JPH05134693A - 音声出力装置 - Google Patents

音声出力装置

Info

Publication number
JPH05134693A
JPH05134693A JP3326932A JP32693291A JPH05134693A JP H05134693 A JPH05134693 A JP H05134693A JP 3326932 A JP3326932 A JP 3326932A JP 32693291 A JP32693291 A JP 32693291A JP H05134693 A JPH05134693 A JP H05134693A
Authority
JP
Japan
Prior art keywords
voice
pitch
additional
input
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3326932A
Other languages
English (en)
Inventor
Yasuhiko Kato
靖彦 加藤
Masao Watari
雅男 渡
Miyuki Tanaka
幸 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP3326932A priority Critical patent/JPH05134693A/ja
Publication of JPH05134693A publication Critical patent/JPH05134693A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 違和感のない音声出力応答を得る。 【構成】 マイク1に入力された音声(相手先名)は、
A/D変換器2を介して、音声認識部7に出力され、音
声認識された後、その認識結果に対応する音声信号(相
手先名)が、ユーザメモリ4より読み出され、さらにシ
ステムメモリ5に記憶されている付加音声「さんですね
?」が読み出され、音声信号(相手先名)に連続して付
加音声「さんですね?」が、ピッチ変換部12に出力さ
れる。ピッチ変換部12において、音声応答制御部3よ
り出力された音声信号(相手先名)のピッチ、および付
加音声「さんですね?」のピッチが、同一のピッチに変
換される。そして、D/A変換器13において、D/A
変換処理が施された後、同一ピッチの音声(相手先名)
および付加音声「さんですね?」が連続した音声「(相
手先名)さんですね?」が、認識結果を確認するための
音声として、スピーカ14より出力される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声を出力する場合に
用いて好適な音声出力装置に関する。
【0002】
【従来の技術】従来の、例えば音声認識電話は、使用者
が発声した例えば通話しようとする相手の名前などを音
声認識し、認識結果を確認するために、認識した音声、
即ち使用者が発声した相手の名前(相手先名)に、例え
ば音声「ですね?」を付加した音声「(相手先名)です
ね?」を出力する。装置による認識が正しい場合、使用
者が、例えば「はい。」などと応答(発声)することに
より、装置は認識結果を正しいものとみなして、その認
識結果に対応する、あらかじめ装置に登録された相手先
の電話番号を、自動的にダイヤルする。
【0003】
【発明が解決しようとする課題】ところで、装置が認識
結果を確認するために出力する音声「(相手先名)です
ね?」は、あらかじめ装置に登録されている必要があ
る。しかしながら、使用者ごとに異なる相手先名は、そ
のデータ量が莫大で、装置を製作する際に、あらかじめ
登録することができない課題があった。
【0004】そこで、使用者ごとに異なるデータを登録
することができるように設けられた、例えばユーザ用メ
モリに、装置が認識結果を確認するために出力する音声
「(相手先名)ですね?」を、例えばキーボードやマイ
クなどにより入力(登録)する方法がある。しかしなが
ら、この方法では、使用者ごとに異なる相手先名に、す
べて共通に「ですね?」を付加して、装置に登録しなけ
ればならず、使用者にわずらわしさを感じさせる課題が
あった。
【0005】これを解決するために、装置が認識結果を
確認するために出力する音声を、相手先名のみにする方
法がある。しかしながら、この方法では、装置が認識結
果を確認するための音声として、相手先名しか出力しな
いので、使用者に違和感を感じさせる課題があった。
【0006】本発明は、このような状況に鑑みてなされ
たものであり、違和感のない音声を容易に出力すること
ができるようにするものである。
【0007】
【課題を解決するための手段】請求項1に記載の音声出
力装置は、音声を入力する入力手段としてのマイク1
と、マイク1より入力された音声を記憶する音声記憶手
段としてのユーザメモリ4と、マイク1より入力された
音声に付加する付加音声を記憶した付加音声記憶手段と
してのシステムメモリ5と、ユーザメモリ4に記憶され
た音声、およびシステムメモリ5に記憶された付加音声
を連続して再生する再生手段としての音声応答制御部
3、システム制御部8、D/A変換器13、およびスピ
ーカ14とを備えることを特徴とする。
【0008】この音声出力装置は、マイク1より入力さ
れた音声を認識する認識手段としての音声認識部7をさ
らに備えることができ、音声応答制御部3、システム制
御部8、D/A変換器13、およびスピーカ14は、音
声認識部7により認識された音声に対応してユーザメモ
リ4に記憶された音声、およびシステムメモリ5に記憶
された付加音声を連続して再生することができる。
【0009】請求項3に記載の音声出力装置は、音声を
入力する入力手段としてのマイク1と、マイク1より入
力された音声を記憶する音声記憶手段としてのユーザメ
モリ4と、マイク1より入力された音声に付加する付加
音声を記憶した付加音声記憶手段としてのシステムメモ
リ5と、ユーザメモリ4に記憶された音声のピッチ、お
よびシステムメモリ5に記憶された付加音声のピッチを
同一のピッチに変換するピッチ変換手段としてのピッチ
変換部12と、同一のピッチに変換された音声、および
付加音声を連続して再生する再生手段としての音声応答
制御部3、システム制御部8、D/A変換器13、およ
びスピーカ14を備えることを特徴とする。
【0010】
【作用】請求項1に記載の音声出力装置においては、マ
イク1より入力された音声をユーザメモリ4に記憶し、
マイク1より入力された音声に付加する付加音声をシス
テムメモリ5に記憶し、ユーザメモリ4に記憶された音
声、およびシステムメモリ5に記憶された付加音声を連
続して再生する。従って、入力された音声に共通に付加
する付加音声を入力する必要がないので、使用者にわず
らわしさを感じさせることが防止される。
【0011】マイク1より入力された音声を認識し、認
識された音声に対応してユーザメモリ4に記憶された音
声、およびシステムメモリ5に記憶された付加音声を連
続して再生する場合においては、認識された音声を確認
することができる。
【0012】請求項3に記載の音声出力装置において
は、マイク1より入力された音声をユーザメモリ4に記
憶し、マイク1より入力された音声に付加する付加音声
をシステムメモリ5に記憶し、ユーザメモリ4に記憶さ
れた音声のピッチ、およびシステムメモリ5に記憶され
た付加音声のピッチを同一のピッチに変換し、同一のピ
ッチに変換された音声、および付加音声を連続して再生
する。従って、使用者に違和感を感じさせることなく、
異なる音声を連続に再生することができる。
【0013】
【実施例】図1は、本発明の音声出力装置を応用した音
声認識電話の一実施例の構成を示すブロック図である。
マイク1は、入力された例えば電話をかける相手の名前
などの音声を電気信号(アナログ信号)に変換する。A
/D変換器2は、マイク1より出力されたアナログ信号
をディジタル信号に変換するA/D変換処理を行う。ユ
ーザメモリ4は、A/D変換器2および音声応答制御部
3を介してマイク1より出力される、電話をかける相手
の名前などの音声(音声信号)を記憶する。システムメ
モリ5には、ユーザメモリ4に記憶された電話をかける
相手の名前の直後に付加する、例えば「さんですね?」
などの付加音声(付加音声信号)が記憶されている。
【0014】音声応答制御部3は、A/D変換器2より
出力されたディジタル信号をユーザメモリ4に記憶させ
る。また、音声応答制御部3は、システム制御部8に制
御され、ユーザメモリ4に記憶されている音声信号を読
み出し、連続してシステムメモリ5に記憶されている付
加音声信号を読み出す。さらに、音声応答制御部3は、
システム制御部8を介して音声認識部7より供給される
認識結果に対応して、音声メモリ4に記憶されている音
声信号を読み出す。
【0015】キーボード9は、電話をかける相手の電話
番号などを入力する。メモリ10は、システム制御部8
を介して、キーボード9より出力される電話番号、ピッ
チ抽出部6により抽出される音声信号のピッチ、および
音声認識部7により作成される音声認識を行うための標
準パターンなどを記憶する。
【0016】ピッチ抽出部6は、A/D変換器2を介し
てマイク1より出力された音声信号のピッチを抽出す
る。音声認識部7は、A/D変換器2を介してマイク1
より出力された音声信号から、例えば線形予測係数など
の特徴パラメータを抽出し、その特徴パラメータから音
声パターンおよび標準パターンを作成し、この音声パタ
ーンと標準パターンとを比較して音声認識を行う。
【0017】ピッチ変換部12は、音声応答制御部3に
よりユーザメモリ4およびシステムメモリ5から読み出
された音声信号および付加音声信号のピッチを、システ
ム制御部8より供給されるメモリ10に記憶されたピッ
チに変換する。D/A変換器13は、音声応答制御部3
によって連続的に読み出され、ピッチ変換部12によっ
て同一のピッチに変換された音声信号(ディジタル信
号)および付加音声信号(ディジタル信号)をアナログ
信号に変換するD/A変換処理を行う。スピーカ14
は、D/A変換器13より出力されたアナログ信号(音
声信号)を音声に変換し、出力する。
【0018】ダイヤル発信部11は、電話回線(図示せ
ず)に接続されており、音声認識部7による音声認識結
果に対応してシステム制御部8より供給される、メモリ
10に記憶された電話番号にダイヤルする。
【0019】システム制御部8は、音声認識部7による
音声認識結果に対応して、音声応答制御部3およびピッ
チ変換部12を制御するなど、装置の各ブロックを制御
する。
【0020】次に、電話をかける相手の名前とその電話
番号を登録する場合の動作について説明する。最初に、
システム制御部8に名前とその電話番号を登録すること
を知らせるために、登録スイッチ(図示せず)をオンに
した後、電話をかけるために登録したい相手の名前(相
手先名)をマイク1に入力する。マイク1に入力された
音声(相手先名)は、電気信号(音声信号)に変換さ
れ、A/D変換器2に出力される。A/D変換器2によ
り、A/D変換処理された音声信号は、音声応答制御部
3、ピッチ抽出部6、および音声認識部7に供給され
る。
【0021】音声応答制御部3において、A/D変換器
2より出力された音声信号は、ユーザメモリ4に記憶さ
れる。また、ピッチ検出部6において、A/D変換器2
より出力された音声信号は、そのピッチが検出され、シ
ステム制御部8を介してメモリ10に記憶される。さら
に、音声認識部7において、A/D変換器2より出力さ
れた音声信号から、特徴パラメータが抽出され、その特
徴パラメータから標準パターンが作成され、この標準パ
ターンは、システム制御部8を介してメモリ10に記憶
される。
【0022】このように、マイク1に入力された音声
(相手先名)がユーザメモリ4に記憶され、その音声の
ピッチおよび標準パターンがメモリ10に記憶された
後、キーボード9より相手先の電話番号が入力される
と、その電話番号がシステム制御部8を介して、メモリ
10に記憶される。
【0023】以上の動作を繰り返し、所望する相手先名
とその電話番号の登録が終了した後、不必要な音声およ
び音などがユーザメモリ4およびメモリ10に記憶され
ないように、登録スイッチをオフにする。
【0024】次に、登録された相手先名を入力(発声)
することにより自動発呼(自動ダイヤル)する場合の動
作について説明する。最初に、登録した相手先名をマイ
ク1に入力する。マイク1に入力された音声(相手先
名)は、電気信号(音声信号)に変換され、A/D変換
器2に出力される。A/D変換器2において、A/D変
換処理された音声信号は、音声認識部7に供給される。
音声認識部7において、A/D変換処理された音声信号
から特徴パラメータが抽出され、その特徴パラメータか
ら音声パターンが作成される。さらに、音声認識部7に
おいて、システム制御部8によって読み出された、メモ
リ10に記憶された標準パターンが参照され、その標準
パターンと音声パターンとが比較され、音声パターンに
最も類似した標準パターン(音声パターンとの距離が最
も近い標準パターン)が検出された後(音声認識された
後)、その標準パターン(認識結果)がシステム制御部
8に出力される。
【0025】システム制御部8において、音声認識部7
より出力された標準パターンに対応する音声信号をユー
ザメモリ4から読み出すように、音声応答制御部3に制
御信号が出力されるとともに、音声認識部7より出力さ
れた標準パターンに対応する音声信号のピッチが、メモ
リ10より読み出され、ピッチ変換部12に出力され
る。
【0026】システム制御部8から音声応答制御部3に
制御信号が出力されると、音声応答制御部3において、
音声認識部7より出力された標準パターンに対応する音
声信号(相手先名)が、ユーザメモリ4より読み出さ
れ、さらに続けてシステムメモリ5に記憶されている付
加音声「さんですね?」が読み出され、音声信号(相手
先名)に連続して付加音声「さんですね?」が、ピッチ
変換部12に出力される。ピッチ変換部12において、
音声応答制御部3より出力された音声信号(相手先名)
のピッチ、および付加音声「さんですね?」のピッチ
が、システム制御部8より出力されたピッチに変換さ
れ、D/A変換器13に出力される。
【0027】ここで、システム制御部8より出力される
ピッチは、ユーザメモリ4に相手先名を登録したときの
音声信号のピッチ、即ちユーザメモリ4に記憶された音
声信号(相手先名)のピッチであるから、本実施例の場
合においては、音声信号(相手先名)のピッチは、ピッ
チ変換部12において、変換されない。
【0028】D/A変換器13において、ピッチ変換部
12より出力された同一ピッチの音声信号(相手先名)
および付加音声「さんですね?」は、D/A変換処理さ
れ、同一ピッチの音声(相手先名)および付加音声「さ
んですね?」が連続した音声「(相手先名)さんですね
?」が、認識結果を確認するための音声として、スピー
カ14より出力される。
【0029】スピーカ14より出力された音声「(相手
先名)さんですね?」が、マイク1に入力した電話をか
ける相手の名前である場合、その音声認識結果が正しい
ことを装置に知らせるために、例えば「はい」などとマ
イク1に入力する。前述した場合と同様に、マイク1に
入力された音声「はい」は、A/D変換器2を介して音
声認識部7に出力され、音声認識部7において、音声認
識され、その認識結果がシステム制御部8に出力され
る。システム制御部8において、音声認識部7により認
識された音声が「はい」であると判定された場合、ユー
ザメモリ4から読み出すように、音声応答制御部3に指
令した音声信号(相手先名)に対応する電話番号が、メ
モリ10より読み出され、ダイヤル発信部11に出力さ
れる。そして、ダイヤル発信部11において、システム
制御部8より出力された電話番号が自動的にダイヤルさ
れる。
【0030】なお、システムメモリ5に記憶されている
付加音声のピッチを、あらかじめメモリ10に記憶させ
ておき、ピッチ変換部12において、音声(相手先名)
が、付加音声のピッチに変換されるようにすることがで
きる。さらに、キーボード9より任意のピッチを入力し
てメモリ10に記憶させておき、ピッチ変換部12にお
いて、音声(相手先名)および付加音声が任意のピッチ
に変換されるようにすることも可能である。
【0031】
【発明の効果】請求項1に記載の音声出力装置によれ
ば、入力手段より入力された音声を音声記憶手段に記憶
し、入力手段より入力された音声に付加する付加音声を
付加音声記憶手段に記憶し、音声記憶手段に記憶された
音声、および付加音声記憶手段に記憶された付加音声を
連続して再生する。従って、入力された音声に共通に付
加する付加音声を入力する必要がないので、使用者にわ
ずらわしさを感じさせることが防止される。
【0032】請求項2に記載の音声出力装置によれば、
入力手段より入力された音声を認識し、認識された音声
に対応して音声記憶手段に記憶された音声、および付加
音声記憶手段に記憶された付加音声を連続して再生す
る。従って、認識された音声を確認することができる。
【0033】請求項3に記載の音声出力装置によれば、
入力手段より入力された音声を音声記憶手段に記憶し、
入力手段より入力された音声に付加する付加音声を付加
音声記憶手段に記憶し、音声記憶手段に記憶された音声
のピッチ、および付加音声記憶手段に記憶された付加音
声のピッチを同一のピッチに変換し、同一のピッチに変
換された音声、および付加音声を連続して再生する。従
って、使用者に違和感を感じさせることなく、異なる音
声を連続に再生することができる。
【図面の簡単な説明】
【図1】本発明の音声出力装置を応用した音声認識電話
の一実施例の構成を示すブロック図である。
【符号の説明】
1 マイク 2 A/D変換器 3 音声応答制御部 4 ユーザメモリ 5 システムメモリ 6 ピッチ抽出部 7 音声認識部 8 システム制御部 9 キーボード 10 メモリ 11 ダイヤル発信部 12 ピッチ変換部 13 D/A変換器 14 スピーカ

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力する入力手段と、 前記入力手段より入力された音声を記憶する音声記憶手
    段と、 前記入力手段より入力された音声に付加する付加音声を
    記憶した付加音声記憶手段と、 前記音声記憶手段に記憶された音声、および前記付加音
    声記憶手段に記憶された付加音声を連続して再生する再
    生手段とを備えることを特徴とする音声出力装置。
  2. 【請求項2】 前記入力手段より入力された音声を認識
    する認識手段をさらに備え、 前記再生手段は、前記認識手段により認識された音声に
    対応して前記音声記憶手段に記憶された音声、および前
    記付加音声記憶手段に記憶された付加音声を連続して再
    生することを特徴とする請求項1に記載の音声出力装
    置。
  3. 【請求項3】 音声を入力する入力手段と、 前記入力手段より入力された音声を記憶する音声記憶手
    段と、 前記入力手段より入力された音声に付加する付加音声を
    記憶した付加音声記憶手段と、 前記音声記憶手段に記憶された音声のピッチ、および前
    記付加音声記憶手段に記憶された付加音声のピッチを同
    一のピッチに変換するピッチ変換手段と、 前記ピッチ変換手段により同一のピッチに変換された前
    記音声、および前記付加音声を連続して再生する再生手
    段とを備えることを特徴とする音声出力装置。
JP3326932A 1991-11-15 1991-11-15 音声出力装置 Withdrawn JPH05134693A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3326932A JPH05134693A (ja) 1991-11-15 1991-11-15 音声出力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3326932A JPH05134693A (ja) 1991-11-15 1991-11-15 音声出力装置

Publications (1)

Publication Number Publication Date
JPH05134693A true JPH05134693A (ja) 1993-05-28

Family

ID=18193380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3326932A Withdrawn JPH05134693A (ja) 1991-11-15 1991-11-15 音声出力装置

Country Status (1)

Country Link
JP (1) JPH05134693A (ja)

Similar Documents

Publication Publication Date Title
CA2172748C (en) Digital secretary
EP1147649B1 (en) Voice activated mobile telephone call answerer
US6035018A (en) Access, selection, and downloading of a pre-recorded outgoing greeting message for a voice messaging system from an external source
JP3527401B2 (ja) ボイスメッセージの明瞭度を向上する方法
JPH09186770A (ja) 電話における自動音声認識のための方法
JPH08163252A (ja) Pbx−コンピュータ連動システム
KR930005223B1 (ko) 음성 인식장치 및 이것을 이용한 전화기
JPH10215331A (ja) 音声会議システムとその情報端末装置
GB2188812A (en) Telephone answering device
JPH05134693A (ja) 音声出力装置
JPS6046647A (ja) 電報サ−ビス方式
TWI237488B (en) Telephone with portable memory card
JPS6139756A (ja) 留守番電話システム
JPH04165850A (ja) 留守番電話
JPH0981200A (ja) 通信器
US20040181415A1 (en) Speech activated telephone device for connection to existing landline phone
HK1003770A (en) Telephone answering machine with speech recognition
JPH06152730A (ja) 電話装置
JP3477099B2 (ja) 電話装置
JPH06205101A (ja) 留守番電話機
JPS6276345A (ja) 音声ダイヤル電話
JPH0732419B2 (ja) 音声認識電話機
JPH0318162A (ja) 留守番電話システム
JP2000013496A (ja) コンピュータシステムおよび留守録応答メッセージ管理方法
JPH0253369A (ja) 音声蓄積・音声認識機能付キーテレフォンシステム

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990204