JPH0588480B2 - - Google Patents

Info

Publication number
JPH0588480B2
JPH0588480B2 JP59021115A JP2111584A JPH0588480B2 JP H0588480 B2 JPH0588480 B2 JP H0588480B2 JP 59021115 A JP59021115 A JP 59021115A JP 2111584 A JP2111584 A JP 2111584A JP H0588480 B2 JPH0588480 B2 JP H0588480B2
Authority
JP
Japan
Prior art keywords
voice
input
user
line
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59021115A
Other languages
English (en)
Other versions
JPS60165699A (ja
Inventor
Masao Watari
Takao Watanabe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP59021115A priority Critical patent/JPS60165699A/ja
Priority to BR8401300A priority patent/BR8401300A/pt
Priority to US06/590,660 priority patent/US4641342A/en
Publication of JPS60165699A publication Critical patent/JPS60165699A/ja
Publication of JPH0588480B2 publication Critical patent/JPH0588480B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 <産業上の利用分野> 本発明は、多数の利用者回線に対して音声認識
による音声入力と音声応答による音声出力を行う
音声入出力装置に関する。
<従来技術> 音声認識による音声入力と音声応答による音声
出力を行う音声入出力装置は電話などによる利用
者からの問合せシステムに利用されている。この
問合せシステムでは第1表に示すように利用者か
らの音声入力により問合せ内容をシステムが自動
的に識別し、その問合せの解答を音声出力により
利用者へ通知している。このような問合せシステ
ムでは、多数の利用者へ同時に音声入力と音声出
力のサービスを行う必要がある。
第1表 利用者:システムへ電話する システム:“こちらはテレホンサービスです。サ
ービスコードをどうぞ。ピー” 利用者:イチ システム:“ピー” 利用者:ニー システム:“残高問合せですね。あなたの口座番
号をどうぞ。ピー” 利用者:イチ システム:“ピー” 利用者:ニー システム:“ピー” 利用者:サン システム:“あなたの口座番号は123ですね。ピ
ー” 利用者:はい システム:“あなたの残高は12300円です。どうも
ありがとうございました。” 従来、多数の利用者回線に対する音声入出力装
置では、利用者回線数mと同数のm個の音声入力
を同時処理できる認識部と、m個の音声出力を同
時処理できる応答部を使用していた。しかし、認
識部は応答部に比較し処理が複雑であり、かつ多
くのメモリを必要としているため、装置は大形と
なる欠点があつた。
一方、特開昭56−131250号明細書に認識部を小
形にした音声入出力装置が記載されている。この
装置の概略は次の通りである。利用者は音声入力
と音声出力を使用するが、音声出力を行つている
時間は、音声入力を行なわず認識部にとつて空き
時間となる。この空き時間を他の利用者回線の音
声入力処理に利用するため、利用者回線と認識部
の間に切換スイツチを設け、音声入力要求のある
利用者回線のみを認識部に接続する。しかし、認
識部の同時処理回線はmより小さなn個であるた
め、音声入力要求が同時にn個以上とならないよ
う制御する必要がある。このため、認識部の空き
回線がある時のみ、言いかえれば空き回線がない
時は空き回線ができるまで待つた後、利用者へ音
声入力の発声をうながす旨の音声出力(音声入力
促進音の出力)を行い、利用者の音声入力を受け
付けている。これによつて、mより小さなn個の
音声入力を同時処理行う認識部によりm個の利用
者に対して音声入力と音声出力を行うことが可能
となつた。
しかし、前記多回線音声入出力装置では、利用
者は音声入力促進音を聞いた後、音声入力を行な
わなければならない。このため未熟練者または音
声入出力装置に不慣れな者は、合図を待ちきれず
に発声することがおこりやすい。合図の前に発声
した音声は認識処理が開始されていないため、語
頭が脱落して誤認識を生じたり、全く処理されず
に入力未受理となる欠点があつた。
前記合図を待ちきれずに発声した音声の誤認識
または入力未受理を防ぐ方法が本願と同一出願人
による特願昭58−44741号明細書に記載されてい
る。この発明による音声入力装置は、音声検出信
号と音声入力要求を入力とし、認識スタート信号
と音声入力促進要求を出力する入力指令部を持
ち、音声入力促進要求時に音声検出信号が出力さ
れていた場合音声の終端検出時に再度音声入力促
進要求を出力し認識部を再スタートさせている。
すなわち、合図を待ちきれずに発声した場合、音
声入力促進要求時に音声検出信号が出力されてお
り、その音声の終端検出時に入力指令部より再び
音声入力促進要求と認識スタート信号が発せら
れ、待ちきれずに発声した音声は無視され、次に
発声された音声を認識する。これにより、待ちき
れずに発声した音声の誤認識または入力未受理を
防ぐことができる。
しかし、特願昭58−44741による音声入力装置
は1回線に対する音声入力装置であり、特開昭56
−131250による多回線音声入出力装置の認識部と
して使用した場合、切換スイツチにより利用者回
線が切換えられるため利用者回線の音声を常時監
視できず合図を待ちきれずに発声した音声の検出
が正確に行えないため誤認識または入力未受理を
防ぐことができない。このため、特願昭58−
44741による音声入力部を持つ多回線音声入出力
装置には、切換スイツチを用いることはできず、
やはりm個の音声を認識する認識部が必要となり
装置が大形となる欠点があつた。
<発明の目的> 本発明の目的は、音声認識処理部の前段に切換
えスイツチを設け音声認識処理部を時分割多重使
用しその使用するタイミングを音声出力により利
用者へ知らせる音声入出力装置に、利用者が合図
を待ちきれずに発声した音声を検出する検出部と
前記音声が検出された時再び音声入力促進要求を
出力する入力指令部を合せ持つことにより、合図
に対する同期にそれ程神経を使わなくて済む使用
し易すい音声入力が、多数の利用者に対して行う
ことのできる小形の音声入出力装置を提供するこ
とにある。
<発明の構成> 本発明による多回線音声入出力装置は、m(正
の整数)個の利用者回線と、前記m個の利用者回
線へ音声出力を行う応答部と、前記m個の利用者
回線よりの音声入力を検出する検出部と、前記検
出部のm個の音声パタンの出力をmより小さなn
(正の整数)個の認識部入力回線へ接続する切換
えスイツチと、前記切換えスイツチの出力を受け
るn個の入力回線の音声を認識する認識部と、認
識部の空き回線の存在を検知した時にのみ通話状
態にある利用者回線を前記認識部の空き回線に接
続し、音声入力要求を出力する制御部と、前記音
声入力要求を受信した時刻以前に前記検出部にて
音声が検出されていないとき利用者回線に発声を
うながす旨の音声出力を行い認識部をスタートさ
せるよう指令し、音声が検出されていたときその
音声の終端を検出した時刻に利用者回線に発声を
うながす旨の音声出力を行い認識部をスタートさ
せるように指令する入力指令部を有している。
<本発明の作用・原理> 本発明による多回線音声入出力装置は、上位シ
ステムよりの音声入力コマンド,音声出力コマン
ドに従つて音声入力と音声出力をm個の利用者回
線に対して行う。具体的な動作を第1図を参照し
ながら説明する。始めに音声出力コマンドを受け
た制御部は応答部に対して“口座番号をどうぞ”
という音声出力を利用者回線mに行うよう指示す
る。音声出力が終了すると終了したことを制御部
を介して上位システムへ通知する。通知を受けた
上位システムは、音声入力コマンドを制御部に出
力する。制御部は認識部の空き入力回線を捜し、
見つけた時点で切換えスイツチにより要求のあつ
た利用者回線を前記空き認識部入力回線へ接続す
る。さらに入力指令部へ音声入力要求を通知す
る。入力指令部は音声入力要求を受取るとすでに
音声が検出されていたか判定し、検出されていな
い場合は音声入力促進音(例えば「ピー」)の出
力を応答部に指示し、前記接続された認識部入力
回線の認識処理開始を認識部へ指示する。もし、
音声入力要求を受けた時刻においてその時刻以前
に前記利用者回線からの音声が検出されていた場
合は、利用者が、音声入力促進音の前に音声を発
声していたことになるため、その音声の終端を検
出した時刻に再び音声入力促進音の出力を応答部
に指示し、認識処理の再スタートを認識部へ指示
する。
<実施例> 本発明について第2図に示した実施例を示すブ
ロツク図に基づきさらに詳細に説明する。第2図
に示すように本発明による多回線音声入出力装置
の実施例は、利用者回線11,12,…,1m,
認識部入力回線21,22,…,2n,音声検出
部3,切換えスイツチ4,認識部5,応答部6,
入力指令部7,制御部8より構成される。
切換スイツチ4は、例えば特開昭56−131250号
明細書の第4図または第5図または第7図に記載
された構成を取ることができる。すなわち、切換
スイツチ4は利用者回線11,12,…,1mを
入力とし、n個の認識部入力回線21,22,
…,2nを出力としており、制御部8の制御によ
り利用者回線11,12,…,1mの中より音声
入力を要求している回線のみを認識部入力回線2
1,22,…,2nへ接続する。応答部6はたと
えば刊行物アイ・イー・イー・イートランザクシ
ヨンズ オン エー・エス・エス・ピー(IEEE
Transactions on ASSP)の1974年11月号の第
339頁より第352頁までの論文「ア マルチライン
コンピユーター ボイス レスポンスシステム
ユーテイライズイング エーデーピーシーエム
コーデイド スピーチ(a Multiline
Conputer Voice Response System Utilizing
ADPCM Coded Speech)」の第340頁の第2図
に記載された構成のものを用いることができる。
すなわち、応答部6は制御部8または入力指令部
7の指示に従つてm個の利用者回線へ「こちらは
テレホンセンタです。サービスコードをどうぞ」
という文章や「ピー」という音声入力促進音を出
力する。音声認識装置は、たとえば、刊行物プロ
シイーデイングズ オブ ジ アイ・イー・イ
ー・イー(PROCEEDINGS OF THE IEEE)
の1976年4月号の第405頁より第415頁までの論文
「プラクテイカル アプリケーシヨンズ オブ
ボイス インプツト ツー マシンズ
(Practical Applications of Voice Input to
Machines)」の第5図に示された構成のものを用
いることができる。すなわち、第3図に示すよう
に音声を分析して、例えばパワー情報と特徴ベク
トル(スペクトラム情報)を抽出する前処理部と
音声がどの時刻で発声されたかを検出する音声検
出部と、入力された音声の特徴を抽出する特徴抽
出部と、その特徴より発声された音声が何である
か識別する識別部より構成される。
本発明では第2図に示した如く前処理部と音声
検出部を特徴抽出部と識別部より切りはなし、そ
の間に切換えスイツチ4を置いている。すなわ
ち、利用者回線iの音声は音声検出部3の入力回
線1iへ入力され音声の発声された時刻を検出し
その結果を入力指令部7へ送る。さらに利用者回
線iの音声は切換えスイツチ4を通過し、認識部
入力回線2jへ入力される。認識部ではn個の音
声の特徴抽出と識別の処理の実行が可能である。
認識部入力回線2jより入力された音声は特徴を
抽出し識別を行いその結果を制御部8へ出力す
る。
音声検出部3は、第4図に示すように前処理部
31にてm個の利用者回線の音声を分析し、その
分析結果を切換えスイツチ4へ出力する。さらに
前処理部31よりm個の利用者回線の音声パワー
情報が、マイクロプロセツサ部32のパワー情報
入力部321へ送られる。マイクロプロセツサ部
32は入力部321、検出情報出力部322、
CPU323、メモリ324より構成され、第5
図に示したフローチヤートに従つてm個の音声の
始端時刻,終端時刻を求める。すなわち、音声の
始端検出では、第5図aに示すように子韻レベル
Th1を越えた時刻ts以後さらに母音レベルTh2
を越えた場合、tsを始端時刻としている。一方、
第5図bに示すように音声の終端検出では、子韻
レベルTh1を下がつた時刻te以後LE時間Th1以
下のレベルであつた時にteを終端時刻としてい
る。前記した始端時刻ts,終端時刻teは検出情報
出力部322より入力指令部7へ通知される。こ
こで第5図のFLAGは一定時刻ごとに1にセツト
されるもので、一定時刻ごとのパワーPiより音声
検出を行つている。また、Diはパワーの状態で、
Di=0,1,2は各々無音,始端候補が検出さ
れた、母音が検出され始端が、確定した状態であ
る。以上述べた音声検出部の動作例を図示する
と、第6図に示した如くとなる。第5図におい
て、Pi,Si,Eiは利用者回線iのパワー,始端時
刻,終端時刻を示す。
入力指令部7は第7図に示すようにマイクロプ
ロセツサ71,メモリ72,検出情報入力部7
3,入力要求情報入力部74,応答情報出力部7
5,認識情報出力部76より構成される。マイク
ロプロセツサ71は第8図a,b,cに示すフロ
ーチヤートに従つて動作する。すなわち、始めに
ブロツク701で利用者回線iでの使用状態Ri,
Wiをリセツトし、(Ri=0認識スタートしていな
い状態、Wi=0は認識スタート以前に音声検出
されていない状態),続いてブロツク702で音
声検出部3より検出情報(利用者回線i,始端時
刻ts,終端時刻te)を入力する。検出情報が始端
情報である場合、ブロツク703にて認識部5へ
認識部入力回線ji(利用者回線が切替スイツチ4
により接続された認識部入力回線)の始端時刻ts
を通過するか、またはその利用者回線iが認識部
5へ接続される時刻以前に音声が発声されたと判
断しその状態(Wi=1)を記憶する。検出情報
が終端情報である場合、第8図bにて認識部5へ
認識部入力回線jiの終端時刻teを通知するか、ま
たはWi=1であつた場合応答部6へ応答情報
(利用者回線i,応答内容として音声入力促進音)
を出力し認識部5へ認識部入力回線jiの認識をス
タートするよう指示する。さらに、第8図cにて
制御部8より入力要求情報(利用者回線i,認識
部入力回線ji)を入力し、応答部6へ応答情報を
出力し、認識部5へ認識入力回線jiの認識をスタ
ートするように指示し、さらに認識入力回線jiで
認識がスタートした状態(Ri=1)を記憶する。
以上説明したブロツク702,703,第8図
b,cの処理を繰返し行うことにより、m個の利
用者回線に対する処理が実行される。
制御部8は1983年3月発行のアメリカ特許
USP4385359「マルチプル チヤンネル ボイス
インプツト/アウトプツト システム
(Multiple−Channel Voice Input/Output
System)」の明細書の第2図に示す構成を取るこ
とができ、同明細書の第4図に示したフローチヤ
ートに従つて動作する。
以上説明した実施例は電話回線および応用プロ
グラムが動作する上位システムと共使用される。
第2図に示したように利用者が電話によりシステ
ムを呼び出すと電話回線制御部(NCU)10i
が呼び出しを検出し上位システム200へ通知す
る。上位システム200通知後利用者回線1iに
対して音声入力コマンド、音声出力コマンドを制
御部8へ出力して音声入出力のサービスを行う。
以上本発明を実施例に基づき説明したが、1回
線に対する音声検出部,認識部,応答部をm個ま
たはn個並べる構成を取ることもできることは明
白である。また、実施例では入力指令部,制御部
は共にマイクロプロセツサを用いた構成であるた
め、CPUの処理能力に余裕があればCPU,メモ
リを共用し、CPU,メモリを1つに減らすこと
が可能である。
<発明の効果> 本発明によれば、認識処理部の前段に切換えス
イツチを設け、認識処理部を時分割多重使用し、
その音声入力を利用するタイミングを音声入力促
進音の出力により利用者へ通知することにより、
認識処理部の同時処理回線数を利用者回線数mよ
り小さなnとすることができ、装置の小形化が実
現する。
さらに、切換スイツチの前段に音声検出部を設
け、常時利用者回線の音声入力を監視し、利用者
が音声入力促進音の合図に待ちきれず音声を発声
した場合、再度音声入力を行うよう制御する入力
指令部を設けることにより、利用者が合図にに待
ちきれず音声を発声した場合も誤認識や入力未受
理とはならず、利用者に対して使用しやすい音声
入力が提供できる。
【図面の簡単な説明】
第1図は本発明の動作を示す図、第2図は本発
明の実施例を示すブロツク図、第3図は音声認識
装置のブロツク図、第4図は本発明の検出部の実
施例を示すブロツク図、第5図a,bは本発明の
検出部の動作を示すフローチヤート、第6図は音
声検出動作の例を示す図、第7図は本発明の入力
指令部の実施例を示すブロツク図、第8図a,
b,cは本発明の入力指令部の動作を示すフロー
チヤートである。 図において、11,12,…,1mは利用者回
線、21,22,…,2nは認識部入力回線、3
は音声検出部、4は切換スイツチ、5認識部、6
は応答部、7は入力指令部、8は制御部、31は
前処理部、32はマイクロプロセツサ部、10
1,102,10i,10mはNCU、200は
上位システム、である。

Claims (1)

    【特許請求の範囲】
  1. 1 m(正の整数)個の利用者回線と、前記m個
    の利用者回線へ音声出力を行う応答部と、前記m
    個の利用者回線よりの音声入力を検出する検出部
    と、前記検出部のm個の音声パタンの出力をmよ
    り小さなn(正の整数)個の認識部入力回線へ接
    続する切換えスイツチと、前記切換えスイツチの
    出力を受けるn個の入力回線の音声を認識する認
    識部と、認識部への空き回線の存在を検知した時
    にのみ通話状態にある利用者回線を前記認識部の
    空き回線に接続させる制御信号を発生し、音声入
    力要求を出力する制御部と、前記音声入力要求を
    受信した時刻以前に前記検出部にて音声が検出さ
    れていないとき利用者回線に発声をうながす旨の
    音声出力を行い認識部をスタートさせるよう指令
    し、音声が検出されていたときその音声の終端を
    検出した時刻に利用者回線に発声をうながす旨の
    音声出力を行い認識部をスタートさせるように指
    令する入力指令部を持つことを特徴とする多回線
    音声入出力装置。
JP59021115A 1983-03-17 1984-02-08 多回線音声入出力装置 Granted JPS60165699A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP59021115A JPS60165699A (ja) 1984-02-08 1984-02-08 多回線音声入出力装置
BR8401300A BR8401300A (pt) 1983-03-17 1984-03-16 Processo de registro de voz
US06/590,660 US4641342A (en) 1983-03-17 1984-03-19 Voice input system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59021115A JPS60165699A (ja) 1984-02-08 1984-02-08 多回線音声入出力装置

Publications (2)

Publication Number Publication Date
JPS60165699A JPS60165699A (ja) 1985-08-28
JPH0588480B2 true JPH0588480B2 (ja) 1993-12-22

Family

ID=12045878

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59021115A Granted JPS60165699A (ja) 1983-03-17 1984-02-08 多回線音声入出力装置

Country Status (1)

Country Link
JP (1) JPS60165699A (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5724999A (en) * 1980-07-22 1982-02-09 Fujitsu Ltd Voice recognition responding system
JPS57185093A (en) * 1981-05-08 1982-11-15 Oki Electric Ind Co Ltd Voice recognition system

Also Published As

Publication number Publication date
JPS60165699A (ja) 1985-08-28

Similar Documents

Publication Publication Date Title
US6651043B2 (en) User barge-in enablement in large vocabulary speech recognition systems
US6944594B2 (en) Multi-context conversational environment system and method
US6882973B1 (en) Speech recognition system with barge-in capability
US6539084B1 (en) Intercom system
TW299437B (ja)
CN111540349A (zh) 一种语音的打断方法和装置
DE3881917D1 (de) Spracherkennungssystem fuer mehrere benutzer.
WO2017128775A1 (zh) 一种语音控制系统、语音处理方法及终端设备
JPH06100959B2 (ja) 音声対話装置
JPH0759009B2 (ja) 回線接続切替装置
US20050038659A1 (en) Method of operating a barge-in dialogue system
US4641342A (en) Voice input system
JP3998724B2 (ja) 対話式装置
CN110602334A (zh) 一种基于人机协同的智能外呼方法及系统
US20010056345A1 (en) Method and system for speech recognition of the alphabet
JPH0588480B2 (ja)
JP2001343983A (ja) 音声始端検出方法、音声認識装置における音声区間検出方法および音声認識装置
JP2656234B2 (ja) 会話音声理解方法
JPS58115539A (ja) 音声処理装置
JPS58131856A (ja) 音声応答認識サ−ビス方式
KR100363251B1 (ko) 음성 끝점 판별 방법
JPS5957300A (ja) 音声認識方式
KR20000042364A (ko) 인식기 자원을 효율적으로 사용하는 음성인식 방법
JPS62164097A (ja) 音声判別方式
JPH10240284A (ja) 音声検出方法及び装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term