JPH10207486A - 対話型音声認識方法およびこの方法を実施する装置 - Google Patents
対話型音声認識方法およびこの方法を実施する装置Info
- Publication number
- JPH10207486A JPH10207486A JP9007757A JP775797A JPH10207486A JP H10207486 A JPH10207486 A JP H10207486A JP 9007757 A JP9007757 A JP 9007757A JP 775797 A JP775797 A JP 775797A JP H10207486 A JPH10207486 A JP H10207486A
- Authority
- JP
- Japan
- Prior art keywords
- likelihood
- recognition
- recognition result
- ranked
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【課題】 音声認識が適正に実施されたものと認識され
たもののみを認識結果の正解の候補として復唱確認の操
作を実施して音声対話時間を短縮する対話型音声認識方
法およびこの方法を実施する装置を提供する。 【解決手段】 1位の音声認識結果の尤度と2位以下の
各音声認識結果の尤度との間の差を尤度差とし、認識単
語種別毎にこの尤度差の或る一定値を尤度差閾値として
設定記憶しておき、或る認識単語種別の認識において1
位の認識結果の尤度と2位以下の各認識結果の尤度との
間の尤度差を測定し、各尤度差と先に記憶されている当
該認識単語種別の尤度差閾値との間の比較をして認識結
果の正解の候補を選択する対話型音声認識方法およびこ
の方法を実施する装置。
たもののみを認識結果の正解の候補として復唱確認の操
作を実施して音声対話時間を短縮する対話型音声認識方
法およびこの方法を実施する装置を提供する。 【解決手段】 1位の音声認識結果の尤度と2位以下の
各音声認識結果の尤度との間の差を尤度差とし、認識単
語種別毎にこの尤度差の或る一定値を尤度差閾値として
設定記憶しておき、或る認識単語種別の認識において1
位の認識結果の尤度と2位以下の各認識結果の尤度との
間の尤度差を測定し、各尤度差と先に記憶されている当
該認識単語種別の尤度差閾値との間の比較をして認識結
果の正解の候補を選択する対話型音声認識方法およびこ
の方法を実施する装置。
Description
【0001】
【発明の属する技術分野】この発明は、対話型音声認識
方法およびこの方法を実施する装置に関し、特に音声認
識が適正に実施されたものと認識されたもののみを認識
結果の正解の候補として復唱確認の操作を実施して音声
対話時間を短縮した対話型音声認識方法およびこの方法
を実施する装置に関する。
方法およびこの方法を実施する装置に関し、特に音声認
識が適正に実施されたものと認識されたもののみを認識
結果の正解の候補として復唱確認の操作を実施して音声
対話時間を短縮した対話型音声認識方法およびこの方法
を実施する装置に関する。
【0002】
【従来の技術】音声認識装置においては、音声認識の結
果として複数の音声認識結果が出力されるが、これらの
音声認識結果は必ずしも正しいとは限らず、単なる認識
結果の正解の候補であるに過ぎない。ここで、音声認識
装置は出力される単なる候補の内から正解の認識結果を
確認選択することを実施している。対話型音声認識装置
においては、認識装置の利用者に対して認識結果の復唱
確認を実施し、正解の認識結果を確認選択している。
果として複数の音声認識結果が出力されるが、これらの
音声認識結果は必ずしも正しいとは限らず、単なる認識
結果の正解の候補であるに過ぎない。ここで、音声認識
装置は出力される単なる候補の内から正解の認識結果を
確認選択することを実施している。対話型音声認識装置
においては、認識装置の利用者に対して認識結果の復唱
確認を実施し、正解の認識結果を確認選択している。
【0003】音声認識においては、音声認識結果の候補
の尤もらしさを表すパラメータとして尤度を使用してい
る。なお、尤度とは統計的手法による音声認識の計算処
理において使用されるパラメータであり、その計算式
は、例えば「Hidden Markov Model に基づいた音声認
識:大河内 正明、日本音響学会誌第42巻第12号、
1986年」、或いは「A tutorial on Hidden Markov
Model and Selected applications in speech recognit
ion :L.R.Rabiner 、proceedings of IEEE Vol.77No.
2、1989 」に示されている。音声認識における尤度の使
用の仕方は認識結果の正解の候補に尤度を付与して認識
結果の正解の候補の順位を尤度の大きさにより規定し、
尤度の大きさの順位に正解の候補すべての復唱確認を実
施して正解の認識結果を選択している。
の尤もらしさを表すパラメータとして尤度を使用してい
る。なお、尤度とは統計的手法による音声認識の計算処
理において使用されるパラメータであり、その計算式
は、例えば「Hidden Markov Model に基づいた音声認
識:大河内 正明、日本音響学会誌第42巻第12号、
1986年」、或いは「A tutorial on Hidden Markov
Model and Selected applications in speech recognit
ion :L.R.Rabiner 、proceedings of IEEE Vol.77No.
2、1989 」に示されている。音声認識における尤度の使
用の仕方は認識結果の正解の候補に尤度を付与して認識
結果の正解の候補の順位を尤度の大きさにより規定し、
尤度の大きさの順位に正解の候補すべての復唱確認を実
施して正解の認識結果を選択している。
【0004】
【発明が解決しようとする課題】対話型音声認識装置に
おいては、上述した通り、認識結果の正解の候補のそれ
ぞれについて復唱確認を実施して正解の認識結果を選択
している。この場合、認識結果の正解の候補の内には、
種々の要因により尤度の極く小さいもの、例えば認識装
置が周囲雑音を誤認識して正解の候補であるものとされ
たものも含まれている。対話型音声認識装置は、この様
にして音声認識が正しく実施されなかった場合の誤った
認識結果の正解の候補についても復唱確認操作を実施す
るものであり、その分だけ対話時間を増大する。
おいては、上述した通り、認識結果の正解の候補のそれ
ぞれについて復唱確認を実施して正解の認識結果を選択
している。この場合、認識結果の正解の候補の内には、
種々の要因により尤度の極く小さいもの、例えば認識装
置が周囲雑音を誤認識して正解の候補であるものとされ
たものも含まれている。対話型音声認識装置は、この様
にして音声認識が正しく実施されなかった場合の誤った
認識結果の正解の候補についても復唱確認操作を実施す
るものであり、その分だけ対話時間を増大する。
【0005】この発明は、音声認識の結果として出力さ
れる複数の音声認識結果について音声認識が適正に実施
された結果のものであるか否かを識別し、音声認識が適
正に実施されたものと認識されたもののみを認識結果の
正解の候補として復唱確認の操作を実施して、音声対話
時間を短縮した利用者にとって使用し易い対話型音声認
識方法およびこの方法を実施する装置を提供するもので
ある。
れる複数の音声認識結果について音声認識が適正に実施
された結果のものであるか否かを識別し、音声認識が適
正に実施されたものと認識されたもののみを認識結果の
正解の候補として復唱確認の操作を実施して、音声対話
時間を短縮した利用者にとって使用し易い対話型音声認
識方法およびこの方法を実施する装置を提供するもので
ある。
【0006】
【課題を解決するための手段】1位の音声認識結果の尤
度と2位以下の各音声認識結果の尤度との間の差を尤度
差とし、認識単語種別毎にこの尤度差の或る一定値を尤
度差閾値として設定記憶しておき、或る認識単語種別の
認識において、1位の認識結果の尤度と2位以下の各認
識結果の尤度との間の尤度差を測定し、各尤度差と先に
記憶されている当該認識単語種別の尤度差閾値との間の
比較をして認識結果の正解の候補を選択する対話型音声
認識方法を構成した。
度と2位以下の各音声認識結果の尤度との間の差を尤度
差とし、認識単語種別毎にこの尤度差の或る一定値を尤
度差閾値として設定記憶しておき、或る認識単語種別の
認識において、1位の認識結果の尤度と2位以下の各認
識結果の尤度との間の尤度差を測定し、各尤度差と先に
記憶されている当該認識単語種別の尤度差閾値との間の
比較をして認識結果の正解の候補を選択する対話型音声
認識方法を構成した。
【0007】そして、利用者により特定される認識単語
種別に基づいて対話制御部14内の尤度差閾値記憶部4
2から尤度差閾値Lthを予め選択設定し、音声認識部1
1から出力される尤度の大きさにより順位付けられた複
数の認識結果について尤度が最も大きい1位認識結果の
尤度L1 と2位以下の認識結果の尤度Ln との間の比較
を順次に実施し、尤度L1 と尤度Ln の差が尤度差閾値
Lth以下であれば、n位の認識結果を復唱確認を実施す
る対象である認識結果の正解の候補として選択する対話
型音声認識方法を構成した。
種別に基づいて対話制御部14内の尤度差閾値記憶部4
2から尤度差閾値Lthを予め選択設定し、音声認識部1
1から出力される尤度の大きさにより順位付けられた複
数の認識結果について尤度が最も大きい1位認識結果の
尤度L1 と2位以下の認識結果の尤度Ln との間の比較
を順次に実施し、尤度L1 と尤度Ln の差が尤度差閾値
Lth以下であれば、n位の認識結果を復唱確認を実施す
る対象である認識結果の正解の候補として選択する対話
型音声認識方法を構成した。
【0008】また、利用者の発声した音声を認識し、認
識結果に尤度を付与して尤度の大きさにより順位付けし
た複数の認識結果を出力する音声認識部11を具備し、
利用者に対して発声要求および認識結果の復唱確認を含
むガイダンスを送出する音声応答部12を具備し、音声
認識部11と音声応答部12を制御して音声対話の制御
を実行する対話制御部14を具備し、この対話制御部1
4は音声認識部11と音声応答部12の制御手順である
対話フローを記憶する対話フロー記憶部41および単語
種別毎の尤度差閾値を記憶する尤度閾値記憶部42より
成り、或る認識単語種別の単語について1位の認識結果
の尤度と2位以下の各認識結果の尤度との間の尤度差を
測定して尤度差と先に記憶されている当該認識単語種別
の尤度差閾値との間の比較を行ない、復唱確認を実施す
る認識結果の正解の候補を選択する対話型音声認識装置
を構成した。
識結果に尤度を付与して尤度の大きさにより順位付けし
た複数の認識結果を出力する音声認識部11を具備し、
利用者に対して発声要求および認識結果の復唱確認を含
むガイダンスを送出する音声応答部12を具備し、音声
認識部11と音声応答部12を制御して音声対話の制御
を実行する対話制御部14を具備し、この対話制御部1
4は音声認識部11と音声応答部12の制御手順である
対話フローを記憶する対話フロー記憶部41および単語
種別毎の尤度差閾値を記憶する尤度閾値記憶部42より
成り、或る認識単語種別の単語について1位の認識結果
の尤度と2位以下の各認識結果の尤度との間の尤度差を
測定して尤度差と先に記憶されている当該認識単語種別
の尤度差閾値との間の比較を行ない、復唱確認を実施す
る認識結果の正解の候補を選択する対話型音声認識装置
を構成した。
【0009】
【発明の実施の形態】この発明の実施の形態を説明す
る。対話型音声認識装置にアクセスし、サービス名を音
声により入力して任意のサービスを選択するという業務
を実施する場合、認識の対象とされる認識単語種別とし
て、名前、住所、所属、地名、その他の如き認識単語種
別が考えられる。この発明は音声認識の対象とされる単
語について音声認識を実施し、音声認識結果の尤もらし
さの尺度として尤度を音声認識結果に付与し、認識結果
の順位を尤度の大きさにより規定する。認識単語種別毎
に音声認識を実施して尤度を付与し、1位の音声認識結
果の尤度と2位以下の各音声認識結果の尤度との間の差
を尤度差として試験測定することを予め実施する。そし
て、各認識単語種別について尤度差がどの程度以下であ
れば2位以下の各音声認識結果を正しい認識結果である
可能性があるものとして採用することができるかという
ことを試験測定し、この尤度差の値を認識単語種別毎に
「尤度差閾値」として記憶しておく。
る。対話型音声認識装置にアクセスし、サービス名を音
声により入力して任意のサービスを選択するという業務
を実施する場合、認識の対象とされる認識単語種別とし
て、名前、住所、所属、地名、その他の如き認識単語種
別が考えられる。この発明は音声認識の対象とされる単
語について音声認識を実施し、音声認識結果の尤もらし
さの尺度として尤度を音声認識結果に付与し、認識結果
の順位を尤度の大きさにより規定する。認識単語種別毎
に音声認識を実施して尤度を付与し、1位の音声認識結
果の尤度と2位以下の各音声認識結果の尤度との間の差
を尤度差として試験測定することを予め実施する。そし
て、各認識単語種別について尤度差がどの程度以下であ
れば2位以下の各音声認識結果を正しい認識結果である
可能性があるものとして採用することができるかという
ことを試験測定し、この尤度差の値を認識単語種別毎に
「尤度差閾値」として記憶しておく。
【0010】ここで、或る認識単語種別の認識におい
て、利用者の発声が1位で正しく認識される場合の1位
の認識結果の尤度と2位以下の各認識結果の尤度との間
の尤度差を測定し、尤度差と先に試験測定して記憶され
ている当該認識単語種別の尤度差閾値との間の比較を行
い、この尤度差が尤度差閾値以下である認識結果は正し
い認識結果である可能性があるものと見做して復唱確認
を実施する認識結果の正解の候補として選択する。それ
以外の各認識結果は復唱確認の実施の対象外とすること
により、復唱確認を実施する認識結果の個数を適正化し
て音声対話時間を短縮する。
て、利用者の発声が1位で正しく認識される場合の1位
の認識結果の尤度と2位以下の各認識結果の尤度との間
の尤度差を測定し、尤度差と先に試験測定して記憶され
ている当該認識単語種別の尤度差閾値との間の比較を行
い、この尤度差が尤度差閾値以下である認識結果は正し
い認識結果である可能性があるものと見做して復唱確認
を実施する認識結果の正解の候補として選択する。それ
以外の各認識結果は復唱確認の実施の対象外とすること
により、復唱確認を実施する認識結果の個数を適正化し
て音声対話時間を短縮する。
【0011】尤度差閾値は認識単語種別毎に相違するの
で、尤度差閾値を認識単語種別に無関係に一定の値のも
のを使用することはできない。即ち、或る認識単語種別
については、尤度差は相当に大きくてもこれを正しい認
識結果である可能性があるものと見做して差し支えな
く、この場合は尤度差閾値は大きく設定する。これに対
して、他の或る認識単語種別については、尤度差は小さ
くてもこれを正しい認識結果である可能性があるものと
することができず、この場合は尤度差閾値は小さく設定
する。この様に、認識単語種別毎に適正な尤度差閾値を
予め試験測定して記憶しておき、音声対話時に各認識単
語種別に対応した尤度差閾値を参照することにより、認
識の正しさの判定精度を向上することができる。
で、尤度差閾値を認識単語種別に無関係に一定の値のも
のを使用することはできない。即ち、或る認識単語種別
については、尤度差は相当に大きくてもこれを正しい認
識結果である可能性があるものと見做して差し支えな
く、この場合は尤度差閾値は大きく設定する。これに対
して、他の或る認識単語種別については、尤度差は小さ
くてもこれを正しい認識結果である可能性があるものと
することができず、この場合は尤度差閾値は小さく設定
する。この様に、認識単語種別毎に適正な尤度差閾値を
予め試験測定して記憶しておき、音声対話時に各認識単
語種別に対応した尤度差閾値を参照することにより、認
識の正しさの判定精度を向上することができる。
【0012】
【実施例】この発明の実施例を図1および図2を参照し
て更に具体的に説明する。図1において、11は利用者
の音声を認識する音声認識部、12は利用者へのガイダ
ンスを送出する音声応答部、3は通話回線5への音声信
号の伝送および通話回線5から入力する音声信号の取り
出しを行う伝送装置、14は音声認識部11と音声応答
部12を制御して音声対話の制御を実行する対話制御
部、41は音声認識部11と音声応答部12の制御手順
である対話フローを記憶する対話フロー記憶部、42は
単語種別毎の尤度差閾値を記憶する尤度差閾値記憶部、
5は伝送装置3と利用者とを接続して音声対話をする通
話回線、6は伝送装置3と音声認識部11との間を接続
する通話線、7は伝送装置3と音声応答部2との間を接
続する通話線、8は対話制御部14と音声認識部11と
の間を接続する制御線、9は対話制御部4と音声応答部
2との間を接続する制御線、10は対話制御部14と伝
送装置3との間を接続する制御線である。
て更に具体的に説明する。図1において、11は利用者
の音声を認識する音声認識部、12は利用者へのガイダ
ンスを送出する音声応答部、3は通話回線5への音声信
号の伝送および通話回線5から入力する音声信号の取り
出しを行う伝送装置、14は音声認識部11と音声応答
部12を制御して音声対話の制御を実行する対話制御
部、41は音声認識部11と音声応答部12の制御手順
である対話フローを記憶する対話フロー記憶部、42は
単語種別毎の尤度差閾値を記憶する尤度差閾値記憶部、
5は伝送装置3と利用者とを接続して音声対話をする通
話回線、6は伝送装置3と音声認識部11との間を接続
する通話線、7は伝送装置3と音声応答部2との間を接
続する通話線、8は対話制御部14と音声認識部11と
の間を接続する制御線、9は対話制御部4と音声応答部
2との間を接続する制御線、10は対話制御部14と伝
送装置3との間を接続する制御線である。
【0013】図2は音声認識して出力される複数の音声
認識結果の内から復唱確認を実施する対象である認識結
果の正解の候補を選択する手順を説明するフローチャー
トである。図2において、Lthは尤度差閾値であり、利
用者により特定されるサービス対象の認識単語種別に基
づいて対話制御部14内の尤度差閾値記憶部42から予
め選択設定される。音声認識部11による音声認識結果
は単語を識別する単語情報および認識結果の尤もらしさ
を表すパラメータである尤度により構成され、尤度の大
きさにより順位付けられた複数の認識結果が音声認識部
11から出力される。
認識結果の内から復唱確認を実施する対象である認識結
果の正解の候補を選択する手順を説明するフローチャー
トである。図2において、Lthは尤度差閾値であり、利
用者により特定されるサービス対象の認識単語種別に基
づいて対話制御部14内の尤度差閾値記憶部42から予
め選択設定される。音声認識部11による音声認識結果
は単語を識別する単語情報および認識結果の尤もらしさ
を表すパラメータである尤度により構成され、尤度の大
きさにより順位付けられた複数の認識結果が音声認識部
11から出力される。
【0014】尤度が最も大きい1位認識結果の尤度L1
と2位以下の認識結果の尤度Ln との間の比較を順次に
実施し、尤度L1 と尤度Ln の差が尤度差閾値Lth以下
であれば、n位の認識結果を復唱確認を実施する対象で
ある認識結果の正解の候補として選択する。図3を参照
して説明するに、これは利用者が自身の伝送装置30か
ら対話型音声認識装置1にアクセスして音声による情報
入力を実施する手順を説明する図である。この例は、サ
ービス名を音声で入力して任意のサービスを選択するサ
ービスの例である。
と2位以下の認識結果の尤度Ln との間の比較を順次に
実施し、尤度L1 と尤度Ln の差が尤度差閾値Lth以下
であれば、n位の認識結果を復唱確認を実施する対象で
ある認識結果の正解の候補として選択する。図3を参照
して説明するに、これは利用者が自身の伝送装置30か
ら対話型音声認識装置1にアクセスして音声による情報
入力を実施する手順を説明する図である。この例は、サ
ービス名を音声で入力して任意のサービスを選択するサ
ービスの例である。
【0015】利用者が自身の伝送装置30を介して対話
型音声認識装置1に対してアクセス番号をダイヤルして
発呼すると、交換機2は通話回線5を経由して伝送装置
30と対話型音声認識装置1とを接続すると共に、制御
線10を経由して対話型音声認識装置1へ音声によるサ
ービス選択を依頼する。対話型音声認識装置1は、制御
線10を介して受信した制御信号に基づいて対話制御部
14の対話フロー記憶部41に記憶する音声認識部11
と音声応答部12の制御手順である対話フロー141を
選択する。対話制御部14は、先に選択した対話フロー
141に基づいて音声認識部11と音声応答部12とを
制御し、サービス名を収集する。収集したサービス名は
制御線10を介して交換機2に通知される。
型音声認識装置1に対してアクセス番号をダイヤルして
発呼すると、交換機2は通話回線5を経由して伝送装置
30と対話型音声認識装置1とを接続すると共に、制御
線10を経由して対話型音声認識装置1へ音声によるサ
ービス選択を依頼する。対話型音声認識装置1は、制御
線10を介して受信した制御信号に基づいて対話制御部
14の対話フロー記憶部41に記憶する音声認識部11
と音声応答部12の制御手順である対話フロー141を
選択する。対話制御部14は、先に選択した対話フロー
141に基づいて音声認識部11と音声応答部12とを
制御し、サービス名を収集する。収集したサービス名は
制御線10を介して交換機2に通知される。
【0016】図4および図5を参照して対話フローによ
る音声認識手順について説明する。図4は対話フロー1
41の1例である。図5は図4の対話フローに基づいて
対話制御部14と、音声認識部11と、音声応答部12
との間を制御する手順を説明するシーケンス図である。
対話制御部14は音声認識部11にサービス名の認識開
始を指示した後、音声応答部12に対してサービス名発
声要求ガイダンスの送出を指示する。利用者の発声した
音声を音声認識部11が検出すると、音声認識部11は
認識処理を実施し、認識結果を対話制御部14に通知す
る。
る音声認識手順について説明する。図4は対話フロー1
41の1例である。図5は図4の対話フローに基づいて
対話制御部14と、音声認識部11と、音声応答部12
との間を制御する手順を説明するシーケンス図である。
対話制御部14は音声認識部11にサービス名の認識開
始を指示した後、音声応答部12に対してサービス名発
声要求ガイダンスの送出を指示する。利用者の発声した
音声を音声認識部11が検出すると、音声認識部11は
認識処理を実施し、認識結果を対話制御部14に通知す
る。
【0017】対話制御部14は音声認識部11から通知
されたサービス名の認識結果の内から復唱確認を実施す
る認識結果を選択し、音声認識部11に対して選択結果
である復唱確認語の認識開始を指示すると共に、音声応
答部12に対して選択した認識結果の復唱確認ガイダン
スの送出を指示する。利用者の発声した音声を音声認識
部11が検出すると、音声認識部11は認識処理を行
い、認識結果を対話制御部14に通知する。
されたサービス名の認識結果の内から復唱確認を実施す
る認識結果を選択し、音声認識部11に対して選択結果
である復唱確認語の認識開始を指示すると共に、音声応
答部12に対して選択した認識結果の復唱確認ガイダン
スの送出を指示する。利用者の発声した音声を音声認識
部11が検出すると、音声認識部11は認識処理を行
い、認識結果を対話制御部14に通知する。
【0018】対話制御部14は音声認識部11から通知
された確認語の認識結果から、復唱確認したサービス名
の認識結果が確定したか否かを判定する。サービス名の
認識結果が確定した場合、サービス名の収集に成功した
と見做して対話フローを終了させる。サービス名の認識
結果が確定せず、かつ、次の復唱確認すべきサービス名
の認識結果が存在するならば、引き続いてサービス名認
識結果の復唱確認を行う。
された確認語の認識結果から、復唱確認したサービス名
の認識結果が確定したか否かを判定する。サービス名の
認識結果が確定した場合、サービス名の収集に成功した
と見做して対話フローを終了させる。サービス名の認識
結果が確定せず、かつ、次の復唱確認すべきサービス名
の認識結果が存在するならば、引き続いてサービス名認
識結果の復唱確認を行う。
【0019】サービス名の認識結果が確定せず、かつ、
次の復唱確認すべきサービス名の認識結果が存在しない
ならば、サービス名の収集に失敗したと見做し、対話フ
ローを終了させる。
次の復唱確認すべきサービス名の認識結果が存在しない
ならば、サービス名の収集に失敗したと見做し、対話フ
ローを終了させる。
【0020】
【発明の効果】以上の通りであって、この発明によれ
ば、認識単語種別毎に適正な尤度差閾値を予め試験測定
して記憶しておき、音声対話時に各認識単語種別に対応
した尤度差閾値を参照して音声認識の結果として出力さ
れる複数の音声認識結果について音声認識が適正に実施
された結果のものであるか否かを識別し、音声認識が適
正に実施されたものと認識されたもののみを認識結果の
正解の候補として復唱確認の操作を実施することによ
り、認識の正しさの判定精度を向上することができるこ
ととなり、音声対話時間を短縮した利用者にとって使用
し易い対話型音声認識方法およびこの方法を実施する装
置を提供することができる。
ば、認識単語種別毎に適正な尤度差閾値を予め試験測定
して記憶しておき、音声対話時に各認識単語種別に対応
した尤度差閾値を参照して音声認識の結果として出力さ
れる複数の音声認識結果について音声認識が適正に実施
された結果のものであるか否かを識別し、音声認識が適
正に実施されたものと認識されたもののみを認識結果の
正解の候補として復唱確認の操作を実施することによ
り、認識の正しさの判定精度を向上することができるこ
ととなり、音声対話時間を短縮した利用者にとって使用
し易い対話型音声認識方法およびこの方法を実施する装
置を提供することができる。
【図1】対話型音声認識装置の実施例を説明するブロッ
ク図。
ク図。
【図2】対話型音声認識装置内で行なわれる復唱確認を
実施する認識結果の選択手順を説明するフローチャー
ト。
実施する認識結果の選択手順を説明するフローチャー
ト。
【図3】サービス名の収集手順を説明するシーケンス
図。
図。
【図4】対話フローの一例を示す図。
【図5】対話型音声認識装置内で行なわれる認識結果の
正解を認識する制御手順を説明するシーケンス図。
正解を認識する制御手順を説明するシーケンス図。
1 対話型音声認識装置 2 交換機 3 伝送装置 5 通話回線 6、7 通話線 8、9、10 制御線 11 音声認識部 12 音声応答部 14 対話制御部 30 利用者伝送装置 41 対話フロー記憶部 42 尤度差閾値記憶部 141 対話フロー Lth 尤度閾値 Ln 尤度
Claims (3)
- 【請求項1】 1位の音声認識結果の尤度と2位以下の
各音声認識結果の尤度との間の差を尤度差とし、認識単
語種別毎にこの尤度差の或る一定値を尤度差閾値として
設定記憶しておき、 或る認識単語種別の認識において、1位の認識結果の尤
度と2位以下の各認識結果の尤度との間の尤度差を測定
し、各尤度差と先に記憶されている当該認識単語種別の
尤度差閾値との間の比較をして認識結果の正解の候補を
選択することを特徴とする対話型音声認識方法。 - 【請求項2】 請求項1に記載される対話型音声認識方
法において、 利用者により特定される認識単語種別に基づいて対話制
御部内の尤度差閾値記憶部から尤度差閾値を予め選択設
定し、音声認識部から出力される尤度の大きさにより順
位付けられた複数の認識結果について尤度が最も大きい
1位認識結果の尤度と2位以下の認識結果の尤度との間
の比較を順次に実施し、1位認識結果の尤度と2位以下
n位の尤度の差が尤度差閾値以下であれば、n位の認識
結果を復唱確認を実施する対象である認識結果の正解の
候補として選択することを特徴とする対話型音声認識方
法。 - 【請求項3】 利用者の発声した音声を認識し、認識結
果に尤度を付与して尤度の大きさにより順位付けをした
複数の認識結果を出力する音声認識部を具備し、 利用者に対して発声要求および認識結果の復唱確認を含
むガイダンスを送出する音声応答部を具備し、 音声認識部と音声応答部を制御して音声対話の制御を実
行する対話制御部を具備し、この対話制御部は音声認識
部と音声応答部の制御手順である対話フローを記憶する
対話フロー記憶部および単語種別毎の尤度差閾値を記憶
する尤度差閾値記憶部より成り、 或る認識単語種別の単語について1位の認識結果の尤度
と2位以下n位の各認識結果の尤度との間の尤度差を測
定して尤度差と先に記憶されている当該認識単語種別の
尤度差閾値との間の比較を行ない、復唱確認を実施する
認識結果の正解の候補を選択することを特徴とする対話
型音声認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9007757A JPH10207486A (ja) | 1997-01-20 | 1997-01-20 | 対話型音声認識方法およびこの方法を実施する装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9007757A JPH10207486A (ja) | 1997-01-20 | 1997-01-20 | 対話型音声認識方法およびこの方法を実施する装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH10207486A true JPH10207486A (ja) | 1998-08-07 |
Family
ID=11674578
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9007757A Pending JPH10207486A (ja) | 1997-01-20 | 1997-01-20 | 対話型音声認識方法およびこの方法を実施する装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH10207486A (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7343288B2 (en) | 2002-05-08 | 2008-03-11 | Sap Ag | Method and system for the processing and storing of voice information and corresponding timeline information |
| US7406413B2 (en) | 2002-05-08 | 2008-07-29 | Sap Aktiengesellschaft | Method and system for the processing of voice data and for the recognition of a language |
| JP2014194480A (ja) * | 2013-03-28 | 2014-10-09 | Fujitsu Ltd | 音声処理装置、音声処理システムおよび音声処理方法 |
| US9251789B2 (en) | 2012-07-04 | 2016-02-02 | Seiko Epson Corporation | Speech-recognition system, storage medium, and method of speech recognition |
| JP2016102823A (ja) * | 2014-11-27 | 2016-06-02 | アルパイン株式会社 | 情報処理システム、音声入力装置及びコンピュータプログラム |
| WO2019030810A1 (ja) * | 2017-08-08 | 2019-02-14 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
-
1997
- 1997-01-20 JP JP9007757A patent/JPH10207486A/ja active Pending
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7343288B2 (en) | 2002-05-08 | 2008-03-11 | Sap Ag | Method and system for the processing and storing of voice information and corresponding timeline information |
| US7406413B2 (en) | 2002-05-08 | 2008-07-29 | Sap Aktiengesellschaft | Method and system for the processing of voice data and for the recognition of a language |
| US9251789B2 (en) | 2012-07-04 | 2016-02-02 | Seiko Epson Corporation | Speech-recognition system, storage medium, and method of speech recognition |
| JP2014194480A (ja) * | 2013-03-28 | 2014-10-09 | Fujitsu Ltd | 音声処理装置、音声処理システムおよび音声処理方法 |
| JP2016102823A (ja) * | 2014-11-27 | 2016-06-02 | アルパイン株式会社 | 情報処理システム、音声入力装置及びコンピュータプログラム |
| WO2019030810A1 (ja) * | 2017-08-08 | 2019-02-14 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
| JPWO2019030810A1 (ja) * | 2017-08-08 | 2019-11-14 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6377922B2 (en) | Distributed recognition system having multiple prompt-specific and response-specific speech recognizers | |
| US5566272A (en) | Automatic speech recognition (ASR) processing using confidence measures | |
| US5917889A (en) | Capture of alphabetic or alphanumeric character strings in an automated call processing environment | |
| US7933773B1 (en) | Natural language understanding monitoring system for identifying a task | |
| US6487530B1 (en) | Method for recognizing non-standard and standard speech by speaker independent and speaker dependent word models | |
| US5917890A (en) | Disambiguation of alphabetic characters in an automated call processing environment | |
| US6601029B1 (en) | Voice processing apparatus | |
| US7127395B1 (en) | Method and system for predicting understanding errors in a task classification system | |
| US7881938B2 (en) | Speech bookmarks in a voice user interface using a speech recognition engine and acoustically generated baseforms | |
| US20120253823A1 (en) | Hybrid Dialog Speech Recognition for In-Vehicle Automated Interaction and In-Vehicle Interfaces Requiring Minimal Driver Processing | |
| EP1561204B1 (en) | Method and system for speech recognition | |
| US20030091163A1 (en) | Learning of dialogue states and language model of spoken information system | |
| US20090106026A1 (en) | Speech recognition method, device, and computer program | |
| US20040260543A1 (en) | Pattern cross-matching | |
| US20020128840A1 (en) | Artificial language | |
| US20060287868A1 (en) | Dialog system | |
| WO2000068933A1 (en) | Adaptation of a speech recognition system across multiple remote sessions with a speaker | |
| US20060020471A1 (en) | Method and apparatus for robustly locating user barge-ins in voice-activated command systems | |
| US20050144255A1 (en) | System for communicating with a server through a mobile communication device | |
| KR100442308B1 (ko) | 음성인식데이터베이스에서의주소등록방법및시스템 | |
| US8626506B2 (en) | Method and system for dynamic nametag scoring | |
| CN111613226B (zh) | 语音交互方法、装置及测试机器人 | |
| JPH10207486A (ja) | 対話型音声認識方法およびこの方法を実施する装置 | |
| US6952674B2 (en) | Selecting an acoustic model in a speech recognition system | |
| WO2012174515A1 (en) | Hybrid dialog speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same |