JPH08160988A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPH08160988A JPH08160988A JP6303336A JP30333694A JPH08160988A JP H08160988 A JPH08160988 A JP H08160988A JP 6303336 A JP6303336 A JP 6303336A JP 30333694 A JP30333694 A JP 30333694A JP H08160988 A JPH08160988 A JP H08160988A
- Authority
- JP
- Japan
- Prior art keywords
- word
- words
- registered
- recognition
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Abstract
(57)【要約】
【目的】 利用者に、装置の認識対象語彙を容易に理解
させることができるようにする。 【構成】 類似度計算部5において、マイク1に入力さ
れた音声と、単語辞書に登録されている単語との類似度
を示すスコアが計算される。そして、出力装置7では、
そのスコアの高い順に所定数の単語が表示され、それに
続けて、認識辞書に登録されているその他の単語も表示
される。出力装置7の表示は、キー入力装置8を操作す
ることによりスクロールさせることができる。
させることができるようにする。 【構成】 類似度計算部5において、マイク1に入力さ
れた音声と、単語辞書に登録されている単語との類似度
を示すスコアが計算される。そして、出力装置7では、
そのスコアの高い順に所定数の単語が表示され、それに
続けて、認識辞書に登録されているその他の単語も表示
される。出力装置7の表示は、キー入力装置8を操作す
ることによりスクロールさせることができる。
Description
【0001】
【産業上の利用分野】本発明は、発話された単語を認識
する音声認識装置に関する。
する音声認識装置に関する。
【0002】
【従来の技術】音声認識装置は、それ自体単独で用いら
れることは少なく、通常は、他の装置に組み込まれ、例
えばその装置を動作させる命令などを、音声で入力する
ための入力装置として用いられる場合が多い。
れることは少なく、通常は、他の装置に組み込まれ、例
えばその装置を動作させる命令などを、音声で入力する
ための入力装置として用いられる場合が多い。
【0003】ところで、音声認識装置で100%の認識
率を達成するのは困難であり、従って、発話者に対して
認識結果の確認を行わずに、その認識結果に対応する命
令を実行することは、誤った処理を行うことになる。即
ち、例えば駅の自動券売機に、駅名を認識対象単語とす
る離散単語音声認識装置を組み込み、認識結果の確認を
行わず発券するようにした場合、認識結果が誤っている
ときには、利用者が意図していない乗車券の発行がされ
ることになる。この場合、利用者および駅の職員の両方
に、乗車券の再発行手続という手間をかけさせることに
なる。
率を達成するのは困難であり、従って、発話者に対して
認識結果の確認を行わずに、その認識結果に対応する命
令を実行することは、誤った処理を行うことになる。即
ち、例えば駅の自動券売機に、駅名を認識対象単語とす
る離散単語音声認識装置を組み込み、認識結果の確認を
行わず発券するようにした場合、認識結果が誤っている
ときには、利用者が意図していない乗車券の発行がされ
ることになる。この場合、利用者および駅の職員の両方
に、乗車券の再発行手続という手間をかけさせることに
なる。
【0004】そこで、複数の認識結果候補を、例えばタ
ッチパネル付きの画面に表示し、その中から、利用者
に、正しい駅名を選択させる、音声認識装置付き自動券
売機の公開実験などが行われている。
ッチパネル付きの画面に表示し、その中から、利用者
に、正しい駅名を選択させる、音声認識装置付き自動券
売機の公開実験などが行われている。
【0005】
【発明が解決しようとする課題】ところで、従来の離散
単語音声認識装置としては、例えば数10乃至数100
程度の単語を認識対象とするものが一般的であるが、そ
の利用にあたっては、利用者が、その認識対象語彙(単
語)を容易に知り得ることが重要である。上述したよう
に、音声認識装置を自動券売器に組み込んだ場合には、
利用者は、認識対象語彙が駅名であると判断することが
できる。従って、利用者は、駅名を発声すれば良いこと
を容易に認識することができる。さらに、通常、自動券
売機の近くには、駅名と運賃とが記載された運賃表が掲
示されているので、利用者は、それを見て、自身が希望
する駅名を発声すれば良い。
単語音声認識装置としては、例えば数10乃至数100
程度の単語を認識対象とするものが一般的であるが、そ
の利用にあたっては、利用者が、その認識対象語彙(単
語)を容易に知り得ることが重要である。上述したよう
に、音声認識装置を自動券売器に組み込んだ場合には、
利用者は、認識対象語彙が駅名であると判断することが
できる。従って、利用者は、駅名を発声すれば良いこと
を容易に認識することができる。さらに、通常、自動券
売機の近くには、駅名と運賃とが記載された運賃表が掲
示されているので、利用者は、それを見て、自身が希望
する駅名を発声すれば良い。
【0006】しかしながら、このように認識対象語彙を
容易に知り得ない場合に、誤った認識結果が得られたと
きには、利用者は、それが装置の誤認識によるものなの
か、あるいは、発話した単語が認識対象語彙となってい
なかったことによるものなのか分からず、従って同一単
語を繰り返し発話する必要があった。
容易に知り得ない場合に、誤った認識結果が得られたと
きには、利用者は、それが装置の誤認識によるものなの
か、あるいは、発話した単語が認識対象語彙となってい
なかったことによるものなのか分からず、従って同一単
語を繰り返し発話する必要があった。
【0007】さらに、例えば利用者が風邪などで声の調
子が悪い場合や、利用者と音声認識装置との相性が悪い
場合、また装置の使い方を誤った場合などでも、誤った
認識結果が得られることがあるが、このような場合で
も、やはり利用者には、それが装置の誤認識によるもの
なのか、あるいは、発話した単語が認識対象語彙となっ
ていなかったことによるものなのか分からず、装置の使
い勝手が悪かった。
子が悪い場合や、利用者と音声認識装置との相性が悪い
場合、また装置の使い方を誤った場合などでも、誤った
認識結果が得られることがあるが、このような場合で
も、やはり利用者には、それが装置の誤認識によるもの
なのか、あるいは、発話した単語が認識対象語彙となっ
ていなかったことによるものなのか分からず、装置の使
い勝手が悪かった。
【0008】本発明は、このような状況に鑑みてなされ
たものであり、装置の認識対象語彙を利用者に容易に認
識させることにより、装置の使い勝手を向上させること
ができるようにするものである。
たものであり、装置の認識対象語彙を利用者に容易に認
識させることにより、装置の使い勝手を向上させること
ができるようにするものである。
【0009】
【課題を解決するための手段】本発明の音声認識装置
は、認識対象単語が登録されている単語辞書(例えば、
図1に示す認識辞書など)と、入力された音声と、単語
辞書に登録されている単語との類似度を表すスコアを計
算し、そのスコアの高い順に所定数の単語を出力するス
コア計算手段(例えば、図1に示す類似度計算部5な
ど)と、スコア計算手段より出力された所定数の単語
と、それに続けて単語辞書に登録されている単語とを表
示する表示手段(例えば、図1に示す出力装置7など)
と、表示手段に表示された単語の中から、音声の認識結
果を選択するときに操作される操作手段(例えば、図1
に示すキー入力装置8など)とを備えることを特徴とす
る。
は、認識対象単語が登録されている単語辞書(例えば、
図1に示す認識辞書など)と、入力された音声と、単語
辞書に登録されている単語との類似度を表すスコアを計
算し、そのスコアの高い順に所定数の単語を出力するス
コア計算手段(例えば、図1に示す類似度計算部5な
ど)と、スコア計算手段より出力された所定数の単語
と、それに続けて単語辞書に登録されている単語とを表
示する表示手段(例えば、図1に示す出力装置7など)
と、表示手段に表示された単語の中から、音声の認識結
果を選択するときに操作される操作手段(例えば、図1
に示すキー入力装置8など)とを備えることを特徴とす
る。
【0010】表示手段は、操作手段の操作に対応してス
クロールさせることができる。また、表示手段には、操
作手段の操作に対応してページを切り替えさせることが
できる。さらに、表示手段には、スコア計算手段により
出力された所定数の単語を、スコアの高い順に表示させ
ることができる。また、表示手段には、単語辞書に登録
されている他の単語を、文字コード順に表示させること
ができる。さらに、表示手段には、単語辞書に登録され
ている他の単語を、登録順に表示させることができる。
また、表示手段には、単語辞書に登録されている他の単
語を、50音順に表示させることができる。また、認識
対象単語は、地名とすることができる。
クロールさせることができる。また、表示手段には、操
作手段の操作に対応してページを切り替えさせることが
できる。さらに、表示手段には、スコア計算手段により
出力された所定数の単語を、スコアの高い順に表示させ
ることができる。また、表示手段には、単語辞書に登録
されている他の単語を、文字コード順に表示させること
ができる。さらに、表示手段には、単語辞書に登録され
ている他の単語を、登録順に表示させることができる。
また、表示手段には、単語辞書に登録されている他の単
語を、50音順に表示させることができる。また、認識
対象単語は、地名とすることができる。
【0011】認識対象単語が地名である場合、表示手段
には、単語辞書に登録されている他の単語である地名
を、JISコード順に表示させることができる。
には、単語辞書に登録されている他の単語である地名
を、JISコード順に表示させることができる。
【0012】
【作用】上記構成の音声認識装置においては、入力され
た音声と、単語辞書に登録されている単語とのスコアが
計算され、そのスコアの高い順に所定数の単語が表示さ
れるとともに、単語辞書に登録されている他の単語も表
示される。そして、表示された単語の中から、音声の認
識結果が選択される。従って、利用者は、装置の認識対
象語彙を容易に認識することができるので、装置の使い
勝手を向上させることができる。
た音声と、単語辞書に登録されている単語とのスコアが
計算され、そのスコアの高い順に所定数の単語が表示さ
れるとともに、単語辞書に登録されている他の単語も表
示される。そして、表示された単語の中から、音声の認
識結果が選択される。従って、利用者は、装置の認識対
象語彙を容易に認識することができるので、装置の使い
勝手を向上させることができる。
【0013】
【実施例】図1は、本発明の音声認識装置の一実施例の
構成を示すブロック図である。マイク1は、音声を電気
信号としての音声信号に変換するようになされている。
特徴抽出部2は、マイク1からの音声信号をA/D変換
してディジタル信号とし、さらにその音声信号を、所定
のフレーム単位(例えば、10ms単位など)で音響分
析して、音声の特徴パラメータを抽出するようになされ
ている。即ち、特徴抽出部2は、例えば複数のBPFで
なるフィルタバンクを有し、各BPFの整流平滑化出力
を特徴パラメータとして出力するようになされている。
さらに、特徴抽出部2は、音声信号のゼロクロス数など
も算出するようになされている。
構成を示すブロック図である。マイク1は、音声を電気
信号としての音声信号に変換するようになされている。
特徴抽出部2は、マイク1からの音声信号をA/D変換
してディジタル信号とし、さらにその音声信号を、所定
のフレーム単位(例えば、10ms単位など)で音響分
析して、音声の特徴パラメータを抽出するようになされ
ている。即ち、特徴抽出部2は、例えば複数のBPFで
なるフィルタバンクを有し、各BPFの整流平滑化出力
を特徴パラメータとして出力するようになされている。
さらに、特徴抽出部2は、音声信号のゼロクロス数など
も算出するようになされている。
【0014】なお、特徴抽出部2には、その他、例えば
自己相関分析やLPC分析などを行わせて、特徴パラメ
ータを抽出させるようにしても良い。
自己相関分析やLPC分析などを行わせて、特徴パラメ
ータを抽出させるようにしても良い。
【0015】区間検出部3は、特徴抽出部2で求められ
た特徴パラメータ(特徴ベクトル)の大きさや、ゼロク
ロス数などに基づいて音声区間を判定(検出)し、音声
区間における特徴パラメータのみをベクトル量子化部4
に供給するようになされている。ベクトル量子化部4
は、区間検出部3から供給される特徴パラメータ(特徴
ベクトル)を、あらかじめ作成されたコードブックを参
照してベクトル量子化するようになされている。ベクト
ル量子化の結果得られたコード(シンボル)は、類似度
計算部5に供給されるようになされている。
た特徴パラメータ(特徴ベクトル)の大きさや、ゼロク
ロス数などに基づいて音声区間を判定(検出)し、音声
区間における特徴パラメータのみをベクトル量子化部4
に供給するようになされている。ベクトル量子化部4
は、区間検出部3から供給される特徴パラメータ(特徴
ベクトル)を、あらかじめ作成されたコードブックを参
照してベクトル量子化するようになされている。ベクト
ル量子化の結果得られたコード(シンボル)は、類似度
計算部5に供給されるようになされている。
【0016】類似度計算部5は、所定の音声認識アルゴ
リズムにしたがって、認識辞書に登録されている単語
(それぞれ)と、マイク1に入力された音声との類似度
を表すスコアを計算するようになされている。即ち、類
似度計算部5は、例えば離散型HMM(Hidden Markov
Models)法にしたがい、モデルセットおよび認識辞書を
参照して、ベクトル量子化部4から供給されるコードが
観測される尤度を算出するようになされている。
リズムにしたがって、認識辞書に登録されている単語
(それぞれ)と、マイク1に入力された音声との類似度
を表すスコアを計算するようになされている。即ち、類
似度計算部5は、例えば離散型HMM(Hidden Markov
Models)法にしたがい、モデルセットおよび認識辞書を
参照して、ベクトル量子化部4から供給されるコードが
観測される尤度を算出するようになされている。
【0017】ここで、モデルセットには、あらかじめ学
習により得られたモデル(例えば、音韻モデルなど)が
記憶されており、認識辞書には、認識対象語彙とされて
いる単語が登録されている。類似度計算部5は、認識辞
書に登録されている単語を構成するように、モデルセッ
トに記憶されている音韻モデルを接続し、そのモデルか
ら、ベクトル量子化部4より出力されるコードが観測さ
れる尤度を計算するようになされている。
習により得られたモデル(例えば、音韻モデルなど)が
記憶されており、認識辞書には、認識対象語彙とされて
いる単語が登録されている。類似度計算部5は、認識辞
書に登録されている単語を構成するように、モデルセッ
トに記憶されている音韻モデルを接続し、そのモデルか
ら、ベクトル量子化部4より出力されるコードが観測さ
れる尤度を計算するようになされている。
【0018】なお、ここでは、尤度は、例えばビタビ
(Viterbi)法によって計算されるようになされてい
る。但し、尤度は、その他、例えばフォワード(Forwar
d)法によって計算するようにしても良い。また、認識
辞書に登録されている単語と、マイク1に入力された音
声との類似度を表すスコアは、離散HMM法以外の、例
えば連続HMM法や、DP(Dynamic Programing)マッ
チング法に代表されるDTW(Dynamic Time Warping)
法などの音声認識アルゴリズムにしたがって計算するよ
うにすることが可能である。例えば連続HMM法を用い
る場合には、モデルセットに連続モデルを記憶させ、区
間検出部3からの特徴パラメータをベクトル量子化せず
にそのまま用いるようにすれば良い。
(Viterbi)法によって計算されるようになされてい
る。但し、尤度は、その他、例えばフォワード(Forwar
d)法によって計算するようにしても良い。また、認識
辞書に登録されている単語と、マイク1に入力された音
声との類似度を表すスコアは、離散HMM法以外の、例
えば連続HMM法や、DP(Dynamic Programing)マッ
チング法に代表されるDTW(Dynamic Time Warping)
法などの音声認識アルゴリズムにしたがって計算するよ
うにすることが可能である。例えば連続HMM法を用い
る場合には、モデルセットに連続モデルを記憶させ、区
間検出部3からの特徴パラメータをベクトル量子化せず
にそのまま用いるようにすれば良い。
【0019】表示選択制御部6は、類似度計算部5で計
算された尤度(以下、適宜、スコアという)の高い順
に、所定数の単語を、認識結果候補として認識辞書から
読み出し、出力装置7に供給して表示させるようになさ
れいている。さらに、表示選択制御部6は、認識辞書に
登録されているその他の単語も読み出し、認識結果候補
に続けて、出力装置7に供給して表示させるようになさ
れている。
算された尤度(以下、適宜、スコアという)の高い順
に、所定数の単語を、認識結果候補として認識辞書から
読み出し、出力装置7に供給して表示させるようになさ
れいている。さらに、表示選択制御部6は、認識辞書に
登録されているその他の単語も読み出し、認識結果候補
に続けて、出力装置7に供給して表示させるようになさ
れている。
【0020】キー入力装置8は、例えばジョイスティッ
クやカーソルキー(例えば、上カーソルキーと下カーソ
ルキーなど)などの、少なくともカーソルを上下に移動
させるキーと、カーソルが指示している位置を確定する
確定キーとで構成されている。そして、キー入力装置8
は、出力装置7に表示された単語を選択したり、また出
力装置7の表示をスクロールさせたり、あるいはページ
を切り替えさせるときに操作される。キー入力装置8の
操作に対応する操作信号は、表示選択制御部6に供給さ
れ、表示選択制御部6では、キー入力装置8からの操作
信号に対応して、出力装置7の表示が制御されるように
なされている。
クやカーソルキー(例えば、上カーソルキーと下カーソ
ルキーなど)などの、少なくともカーソルを上下に移動
させるキーと、カーソルが指示している位置を確定する
確定キーとで構成されている。そして、キー入力装置8
は、出力装置7に表示された単語を選択したり、また出
力装置7の表示をスクロールさせたり、あるいはページ
を切り替えさせるときに操作される。キー入力装置8の
操作に対応する操作信号は、表示選択制御部6に供給さ
れ、表示選択制御部6では、キー入力装置8からの操作
信号に対応して、出力装置7の表示が制御されるように
なされている。
【0021】出力装置7は、例えばLCDやCRTなど
でなり、表示選択制御部6の制御にしたがった表示を行
うようになされている。
でなり、表示選択制御部6の制御にしたがった表示を行
うようになされている。
【0022】次に、図2のフローチャートを参照して、
その動作について説明する。まず最初にステップS1で
は、音声認識が行われる。即ち、マイク1に音声が入力
され、特徴抽出部2で、その音声から特徴パラメータが
抽出される。この特徴パラメータは、区間検出部3を介
してベクトル量子化部4に供給され、そこでベクトル量
子化される。ベクトル量子化により得られたコードは、
類似度計算部5に出力され、そこで、そのコード系列
が、認識辞書に登録されている単語から観測される尤度
が計算される。即ち、入力された音声と、認識辞書に登
録されている単語との類似度を表すスコアが計算され
る。
その動作について説明する。まず最初にステップS1で
は、音声認識が行われる。即ち、マイク1に音声が入力
され、特徴抽出部2で、その音声から特徴パラメータが
抽出される。この特徴パラメータは、区間検出部3を介
してベクトル量子化部4に供給され、そこでベクトル量
子化される。ベクトル量子化により得られたコードは、
類似度計算部5に出力され、そこで、そのコード系列
が、認識辞書に登録されている単語から観測される尤度
が計算される。即ち、入力された音声と、認識辞書に登
録されている単語との類似度を表すスコアが計算され
る。
【0023】そして、ステップS2に進み、表示選択制
御部6で、計算結果であるスコアがが昇順にソートさ
れ、そのうちの上位数個の単語が、認識辞書から読み出
されて、結果リストとされて記憶される。その後、表示
選択制御部6では、ステップS3に進み、認識辞書に登
録されている、その他の単語(エントリ)が、例えば登
録順に、結果リストに追加される。
御部6で、計算結果であるスコアがが昇順にソートさ
れ、そのうちの上位数個の単語が、認識辞書から読み出
されて、結果リストとされて記憶される。その後、表示
選択制御部6では、ステップS3に進み、認識辞書に登
録されている、その他の単語(エントリ)が、例えば登
録順に、結果リストに追加される。
【0024】以上のようにして、結果リストの最初の部
分には、スコアの計算に基づく単語が記憶され、それ以
降には、認識辞書に登録されているその他の単語が記憶
される。
分には、スコアの計算に基づく単語が記憶され、それ以
降には、認識辞書に登録されているその他の単語が記憶
される。
【0025】そして、ステップS4に進み、結果リスト
に記憶された単語のうち、最初の部分に記憶されている
もの、即ちスコアの上位の単語が、出力装置7に供給さ
れて表示される。なお、このとき、出力装置7には、カ
ーソルキーも表示される。
に記憶された単語のうち、最初の部分に記憶されている
もの、即ちスコアの上位の単語が、出力装置7に供給さ
れて表示される。なお、このとき、出力装置7には、カ
ーソルキーも表示される。
【0026】その後は、キー入力装置8の操作に対応し
て、結果リストに記憶された単語が適宜表示される。即
ち、ステップS5においては、キー入力装置8が上方向
に操作されたか否か(キー入力装置8を構成する上キー
(上方向カーソルキー)が操作されたか否か)が判定さ
れる。ステップS5において、上キーが操作されたと判
定された場合、ステップS6に進み、カーソルキーが上
方向に移動され、ステップS4に戻る。なお、この場
合、カーソルキーが、出力装置7の画面の最上行に位置
しているときには、画面が下方向にスクロール(あるい
は、前ページにページ切り替え)され、ステップS4に
戻る。これにより、結果リストにおいて、いま表示され
ている単語より前に記憶されている単語が表示される。
て、結果リストに記憶された単語が適宜表示される。即
ち、ステップS5においては、キー入力装置8が上方向
に操作されたか否か(キー入力装置8を構成する上キー
(上方向カーソルキー)が操作されたか否か)が判定さ
れる。ステップS5において、上キーが操作されたと判
定された場合、ステップS6に進み、カーソルキーが上
方向に移動され、ステップS4に戻る。なお、この場
合、カーソルキーが、出力装置7の画面の最上行に位置
しているときには、画面が下方向にスクロール(あるい
は、前ページにページ切り替え)され、ステップS4に
戻る。これにより、結果リストにおいて、いま表示され
ている単語より前に記憶されている単語が表示される。
【0027】また、ステップS5において、上キーが操
作されていないと判定された場合、ステップS7に進
み、キー入力装置8が下方向に操作されたか否か(キー
入力装置8を構成する下キー(下方向カーソルキー)が
操作されたか否か)が判定される。ステップS7におい
て、下キーが操作されたと判定された場合、ステップS
8に進み、カーソルキーが下方向に移動され、ステップ
S4に戻る。なお、この場合、カーソルキーが、出力装
置8の画面の最下行に位置しているときには、画面が上
方向にスクロール(あるいは、次ページにページ切り替
え)され、ステップS4に戻る。これにより、結果リス
トにおいて、いま表示されている単語より後に記憶され
ている単語が表示される。
作されていないと判定された場合、ステップS7に進
み、キー入力装置8が下方向に操作されたか否か(キー
入力装置8を構成する下キー(下方向カーソルキー)が
操作されたか否か)が判定される。ステップS7におい
て、下キーが操作されたと判定された場合、ステップS
8に進み、カーソルキーが下方向に移動され、ステップ
S4に戻る。なお、この場合、カーソルキーが、出力装
置8の画面の最下行に位置しているときには、画面が上
方向にスクロール(あるいは、次ページにページ切り替
え)され、ステップS4に戻る。これにより、結果リス
トにおいて、いま表示されている単語より後に記憶され
ている単語が表示される。
【0028】一方、ステップS7において、下キーが操
作されていないと判定された場合、ステップS9に進
み、キー入力装置8を構成する確定キーが操作されたか
否かが判定される。ステップS9において、確定キーが
操作されていないと判定された場合、ステップS5に戻
る。また、ステップS9において、確定キーが操作され
たと判定された場合、ステップS10に進み、所定の確
定動作が行われ、処理を終了する。即ち、確定キーが操
作されたときにカーソルが位置していた単語が、例えば
図示せぬ他の装置に供給され、処理を終了する。
作されていないと判定された場合、ステップS9に進
み、キー入力装置8を構成する確定キーが操作されたか
否かが判定される。ステップS9において、確定キーが
操作されていないと判定された場合、ステップS5に戻
る。また、ステップS9において、確定キーが操作され
たと判定された場合、ステップS10に進み、所定の確
定動作が行われ、処理を終了する。即ち、確定キーが操
作されたときにカーソルが位置していた単語が、例えば
図示せぬ他の装置に供給され、処理を終了する。
【0029】図3は、認識対象語彙を地名として、例え
ば「岡山市」と発話があった場合の出力装置7における
表示例を示している。なお、図3では、認識結果が、ス
コアの高い順に5個表示されるようになされている。
ば「岡山市」と発話があった場合の出力装置7における
表示例を示している。なお、図3では、認識結果が、ス
コアの高い順に5個表示されるようになされている。
【0030】この場合、「和歌山市」、「岡山市」、
「徳山市」、「福山市」、「館山市」の順で、高いスコ
アが得られており、最初は、最もスコアの高い「和歌山
市」の部分に、カーソル11が位置している。発話した
地名が、例えば「和歌山市」である場合には、この状態
でキー入力装置8の確定キーを操作すれば、「和歌山
市」が音声認識結果として得られる。また、発話した地
名が、例えば「岡山市」である場合には、キー入力装置
8の下キーを1回操作した後、確定キーを操作すれば、
「岡山市」を得ることができる。
「徳山市」、「福山市」、「館山市」の順で、高いスコ
アが得られており、最初は、最もスコアの高い「和歌山
市」の部分に、カーソル11が位置している。発話した
地名が、例えば「和歌山市」である場合には、この状態
でキー入力装置8の確定キーを操作すれば、「和歌山
市」が音声認識結果として得られる。また、発話した地
名が、例えば「岡山市」である場合には、キー入力装置
8の下キーを1回操作した後、確定キーを操作すれば、
「岡山市」を得ることができる。
【0031】ここで、発話した地名が、例えば「高山
市」である場合には、「高山市」が認識辞書に登録され
ていれば、キー入力装置8を操作して画面をスクロール
させることにより「高山市」が表示される。従って、こ
の場合、「高山市」を表示させた後、カーソルをその位
置に移動し、確定キーを操作すれば、「高山市」を得る
ことができる。即ち、スコアの計算からは得られなかっ
た単語であっても、認識辞書に登録されていれば得るこ
とができる。
市」である場合には、「高山市」が認識辞書に登録され
ていれば、キー入力装置8を操作して画面をスクロール
させることにより「高山市」が表示される。従って、こ
の場合、「高山市」を表示させた後、カーソルをその位
置に移動し、確定キーを操作すれば、「高山市」を得る
ことができる。即ち、スコアの計算からは得られなかっ
た単語であっても、認識辞書に登録されていれば得るこ
とができる。
【0032】以上のように、この音声認識装置において
は、スコアの計算の結果得られた単語(スコアが高い順
に所定数の単語)だけでなく、認識対象として登録され
ている他の単語も表示されるので、発話した単語が、ス
コアの計算の結果表示されなくても、認識辞書に登録さ
れていれば、利用者は、キー入力装置8を操作すること
により、その単語を得ることができる。さらに、発話し
た単語が表示されない場合には、それが誤認識によるも
のではなく、認識対象単語となっていないことによるも
のであることを、容易に理解することができるので、利
用者は、精神的な不安を抱くことなく(安心して)、装
置を利用することができる。
は、スコアの計算の結果得られた単語(スコアが高い順
に所定数の単語)だけでなく、認識対象として登録され
ている他の単語も表示されるので、発話した単語が、ス
コアの計算の結果表示されなくても、認識辞書に登録さ
れていれば、利用者は、キー入力装置8を操作すること
により、その単語を得ることができる。さらに、発話し
た単語が表示されない場合には、それが誤認識によるも
のではなく、認識対象単語となっていないことによるも
のであることを、容易に理解することができるので、利
用者は、精神的な不安を抱くことなく(安心して)、装
置を利用することができる。
【0033】さらに、例えば利用者が風邪などで声の調
子が悪い場合や、利用者と音声認識装置との相性が悪い
場合、また装置の使い方を誤った場合などに、誤った認
識結果が得られたとしても、発話した単語が、認識辞書
に登録されていれば、キー入力装置8を操作することに
より、正しい単語を得ることができるので、装置の使い
勝手を向上させることができる。
子が悪い場合や、利用者と音声認識装置との相性が悪い
場合、また装置の使い方を誤った場合などに、誤った認
識結果が得られたとしても、発話した単語が、認識辞書
に登録されていれば、キー入力装置8を操作することに
より、正しい単語を得ることができるので、装置の使い
勝手を向上させることができる。
【0034】以上、本発明の音声認識装置について説明
したが、本発明は、例えば認識対象語彙が100程度
で、可搬型の装置である、例えばカーナビゲーションシ
ステムなどに適用可能である。この場合、目的地とし
て、例えば観光地などの、一般的には認識対象となって
いるかどうかが不明な名称(地名)を音声入力したとき
でも、利用者は、それが認識対象単語となっているかど
うかを容易に知ることができる。
したが、本発明は、例えば認識対象語彙が100程度
で、可搬型の装置である、例えばカーナビゲーションシ
ステムなどに適用可能である。この場合、目的地とし
て、例えば観光地などの、一般的には認識対象となって
いるかどうかが不明な名称(地名)を音声入力したとき
でも、利用者は、それが認識対象単語となっているかど
うかを容易に知ることができる。
【0035】なお、本実施例においては、認識辞書に登
録された単語を、登録順に表示するようにしたが、その
他、例えば文字コード順や、50音順などに表示するよ
うにすることなどが可能である。また、認識辞書に登録
された単語が地名である場合には、その地名を、例えば
JISコード順に表示するようにすることも可能であ
る。
録された単語を、登録順に表示するようにしたが、その
他、例えば文字コード順や、50音順などに表示するよ
うにすることなどが可能である。また、認識辞書に登録
された単語が地名である場合には、その地名を、例えば
JISコード順に表示するようにすることも可能であ
る。
【0036】
【発明の効果】以上の如く、本発明によれば、利用者
に、装置の認識対象語彙を容易に理解させることがで
き、装置の使い勝手を向上させることができる。
に、装置の認識対象語彙を容易に理解させることがで
き、装置の使い勝手を向上させることができる。
【図1】本発明の音声認識装置の一実施例の構成を示す
ブロック図である。
ブロック図である。
【図2】図1の実施例の動作を説明するフローチャート
である。
である。
【図3】図1の出力装置7の表示例を示す図である。
1 マイク 2 特徴抽出部 3 区間検出部 4 ベクトル量子化部 5 類似度計算部 6 表示選択制御部 7 出力装置 8 キー入力装置
───────────────────────────────────────────────────── フロントページの続き (72)発明者 加藤 靖彦 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 小川 浩明 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 渡辺 一夫 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 南野 活樹 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内
Claims (9)
- 【請求項1】 認識対象単語が登録されている単語辞書
と、 入力された音声と、前記単語辞書に登録されている単語
との類似度を表すスコアを計算し、そのスコアの高い順
に所定数の単語を出力するスコア計算手段と、 前記スコア計算手段より出力された前記所定数の単語
と、それに続けて前記単語辞書に登録されている他の単
語とを表示する表示手段と、 前記表示手段に表示された単語の中から、前記音声の認
識結果を選択するときに操作される操作手段とを備える
ことを特徴とする音声認識装置。 - 【請求項2】 前記表示手段は、前記操作手段の操作に
対応してスクロールすることを特徴とする請求項1に記
載の音声認識装置。 - 【請求項3】 前記表示手段は、前記操作手段の操作に
対応してページを切り替えることを特徴とする請求項1
に記載の音声認識装置。 - 【請求項4】 前記表示手段は、前記スコア計算手段に
より出力された前記所定数の単語を、前記スコアの高い
順に表示することを特徴とする請求項1乃至3のいずれ
かに記載の音声認識装置。 - 【請求項5】 前記表示手段は、前記単語辞書に登録さ
れている前記他の単語を、文字コード順に表示すること
を特徴とする請求項1乃至4のいずれかに記載の音声認
識装置。 - 【請求項6】 前記表示手段は、前記単語辞書に登録さ
れている前記他の単語を、登録順に表示することを特徴
とする請求項1乃至4のいずれかに記載の音声認識装
置。 - 【請求項7】 前記表示手段は、前記単語辞書に登録さ
れている前記他の単語を、50音順に表示することを特
徴とする請求項1乃至4のいずれかに記載の音声認識装
置。 - 【請求項8】 前記認識対象単語は、地名であることを
特徴とする請求項1乃至7のいずれかに記載の音声認識
装置。 - 【請求項9】 前記認識対象単語は、地名であり、 前記表示手段は、前記単語辞書に登録されている前記他
の単語である地名を、JISコード順に表示することを
特徴とする請求項1乃至4のいずれかに記載の音声認識
装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6303336A JPH08160988A (ja) | 1994-12-07 | 1994-12-07 | 音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6303336A JPH08160988A (ja) | 1994-12-07 | 1994-12-07 | 音声認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH08160988A true JPH08160988A (ja) | 1996-06-21 |
Family
ID=17919752
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6303336A Withdrawn JPH08160988A (ja) | 1994-12-07 | 1994-12-07 | 音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH08160988A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100464019B1 (ko) * | 2000-12-29 | 2004-12-30 | 엘지전자 주식회사 | 음성 인식기의 발음 사전 편집시 발음열 디스플레이 방법 |
| WO2005076259A1 (ja) * | 2004-02-10 | 2005-08-18 | Nec Corporation | 音声入力システム、電子機器、音声入力方法、および、音声入力用プログラム |
| JP2007003602A (ja) * | 2005-06-21 | 2007-01-11 | Alpine Electronics Inc | 音声認識装置及びこれを備えた車両用走行誘導装置 |
| JP2016048338A (ja) * | 2014-08-28 | 2016-04-07 | アルパイン株式会社 | 音声認識装置及びコンピュータプログラム |
-
1994
- 1994-12-07 JP JP6303336A patent/JPH08160988A/ja not_active Withdrawn
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100464019B1 (ko) * | 2000-12-29 | 2004-12-30 | 엘지전자 주식회사 | 음성 인식기의 발음 사전 편집시 발음열 디스플레이 방법 |
| WO2005076259A1 (ja) * | 2004-02-10 | 2005-08-18 | Nec Corporation | 音声入力システム、電子機器、音声入力方法、および、音声入力用プログラム |
| JP2007003602A (ja) * | 2005-06-21 | 2007-01-11 | Alpine Electronics Inc | 音声認識装置及びこれを備えた車両用走行誘導装置 |
| JP2016048338A (ja) * | 2014-08-28 | 2016-04-07 | アルパイン株式会社 | 音声認識装置及びコンピュータプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5797116A (en) | Method and apparatus for recognizing previously unrecognized speech by requesting a predicted-category-related domain-dictionary-linking word | |
| US8818816B2 (en) | Voice recognition device | |
| US7260529B1 (en) | Command insertion system and method for voice recognition applications | |
| WO2004032113A1 (ja) | 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム | |
| JPH11231886A (ja) | 登録名称認識装置 | |
| JP2004029270A (ja) | 音声制御装置 | |
| JP2002116793A (ja) | データ入力システム及びその方法 | |
| JP2010139826A (ja) | 音声認識システム | |
| JP5364412B2 (ja) | 検索装置 | |
| JPH08160988A (ja) | 音声認識装置 | |
| JP2006195576A (ja) | 車載音声認識装置 | |
| KR101250897B1 (ko) | 전자사전에서 음성인식을 이용한 단어 탐색 장치 및 그 방법 | |
| JPH07319383A (ja) | 地図表示装置 | |
| US20040015354A1 (en) | Voice recognition system allowing different number-reading manners | |
| JP3762191B2 (ja) | 情報入力方法、情報入力装置及び記憶媒体 | |
| JPH07311656A (ja) | マルチモーダル文字入力装置 | |
| JP4212947B2 (ja) | 音声認識システムおよび音声認識の訂正・学習方法 | |
| JP2010128144A (ja) | 音声認識装置及びプログラム | |
| JP2005227369A (ja) | 音声認識装置および方法と車載ナビゲーション装置 | |
| JPH11231889A (ja) | 音声認識装置 | |
| JP4661239B2 (ja) | 音声対話装置及び音声対話方法 | |
| JP2007286358A (ja) | ナビゲーション装置及びその住所入力方法 | |
| JPH06282293A (ja) | 音声認識装置 | |
| JP2006039954A (ja) | データベース検索装置、プログラム及びナビゲーション装置 | |
| JPH06110495A (ja) | 音声認識装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20020305 |