JPH02250097A - 音声認識システム - Google Patents
音声認識システムInfo
- Publication number
- JPH02250097A JPH02250097A JP1070936A JP7093689A JPH02250097A JP H02250097 A JPH02250097 A JP H02250097A JP 1070936 A JP1070936 A JP 1070936A JP 7093689 A JP7093689 A JP 7093689A JP H02250097 A JPH02250097 A JP H02250097A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speech
- voicing
- recognition system
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000284 extract Substances 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 abstract 1
- 230000002401 inhibitory effect Effects 0.000 abstract 1
- 238000000034 method Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 12
- 239000000796 flavoring agent Substances 0.000 description 9
- 235000019634 flavors Nutrition 0.000 description 9
- 150000003839 salts Chemical class 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 235000013361 beverage Nutrition 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 240000006829 Ficus sundaica Species 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、特定話者及び不特定話者が入力した単語音声
を認識し、その音声内容によ多数々の処理を行うための
音声認識システムに関し、特に、不特定話者に対応した
自動販売機用の音声認識システムに関するものである。
を認識し、その音声内容によ多数々の処理を行うための
音声認識システムに関し、特に、不特定話者に対応した
自動販売機用の音声認識システムに関するものである。
従来の技術
従来、カップ飲料等の自動販売機(以後単にカップ自販
機と称する)を始めとする自販機用音声認識システムは
、第4図に示すように、まず、利用者がマイクロホン1
によシ入カした音声を音声分析手段A2にょシ分析して
音声パターンを抽出する。分析には帯域通過フィルタ群
を使ったBPF(Band Path Filter)
分析結果を時間軸と周波数軸で標本化し強度をディジタ
ル処理する手法を用いる。標準パターン記憶手段3には
、同様の手法によシ抽出した多数の不特定話者が発声し
た複数の離散単語の音声パターンを標準パターンとして
あらかじめ記憶しである。ただし、ここで標準パターン
として記憶されている単語はカップ自販機で販売fるフ
レーバー(コーヒー、ジューヌ等飲料の品名)の呼称と
いくつかの返答単語(″はい″ 6いいえ”、′ホット
、″アイヌ”等)である。そして標準パターン選出手段
4で、標準パターンの中から入力音声パターンに最も近
い標準パターンをD P (Dynamic Prog
ramming) マ、7チング法によシ選出し音声を
認識するものである。
機と称する)を始めとする自販機用音声認識システムは
、第4図に示すように、まず、利用者がマイクロホン1
によシ入カした音声を音声分析手段A2にょシ分析して
音声パターンを抽出する。分析には帯域通過フィルタ群
を使ったBPF(Band Path Filter)
分析結果を時間軸と周波数軸で標本化し強度をディジタ
ル処理する手法を用いる。標準パターン記憶手段3には
、同様の手法によシ抽出した多数の不特定話者が発声し
た複数の離散単語の音声パターンを標準パターンとして
あらかじめ記憶しである。ただし、ここで標準パターン
として記憶されている単語はカップ自販機で販売fるフ
レーバー(コーヒー、ジューヌ等飲料の品名)の呼称と
いくつかの返答単語(″はい″ 6いいえ”、′ホット
、″アイヌ”等)である。そして標準パターン選出手段
4で、標準パターンの中から入力音声パターンに最も近
い標準パターンをD P (Dynamic Prog
ramming) マ、7チング法によシ選出し音声を
認識するものである。
DPマツチング法とは動的計画法と訳され、1967年
に米国のBellman が提案した数理計画法の一手
法で、多段決定過程の最適化に適用される。その手法は
、各段で、ある決定(制御)を行って状態を変換させな
がら、目的の状態に達するまでの過程での制御の良さ/
悪さを評価する関数を最大/最小とするというものであ
る。又、音声認識システムが特定話者に対応する場合は
、標準パターン記憶手段3に特定話者が発声した認識単
語の音声パターンを登録し、一方、不特定話者に対応す
る場合は、不特定多数の話者が発声した認識単語の音声
パターンの代表パターンのいくつかを登録する。
に米国のBellman が提案した数理計画法の一手
法で、多段決定過程の最適化に適用される。その手法は
、各段で、ある決定(制御)を行って状態を変換させな
がら、目的の状態に達するまでの過程での制御の良さ/
悪さを評価する関数を最大/最小とするというものであ
る。又、音声認識システムが特定話者に対応する場合は
、標準パターン記憶手段3に特定話者が発声した認識単
語の音声パターンを登録し、一方、不特定話者に対応す
る場合は、不特定多数の話者が発声した認識単語の音声
パターンの代表パターンのいくつかを登録する。
発声誘導手段5は、音声合成手段によ多構成されし後述
する制御手段6の処理に応じて、利用者の発声を促すた
めに音声による誘導を行う。例えば、フレーバーの選択
時は、「いらっしゃいませ。
する制御手段6の処理に応じて、利用者の発声を促すた
めに音声による誘導を行う。例えば、フレーバーの選択
時は、「いらっしゃいませ。
何になさいますか。」と発声して、利用者にフレーバー
塩の発声を促す。ただし、フレーバー塩はカップ自販機
前面のパネル板等に明記してあシ、利用者はその中から
好みのフレーバー塩を1つ選んで発声するものである。
塩の発声を促す。ただし、フレーバー塩はカップ自販機
前面のパネル板等に明記してあシ、利用者はその中から
好みのフレーバー塩を1つ選んで発声するものである。
制御手段θは、処理に応じて、発声誘導手段5に誘導音
声の発声を指示し、標準パターン選出手段4により選出
した標準パターンから利用者が発声した単語を認識する
とともに、認識結果によシ以後のカップ自販機の動作を
制御するものである。又、了はコインの受は取シと釣シ
4銭の払い戻しを行うコイン受は取シ手段、8は選択さ
れたフレーバーをカップに注ぎ搬出する飲料搬出手段で
ある。
声の発声を指示し、標準パターン選出手段4により選出
した標準パターンから利用者が発声した単語を認識する
とともに、認識結果によシ以後のカップ自販機の動作を
制御するものである。又、了はコインの受は取シと釣シ
4銭の払い戻しを行うコイン受は取シ手段、8は選択さ
れたフレーバーをカップに注ぎ搬出する飲料搬出手段で
ある。
発明が解決しようとする課題
しかしながら、上記のような方法では、発声者が認識可
能な単語を発声する期間が決められないため、例えば、
発声者は、フレーバー選択時に迷っているときに、「え
−と、(フレーバー塩)」と発声したシして、認識可能
な単語以外の単語を発声する可能性がある。このため、
正当に認識できずに認識率が低下してしまうという不具
合いが生じるという課題があった。本発明は上記従来の
課題を解決するもので、発声者が認識可能な単語を発声
する期間を決めることによシ、認識可能な単語以外の発
声を抑え、認識率を上げる音声認識システムを提供する
こを目的とする。
能な単語を発声する期間が決められないため、例えば、
発声者は、フレーバー選択時に迷っているときに、「え
−と、(フレーバー塩)」と発声したシして、認識可能
な単語以外の単語を発声する可能性がある。このため、
正当に認識できずに認識率が低下してしまうという不具
合いが生じるという課題があった。本発明は上記従来の
課題を解決するもので、発声者が認識可能な単語を発声
する期間を決めることによシ、認識可能な単語以外の発
声を抑え、認識率を上げる音声認識システムを提供する
こを目的とする。
課題を解決するための手段
上記課題を解決するために本発明の音声認識システムは
、複数の離散単語音声の標準パターン群を記憶した標準
パターン記憶手段と、発声者の音声を分析し音声パター
ンを抽出する音声分析手段と、発声者が発声を開始した
ことを゛発声開始信号により前記音し音声パターンを抽
出する音声分析手段と、前記音声分析手段によシ抽出し
た音声パターンに最も近い標準パターンを前記標準パタ
ーン群から選出する標準パターン選出手段と、発声者に
単語を発声するように誘導する発声誘導手段とを備えた
ものである。
、複数の離散単語音声の標準パターン群を記憶した標準
パターン記憶手段と、発声者の音声を分析し音声パター
ンを抽出する音声分析手段と、発声者が発声を開始した
ことを゛発声開始信号により前記音し音声パターンを抽
出する音声分析手段と、前記音声分析手段によシ抽出し
た音声パターンに最も近い標準パターンを前記標準パタ
ーン群から選出する標準パターン選出手段と、発声者に
単語を発声するように誘導する発声誘導手段とを備えた
ものである。
作 用
本発明は上記した構成により、発声者が認識可能な単語
を発声する時に、音声分析手段によって発声開始を音声
認識システムに伝えることを可能としている。
を発声する時に、音声分析手段によって発声開始を音声
認識システムに伝えることを可能としている。
実施例
以下本発明の一実施例の音声認識システムについて図面
を参照しながら説明する。本実施例は不特定話者に対す
る音声認識システムをカップ自販機に適用したものであ
る。ただし、構成要件中、従来例と同構成のものは同番
号を付し、説明を割愛する。
を参照しながら説明する。本実施例は不特定話者に対す
る音声認識システムをカップ自販機に適用したものであ
る。ただし、構成要件中、従来例と同構成のものは同番
号を付し、説明を割愛する。
第1図は、本発明の実施例における音声認識システムの
機能ブロック図を示すものである。9は音声分析手段で
あシ、発声者が認識可能な単語を発声する時に発生開始
信号を出力する。10は音声分析手段Bであり、前記音
声分析手段Sよシ発生開始信号が入力されると、前記マ
イクロホン1によシ入力した音声を分析して音声パター
ンを抽出する。第2図は、本発明の実施例における前記
音声分析手段90回路図を示すものである。11はスイ
ッチ、12は抵抗であシ、発声者が前記スイッチ11を
ONすると前記音声分析手段B10に″H″信号が入力
される。
機能ブロック図を示すものである。9は音声分析手段で
あシ、発声者が認識可能な単語を発声する時に発生開始
信号を出力する。10は音声分析手段Bであり、前記音
声分析手段Sよシ発生開始信号が入力されると、前記マ
イクロホン1によシ入力した音声を分析して音声パター
ンを抽出する。第2図は、本発明の実施例における前記
音声分析手段90回路図を示すものである。11はスイ
ッチ、12は抵抗であシ、発声者が前記スイッチ11を
ONすると前記音声分析手段B10に″H″信号が入力
される。
表
表は前記音声分析手段9と前記音声分析手段B10の動
作関係表を示すものである。表に示すように、前記音声
分析手段9の前記スイッチ11をONすると前記音声分
析手段B10にH”信号(発声開始信号)が入力され、
音声分析処理が行なわれる。また、前記音声分析手段9
の前記スイッチ11をOFFすると前記音声分析手段B
10に”L”信号が入力され、音声分析処理は行なわれ
ない。
作関係表を示すものである。表に示すように、前記音声
分析手段9の前記スイッチ11をONすると前記音声分
析手段B10にH”信号(発声開始信号)が入力され、
音声分析処理が行なわれる。また、前記音声分析手段9
の前記スイッチ11をOFFすると前記音声分析手段B
10に”L”信号が入力され、音声分析処理は行なわれ
ない。
以上のように構成されたカップ自販機用音声認識システ
ムについて、第3図のフローチャートを用いてその販売
動作を説明する。
ムについて、第3図のフローチャートを用いてその販売
動作を説明する。
第3図において、まずミステップ201で、コイン受は
取り手段7にコインが投入されたか否かを判定し、コイ
ンが投入されればステップ202へ進む。ステップ20
2では、発声誘導手段5によシロいらっしゃいませ、何
になさいますか′″と誘導する。
取り手段7にコインが投入されたか否かを判定し、コイ
ンが投入されればステップ202へ進む。ステップ20
2では、発声誘導手段5によシロいらっしゃいませ、何
になさいますか′″と誘導する。
そして、ステップ203で前記発生告知手段9からの発
声告知信号がある゛まで待ち続ける。発声告知信号があ
ると、ステップ204で、音声パターン選出手段4によ
シ、前記標準パターン記憶手段3に記憶されている標準
パターンから、入力された音声パターンに最も近い標準
パターンを選出シテフレーバー名を認識する。ステップ
205では、ステップ204での認識結果が適当か否か
を判定シ、リジェクトの場合はステップ206へ進み、
発声誘導手段6によシ”もう−度お答え下さい”と誘導
してステップ203へ戻る。一方、リジェクトではない
場合はステップ207へ進む。
声告知信号がある゛まで待ち続ける。発声告知信号があ
ると、ステップ204で、音声パターン選出手段4によ
シ、前記標準パターン記憶手段3に記憶されている標準
パターンから、入力された音声パターンに最も近い標準
パターンを選出シテフレーバー名を認識する。ステップ
205では、ステップ204での認識結果が適当か否か
を判定シ、リジェクトの場合はステップ206へ進み、
発声誘導手段6によシ”もう−度お答え下さい”と誘導
してステップ203へ戻る。一方、リジェクトではない
場合はステップ207へ進む。
ステップ20了では、ステップ204で認識したフレー
バーによシ以降の動作を分岐するものであるが、本実施
例においてはコーヒーを認識したものとし、他のフレー
バーを認識した場合の動作についてはコーヒーの場合と
同様であるため説明を割愛する。次に、ステップ208
では、発声認識手段6によシロコーヒーですね”と確認
し、客の返答を誘導する。そして、ステップ209で前
記発生告知手段9からの発声告知信号があるまで待ち続
ける。発声告知信号があると、ステップ210で、フレ
ーバー塩と同様の方法で、はいかいいえの返答を認識す
る。ステップ211では、ステップ210での認識結果
が適当か否かを判定し、リジェクトの場合はステップ2
08へ戻シ、そうでない場合はステップ212へ進ム。
バーによシ以降の動作を分岐するものであるが、本実施
例においてはコーヒーを認識したものとし、他のフレー
バーを認識した場合の動作についてはコーヒーの場合と
同様であるため説明を割愛する。次に、ステップ208
では、発声認識手段6によシロコーヒーですね”と確認
し、客の返答を誘導する。そして、ステップ209で前
記発生告知手段9からの発声告知信号があるまで待ち続
ける。発声告知信号があると、ステップ210で、フレ
ーバー塩と同様の方法で、はいかいいえの返答を認識す
る。ステップ211では、ステップ210での認識結果
が適当か否かを判定し、リジェクトの場合はステップ2
08へ戻シ、そうでない場合はステップ212へ進ム。
ステップ212では、ステップ210で認識した返答が
はいの場合はステップ213へ進み、いいえの場合はス
テップ208へ戻る。ステップ213では、コーヒーを
飲料搬出手段8を使ってカップに注ぎ搬出する。そして
、ステップ214で、釣シ銭がある場合は、コイン受は
取り手段7によシ釣シ銭を払い戻し、最後に、ステップ
215で、発声誘導手段5によシ″あシがとうございま
した”と発声して一連の動作(販売)を終了する。
はいの場合はステップ213へ進み、いいえの場合はス
テップ208へ戻る。ステップ213では、コーヒーを
飲料搬出手段8を使ってカップに注ぎ搬出する。そして
、ステップ214で、釣シ銭がある場合は、コイン受は
取り手段7によシ釣シ銭を払い戻し、最後に、ステップ
215で、発声誘導手段5によシ″あシがとうございま
した”と発声して一連の動作(販売)を終了する。
以上のように本実施例によれば、本発明は発声者が音声
分析手段により発声開始信号を音声分析手段に入力しな
ければ、音声分析手段が音声分析処理を行なわないよう
に構成されているだめ、発声者は認識可能な単語を発声
するとき、にのみ音声分析手段により発声開始の合図を
してやることにより、例えばフレーバー選択時に迷って
いるときに、「え−と、(フレーバー塩)」と発声して
誤認識を招いたシすることが激減′し、認識率の低下を
防ぐことが可能となる。
分析手段により発声開始信号を音声分析手段に入力しな
ければ、音声分析手段が音声分析処理を行なわないよう
に構成されているだめ、発声者は認識可能な単語を発声
するとき、にのみ音声分析手段により発声開始の合図を
してやることにより、例えばフレーバー選択時に迷って
いるときに、「え−と、(フレーバー塩)」と発声して
誤認識を招いたシすることが激減′し、認識率の低下を
防ぐことが可能となる。
また、発声者自身が認識可能な単語を発声する期間を決
められるため、発声者は安心して自分の篤ベーヌで対話
を進めることができる。その上、発声者が急いでいると
きには、発声の順序が正しければ発声誘導を待つことな
くすばやく商品を購入できることも可能となるなどその
効果は犬である。
められるため、発声者は安心して自分の篤ベーヌで対話
を進めることができる。その上、発声者が急いでいると
きには、発声の順序が正しければ発声誘導を待つことな
くすばやく商品を購入できることも可能となるなどその
効果は犬である。
発明の効果
以上のように本発明の音声認識システムは、複数の離散
単語音声の標準パターン群を記憶した標準パターン記憶
手段と、発声者の音声を分析し音声パターンを抽出する
音声分析手段と、発声者が発声を開始したことを発声開
始信号により前記音し音声パターンを抽出する音声分析
手段と、前記音声分析手段によシ抽出した音声パターン
に最も近い標準パターンを前記標準パターン群から選出
する標準パターン選出手段と、発声者に単語を発声する
ように誘導する発声誘導手段とを設けることによシ、発
声者が発声開始時期を決めることができるため、発声者
の認識可能な単語以外の単語を音声分析処理することが
激減し、認識率の低下を防ぐことが可能となる。
単語音声の標準パターン群を記憶した標準パターン記憶
手段と、発声者の音声を分析し音声パターンを抽出する
音声分析手段と、発声者が発声を開始したことを発声開
始信号により前記音し音声パターンを抽出する音声分析
手段と、前記音声分析手段によシ抽出した音声パターン
に最も近い標準パターンを前記標準パターン群から選出
する標準パターン選出手段と、発声者に単語を発声する
ように誘導する発声誘導手段とを設けることによシ、発
声者が発声開始時期を決めることができるため、発声者
の認識可能な単語以外の単語を音声分析処理することが
激減し、認識率の低下を防ぐことが可能となる。
第1図は本発明の実施例における音声認識システムの機
能ブロック図、第2図は第1図の音声分析手段の回路図
、第3図は本発明の実施例における音声認識システムの
動作例を示すフローチャート、第4図は従来の音声認識
システムの機能ブロック図である。 3・・・・・・標準パター涜憶手段、4・・・・・・標
準パターン選出手段、6・・・・・・発声誘導手段、9
・・団・音声分析手段、10・・・・・・音声分析手段
B0代理人の氏名 弁理士 粟 野 重 孝 ほか1名
嬉 図
能ブロック図、第2図は第1図の音声分析手段の回路図
、第3図は本発明の実施例における音声認識システムの
動作例を示すフローチャート、第4図は従来の音声認識
システムの機能ブロック図である。 3・・・・・・標準パター涜憶手段、4・・・・・・標
準パターン選出手段、6・・・・・・発声誘導手段、9
・・団・音声分析手段、10・・・・・・音声分析手段
B0代理人の氏名 弁理士 粟 野 重 孝 ほか1名
嬉 図
Claims (1)
- 複数の離散単語音声の標準パターン群を記憶した標準パ
ターン記憶手段と、発声音の音声を分析し音声パターン
を抽出する音声分析手段と、発声者が発声を開始したこ
と発声開始信号により前記音声分析手段に伝達する発声
告知手段と、前記音声分析手段により抽出した音声パタ
ーンに最も近い標準パターンを前記標準パターン群から
選出する標準パターン選出手段と、発声者に単語を発声
するように誘導する発声誘導手段とよりなる音声認識シ
ステム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1070936A JPH02250097A (ja) | 1989-03-23 | 1989-03-23 | 音声認識システム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1070936A JPH02250097A (ja) | 1989-03-23 | 1989-03-23 | 音声認識システム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02250097A true JPH02250097A (ja) | 1990-10-05 |
Family
ID=13445889
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1070936A Pending JPH02250097A (ja) | 1989-03-23 | 1989-03-23 | 音声認識システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02250097A (ja) |
-
1989
- 1989-03-23 JP JP1070936A patent/JPH02250097A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3968133B2 (ja) | 音声認識対話処理方法および音声認識対話装置 | |
| US8694316B2 (en) | Methods, apparatus and computer programs for automatic speech recognition | |
| CA2202656C (en) | Speech recognition | |
| JPS5944639B2 (ja) | 音声による異同認識方式における標準パタ−ン更新方法 | |
| JP2000259170A (ja) | 音声認識システムにユーザを登録する方法および装置 | |
| EP2028646A1 (en) | Device for modifying and improving the behaviour of speech recognition systems | |
| US20040098259A1 (en) | Method for recognition verbal utterances by a non-mother tongue speaker in a speech processing system | |
| EP1280137B1 (en) | Method for speaker identification | |
| CA1325479C (en) | Speech recognition | |
| JP2002236494A (ja) | 音声区間判別装置、音声認識装置、プログラム及び記録媒体 | |
| JPS60247697A (ja) | 音声対話装置 | |
| JPH02250097A (ja) | 音声認識システム | |
| JPH0527790A (ja) | 音声入出力装置 | |
| JPH02250095A (ja) | 音声認識システム | |
| JP2001005482A (ja) | 音声認識方法及び装置 | |
| JP7420109B2 (ja) | 情報出力システム、サーバ装置および情報出力方法 | |
| JPH02250096A (ja) | 音声認識システム | |
| JPH02204797A (ja) | 音声認識システム | |
| JPH02250099A (ja) | 音声認識システム | |
| JPH0375799A (ja) | 音声認識システム | |
| JP6522679B2 (ja) | 発話制御装置、方法、発話システム、及びプログラム | |
| JPH03231297A (ja) | 音声認識システム | |
| JPH03276196A (ja) | 音声認識システム | |
| JP4622106B2 (ja) | 人物特定システム | |
| JPH0340000A (ja) | 音声認識システム |