JPH02250096A - 音声認識システム - Google Patents
音声認識システムInfo
- Publication number
- JPH02250096A JPH02250096A JP1070931A JP7093189A JPH02250096A JP H02250096 A JPH02250096 A JP H02250096A JP 1070931 A JP1070931 A JP 1070931A JP 7093189 A JP7093189 A JP 7093189A JP H02250096 A JPH02250096 A JP H02250096A
- Authority
- JP
- Japan
- Prior art keywords
- standard pattern
- voice
- pattern selection
- standard
- selection means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、特定話者及び不特定話者が人力した単語音声
を認識しその音声により数々の処理を行なうための音声
認識システムに関し、特に、不特定話者に関するもので
ある。
を認識しその音声により数々の処理を行なうための音声
認識システムに関し、特に、不特定話者に関するもので
ある。
従来の技術
従来、カップ飲料等の自動販売機(以後、簡単にカップ
自販機と称する。)を始めとする自販機用音声認識シス
テムは、第4図に示すように、まず、利用者がマイクロ
ホン1により入力した音声を音声分析手段2により分析
して音声パターンを抽出する0分析には帯域通過フィル
ター群を使ったBPF(Band Path Fl
lter)分析結果を時間軸と周波数軸で標本化し、強
度をデジタル処理する手法を用いる。標準パターン記憶
手段3には、同様の方法により抽出した多数の不特定話
者が発声した複数の離散単語の音声パターンを標準パタ
ーンとして記憶しである。ただし、ここで標準パターン
として記憶されている単語は、カップ自販機で販売する
フレーバー(コーヒージュース等飲料の品名)の呼称と
いくつかの返答単語(はい、いいえ、ホット、アイス等
)である。
自販機と称する。)を始めとする自販機用音声認識シス
テムは、第4図に示すように、まず、利用者がマイクロ
ホン1により入力した音声を音声分析手段2により分析
して音声パターンを抽出する0分析には帯域通過フィル
ター群を使ったBPF(Band Path Fl
lter)分析結果を時間軸と周波数軸で標本化し、強
度をデジタル処理する手法を用いる。標準パターン記憶
手段3には、同様の方法により抽出した多数の不特定話
者が発声した複数の離散単語の音声パターンを標準パタ
ーンとして記憶しである。ただし、ここで標準パターン
として記憶されている単語は、カップ自販機で販売する
フレーバー(コーヒージュース等飲料の品名)の呼称と
いくつかの返答単語(はい、いいえ、ホット、アイス等
)である。
そして、標準パターン選出手段4で、標準パターンの中
から入カバターンに最も近い標準パターンをDP(Dy
namlc Programlng)マツチング法に
より選び出し音声を認識するものである。DPマツチン
グ法とは動的計画法と訳され、1957年に米国のBe
llmanが提案した数理計画法の一手法で、多段決定
過程の最適化に適用される。その手法は、各段である決
定(制御)t−行なって 状懇を変換させながら、目的に達するまでの過程での良
さ/悪さを評価する間数を最大/最小とするというもの
である。また、音声認識システムが特定話者に対応する
場合は、標準パターン記憶手段3に特定話者が発声した
認識単語の音声パターンを登録し、−力率特定話者に対
応する場合は、不特定多数の話者が発声した認識単語の
音声パターンの内、代表パターンのいくつかを登録する
0発声誘導手段5は、音声合成手段により構成され、後
述する制御手段6に応じて、利用者の発声を促すために
音声による発声を促す。ただし、フレーバー塩は、カッ
プ自販機前面のパネル板等に明記してあり、利用者はそ
の中から妊みのフレーバー塩を1つ選んで発声するもの
である。制御手段6は、処理に応じて発声誘導手段5に
誘導音声の発声を指示し、標準パターン選出手段4によ
り選出した標準パターンの中から利用者が発声した単語
を認識すると共に、認識結果により以後のカップ自販機
の動作を制御するものである。また、7はコインの受取
りと釣銭の払い戻しを行なうコイン受取り手段、8は選
択されたフレーバーをカップに注ぎ搬圧する飲料搬出手
段である。
から入カバターンに最も近い標準パターンをDP(Dy
namlc Programlng)マツチング法に
より選び出し音声を認識するものである。DPマツチン
グ法とは動的計画法と訳され、1957年に米国のBe
llmanが提案した数理計画法の一手法で、多段決定
過程の最適化に適用される。その手法は、各段である決
定(制御)t−行なって 状懇を変換させながら、目的に達するまでの過程での良
さ/悪さを評価する間数を最大/最小とするというもの
である。また、音声認識システムが特定話者に対応する
場合は、標準パターン記憶手段3に特定話者が発声した
認識単語の音声パターンを登録し、−力率特定話者に対
応する場合は、不特定多数の話者が発声した認識単語の
音声パターンの内、代表パターンのいくつかを登録する
0発声誘導手段5は、音声合成手段により構成され、後
述する制御手段6に応じて、利用者の発声を促すために
音声による発声を促す。ただし、フレーバー塩は、カッ
プ自販機前面のパネル板等に明記してあり、利用者はそ
の中から妊みのフレーバー塩を1つ選んで発声するもの
である。制御手段6は、処理に応じて発声誘導手段5に
誘導音声の発声を指示し、標準パターン選出手段4によ
り選出した標準パターンの中から利用者が発声した単語
を認識すると共に、認識結果により以後のカップ自販機
の動作を制御するものである。また、7はコインの受取
りと釣銭の払い戻しを行なうコイン受取り手段、8は選
択されたフレーバーをカップに注ぎ搬圧する飲料搬出手
段である。
次に、第5図に、従来の自販機用音声認識システムの音
声認識可能期間を示す、tlは音声終了確認期間、t2
はパターン選出処理期間である。第5図より、tl及び
t2の期間は、音声認識が不可能であることがわかる。
声認識可能期間を示す、tlは音声終了確認期間、t2
はパターン選出処理期間である。第5図より、tl及び
t2の期間は、音声認識が不可能であることがわかる。
発明が解決しようとする課題
しかしながら、上記のような方法では、tl及びt2の
期間は、発声者の音声を認識できないため、認識率が低
下するという欠点を有していた。
期間は、発声者の音声を認識できないため、認識率が低
下するという欠点を有していた。
本発明は上記従来の課題を解決するもので、音声認識不
可能である期間t2をなくすことにより、認識率の高い
音声認識システムを提供することを目的とする。
可能である期間t2をなくすことにより、認識率の高い
音声認識システムを提供することを目的とする。
課題を解決するための手段
この目的を達成するために本発明の音声認識システムは
、複数の離散単語音声の標準パターン群を記憶した標準
パターン記憶手段と、発声者の音声を分析し音声パター
ンを抽出する音声分析手段と、前記音声分析手段により
抽出した音声パターンに最も近い標準パターンを前記標
準パターン群から選出する複数の標準パターン選出手段
と、前記複数の標準パターン選出手段中のいずれかの標
準パターン選出手段を選択する選択手段と、発声者に単
語を発声するように誘導する発声誘導手段とからなる構
成を有している。
、複数の離散単語音声の標準パターン群を記憶した標準
パターン記憶手段と、発声者の音声を分析し音声パター
ンを抽出する音声分析手段と、前記音声分析手段により
抽出した音声パターンに最も近い標準パターンを前記標
準パターン群から選出する複数の標準パターン選出手段
と、前記複数の標準パターン選出手段中のいずれかの標
準パターン選出手段を選択する選択手段と、発声者に単
語を発声するように誘導する発声誘導手段とからなる構
成を有している。
作用
この構成によって、複数の標準パターン選出手段を持つ
ことにより、1つの標準パターン選出手段がパターン選
出処理期間にある時は、他の標準パターン選出手段がパ
ターン選出処理を行なうことにより、音声認識不可能で
ある期間t2−をなくし認識率の高い音声認識システム
を実現できることどなる。
ことにより、1つの標準パターン選出手段がパターン選
出処理期間にある時は、他の標準パターン選出手段がパ
ターン選出処理を行なうことにより、音声認識不可能で
ある期間t2−をなくし認識率の高い音声認識システム
を実現できることどなる。
実施例
以下本発明の一実施例について、図面を参照しながら説
明する。
明する。
本実施例は、不特定話者に対する音声認識システムをカ
ップ自販機に適応したものである。ただし、構成要件中
、従来例と同構成のものは、同番号を付し、説明を割愛
する。第1図は、本発明の実施例における音声認識シス
テムの機能ブロック図を示すものである。9.10はそ
れぞれ、標準バタ・〜ン選出手段A、[準パターン選出
手段Bであり、標準パターンの中から入カバターンに最
も近い標準パターンをDP(Dynamlc Pro
gramlng)マツチング法により選び出し音声を認
識するものである。11は選択手段であり、前記複数の
標準パターン選出手段9,10のいずれかの標準パター
ン選出手段を選択するものである。
ップ自販機に適応したものである。ただし、構成要件中
、従来例と同構成のものは、同番号を付し、説明を割愛
する。第1図は、本発明の実施例における音声認識シス
テムの機能ブロック図を示すものである。9.10はそ
れぞれ、標準バタ・〜ン選出手段A、[準パターン選出
手段Bであり、標準パターンの中から入カバターンに最
も近い標準パターンをDP(Dynamlc Pro
gramlng)マツチング法により選び出し音声を認
識するものである。11は選択手段であり、前記複数の
標準パターン選出手段9,10のいずれかの標準パター
ン選出手段を選択するものである。
第2図に、本発明の実施例における自販機用音声認識シ
ステムの音声認識可能期間を示す。
ステムの音声認識可能期間を示す。
tlは音声終了確認期間、t2、t 21はパターン選
出処理期間である。
出処理期間である。
第2図に示すように、前記選択手段11は前記標準パタ
ーン選出手段A9がパターン選出処理期間に入るまでは
前記標準パターン選出手段A9を選択し、その後は、前
記標準パターン選出手段B10を選択する。そして、前
記標準パターン選出手段BIOがパターン選出処理期間
に入ると再び前記標準パターン選出手段A9を選択し、
以後この一連の動作を繰り返す。したがって、例えば発
声者が”え−と(音声入力期間 )、コーヒー(音声入
力期間 )“と発声した場合、従来の自販機用音声認識
システムでは、′″コーヒーという音声は前記標準パタ
ーン選出手段A9のパターン選出処理期間Cnえ−と”
という音声の処理期間)に発声されるため認識不可能で
あったが、本発明の実施例では前記標準パターン選出手
段B10によって、認識されることとなる。
ーン選出手段A9がパターン選出処理期間に入るまでは
前記標準パターン選出手段A9を選択し、その後は、前
記標準パターン選出手段B10を選択する。そして、前
記標準パターン選出手段BIOがパターン選出処理期間
に入ると再び前記標準パターン選出手段A9を選択し、
以後この一連の動作を繰り返す。したがって、例えば発
声者が”え−と(音声入力期間 )、コーヒー(音声入
力期間 )“と発声した場合、従来の自販機用音声認識
システムでは、′″コーヒーという音声は前記標準パタ
ーン選出手段A9のパターン選出処理期間Cnえ−と”
という音声の処理期間)に発声されるため認識不可能で
あったが、本発明の実施例では前記標準パターン選出手
段B10によって、認識されることとなる。
以上のように構成されたカップ自販機用音声認識システ
ムについて、第8図のフローチャートを用いてその販売
動作を説明する。第3図において、まず、ステップ20
1で、前記コイン受取手J!!27にコインが投入され
たか否かを判定し、コインが投入されればステップ20
2に進む。ステップ202では、前記発声誘導手段5に
より”いらつしゃいませ、何になさいますか”と誘導し
、客からのフレーバー名の発声を待つ。そして、ステッ
プ208で、前記標準パターン選出手段A9あるいは前
記標準パターン選出手段BIOにより、前記標準パター
ン記憶手段3に記憶されている標準パターンから、入力
された音声パターンに最も近い標準パターンを選出して
フレーバー名を認識する。ステップ204では、ステッ
プ203での認識結果が適当か否かを判定し、リジェク
トの場合はステップ205へ進み、発声誘導手段5によ
り”もう−度お答え下さい”と誘導して203へ戻る。
ムについて、第8図のフローチャートを用いてその販売
動作を説明する。第3図において、まず、ステップ20
1で、前記コイン受取手J!!27にコインが投入され
たか否かを判定し、コインが投入されればステップ20
2に進む。ステップ202では、前記発声誘導手段5に
より”いらつしゃいませ、何になさいますか”と誘導し
、客からのフレーバー名の発声を待つ。そして、ステッ
プ208で、前記標準パターン選出手段A9あるいは前
記標準パターン選出手段BIOにより、前記標準パター
ン記憶手段3に記憶されている標準パターンから、入力
された音声パターンに最も近い標準パターンを選出して
フレーバー名を認識する。ステップ204では、ステッ
プ203での認識結果が適当か否かを判定し、リジェク
トの場合はステップ205へ進み、発声誘導手段5によ
り”もう−度お答え下さい”と誘導して203へ戻る。
一方、リジェクトでない場合はステップ206へ進む。
ステップ206では、ステップ208で認識したフレー
バーにより以降の動作を分岐するものであるが、本実施
例においてはコーヒーを認識したものとし、他のフレー
バー名を認識した場合の動作についてはコーヒーの場合
と同様であるため説明を割愛する0次にステップ207
では、発声誘導手段5により゛′コーヒーですね”と確
認し、客の返答を待つ、そして、208で、フレーバー
名と同様の方法で、はいかいいえの返答を認識する。
バーにより以降の動作を分岐するものであるが、本実施
例においてはコーヒーを認識したものとし、他のフレー
バー名を認識した場合の動作についてはコーヒーの場合
と同様であるため説明を割愛する0次にステップ207
では、発声誘導手段5により゛′コーヒーですね”と確
認し、客の返答を待つ、そして、208で、フレーバー
名と同様の方法で、はいかいいえの返答を認識する。
ステップ209では、ステップ208での認識結果が適
当か否かを判定し、リジェクトの場合はステップ207
へ戻り、そうでない場合はステップ210へ進む。ステ
ップ210では、ステップ208で認識した返答がはい
の場合はステップ211へ進み、いいえの場合はステッ
プ205へ戻る。
当か否かを判定し、リジェクトの場合はステップ207
へ戻り、そうでない場合はステップ210へ進む。ステ
ップ210では、ステップ208で認識した返答がはい
の場合はステップ211へ進み、いいえの場合はステッ
プ205へ戻る。
ステップ211では、制御手段6が、コーヒーを前記飲
料搬出手段8を使ってカップに注ぎ搬出する。そして、
ステップ212で、釣り銭がある場合は、コイン受取手
段7により釣り銭を払い戻し、最後に、ステップ213
で発声誘導手段5により”ありがどうございました”と
発声して一連の動作を終了する。
料搬出手段8を使ってカップに注ぎ搬出する。そして、
ステップ212で、釣り銭がある場合は、コイン受取手
段7により釣り銭を払い戻し、最後に、ステップ213
で発声誘導手段5により”ありがどうございました”と
発声して一連の動作を終了する。
以上のように本実施例によれば、複数の標準パターン選
出手段をもつことにより一つの標準パターン選出手段が
パターン選出処理期間に入ると、他の標準パターン選出
手段が音声分析結果取り込み期間に入るため、従来は音
声認識が不可能であった期間においても音声認識が可能
となり、例えば発声者がフレーバー選択時に迷っている
時に、え−と、(フレーバー名)”と発声しても認識で
きる確率が高くなる。このため、音声認識システムの認
識率が向上すると共に、リジェクトの回数も減少し発声
者がスムーズに対話ができることとなるなどその効果は
大である。
出手段をもつことにより一つの標準パターン選出手段が
パターン選出処理期間に入ると、他の標準パターン選出
手段が音声分析結果取り込み期間に入るため、従来は音
声認識が不可能であった期間においても音声認識が可能
となり、例えば発声者がフレーバー選択時に迷っている
時に、え−と、(フレーバー名)”と発声しても認識で
きる確率が高くなる。このため、音声認識システムの認
識率が向上すると共に、リジェクトの回数も減少し発声
者がスムーズに対話ができることとなるなどその効果は
大である。
発明の効果
以上のように本発明の音声認識システムは、複数の離散
単語音声の標準パターン群を記憶した標準パターン記憶
手段と、発声者の音声を分析し音声パターンを抽出する
音声分析手段と、前記音声分析手段により抽出した音声
パターンに最も近い標準パターンを前記標準パターン群
から選出する複数の標準パターン記憶手段と、前記複数
の標準パターン選出手段中のいずれかの標準パターン選
出手段を選択する選択手段と、発声者に単語を発声する
ように誘導する発声誘導手段とを設けることにより、一
つの標準パターン選出手段がパターン選出処理期間にあ
る時は、他の標準パターン選出手段が音声分析結果取り
込み期間に入るため従来は音声認識が不可能であった期
間においても音声認識が可能となり、認識率の高い音声
認識システムを実現することができることとなる。
単語音声の標準パターン群を記憶した標準パターン記憶
手段と、発声者の音声を分析し音声パターンを抽出する
音声分析手段と、前記音声分析手段により抽出した音声
パターンに最も近い標準パターンを前記標準パターン群
から選出する複数の標準パターン記憶手段と、前記複数
の標準パターン選出手段中のいずれかの標準パターン選
出手段を選択する選択手段と、発声者に単語を発声する
ように誘導する発声誘導手段とを設けることにより、一
つの標準パターン選出手段がパターン選出処理期間にあ
る時は、他の標準パターン選出手段が音声分析結果取り
込み期間に入るため従来は音声認識が不可能であった期
間においても音声認識が可能となり、認識率の高い音声
認識システムを実現することができることとなる。
第1図は本発明の一実施例における音声認識システムの
機能ブロック図、第2図は本発明の実施例における音声
認識システムの音声認識可能期間の説明図、第3図は本
発明の実施例における音声認識システムの動作例を示す
フローチャート、第4図は従来の音声認識システムの機
能ブロック図、第5図は従来の音声認識システムの音声
認識可能期間の説明図である。 2・・・音声分析手段、3・・・標準パターン記憶手段
、5・・・発声誘導手段、9・・・標準パターン選出手
段A、10・・・標準パターン選出手段B、11・・・
選択手段。 ヌ ン m 砧 頃 串 〉 屑の +l■ 区
機能ブロック図、第2図は本発明の実施例における音声
認識システムの音声認識可能期間の説明図、第3図は本
発明の実施例における音声認識システムの動作例を示す
フローチャート、第4図は従来の音声認識システムの機
能ブロック図、第5図は従来の音声認識システムの音声
認識可能期間の説明図である。 2・・・音声分析手段、3・・・標準パターン記憶手段
、5・・・発声誘導手段、9・・・標準パターン選出手
段A、10・・・標準パターン選出手段B、11・・・
選択手段。 ヌ ン m 砧 頃 串 〉 屑の +l■ 区
Claims (1)
- 複数の離散単語音声の標準パターン群を記憶した標準パ
ターン記憶手段と、発声者の音声を分析し音声パターン
を抽出する音声分析手段と、前記音声分析手段により抽
出した音声パターンに最も近い標準パターンを前記標準
パターン群から選出する複数の標準パターン選出手段と
、前記複数の標準パターン選出手段中のいずれかの標準
パターン選出手段を選択する選択手段と、発声者に単語
を発声するように誘導する発声誘導手段とからなる音声
認識システム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1070931A JPH02250096A (ja) | 1989-03-23 | 1989-03-23 | 音声認識システム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1070931A JPH02250096A (ja) | 1989-03-23 | 1989-03-23 | 音声認識システム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02250096A true JPH02250096A (ja) | 1990-10-05 |
Family
ID=13445753
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1070931A Pending JPH02250096A (ja) | 1989-03-23 | 1989-03-23 | 音声認識システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02250096A (ja) |
-
1989
- 1989-03-23 JP JP1070931A patent/JPH02250096A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3968133B2 (ja) | 音声認識対話処理方法および音声認識対話装置 | |
| EP1159737B9 (en) | Speaker recognition | |
| JPH05232984A (ja) | 音声分析における基準パターン形成方法 | |
| JPH0736475A (ja) | 音声分析における基準パターン形成方法 | |
| CN111508474A (zh) | 一种语音打断方法、电子设备及存储装置 | |
| CA1325479C (en) | Speech recognition | |
| JPH0518118B2 (ja) | ||
| JPH02250096A (ja) | 音声認識システム | |
| JP2000347684A (ja) | 音声認識システム | |
| JPH0375799A (ja) | 音声認識システム | |
| JPH02250095A (ja) | 音声認識システム | |
| JPH02250099A (ja) | 音声認識システム | |
| JPH03231297A (ja) | 音声認識システム | |
| JPH02250097A (ja) | 音声認識システム | |
| JPH02204797A (ja) | 音声認識システム | |
| JPH0330083A (ja) | 自動販売機 | |
| JPH02151900A (ja) | 音声認識システム | |
| JPH02106800A (ja) | 音声認識システム | |
| Colotte et al. | Automatic enhancement of speech intelligibility | |
| JPH03127099A (ja) | 音声認識システム | |
| JP6522679B2 (ja) | 発話制御装置、方法、発話システム、及びプログラム | |
| JPH03276196A (ja) | 音声認識システム | |
| JPS61180297A (ja) | 話者照合装置 | |
| JPH05265482A (ja) | 情報処理装置 | |
| JPS6240717B2 (ja) |