JPH02250095A - 音声認識システム - Google Patents
音声認識システムInfo
- Publication number
- JPH02250095A JPH02250095A JP1070918A JP7091889A JPH02250095A JP H02250095 A JPH02250095 A JP H02250095A JP 1070918 A JP1070918 A JP 1070918A JP 7091889 A JP7091889 A JP 7091889A JP H02250095 A JPH02250095 A JP H02250095A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- period
- voicing
- voice
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、特定話者及び不特定話者が入力した単語音声
を認識しその音声により数々の処理を行なうための音声
認識システムに間し、特に、不特定話者に関するもので
坐る。
を認識しその音声により数々の処理を行なうための音声
認識システムに間し、特に、不特定話者に関するもので
坐る。
従来の技術
従来、カップ飲料等の自動販売機(以後、簡単にカップ
自販機と称する。)を始めとする自販機用音声認識シス
テムは、第4図に示すように、まず、利用者がマイクロ
ホン1により入力した音声を音声分析手段2により分析
して音声パターンを抽出する6分析には帯域通過フィル
ター群を使ったBPF(Band Path Fi
lter)分析結果を時間軸と周波数軸で標本化し、強
度をデジタル処理する手法を用いる。標準パターン記憶
手段3には、同様の方法により抽出した多数の不特定話
者が発声した複数の離散単語の音声パターンを標準パタ
ーンとして記憶しである。ただし、ここで標準パターン
として記憶されている単語は、カップ自販機で販売する
フレーバー(コーヒージュース等飲料の品名)の呼称と
いくつかの返答単語(はい、いいえ、ホット、アイス等
)である。
自販機と称する。)を始めとする自販機用音声認識シス
テムは、第4図に示すように、まず、利用者がマイクロ
ホン1により入力した音声を音声分析手段2により分析
して音声パターンを抽出する6分析には帯域通過フィル
ター群を使ったBPF(Band Path Fi
lter)分析結果を時間軸と周波数軸で標本化し、強
度をデジタル処理する手法を用いる。標準パターン記憶
手段3には、同様の方法により抽出した多数の不特定話
者が発声した複数の離散単語の音声パターンを標準パタ
ーンとして記憶しである。ただし、ここで標準パターン
として記憶されている単語は、カップ自販機で販売する
フレーバー(コーヒージュース等飲料の品名)の呼称と
いくつかの返答単語(はい、いいえ、ホット、アイス等
)である。
そして、標準パターン選出手段4で、標準パターンの中
から入カバターンに最も近い標準パターンをDP(Dy
namic Programing)マツチング法に
より選び畠し音声を認識するものである、DPマツチン
グ法とは動的計画法と訳され、1957年に米国のBe
l 1manが提案した数理計画法の一手法で、多段
決定過程の最適化に適用される。その手法は、各段であ
る決定(制御)を行なって 状態を変換させながら、目的に達するまでの過程での良
さ/悪さを評価する間数を最大/最小とするというもの
である。また、音声認識システムが特定話者に対応する
場合は、標準パターン記憶手段3に特定話者が発声した
認識単語の音声パターンを登録し、−万年特定話者に対
応する場合は、不特定多数の話者が発声した認識単語の
音声パターンの内、代表パターンのいくつかを登録する
。発声誘導手段5は、音声合成手段により構成され、後
述する制御手段6に応じて、利用者の発声を促すために
音声による発声を促す。ただし、フレーバー名は、カッ
プ自販機前面のパネル板等に明記してあり、利用者はそ
の中から好みのフレーバー名を1つ選んで発声するもの
である。制御手段6は、処理に応じて発声誘導手段5に
誘導音声の発声を指示し、標準パターン選出手段4によ
り選出した標準パターンの中から利用者が発声した単語
を認識すると共に、認識結果により以後のカップ自販機
の動作を制御するものである。また、7はコインの受取
りと釣銭の払い戻しを行なうコイン受取り手段、8は選
択されたフレーバーをカップに注ぎ搬出する飲料搬出手
段である。
から入カバターンに最も近い標準パターンをDP(Dy
namic Programing)マツチング法に
より選び畠し音声を認識するものである、DPマツチン
グ法とは動的計画法と訳され、1957年に米国のBe
l 1manが提案した数理計画法の一手法で、多段
決定過程の最適化に適用される。その手法は、各段であ
る決定(制御)を行なって 状態を変換させながら、目的に達するまでの過程での良
さ/悪さを評価する間数を最大/最小とするというもの
である。また、音声認識システムが特定話者に対応する
場合は、標準パターン記憶手段3に特定話者が発声した
認識単語の音声パターンを登録し、−万年特定話者に対
応する場合は、不特定多数の話者が発声した認識単語の
音声パターンの内、代表パターンのいくつかを登録する
。発声誘導手段5は、音声合成手段により構成され、後
述する制御手段6に応じて、利用者の発声を促すために
音声による発声を促す。ただし、フレーバー名は、カッ
プ自販機前面のパネル板等に明記してあり、利用者はそ
の中から好みのフレーバー名を1つ選んで発声するもの
である。制御手段6は、処理に応じて発声誘導手段5に
誘導音声の発声を指示し、標準パターン選出手段4によ
り選出した標準パターンの中から利用者が発声した単語
を認識すると共に、認識結果により以後のカップ自販機
の動作を制御するものである。また、7はコインの受取
りと釣銭の払い戻しを行なうコイン受取り手段、8は選
択されたフレーバーをカップに注ぎ搬出する飲料搬出手
段である。
発明が解決しようとする課題
しかしながら、上記のような方法では、発声者は音声認
識可能期間が明確にわからないため、カップ自販機の発
声誘導期間中(音声認識不可能期間)に、′はい”と発
声したりすることにより、カップ自販機が音声を正当に
認識できずに認識率が低下したり、発声時期がわからな
いために発声者が不安感を持ったりするという欠点を有
していた。
識可能期間が明確にわからないため、カップ自販機の発
声誘導期間中(音声認識不可能期間)に、′はい”と発
声したりすることにより、カップ自販機が音声を正当に
認識できずに認識率が低下したり、発声時期がわからな
いために発声者が不安感を持ったりするという欠点を有
していた。
本発明は上記従来の課題を解決するもので、音声認識不
可能である期間を発声者に明確に告知することにより、
認識率が高く、また、 発声者に不安感を与えない音声認識システムを提供する
ことを目的とする。
可能である期間を発声者に明確に告知することにより、
認識率が高く、また、 発声者に不安感を与えない音声認識システムを提供する
ことを目的とする。
課題を解決するための手段
この目的を達成するために本発明の音声認識システムは
、複数の離散単語音声の標準パターン群を記憶した標準
パターン記憶手段と、発声者の音声を分析し音声パター
ンを抽出する音声分析手段と、前記音声分析手段により
抽出した音声パターンに最も近い標準パターンを前記標
準パターン群から選出する標準パターン選出手段と、音
声認識可能期間を発声者に告知する発声開始告知手段と
、発声者に単語を発声するように誘導する発声誘導手段
とからなる構成を有している。
、複数の離散単語音声の標準パターン群を記憶した標準
パターン記憶手段と、発声者の音声を分析し音声パター
ンを抽出する音声分析手段と、前記音声分析手段により
抽出した音声パターンに最も近い標準パターンを前記標
準パターン群から選出する標準パターン選出手段と、音
声認識可能期間を発声者に告知する発声開始告知手段と
、発声者に単語を発声するように誘導する発声誘導手段
とからなる構成を有している。
作用
この構成によって、発声開始告知手段が、音声認識可能
期間を発声者に告知し、カップ自販機の発声誘導期間な
どの音声認識不可能期間に発声者に発声を行わせないこ
とにより、認識率が高く、また、発声者に不安感を与え
ない音声認識システムを実現できる。
期間を発声者に告知し、カップ自販機の発声誘導期間な
どの音声認識不可能期間に発声者に発声を行わせないこ
とにより、認識率が高く、また、発声者に不安感を与え
ない音声認識システムを実現できる。
実施例
以下本発明の一実施例について、図面を参照しながら説
明する。
明する。
本実施例は、不特定話者に対する音声認識システムをカ
ップ自販機に適応したものである。ただし、構成要件中
、従来例と同構成のものは、同番号を付し、説明を割愛
する。第1図は、本発明の実施例における音声認識シス
テムの機能ブロック図を示すものである。9は、発声開
始告知手段であり、音声認識可能期間を発声者に告知す
るもので、例えばカップ自販機の前面のよく目立つ場所
にランプなどを設けたものである。第2図は前記発声開
始告知手段9の動作説明図である。第2図に示すように
カップ自販機の発声誘導期間やパターン選出処理期間な
どの音声認識不可能期間には発声開始告知信号はOFF
状態にあり、音声認識可能期間には発声開始告知信号は
ON状態にある。従って、発声者は発声開始告知信号が
ON状態にある時に発声を行なうことにより、従来のよ
うに誤って音声認識不可能期間に発声することがなくな
る。
ップ自販機に適応したものである。ただし、構成要件中
、従来例と同構成のものは、同番号を付し、説明を割愛
する。第1図は、本発明の実施例における音声認識シス
テムの機能ブロック図を示すものである。9は、発声開
始告知手段であり、音声認識可能期間を発声者に告知す
るもので、例えばカップ自販機の前面のよく目立つ場所
にランプなどを設けたものである。第2図は前記発声開
始告知手段9の動作説明図である。第2図に示すように
カップ自販機の発声誘導期間やパターン選出処理期間な
どの音声認識不可能期間には発声開始告知信号はOFF
状態にあり、音声認識可能期間には発声開始告知信号は
ON状態にある。従って、発声者は発声開始告知信号が
ON状態にある時に発声を行なうことにより、従来のよ
うに誤って音声認識不可能期間に発声することがなくな
る。
以上のように構成されたカップ自販機用音声認識システ
ムについて、第3図のフローチャートを用いてその販売
動作を説明する。第3図において、まず、ステップ20
1で、前記コイン受取手段7にコインが投入されたか否
かを判定し、コインが投入されればステップ202に進
む。ステップ202では、前記発声誘導手段5により、
′いらっしゃいませ、何になさいますか”と誘導し、次
に、ステップ203で前記発声開始告知手段9により発
声開始告知信号を出す0発声告知信号を受けて発声者は
発声を行い、ステップ204で、前記標準パターン選出
手段4により前記標準パターン記憶手段3に記憶されて
いる標準パターンに最も近い標準パターンを選出してフ
レーバー名を認識する。ステップ205では、ステップ
204での認識結果が適当か否かを判定し、リジェクト
の場合はステップ206へ進み、発声誘導手段5により
、′もう一度お答え下さい”と誘導して203へ戻る。
ムについて、第3図のフローチャートを用いてその販売
動作を説明する。第3図において、まず、ステップ20
1で、前記コイン受取手段7にコインが投入されたか否
かを判定し、コインが投入されればステップ202に進
む。ステップ202では、前記発声誘導手段5により、
′いらっしゃいませ、何になさいますか”と誘導し、次
に、ステップ203で前記発声開始告知手段9により発
声開始告知信号を出す0発声告知信号を受けて発声者は
発声を行い、ステップ204で、前記標準パターン選出
手段4により前記標準パターン記憶手段3に記憶されて
いる標準パターンに最も近い標準パターンを選出してフ
レーバー名を認識する。ステップ205では、ステップ
204での認識結果が適当か否かを判定し、リジェクト
の場合はステップ206へ進み、発声誘導手段5により
、′もう一度お答え下さい”と誘導して203へ戻る。
一方、リジェクトでない場合はステップ207へ進む。
ステップ207では、ステップ204で認識したフレー
バーにより以降の動作を分岐するものであるが、本実施
例においてはコーヒーを認識したものとし、他のフレー
バー名を認識した場合の動作についてはコーヒーの場合
と同様であるため説明を割愛する。次にステップ208
では、発声誘導手段5により、″コーヒーですね”と確
認し、続いてステップ209で前記発声開始告知手段9
により発声開始告知信号を出す。発声告知信号を受けて
発声者は発声を行い、210で、フレーバー名と同様の
方法で、はいか、いいえの返答を認識する。ステップ2
11では、ステップ210での認識結果が適当か否かを
判定し、リジェクトの場合はステップ208へ戻り、そ
うでない場合はステップ212へ進む。ステップ212
では、ステップ210で認識した返答がはいの場合はス
テップ213へ進み、いいえの場合はステップ206へ
戻る。ステップ213では、制御手段6が、コーヒーを
前記飲料搬出手段8を使ってカップに注ぎ搬出する。そ
して、ステップ214で、釣り銭がある場合は、コイン
受取手段7により釣り銭を払い戻し、最後に、ステップ
215で発声誘導手段5により、”ありがどうございま
した″と発声して一連の動作を終了する。
バーにより以降の動作を分岐するものであるが、本実施
例においてはコーヒーを認識したものとし、他のフレー
バー名を認識した場合の動作についてはコーヒーの場合
と同様であるため説明を割愛する。次にステップ208
では、発声誘導手段5により、″コーヒーですね”と確
認し、続いてステップ209で前記発声開始告知手段9
により発声開始告知信号を出す。発声告知信号を受けて
発声者は発声を行い、210で、フレーバー名と同様の
方法で、はいか、いいえの返答を認識する。ステップ2
11では、ステップ210での認識結果が適当か否かを
判定し、リジェクトの場合はステップ208へ戻り、そ
うでない場合はステップ212へ進む。ステップ212
では、ステップ210で認識した返答がはいの場合はス
テップ213へ進み、いいえの場合はステップ206へ
戻る。ステップ213では、制御手段6が、コーヒーを
前記飲料搬出手段8を使ってカップに注ぎ搬出する。そ
して、ステップ214で、釣り銭がある場合は、コイン
受取手段7により釣り銭を払い戻し、最後に、ステップ
215で発声誘導手段5により、”ありがどうございま
した″と発声して一連の動作を終了する。
以上のように本実施例によれば、発声開始告知手段によ
り音声認識可能期間を発声者に告知するため、発声者は
音声認識システムの発声誘導期間中などの音声認識不可
能期中に”はい”などと発声することがなくなり、また
、発声時期が明確にわかるために、認識率が高く、また
、発声者に不安感を与えない音声認識システムを実現で
きることとなりその効果は大である。
り音声認識可能期間を発声者に告知するため、発声者は
音声認識システムの発声誘導期間中などの音声認識不可
能期中に”はい”などと発声することがなくなり、また
、発声時期が明確にわかるために、認識率が高く、また
、発声者に不安感を与えない音声認識システムを実現で
きることとなりその効果は大である。
発明の効果
以上のように本発明の音声認識システムは、複数の離散
単語音声の標準パターン群を記憶した標準パターン記憶
手段と、発声者の音声を分析し音声パターンを抽出する
音声分析手段と、前記音声分析手段により抽出した音声
パターンに最も近い標準パターンを前記標準パターン群
から選出する標準パターン選出手段と、音声認識可能期
間を発声者に告知する発声開始告知手段と、発声者に単
語を発声するように誘導する発声誘導手段とを設けるこ
とにより、発声開始告知手段が音声認識可能期間を発声
者に告知するため、発声誘導期間などの音声認識不可能
期間に発声者に発声を行わせないことにより、認識率が
高く、また、発声者に不安感を与えない音声認識システ
ムを実現できることとなる。
単語音声の標準パターン群を記憶した標準パターン記憶
手段と、発声者の音声を分析し音声パターンを抽出する
音声分析手段と、前記音声分析手段により抽出した音声
パターンに最も近い標準パターンを前記標準パターン群
から選出する標準パターン選出手段と、音声認識可能期
間を発声者に告知する発声開始告知手段と、発声者に単
語を発声するように誘導する発声誘導手段とを設けるこ
とにより、発声開始告知手段が音声認識可能期間を発声
者に告知するため、発声誘導期間などの音声認識不可能
期間に発声者に発声を行わせないことにより、認識率が
高く、また、発声者に不安感を与えない音声認識システ
ムを実現できることとなる。
第1図は本発明の一実施例における音声認識システムの
機能ブロック図、第2図は第1図の発声開始告知手段の
動作説明図、第3図は本発明の実施例における音声認識
システムの動作例を示すフローチャート、第4図は従来
の音声認識システムの機能ブロック図である。 2・・・音声分析手段、3・・・標準パターン記憶手段
、4・・・標準パターン選出手段、5・・・発声誘導手
段、9・・・発声開始告知手段。 代理人の氏名 弁理士 粟野重孝 はか1名第 図
機能ブロック図、第2図は第1図の発声開始告知手段の
動作説明図、第3図は本発明の実施例における音声認識
システムの動作例を示すフローチャート、第4図は従来
の音声認識システムの機能ブロック図である。 2・・・音声分析手段、3・・・標準パターン記憶手段
、4・・・標準パターン選出手段、5・・・発声誘導手
段、9・・・発声開始告知手段。 代理人の氏名 弁理士 粟野重孝 はか1名第 図
Claims (1)
- 複数の離散単語音声の標準パターン群を記憶した標準パ
ターン記憶手段と、発声者の音声を分析し音声パターン
を抽出する音声分析手段と、前記音声分析手段により抽
出した音声パターンに最も近い標準パターンを前記標準
パターン群から選出する標準パターン選出手段と、音声
認識可能期間を発声者に告知する発声開始告知手段と、
発声者に単語を発声するように誘導する発声誘導手段と
からなる音声認識システム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1070918A JPH02250095A (ja) | 1989-03-23 | 1989-03-23 | 音声認識システム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1070918A JPH02250095A (ja) | 1989-03-23 | 1989-03-23 | 音声認識システム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02250095A true JPH02250095A (ja) | 1990-10-05 |
Family
ID=13445364
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1070918A Pending JPH02250095A (ja) | 1989-03-23 | 1989-03-23 | 音声認識システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02250095A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2003052737A1 (en) * | 2001-12-17 | 2003-06-26 | Asahi Kasei Kabushiki Kaisha | Speech recognition method, remote controller, information terminal, telephone communication terminal and speech recognizer |
-
1989
- 1989-03-23 JP JP1070918A patent/JPH02250095A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2003052737A1 (en) * | 2001-12-17 | 2003-06-26 | Asahi Kasei Kabushiki Kaisha | Speech recognition method, remote controller, information terminal, telephone communication terminal and speech recognizer |
| JP2009104156A (ja) * | 2001-12-17 | 2009-05-14 | Asahi Kasei Homes Kk | 電話通信端末 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Ainsworth | Duration as a cue in the recognition of synthetic vowels | |
| JP3968133B2 (ja) | 音声認識対話処理方法および音声認識対話装置 | |
| US4394538A (en) | Speech recognition system and method | |
| JPS5944639B2 (ja) | 音声による異同認識方式における標準パタ−ン更新方法 | |
| JP2000259170A (ja) | 音声認識システムにユーザを登録する方法および装置 | |
| Lee et al. | Tone recognition of isolated Cantonese syllables | |
| US20040098259A1 (en) | Method for recognition verbal utterances by a non-mother tongue speaker in a speech processing system | |
| EP1280137B1 (en) | Method for speaker identification | |
| JP2002536691A (ja) | 音声認識除去方式 | |
| JPH02250095A (ja) | 音声認識システム | |
| JP2000347684A (ja) | 音声認識システム | |
| JPH11231895A (ja) | 音声認識方法及びその装置 | |
| JPH02250097A (ja) | 音声認識システム | |
| JPH02250099A (ja) | 音声認識システム | |
| JPH02250096A (ja) | 音声認識システム | |
| JP2001042887A (ja) | 自動音声認識器を訓練する方法 | |
| JPH03231297A (ja) | 音声認識システム | |
| JPH02204797A (ja) | 音声認識システム | |
| JPH0340000A (ja) | 音声認識システム | |
| JP6522679B2 (ja) | 発話制御装置、方法、発話システム、及びプログラム | |
| JPH0330083A (ja) | 自動販売機 | |
| JPS6331798B2 (ja) | ||
| Cohen | Forensic Applications of Automatic Speaker Verification | |
| JPH02151900A (ja) | 音声認識システム | |
| JPS61180297A (ja) | 話者照合装置 |