JPS5946696A - 音声認識方式 - Google Patents
音声認識方式Info
- Publication number
- JPS5946696A JPS5946696A JP57155983A JP15598382A JPS5946696A JP S5946696 A JPS5946696 A JP S5946696A JP 57155983 A JP57155983 A JP 57155983A JP 15598382 A JP15598382 A JP 15598382A JP S5946696 A JPS5946696 A JP S5946696A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speech
- standard
- recognition
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の利用分野〕
本発明は、認識対象の各単語に対応して複数組の標準音
声パタンを記憶しておき、入力音声に対する類似度が最
上位となる組の標準音声パタンを認識結果として出力・
表示する音声認識装置において、その認識率を向上させ
るだめの音声認識方式に関するものである。
声パタンを記憶しておき、入力音声に対する類似度が最
上位となる組の標準音声パタンを認識結果として出力・
表示する音声認識装置において、その認識率を向上させ
るだめの音声認識方式に関するものである。
この種の音声認識装置における従来の音声認識方式は、
例えば、一連のザービスが完了する寸で、内蔵されてい
る+、Ld組の全標準音声パタンを使用して音声= i
=処理を行わせるようにしていたので、ある特定の発声
者による特定の単語が、ある特だ組の標準音声パタンに
関して誤認1試、リジェクトを起こし易いことがあり、
そのような場合には、一連の音声認識処理において誤認
識、リジェクトが当該単語について集中・多発をすると
いうおそれかあった。
例えば、一連のザービスが完了する寸で、内蔵されてい
る+、Ld組の全標準音声パタンを使用して音声= i
=処理を行わせるようにしていたので、ある特定の発声
者による特定の単語が、ある特だ組の標準音声パタンに
関して誤認1試、リジェクトを起こし易いことがあり、
そのような場合には、一連の音声認識処理において誤認
識、リジェクトが当該単語について集中・多発をすると
いうおそれかあった。
本発明の目的は、上記した従来技術の欠点をなくシ、特
に、発声者別に生ずる、特定単1inの標/11;音声
パタンの特定組に対する誤認識を防1.1−L、g:α
識率を総合的に向上することができる音声、4識方式を
4鹸することにある。
に、発声者別に生ずる、特定単1inの標/11;音声
パタンの特定組に対する誤認識を防1.1−L、g:α
識率を総合的に向上することができる音声、4識方式を
4鹸することにある。
本発明に係る音声認識方式の(11′f成は、認識対象
の各単語に対応して複数組の標準音声バタンデータを記
1意しておき、入力音声の特徴抽出を行い、その特徴デ
ータと上記各標準音声バタンデータとの類似度H」算処
理を行い、その類似度が最上位となる標準音声パタンを
認識結果として判定・出力する機能を有する音声認識装
置において、音声認識処理に先立って最初に入力される
所定のキーワードについてクラスタリングを行っておく
ことにより、そのクラスタリングの結果に基づき、当該
入力音声に対応する標準音声バタンの組を選択し、それ
に従って以後の一連の音声8M jjl&処理を行わし
めるように利仰・処理するものである。
の各単語に対応して複数組の標準音声バタンデータを記
1意しておき、入力音声の特徴抽出を行い、その特徴デ
ータと上記各標準音声バタンデータとの類似度H」算処
理を行い、その類似度が最上位となる標準音声パタンを
認識結果として判定・出力する機能を有する音声認識装
置において、音声認識処理に先立って最初に入力される
所定のキーワードについてクラスタリングを行っておく
ことにより、そのクラスタリングの結果に基づき、当該
入力音声に対応する標準音声バタンの組を選択し、それ
に従って以後の一連の音声8M jjl&処理を行わし
めるように利仰・処理するものである。
これを要するに、音声認識処理の最初に所定のキーワー
ド(j’ilJえは、各個人の発fV3特徴の基本とな
る5m音「あ」、「い」、「う」、「え」。
ド(j’ilJえは、各個人の発fV3特徴の基本とな
る5m音「あ」、「い」、「う」、「え」。
「お」)を発声せしめ、その各特徴パラメータ(スペク
トラム)を求め、これらと標準音声パタンの各組の対応
語との相互距離を計算し、その最も近い標準音声パタン
の組を当該入力音声の正認識が得られ易い対応するもの
として選択し、以後の音声認識処理を行うようにするも
のである。
トラム)を求め、これらと標準音声パタンの各組の対応
語との相互距離を計算し、その最も近い標準音声パタン
の組を当該入力音声の正認識が得られ易い対応するもの
として選択し、以後の音声認識処理を行うようにするも
のである。
以下、本発明の実施例を図に基づいて説明する。
第1図は、本発明に係る音声認識方式の一実施例の方式
構成図、第2図は、その処理フ「J−チャートである。
構成図、第2図は、その処理フ「J−チャートである。
ここで、1は、制御部であって、音声ijJ識表置の各
部に対する制御をして所要の認識処理を行い、その認識
結果をホスト装置i#14sTに伝え、これに所望のザ
ービス蟲埋を行わしめるもの、2ば、認識対象の各単語
に対応して各羨故組の標準11声バタンデータが用意さ
れている標準音1)イパタンメモリ、3は、標準音声パ
タン・パ択部、4−2、M声n2織部、5け、そのバタ
ンマツチングの結果に応して人力音声に対する標準音声
バク/の組を判定する判定1′l]S、6L」:、人力
8声がら/11徴ノー 夕を抽出する分析部、7は、音
声入力に係るマイク「7ノ劃ン、8は、認識結果の表示
に係る)イー声合成部、9は、同スピーカ、10は、認
識結果の確認および繰返し音声人力に係るコンソール部
、11は、分析された入力音声バタンについてクラスタ
リングを行うだめのクラスタリング部であ)。
部に対する制御をして所要の認識処理を行い、その認識
結果をホスト装置i#14sTに伝え、これに所望のザ
ービス蟲埋を行わしめるもの、2ば、認識対象の各単語
に対応して各羨故組の標準11声バタンデータが用意さ
れている標準音1)イパタンメモリ、3は、標準音声パ
タン・パ択部、4−2、M声n2織部、5け、そのバタ
ンマツチングの結果に応して人力音声に対する標準音声
バク/の組を判定する判定1′l]S、6L」:、人力
8声がら/11徴ノー 夕を抽出する分析部、7は、音
声入力に係るマイク「7ノ劃ン、8は、認識結果の表示
に係る)イー声合成部、9は、同スピーカ、10は、認
識結果の確認および繰返し音声人力に係るコンソール部
、11は、分析された入力音声バタンについてクラスタ
リングを行うだめのクラスタリング部であ)。
まず、音声認識処理に先立ち、制御部1は、音声入力に
対する準備を分析部6.クラスタリング部11に指示し
、クラスタリングの対象となるべき標準音声パタンを標
準音声バタンメモリ2から選択するように標準音声バタ
ン選択部3に指示する(第2図の処理21)。
対する準備を分析部6.クラスタリング部11に指示し
、クラスタリングの対象となるべき標準音声パタンを標
準音声バタンメモリ2から選択するように標準音声バタ
ン選択部3に指示する(第2図の処理21)。
これらの4(へ備が完了すると、発声者に対してキーワ
ード(例えば、母音「あ」、「い」、「う」。
ード(例えば、母音「あ」、「い」、「う」。
「え」、「お」)の音声入力を促すべき入力催告メツセ
ージを出力するよう音声合成部8に指示するのでスピー
カ9から上記入力催告メツセージが放声される(同処理
22)。
ージを出力するよう音声合成部8に指示するのでスピー
カ9から上記入力催告メツセージが放声される(同処理
22)。
コレにより、発声者がマイクロフォン7かも上記キーワ
ードの音声を入力すると(同処理24)、分析部6は、
入力された音声を分析して特徴データを抽出する(同処
理25)。
ードの音声を入力すると(同処理24)、分析部6は、
入力された音声を分析して特徴データを抽出する(同処
理25)。
ここで、クラスタリング部11−は、標準音声バタン選
択部3が示す標準片声バタンと」−:記入カiイ声パタ
ンとの間でクラスタリング(1クリえば、多変量解析の
分野における階層的クラスタリングと同様なもの)を行
い、」二記キーワー 1・が標準音声パタンのいずれの
組に属しく対応)でいるかを調べる(同処理26)。
択部3が示す標準片声バタンと」−:記入カiイ声パタ
ンとの間でクラスタリング(1クリえば、多変量解析の
分野における階層的クラスタリングと同様なもの)を行
い、」二記キーワー 1・が標準音声パタンのいずれの
組に属しく対応)でいるかを調べる(同処理26)。
制イ卸部1は、上記クラスタリングの結果より、標準音
声バタン選択部3に対し、以後の音声認識処理に備えて
どの組の標準音声パタンを選択するかを指示する(同処
理27)。
声バタン選択部3に対し、以後の音声認識処理に備えて
どの組の標準音声パタンを選択するかを指示する(同処
理27)。
次に、発声者に対して本来の音声□想識をずへき音声入
力をするように、入カ催告メッセー ジを音声合成部8
経出でスピーカ9から放声ゼしめる(同処理23)。
力をするように、入カ催告メッセー ジを音声合成部8
経出でスピーカ9から放声ゼしめる(同処理23)。
発声者がマイクロフォン7がら音声を人力−7−ルと(
同処理24)、分析部6は、人力さ11./こ1゛1声
を分析して特徴データを抽出する(同処理25)。
同処理24)、分析部6は、人力さ11./こ1゛1声
を分析して特徴データを抽出する(同処理25)。
音声認識部4は、標準音声バタン選択部3が示す標準音
声パタンと、」二記入カ音−辺バタンとの間でパタンマ
ツチングを行い、その結果の類似度を判定部5へ送る(
同処理28)。
声パタンと、」二記入カ音−辺バタンとの間でパタンマ
ツチングを行い、その結果の類似度を判定部5へ送る(
同処理28)。
判定部5は、類似度が最」1位のものを認識結果とし7
て制御?i′IS1へ送る(同処理29)。 □
人力音声に対して最も確からしい類似度の値が低くて認
識結果として決定するのは疑わしいとすべきりジエクト
の場合には、制?i11+部1は、標準音声パタン選択
部3に対して今寸でと同一の標準音声パタンを選択する
ように指ンJミしく同処理30)、更に音声合成部8に
対して再音声人力を促すメツセージをスピーカ9から放
声せしめるように制御する(同処理31)。これにより
、上述の処理24以降が繰り返される。
て制御?i′IS1へ送る(同処理29)。 □
人力音声に対して最も確からしい類似度の値が低くて認
識結果として決定するのは疑わしいとすべきりジエクト
の場合には、制?i11+部1は、標準音声パタン選択
部3に対して今寸でと同一の標準音声パタンを選択する
ように指ンJミしく同処理30)、更に音声合成部8に
対して再音声人力を促すメツセージをスピーカ9から放
声せしめるように制御する(同処理31)。これにより
、上述の処理24以降が繰り返される。
制御部1ば、その認識結果が正しいものであるか否かを
発声者に確認させるだめの表示として、確認要求メツセ
ージを音声合成部8から出力させ、それをスピーカ9か
ら放声さぜる(同処理32)。
発声者に確認させるだめの表示として、確認要求メツセ
ージを音声合成部8から出力させ、それをスピーカ9か
ら放声さぜる(同処理32)。
発声者は、これを聴取して入力音声が正しく認識された
のか、誤Mg ii+i’!されたのかを知り、その旨
をコンノール部10から開側]部1へ入力する(同処理
33)。
のか、誤Mg ii+i’!されたのかを知り、その旨
をコンノール部10から開側]部1へ入力する(同処理
33)。
制御部1−\の認識結果の正否の確認人力は、必ずしも
コンノール部10における操作による必要はなく、マイ
クロフォン7から確認用音声の入力に」:ってもよいが
、その内容は音声認識が確実に行われるように、141
単で誤認識しにくいものであることが望寸しい。
コンノール部10における操作による必要はなく、マイ
クロフォン7から確認用音声の入力に」:ってもよいが
、その内容は音声認識が確実に行われるように、141
単で誤認識しにくいものであることが望寸しい。
制姐j部]は、上記確認情報により、上述の認識候補が
正しいものであるときは、それを認識結果としてホスト
装置1−I S Tへ送出し、1つの人力音声に対する
処理を終了せしめて次の人力に備える。
正しいものであるときは、それを認識結果としてホスト
装置1−I S Tへ送出し、1つの人力音声に対する
処理を終了せしめて次の人力に備える。
一方、誤認識であったという確認’1iIr報を受けだ
ときには、?1tlJ御部1は、上述のリジェクトの場
合と同様に、音声合成部8Vこ対し、画び回−の1°1
声入力をするようにメツセージ送出をせしめ、用度、上
述の処理24以降の認識を行う。、 以上の動作を一連のザービスが完了する斗で繰り返して
行う。
ときには、?1tlJ御部1は、上述のリジェクトの場
合と同様に、音声合成部8Vこ対し、画び回−の1°1
声入力をするようにメツセージ送出をせしめ、用度、上
述の処理24以降の認識を行う。、 以上の動作を一連のザービスが完了する斗で繰り返して
行う。
このように本実施例によれは、発声者による!111定
の単語の、特定の組の標準音声パタンに対ずイ)誤認識
が減少し、認識率を向上せしめることができる。
の単語の、特定の組の標準音声パタンに対ずイ)誤認識
が減少し、認識率を向上せしめることができる。
以上、詳11i11に説明したように、本発明によれば
、谷発声者ごとに適合した標準音声パタンによって音声
MIJ ijm A理をすることができるので、特定者
による発声が標準音声パタンの特定絹に誤認識されるこ
とが減少し、音声認識装置における認識率向上。
、谷発声者ごとに適合した標準音声パタンによって音声
MIJ ijm A理をすることができるので、特定者
による発声が標準音声パタンの特定絹に誤認識されるこ
とが減少し、音声認識装置における認識率向上。
ザービス性向上に顕著な効果が伶られる。
第1図は、本発明に係る音声認識方式の一実施例の方式
構成図、第2図は、その処理フローチャー1・である。 1・・・制fl11j部、2・・・標準音声パフ/メモ
リ、3・・・標準音声バタン選択部、4・・・音声認識
部、5・・・判定部、6・・・分析部、7・・・マイク
ロフォン、8・・・音声合成部、9・・・スピーカ、1
0・・・コンソール部、11’−”7i 27 ’)
’−り“J3. 代理人 弁理士 福田幸作(ほか1名
) $ 1 目
構成図、第2図は、その処理フローチャー1・である。 1・・・制fl11j部、2・・・標準音声パフ/メモ
リ、3・・・標準音声バタン選択部、4・・・音声認識
部、5・・・判定部、6・・・分析部、7・・・マイク
ロフォン、8・・・音声合成部、9・・・スピーカ、1
0・・・コンソール部、11’−”7i 27 ’)
’−り“J3. 代理人 弁理士 福田幸作(ほか1名
) $ 1 目
Claims (1)
- 1、認識対象の各単語に対して泉数組の標準音声パタン
データを記憶しておき、人力音声の特徴抽出を行い、そ
の特徴データと」二記谷標準音声パタンデータとの類似
度計算処理を行い、その類似度が最上位となる標準音声
パタンを認識結果として判定・出力する・吹射を有する
音声認識装置において、音声認識処理に先立って最初に
入力される所定のキーワードについてクラスタリングを
行っておくことにより、そのクラスタリングの結果に基
づき、尚該入力音声に対応する標準音声パタンの組を選
択し、それに従って以後の一連の音声認識処Jgjlを
行わしめるように制御・処理することを特徴とする音声
認識方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57155983A JPS5946696A (ja) | 1982-09-09 | 1982-09-09 | 音声認識方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57155983A JPS5946696A (ja) | 1982-09-09 | 1982-09-09 | 音声認識方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS5946696A true JPS5946696A (ja) | 1984-03-16 |
Family
ID=15617784
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57155983A Pending JPS5946696A (ja) | 1982-09-09 | 1982-09-09 | 音声認識方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5946696A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH034881U (ja) * | 1989-06-02 | 1991-01-18 |
-
1982
- 1982-09-09 JP JP57155983A patent/JPS5946696A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH034881U (ja) * | 1989-06-02 | 1991-01-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3968133B2 (ja) | 音声認識対話処理方法および音声認識対話装置 | |
| US7373301B2 (en) | Method for detecting emotions from speech using speaker identification | |
| JPS603699A (ja) | 適応性自動離散音声認識方法 | |
| JPS5946696A (ja) | 音声認識方式 | |
| JPS59212900A (ja) | 音声認識装置 | |
| CN117577115B (zh) | 一种智慧型无纸化会议系统 | |
| JPS59147397A (ja) | 音声認識制御方式 | |
| Maltby et al. | Robust Deepfake Speech Algorithm Recognition: Classifying Generative Algorithms via Speaker X-Vectors and Deep Learning | |
| JPH09230889A (ja) | 音声認識応答装置 | |
| JPS645320B2 (ja) | ||
| JPS5962900A (ja) | 音声認識方式 | |
| JPS60107192A (ja) | パタ−ン認識装置 | |
| JP2000148187A (ja) | 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体 | |
| JPS5915990A (ja) | 音声認識方式 | |
| JPS59111698A (ja) | 音声認識方式 | |
| JPS5988798A (ja) | 音声認識処理方式 | |
| JP2975808B2 (ja) | 音声認識装置 | |
| CN120071940A (zh) | 一种语音数据处理方法及装置 | |
| CN118645107A (zh) | 基于智能音响的会议协调方法、装置、系统以及电子设备 | |
| JPS59147396A (ja) | 音声認識制御方式 | |
| Trabelsi et al. | Dynamic sequence-based learning approaches on emotion recognition systems | |
| CN121306374A (zh) | 一种声纹识别辅助的智能化语音病历录入系统 | |
| JPS5917596A (ja) | 音声認識方式 | |
| JPS61151600A (ja) | 音声認識方法 | |
| JPH0256680B2 (ja) |