JPH01200293A - 音声認識方式 - Google Patents
音声認識方式Info
- Publication number
- JPH01200293A JPH01200293A JP63024382A JP2438288A JPH01200293A JP H01200293 A JPH01200293 A JP H01200293A JP 63024382 A JP63024382 A JP 63024382A JP 2438288 A JP2438288 A JP 2438288A JP H01200293 A JPH01200293 A JP H01200293A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- evaluation distance
- value
- input
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 claims abstract description 47
- 238000000034 method Methods 0.000 claims description 11
- 230000003044 adaptive effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
支血欠1
本発明は音声認識方式に関し、特に各時間毎に入力パタ
ーンの終端点を時間方向にシフトしながらパターンマツ
チングを行い、標準パターンとの距離を算出し、各時間
毎の距離を評価して認識結果を判定する音声認識方式に
関する。
ーンの終端点を時間方向にシフトしながらパターンマツ
チングを行い、標準パターンとの距離を算出し、各時間
毎の距離を評価して認識結果を判定する音声認識方式に
関する。
従来技術
従来、この種の音声認識方式においては、認識判定部で
用いる評価距離閾値は固定値となっている。上述した従
来の音声認識方式における認識結果判定部では評価距離
間値が固定値であるために、話者に適した閾値を設定す
ることができないことから、誤認識となることがあり、
正しい認識結果を得られないという欠点かある。
用いる評価距離閾値は固定値となっている。上述した従
来の音声認識方式における認識結果判定部では評価距離
間値が固定値であるために、話者に適した閾値を設定す
ることができないことから、誤認識となることがあり、
正しい認識結果を得られないという欠点かある。
発明の目的
本発明は話者に適した閾値を設定するようにしして、正
しい認識結果が得られるようにした音声3.2織方式を
提供することを目的としている。
しい認識結果が得られるようにした音声3.2織方式を
提供することを目的としている。
発明の構成
本発明は、時系列データである評価距離に対して評価距
離閾値と継続時間閾値を設け、音声認識結果を判定する
方法において、入力開始から定められたフレーム目の評
価距離の値から定められた係数値を減じた値を評価距離
間値として適応的に算出することにより話者に敵した評
価距離閾値を設定することかでき、よって正確な認識結
果を得ることができるものである。
離閾値と継続時間閾値を設け、音声認識結果を判定する
方法において、入力開始から定められたフレーム目の評
価距離の値から定められた係数値を減じた値を評価距離
間値として適応的に算出することにより話者に敵した評
価距離閾値を設定することかでき、よって正確な認識結
果を得ることができるものである。
実施例
次に、図面を参照して本発明の実施例について説明する
。
。
第1図は本発明の一実施例のブロック図である。
音声分析部1、標準パターン部2、パターンマツチング
部3、認識結果判定部4より構成されいる。
部3、認識結果判定部4より構成されいる。
入力音声10は、音声分析部1に入力されて特徴パター
ンに分析され、入力パターン11としてパターンマツチ
ング部3に入力される。パターンマツチング部3は標準
パターン部2から標準パターン12を読出し、入力パタ
ーン11とパターンマツチングを毎フレーム行いパター
ン間距離を算出し、評価距離13として認識結果判定部
4に出力する。尚、パターンマツチングはフレーム毎に
、入力パターンの終端点を前フレームの時の終端点より
も1フレーム後ろにシフトしてから行う。
ンに分析され、入力パターン11としてパターンマツチ
ング部3に入力される。パターンマツチング部3は標準
パターン部2から標準パターン12を読出し、入力パタ
ーン11とパターンマツチングを毎フレーム行いパター
ン間距離を算出し、評価距離13として認識結果判定部
4に出力する。尚、パターンマツチングはフレーム毎に
、入力パターンの終端点を前フレームの時の終端点より
も1フレーム後ろにシフトしてから行う。
パターンマツチングの方法は始端フリーDPマツチング
法として以下に説明するが、これに限定されない、第2
図は女台端フリーDPマツチングを用いた時のパターン
マツチングのDPパス許容領域を示す図であり、第3図
に示すDPババス用いている。第2図、第3図とも横軸
が入力パターンのフレーム、縦軸が標準パターンのフレ
ームであり、iは入力パターンのフレーム、jは標準パ
ターンのフレームを示す。
法として以下に説明するが、これに限定されない、第2
図は女台端フリーDPマツチングを用いた時のパターン
マツチングのDPパス許容領域を示す図であり、第3図
に示すDPババス用いている。第2図、第3図とも横軸
が入力パターンのフレーム、縦軸が標準パターンのフレ
ームであり、iは入力パターンのフレーム、jは標準パ
ターンのフレームを示す。
始端フリーDPマツチング法とは終端点に至るDPマツ
チング経路のうち最少のパターン間距離を与えるものを
始端点を限定しないで求める方法であり、第2図に示し
た例は、入力パターンのフレームIを終端点とした時、
IS、からIS2のいづれかのフレームが始端点となる
ことを示している。又、フレーム毎に入力パターンの終
端点をシフトしてパターンマツチングを行うことは、第
2図で示したDPパスの許容領域が横軸iの方向のスラ
イドしたことを意味する。
チング経路のうち最少のパターン間距離を与えるものを
始端点を限定しないで求める方法であり、第2図に示し
た例は、入力パターンのフレームIを終端点とした時、
IS、からIS2のいづれかのフレームが始端点となる
ことを示している。又、フレーム毎に入力パターンの終
端点をシフトしてパターンマツチングを行うことは、第
2図で示したDPパスの許容領域が横軸iの方向のスラ
イドしたことを意味する。
次に、第4図を参照して認識結果判定部4について説明
する。評価距離13は入力フレーム毎に算出されるため
、第4図に示す様な入力フレームに対する時系列データ
となる。第4図の横軸は入力フレーム、縦軸は評価距離
である。第4図(a)、(b)、(c)、(d)はそれ
ぞれ話者A、B。
する。評価距離13は入力フレーム毎に算出されるため
、第4図に示す様な入力フレームに対する時系列データ
となる。第4図の横軸は入力フレーム、縦軸は評価距離
である。第4図(a)、(b)、(c)、(d)はそれ
ぞれ話者A、B。
C,Dの評価距離のグラフである。
認識結果判定部4では、第4図に示す様な評価距離閾値
算出フレーム20と評価距離閾値算出用係数21とを定
め、次の式で適応評価距離閾値を算出する。本実施例で
は、評価距離閾値算出フレームを25、評価距離閾値算
出用係数を100としている。
算出フレーム20と評価距離閾値算出用係数21とを定
め、次の式で適応評価距離閾値を算出する。本実施例で
は、評価距離閾値算出フレームを25、評価距離閾値算
出用係数を100としている。
適応評価距離間値
一評価距離閾値算出フレームの評価距^i−評価距離閾
値算出用係数 このようにして適応評価距離間値は算出され、第4 (
a)、(b)、(c)、(d)の22.23.24.2
5に示すように話者に応じて#適な値となる。継続性に
対する閾値として継続性閾値を設け、評価距離13が適
応評価距離間値22゜23.24.25を継続して下回
っている区間の時間が継続時間閾値以上であるかを判定
し、継続時間閾値以上である区間を谷区間とする0本実
施例では、谷区間の最下点の評価距離を判定スコアーと
して用いる。但し、判定スコアーとして何を用いるかは
特に限定されていない。
値算出用係数 このようにして適応評価距離間値は算出され、第4 (
a)、(b)、(c)、(d)の22.23.24.2
5に示すように話者に応じて#適な値となる。継続性に
対する閾値として継続性閾値を設け、評価距離13が適
応評価距離間値22゜23.24.25を継続して下回
っている区間の時間が継続時間閾値以上であるかを判定
し、継続時間閾値以上である区間を谷区間とする0本実
施例では、谷区間の最下点の評価距離を判定スコアーと
して用いる。但し、判定スコアーとして何を用いるかは
特に限定されていない。
このようにして、全ての標準パターンとの判定スコアー
を求め、判定スコアーが最も小さい標準パターンを認識
結果14として選択して出力する。
を求め、判定スコアーが最も小さい標準パターンを認識
結果14として選択して出力する。
第4図(a)、(b)、(c)、(d)に示した例から
明らかなように、話者によって評価距離の動き方が異な
り、評価「E離間値を固定値とした場合、全話者に適し
た値を求めることは難しくなってしまう0例えば、話者
Aと話者りを比較した場合、話者りに適した評価距離間
値は約650であるが、話者Aには大きすぎた値となり
、誤認識を招いてしまう。
明らかなように、話者によって評価距離の動き方が異な
り、評価「E離間値を固定値とした場合、全話者に適し
た値を求めることは難しくなってしまう0例えば、話者
Aと話者りを比較した場合、話者りに適した評価距離間
値は約650であるが、話者Aには大きすぎた値となり
、誤認識を招いてしまう。
一方、上述の本実施例で示した適応評価距離閾値22.
23,24.25を用いることにより、第4図(a)、
(b)、(c)、(d)から明らかなように各話者に適
した評価距離閾値が設定され、従来方式で発生した誤認
識を除去し、正しい誤認識を得ることができる。
23,24.25を用いることにより、第4図(a)、
(b)、(c)、(d)から明らかなように各話者に適
した評価距離閾値が設定され、従来方式で発生した誤認
識を除去し、正しい誤認識を得ることができる。
発明の効果
本発明によれば、固定評価距M間値を評価距離の判定に
用いるのではなく、入力音声に適した適応評価の判定に
用いるのではなく、入力音声に適した適応評価距離閾値
を用いるようにしているので、正確な認識結果を得るこ
とができ、よって誤認識を少なくできるという効果があ
る。
用いるのではなく、入力音声に適した適応評価の判定に
用いるのではなく、入力音声に適した適応評価距離閾値
を用いるようにしているので、正確な認識結果を得るこ
とができ、よって誤認識を少なくできるという効果があ
る。
第1図は本発明の実施例のブロック図、第2図は始端フ
リーDPマツチングにおけるDPパスの許容領域を示す
図、第3図は始端フリーDPマツチングにおけるDPパ
スを示す図、第4図(a)〜(d)は話者A〜Dの各評
価「1離のグラフである。 主要部分の符号の説明 1・・・・・・音声分析部 2・・・・・・標準パターン部 3・・・・・・パターンマッチンク部 4・・・・・・認識結果判定部
リーDPマツチングにおけるDPパスの許容領域を示す
図、第3図は始端フリーDPマツチングにおけるDPパ
スを示す図、第4図(a)〜(d)は話者A〜Dの各評
価「1離のグラフである。 主要部分の符号の説明 1・・・・・・音声分析部 2・・・・・・標準パターン部 3・・・・・・パターンマッチンク部 4・・・・・・認識結果判定部
Claims (1)
- (1)認識対象の単語又は音韻の特徴パターンを標準パ
ターンとして記憶しておく標準パターン部と、入力音声
の分析を定められたフレーム周期毎に行い、入力音声の
特徴パターンである入力パターンを出力する音声分析部
と、標準パターンと入力パターンとのマッチングを行い
、評価距離を算出するパターンマッチング部と、評価距
離に基づいて認識結果を判定する認識結果判定部とを具
備し、前記パターンマッチング部において入力パターン
のフレーム毎に入力パターンの終端点を1フレームづつ
後にシフトしてパターンマッチングを行い、評価距離と
してパターン間距離を毎フレーム算出し、時系列データ
として評価距離を前記認識結果判定部へ出力し、この認
識結果判定部において時系列データである評価距離に対
して評価距離間値と継続時間閾値を設け、認識結果を判
定する音声認識方式であって、入力開始から定められた
フレーム目の評価距離の値から定められた係数値を減じ
た値を該評価距離閾値として適応的に算出することを特
徴とする音声認識方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63024382A JP2748383B2 (ja) | 1988-02-04 | 1988-02-04 | 音声認識方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63024382A JP2748383B2 (ja) | 1988-02-04 | 1988-02-04 | 音声認識方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH01200293A true JPH01200293A (ja) | 1989-08-11 |
| JP2748383B2 JP2748383B2 (ja) | 1998-05-06 |
Family
ID=12136632
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63024382A Expired - Lifetime JP2748383B2 (ja) | 1988-02-04 | 1988-02-04 | 音声認識方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2748383B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2980420B2 (ja) | 1991-07-26 | 1999-11-22 | 富士通株式会社 | 動的計画法照合装置 |
-
1988
- 1988-02-04 JP JP63024382A patent/JP2748383B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JP2748383B2 (ja) | 1998-05-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9002709B2 (en) | Voice recognition system and voice recognition method | |
| JPS58140798A (ja) | 音声ピツチ抽出方法 | |
| JP3069531B2 (ja) | 音声認識方法 | |
| JPWO2003107326A1 (ja) | 音声認識方法及びその装置 | |
| JPH01200293A (ja) | 音声認識方式 | |
| JPH0792989A (ja) | 音声認識方法 | |
| JPS60114900A (ja) | 有音・無音判定法 | |
| JP3091537B2 (ja) | 音声パターン作成方法 | |
| JP3011421B2 (ja) | 音声認識装置 | |
| JPH02125298A (ja) | 音声認識方式 | |
| JPS6147437B2 (ja) | ||
| JPH09258765A (ja) | 音声認識のための音声区間始端補正方法及び装置並びに音声認識方法 | |
| JP2737109B2 (ja) | 音声区間検出方式 | |
| JPH0546196A (ja) | 音声認識装置 | |
| JPH01116597A (ja) | 音声認識方式 | |
| JP3007357B2 (ja) | 音声認識装置の辞書更新方式 | |
| JPH0754434B2 (ja) | 音声認識装置 | |
| KR100523905B1 (ko) | 이중화된 검출조건을 이용한 음성 추출 방법 | |
| JPH01116599A (ja) | 音声認識方式 | |
| JPS62141595A (ja) | 音声検出方式 | |
| JPH01116598A (ja) | 音声認識方式 | |
| JPH0619491A (ja) | 音声認識装置 | |
| JPS59124397A (ja) | 無音区間検出回路 | |
| JPH06105400B2 (ja) | 音声認識方式 | |
| JPH0752354B2 (ja) | 音声認識装置 |