JPH01116597A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPH01116597A
JPH01116597A JP62274065A JP27406587A JPH01116597A JP H01116597 A JPH01116597 A JP H01116597A JP 62274065 A JP62274065 A JP 62274065A JP 27406587 A JP27406587 A JP 27406587A JP H01116597 A JPH01116597 A JP H01116597A
Authority
JP
Japan
Prior art keywords
section
distance
pattern
evaluation distance
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62274065A
Other languages
English (en)
Inventor
Yuichiro Fujihashi
藤橋 勇一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62274065A priority Critical patent/JPH01116597A/ja
Publication of JPH01116597A publication Critical patent/JPH01116597A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は音声認識方式に関し、特に各時間毎に入力パタ
ーンの終端点を時間方向にシフトしながらパターンマツ
チングを行い標準パターンとの距離を算出し、各時間ご
との距離を評価して認識結果を判定する音声認識方式に
関する。
従来技術 従来、この種の音声認識方式の!認識結果判定部では、
評価距離が評価距離同値を継続時間同値以上継続して下
回っている区間の中で、最小の評価距離を認識結果判定
スコアとし、全標準パターンの中で最小のスコアを持つ
標準パターンを認識結果としていた。
上述した従来の音声認識方式のg識結果判定部では、評
価距離が評価距離閾値を継続時間同値以上継続して下回
っている区間の中で最小の評価距離を単純に認識結果判
定のスコアとし、全標準パターンの中で最小のスコアを
持つ標準パターンを認識結果としていたため誤認識をす
ることがあり、正しいi!!!結果を得られないという
欠点があった。
11立亘濃 本発明の目的は正確な認識結果を得ることが可能な音声
g識方式を提供することである。
1JJと1感 本発明によれば、音声認識結果を判定する方法において
、時系列データである評価距離に対して評価距離同値と
継続時間閾値とを設け、評価距離が評価距離閾値を継続
時間閾値以上継続して下回る区間を谷区間とし、谷区間
の開始点から谷区間の中で評価距離が最小である最下点
までの時間を谷区間半値幅とし、評価距離閾値から最下
点の評価距離を減じた値を谷区間深さとし、この谷区間
深さに前記谷区間半値幅を乗じた値を判定のためのスコ
アとして算出し、全標準パターンと比較してスコアが最
も大きい標準パターンを認識結果とすることにより正確
な認識結果を得ることができ、誤[を少なくすることが
できる音声認識方式が得られる。
実施例 次に、図面を参照して本発明の実施例について説明する
第1図は本発明の一実施例のブロック図である。
本発明による実施例は、音声分析部1、標準パターン部
2、パターンマツチング部3、認識結果判定部4より構
成される。
入力音声10は音声分析部1に入力され、特徴パターン
に分析され、入力パターン11としてパターンマツチン
グ部3に入力される。パターンマツチング部3は標準パ
ターン部2から標準パターン12を読出し、入力パター
ン11とパターンマツチングを毎フレーム行いパターン
間距離を算出し、これを評価距離13として認識結果判
定部4に出力する。
尚、パターンマツチングはフレーム毎に入力パターンの
終端点を前フレームの時の終端点よりも1フレーム後に
シフトしてから行う。 パターンマツチングの方法は、
特に限定されないが、本実施例では始点フリーDPマツ
チングの例について説明する。第2図は始端フリーDP
マツチング法を用いた場合のパターンマツチングのDP
ババス容領域を示す図であり、第3図に示すDPパスを
用いている。第2図、第3図とも横軸が入力パターンの
フレーム、縦軸が標準パターンのフレームであり、iが
入力パターンのフレーム、jが標準パターンのフレーム
を示す。
始端フリーDPマツチング法とは、終端点に至るDPマ
ツチング経路のうち最小のパターン距離を与えるものを
始端点を限定しないで求める方法であり、第2図に示し
た1例は入力パターンのフレーム■を終端点としたとき
、IslからlS2の門のいずれかのフレームが始端点
となることを示している。また、フレーム毎に入力パタ
ーンの終端点をシフトしてパターンマツチングを行うと
いうことは、第2図に示したパターンマツチングのDP
ババス容領域を横軸iの方向にスライドさせたことを意
味する。
次に第4図を参照して認識結果判定部4の動作について
説明する。評価距離13は入力フレーム毎に算出される
ため、第4図に示す様な入力フレームに対する時系列デ
ータとなる。ここに、第4図の横軸は入力フレーム、縦
軸は評価距離である。
認識結果判定部4では、評価距離13に対する閾値とし
て第4図に示す様な評価距離間1i1121と、継続性
に対する閾値として継続性閾値とを設け、評価距離13
が評価距離閾値21を継続時間閾値以上継続して下回っ
ている区間を谷区間とし1谷区間の開始点から谷区間の
中で評価距離が最小である最下点までの時間を谷区間半
値幅として求める。
次に、評価距離21から最下点評価距離を減じた値を算
出し谷区間深さとする。更に、谷区間深さに谷区間半値
幅を乗じた値を判定スコアとして算出し、全ての標準パ
ターンの判定スコアと比較して判定スコアが最も大きい
標準パターンを認識結果14として選択し、出力する。
すなわち、判定スコアは次の式により算出される。
(判定スコア)− (谷区間深さ)×(谷区間半値幅) 従って、第4図(a)、(b)の最下点評価距離はそれ
ぞれ22.25で示した値となり、谷区間半値幅はそれ
ぞれ23.26で示した区間の長さとなり、谷区間深さ
はそれぞれ24.27で示した値となる。第4図に示し
た例は同じ入力パターンに対する2つの標準パターンと
の評価距離を示したものである。第4図(a)は正解標
準パターンとの評価距離のグラフであり、(b)は誤認
識標準パターンとの評1illi21!離のグラフであ
る。
従来から用いられている方式の様に、最下点評価距離が
最小である標準パターンを誤認識結果として選択した場
合、(b)の最下点評価距離25が(a)の最下点評価
距離22によりわずかであるが小さいため、(b)が認
識結果として選択され誤認識となってしまう。
一方、上述の本実施例で示した判定スコアを用いた場合
、第4図(a)と(b)の谷区間深さ24.27はほと
んど同じであるが、(a)の谷区間半値幅23が(b)
の谷区間半値幅26よる大であるため、(a)の正解標
準パターンの判定スコアの方が大きくなり、(a)が認
識結果として選択され、従来方式で発生した誤認識を除
去し、正しい認識結果が得らえる。
発明の効果 畝上の如く、本発明によれば、パターン間の評価距離の
最小値ではなく、本発明による判定スコアが最も大きい
標準パターンを認識結果とすることによって、正確な認
識結果を得ることができ、誤認識を少なくすることがで
きるという効果がある。
【図面の簡単な説明】
第1図は本発明の実施例のブロック図、第2図はパター
ンマツチングのDPパス許容領域を示す図、第3図はD
Pパスを示す図、第4図(a)は正解標準パターンと評
価距離とのグラフ、第4図(b)は誤認識標準パターン
と評価距離とのグラフである。 主要部分の符号の説明 1・・・・・・音声分析部 2・・・・・・標準パターン部 3・・・・・・パターンマツチング部 4・・・・・・認識結果判定部 21・・・・・・評価距11m箇 22.25・・・・・・最下点評価距離23.26・・
・・・・谷区間半値幅 24.27・・・・・・谷区間深さ

Claims (2)

    【特許請求の範囲】
  1. (1)認識対象の単語又は音韻の特徴パターンを標準パ
    ターンとして記憶しておく標準パターン部と、入力音声
    の分析を定められたフレーム周期毎に行い入力音声の特
    徴パターンである入力パターンを出力する音声分析部と
    、前記標準パターンと前記入力パターンとのマッチング
    を行い、評価距離を算出するパターンマッチング部と、
    評価距離に基づいて認識結果を判定する認識結果判定部
    とを具備し、前記パターンマッチング部では、前記入力
    パターンのフレーム毎に入力パターンの終端点を1フレ
    ームづつ後にシフトしてパターンマッチングを行い、評
    価距離としてパターン間距離を毎フレーム算出し、時系
    列データとして評価距離を前記認識結果判定部へ出力す
    るようにした音声認識方式であって、前記認識結果判定
    部では、時系列データである前記評価距離に対して評価
    距離閾値と継続時間閾値とを設け、前記評価距離が前記
    評価距離閾値を前記継続時間閾値以上継続して下回つて
    いる区間を谷区間とし、この谷区間の開始点から谷区間
    の中で評価距離が最小である最下点までの時間を谷区間
    半値幅とし、前記評価距離閾値から最下点の評価距離を
    減じた値を谷区間深さとし、この谷区間深さに前記谷区
    間半値幅を乗じた値を判定のためのスコアとして算出し
    、全標準パターンのスコアと比較してスコアが最も大き
    い標準パターンを認識結果とすることを特徴とする音声
    認識方式。
  2. (2)前記パターンマッチング部において、パターンマ
    ッチングの方法として始端フリーDPマッチング法を用
    いることを特徴とする特許請求の範囲第1項の音声認識
    方式。
JP62274065A 1987-10-29 1987-10-29 音声認識方式 Pending JPH01116597A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62274065A JPH01116597A (ja) 1987-10-29 1987-10-29 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62274065A JPH01116597A (ja) 1987-10-29 1987-10-29 音声認識方式

Publications (1)

Publication Number Publication Date
JPH01116597A true JPH01116597A (ja) 1989-05-09

Family

ID=17536481

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62274065A Pending JPH01116597A (ja) 1987-10-29 1987-10-29 音声認識方式

Country Status (1)

Country Link
JP (1) JPH01116597A (ja)

Similar Documents

Publication Publication Date Title
JP5299436B2 (ja) 音声検出装置、音声検出プログラムおよびパラメータ調整方法
JPH0443279B2 (ja)
US7593847B2 (en) Pitch detection method and apparatus
CN113611330A (zh) 一种音频检测方法、装置、电子设备及存储介质
JPH01116597A (ja) 音声認識方式
JPH01116599A (ja) 音声認識方式
JPH01116598A (ja) 音声認識方式
JP3091537B2 (ja) 音声パターン作成方法
JPH01200293A (ja) 音声認識方式
JPH06105400B2 (ja) 音声認識方式
JPS6242198A (ja) 音声認識装置
JPH0222399B2 (ja)
JPH06105399B2 (ja) 音声認識方式
JPH08146996A (ja) 音声認識装置
JP3061292B2 (ja) アクセント句境界検出装置
JPS62141595A (ja) 音声検出方式
JP3007357B2 (ja) 音声認識装置の辞書更新方式
JPS61128300A (ja) ピツチ抽出装置
JPS61292199A (ja) 音声認識装置
Scagliola et al. Two novel algorithms for variable frame analysis and word matching for connected word recognition
JPS59149400A (ja) 音声入力装置
JPH0690635B2 (ja) ピツチエラ−修正方法
JPH06110491A (ja) 音声認識装置
JPH0981190A (ja) ニューラルネットワークの学習方法および音声認識装置
JPS62237498A (ja) 音声区間検出方法