JPH01200293A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPH01200293A
JPH01200293A JP63024382A JP2438288A JPH01200293A JP H01200293 A JPH01200293 A JP H01200293A JP 63024382 A JP63024382 A JP 63024382A JP 2438288 A JP2438288 A JP 2438288A JP H01200293 A JPH01200293 A JP H01200293A
Authority
JP
Japan
Prior art keywords
pattern
evaluation distance
value
input
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63024382A
Other languages
English (en)
Other versions
JP2748383B2 (ja
Inventor
Yuichiro Fujihashi
藤橋 勇一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63024382A priority Critical patent/JP2748383B2/ja
Publication of JPH01200293A publication Critical patent/JPH01200293A/ja
Application granted granted Critical
Publication of JP2748383B2 publication Critical patent/JP2748383B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 支血欠1 本発明は音声認識方式に関し、特に各時間毎に入力パタ
ーンの終端点を時間方向にシフトしながらパターンマツ
チングを行い、標準パターンとの距離を算出し、各時間
毎の距離を評価して認識結果を判定する音声認識方式に
関する。
従来技術 従来、この種の音声認識方式においては、認識判定部で
用いる評価距離閾値は固定値となっている。上述した従
来の音声認識方式における認識結果判定部では評価距離
間値が固定値であるために、話者に適した閾値を設定す
ることができないことから、誤認識となることがあり、
正しい認識結果を得られないという欠点かある。
発明の目的 本発明は話者に適した閾値を設定するようにしして、正
しい認識結果が得られるようにした音声3.2織方式を
提供することを目的としている。
発明の構成 本発明は、時系列データである評価距離に対して評価距
離閾値と継続時間閾値を設け、音声認識結果を判定する
方法において、入力開始から定められたフレーム目の評
価距離の値から定められた係数値を減じた値を評価距離
間値として適応的に算出することにより話者に敵した評
価距離閾値を設定することかでき、よって正確な認識結
果を得ることができるものである。
実施例 次に、図面を参照して本発明の実施例について説明する
第1図は本発明の一実施例のブロック図である。
音声分析部1、標準パターン部2、パターンマツチング
部3、認識結果判定部4より構成されいる。
入力音声10は、音声分析部1に入力されて特徴パター
ンに分析され、入力パターン11としてパターンマツチ
ング部3に入力される。パターンマツチング部3は標準
パターン部2から標準パターン12を読出し、入力パタ
ーン11とパターンマツチングを毎フレーム行いパター
ン間距離を算出し、評価距離13として認識結果判定部
4に出力する。尚、パターンマツチングはフレーム毎に
、入力パターンの終端点を前フレームの時の終端点より
も1フレーム後ろにシフトしてから行う。
パターンマツチングの方法は始端フリーDPマツチング
法として以下に説明するが、これに限定されない、第2
図は女台端フリーDPマツチングを用いた時のパターン
マツチングのDPパス許容領域を示す図であり、第3図
に示すDPババス用いている。第2図、第3図とも横軸
が入力パターンのフレーム、縦軸が標準パターンのフレ
ームであり、iは入力パターンのフレーム、jは標準パ
ターンのフレームを示す。
始端フリーDPマツチング法とは終端点に至るDPマツ
チング経路のうち最少のパターン間距離を与えるものを
始端点を限定しないで求める方法であり、第2図に示し
た例は、入力パターンのフレームIを終端点とした時、
IS、からIS2のいづれかのフレームが始端点となる
ことを示している。又、フレーム毎に入力パターンの終
端点をシフトしてパターンマツチングを行うことは、第
2図で示したDPパスの許容領域が横軸iの方向のスラ
イドしたことを意味する。
次に、第4図を参照して認識結果判定部4について説明
する。評価距離13は入力フレーム毎に算出されるため
、第4図に示す様な入力フレームに対する時系列データ
となる。第4図の横軸は入力フレーム、縦軸は評価距離
である。第4図(a)、(b)、(c)、(d)はそれ
ぞれ話者A、B。
C,Dの評価距離のグラフである。
認識結果判定部4では、第4図に示す様な評価距離閾値
算出フレーム20と評価距離閾値算出用係数21とを定
め、次の式で適応評価距離閾値を算出する。本実施例で
は、評価距離閾値算出フレームを25、評価距離閾値算
出用係数を100としている。
適応評価距離間値 一評価距離閾値算出フレームの評価距^i−評価距離閾
値算出用係数 このようにして適応評価距離間値は算出され、第4 (
a)、(b)、(c)、(d)の22.23.24.2
5に示すように話者に応じて#適な値となる。継続性に
対する閾値として継続性閾値を設け、評価距離13が適
応評価距離間値22゜23.24.25を継続して下回
っている区間の時間が継続時間閾値以上であるかを判定
し、継続時間閾値以上である区間を谷区間とする0本実
施例では、谷区間の最下点の評価距離を判定スコアーと
して用いる。但し、判定スコアーとして何を用いるかは
特に限定されていない。
このようにして、全ての標準パターンとの判定スコアー
を求め、判定スコアーが最も小さい標準パターンを認識
結果14として選択して出力する。
第4図(a)、(b)、(c)、(d)に示した例から
明らかなように、話者によって評価距離の動き方が異な
り、評価「E離間値を固定値とした場合、全話者に適し
た値を求めることは難しくなってしまう0例えば、話者
Aと話者りを比較した場合、話者りに適した評価距離間
値は約650であるが、話者Aには大きすぎた値となり
、誤認識を招いてしまう。
一方、上述の本実施例で示した適応評価距離閾値22.
23,24.25を用いることにより、第4図(a)、
(b)、(c)、(d)から明らかなように各話者に適
した評価距離閾値が設定され、従来方式で発生した誤認
識を除去し、正しい誤認識を得ることができる。
発明の効果 本発明によれば、固定評価距M間値を評価距離の判定に
用いるのではなく、入力音声に適した適応評価の判定に
用いるのではなく、入力音声に適した適応評価距離閾値
を用いるようにしているので、正確な認識結果を得るこ
とができ、よって誤認識を少なくできるという効果があ
る。
【図面の簡単な説明】
第1図は本発明の実施例のブロック図、第2図は始端フ
リーDPマツチングにおけるDPパスの許容領域を示す
図、第3図は始端フリーDPマツチングにおけるDPパ
スを示す図、第4図(a)〜(d)は話者A〜Dの各評
価「1離のグラフである。 主要部分の符号の説明 1・・・・・・音声分析部 2・・・・・・標準パターン部 3・・・・・・パターンマッチンク部 4・・・・・・認識結果判定部

Claims (1)

    【特許請求の範囲】
  1. (1)認識対象の単語又は音韻の特徴パターンを標準パ
    ターンとして記憶しておく標準パターン部と、入力音声
    の分析を定められたフレーム周期毎に行い、入力音声の
    特徴パターンである入力パターンを出力する音声分析部
    と、標準パターンと入力パターンとのマッチングを行い
    、評価距離を算出するパターンマッチング部と、評価距
    離に基づいて認識結果を判定する認識結果判定部とを具
    備し、前記パターンマッチング部において入力パターン
    のフレーム毎に入力パターンの終端点を1フレームづつ
    後にシフトしてパターンマッチングを行い、評価距離と
    してパターン間距離を毎フレーム算出し、時系列データ
    として評価距離を前記認識結果判定部へ出力し、この認
    識結果判定部において時系列データである評価距離に対
    して評価距離間値と継続時間閾値を設け、認識結果を判
    定する音声認識方式であって、入力開始から定められた
    フレーム目の評価距離の値から定められた係数値を減じ
    た値を該評価距離閾値として適応的に算出することを特
    徴とする音声認識方式。
JP63024382A 1988-02-04 1988-02-04 音声認識方式 Expired - Lifetime JP2748383B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63024382A JP2748383B2 (ja) 1988-02-04 1988-02-04 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63024382A JP2748383B2 (ja) 1988-02-04 1988-02-04 音声認識方式

Publications (2)

Publication Number Publication Date
JPH01200293A true JPH01200293A (ja) 1989-08-11
JP2748383B2 JP2748383B2 (ja) 1998-05-06

Family

ID=12136632

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63024382A Expired - Lifetime JP2748383B2 (ja) 1988-02-04 1988-02-04 音声認識方式

Country Status (1)

Country Link
JP (1) JP2748383B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2980420B2 (ja) 1991-07-26 1999-11-22 富士通株式会社 動的計画法照合装置

Also Published As

Publication number Publication date
JP2748383B2 (ja) 1998-05-06

Similar Documents

Publication Publication Date Title
US9002709B2 (en) Voice recognition system and voice recognition method
JPS58140798A (ja) 音声ピツチ抽出方法
JP3069531B2 (ja) 音声認識方法
JPWO2003107326A1 (ja) 音声認識方法及びその装置
JPH01200293A (ja) 音声認識方式
JPH0792989A (ja) 音声認識方法
JPS60114900A (ja) 有音・無音判定法
JP3091537B2 (ja) 音声パターン作成方法
JP3011421B2 (ja) 音声認識装置
JPH02125298A (ja) 音声認識方式
JPS6147437B2 (ja)
JPH09258765A (ja) 音声認識のための音声区間始端補正方法及び装置並びに音声認識方法
JP2737109B2 (ja) 音声区間検出方式
JPH0546196A (ja) 音声認識装置
JPH01116597A (ja) 音声認識方式
JP3007357B2 (ja) 音声認識装置の辞書更新方式
JPH0754434B2 (ja) 音声認識装置
KR100523905B1 (ko) 이중화된 검출조건을 이용한 음성 추출 방법
JPH01116599A (ja) 音声認識方式
JPS62141595A (ja) 音声検出方式
JPH01116598A (ja) 音声認識方式
JPH0619491A (ja) 音声認識装置
JPS59124397A (ja) 無音区間検出回路
JPH06105400B2 (ja) 音声認識方式
JPH0752354B2 (ja) 音声認識装置