JPH096384A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH096384A
JPH096384A JP15373695A JP15373695A JPH096384A JP H096384 A JPH096384 A JP H096384A JP 15373695 A JP15373695 A JP 15373695A JP 15373695 A JP15373695 A JP 15373695A JP H096384 A JPH096384 A JP H096384A
Authority
JP
Japan
Prior art keywords
likelihood
frame
threshold
value
equal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP15373695A
Other languages
English (en)
Other versions
JP2979999B2 (ja
Inventor
優 ▲高▼野
Masaru Takano
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7153736A priority Critical patent/JP2979999B2/ja
Publication of JPH096384A publication Critical patent/JPH096384A/ja
Application granted granted Critical
Publication of JP2979999B2 publication Critical patent/JP2979999B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 発声中から特定単語を検出するワードスポッ
ティング装置において、候補単語の尤度の経時変化の不
安定さを低減し、より頑健な単語検出を行う。 【構成】 音声検出部101で入力音声の周波数分析を
行い、フレーム毎の特徴ベクトルを抽出する。尤度計算
部102で特徴ベクトルの時系列と音韻辞書104,単
語辞書105とのマッチングを行い、各フレーム毎の各
候補単語の尤度を算出する。オートマトン部106で各
フレーム毎の尤度を修正する。この場合、現フレームと
過去のフレームの少なくとも1つのフレームとの尤度に
従って、現フレーム尤度を修正する。これにより、尤度
の経時変化の不安定性が解消される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声認識装置に関し、特
に発声中から一定時間(フレーム)毎の特定単語の尤度
を算出してこの算出尤度を基準としてこの特定単語の検
出を行うワードスポッティング装置に関するものであ
る。
【0002】
【従来の技術】従来、発声中から特定単語を検出する技
術として、電子通信学会論文誌,‘84/10,Vo
l.J67−D No.10のp.1242〜1249
の「拡張連続DP法による連続音声認識アルゴリズム」
(中川 聖一)に記載の方法があり、ワードスポッティ
ング装置として知られている。
【0003】図8はこのワードスポッティング装置の概
要を示すブロック図であり、発声中から音声分析部10
1にて音声分析を行い、フレーム毎の特定単語の尤度を
そのまま検出基準値として用い結果出力部103にて検
出閾値との比較により検出を行うようになっている。
尚、尤度計算部102は音韻辞書104や単語辞書10
5等を参照して各フレーム毎の尤度算出を行う。
【0004】この方式では、フレーム毎の独立に算出さ
れる尤度をそのまま用いて検出基準値とし、所定の検出
閾値との比較により検出を行うようになっている。
【0005】
【発明が解決しようとする課題】この様な従来の方式で
は、フレーム単位の尤度をそのまま検出値として用いる
ようになっているので、尤度が不安定な経時変化をする
様な単語に対しては、尤度が検出閾値の周辺で上下を繰
返す場合に同一単語が続けて複数回検出されてしまう恐
れがあり、また、一瞬の尤度上昇により誤検出を引起こ
してしまうという問題もある。
【0006】本発明の目的は、フレーム単位の尤度をそ
のまま検出基準値として用いることによる弊害を少なく
して候補単語の尤度の経時変化の不安定さを低減し、よ
り頑健な単語検出が行えるようにした音声認識装置を提
供することである。
【0007】
【課題を解決するための手段】本発明によれば、発声中
から一定時間(フレーム)毎の特定単語の尤度を算出し
てこの算出尤度を基準として前記特定単語の検出を行う
音声認識装置であって、各フレーム毎の尤度を、現在フ
レームにおける尤度と過去の少なくとも1つのフレーム
の尤度とに基づき修正して導出する尤度修正手段を含む
ことを特徴とする音声認識装置が得られる。
【0008】
【作用】各フレーム毎の尤度を独立に用いるのではな
く、現在フレームの尤度と過去の少なくとも1つのフレ
ームの尤度とを参照して尤度の経時変化の不安定さを低
減するものである。
【0009】
【実施例】以下、図面を用いて本発明の実施例を説明す
る。
【0010】図1は本発明の実施例の概略ブロック図で
あり、図8と同等部分は同一符号にて示している。図1
において、音声分析部101は入力された音声の周波数
分析を行い、その一定時間(フレーム同期)毎の特徴ベ
クトルの抽出を行う。尤度計算部102は音声分析部1
01からの特徴ベクトルの時系列と、音韻辞書104及
び単語辞書105とのマッチングを行うことにより、各
フレーム周期毎の各候補単語の尤度を計算し、オートマ
トン部106へ出力する。
【0011】オートマトン部106は尤度計算部102
より出力された尤度を受け取り、各フレーム周期毎の各
候補単語の尤度を修正し、出力部103へ出力する。こ
の出力部103は各候補単語の尤度を受け取り、予め定
められた閾値との比較を行って各フレーム周期毎に閾値
を越える尤度を有する単語の検出単語として出力するも
のである。
【0012】従来の図8との差異は、オートマトン部1
06により尤度計算部102で算出された尤度を修正す
る点であり、以下にこのオートマトン部106における
尤度修正の実施例について説明する。ここで示すオート
マトン部106は尤度計算部102から出力されるフレ
ーム毎の尤度を入力尤度として受け取り、尤度を受け取
る毎に各件判定により状態遷移を行い、続いて各件成立
時の処理を行うものとする。
【0013】図2は第1の実施例を示す図であり、この
例のオートマトンは初期状態がs1であるオートマトン
で、状態s1において入力された尤度はそのまま出力さ
れる。この時、尤度がB(検出閾値)以上ならば、状態
s2に遷移し、そうでない時は状態s1にとどまる。状
態s2は直前フレームの尤度がB以上である状態で、こ
こで入力尤度がB以上のうちは状態s2にとどまりB未
満の修正尤度を出力し続ける。そうでない時は、入力尤
度をそのまま修正尤度とし出力し、状態s1に戻る。
【0014】このオートマトンでは、現在フレームにお
ける尤度とその直前のフレームにおける尤度が共に検出
閾値を越える時のみ、検出閾値未満のある値を修正尤度
として出力する。それ以外の場合は現在フレームの尤度
をそのまま出力する。このオートマトンを用いて出力さ
れる修正尤度は、入力尤度が検出閾値未満から検出閾値
以上へ上昇したフレームに限り、検出閾値以上となる。
また、最初のフレームの尤度が検出閾値以上の場合は、
この尤度を出力する。
【0015】この様な修正尤度を用いることにより、同
一の単語が連続する数フレームの間検出され続けるとい
う現象が起こるのを防ぐことができる。
【0016】尚、図2の遷移2における修正尤度として
のB未満の値は、Bより小なる値であれば、極端にいえ
ば−∞でも良いが、実際的ではないので、例えば“B−
1,0”の値を修正尤度として出力するようにしても良
い。
【0017】この図2に示したオートマトンを用いる場
合、検出回数を下げる目的で検出閾値を図3に示す如く
BからB′(B′>B)へ上げると、Bの時は検出回数
がt1のみであったのが、B′の時はt2〜t4と逆に
検出回数が増えることがある。そこで、図4に示す第2
の実施例が考えられる。
【0018】図4に示すオートマトンにおいては図2の
オートマトンの状態s2における動作が異なっている。
本オートマトンの状態s2では、入力尤度がB2(B2
<B)以上の時はそのままs2にとどまり、B未満の値
を修正尤度として出力する。そうでない時は、入力尤度
をそのまま修正尤度とし出力、状態s1に戻る。B2は
検出有効化閾値である。
【0019】このオートマトンでは、検出閾値の他に検
出閾値未満の検出有効化閾値を定め、一度検出閾値を下
回っても、一旦検出有効化閾値を下回るまでは、検出閾
値を越える尤度を出力しない。これにより、尤度が検出
有効化閾値以上に留まっているうちは、複数回の検出は
行われない。よって、図5に示す如く検出閾値を上げて
も、検出有効化閾値を元の検出閾値と同一値に設定する
ことにより、検出回数が増える現象を防ぐことができ
る。
【0020】換言すれば、現在フレームの算出尤度が検
出閾値B以上であり、過去のフレームにおいてB以上の
尤度が出力されていない場合であってBよりも小なる検
出有効化閾値B2を下回る尤度を出力したフレームが直
前のフレーム以前に存在してそれ以降直前のフレームま
でB以上の尤度を出力したフレームが存在しない限りB
以上の値を修正尤度(例えば、現フレームの尤度Lf)
とし、それ以外の場合はB未満の値を修正尤度として導
出するようにしたものである。
【0021】図6は第3の実施例を示すものであり、図
6のオートマトンは初期状態がs1であるオートマトン
で、入力尤度がB未満の時は状態s1にとどまり、検出
閾値未満の値(本例ではLf)を修正尤度として検出閾
値未満の値を出力する。
【0022】状態s2においては、入力尤度がB以上の
場合にはそのままとどまる。この時、状態s2に過去n
フレーム以上とどまっている場合に限り、検出閾値以上
の値(本例ではLf)を修正尤度として出力し、そうで
ない場合には検出閾値未満の値を修正尤度として出力す
る。状態s2において入力尤度がB未満の場合には、状
態s1に戻り、検出閾値未満の値を修正尤度として出力
する。
【0023】このオートマトンでは、過去nフレームの
間の尤度が全て検出閾値以上である時のみ、検出閾値以
上の値を出力する。このオートマトンにより、本来検出
すべきでない単語の一瞬の尤度上昇による誤検出を減ら
すことができる。
【0024】図7は第4の実施例を示す図であり、この
図7に示すオートマトンは初期状態がs1であるオート
マトンであって、第nフレームに達するまではs1にと
どまり、現在フレームを含む過去の全フレームの尤度の
平均値を出力し続ける。第nフレームに達すると、現在
フレームを含む過去nフレームの尤度の平均値を出力
し、s2に遷移する。以後s2にとどまり続け、各フレ
ーム毎に現在フレームを含む過去nフレームの尤度の平
均値を出力するものである。
【0025】こうすることにより、出力される修正尤度
は現在フレームを含む過去nフレームにおける尤度の重
み付け平均値となり、よって候補単語の尤度が平滑化さ
れ、本来検出すべきでない単語の一瞬の尤度上昇による
誤検出の確率を低減できることになる。
【0026】
【発明の効果】以上述べた如く、本発明によれば、現フ
レームの算出尤度を現フレームと過去の少なくとも1つ
のフレームとの尤度に応じて修正して出力する様にした
ので、候補単語の尤度の経時変化の不安定さを低減し、
より頑健な単語検出を行うことが可能なワードスポッテ
ィング装置を構成できるという効果がある。
【図面の簡単な説明】
【図1】本発明の実施例のワードスポッティングの概略
システム図である。
【図2】図1のオートマトン部106の一実施例を説明
する図である。
【図3】図2の実施例の問題点を説明するための図であ
る。
【図4】図1のオートマトン部106の他の実施例を説
明する図である。
【図5】図4の実施例の効果を説明するための図であ
る。
【図6】図1のオートマトン部106の更に他の実施例
を説明する図である。
【図7】図1のオートマトン部106の別の実施例を説
明する図である。
【図8】従来のワードスポッティング装置の概略システ
ム図である。
【符号の説明】
101 音声分析部 102 尤度計算部 103 結果出力部 104 音韻辞書 105 単語辞書 106 オートマトン部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 発声中から一定時間(フレーム)毎の特
    定単語の尤度を算出してこの算出尤度を基準として前記
    特定単語の検出を行う音声認識装置であって、各フレー
    ム毎の尤度を、現在フレームにおける尤度と過去の少な
    くとも1つのフレームの尤度とに基づき修正して導出す
    る尤度修正手段を含むことを特徴とする音声認識装置。
  2. 【請求項2】 前記尤度修正手段は、現在フレーム及び
    その直前のフレームの尤度が共に所定閾値以上の場合に
    は前記閾値未満の尤度を修正尤度として導出し、それ以
    外の場合には現在レームの尤度を修正尤度として導出す
    るようにしたことを特徴とする請求項1記載の音声認識
    装置。
  3. 【請求項3】 最初のフレームの尤度が前記閾値以上の
    場合には当該尤度を修正尤度として導出するようにした
    ことを特徴とする請求項2記載の音声認識装置。
  4. 【請求項4】 前記尤度修正手段は、現在フレームの算
    出尤度が第1の閾値以上であり、過去のフレームにおい
    て前記第1の閾値以上の尤度が出力されていない場合で
    あって前記第1の閾値よりも小なる第2の閾値を下回る
    尤度を出力したフレームが直前のフレーム以前に存在し
    てそれ以降前記直前のフレームまで前記第1の閾値以上
    の尤度を出力したフレームが存在しない限り前記第1の
    閾値以上の値を修正尤度とし、それ以外の場合は前記第
    1の閾値未満の値を修正尤度として導出するようにした
    ことを特徴とする請求項1記載の音声認識装置。
  5. 【請求項5】 前記尤度修正手段は、現在フレームを含
    む過去の一定数のフレームにおける尤度が全て所定閾値
    以上の場合に限り、前記閾値以上の値を修正尤度として
    導出し、それ以外の場合は、前記閾値未満の値を修正尤
    度して導出するようにしたことを特徴とする請求項1記
    載の音声認識装置。
  6. 【請求項6】 前記尤度修正手段は、現在フレームを含
    む過去の一定数のフレームにおける尤度の重み付け平均
    値を前記現在フレームの修正尤度として導出するように
    したことを特徴とする請求項1記載の音声認識装置。
JP7153736A 1995-06-21 1995-06-21 音声認識装置 Expired - Fee Related JP2979999B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7153736A JP2979999B2 (ja) 1995-06-21 1995-06-21 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7153736A JP2979999B2 (ja) 1995-06-21 1995-06-21 音声認識装置

Publications (2)

Publication Number Publication Date
JPH096384A true JPH096384A (ja) 1997-01-10
JP2979999B2 JP2979999B2 (ja) 1999-11-22

Family

ID=15568982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7153736A Expired - Fee Related JP2979999B2 (ja) 1995-06-21 1995-06-21 音声認識装置

Country Status (1)

Country Link
JP (1) JP2979999B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009097738A1 (zh) * 2008-01-30 2009-08-13 Institute Of Computing Technology, Chinese Academy Of Sciences 一种音频匹配方法及系统
JP2018116206A (ja) * 2017-01-20 2018-07-26 アルパイン株式会社 音声認識装置、音声認識方法及び音声認識システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009097738A1 (zh) * 2008-01-30 2009-08-13 Institute Of Computing Technology, Chinese Academy Of Sciences 一种音频匹配方法及系统
JP2018116206A (ja) * 2017-01-20 2018-07-26 アルパイン株式会社 音声認識装置、音声認識方法及び音声認識システム

Also Published As

Publication number Publication date
JP2979999B2 (ja) 1999-11-22

Similar Documents

Publication Publication Date Title
US7447634B2 (en) Speech recognizing apparatus having optimal phoneme series comparing unit and speech recognizing method
US5621849A (en) Voice recognizing method and apparatus
US6134527A (en) Method of testing a vocabulary word being enrolled in a speech recognition system
JPH04255900A (ja) 音声認識装置
JPH096394A (ja) 音声認識装置及び音声認識方法
JP2969862B2 (ja) 音声認識装置
US5040213A (en) Method of renewing reference pattern stored in dictionary
JP4393648B2 (ja) 音声認識装置
JPH10254475A (ja) 音声認識方法
JPH096384A (ja) 音声認識装置
KR20060057921A (ko) 대화형 음성인식 시스템의 인식오류 수정장치 및 그 방법
JPH0792989A (ja) 音声認識方法
KR101529918B1 (ko) 다중 스레드를 이용한 음성 인식 장치 및 그 방법
JP2002073061A (ja) 音声認識装置及びその方法
JP3008593B2 (ja) 音声認識装置
JP3006496B2 (ja) 音声認識装置
JPH0619491A (ja) 音声認識装置
JP2001067092A (ja) 音声検出装置
CN114120968B (zh) 语音实时识别结果边界缓冲修正方法及装置
WO2003085638A1 (en) Pattern recognition
JPH04152397A (ja) 音声認識装置
JPH02198499A (ja) 音声認識装置の辞書の自動更新システム
JPH06250687A (ja) 不特定話者用音声認識装置
JPH0627992A (ja) 音声認識装置
JPH02293798A (ja) 音声認識装置の辞書更新方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees