JPS62289895A

JPS62289895A - 音声認識方法

Info

Publication number: JPS62289895A
Application number: JP61132676A
Authority: JP
Inventors: 陽一山田; 高橋　圭子
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1986-06-10
Filing date: 1986-06-10
Publication date: 1987-12-16
Anticipated expiration: 2010-04-10
Also published as: JPH0731506B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】３、発明の詳細な説明（産業上の利用分野）この発明は音声認識方法、特に音声認識に際してのロー
カルピーク抽出方法に関する。

（従来の技術）音声認識を行うに際し、入力音声の母音定常部の特徴を
安定及び正確に抽出することは認識性能を向上させるた
めに非常に大切なことである。それは、人間が発声する
音声の中で母音定常部が時間的に占める割合が、子音又
は母音から母音へ、或いは、母音から子音等へ遷移する
部分である過渡部（非定常部）に比較して、大であるこ
と、また、継続時間が比較的大であるので、発声タイミ
ング等の影響によるバラツキが小さく安定に特徴を抽出
することが出来ることにより、母音定常部の特徴を主体
として利用する認識方式が有効であるという理由による
。

従来装置において母音定常部の特徴抽出のために使用し
て有効な方法としてローカルピーク抽出の方法が提案さ
れてる。この方法は母音定常部のホルマント周波数帯域
を検出しようとする方法である。

第３図（Ａ）〜（Ｃ）はこの方法を説明するための図で
ある。この方法によれば、Ａ／Ｄ変換された入力音声信
号に対し、中心周波数（各中心周波数に対応するチャネ
ル番号ｋ（ｋは正の整数）が付しである）の異なるバン
ドパスフィルタによる周波数分析及び対数変換を順次に
行った後得られた周波数スペクトルを算出しく第３図（
Ａ））、これら周波数スペクトルからこれらスペクトル
の最小二乗直線を減じてスペクトルの正規化を行い（第
３図（Ｂ））、正規化スペクトルの値が「Ｏ」より大と
なるチャネルの中で出力信号の値が極大となるチャネル
のローカルシビークイ直を「１」　とし、残りのチャネ
ルのローカルピーク値を全て「０」と設定する１ビツト
特微量としてローカルピークパタンを抽出している（第
３図（Ｃ））。従って、この方法では特徴量の圧縮効果
をもたらすことが出来るので、認識方法を小規模なハー
ドｌで実現する際にも有効である。

（発明が解決しようとする問題点）しかしながら、この従来提案されている認識方法におけ
るローカルピーク抽出方法によれば、周波数スペクトル
の最小二乗直線との大小関係、すなわち、他の周波数帯
域の出力値との相対的な大きさをローカルピーク抽出を
行うための尺度として使用しているが、周波数スペクト
ル出力値の絶対量はローカルピーク抽出を行うための情
報としては使用されていない。

従って、連続発声音声におけるような破裂音を含む音節
等に発生する無音区間、つまり、周波数スペクトル出力
レベルが周囲雑音の大きさと同等となりしかもスペクト
ルの形も周囲雑音スペクトルと同等となる区間において
ローカルピーク抽出を行うことは、実質的には周囲雑音
スペクトルのローカルビークを抽出することになる。こ
れがため、周囲雑音スペクトルの変化に対応して無音区
間におけるローカルピーク抽出結果が変化して安定とな
らないので、この方法は認識性能の低下を招く問題点が
あった。

このような問題点を解決するため、入力信号レベルが所
定の一つのＩＪｉ定した１刀値よｉｌ　／ｌ＼七い黒へ
は無条件にローカルピーク値を全て「Ｏ」としてしまう
方法も考えられるが、その方法であると、入力音声レベ
ルがほとんど一定である場合には有効であるが、話者の
変化、入力媒体の変化その他の原因により入力音声レベ
ルが大きく変化する場合には、固定の閾値による判定は
困難となる。

一方、入力レベルの変化に対応出来る方法として、入力
音声信号の最大値の２割程度の大きさに対応するレベル
以下のローカルピーク値を全て「０」にする方法が考え
られる。この方法によれば、ローカルピーク抽出を精度
高く行うことが出来るというメリットがあるが、入力音
声信号の最大値を検出した時刻の後でなければ無音区間
判定の閾値を決定出来ないために、ローカルピーク抽出
を実時間処理で行うことが出来ず、これがため処理時間
が長くなるという問題点がある。

このような従来提案されているローカルピーク抽出方法
は、いずれにしても、抽出精度及び処理時間の双方を満
足させる方法ではなかった。

この発明の目的は、上述したような従来の問題点を除去
し、実時間処理が可能で抽出精度が高いローカルピーク
抽出方法を使用することにより高性能な音声認識処理を
行えるようにした音声認識方法を提供することにある。

（問題点を解決するための手段）この目的の達成を図るため、この発明によれば、標準パ
タンとの類似度計算用のローカルピークパタンを入力音
声レベルに適応したレベル適応ローカルピークパタンと
する。

このローカルピークパタンを得るため、（ａ）入力音声
レベルに対応して複数の無音区間判定閾値を予めメモリ
に設定しておく。

（ｂ）次に、音声入力から検出される音声区間の始端か
ら各フレーム毎に、入力音声レベルと全ての無音判定閾
値との大小比較を無音判定閾値毎にそれぞれ行って、無
音区間におけるローカルピーク値を全て「Ｏ」とすると
共に、設定した無音判定閾値の個数に対応する数のロー
カルピークパタンをそれぞれ抽出する処理を実時間で行
）。

この処理は、 ■入力音声レベルが無音判定閾値より大であるとき正規
化出力ベクトルの中で正値かつ極大となる成分を「１」
及びその他の成分を「０」と設定し及び ■入力音声レベルが無音判定閾値以下であるとき正規化
出力ベクトルの全ての成分を「０」と設定することによ
り、行う。

このようにして抽出したローカルピークパタンをローカ
ルビーク記憶部の所定のアドレスに記憶する。

（ｃ）次に、音声区間の経端検出後、入力音声レベルの
最大値を検出し、複数の無音区間判定閾値の中からこの
最大値に適応した無音区間判定閾値をレベル適応無音区
間判定閾値として選択する。

この最大値に適応した無音区間判定閾値とは、好ましく
は、この最大値の２割程度の閾値とするのが良い。

（ｄ）次に、このようにして選択されたレベル適応無音
区間判定閾値に対して各フレーム毎に求められているロ
ーカルピークパタンをレベル適応ローカルピークパタン
としてローカルビーク記憶部から読出して類似度計算部
へと出力させる。

これらレベル適応ローカルピークパタンの抽出は上述し
た（ｃ）及び（ｄ）の過程での実時間処理で行われる。

類似度計算部では、これらレベル適応ローカルピークパ
タンと、予め標準パタンメモリに格納されて用意されて
いる標準パタンとの類似度を計算し、全ての標準パタン
の中で最大の類似度を与える標準パタンのカテゴリ名を
認識結果として出力する。

（作用）この発明の音声認識方法によれば、ローカルピーク抽出
に当り、入力音声レベルに適応した無音区間判定を行っ
た後、無音区間においてはその区間のローカルピーク値
を「０」と設定することによって、周囲雑音変動による
ローカルビーク抽出結果の不安定要因を除去する処理を
、音声の入力に即応して逐次行うので、これら処理を実
時間で実行することが出来ると共に、無音区間判定のた
めに用いる無音区間判定閾値を複数個設定しであるので
、無音区間の判定を精度良く行うことが出来る。

このように、この発明によれば、実時間処理でしかも高
精度でローカルビークの抽出を行うことが出来、従って
、高性能な音声認識となる。

（実施例）以下、図面を参照して、この発明の音声認識方法の実施
例につき説明する。

第１図はこの発明の音声認識方法を実施するための装置
の要部の一構成例を示すブロック図及び第２図はこの発
明の説明に供する流れ図である。

第１図において、ｌＯはレベル抽出部、１２は周波数分
析部、１４は庁声区間検出部、１６は最大値検出部、１
８はローカルピーク抽出部、２０はローカルピークアド
レス部、２２はローカルビーク記憶部、２４は類似度計
算部、２６は標準パタン記憶部、２８は判定部及び３０
はメモリである。

このような構成成分を具える装置で行われるこの発明の
方法の実施例につき第２図を参照して説明する。

入力信号ａをレベル抽出部１０及び周波数分析部１２に
供給する。この周波数分析部１２では、この入力信号ａ
に対し所定の帯域数のハンドパスフィルタで分析し、そ
の分析結果である周波数スペクトル信号すを所定の時間
間隔（以後フレームと称する）毎に算出してローカルビ
ーク抽出部１８へ出力する。

レベル抽出部１０は入力信号ａのレベル抽出を実時間的
で行って得られた入力音声レベル信号Ｃを音声区間検出
部１４、最大値検出部１６及びローカルピーク抽出部１
８にそれぞれ逐次供給する。

音声区間検出部１４には逐次供給される入力音声レベル
信号Ｃからその音声区間の検出を行う。

音声区間検出部１４は音声区間の始端を検出すると、音
声始端時刻信号ｄを最大値検出部１６及びローカルピー
ク抽出部１８へ出力する（ステップｌ；以下、ステップ
をＳで表わす）、この音声始端時刻信号ｄは入力音声に
対するローカルビーク抽出開始時刻を意味する。また、
最大値検出部１６は音声始端時刻から逐次入力される入
力音声レベル信号のその時点までの最大値を算出して出
力するように構成したものである。

次に、ローカルピークパタンを抽出し、これらローカル
ピークパタンの中から、標準パタンとの類似度計算用の
、入力音声レベルに適応したレベル適応ローカルピーク
パタンを得る過程につき説明する。

ローカルピークパタン入力音声レベルに対応して複数の無音区間判定閾値（以
下、単に閾値と称する）を予め格納したメモリ３０を設
けておき、このメモリ３０からローカルピーク抽出部１
８へこれら閾値を随時呼び出せるように構成しておく０
例えば、この閾値の設定個数をＴＨＮＯとし、閾値をＴ
ＨＭ　（Ｌ）（但し、Ｌ＝１−ＴＨＮＯ）とする、尚、
ここで、以下の説明の便宜のため、音声始端時刻フレー
ム番号をＳＦＲ、ローカルビーク抽出を行うフレーム番
号をＦＲ１入力音声レベルをＰＯＷ（ｊ）（但し、ｊは
フレーム番号）、ローカルピーク値をＬＰＫ（ｋ、ｊ、
Ｌ）（ｋはチャネル番号、ｊはフレーム番号、Ｌ＝　１
−ＴＨＮＯで、Ｌは無音区間閾値番号である）、周波数
分析チャネル数をＣＨＮＮＯ及び入力音声最大フレーム
数（入力音声に対して予想されるフレーム数の最大値）
をＭＡＸＦＲとする。

ローカルピーク抽出部１８においては、始端時刻より、
周波数スペクトル信号ｂ、入力音声レベル信号Ｃの入力
を開始し、周波数スペクトルに対して対数変換及びスペ
クトルの最小二乗直線による正規化処理を行って正規化
出力ベクトルを得る。

そして、このローカルピーク抽出部１８において、音声
区間中の各フレーム毎に、入力音声レベルと全ての閾値
との大小比較をこれら閾値毎に行う。

そのため、先ず、第り番目の閾値ＴＨＭ　（Ｌ）に対し
て入力音声レベルＰＯＷ（ｊ）との比較を行う（Ｓ２）
、この比較において、 ■ＰＯＷ　（ｊ）＞ＴＨＭ　（Ｌ）である場合には、正
規化出力ベクトルの中で正値かつ極大となる成分（チャ
ネル）のローカルピーク値を「１」及びその他の成分（
チャネル）のローカルピーク値を「０」と設定する（Ｓ
３）、或いは、 ■ＰＯＷ（ｊ）≦ＴＨＭ　（Ｌ）である場合には、正規
化出力ベクトルの全ての成分（チャネル）のローカルピ
ーク値を「０」と設定する（Ｓ４）。

以上の処理を閾値の個数ＴＨＮＯ分だけ行って全ての閾
値に対するローカルピークパタンをそれぞれ抽出する（
Ｓ５）、全ての閾値に対して処理が終了していない場合
には、この大小比較を繰り返し行う。

次に、このようにして得られた、フレーム番号ｊ＝ＦＲ
及び第り番目の閾値に対し、各チャネルに＝ｌ−ＣＨＮ
ＮＯまでのローカルピーク値ＬＰＫ（１，ＦＲ，Ｌ）、
ＬＰＫ（２，ＦＲ，Ｌ）、−−−ＬＰＫ　（ＣＨＮＮＯ
、ＦＲ、Ｌ）　から成るローカルピークパタン信号ｅを
ローカルビーク記憶部２２に出力し、これにローカルピ
ークパタンとして記憶する（ＳＳ）。

このような処理は音声始端時刻から開始し、音声区間検
出部１４から音声区間の終端の検出を表わす音声終端時
刻信号ｆがローカルビーク抽出部１８に供給されるまで
逐次繰り返し行われる（Ｓ７）。

第４図は、この音声区間終端時刻におけるローカルビー
ク記憶部２２でのメモリ状態の一例を示す図である。ま
ず、大きく区分して、閾値の個数はＬ＝１−ＴＨＮＯで
あるので、第１闇値による抽出結果から第ＴＨＮＯＩ：
ｌ僅による抽出結果までのメモリ欄がある。各閾値に対
するメモリ欄はそれぞれの最大フレーム数ＭＡＸＦＲ分
のメモリ部分がある。そして各フレーム毎にチャネル数
に対応した個数のメモリ箇所が用意されている。そして
これらメモリ箇所毎に番地が決められていて、例えば、
第１閾値による抽出結果の第１フレームの第１チヤネル
のメモリ箇所をＯ番地とし、第ＴＨＮＯＩ１ｍ値の第Ｍ
ＡＫＦＲフレームの第ＣＨＨＮＮＯチャネルのメモリ箇
所を最終のＴＨＮＯ−ＭＡＸＦＲ−ＣＨＮＮＯ−１番地
トスル。

従って、この実施例では、これらのローカルピーク値Ｌ
ＰＫ（１，ＦＲ，Ｌ）、ＬＰＫ　（２゜ＦＲ、Ｌ）、−
−−ＬＰＫ　（ＣＨＮＮＯ，ＦＲ。

Ｌ）を、ローカルビーク記憶部２２の対応する番地すな
わちＭＡＸＦＲ−（Ｌ−１）−ＣＨＮＮＯ＋ＣＨＮＮＯ
−（ＦＲ−ＳＦＲ）番地、ＭＡＸ　Ｆ　Ｒ・　（Ｌ−１
）−ＣＨＮＮＯ＋ＣＨＮＮＯφ　（ＦＲ−３ＦＲ）＋１
番地、５ｅｅｓ、ＭＡＸＦＲ−（Ｌ−１）　　・ＣＨＮ
　Ｎ　Ｏ＋　ＣＨＮ　Ｎ　Ｏ・　（ＦＲ−３ＦＲ）＋Ｃ
ＨＨＮＯ−１番地へそれぞれ格納する。尚、第４図に示
す例は主としてＬ＝１とした場合である。

レベル　自ローカルピークパタン最大検出部１８において、音声始端時刻より音声終端時
刻までの間の入力音声レベルの最大値を算出し、入力音
声レベル最大値信号ｇをローカルビークアドレス計算部
２０に出力する。

ローカルビークアドレス計算部２０では、記憶された複
数のローカルピークパタンの中から、入力音声レベル信
号Ｃに最適なレベル最適ローカルピークパタンが格納さ
れているローカルピーク記憶部２２のメモリ部分の先頭
アドレスを算出する。

以下、この先頭アドレス算出処理につき説明する。

先ず、音声区間の終端検出後、複数の閾値の中から入力
音声レベルの最大値に適応した閾値をレベル適応無音区
間判定閾値として選択する。この場合、入力音声レベル
閾値をＴＨＬ（Ｌ）（但しＬ＝Ｏ〜ＴＨＮＯとする。ま
た、ＴＨＬ　（Ｌ−１）＜ＴＨＬ　（Ｌ）及びＴＨＬ　
（０）＝Ｏであって、ＴＨＬ　（ＴＨＮＯ）は入力音声
レベル信号が最大取り得る値とする）とし、これらの閾
値を予め設定しておく、さらに、入力音声レベル最大値
をＭＡＸＬとする。

この入力音声レベルの最大値に適応した閾値をレベル適
応閾値として選択するため、次の条件を使用する。

ＴＨＬ　（Ｌ−１）＜ＭＡＸＬ≦ＴＨＬ　（Ｌ）この条
件を満足する第り番目の閾値ＴＨＭ　（Ｌ）をレベル適
応閾値とする。

第５図（Ａ）及び（Ｂ）はこのようなレベル適応閾値を
判定する方法を具体的に説明するための図であり、この
図示例では、ＴＨＮＯ＝５とした場合につき、（Ａ）図
は入力音声レベルが小さい場合及び（Ｂ）図は入力音声
レベルが大きい場合をそれぞれ示す、これら図において
、横軸に時刻ｔを取り及び縦軸に無音区間利足閾値ＴＨ
Ｍ（１）〜ＴＨＭ（５）及び入力音声レベル閾値ＴＨＬ
（１）〜ＴＨＬ　（４）を取って示しである。

第５図（Ａ）に示す入力音声信号においては、その入力
音声レベルの最大値ＭＡＫＬが前述の条件を満足するＬ
の値は２であるので、このＬ＝２に対応する閾値はＴＨ
Ｍ　（２）となる、従って、この（２１値ＴＨＭ　（２
）がレベル適応閾値であると共に、この閾値ＴＨＭ　（
２）以下の入力音声信号区間が無音区間と判定される。

第５図（Ｂ）の場合も同様に、入力音声レベルの最大値
ＭＡＸＬが条件を満足するＬは４であるので、対応する
レベル適応閾値はＴＨＭ　（４）となり、従って、この
閾値以下の入力信号区間が無音区間となる。

このようにして設定されるレベル適応閾値に対応するロ
ーカルピークパタンをローカルビーク記憶部２２から読
み出すため、このローカルピークパタンが記憶されてい
る第り番目の閾値に対応するメモリ部分の先頭アドレス
ＣＨＮＮＯ・ＭＡＸＦＲ・　（Ｌ−１）を表わす先頭ア
ドレス信号りをこの記憶部２２にローカルビークアドレ
ス計算部２０から供給する（Ｓａ）、第５図（Ａ）の実
施例では、Ｌ＝２であるから先頭アドレスはＣＨＮＮＯ
−ＭＡＸＦＲ−１トナ！Ｊ、第５図ＣＢ）　ノ実施例テ
ハ、先頭アドレスはＣＨＮＮＯ・ＭＡＸＦＲ−３となる
。

このようにして、ローカルビーク記憶部２２からは、供
給された先頭アドレス信号から入力音声のフレーム数分
のローカルピークパタンをレベル適応ローカルピークパ
タン信号ｉとして読み出して類似度計算部２４へ出力す
る。

次に、類似度計算及び判定処理につき簡単に説明する。

類似度計算部２４においては、従来と同様にして、予め
認識対象カテゴリについてローカルピークパタンの標準
的なパタンと考えられるパタンか格納されている標準パ
タン記憶部２Ｂから、標準パタンを読み出してその信号
ｍを受は取り、この標準パタンとレベル適応ローカルピ
ークパタンとの類似度計算（−例として市街地圧′！ａ
）を行って、類似度を算出し、これを類似度信号ｎとし
て判定部２８に供給する。この処理は全ての標準パタン
につき行う。

判定部２８においては、全標準パタンとの類似度の中か
ら、最大類似度を算出し、この最大類似度先竿える標準
パタンのカテゴリ名を認識結果を表わす信号ｐとして出
力する。

以上の処理により、この発明の音声認識方法の一連の処
理を終了する。

この発明は上述した実施例にのみ限定されるものではな
いこと明らかである１例えば、無音区間判定用値及び入
力音声レベル閾値は設計に応じて任意の個数だけに設定
することが出来る。

又、この発明の音声認識方法を実行するための各処理の
内容は、この発明の範囲を逸脱しない範囲内で、上述し
た内容とは異なる内容とすることも出来る。

（発明の効果）上述した説明から明らかなように、この発明の音声認識
方法によれば、無音区間判定１２１値を複数個設定し、
これにより入力音声レベルに適応した無音区間判定を実
時間処理で行い、この無音区間におけるローカルビーク
値を「０」とするローカルビーク抽出方法であるので、
周囲雑音変動によるローカルビーク抽出結果の不安定要
因を取り除く処理を実時間でかつ精度良く行うことが出
来る。

従って、この発明の音声認識方法によれば、周囲雑音変
動に影響されずに認識精度が著しく高くかつ高速で処理
できる音声認識装置を提供することが出来る。

【図面の簡単な説明】

第１図はこの発明の音声認識方法の説明に供する、この
発明を実施するための装置の一構成例を示すブロック図
、第２図はこの発明の説明に供するレベル適応ローカルピ
ークパタンを抽出する過程を示す流れ図、第３図（Ａ）　、　（Ｂ）及び（Ｃ）は従来のローカル
ピークパタン算出方法の説明に供する説明図、第４図は
この発明の説明に供する音声終端時刻でのローカルピー
ク記憶部の一構成例を示す図、第５図（Ａ）及び（８）
は入力音声レベルから無音区間判定及びレベル適応無音
区間判定閾値を選定する例を説明するための図である。１０・・・レベル抽出部、　　１２・・・周波数分析部
１４・・・音声区間検出部、　１６・・・最大値検出部
１８・・・ローカルピーク抽出部２０・・・ローカルピークアドレス計算部２２・・・ロ
ーカルピーク記憶部２４・・・類似度計算部、　　２６・・・標準パタン記
憶部２８・・・判定部ａ・・・入力信号ｂ・・・周波数スペクトル信号Ｃ・・・入力音声レベル信号ｄ・・・音声始端時刻信号ｅ・・・ローカルピークパタン信号ｆ・・・音声終端時刻信号ｇ・・・入力音声レベル最大信号ｈ・・・先頭アドレス信号ｉ・・・レベル適応ローカルピークパタン信号ｍ・・・
標準パタン、　　　　ｎ・・・類似度信号ｐ・・・認識
結果信号。特許出願人　　　　沖電気工業株式会社レベ゛）し↓、
−ローカルし０−フハ″ワン享由≦の涜れ図第２図千−不ル沓号　　　　　　　２（Ｃ）　　ｒ、　　０００１０００００１００００１０
００ローカ）しぴ−７ノマタンロールしこ°−７ノぐタン　１巳ａｏｓ　国第３図ＣＨＮＮＯ−／音声朴鳩Ｂ１・１でのローｎルビー７記・置部ノ嬶氏図
面の浄書（内容に変更なし）手続ネ甫正書（方式）％式％１事件の表示　　昭和６１年特許願１３２６７６号２発
明の名称音声認識方法３補正をする者事件との関係　　特許出願人住所　（〒−１０５）東京都港区虎ノ門１丁目７番１２号名称（０２９）沖電気工業株式会社代表者　橋本　南海男４代理人　〒１７０　　　ｆｆｉ　（９８８）５５６３
住所　東京都豊島区東池袋１丁目２０番地５６補正の対
象図面７補正の内容　　別紙の通り（１）図面のｉｓ図を、添付の訂正図の通り訂正する。手続補正書昭和６２年２月９日

Claims

【特許請求の範囲】

（１）入力音声に対し周波数分析及び対数変換を行った
後、周波数スペクトルの最小二乗値で正規化した正規化
出力ベクトルの正値かつ極大となる成分を「１」及びそ
の他の成分を「０」と設定してローカルピークパタンを
抽出し、音声入力終了後前記ローカルピークパタンを使
用して予め用意されている標準パタンとの類似度計算に
より認識を行うようにした音声認識方法において、前記標準パタンとの類似度計算用の、入力音声レベルに
適応したレベル適応ローカルピークパタンを得るため、（ａ）入力音声レベルに対応して複数の無音区間判定閾
値を予め設定しておき、（ｂ）音声区間中の各フレーム毎に、入力音声レベルと
全ての前記無音判定閾値との大小比較を無音判定閾値毎
に行って、［１］入力音声レベルが前記無音判定閾値より大である
とき前記正規化出力ベクトルの中で正値かつ極大となる
成分を「１」及びその他の成分を「０」と設定し及び［２］前記入力音声レベルが前記無音判定閾値以下であ
るとき前記正規化出力ベクトルの全ての成分を「０」と
設定することにより、全ての前記無音判定閾値に対するローカルピークパタン
をそれぞれ抽出し、（ｃ）前記音声区間の終端検出後、複数の前記無音区間
判定閾値の中から前記入力音声レベルの最大値に適応し
た無音区間判定閾値をレベル適応無音区間判定閾値とし
て選択し、（ｄ）該レベル適応無音区間判定閾値に対する各フレー
ム毎のローカルピークパタンをレベル適応ローカルピー
クパタンとして出力することを特徴とする音声認識方法。