JPH0792671B2 - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPH0792671B2 JPH0792671B2 JP60132064A JP13206485A JPH0792671B2 JP H0792671 B2 JPH0792671 B2 JP H0792671B2 JP 60132064 A JP60132064 A JP 60132064A JP 13206485 A JP13206485 A JP 13206485A JP H0792671 B2 JPH0792671 B2 JP H0792671B2
- Authority
- JP
- Japan
- Prior art keywords
- noise information
- voice
- noise
- section
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000005259 measurement Methods 0.000 claims description 43
- 238000001514 detection method Methods 0.000 claims description 27
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000013500 data storage Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000034 method Methods 0.000 description 1
Description
【発明の詳細な説明】 (産業上の利用分野) 本発明は、ノイズ情報を用いて音声区間の検出及び認識
処理を行なう音声認識装置に関するものである。
処理を行なう音声認識装置に関するものである。
(従来の技術) 従来、この種の音声認識装置は音声が発声される前にあ
らかじめ話者周囲環境ノイズあるいは入力条件に起因す
るノイズを測定し、該ノイズ測定の結果をノイズ情報と
してそのノイズ情報を用いて音声の区間検出及び認識を
行なっている。第5図は従来の音声認識装置の構成を示
すブロック図である。同図において、1は入力データを
分析する音声分析部、2は音声分析部1からの分析デー
タの入力先を切替えるスイッチ、3はスイッチ2を介し
て入力される分析データからノイズ情報を作成するノイ
ズ情報作成部、4はノイズ情報作成部3で作成されたノ
イズ情報を記憶するノイズ情報記憶部、5はスイツチ2
を介して入力される分析データを記憶する分析データ記
憶部、6はノイズ情報記憶部4に格納されたノイズ情報
を用いてレベル閾値を設定し、分析データ記憶部5の分
析データとレベル閾値とを比較して音声区間を検出する
音声区間検出部、7は分析データと音声区間検出部6か
らの音声区間情報により入力音声の認識処理を行なう認
識処理部、8は装置全体を制御するコントローラであ
る。
らかじめ話者周囲環境ノイズあるいは入力条件に起因す
るノイズを測定し、該ノイズ測定の結果をノイズ情報と
してそのノイズ情報を用いて音声の区間検出及び認識を
行なっている。第5図は従来の音声認識装置の構成を示
すブロック図である。同図において、1は入力データを
分析する音声分析部、2は音声分析部1からの分析デー
タの入力先を切替えるスイッチ、3はスイッチ2を介し
て入力される分析データからノイズ情報を作成するノイ
ズ情報作成部、4はノイズ情報作成部3で作成されたノ
イズ情報を記憶するノイズ情報記憶部、5はスイツチ2
を介して入力される分析データを記憶する分析データ記
憶部、6はノイズ情報記憶部4に格納されたノイズ情報
を用いてレベル閾値を設定し、分析データ記憶部5の分
析データとレベル閾値とを比較して音声区間を検出する
音声区間検出部、7は分析データと音声区間検出部6か
らの音声区間情報により入力音声の認識処理を行なう認
識処理部、8は装置全体を制御するコントローラであ
る。
次に動作を説明する。まず、最初に音声が発声される前
にノイズ測定を行なう。コントローラ8はスイッチ2を
ノイズ情報作成部3側に切替えて音声分析部1及びノイ
ズ情報作成部3を起動する。これにより入力データは音
声分析部1に入力され、ここで入力データのパワー情報
及び周波数情報を抽出する分析処理が一定時間毎(フレ
ーム単位毎)に行なわれ、この分析結果よりノイズ情報
作成部3においてノイズ情報を作成し、ノイズ情報記憶
部4に格納する。該ノイズ測定が完了するとコントロー
ラ8は音声分析部1及びノイズ情報作成部3を停止さ
せ、次に音声区間検出及び認識動作を行なう。この場
合、コントローラ8はスイッチ2を音声区間検出部6側
に切替えて音声分析部1及び音声区間検出部6を起動す
る。これにより入力データは前記ノイズ測定と同様音声
分析部1により分析され、分析結果は音声分析データと
して分析データ記憶部5及び音声区間検出部6に入力さ
れる。音声区間検出部6は音声分析結果とノイズ情報記
憶部4に格納され、あらかじめノイズ測定により得られ
た前記ノイズ情報とを用いて入力された音声レベルの検
出を行なうためのレベル閾値を設定し、該レベル閾値よ
り大の区間の最初のフレームを始端、最後のフレームを
終端として、この始端から終端までの区間を音声区間と
決定し、次にコントローラ8は認識処理部7を起動させ
る。認識処理部7は音声分析データ及び音声区間検出部
5から出力される音声区間情報、ノイズ情報をもとに一
般的に知られているパターンマッチングによる認識処理
等を行ない、認識結果を出力する。第6図は入力データ
に対するノイズ測定及び音声区間検出の関係を示したも
のである。
にノイズ測定を行なう。コントローラ8はスイッチ2を
ノイズ情報作成部3側に切替えて音声分析部1及びノイ
ズ情報作成部3を起動する。これにより入力データは音
声分析部1に入力され、ここで入力データのパワー情報
及び周波数情報を抽出する分析処理が一定時間毎(フレ
ーム単位毎)に行なわれ、この分析結果よりノイズ情報
作成部3においてノイズ情報を作成し、ノイズ情報記憶
部4に格納する。該ノイズ測定が完了するとコントロー
ラ8は音声分析部1及びノイズ情報作成部3を停止さ
せ、次に音声区間検出及び認識動作を行なう。この場
合、コントローラ8はスイッチ2を音声区間検出部6側
に切替えて音声分析部1及び音声区間検出部6を起動す
る。これにより入力データは前記ノイズ測定と同様音声
分析部1により分析され、分析結果は音声分析データと
して分析データ記憶部5及び音声区間検出部6に入力さ
れる。音声区間検出部6は音声分析結果とノイズ情報記
憶部4に格納され、あらかじめノイズ測定により得られ
た前記ノイズ情報とを用いて入力された音声レベルの検
出を行なうためのレベル閾値を設定し、該レベル閾値よ
り大の区間の最初のフレームを始端、最後のフレームを
終端として、この始端から終端までの区間を音声区間と
決定し、次にコントローラ8は認識処理部7を起動させ
る。認識処理部7は音声分析データ及び音声区間検出部
5から出力される音声区間情報、ノイズ情報をもとに一
般的に知られているパターンマッチングによる認識処理
等を行ない、認識結果を出力する。第6図は入力データ
に対するノイズ測定及び音声区間検出の関係を示したも
のである。
(発明が解決しようとする問題点) しかしながら、上記構成の装置では電話機や指向性の弱
いマイクロフォン等で音声が入力される場合の話者の周
囲雑音の変化や入力されてから音声認識装置まで伝送さ
れる間に混入するノイズによって発声するノンパルス性
のノイズをノイズ測定において偶然に拾うと、そのため
ノイズ情報が特異なものになり実際の音声が存在する近
辺のノイズの状態と該ノイズ測定で得たノイズ情報が大
きく異って正確な音声区間を切り出すことができず誤認
識が引き起すという問題点があった。
いマイクロフォン等で音声が入力される場合の話者の周
囲雑音の変化や入力されてから音声認識装置まで伝送さ
れる間に混入するノイズによって発声するノンパルス性
のノイズをノイズ測定において偶然に拾うと、そのため
ノイズ情報が特異なものになり実際の音声が存在する近
辺のノイズの状態と該ノイズ測定で得たノイズ情報が大
きく異って正確な音声区間を切り出すことができず誤認
識が引き起すという問題点があった。
本発明は、以上述べた特異なノイズ情報で音声区間検出
を誤るという問題点を除去し、より正確な音声区間を切
り出し認識率の優れた装置を提供することを目的とす
る。
を誤るという問題点を除去し、より正確な音声区間を切
り出し認識率の優れた装置を提供することを目的とす
る。
(問題点を解決するための手段) 本発明は前記問題点を解決するために、入力データを音
声分析する分析手段と、前記分析手段の分析結果を記憶
する分析結果記憶手段と、前記分析結果記憶手段に格納
された分析結果の所定の先頭フレームと任意の終了フレ
ームとの間の測定区間のノイズを測定してノイズ情報を
算出するノイズ情報算出手段と、前記ノイズ情報算出手
段における終了フレームを所定量ずつ増加させて前記測
定区間を変更するストップフレーム設定手段と、前記ノ
イズ情報算出手段からのノイズ情報を記憶するノイズ情
報記憶手段と、前記ノイズ情報記憶手段からのノイズ情
報を用いてレベル閾値を設定し、該設定したときタイミ
ングで前記分析結果記憶手段の内容と該レベル閾値とを
比較することにより音声区間を検出する検出手段と、前
記分析結果記憶手段及び検出手段の出力信号に基づいて
音声認識を行う認識手段と、前記検出手段が、音声区間
の始端を検出するまで、前記ストップフレーム設定手段
を動作させて終了フレームを所定量づつ増加させてノイ
ズ情報を更新させ、更新されたノイズ情報に基づいて音
声区間を検出させる制御手段とから構成される音声認識
装置である。
声分析する分析手段と、前記分析手段の分析結果を記憶
する分析結果記憶手段と、前記分析結果記憶手段に格納
された分析結果の所定の先頭フレームと任意の終了フレ
ームとの間の測定区間のノイズを測定してノイズ情報を
算出するノイズ情報算出手段と、前記ノイズ情報算出手
段における終了フレームを所定量ずつ増加させて前記測
定区間を変更するストップフレーム設定手段と、前記ノ
イズ情報算出手段からのノイズ情報を記憶するノイズ情
報記憶手段と、前記ノイズ情報記憶手段からのノイズ情
報を用いてレベル閾値を設定し、該設定したときタイミ
ングで前記分析結果記憶手段の内容と該レベル閾値とを
比較することにより音声区間を検出する検出手段と、前
記分析結果記憶手段及び検出手段の出力信号に基づいて
音声認識を行う認識手段と、前記検出手段が、音声区間
の始端を検出するまで、前記ストップフレーム設定手段
を動作させて終了フレームを所定量づつ増加させてノイ
ズ情報を更新させ、更新されたノイズ情報に基づいて音
声区間を検出させる制御手段とから構成される音声認識
装置である。
好ましくは、前記制御手段が、前記ノイズ情報記憶手段
の最新の内容を次の音声認識時における最初のノイズ測
定区間のノイズ情報とするように前記各手段を制御する
ものである。
の最新の内容を次の音声認識時における最初のノイズ測
定区間のノイズ情報とするように前記各手段を制御する
ものである。
(作用) 本発明によれば以上のように音声認識装置を構成したの
で技術的手段は次のように作用する。無音声(ノイズ測
定)区間も含む音声入力データが分析手段により音声分
析され分析結果記憶手段に格納される。制御手段はノイ
ズ情報算出手段に対して分析結果記憶手段の分析データ
の先頭フレーム及び任意の終了フレームのノイズ測定区
間を指示してノイズ情報を算出させる。次に、検出手段
はノイズ情報記憶手段を介して入力されたノイズ情報を
用いてレベル閾値を設定し、このタイミング(終了フレ
ーム+レベル閾値設定時間)で、分析データのレベルと
レベル閾値とを比較して入力音声の始端から終端までの
音声区間を検出する。制御手段は検出手段で音声区間の
始端が検出されないときには、始端が検出されるまで終
了フレームを所定量増加させたノイズ測定区間をストッ
プフレーム設定手段に指示してノイズ情報を更新させ
る。検出手段は更新されたノイズ情報を用いてレベル閾
値を設定し、このタイミング(更新の終了フレーム+更
新のレベル閾値の設定時間)で同様に音声区間の検出を
行なう。認識手段はこのようにして得られた音声区間情
報により入力音声の認識を行なう。従って、音声区間が
検出されるまで最新のノイズ情報を用いて音声区間検出
を行うので、前記従来技術の問題点が解決できるのであ
る。
で技術的手段は次のように作用する。無音声(ノイズ測
定)区間も含む音声入力データが分析手段により音声分
析され分析結果記憶手段に格納される。制御手段はノイ
ズ情報算出手段に対して分析結果記憶手段の分析データ
の先頭フレーム及び任意の終了フレームのノイズ測定区
間を指示してノイズ情報を算出させる。次に、検出手段
はノイズ情報記憶手段を介して入力されたノイズ情報を
用いてレベル閾値を設定し、このタイミング(終了フレ
ーム+レベル閾値設定時間)で、分析データのレベルと
レベル閾値とを比較して入力音声の始端から終端までの
音声区間を検出する。制御手段は検出手段で音声区間の
始端が検出されないときには、始端が検出されるまで終
了フレームを所定量増加させたノイズ測定区間をストッ
プフレーム設定手段に指示してノイズ情報を更新させ
る。検出手段は更新されたノイズ情報を用いてレベル閾
値を設定し、このタイミング(更新の終了フレーム+更
新のレベル閾値の設定時間)で同様に音声区間の検出を
行なう。認識手段はこのようにして得られた音声区間情
報により入力音声の認識を行なう。従って、音声区間が
検出されるまで最新のノイズ情報を用いて音声区間検出
を行うので、前記従来技術の問題点が解決できるのであ
る。
(実施例) 第1図は本発明の第1の実施例を示すブロック図であ
る。同図において、第5図と同一の参照符号は同一性の
ある構成部分を示す。30は第5図のノイズ情報作成部3
に相当するノイズ情報作成部で、ノイズ情報算出部31及
びストップフレーム設定部32から構成される。ノイズ情
報算出部31は分析データ記憶部5に格納された音声分析
データ(無音声区間も含む)を入力としてノイズ情報を
作成する。ストップフレーム設定部32はコントローラ8
の指示によりノイズ測定の終了フレーム番号を格納して
ノイズ情報算出部31に与える。
る。同図において、第5図と同一の参照符号は同一性の
ある構成部分を示す。30は第5図のノイズ情報作成部3
に相当するノイズ情報作成部で、ノイズ情報算出部31及
びストップフレーム設定部32から構成される。ノイズ情
報算出部31は分析データ記憶部5に格納された音声分析
データ(無音声区間も含む)を入力としてノイズ情報を
作成する。ストップフレーム設定部32はコントローラ8
の指示によりノイズ測定の終了フレーム番号を格納して
ノイズ情報算出部31に与える。
次に動作例を説明する。まず音声が入力される前に従来
と同様にノイズ測定を一次ノイズ測定として行なう。音
声分析部1から従来と同様にして分析された音声分析デ
ータはすべて一度分析データ記憶部5にあらかじめ決ま
った先頭フレーム番号から逐次格納され、コントローラ
8は一次ノイズ測定を行なう区間の終了フレーム番号を
ストップフレーム設定部32に設定する。次にノイズ情報
作成部30が起動され、ノイズ情報算出部31は前記先頭フ
レーム番号とストップフレーム設定部32に設定されてい
る前記終了フレーム番号で指される区間の音声分析デー
タを分析データ記憶部5から読み出し、従来と同様にし
てノイズ情報を作成してノイズ情報記憶部4に格納す
る。これにより一次ノイズ測定を終了する。次にコント
ローラ8は音声区間検出部6を起動し、該音声区間検出
部6において前記一次ノイズ測定によるノイズ情報によ
り従来と同様の音声区間検出を行ない、音声区間の始端
が検出されない場合は更にストップフレーム設定部32に
あらかじめ設定されている終了フレーム番号に対して一
定のフレーム数加算したフレーム番号をストップフレー
ム設定部32に再設定する。次にノイズ情報作成部30を起
動して前記一次ノイズ測定と同様にして前記先頭フレー
ムと前記再設定された終了フレーム番号で指される区間
の音声分析データを分析データ記憶部5から読み出し、
ノイズ情報を作成し、ノイズ情報記憶部4に格納させ、
音声区間検出部6において音声区間の始端検出を行な
う。以上の操作を音声区間の始端が検出されるまで繰り
返すことによって、ノイズ測定の区間を拡大させ最新の
ノイズ情報を音声区間検出部6に与える。これにより音
声区間検出部6は、ノイズ情報記憶部4に格納されてい
る最新のノイズ情報をもとに従来と同様にして音声区間
の検出を行なう。
と同様にノイズ測定を一次ノイズ測定として行なう。音
声分析部1から従来と同様にして分析された音声分析デ
ータはすべて一度分析データ記憶部5にあらかじめ決ま
った先頭フレーム番号から逐次格納され、コントローラ
8は一次ノイズ測定を行なう区間の終了フレーム番号を
ストップフレーム設定部32に設定する。次にノイズ情報
作成部30が起動され、ノイズ情報算出部31は前記先頭フ
レーム番号とストップフレーム設定部32に設定されてい
る前記終了フレーム番号で指される区間の音声分析デー
タを分析データ記憶部5から読み出し、従来と同様にし
てノイズ情報を作成してノイズ情報記憶部4に格納す
る。これにより一次ノイズ測定を終了する。次にコント
ローラ8は音声区間検出部6を起動し、該音声区間検出
部6において前記一次ノイズ測定によるノイズ情報によ
り従来と同様の音声区間検出を行ない、音声区間の始端
が検出されない場合は更にストップフレーム設定部32に
あらかじめ設定されている終了フレーム番号に対して一
定のフレーム数加算したフレーム番号をストップフレー
ム設定部32に再設定する。次にノイズ情報作成部30を起
動して前記一次ノイズ測定と同様にして前記先頭フレー
ムと前記再設定された終了フレーム番号で指される区間
の音声分析データを分析データ記憶部5から読み出し、
ノイズ情報を作成し、ノイズ情報記憶部4に格納させ、
音声区間検出部6において音声区間の始端検出を行な
う。以上の操作を音声区間の始端が検出されるまで繰り
返すことによって、ノイズ測定の区間を拡大させ最新の
ノイズ情報を音声区間検出部6に与える。これにより音
声区間検出部6は、ノイズ情報記憶部4に格納されてい
る最新のノイズ情報をもとに従来と同様にして音声区間
の検出を行なう。
第2図は入力データに対するノイズ測定と音声区間検出
との関係を示したもので、の区間は〔1〕の区間で求
めたノイズ情報を、の区間では〔2〕の区間で求めた
ノイズ情報を、…、の区間では〔n〕の区間で求めた
ノイズ情報を用いて音声区間の検出を行なうタイミング
を表し、前記一次ノイズ測定の区間は1回目のノイズ測
定区間〔1〕に対応し、n回目のノイズ測定区間〔n〕
により音声区間の始端が検出されたことを示してい
る。
との関係を示したもので、の区間は〔1〕の区間で求
めたノイズ情報を、の区間では〔2〕の区間で求めた
ノイズ情報を、…、の区間では〔n〕の区間で求めた
ノイズ情報を用いて音声区間の検出を行なうタイミング
を表し、前記一次ノイズ測定の区間は1回目のノイズ測
定区間〔1〕に対応し、n回目のノイズ測定区間〔n〕
により音声区間の始端が検出されたことを示してい
る。
なお音声区間検出後の動作は従来と同様のためその説明
は省略する。第1の実施例では、一次ノイズ測定の音声
区間検出する区間が連続している場合を説明したが、そ
の間が不連続であっても音声分析データをあたかも連続
しているように扱って連続の場合と同様にノイズ測定を
行なっても良い。
は省略する。第1の実施例では、一次ノイズ測定の音声
区間検出する区間が連続している場合を説明したが、そ
の間が不連続であっても音声分析データをあたかも連続
しているように扱って連続の場合と同様にノイズ測定を
行なっても良い。
次に第2の実施例について説明する。第3図は本発明の
第2実施例を示すブロック図であり、第1の実施例構成
要素に加えて前回の認識に用いたノイズ情報を測定した
区間の音声分析データの平均値を格納する平均ノイズ記
憶部41を設けたものである。次に動作例を説明する。ま
ず一回目の入力データに対する認識動作は第1の実施例
と同様に一次ノイズ測定を行ない順次音声区間の始端が
決定されるまでノイズ測定を繰り返し、最終的に音声区
間が検出され、これにより認識処理を行なった後、音声
区間検出に使用されたノイズ情報を測定した区間の音声
分析データの平均値を求め平均ノイズ記憶部41に格納す
る。更に二回目以降の入力データに対する認識について
は一次ノイズ測定を行なわず、コントローラ8の指令に
より平均ノイズ記憶部41に格納されている前記音声分析
データの平均値を分析データ記憶部5内における音声区
間検出区間の各フレームに対応した一次ノイズ測定用分
析データ格納エリアに格納し一次ノイズ測定を終了した
ものとして扱う。以下の動作は第1の実施例と同様に、
前記先頭フレーム番号とコントローラ8より与えられた
ストップフレーム設定部32の終了フレーム番号とが指す
区間に対してノイズ測定を音声区間の始端が検出される
まで繰り返し、以降は第1の実施例と同じ動作を行な
う。その他の動作は第1の実施例と同じであり、更に認
識処理後最終的に音声区間検出及び認識処理に用いたノ
イズ情報を測定した区間の音声分析データの平均値を前
記平均ノイズ記憶部41に格納する。第4図は第1の実施
例における第2図と同様に入力データに対するノイズ測
定と音声区間検出との関係を示したもので、の区間は
〔1〕の区間で求めたノイズ情報を、の区間では
〔2〕の区間で求めたノイズ情報を、…、の区間では
〔n〕の区間で求めたノイズ情報を用いて音声区間の検
出を行なうタイミングを表す。また、前記音声分析デー
タの平均値の格納の区間は1回目のノイズ測定区間
〔1〕に対応し、n回目のノイズ測定区間〔n〕により
音声区間の始端が検出されたことを示している。
第2実施例を示すブロック図であり、第1の実施例構成
要素に加えて前回の認識に用いたノイズ情報を測定した
区間の音声分析データの平均値を格納する平均ノイズ記
憶部41を設けたものである。次に動作例を説明する。ま
ず一回目の入力データに対する認識動作は第1の実施例
と同様に一次ノイズ測定を行ない順次音声区間の始端が
決定されるまでノイズ測定を繰り返し、最終的に音声区
間が検出され、これにより認識処理を行なった後、音声
区間検出に使用されたノイズ情報を測定した区間の音声
分析データの平均値を求め平均ノイズ記憶部41に格納す
る。更に二回目以降の入力データに対する認識について
は一次ノイズ測定を行なわず、コントローラ8の指令に
より平均ノイズ記憶部41に格納されている前記音声分析
データの平均値を分析データ記憶部5内における音声区
間検出区間の各フレームに対応した一次ノイズ測定用分
析データ格納エリアに格納し一次ノイズ測定を終了した
ものとして扱う。以下の動作は第1の実施例と同様に、
前記先頭フレーム番号とコントローラ8より与えられた
ストップフレーム設定部32の終了フレーム番号とが指す
区間に対してノイズ測定を音声区間の始端が検出される
まで繰り返し、以降は第1の実施例と同じ動作を行な
う。その他の動作は第1の実施例と同じであり、更に認
識処理後最終的に音声区間検出及び認識処理に用いたノ
イズ情報を測定した区間の音声分析データの平均値を前
記平均ノイズ記憶部41に格納する。第4図は第1の実施
例における第2図と同様に入力データに対するノイズ測
定と音声区間検出との関係を示したもので、の区間は
〔1〕の区間で求めたノイズ情報を、の区間では
〔2〕の区間で求めたノイズ情報を、…、の区間では
〔n〕の区間で求めたノイズ情報を用いて音声区間の検
出を行なうタイミングを表す。また、前記音声分析デー
タの平均値の格納の区間は1回目のノイズ測定区間
〔1〕に対応し、n回目のノイズ測定区間〔n〕により
音声区間の始端が検出されたことを示している。
なお、第2の実施例において最終的に音声区間検出及び
認識処理に用いたノイズ情報を測定した区間の音声分析
データの平均値を装置内の平均ノイズ記憶部41に格納し
次の認識に用いているが、前記音声分析データの平均値
を装置外部に出力し、次の認識において外部から受け取
るようにしても良い。
認識処理に用いたノイズ情報を測定した区間の音声分析
データの平均値を装置内の平均ノイズ記憶部41に格納し
次の認識に用いているが、前記音声分析データの平均値
を装置外部に出力し、次の認識において外部から受け取
るようにしても良い。
以上のように本実施例によれば、ノイズ情報の測定を音
声区間の始端が検出されるまで繰り返し行ない、音声に
極めて近いところのノイズ情報による音声区間検出を行
なうことにより、話者の周囲雑音の変化等があってもよ
り正確な音声区間を切り出すことができ、認識率の優れ
た音声認識装置を提供できる。更に前記第2の実施例の
ように二回目以降の入力データに対する認識において一
次ノイズ測定を行なわないことにより、連続的な認識に
対して、ノイズ測定のため時間が取られることがなく話
者の発声を自然に行なわせることができる。
声区間の始端が検出されるまで繰り返し行ない、音声に
極めて近いところのノイズ情報による音声区間検出を行
なうことにより、話者の周囲雑音の変化等があってもよ
り正確な音声区間を切り出すことができ、認識率の優れ
た音声認識装置を提供できる。更に前記第2の実施例の
ように二回目以降の入力データに対する認識において一
次ノイズ測定を行なわないことにより、連続的な認識に
対して、ノイズ測定のため時間が取られることがなく話
者の発声を自然に行なわせることができる。
(発明の効果) 以上説明したように本発明によれば、音声区間を正確に
切り出すことができるので確認率の優れた音声認識装置
を提供することができる。
切り出すことができるので確認率の優れた音声認識装置
を提供することができる。
第1図は本発明の音声認識装置の第1の実施例を示すブ
ロック図、第2図は第1の実施例の動作を説明する図、
第3図は本発明の音声認識装置の第2の実施例を示すブ
ロック図、第4図は第2の実施例の動作を説明する図、
第5図は従来の音声認識装置を示すブロック図、第6図
は従来の音声区間検出動作を説明する図である。 1……音声分析部、4……ノイズ情報記憶部、5……分
析データ記憶部、6……音声区間検出部、7……認識処
理部、8……コントローラ、30……ノイズ情報作成部、
31……ノイズ情報算出部、32……ストップフレーム設定
部、41……平均ノイズ記憶部。
ロック図、第2図は第1の実施例の動作を説明する図、
第3図は本発明の音声認識装置の第2の実施例を示すブ
ロック図、第4図は第2の実施例の動作を説明する図、
第5図は従来の音声認識装置を示すブロック図、第6図
は従来の音声区間検出動作を説明する図である。 1……音声分析部、4……ノイズ情報記憶部、5……分
析データ記憶部、6……音声区間検出部、7……認識処
理部、8……コントローラ、30……ノイズ情報作成部、
31……ノイズ情報算出部、32……ストップフレーム設定
部、41……平均ノイズ記憶部。
Claims (2)
- 【請求項1】(a)入力データを音声分析する分析手
段、 (b)前記分析手段の分析結果を記憶する分析結果記憶
手段、 (c)前記分析結果記憶手段に格納された分析結果の所
定の先頭フレームと任意の終了フレームとの間の測定区
間のノイズを測定してノイズ情報を算出するノイズ情報
算出手段、 (d)前記ノイズ情報算出手段における終了フレームを
所定量ずつ増加させて前記測定区間を変更するストップ
フレーム設定手段、 (e)前記ノイズ情報算出手段からのノイズ情報を記憶
するノイズ情報記憶手段、 (f)前記ノイズ情報記憶手段からのノイズ情報を用い
てレベル閾値を設定し、該設定したときのタイミングで
前記分析結果記憶手段の内容と該レベル閾値とを比較す
ることにより音声区間を検出する検出手段、 (g)前記分析結果記憶手段及び検出手段の出力信号に
基づいて音声認識を行う認識手段、 (h)前記検出手段が、音声区間の始端を検出するま
で、前記ストップフレーム設定手段を作動させて終了フ
レームを所定量ずつ増加させてノイズ情報を更新させ、
更新されたノイズ情報に基づいて音声区間を検出させる
制御手段、 とからなる音声認識装置。 - 【請求項2】前記制御手段は前記ノイズ情報記憶手段の
最新の内容を次の音声認識時における最初のノイズ測定
区間のノイズ情報とするように前記各手段を制御するこ
とを特徴とする特許請求の範囲第1項記載の音声認識装
置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60132064A JPH0792671B2 (ja) | 1985-06-19 | 1985-06-19 | 音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60132064A JPH0792671B2 (ja) | 1985-06-19 | 1985-06-19 | 音声認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS61292198A JPS61292198A (ja) | 1986-12-22 |
| JPH0792671B2 true JPH0792671B2 (ja) | 1995-10-09 |
Family
ID=15072666
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP60132064A Expired - Lifetime JPH0792671B2 (ja) | 1985-06-19 | 1985-06-19 | 音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0792671B2 (ja) |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60499A (ja) * | 1983-06-17 | 1985-01-05 | カシオ計算機株式会社 | 音声認識装置におけるしきい値設定方式 |
-
1985
- 1985-06-19 JP JP60132064A patent/JPH0792671B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPS61292198A (ja) | 1986-12-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4811399A (en) | Apparatus and method for automatic speech recognition | |
| US7620544B2 (en) | Method and apparatus for detecting speech segments in speech signal processing | |
| KR940024660A (ko) | 음성인식장치 | |
| JPH0792671B2 (ja) | 音声認識装置 | |
| JPS61292199A (ja) | 音声認識装置 | |
| JPH0950288A (ja) | 音声認識装置及び音声認識方法 | |
| JP3360978B2 (ja) | 音声認識装置 | |
| JP2589468B2 (ja) | 音声認識装置 | |
| KR100262576B1 (ko) | 운전자의 음성 신호 구간 검출 장치 및 그 방법 | |
| JPH11119793A (ja) | 音声認識装置 | |
| JPH0236960B2 (ja) | ||
| KR100298118B1 (ko) | Hmm모델의유사성을이용한음성인식장치및방법 | |
| JPS6220560B2 (ja) | ||
| KR0128669B1 (ko) | 음성 신호의 실시간 음성부 검출 방법 | |
| JPS61140999A (ja) | 音声区間検出方式 | |
| JPH0690631B2 (ja) | 音声認識方法 | |
| JPH05210763A (ja) | 自動学習型文字認識装置 | |
| JPS6223096A (ja) | 音声区間検出装置 | |
| JPS60170900A (ja) | 音節音声標準パタン登録方式 | |
| JPH0752354B2 (ja) | 音声認識装置 | |
| JPH01244497A (ja) | 音声区間検出回路 | |
| JPH01319099A (ja) | 音声認識装置 | |
| JPH10171488A (ja) | 音声認識方法及び装置及び記憶媒体 | |
| JPH01200293A (ja) | 音声認識方式 | |
| JPS61176998A (ja) | 特定話者音声認識方式 |