JPS59219797A - 音声区間切り出し方式 - Google Patents
音声区間切り出し方式Info
- Publication number
- JPS59219797A JPS59219797A JP58093911A JP9391183A JPS59219797A JP S59219797 A JPS59219797 A JP S59219797A JP 58093911 A JP58093911 A JP 58093911A JP 9391183 A JP9391183 A JP 9391183A JP S59219797 A JPS59219797 A JP S59219797A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- voice
- input
- noise
- frequency distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の利用分野〕
本発明は、音声認識装置において、その入力音声信号に
重畳された騒音のレベルが変動した場合、音声区間の湧
き出し・欠落を防止するだめの音声区間切り出し方式に
関するものである。
重畳された騒音のレベルが変動した場合、音声区間の湧
き出し・欠落を防止するだめの音声区間切り出し方式に
関するものである。
従来の音声認識装置は、音声区間の決定に用いるパラメ
ータとして、 (a) あらかじめ、装置として与えられた値(b)
過去に測定したある一時点での値(C) 最新の
音声区間終了後に測定した値などを利用していた。すな
わち、周囲騒音条件は、(a)では設計時の値で固定さ
れ、(b)ではパラメータを測定した時点での値に代表
され、(C)でも最後に音声入力をした直後の騒音状態
に代表されるようになっていた。
ータとして、 (a) あらかじめ、装置として与えられた値(b)
過去に測定したある一時点での値(C) 最新の
音声区間終了後に測定した値などを利用していた。すな
わち、周囲騒音条件は、(a)では設計時の値で固定さ
れ、(b)ではパラメータを測定した時点での値に代表
され、(C)でも最後に音声入力をした直後の騒音状態
に代表されるようになっていた。
そのため、周囲騒音がダイナミックに変動する環境で音
声認識装置を使用すると、騒音を誤まって入力音声とし
て認識したり、その逆に入力された音声を検出しえなか
ったりするという欠点があった。
声認識装置を使用すると、騒音を誤まって入力音声とし
て認識したり、その逆に入力された音声を検出しえなか
ったりするという欠点があった。
本発明の目的は、上記した従来技術の欠点をなくシ、周
囲騒音がダイナミックに変動しても、それを高精度で検
出し、入力音声の音声区間を正しく切シ出し、その認識
を確実に行うことができる音声区間切り出し方式を提供
することにある。
囲騒音がダイナミックに変動しても、それを高精度で検
出し、入力音声の音声区間を正しく切シ出し、その認識
を確実に行うことができる音声区間切り出し方式を提供
することにある。
本発明に係る音声区間切シ出し方式の構成は、入力音声
について、その音響分析をして得られた特徴パラメータ
から音声区間の切り出しを行った後、標準音声パターン
との比較・照合・判定によって認識処理をする音声認識
装置において、常に現在から一定期間前の過去までさか
のぼって累計した入力音声パワー別の頻度分布を記録し
ておき、入力音声の認識に際して、その時の上記頻度分
布の最大頻度に対応するパワーを現騒音レベルとして音
声区間の切り出しを行うように制御・処理するものであ
る。
について、その音響分析をして得られた特徴パラメータ
から音声区間の切り出しを行った後、標準音声パターン
との比較・照合・判定によって認識処理をする音声認識
装置において、常に現在から一定期間前の過去までさか
のぼって累計した入力音声パワー別の頻度分布を記録し
ておき、入力音声の認識に際して、その時の上記頻度分
布の最大頻度に対応するパワーを現騒音レベルとして音
声区間の切り出しを行うように制御・処理するものであ
る。
なお、これを以下に補足して説明する。
音声認識装置の音声区間の検出に必要な騒音レベル(切
り出しレベル)として、前述の従来技術のように過去の
一時点での騒音レベルで代表することなく、常に騒音状
態を測定し、その最新の状態に適合した騒音レベルを用
いるようにしたものである。
り出しレベル)として、前述の従来技術のように過去の
一時点での騒音レベルで代表することなく、常に騒音状
態を測定し、その最新の状態に適合した騒音レベルを用
いるようにしたものである。
これによシ、衝撃音や話し声などの短時間的な騒音が入
力された場合にも、それらの音によって切シ出しレベル
が影響をうけなくなる。また、長時間的な周一騒音の変
動にも追従ができるようになり、入力音声区間の正確な
切り出しが容易に行いうるようになる。
力された場合にも、それらの音によって切シ出しレベル
が影響をうけなくなる。また、長時間的な周一騒音の変
動にも追従ができるようになり、入力音声区間の正確な
切り出しが容易に行いうるようになる。
以下、本発明の実施例を第1図および第2図に基づいて
説明する。
説明する。
第1図は、本発明に係る音声区間切り出し方式が適用さ
れる音声認識装置の一実施例のブロック図、第2図は、
その騒音レベル決定に関する頻度分布図である。
れる音声認識装置の一実施例のブロック図、第2図は、
その騒音レベル決定に関する頻度分布図である。
第1図において、1は入力音声、2は音声切シ出し手段
、3は装置制御手段、4は音響分析手段、5は距離計算
手段、6は照合・判定手段、8は標準パターン格納手段
、7は認識結果である。
、3は装置制御手段、4は音響分析手段、5は距離計算
手段、6は照合・判定手段、8は標準パターン格納手段
、7は認識結果である。
従来方式では、音声切シ出し手段2において、上記した
ような過去の一時点の状態(周囲騒音)を保持し、その
値を用いて入力信号が音声であるか雑音(無音声)であ
るかを検出していた。
ような過去の一時点の状態(周囲騒音)を保持し、その
値を用いて入力信号が音声であるか雑音(無音声)であ
るかを検出していた。
本実施例では、現時点から過去の一定期間までの状態(
周囲騒音)を用いて、入力音声ノくワーについて第2図
に示すよう汝頻度分布表を作成し、最も頻度の高い騒音
レベルをもって、その時の周囲騒音レベルとして音声区
間の切り出しノくラメータとしている。すなわち、従来
方式は上記した(a)。
周囲騒音)を用いて、入力音声ノくワーについて第2図
に示すよう汝頻度分布表を作成し、最も頻度の高い騒音
レベルをもって、その時の周囲騒音レベルとして音声区
間の切り出しノくラメータとしている。すなわち、従来
方式は上記した(a)。
(b) 、 (C)などの指定された時刻に取り込まれ
るが、本実施例では時々刻々変化している状態に対応し
て適切な騒音レベルを設定するものである。
るが、本実施例では時々刻々変化している状態に対応し
て適切な騒音レベルを設定するものである。
以下、その切り出しノくラメータの決定方法について説
明する。なお、ノクラメータの内容についてハ、−例ト
して音声パワーを用いて説明することにする。
明する。なお、ノクラメータの内容についてハ、−例ト
して音声パワーを用いて説明することにする。
まず、入力音声1は、適切なプリエンファシスおよび増
幅を行った後、音響分析手段4によって音声の特徴を表
わす・4ラメータに変換される。そのパラメータの1つ
であるノζワー情報が音声切シ出し手段2に入力される
。
幅を行った後、音響分析手段4によって音声の特徴を表
わす・4ラメータに変換される。そのパラメータの1つ
であるノζワー情報が音声切シ出し手段2に入力される
。
音声切り出し手段2は、まず、このノくワー情報を用い
て現在の周囲騒音レベルを決定し、次に、人力音声の特
徴パラメータを作成する基本周期であるフレーム周期ご
とに得られるノ(ワー情報から第2図に示すような頻度
分布表を作成する。
て現在の周囲騒音レベルを決定し、次に、人力音声の特
徴パラメータを作成する基本周期であるフレーム周期ご
とに得られるノ(ワー情報から第2図に示すような頻度
分布表を作成する。
これは、パワー情報を騒音レベルとして存在し得る範囲
内でm分割し、それを横軸とし、入力・シワ−の頻度を
縦軸としたもので、現在から過去の一定期間まで遡及し
て累計したものである。第2図ではm=12の例を示す
。
内でm分割し、それを横軸とし、入力・シワ−の頻度を
縦軸としたもので、現在から過去の一定期間まで遡及し
て累計したものである。第2図ではm=12の例を示す
。
入力パワー情報が音響分析手段4から音声区間切り出し
手段2に与えられると、該当するレベルの頻度に1を加
える。もし、加えた後の値が最大値Cm、xを超える場
合には入カックワ−の各分割ごとの各頻度から1だけ減
じておく。これによシ過去から現時点までの入力音声の
騒音について累計した頻度分布表が得られる。そして、
その時の最大値Cに対応するレベルを現在の騒音レベル
と決定する。ただし、入力音声が騒音でなく音声である
とみなされた場合には、この頻度分布表は更新しないよ
うにしておく。
手段2に与えられると、該当するレベルの頻度に1を加
える。もし、加えた後の値が最大値Cm、xを超える場
合には入カックワ−の各分割ごとの各頻度から1だけ減
じておく。これによシ過去から現時点までの入力音声の
騒音について累計した頻度分布表が得られる。そして、
その時の最大値Cに対応するレベルを現在の騒音レベル
と決定する。ただし、入力音声が騒音でなく音声である
とみなされた場合には、この頻度分布表は更新しないよ
うにしておく。
このようにして得られた騒音レベルに基づいて音声区間
の切り出しレベルを設定し、入力音声の始端・終端を検
出する。
の切り出しレベルを設定し、入力音声の始端・終端を検
出する。
始端が検出されると、装置制御手段3は、音声切り出し
手段2に対して頻度分布表の作成作業の中止を指示する
とともに、距離計算手段5に対して入力特徴パラメータ
の受は取シ、および標準パターン格納手段7内の標準パ
ターンとのパターン間距離の計算を行うよう指示する。
手段2に対して頻度分布表の作成作業の中止を指示する
とともに、距離計算手段5に対して入力特徴パラメータ
の受は取シ、および標準パターン格納手段7内の標準パ
ターンとのパターン間距離の計算を行うよう指示する。
音声区間中は、その計算が続けられ、終端が音声切シ出
し手段2によって検出されると、装置制御手段3は、再
び累積頻度分布表の作成作業を続行するように指示する
。また、パターン間距離の計算を中止するようにも指示
する。
し手段2によって検出されると、装置制御手段3は、再
び累積頻度分布表の作成作業を続行するように指示する
。また、パターン間距離の計算を中止するようにも指示
する。
その間のパターン間距離の値に基づいて照合・判定手段
6は、入力音声が標準パターン内のいずれに該当するか
を認識し、その結果を認識結果8として出力する。なお
、音声切シ出し手段2では、次の音声が入力されるまで
騒音値を測定し続ける。
6は、入力音声が標準パターン内のいずれに該当するか
を認識し、その結果を認識結果8として出力する。なお
、音声切シ出し手段2では、次の音声が入力されるまで
騒音値を測定し続ける。
以上のように、本実施例によれば、音声区間の切り出し
の重要なパラメータである周囲騒音レベルを、過去の一
期間または一時点で代表することなく、常に更新するこ
とができる。したがって、周囲騒音の変動に追従するこ
とができ、最適な周囲騒音レベルに基づいて安定な音声
区間の切シ出しが可能である。なお、本実施例では、累
積した頻度分布によシ騒音レベルを決定したが、現時刻
から過去一定期間内の音声レベルの平均値を用いて決定
する方法でも実現可能である。
の重要なパラメータである周囲騒音レベルを、過去の一
期間または一時点で代表することなく、常に更新するこ
とができる。したがって、周囲騒音の変動に追従するこ
とができ、最適な周囲騒音レベルに基づいて安定な音声
区間の切シ出しが可能である。なお、本実施例では、累
積した頻度分布によシ騒音レベルを決定したが、現時刻
から過去一定期間内の音声レベルの平均値を用いて決定
する方法でも実現可能である。
以上の説明から明らかなように、本発明によれば、音声
認識装置内で常に周囲騒音が測定され、その測定値に基
づいて音声区間が決定されるので、騒音の変動に対して
も安定な音声区間切シ出し・認識ができ、この種の音声
認識装置の認識率、信頼性の向上に顕著な効果が得られ
る。
認識装置内で常に周囲騒音が測定され、その測定値に基
づいて音声区間が決定されるので、騒音の変動に対して
も安定な音声区間切シ出し・認識ができ、この種の音声
認識装置の認識率、信頼性の向上に顕著な効果が得られ
る。
第1図は、本発明に係る音声区間切シ出し方式が適用さ
れる音声認識装置の一実施例のブロック図、第2図は、
その騒音レベル決定に関する頻度分布図である。 1・・・入力音声、2・・・音声切シ出し手段、3・・
・装置制御手段、4・・・音響分析手段、5・・・距離
計算手段、6・・・照合・判定手段、7・・・標準パタ
ーン格納手段、8・・・認識結果。 イ・i 代理人 弁理士 福田幸作ど“i (ほか1名旨゛ $1 目 茅Z 固 理&め側+pへ2し
れる音声認識装置の一実施例のブロック図、第2図は、
その騒音レベル決定に関する頻度分布図である。 1・・・入力音声、2・・・音声切シ出し手段、3・・
・装置制御手段、4・・・音響分析手段、5・・・距離
計算手段、6・・・照合・判定手段、7・・・標準パタ
ーン格納手段、8・・・認識結果。 イ・i 代理人 弁理士 福田幸作ど“i (ほか1名旨゛ $1 目 茅Z 固 理&め側+pへ2し
Claims (1)
- 1、入力音声について、その音響分析をして得られた特
徴パラメータから音声区間の切シ出しを行った後、標準
音声パターンとの比較・照合・判定によって認識処理を
する音声認識装置において、常に現在から一定期間前の
過去までさかのぼって累計した入力音声パワー別の頻度
分布を記録しておき、入力音声の認識に際して、その時
の上記頻度分布の最大頻度に対応するパワーを現騒音レ
ベルとして音声区間の切り出しを行うように制御・処理
することを特徴とする音声区間終了後し方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58093911A JPS59219797A (ja) | 1983-05-30 | 1983-05-30 | 音声区間切り出し方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58093911A JPS59219797A (ja) | 1983-05-30 | 1983-05-30 | 音声区間切り出し方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS59219797A true JPS59219797A (ja) | 1984-12-11 |
Family
ID=14095654
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58093911A Pending JPS59219797A (ja) | 1983-05-30 | 1983-05-30 | 音声区間切り出し方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS59219797A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2022117374A (ja) * | 2021-01-29 | 2022-08-10 | 株式会社アイシン | 音声認識プログラム及び音声認識装置 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS57144597A (en) * | 1981-03-04 | 1982-09-07 | Fujitsu Ltd | Voice signal processor |
-
1983
- 1983-05-30 JP JP58093911A patent/JPS59219797A/ja active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS57144597A (en) * | 1981-03-04 | 1982-09-07 | Fujitsu Ltd | Voice signal processor |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2022117374A (ja) * | 2021-01-29 | 2022-08-10 | 株式会社アイシン | 音声認識プログラム及び音声認識装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS59139099A (ja) | 音声区間検出装置 | |
| EP0077194B1 (en) | Speech recognition system | |
| JPH10254476A (ja) | 音声区間検出方法 | |
| JP2000250568A (ja) | 音声区間検出装置 | |
| JPS59219797A (ja) | 音声区間切り出し方式 | |
| CN100559470C (zh) | 在数字音频信号内的微小静电干扰噪声检测 | |
| JP2666296B2 (ja) | 音声認識装置 | |
| JPH03114100A (ja) | 音声区間検出装置 | |
| CN111968623B (zh) | 气口位置检测方法及相关设备 | |
| JPH0651792A (ja) | 音声認識装置 | |
| JPS61292199A (ja) | 音声認識装置 | |
| JPS61140999A (ja) | 音声区間検出方式 | |
| JPH0376471B2 (ja) | ||
| JP2748383B2 (ja) | 音声認識方式 | |
| JPS59170894A (ja) | 音声区間の切り出し方式 | |
| JP2844592B2 (ja) | 離散単語音声認識装置 | |
| JP2901976B2 (ja) | パターン照合予備選択方式 | |
| JP2557497B2 (ja) | 男女声の識別方法 | |
| JP2891259B2 (ja) | 音声区間検出装置 | |
| JPS6239754B2 (ja) | ||
| JPS6250837B2 (ja) | ||
| JPS5911920B2 (ja) | 音声波形自動切り出し装置 | |
| JPS6267598A (ja) | 音声区間検出方式 | |
| JPS63115200A (ja) | 音声分析方式 | |
| JPS63226691A (ja) | 標準パターン作成方式 |