JPH0383100A - 音声区間の検出装置 - Google Patents
音声区間の検出装置Info
- Publication number
- JPH0383100A JPH0383100A JP1220027A JP22002789A JPH0383100A JP H0383100 A JPH0383100 A JP H0383100A JP 1220027 A JP1220027 A JP 1220027A JP 22002789 A JP22002789 A JP 22002789A JP H0383100 A JPH0383100 A JP H0383100A
- Authority
- JP
- Japan
- Prior art keywords
- threshold
- threshold value
- signal
- value
- sum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
この発明は変換器を介して得られた電気信号中に含まれ
る音声区間を検出する装置に関するものである。
る音声区間を検出する装置に関するものである。
従来の技術
音メイ信号を電気信号から切り出して、マイクロコンピ
ュータなどのデータ処理装買に入力して処理する場合が
ある。
ュータなどのデータ処理装買に入力して処理する場合が
ある。
一般的に、音声切り出し方式としては、音声信号のエネ
ルギーたとえば振幅を検出し、所定のしきい値と比較す
るレベル検出法、音声信号の零交差数や極性ビット系列
を検出し判定する方法、また、両者を複合する方法等が
用いられている。
ルギーたとえば振幅を検出し、所定のしきい値と比較す
るレベル検出法、音声信号の零交差数や極性ビット系列
を検出し判定する方法、また、両者を複合する方法等が
用いられている。
レベル検出法は音声信号の有無を判別しようとする電気
信号を比較器で所定しきい値と比較して電気信号のレベ
ルがしきい値レベルより大のとき音声信号であると判定
して、その音声信号部分を出力する。このしきい値とし
ては符号化、復号化時の音声波形からパワーを求め、有
音/無音の判定を行う場合の判定レベルであるパワーし
きい値が用いられている。
信号を比較器で所定しきい値と比較して電気信号のレベ
ルがしきい値レベルより大のとき音声信号であると判定
して、その音声信号部分を出力する。このしきい値とし
ては符号化、復号化時の音声波形からパワーを求め、有
音/無音の判定を行う場合の判定レベルであるパワーし
きい値が用いられている。
発明が解決しようとする課題
このレベル検出法は、方法が簡弔ではあるが、設定する
しきい値が大きすぎると音声区間を検出できない場合が
生じる一方、しきい値が小さずぎろと、背景雑音の大き
い場合に誤検出を起こ(7たり、子音などのエネルギー
レベルの低い部分が検出されなかったりする問題かあっ
た。
しきい値が大きすぎると音声区間を検出できない場合が
生じる一方、しきい値が小さずぎろと、背景雑音の大き
い場合に誤検出を起こ(7たり、子音などのエネルギー
レベルの低い部分が検出されなかったりする問題かあっ
た。
また従来の音声切出方式にお;子るレベル検出用のしき
い値か[司定したしのであったので前述の問題と+Rな
って背a音のレベルが大きくなると、背景音をら音Ji
であると誤って認識してしまう欠点がd5す、適切なし
きい値レベルを設2ずろことか困雅てあった。
い値か[司定したしのであったので前述の問題と+Rな
って背a音のレベルが大きくなると、背景音をら音Ji
であると誤って認識してしまう欠点がd5す、適切なし
きい値レベルを設2ずろことか困雅てあった。
この挿の音声区間切り出I2方式は、雑音による誤動作
の少ないこと、語頭語尾か欠落しないことさらに汎用マ
イクロコンピュータによって処理する為、ソフト亀(処
理時間)の少ないものが要求されていl:。
の少ないこと、語頭語尾か欠落しないことさらに汎用マ
イクロコンピュータによって処理する為、ソフト亀(処
理時間)の少ないものが要求されていl:。
この発明は上述の問題を解決して、背景雑音の大きい信
号でも音声区間を確実に認識できる音声信号切出方法を
提供することを目的とする。
号でも音声区間を確実に認識できる音声信号切出方法を
提供することを目的とする。
課題を解決セる手段
この発明は3声信号を検出しようとする信号を複数のブ
〔1ツクに分割する手段と、各ブロック中の信号間のエ
ネルギーレベルの差分絶対値和を計算する回路と、上記
絶対値和から音声信号のレベル判定用のしきい値を計算
する回路とを備えたことを特徴とする。
〔1ツクに分割する手段と、各ブロック中の信号間のエ
ネルギーレベルの差分絶対値和を計算する回路と、上記
絶対値和から音声信号のレベル判定用のしきい値を計算
する回路とを備えたことを特徴とする。
作用
この発明においては、音声信号を検出しようとする信号
を複数のブロックに分割して、ブロック中の信号間のエ
ネルギーレベルの差分絶対値和を特徴量として、音声信
号のレベル判定用のしきい値を上記特徴量から決定する
。特徴量としきい値設定は以下の計算による。
を複数のブロックに分割して、ブロック中の信号間のエ
ネルギーレベルの差分絶対値和を特徴量として、音声信
号のレベル判定用のしきい値を上記特徴量から決定する
。特徴量としきい値設定は以下の計算による。
特徴量
音声信号をあるブロックに区切り、同一ブロック内の隣
合った音声信号の差分絶対値和を音声区間切り出しの特
!kiFとする。
合った音声信号の差分絶対値和を音声区間切り出しの特
!kiFとする。
t
ブロックのインデックス。
(0,1,2,3,・・・)
時間tの時の音声信号振幅。
ブロック中の音声信号の数。Fが安定
した値になるように1ビッヂ以上の長
さとした。
80(8KHzサンプリングで10m5ec)しきい値
設定 1v3λWgによる誤検出を防ぐために、しきい値T
1−(を背1☆堆跨レベルによって適応的に設定する。
設定 1v3λWgによる誤検出を防ぐために、しきい値T
1−(を背1☆堆跨レベルによって適応的に設定する。
CNT N0ISEブロツク長の背景雑音を入力し、そ
の平均特徴量F゛から次式により設定する。
の平均特徴量F゛から次式により設定する。
TH=G(F’)
−・例として CN T N0ISE
り長。lOブロックとした。
G(x) = 1.25*X→500 (X≧550
)= 1200 (X< 550)とした
。
)= 1200 (X< 550)とした
。
背は雑音人カブロソ
実施例
第1図において、音声データは適宜な時間間隔てサンプ
リングされたものである。
リングされたものである。
1は一つ前のサンプリング時期における音声データを入
れておく直前データレジスタ、2は当該サンプリング時
期に入力される音声データの値と直前データレジスタか
ら印加される一つホfのサンプリング時期の音声データ
の値の差分絶対値を計算する回路、 3は差分絶対値と差分絶対値和を加算する加算回路、 4は差分絶対値和から計算によりしきい値を計算する回
路、 5は定数1と差分絶対値和を比較するコンパレータ、 6はしきい値を保持するレジスタ、 7は計算回路3から得た信号から音声データを切り出す
コンパレータであり、しきい値としてはしきい値レジス
タ6から得られたしきい値をmいる。各ビットは電源ラ
インやグランドラインに接続する。背景音が全くない場
合でも、ある一定の値をしきい値としてセットする。そ
の一定の値か定数2である。しきい値として定数2を採
用するかどうかを判定するのに使用する値が定数1であ
る。
れておく直前データレジスタ、2は当該サンプリング時
期に入力される音声データの値と直前データレジスタか
ら印加される一つホfのサンプリング時期の音声データ
の値の差分絶対値を計算する回路、 3は差分絶対値と差分絶対値和を加算する加算回路、 4は差分絶対値和から計算によりしきい値を計算する回
路、 5は定数1と差分絶対値和を比較するコンパレータ、 6はしきい値を保持するレジスタ、 7は計算回路3から得た信号から音声データを切り出す
コンパレータであり、しきい値としてはしきい値レジス
タ6から得られたしきい値をmいる。各ビットは電源ラ
インやグランドラインに接続する。背景音が全くない場
合でも、ある一定の値をしきい値としてセットする。そ
の一定の値か定数2である。しきい値として定数2を採
用するかどうかを判定するのに使用する値が定数1であ
る。
8は音声データをいくつ読んだかを記憶するカウンタ、
9は全体の処理フローをコントロールし、各しノスタに
対して値をセットするための信号を発するコントローラ
である。
対して値をセットするための信号を発するコントローラ
である。
11は語頭検出のためのカウンタで、THより大きい総
和をもつブロックからのブロック数を数えるカウンタ、 I2は語頭検出のためのカウンタで、THより大きい総
和をもつブロックの数を数えるカウンタ、13はバース
ト誤り検出のためのカウンタて、語頭が見つか、ってか
らのブロックの数を数えるカウンタで、このカウンタの
内容がある値を超えないと音声区間と認められない。
和をもつブロックからのブロック数を数えるカウンタ、 I2は語頭検出のためのカウンタで、THより大きい総
和をもつブロックの数を数えるカウンタ、13はバース
ト誤り検出のためのカウンタて、語頭が見つか、ってか
らのブロックの数を数えるカウンタで、このカウンタの
内容がある値を超えないと音声区間と認められない。
14は語尾を見つけるためのカウンタで、T)fより小
さいブロックの数を数えるカウンタである。
さいブロックの数を数えるカウンタである。
第2図は音声区間の検出を行うための比較器7用のしき
い値を算出する処理フローチャートである。
い値を算出する処理フローチャートである。
ステップS】で音声データを1つ績み込んで、ステップ
S2で直前データとステップSlで読み込んだ音声デー
タとの差分絶対値を差分絶対値計算回路2で計算し、ス
テップS2で計算された差分絶対値をステップS3で、
計算回路3を用いて差分絶対値和に加算4−る。ステッ
プS4でデータカウンタ8が決められた値nになったか
どうか判定し、もしnになっていればステップS6にと
ぶ。
S2で直前データとステップSlで読み込んだ音声デー
タとの差分絶対値を差分絶対値計算回路2で計算し、ス
テップS2で計算された差分絶対値をステップS3で、
計算回路3を用いて差分絶対値和に加算4−る。ステッ
プS4でデータカウンタ8が決められた値nになったか
どうか判定し、もしnになっていればステップS6にと
ぶ。
データカウンタがnより小さいときはステップS5へ進
む。そしてデータカウンタ8を1インクリメントし、今
回のサンプリングで得た音声データの値を直前データレ
ジスタ1iこセットしてステップS1へ戻る。
む。そしてデータカウンタ8を1インクリメントし、今
回のサンプリングで得た音声データの値を直前データレ
ジスタ1iこセットしてステップS1へ戻る。
ステップS6では差分絶対値和をブロック数(ある決ま
った音声の個数aでlブロックとし、そのブロックを決
まった個数す集めて差分絶対値とする。我々の場合a−
128,b=8とした。)で割り平均をとる。
った音声の個数aでlブロックとし、そのブロックを決
まった個数す集めて差分絶対値とする。我々の場合a−
128,b=8とした。)で割り平均をとる。
ステップS6で計算した平均がある値α(定数1)より
大きいかどうかをステップS7で比較器5により判定す
る。ステップS6で計算した平均よりαか大きいときは
ステップS8へ、そうでないときはステップS9へとぶ
。平均よりαが大きいのは背景雑音の大きいときであり
、マルチプレクサ15をしきい漬汁算回路4側に切り換
える。
大きいかどうかをステップS7で比較器5により判定す
る。ステップS6で計算した平均よりαか大きいときは
ステップS8へ、そうでないときはステップS9へとぶ
。平均よりαが大きいのは背景雑音の大きいときであり
、マルチプレクサ15をしきい漬汁算回路4側に切り換
える。
平均よりαが小さいのは背景雑音の小さいときであり、
マルチプレクサ15を定数2側へ切り換えろ。
マルチプレクサ15を定数2側へ切り換えろ。
ステップS8では計算式をもとにしきい値をしきい漬汁
算回路4で計算し、それをしきい値レノスタ6にセット
する。計算式は一例としてしきい値−125×平均値+
500/16)を用いた。
算回路4で計算し、それをしきい値レノスタ6にセット
する。計算式は一例としてしきい値−125×平均値+
500/16)を用いた。
上記のようにして、このしきい値は比較器7に印加され
て、加算和計算回路3から印加されるデータ信号と比較
され、比較器7はこのしきい値を越えるデータ信号を音
声データ信号として出力する。これによって入力される
データ信号から音声データの切出しが行なわれる。
て、加算和計算回路3から印加されるデータ信号と比較
され、比較器7はこのしきい値を越えるデータ信号を音
声データ信号として出力する。これによって入力される
データ信号から音声データの切出しが行なわれる。
しきい値を計算したあと、音声区間の判定は次の様に行
なう。
なう。
(語頭)
隣接するデータ間で差分絶対値を計算し、lブロック分
の差分絶対値の総和Sを計算する。しきい値THよりS
のほうが大きいブロックが連続するT HD (定数)
ブロック中に、T HT H(定数)ブロック以上あれ
ば、語頭とする。実際には、語頭が見つかった時点より
ある一定時間さかのぼった時点を語頭とする。
の差分絶対値の総和Sを計算する。しきい値THよりS
のほうが大きいブロックが連続するT HD (定数)
ブロック中に、T HT H(定数)ブロック以上あれ
ば、語頭とする。実際には、語頭が見つかった時点より
ある一定時間さかのぼった時点を語頭とする。
(語尾検出)
T HENDブロック長中に、しきい値THより大きい
特徴量のブロックがなければ、その最初を語尾とする。
特徴量のブロックがなければ、その最初を語尾とする。
(バースト検出)
語頭と語尾の間隔が一定時間より短ずぎる場合は、バー
スト誤りとして音声区間とはみなさない。
スト誤りとして音声区間とはみなさない。
これは舌打ち音などの突発的な雑音をジェクトするため
である。
である。
なお第1図に示した回路において、直前データレジスタ
1、計算回路2,3.4は音声区間の切出しにもしきい
値の計算にもこれらの回路を音声データ信号とデータ信
号とに対して時分割的に使用することによって共用する
ことができる。
1、計算回路2,3.4は音声区間の切出しにもしきい
値の計算にもこれらの回路を音声データ信号とデータ信
号とに対して時分割的に使用することによって共用する
ことができる。
発明の効果
本発明は、音声区間の切り出しを行うとき、音声区間か
どうかの判定を行うためのしきい値をその時り背景音を
考慮して自動的に変更1−て設定できるよう1こしノニ
のて、雑音の多いところでも事17g:よく音声区間の
切ζ)出しが行えるようにすることができる。
どうかの判定を行うためのしきい値をその時り背景音を
考慮して自動的に変更1−て設定できるよう1こしノニ
のて、雑音の多いところでも事17g:よく音声区間の
切ζ)出しが行えるようにすることができる。
第1図はこの発明の音声区間の切出方法に用いられる装
置の一例を示すブロック図、第2図は第1図の装置の動
作を示すフ〔1−ヂャート、第3[4は音声区間の一例
を示す波形図である。 l・・・直前データレノスタ、 2・差分絶対値計算回路、 3・・加算回路、 4 しきい漬汁算回路、 5・比較器、 6・・しきい値レンスタ、 7・・比較器、 8・・・データカウンタ、 9・・制御回路。 第2図
置の一例を示すブロック図、第2図は第1図の装置の動
作を示すフ〔1−ヂャート、第3[4は音声区間の一例
を示す波形図である。 l・・・直前データレノスタ、 2・差分絶対値計算回路、 3・・加算回路、 4 しきい漬汁算回路、 5・比較器、 6・・しきい値レンスタ、 7・・比較器、 8・・・データカウンタ、 9・・制御回路。 第2図
Claims (1)
- (1)音声信号を検出しようとする信号を複数のブロッ
クに分割する手段と、各ブロック中の信号間のエネルギ
ーレベルの差分絶対値和を計算する回路と、上記絶対値
和から音声信号のレベル判定用のしきい値を計算する回
路とを備えたことを特徴とする音声区間検出装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1220027A JPH0383100A (ja) | 1989-08-25 | 1989-08-25 | 音声区間の検出装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1220027A JPH0383100A (ja) | 1989-08-25 | 1989-08-25 | 音声区間の検出装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0383100A true JPH0383100A (ja) | 1991-04-09 |
Family
ID=16744790
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1220027A Pending JPH0383100A (ja) | 1989-08-25 | 1989-08-25 | 音声区間の検出装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0383100A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008176155A (ja) * | 2007-01-19 | 2008-07-31 | Kddi Corp | 音声認識装置およびその発声判定方法、発声判定プログラムならびにその記憶媒体 |
| US10604730B2 (en) | 2015-10-16 | 2020-03-31 | Terressentia Corporation | Alcoholic beverage maturing device |
-
1989
- 1989-08-25 JP JP1220027A patent/JPH0383100A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008176155A (ja) * | 2007-01-19 | 2008-07-31 | Kddi Corp | 音声認識装置およびその発声判定方法、発声判定プログラムならびにその記憶媒体 |
| US10604730B2 (en) | 2015-10-16 | 2020-03-31 | Terressentia Corporation | Alcoholic beverage maturing device |
| US11649422B2 (en) | 2015-10-16 | 2023-05-16 | Green River Spirits Company | Alcoholic beverage maturing device |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0713584A (ja) | 音声検出装置 | |
| EP2328143B1 (en) | Human voice distinguishing method and device | |
| JPH0383100A (ja) | 音声区間の検出装置 | |
| JPS63163495A (ja) | 音声区間検出装置 | |
| JPS6041099A (ja) | 音声区間切り出し方式 | |
| SU1781701A1 (en) | Method of separation of speech and nonstationary noise signals | |
| JPH05100661A (ja) | 小節境界時刻抽出装置 | |
| JP2891259B2 (ja) | 音声区間検出装置 | |
| JPS62141595A (ja) | 音声検出方式 | |
| JP2557497B2 (ja) | 男女声の識別方法 | |
| JPS60168200A (ja) | ピツチ抽出装置 | |
| JPS61233791A (ja) | 音声認識装置における音声区間検出方式 | |
| JPS59105697A (ja) | 音声認識装置 | |
| JPS62238599A (ja) | 音声区間検出方法 | |
| JP2602641B2 (ja) | 音声符号化方式 | |
| JPH0443277B2 (ja) | ||
| JPH04130500A (ja) | 音声信号の判別方法 | |
| JPH0376471B2 (ja) | ||
| JPS6217800A (ja) | 音声区間判定方式 | |
| JPS61259296A (ja) | 音声区間検出方式 | |
| JPH09292894A (ja) | 音声認識方法及び装置 | |
| JPS6256998A (ja) | 子音区間検出装置 | |
| JPS59180594A (ja) | 音声認識装置 | |
| JPS60101598A (ja) | 音声区間検出装置 | |
| JPH06175676A (ja) | 音声検出器 |