JPS63281200A - 音声区間検出方式 - Google Patents
音声区間検出方式Info
- Publication number
- JPS63281200A JPS63281200A JP62115990A JP11599087A JPS63281200A JP S63281200 A JPS63281200 A JP S63281200A JP 62115990 A JP62115990 A JP 62115990A JP 11599087 A JP11599087 A JP 11599087A JP S63281200 A JPS63281200 A JP S63281200A
- Authority
- JP
- Japan
- Prior art keywords
- threshold
- sound
- lpc
- signal
- average power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003044 adaptive effect Effects 0.000 claims description 39
- 239000013598 vector Substances 0.000 claims description 20
- 238000001514 detection method Methods 0.000 claims description 17
- 230000005236 sound signal Effects 0.000 claims description 6
- 206010019133 Hangover Diseases 0.000 description 14
- 101150102700 pth2 gene Proteins 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000007257 malfunction Effects 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 101000774560 Crotalus atrox Zinc metalloproteinase-disintegrin-like VAP1 Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Landscapes
- Selective Calling Equipment (AREA)
- Alarm Systems (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、ディジタル通信分野のディジタル音声挿入シ
ステム、或いは音声パケットシステムにおける音声区間
の検出方式に関するものである。
ステム、或いは音声パケットシステムにおける音声区間
の検出方式に関するものである。
(従来の技術)
従来、音声区間検出方式に適用される音声検出器として
は第2図に示すものが知られている。第2図によれば、
入力端子1に入力された入力サンプル信号Aのうち、母
音等の比較的振幅の大きい信号AIは、振幅検出部2に
入力され、摩擦性子音による信号A2は、DC抑圧回路
4でオフセットを取り除かれた後、一定値aを加えその
符号ビットを取り出したものが零交差検出部3に入力さ
れる。振幅検出部2では、比較回路2aで信号Alの絶
対値と所定値θとの大小の比較をなし、その結果により
カウンタ2bを増減させ、このカウンタ2bのカウンタ
値が閾値THvより大きくなると、閾値回路2Cから出
力αVを高レベル「1」でOR回路5に出力する。一方
、零交差検出部3では、OR回路3aにて入力した符号
ビットと1サンプル前の符号ビットとの一致を判別し、
この結果が一致、不一致かによりカウンタ3bを増減さ
せる。このことは、入力が(−a)を横切る回数を数え
ることと等価であり、カウンタ3bのカウンタ値が閾値
THzより大きくなると、閾値回路2Cから出力α2を
高レベル「1」でOR回路5に出力する。このOR回路
5から閾値回路2C及び3Cからの出力αV及びα2と
の論理和αがハングオーバ制御回路6に入力され、ハン
グオーバ制御回路6にてOR回路5の出力αが高レベル
「1」から低レベル「0」になったとしても、一定時間
高レベル「1」を出力し続けるハングオーバ時間が付加
されて、出力端子7から出力αoutとして出力する。
は第2図に示すものが知られている。第2図によれば、
入力端子1に入力された入力サンプル信号Aのうち、母
音等の比較的振幅の大きい信号AIは、振幅検出部2に
入力され、摩擦性子音による信号A2は、DC抑圧回路
4でオフセットを取り除かれた後、一定値aを加えその
符号ビットを取り出したものが零交差検出部3に入力さ
れる。振幅検出部2では、比較回路2aで信号Alの絶
対値と所定値θとの大小の比較をなし、その結果により
カウンタ2bを増減させ、このカウンタ2bのカウンタ
値が閾値THvより大きくなると、閾値回路2Cから出
力αVを高レベル「1」でOR回路5に出力する。一方
、零交差検出部3では、OR回路3aにて入力した符号
ビットと1サンプル前の符号ビットとの一致を判別し、
この結果が一致、不一致かによりカウンタ3bを増減さ
せる。このことは、入力が(−a)を横切る回数を数え
ることと等価であり、カウンタ3bのカウンタ値が閾値
THzより大きくなると、閾値回路2Cから出力α2を
高レベル「1」でOR回路5に出力する。このOR回路
5から閾値回路2C及び3Cからの出力αV及びα2と
の論理和αがハングオーバ制御回路6に入力され、ハン
グオーバ制御回路6にてOR回路5の出力αが高レベル
「1」から低レベル「0」になったとしても、一定時間
高レベル「1」を出力し続けるハングオーバ時間が付加
されて、出力端子7から出力αoutとして出力する。
このαoutが高レベル「1」である間は有音であり、
低レベル「0」であれば無音である(昭和51年度電子
通信学会総合全国大会、1753 r零交差頻度を利
用した音声検出の一方式」荒関 卓、落合和雄)。
低レベル「0」であれば無音である(昭和51年度電子
通信学会総合全国大会、1753 r零交差頻度を利
用した音声検出の一方式」荒関 卓、落合和雄)。
(発明が解決しようとする問題点)
しかしながら、上記構成によれば、零交差回数は、入力
サンプル信号Aが一定値(−a)を横切る回数を数えて
いるので、正確な入力サンプル列もスペクトル分布の推
定とはならない。即ち、回線雑音と音声信号とが同じ零
交差数を持ったとしても、聴感上では有意なスペクトル
分布の違いが生じる可能性があり、音声区間の切り出し
が不正確になるという間通点があった。更に、音声区間
検出に零交差情報を用いているので、ハングオーバ時間
を大きく短縮することができず、このため全通話時間に
占める有音部分の割合いが高くなってしまい、ディジタ
ル音声挿入システム或いは音声パケットシステムの様に
、無音部分に他の音声やデータを伝送することにより伝
送路の有効利用を図るシステムにおいては、より一層の
効率化が期待できないという問題点があった。
サンプル信号Aが一定値(−a)を横切る回数を数えて
いるので、正確な入力サンプル列もスペクトル分布の推
定とはならない。即ち、回線雑音と音声信号とが同じ零
交差数を持ったとしても、聴感上では有意なスペクトル
分布の違いが生じる可能性があり、音声区間の切り出し
が不正確になるという間通点があった。更に、音声区間
検出に零交差情報を用いているので、ハングオーバ時間
を大きく短縮することができず、このため全通話時間に
占める有音部分の割合いが高くなってしまい、ディジタ
ル音声挿入システム或いは音声パケットシステムの様に
、無音部分に他の音声やデータを伝送することにより伝
送路の有効利用を図るシステムにおいては、より一層の
効率化が期待できないという問題点があった。
本発明の目的は、上記問題点に鑑み、ハングオーバ時間
の短縮化が図れるとともに、的確に音声区間を検出でき
る音声区間検出方式を提供することにある。
の短縮化が図れるとともに、的確に音声区間を検出でき
る音声区間検出方式を提供することにある。
(問題点を解決するための手段)
本発明は、上記目的を達成するために、入力サンプル信
号の回線雑音と音声信号との識別をなし、音声信号を検
出する音声区間検出方式において、入力サンプル信号を
所定のフレーム長に区切り、各フレームのLPC分析を
なし、各フレームの平均パラとLPC係数を算出する分
析手段と、前記LPC係数と予め設定した標準ベクトル
とのLPC距離と予め設定した閾値との比較をなし、L
PC距離が該閾値よりも大きいならば有音と判定する第
1の判定手段と、前記平均パワと予め設定した閾値との
比較をなし、平均パワが該閾値よりも大きいならば有音
と判定する第2の判定手段と、前記平均バラと所定範囲
で更新可能な適応パワ閾値との比較をなし、平均パワが
該適応パワ閾値よりも大きいならば有音と判定する第3
の判定手段と、前記第1.第2及び第3の判定手段によ
る判定結果に基づいて音声信号の有音・無音の判定をな
すとともに、有音及び無音の各フレーム数を計数する第
4の判定手段と、前記第4の判定手段からの指示により
、適応パワ閾値を算出し、これを更新する更新手段とを
備え、前記更新手段は、連続する無音フレーム数が予め
設定した指定数に達するか、前記第1及び第2の判定手
段による判定が無音であり、かつ前記第3の判定手段に
より有音と判定されたフレームが連続しその数が前記指
定数に達した時に適応パワ閾値を更新するようになした
ことを特徴とする。
号の回線雑音と音声信号との識別をなし、音声信号を検
出する音声区間検出方式において、入力サンプル信号を
所定のフレーム長に区切り、各フレームのLPC分析を
なし、各フレームの平均パラとLPC係数を算出する分
析手段と、前記LPC係数と予め設定した標準ベクトル
とのLPC距離と予め設定した閾値との比較をなし、L
PC距離が該閾値よりも大きいならば有音と判定する第
1の判定手段と、前記平均パワと予め設定した閾値との
比較をなし、平均パワが該閾値よりも大きいならば有音
と判定する第2の判定手段と、前記平均バラと所定範囲
で更新可能な適応パワ閾値との比較をなし、平均パワが
該適応パワ閾値よりも大きいならば有音と判定する第3
の判定手段と、前記第1.第2及び第3の判定手段によ
る判定結果に基づいて音声信号の有音・無音の判定をな
すとともに、有音及び無音の各フレーム数を計数する第
4の判定手段と、前記第4の判定手段からの指示により
、適応パワ閾値を算出し、これを更新する更新手段とを
備え、前記更新手段は、連続する無音フレーム数が予め
設定した指定数に達するか、前記第1及び第2の判定手
段による判定が無音であり、かつ前記第3の判定手段に
より有音と判定されたフレームが連続しその数が前記指
定数に達した時に適応パワ閾値を更新するようになした
ことを特徴とする。
(作 用)
本発明によれば、分析手段により入力サンプル信号を所
定長のフレームに区切り、このフレームのLPC分析を
行なって平均バラとLPC係数を算出し、第1の判定手
段は、このLPC係数と予め設定しである標準ベクトル
とのLPC距離と予め設定した閾値との大小の比較を行
ないLPC距離に基づく有音・無音の判定を行う。第2
の判定手段はフレームの平均パワと予め設定した閾値と
の大小の比較を行い、フレームの平均パワに基づく有音
・無音の判定を行ない、更に、第3の判定手段では、フ
レームの平均バラと更新手段よりの適応パワ閾値との大
小の比較を行い、適応パワ閾値に基づく有音・無音の判
定を行う。ここで、第4の判定手段が以上の第1.第2
及び第3の判定手段の各々の判定結果を統合して音声信
号の有音・無音の判定を行ない音声が検出される。
定長のフレームに区切り、このフレームのLPC分析を
行なって平均バラとLPC係数を算出し、第1の判定手
段は、このLPC係数と予め設定しである標準ベクトル
とのLPC距離と予め設定した閾値との大小の比較を行
ないLPC距離に基づく有音・無音の判定を行う。第2
の判定手段はフレームの平均パワと予め設定した閾値と
の大小の比較を行い、フレームの平均パワに基づく有音
・無音の判定を行ない、更に、第3の判定手段では、フ
レームの平均バラと更新手段よりの適応パワ閾値との大
小の比較を行い、適応パワ閾値に基づく有音・無音の判
定を行う。ここで、第4の判定手段が以上の第1.第2
及び第3の判定手段の各々の判定結果を統合して音声信
号の有音・無音の判定を行ない音声が検出される。
また、第4の判定手段は、有音及び無音の各フレーム数
を計数して、連続する無音フレーム数が予め設定した指
定数に達するか、前記第1及び第2の判定手段による判
定が無音であり、かつ前記第3の判定手段により有音と
判定されたフレームが連続し、その数が前記指定数に達
した時に更新手段に適応パワ閾値の更新を指示し、これ
により更新手段により、適応パワ閾値の算出、更新が行
なわれる。
を計数して、連続する無音フレーム数が予め設定した指
定数に達するか、前記第1及び第2の判定手段による判
定が無音であり、かつ前記第3の判定手段により有音と
判定されたフレームが連続し、その数が前記指定数に達
した時に更新手段に適応パワ閾値の更新を指示し、これ
により更新手段により、適応パワ閾値の算出、更新が行
なわれる。
(実施例)
第1図は、本発明による音声区間検出方式が適用される
音声検出器の一実施例を示すブロック図である。図中、
1は入力端子、7は出力端子、10はLPC分析部、1
1はLPC距離算出部、12は標準ベクトルメモリ、1
3,14.16は比較部、15は適応パワ閾値更新部、
17は有音・無音判定部、18はハングオーバ時間付加
部である。
音声検出器の一実施例を示すブロック図である。図中、
1は入力端子、7は出力端子、10はLPC分析部、1
1はLPC距離算出部、12は標準ベクトルメモリ、1
3,14.16は比較部、15は適応パワ閾値更新部、
17は有音・無音判定部、18はハングオーバ時間付加
部である。
LPC分析部10は、入力サンプル信号Aを入力して所
定のフレーム長に区切りLPC分析を行ないLPC分析
フレームの自己相関係数R1及びLPC係数kiを算出
し、自己相関係数行列IR及びLPC係数ベクトル1に
として、LPC距離算出部11に送出するとともに、第
0次の自己相関係数ROをLPC分析フレームの平均パ
ワとして、比較部14.16及び適応パワ閾値更新部1
5に送出する。
定のフレーム長に区切りLPC分析を行ないLPC分析
フレームの自己相関係数R1及びLPC係数kiを算出
し、自己相関係数行列IR及びLPC係数ベクトル1に
として、LPC距離算出部11に送出するとともに、第
0次の自己相関係数ROをLPC分析フレームの平均パ
ワとして、比較部14.16及び適応パワ閾値更新部1
5に送出する。
LPC距離算出部11は、LPC分析部10からの自己
相関係数行列IR,LPC係数ベクトル1k及び標準ベ
クトルメモリ12に格納しである標準LPC係数ベクト
ル1bとから下記(1)式に従いLPC距離りを算出し
、その結果を比較部13に送出する。
相関係数行列IR,LPC係数ベクトル1k及び標準ベ
クトルメモリ12に格納しである標準LPC係数ベクト
ル1bとから下記(1)式に従いLPC距離りを算出し
、その結果を比較部13に送出する。
(lk−1b)・IRI・ (lk −1b ”) t
D −(1) lk ・IR−Ikt 但し、lk−(1,kl 、に2 、 ・・・、kp
)lb−(1,bl 、b2 、・・・、bp)IR−
(Rlj) Rlj−R11−j l (t、 j−0+
・・・、 p)Σ x (n) ・ x (
n+1)R1−□ 尚、NはLPC分析フレームのサンプル数、X(1)は
入力信号のサンプル値、pはLPC分析の分析次数、R
1はLPC分析フレームの第1次の自己相関係数、kl
は第1次のLPC係数、blは第1次の標準LPC係数
、nはLPC分析フレームの番号、tはベクトルの転置
を示す記号である。(上記(1)式は、昭和58年4月
15日、■コロナ社より発行の「音声のディジタル信号
処理(下)JP269−P271、の式9−21参照、
著者り、 R,Rablner 、 R,W、 5ch
af’er s訳者:鈴木久喜)。
D −(1) lk ・IR−Ikt 但し、lk−(1,kl 、に2 、 ・・・、kp
)lb−(1,bl 、b2 、・・・、bp)IR−
(Rlj) Rlj−R11−j l (t、 j−0+
・・・、 p)Σ x (n) ・ x (
n+1)R1−□ 尚、NはLPC分析フレームのサンプル数、X(1)は
入力信号のサンプル値、pはLPC分析の分析次数、R
1はLPC分析フレームの第1次の自己相関係数、kl
は第1次のLPC係数、blは第1次の標準LPC係数
、nはLPC分析フレームの番号、tはベクトルの転置
を示す記号である。(上記(1)式は、昭和58年4月
15日、■コロナ社より発行の「音声のディジタル信号
処理(下)JP269−P271、の式9−21参照、
著者り、 R,Rablner 、 R,W、 5ch
af’er s訳者:鈴木久喜)。
標準ベクトルメモリー2には、前記標準LPC係数ベク
トル1bが格納されており、この標準LPC係数ベクト
ル1bは、回線雑音を白色雑音とし、この白色雑音の実
測データから決定したものである。
トル1bが格納されており、この標準LPC係数ベクト
ル1bは、回線雑音を白色雑音とし、この白色雑音の実
測データから決定したものである。
比較部13は、LPC距離算出部11からのLPC距離
りと閾値Dthとの比較をなし、下記(2)式に従い、
LPC距離りが閾値Dthよりも大きい場合は、LPC
距離りに基づく有音、無音の判定信号VDを有音を示す
高レベル「1」とし、LPC距離が閾値pthと等しい
か或いは小さい場合は、判定信号VDを無音を示す低レ
ベル「0」として有音・無音判定部17に送出する。
りと閾値Dthとの比較をなし、下記(2)式に従い、
LPC距離りが閾値Dthよりも大きい場合は、LPC
距離りに基づく有音、無音の判定信号VDを有音を示す
高レベル「1」とし、LPC距離が閾値pthと等しい
か或いは小さい場合は、判定信号VDを無音を示す低レ
ベル「0」として有音・無音判定部17に送出する。
VD −1(D>Dth) (2)0 (D
≦D th) 尚、閾値D−thは、LPC距離りがLPC係数ベクト
ル1k及び標準LPC係数ベクトル1bとがもつスペク
トル包絡の形が類似しておれば小さな値をもち、相違し
ておれば大きな値をもつ傾向があり、従って、LPC距
離りが大きいならば、入力フレームは白色的信号ではな
く有色性の信号、即ち音声信号として判断でき、このス
ペクトル分布の違いを利用して音声信号を検出するため
にLPC距離りに対して設けられたものである。
≦D th) 尚、閾値D−thは、LPC距離りがLPC係数ベクト
ル1k及び標準LPC係数ベクトル1bとがもつスペク
トル包絡の形が類似しておれば小さな値をもち、相違し
ておれば大きな値をもつ傾向があり、従って、LPC距
離りが大きいならば、入力フレームは白色的信号ではな
く有色性の信号、即ち音声信号として判断でき、このス
ペクトル分布の違いを利用して音声信号を検出するため
にLPC距離りに対して設けられたものである。
比較部14は、LPC分析部10からのLPC分析フレ
ームの平均パワ、即ち、第0次の自己相関係数ROと第
1の閾値p thi及び第2の閾値Pth2との比較を
なし、下記(3)式に従い、自己相関係数ROが閾値p
thtよりも大きい場合は、LPC分析フレームの平
均パワに基づく有音、無音の判定信号Vpを有音を示す
高レベル「1」とし、自己相関係数ROが第1の閾値P
thlと等しいか小さく、かつ第2の閾値P th2
よりも大きいか等しい場合は、検出信号Vpを無音を示
す低L/ベルrOJとし、更に、自己相関係数ROが閾
値Pth2より小さい場合は、検出信号Vpを同じく無
音を示す低レベル「−1」として有音・無音判定部17
に送出する。
ームの平均パワ、即ち、第0次の自己相関係数ROと第
1の閾値p thi及び第2の閾値Pth2との比較を
なし、下記(3)式に従い、自己相関係数ROが閾値p
thtよりも大きい場合は、LPC分析フレームの平
均パワに基づく有音、無音の判定信号Vpを有音を示す
高レベル「1」とし、自己相関係数ROが第1の閾値P
thlと等しいか小さく、かつ第2の閾値P th2
よりも大きいか等しい場合は、検出信号Vpを無音を示
す低L/ベルrOJとし、更に、自己相関係数ROが閾
値Pth2より小さい場合は、検出信号Vpを同じく無
音を示す低レベル「−1」として有音・無音判定部17
に送出する。
1 (RO>Pthl)
Vp −0(Pthl ≧RO≧Pth2 ) (
3)−1(Pth2 >RO) (但し、pthl > Pth2 ) 適応パワ閾値更新部15は前記LPC分析フレームの平
均パワである第0次の自己相関係数ROを入力するとと
もに、有音・無音判定部17から送出されてくる制御信
号CAPの指示により下記(4)式に従って、後述する
条件により連続するMAP個のLPC分析フレームの平
均レベルに基づき適応パワ閾値PAPを算出、更新し、
この適応パワ閾値PAPを比較部16に送出する。また
適応パワ閾値PAPの可変範囲は、前記閾値P thl
以下かつP th2以上であり、閾値P thlより大
きくなった時は閾値P thlの値に、閾値P th2
より小さくなった時は、閾値P th2の値に保持する
。
3)−1(Pth2 >RO) (但し、pthl > Pth2 ) 適応パワ閾値更新部15は前記LPC分析フレームの平
均パワである第0次の自己相関係数ROを入力するとと
もに、有音・無音判定部17から送出されてくる制御信
号CAPの指示により下記(4)式に従って、後述する
条件により連続するMAP個のLPC分析フレームの平
均レベルに基づき適応パワ閾値PAPを算出、更新し、
この適応パワ閾値PAPを比較部16に送出する。また
適応パワ閾値PAPの可変範囲は、前記閾値P thl
以下かつP th2以上であり、閾値P thlより大
きくなった時は閾値P thlの値に、閾値P th2
より小さくなった時は、閾値P th2の値に保持する
。
l NAP
P AP−M APX −Σ D R0(S) (
4)NAP S−1 但し、MAPは定数、NAPは後述するカウンタで計数
する予め設定しである連続するフレームの指定数、D
R0(S)は連続するMAP個のLPC分析フレームの
平均パワを示す。
4)NAP S−1 但し、MAPは定数、NAPは後述するカウンタで計数
する予め設定しである連続するフレームの指定数、D
R0(S)は連続するMAP個のLPC分析フレームの
平均パワを示す。
比較部16は、適応パワ閾値PAPとLPC分析フレー
ムの平均パワである第0次の自己相関係数ROとを入力
して両者の比較をなし、下記(5)式に従い、自己相関
係数ROが適応パワ閾値PAPよりも大きい場合は、適
応パワ閾値に基づく判定信号VAPを有音を宗す高レベ
ル「1」とし、また自己相関係数ROが適応パワ閾値P
APよりも等しいか小さい場合は、判定信号VAPを無
音を示す低レベル「0」と、L、て有音・無音判定部1
7に送出する。
ムの平均パワである第0次の自己相関係数ROとを入力
して両者の比較をなし、下記(5)式に従い、自己相関
係数ROが適応パワ閾値PAPよりも大きい場合は、適
応パワ閾値に基づく判定信号VAPを有音を宗す高レベ
ル「1」とし、また自己相関係数ROが適応パワ閾値P
APよりも等しいか小さい場合は、判定信号VAPを無
音を示す低レベル「0」と、L、て有音・無音判定部1
7に送出する。
VAP −1(RO>PAP) (5)0
(RO≦P AP) (但し、P thl ≧PAP≧Pth2)有音・無音
判定部17は、比較部13からのLPC距HDに基づく
判定信号VD、比較部14からのLPCフレームの平均
パワに基づく判定信号■P及び比較部16からの適応パ
ワ閾値PAPに基づく判定信号VAPを入力して、下記
(6)式に従い、判定信号VD 、 VP 、 VAP
の和が0より大きい場合は、有音と判定して有音・無音
判定信号Vを高レベル「1」とし、また判定信号VD、
VP、VAPの和がrOJかrOJより小さい場合は、
無音と判定して有音・無音判定信号Vを低レベルrOJ
としてハングオーバ時間付加部18に送出する。
(RO≦P AP) (但し、P thl ≧PAP≧Pth2)有音・無音
判定部17は、比較部13からのLPC距HDに基づく
判定信号VD、比較部14からのLPCフレームの平均
パワに基づく判定信号■P及び比較部16からの適応パ
ワ閾値PAPに基づく判定信号VAPを入力して、下記
(6)式に従い、判定信号VD 、 VP 、 VAP
の和が0より大きい場合は、有音と判定して有音・無音
判定信号Vを高レベル「1」とし、また判定信号VD、
VP、VAPの和がrOJかrOJより小さい場合は、
無音と判定して有音・無音判定信号Vを低レベルrOJ
としてハングオーバ時間付加部18に送出する。
V−1(VD +VP +VAP>0) (8)0
(VD +VP +VAP≦0) 更に、適応パワ閾値更新部15が適応パワ閾値PAPを
算出するための条件を設定するカウンタ17aを有し、
有音・無音判定信号Vによって無音と判定されたLPC
分析フレームが連続して生じる限り、このLPC分析フ
レームの数をカウンタ17aで予め指定したNAP個ず
つ計数し、もし判定信号VD、VPとの和が「0」より
大きいLPC分析フレームが生じたならば、その時点で
カウンタ値NCを「0」に戻す。一方、判定信号VD、
VPの和が「0」か「0」より小さく、判定信号VAP
が高レベル「1」であるフレームが生じれば、カウンタ
値NCを「1」とし、この状態が続く限りNAP個ずつ
計数してカウンタ17aを歩進させる。
(VD +VP +VAP≦0) 更に、適応パワ閾値更新部15が適応パワ閾値PAPを
算出するための条件を設定するカウンタ17aを有し、
有音・無音判定信号Vによって無音と判定されたLPC
分析フレームが連続して生じる限り、このLPC分析フ
レームの数をカウンタ17aで予め指定したNAP個ず
つ計数し、もし判定信号VD、VPとの和が「0」より
大きいLPC分析フレームが生じたならば、その時点で
カウンタ値NCを「0」に戻す。一方、判定信号VD、
VPの和が「0」か「0」より小さく、判定信号VAP
が高レベル「1」であるフレームが生じれば、カウンタ
値NCを「1」とし、この状態が続く限りNAP個ずつ
計数してカウンタ17aを歩進させる。
このようにして、カウンタ17aのカウンタ値NCが予
め指定した数値NAPと等しくなった時、即チ、判定信
号VD 、 VP 、 VAP(7)和が「0」か、「
0」より小さいLPC分析フレームが連続してNAP個
生じたか、或いは検出信号VD、VPの和が「0」か、
「0」より小さく、かつ検出信号VAPが有音を示す高
レベル「1」のLPC分析フレームが連続してNAP個
生じた場合、制御信号CAPを適応パワ閾値更新部15
に送出して、カウンタ値NCを「0」に戻す。
め指定した数値NAPと等しくなった時、即チ、判定信
号VD 、 VP 、 VAP(7)和が「0」か、「
0」より小さいLPC分析フレームが連続してNAP個
生じたか、或いは検出信号VD、VPの和が「0」か、
「0」より小さく、かつ検出信号VAPが有音を示す高
レベル「1」のLPC分析フレームが連続してNAP個
生じた場合、制御信号CAPを適応パワ閾値更新部15
に送出して、カウンタ値NCを「0」に戻す。
ハングオーバ時間付加部18は、有音・無音判定部17
からの有音・無音の判定信号Vを入力し、判定信号Vが
有音を示す高レベル「1」ならばハングオーバ時間を付
加して最終的な有音・無音の判定信号V outを出力
端子7から出力する。
からの有音・無音の判定信号Vを入力し、判定信号Vが
有音を示す高レベル「1」ならばハングオーバ時間を付
加して最終的な有音・無音の判定信号V outを出力
端子7から出力する。
第3図(a) 、(b) 、 (c)は、LPC分析フ
レームの平均パワ、適応パワ閾値P AP、有音・無音
の判定信号Vとカウンタ17aの動作との関係を説明す
るための説明図である。第3図(a)は、入力サンプル
信号AのLPC分析フレームの平均パワの時間変化と、
適応パワ閾値PAPの時間変化を示しており、ここで、
X区間は音声信号区間、Y区間は回線雑音区間、Y′区
間は一時的に平均パワが大きく上昇した回線雑音区間を
示す。第3図(b)は同図(a)に対応する、有音・無
音の判定信号Vの出力結果を示し、同図(c)は、同じ
く同図(a)図に対応する判定信号VD 、 VP 、
VAPと適応パワ閾値PAPの算出に用いたカウンタ
17aのカウンタ値NCを示している。尚、NAPは6
を指定したものである。
レームの平均パワ、適応パワ閾値P AP、有音・無音
の判定信号Vとカウンタ17aの動作との関係を説明す
るための説明図である。第3図(a)は、入力サンプル
信号AのLPC分析フレームの平均パワの時間変化と、
適応パワ閾値PAPの時間変化を示しており、ここで、
X区間は音声信号区間、Y区間は回線雑音区間、Y′区
間は一時的に平均パワが大きく上昇した回線雑音区間を
示す。第3図(b)は同図(a)に対応する、有音・無
音の判定信号Vの出力結果を示し、同図(c)は、同じ
く同図(a)図に対応する判定信号VD 、 VP 、
VAPと適応パワ閾値PAPの算出に用いたカウンタ
17aのカウンタ値NCを示している。尚、NAPは6
を指定したものである。
ここで、以上の構成による動作を第4図(a)。
(b)の流れ図により説明する。
まず、LPC分析部10は入力端子1から入力した入力
サンプル信号Aを所定のフレーム長に区切り(S 1)
、LPC分析を行いLPC分析フレームの自己相関係
数行列IR及びLPC係数ベクトル1kを算出して(S
2) 、LPC距離算出部11に送出するとともにLP
C分析フレームの平均パワを示す第0次の自己相関係数
ROを比較部14゜16及び適応パワ閾値更新部15に
送出する。LPC距離算出部11は、自己相関係数行列
IR,LPC係数ベクトル1k及び標準ベクトルメモリ
12に格納しである標準LPC係数ベクトルlbとから
LPC距離りを(1)式に従って算出して、その結果を
比較部13に送出する(S3)。比較部13は(2)式
に従い、LPC距離りと閾値Dthとの大小の比較をな
しくS4) 、LPC距HDが閾値Dthよりも大きい
場合は、判定信号VDを高レベル「1」としくS5)
、LPC距離りが閾値と等しいか、小さい場合は判定信
号VDを低レベル「0」として(S6)有音・無音判定
部 17に送出する。また、比較部14はLPC分析フ
レームの平均パワを示す第0次の自己相関係数ROと第
1の閾値P thlとの大小の比較をなしくS7)、自
己相関係数ROが第1の閾値P thLよりも大きい場
合は、判定信号vPを高レベル「1」としくS8)、自
己相関係数ROが第1の閾値P thlよりも小さい場
合は、第2の閾値P th2との大小の比較をなしくS
9)、自己相関係数ROが第2の閾値Pth2よりも大
きいか等しい場合は、判定信号VPを低レベル「0」と
しくS 10) 、自己相関係数ROが第2の閾値P
th2よりも小さい場合は判定信号vpを「−1」とし
て(Sll)有音・無音判定部17に送出する。更に、
比較部16は(5)式に従い適応パワ閾値PAP(初期
値はPthl)と自己相関係数ROとの大小の比較をな
しくS 12)、自己相関係数ROが適応パワ閾値PA
Pより大きい場合は、判定信号VAPを高レベル「1」
としくS 13) 、自己相関係数ROが適応パワ閾値
PAPと等しいか小さい場合は、判定信号VAPを低レ
ベル「0」として(S14)有音・無音判定部17に送
出する。
サンプル信号Aを所定のフレーム長に区切り(S 1)
、LPC分析を行いLPC分析フレームの自己相関係
数行列IR及びLPC係数ベクトル1kを算出して(S
2) 、LPC距離算出部11に送出するとともにLP
C分析フレームの平均パワを示す第0次の自己相関係数
ROを比較部14゜16及び適応パワ閾値更新部15に
送出する。LPC距離算出部11は、自己相関係数行列
IR,LPC係数ベクトル1k及び標準ベクトルメモリ
12に格納しである標準LPC係数ベクトルlbとから
LPC距離りを(1)式に従って算出して、その結果を
比較部13に送出する(S3)。比較部13は(2)式
に従い、LPC距離りと閾値Dthとの大小の比較をな
しくS4) 、LPC距HDが閾値Dthよりも大きい
場合は、判定信号VDを高レベル「1」としくS5)
、LPC距離りが閾値と等しいか、小さい場合は判定信
号VDを低レベル「0」として(S6)有音・無音判定
部 17に送出する。また、比較部14はLPC分析フ
レームの平均パワを示す第0次の自己相関係数ROと第
1の閾値P thlとの大小の比較をなしくS7)、自
己相関係数ROが第1の閾値P thLよりも大きい場
合は、判定信号vPを高レベル「1」としくS8)、自
己相関係数ROが第1の閾値P thlよりも小さい場
合は、第2の閾値P th2との大小の比較をなしくS
9)、自己相関係数ROが第2の閾値Pth2よりも大
きいか等しい場合は、判定信号VPを低レベル「0」と
しくS 10) 、自己相関係数ROが第2の閾値P
th2よりも小さい場合は判定信号vpを「−1」とし
て(Sll)有音・無音判定部17に送出する。更に、
比較部16は(5)式に従い適応パワ閾値PAP(初期
値はPthl)と自己相関係数ROとの大小の比較をな
しくS 12)、自己相関係数ROが適応パワ閾値PA
Pより大きい場合は、判定信号VAPを高レベル「1」
としくS 13) 、自己相関係数ROが適応パワ閾値
PAPと等しいか小さい場合は、判定信号VAPを低レ
ベル「0」として(S14)有音・無音判定部17に送
出する。
を音・無音判定部17は、判定信号VD、VP。
VAPを入力しく6)式に従い判定信号VD、VP。
VAPの和と0との比較をなしくS 15) 、この和
が「0」と等しいか或いは小さい場合は、有音・無音の
判定信号Vを低レベル「0」として(S16)カウンタ
17aのカウンタ値NCに1を加算する(SL?)、一
方、判定信号、VD、VP。
が「0」と等しいか或いは小さい場合は、有音・無音の
判定信号Vを低レベル「0」として(S16)カウンタ
17aのカウンタ値NCに1を加算する(SL?)、一
方、判定信号、VD、VP。
VAPの和が「0」より大きい場合は、判定信号Vを高
レベル「1」としく818) 、判定信号VDとvPと
の和と「0」との比較をなしくS 19)、この和が0
より大きい場合はカウンタ17aのカウンタ値NCを「
0」に戻す(S 20)。判定信号VDとVPとの和が
rOJに等しいか小さい場合、一つ前のLPC分析フレ
ームが有音であったか無音であったかの判別をなしく5
21)、無音であったら、カウンタ値NCを「1」とし
く522)、有音であったならばカウンタ値NGに「1
」を加算する(S 23)。以上の判定を行なった後、
現在のLPC分析フレームの有音・無音の判定信号vの
レベルを次のLPC分析フレームがS21で参照できる
様に記憶する(S24)とともに、連続するNAP個の
LPC分析フレームの各々の平均パワも記憶しくS 2
5) 、カウンタ値NCと指定値NAPとの一致、不一
致を判定する(S26)。
レベル「1」としく818) 、判定信号VDとvPと
の和と「0」との比較をなしくS 19)、この和が0
より大きい場合はカウンタ17aのカウンタ値NCを「
0」に戻す(S 20)。判定信号VDとVPとの和が
rOJに等しいか小さい場合、一つ前のLPC分析フレ
ームが有音であったか無音であったかの判別をなしく5
21)、無音であったら、カウンタ値NCを「1」とし
く522)、有音であったならばカウンタ値NGに「1
」を加算する(S 23)。以上の判定を行なった後、
現在のLPC分析フレームの有音・無音の判定信号vの
レベルを次のLPC分析フレームがS21で参照できる
様に記憶する(S24)とともに、連続するNAP個の
LPC分析フレームの各々の平均パワも記憶しくS 2
5) 、カウンタ値NCと指定値NAPとの一致、不一
致を判定する(S26)。
カウンタ値NGと指定値NAPとが一致したならば、制
御信号CAPを高レベル「1」にすることにより、適応
パワ閾値更新部15で(4)式に従い適応パワマ゛り値
PAPが算出される(S27)。一方、カウンタ値NC
が指定値NAPに達していなければ、制御信号CAPを
低レベルrOJとし、有音・無音判定信号Vが、有音を
示す高レベル「1」であれば、ハングオーバ時間付加部
18でハングオーバ時間が付加されて(82g)出力端
子7から最終的な有音・無音判定信号V outが出力
される。以上の動作が81〜528まで順次繰り返され
ることになる。
御信号CAPを高レベル「1」にすることにより、適応
パワ閾値更新部15で(4)式に従い適応パワマ゛り値
PAPが算出される(S27)。一方、カウンタ値NC
が指定値NAPに達していなければ、制御信号CAPを
低レベルrOJとし、有音・無音判定信号Vが、有音を
示す高レベル「1」であれば、ハングオーバ時間付加部
18でハングオーバ時間が付加されて(82g)出力端
子7から最終的な有音・無音判定信号V outが出力
される。以上の動作が81〜528まで順次繰り返され
ることになる。
本実施例によれば、音声信号のパワは大きな範囲で変化
するが、回線雑音はある一定のパワ領域であることを利
用して、音声信号のみが存在するパワ領域と、回線雑音
と音声信号が混在する領域と、回線雑音のみが存在する
領域に分割して、音声信号のみが存在する領域での音声
信号の検出は平均パワが所定閾値P thlより大きい
場合に検出し、一方、回線雑音と音声信号とが混在する
領域では、LPC距離りによるスペクトル分布上の違い
による検出と及び適応パワ閾値PAPとにより検出とを
併用する様になしたので、回線雑音による誤動作の影響
を少なくし、かつ適切な音声区間を検出できる。
するが、回線雑音はある一定のパワ領域であることを利
用して、音声信号のみが存在するパワ領域と、回線雑音
と音声信号が混在する領域と、回線雑音のみが存在する
領域に分割して、音声信号のみが存在する領域での音声
信号の検出は平均パワが所定閾値P thlより大きい
場合に検出し、一方、回線雑音と音声信号とが混在する
領域では、LPC距離りによるスペクトル分布上の違い
による検出と及び適応パワ閾値PAPとにより検出とを
併用する様になしたので、回線雑音による誤動作の影響
を少なくし、かつ適切な音声区間を検出できる。
(発明の効果)
以上説明したように本発明によれば、回線雑音と音声信
号との識別として、LPC係数と標準ベクトルとのLP
C距離と予め設定した閾値との比較をすることでスペク
トル分布上の違いによるを音・無音の判定ができるとと
もに、連続する無音フレーム数が予め設定された指定数
に達するか、LPC距離に基づく判定と、平均パワに基
づく判定が無音であり、かつ適応パワ閾値に基づく判定
が有音である連続フレームが前記指定数に達した時にこ
の適応パワ閾値を所定範囲で更新するようにしたので、
回線雑音レベルを正しく推定した適応パワ閾値とフレー
ムの平均パワとの比較をすることで有音・無音の判定が
できる。従って、回線雑音による誤動作を最小限にする
ことができ、かつ的確に音声区間の検出ができるので、
ハングオーバ時間を大幅に短縮できる利点がある。
号との識別として、LPC係数と標準ベクトルとのLP
C距離と予め設定した閾値との比較をすることでスペク
トル分布上の違いによるを音・無音の判定ができるとと
もに、連続する無音フレーム数が予め設定された指定数
に達するか、LPC距離に基づく判定と、平均パワに基
づく判定が無音であり、かつ適応パワ閾値に基づく判定
が有音である連続フレームが前記指定数に達した時にこ
の適応パワ閾値を所定範囲で更新するようにしたので、
回線雑音レベルを正しく推定した適応パワ閾値とフレー
ムの平均パワとの比較をすることで有音・無音の判定が
できる。従って、回線雑音による誤動作を最小限にする
ことができ、かつ的確に音声区間の検出ができるので、
ハングオーバ時間を大幅に短縮できる利点がある。
第1図は本発明による音声区間検出方式が適用される音
声検出器の一実施例を示すブロック図、第2図は従来の
音声区間検出方式が適用された音声検出器を示すブロッ
ク図、第3図(a) 、 (b) 、(c)は、LPC
フレーム平均パワ、適応パワ閾値、有音・無音の判定信
号とカウンタの動作との関係を説明するための説明図、
第4図(ac 、(b)は、本発明による動作を説明す
るための流れ図である。 図中、1・・・入力端子、7・・・出力端子、10・・
・LPC分析部、11・・・LPC距離算出部、12・
・・標準ベクトルメモリ、13,14.16・・・比較
部、15・・・適応パワ閾値更新部、17・・・有音・
無音判定部、18・・・ハングオーバ時間付加部。
声検出器の一実施例を示すブロック図、第2図は従来の
音声区間検出方式が適用された音声検出器を示すブロッ
ク図、第3図(a) 、 (b) 、(c)は、LPC
フレーム平均パワ、適応パワ閾値、有音・無音の判定信
号とカウンタの動作との関係を説明するための説明図、
第4図(ac 、(b)は、本発明による動作を説明す
るための流れ図である。 図中、1・・・入力端子、7・・・出力端子、10・・
・LPC分析部、11・・・LPC距離算出部、12・
・・標準ベクトルメモリ、13,14.16・・・比較
部、15・・・適応パワ閾値更新部、17・・・有音・
無音判定部、18・・・ハングオーバ時間付加部。
Claims (1)
- 【特許請求の範囲】 入力サンプル信号の回線雑音と音声信号との識別をなし
、音声信号を検出する音声区間検出方式において、 入力サンプル信号を所定のフレーム長に区切り、各フレ
ームの線形予測(以下、LPCと称す)分析をなし、各
フレームの平均パワとLPC係数を算出する分析手段と
、 前記LPC係数と予め設定した標準ベクトルとのLPC
距離と予め設定した閾値との比較をなし、LPC距離が
該閾値よりも大きいならば有音と判定する第1の判定手
段と、 前記平均パワと予め設定した閾値との比較をなし、平均
パワが該閾値よりも大きいならば有音と判定する第2の
判定手段と、 前記平均パワと所定範囲で更新可能な適応パワ閾値との
比較をなし、平均パワが該適応パワ閾値よりも大きいな
らば有音と判定する第3の判定手段と、 前記第1、第2及び第3の判定手段による判定結果に基
づいて音声信号の有音・無音の判定をなすとともに、有
音及び無音の各フレーム数を計数する第4の判定手段と
、 前記第4の判定手段からの指示により、適応パワ閾値を
算出し、これを更新する更新手段とを備え、 前記更新手段は、連続する無音フレーム数が予め設定し
た指定数に達するか、前記第1及び第2の判定手段によ
る判定が無音であり、かつ前記第3の判定手段により有
音と判定されたフレームが連続しその数が前記指定数に
達した時に適応パワ閾値を更新するようになした ことを特徴とする音声区間検出方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62115990A JPS63281200A (ja) | 1987-05-14 | 1987-05-14 | 音声区間検出方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62115990A JPS63281200A (ja) | 1987-05-14 | 1987-05-14 | 音声区間検出方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS63281200A true JPS63281200A (ja) | 1988-11-17 |
Family
ID=14676134
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP62115990A Pending JPS63281200A (ja) | 1987-05-14 | 1987-05-14 | 音声区間検出方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS63281200A (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03144700A (ja) * | 1989-10-18 | 1991-06-20 | American Teleph & Telegr Co <Att> | 可聴信号の知覚符号化方法および音声信号伝送方法 |
| JP2005215204A (ja) * | 2004-01-28 | 2005-08-11 | Ntt Docomo Inc | 有音無音判定装置および有音無音判定方法 |
| JP2009122710A (ja) * | 1998-08-21 | 2009-06-04 | Panasonic Corp | パラメータ抽出装置及びパラメータ抽出方法 |
| US8442817B2 (en) | 2003-12-25 | 2013-05-14 | Ntt Docomo, Inc. | Apparatus and method for voice activity detection |
| JP2013109381A (ja) * | 2008-12-30 | 2013-06-06 | Huawei Technologies Co Ltd | 信号圧縮方法及び装置 |
| JP2017151455A (ja) * | 2012-08-31 | 2017-08-31 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | 音声アクティビティ検出のための方法及び装置 |
-
1987
- 1987-05-14 JP JP62115990A patent/JPS63281200A/ja active Pending
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03144700A (ja) * | 1989-10-18 | 1991-06-20 | American Teleph & Telegr Co <Att> | 可聴信号の知覚符号化方法および音声信号伝送方法 |
| JP2009122710A (ja) * | 1998-08-21 | 2009-06-04 | Panasonic Corp | パラメータ抽出装置及びパラメータ抽出方法 |
| US8442817B2 (en) | 2003-12-25 | 2013-05-14 | Ntt Docomo, Inc. | Apparatus and method for voice activity detection |
| JP2005215204A (ja) * | 2004-01-28 | 2005-08-11 | Ntt Docomo Inc | 有音無音判定装置および有音無音判定方法 |
| JP2013109381A (ja) * | 2008-12-30 | 2013-06-06 | Huawei Technologies Co Ltd | 信号圧縮方法及び装置 |
| JP2017151455A (ja) * | 2012-08-31 | 2017-08-31 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | 音声アクティビティ検出のための方法及び装置 |
| US10607633B2 (en) | 2012-08-31 | 2020-03-31 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and device for voice activity detection |
| US11417354B2 (en) | 2012-08-31 | 2022-08-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and device for voice activity detection |
| US11900962B2 (en) | 2012-08-31 | 2024-02-13 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and device for voice activity detection |
| US12456483B2 (en) | 2012-08-31 | 2025-10-28 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and device for voice activity detection |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH06332492A (ja) | 音声検出方法および検出装置 | |
| KR20050039454A (ko) | 피치검출방법 및 장치 | |
| US6865529B2 (en) | Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor | |
| JPH04182700A (ja) | 音声認識装置 | |
| JPH10105187A (ja) | クラスタ構成をベースとする信号セグメント化方法 | |
| EP1226577A1 (en) | Handling variable delay in objective speech quality assessment | |
| JPS63281200A (ja) | 音声区間検出方式 | |
| WO2003107326A1 (ja) | 音声認識方法及びその装置 | |
| US8306828B2 (en) | Method and apparatus for audio signal expansion and compression | |
| US20010029447A1 (en) | Method of estimating the pitch of a speech signal using previous estimates, use of the method, and a device adapted therefor | |
| JP2656069B2 (ja) | 音声検出装置 | |
| JPS60129796A (ja) | 音声入力装置 | |
| JPS63237100A (ja) | 音声検出器 | |
| JPH03290700A (ja) | 有音検出装置 | |
| JPS59124397A (ja) | 無音区間検出回路 | |
| JPS59149400A (ja) | 音声入力装置 | |
| JP2772598B2 (ja) | 音声符号化装置 | |
| Gulzar et al. | An improved endpoint detection algorithm using bit wise approach for isolated, spoken paired and Hindi hybrid paired words | |
| KR940005047B1 (ko) | 음성전이구간 검출기 | |
| JP2003271189A (ja) | 話者方向検出回路及びその検出方法 | |
| JPS6217800A (ja) | 音声区間判定方式 | |
| JPS6039700A (ja) | 音声区間検出方法 | |
| KR20010091093A (ko) | 음성 인식 및 끝점 검출방법 | |
| Manovisut et al. | Reducing waiting time in automatic captioned relay service using short pause in voice activity detection | |
| JPH02272837A (ja) | 音声区間検出方式 |