JPH04130500A - 音声信号の判別方法 - Google Patents
音声信号の判別方法Info
- Publication number
- JPH04130500A JPH04130500A JP2252991A JP25299190A JPH04130500A JP H04130500 A JPH04130500 A JP H04130500A JP 2252991 A JP2252991 A JP 2252991A JP 25299190 A JP25299190 A JP 25299190A JP H04130500 A JPH04130500 A JP H04130500A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- time length
- peak value
- time
- power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 9
- 230000005236 sound signal Effects 0.000 claims description 27
- 230000001755 vocal effect Effects 0.000 abstract 3
- 238000001514 detection method Methods 0.000 description 10
- 208000037656 Respiratory Sounds Diseases 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000012850 discrimination method Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
本発明は音声信号の判別信号に係り、特に音響分析部の
前処理に用いられ、呼吸音や舌打ち音等の雑音信号を除
去する音声信号の判別方法に関する。
前処理に用いられ、呼吸音や舌打ち音等の雑音信号を除
去する音声信号の判別方法に関する。
[従来の技術]
音声認識における有音区間検出方法としては。
音声パワーに着目するものが従来より知られてしする。
この方法は、例えば「パターン認識、森健−監修、(社
)電子情報通信学会編1988年1頁115」に開示さ
れているように9分析フレームのパワー時系列に対しあ
る閾値を設定して、それ以上の部分を有音部と判定する
ものである。
)電子情報通信学会編1988年1頁115」に開示さ
れているように9分析フレームのパワー時系列に対しあ
る閾値を設定して、それ以上の部分を有音部と判定する
ものである。
[発明が解決しようとする課題]
しかしこのような従来の音声パワーのみに依存する判別
方法では、単語発生の前に生ずる呼吸音や舌打ち音等の
雑音信号を本来の音声信号と区別することが困難であっ
た。
方法では、単語発生の前に生ずる呼吸音や舌打ち音等の
雑音信号を本来の音声信号と区別することが困難であっ
た。
本発明は上述した問題点を解消するためになされたもの
で、入力信号の時間長とその時間長でのパワーピーク値
とを検出することにより、呼吸音や舌打ち音等の音声認
識に不用な雑音信号を区別して除去することの出来る音
声信号の判別方法を提供することを目的とする。
で、入力信号の時間長とその時間長でのパワーピーク値
とを検出することにより、呼吸音や舌打ち音等の音声認
識に不用な雑音信号を区別して除去することの出来る音
声信号の判別方法を提供することを目的とする。
[課題を解決するための手段]
本発明は、音声入力信号を複数の時系列区間に分割して
、各区間における音声の時系列の入力信号から前記音声
入力信号の平均パワーを前記区間ごとに算出して時系列
データとして出力し、前記平均パワーの値があらかじめ
定めた閾値を越える連続した時系列区間を有音信号の時
間長として検出する。さらに有音信号の時間長として検
出された区間ごとにパワーピーク値を検出し、前記有音
信号の時間長と、前記パワーピーク値とに基づき線形判
別関数を決定する。そしてこの線形判別関数にしたがっ
て前記音声入力信号の判別を行うようにしたものである
。
、各区間における音声の時系列の入力信号から前記音声
入力信号の平均パワーを前記区間ごとに算出して時系列
データとして出力し、前記平均パワーの値があらかじめ
定めた閾値を越える連続した時系列区間を有音信号の時
間長として検出する。さらに有音信号の時間長として検
出された区間ごとにパワーピーク値を検出し、前記有音
信号の時間長と、前記パワーピーク値とに基づき線形判
別関数を決定する。そしてこの線形判別関数にしたがっ
て前記音声入力信号の判別を行うようにしたものである
。
[作用]
本発明では、有音信号の時間長とパワーピーク値とに基
づいて判別を行っている。一般に呼吸音や舌打ち音等の
雑音信号の場合にはその時間長は短くパワーピーク値も
低い。一方音声信号の場合には、その時間長は長く、パ
ワーピーク値も大きい。したがって両者を区分する線形
判別関数を用いれば雑音信号と音声信号とを有効に判別
することが出来る。
づいて判別を行っている。一般に呼吸音や舌打ち音等の
雑音信号の場合にはその時間長は短くパワーピーク値も
低い。一方音声信号の場合には、その時間長は長く、パ
ワーピーク値も大きい。したがって両者を区分する線形
判別関数を用いれば雑音信号と音声信号とを有効に判別
することが出来る。
[実施例コ
第2図は、本発明に係る判別方法を実施するための判別
装置の基本構成図を示したものである。
装置の基本構成図を示したものである。
入力信号1からその平均パワーを算出する平均パワー算
出手段2と、平均パワーから有音信号の時間長を検出す
る時間長検出手段3と、有音信号の時間長として検出さ
れた区間ごとにそのパワーピーク値を検出する有音信号
のパワーピーク値検出手段4と、有音信号の時間長とパ
ワーピーク値とに基づいて線形判別関数を決定して、こ
の線形判別関数にしたがって音声入力信号の判別を行う
音声信号判別手段5とから構成されている。音声信号判
別手段5によって判別された信号は、検出信号6として
出力される。
出手段2と、平均パワーから有音信号の時間長を検出す
る時間長検出手段3と、有音信号の時間長として検出さ
れた区間ごとにそのパワーピーク値を検出する有音信号
のパワーピーク値検出手段4と、有音信号の時間長とパ
ワーピーク値とに基づいて線形判別関数を決定して、こ
の線形判別関数にしたがって音声入力信号の判別を行う
音声信号判別手段5とから構成されている。音声信号判
別手段5によって判別された信号は、検出信号6として
出力される。
入力信号1は例えばサンプリング周波数8ki(2でA
/D変換された音声の時系列信号x (n)n=0.±
Δt、±2Δt、±3Δt、・・・Δt=1/8000
(sec、)と時系列サンプリング信号となっている
。平均パワー算出手段2は、この人力信号x (n)1
を入力して、2乗信号(x (n) ) ”を得たのち
、次式にしたがって平均パワーPa(n)を得る。
/D変換された音声の時系列信号x (n)n=0.±
Δt、±2Δt、±3Δt、・・・Δt=1/8000
(sec、)と時系列サンプリング信号となっている
。平均パワー算出手段2は、この人力信号x (n)1
を入力して、2乗信号(x (n) ) ”を得たのち
、次式にしたがって平均パワーPa(n)を得る。
ここでLは5時系列化された区間長であって、この区間
長りに対して平均化処理を行う。
長りに対して平均化処理を行う。
ついで有音信号の時間長検出を行う、ここで有音信号と
は平均パワー算出手段2の出力である平均パワーpo
(n)の値があらかじめ定められた閾値(例えば背景
雑音レベルより10dB高い値)を越える信号と定義す
る。有音信号時間長検出手段3では、この有音信号の時
間長SLを各時系列区間ごとに算出して時系列データと
して出力する。
は平均パワー算出手段2の出力である平均パワーpo
(n)の値があらかじめ定められた閾値(例えば背景
雑音レベルより10dB高い値)を越える信号と定義す
る。有音信号時間長検出手段3では、この有音信号の時
間長SLを各時系列区間ごとに算出して時系列データと
して出力する。
音声信号のパワーピーク値検出手段4は1時間長検出手
段3で検出した区間におけるパワーのピーク値S、を出
力する。
段3で検出した区間におけるパワーのピーク値S、を出
力する。
第3図は、有音信号の時間長S、とパワービーク値S、
、どの関係を示した図で、あらかじめ定められた閾値8
thを越える信号区間を有音信号の時間長SLとし、そ
の時間内のピーク値をパワーピークS、とじていること
を示している。このようにして時間長S、パワービーク
値S、とが検出されると、音声信号判定手段5により雑
音信号と音声信号との判別が行われる。すなわち判定手
段5により判別した結果、呼吸音や舌打ち音等の雑音信
号であれば、その検出信号を出力し不用雑音を除去する
。このようにして検出信号6が判定手段5から出力され
る。
、どの関係を示した図で、あらかじめ定められた閾値8
thを越える信号区間を有音信号の時間長SLとし、そ
の時間内のピーク値をパワーピークS、とじていること
を示している。このようにして時間長S、パワービーク
値S、とが検出されると、音声信号判定手段5により雑
音信号と音声信号との判別が行われる。すなわち判定手
段5により判別した結果、呼吸音や舌打ち音等の雑音信
号であれば、その検出信号を出力し不用雑音を除去する
。このようにして検出信号6が判定手段5から出力され
る。
第1図は1本発明による音声信号判定方法を説明する図
で、横軸は有音信号の時間長検出手段3で得られた時間
長Stを、縦軸は有音信号のパワーピーク値検出手段4
で得られたピーク値S、を示している。図から明らかな
ように、呼吸音や舌打ち音等の雑音信号の場合にはその
時間長は短くパワーのピーク値も低い。
で、横軸は有音信号の時間長検出手段3で得られた時間
長Stを、縦軸は有音信号のパワーピーク値検出手段4
で得られたピーク値S、を示している。図から明らかな
ように、呼吸音や舌打ち音等の雑音信号の場合にはその
時間長は短くパワーのピーク値も低い。
一方有音信号の場合にはその時間長は長くパワーのピー
ク値も大きい。したがって雑音信号は図中の左下部分に
集中して現れる。そこでこれらの雑音信号と音声信号と
を区分する線形判別関数を図に示すように設定すること
により両者の判別が可能となる。
ク値も大きい。したがって雑音信号は図中の左下部分に
集中して現れる。そこでこれらの雑音信号と音声信号と
を区分する線形判別関数を図に示すように設定すること
により両者の判別が可能となる。
に基づいて決定するのが望ましい。
[発明の効果]
以上実施例に基づいて説明したように1本発明では有音
信号の時間長とパワーピーク値とに基づく線形判別関数
を用いて雑音信号と音声信号との判別を行っているため
、雑音信号が時間長が短くそのパワーも小さいという性
質を利用することになるため有効な判別が実施できる。
信号の時間長とパワーピーク値とに基づく線形判別関数
を用いて雑音信号と音声信号との判別を行っているため
、雑音信号が時間長が短くそのパワーも小さいという性
質を利用することになるため有効な判別が実施できる。
したがって本発明による判別方法を音声認識装置の音響
分析部の前処理工程として用いた場合、認識率を向上さ
せることが出来る。
分析部の前処理工程として用いた場合、認識率を向上さ
せることが出来る。
第1図は本発明の音声信号の判別方法を説明するための
図、第2国は本発明方法を実施する判別装置の基本構成
図、第3図は有音信号の区間長とパワーピーク値との関
係を示す特性図である。 図において、1・・・・・・入力信号、2・・・・・・
平均パワー算出手段、3・・・・・・有音信号の時間長
検出手段。 4・・・・・・有音信号のパワーピーク値検出手段、5
・・・・・・音声信号判定手段、6・・・・・・検出信
号、 x (n)・・・・・・入力信号、Po(n)・
・・・・・平均パワー、s。 ・・・有音信号の時間長、S、・・・・・・有音信号の
パワービーク値、5th・・・・・・H値。
図、第2国は本発明方法を実施する判別装置の基本構成
図、第3図は有音信号の区間長とパワーピーク値との関
係を示す特性図である。 図において、1・・・・・・入力信号、2・・・・・・
平均パワー算出手段、3・・・・・・有音信号の時間長
検出手段。 4・・・・・・有音信号のパワーピーク値検出手段、5
・・・・・・音声信号判定手段、6・・・・・・検出信
号、 x (n)・・・・・・入力信号、Po(n)・
・・・・・平均パワー、s。 ・・・有音信号の時間長、S、・・・・・・有音信号の
パワービーク値、5th・・・・・・H値。
Claims (1)
- 音声入力信号を複数の時系区間に分割し、各区間におけ
る音声の時系列入力信号から前記音声入力信号の平均パ
ワーを前記区間ごとに算出して時系列データとして出力
する第1のステップと、前記平均パワーの値があらかじ
め定めた閾値を越える連続した時系列区間を有音信号の
時間長として検出する第2のステップと、前記有音信号
の時間長として検出された区間ごとにパワーピーク値を
検出する第3のステップと、前記有音信号の時間長と前
記パワーピーク値とに基づき線形判別関数を決定し、こ
の線形判別関数にしたがって前記音声入力信号の判別を
行う第4のステップとを有する音声信号の判別方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2252991A JPH04130500A (ja) | 1990-09-21 | 1990-09-21 | 音声信号の判別方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2252991A JPH04130500A (ja) | 1990-09-21 | 1990-09-21 | 音声信号の判別方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH04130500A true JPH04130500A (ja) | 1992-05-01 |
Family
ID=17244982
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2252991A Pending JPH04130500A (ja) | 1990-09-21 | 1990-09-21 | 音声信号の判別方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH04130500A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009180958A (ja) * | 2008-01-31 | 2009-08-13 | Yamaha Corp | パラメータ設定装置、音響生成装置およびプログラム |
| JP2023543382A (ja) * | 2020-08-12 | 2023-10-16 | ドルビー・インターナショナル・アーベー | 音声アーティキュレーション雑音事象の自動検出および減衰 |
-
1990
- 1990-09-21 JP JP2252991A patent/JPH04130500A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009180958A (ja) * | 2008-01-31 | 2009-08-13 | Yamaha Corp | パラメータ設定装置、音響生成装置およびプログラム |
| JP2023543382A (ja) * | 2020-08-12 | 2023-10-16 | ドルビー・インターナショナル・アーベー | 音声アーティキュレーション雑音事象の自動検出および減衰 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101122838B1 (ko) | 음원 신호 분리 장치 및 방법, 및 피치 검출 장치 및 방법 | |
| KR101437830B1 (ko) | 음성 구간 검출 방법 및 장치 | |
| US6236970B1 (en) | Adaptive speech rate conversion without extension of input data duration, using speech interval detection | |
| CN113611330B (zh) | 一种音频检测方法、装置、电子设备及存储介质 | |
| JPH04130500A (ja) | 音声信号の判別方法 | |
| JP2005266797A (ja) | 音源信号分離装置及び方法、並びにピッチ検出装置及び方法 | |
| JP4705480B2 (ja) | 高調波信号の基本周波数を求める方法 | |
| JP3420831B2 (ja) | 骨伝導音声のノイズ除去装置 | |
| JP2992324B2 (ja) | 音声区間検出方法 | |
| KR100273395B1 (ko) | 음성인식시스템의음성구간검출방법 | |
| CN119814345B (zh) | 超声波事件欺骗攻击防御方法及装置 | |
| JPH02278298A (ja) | 雑音除去装置 | |
| JP2989219B2 (ja) | 音声区間検出方式 | |
| TWI916433B (zh) | 具低複雜度語音活動檢測演算之設備及方法 | |
| JPH0424692A (ja) | 音声区間検出方式 | |
| JP3190231B2 (ja) | 有声音信号のピッチ周期抽出装置およびピッチ周期抽出方法 | |
| JP2557497B2 (ja) | 男女声の識別方法 | |
| JP3484559B2 (ja) | 音声認識装置および音声認識方法 | |
| JPH0285897A (ja) | 音声検出方式 | |
| JP2748383B2 (ja) | 音声認識方式 | |
| KR100523905B1 (ko) | 이중화된 검출조건을 이용한 음성 추출 방법 | |
| CN121687089A (zh) | 一种采用ai技术处理音频杂音的方法 | |
| TW202226225A (zh) | 以零點交越檢測改進語音活動檢測之設備及方法 | |
| JPH0383100A (ja) | 音声区間の検出装置 | |
| JPH07225592A (ja) | 有音区間検出装置 |