JPS62141594A - 音声検出方式 - Google Patents
音声検出方式Info
- Publication number
- JPS62141594A JPS62141594A JP60282479A JP28247985A JPS62141594A JP S62141594 A JPS62141594 A JP S62141594A JP 60282479 A JP60282479 A JP 60282479A JP 28247985 A JP28247985 A JP 28247985A JP S62141594 A JPS62141594 A JP S62141594A
- Authority
- JP
- Japan
- Prior art keywords
- peak
- candidate
- threshold
- power
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims 5
- 238000009499 grossing Methods 0.000 claims 1
- 230000005236 sound signal Effects 0.000 claims 1
Landscapes
- Time-Division Multiplex Systems (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(虚業上の利用分野)
本発明は、音声、VA識装置等において音声の存在する
1寺間を判定するのに用いる音声検出方式に関する。
1寺間を判定するのに用いる音声検出方式に関する。
(従来の技術)
従来、この種の音声検出方式では、音声のパワーのレベ
ルが閾値を越えている継続時間がらる一定時間以上のと
きに音声の始端とし、閾値を下回つぞいる継続時間があ
る一定時間以上のときに音声の終端とする方式が多く用
いられていた。
ルが閾値を越えている継続時間がらる一定時間以上のと
きに音声の始端とし、閾値を下回つぞいる継続時間があ
る一定時間以上のときに音声の終端とする方式が多く用
いられていた。
(発明が解決しようとする問題点)
上述し九従来の音声検出方式では、レベルの継1続時間
によって音声区間を検出しているから、パワー・ディッ
プの深い音声の場合には語頭部が欠落したシ、瞬時的な
雑音でも雑音が語尾に近接している場合には終端が延長
されて音声区間に雑音が含まれる。このように、従来の
音声検出方式には音声区間を誤って検出するという欠点
がある。
によって音声区間を検出しているから、パワー・ディッ
プの深い音声の場合には語頭部が欠落したシ、瞬時的な
雑音でも雑音が語尾に近接している場合には終端が延長
されて音声区間に雑音が含まれる。このように、従来の
音声検出方式には音声区間を誤って検出するという欠点
がある。
(問題点を解決するための手段)
前述の問題点を解決するために本発明が提供する手段は
、音声信号のパワーを算出するパワー算出部と、このパ
ワー算出部が算出し九前記パワーを平滑化して平滑化パ
ワーを得るパワー平滑化部と、前記平滑化パワーの変化
率が正から負に変わる変曲点をその平滑化パワーのピー
ク候補として検出するピーク検出部と、前記ピーク候補
のうちレベルが最大であるピーク候補を最大ピークとし
て選出し、この最大ピークのレベルと所定のピーク選別
用係数とからピーク選別用間(直を算出し。
、音声信号のパワーを算出するパワー算出部と、このパ
ワー算出部が算出し九前記パワーを平滑化して平滑化パ
ワーを得るパワー平滑化部と、前記平滑化パワーの変化
率が正から負に変わる変曲点をその平滑化パワーのピー
ク候補として検出するピーク検出部と、前記ピーク候補
のうちレベルが最大であるピーク候補を最大ピークとし
て選出し、この最大ピークのレベルと所定のピーク選別
用係数とからピーク選別用間(直を算出し。
前記最大ピークのレベルと所定のピーク幅算出用係数と
からピーク1lIiJ出用閾値を算出する閾値算出部と
、前記ピーク検出部で検出した前記ピーク候補のレベル
と前記ピーク選別用閾値とを比較し。
からピーク1lIiJ出用閾値を算出する閾値算出部と
、前記ピーク検出部で検出した前記ピーク候補のレベル
と前記ピーク選別用閾値とを比較し。
そのレベルが前記ピーク選別用閾値以上の前記ピーク候
補だけをピークとして選別するピーク選別部と、前記平
滑化パワーが的記ピーク幅算出用閾直以上である時間で
あって前記ピーク選別部で選別された前記ピークを含む
時間をピーク幅として算出するピーク幅算出部と、ピー
ク幅が所定のピーク幅閾値よシ広い前記ピークの始端か
ら終端までの区間を音声区間候補として出力するピーク
幅比較部と、前記音声区間候補に基づき音声区間の判定
を行なう音声区間判定部とを備え、前記音声区間判定部
は、前記音声区間候補が1つの場合はそのまま、前記音
声区間候補を音声区間と判定し。
補だけをピークとして選別するピーク選別部と、前記平
滑化パワーが的記ピーク幅算出用閾直以上である時間で
あって前記ピーク選別部で選別された前記ピークを含む
時間をピーク幅として算出するピーク幅算出部と、ピー
ク幅が所定のピーク幅閾値よシ広い前記ピークの始端か
ら終端までの区間を音声区間候補として出力するピーク
幅比較部と、前記音声区間候補に基づき音声区間の判定
を行なう音声区間判定部とを備え、前記音声区間判定部
は、前記音声区間候補が1つの場合はそのまま、前記音
声区間候補を音声区間と判定し。
前記音声区間候補が複数の場合は最初の前記音声区間候
補の始端から最後の前記音声区間候補の終端までの時間
を音声区間と判定することを特徴とする。
補の始端から最後の前記音声区間候補の終端までの時間
を音声区間と判定することを特徴とする。
(実施例)
次に本発明について図面を参照して説明する。
第1図は本発明の一実施例のブロック図である。
この実施例は、パワー算出部1、パワー平滑化部2、ピ
ーク検出部3、閾値算出部4、ピーク選別部5、ピーク
幅算出部6、ピーク幅比較・;Is 7 、音声区間判
定部8及び音声区間候補時間差算出部22から構成され
る。入力音声10はパワー算出部lに入力され、算出さ
れたパワー11はパワー平滑化部2に入力され、平滑化
されたパワー12はピーク、演出g3とピーク幅算出部
6とに入力されろ。ピーク検出部3は、平滑化−くワー
12の変化率が正から負に変わる変曲点をその平滑化パ
ワ=のピーク候補13として検出し、演出したピーり候
補13を閾値算出部4とピーク選別部5とに出力する。
ーク検出部3、閾値算出部4、ピーク選別部5、ピーク
幅算出部6、ピーク幅比較・;Is 7 、音声区間判
定部8及び音声区間候補時間差算出部22から構成され
る。入力音声10はパワー算出部lに入力され、算出さ
れたパワー11はパワー平滑化部2に入力され、平滑化
されたパワー12はピーク、演出g3とピーク幅算出部
6とに入力されろ。ピーク検出部3は、平滑化−くワー
12の変化率が正から負に変わる変曲点をその平滑化パ
ワ=のピーク候補13として検出し、演出したピーり候
補13を閾値算出部4とピーク選別部5とに出力する。
FA flt算出部4は、ピーク候補13のうちから最
大ピークレベルを算出し、ピーク選別用係数19と演算
を行ないピーク選別用間(rILL4を算出しピーク選
別部5へ出力し、また最大ピークレベルとピーク幅算出
用係a20との演算を行ないピーク幅算出用閾値15を
算出しピーク1扁算出部6へ出力する。ピーク選別部5
は、ピーク候補13のピークジベルとピーク選別用閾値
14とを比較し閾値以上のピークレベルを有するピーク
候補だけをピーク25としてピーク幅算出部6へ出力す
る。
大ピークレベルを算出し、ピーク選別用係数19と演算
を行ないピーク選別用間(rILL4を算出しピーク選
別部5へ出力し、また最大ピークレベルとピーク幅算出
用係a20との演算を行ないピーク幅算出用閾値15を
算出しピーク1扁算出部6へ出力する。ピーク選別部5
は、ピーク候補13のピークジベルとピーク選別用閾値
14とを比較し閾値以上のピークレベルを有するピーク
候補だけをピーク25としてピーク幅算出部6へ出力す
る。
ピーク幅算出部6は、ピーク幅算出用閾イ直15以上に
平滑化パワー12がある時間区間であって、ピークz5
が含まれる時間区間をピーク幅16として出力する。ピ
ーク1隔16は、ピーク25が指定する平滑化パワー1
2のピークでらって、ピーク1鴎算出用閾値15以上で
金る平滑化パワー12の時間区間を現わしている。この
ピークIpffl l 6にはピーク幅比較部7へ出力
される。ピーク幅比較部7は、ピーク幅閾値21と各ピ
ークのピーク幅16とを比較し、閾値21以上のピーク
幅を有するピークの始端及び終端を音声区間候補17と
して音声区間判定部8と音声区間候補時間差算出部22
へ出力する。
平滑化パワー12がある時間区間であって、ピークz5
が含まれる時間区間をピーク幅16として出力する。ピ
ーク1隔16は、ピーク25が指定する平滑化パワー1
2のピークでらって、ピーク1鴎算出用閾値15以上で
金る平滑化パワー12の時間区間を現わしている。この
ピークIpffl l 6にはピーク幅比較部7へ出力
される。ピーク幅比較部7は、ピーク幅閾値21と各ピ
ークのピーク幅16とを比較し、閾値21以上のピーク
幅を有するピークの始端及び終端を音声区間候補17と
して音声区間判定部8と音声区間候補時間差算出部22
へ出力する。
音声区間判定g8は、音声区間候補17が1つの場合そ
のまま音声区間候補17を音声区間18として出力し、
複数の場合i&辺の音声区間候補の始端から最淡の音声
区間候補の終端までを音声区間として出力する。
のまま音声区間候補17を音声区間18として出力し、
複数の場合i&辺の音声区間候補の始端から最淡の音声
区間候補の終端までを音声区間として出力する。
第2図は、第1図実施例においる平滑した音声パワー1
2の波形と音声検出用閾値と検出された音声区間との関
係を示す図でbる。第1図実施例によれば、ピークレベ
ルの低い雑音や音声に近接した雑音が除去され、かつパ
ワーφデツプの深い音声でも語頭の欠落を防ぐことがで
きることを、第2図を参照して、また第1図と関連づけ
て以下に詳しく説明する。第2図の、IJ軸30は時間
、縦軸31は平滑されたパワーを表し、本図の波形は。
2の波形と音声検出用閾値と検出された音声区間との関
係を示す図でbる。第1図実施例によれば、ピークレベ
ルの低い雑音や音声に近接した雑音が除去され、かつパ
ワーφデツプの深い音声でも語頭の欠落を防ぐことがで
きることを、第2図を参照して、また第1図と関連づけ
て以下に詳しく説明する。第2図の、IJ軸30は時間
、縦軸31は平滑されたパワーを表し、本図の波形は。
第1図のパワー平滑化部2の出力である平滑化されたパ
ワー12の波形を示す。
ワー12の波形を示す。
IJ1図のピーク検出部3によって、第2図のピーク候
補32= 33t 34e−35の4つのピーク候
補が検出され、@1図の閾値算出部4で最大ピークであ
るピーク候補34からピーク選別用閾値14とピーク幅
算出用閾値15とが算出される。
補32= 33t 34e−35の4つのピーク候
補が検出され、@1図の閾値算出部4で最大ピークであ
るピーク候補34からピーク選別用閾値14とピーク幅
算出用閾値15とが算出される。
ピーク選別部5では、ピーク選別用閾値14によりピー
クレベルの小さいピーク候補32が除去され、ピーク候
補33,34.35がピークとして出力される。ピーク
幅算出$6では、ピーク幅算出用閾1直15によりピー
ク33= 34* 35のピークqgast 3
9t 40を算出し、ピーク幅比較部7ではピーク幅
閾値21と各ピーク幅38.39゜40とを比較し、ピ
ーク幅40がFA値21より狭いピーク35は1余去さ
れ、ピーク33と34が音声区間候補として出力される
。音声区間判定@8ではピーク33の始端41からピー
ク34の終端42までを音声区間と判定して出力する。
クレベルの小さいピーク候補32が除去され、ピーク候
補33,34.35がピークとして出力される。ピーク
幅算出$6では、ピーク幅算出用閾1直15によりピー
ク33= 34* 35のピークqgast 3
9t 40を算出し、ピーク幅比較部7ではピーク幅
閾値21と各ピーク幅38.39゜40とを比較し、ピ
ーク幅40がFA値21より狭いピーク35は1余去さ
れ、ピーク33と34が音声区間候補として出力される
。音声区間判定@8ではピーク33の始端41からピー
ク34の終端42までを音声区間と判定して出力する。
従って、本実施例によれば、第2図に示した例の様に雑
音であるピーク32.35が除去され、パワー・ディッ
プが深くピーク33とピーク34に分離している音声で
も正しく音声区間の検出を行なうことができる。
音であるピーク32.35が除去され、パワー・ディッ
プが深くピーク33とピーク34に分離している音声で
も正しく音声区間の検出を行なうことができる。
(発明の効果)
以上説明したように、本発明は、平滑化したパワー波形
のピークを検出し、レベルかは大であるピークのレベル
からピーク選別用閾値と、ピーク幅算出用閾イ直とを算
出し、ピーク選別用閾値以上のピークレベルを有するピ
ークのピーク幅をピーク幅算出用閾11Kによって算出
し、ピーク幅が所定の幅以上のピークを音声と判定し、
音声とFll定声れたピークの始端から終端を音声区間
とし、音声と判定されたピークが複数の場合、最初のピ
ークの始端から練直のピークの終端までを音声区間と判
定することにより、ピークの高さ、幅により音声区間の
判定を行なうことができ、パワー・含ツブの礪い音声の
場合でも語頭のピークから音声として検出でき、また瞬
時的なピークをj#つ惟音が語尾に近接していても雑音
の部分を除去でき、よシ正′直に音声区間を検出するこ
とができ、音声認識装置に用いた場合、認識率を向上で
きる。
のピークを検出し、レベルかは大であるピークのレベル
からピーク選別用閾値と、ピーク幅算出用閾イ直とを算
出し、ピーク選別用閾値以上のピークレベルを有するピ
ークのピーク幅をピーク幅算出用閾11Kによって算出
し、ピーク幅が所定の幅以上のピークを音声と判定し、
音声とFll定声れたピークの始端から終端を音声区間
とし、音声と判定されたピークが複数の場合、最初のピ
ークの始端から練直のピークの終端までを音声区間と判
定することにより、ピークの高さ、幅により音声区間の
判定を行なうことができ、パワー・含ツブの礪い音声の
場合でも語頭のピークから音声として検出でき、また瞬
時的なピークをj#つ惟音が語尾に近接していても雑音
の部分を除去でき、よシ正′直に音声区間を検出するこ
とができ、音声認識装置に用いた場合、認識率を向上で
きる。
第1図は本発明の一実施例のブロック図、第2図はこの
実施例における平滑化音声パワーの波形を示す図である
。 1・・・パワー算出部、2・・・パワー平滑化部、3・
・・ビー゛り検出部、4・・・閾値算出部、5・・・ピ
ーク選別部、6・・・〈−り幅算出部、7・・・ピーク
幅比較部、8・・・音声区間判定部、10・・・入力音
声、11・・・パワー、12・・−平滑化されたパワー
、13・・・ピーク ′候補J14・・:ピーク選
別用閾値、15・・・ピーク幅算出用閾値、16・・斗
−り幅、17−・・音声区間候補、1B・・・音声区間
、19・・・ピーク選別用係数、20・・・ピーク幅算
出用係数・−21−・・ピーク幅閾値、22・・・音声
区間候補時間差算出部、30・・・横軸(時間)、31
・・・縦軸(平滑されたパワー)、32〜35・・・ピ
ーク候補、38〜40・・・ピーク幅、41・・・始端
、42・・・終端。
実施例における平滑化音声パワーの波形を示す図である
。 1・・・パワー算出部、2・・・パワー平滑化部、3・
・・ビー゛り検出部、4・・・閾値算出部、5・・・ピ
ーク選別部、6・・・〈−り幅算出部、7・・・ピーク
幅比較部、8・・・音声区間判定部、10・・・入力音
声、11・・・パワー、12・・−平滑化されたパワー
、13・・・ピーク ′候補J14・・:ピーク選
別用閾値、15・・・ピーク幅算出用閾値、16・・斗
−り幅、17−・・音声区間候補、1B・・・音声区間
、19・・・ピーク選別用係数、20・・・ピーク幅算
出用係数・−21−・・ピーク幅閾値、22・・・音声
区間候補時間差算出部、30・・・横軸(時間)、31
・・・縦軸(平滑されたパワー)、32〜35・・・ピ
ーク候補、38〜40・・・ピーク幅、41・・・始端
、42・・・終端。
Claims (1)
- 音声信号のパワーを算出するパワー算出部と、このパワ
ー算出部が算出した前記パワーを平滑化して平滑化パワ
ーを得るパワー平滑化部と、前記平滑化パワーの変化率
が正から負に変わる変曲点をその平滑化パワーのピーク
候補として検出するピーク検出部と、前記ピーク候補の
うちレベルが最大であるピーク候補を最大ピークとして
選出しこの最大ピークのレベルと所定のピーク選別用係
数とからピーク選別用閾値を算出し、前記最大ピークの
レベルと所定のピーク幅算出用係数とからピーク幅算出
用閾値を算出する閾値算出部と、前記ピーク検出部で検
出した前記ピーク候補のレベルと前記ピーク選別用閾値
とを比較し、そのレベルが前記ピーク選別用閾値以上の
前記ピーク候補だけをピークとして選別するピーク選別
部と、前記平滑化パワーが前記ピーク幅算出用閾値以上
である時間であつて前記ピーク選別部で選別された前記
ピークを含む時間をピーク幅として算出するピーク幅算
出部と、ピーク幅が所定のピーク幅閾値より広い前記ピ
ークの始端から終端までの区間を音声区間候補として出
力するピーク幅比較部と、前記音声区間候補に基づき音
声区間の判定を行なう音声区間判定部とを備え、前記音
声区間判定部は、前記音声区間候補が1つの場合はその
まま前記音声区間候補を音声区間と判定し、前記音声区
間候補が複数の場合は最初の前記音声区間候補の始端か
ら最後の前記音声区間候補の終端までの時間を音声区間
と判定することを特徴とする音声検出方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60282479A JPS62141594A (ja) | 1985-12-16 | 1985-12-16 | 音声検出方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60282479A JPS62141594A (ja) | 1985-12-16 | 1985-12-16 | 音声検出方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS62141594A true JPS62141594A (ja) | 1987-06-25 |
| JPH0588839B2 JPH0588839B2 (ja) | 1993-12-24 |
Family
ID=17652970
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP60282479A Granted JPS62141594A (ja) | 1985-12-16 | 1985-12-16 | 音声検出方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS62141594A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0467200A (ja) * | 1990-07-09 | 1992-03-03 | Matsushita Electric Ind Co Ltd | 有音区間判定方法 |
| JP2009122204A (ja) * | 2007-11-12 | 2009-06-04 | Nippon Telegr & Teleph Corp <Ntt> | 音量調整装置、方法及びプログラム |
| US9129611B2 (en) | 2011-12-28 | 2015-09-08 | Fuji Xerox Co., Ltd. | Voice analyzer and voice analysis system |
| US9153244B2 (en) | 2011-12-26 | 2015-10-06 | Fuji Xerox Co., Ltd. | Voice analyzer |
-
1985
- 1985-12-16 JP JP60282479A patent/JPS62141594A/ja active Granted
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0467200A (ja) * | 1990-07-09 | 1992-03-03 | Matsushita Electric Ind Co Ltd | 有音区間判定方法 |
| JP2009122204A (ja) * | 2007-11-12 | 2009-06-04 | Nippon Telegr & Teleph Corp <Ntt> | 音量調整装置、方法及びプログラム |
| US9153244B2 (en) | 2011-12-26 | 2015-10-06 | Fuji Xerox Co., Ltd. | Voice analyzer |
| US9129611B2 (en) | 2011-12-28 | 2015-09-08 | Fuji Xerox Co., Ltd. | Voice analyzer and voice analysis system |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0588839B2 (ja) | 1993-12-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS5852695A (ja) | 車両用音声検出装置 | |
| JPS62141594A (ja) | 音声検出方式 | |
| JPS62141595A (ja) | 音声検出方式 | |
| JPH0138320B2 (ja) | ||
| KR100273395B1 (ko) | 음성인식시스템의음성구간검출방법 | |
| JPS6256998A (ja) | 子音区間検出装置 | |
| JPS6242197A (ja) | 音声区間検出方法 | |
| JPS61272796A (ja) | 音声区間検出方式 | |
| JP2532618B2 (ja) | ピッチ抽出装置 | |
| JPH0320792B2 (ja) | ||
| JPS61259296A (ja) | 音声区間検出方式 | |
| JPS61223796A (ja) | 音声区間検出回路 | |
| JPH04184495A (ja) | 音声認識装置 | |
| JPS61269197A (ja) | 音声区間検出方式 | |
| JPS61113099A (ja) | 音声認識装置における音声区間検出方式 | |
| JPS62109099A (ja) | 音声区間検出方式 | |
| JPS62237498A (ja) | 音声区間検出方法 | |
| JPS5867236A (ja) | 血圧測定装置 | |
| JPH1049190A (ja) | 音声認識装置および音声認識方法 | |
| JPS63291096A (ja) | 音声区間検出方式 | |
| JP2901976B2 (ja) | パターン照合予備選択方式 | |
| JPS6292998A (ja) | 音声区間検出装置 | |
| JPS59219797A (ja) | 音声区間切り出し方式 | |
| JPH0412478B2 (ja) | ||
| JPH01200293A (ja) | 音声認識方式 |