JPH04355799A

JPH04355799A - 音声の切り出し装置

Info

Publication number: JPH04355799A
Application number: JP3131314A
Authority: JP
Inventors: Hideyuki Sugita; 英之杉田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1991-06-03
Filing date: 1991-06-03
Publication date: 1992-12-09

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は音声の切り出し装置に関
し、音声の開始点を検出して切り出しを行なう音声の切
り出し装置に関する。

【０００２】音声認識を行なう場合には音声の開始点を
検出して、この開始点から音声を切り出して認識を行な
う。この音声の開始点を誤って検出すると音声自体の持
つ情報が変化して認識率が低下するため音声の開始点を
正確に検出する必要がある。

【０００３】

【従来の技術】従来は、マイクロホンで集音したアナロ
グの音声信号をディジタル化し、このディジタル音声信
号から音声パワーを演算により求める。この音声パワー
を図５（Ａ）に示す第１閾値と比較して、第１閾値を越
えた時点Ｃを音声の開始点としており、音声パワーが零
でなくとも　　第１閾値未満であればこれをノイズとみ
なす。このようにして検出した音声の開始点以降の音声
を切り出している。

【０００４】

【発明が解決しようする課題】従来方法では、図５（Ｂ
）のＷ区間の如く音声パワーは第１閾値未満であるが既
に音声パワーが変動し歴然として音声が開始している場
合であっても、音声の開始点は時点Ｃと検出される。こ
のため音声の切り出しは時点Ｃから行なわれてしまい、
音声の開始点が誤っているために認識率が悪化するとい
う問題があった。

【０００５】本発明は上記の点に鑑みなされたもので、
音声の開始点を正確に検出して切り出し、認識率が向上
する音声の切り出し装置を提供することを目的とする。

【０００６】

【課題を解決するための手段】図１は本発明の原理図を
示す。

【０００７】同図中、第１の比較手段１は端子２より、
入力された音声のパワーを一定値の第１閾値と比較して
第１閾値を越えたときを音声の開始点とする。

【０００８】第２の比較手段３は、第１の比較手段１で
得られた音声の開始点より以前の所定期間で音声の開始
点より前となる程値が大きくなり、かつ第１閾値よりも
小さな値の第２閾値と音声のパワーを比較する。

【０００９】開始点移動手段４は、所定期間で該音声の
パワーが該第２閾値を越えた最も早い時点に音声の開始
点を移動させる。

【００１０】切り出し手段５は開始点移動手段４で移動
した音声の開始点より音声の切り出しを行なう。

【００１１】

【作用】本発明においては、第１閾値よりも音声パワー
が小さくても、所定期間でこの第１閾値より小さい第２
閾値を越えるとその時点まで音声の開始点を移動させる
ため、音声パワーが第１閾値未満であっても音声パワー
が変動して音声が開始しているような場合も音声の開始
点を正確に検出して切り出すことがてきる。

【００１２】

【実施例】図２は本発明装置のフローチャートを示す。同図中、ステップ１０でマイクロホン等より音声を入力
する。

【００１３】ステップ１１では入力音声をディジタル化
し、ステップ１２でこのディジタル音声信号のパワー値
を計算し、図３（Ａ）の実線Ｉに示す如き音声パワーを
求める。

【００１４】次にステップ１３では音声パワーを図３（
Ａ）の実線ＩＩに示す第１閾値と比較して、この第１閾
値を越えた時点Ｃを音声の開始点とする（ステップ１４
）。この後、ステップ１５で、開始点Ｃ以前の所定期間
Ｘで音声パワーを図３（Ａ）の実線ＩＩＩ　に示す第２
閾値と比較して、この第２閾値を越えたとき開始点を移
動する（ステップ１７）。

【００１５】ここで、第２閾値は図３（Ｂ）に示す如く
期間Ｘ内で開始点Ｃより前となる程、値が大きくなり、
最大でも第１閾値より小さくなるように設定されている
。

【００１６】上記のステップ１５，１６について図４の
フローチャートを用いて更に詳しく説明する。同図中、
ステップ２０で音声の開始点Ｃを検出した後、ステップ
２１で開始点Ｃから前の期間Ｘについて時間軸に対し値
が変化する第２閾値を設定する。この後、開始点Ｃから
順に時間をさかのぼり、ステップ２２で音声パワー値が
第２閾値以上かどうかを判別し、第２閾値以上の場合に
はステップ２３で音の始点をこの音声パワーが第２閾値
を越えた時点に移動する。ステップ２４では期間Ｘが終
了したかどうかを判別し、終了していない場合はステッ
プ２２に戻り時間をさかのぼって音声パワー値を第２閾
値と比較し、期間Ｘが終了すると上記の処理を終了する
。

【００１７】これによって、音声の開始点は開始点Ｃか
ら時点Ｃ，Ｅ，Ｆ，Ｇ，Ｈの順に移動され、図２のステ
ップ１６により最終的には時点Ｈが音声の開始点とされ
る。この後ステップ１７で時点Ｈ以降のディジタル音声
信号が音声として切り出される。

【００１８】このように、第１閾値よりも音声パワーが
小さくても、所定期間でこの第１閾値より小さい第２閾
値を越えるとその時点まで音声の開始点を移動させるた
め、音声パワーが第１閾値未満であっても音声パワーが
変動して音声が開始しているような場合も音声の開始点
を正確に検出して切り出すことができ、それだけ音声の
認識率が高くなる。

【００１９】

【発明の効果】上述の如く、本発明の音声の切り出し装
置によれば、音声の開始点を正確に検出して切り出すこ
とができ、音声の認識率が向上し、実用上きわめて有用
である。

【図面の簡単な説明】

【図１】本発明の原理図である。

【図２】本発明装置のフローチャートである。

【図３】本発明装置を説明するための図である。

【図４】本発明装置の要部のフローチャートである。

【図５】従来装置を説明するための図である。

【符号の説明】

１　　第１の比較手段３　　第２の比較手段４　　開始点移動手段５　　切り出し手段１０〜２４　　ステップ

Claims

【特許請求の範囲】

【請求項１】　　入力された音声のパワーを一定値の第
１閾値と比較して該第１閾値を越えたときを音声の開始
点とする第１の比較手段（１）と、該第１の比較手段（
１）で得られた音声の開始点より以前の所定期間で該音
声の開始点より前となる程値が大きくなり、かつ該第１
閾値よりも小さな値の第２閾値と該音声のパワーを比較
する第２の比較手段（３）と、該所定期間で該音声のパ
ワーが該第２閾値を越えた最も早い時点に音声の開始点
を移動させる開始点移動手段（４）とを有し、開始点移
動手段（４）で移動した音声の開始点より音声の切り出
しを行なうことを特徴とする音声の切り出し装置。