JPH04355799A - 音声の切り出し装置 - Google Patents
音声の切り出し装置Info
- Publication number
- JPH04355799A JPH04355799A JP3131314A JP13131491A JPH04355799A JP H04355799 A JPH04355799 A JP H04355799A JP 3131314 A JP3131314 A JP 3131314A JP 13131491 A JP13131491 A JP 13131491A JP H04355799 A JPH04355799 A JP H04355799A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- threshold value
- start point
- power
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】本発明は音声の切り出し装置に関
し、音声の開始点を検出して切り出しを行なう音声の切
り出し装置に関する。
し、音声の開始点を検出して切り出しを行なう音声の切
り出し装置に関する。
【0002】音声認識を行なう場合には音声の開始点を
検出して、この開始点から音声を切り出して認識を行な
う。この音声の開始点を誤って検出すると音声自体の持
つ情報が変化して認識率が低下するため音声の開始点を
正確に検出する必要がある。
検出して、この開始点から音声を切り出して認識を行な
う。この音声の開始点を誤って検出すると音声自体の持
つ情報が変化して認識率が低下するため音声の開始点を
正確に検出する必要がある。
【0003】
【従来の技術】従来は、マイクロホンで集音したアナロ
グの音声信号をディジタル化し、このディジタル音声信
号から音声パワーを演算により求める。この音声パワー
を図5(A)に示す第1閾値と比較して、第1閾値を越
えた時点Cを音声の開始点としており、音声パワーが零
でなくとも 第1閾値未満であればこれをノイズとみ
なす。このようにして検出した音声の開始点以降の音声
を切り出している。
グの音声信号をディジタル化し、このディジタル音声信
号から音声パワーを演算により求める。この音声パワー
を図5(A)に示す第1閾値と比較して、第1閾値を越
えた時点Cを音声の開始点としており、音声パワーが零
でなくとも 第1閾値未満であればこれをノイズとみ
なす。このようにして検出した音声の開始点以降の音声
を切り出している。
【0004】
【発明が解決しようする課題】従来方法では、図5(B
)のW区間の如く音声パワーは第1閾値未満であるが既
に音声パワーが変動し歴然として音声が開始している場
合であっても、音声の開始点は時点Cと検出される。こ
のため音声の切り出しは時点Cから行なわれてしまい、
音声の開始点が誤っているために認識率が悪化するとい
う問題があった。
)のW区間の如く音声パワーは第1閾値未満であるが既
に音声パワーが変動し歴然として音声が開始している場
合であっても、音声の開始点は時点Cと検出される。こ
のため音声の切り出しは時点Cから行なわれてしまい、
音声の開始点が誤っているために認識率が悪化するとい
う問題があった。
【0005】本発明は上記の点に鑑みなされたもので、
音声の開始点を正確に検出して切り出し、認識率が向上
する音声の切り出し装置を提供することを目的とする。
音声の開始点を正確に検出して切り出し、認識率が向上
する音声の切り出し装置を提供することを目的とする。
【0006】
【課題を解決するための手段】図1は本発明の原理図を
示す。
示す。
【0007】同図中、第1の比較手段1は端子2より、
入力された音声のパワーを一定値の第1閾値と比較して
第1閾値を越えたときを音声の開始点とする。
入力された音声のパワーを一定値の第1閾値と比較して
第1閾値を越えたときを音声の開始点とする。
【0008】第2の比較手段3は、第1の比較手段1で
得られた音声の開始点より以前の所定期間で音声の開始
点より前となる程値が大きくなり、かつ第1閾値よりも
小さな値の第2閾値と音声のパワーを比較する。
得られた音声の開始点より以前の所定期間で音声の開始
点より前となる程値が大きくなり、かつ第1閾値よりも
小さな値の第2閾値と音声のパワーを比較する。
【0009】開始点移動手段4は、所定期間で該音声の
パワーが該第2閾値を越えた最も早い時点に音声の開始
点を移動させる。
パワーが該第2閾値を越えた最も早い時点に音声の開始
点を移動させる。
【0010】切り出し手段5は開始点移動手段4で移動
した音声の開始点より音声の切り出しを行なう。
した音声の開始点より音声の切り出しを行なう。
【0011】
【作用】本発明においては、第1閾値よりも音声パワー
が小さくても、所定期間でこの第1閾値より小さい第2
閾値を越えるとその時点まで音声の開始点を移動させる
ため、音声パワーが第1閾値未満であっても音声パワー
が変動して音声が開始しているような場合も音声の開始
点を正確に検出して切り出すことがてきる。
が小さくても、所定期間でこの第1閾値より小さい第2
閾値を越えるとその時点まで音声の開始点を移動させる
ため、音声パワーが第1閾値未満であっても音声パワー
が変動して音声が開始しているような場合も音声の開始
点を正確に検出して切り出すことがてきる。
【0012】
【実施例】図2は本発明装置のフローチャートを示す。
同図中、ステップ10でマイクロホン等より音声を入力
する。
する。
【0013】ステップ11では入力音声をディジタル化
し、ステップ12でこのディジタル音声信号のパワー値
を計算し、図3(A)の実線Iに示す如き音声パワーを
求める。
し、ステップ12でこのディジタル音声信号のパワー値
を計算し、図3(A)の実線Iに示す如き音声パワーを
求める。
【0014】次にステップ13では音声パワーを図3(
A)の実線IIに示す第1閾値と比較して、この第1閾
値を越えた時点Cを音声の開始点とする(ステップ14
)。この後、ステップ15で、開始点C以前の所定期間
Xで音声パワーを図3(A)の実線III に示す第2
閾値と比較して、この第2閾値を越えたとき開始点を移
動する(ステップ17)。
A)の実線IIに示す第1閾値と比較して、この第1閾
値を越えた時点Cを音声の開始点とする(ステップ14
)。この後、ステップ15で、開始点C以前の所定期間
Xで音声パワーを図3(A)の実線III に示す第2
閾値と比較して、この第2閾値を越えたとき開始点を移
動する(ステップ17)。
【0015】ここで、第2閾値は図3(B)に示す如く
期間X内で開始点Cより前となる程、値が大きくなり、
最大でも第1閾値より小さくなるように設定されている
。
期間X内で開始点Cより前となる程、値が大きくなり、
最大でも第1閾値より小さくなるように設定されている
。
【0016】上記のステップ15,16について図4の
フローチャートを用いて更に詳しく説明する。同図中、
ステップ20で音声の開始点Cを検出した後、ステップ
21で開始点Cから前の期間Xについて時間軸に対し値
が変化する第2閾値を設定する。この後、開始点Cから
順に時間をさかのぼり、ステップ22で音声パワー値が
第2閾値以上かどうかを判別し、第2閾値以上の場合に
はステップ23で音の始点をこの音声パワーが第2閾値
を越えた時点に移動する。ステップ24では期間Xが終
了したかどうかを判別し、終了していない場合はステッ
プ22に戻り時間をさかのぼって音声パワー値を第2閾
値と比較し、期間Xが終了すると上記の処理を終了する
。
フローチャートを用いて更に詳しく説明する。同図中、
ステップ20で音声の開始点Cを検出した後、ステップ
21で開始点Cから前の期間Xについて時間軸に対し値
が変化する第2閾値を設定する。この後、開始点Cから
順に時間をさかのぼり、ステップ22で音声パワー値が
第2閾値以上かどうかを判別し、第2閾値以上の場合に
はステップ23で音の始点をこの音声パワーが第2閾値
を越えた時点に移動する。ステップ24では期間Xが終
了したかどうかを判別し、終了していない場合はステッ
プ22に戻り時間をさかのぼって音声パワー値を第2閾
値と比較し、期間Xが終了すると上記の処理を終了する
。
【0017】これによって、音声の開始点は開始点Cか
ら時点C,E,F,G,Hの順に移動され、図2のステ
ップ16により最終的には時点Hが音声の開始点とされ
る。この後ステップ17で時点H以降のディジタル音声
信号が音声として切り出される。
ら時点C,E,F,G,Hの順に移動され、図2のステ
ップ16により最終的には時点Hが音声の開始点とされ
る。この後ステップ17で時点H以降のディジタル音声
信号が音声として切り出される。
【0018】このように、第1閾値よりも音声パワーが
小さくても、所定期間でこの第1閾値より小さい第2閾
値を越えるとその時点まで音声の開始点を移動させるた
め、音声パワーが第1閾値未満であっても音声パワーが
変動して音声が開始しているような場合も音声の開始点
を正確に検出して切り出すことができ、それだけ音声の
認識率が高くなる。
小さくても、所定期間でこの第1閾値より小さい第2閾
値を越えるとその時点まで音声の開始点を移動させるた
め、音声パワーが第1閾値未満であっても音声パワーが
変動して音声が開始しているような場合も音声の開始点
を正確に検出して切り出すことができ、それだけ音声の
認識率が高くなる。
【0019】
【発明の効果】上述の如く、本発明の音声の切り出し装
置によれば、音声の開始点を正確に検出して切り出すこ
とができ、音声の認識率が向上し、実用上きわめて有用
である。
置によれば、音声の開始点を正確に検出して切り出すこ
とができ、音声の認識率が向上し、実用上きわめて有用
である。
【図1】本発明の原理図である。
【図2】本発明装置のフローチャートである。
【図3】本発明装置を説明するための図である。
【図4】本発明装置の要部のフローチャートである。
【図5】従来装置を説明するための図である。
1 第1の比較手段
3 第2の比較手段
4 開始点移動手段
5 切り出し手段
10〜24 ステップ
Claims (1)
- 【請求項1】 入力された音声のパワーを一定値の第
1閾値と比較して該第1閾値を越えたときを音声の開始
点とする第1の比較手段(1)と、該第1の比較手段(
1)で得られた音声の開始点より以前の所定期間で該音
声の開始点より前となる程値が大きくなり、かつ該第1
閾値よりも小さな値の第2閾値と該音声のパワーを比較
する第2の比較手段(3)と、該所定期間で該音声のパ
ワーが該第2閾値を越えた最も早い時点に音声の開始点
を移動させる開始点移動手段(4)とを有し、開始点移
動手段(4)で移動した音声の開始点より音声の切り出
しを行なうことを特徴とする音声の切り出し装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3131314A JPH04355799A (ja) | 1991-06-03 | 1991-06-03 | 音声の切り出し装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3131314A JPH04355799A (ja) | 1991-06-03 | 1991-06-03 | 音声の切り出し装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH04355799A true JPH04355799A (ja) | 1992-12-09 |
Family
ID=15055062
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3131314A Withdrawn JPH04355799A (ja) | 1991-06-03 | 1991-06-03 | 音声の切り出し装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH04355799A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2022117375A (ja) * | 2021-01-29 | 2022-08-10 | 株式会社アイシン | 音声認識プログラム及び音声認識装置 |
-
1991
- 1991-06-03 JP JP3131314A patent/JPH04355799A/ja not_active Withdrawn
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2022117375A (ja) * | 2021-01-29 | 2022-08-10 | 株式会社アイシン | 音声認識プログラム及び音声認識装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3604393B2 (ja) | 音声検出装置 | |
| CN101625860B (zh) | 语音端点检测中的背景噪声自适应调整方法 | |
| US20090047003A1 (en) | Playback apparatus and method | |
| US20030055639A1 (en) | Speech processing apparatus and method | |
| JPH0895589A (ja) | 音声合成方法及びシステム | |
| JP2000310993A (ja) | 音声検出装置 | |
| JPH04355799A (ja) | 音声の切り出し装置 | |
| JP2000163099A (ja) | 雑音除去装置、音声認識装置および記憶媒体 | |
| JP3091537B2 (ja) | 音声パターン作成方法 | |
| KR100273395B1 (ko) | 음성인식시스템의음성구간검출방법 | |
| KR100345402B1 (ko) | 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법 | |
| JP3484559B2 (ja) | 音声認識装置および音声認識方法 | |
| CN101625859B (zh) | 语音端点检测中的短时能频值波形斜率门限的确定方法 | |
| JPH06337696A (ja) | 速度変換制御装置と速度変換制御方法 | |
| JP2844592B2 (ja) | 離散単語音声認識装置 | |
| JP3063856B2 (ja) | 音声認識におけるマッチング距離値の極小値探索方法 | |
| JPH03233600A (ja) | 音声切り出し方法及び音声認識装置 | |
| JPH04251299A (ja) | 音声区間検出方法 | |
| JP4552064B2 (ja) | 音声レベル自動補正装置 | |
| JPS61292199A (ja) | 音声認識装置 | |
| KR20000074086A (ko) | 음성의 피치 차이값을 이용한 음성 파일의 끝점 검출방법 | |
| JPS63281199A (ja) | 音声セグメンテ−ション装置 | |
| JPH06266383A (ja) | 音声切出装置 | |
| JPH0740200B2 (ja) | 音声区間検出方法 | |
| KR0128669B1 (ko) | 음성 신호의 실시간 음성부 검출 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 19980903 |