JPS62238599A - 音声区間検出方法 - Google Patents
音声区間検出方法Info
- Publication number
- JPS62238599A JPS62238599A JP61082808A JP8280886A JPS62238599A JP S62238599 A JPS62238599 A JP S62238599A JP 61082808 A JP61082808 A JP 61082808A JP 8280886 A JP8280886 A JP 8280886A JP S62238599 A JPS62238599 A JP S62238599A
- Authority
- JP
- Japan
- Prior art keywords
- section
- detection method
- voice
- voiced
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
五夏氷駅
本発明は、音声認識装置における音声区間検出方式に関
する。
する。
丈米技嵐
音声認識装置の音声区間検出方式において、始端の検出
方式はさまざまあり、種々有効な方法が報告されている
が、端始以降の音声区間検出には。
方式はさまざまあり、種々有効な方法が報告されている
が、端始以降の音声区間検出には。
一般的には、一定則値が用いられている。一方、音声認
識装置の音声区間検出はほとんどの場合、リアルタイム
検出が要求されており、先の一定閾値をある音声入力時
以外にその周囲ノイズをサンプルし、それを基にして次
単語の一定閾値を決定しているのが現状である。このよ
うに、一定則値の場合、語頭が子音などの場合欠落する
可能性が大きいが、特に、語頭は重要な要素が大きい。
識装置の音声区間検出はほとんどの場合、リアルタイム
検出が要求されており、先の一定閾値をある音声入力時
以外にその周囲ノイズをサンプルし、それを基にして次
単語の一定閾値を決定しているのが現状である。このよ
うに、一定則値の場合、語頭が子音などの場合欠落する
可能性が大きいが、特に、語頭は重要な要素が大きい。
上述のように、従来技術においては、音声始端が検出さ
れた後、語中においては少なくとも一定閾値で音声区間
を検出していため、決定されている閾値が高い場合(比
較的騒音レベルが高い場合)音声パワーの低い部分つま
りは子音部分などを欠落する可能性が高かった。
れた後、語中においては少なくとも一定閾値で音声区間
を検出していため、決定されている閾値が高い場合(比
較的騒音レベルが高い場合)音声パワーの低い部分つま
りは子音部分などを欠落する可能性が高かった。
ニーー旗
本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声区間をより正確に検出することを目的として
なされたものである。
特に、音声区間をより正確に検出することを目的として
なされたものである。
盈−一%
本発明は、上記目的を達成するために、マイクから入力
された音声の音声パワーを検出する手段。
された音声の音声パワーを検出する手段。
n(n=整数)チャンネルのバンドパスフィルタを有し
、周波数を分析して各チャンネルのパワー得る手段、及
び、その周波数差分パワースペクトルを検出する手段と
を有する音声区間検出方式において、音声始端を検出し
た時点で、ある所定区間の間切り出し閾値を下げて語頭
部分の検出精度を上げるようにしたことを特徴としたも
のである。
、周波数を分析して各チャンネルのパワー得る手段、及
び、その周波数差分パワースペクトルを検出する手段と
を有する音声区間検出方式において、音声始端を検出し
た時点で、ある所定区間の間切り出し閾値を下げて語頭
部分の検出精度を上げるようにしたことを特徴としたも
のである。
以下、本発明の実施例に基いて説明する。
第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図で1図中、1はマイクロフォン、2は前処理
部、3は音声パワー生成部、4は始端検出部、5はnフ
レームチェック部、6は閾値決定部、7は閾値からの減
算部、8は比較部である6 第2図及び第3図は、それぞれ本発明の動作説明をする
ためのタイムチャートで、両図とも(a)は音声パワー
信号、(b)及び(c)は音声区間パルスで、(b)は
従来技術による音声区間パルス、(C)は本発明による
音声区間パルスである。
ロック線図で1図中、1はマイクロフォン、2は前処理
部、3は音声パワー生成部、4は始端検出部、5はnフ
レームチェック部、6は閾値決定部、7は閾値からの減
算部、8は比較部である6 第2図及び第3図は、それぞれ本発明の動作説明をする
ためのタイムチャートで、両図とも(a)は音声パワー
信号、(b)及び(c)は音声区間パルスで、(b)は
従来技術による音声区間パルス、(C)は本発明による
音声区間パルスである。
第2図は、始端検出が8点で行われた場合の例で、この
場合、子音の先頭で正確に行われたにもかかわらず、音
声パワーによる検出閾値pthが高いために音声区間パ
ルスは(b)に示すように語頭の部分のみが残り、有用
な情報を切り落すことになる。従って、始端からnフレ
ームの区間のみ区間の閾値を下げておき、nフレームた
った時点で閾値をもとに戻すようにすれば、音声区間パ
ルスは(c)のようになり、有用な情報が欠落すること
はない。
場合、子音の先頭で正確に行われたにもかかわらず、音
声パワーによる検出閾値pthが高いために音声区間パ
ルスは(b)に示すように語頭の部分のみが残り、有用
な情報を切り落すことになる。従って、始端からnフレ
ームの区間のみ区間の閾値を下げておき、nフレームた
った時点で閾値をもとに戻すようにすれば、音声区間パ
ルスは(c)のようになり、有用な情報が欠落すること
はない。
第3図は、語中に無音区間が生じた場合の例で。
この場合、次の有音区間の先頭に有用な子音情報がある
が(例えばストップ、復改など)、この場合も、前記と
同様にして音声区間パルス(c)を検出することが可能
となる。
が(例えばストップ、復改など)、この場合も、前記と
同様にして音声区間パルス(c)を検出することが可能
となる。
第4図は、本発明の他の実施例を説明するための電気的
ブロック線図で、この実施例は、第1図に示した実施例
に更に有声/無声検出回路9を付加し、前記のnフレー
ム区間を自動的に制御するようにしたものである。
ブロック線図で、この実施例は、第1図に示した実施例
に更に有声/無声検出回路9を付加し、前記のnフレー
ム区間を自動的に制御するようにしたものである。
第5図は、第4図に示した実施例の動作説明をするため
のタイムチャートで、(a)は音声パワー信号、(b)
は有声/無声信号、(Q)は音声区間信号であるが、閾
値を下げる目的は主に子音の救済にある。而して、子音
はすべてが無声である訳ではないが比較的無声音が多い
。そこで、音声の有声/無声信号を利用し、nフレーム
中に有声音が発生した場合には閾値を下げておく必要が
なくなるので、閾値をもとに戻す(閾値は正常値の方が
望ましいのは当然であり、閾値を下げることによりノイ
ズを切り出してしまう可能性が強い)。又、無声音が続
いても、nフレームたったら閾値をもとに戻せば良いこ
とになる。
のタイムチャートで、(a)は音声パワー信号、(b)
は有声/無声信号、(Q)は音声区間信号であるが、閾
値を下げる目的は主に子音の救済にある。而して、子音
はすべてが無声である訳ではないが比較的無声音が多い
。そこで、音声の有声/無声信号を利用し、nフレーム
中に有声音が発生した場合には閾値を下げておく必要が
なくなるので、閾値をもとに戻す(閾値は正常値の方が
望ましいのは当然であり、閾値を下げることによりノイ
ズを切り出してしまう可能性が強い)。又、無声音が続
いても、nフレームたったら閾値をもとに戻せば良いこ
とになる。
効 果
以上の説明から明らかなように、本発明によると、語中
の閾値による子音の欠落を最小に押えることができる。
の閾値による子音の欠落を最小に押えることができる。
第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図、第2図及び第3図は、それぞれ第1図に示
した実施例の動作説明をするためのタイムチャート、第
4図は、本発明の他の実施例を説明するための電気的ブ
ロック線図、第5図は、第4図に示した実施例の動作説
明をするためのタイムチャートである。 1・・・マイクロフォン、2・・・前処理部、3・・・
音声パワー生成部、4・・・始端検出部、5・・・nフ
レームチェック部、6・・・閾値決定部、7・・・閾値
からの減算部、8・・・比較部、9・・・有声/無声検
出回路。 第1図 第 2 図 萬 3 図 (C) 第4図 ? 第 52 (C)
ロック線図、第2図及び第3図は、それぞれ第1図に示
した実施例の動作説明をするためのタイムチャート、第
4図は、本発明の他の実施例を説明するための電気的ブ
ロック線図、第5図は、第4図に示した実施例の動作説
明をするためのタイムチャートである。 1・・・マイクロフォン、2・・・前処理部、3・・・
音声パワー生成部、4・・・始端検出部、5・・・nフ
レームチェック部、6・・・閾値決定部、7・・・閾値
からの減算部、8・・・比較部、9・・・有声/無声検
出回路。 第1図 第 2 図 萬 3 図 (C) 第4図 ? 第 52 (C)
Claims (3)
- (1)、マイクから入力された音声の音声パワーを検出
する手段、n(n=整数)チャンネルのバンドパスフィ
ルタを有し、周波数を分析して各チャンネルのパワー得
る手段、及び、その周波数差分パワースペクトルを検出
する手段とを有する音声区間検出方式において、音声始
端を検出した時点で、ある所定区間の間切り出し閾値を
下げて語頭部分の検出精度を上げることを特徴とする音
声区間検出方式。 - (2)、音声区間中に無音区間がある区間存在する場合
、その次の有音区間の始端を検出した時点で、ある所定
区間の間切り出し閾値を下げるようにしたことを特徴と
する特許請求の範囲第(1)項に記載の音声区間検出方
式。 - (3)、当該フレームの有声/無声信号が無声区間中は
閾値を下げておき、有声信号が発生した時点で閾値をも
とにもどすことを特徴とする特許請求の範囲第(1)項
又は第(2)項に記載の音声区間検出方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61082808A JPH0792672B2 (ja) | 1986-04-10 | 1986-04-10 | 音声区間検出方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61082808A JPH0792672B2 (ja) | 1986-04-10 | 1986-04-10 | 音声区間検出方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS62238599A true JPS62238599A (ja) | 1987-10-19 |
| JPH0792672B2 JPH0792672B2 (ja) | 1995-10-09 |
Family
ID=13784710
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP61082808A Expired - Fee Related JPH0792672B2 (ja) | 1986-04-10 | 1986-04-10 | 音声区間検出方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0792672B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6704702B2 (en) | 1997-01-23 | 2004-03-09 | Kabushiki Kaisha Toshiba | Speech encoding method, apparatus and program |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58190993A (ja) * | 1982-05-01 | 1983-11-08 | 日産自動車株式会社 | 車両用音声検出装置 |
| JPS60242500A (ja) * | 1984-05-17 | 1985-12-02 | 日本電気株式会社 | 音声検出方法及び回路 |
-
1986
- 1986-04-10 JP JP61082808A patent/JPH0792672B2/ja not_active Expired - Fee Related
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58190993A (ja) * | 1982-05-01 | 1983-11-08 | 日産自動車株式会社 | 車両用音声検出装置 |
| JPS60242500A (ja) * | 1984-05-17 | 1985-12-02 | 日本電気株式会社 | 音声検出方法及び回路 |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6704702B2 (en) | 1997-01-23 | 2004-03-09 | Kabushiki Kaisha Toshiba | Speech encoding method, apparatus and program |
| US7191120B2 (en) | 1997-01-23 | 2007-03-13 | Kabushiki Kaisha Toshiba | Speech encoding method, apparatus and program |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0792672B2 (ja) | 1995-10-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8326610B2 (en) | Producing phonitos based on feature vectors | |
| JPH0431898A (ja) | 音声雑音分離装置 | |
| JPS62238599A (ja) | 音声区間検出方法 | |
| WO2009055718A1 (en) | Producing phonitos based on feature vectors | |
| JPS61233791A (ja) | 音声認識装置における音声区間検出方式 | |
| JPS6217800A (ja) | 音声区間判定方式 | |
| KR100345402B1 (ko) | 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법 | |
| JPS61292699A (ja) | 音声通過フイルタ | |
| KR0180651B1 (ko) | 음성인식장치 | |
| JPS59228300A (ja) | 音声区間検出方式 | |
| JP2891259B2 (ja) | 音声区間検出装置 | |
| JPS61260299A (ja) | 音声認識装置 | |
| JPS6267598A (ja) | 音声区間検出方式 | |
| JPH0652479B2 (ja) | 音声分析方式 | |
| JPS6031196A (ja) | 音声パタ−ン作成装置 | |
| JPS59204099A (ja) | 音声認識方式 | |
| JPS61273599A (ja) | 音声認識装置 | |
| JPS62244100A (ja) | 音声区間検出方式 | |
| JPS58113992A (ja) | 音声信号圧縮方式 | |
| JPH04251299A (ja) | 音声区間検出方法 | |
| JPS5995597A (ja) | 音声特徴パラメ−タ作成方式 | |
| JPS61177499A (ja) | 音声区間検出方式 | |
| JPS61277998A (ja) | 音声認識回路 | |
| JPH07104675B2 (ja) | 音声認識方法 | |
| JPS63127296A (ja) | 音声区間検出方式 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |