JPS62238599A - 音声区間検出方法 - Google Patents

音声区間検出方法

Info

Publication number
JPS62238599A
JPS62238599A JP61082808A JP8280886A JPS62238599A JP S62238599 A JPS62238599 A JP S62238599A JP 61082808 A JP61082808 A JP 61082808A JP 8280886 A JP8280886 A JP 8280886A JP S62238599 A JPS62238599 A JP S62238599A
Authority
JP
Japan
Prior art keywords
section
detection method
voice
voiced
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61082808A
Other languages
English (en)
Other versions
JPH0792672B2 (ja
Inventor
安田 晴剛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61082808A priority Critical patent/JPH0792672B2/ja
Publication of JPS62238599A publication Critical patent/JPS62238599A/ja
Publication of JPH0792672B2 publication Critical patent/JPH0792672B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 五夏氷駅 本発明は、音声認識装置における音声区間検出方式に関
する。
丈米技嵐 音声認識装置の音声区間検出方式において、始端の検出
方式はさまざまあり、種々有効な方法が報告されている
が、端始以降の音声区間検出には。
一般的には、一定則値が用いられている。一方、音声認
識装置の音声区間検出はほとんどの場合、リアルタイム
検出が要求されており、先の一定閾値をある音声入力時
以外にその周囲ノイズをサンプルし、それを基にして次
単語の一定閾値を決定しているのが現状である。このよ
うに、一定則値の場合、語頭が子音などの場合欠落する
可能性が大きいが、特に、語頭は重要な要素が大きい。
上述のように、従来技術においては、音声始端が検出さ
れた後、語中においては少なくとも一定閾値で音声区間
を検出していため、決定されている閾値が高い場合(比
較的騒音レベルが高い場合)音声パワーの低い部分つま
りは子音部分などを欠落する可能性が高かった。
ニーー旗 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声区間をより正確に検出することを目的として
なされたものである。
盈−一% 本発明は、上記目的を達成するために、マイクから入力
された音声の音声パワーを検出する手段。
n(n=整数)チャンネルのバンドパスフィルタを有し
、周波数を分析して各チャンネルのパワー得る手段、及
び、その周波数差分パワースペクトルを検出する手段と
を有する音声区間検出方式において、音声始端を検出し
た時点で、ある所定区間の間切り出し閾値を下げて語頭
部分の検出精度を上げるようにしたことを特徴としたも
のである。
以下、本発明の実施例に基いて説明する。
第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図で1図中、1はマイクロフォン、2は前処理
部、3は音声パワー生成部、4は始端検出部、5はnフ
レームチェック部、6は閾値決定部、7は閾値からの減
算部、8は比較部である6 第2図及び第3図は、それぞれ本発明の動作説明をする
ためのタイムチャートで、両図とも(a)は音声パワー
信号、(b)及び(c)は音声区間パルスで、(b)は
従来技術による音声区間パルス、(C)は本発明による
音声区間パルスである。
第2図は、始端検出が8点で行われた場合の例で、この
場合、子音の先頭で正確に行われたにもかかわらず、音
声パワーによる検出閾値pthが高いために音声区間パ
ルスは(b)に示すように語頭の部分のみが残り、有用
な情報を切り落すことになる。従って、始端からnフレ
ームの区間のみ区間の閾値を下げておき、nフレームた
った時点で閾値をもとに戻すようにすれば、音声区間パ
ルスは(c)のようになり、有用な情報が欠落すること
はない。
第3図は、語中に無音区間が生じた場合の例で。
この場合、次の有音区間の先頭に有用な子音情報がある
が(例えばストップ、復改など)、この場合も、前記と
同様にして音声区間パルス(c)を検出することが可能
となる。
第4図は、本発明の他の実施例を説明するための電気的
ブロック線図で、この実施例は、第1図に示した実施例
に更に有声/無声検出回路9を付加し、前記のnフレー
ム区間を自動的に制御するようにしたものである。
第5図は、第4図に示した実施例の動作説明をするため
のタイムチャートで、(a)は音声パワー信号、(b)
は有声/無声信号、(Q)は音声区間信号であるが、閾
値を下げる目的は主に子音の救済にある。而して、子音
はすべてが無声である訳ではないが比較的無声音が多い
。そこで、音声の有声/無声信号を利用し、nフレーム
中に有声音が発生した場合には閾値を下げておく必要が
なくなるので、閾値をもとに戻す(閾値は正常値の方が
望ましいのは当然であり、閾値を下げることによりノイ
ズを切り出してしまう可能性が強い)。又、無声音が続
いても、nフレームたったら閾値をもとに戻せば良いこ
とになる。
効   果 以上の説明から明らかなように、本発明によると、語中
の閾値による子音の欠落を最小に押えることができる。
【図面の簡単な説明】
第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図、第2図及び第3図は、それぞれ第1図に示
した実施例の動作説明をするためのタイムチャート、第
4図は、本発明の他の実施例を説明するための電気的ブ
ロック線図、第5図は、第4図に示した実施例の動作説
明をするためのタイムチャートである。 1・・・マイクロフォン、2・・・前処理部、3・・・
音声パワー生成部、4・・・始端検出部、5・・・nフ
レームチェック部、6・・・閾値決定部、7・・・閾値
からの減算部、8・・・比較部、9・・・有声/無声検
出回路。 第1図 第 2 図 萬 3 図 (C) 第4図 ? 第 52 (C)

Claims (3)

    【特許請求の範囲】
  1. (1)、マイクから入力された音声の音声パワーを検出
    する手段、n(n=整数)チャンネルのバンドパスフィ
    ルタを有し、周波数を分析して各チャンネルのパワー得
    る手段、及び、その周波数差分パワースペクトルを検出
    する手段とを有する音声区間検出方式において、音声始
    端を検出した時点で、ある所定区間の間切り出し閾値を
    下げて語頭部分の検出精度を上げることを特徴とする音
    声区間検出方式。
  2. (2)、音声区間中に無音区間がある区間存在する場合
    、その次の有音区間の始端を検出した時点で、ある所定
    区間の間切り出し閾値を下げるようにしたことを特徴と
    する特許請求の範囲第(1)項に記載の音声区間検出方
    式。
  3. (3)、当該フレームの有声/無声信号が無声区間中は
    閾値を下げておき、有声信号が発生した時点で閾値をも
    とにもどすことを特徴とする特許請求の範囲第(1)項
    又は第(2)項に記載の音声区間検出方式。
JP61082808A 1986-04-10 1986-04-10 音声区間検出方法 Expired - Fee Related JPH0792672B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61082808A JPH0792672B2 (ja) 1986-04-10 1986-04-10 音声区間検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61082808A JPH0792672B2 (ja) 1986-04-10 1986-04-10 音声区間検出方法

Publications (2)

Publication Number Publication Date
JPS62238599A true JPS62238599A (ja) 1987-10-19
JPH0792672B2 JPH0792672B2 (ja) 1995-10-09

Family

ID=13784710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61082808A Expired - Fee Related JPH0792672B2 (ja) 1986-04-10 1986-04-10 音声区間検出方法

Country Status (1)

Country Link
JP (1) JPH0792672B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6704702B2 (en) 1997-01-23 2004-03-09 Kabushiki Kaisha Toshiba Speech encoding method, apparatus and program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58190993A (ja) * 1982-05-01 1983-11-08 日産自動車株式会社 車両用音声検出装置
JPS60242500A (ja) * 1984-05-17 1985-12-02 日本電気株式会社 音声検出方法及び回路

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58190993A (ja) * 1982-05-01 1983-11-08 日産自動車株式会社 車両用音声検出装置
JPS60242500A (ja) * 1984-05-17 1985-12-02 日本電気株式会社 音声検出方法及び回路

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6704702B2 (en) 1997-01-23 2004-03-09 Kabushiki Kaisha Toshiba Speech encoding method, apparatus and program
US7191120B2 (en) 1997-01-23 2007-03-13 Kabushiki Kaisha Toshiba Speech encoding method, apparatus and program

Also Published As

Publication number Publication date
JPH0792672B2 (ja) 1995-10-09

Similar Documents

Publication Publication Date Title
US8326610B2 (en) Producing phonitos based on feature vectors
JPH0431898A (ja) 音声雑音分離装置
JPS62238599A (ja) 音声区間検出方法
WO2009055718A1 (en) Producing phonitos based on feature vectors
JPS61233791A (ja) 音声認識装置における音声区間検出方式
JPS6217800A (ja) 音声区間判定方式
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
JPS61292699A (ja) 音声通過フイルタ
KR0180651B1 (ko) 음성인식장치
JPS59228300A (ja) 音声区間検出方式
JP2891259B2 (ja) 音声区間検出装置
JPS61260299A (ja) 音声認識装置
JPS6267598A (ja) 音声区間検出方式
JPH0652479B2 (ja) 音声分析方式
JPS6031196A (ja) 音声パタ−ン作成装置
JPS59204099A (ja) 音声認識方式
JPS61273599A (ja) 音声認識装置
JPS62244100A (ja) 音声区間検出方式
JPS58113992A (ja) 音声信号圧縮方式
JPH04251299A (ja) 音声区間検出方法
JPS5995597A (ja) 音声特徴パラメ−タ作成方式
JPS61177499A (ja) 音声区間検出方式
JPS61277998A (ja) 音声認識回路
JPH07104675B2 (ja) 音声認識方法
JPS63127296A (ja) 音声区間検出方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees