JPH04115299A - 音声有音無音判定方法および装置 - Google Patents

音声有音無音判定方法および装置

Info

Publication number
JPH04115299A
JPH04115299A JP2236752A JP23675290A JPH04115299A JP H04115299 A JPH04115299 A JP H04115299A JP 2236752 A JP2236752 A JP 2236752A JP 23675290 A JP23675290 A JP 23675290A JP H04115299 A JPH04115299 A JP H04115299A
Authority
JP
Japan
Prior art keywords
stationary
voice
spectrum
pitch
absence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2236752A
Other languages
English (en)
Inventor
Hiroko Kezuka
毛塚 博子
Koji Yoshida
幸司 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2236752A priority Critical patent/JPH04115299A/ja
Publication of JPH04115299A publication Critical patent/JPH04115299A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、ディジタル通信、ボイスメール、パケット通
信等に利用する音声有音無音判定方法および装置に関す
る。
従来の技術 第3図には従来の音声有音無音判定方法の一例が示され
ている。第3図において、まず一定時間(以下、フレー
ムという。)毎に音声信号を入力しくステップ1)、入
力した音声信号にピッチが有るか無いかを判定する(ス
テップ2)。ピッチが無ければ、さらに、入力した音声
信号のスペクトルが複数個前のフレームに渡って定常か
非定常かを判定する(ステップ3)。そしてピッチが無
く、かつスペクトルが定常であれば、入力した音声信号
を無音と判定しくステップ5)、これ以外を有音と判定
する(ステップ4)。
このように、上記従来の音声有音無音判定方法でもピッ
チが無くスペクトルが定常な雑音信号を無音と判定し、
スペクトルの変化の激しい子音やスペクトルは定常でも
ピッチが有る母音を有音と判定することができる。
発明が解決しようとする課題 しかしながら、上記従来の音声有音無音判定方法では、
ピッチが無くスペクトルが定常であれば無音と判定して
いるため、スペクトルが非定常であってもピッチの無い
無声子音や、ピッチの判定が困難な有声子音を誤って無
音と判定してしまうという問題があった。
本発明は、このような従来の問題を解決するものであり
、上記のような無声子音や有声子音を正しく音声と判断
することのできる精度の高い音声有音無音判定方法およ
びその装置を提供することを目的とする。
課題を解決するための手段 本発明は上記目的を達成するために、入力した音声信号
においてピッチが有るか無いかの判定結果とスペクトル
が定常か非定常かの判定結果と音声が有るか無いかの判
定結果とから次に入力する音声信号が無音区間であるか
、子音区間であるか、または母音区間であるか等の音声
信号の状態を予測し、この予測に基き、ピッチが有るか
無いかを判定するための閾値とスペクトルが定常か非定
常かを判定するための闇値とをそれぞれ次に入力される
音声の状態に適応させて、音声の有音無音の判定を行な
うようにしたものである。
作用 本発明は上記構成により次のような作用を有する。すな
わち、現在のフレームにおけるピッチのを無判定結果と
スペクトルの定常非定常判定結果と有音無音判定結果に
基づいて次のフレームの音声信号の状態を予測し、その
予測結果に従ってピッチの有無判定のための閾値と、ス
ペクトルが定常か非定常かの判定のための閾値とをそれ
ぞれ適宜設定することによって、音声の状態に応じた有
音無音の判定を行なうことができ、したがって音声有音
無音判定の精度を上げることができるという効果を有す
る。
実施例 第1図は本発明の一実施例の構成を示すものである。第
1図において、11はピッチ有無判定手段であり、入力
した音声信号にピッチがをるか無いかを判定する。12
はスペクトル定常非定常判定手段であり、入力した音声
信号のスペクトルが定常であるか非定常であるかを判定
する。13は音声有音無音判定手段であり、ピッチ有無
判定手段11とスペクトル定常非定常判定手段12とで
判定した結果に基づいて入力した音声信号に音声が有る
か無いかを判定する。14は音声区間予測手段であり、
ピッチ有無判定手段11とスペクトル定常非定常判定手
段12と音声有音無音判定手段13のそれぞれの判定結
果に基づいて現在の音声の状態を判定し、次のフレーム
の音声の状態を予測する。15は閾値設定手段であり、
音声区間予測手段14により得られた結果に基づいてピ
ッチ有無判定手段11とスペクトル定常非定常判定手段
12とにおける判定に適応した閾値を設定する。
次に上記実施例の動作について第2図を用いて説明する
。第2図において、まずA/D変換された音声信号をフ
レーム毎に入力しくステップ21)、ピッチ有無判定手
段11において、入力した音声信号にピッチが有るか無
いかを判定する(ステップ22)。この判定には種々の
方法が考えられるが、この場合はピッチの有無を判定す
るパラメータが閾値以下であればピッチが無いと、閾値
以上であればピッチが有ると判定する。次いでスペクト
ル定常非定常判定手段12において、入力した信号のス
ペクトルが前のフレームのスペクトルとの間に変動が有
るか無いか、すなわち定常であるか非定常であるかを閾
値を用いて判定する(ステップ23)。この場合、変動
が閾値以下であれば定常と、閾値以上であれば非定常と
判定する。そして、音声有音無音判定手段13において
、ピッチが無くかつスペクトルが定常と判定された入力
信号を無音と判定する(ステップ25)ピッチが有る場
合とスペクトルが非定常である場合は有音と判定する(
ステップ24)。
次に、音声区間予測手段14において、これらの判定結
果から現在の音声信号の状態を判定して、次のフレーム
の信号の状態を予測する(ステップ26)。すなわち、
無音と判定されたならば無音区間と判定し、無音区間が
続いた後にスペクトルの急激な変動があれば音声の立ち
上がり区間すなわち子音区間であると判定し、立ち上が
り区間の次にピッチが有るフレームが続いたならば音声
の母音区間であると判定し、母音区間が続いた後スペク
トルの変動があり、直ぐにピッチが有るフレームが順に
続けば音声の渡り区間であると判定し、ピッチが無けれ
ば無音区間と判定する。
そして、閾値設定手段15において、ステップ26の予
測結果に基づいて、ピッチの有無の判定に適応した閾値
と、スペクトルが定常か非定常かの判定に適応した閾値
とをそれぞれ設定する(ステップ27)。すなわち、音
声区間予測手段14において、入力した信号が無音区間
と判定された場合は、次に入力される信号は無音信号ま
たは音声の立ち上がり信号であると予測して、スペクト
ルの定常非定常を判定する閾値を下げてスペクトルに対
する感度を高くし、音声の立ち上がり区間を判定しやす
くする。また、入力した信号が子音区間であると判定さ
れた場合は、次に入力される信号は母音区間と予測され
、ピッチの閾値を下げてピッチの感度を高くシ、かつス
ペクトルの閾値を上げてスペクトルの変化に対する感度
を低くし、母音を判定しやすくする。また、入力した信
号が母音区間と判定された場合は、次に入力される信号
は音声の渡り区間または無音区間と予測され、スペクト
ルの閾値を下げてスペクトルの変化に対する感度を高く
して音声の渡りと無音とを判定しやすくするとともに、
スペクトルの変化が大きくなった後には次に母音が続く
ので、ピッチに対する感度を高くして母音を判定しやす
くする。
このように、上記実施例によれば、入力した音声信号に
おいてピッチが有るか無いかの判定結果とスペクトルが
定常か非定常かの判定結果と音声が有るか無いかの判定
結果とから次の信号が音声の無音区間であるか、音声の
立ち上がりの子音区間であるか、音声の母音区間である
か、または音声の渡り区間であるか等を予測し、この予
測に基づいて、ピッチが有るか無いかを判定するための
閾値とスペクトルが定常か非定常かを判定するための閾
値をそれぞれ次に入力する音声の状態に応じて適宜変化
させるようにしたので、音声の有音無音の判定を正確に
行なうことができ、音声有音無音判定の精度を上げるこ
とができる。
発明の効果 本発明は上記実施例から明らかなように、入力した音声
信号においてピッチが有るか無いかの判定結果とスペク
トルが定常か非定常かの判定結果と音声が有るか無いか
の判定結果とから次の信号が無音区間であるか、子音区
間であるか、または母音区間であるか等の音声信号の状
態を予測し、この予測に基づいて、ピッチが有るか無い
かを判定するための閾値とスペクトルが定常か非定常か
を判定するための閾値とをそれぞれ次に入力される音声
の状態に適応するように変化させて、音声の有音無音の
判定を行なうようにしたので、音声の有音無音の判定を
正確に行なうことができ、精度の高い音声有音無音判定
方法およびその装置を実現することができるという効果
を有する。
【図面の簡単な説明】
第1図は本発明の一実施例における音声有音無音判定装
置の概略ブロック図、第2図は同装置の動作を説明する
ためのフローチャート、第3図は従来の音声有音無音判
定方法を説明するためのフローチャートである。 11・・・ピッチ有無判定手段、12・・・スペクトル
定常非定常判定手段、13・・・音声有音無音判定手段
、14・・・音声区間予測手段、15・・・閾値設定手
段。 代理人の氏名 弁理士小鍜治 明ほか2名々午 図

Claims (2)

    【特許請求の範囲】
  1. (1)入力した音声信号にピッチが有るか無いかを判定
    するとともに、スペクトルが定常であるか非定常である
    かを判定し、これらの結果から音声が有るか無いかを判
    定して、それぞれの判定結果から次に入力する音声信号
    の状態を予測し、この予測に基づいてピッチの有無の判
    定のための閾値とスペクトルが定常か非定常かの判定の
    ための閾値とをそれぞれ次に入力される音声の状態に適
    応させて設定するようにした音声有音無音判定方法。
  2. (2)入力した音声信号にピッチが有るか無いかを判定
    するピッチ有無判定手段と、スペクトルが定常であるか
    非定常であるかを判定するスペクトル定常非定常判定手
    段と、これらの判定結果から音声が有るか無いかを判定
    する音声有音無音判定手段と、前記各手段によるそれぞ
    れの判定結果から、次に入力する音声信号の状態を予測
    する音声区間予測手段と、その予測に基づいてピッチの
    有無の判定に適応した閾値とスペクトルが定常か非定常
    かの判定に適応した閾値とを設定する閾値設定手段とを
    備えた音声有音無音判定装置。
JP2236752A 1990-09-05 1990-09-05 音声有音無音判定方法および装置 Pending JPH04115299A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2236752A JPH04115299A (ja) 1990-09-05 1990-09-05 音声有音無音判定方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2236752A JPH04115299A (ja) 1990-09-05 1990-09-05 音声有音無音判定方法および装置

Publications (1)

Publication Number Publication Date
JPH04115299A true JPH04115299A (ja) 1992-04-16

Family

ID=17005270

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2236752A Pending JPH04115299A (ja) 1990-09-05 1990-09-05 音声有音無音判定方法および装置

Country Status (1)

Country Link
JP (1) JPH04115299A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0713584A (ja) * 1992-10-05 1995-01-17 Matsushita Electric Ind Co Ltd 音声検出装置
JP2002091470A (ja) * 2000-09-20 2002-03-27 Fujitsu Ten Ltd 音声区間検出装置
JP2009122710A (ja) * 1998-08-21 2009-06-04 Panasonic Corp パラメータ抽出装置及びパラメータ抽出方法
JP2010230814A (ja) * 2009-03-26 2010-10-14 Fujitsu Ltd 音声信号評価プログラム、音声信号評価装置、音声信号評価方法
WO2020039598A1 (ja) * 2018-08-24 2020-02-27 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0713584A (ja) * 1992-10-05 1995-01-17 Matsushita Electric Ind Co Ltd 音声検出装置
JP2009122710A (ja) * 1998-08-21 2009-06-04 Panasonic Corp パラメータ抽出装置及びパラメータ抽出方法
JP2010186190A (ja) * 1998-08-21 2010-08-26 Panasonic Corp 量子化lspパラメータ動的特徴抽出器及び量子化lspパラメータ動的特徴抽出方法
JP2002091470A (ja) * 2000-09-20 2002-03-27 Fujitsu Ten Ltd 音声区間検出装置
JP2010230814A (ja) * 2009-03-26 2010-10-14 Fujitsu Ltd 音声信号評価プログラム、音声信号評価装置、音声信号評価方法
US8532986B2 (en) 2009-03-26 2013-09-10 Fujitsu Limited Speech signal evaluation apparatus, storage medium storing speech signal evaluation program, and speech signal evaluation method
WO2020039598A1 (ja) * 2018-08-24 2020-02-27 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
JPWO2020039598A1 (ja) * 2018-08-24 2021-08-12 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
US11769517B2 (en) 2018-08-24 2023-09-26 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program

Similar Documents

Publication Publication Date Title
Howell et al. Production and perception of rise time in the voiceless affricate/fricative distinction
JP5331784B2 (ja) スピーチエンドポインタ
JPH0341838B2 (ja)
JPH04115299A (ja) 音声有音無音判定方法および装置
CN112786071A (zh) 面向语音交互场景语音片段的数据标注方法
JP2002169579A (ja) オーディオ信号への付加データ埋め込み装置及びオーディオ信号からの付加データ再生装置
JPH0950288A (ja) 音声認識装置及び音声認識方法
JPS60129796A (ja) 音声入力装置
JP2006010739A (ja) 音声認識装置
JPH03114100A (ja) 音声区間検出装置
JPH07295588A (ja) 発話速度推定方法
JP4313724B2 (ja) 音声再生速度調節方法、音声再生速度調節プログラム、およびこれを格納した記録媒体
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
JP6790851B2 (ja) 音声処理プログラム、音声処理方法、及び音声処理装置
JPS59149400A (ja) 音声入力装置
KR100322704B1 (ko) 음성신호의지속시간변경방법
JPS5925240B2 (ja) 音声区間の語頭検出方式
JPS6217800A (ja) 音声区間判定方式
JPH0567040B2 (ja)
CN116705025A (zh) 一种车载终端通信方法
JPS63217399A (ja) 音声区間検出装置
KR100322203B1 (ko) 차량의 음성인식장치 및 그 방법
JPH0398098A (ja) 音声認識装置
JPH0640274B2 (ja) 音声認識装置
JPH045699A (ja) 鼻音区間検出方式