JPH04100099A - 音声検出装置 - Google Patents

音声検出装置

Info

Publication number
JPH04100099A
JPH04100099A JP2218392A JP21839290A JPH04100099A JP H04100099 A JPH04100099 A JP H04100099A JP 2218392 A JP2218392 A JP 2218392A JP 21839290 A JP21839290 A JP 21839290A JP H04100099 A JPH04100099 A JP H04100099A
Authority
JP
Japan
Prior art keywords
sound
unvoiced
power
autocorrelation coefficient
noise level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2218392A
Other languages
English (en)
Inventor
Hiroshi Irii
入井 寛
Kenzo Ito
憲三 伊藤
Keita Kurashima
倉島 圭太
Nobuhiko Kitawaki
北脇 信彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2218392A priority Critical patent/JPH04100099A/ja
Publication of JPH04100099A publication Critical patent/JPH04100099A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Time-Division Multiplex Systems (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声のディジタル処理において、音声信号中
の有声音、無声音あるいは無音区間を判別する音声検出
装置に関する。
なお、音声信号を効率よく符号化する場合には、音声信
号を有声音区間と無声音区間に分け、それぞれにあった
符号化方式を採用することが有効になっている。また、
音声認識装置の前処理部では、音韻の大まかな分類を行
うときに有声音、無声音あるいは無音区間の判別が有効
になっている。
さらに、時間指定音声挿入方式(Time Assig
nwent 5peech Interpolatio
n  : TA S I ) 、ディジタル音声挿入方
式(Digital 5peech Interpol
ation : D S I ) 、あるいは音声パケ
ット通信方式その他においては、音声区間を精度よく抽
出する処理は不可欠な要素になっている。
本発明の音声検出装置は、このような各装置あるいは方
式に適用されるものである。
[従来の技術] 従来、音声信号中の有声音、無声音あるいは無音区間の
判別は、観測者が広帯域スペクトログラフ(ツナグラフ
)を用いて波形観測し、その判断に基づいて行われてい
る。
[発明が解決しようとする課題] ところで、従来の判別方法は、視察する観測者の判断に
委ねられており、熟練を要するとともに時間もかかって
いた。
一方、短時間のパワーの変化量や零交差回数などを測定
し、所定の闇値との比較により、有声音、無声音あるい
は無音区間を自動的に判別することも行われているが、
音声信号のS/N比に影響されて所定の測定精度を得る
ことが困難であった。
本発明は、音声信号中の有声音、無声音あるいは無音区
間について、自動的かつ精度よく判別することができる
音声検出装置を提供することを目的とする。
[課題を解決するための手段] 請求項1に記載の発明は、入力される音声信号の雑音レ
ベルNを測定する雑音レベル測定部と、前記音声信号か
ら所定の短区間を切り出し、前記各短区間音声信号につ
いて、偏自己相関係数に1、スペクトルの高域側と低域
側のパワー比T、全周波数帯域のパワーPT、線形予測
分析残差の自己相関係数の最大値ρM□を求める演算部
と、前記雑音レベルN、前記各短区間音声信号の偏自己
相関係数に1、パワー比T、パワーPTおよび自己相関
係数の最大値ρ□8を用いて、前記各短区間音声信号ご
とに有声音、無声音および無音区間のいずれかに判定す
る判定部とを備えて構成する。
請求項2に記載の発明は、請求項1に記載の音声検出装
置において、判定部が、短区間音声信号の偏自己相関係
数に1が所定値を下回りまたはパワー比γが所定値を下
回るときに無声音とし他を無声音とした上で、パワー比
Tが所定値を越えかつパワーPTが所定値を越えるとき
、あるいは自己相関係数の最大値ρMAXが所定値を越
えるときに有声音とし、他を無声音とするとともに、パ
ワーPTが雑音レベルNを下回るときにさらにそれを無
音区間とする判定を行う構成とする。
[作 用] 本発明は、入力される音声信号の雑音レベルNを測定し
、各短区間音声信号について、偏自己相関係数に1、ス
ペクトルの高域側と低域側のパワー比γ、全周波数帯域
のパワーPT、線形予測分析残差の自己相関係数の最大
値ρMAXを求めて所定の論理処理を行うことにより、
有声音、無声音および無音区間のいずれかに判定するこ
とができる。
すなわち、複数の判定条件を用いた自動判定であるので
、判定精度を高めることができるとともに、人間の操作
を必要としないので高速処理を可能にすることができる
〔実施例〕
以下、図面に基づいて本発明の実施例について詳細に説
明する。
第1図は、本発明の一実施例構成を示すプロ・ンク図で
ある。
図において、音声信号は、雑音レベル測定部11、線形
予測分析部13および高速フーリエ変換部15に入力さ
れる。線形予測分析部13の一方の出力は相関器17に
入力される。線形予測分析部13の他方の出力、相関器
17の出力、高速フーリエ変換部15の出力および雑音
レベル測定部11の出力は、それぞれ判定部19に入力
される。
判定部17は、各入力信号に基づいて所定の判定処理を
行い、有声音V、無声音UVあるいは無音区間Pについ
ての判定結果を出力する。
ここで、測定対象装置の入力音声信号として、音声が開
始される直前に数100m5e(の無音区間T1を設け
ておき、このT1に相当する時間取り込まれた信号につ
いて、まず雑音レベル測定部11で雑音レベルNが測定
される。
続いて、10〜30m5ec程度の短区間(フレーム)
の切り出しを行い、各短区間ごとに、線形予測分析部1
3、高速フーリエ変換部15および相関器17により、
−次の偏自己相関係数に1.2 k)lzを境界として
これより高い周波数成分のパワーPHと、低い周波数成
分のパワーPLとのパワー比r (=PL/PH)、該
当フレームの全周波数帯域のパワーPT、および線形予
測分析の予測誤差についての自己相関係数ρの最大値ρ
MAXを求める。
判定部19では、これらの値を用いて音声信号の有声音
、無声音および無音区間の判定を行う。
以下、第2図に示すフローチャートを参照して、判定部
19における判定処理について説明する。
まず、判定処理の開始点では、切り出された短区間につ
いてはすべて有声音とみなす。
次に、無声音である条件に基づいて、無声音であるか否
かについて判定する(判定■)。
ここで、−次の偏自己相関係数に1が音声のスペクトル
概形の傾きを示し、その値が小さいほどスペクトルが平
坦であることから、K 1 <0.3であるときに無声
音であるとする。また、パワー比Tの値は、小さいほど
スペクトルが平坦であることから、γ〈6であるときに
無声音であるとする。
したがって、無声音である条件は、K 1 <0.3あ
るいはγ〈6とし、それを満たすときに該当フレームの
判定を有声音から無声音に変更する。
次に、有声音である条件に基づいて、有声音であるか否
かについて判定する(判定■)。
ここで、有声音は一般に無声音に比べてパワーが大きい
ので、あらかじめ測定されている雑音レベルNと比較し
、r>OかつP T > N +30dBであるときに
有声音であるとする。なお、この条件はS/N比が十分
でなければ有効に機能しないので、その場合には信号の
周期性に着目する。すなわち、有声音は声帯の振動に伴
う周期性があり、ρWAXに相当する時間遅れ(周期)
が声帯の基本振動数に対応し、その大小が声帯振動の周
期性に依存するので、その値が大きいときに信号の周期
性が認められ、ρM□>0.25であるときに有声音と
する。
したがって、有声音である条件は、γ〉0がっP T 
> N +30dB、あるいはρMAX >0.25と
し、それを満たすときに該当フレームの判定を有声音に
変更する。
すなわち、判定■の無声音である条件(K 1 <0.
3あるいはγく6)に基づいて無声音とされたものの中
で、判定■の有声音である条件(r>0かツPT>N+
30dB、あるいはρMAX >0.25) カ満たさ
れれば、その判定を有声音に変更する。
逆に、判定■の無声音である条件を満たさず判定が有声
音のままであるものについて、判定■の有声音である条
件を満たさない場合には、改めてその判定を無声音に変
更する。たとえば、判定■においてT2Cにより無声音
でない(有声音)と判定されても、判定■においてP 
T > N −)−30clBあるいはρWAX >0
.25め条件を満たさなければ、それは無声音との判定
になる。
ところで、判定■および判定■で無声音との判定の中に
は、無通話時の雑音(無音区間)に対する判定も含まれ
ている。
シタ力って、無音区間である条件に基づいて、無声音と
されたものについて無音区間であるが否かを判定する(
判定■)。
ここで、無音区間である条件はPT<Nとし、それを満
たすときに該当フレームの判定を無音区間に変更し、そ
れ以外では無声音と判定する。
このように、判定■および判定■により有声音との判定
が確定し、それ以外のものについて判定■により無音区
間と無声音との判定を確定させることができる。
〔発明の効果] 上述したように、本発明は、複数の判定条件を用いて有
声音、無声音あるいは無音区間の判定を自動的に行う構
成であるので、従来の単純な自動判定方式に比べて、格
段に判定部・度を高めることができるとともに、人間の
操作を必要としないので高速処理を可能にすることがで
きる。
【図面の簡単な説明】
第1図は本発明の一実施例構成を示すブロック図。 第2図は本発明装置における判定処理を説明するフロー
チャート。 11・・・雑音レベル測定部、13・・・線形予測分析
部、15・・・高速フーリエ変換部、17・・・相関器
、19・・・判定部。

Claims (2)

    【特許請求の範囲】
  1. (1)入力される音声信号の雑音レベルNを測定する雑
    音レベル測定部と、 前記音声信号から所定の短区間を切り出し、各短区間音
    声信号について、偏自己相関係数K1、スペクトルの高
    域側と低域側のパワー比γ、全周波数帯域のパワーPT
    、線形予測分析残差の自己相関係数の最大値ρ_M_A
    _Xを求める演算部と、前記雑音レベルN、前記各短区
    間音声信号の偏自己相関係数K1、パワー比T、パワー
    PTおよび自己相関係数の最大値ρ_M_A_Xを用い
    て、前記各短区間音声信号ごとに有声音、無声音および
    無音区間のいずれかに判定する判定部と を備えたことを特徴とする音声検出装置。
  2. (2)請求項1に記載の音声検出装置において、判定部
    は、短区間音声信号の偏自己相関係数K1が所定値を下
    回りまたはパワー比γが所定値を下回るときに無声音と
    し他を無声音とした上で、パワー比γが所定値を越えか
    つパワーPTが所定値を越えるとき、あるいは自己相関
    係数の最大値ρ_M_A_Xが所定値を越えるときに有
    声音とし、他を無声音とするとともに、パワーPTが雑
    音レベルNを下回るときにさらにそれを無音区間とする
    判定を行う構成であることを特徴とする音声検出装置。
JP2218392A 1990-08-20 1990-08-20 音声検出装置 Pending JPH04100099A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2218392A JPH04100099A (ja) 1990-08-20 1990-08-20 音声検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2218392A JPH04100099A (ja) 1990-08-20 1990-08-20 音声検出装置

Publications (1)

Publication Number Publication Date
JPH04100099A true JPH04100099A (ja) 1992-04-02

Family

ID=16719190

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2218392A Pending JPH04100099A (ja) 1990-08-20 1990-08-20 音声検出装置

Country Status (1)

Country Link
JP (1) JPH04100099A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002261553A (ja) * 2001-03-02 2002-09-13 Ricoh Co Ltd 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム
JP2005227782A (ja) * 2004-02-10 2005-08-25 Samsung Electronics Co Ltd 有声音および無声音の検出装置、並びにその方法
JP2007304605A (ja) * 1994-08-10 2007-11-22 Qualcomm Inc 可変レートボコーダにおけるスピーチエンコーディングレート決定の方法および装置
JP2008058901A (ja) * 2006-09-04 2008-03-13 Nippon Telegr & Teleph Corp <Ntt> 音響信号区間検出方法、装置、プログラム及びその記録媒体
JP2009198892A (ja) * 2008-02-22 2009-09-03 Yamaha Corp 音処理装置およびプログラム
JP2019158739A (ja) * 2018-03-15 2019-09-19 富士通株式会社 情報処理プログラム、情報処理方法及び情報処理装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007304605A (ja) * 1994-08-10 2007-11-22 Qualcomm Inc 可変レートボコーダにおけるスピーチエンコーディングレート決定の方法および装置
JP2002261553A (ja) * 2001-03-02 2002-09-13 Ricoh Co Ltd 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム
JP2005227782A (ja) * 2004-02-10 2005-08-25 Samsung Electronics Co Ltd 有声音および無声音の検出装置、並びにその方法
JP2008058901A (ja) * 2006-09-04 2008-03-13 Nippon Telegr & Teleph Corp <Ntt> 音響信号区間検出方法、装置、プログラム及びその記録媒体
JP2009198892A (ja) * 2008-02-22 2009-09-03 Yamaha Corp 音処理装置およびプログラム
JP2019158739A (ja) * 2018-03-15 2019-09-19 富士通株式会社 情報処理プログラム、情報処理方法及び情報処理装置

Similar Documents

Publication Publication Date Title
KR950013551B1 (ko) 잡음신호예측장치
KR100911679B1 (ko) 오디오 신호를 오디토리 이벤트로 세그먼트하는 방법
US10134409B2 (en) Segmenting audio signals into auditory events
NL192701C (nl) Werkwijze en inrichting voor het herkennen van een foneem in een stemsignaal.
KR100744352B1 (ko) 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치
JPH05346797A (ja) 有声音判別方法
JPH0713584A (ja) 音声検出装置
CN102214464A (zh) 音频信号的瞬态检测方法以及基于该方法的时长调整方法
JPH04100099A (ja) 音声検出装置
JPH0462399B2 (ja)
RU2174714C2 (ru) Способ выделения основного тона
JP3423233B2 (ja) オーディオ信号処理方法および装置
CN120412651B (zh) 一种通过静音去除实现口语评测效率提升的方法
JP3019603B2 (ja) 音声の基本周波数の抽出装置
JP2643202B2 (ja) 入力音声の定常部、過渡部、不確定部の検出装置
KR20050048214A (ko) 화자인식시스템의 화자 특징벡터 생성방법 및 시스템
US12118987B2 (en) Dialog detector
KR100539176B1 (ko) 음악적 특징 추출 방법 및 장치
JPH04230798A (ja) 雑音予測装置
JP2880683B2 (ja) 雑音抑制装置
JP3049711B2 (ja) 音声処理装置
JPH0398098A (ja) 音声認識装置
JP2557497B2 (ja) 男女声の識別方法
CN116543751A (zh) 语音特征提取方法、装置、电子设备及存储介质
JPS5925238B2 (ja) 音声分析合成方式の音声区間判定方法