JPS63155199A - 無声音検出方法 - Google Patents
無声音検出方法Info
- Publication number
- JPS63155199A JPS63155199A JP30453186A JP30453186A JPS63155199A JP S63155199 A JPS63155199 A JP S63155199A JP 30453186 A JP30453186 A JP 30453186A JP 30453186 A JP30453186 A JP 30453186A JP S63155199 A JPS63155199 A JP S63155199A
- Authority
- JP
- Japan
- Prior art keywords
- unvoiced
- section
- sound
- short
- determined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概要〕
入力音声の所定区間での短時間エネルギ関数の増加状態
が基準条件に合致し、且つ前区間の入力音声を無声音と
判定していた場合に、入力音声を無声音を判定する。
が基準条件に合致し、且つ前区間の入力音声を無声音と
判定していた場合に、入力音声を無声音を判定する。
本発明は、音声からピッチを抽出するに際し、ピンチ抽
出の対象とならぬ無声音を検出する無声音検出方法の改
良に関する。
出の対象とならぬ無声音を検出する無声音検出方法の改
良に関する。
音声から重要なパラメータの一つであるピンチを高精度
に抽出する為には、音声の中でピッチの抽出対象として
必要な有声音のみを残し、池の無声音並びに音声の全く
無い無声の状態(以後無声の状態を含み無声音と総称す
る)を除去する無声音検出方法の精度同上が強(要望さ
れる。
に抽出する為には、音声の中でピッチの抽出対象として
必要な有声音のみを残し、池の無声音並びに音声の全く
無い無声の状態(以後無声の状態を含み無声音と総称す
る)を除去する無声音検出方法の精度同上が強(要望さ
れる。
一般に有声音は周間性を有する為、自己相関関数は大き
い値を示し、無声音は周間性を持たぬ為、自己相関関数
は小さい値を示す。従って有声音と無声音とを自己相関
関数で識別する基半値を設け、対象とする音声の自己(
目間関数を基(上値と比較することにより無声音を検出
することが考慮される。
い値を示し、無声音は周間性を持たぬ為、自己相関関数
は小さい値を示す。従って有声音と無声音とを自己相関
関数で識別する基半値を設け、対象とする音声の自己(
目間関数を基(上値と比較することにより無声音を検出
することが考慮される。
第6図は、かかる原理を用いた従来ある無声音検出方法
の一例を示す図である。
の一例を示す図である。
第6図において、自己相関関数算出回路2は、入力端子
1から入力される音声Xに対し、エネルギで正規化した
短時間自己相関関数R(i) (以後単に自己相関関
数と称する)を(1)式に基づき算出し、判定回路3に
伝達する。
1から入力される音声Xに対し、エネルギで正規化した
短時間自己相関関数R(i) (以後単に自己相関関
数と称する)を(1)式に基づき算出し、判定回路3に
伝達する。
ン−I
・・・・・・(1)
但し、W(k) :窓関数
X (n十k) 、X (n+に+i) :音声n:
積分区間の始点 i:自己相関関数の遅延量 に:積分区間(例えば128) なおi、nおよびkは、何れも標本化周期T(例えば1
25マイクロ秒)を単位とする。
積分区間の始点 i:自己相関関数の遅延量 に:積分区間(例えば128) なおi、nおよびkは、何れも標本化周期T(例えば1
25マイクロ秒)を単位とする。
判定回路3は、自己相関関数算出回路2から伝達された
自己相関関数R(i)を、予め定められた基準値(例え
ば完全な周期性を有する有声音が示す自己相関関数値=
1と、完全な非周期性を有する無声音が示す自己相関関
数−0との中間値として0.5に定める)と比較し、自
己相関関数R(i)が基準値(0,5)を上回れば有声
音、下回れば無声音と判定し、判定結果を出力端子4か
ら出力し、図示されぬピッチ抽出回路に伝達する。
自己相関関数R(i)を、予め定められた基準値(例え
ば完全な周期性を有する有声音が示す自己相関関数値=
1と、完全な非周期性を有する無声音が示す自己相関関
数−0との中間値として0.5に定める)と比較し、自
己相関関数R(i)が基準値(0,5)を上回れば有声
音、下回れば無声音と判定し、判定結果を出力端子4か
ら出力し、図示されぬピッチ抽出回路に伝達する。
ピッチ抽出回路は、有声音の判定結果が伝達された場合
には、公知の方法により音声に対してピンチ抽出処理を
実行し、無声音の判定結果が伝達された場合には、音声
に対してピンチ抽出処理を実行せず、判定結果(無声音
)のみを出力する。
には、公知の方法により音声に対してピンチ抽出処理を
実行し、無声音の判定結果が伝達された場合には、音声
に対してピンチ抽出処理を実行せず、判定結果(無声音
)のみを出力する。
以上の説明から明らかな如く、従来ある無声音検出方法
においては、対象とする音声の自己相関関数R(i)が
基準値を下廻る場合には無声音と判定していた。
においては、対象とする音声の自己相関関数R(i)が
基準値を下廻る場合には無声音と判定していた。
然し、高い周期性を有する無声音に対する自己相関関数
R(i)は基準値を上回って有声音として検出される恐
れがある。かかる場合を考慮して基準値を高く設定する
と、自己相関関数値の小さい有声音が無声音と検出され
る恐れがあり、無声音の検出精度が低下する問題点があ
った。
R(i)は基準値を上回って有声音として検出される恐
れがある。かかる場合を考慮して基準値を高く設定する
と、自己相関関数値の小さい有声音が無声音と検出され
る恐れがあり、無声音の検出精度が低下する問題点があ
った。
第1図は本発明の原理を示す図である。
第1図において、100は本発明により設けられ、入力
音声の対象区間における短時間エネルギ関数P(i)を
(2)式に基づいて算出する過程である。
音声の対象区間における短時間エネルギ関数P(i)を
(2)式に基づいて算出する過程である。
200は本発明により設けられ、過程100で算出され
た短時間キネルギ関数の増加状態を、予め定められた基
準条件と照合する過程である。
た短時間キネルギ関数の増加状態を、予め定められた基
準条件と照合する過程である。
300は本発明により設けられ、短時間キネルギ関数の
増加状態が基準条件に合致したことを検出する過程であ
る。
増加状態が基準条件に合致したことを検出する過程であ
る。
400は本発明により設けられ、対象区間の前の区間の
入力音声が無声音であることを検出する過程である。
入力音声が無声音であることを検出する過程である。
500は本発明により設けられ、過程300および過程
400が共に検出された場合に、入力音声を無声音と判
定する過程である。
400が共に検出された場合に、入力音声を無声音と判
定する過程である。
短時間エネルギ関数P (i)は、入力音声Xのエネル
ギ変動に対応して変動する。従って、エネルギの小さい
無声音からエネルギの大きい任声音への遷移区間におい
ては、短時間エネルギ関数P(i)も有声音および無声
音の′m続区間に比して急激に増加する。
ギ変動に対応して変動する。従って、エネルギの小さい
無声音からエネルギの大きい任声音への遷移区間におい
ては、短時間エネルギ関数P(i)も有声音および無声
音の′m続区間に比して急激に増加する。
従って、入力音声の対象区間の前の区間が無音声と判定
されており、対象区間における短時間エネルギ関数P
(i)が急激に増加している場合には、対象区間は無声
音から有声音への遷移区間と見做される。かかる遷移区
間において、短時間エネルギ関数P(i)が無声音と思
われる低値を示す期間が長く継続する場合には、対象区
間を無声音と見做し、また短時間エネルギ関数P (i
)が有声音と思われる高値を示す期間が長く継続する場
合には、対象区間を有声音と見做すことが出来る。
されており、対象区間における短時間エネルギ関数P
(i)が急激に増加している場合には、対象区間は無声
音から有声音への遷移区間と見做される。かかる遷移区
間において、短時間エネルギ関数P(i)が無声音と思
われる低値を示す期間が長く継続する場合には、対象区
間を無声音と見做し、また短時間エネルギ関数P (i
)が有声音と思われる高値を示す期間が長く継続する場
合には、対象区間を有声音と見做すことが出来る。
本発明はかかる原理に基づき、無声音と見做される遷移
区間と判定する基準条件を予め設定し、入力音声の対象
区間における短時間エネルギ関数P(i)を基準条件と
照合し、更に前区間の入力音声が無声音と判定されてい
た場合に、対象区間を無声音と判定する。
区間と判定する基準条件を予め設定し、入力音声の対象
区間における短時間エネルギ関数P(i)を基準条件と
照合し、更に前区間の入力音声が無声音と判定されてい
た場合に、対象区間を無声音と判定する。
従って、自己相関関数の大きさで判定する従来ある無声
音検出方法の如く、高い周期性を有する無声音を有声音
と判定することは防止され、ピッチの抽出処理の精度を
向上することが出来る。
音検出方法の如く、高い周期性を有する無声音を有声音
と判定することは防止され、ピッチの抽出処理の精度を
向上することが出来る。
以下、本発明の一実施例を図面により説明する。
第2図は本発明の一実施例による無声音検出方法を示す
図であり、第3図は第2図における遷移区間検出条件を
例示する図であり、第4図は遷移区間の説明図であり、
第5図fa)乃至第5図(dlは第2図の動作を説明す
る波形図である。なお、全図を通じて同一符号は同一対
象物を示す。
図であり、第3図は第2図における遷移区間検出条件を
例示する図であり、第4図は遷移区間の説明図であり、
第5図fa)乃至第5図(dlは第2図の動作を説明す
る波形図である。なお、全図を通じて同一符号は同一対
象物を示す。
第2図において、短時間エネルギ関数算出回路10は、
入力端子1から対象区間内に入力される音声Xに対し、
短時間エネルギ関数P (i)を(2]式に基づき算出
し、エネルギ最大点検出回路20に伝達する。
入力端子1から対象区間内に入力される音声Xに対し、
短時間エネルギ関数P (i)を(2]式に基づき算出
し、エネルギ最大点検出回路20に伝達する。
なお対象区間は、ピッチ周波数領域(通常50ヘルツ乃
至500ヘルツ)を充分包含する範囲(例えばi=1乃
至192)に設定する。
至500ヘルツ)を充分包含する範囲(例えばi=1乃
至192)に設定する。
エネルギ最大点検出回路20は、受信した短時間エネル
ギ関数P (i)の最大値P、を抽出し、全区間(i=
1乃至192)における短時間エネルギ関数P (i)
の値を最大値P1により正規化し、最大値P。の抽出点
1=rr+、と共に遷移区間検出回路30に伝達する。
ギ関数P (i)の最大値P、を抽出し、全区間(i=
1乃至192)における短時間エネルギ関数P (i)
の値を最大値P1により正規化し、最大値P。の抽出点
1=rr+、と共に遷移区間検出回路30に伝達する。
遷移区間検出回路30は、エネルギ最大点検出回路20
から伝達された正規化された短時間エネルギ関数P (
i)の、区間(i−1乃至192)内における値を、第
3図に示される遷移区間検出条件と照合し、無声音と見
做し得る遷移区間を検出する。
から伝達された正規化された短時間エネルギ関数P (
i)の、区間(i−1乃至192)内における値を、第
3図に示される遷移区間検出条件と照合し、無声音と見
做し得る遷移区間を検出する。
先ず遷移区間検出回路30は、
条件m、 =192 (ステップSL)および、条件
P(64)<0.125 (ステップ32)が成立し
た場合、 短時間エネルギ関数P(t)が第4図の曲線■に示され
る如き増加状態を示し、無声音と見做し得る遷移区間で
あると判定する(ステップS I OO)。
P(64)<0.125 (ステップ32)が成立し
た場合、 短時間エネルギ関数P(t)が第4図の曲線■に示され
る如き増加状態を示し、無声音と見做し得る遷移区間で
あると判定する(ステップS I OO)。
また遷移区間検出回路30は、
条件my −192(ステップSL)が成立し、条件P
(64)<0.125 (ステップS2)が成立せず
、且つ条件P(128) <0.125 (ステップ
S3)が成立した場合、 短時間エネルギ関数P (i)が第4図の曲線■に示さ
れる如き増加状態を示し、無声音と見做し得る゛ 遷移
区間であると判定する(ステップ5100)。
(64)<0.125 (ステップS2)が成立せず
、且つ条件P(128) <0.125 (ステップ
S3)が成立した場合、 短時間エネルギ関数P (i)が第4図の曲線■に示さ
れる如き増加状態を示し、無声音と見做し得る゛ 遷移
区間であると判定する(ステップ5100)。
また遷移区間検出回路30は、
条件m、 =192 (ステップSt)が成立せず、
条件P(1) <0.125 (ステップS4)およ
び条件P(64)<0.125 (ステップS5)が
成立した場合、 短時間エネルギ関数P(i)が第4図の曲線■に示され
る如き増加状態を示し、無声音と見做し得る遷移区間で
あると判定する(ステップS 100)。
条件P(1) <0.125 (ステップS4)およ
び条件P(64)<0.125 (ステップS5)が
成立した場合、 短時間エネルギ関数P(i)が第4図の曲線■に示され
る如き増加状態を示し、無声音と見做し得る遷移区間で
あると判定する(ステップS 100)。
なお遷移区間検出回路30は、
条件ff1p =192 −(ステップ31)が成立し
、条件P(64)<0.125 (ステップS2)お
よび条件P(128) <0.125 (ステップS
3)が不成立の場合、または 条件my =192 (ステップSl)および条件P
(1) <0.125 (ステップS4)が不成立の
場合、または 条件m、 −492(ステップSl)が成立せず、条件
P(1) <0.125 (ステップSA)が成立し
、且つ条件P (64) < 0.125 (ステッ
プS5)が不成立の場合に、 短時間エネルギ関数P (i)が区間(i=1乃至19
2)内において、無声音と見做し得る遷移区間では無い
と判定する(ステップ5200)。
、条件P(64)<0.125 (ステップS2)お
よび条件P(128) <0.125 (ステップS
3)が不成立の場合、または 条件my =192 (ステップSl)および条件P
(1) <0.125 (ステップS4)が不成立の
場合、または 条件m、 −492(ステップSl)が成立せず、条件
P(1) <0.125 (ステップSA)が成立し
、且つ条件P (64) < 0.125 (ステッ
プS5)が不成立の場合に、 短時間エネルギ関数P (i)が区間(i=1乃至19
2)内において、無声音と見做し得る遷移区間では無い
と判定する(ステップ5200)。
遷移区間検出回路30は、以上の判定結果を、判定回路
40に伝達する。
40に伝達する。
一方レジスタ50には、対象区間の前の区間において、
判定回路40の判定結果(有声音/無声音)が蓄積され
ている。
判定回路40の判定結果(有声音/無声音)が蓄積され
ている。
判定回路40は、遷移区間検出回路30から伝達される
判定結果が無声音と見做し得る遷移区間であり、且つレ
ジスタ50に蓄積されている前区間の判定結果が無声音
である場合に、対象区間を無声音と判定し、判定結果(
無声音)を出力端子4に出力する。
判定結果が無声音と見做し得る遷移区間であり、且つレ
ジスタ50に蓄積されている前区間の判定結果が無声音
である場合に、対象区間を無声音と判定し、判定結果(
無声音)を出力端子4に出力する。
なお判定回路40は、遷移区間検出回路30から伝達さ
れる判定結果が無声音であっても、レジスタ50に蓄積
されている前区間の判定結果が有声音である場合には、
対象区間を無声音と判定せず、また遷移区間検出回路3
0から伝達される判定結果が有声音であった場合には、
レジスタ50の蓄積内容に拘らず対象区間を無声音と判
定せず、判定結果(無声音と判定されない)を出力端子
4に出力する。
れる判定結果が無声音であっても、レジスタ50に蓄積
されている前区間の判定結果が有声音である場合には、
対象区間を無声音と判定せず、また遷移区間検出回路3
0から伝達される判定結果が有声音であった場合には、
レジスタ50の蓄積内容に拘らず対象区間を無声音と判
定せず、判定結果(無声音と判定されない)を出力端子
4に出力する。
第5図(alは無声音と判定された区間である。
第5図(blは第5図(a)に続(区間であり、短時間
エヱルギ関数P(i)が急激に増加しており、遷移区間
検出回路30 (第2図)により無声音と見做し得る遷
移区間と判定され、且つ前区間(第5図(a))が無声
音と判定されている為、無声音と判定される。
エヱルギ関数P(i)が急激に増加しており、遷移区間
検出回路30 (第2図)により無声音と見做し得る遷
移区間と判定され、且つ前区間(第5図(a))が無声
音と判定されている為、無声音と判定される。
第5図(C)は第5図(b)に続く区間であり、短時間
エネルギ関数P(i)が急激に増加しているが、遷移区
間検出回路30(第2図)により無声音と見做し得る遷
移区間では無いと判定される為、無声音とは判定されな
い。
エネルギ関数P(i)が急激に増加しているが、遷移区
間検出回路30(第2図)により無声音と見做し得る遷
移区間では無いと判定される為、無声音とは判定されな
い。
第5図(dlは第5図(C1に続く区間であり、短時間
エネルギ関数P (i)が惣、激に増加していない為、
遷移区間検出回路30により遷移区間では無いと判定さ
れ、無声音とは判定されない。
エネルギ関数P (i)が惣、激に増加していない為、
遷移区間検出回路30により遷移区間では無いと判定さ
れ、無声音とは判定されない。
以上の説明から明らかな如(、本実施例によれば、音声
Xの短時間エネルギ関数P(i)の変化から無声音と見
做し得る遷移区間を検出し、且つ前区間の判定結果が無
声音であることにより無声音を検出している為、周期性
の高い無声音を有声音として検出することが避けられる
。
Xの短時間エネルギ関数P(i)の変化から無声音と見
做し得る遷移区間を検出し、且つ前区間の判定結果が無
声音であることにより無声音を検出している為、周期性
の高い無声音を有声音として検出することが避けられる
。
なお、第2図乃至第5図はあく迄本発明の一実施例に過
ぎず、例えば遷移区間の検出条件は図示されるものに限
定されることは無く、他に幾多の変形が考慮されるが、
何れの場合にも本発明の効果は変わらない。
ぎず、例えば遷移区間の検出条件は図示されるものに限
定されることは無く、他に幾多の変形が考慮されるが、
何れの場合にも本発明の効果は変わらない。
以上、本発明によれば、自己相関関数が大きい無声音も
有声音と判定されることは防止され、ピッチの抽出処理
の精度を向上することが出来る。
有声音と判定されることは防止され、ピッチの抽出処理
の精度を向上することが出来る。
第1図は本発明の原理を示す図、第2図は本発明の一実
施例による無声音検出方法を示す図、第3図は第2図に
おける遷移区間検出条件を例示する図、第4図は遷移区
間の説明図、第5図(a)乃至第5図(dlは第2図の
動作を説明する波形図、第6図は従来ある無声音検出方
法の一例を示す図である。 図において、1は入力端子、2は自己相関関数算出回路
、3および40は判定回路、4は出力端子、10は短時
間エネルギ関数算出回路、20はエネルギ最大点検出回
路、30は遷移区間検出凹未発Ell;Jl:よ3無?
i#ヰ灸)Kゲン人不2 図 A42図にb′は384羊多区開倹侭イ奔イ牛阜3 @ 0 64 /2B /’?2遷移区
間の暁朗閲 苓4 K L −で 茶 5 図 不り末麓恕、声音検出ゲ沫 享 6 回
施例による無声音検出方法を示す図、第3図は第2図に
おける遷移区間検出条件を例示する図、第4図は遷移区
間の説明図、第5図(a)乃至第5図(dlは第2図の
動作を説明する波形図、第6図は従来ある無声音検出方
法の一例を示す図である。 図において、1は入力端子、2は自己相関関数算出回路
、3および40は判定回路、4は出力端子、10は短時
間エネルギ関数算出回路、20はエネルギ最大点検出回
路、30は遷移区間検出凹未発Ell;Jl:よ3無?
i#ヰ灸)Kゲン人不2 図 A42図にb′は384羊多区開倹侭イ奔イ牛阜3 @ 0 64 /2B /’?2遷移区
間の暁朗閲 苓4 K L −で 茶 5 図 不り末麓恕、声音検出ゲ沫 享 6 回
Claims (1)
- 【特許請求の範囲】 入力音声の対象区間における短時間エネルギ関数を算出
し(100)、 該算出された短時間キネルギ関数の増加状態を予め定め
られた基準条件と照合し(200)、該短時間キネルギ
関数の増加状態が前記基準条件に合致し(300)、 且つ前記対象区間の前の区間における入力音声が無声音
と判定されていた場合に(400)、前記区間における
入力音声を無声音と判定する(500)ことを特徴とす
る無声音検出方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP30453186A JPS63155199A (ja) | 1986-12-19 | 1986-12-19 | 無声音検出方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP30453186A JPS63155199A (ja) | 1986-12-19 | 1986-12-19 | 無声音検出方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS63155199A true JPS63155199A (ja) | 1988-06-28 |
Family
ID=17934130
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP30453186A Pending JPS63155199A (ja) | 1986-12-19 | 1986-12-19 | 無声音検出方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS63155199A (ja) |
-
1986
- 1986-12-19 JP JP30453186A patent/JPS63155199A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3578587B2 (ja) | 音声認識装置および音声認識方法 | |
| JPS63155199A (ja) | 無声音検出方法 | |
| JP2737109B2 (ja) | 音声区間検出方式 | |
| JPS5961900A (ja) | 音声入力装置 | |
| JP2901976B2 (ja) | パターン照合予備選択方式 | |
| JPS63155197A (ja) | 無声音検出方法 | |
| JPS63163900A (ja) | ピツチ抽出方法 | |
| JPS63161499A (ja) | 音声認識装置 | |
| JP2844592B2 (ja) | 離散単語音声認識装置 | |
| JPS63155196A (ja) | 無声音検出方法 | |
| JPS59149400A (ja) | 音声入力装置 | |
| JPS63155198A (ja) | 無声音検出方法 | |
| JPS63220295A (ja) | 音声区間検出方式 | |
| JPS62183500A (ja) | 音声のピツチ抽出装置 | |
| JPS63168700A (ja) | 音韻変化点検出方法 | |
| JPS6029798A (ja) | 音声認識装置 | |
| JPS5923398A (ja) | 単音節音声認識装置 | |
| JPS6039691A (ja) | 音声認識方法 | |
| JPS63259596A (ja) | 音声区間検出方式 | |
| JPS5969798A (ja) | ピツチ抽出方法 | |
| JPH07210186A (ja) | 音声登録装置 | |
| JPS62194299A (ja) | 有声無声判定方式 | |
| JPS617896A (ja) | 単語音声認識方法 | |
| JPS61118800A (ja) | 音声分析装置 | |
| JPS60147799A (ja) | 音声認識方法 |