JPH1185197A - 音声信号分析装置 - Google Patents
音声信号分析装置Info
- Publication number
- JPH1185197A JPH1185197A JP9236802A JP23680297A JPH1185197A JP H1185197 A JPH1185197 A JP H1185197A JP 9236802 A JP9236802 A JP 9236802A JP 23680297 A JP23680297 A JP 23680297A JP H1185197 A JPH1185197 A JP H1185197A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- waveform
- absolute value
- sound source
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 claims abstract description 27
- 230000001755 vocal effect Effects 0.000 claims abstract description 12
- 238000000034 method Methods 0.000 claims abstract description 11
- 238000012546 transfer Methods 0.000 claims abstract description 7
- 230000005236 sound signal Effects 0.000 claims description 56
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 4
- 238000005259 measurement Methods 0.000 abstract description 6
- 241000167854 Bourreria succulenta Species 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 22
- 210000001260 vocal cord Anatomy 0.000 description 6
- 238000000605 extraction Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 239000011295 pitch Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Abstract
(57)【要約】
【課題】 従来技術に比較して構成が簡単であって、し
かも高い測定精度で音声信号の極性を判定することがで
きる音声信号分析装置を提供することにある。 【解決手段】 音声信号をA/D変換した音声ディジタ
ル信号の信号波形s(n)を線形予測分析部4でLPC
分析法で分析し声道特性を表す声道伝達関数の係数を得
る。音源波形抽出部5において、逆フィルタ法を使って
雑音成分を含んだ逆フィルタ波形v(n)が生成され、
低域通過フィルタ(LPF)6に通して低域の雑音成分
を除去した後、擬似声門音源波形SG(n)を得る。勾
配計算部8及び絶対値計算部9において、擬似音源波形
SG(n)の微分と絶対値を計算し、逆フィルタ波形の
勾配の絶対値信号AGSG(n)を得る。極性判定部1
0は、擬似音源波形SG(n)と勾配の絶対値信号AG
SG(n)を用いて音声の極性を決定してその結果を示
す信号を出力する。
かも高い測定精度で音声信号の極性を判定することがで
きる音声信号分析装置を提供することにある。 【解決手段】 音声信号をA/D変換した音声ディジタ
ル信号の信号波形s(n)を線形予測分析部4でLPC
分析法で分析し声道特性を表す声道伝達関数の係数を得
る。音源波形抽出部5において、逆フィルタ法を使って
雑音成分を含んだ逆フィルタ波形v(n)が生成され、
低域通過フィルタ(LPF)6に通して低域の雑音成分
を除去した後、擬似声門音源波形SG(n)を得る。勾
配計算部8及び絶対値計算部9において、擬似音源波形
SG(n)の微分と絶対値を計算し、逆フィルタ波形の
勾配の絶対値信号AGSG(n)を得る。極性判定部1
0は、擬似音源波形SG(n)と勾配の絶対値信号AG
SG(n)を用いて音声の極性を決定してその結果を示
す信号を出力する。
Description
【0001】
【発明の属する技術分野】本発明は、音声信号の波形の
極性を判定する音声信号分析装置に関する。
極性を判定する音声信号分析装置に関する。
【0002】
【従来の技術】音声を録音するとき、信号を増幅器など
の装置に通すとき、音声波形の極性が逆になる場合があ
る。一方、音声信号の分析(例えば、エポック(epo
ch)検出、2チャンネル信号による分析、EGG信号
による処理など)に対しては、音声波形の極性の解明が
重要である。例えば、声門音源の閉鎖点によるピッチ抽
出のとき、分析手法によって、異なる極性の音声信号か
ら不安定な結果が得られる。また、音素接続音声合成シ
ステムには、異なる極性の音素単位の音声波形を接続す
ると、接続点による合成音声の不連続感が生じる。
の装置に通すとき、音声波形の極性が逆になる場合があ
る。一方、音声信号の分析(例えば、エポック(epo
ch)検出、2チャンネル信号による分析、EGG信号
による処理など)に対しては、音声波形の極性の解明が
重要である。例えば、声門音源の閉鎖点によるピッチ抽
出のとき、分析手法によって、異なる極性の音声信号か
ら不安定な結果が得られる。また、音素接続音声合成シ
ステムには、異なる極性の音素単位の音声波形を接続す
ると、接続点による合成音声の不連続感が生じる。
【0003】
【発明が解決しようとする課題】従来、音声波形の極性
を判断するために、音声波形の一部を拡大して視察によ
って決めている。従って音声信号の分析に人間の介在が
必要となり、分析の効率及び主観判断の精度が低くなる
という問題点があった。また、従来、エントロピック
(Entropic)社により、音声信号から極性と声
門閉鎖点を求めるコンピュータ用ツール(ソフトウエ
ア)が作られているが、DP法を使うため大量の計算が
必要であるという問題点があった(例えば、従来技術文
献「T.David etal.,“ESPS Programs,epochs",Manual,E
ntropic Research Laboratory,Inc.,1993年」参
照。)。
を判断するために、音声波形の一部を拡大して視察によ
って決めている。従って音声信号の分析に人間の介在が
必要となり、分析の効率及び主観判断の精度が低くなる
という問題点があった。また、従来、エントロピック
(Entropic)社により、音声信号から極性と声
門閉鎖点を求めるコンピュータ用ツール(ソフトウエ
ア)が作られているが、DP法を使うため大量の計算が
必要であるという問題点があった(例えば、従来技術文
献「T.David etal.,“ESPS Programs,epochs",Manual,E
ntropic Research Laboratory,Inc.,1993年」参
照。)。
【0004】本発明の目的は以上の問題点を解決し、従
来技術に比較して構成が簡単であって、しかも高い測定
精度で音声信号の極性を判定することができる音声信号
分析装置を提供することにある。
来技術に比較して構成が簡単であって、しかも高い測定
精度で音声信号の極性を判定することができる音声信号
分析装置を提供することにある。
【0005】
【課題を解決するための手段】本発明に係る請求項1記
載の音声信号分析装置は、入力される音声信号から逆フ
ィルタ波形を演算し、その逆フィルタ波形の声門閉鎖点
の付近に急な勾配があることを利用して上記音声信号の
極性を検出することを特徴とする。
載の音声信号分析装置は、入力される音声信号から逆フ
ィルタ波形を演算し、その逆フィルタ波形の声門閉鎖点
の付近に急な勾配があることを利用して上記音声信号の
極性を検出することを特徴とする。
【0006】また、本発明に係る請求項2記載の音声信
号分析装置は、入力される音声信号をA/D変換して音
声ディジタル信号を出力する変換手段と、上記変換手段
から出力される音声ディジタル信号を、LPC分析法で
分析して声道特性を表す声道伝達特性を表わす信号を出
力する分析手段と、上記分析手段から出力される信号に
対して、逆フィルタ法を用いて、逆フィルタ波形信号を
発生して出力する抽出手段と、上記抽出手段から出力さ
れる逆フィルタ波形信号から低域の雑音成分を除去して
擬似声門音源波形信号を出力する低域通過フィルタと、
上記低域通過フィルタから出力される擬似声門音源波形
信号の勾配の絶対値を演算して、当該勾配の絶対値を示
す絶対値信号を発生して出力する演算手段と、上記低域
通過フィルタから出力される擬似声門音源波形信号と、
上記演算手段から出力される絶対値信号とに基づいて、
逆フィルタ波形の声門閉鎖点の付近に急な勾配があるこ
とを利用して上記音声信号の極性を検出して、検出結果
信号を出力する判定手段とを備えたことを特徴とする。
号分析装置は、入力される音声信号をA/D変換して音
声ディジタル信号を出力する変換手段と、上記変換手段
から出力される音声ディジタル信号を、LPC分析法で
分析して声道特性を表す声道伝達特性を表わす信号を出
力する分析手段と、上記分析手段から出力される信号に
対して、逆フィルタ法を用いて、逆フィルタ波形信号を
発生して出力する抽出手段と、上記抽出手段から出力さ
れる逆フィルタ波形信号から低域の雑音成分を除去して
擬似声門音源波形信号を出力する低域通過フィルタと、
上記低域通過フィルタから出力される擬似声門音源波形
信号の勾配の絶対値を演算して、当該勾配の絶対値を示
す絶対値信号を発生して出力する演算手段と、上記低域
通過フィルタから出力される擬似声門音源波形信号と、
上記演算手段から出力される絶対値信号とに基づいて、
逆フィルタ波形の声門閉鎖点の付近に急な勾配があるこ
とを利用して上記音声信号の極性を検出して、検出結果
信号を出力する判定手段とを備えたことを特徴とする。
【0007】さらに、請求項3記載の音声信号分析装置
は、請求項2記載の音声信号分析装置において、上記判
定手段は、所定の分析期間で、上記絶対値信号の正のピ
ークと上記擬似声門音源波形信号の負のピークとの時間
差が、上記絶対値信号の正のピークと擬似声門音源波形
信号の正のピークとの間の時間差よりも小さいという第
1の条件が成立する回数が、上記絶対値信号の正のピー
クと上記擬似声門音源波形信号の負のピークとの時間差
が、上記絶対値信号の正のピークと上記擬似声門音源波
形信号の正のピークとの間の時間差よりも小さくないと
いう第2の条件が成立する回数よりも小さいとき、上記
入力される音声信号の極性を正と判定する一方、上記分
析期間で、上記第1の条件が成立する回数が上記第2の
条件が成立する回数よりも小さくないとき、上記入力さ
れる音声信号の極性を負と判定することを特徴とする。
は、請求項2記載の音声信号分析装置において、上記判
定手段は、所定の分析期間で、上記絶対値信号の正のピ
ークと上記擬似声門音源波形信号の負のピークとの時間
差が、上記絶対値信号の正のピークと擬似声門音源波形
信号の正のピークとの間の時間差よりも小さいという第
1の条件が成立する回数が、上記絶対値信号の正のピー
クと上記擬似声門音源波形信号の負のピークとの時間差
が、上記絶対値信号の正のピークと上記擬似声門音源波
形信号の正のピークとの間の時間差よりも小さくないと
いう第2の条件が成立する回数よりも小さいとき、上記
入力される音声信号の極性を正と判定する一方、上記分
析期間で、上記第1の条件が成立する回数が上記第2の
条件が成立する回数よりも小さくないとき、上記入力さ
れる音声信号の極性を負と判定することを特徴とする。
【0008】
【発明の実施の形態】以下、図面を参照して本発明に係
る実施形態について説明する。
る実施形態について説明する。
【0009】通常の声門音源波形をモデルで近似する
と、図2に示すように声門音源波形と口唇の放射特性を
考慮した微分声門音源波形がある。声門閉鎖(開始)時
点が微分音源波形の下部になるのは普通であり、この時
の音声波形が正の極性を持つことを意味している。その
反対の場合は負の極性である。また、声門開放区間にお
ける微分音源波形が滑らかになっていることに対して、
声門閉鎖区間において音源波形が急に変化していること
(急な勾配)が見られる。
と、図2に示すように声門音源波形と口唇の放射特性を
考慮した微分声門音源波形がある。声門閉鎖(開始)時
点が微分音源波形の下部になるのは普通であり、この時
の音声波形が正の極性を持つことを意味している。その
反対の場合は負の極性である。また、声門開放区間にお
ける微分音源波形が滑らかになっていることに対して、
声門閉鎖区間において音源波形が急に変化していること
(急な勾配)が見られる。
【0010】図1は、本発明に係る一実施形態である音
声信号分析装置の構成を示すブロック図である。本実施
形態の音声信号分析装置は、音声波形と同じ極性を持つ
声門音源波形(逆フィルタ波形)の極性を判明するもの
である。まず、極性未知の音声をマイクロホン1で音声
アナログ信号に変換した後、増幅器2及びA/D変換器
3を介して音声ディジタル信号に変換する。次いで、当
該音声ディジタル信号の信号波形s(n)を線形予測分
析部4でLPC分析法で分析し、声道特性を表す声道伝
達関数の係数を得る。さらに、音源波形抽出部5におい
て、逆フィルタ法を使って、雑音成分を含んだ逆フィル
タ波形v(n)が生成され、低域通過フィルタ(LP
F)6に通して、低域の雑音成分を除去した後、擬似声
門音源波形(spurious glottal waveform)SG(n)
を得る。さらに、勾配計算部8及び絶対値計算部9にお
いて、擬似音源波形SG(n)の微分と絶対値を計算
し、逆フィルタ波形の勾配の絶対値信号AGSG(n)
を得る。最後に、極性判定部10は、擬似音源波形SG
(n)と上記勾配の絶対値信号AGSG(n)を用い
て、音声の極性を決定して、その結果を示す信号を出力
する。以下、上記の処理について詳述する。
声信号分析装置の構成を示すブロック図である。本実施
形態の音声信号分析装置は、音声波形と同じ極性を持つ
声門音源波形(逆フィルタ波形)の極性を判明するもの
である。まず、極性未知の音声をマイクロホン1で音声
アナログ信号に変換した後、増幅器2及びA/D変換器
3を介して音声ディジタル信号に変換する。次いで、当
該音声ディジタル信号の信号波形s(n)を線形予測分
析部4でLPC分析法で分析し、声道特性を表す声道伝
達関数の係数を得る。さらに、音源波形抽出部5におい
て、逆フィルタ法を使って、雑音成分を含んだ逆フィル
タ波形v(n)が生成され、低域通過フィルタ(LP
F)6に通して、低域の雑音成分を除去した後、擬似声
門音源波形(spurious glottal waveform)SG(n)
を得る。さらに、勾配計算部8及び絶対値計算部9にお
いて、擬似音源波形SG(n)の微分と絶対値を計算
し、逆フィルタ波形の勾配の絶対値信号AGSG(n)
を得る。最後に、極性判定部10は、擬似音源波形SG
(n)と上記勾配の絶対値信号AGSG(n)を用い
て、音声の極性を決定して、その結果を示す信号を出力
する。以下、上記の処理について詳述する。
【0011】音声信号に対してLPC分析(線形予測分
析法)を行ったときの音声サンプルs(n)は次式で表
される。
析法)を行ったときの音声サンプルs(n)は次式で表
される。
【数1】 ここで、s(n)は時刻nの音声サンプル、u(n)は
正規化した音源信号、Gは音源信号の利得である。フィ
ルタ係数a1,a2,…,apはある分析区間に一定であ
ることを仮定している。
正規化した音源信号、Gは音源信号の利得である。フィ
ルタ係数a1,a2,…,apはある分析区間に一定であ
ることを仮定している。
【0012】次いで、数1のz変換を取ると、次式のよ
うになる。
うになる。
【数2】 H(z)は分析区間における声道の伝達特性を表す関数
である。逆フィルタ法は音声信号から声道の伝達特性を
取り除いてから声門音源波形を求める方法であって、次
式で表される。
である。逆フィルタ法は音声信号から声道の伝達特性を
取り除いてから声門音源波形を求める方法であって、次
式で表される。
【数3】
【0013】しかしながら、このように得られた逆フィ
ルタ波形v(n)はフィルタ係数の推定誤差及び音声信
号に含まれている雑音によって雑音を多く含んでいる。
この雑音成分を除去するために、低域通過フィルタ6
(例えば、カットオフ周波数:1000Hz)を使用す
る。このように得られた信号を、擬似声門音源波形SG
(n)と呼ぶ。
ルタ波形v(n)はフィルタ係数の推定誤差及び音声信
号に含まれている雑音によって雑音を多く含んでいる。
この雑音成分を除去するために、低域通過フィルタ6
(例えば、カットオフ周波数:1000Hz)を使用す
る。このように得られた信号を、擬似声門音源波形SG
(n)と呼ぶ。
【0014】図3において、(a)は正の極性を有する
男性の音声波形s(n)の一例を示す波形図であり、
(b)は上記音声波形s(n)を逆フィルタでろ波され
た波形v(n)の波形図であり、(c)は上記波形v
(n)を低域通過フィルタで雑音を除去したときの波形
SG(n)の波形図であり、(d)は上記波形SG
(n)に基づいて得られた声帯音源波形の絶対値信号A
GSG(n)の波形図である。図3(c)に示す信号波
形に雑音成分が少なく、声門閉鎖点の付近には声門開放
区間と比べて急な勾配が現れている。次に、このような
波形上の特徴を利用して声門閉鎖点の上下の位置によっ
て極性を判断する。
男性の音声波形s(n)の一例を示す波形図であり、
(b)は上記音声波形s(n)を逆フィルタでろ波され
た波形v(n)の波形図であり、(c)は上記波形v
(n)を低域通過フィルタで雑音を除去したときの波形
SG(n)の波形図であり、(d)は上記波形SG
(n)に基づいて得られた声帯音源波形の絶対値信号A
GSG(n)の波形図である。図3(c)に示す信号波
形に雑音成分が少なく、声門閉鎖点の付近には声門開放
区間と比べて急な勾配が現れている。次に、このような
波形上の特徴を利用して声門閉鎖点の上下の位置によっ
て極性を判断する。
【0015】擬似声門音源波形SG(n)の勾配の絶対
値信号AGSG(n)を求めるために、図3(d)に示
す信号波形AGSG(n)を使用した。
値信号AGSG(n)を求めるために、図3(d)に示
す信号波形AGSG(n)を使用した。
【数4】 AGSG(n)=abs(deriv(SG(n))
【数5】AGSG(n)=abs(SG(n)−SG
(n−1)) ここで、deriv(・)は勾配計算部8で使用される
時間微分関数であり、abs(・)は絶対値計算部9で
使用される絶対値関数である。
(n−1)) ここで、deriv(・)は勾配計算部8で使用される
時間微分関数であり、abs(・)は絶対値計算部9で
使用される絶対値関数である。
【0016】図3(d)から明らかなように、勾配の絶
対値信号AGSG(n)の正のピークの位置P(i),
P(i+1),…は擬似声門音源波形SG(n)の声門
閉鎖点V(i),V(i+1),…の付近に現れてい
る。これは擬似声門音源波形SG(n)の声門閉鎖点の
付近に波形の勾配がそれ以外のところより大きくなって
いるからである。従って、勾配の絶対値信号AGSG
(n)の正のピークは擬似声門音源波形SG(n)の正
のピークより負のピークに近ければ、音声波形が正の極
性をもつことが判断できる。この判断規則を式で表すと
次式のようになる。
対値信号AGSG(n)の正のピークの位置P(i),
P(i+1),…は擬似声門音源波形SG(n)の声門
閉鎖点V(i),V(i+1),…の付近に現れてい
る。これは擬似声門音源波形SG(n)の声門閉鎖点の
付近に波形の勾配がそれ以外のところより大きくなって
いるからである。従って、勾配の絶対値信号AGSG
(n)の正のピークは擬似声門音源波形SG(n)の正
のピークより負のピークに近ければ、音声波形が正の極
性をもつことが判断できる。この判断規則を式で表すと
次式のようになる。
【数6】極性Po=P;もしcount[dist(P
(i)AGSG(n),V(i)SG(n))<dist(P(i)
AGSG(n),P(i)SG(n))]<count[dist
(P(i)AGSG(n),V(i)SG(n))≧dist(P
(i)AGSG(n),P(i)SG(n))]=N;もしcoun
t[dist(P(i)AGSG(n),V(i)SG(n))<d
ist(P(i)AGSG(n),P(i)SG(n))]≧cou
nt[dist(P(i)AGSG(n),V(i)SG(n))≧
dist(P(i)AGSG(n),P(i)SG(n))]
(i)AGSG(n),V(i)SG(n))<dist(P(i)
AGSG(n),P(i)SG(n))]<count[dist
(P(i)AGSG(n),V(i)SG(n))≧dist(P
(i)AGSG(n),P(i)SG(n))]=N;もしcoun
t[dist(P(i)AGSG(n),V(i)SG(n))<d
ist(P(i)AGSG(n),P(i)SG(n))]≧cou
nt[dist(P(i)AGSG(n),V(i)SG(n))≧
dist(P(i)AGSG(n),P(i)SG(n))]
【0017】ここで、P、Nはそれぞれ正、負の極性を
意味している。dist(P(i)AGSG(n),V(i)
SG(n)は、勾配の絶対値信号AGSG(n)の正のピー
クP(i)と擬似声門音源波形信号SG(n)の負のピ
ークV(i)の間の時間差(又は時間的距離)を表す。
また、dist(P(i)AGSG(n),P(i)SG(n))
は、勾配の絶対値信号AGSG(n)の正のピークP
(i)と擬似声門音源波形信号SG(n)の正のピーク
P(i)の間の時間差(又は時間的距離)を表す。さら
に、count{A}は所定の分析区間(例えば、基本
周期毎に又はピッチ間に)に対して条件Aが判断された
回数を表す。基本的にピッチごとに1回の極性判断がで
きるが、ある区間において確率の高い判断を、高い信頼
度で行うために、count{A}が必要となる。
意味している。dist(P(i)AGSG(n),V(i)
SG(n)は、勾配の絶対値信号AGSG(n)の正のピー
クP(i)と擬似声門音源波形信号SG(n)の負のピ
ークV(i)の間の時間差(又は時間的距離)を表す。
また、dist(P(i)AGSG(n),P(i)SG(n))
は、勾配の絶対値信号AGSG(n)の正のピークP
(i)と擬似声門音源波形信号SG(n)の正のピーク
P(i)の間の時間差(又は時間的距離)を表す。さら
に、count{A}は所定の分析区間(例えば、基本
周期毎に又はピッチ間に)に対して条件Aが判断された
回数を表す。基本的にピッチごとに1回の極性判断がで
きるが、ある区間において確率の高い判断を、高い信頼
度で行うために、count{A}が必要となる。
【0018】すなわち、数6から明らかなように、所定
の分析期間で、絶対値信号の正のピークP(i)
AGSG(n)と擬似声門音源波形信号の負のピークV(i)
SG(n)との間の時間差が、絶対値信号の正のピークP
(i)AGSG(n)と擬似声門音源波形信号の正のピークP
(i)SG(n)との間の時間差よりも小さいという第1の
条件が成立する回数が、絶対値信号の正のピークP
(i)AGSG(n)と擬似声門音源波形信号の負のピークV
(i)SG(n)との間の時間差が、絶対値信号の正のピー
クP(i)AGSG(n)と擬似声門音源波形信号の正のピー
クP(i)SG(n)との間の時間差よりも小さくないとい
う第2の条件が成立する回数よりも小さいとき、音声信
号の極性Poを正と判定する。一方、上記分析期間で、
上記第1の条件が成立する回数が、上記第2の条件が成
立する回数よりも小さくないとき、音声信号の極性Po
を負と判定する。
の分析期間で、絶対値信号の正のピークP(i)
AGSG(n)と擬似声門音源波形信号の負のピークV(i)
SG(n)との間の時間差が、絶対値信号の正のピークP
(i)AGSG(n)と擬似声門音源波形信号の正のピークP
(i)SG(n)との間の時間差よりも小さいという第1の
条件が成立する回数が、絶対値信号の正のピークP
(i)AGSG(n)と擬似声門音源波形信号の負のピークV
(i)SG(n)との間の時間差が、絶対値信号の正のピー
クP(i)AGSG(n)と擬似声門音源波形信号の正のピー
クP(i)SG(n)との間の時間差よりも小さくないとい
う第2の条件が成立する回数よりも小さいとき、音声信
号の極性Poを正と判定する。一方、上記分析期間で、
上記第1の条件が成立する回数が、上記第2の条件が成
立する回数よりも小さくないとき、音声信号の極性Po
を負と判定する。
【0019】なお、図1の音声信号分析装置において、
A/D変換器3におけるディジタル信号のサンプルリン
グレートは通常8kHz,12kHz,16kHz,2
2.1kHzのいずれに設定される。ここで、使われて
いるA/D変換器3及び増幅器2の電気特性によって音
声信号の上下が逆転になる可能性がある。
A/D変換器3におけるディジタル信号のサンプルリン
グレートは通常8kHz,12kHz,16kHz,2
2.1kHzのいずれに設定される。ここで、使われて
いるA/D変換器3及び増幅器2の電気特性によって音
声信号の上下が逆転になる可能性がある。
【0020】
【実施例】図4において、(a)は正の極性を有する女
性の音声波形s(n)の一例を示す波形図であり、
(b)は上記音声波形s(n)を逆フィルタでろ波され
た波形v(n)の波形図であり、(c)は上記波形v
(n)を低域通過フィルタで雑音を除去したときの波形
SG(n)の波形図であり、(d)は上記波形SG
(n)に基づいて得られた声帯音源波形の絶対値信号A
GSG(n)の波形図である。女性の分析例を示す図4
において、逆フィルタ波形SG(n)の声門閉鎖区間に
リターンフェーズ(return phase)が大きいが、勾配逆
フィルタ波形AGSG(n)の声門閉鎖点の付近に主に
一つのピークが現れている。また、このピークの位置は
逆フィルタ波形SG(n)の負のピークに近いので、数
6を適応すると、音声信号の極性を正と判断できる。
性の音声波形s(n)の一例を示す波形図であり、
(b)は上記音声波形s(n)を逆フィルタでろ波され
た波形v(n)の波形図であり、(c)は上記波形v
(n)を低域通過フィルタで雑音を除去したときの波形
SG(n)の波形図であり、(d)は上記波形SG
(n)に基づいて得られた声帯音源波形の絶対値信号A
GSG(n)の波形図である。女性の分析例を示す図4
において、逆フィルタ波形SG(n)の声門閉鎖区間に
リターンフェーズ(return phase)が大きいが、勾配逆
フィルタ波形AGSG(n)の声門閉鎖点の付近に主に
一つのピークが現れている。また、このピークの位置は
逆フィルタ波形SG(n)の負のピークに近いので、数
6を適応すると、音声信号の極性を正と判断できる。
【0021】以上説明したように、本実施形態によれ
ば、逆フィルタ波形の勾配を用いて音声信号の極性を判
断する方法を用いた音声信号分析装置を発明し、音声信
号から逆フィルタ波形を求め、その声門閉鎖点の付近に
急な勾配があることを利用して極性を検出した。これに
より、従来技術に比較して構成が簡単であって、しかも
高い測定精度で音声信号の極性を自動的に判定すること
ができる音声信号分析装置を提供することができる。
ば、逆フィルタ波形の勾配を用いて音声信号の極性を判
断する方法を用いた音声信号分析装置を発明し、音声信
号から逆フィルタ波形を求め、その声門閉鎖点の付近に
急な勾配があることを利用して極性を検出した。これに
より、従来技術に比較して構成が簡単であって、しかも
高い測定精度で音声信号の極性を自動的に判定すること
ができる音声信号分析装置を提供することができる。
【0022】
【発明の効果】以上詳述したように本発明に係る請求項
1記載の音声信号分析装置によれば、入力される音声信
号から逆フィルタ波形を演算し、その逆フィルタ波形の
声門閉鎖点の付近に急な勾配があることを利用して上記
音声信号の極性を検出する。従って、従来技術に比較し
て構成が簡単であって、しかも高い測定精度で音声信号
の極性を自動的に判定することができる音声信号分析装
置を提供することができる。
1記載の音声信号分析装置によれば、入力される音声信
号から逆フィルタ波形を演算し、その逆フィルタ波形の
声門閉鎖点の付近に急な勾配があることを利用して上記
音声信号の極性を検出する。従って、従来技術に比較し
て構成が簡単であって、しかも高い測定精度で音声信号
の極性を自動的に判定することができる音声信号分析装
置を提供することができる。
【0023】また、本発明に係る請求項2記載の音声信
号分析装置においては、入力される音声信号をA/D変
換して音声ディジタル信号を出力する変換手段と、上記
変換手段から出力される音声ディジタル信号を、LPC
分析法で分析して声道特性を表す声道伝達特性を表わす
信号を出力する分析手段と、上記分析手段から出力され
る信号に対して、逆フィルタ法を用いて、逆フィルタ波
形信号を発生して出力する抽出手段と、上記抽出手段か
ら出力される逆フィルタ波形信号から低域の雑音成分を
除去して擬似声門音源波形信号を出力する低域通過フィ
ルタと、上記低域通過フィルタから出力される擬似声門
音源波形信号の勾配の絶対値を演算して、当該勾配の絶
対値を示す絶対値信号を発生して出力する演算手段と、
上記低域通過フィルタから出力される擬似声門音源波形
信号と、上記演算手段から出力される絶対値信号とに基
づいて、逆フィルタ波形の声門閉鎖点の付近に急な勾配
があることを利用して上記音声信号の極性を検出して、
検出結果信号を出力する判定手段とを備える。従って、
従来技術に比較して構成が簡単であって、しかも高い測
定精度で音声信号の極性を自動的に判定することができ
る音声信号分析装置を提供することができる。
号分析装置においては、入力される音声信号をA/D変
換して音声ディジタル信号を出力する変換手段と、上記
変換手段から出力される音声ディジタル信号を、LPC
分析法で分析して声道特性を表す声道伝達特性を表わす
信号を出力する分析手段と、上記分析手段から出力され
る信号に対して、逆フィルタ法を用いて、逆フィルタ波
形信号を発生して出力する抽出手段と、上記抽出手段か
ら出力される逆フィルタ波形信号から低域の雑音成分を
除去して擬似声門音源波形信号を出力する低域通過フィ
ルタと、上記低域通過フィルタから出力される擬似声門
音源波形信号の勾配の絶対値を演算して、当該勾配の絶
対値を示す絶対値信号を発生して出力する演算手段と、
上記低域通過フィルタから出力される擬似声門音源波形
信号と、上記演算手段から出力される絶対値信号とに基
づいて、逆フィルタ波形の声門閉鎖点の付近に急な勾配
があることを利用して上記音声信号の極性を検出して、
検出結果信号を出力する判定手段とを備える。従って、
従来技術に比較して構成が簡単であって、しかも高い測
定精度で音声信号の極性を自動的に判定することができ
る音声信号分析装置を提供することができる。
【0024】さらに、請求項3記載の音声信号分析装置
においては、請求項2記載の音声信号分析装置におい
て、上記判定手段は、所定の分析期間で、上記絶対値信
号の正のピークと上記擬似声門音源波形信号の負のピー
クとの時間差が、上記絶対値信号の正のピークと擬似声
門音源波形信号の正のピークとの間の時間差よりも小さ
いという第1の条件が成立する回数が、上記絶対値信号
の正のピークと上記擬似声門音源波形信号の負のピーク
との時間差が、上記絶対値信号の正のピークと上記擬似
声門音源波形信号の正のピークとの間の時間差よりも小
さくないという第2の条件が成立する回数よりも小さい
とき、上記入力される音声信号の極性を正と判定する一
方、上記分析期間で、上記第1の条件が成立する回数が
上記第2の条件が成立する回数よりも小さくないとき、
上記入力される音声信号の極性を負と判定する。従っ
て、音声信号の極性をより簡単に判定することができ、
従来技術に比較して構成が簡単であって、しかも高い測
定精度で音声信号の極性を自動的に判定することができ
る音声信号分析装置を提供することができる。
においては、請求項2記載の音声信号分析装置におい
て、上記判定手段は、所定の分析期間で、上記絶対値信
号の正のピークと上記擬似声門音源波形信号の負のピー
クとの時間差が、上記絶対値信号の正のピークと擬似声
門音源波形信号の正のピークとの間の時間差よりも小さ
いという第1の条件が成立する回数が、上記絶対値信号
の正のピークと上記擬似声門音源波形信号の負のピーク
との時間差が、上記絶対値信号の正のピークと上記擬似
声門音源波形信号の正のピークとの間の時間差よりも小
さくないという第2の条件が成立する回数よりも小さい
とき、上記入力される音声信号の極性を正と判定する一
方、上記分析期間で、上記第1の条件が成立する回数が
上記第2の条件が成立する回数よりも小さくないとき、
上記入力される音声信号の極性を負と判定する。従っ
て、音声信号の極性をより簡単に判定することができ、
従来技術に比較して構成が簡単であって、しかも高い測
定精度で音声信号の極性を自動的に判定することができ
る音声信号分析装置を提供することができる。
【図面の簡単な説明】
【図1】 本発明に係る一実施形態である音声信号分析
装置の構成を示すブロック図である。
装置の構成を示すブロック図である。
【図2】 (a)は声帯音源波形の一例を示す波形図で
あり、(b)は声帯音源波形の微分波形の一例を示す波
形図である。
あり、(b)は声帯音源波形の微分波形の一例を示す波
形図である。
【図3】 (a)は正の極性を有する男性の音声波形s
(n)の一例を示す波形図であり、(b)は上記音声波
形s(n)を逆フィルタでろ波された波形v(n)の波
形図であり、(c)は上記波形v(n)を低域通過フィ
ルタで雑音を除去したときの波形SG(n)の波形図で
あり、(d)は上記波形SG(n)に基づいて得られた
声帯音源波形の絶対値信号AGSG(n)の波形図であ
る。
(n)の一例を示す波形図であり、(b)は上記音声波
形s(n)を逆フィルタでろ波された波形v(n)の波
形図であり、(c)は上記波形v(n)を低域通過フィ
ルタで雑音を除去したときの波形SG(n)の波形図で
あり、(d)は上記波形SG(n)に基づいて得られた
声帯音源波形の絶対値信号AGSG(n)の波形図であ
る。
【図4】 (a)は正の極性を有する女性の音声波形s
(n)の一例を示す波形図であり、(b)は上記音声波
形s(n)を逆フィルタでろ波された波形v(n)の波
形図であり、(c)は上記波形v(n)を低域通過フィ
ルタで雑音を除去したときの波形SG(n)の波形図で
あり、(d)は上記波形SG(n)に基づいて得られた
声帯音源波形の絶対値信号AGSG(n)の波形図であ
る。
(n)の一例を示す波形図であり、(b)は上記音声波
形s(n)を逆フィルタでろ波された波形v(n)の波
形図であり、(c)は上記波形v(n)を低域通過フィ
ルタで雑音を除去したときの波形SG(n)の波形図で
あり、(d)は上記波形SG(n)に基づいて得られた
声帯音源波形の絶対値信号AGSG(n)の波形図であ
る。
1…マイクロホン、 2…増幅器、 3…A/D変換器、 4…線形予測分析部、 5…音源波形抽出部、 6…低域通過フィルタ(LPF)、 7…バッファメモリ、 8…勾配計算部、 9…絶対値計算部、 10…極性判定部。
フロントページの続き (72)発明者 ニック・キャンベル 京都府相楽郡精華町大字乾谷小字三平谷5 番地 株式会社エイ・ティ・アール音声翻 訳通信研究所内 (72)発明者 樋口 宜男 京都府相楽郡精華町大字乾谷小字三平谷5 番地 株式会社エイ・ティ・アール音声翻 訳通信研究所内
Claims (3)
- 【請求項1】 入力される音声信号から逆フィルタ波形
を演算し、その逆フィルタ波形の声門閉鎖点の付近に急
な勾配があることを利用して上記音声信号の極性を検出
することを特徴とする音声信号分析装置。 - 【請求項2】 入力される音声信号をA/D変換して音
声ディジタル信号を出力する変換手段と、 上記変換手段から出力される音声ディジタル信号を、L
PC分析法で分析して声道特性を表す声道伝達特性を表
わす信号を出力する分析手段と、 上記分析手段から出力される信号に対して、逆フィルタ
法を用いて、逆フィルタ波形信号を発生して出力する抽
出手段と、 上記抽出手段から出力される逆フィルタ波形信号から低
域の雑音成分を除去して擬似声門音源波形信号を出力す
る低域通過フィルタと、 上記低域通過フィルタから出力される擬似声門音源波形
信号の勾配の絶対値を演算して、当該勾配の絶対値を示
す絶対値信号を発生して出力する演算手段と、 上記低域通過フィルタから出力される擬似声門音源波形
信号と、上記演算手段から出力される絶対値信号とに基
づいて、逆フィルタ波形の声門閉鎖点の付近に急な勾配
があることを利用して上記音声信号の極性を検出して、
検出結果信号を出力する判定手段とを備えたことを特徴
とする音声信号分析装置。 - 【請求項3】 請求項2記載の音声信号分析装置におい
て、 上記判定手段は、所定の分析期間で、上記絶対値信号の
正のピークと上記擬似声門音源波形信号の負のピークと
の時間差が、上記絶対値信号の正のピークと擬似声門音
源波形信号の正のピークとの間の時間差よりも小さいと
いう第1の条件が成立する回数が、上記絶対値信号の正
のピークと上記擬似声門音源波形信号の負のピークとの
時間差が、上記絶対値信号の正のピークと上記擬似声門
音源波形信号の正のピークとの間の時間差よりも小さく
ないという第2の条件が成立する回数よりも小さいと
き、上記入力される音声信号の極性を正と判定する一
方、上記分析期間で、上記第1の条件が成立する回数が
上記第2の条件が成立する回数よりも小さくないとき、
上記入力される音声信号の極性を負と判定することを特
徴とする音声信号分析装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9236802A JPH1185197A (ja) | 1997-09-02 | 1997-09-02 | 音声信号分析装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9236802A JPH1185197A (ja) | 1997-09-02 | 1997-09-02 | 音声信号分析装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH1185197A true JPH1185197A (ja) | 1999-03-30 |
Family
ID=17006009
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9236802A Pending JPH1185197A (ja) | 1997-09-02 | 1997-09-02 | 音声信号分析装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH1185197A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007068847A (ja) * | 2005-09-08 | 2007-03-22 | Advanced Telecommunication Research Institute International | 声門閉鎖区間検出装置および声門閉鎖区間検出方法 |
| JP2010026068A (ja) * | 2008-07-16 | 2010-02-04 | Toshiba Corp | 情報処理装置 |
| CN116778910A (zh) * | 2023-05-06 | 2023-09-19 | 中国科学院声学研究所 | 一种语音检测方法 |
-
1997
- 1997-09-02 JP JP9236802A patent/JPH1185197A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007068847A (ja) * | 2005-09-08 | 2007-03-22 | Advanced Telecommunication Research Institute International | 声門閉鎖区間検出装置および声門閉鎖区間検出方法 |
| JP2010026068A (ja) * | 2008-07-16 | 2010-02-04 | Toshiba Corp | 情報処理装置 |
| CN116778910A (zh) * | 2023-05-06 | 2023-09-19 | 中国科学院声学研究所 | 一种语音检测方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Goto | A robust predominant-F0 estimation method for real-time detection of melody and bass lines in CD recordings | |
| Krishnamurthy et al. | Two-channel speech analysis | |
| Veeneman et al. | Automatic glottal inverse filtering from speech and electroglottographic signals | |
| EP0325075B1 (en) | Voice parameter extractor using oral airflow | |
| JPS63500683A (ja) | 並列処理型ピッチ検出器 | |
| JP3033061B2 (ja) | 音声雑音分離装置 | |
| US20140200889A1 (en) | System and Method for Speech Recognition Using Pitch-Synchronous Spectral Parameters | |
| US20100169085A1 (en) | Model based real time pitch tracking system and singer evaluation method | |
| US5809453A (en) | Methods and apparatus for detecting harmonic structure in a waveform | |
| KR100653643B1 (ko) | 하모닉과 비하모닉의 비율을 이용한 피치 검출 방법 및피치 검출 장치 | |
| JPH1185197A (ja) | 音声信号分析装置 | |
| Brookes et al. | Speaker characteristics from a glottal airflow model using robust inverse filtering | |
| JP3354252B2 (ja) | 音声認識装置 | |
| Samad et al. | Pitch detection of speech signals using the cross-correlation technique | |
| Brookes et al. | Modelling energy flow in the vocal tract with applications to glottal closure and opening detection | |
| Ding et al. | Determining polarity of speech signals based on gradient of spurious glottal waveforms | |
| JP7750250B2 (ja) | オーディオ移調 | |
| Park et al. | Pitch detection based on signal-to-noise-ratio estimation and compensation for continuous speech signal | |
| JP4177751B2 (ja) | 声質モデル生成方法、声質変換方法、並びにそれらのためのコンピュータプログラム、当該プログラムを記録した記録媒体、及び当該プログラムによりプログラムされたコンピュータ | |
| JP5203404B2 (ja) | テンポ値検出装置およびテンポ値検出方法 | |
| Cabral | Estimation of the Asymmetry Parameter of the Glottal Flow Waveform Using the Electroglottographic Signal. | |
| JP3035939B2 (ja) | 音声分析合成装置 | |
| KR0176623B1 (ko) | 연속 음성의 유성음부와 무성자음부의 자동 추출방법 및 장치 | |
| JPH06348298A (ja) | 音声分析装置 | |
| KR100289317B1 (ko) | 음성신호의 피치 검출장치 및 그 방법 |