JPS6190200A - パワ−スペクトル抽出方式 - Google Patents
パワ−スペクトル抽出方式Info
- Publication number
- JPS6190200A JPS6190200A JP59211711A JP21171184A JPS6190200A JP S6190200 A JPS6190200 A JP S6190200A JP 59211711 A JP59211711 A JP 59211711A JP 21171184 A JP21171184 A JP 21171184A JP S6190200 A JPS6190200 A JP S6190200A
- Authority
- JP
- Japan
- Prior art keywords
- power spectrum
- autocorrelation function
- pitch
- speech
- analyzed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Magnetic Resonance Imaging Apparatus (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Spectrometry And Color Measurement (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は音声の自己相関関数からパワースペクトルを抽
出する音声分析システムに係り、特に分析対象信号に混
入した白色雑音の影響を除去可能なパワースペクトル抽
出方式に関する。
出する音声分析システムに係り、特に分析対象信号に混
入した白色雑音の影響を除去可能なパワースペクトル抽
出方式に関する。
人間の発する音声を分析する為にパワースペクトルを求
める場合に、分析対象とする音声の自己相関関数を求め
、得られた自己相関関数にフーリエ変換を施す方法が公
知である。
める場合に、分析対象とする音声の自己相関関数を求め
、得られた自己相関関数にフーリエ変換を施す方法が公
知である。
なお分析対象とする音声に白色雑音が重畳していると、
分析の結果本来の音声のパワースペクトルが得られぬ恐
れがある。
分析の結果本来の音声のパワースペクトルが得られぬ恐
れがある。
この種の従来あるパワースペクトル抽出方式においては
、最初に分析対象音声の自己相関関数Rv(iT)(但
しTは標本化周期、i=o、1、・・・、N−1)を求
め、続いて分析対象音声または得られた音声自己相関関
数Rv(iT)からピッチT0を求め、ピッチT。が得
られた場合には分析封象音声が有声音と見做して該ピッ
チT。(またはその整数倍)を積分区間とし、とソ千T
。が得られぬ場合には分析対象音声が無声音と見做して
予め定められた時間長を積分区間とし、得られた音声自
己相関関数Rv(iT)にフーリエ変換を施し、音声パ
ワースペクトル5v(kω。)を求める。なお会話音声
等においては、音声のホルマントが変動する為、音声自
己相関関数Rν(i T)は正弦成分のみならず余弦成
分も含む。従って音声パワースペクトル5v(kω。)
を求める為には音声自己相関関数Rv(iT)に余弦フ
ーリエ変換のみならず正弦フーリエ変換を施して音声パ
ワースペクトルの余弦成分5c(kω。)および正弦成
分5s(kω。)をそれぞれ求める必要がある〔(1)
式および(2)1式参照〕。
、最初に分析対象音声の自己相関関数Rv(iT)(但
しTは標本化周期、i=o、1、・・・、N−1)を求
め、続いて分析対象音声または得られた音声自己相関関
数Rv(iT)からピッチT0を求め、ピッチT。が得
られた場合には分析封象音声が有声音と見做して該ピッ
チT。(またはその整数倍)を積分区間とし、とソ千T
。が得られぬ場合には分析対象音声が無声音と見做して
予め定められた時間長を積分区間とし、得られた音声自
己相関関数Rv(iT)にフーリエ変換を施し、音声パ
ワースペクトル5v(kω。)を求める。なお会話音声
等においては、音声のホルマントが変動する為、音声自
己相関関数Rν(i T)は正弦成分のみならず余弦成
分も含む。従って音声パワースペクトル5v(kω。)
を求める為には音声自己相関関数Rv(iT)に余弦フ
ーリエ変換のみならず正弦フーリエ変換を施して音声パ
ワースペクトルの余弦成分5c(kω。)および正弦成
分5s(kω。)をそれぞれ求める必要がある〔(1)
式および(2)1式参照〕。
5c(kω。)=、ΣRv(i T)cosk ω(1
t T ”・(11Ss(kω。);ΣRv(i T
)sink ω。i T ”−(2)411? 〔但しk =0.1、・・・、N−1、N =T
o / T 1 ω。=2π/T0 〕 その結果音声パワースペクトル5v(kω。)は(3)
式により求められる。
t T ”・(11Ss(kω。);ΣRv(i T
)sink ω。i T ”−(2)411? 〔但しk =0.1、・・・、N−1、N =T
o / T 1 ω。=2π/T0 〕 その結果音声パワースペクトル5v(kω。)は(3)
式により求められる。
5v(k ωG) = (Sc2(k (111G)
+ SS”(k ωo))””・・・(3) なお分析対象信号に、音声と白色雑音が混入している場
合には、前述の過程による分析の結果得られるパワース
ペクトルS (kω。)は(4)式に示される如(、音
声パワースペクトル5v(kω0)と雑音パワースペク
トル5n(kω。)との和となる。
+ SS”(k ωo))””・・・(3) なお分析対象信号に、音声と白色雑音が混入している場
合には、前述の過程による分析の結果得られるパワース
ペクトルS (kω。)は(4)式に示される如(、音
声パワースペクトル5v(kω0)と雑音パワースペク
トル5n(kω。)との和となる。
S(kωo)=Sv(kωo)−+5n(k(do)
−・(41〔但し5n(0) = Sn(ωo)
= −= 5n((N−1) ωo))〔発明が解決し
ようとする問題点〕 以上の説明から明らかな如く、従来あるパワースペクト
ル抽出方式においては、音声以外に白色雑音が混入した
分析対象信号から得られたパワースペクトルS (kω
0)には音声パワースペクトル5v(kω。)と雑音パ
ワースペクトル5n(kω。)とが含まれ、かかるパワ
ースペクトルS (kω。)を用いて音声の特徴パラメ
ータの抽出を行うと、当然乍ら雑音パワースペクトル5
n(kω。)による誤差が生ずる。
−・(41〔但し5n(0) = Sn(ωo)
= −= 5n((N−1) ωo))〔発明が解決し
ようとする問題点〕 以上の説明から明らかな如く、従来あるパワースペクト
ル抽出方式においては、音声以外に白色雑音が混入した
分析対象信号から得られたパワースペクトルS (kω
0)には音声パワースペクトル5v(kω。)と雑音パ
ワースペクトル5n(kω。)とが含まれ、かかるパワ
ースペクトルS (kω。)を用いて音声の特徴パラメ
ータの抽出を行うと、当然乍ら雑音パワースペクトル5
n(kω。)による誤差が生ずる。
前記間1題点は、自己相関関数のフーリエ変換により音
声のパワースペクトルを抽出する音声分析システムにお
いて、分析対象信号から自己相関関数R(iT)を算出
する第一の手段と、前記分析対象信号或いは前記第一の
手段より得た自己相関関数からピッチを求める第二の手
段と、該第二の手段が所定時間以内にピッチの抽出に成
功した場合には該ピッチまたはその整数倍に設定した時
間長を、該第二の手段がピッチの抽出に不成功の場合に
は予め定められた時間長をそれぞれ積分区間とし、前記
第一の手段より得た自己相関関数R(iT)の内i=o
以外の自己相関関数を対象にフーリエ変換を行う第三の
手段とを設けることにより、前記分析対象信号に混入す
る白色雑音のパワースペクトルを除去したパワースペク
トルを抽出することを′特徴とする本発明により解決さ
れる。
声のパワースペクトルを抽出する音声分析システムにお
いて、分析対象信号から自己相関関数R(iT)を算出
する第一の手段と、前記分析対象信号或いは前記第一の
手段より得た自己相関関数からピッチを求める第二の手
段と、該第二の手段が所定時間以内にピッチの抽出に成
功した場合には該ピッチまたはその整数倍に設定した時
間長を、該第二の手段がピッチの抽出に不成功の場合に
は予め定められた時間長をそれぞれ積分区間とし、前記
第一の手段より得た自己相関関数R(iT)の内i=o
以外の自己相関関数を対象にフーリエ変換を行う第三の
手段とを設けることにより、前記分析対象信号に混入す
る白色雑音のパワースペクトルを除去したパワースペク
トルを抽出することを′特徴とする本発明により解決さ
れる。
白色雑音は相関を持たないから、雑音自己相関関数Rn
(i T)は(5)式の如く表される。
(i T)は(5)式の如く表される。
Rn(0)≠0 ・・・(5
)Rn(iT)=O(i=1.2、・’) ・(
5)従って分析対象信号の自己相関関数R(iT)は(
6)式の如くなる。
)Rn(iT)=O(i=1.2、・’) ・(
5)従って分析対象信号の自己相関関数R(iT)は(
6)式の如くなる。
R(iT)=Rv(iT)+Rn(iT)=Rv(0)
+Rn(0) (i=o)(61=Rv(iT)
(i≠0)(61即ち自己相関関数R(iT)
にはi=0においてのみ白色雑音成分を含むことが判る
。
+Rn(0) (i=o)(61=Rv(iT)
(i≠0)(61即ち自己相関関数R(iT)
にはi=0においてのみ白色雑音成分を含むことが判る
。
音声が有声音の場合には、ピッチT0を周期として同じ
波形が繰返されるので、(7)式が成立する。
波形が繰返されるので、(7)式が成立する。
Rv(0) = Rv(N) ・
・・(71また(8)式が成立する。
・・(71また(8)式が成立する。
cos k ωo NT=cos k 2 π(1/T
o)NT(81sin k (170NT= 0
−(81(7)式および(8)式から、
(1)式および(2)式の積分区間(i−0乃至N−1
)を1標本化周期Tだけ平行移動させた積分区間(i=
1乃至N)を用いると、(9)式およびα0)式が得ら
れる。
o)NT(81sin k (170NT= 0
−(81(7)式および(8)式から、
(1)式および(2)式の積分区間(i−0乃至N−1
)を1標本化周期Tだけ平行移動させた積分区間(i=
1乃至N)を用いると、(9)式およびα0)式が得ら
れる。
5c(kωo)=ΣR(iT)coskωo iT=
ΣRv(iT)coskω。iT ・・・(9)Ss(
kωo)=ΣR(i T)sink (1170i T
=ΣRv(i T)sink ω。iT−・・α0)(
9)式およびαO)式においては、雑音自己相関関数R
n(iT)が含まれず、音声自己相関関数Rv(i T
)のみがフーリエ変換される為、算出される余弦成分5
c(kω。)および正弦成分5s(kω、)からは白色
雑音の影響が除去される。(9)式およびα0)式を(
3)式に代入することにより、雑音パワースペクトル5
n(kω。)を含まぬ音声パワースペクトル5v(kω
。)が得られる。
ΣRv(iT)coskω。iT ・・・(9)Ss(
kωo)=ΣR(i T)sink (1170i T
=ΣRv(i T)sink ω。iT−・・α0)(
9)式およびαO)式においては、雑音自己相関関数R
n(iT)が含まれず、音声自己相関関数Rv(i T
)のみがフーリエ変換される為、算出される余弦成分5
c(kω。)および正弦成分5s(kω、)からは白色
雑音の影響が除去される。(9)式およびα0)式を(
3)式に代入することにより、雑音パワースペクトル5
n(kω。)を含まぬ音声パワースペクトル5v(kω
。)が得られる。
また音声が無声音の場合には、積分区間は任意に設定可
能である為、積分区間をi=1乃至Nとしても不都合は
生じない。
能である為、積分区間をi=1乃至Nとしても不都合は
生じない。
以下、本発明の一実施例を図面により説明する。
図面は本発明の一実施例によるパワースペクトル抽出方
式を示す図である。
式を示す図である。
図において、入力端子1に到着した分析対象信号は自己
相関関数生成回路2に入力される。自己相関関数生成回
路2は、入力された分析対象信号の自己相関関数R(i
T)を公知の方法で算出し、ピッチ検出回路3およびフ
ーリエ変換回路4に伝達する。ピッチ検出回路3は、分
析回路31および判断回路32から構成される。分析回
路31は、入力された自己相関関数R(iT)の値をi
=1より順に確認し、自己相関関数R(iT)が一度負
となった後の最大値を与える自己相関関数(例えばR(
NT))を検出し、判断回路32に伝達する。判断回路
32は、伝達された自己相関関数R(NT)を予め定め
られた閾値R8と比較し、条件R(NT)≧R0が成立
すれば有声音、条件R(NT)<ROが設立すれば無声
音と判定する。
相関関数生成回路2に入力される。自己相関関数生成回
路2は、入力された分析対象信号の自己相関関数R(i
T)を公知の方法で算出し、ピッチ検出回路3およびフ
ーリエ変換回路4に伝達する。ピッチ検出回路3は、分
析回路31および判断回路32から構成される。分析回
路31は、入力された自己相関関数R(iT)の値をi
=1より順に確認し、自己相関関数R(iT)が一度負
となった後の最大値を与える自己相関関数(例えばR(
NT))を検出し、判断回路32に伝達する。判断回路
32は、伝達された自己相関関数R(NT)を予め定め
られた閾値R8と比較し、条件R(NT)≧R0が成立
すれば有声音、条件R(NT)<ROが設立すれば無声
音と判定する。
有声音と判定した場合には、判断回路32はNTをピッ
チとし、区間(i=1乃至N)を積分区間としてフーリ
エ変換回路4に伝達する。また判別の結果無声音と判定
した場合にはやはり始点を1標本化周期だけ遅延させた
予め定められた時間長を積分区間としてフーリエ変換回
路4に伝達する。
チとし、区間(i=1乃至N)を積分区間としてフーリ
エ変換回路4に伝達する。また判別の結果無声音と判定
した場合にはやはり始点を1標本化周期だけ遅延させた
予め定められた時間長を積分区間としてフーリエ変換回
路4に伝達する。
フーリエ変換回路4は、自己相関関数生成回路2゛から
伝達された自己相関関数R(iT)に対し、公知の方法
でフーリエ変換を施してパワースペクトルS (kω。
伝達された自己相関関数R(iT)に対し、公知の方法
でフーリエ変換を施してパワースペクトルS (kω。
)を算出し、出力端子5から出力す・ る。
以上の説明から明らかな如く、本実施例によれば、フー
リエ変換回路4は1標本化周期だけ遅延させた積分区間
(i=1乃至N)に就きフーリエ変換を行う為、分析対
象信号に混入する白色雑音の雑音パワースペクトル5n
(kω。)を含まぬ音声パワースペクトル5v(kω。
リエ変換回路4は1標本化周期だけ遅延させた積分区間
(i=1乃至N)に就きフーリエ変換を行う為、分析対
象信号に混入する白色雑音の雑音パワースペクトル5n
(kω。)を含まぬ音声パワースペクトル5v(kω。
)のみを抽出することが可能となる。
なお、図面はあく迄本発明の一実施例に過ぎず、例えば
ピッチ検出回路3は自己相関関数生成回路2から伝達さ
れる自己相関関数R(iT)からピッチT0を抽出する
ものに限定されることば無く、分析対象信号から抽出す
ることも考慮されるが、かかる場合にも本発明の効果は
変わらない。またピッチ検出回路3はフーリエ変換回路
4に伝達する積分区間を1標本化周期だけ遅延されるも
のに限定されることは無く、2以上の任意標本化周期だ
け遅延されることも考慮されるが、何れの場合にも本発
明の効果は変わらない。また有声音の積分区間は1ピツ
チT0に設定するものに限定されることば無く、1ピツ
千T0の整数倍に設定することも考慮されるが、かかる
場合にも本発明の効果は変わらない。更に適当な窓関数
を用いることにより、積分区間は1ピッチT0或いはそ
の整数倍に正確に一致させる必要も無い。
ピッチ検出回路3は自己相関関数生成回路2から伝達さ
れる自己相関関数R(iT)からピッチT0を抽出する
ものに限定されることば無く、分析対象信号から抽出す
ることも考慮されるが、かかる場合にも本発明の効果は
変わらない。またピッチ検出回路3はフーリエ変換回路
4に伝達する積分区間を1標本化周期だけ遅延されるも
のに限定されることは無く、2以上の任意標本化周期だ
け遅延されることも考慮されるが、何れの場合にも本発
明の効果は変わらない。また有声音の積分区間は1ピツ
チT0に設定するものに限定されることば無く、1ピツ
千T0の整数倍に設定することも考慮されるが、かかる
場合にも本発明の効果は変わらない。更に適当な窓関数
を用いることにより、積分区間は1ピッチT0或いはそ
の整数倍に正確に一致させる必要も無い。
以上、本発明によれば、前記音声分析システムにおいて
、音声に白色雑音が重畳する分析対象信号から白色雑音
の影響を被ること無く音声のパワースペクトルが抽出可
能となり、音声分析の精度が向上する。
、音声に白色雑音が重畳する分析対象信号から白色雑音
の影響を被ること無く音声のパワースペクトルが抽出可
能となり、音声分析の精度が向上する。
図面は本発明の一実施例によるパワースペクトル抽出方
式を示す図である。 図において、1は入力端子、2は自己相関関数生成回路
、3はピッチ検出回路、4はフーリエ変換回路、5は出
力端子、を示す。
式を示す図である。 図において、1は入力端子、2は自己相関関数生成回路
、3はピッチ検出回路、4はフーリエ変換回路、5は出
力端子、を示す。
Claims (1)
- 自己相関関数のフーリエ変換により音声のパワースペク
トルを抽出する音声分析システムにおいて、分析対象信
号から自己相関関数R(iT)を算出する第一の手段と
、前記分析対象信号或いは前記第一の手段より得た自己
相関関数からピッチを求める第二の手段と、該第二の手
段が所定時間以内にピッチの抽出に成功した場合には該
ピッチまたはその整数倍に設定した時間長を、該第二の
手段がピッチの抽出に不成功の場合には予め定められた
時間長をそれぞれ積分区間とし、前記第一の手段より得
た自己相関関数R(iT)の内i=0以外の自己相関関
数を対象にフーリエ変換を行う第三の手段とを設けるこ
とにより、前記分析対象信号に混入する白色雑音のパワ
ースペクトルを除去したパワースペクトルを抽出するこ
とを特徴とするパワースペクトル抽出方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59211711A JPS6190200A (ja) | 1984-10-09 | 1984-10-09 | パワ−スペクトル抽出方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59211711A JPS6190200A (ja) | 1984-10-09 | 1984-10-09 | パワ−スペクトル抽出方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS6190200A true JPS6190200A (ja) | 1986-05-08 |
Family
ID=16610329
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59211711A Pending JPS6190200A (ja) | 1984-10-09 | 1984-10-09 | パワ−スペクトル抽出方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6190200A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6341982A (ja) * | 1986-08-08 | 1988-02-23 | Graphtec Corp | 高速フ−リエ変換器 |
| JPH0487736U (ja) * | 1990-12-14 | 1992-07-30 | ||
| JP2007534955A (ja) * | 2004-04-27 | 2007-11-29 | サントル ナスィオナル デ ラ ルシェルシェ スィアンティフィーク | 自己相関関数を決定する方法 |
-
1984
- 1984-10-09 JP JP59211711A patent/JPS6190200A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6341982A (ja) * | 1986-08-08 | 1988-02-23 | Graphtec Corp | 高速フ−リエ変換器 |
| JPH0487736U (ja) * | 1990-12-14 | 1992-07-30 | ||
| JP2007534955A (ja) * | 2004-04-27 | 2007-11-29 | サントル ナスィオナル デ ラ ルシェルシェ スィアンティフィーク | 自己相関関数を決定する方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4559602A (en) | Signal processing and synthesizing method and apparatus | |
| US4283601A (en) | Preprocessing method and device for speech recognition device | |
| CA1061906A (en) | Speech signal fundamental period extractor | |
| CN113658599A (zh) | 基于语音识别的会议记录生成方法、装置、设备及介质 | |
| CN111883154B (zh) | 回声消除方法及装置、计算机可读的存储介质、电子装置 | |
| CN112767950A (zh) | 一种声纹识别方法、装置及计算机可读存储介质 | |
| Srinivas et al. | Combining phase-based features for replay spoof detection system | |
| Bellur et al. | A novel application of group delay function for identifying tonic in Carnatic music | |
| JPS6190200A (ja) | パワ−スペクトル抽出方式 | |
| EP1293961B1 (en) | A signal processing method to analyse transients of a speech signal | |
| Leutnant et al. | A new observation model in the logarithmic mel power spectral domain for the automatic recognition of noisy reverberant speech | |
| CN115359800B (zh) | 发动机型号检测方法和装置、电子设备、存储介质 | |
| Kodukula | Significance of excitation source information for speech analysis | |
| Rahman et al. | Formant frequency estimation of high-pitched speech by homomorphic prediction | |
| Andrews et al. | Robust pitch determination via SVD based cepstral methods | |
| Sharma et al. | Emotion Recognition based on audio signal using GFCC Extraction and BPNN Classification | |
| KR100766170B1 (ko) | 다중 레벨 양자화를 이용한 음악 요약 장치 및 방법 | |
| Patole et al. | Acoustic environment identification using blind de-reverberation | |
| JPS6132100A (ja) | パワ−スペクトル抽出方式 | |
| Goto et al. | Analysis of individual characteristics in vowel spectral envelopes | |
| JPS59228300A (ja) | 音声区間検出方式 | |
| Franklin | A time series model for the stochastic process associated with acoustic measurement systems. | |
| JPS6255799B2 (ja) | ||
| Hossain et al. | Frequency component grouping based sound source extraction from mixed audio signals using spectral analysis | |
| JPS60167000A (ja) | ピツチ抽出器 |