JPS5876891A - 音声ピツチ抽出方法 - Google Patents
音声ピツチ抽出方法Info
- Publication number
- JPS5876891A JPS5876891A JP17306081A JP17306081A JPS5876891A JP S5876891 A JPS5876891 A JP S5876891A JP 17306081 A JP17306081 A JP 17306081A JP 17306081 A JP17306081 A JP 17306081A JP S5876891 A JPS5876891 A JP S5876891A
- Authority
- JP
- Japan
- Prior art keywords
- correlation
- pitch
- frequency
- waveform
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Working-Up Tar And Pitch (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Battery Electrode And Active Subsutance (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本*vAは、f%波形から有声/−声の判定を行い、有
声音区間と判定されたときは、そのピッチ局lAメるi
はその逆数として定義されるピッチ周波数を抽出決定す
る方法の改良に関するものである。とくに信号処理グロ
セサーのような、データメモリの少なり装置でのピッチ
抽出方法の改良に関す4ものである。
声音区間と判定されたときは、そのピッチ局lAメるi
はその逆数として定義されるピッチ周波数を抽出決定す
る方法の改良に関するものである。とくに信号処理グロ
セサーのような、データメモリの少なり装置でのピッチ
抽出方法の改良に関す4ものである。
音声波形からその周iIA注と周期、ナなわらピッチを
検出する方法としては多くの方法が提案され実施されて
iるが原理的に次のように分類される。
検出する方法としては多くの方法が提案され実施されて
iるが原理的に次のように分類される。
l) 波形の相関によるもの(相関法)2)波形の差に
よるもの(MDI?法)これらのも堰を行う面に周期性
を強調する処理とし七%臓形予測分析による残差波形化
、線形もしくは非線形クリッピングによる低ビツト極性
強調化、などが施されることが多い。
よるもの(MDI?法)これらのも堰を行う面に周期性
を強調する処理とし七%臓形予測分析による残差波形化
、線形もしくは非線形クリッピングによる低ビツト極性
強調化、などが施されることが多い。
いずれの方法によっても、ピッチ周lA分をカバーする
波形もしくは相関値を記憶しておくことが必要であり、
<のため多くのデータメモリ(R,AM)を必要とする
。たとえば、男、ズの声を区別せずにピッチ周期を抽出
したいとなると、男声の最低ピッチ50Hzから女性の
最高ピッチ500Hzまでをカバーしなければならず、
波形のサンプリング周波数を8 k f(zとすれば、
周期検出のために必要なメモリ量は、 8X10”15G−8X10”1500=160−16
=144すなわら、最低144g必要となる。
波形もしくは相関値を記憶しておくことが必要であり、
<のため多くのデータメモリ(R,AM)を必要とする
。たとえば、男、ズの声を区別せずにピッチ周期を抽出
したいとなると、男声の最低ピッチ50Hzから女性の
最高ピッチ500Hzまでをカバーしなければならず、
波形のサンプリング周波数を8 k f(zとすれば、
周期検出のために必要なメモリ量は、 8X10”15G−8X10”1500=160−16
=144すなわら、最低144g必要となる。
こnは、信号処理プロセサーのように、データメモリが
比較的少ないハードウェアVζよって音声波形を分析す
る場合、大きな制約となる。
比較的少ないハードウェアVζよって音声波形を分析す
る場合、大きな制約となる。
これを肩決する方法として、音声信号の周期(ピッチ)
は500H2以下の低周波数で必ることを利用して、第
1図に示すように、音声波形を低域p波器11により低
域成分(たとえば1k)12以下)のみをとりだし、そ
の出力をBkHzより低い周波数(九とえば2kl(Z
)を有するクロックで掛算器12によりリサンプリング
レ、その出力の相関値を相関演算613 Kより計算し
て周期性を検出する。この結果、サングリイブ周波数が
1/4となっているから、メモリ量も前記144語の1
/4、ナなわら36語でよいことになるが、このままで
は周期検出の精度かもとの1/4に劣化しているので、
相関のピーク値の真の存在位置をピーク位置推定演算器
1゛4により推定して求める。この演算a14による推
定演算は第2図に示すように、リサンプリング相関出力
のピーク1直Aoを与える点101前後3点(r−1,
τ、τ十l)の値を直りC2次1ftl線で推定する演
算でおる(特願昭55−158299号参照)。
は500H2以下の低周波数で必ることを利用して、第
1図に示すように、音声波形を低域p波器11により低
域成分(たとえば1k)12以下)のみをとりだし、そ
の出力をBkHzより低い周波数(九とえば2kl(Z
)を有するクロックで掛算器12によりリサンプリング
レ、その出力の相関値を相関演算613 Kより計算し
て周期性を検出する。この結果、サングリイブ周波数が
1/4となっているから、メモリ量も前記144語の1
/4、ナなわら36語でよいことになるが、このままで
は周期検出の精度かもとの1/4に劣化しているので、
相関のピーク値の真の存在位置をピーク位置推定演算器
1゛4により推定して求める。この演算a14による推
定演算は第2図に示すように、リサンプリング相関出力
のピーク1直Aoを与える点101前後3点(r−1,
τ、τ十l)の値を直りC2次1ftl線で推定する演
算でおる(特願昭55−158299号参照)。
上記従来手法によって、多数の音声データを分析し、ピ
ッチ抽出を行った結果、必ずしも十分ではなく、抽出結
果にまま誤りがめることがS認された。本発明は、この
誤りの原因をとり除き、より確実でη頼のおけるピッチ
抽出方法を提供することを目的とする。
ッチ抽出を行った結果、必ずしも十分ではなく、抽出結
果にまま誤りがめることがS認された。本発明は、この
誤りの原因をとり除き、より確実でη頼のおけるピッチ
抽出方法を提供することを目的とする。
上記従来手法の誤りの主原因は、低域P波によって高周
波鵠のホルマント構造を除去し、ピッチ抽出の誤りの原
因を除去できたと考え、低域F波出力の相関から直接ピ
ッチ周期を検出しようとしたことにある。たしかに低域
−波によって高次のホルマント(声とえば第2ホルマン
ト以上)は除くことができるが、低次の、ことに第1ホ
ルマ/トを除くことはできない。第1ホルマントは20
0H2〜1,0001−IZの間に伴伍しており、その
形番を低域P波のみによっては除去することはできない
O そこで不発明ではまず低域p波出力が第1ホルマント1
個の与をきひものと仮足し、この低域p波出力に3〜4
次の線形予測分析を行ってホルマントの逆フィルタtS
成し、低域P波出力をこの逆フィルタに通すことによっ
て残差化し、残差相関からピッチt−抽出するようにし
九点に特微力;おる。
波鵠のホルマント構造を除去し、ピッチ抽出の誤りの原
因を除去できたと考え、低域F波出力の相関から直接ピ
ッチ周期を検出しようとしたことにある。たしかに低域
−波によって高次のホルマント(声とえば第2ホルマン
ト以上)は除くことができるが、低次の、ことに第1ホ
ルマ/トを除くことはできない。第1ホルマントは20
0H2〜1,0001−IZの間に伴伍しており、その
形番を低域P波のみによっては除去することはできない
O そこで不発明ではまず低域p波出力が第1ホルマント1
個の与をきひものと仮足し、この低域p波出力に3〜4
次の線形予測分析を行ってホルマントの逆フィルタtS
成し、低域P波出力をこの逆フィルタに通すことによっ
て残差化し、残差相関からピッチt−抽出するようにし
九点に特微力;おる。
不方法によれば、低域P波出力(低次のffJ!琳な線
形予測分析を行うて残差化することによって。
形予測分析を行うて残差化することによって。
第1ホルマントの影響を取り除き、確実なピッチ抽出が
可能となる。
可能となる。
欠に低サンプリング周波数によるピッチ抽出精度の劣化
に対しては、@記従来手法による真のピーク値の補關処
理金そのま\適用したのでは722ピーク慣出のエラー
かめるから本発明では、まず相関波形を内挿演gvcよ
りて相関し、その相関され足相関波形のピークを検出す
ることによってピッチを検出する改良法t−f!に案す
るものである。本改良法の処理のIJK理を43図に示
す。
に対しては、@記従来手法による真のピーク値の補關処
理金そのま\適用したのでは722ピーク慣出のエラー
かめるから本発明では、まず相関波形を内挿演gvcよ
りて相関し、その相関され足相関波形のピークを検出す
ることによってピッチを検出する改良法t−f!に案す
るものである。本改良法の処理のIJK理を43図に示
す。
41図の4律と同様に低域Fa、器11の出力を掛算器
12により所定のクロックでリサンプリングした後、リ
サンプリング信号を低次線形予111分析器32を通し
て逆フィルタ331/cより残差波形34を抽出する。
12により所定のクロックでリサンプリングした後、リ
サンプリング信号を低次線形予111分析器32を通し
て逆フィルタ331/cより残差波形34を抽出する。
相関演、i1.器13<より残差波形34の411関波
形35をit算してこnを相関波形内挿補ri4器36
に入力し、内挿補間さnfc相関波形37よりピーク位
置推定演算器14によってピッチ38を抽出する。
形35をit算してこnを相関波形内挿補ri4器36
に入力し、内挿補間さnfc相関波形37よりピーク位
置推定演算器14によってピッチ38を抽出する。
以ド、不発明を実施例を参照して詳細に説明する。s4
図は本発明の方法VCよるピッチ抽出装置の実施例のブ
ロック図を示す。
図は本発明の方法VCよるピッチ抽出装置の実施例のブ
ロック図を示す。
音声波形lは低域p波器2によって、たとえば1kHz
以Fに低域P波さn、その出力3は%掛でリサンプリン
グさnる。こ\ではd声涙形1がすでにサンプリングさ
れている離数的な信号であると考えたので、これをリサ
ンプリングとd′)′fcが、低域P波出力3までがf
ナログ的に処理されているとすれば、これをサンプリン
グと言う。
以Fに低域P波さn、その出力3は%掛でリサンプリン
グさnる。こ\ではd声涙形1がすでにサンプリングさ
れている離数的な信号であると考えたので、これをリサ
ンプリングとd′)′fcが、低域P波出力3までがf
ナログ的に処理されているとすれば、これをサンプリン
グと言う。
リサンプリング出力6から、相関演算器7によってめる
区間(フレーム区間とい\、通常20〜30ミリ秒にと
る)にわたっての相関出力11(vt)、i=Q〜θ1
.8が計算さCる。θ、、8は、検出rべき最長ピッチ
周期τ1.8と、次段の線形予測分析の次apとから0
m a x ” rm * x +pとして求められる
。
区間(フレーム区間とい\、通常20〜30ミリ秒にと
る)にわたっての相関出力11(vt)、i=Q〜θ1
.8が計算さCる。θ、、8は、検出rべき最長ピッチ
周期τ1.8と、次段の線形予測分析の次apとから0
m a x ” rm * x +pとして求められる
。
九とえば、τ、、、=40. p=3のとき、θwag
=40+3=43で6−る。
=40+3=43で6−る。
この相関出力8のうちで低次OO欠より2次までの成分
(vtl r ’ =0〜pから、低次線形予−1j分
析器9によって2次の線形予測分析が行わn、d形予測
係数(αl ) l ’ ” U ””’pが求めらル
、この(α量)から逆スペクトル係畝10c(AIL
1=0111・・・p」が求められる。
(vtl r ’ =0〜pから、低次線形予−1j分
析器9によって2次の線形予測分析が行わn、d形予測
係数(αl ) l ’ ” U ””’pが求めらル
、この(α量)から逆スペクトル係畝10c(AIL
1=0111・・・p」が求められる。
(V、)から(α−)を求める方法は、すでに線形予測
分析手法として公知でろり、原理的には次の線形p元1
次方程式を解くことに帰着する。
分析手法として公知でろり、原理的には次の線形p元1
次方程式を解くことに帰着する。
次ソし、α、=1
p=3 (3次分析)のときは
を屏けばよい。
(α+ l + ’ =0−pが求まると、その系列の
相関係数として逆スペクトル係数(Atlが矢のように
して求められる(p=3の場合)。
相関係数として逆スペクトル係数(Atlが矢のように
して求められる(p=3の場合)。
人。=1+α1+α!十α3
AH=a1+”1(Xz+”l ”s
A、 =α、十α1α。
A、=α。
逆スペクトル係a10((A+)、i=0〜pJ と入
力波形の相yA係畝11(tV口、i=0〜θmax3
カsJ こ\で、1=AJ、 ■−1:V、とする。
力波形の相yA係畝11(tV口、i=0〜θmax3
カsJ こ\で、1=AJ、 ■−1:V、とする。
この相関波形13は時間軸のサンプリングが0、5 ミ
IJ秒間p4 (2k )(zサンプリングに対応)と
祖くなりておシ、このままピーク1直を検出−rると、
ピッチ周波数との関係で誤りとなることがめる。
IJ秒間p4 (2k )(zサンプリングに対応)と
祖くなりておシ、このままピーク1直を検出−rると、
ピッチ周波数との関係で誤りとなることがめる。
そこで、残差相関波形13を、内挿補間演算器14Ic
よって、たとえば4倍精度(もとの信号の9 k l(
zサンプリングに対応)で補間じ、補間された相関波形
15から、ピーク検出器16によってそのピーク位置′
fr:検出し、そのンくれ時間かりピッチ周期ま几はそ
の逆数としCピッチ周波数を検出する。
よって、たとえば4倍精度(もとの信号の9 k l(
zサンプリングに対応)で補間じ、補間された相関波形
15から、ピーク検出器16によってそのピーク位置′
fr:検出し、そのンくれ時間かりピッチ周期ま几はそ
の逆数としCピッチ周波数を検出する。
なお内挿補間演算器14で行う゛べき演算は次のような
ものでめる。
ものでめる。
ナングリング定理にもとづく内挿公式によればである。
したがってtとして、1/4T、1/2’r 。
3/4 ’i’をとり、3点内挿しc8kl(Zサンプ
リングに補間する。nとしては4程度とればよく、上式
から係数′にめらかしめ計算して&さ1前後9点(過去
5点、−未来4点)〃島ら内挿演算すnばよい。
リングに補間する。nとしては4程度とればよく、上式
から係数′にめらかしめ計算して&さ1前後9点(過去
5点、−未来4点)〃島ら内挿演算すnばよい。
本発明を用いてピッチ抽出金おこなった結果の一列を第
5図に示す。第5図(a)は男声、第5図(C)は女声
にンける本発明の原理による低域残差相関波形で少り、
■で示す正しい位置(原波形から人間が祝祭にLって求
めた直との比砿による)にご第5図(b)と第5図(d
)はぞれぞへ第5図(C)に対応する4盆の低域P波出
力の直接の相関波形であり、ホルマント周波数の影響は
明らかで6L%の位置に誤ったピークが検出されている
(男声の揚曾、倍ピツチ、女声の場曾、半ピツチである
)。
5図に示す。第5図(a)は男声、第5図(C)は女声
にンける本発明の原理による低域残差相関波形で少り、
■で示す正しい位置(原波形から人間が祝祭にLって求
めた直との比砿による)にご第5図(b)と第5図(d
)はぞれぞへ第5図(C)に対応する4盆の低域P波出
力の直接の相関波形であり、ホルマント周波数の影響は
明らかで6L%の位置に誤ったピークが検出されている
(男声の揚曾、倍ピツチ、女声の場曾、半ピツチである
)。
以上説明し九ととく本@明によれば、少ないデータメモ
リ量で正確で信頼度の高いピッチ抽出を実現することが
できる。その−例を第5図に示す。
リ量で正確で信頼度の高いピッチ抽出を実現することが
できる。その−例を第5図に示す。
第1図は従来の方法によるピッチ抽出装置のブロック図
、第2図は相関波形のピーク値とその位置を推定する原
理t−説明する図、第3図は本#3明の方法によるピッ
チ抽出装置の原理図、第4図は本発明の一実施例のブロ
ック図、第5図は本発明によりピッチ抽出を2こなった
結果の一例を示す図である。 14・・・ピーク位11!定演算器。 代理人 弁理士 薄田利幸。 眉 j 図 +Z 第2図
、第2図は相関波形のピーク値とその位置を推定する原
理t−説明する図、第3図は本#3明の方法によるピッ
チ抽出装置の原理図、第4図は本発明の一実施例のブロ
ック図、第5図は本発明によりピッチ抽出を2こなった
結果の一例を示す図である。 14・・・ピーク位11!定演算器。 代理人 弁理士 薄田利幸。 眉 j 図 +Z 第2図
Claims (1)
- 低域P波された音声波形を所定の周波数でサンプリング
し、サンプリング値の相関を11−真し、相関のピーク
位置の推定+1から音声ピッチを求める音声ピッチ抽出
方法において、低域PtILされた音声波形にたいして
低次の線形予測′分析をおこない残差波形化し、1g*
残差波形よ9式21相関を計算し、該残差相関にたいし
て内挿補間演算をお1こな9、補間さrt九残差相関の
ピーク値からピッチ周期を求めることを4#憾とする音
声ピッチ抽出方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP17306081A JPS5876891A (ja) | 1981-10-30 | 1981-10-30 | 音声ピツチ抽出方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP17306081A JPS5876891A (ja) | 1981-10-30 | 1981-10-30 | 音声ピツチ抽出方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS5876891A true JPS5876891A (ja) | 1983-05-10 |
Family
ID=15953466
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP17306081A Pending JPS5876891A (ja) | 1981-10-30 | 1981-10-30 | 音声ピツチ抽出方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5876891A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60194499A (ja) * | 1984-02-22 | 1985-10-02 | エヌ・ベー・フイリツプス・フルーイランペンフアブリケン | 音声分析方式 |
| JPS62203199A (ja) * | 1986-03-03 | 1987-09-07 | 富士通株式会社 | ピツチ周期抽出方式 |
| JP2013238894A (ja) * | 1999-04-19 | 2013-11-28 | At & T Corp | フレーム消去隠蔽を実行するための装置 |
-
1981
- 1981-10-30 JP JP17306081A patent/JPS5876891A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60194499A (ja) * | 1984-02-22 | 1985-10-02 | エヌ・ベー・フイリツプス・フルーイランペンフアブリケン | 音声分析方式 |
| JPS62203199A (ja) * | 1986-03-03 | 1987-09-07 | 富士通株式会社 | ピツチ周期抽出方式 |
| JP2013238894A (ja) * | 1999-04-19 | 2013-11-28 | At & T Corp | フレーム消去隠蔽を実行するための装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Yegnanarayana et al. | Extraction of vocal-tract system characteristics from speech signals | |
| JP4566493B2 (ja) | 信号分析方法及び装置 | |
| KR100365300B1 (ko) | 스펙트럼감산잡음억제방법 | |
| EP1309964B1 (en) | Fast frequency-domain pitch estimation | |
| US7272551B2 (en) | Computational effectiveness enhancement of frequency domain pitch estimators | |
| EP2249333B1 (en) | Method and apparatus for estimating a fundamental frequency of a speech signal | |
| JPS5850360B2 (ja) | 音声認識装置における前処理方法 | |
| EP1944754B1 (en) | Speech fundamental frequency estimator and method for estimating a speech fundamental frequency | |
| US7957964B2 (en) | Apparatus and methods for noise suppression in sound signals | |
| KR100724736B1 (ko) | 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치 | |
| JP5325130B2 (ja) | Lpc分析装置、lpc分析方法、音声分析合成装置、音声分析合成方法及びプログラム | |
| CN113763930B (zh) | 语音分析方法、装置、电子设备以及计算机可读存储介质 | |
| JPS5876891A (ja) | 音声ピツチ抽出方法 | |
| JP2001222289A (ja) | 音響信号分析方法及び装置並びに音声信号処理方法及び装置 | |
| Chang et al. | Pitch estimation of speech signal based on adaptive lattice notch filter | |
| Chowdhury et al. | Formant estimation from speech signal using the magnitude spectrum modified with group delay spectrum | |
| JPH04288600A (ja) | ピッチ周波数差分特徴量抽出法 | |
| JP7461192B2 (ja) | 基本周波数推定装置、アクティブノイズコントロール装置、基本周波数の推定方法及び基本周波数の推定プログラム | |
| US11004463B2 (en) | Speech processing method, apparatus, and non-transitory computer-readable storage medium for storing a computer program for pitch frequency detection based upon a learned value | |
| JP2898637B2 (ja) | 音声信号分析方法 | |
| KR100211965B1 (ko) | 유성음 구간에서 피치동기식 포먼트 추정방법 | |
| Dasgupta et al. | Detection of Glottal Excitation Epochs in Speech Signal Using Hilbert Envelope. | |
| JP2880683B2 (ja) | 雑音抑制装置 | |
| JPH01315797A (ja) | ピッチ抽出装置 | |
| JPS5936279B2 (ja) | 音声分析処理方式 |