JPH0344318B2 - - Google Patents
Info
- Publication number
- JPH0344318B2 JPH0344318B2 JP58208526A JP20852683A JPH0344318B2 JP H0344318 B2 JPH0344318 B2 JP H0344318B2 JP 58208526 A JP58208526 A JP 58208526A JP 20852683 A JP20852683 A JP 20852683A JP H0344318 B2 JPH0344318 B2 JP H0344318B2
- Authority
- JP
- Japan
- Prior art keywords
- τmin
- τmax
- pitch
- calculation
- waveform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 8
- 238000005314 correlation function Methods 0.000 claims description 7
- 239000011295 pitch Substances 0.000 description 18
- 238000000034 method Methods 0.000 description 11
- 208000019300 CLIPPERS Diseases 0.000 description 8
- 208000021930 chronic lymphocytic inflammation with pontine perivascular enhancement responsive to steroids Diseases 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Working-Up Tar And Pitch (AREA)
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、音声分析合成系における重要な基本
パラメータの1つである音声のピツチ周期を抽出
する方法に関する。
パラメータの1つである音声のピツチ周期を抽出
する方法に関する。
従来例の構成とその問題点
音声分析合成系は、音声波形を人間の発声機構
のシミユレーシヨンに基づき種々のパラメーター
を抽出し、そのパラメーターを伝送する事により
情報量の圧縮をはかるものであるが、特にその中
でも音帯の振動に対応した音声の基本周波数成分
であるピツチパラメーターの抽出は、自己相関関
数による方法が提案されており、この方法は演算
処理量が多いため、実時間でピツチ抽出を行なう
ためには、高速な演算回路およびメモリを必要と
した。
のシミユレーシヨンに基づき種々のパラメーター
を抽出し、そのパラメーターを伝送する事により
情報量の圧縮をはかるものであるが、特にその中
でも音帯の振動に対応した音声の基本周波数成分
であるピツチパラメーターの抽出は、自己相関関
数による方法が提案されており、この方法は演算
処理量が多いため、実時間でピツチ抽出を行なう
ためには、高速な演算回路およびメモリを必要と
した。
特に、第1図に示す構成のように、音声波形y
(n)にクリツパ演算装置1によりクリツパ演算
を施して得られた波形y1(n)と、しきい値演算
装置2により−1、0、+1に3値化した波形y2
(n)とをバツフアメモリ3に蓄積し、y1(n)と
y2(n)との相互相関関数を次式 (τ)= 〓n 〓Ly1(n−τ)y2(n) ……(1) 又は (τ)= 〓n 〓Ly1(n)y2(n−τ) ……(2) 〔但し、Lはフレームの全領域 τ≧0 のうちのいずれかにより、相関器4を用いて求
め、(τ)の最大値を与えるτを最大値位置検
出装置5で求めてピツチ周期Pを得る方法は、y2
(n)が3値化されているため相関演算の過程に
よる乗算演算が不要となるため、計算時間の点で
有利な方法である。
(n)にクリツパ演算装置1によりクリツパ演算
を施して得られた波形y1(n)と、しきい値演算
装置2により−1、0、+1に3値化した波形y2
(n)とをバツフアメモリ3に蓄積し、y1(n)と
y2(n)との相互相関関数を次式 (τ)= 〓n 〓Ly1(n−τ)y2(n) ……(1) 又は (τ)= 〓n 〓Ly1(n)y2(n−τ) ……(2) 〔但し、Lはフレームの全領域 τ≧0 のうちのいずれかにより、相関器4を用いて求
め、(τ)の最大値を与えるτを最大値位置検
出装置5で求めてピツチ周期Pを得る方法は、y2
(n)が3値化されているため相関演算の過程に
よる乗算演算が不要となるため、計算時間の点で
有利な方法である。
しかしながら、この方法においても、バツフア
メモリ3の内容を用いて、相関器4によつて、例
えば、10KHzサンプリングされた30mSの音声デ
ータ300個(N=300)から、相関値τmin=20
(500Hz)からτmin=200(50Hz)までの値を計算
するためには、第2図のフロー・チヤートによる
計算方法を用いると、y2のメモリ読み出し回数
は、34200回、更に300個のy2の値の内、240個が
0の値として、y1のメモリ読み出し回数は、6800
回、合わせて41000回メモリ3を読み出さなけれ
ばならない。ピツチ抽出を実時間で処理するため
には、30mSの間に処理を完了しなげればならな
いため、1回のメモリ読み出しは、732nS以内で
なければならず、相関器4を低コスト化のために
マイクロコンピユータレベルで実現しようとして
も、マイクロコンピユータの1データのメモリ読
み出し時間は、高速なもので1μS〜2μS程度なの
で実現は不可能である。
メモリ3の内容を用いて、相関器4によつて、例
えば、10KHzサンプリングされた30mSの音声デ
ータ300個(N=300)から、相関値τmin=20
(500Hz)からτmin=200(50Hz)までの値を計算
するためには、第2図のフロー・チヤートによる
計算方法を用いると、y2のメモリ読み出し回数
は、34200回、更に300個のy2の値の内、240個が
0の値として、y1のメモリ読み出し回数は、6800
回、合わせて41000回メモリ3を読み出さなけれ
ばならない。ピツチ抽出を実時間で処理するため
には、30mSの間に処理を完了しなげればならな
いため、1回のメモリ読み出しは、732nS以内で
なければならず、相関器4を低コスト化のために
マイクロコンピユータレベルで実現しようとして
も、マイクロコンピユータの1データのメモリ読
み出し時間は、高速なもので1μS〜2μS程度なの
で実現は不可能である。
発明の目的
本発明は、音声波形y(n)を非線形演算して
変換をほどこし、その相関関数からピツチを抽出
する際に少ないメモリ容量と、少ない演算回数で
ピツチ抽出を可能にするピツチ抽出方法を提供す
るものである。
変換をほどこし、その相関関数からピツチを抽出
する際に少ないメモリ容量と、少ない演算回数で
ピツチ抽出を可能にするピツチ抽出方法を提供す
るものである。
発明の構成
本発明は、音声波形y(n)より、しきい値CL
を越えるy(n)のnの集合Y1と、しきい値−CL
より小さいy(m)の−mの集合Y2(n、mはサ
ンプルナンバー)Y2を求め、音声波形y(n)の
クリツパ演算y1(n)とY1とY2より相関演算を行
ない、この相関関数の最大値をピツチとするピツ
チ抽出方法である。
を越えるy(n)のnの集合Y1と、しきい値−CL
より小さいy(m)の−mの集合Y2(n、mはサ
ンプルナンバー)Y2を求め、音声波形y(n)の
クリツパ演算y1(n)とY1とY2より相関演算を行
ない、この相関関数の最大値をピツチとするピツ
チ抽出方法である。
実施例の説明
以下、本発明の実施例を図面を用いて説明す
る。第3図において音声波形y(n)を(3)式に基
づきクリツパ演算装置11により、クリツパ演算
を施し、クリツパ波形y1(n)をバツフアメモリ
14に書き込むと同時に、y(n)を(4)式に基づ
き、しきい値演算装置12により、−1、0、1
の3値化波形y2(n)を得、データ・セレクタ1
3へ入力する。
る。第3図において音声波形y(n)を(3)式に基
づきクリツパ演算装置11により、クリツパ演算
を施し、クリツパ波形y1(n)をバツフアメモリ
14に書き込むと同時に、y(n)を(4)式に基づ
き、しきい値演算装置12により、−1、0、1
の3値化波形y2(n)を得、データ・セレクタ1
3へ入力する。
y1(n)=y(n)−CL
=0
=y(n)+CL
y(n)≧CL
|y(n)|<CL
y(n)≦−CL (3)
y2(n)=1
=0
=−1
y(n)≧CL
|y(n)|<CL
y(n)≦−CL (4)
データ・セレクタ13では、y(n)における
数値nが入力され、y2(n)=1の時は(5)式Y1に
基づきnを、y2(n)=−1の時は(5)式Y2に基づ
き−mを出力し、バツフア・メモリ14に書き込
み、y2(n)=0の時は、バツフア・メモリには書
き込まない。
数値nが入力され、y2(n)=1の時は(5)式Y1に
基づきnを、y2(n)=−1の時は(5)式Y2に基づ
き−mを出力し、バツフア・メモリ14に書き込
み、y2(n)=0の時は、バツフア・メモリには書
き込まない。
Y1={n|y(n)≧CL}
Y2={−m|y(m)≦−CL (5)
次にバツフア・メモリ14に書き込まれたy1
(n)とY1とY2のデータを複数回読みだし、相関
器15において(6)式に基づき、第4図に示すフロ
ーに沿つて演算を行ない、相関関数(τ)を最
大値位置検出装置16に出力する。
(n)とY1とY2のデータを複数回読みだし、相関
器15において(6)式に基づき、第4図に示すフロ
ーに沿つて演算を行ない、相関関数(τ)を最
大値位置検出装置16に出力する。
(τ)=
〓n
〓Y1y1(n+τ)
−
〓n
〓Y2y1(−m+τ) ……(6)
最大値位置検出装置16では、τ=τminから
τmaxまでの最大になる(τ)maxを求め、そ
の時のτをピツチ周期Pとして出力する。
τmaxまでの最大になる(τ)maxを求め、そ
の時のτをピツチ周期Pとして出力する。
次に相関器15について、第4図のフロー・チ
ヤートを用いて説明する。第4図は、y1(τ)の
データ数がNコ、求めたいピツチの探索範囲は
τminからτmaxとして、相関関数(τ)を止め
る方法である。Y(τ)はデータ・セレクター1
3により出力されたY1とY2の値のその絶対値が
小さい順に並んでいるものである。その個数は一
定ではなく、入力の音声波形に依存する。一例と
して、第5図に音声波形「あ」を示す。分析フレ
ーム1でしきい値CL1を越えるデータの個数
(黒ぬりの部分)はフレームのデータ数の12%で
あり、フレーム2については11%(しきい値CL
2)である。一般に音声分析合成系においては、
音声を無声部分と有声部分に分け、ピツチ成分が
求めにくい無声部分ではピツチを求める必要がな
く、明らかにピツチ成分がある部分のみのピツチ
を求めればよい。このことから、第5図の例のご
とく、フレーム毎の音声波形の振巾に対応したし
きい値CLをフレーム毎に決めることにより、各
フレームでしきい値を越えるデータ数を、フレー
ムデータ数の20%以下にすることは可能である。
このことは、Y(τ)の個数がN/5以下になる。
第4図とループ1では(6)式に従がつて、ある特定
のτについての(τ)を求め、ループ2ではそ
のτをτminからτmaxまで変化させることによ
り、(τ)(τ=τmin〜τmaxを演算する。
ヤートを用いて説明する。第4図は、y1(τ)の
データ数がNコ、求めたいピツチの探索範囲は
τminからτmaxとして、相関関数(τ)を止め
る方法である。Y(τ)はデータ・セレクター1
3により出力されたY1とY2の値のその絶対値が
小さい順に並んでいるものである。その個数は一
定ではなく、入力の音声波形に依存する。一例と
して、第5図に音声波形「あ」を示す。分析フレ
ーム1でしきい値CL1を越えるデータの個数
(黒ぬりの部分)はフレームのデータ数の12%で
あり、フレーム2については11%(しきい値CL
2)である。一般に音声分析合成系においては、
音声を無声部分と有声部分に分け、ピツチ成分が
求めにくい無声部分ではピツチを求める必要がな
く、明らかにピツチ成分がある部分のみのピツチ
を求めればよい。このことから、第5図の例のご
とく、フレーム毎の音声波形の振巾に対応したし
きい値CLをフレーム毎に決めることにより、各
フレームでしきい値を越えるデータ数を、フレー
ムデータ数の20%以下にすることは可能である。
このことは、Y(τ)の個数がN/5以下になる。
第4図とループ1では(6)式に従がつて、ある特定
のτについての(τ)を求め、ループ2ではそ
のτをτminからτmaxまで変化させることによ
り、(τ)(τ=τmin〜τmaxを演算する。
ここで、従来例第1図と本発明第3図とを比較
すると、第1図はy1(n)がNコ+y2(n)がN
コ、計2Nコのメモリが入るのに反して第3図で
は、y1(n)がNコ+y(τ)がN/5、計6/
5Nコですむ。更に従来例第2図の相関演算にお
いては、ループ2を回る回数はτmax−τmin回、
ループ1を回る回数はτによつて異なるが、平均
すると(N−τmin)+(N−τmax)/2回とな
り、y2をメモリ・バツフアから読み出す全回数は
(2N−τmax−τmin)・(τmax−τmin)/2回で
あり、y1をメモリ・バツフアから読み出す全回数
は、y2(τ)≠0個数をN/5とすると(2N−
τmax−τmin)・(τmax−τmin)/10となり、全
メモリ読み出し回数は(2N−τmax−τmin)・
(τmax−τmin)・6/10である。一方、本発明第
4図の相関演算においては、ループ2を回る回数
はτmax−τmin回で従来例と同じてあるが、ルー
プ1を回る回数はτによつて同じく異なるが、Y
(τ)の個数をN/5とすると平均((N−
τmin)/5+(N−τmax)/5)/2=(2N−
τmax−τmin)/10となる。よつてこのループ1
でYとy1を1度づつ読み出すため、全メモリ読み
出し回数は(2N−τmax−τmin)・(τmax−
τmin)/5となり、従来例の1/3となる。
すると、第1図はy1(n)がNコ+y2(n)がN
コ、計2Nコのメモリが入るのに反して第3図で
は、y1(n)がNコ+y(τ)がN/5、計6/
5Nコですむ。更に従来例第2図の相関演算にお
いては、ループ2を回る回数はτmax−τmin回、
ループ1を回る回数はτによつて異なるが、平均
すると(N−τmin)+(N−τmax)/2回とな
り、y2をメモリ・バツフアから読み出す全回数は
(2N−τmax−τmin)・(τmax−τmin)/2回で
あり、y1をメモリ・バツフアから読み出す全回数
は、y2(τ)≠0個数をN/5とすると(2N−
τmax−τmin)・(τmax−τmin)/10となり、全
メモリ読み出し回数は(2N−τmax−τmin)・
(τmax−τmin)・6/10である。一方、本発明第
4図の相関演算においては、ループ2を回る回数
はτmax−τmin回で従来例と同じてあるが、ルー
プ1を回る回数はτによつて同じく異なるが、Y
(τ)の個数をN/5とすると平均((N−
τmin)/5+(N−τmax)/5)/2=(2N−
τmax−τmin)/10となる。よつてこのループ1
でYとy1を1度づつ読み出すため、全メモリ読み
出し回数は(2N−τmax−τmin)・(τmax−
τmin)/5となり、従来例の1/3となる。
発明の効果
以上のように、本発明は音声波形を複数区間に
分割して、有声区間のみにピツチ抽出を行なう際
有声区間毎に、音声波形のクリツパ演算してy1
(n)を、しきい値演算してy(n)≧CLの時はn
を、y(n)≦−CLの時は−nを、バツフア・メ
モリに書き込み、これらのデータを基に相関演算
をし、相関関数において最大振幅の位置τを求め
るピツチ抽出方法であり、この方法ではバツフ
ア・メモリが従来例の6割、相関演算におけるバ
ツフア・メモリの全読み出し回数を少なくとも1/
3以下に軽減できる。
分割して、有声区間のみにピツチ抽出を行なう際
有声区間毎に、音声波形のクリツパ演算してy1
(n)を、しきい値演算してy(n)≧CLの時はn
を、y(n)≦−CLの時は−nを、バツフア・メ
モリに書き込み、これらのデータを基に相関演算
をし、相関関数において最大振幅の位置τを求め
るピツチ抽出方法であり、この方法ではバツフ
ア・メモリが従来例の6割、相関演算におけるバ
ツフア・メモリの全読み出し回数を少なくとも1/
3以下に軽減できる。
例えば、10KHzサンプリングされた30mSの音
声データ300個(N=300)から、相関値τmin=
20(500Hz)からτmax=200(50Hz)までの値を計
算するためには、バツフア・メモリの全読み出し
回数は13667回となり、1回のメモリ読み出しは、
2.2μS以上となる。このことは、相関器15を低
コスト化のために、マイクロコンピユータで実現
できる。
声データ300個(N=300)から、相関値τmin=
20(500Hz)からτmax=200(50Hz)までの値を計
算するためには、バツフア・メモリの全読み出し
回数は13667回となり、1回のメモリ読み出しは、
2.2μS以上となる。このことは、相関器15を低
コスト化のために、マイクロコンピユータで実現
できる。
第1図は従来のピツチ抽出装置の一例を説明す
るブロツク図、第2図は従来の相関計算法を示し
たフローチヤート、第3図は本発明の一実施例に
おけるピツチ抽出方法を実現する装置のブロツク
図、第4図は同装置の要部である相関器の演算方
法を示したフローチヤート、第5図は本発明にお
ける音声波形と分析フレームおよびしきい値の関
係を示した波形図である。 1,11……クリツパ演算装置、2,12……
しきい値演算装置、3,14……バツフア・メモ
リ、4,15……相関器、5,16……最大値位
置検出装置、13……データ・セレクタ。
るブロツク図、第2図は従来の相関計算法を示し
たフローチヤート、第3図は本発明の一実施例に
おけるピツチ抽出方法を実現する装置のブロツク
図、第4図は同装置の要部である相関器の演算方
法を示したフローチヤート、第5図は本発明にお
ける音声波形と分析フレームおよびしきい値の関
係を示した波形図である。 1,11……クリツパ演算装置、2,12……
しきい値演算装置、3,14……バツフア・メモ
リ、4,15……相関器、5,16……最大値位
置検出装置、13……データ・セレクタ。
Claims (1)
- 【特許請求の範囲】 1 音声波形y(n)を複数区間に分割し、各区
間内で音声波形y(n)を次式 y1(n)=y(n)−CL =0 =y(n)+CL y(n)≧CL |y(n)|<CL y(n)≦−CL Y1={n|y(n)≧CL} Y2={−m|y(m)≦−CL} (ここに、n、mはサンプルナンバー、CLはし
きい値) に従つて非線形演算し、これらを次式 (τ)= 〓n 〓Y1y1(n+τ) − 〓n 〓Y2y1(−m+τ) に従つて相関演算を行ない、この相関関数の最大
値をピツチとして求めることを特徴とするピツチ
抽出方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58208526A JPS60100200A (ja) | 1983-11-07 | 1983-11-07 | ピッチ抽出方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58208526A JPS60100200A (ja) | 1983-11-07 | 1983-11-07 | ピッチ抽出方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS60100200A JPS60100200A (ja) | 1985-06-04 |
| JPH0344318B2 true JPH0344318B2 (ja) | 1991-07-05 |
Family
ID=16557639
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58208526A Granted JPS60100200A (ja) | 1983-11-07 | 1983-11-07 | ピッチ抽出方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS60100200A (ja) |
-
1983
- 1983-11-07 JP JP58208526A patent/JPS60100200A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS60100200A (ja) | 1985-06-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Gold et al. | Parallel processing techniques for estimating pitch periods of speech in the time domain | |
| KR940024660A (ko) | 음성인식장치 | |
| JP3402748B2 (ja) | 音声信号のピッチ周期抽出装置 | |
| CN101030374B (zh) | 基音周期提取方法及装置 | |
| KR102277952B1 (ko) | 디제이 변환에 의한 주파수 추출 방법 | |
| US4982433A (en) | Speech analysis method | |
| JPH0344318B2 (ja) | ||
| JP2005266797A (ja) | 音源信号分離装置及び方法、並びにピッチ検出装置及び方法 | |
| JPH04288600A (ja) | ピッチ周波数差分特徴量抽出法 | |
| JPH04100099A (ja) | 音声検出装置 | |
| JPS60147800A (ja) | ピツチ抽出装置 | |
| JP3019603B2 (ja) | 音声の基本周波数の抽出装置 | |
| JPH0377520B2 (ja) | ||
| JPH0318720B2 (ja) | ||
| JPS622300A (ja) | 音声ピツチ抽出装置 | |
| JPS58193597A (ja) | ピッチ抽出装置 | |
| JPS60158500A (ja) | ピツチ抽出装置 | |
| JPS5876891A (ja) | 音声ピツチ抽出方法 | |
| JPH0448239B2 (ja) | ||
| JPH0122638B2 (ja) | ||
| JPS62270000A (ja) | 音声のピツチ周波数検出方法 | |
| JPS63124100A (ja) | 基本周波数分析装置 | |
| JPS60189000A (ja) | ピツチ周期抽出装置 | |
| JPS5925238B2 (ja) | 音声分析合成方式の音声区間判定方法 | |
| JPH0311479B2 (ja) |