JPS62103700A

JPS62103700A - フオルマント型パタンマツチングボコ−ダ

Info

Publication number: JPS62103700A
Application number: JP61134569A
Authority: JP
Inventors: 哲田口
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1985-07-03
Filing date: 1986-06-09
Publication date: 1987-05-14
Anticipated expiration: 2010-04-26
Also published as: CA1277034C; CA1270568A; US4914702A; JPH0738114B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明はフォルマント情報を利用したバタンｉ、チング
を介して入力音声信号の分析および合成を行なうフォル
マント型パタ／マ、チングボコーダに関する。

〔従来の技術〕

入力音声信号を分析して抽出したスペクトル包絡に関す
る分布バタンと、−あらかじめ設定した標準的音声資料
から抽出したスペクトル包絡の分布に関する標準バタン
とを照合し、最もよくマツチングした標準パタンのバタ
ンラベルをスペクトル包絡に関する全データに代えて分
析側から合成側に音源情報とともに送出して音声の分析
、合成を行’＆’ｌ）パルツマ、チングボコーダは音声
情報圧縮伝送の有力な手法としてよく知られており、ま
たスペクトル包絡を表わす情報としては通常ＬＰＣ（Ｌ
ｉｎｅａｒ　Ｐｒｅｄｉｃｔｉｏｎ　Ｃｏｄｉｎｇ、１
１ｉ形予測符号化）係数としてのαパラメータやにパラ
メータ、もしくはこれらから誘導される徨種の係数が利
用されている。

〔発明が解決しようとする問題点〕

しかしながら従来のこの橿のパタンマツチングボコーダ
では標準バタン作成のためにトレーニング（ｔｒａｉｎ
ｉｎｇ　、登録）Ｋ利用しうる話者の数は経済的その他
多くの理由で制限され、従ってこれら限定された数の話
者によるトレーニングデータをクラスタリングしていか
なる不特定話者にも適合する標準バタンを作成すること
は極めて困難である。この仁とは、入力音声のスペクト
ル分布は話者ごとに異なり、実用上たかだか数ないし数
１０人程度の話者によるトレーニングデータにもとづい
てあらゆる不特定話者に適合しうる標準パタンの作成は
殆んど不可能であるという事実にもとづく。スペクトル
分布が話者ごとに異る個人差を有することは話者ごとに
声道特性と声帯音源特性とが異ることに起因する。これ
ら両特性のうち声道特性の話者ごとの相違は話者ごとに
声道長が異ることによって発生し声道における共振点と
してのフォルマント周波数の変動をもたらし、一方声帯
音源特性の話者ごとの相違はスペクトル包絡の概形の傾
きに影響を与える。従って不特定話者にも適合し易いパ
タンマツチングを行なうためには話者ごとに異る声道特
性と声帯音源特性とをそれぞれ伺等かの手段で正規化す
るかもしくはその影響を除去することが必要となる。し
かしながら通常のパタンマッチングボコーダではＬＰＣ
分析によって抽出したスペクトル包絡パラメータを介し
てバタンマツチングを行なっており、このＬＰＣ分析で
はもともと一様（フラット）ではない声道音源特性を一
様なものとしてスペクトル包絡パラメータを抽出するこ
とをその基本処理手法とし、話者によって異る声道特性
と７ラツトと見做した声帯音源特性とが畳み込まれた形
式でスペクトル包絡パラメータが抽出されている。

従って不特定話者にも適合し易いパタンマツチングを行
なうためには畳み込まれた声道特性と声帯音源特性とを
分離したうえ何等かの手段でそれぞれの正規化もしくは
話者依存性の除去を図ったスペクトル分布を利用すれば
よいわけでおるが、従来のパタンマ、テングボコーダは
この点を殆んど配慮していない。

本発明の目的も上述した欠点を除去し、不特定話者に対
しても適用し易いバタンマツチングが行なえる標準パタ
ンを備えたフォルマント型パタンマッチングボコーダを
提供することにある。

〔問題点を解決するための手段〕

本発明のボコーダは、入力音声信号を分析して得られる
第１および第２ならびに第３フォルマント周波数を極座
標表現することによって求まる前記フォルマント周波数
相互間の２つの関係角度情報をベクトル要素とする標準
バタンファイルｔｍえて構成される。

〔実施例〕

次に図面を参照して本発明の詳細な説明する。

第１図は本発明によるフォルマント型パタンマ。

チングボコーダの分析側の一実施例の構成を示すプロ、
り図、また第２図は本発明によるフォルマント型パタン
マッチングボコーダの合成側の一実施の構成を示すブロ
ック園である。

第１図に示す分析側１はＡ／Ｄコンバータ１０１、ピッ
チ・Ｖ／ＵＶ抽出器１０２、自己相関係数算出器１０３
、量子化器１０４、量子化器１０５、フォルマント抽出
器１０６、極座標変換器１０７、バタン照合器１０８、
量子化器１０９、標準バタンファイル１１０およびマル
チプレクサ１１１を備えて構成される。

また、第２図に示す合成側２は、デマルチプレクサ２０
１、復号化器２０２、復号化器２０３、復号化器２０４
、バタン読出器２０５、ピッチ周波数発生器２０６、雑
音発生器２０７、切替器２０８、乗算器２０９、標準バ
タンファイル２１０、直交座標変換器２１１．フォルマ
ント合成器２１２、Ｄ／Ａ：２ンバータ２１３を備えて
構成される。

第１図の分析側において、入力音声信号はＡ／Ｄコｙバ
ータｌ０ＩＫ供給されＬ　Ｐ　Ｅ　（Ｌｏｗ　Ｐａ５ｓ
Ｆｉｌｔｅｒ　）を介して不要な高域周波数成分を遮断
したのち所定のサンプリング周波数で標本化し、このあ
と所定のビット数で量子化される。本実施例にろっては
サンプリング周波数８Ｋ　Ｈｚ　１　ビ。

ト数１２ビ、トで量子化している。

量子化信号はたとえば３９ｍ５ＥＣ分ずつ、すなわち２
４０サンプル分ずつを窓時間分として一旦内部メモリに
格納され、これにハミング関数あるいは矩形関数の窓関
数による荷重乗算を所定の繰返し周期、本実施の場合は
２ＱｍＳＥＣごとに実施しこれが分析７レ一ム周期とな
る。量子化信号はこの分析フレーム周期ごとに読出され
てピッチ・Ｖ／ＵＶ　（Ｖｏ　ｉｃｅ／Ｕｎ−ｖｏ　ｉ
ｃｅ　、有声／無声）抽出器１０２と自己相関係数算出
器１０３とに供給される。

ピッチ・Ｖ／ＵＶ抽出器１０２は分析フレームごとに入
力する量子化信号から公知の抽出技術でピッチ周期とＶ
／ＵＶ判別に閥するデータを抽出、これを量子化器１０
４に供給する。

量子化器１０４は入力を所定の形式で量子化したうえこ
れをマルチプレクサ１１１に供給する。

自己相関係数算出器１０３は分析フレームごとの量子化
信号につき必要な時間遅れ範囲での自己相関係数を所定
の次数、本実施例の場合は１２次まで抽出しこれをフォ
ルマント抽出器１０６に供給するとともに、遅れ時間零
における自己相関係数を短時間平均音声電力として分析
フレームごとに量子化器１０５に供給、これによって所
定の形式の量子化を受けた短時間平均音声電力はマルチ
プレクサ１１１に供給される。

フォルマント抽出器１０６は１２次の自己相関係数を分
析フレーム単位で受けるごとにこの自己相関係数列を利
用し公知のフォルマント抽出手法、たとえば日本音響学
会音声研究会資料８８１−４１（１９８１年１０月２６
日）の論文「自己相関領域で逆フィルタリングを用いた
ホルマントの多段推定方式」（著者伏木田勝信）、自己
相関領域におけるＡｂ８（Ａｎａｌｙｓｉｓ　ｂｙ　５
ｙｎｔｈｅｓｉｓ）釣手法によって分析フレームごとに
第１乃至第３フォルマント周波数’１　ｅ　’ｔ　＋ら
を抽出する。この場合、抽出するフォルマントを第１な
いし第３フオルマントとしているのは極座標変換器１０
７における極座標化に必要最低限のフォルマント周波数
が相連続する３個のフォルマント周波数であることのほ
か、その発生状況が不安定で利用しＫくい第４フォルマ
ント以上の高域フォルマントを除いた相連続する３つの
極を利用するものである。ここでいう極とは声道の共振
点でありフォルマント周波数とほぼ一致する。

さて、こうして選定したフォルマント周波数ｆ１とｆ！
ならびにらの比ｆ、：ｆｔ：ｆｓの分布は話者にかかわ
らずどのような音声についてもほぼ一定であり、このこ
とは多くの音声資料にもとづいてよく知られている。

極座標変換器１０７は入力した第１〜第３フォルマント
周波数ｆ、、ｆ！、ｆ、の極座標変換を実施する。

第３図は第１〜第３フォルマント周波数の３次元極座標
表示図である。

座標原点Ｏで互いに直交する座標軸はそれぞれフォルマ
ント周波数’１　＊　’＊およびｆ、を示し、これら３
座標軸によって形成される３次元極座標系における合成
ベクトルｖ（ｆｓ　−’ｔ　−ｆｓ）ハフオルマント周
波数’１　＊　’ｔ　＊　ｆｊによる合成ベクトルであ
り、その空間方向を決定する２つの角度がθ、ψである
。

第４図は極座標変換器１０７の構成を詳細に説明するだ
めのプロ、り図である。第４図に示す極座標変換器１０
７は乗算器１０７１，１０７２゜１０７３、加算器１０
７４，１０７５．ＲＯＭ１０７６−１〜２、　除算器１
０７７−１〜２．ＲＯＭ１０７８−１〜２を含んで構成
されている。

フォルマント抽出器１０６より供給されるフォルマント
周波数データｆ、　、　ｆ、　、　ｆ、は各々、乗算器
１０７１，１０７２．１０７３の２つの入力端子に入力
される。ｆ、　、　ｆ、は各々除算器１０７７−１の被
除数入力端子１０７７−１２．１０７７−２の被除数入
力端子１０７７−２２にも同時に入力される。

乗算器１０７１，１０７２，１０７３は乗算結果Ｒ＋ｆ
ｉ　、　ｆ−を各々、加算器１０７４，１０７４，１０
７５へ出力する。加算器１０７４はｆ？とｆｉの和Ｂ’
＋ｆｉをＲ，０Ｍ１０７６−１　　と加算器１０７５へ
出力する。加算器１０７５はｆＪとｆｌ’＋　ｆＪ　ノ
和ｆ？＋ｆ７＋ｆｌをＲＯＭ１０７６−２へ出力する。

　ＲＯＭ１０７６−１〜２は几ＯＭでおり、平方根に関
するデータが書込まれている。即ち、ＲＯＭの番地内に
はＩｘｓが書込まれている。故にＲＯＭ１０７６−１．
１０７６−２の各出力は〆了ｒ「ｑ、８η７ηである。

出カメ「ツｑは除算器１０７７−１の除数入力端子１０
７７−１１へ供給される。出力ｆ／＋　ｆ”　＋　ｆＪ
　Ｕ除算器１０７７−２（７）除ａ入力ｉ子１０７７−
２１へ供給される外、データ”ｔ”として量子化器１０
９へ出力される。尚尚・　ｔｌ＋ｒｚ＋ｔｚは第３図に示すＬであることは
自明である。さて除算器１０７７−１．１０７７をＲＯ
Ｍ１０７８−１．１０７８−２へ出力する。

ＲＯＭ１０７８−１〜２はＲＯＭであり５ＩＮＥの逆関
数に関するデータが書込まれている。即ち、ＲＯＭの番
地Ｘ！には８　Ｉ　Ｎ４（！、　）　カ書込まれティる
。故にＲＯＭ１０７８−１．１０７８−２の各出力は明
らかに第３図に示す１θ”、＠ψ”である。これらのデ
ータθ、ψはバタン照合器１０８へ出力される。

さて、このようにして算出された角度θ、ψは、つまり
極座標表現した第１〜第３フォルマント周波数相互間の
２つの関係角度情報であって３つのフォルマント周波数
に対応して決定され、観点を変えると分析フレームごと
の音声信号の周波数スペクトルを表現し、かつ話者独自
の特性がはｔチ除去されたものであることも前述したｆ
、：ｆ、：らの特徴等から明らかである。

再び第１図を参照すると、こうして極座標表現したフォ
ルマント周波数ｆ、　、　ｆ、およびｆ、は合成ベクト
ル絶対値ｔと２つの関係角度θ、ψとによって示され、
これらのデータが分析フレームごとにデータｔは量子化
器１０９に、またデータθ。

ψはバタン照合器１０８に供給される。

量子化器１０９に供給されたデータｔは所定の量子化を
受けたのちマルチプレクサ１１１に供給される。

バタン照合器１０８に供給されるデータθ、ψは標準バ
タンファイル１１０に格納されている複数の標準バタン
それぞれのθ、ψとの距離、いわゆる市街地距離もしく
はユークリッド距離の計測を介してバタン照合を分析フ
レームごとに実施する。本実施例では市街地距離利用し
この距離が最小となる標準バタンを指定するバタンラベ
ルデータをマルチプレクサ１１１に供給する。

標準バタンファイル１１０は、予め設定した１名乃至数
十名の特定話者による音声資料を本実施例の分析側もし
くは別に用意したコンビ、−タンステム等を利用して分
析しオフライン的にθおよびψに関するデータを分析フ
レーム単位で抽出しクラスタリングした標準バタンを格
納した凡ＯＭである。標準バタンファイル１１０はバタ
ン照合器１０８より供給される番地情報により指定され
た番地に記憶されているデータ、即ち標準バタンをバタ
ン照合器１０８へ出力する。熱論、標愈バタンのラベル
とこの番地とは一致している。バタン照合器１０８は標
準パタンファイル１１０より供給される標草パタンデー
タと＠座標変換器１０７から供給される０、ψとのバタ
ン照合を実施する。

このバタン照合は次の（１）式で示される市街地距離ｄ
ｉｋ最小とする標準パタンを選択する形式によって実施
される。

ｄｉｋ＝ｍｉｎ（１＃フーθｋ　ｌ＋ｌψτ−ψｋｌ　
）　　　−−−−−−（１）（１）式においてθ１．ψ
１は極座標変換器１０７から入力する分析フレームごと
の角度データ、０丁。

ψ１は標準バタンファイルに格納されている角度データ
であり前述した如くいずれも周波数スペクトルとしての
角度データである。なおｉ＝ｏ　、　１・・・。

ｎ−１でｎは標準パタンの総数である。

次にバタン照合器１０８の構成を図面を用いて詳細に説
明する。第５図はバタン照合器１０８の構成を示すブロ
ック図である。第５図に示すノ（タン照合器１０８は市
街地距離算出器１２０、比較器１２１、最小距離レジス
タ１２２、アドレスカウンタ１２３、制御器１２４、と
ラベルレジスタ１２５を含んで構成され、標準バタンフ
ァイル１１０を併記しである。

制御器１２４はフレーム周期にイニシャライズされる。

制御器１２４はイニシャライズされると次の初期設定を
実施する。初期設定の内容は、１）アドレスカウンタ１
２３を”Ｏ′″に設定、２）ラベルレジスタ１２５を１
０ｍに設定、および３）最小距離レジスタ１２２を最大
値に設定、の３種である。尚、この最大値は前記（１）
式により算出される市街地距離が取り得る理論的最大値
、又はこの値を越える値である。アドレスカウンタ１２
３の内容＠０″は番地情報として標準バタンファイル１
１０へ供給される。標準バタンファイル１１０は＠０”
番地に記憶しているラベル−〇Ｔａの標準バタンデータ
θ♂、ψ・“を市街地距離算出器１２０へ出力する。市
街地距離算出器１２０には同時に極座標変換器１０７よ
り分析されたフォルマント周波数より算出されたθ　、
ψ　が供給されている。市街地距離算出器１２０はこれ
らのデータより後述する（２）式を用いて市街地距離ｄ
ｏｋを求める。仁の市街地距離の算出は具体的には以下
のように実施される。

第６図は市街地距離算出器１２０の具体的な構成を示す
ブロック図である。第６図に示す市街地距離算出器１２
０は減算器１２０１−１〜２、絶対値算出器１２０２−
１〜２、乗算器１２０３−１〜２、加算器１２０４　を
有して構成されている。説明の都合上、乗算器１２０３
−１〜２が存在しないものとする。減算器１２０１−１
．１２０１−２で各々、θ。−〇　、ψ。−ψが算出さ
れ絶対値算出器１２ｏ２−１．１２０２−２へ出力され
る。絶対値算出器１２０２−１．１２０２−２はこれら
のデータの絶対値１θ♂−θ町、１ψ。１−ψに１を算
出し加算器１２０４へ出力する。加算器１２０４の出力
は下記（２）式で示されるｄｏｋである。

ｄｏ″ｋ　＝ｌ　ａ：　−ｅ　ｋｌ　＋　ｌψ、＠　−
ｐ　ｋｌ−−−−””　”””　’”’　”””　””
　（２）熱論、市街地距離として、角度０．ψに聴覚的
な重み付けを実施する事も可能である。重み係数をａ、
ｂとすると前記（２）式の代りに次の（３）式を用いて
ｄｏｋが算出される。

ｄｏｋ＝ａｌθ：　＃ｋｌ＋ｂｌψ。１−ψｋｌ−・・
−−−−−−−−−（３）（３）式を用いる場合には第
６図に於いて乗算器１２０３−１〜２を追加すればよい
。

次に絶対値算出器１２０２−１〜２の構成を図面を用い
て説明する。第７図は絶対値算出器１２０２の構成を示
すブロック図である。第７図に示す絶対値算出器１２０
２は排他的論理和１２０２−３０〜３７、全加算器１２
０２−４を有して構成されている。３ｂｉｔ構成のデー
タへ〜へが排他的論理和１２０２−３０〜３７の一方の
入力端子に接続されている。又、八が排他的論理和１２
０２−３０〜３７の他の入力端子に接続されている。へ
〜へはり、をＭＳＢ、Ｄ、をＬＳＭとする２の補数で表
現されたデータである。即ち、データが負の場合にはＤ
０＝１、正又はＯの場合にはＤｏ　＝　０となっている
。排他的論理和１２０２−３０〜３７の出力ばり、　＝
　ｌの場合には入力Ｄ０〜Ｄマを反転し、Ｄ０＝Ｑ　　
の場合には入力と一致する。これらの出力は全加算器１
２０２−４の２７〜２°の一方の入力端子に供給される
。全加算器１２０２−４の２７〜２１の他の入力端子に
は”０”が、２°にはり、が供給されている。従って全
加算器１２０２−４の出力Ｄ′ｃ、〜Ｄ；はり、　＝　
Ｑの場合、Ｄ、　〜Ｄ、の一致し、Ｄ０＝１の場合、Ｄ
、〜痔の各ｂｉｔを反転し、“１”を加えたものとなっ
ている。即ち、公知の補数計算法を利用して、入力デー
タが負の場合には出力データはその補数となっている。

再び第５図を用いて説明を続ける。市街地距離算出器１
２０で算出された市街地距離ｄｏｋは比較器１２１と最
小距離レジスタ１２２へ供給される。

前述のように最小距離レジスタ１２２には最大値が予じ
め記憶されている。この最大値は比較器１２１へ供給さ
れている。比較器１２１はこの最大値とｄｏｋを比較し
、ｄｏｋが小さい場合に制御信号を制御器１２４へ供給
される。制御器１２４は、この信号が入力されると最小
距離レジスタ１２２と２ベルレジスタ１２５へ記憶命令
を出力する。

最小距離レジスタは記憶命令により前記ｄｏｋを前記−
最大値“の代りに記憶する。又、ラベルレジスタ１２５
はアドレスカウンタ１２３より供給されている番地情報
“Ｏ″を記憶する。次に制御器１２４はカウントアツプ
命令をアドレスカウンタ１２３へ出力する。アドレスカ
ウンタ１２３はカウントアツプ命令によりその内容を”
１”だけア、プする。アドレスカウンタ１２３は０＋１
＝１を標準バタンファイル１１０へ出力する。標準バタ
ンファイル１１０は標準バタンθ−２ψ１１を市街地距
離算出器１２０へ出力する。市街地距離算出器１２０は
ｄｏｋと同様にｄｌｋを算出し、比較器１２１と最小距
離レジスタ１２２へ供給する。比較器１２１は最小距離
レジスタ１２２よシ供給されるｄｏｋとこのｄｘｋの大
小を地絞する。もしｄｏｋ（ｄｘｋの場合には最小距離
レジスタ１２２とラベルレジスタ１２５の内容は変更さ
れない。又、もしｄｏｋ　）　ｄｌにの場合には制御信
号が制御器１２４へ供給され、最小距離レジスタ１２２
にはｄｌｋが、ラベルレジスタ１２５にはラベル６１″
があらためて記憶される。アドレスカウンタが０，１．
・・・、ｊ（ｊ＜ｎ−１）と次々にアップされていくと
、結果として最小距離レジスタ１２２には下記（３）式
で示されるｄｏが書込まれる。

ｄ（ｊ）＝ｍｉｎ　（ｄｏｋ　、　ｄｌｋ　、−ｄｊ−
ＩＢ、、　ｄｊｋ）−（３）又、ラベルレジスタ１２５
には（３）式に付随して求められたラベルが書込まれる
。

こうしてｋ　＝　ｎ−１となりたときにラベルレジスタ
１２５には必要なラベルが書込まれている。このラベル
データはマルチプレクサ１１１へ出力される。

再び第１図に戻って説明を続ける。

このように、バタン照合は（１）式に示すｄｉｋを最小
とする４！準パタンを選択することによって行なわれる
が、このことはフォルマント周波数比ｆ８゜：ｆ、：ら
が最もよく近似した標準バタンを選択することに他なら
ず、しかもこの場合のフォルマント周波数は話者による
差異が非常に少ない第１〜第３フォルマント周波数の比
の分布を対象とする形式で行なわれるため不特定話者に
よる入力音声のバタン照合も特定話者による入力音声の
バタン照合とほぼ同様な適合し易さで実施できる。

前述した如く任意の不特定話者に対してもよく適合する
標準パタンの作成は極めて困難であり、この原因は話者
ごとにスペクトル分布が異ることに起因し、このスペク
トル分布の話者ごとの差異を無くすためには声道特性の
差異を生む声道長と声帯音源とを何かの手段でそれぞれ
独立的に正規化するかもしくはこれらから個人差を除去
することにより不特定話者にも適合し易いバタンマツチ
ングが実施できる。本実施例でもこの点に着目し極座標
表現による第１〜第３フオルマント周波数のなす角度情
報０．ψを介して声道長を正規化し、さらにスペクトル
包絡を第１ないし第３フォルマントの比で代表させて声
帯音源特性の個人差の問題を基本的にほぼ排除、し不特
定話者にも適合し易いバタンマツチングを行なっている
。

さて、マルチプレクサ１１１はζうして入力した各種デ
ータを所定の形式で符号化したうえその多重化を行なっ
て伝送路１１１１を介して合成側２に送出する。

合成側２ではデマルチプレクサ２０１によって受信信号
の多重化分離を行なったのちピッチ・Ｖ／ＵＶデータは
復号化器２０２に、短時間平均電力データは復号化器２
０３に　１１データは復号化器２０４に、またバタンラ
ベルデータはバタン読出器２０５にそれぞれ供給される
。

復号化器２０２によって復号されたピッチ情報はピッチ
周波数発生器２０６に供給されピッチ周期に対応する周
波数のピッチ周波数信号を発生せしめる。

切替器２０８は供給されたＶ／ＵＶ情法がＶ（有声）を
指定するときはピッチ周波数発生器２０６の出力を乗算
器２０９に供給し、Ｖ／Ｕ　Ｖ情報がＵＶ（無声）を指
定するときは雑音発生器２０７の出力する雑音信号を乗
算器２０９に供給するように切替える。

乗算器２０９にはまた、復号化器２０３の出力、すなわ
ち復号化された短時間平均電力が供給されこれら２人力
の乗算結果としてモデル化された音源データがフォルマ
ント合成器２１２に供給される。

ｔデータは復号化器２０４によって復号化ｔ′として交
座標変換器２１１に供給される。

パタン読出器２０５は入力したバタンラベルデータにも
とづいて標準バタンファイル２１０から標準パタンを読
出す。この標準パタンは分析側１のバタン照合器１０８
によって入力θ、ψデータと最もよく適合した標準パタ
ンのθ、ψデータとしてのθ′、ψ′である。

標準バタンファイル２１０は分析側１の標準バタンファ
イル１１０とほぼ同一のファイル内容を格納し、パタン
読出器２０５で指定されたバタンラベルを有する標準パ
タンの角度情報θ′、ψ′をパタン読出器２０５を介し
て直交座標変換器２１１に供給する。

直交座標変換器２１１はこうして供給されたＺ／。

θ′、りによる極座標データを直交座標データに変換し
てｆ’ｌ　＋　ｆ’ｔ　ｅ　ｆ’８のフォルマント周波
数を得てこれをフォルマント合成器２１２に供給する。

フォルマント合成器２１２は入力したｆ’ｌ　＊　［′
、　１ｆｌ、　　にそれぞれあらかじめ設定する帯域幅
を付与する。これら帯域幅はフォルマントに関する資料
、経験等にもとづいてそれぞれ適宜設定される。

こうして得られるフォルマント情報を合成するにも１徨
の手法が考えられるが本実施例ではこれら帯域幅を付与
された３個のフォルマント情報のそれぞれから１組２個
ずつのαパラメータを求めこれらαパラメータをフィル
タ係数とする３個の２次の巡回型ディジタルフィルタを
カスケード接続しその入力に音源データを印加するとい
う形式でフォルマントの合成を行なっている。このフォ
ルマント合成の結果、入力音声信号のディジタル再生が
行なわれこれはＤ／Ａコンバータ２１３に出力される。

Ｄ／Ａコンバータ２１３は、入力したディジタル音声信
号をアナログ量に変換したうえＬＰＦを介して不要の高
域成分を除去し出力音声信号として送出する。

本発明はパタンマッチングボコーダにおける分析側と合
成側とに備える標準バタンファイルを、入力音声信号を
分析して得られる第１〜第３フォルマント周波数を極座
標表現して求まる２つの角度情報をベクトル要素として
構成する点に基本的特徴を有するものであり第１および
第２図の実施例の変形も種穫考見られる。

たとえば、本実施例では第１〜第３フォルマント周波数
の極座標表現化は極座標系の’１ｗｂｓら軸上にそれぞ
れ第１．２，３フオルマントの中心周波数とその分布範
囲とをそれぞれ独立的に設定する形式で行なっているが
、この場合これら３つの分布範囲の下限周波数が座標原
点で正規化される形式で座標表現化を行ない量子化感情
の平準化を図っても勿論差支えない。

また、合成側におけるフォルマント合成は第２図に示す
フォルマント合成器２１２とほぼ同一の機能を有する他
の構成、たとえば市販製品としてのフォルマント合成用
ＬＳＩ等を利用しても勿論差支えない。

さらに、本実施例では音源情報として、有声の場合には
抽出ビ、チ周期に対応するピッチ周波数、また無声の場
合には雑音信号でモデル化したモデル化音源を利用して
いるが、これは他の形式の音源情報たとえばマルチパル
ス等を利用しても一向に差支えなく以上はすべて本発明
の主旨を損なうことなくいずれも容易に冥施しうるもの
である。

〔発明の効果〕

以上説明した如く本発明によれば、バタンマ。

チングボコーダにおいて、入力音声信号を分析して得ら
れる第１〜第３フォルマント周波数を極座標表現して求
まる２つの角度情報をベクトル要素とする標準バタンフ
ァイルを備えることＫより特定話者とともに不特定話者
に対しても極めてよく適合し易いパタンマツチングが実
施できるフォルマント壓パタンマッチングボコーダが実
現できるという効果がある。

【図面の簡単な説明】

第１図は本発明のフォルマント型パタンマッチングボコ
ーダの分析側の一実施例の構成を示すプロ、り図、第２
図は本発明のフォルマント型パタンマ、チングボコーダ
の合成側の一実施例の構成を示すブロック図、第３図は
第１〜第３フォルマント周波数の３次元極座標表示図、
第４図は第１図に示されている極座標変換器１０７の構
成を示すプロ、り図、第５図は第１図に示されているバ
タン照合器１０８の構成を示すブロック図、第６図は第
５図に示されている市街地距離算出器１２０の構成を示
すブロック図、第７図は第６図に示されている絶対値算
出器１２０２の構成を示すプロ、り図である。１・・・・・・分析側、２・・・・・・合成側、１０１
・・・・・・Ａ／Ｄコンバータ、１０２・・・・・・ビ
、チ・Ｖ／ＵＶ抽出器、１０３・・・・・・自己相関係
数算出器、１０４・・・・−量子化器、１０５・・・・
・・量子化器、１０６・・・・・・フォルマント抽出器
、１０７・・・・・・極座標変換器、１０８・・・・・
・バタン照合器、１０９・・・・・・量子化器、１１０
−・・・−ｍ準パタンファイル、１１１・−・・・マル
チプレクサ、２０１・・・・・・デマルチプレクサ、２
０ｆ・・・・・・復号化器、２０３・・・・・−復号化
器、２０４・・・・・・復号化器、２０５・・・・・・
バタン読出器、２０６・・・・・・ピッチ周波数発生器
、２０７・・・・・・雑音発生器、２０８・−・・・切
替器、２０９・・・・・・乗算器、２１０・・・・・・
標準バタンファイル、２１１・−・・・・直交座標変換
器、２１２・・・・・グオルマント合成器、２１３・・
・・・・Ｄ／Ａコンバータ、１０７１，１０７２，１０
７３・・・・・・乗算器、１０７４゜１０７５・・・・
・・加算器、１０７６−１〜２・・・・−４０Ｍ。１０７７−１〜２・・・・・・除算器、１０７８−１〜
２・・・・・−ＲＯＭ、１２０・・・・・・市街地距離
算出器、１２１・・・比較器、１２２−・・・・・最小
距離レジスタ、１２３・・・・・・アドレスカウンタ、
１２４・・・・・・制御器、１２５・・・・・・ラベル
レジスタ、１２０１−１〜２・・・・−・減算器、１２
０２−１〜２・・・・・・絶対値算出器、１２０３−１
〜２・・・・・・乗算器、１２０４　・・・・・・加算
器、１２０２−３０〜３７・・・・・・排他的論理和、
１２０２−４””・・・全加算器。代理人　弁理士　　内　原　　　晋　、＜：）、’ｌ’
（”・θ７　ψ　　−ｍ−〜−−−２〒ルマン募ゴ；皮
４酎ネ百丸間の模「承狗度第　ｌ　図第　２７Ｊ／、了２−ｆ１了−−−−・已耳３ト）Ｌζビ！シｔ
、フ１呵ｊ二】ξ５七勢（辷ミ第　３　回

Claims

【特許請求の範囲】

入力音声信号を分析して得られる第１および第２ならび
に第３フォルマント周波数を極座標表現することによっ
て求まる前記フォルマント周波数相互間の２つの関係角
度情報をベクトル要素とする標準パタンファイルを備え
て成ることを特徴とするフォルマント型パタンマッチン
グボコーダ。