JPS6370300A

JPS6370300A - 人の音声の符号化処理システム

Info

Publication number: JPS6370300A
Application number: JP62171340A
Authority: JP
Inventors: エドワード　チャールズ　ブロンソン; ウォルター　ソーンレイ　ハートウェル; トーマス　エドワード　ジャコブス; リチャード　ハリー　ケッチャム; ウィレム　バスチアアン　クレイジン
Original assignee: American Telephone and Telegraph Co Inc
Current assignee: AT&T Corp
Priority date: 1986-09-11
Filing date: 1987-07-10
Publication date: 1988-03-30
Anticipated expiration: 2011-03-29
Also published as: CA1307344C; ATE73251T1; JPH0833753B2; AU7530287A; EP0259950A1; DE3777028D1; EP0259950B1; KR960002387B1; SG123392G; KR880004425A; US4771465A; AU575515B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】退Ｊ野と艷本発明は音声処理、より詳細には、ボコーダ−のアナラ
イザ　セクションからの基本振動数及び高調波のサブセ
ットのみを使用する音声の発声部分に対するシヌソイダ
ル　モデル及び音声の非発声部分に対する励振線形予測
符号化フィルタを利用して音声の複製を生成するデジタ
ル音声符号及び復号装置に関する。

１１じｌ」延音声メモリ及び音声レスポンス設備を含むデジタル音声
通信システムは記憶及び／或いは伝送に必要とされるビ
ット速度を低減するために信号圧縮を使用する。従来の
デジタル音声符号化技術が、Ｒ，Ｊ、マツフォーレイ（
Ｒ，Ｊ　、　ＭｃＡｕｌａｙ）らによって、音響、音声
、及び信号処理に関するＺＥＥＥ国際会議録（Ｐｒｏｃ
ｅｅｄｉｎｇｓ　ｏｆ　ＩＥ　Ｅ　Ｅ　Ｉｎｔｅｒｎａ
ｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅ　ｏｎ　Ａｃｏｕｓ
ｔｉｃｓ、　５ｐｅｅｃｈ、　ａｎｄＳｉｇｎａｌ　Ｐ
ｒｏｃｅｓｓｉｎｇ）ｓ　１９８４年、Ｖｏｌ。

２、ページ２７．６．１−２７．６．４　（サンジエゴ
、Ｕ、Ｓ、Ａ、）に掲載の論文［シヌソイダル　モデル
を使用する規模のみの再生（Ｍａｇｎｉｔｕｄｅ−Ｏｎ
ｌｙ　Ｒｅｃｏｎｓｔｒｕｃｔｉｏｎ　Ｕｓｉｎｇａ　
　Ｓ　１ｎｕｓｏｉｄａｌ　Ｓ　ｐｅｅｃｈ　Ｍｏｄｅ
ｌ）　］に開示される。この論文においては音声の発声
部分及び非発声部分の両方を符号化及び復号するために
シヌソイダル音声モデルが使用される。

音声波形がボコーダ−のアナライザ部分内で音声波形を
正弦波の総和としてモデル化することによって分析され
る。この正弦波の総和は音声波形の基本振動数と高調波
から構成され、以下によって表わされる。

５（ｎ）−Σａ１（ｎ）　ｓｉｎ　［φ、（ｎ）］　　
　　（１）ここで、ａｒ（ｎ）及びφ１（ｎ）はそれぞ
れ任意の時間における音声波形の時間とともに変化する
振幅及び位相を表わす。発声処理機能がアナライザ部分
内でこれら振幅及び位相を計算することによって遂行さ
れ、これら値が合成部分に伝送され、ここで式（１）を
使用して音声波形の再生が行なわれる。

Ｒ，Ｊ、マツフォーレイ（Ｒ、Ｊ　、　ＭｃＡｕｌａｙ
）らの論文は、ボコーダ−のアナライザ部分による全て
の高調波に対する振幅及び位相の計算、及びこれら情報
のボコーダ−の合成セクションへの伝送を開示する。位
相は瞬時周波数の積分であるという事実を使用して、合
成セクションは基本振動数及びその高調波振動数から対
応する位相を計算する。アナライザはこれら振動数をこ
れらがこのスペクトル内のピークとして現われるため速
いフーリエ変換（ｆａｓｔ　Ｆｏｕｒｉｅｒ　ｔｒａｎ
ｓｆｏｒ＋＊、　Ｆ　Ｆ　Ｔ）スペクトルから計算する
。つまり、単にピーク検出を行なうことによって基本及
び高調波の振動数及び位相が計算される。アナライザに
よって基本及び全ての高調波の振動数に加えて振幅が決
定されると、この情報はシンセサイザに伝送される。

基本及び全ての高調波の振動数に加えてこれら振幅が伝
送されるため、この情報をアナライザからシンセサイザ
に伝送するのに秒当たり多量のビットが必要となるとい
う問題が存在する。これに加えて、これら振動数及び振
幅は、結果としてのスペクトル内のピークのみから直接
に計算されるため、これらピークを検出されるために遂
行されるＦＦＴ計算は非常に正確であることが要求され
、結果として高度の計算が要求されるという問題が存在
する。

鼠久友豊本発明は、これら問題及び先行技術の短所を解決し、技
術上の向上を達成することを目的とする１本発明の方法
及び構造上の実施態様においては、音声の分析及び合成
がアナライザ内で基本振動数及びサブセットの高調波振
動数のみを計算し、シンセサイザ内で音声を音声の発声
部分に対するシヌソイダル　モデルを利用して再生する
ことによって達成される。このモデルは、基本振動数及
びサブセットの高調波振動数を使用して構築され、残り
の高調波振動数は理論高調波振動数からの差異を与える
計算を使用して基本振動数から計算される。基本振動数
及び高調波振動数の振幅は、アナライザからシンセサイ
ザに直接に伝送されるのではなく、シンセサイザの所で
アナライザから受信される線形予測符号化（ｌｉｎｅａ
ｒ　ｐｒｅｄｉｃｔｉｖｅ　ｃｏｄｉｎｇ、　Ｌ　Ｐ　
Ｇ）係数及びフレーム　エネルギーから計算される。こ
うして、振幅を直接に伝送するのでなく振幅を再生する
ために必要な情報を伝送することによって、これに要求
されるビット数が非常に削減できる。

計算を簡素化するために、アナライザはＦＦＴスペクト
ルから基本振動数及び高調波振動数をそれらピークを発
見し次にスペクトル内のどこにピークが起こるかをより
正確に決定するための挿間を行なうことによって計算す
る。これは低い振動数分解能のＦＦＴ計算を使用するこ
とを可能とする。

個々の音声フレームに対して、シンセサイザはフレーム
　エネルギー、セットの音声パラメータ、基本振動数、
及び基本振動数から派生された個々の理論高調波振動数
とサブセットの実際の高調波振動数との間の差を表わす
オフセット信号から成る符号化情報に応答する。シンセ
サイザはオフセット信号及び基本振動数信号に応答して
そのオフセット信号に対応するサブセットの高調波位相
信号を計算し、また、基本振動数に応答して残りの高調
波位相信号を計算する。シンセサイザはフレーム　エネ
ルギー及びセットの音声パラメータに応答して基本振動
数信号、サブセットの高調波位相信号、及び残りの高調
波位相信号の振幅を計算する。シンセサイザは次に基本
信号、高調波位相信号及びこれら信号の振幅に応答して
音声を再生する。

１つの実施態様においては、シンセサイザは、この残り
の高調波振動数信号を基本振動数に高調波の数を掛けて
計算し１次に結果としての振動数を変化させて残りの高
調波位相信号を計算する。

第２の実施態様においては、シンセサイザはこの残りの
高調波振動数信号を最初に基本振動数信号に高調波の数
を掛けることによって理論高調波振動数信号を計算する
ことによって生成する。シンセサイザは次に残りの高調
波振動数信号に対応する理論高調波振動数信号を個々が
元のサブセットの高調波位相信号と同数の高調波を持つ
複数のサブセットにグループ化し、次に個々のオフセッ
ト信号を個々の複数のサブセットの対応する残りの理論
振動数信号に加えることによって修正された残りの高調
波振動数信号を生成する。シンセサイザは次にこの修正
された残りの高調波振動数信号を使用して残りの高調波
位相信号を計算する。

第３の実施態様においては、シンセサイザは第２の実施
態様と類似の方法で残りの高調波振動数信号を計算する
が、オフセット信号の順番が、これら信号が修正された
残りの高調波振動数信号を生成するために理論高調波振
動数信号に加えられる前に入れ替えられる点が異なる。

これに加え、シンセサイザは基本振動数信号及び高調波
振動数信号に対する振幅を個々のフレームに対するセッ
トの音声パラメータから個々の高調波振動数信号の未ス
ケール（ｕｎｓｅａｌｅｄ）エネルギーを計算すること
によって計算し、これら未スケール　エネルギーを高調
波振動数信号の全てを通じて総和する。

シンセサイザは、次に個々の高調波信号に対する高調波
エネルギー、未スケールの総和エネルギー、及びフレー
ム　エネルギーを使用して個々の高調波位相信号の振幅
を計算する。

再生音声の品質を向上させるため、基本振動数信号及び
計算高調波振動数信号は音声フレームの真ん中の１つの
サンプルを表わすものと想定され、シンセサイザは挿間
を使用して基本及び高調波振動数信号の両方に対して音
声フレームを通じての連続サンプルを生成する。類似の
挿間が基本及び高調波振動数の両方の振幅に対しても遂
行される。隣接するフレームが非発声フレームである場
合は、基本及び高調波信号の両方の振動数は発声フレー
ムの中心から非フレームまで一定であると想定され、一
方、振幅は発声フレームと非発声フレームとの間の境界
の所で“０″であると想定される。

非発声フレームの符号化には、セットの音声パラメータ
、多重パルス励振情報、及び励振タイプ信号並びに基本
振動数信号が含まれる。シンセサイザは励振タイプ信号
によってノイズ様励振を使用することが指示される非発
声フレームに応答してノイズ様励振を持つセットの音声
パラメータによって定義されるフィルタを励振する。さ
らに、シンセサイザは多重パルスを使用することを指示
する励振タイプ信号に応答して、多重パルス励振情報を
使用してセットの音声パラメータ信号から構成されるフ
ィルタを励振する。これに加えて、発声フレームから非
発声フレームへの遷移が起こった場合は、最初に発声フ
レームからのセットの音声パラメータがフィルタをセッ
トするのに使用され、このフィルタが非発声領域の間も
指定の励振情報を使用して励振される。

実施例の説明第１図及び第２図は、それぞれ本発明の焦点である音声
アナライザ及び音声シンセサイザを示す。第１図の音声
アナライザ１００は経路１２０を介して受信されるアナ
ログ音声信号に応答してこれら信号をチャネル１３９を
介して第２図のシンセサイザ２００に伝送するために低
ビツト速度にて符号化する。好ましくは、チャネル１３
９は通信伝送経路あるいは記憶媒体とされ、後に合成さ
れた音声を必要とする各種の用途に対する音声合成が提
供できるようにされる。アナライザ１００はチャネル１
２０を介して受信される音声を３つの異なる符号化技術
を使用して符号化する。音声の発声領域の間に、アナラ
イザ１００はシンセサイザ２００によって音声のシヌソ
イダル　モデリング及び再生に使用される情報の符号化
を行なう、音声の領域は、基本振動数が声帯による空気
の流れに起因する場合は、発声領域と分類される。非発
声領域においては、シンセサイザ１００は適当な励振を
持つ線形予測符号化（１ｉｎｅａｒ　ｐ　ｒ　ｅ　ｄｉ
ｃｔｉｖｅｃｏｄｉｎｇ、　Ｌ　Ｐ　Ｇ　）フィルタを
励振することによってシンセサイザ２００内で音声の複
製を可能とする情報を符号化する。励振のタイプは、個
々の非発声フレームに対してアナライザ１００によって
決定される。破裂音子音と発声領域と非発声領域との間
の非発声と分類される遷移を含む非発声領域において、
多重パルス励振が符号化されシンセサイザ２００に送ら
れる。ある非発声フレームに対して多重パルス励振が符
号化されない場合は、アナライザ１００はシンセサイザ
２００にＬＰＣフィルタを励振するのにホワイト　ノイ
ズ励振を使用することを指示する信号を送る。

次に、シンセサイザ１００の動作全般をさらに詳細に説
明する。アナライザ１００はアナログ／デジタル　コン
バータ１０１からフレームにて受信され、フレーム　セ
グメンタ１０２によってセグメント化されたデジタルサ
ンプルを処理する０個々のフレームは、好ましくは１８
０個のサンプルから成る。あるフレームが発声領域であ
るか非発声領域であるかの決定は、以下の方法で行なわ
れる。ＬＰＣ計算器１１１はフレームのデジタル　サン
プルに応答して人の声帯（ｖｏｃａｌ　ｔｒａｃｔ）を
モデル化するＬＰＣ係数及び残留信号を生成する。これ
ら係数及びエネルギーの生成は合衆国特許第３，７４０
，４６７号に開示され、本発明の譲受人と同一譲受人に
譲渡された装置、あるいは他の当分野において周知の装
置によって遂行される。ピッチ検出器１０９は経路１２
２を介して受信される残留信号及び経路１２１を介して
フレームセグメンタ　ブロック１０２から受信される音
声サンプルに応答して、そのフレームが発声領域である
か非発声領域であるか決定する。ピッチ検出器１０９が
、フレームが発声領域であることを決定したときは、ブ
ロック１４１から１４７がフレームのシヌソイダル符号
化を遂行する。

一方、そのフレームが非発声領域であると決定された場
合は、ノイズ／多重パルス判定ブロック１１２によって
シンセサイザ２００がこれもＬＰＣ計算器ブロック１１
１によって計算されるＬＰＣ係数によって定義されるフ
ィルタを励振するためにノイズ励振を使用すべきかある
いは多重パルス励振を使用すべきかが決定される。ノイ
ズ励振を使用する場合は、この事実がパラメータ符号化
ブロック１１３を介してシンセサイザ２００に伝えられ
る。一方、多重パルス励振を使用する場合は、ブロック
１１０はパルス　トレイン位置及び振幅を決定し、この
情報を経路１２８及び１２９を介して後に第２図のシン
セサイザ２００に送るためにパラメータ符号化ブロック
１１３に送る。

アナライザ１００とシンセサイザ２００の間の通信チャ
ネルがパケットを使用して実現される場合の発声フレー
ムに対して伝送されるパケットが第３図に示され、ホワ
イト　ノイズ励振を使用する非発声フレームに対して伝
送されるパケットが第４図に示され、そして多重パルス
励振を使用する非発声フレームに対するパケットが第５
図に示される。

次に、非発声フレームに対するアナライザ１００の動作
を詳細に説明する。ピッチ検出器１０９が経路１３０を
介してそのフレームが非発声領域であることを伝えると
、ノイズ／多重パルス判定ブロック１１２は、この信号
に応答してノイズ励振を使用すべきか多重パルス励振を
使用すべきかを決定する。多重パルス励振を使用する場
合は、この事実を示す信号が経路１２４を介して多重パ
ルス　アナライザ　ブロック１１０に送られる。このア
ナライザは、経路１２４上のこの信号及びピッチ検出器
１０９から経路１２５及び１２６を介して伝送される２
つのセットのパルスに応答する。多重パルス　アナライ
ザ　ブロック１１０は選択されたパルスの位置並びに選
択されたパルスの振幅をパラメータ符号器１１３に送る
。この符号器はまた経路１２３を介してＬＰＣ計算器１
１１から受信されるＬＰＣ係数に応答して第５図に示さ
れるパケットを生成する。

ノイズ／多重パルス判定ブロック１１２がノイズ励振を
使用することを決定した場合は、これはこの事実を経路
１２４を介してパラメータ符号器１１３に信号を送るこ
とによって示す。符号器１１３はこの信号に応答してブ
ロック１１１からのＬＰＣ係数並びにブロック１１５に
よって残留信号から計算された利得を使用して第４図に
示されるパケットを生成する。

次に発声フレームに対するアナライザ１９０の動作を詳
細に説明する０発声フレームの間にアナライザ１００か
らシンセサイザ２００に送られる情報が第３図に示され
る。ＬＰＣ係数はＬＰＣ計算器１１０によって生成され
径路１２３を介してパラメータ符号器１１３に送られ；
フレームが発声フレームであることを示す指標がピッチ
検出器１０９から径路１３０を介して送られる０発声領
域の基本振動数はピッチ検出器１０９によって径路１３
１を介してピッチ周期として送られる。パラメータ符号
器１１３はこのピッチ周期に応答して、このピッチ周期
を基本振動数に変換した後にチャネル１３９上に送る。

フレーム内の音声の総エネルギー、ｅＯがエネルギー計
算器１０３によって計算される。計算器１０３はデジタ
ル　サンプルの総和の二乗の平方根をとることによって
ｅｏを生成する。このデジタルサンプルがフレームセグ
メンタ１０２から径路１２１を介して受信され、エネル
ギー計算器１０３は結果としての計算エネルギーを径路
１３５を介してパラメータ符号器１１３に送る。

個々のフレーム、例えば、第６図に示されるフレームＡ
は好ましくは１８０のサンプルから構成される。音声フ
レーム　セグメンタ１４１は、アナログ／デジタル　コ
ンバータ１０１からのデジタル　サンプルに応答してデ
ータサンプルのセグメントを抽出する０個々のセグメン
トは第６図のセグメントＡ及びフレームＡによって示さ
れるように１つのフレームをオーバラップする。１つの
セグメントは、好ましくは２５６個のサンプルから構成
される。シヌソイダル分析を遂行する前にフレームをオ
ーバラップすることの目的は、フレームの終端ポイント
により多くの情報を提供することにある。ダウンサンプ
ラ１４２は発声フレーム　セグメンタ１４１の出力ｔこ
応答して、２５６個のサンプル　セグメントのサンプル
を１つおきに選択する。結果として、好ましくは、１２
８サンプルのサンプル群が得られる。このダウン　サン
プリングの目的は、ブロック１４３及び１１４によって
遂行される計算の繁雑さを削減することにある。

ハミング　ウィンドウ　ブロック１４３はブロック１４
２からのデータ、ｓｎに応答して、以下の式によって与
えられるウインドニング動作を遂行する。

ｓｎ：５ｎ（０，５４−０，４６ｃｏｓ（（２πｎ）／
１２７））、（２）０（ｎ＜１２７このウインドニング動作の目的は、フレームの終端ポイ
ントの所の不連続性を排除し、スペクトル分解能を向上
させることにある。

ウインドニング動作が遂行された後、ブロック１４４は
、最初、ブロック１４３からのサンプルにゼロを挿入す
る。この挿入の結果として、以下の式によって定義され
る、好ましくは、２５６個のデータ　ポイントから成る
新たなシーケンスが生成される。

次にブロック１４４によって以下の式によって定義され
る離散フーリエ変換が遂行される。

ここで、ｓ子　はこのゼロを挿入されたシーケンスｓｐ
のｎ番目のポイントを表わす０式４の評価は速いフーリ
エ変換（ｆａｓｔ　Ｆｏｕｒｉｅｒｔｒａｎｓｆｏｒｍ
、　Ｆ　Ｆ　Ｔ　）法を使用して行なわれる。

ＦＦＴ計算を遂行した後、ブロック１４４は式（４）の
計算を遂行した結果とて得られる個々の複素振動数デー
タ　ポイントから以下の式によってスペクトルＳを得る
。

ｓ、　　＝　　Ｆ、　　Ｆ、　　、　　Ｏ＜　　ｋ　　
＜　　２５５．　　　　　　　（５）ここで、傘　は複
素共役を表わす。

高調波ピーク　ロケータ１４５はピッチ検出器１０９に
よって計算された周期及びブロック１４４によって計算
されたスペクトルに応答して基本振動数の後の最初の５
つの高調波に対応するスペクトル内のピークを決定する
。この探索は高調波の数に基本振動数を掛けた値に等し
い理論的高調波振動数をスペクトルの開始ポイントとし
て使用し、この理論高周波からの所定の距離内の最も高
いサンプルに向かって傾斜を昇っていくことによって行
なわれる。

このスペクトルは限られた数のデータ　サンプルに基づ
くため、高周波挿間器１４６が高調波ピーク　ロケータ
１４５によって決定された高調波ピークの回りの二次挿
間を遂行する。これによってその高調波に対して決定さ
れた値がずばりの値により一致される。個々の高調波に
対して使用されるこの二次挿間は以下の式によって定義
される。

ここで、Ｍは２５６である。Ｓ　（ｑ）は発見されたピ
ークにより近いサンプル　ポイントを表わし、高調波振
動数はＰｋにサンプリング周波数を掛けた値に等しい。

高調波計算器１４７はこの修正された高調波振動数及び
ピッチに応答して理論高調波ピークと計算高調波ピーク
との間のオフセットを計算する。このオフセットは次に
後にシンセサイザ２００に送るためパラメータ符号器１
１３に送られる。

第２図にシンセサイザ２００が示される。

シンセサイザはチャネル１３９を介して受信される声帯
モデル及び励振情報あるいはシヌソイダル情報に応答し
て第１図のアナライザ１００によって符号化された元の
アナログ音声の複製を生成する。受信された情報がフレ
ームが発声領域であることを示す場合は、ブロック２１
１から２１４がシヌソイダル合成を遂行し式（１）に従
って元の発声フレーム情報が再生され、この再生された
音声がセレクタ２０６を介してデジタル／アナログ　コ
ンバータ２０８に送られる。コンバータ２０８は受信さ
れたデジタル情報をアナログ信号に変換する。

受信された符号化情報が非発声フレームであると指定さ
れる場合は、ノイズ励振あるいは多重パルス励振を使用
して合成フィルタ２０７が励振される。径路２２７を介
して送られるノイズ／多重パルス、Ｎ／Ｍ信号によって
ノイズ励振を使用するか多重パルスを使用するかが決定
される。Ｎ　／　Ｍ信号はまたセレクタ２０５を動作し
指定の発生器２０３あるいは２０４のいずれかの出力を
合成フィルタ２０７に送る。合成フィルタ２０７はＬＰ
Ｃ係数を使用して声帯をモデル化する。これに加えて、
非発声フレームが非発声領域の最初のフレームである場
合は、後続の発声フレームから径路２２５を介してＬＰ
Ｃ係数が得られ、これが合成フィルタ２０７を初期化す
るのに使用される。

次に発声フレームが受信された場合の動作を説明する。

第３図に示される発声情報パケットが受信されると、チ
ャネル復号器２０１は径路２２１を介して基本振動数（
ピッチ）を、そして径路２２２を介して基本振動数オフ
セット情報を低高調波振動数計算器２１２及び高高調波
振動数計算器２１１に送る。音声フレーム　エネルギー
、ｅｏ及びＬＰＣ係数がそれぞれ経路２２０及び２１６
を介して高調波振幅計算器２１３に送られる。発声／非
発声（ｖｏｉｃｓｄ／ｕｎｖｏｉｃｅｄ　、　Ｖ　／　
Ｕ　）　　信号が高調波振動数計算器２１１及び２１２
に送られる。Ｖ／Ｕ信号が１”に等しいことはそのフレ
ームが発声フレームであることを意味する。低高調波計
算器２１２は“１″に等しいＶ／Ｕ信号を受信し、これ
に応答して基本振動数及び高調波振動数オフセット情報
に基づいて最初の５つの高調波振動数を計算する。

計算器２１２は次にこの最初の５つの高調波振動数を経
路２２３を介してブロック２１３及び２１４に送る。

高高調波振動数計算器２１１は、基本振動数及びＶ／Ｕ
信号に応答してフレームの残りの高調波振動数を計算し
、これら高調波振動数を経路２２９を介してブロック２
１３及び２１４に送る。

高周波振幅計算器２１３は計算器２１２及び２１１から
の高調波振動数、経路２２０を介して受信されるフレー
ムエネルギー情報、及び経路２１６を介して受信される
ＬＰＣ係数に応答してこれら高調波振動数の振幅を計算
する。シヌソイダル発生器２１４は計算器２１１及び２
１２から受信される振動数情報に応答して高調波位相情
報を決定し、この位相情報及び計算器２１３から受信さ
れる高調波振幅を使用して式（１）によって示される計
算を遂行する。

チャネル復号器２０１が第４図に示されるようなノイズ
励振パケットを受信すると、チャネル復号器２０１は経
路２２７を介してセレクタ２０５にホワイト　ノイズ発
生器２０３の出力を選択するように指示する信号を送り
、また経路２１５を介してセレクタ２０６に合成フィル
タ２０７の出力を選択するように指示する信号を送る。

これに加えて、チャネル復号器２０１は経路２２８を介
してホワイトノイズ発生器２０３に利得を送る。この利
得は第１図に示されるアナライザ１００の利得計算器１
１５によって生成される０合成フィルタ２０７は、チャ
ネル復号器２０１から経路２１６を介して受信されるＬ
ＰＣ係数及びセレクタ２０５を介して受信されるホワイ
トノイズ発生器２０３の出力に応答して音声のデジタル
　サンプルを生成する。

チャネル復号器２０１がチャネル１３９から第５図に示
されるようなパルス励振パケットを受信すると、復号器
２０１は受信されたパルスの位置及び振幅を経路２１０
を介してパルス発生器２０４に送る。　これに加えて。

チャネル復号器２０１は経路２２７を介してセレクタ２
０５がパルス発生器２０４の出力を選択するように指令
し、この出力を合成フィルタ２０７に送る０合成フィル
タ２０７及びデジタル／アナログコンバータ２０８は次
に音声を再生する。コンバータ２０８はコンバータの出
力の所に内蔵ロー　パス　フィルタを持つ。

次に発声フレームのシヌソイダル合成を遂行するブロッ
ク２１１，２１２，２１３及び２１４の動作を詳細に説
明する。低高調波振動数計算器２１２は経路２１１を介
して受信される基本振動数Ｆｒに応答して経路２２２を
介して受信される高調波オフセットｈ。

を使用して、好ましくは、５つのサブセットの高調波振
動数を計算する。理論高調波振動数ｔ５．　　は、単に
高調波の番号に基本振動数を掛けることによって得られ
る。個々の高調波に対するｉ番目の振動数は以下の式に
よって定義される。

ｈｆ７　＝　　ｉｓＩ＋　ｈｏｌｆｒ。

１＜ｉ＜５゜ここで、ｆｒはスペクトル　サンプル　ポイント間の振
動数分解能を表わす。

計算器２１１は基本振動数Ｆｒに応答して以下の式を使
用して高調波振動数ｈｆ、（ここでｉ≧６）を生成する
。

ｈｆＩ＝ｉＦｒ、６＜　ｉ　　＜　ｈ、　　（７）ここ
で、ｈは現フレーム内の高調波の最高数を表わす。

計算器２１１のもう１つの実施態様においては、基本振
動数に応答して以下の式を使用して第５番目の高調波以
上の高調波振動数が計算される。

ｈｆ　１　　＝　　ｎａ　　、　　６　　＜　　　ｉ　
　　＜　　ｈ　　、　　　　　　（８）ここで、ｈは高
調波の最高数を表わし、ａはこのシンセサイザで許され
る振動数分解能を表わす、好ましくは、変数ａは２Ｈｚ
に選択される。ｉ番目の振動数に対する整数ｎは以下の
式を最小化することによって発見され。

（ｉＦｒ−ｎａ）”　　　　　　（９）ここで、ｉＦｒ
はｉ番目の理論高調波振動数を表わす、こうして、異な
るパターンの小さなオフセットが生成される。

計算器２１１のもう１つの実施態様においては、基本振
動数及び好ましくは最初から５つの高調波振動数に対す
るオフセットに応答して好ましくは５番目の高調波以上
の高調波振動数がこれらオフセットを残りの高調波を５
つのグループに分けこれらグループにこれらオフセット
を加えることによって生成される。これらグループは（
ｋ□＋１　、、、、２　ｋ□）。

（２ｋ１＋、、、、　３　ｋｌ）、、、、によって表わ
される。　ここで、好ましくは　ｋ工＝５とされる。

以下の式はｍｋ□＋１から（ｒｎ　＋　１　）　ｋ　ｘ
にて表わされる一群の高調波に対するこの実施態様を定
義する。

ｈ　ｆ　ｒ　＝ｊＦ　ｒ　　＋　　ｈ　ＯＪここでｊ　　＝　　ｍｋ１＋１．、、、（ｍ＋１）ｋｍに対し
て（ｈｏ）＝Ｐｅｒｍ　（ｈｏ、）　ｉ＝１．２．、、、
、、に１（１０）Ｉ　　　　　　　　　Ａ＋ここで、ｍは整数である。

これら置換は変数ｍ（グループ番号）の関数である。　
　原則として、高調波の数かに□の倍数でないときは最
後のグループは完結しないことに注意する。これら置換
は周知の技術を使用して個々の音声フレームに対してラ
ンダムに、決定論的に、あるいは発見的に定義される。

計算器２１１及び２１２は、基本振動数及び個々の高調
波振動数に対して１つの値を生成する。この値は合成さ
れる音声フレームの中心に位置するものと想定される。

フレーム内の個々のサンプルに対する残りのサンプル当
たりの振動数は隣接する発声フレームの振動数あるいは
隣接する非発声フレームに対する所定の境界状態の線形
挿間によって得られる。この挿間はシヌソイダル発生器
２１４内で遂行されるが、これに関しては後に詳細に説
明される。

高調波振幅計算器２１３は計算器２１１及び２１２によ
って計算された振動数、計算器２１６を介して受信され
るＬＰＣ係数、及び経路２２０を介して受信されるフレ
ーム　エネルギーｅｏに応答して高調波振幅を計算する
。個々の発声フレームに対するＬＰＣ反射係数は個々の
フレームの間の声帯を表わす音響チューブ　モデルを定
義する。この情報から相対高調波振幅が決定される。た
だし、ＬＰＣ係数は声帯の構造をモデル化するもので、
個々のこれら高調波振動数のエネルギーの量を表わす情
報は含まない。この情報は計算器２１３によって経路２
２０を介して受信されるフレーム　エネルギーを使用し
て決定される０個々のフレームに対して、計算器２１３
は高調波振幅を計算する。これは、振動数の計算と同様
にこの振幅がフレームの中心に位置するものと想定する
。次に線形挿間を使用し、隣接する発声フレームからの
振幅情報あるいは隣接する非発声フレームに対する所定
の境界状態を使用してこのフレームを通じて残りの振幅
が計算される。

これら振幅は声帯が以下によって表わされるオール　ボ
ール　フィルタにて記述できることから発見できる。

ここで、である。

定義により、係数ａ０は１である。オールボール　フィ
ルタを記述するのに必要な係数ａ　　、１≦ｍ≦１０　
は、マーケル、Ｊ、Ｄ。

（Ｍａｒｋｅｌ、　Ｊ、Ｄ、）、及びグレイ、Ｊｒ、Ａ
、Ｈ。

（Ｇｒａｙ、　Ｊｒ、、　Ａ、Ｈ，）による文献［音声
の線形予測（Ｌｉｎｅａｒ　Ｐｒａｄｉｃｔｉｏｎ　ｏ
ｆ　５ｐｅｅｃｈ）　］、スプリンガ　バーラッグ（Ｓ
　ｐｒｉｎｇｅｒ−Ｂｅｒｌａｇ）、ニューヨーク、ニ
ューヨーク、１９７６年に説明の反復ステップアップ手
順を使用して経路２１６を介して受信される反射係数か
ら得ることができる。式（１１）及び式（１２）にて記
述されるフィルタを使用して以下の方法で個々のフレー
ムに対する高調波成分の振幅が計算される。計算される
べき高調波振幅を　ｈａ　、Ｏ≦ｉ≦ｈと表わすものと
する。

ここで、ｈは高調波の数を表わす。すると、未スケール
（ｕｎｓｅａｌｅｄ）の高調波寄与値ｈｅ　。

Ｏ≦ｉ≦ｈが個々の高調波振動数ｈｆ　　に対して以下
の式から得られる。

ここで、ｓｒはサンプリング速度を表わす。

全高開披の総未スケール　エネルギーＥは以下によって
得られる。

ここで、と仮定すると、１番目のスケール済み（ｓｃａｌｅｄ）
高調波振幅ｈａｄは以下によって計算できる。

ここで、ｅＯはアナライザ１００によって計算された伝
送された音声フレームのエネルギーを表わす。

次にシヌソイダル発生器２１４がいかに計算器、、２１
１，２１２．及び２１３から受信される情報を使用して
式（１）によって記述される計算を遂行するか説明する
。任意のフレームに対して、計算器２１１，２１２．及
び２１３は発生器２１４に対してそのフレーム内の個々
の高調波に対する１つの振動数及び振幅を与える。発生
器２１４はこれら振動数及び振幅の両方の線形挿間を遂
行し、振動数情報を位相情報に変換し、フレームを通じ
ての個々のサンプル　ポイントに対する位相及び振幅を
与える。

この線形挿間は以下のように遂行される。

第７図は５つの音声フレーム及び０番目の高調波振動数
であるともみなされる基本振動数に対するその線形挿間
を示す、他の高調波も類似に表現できる。大まかに言っ
て、ある発声フレームに対して３つの境界状態が存在す
る。第１の場合、発声フレームは１つの先行非発声フレ
ーム及び１つの後続発声フレームを持つ、第２の状態で
は、発声フレームは他の発声フレームによってとりまか
れる。第３の状態では、発声フレームは１つの先行発声
フレーム及び１つの後続非発声フレームを持つ、第７図
において、フレームＣ、ポイント７０１から７０３は第
１の状態を表わしフ振動数ｈｆ　　は７０１によって定
義されるこのフレームの開始から一定であると想定され
る。

基本振動数に対しては、　ｉはＯである。　Ｃはこれが
Ｃフレームであることを示す、フレームｂは　フレーム
Ｃの後に来るが、ポイント７０３から７０５によって定
義され、第２の状態を表わし；線形挿間がポイント７０
２と７０４の間でそれぞれポイント７０２と７０４の間
で起こる振動数ｈｆ、及びｈｆ。

を使用して遂行される。第３の状態はポイント７０５か
ら７０７に延びるフレームによって代表され、フレーム
ａに続くフレームは非発声フレーム、つまりポイント７
０７から７０８である。この状態においては、高調波振
動数ｈｆ、　はフレームａの終端のポイント７０７まで
一定である。

第８図は振幅の挿間を示す。連続の発声フレーム、例え
ば、フレームＣ及びｂにて定義されるフレームでは、挿
間は振動数に対する挿間と同一である。ただし、先行フ
レームが非発声フレームである場合１例えば、フレーム
Ｃの前にポイント８００から８０１によって定義される
非発声フレームが存在するような関係においては、この
フレームの開始点はポイント８０１によって示されるよ
うに０の振幅を持つものと想定される。同様に、発声フ
レームの後に非発声フレームが続く場合、例えば、　フ
レームａとポイント８０７から８０８によって表わされ
るフレームの関係では、終端ポイント、例えば、ポイン
ト８０７は０の振幅を持つものと想定される。

発生器２１４は上に説明の挿間を以下の式を使用して遂
行する。ｎ番目のサンプルのバーサンプル（ｐｅｒ−ｓ
ａｍｐｌｅ）位相は以下によって定義される。

二こで、０　　はｉ番目の高調波のバーサンプル（ｐｅ
ｒ−ｓａｍｐｌｅ）位相を表わし、ｓｒは出力サンプル
速度を表わす、これら位相を解くためには、バーサンプ
ル振動数Ｗ。、１　を知ることのみが必要であり、これ
らバーサンプル振動数は挿間を行なうことによって発見
できる。第７図のフレームｂのように発声フレームが隣
接する発声フレームに対する振動数の線形挿間は以下に
よって定義される。

ここで、ｈ　　は隣接するどちらかのフレーム内の高調
波の最小数を表わす。非発声フレームからの発声フレー
ムへの遷移１例えば、フレームＣは以下の式によってバ
ーサンプル高調波振動数を計算すること１こよって処理
される。

発声フレームから非発声フレームへの遷移。

例えば、フレームａは以下の式によってバーサンプル高
調波振動数を計算することによって処理される。

ｈｍｌｎが２つの隣接するフレーム内のいずれかの高調
波の最低数を表わすものとすると、フレームｂがフレー
ムＣより多くの高調波を持つような場合は、式（２０）
を使用してｈｍｌｎ以上の高調波に対するバーサンプル
高調波振幅数が計算される。フレームｂがフレーム　ａ
　より多数の高調波を持つ場合は、式（２１）を使用し
てり。１ｎ　以上の高調波に対するバーサンプル高調波
振動数が計算される。

このバーサンプル高調波振幅Ａｎ、はｈａ７から発声フ
レームｂに対する以下の式によって定義されるように類
似の方法で計算される。

９０＜ｎ＜１７９．Ｏ＜ｉ＜ｈ及びフレームが発声領域の開始、例えば、フレームＣの開始
ポイン１〜であるような場合は、バーサンプル高調波振
幅は以下によって決定される。

Ａ　ｏ　、　＋’　＝Ｏ＋　Ｏ’　ｘ　’　ｈ　　　　
　（２４）及びここで、ｈはフレーム内の高調波の数を表わす。

フレームが発声領域の終端である場合、例えば、フレー
ムａのような場合は、バーサンプル振幅は以下によって
計算される。

ここで、ｈはフレームａ内の高調波の数を表わす。ある
フレーム、例えば、フレームｂが先行発声フレーム、例
えば、フレームＣより多くの高調波を持つ場合は、式（
２４）及び式（２５）を使用してｈ□ｉｎ　以上の高調
波に対する高調波振幅が計算される。フレームｂがフレ
ームａより多数の高調波を持つ場合は、式（１８）を使
用してｈ　　以上の高調波に対する高調波振幅が計算さ
れる。

次に、第１図に示されるアナライザを詳細に説明する。

第１０図及び第１１図は、第１図のフレーム　セグメン
タ１４１を実現するのに必要なステップを示す。個々の
サンプルＳが、Ａ／Ｄブロック１０１から受信されると
、セグメンタ１４１は個々のサンプルを循環バッファＢ
に格納する。ブロック１００１から１００５は、ｉイン
デックスを使用してサンプルを循環バッファ已に連続的
に格納する。判定ブロック１００２によって、ｊとバッ
ファの終端を定義するＮとを比較することによって循環
バッファＢが終端に到達したか決定される。Ｎはまた、
そのスペクトル分析におけるポイントの数を表わす。好
ましくは、Ｎは２５６とされ、Ｗは１８０とされる。ｊ
が順番バッファの終端を越えると、ブロック１０ｏ３に
よってｉがＯにセットされ、次にサンプルが循環バッフ
ァＢの始めから格納される。判定ブロック１００５によ
って循環バッファＢ内に格納されたサンプルの数がカウ
ントされ；Ｗによって定義される１つのフレームを構成
する好ましくは１８０個のサンプルが格納されると、ブ
ロック１００６が実行され；まだＷに達してない場合は
、１００７が実行され、第１０図に示されるステップは
単にブロック１０１からの次のサンプルを待つ。１８０
ポイントが受信されると、第１０図及び第１１図のブロ
ック１００６から１１０６によって循環バッファＢから
の情報がアレイＣに送られ、アレイＣ内の情報が次に第
６図に示されるセグメントの１つを記述する。

ダウン　サンプラ１４２及びハミング　ウイントウ　ブ
ロック１４３は第１１図のブロック１１０７から１１１
０によって実現される。ブロック１４２によって遂行さ
れるダウン　サンプリングはブロック１１０８によって
実現され；式（２）によって定義されるハミングウイン
ドニング機能はブロック１１０９によって遂行される６
判定ブロック１１０７及びコネクタ　ブロック１１１０
によってアレイＣ内に格納されるデータ　ポイントの全
てに対するこれら動作の遂行が制御される。

第１２図のブロック１２０１から１２０７はＦＦＴスペ
クトル規模ブロック１４４の機能を実現する。式（３）
によって定義されるゼロの挿入はブロック１２０１から
１２０３によって遂行される。ブロック１２０１から１
２０３から結果として得られるデータ　ポイントに関す
る速いフーリエ変換の実現はブロック１２０４によって
遂行され、これによって式（４）によって定義されるの
と同一結果が得られる。ブロック１２０５から１２０７
は式（５）によって定義されるスペクトルを得るのに使
用される。

第１図のブロック１４５，１４６及び１４７は第１２図
及び第１３図のブロック１２０８から１３１４によって
示されるステップによって実現される。第１図の経路１
３１を介してピッチ検出器１０９から受信されるピッチ
周期はブロック１２ｏ８によって基本振動数Ｆｒに変換
される。

この変換は高調波ピーク　ロケータ１４５及び高調波計
算器１４７の両方によって遂行される。基本振動数が、
好ましくは、　６０Ｈｚと決定される所定の振動数Ｑ以
下である場合は、判定ブロック１２０９は制御をブロッ
ク１３０１及び１３０２にパスし、ここで高調波オフセ
ットが０にセットされる。基本振動数が所定の値Ｑより
大きな場合は、判定ブロック１２０９によって制御が判
定ブロック１３０３にパスされる。判定ブロック１３ｏ
３及びコネクタ　ブロック１３１４は、好ましくは、高
調波１から５のサブセットの高調波オフセットの計算を
制御する。初期高調波はに、によって定義され１にセッ
トされ、上限高調波値はに□によって定義され５にセッ
トされる。ブロック１３０４は現在計算中の高調波がス
ペクトルＳ内に発見されるかの初期推定を行なう。ブロ
ック１３０５から１３０８は現在計算中の高調波と関連
するピークの位置を探索し発見する。これらブロックは
高調波ピーク　ロケータ１４５を実現する。ピークの位
置が発見されると、ブロック１３０９によってブロック
１４６の高調波挿間機能が遂行される。

高調波計算器１４７はブロック１３１０から１３１３に
よって実現される。最初、現在計算中の高調波に対する
未スケール　オフセットがブロック１３１０の実行によ
って得られる。次に、ブロック１３１ｏの結果がブロッ
ク１３１１Ｌこよってスケールされ、整数が得られる０
判定ブロック１３２１によって検出された高調波ピーク
がエラーでないことを保証するためオフセットが所定の
範囲内にあるかチェックされる。計算されたオフセット
が所定の範囲より大きな場合は、オフセットがブロック
１３１３の実行によって０にセットされる。全ての高調
波オフセットが計算されると、制御は第１図のパラメー
タ符号器１１３にパスされる。

第１４図から第１９図は第２図のシンセサイザ２００を
実現するためにプロセッサ８０３によって実行されるス
テップの詳細を示す。

第２図の高調波振動数計算器２１２及び２１１は第１４
図のブロック１４１８から１４２４によって実現される
。ブロック１４１８はこの動作において使用されるパラ
メータを初期化する。ブロック１４１９から１４２０は
最初に伝送ピッチとして得られる基本振動数にに＋１を
掛けることによって個々の高調波振動数ｈｆｈを計算す
る。全ての理論高調波振動数が計算されたら、スケール
され伝送されたオフセットがブロック１４２１から１４
２４によって最初の５つの理論高調波振動数に加えられ
る。定数に０及びに１がブロック１４２１によってそれ
ぞれ１”及び１１５　Ｉ＋にセットされる。

高調波振幅計算器２１３は第８図のプロセッサ８０３に
よって第１４図及び第１５図のブロック１４０１から１
４１７を実行することによって実現される。ブロック１
４０１から１４０７は式（１１）によって与えられる声
帯のオール　ボール　フィルタ記述に対するＬＰＣ反射
係数を変換するためのステップアップ手順を実行する。

ブロック１４０８から１４１２は個々の高調波に対して
式（１３）にて定義される未スケール高調波エネルギー
を計算する。ブロック１４１３から１４１５は式（１４
）によって定義される総未スケール　エネルギーＥを計
算するのに使用される。

ブロック１４１６及び１４１７は式（１６）によって定
義されるｉ番目のフレームのスケールされた高調波振幅
ｈａｂ　を計算する６第１５図から第１８図のブロック
１５０１から１５２１及びブロック１６０１から１６１
４はプロセッサ８０３によって第７図及び第８図に示さ
れるように個々の高調波に対する振動数及び振幅を挿間
するために遂行される動作を示す。これら動作は、フレ
ームの最初の部分をブロック１５０１から１５２１によ
って処理し、フレームの第２の部分をブロック１６０１
から１５１４によって処理することによって遂行される
。第７図に示されるように、フレームＣの最初の半分は
ポイント７０１から７０２に延び、フレームＣの後半は
ポイント７０２から７０３に延びる。これらブロックに
よって遂行される最初の動作は先行フレームが発声フレ
ームであるか非発声フレームであるか決定する動作であ
る。

より具体的には、第１５図のブロック１５０１によって
初期値がセットされる。判定ブロック１５０２は先行フ
レームが発声フレームであるか非発声フレームであるか
の判定を行なう。先行フレームが非発声フレームである
場合は、判定ブロック１５０４から１５１０が実行され
る。第１７図のブロック１５０４及び１５０７はフレー
ムの開始において個々の高調波に対する高調波振動数及
び振幅の最初のデータ　ポイントを位相に対してｈｆ３
、そして振幅に対してａｐ＝ｏに初期化する。

これは第７図及び第８図の図解に対応する。

フレームの最初のデータ　ポイントに対する初期値がセ
ットしたら次にこのフレームに対する残りの値がブロッ
ク１５ｏ８から１５１０を実行することによってセット
される。高調波振動数の場合は、これら振動数は第７図
に示されるように中心振動数にセットされる。

高調波振幅の場合は第８図のフレームＣに対して示され
るように個々のデータ　ポイントがフレームの開始点の
所のゼロから中点振幅に向かって線形近似セットされる
。

ブロック１５０２において先行フレームが発声フレーム
であると判定された場合は、第１６図の判定ブロックが
遂行される。判定ブロック１５０３は先行フレームが現
在のフレームより多くの高調波を持つか否かを決定する
。高調波の数は変数ｓｈによって示される。

どちらのフレームが多くの高調波を持つかによって、ブ
ロック１５０５が実行されるかブロック１５０６が実行
されるかが決定される。

変数ｈｍｉｎ　　はいずれかのフレームの高調波の最低
数にセットされる。ブロック１５０５あるいは　１５０
６が実行された後、ブロック１５１１及び１５１２が実
行される。これらブロックは振動数及び振幅の両方に対
する現フレームの初期ポイントを先行フレームの最終ポ
イントを計算することによって決定する。

この動作を全ての高調波に対して遂行した後に、ブロッ
ク１５］３から１５１５によって全ての高調波に対する
振動数及び振幅の両方に対する個々のサンプル毎の値が
それぞれ式（２２）及び式（２６）によって定義される
ように計算される。

変数り。、ｎにて定義されるように全ての高調波に対す
るバーサンプル振動数及びバーサンプル振幅が計算され
たら、ブロック１５１６から１５２１が現在のフレーム
が先行フレームよりも多くの高調波を持つ事実が考慮さ
れるように計算される。現在のフレームが先行フレーム
よりも多数の高調波を持つ場合は、判定ブロック１５１
６は制御をブロック１５１７に渡す、現在のフレーム内
に先行フレームより多数の高調波が含まれる場合は、ブ
ロック１５１７から　１５２１が実行されるが、　これ
ら動作は先に説明のブロック１５０４から１５１０と同
一である。

フレームの後半の個々の高調波に対する振動数及び振幅
に対するバーサンプル　ポイントの計算がブロック１６
０１から１６１４によって図解される。ブロック１６０
１によって次のフレームが発声フレームであるか非発声
フレームであるか決定される。次のフレームが非発声フ
レームである場合は、ブロック１６０３から１６０７が
実行される。初期ポイントは振動数及び振幅の両方とも
フレームの中間ポイントであるため、ブロック１５０４
及び１５０７によって遂行されるような初期値の決定は
必要でない。ブロック１６０３からブロック１６０７は
ブロック１５０８から１５１０によって遂行されるのと
類似する機能を遂行する。次のフレームが発声フレーム
である場合は、判定ブロック１６０２及び１６Ｑ４ある
いは１６０５が実行される。これらブロックの実行は前
述のブロック１５０３゜１５０５、及び１５０６におけ
る説明と類似する。ブロック１６０８から１６１１の動
作は前述のブロック１５１３から１５１６の動作と類似
する。フレームの後半では振動数及び振幅に対して初期
状態をセットする必要はない。ブロック１６２１から１
６１４の動作は前述のブロック１５１９から１５２１の
動作に類似する。

発生器２１４によって遂行される最後の動作は前述のよ
うにして個々の高調波に対して計算されたバーサンプル
振動数及び振幅を使用しズ゛音声の実際のシヌソイダル
合成を行な・５１″：、とである、第１−９図のブロッ
ク１７０１かＥ、、　Ｌ　７０７は先に計算された振動
数情報を使用してこれら振動数から高調波の位相を計算
し５次←こ式（］、）によって定義される計算を遂行す
るゆブロック１７ｏ２及び１７０３はフレームの口４始
に対する初期音声サンプルを決定する。、７の初期・ｆ
インｌ−＝　六＜決定された後、プロッタ１７０４か”
ｐ　１　’７０７によってこＩ−７リー１１／−ム仁゛
々９する残りの音声サンプルが快定さｆｌ、　２”１９
次にこれらブロックからの出力・デデジタル／アナログ
　コンバー・夕２０８に伝送される９２−ｉプ器２１１の生、・うコ・２の実！ｌ’＋！態様
は、第２．０図に示されるように伝送された高調波オフ
セットを再使用して５以し−の高調波に対する計算理論
高調波振動数を修正する。ブロック２００３から２００
５は５番目の高調波以上の高調波を５つのグループにグ
ループ化し、次にブロック２００６及び２００７によっ
てこれらグループの個々の理論高調波振動数に対応する
伝送された高調波オフセットが加えられる。

第２１図は計算器２１１の第２の実施態様に示すが、　
これは第２０図に示される実施態様とはブロック２１０
０によって最初の５個の高調波以上の個々のグループの
高調源振！Ｉ′Ｉ数に対してオフセラ１−の順番がラン
ダムに同′換される点が異なる。第２１図のブロック２
１０］から２１０８は第２０図の対応するブロックと類
似する機能を遂行する。

第２２図は計算器２１１の第３の実施態様を示す。この
実施態様はブロック２２０２及び２２０５の制御下で個
々の高調波振動数に対してブロック２２０３及び２２０
４に示される計算を遂行することによって第２図の計算
器２１３及び２１４に伝送された理論高調波振動数の修
正高調波振動数を得る。

上に説明の実施態様は単に本発明の原理を解説するため
のものであり、本発明の精神及び範囲から逸脱すること
なく他の構成を考案できることは明白である。

【図面の簡単な説明】

第１図は本発明による音声アナライザのブロック図；第２図は本発明による音声シンセサイザのブロック図；第３図は発声領域の間に音声を再生するための情報を含
むパケットを示す図；第４図は非発声領域の間にノイズ励振を使用して音声を
再生するための情報を含むパケットを示す図；第５図は非発声領域の間にパルス励振を使用して音声を
再生するための情報を含むパケットを示す図；第６図は第１図の音声フレーム　セグメンタ１４１が音
声フレームを音声セグメントにて、いかにオーバラップ
させるかを示す図７第７図は第２図のシンセサイザによ
って基本及び高調波振動数に対して遂行される挿間をグ
ラフ形式にて示す図；第８図は第２図のシンセサイザによって基本及び高調波
振動数の振幅に対して遂行される挿間をグラフ形式にて
示す図；第９図は第１図及び第２図のデジタル信号プロセッサの
構成を示す図；第１０図から第１３図は第９図の信号プロセッサ９０３
を制御して第１図のアナライザ回路を動作させるための
プログラムの流れ図；第１４図から第１９図は第９図の
デジタル信号プロセッサ９０３の実行を制御して第２図
のシンセサイザを動作させるためのプログラムの流れ図
：そして第２０図、第２１図、及び第２２図は第９図のデジタル
信号プロセッサ９０３の実行を制御して第２図の高高調
波計算器２２１を動作させるためのその他のプログラム
　ルーチンの流れ図である。［主要部分の符号の説明］Ａ／Ｄ　　コンバータ　・・・・・・・・・・・・・・
・・・・１０１フレームセグメンタ　・・・・・・・・
・・・・・・・・１０２エネルギー計算器・・・・・・
・・・・・・・・・・・・・１０３０−バスフイルタ　
・・・・・・・・・・・・・・・・・１０４パラメータ
符号器・・・・・・・・・・・・・・・・・・・１１３
チャネル復号器・φ・・・・・・・・・・・・・・・・
・・・２０１ホワイト　ノイズ発生器・・・・・・・・
・・・・・・２０３パルス発生器・・・・・・・・・・
・・・・・・・・・・・・・２０４選択スイッチ・・・
・・・・・・・・・・・・・・・２０５．２０６合成フ
ィルタ　・・・・・・・・・・・・・・・・・・・・・
・・２０７Ｄ／Ａ　コンバータ　・・・・・・・・・・
・・・・・・・・２０８ＦＩＧ、６将ち数１挨中冨堝中亀の坤ｒ昌ＦＩＯ，８ＦＩＧ、　１０ＦＩＧ、　ＩＩＦＩＧ、　／２Ｆｌ（９，１４Ｆｌに、　１５Ｈダ１５Ｆ／に、　／７ＦＩＧ、　／９Ｗ庄斐＃？豚２０８へＦＩＧ、２０Ｆ１ａ、２／Ｆｌσ、２２

Claims

【特許請求の範囲】１、人の音声を符号化するための処理システムにおいて、該システムが：音声を個々が音声の瞬時振幅の所定の数の均一な間隔のサンプルを持ちまた個々が所定の数のサン
プルだけ先行フレーム及び後続フレームにオーバラップ
する複数の音声フレームにセグメント化するためのセグ
メンタ、例えば（１０２、１４１）；個々のフレームに対して声帯を定義するセットの音声パラメータ信号を計算するためのＬＰＣ計算
器、例えば（１１１）；及び音声サンプルのフレーム当たりのフレームエネルギーを計算するためのエネルギー計算器、例えば
（１０３）を含み、該処理システムがさらに個々のフレームに対するスペクトルを生成するために個々のフレームの該音声サンプルのスペクト
ル分析を遂行するためのスペクトルアナライザ、例えば
（１４２、１４３、１４４）；個々のフレームに対応するスペクトルから個々のフレームに対する基本振動数信号を検出するため
のピッチ検出器、例えば（１０９）；個々のフレームに
対応するスペクトルから個々のフレームに対するサブセットの高調波振動数信号
を計算するための高調波ピーク発見器、例えば（１４５
）；個々の該高調波振動数信号と該基本振動数信号の倍数との差を表わすオフセット信号を計算するた
めの高調波計算器、例えば（１４７）；及び該フレームエネルギーを表わす符号化信号、該セットの音声パラメータ、該基本振動数信号及び
該オフセット信号を後の音声合成のために伝送するため
のパラメータ符号器、例えば（１１３）を含むことを特
徴とするシステム。２、特許請求の範囲第１項に記載のシステムにおいて、該スペクトルアナライザが該音声サンプルをダウンサンプリングするためのサンプ
ラ、例えば（１４２）を含み、これによって計算の量が
軽減されることを特徴とするシステム。３、特許請求の範囲第２項に記載のシステムにおいて、該ピッチ検出器がさらにフレームを発声
フレーム及び非発声フレームに識別し、該システムがさ
らにあるフレームの音声が人の喉頭内のノイズ様のソー
スに起因し該検出器が非発声フレームであることを示す
場合はノイズ様励振を使用することを指示する信号を送
るためのノイズ／多重パルス判定回路、例えば（１１２
）；及び該ノイズ様ソースが存在せず該手段が非発声フレームであることを示す場合は多重パルス励振ソー
スから励振情報を生成するための多重パルスアナライザ
、例えば（１１０）を含み、該パラメータ符号器がさらに該多重パルス励振情報及び該セットの音声パラメータに応答して多重
パルス励振情報及び該セットの音声パラメータの符号化
信号を後の音声合成のために伝送することを特徴とする
システム。４、音声フレームを表わす符号化情報から音声を合成するための方法において、該フレームの個
々が音声の瞬時振幅の所定の数の均一な間隔のサンプル
を持ち、個々のフレームを表わす該符号化情報がフレー
ムエネルギー、セットの音声パラメータ、音声の基本振動数及び
基本振動数信号から派生された理論高調波振動数と実際
のサブセットの高調波振動数との間の差を表わすオフセ
ット信号から成り、該方法が：該オフセット信号に対応するサブセットの高調波位相信号を計算するステップ；該フレームに対する残りの高調波位相信号を該基本振動数信号から計算するステップ；該基本信号
、該サブセットの高調波位相信号及び該残りの高調波位相信号の振幅を該フレームのフ
レームエネルギー及びセットの音声パラメータから決定するステップ；及び該フレーム
に対する該基本信号、該サブセット及び残りの位相信号並びに該計算された振幅に応答
して複製音声を生成するステップを含むことを特徴とす
る方法。５、特許請求の範囲第４項に記載の方法において、該残りの高調波位相信号を計算するステップ
が個々の高調波の数を該基本振動数信号に掛けることに
よって該個々の残りの高調波位相信号に対する振動数を
生成するステップ；該生成される振動数を算術的に修正するステップ；及び該残りの位相信号を該修正された振動数から計算するステップを含むことを特徴とする方法。６、特許請求の範囲第４項に記載の方法において、該残りの高調波位相信号を計算するステップ
が該残りの高調波位相信号に対応する残りの高調波振動
数信号を該基本振動数信号に該個々の残りの高調波信号
に対する高調波の数を掛けることによって生成するステ
ップ；該掛けられた振動数信号を個々が該サブセットの高調波位相信号と同数の高調波を持つ複数のサブ
セットにグループ化するステップ；該個々のオフセット
信号を該複数の個々のサブセットの対応するグループ化された振動数信号に加
えることによって修正された残りの高調波振動数信号を
生成するステップ；及び該修正された高調波振動数信号から該残りの高調波位相信号を生成するステップを含むことを特徴
とする方法。７、特許請求の範囲第６項に記載の方法において、該修正された残りの高調波振動数信号を生成
するために該オフセットを加えるステップが該複数の個
々のサブセットの対応するグループ化された振動数信号
に該信号を加える前に該オフセット信号の順番を並べ変
えるステップが含まれることを特徴とする方法。８、特許請求の範囲第４項に記載の方法において、該振幅を計算するステップがあるフレーム
に対する該セットの音声パラメータから該個々の高調波
位相信号の未スケールエネルギーを計算するステップ；該フレームに対する該高調波位相信号の全てを通じての該未スケールエネルギーの総和を求めるステップ；及び該高調波位相信号の振幅を個々の高調波信号の該高調波エネルギー、総和未スケールエネルギー及び該フレームに対するフレームエネルギー
に応答して計算するステップが含まれることを特徴とす
る方法。