JPS6370300A - 人の音声の符号化処理システム - Google Patents

人の音声の符号化処理システム

Info

Publication number
JPS6370300A
JPS6370300A JP62171340A JP17134087A JPS6370300A JP S6370300 A JPS6370300 A JP S6370300A JP 62171340 A JP62171340 A JP 62171340A JP 17134087 A JP17134087 A JP 17134087A JP S6370300 A JPS6370300 A JP S6370300A
Authority
JP
Japan
Prior art keywords
frame
harmonic
signal
remaining
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62171340A
Other languages
English (en)
Other versions
JPH0833753B2 (ja
Inventor
エドワード チャールズ ブロンソン
ウォルター ソーンレイ ハートウェル
トーマス エドワード ジャコブス
リチャード ハリー ケッチャム
ウィレム バスチアアン クレイジン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
American Telephone and Telegraph Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by American Telephone and Telegraph Co Inc filed Critical American Telephone and Telegraph Co Inc
Publication of JPS6370300A publication Critical patent/JPS6370300A/ja
Publication of JPH0833753B2 publication Critical patent/JPH0833753B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Devices For Supply Of Signal Current (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 退J野と艷 本発明は音声処理、より詳細には、ボコーダ−のアナラ
イザ セクションからの基本振動数及び高調波のサブセ
ットのみを使用する音声の発声部分に対するシヌソイダ
ル モデル及び音声の非発声部分に対する励振線形予測
符号化フィルタを利用して音声の複製を生成するデジタ
ル音声符号及び復号装置に関する。
11じl」延 音声メモリ及び音声レスポンス設備を含むデジタル音声
通信システムは記憶及び/或いは伝送に必要とされるビ
ット速度を低減するために信号圧縮を使用する。従来の
デジタル音声符号化技術が、R,J、マツフォーレイ(
R,J 、 McAulay)らによって、音響、音声
、及び信号処理に関するZEEE国際会議録(Proc
eedings of IE E E Interna
tionalConference on Acous
tics、 5peech、 andSignal P
rocessing)s 1984年、Vol。
2、ページ27.6.1−27.6.4 (サンジエゴ
、U、S、A、)に掲載の論文[シヌソイダル モデル
を使用する規模のみの再生(Magnitude−On
ly Reconstruction Usinga 
 S 1nusoidal S peech Mode
l) ]に開示される。この論文においては音声の発声
部分及び非発声部分の両方を符号化及び復号するために
シヌソイダル音声モデルが使用される。
音声波形がボコーダ−のアナライザ部分内で音声波形を
正弦波の総和としてモデル化することによって分析され
る。この正弦波の総和は音声波形の基本振動数と高調波
から構成され、以下によって表わされる。
5(n)−Σa1(n) sin [φ、(n)]  
  (1)ここで、ar(n)及びφ1(n)はそれぞ
れ任意の時間における音声波形の時間とともに変化する
振幅及び位相を表わす。発声処理機能がアナライザ部分
内でこれら振幅及び位相を計算することによって遂行さ
れ、これら値が合成部分に伝送され、ここで式(1)を
使用して音声波形の再生が行なわれる。
R,J、マツフォーレイ(R、J 、 McAulay
)らの論文は、ボコーダ−のアナライザ部分による全て
の高調波に対する振幅及び位相の計算、及びこれら情報
のボコーダ−の合成セクションへの伝送を開示する。位
相は瞬時周波数の積分であるという事実を使用して、合
成セクションは基本振動数及びその高調波振動数から対
応する位相を計算する。アナライザはこれら振動数をこ
れらがこのスペクトル内のピークとして現われるため速
いフーリエ変換(fast Fourier tran
sfor+*、 F F T)スペクトルから計算する
。つまり、単にピーク検出を行なうことによって基本及
び高調波の振動数及び位相が計算される。アナライザに
よって基本及び全ての高調波の振動数に加えて振幅が決
定されると、この情報はシンセサイザに伝送される。
基本及び全ての高調波の振動数に加えてこれら振幅が伝
送されるため、この情報をアナライザからシンセサイザ
に伝送するのに秒当たり多量のビットが必要となるとい
う問題が存在する。これに加えて、これら振動数及び振
幅は、結果としてのスペクトル内のピークのみから直接
に計算されるため、これらピークを検出されるために遂
行されるFFT計算は非常に正確であることが要求され
、結果として高度の計算が要求されるという問題が存在
する。
鼠久友豊 本発明は、これら問題及び先行技術の短所を解決し、技
術上の向上を達成することを目的とする1本発明の方法
及び構造上の実施態様においては、音声の分析及び合成
がアナライザ内で基本振動数及びサブセットの高調波振
動数のみを計算し、シンセサイザ内で音声を音声の発声
部分に対するシヌソイダル モデルを利用して再生する
ことによって達成される。このモデルは、基本振動数及
びサブセットの高調波振動数を使用して構築され、残り
の高調波振動数は理論高調波振動数からの差異を与える
計算を使用して基本振動数から計算される。基本振動数
及び高調波振動数の振幅は、アナライザからシンセサイ
ザに直接に伝送されるのではなく、シンセサイザの所で
アナライザから受信される線形予測符号化(linea
r predictive coding、 L P 
G)係数及びフレーム エネルギーから計算される。こ
うして、振幅を直接に伝送するのでなく振幅を再生する
ために必要な情報を伝送することによって、これに要求
されるビット数が非常に削減できる。
計算を簡素化するために、アナライザはFFTスペクト
ルから基本振動数及び高調波振動数をそれらピークを発
見し次にスペクトル内のどこにピークが起こるかをより
正確に決定するための挿間を行なうことによって計算す
る。これは低い振動数分解能のFFT計算を使用するこ
とを可能とする。
個々の音声フレームに対して、シンセサイザはフレーム
 エネルギー、セットの音声パラメータ、基本振動数、
及び基本振動数から派生された個々の理論高調波振動数
とサブセットの実際の高調波振動数との間の差を表わす
オフセット信号から成る符号化情報に応答する。シンセ
サイザはオフセット信号及び基本振動数信号に応答して
そのオフセット信号に対応するサブセットの高調波位相
信号を計算し、また、基本振動数に応答して残りの高調
波位相信号を計算する。シンセサイザはフレーム エネ
ルギー及びセットの音声パラメータに応答して基本振動
数信号、サブセットの高調波位相信号、及び残りの高調
波位相信号の振幅を計算する。シンセサイザは次に基本
信号、高調波位相信号及びこれら信号の振幅に応答して
音声を再生する。
1つの実施態様においては、シンセサイザは、この残り
の高調波振動数信号を基本振動数に高調波の数を掛けて
計算し1次に結果としての振動数を変化させて残りの高
調波位相信号を計算する。
第2の実施態様においては、シンセサイザはこの残りの
高調波振動数信号を最初に基本振動数信号に高調波の数
を掛けることによって理論高調波振動数信号を計算する
ことによって生成する。シンセサイザは次に残りの高調
波振動数信号に対応する理論高調波振動数信号を個々が
元のサブセットの高調波位相信号と同数の高調波を持つ
複数のサブセットにグループ化し、次に個々のオフセッ
ト信号を個々の複数のサブセットの対応する残りの理論
振動数信号に加えることによって修正された残りの高調
波振動数信号を生成する。シンセサイザは次にこの修正
された残りの高調波振動数信号を使用して残りの高調波
位相信号を計算する。
第3の実施態様においては、シンセサイザは第2の実施
態様と類似の方法で残りの高調波振動数信号を計算する
が、オフセット信号の順番が、これら信号が修正された
残りの高調波振動数信号を生成するために理論高調波振
動数信号に加えられる前に入れ替えられる点が異なる。
これに加え、シンセサイザは基本振動数信号及び高調波
振動数信号に対する振幅を個々のフレームに対するセッ
トの音声パラメータから個々の高調波振動数信号の未ス
ケール(unsealed)エネルギーを計算すること
によって計算し、これら未スケール エネルギーを高調
波振動数信号の全てを通じて総和する。
シンセサイザは、次に個々の高調波信号に対する高調波
エネルギー、未スケールの総和エネルギー、及びフレー
ム エネルギーを使用して個々の高調波位相信号の振幅
を計算する。
再生音声の品質を向上させるため、基本振動数信号及び
計算高調波振動数信号は音声フレームの真ん中の1つの
サンプルを表わすものと想定され、シンセサイザは挿間
を使用して基本及び高調波振動数信号の両方に対して音
声フレームを通じての連続サンプルを生成する。類似の
挿間が基本及び高調波振動数の両方の振幅に対しても遂
行される。隣接するフレームが非発声フレームである場
合は、基本及び高調波信号の両方の振動数は発声フレー
ムの中心から非フレームまで一定であると想定され、一
方、振幅は発声フレームと非発声フレームとの間の境界
の所で“0″であると想定される。
非発声フレームの符号化には、セットの音声パラメータ
、多重パルス励振情報、及び励振タイプ信号並びに基本
振動数信号が含まれる。シンセサイザは励振タイプ信号
によってノイズ様励振を使用することが指示される非発
声フレームに応答してノイズ様励振を持つセットの音声
パラメータによって定義されるフィルタを励振する。さ
らに、シンセサイザは多重パルスを使用することを指示
する励振タイプ信号に応答して、多重パルス励振情報を
使用してセットの音声パラメータ信号から構成されるフ
ィルタを励振する。これに加えて、発声フレームから非
発声フレームへの遷移が起こった場合は、最初に発声フ
レームからのセットの音声パラメータがフィルタをセッ
トするのに使用され、このフィルタが非発声領域の間も
指定の励振情報を使用して励振される。
実施例の説明 第1図及び第2図は、それぞれ本発明の焦点である音声
アナライザ及び音声シンセサイザを示す。第1図の音声
アナライザ100は経路120を介して受信されるアナ
ログ音声信号に応答してこれら信号をチャネル139を
介して第2図のシンセサイザ200に伝送するために低
ビツト速度にて符号化する。好ましくは、チャネル13
9は通信伝送経路あるいは記憶媒体とされ、後に合成さ
れた音声を必要とする各種の用途に対する音声合成が提
供できるようにされる。アナライザ100はチャネル1
20を介して受信される音声を3つの異なる符号化技術
を使用して符号化する。音声の発声領域の間に、アナラ
イザ100はシンセサイザ200によって音声のシヌソ
イダル モデリング及び再生に使用される情報の符号化
を行なう、音声の領域は、基本振動数が声帯による空気
の流れに起因する場合は、発声領域と分類される。非発
声領域においては、シンセサイザ100は適当な励振を
持つ線形予測符号化(1inear p r e di
ctivecoding、 L P G )フィルタを
励振することによってシンセサイザ200内で音声の複
製を可能とする情報を符号化する。励振のタイプは、個
々の非発声フレームに対してアナライザ100によって
決定される。破裂音子音と発声領域と非発声領域との間
の非発声と分類される遷移を含む非発声領域において、
多重パルス励振が符号化されシンセサイザ200に送ら
れる。ある非発声フレームに対して多重パルス励振が符
号化されない場合は、アナライザ100はシンセサイザ
200にLPCフィルタを励振するのにホワイト ノイ
ズ励振を使用することを指示する信号を送る。
次に、シンセサイザ100の動作全般をさらに詳細に説
明する。アナライザ100はアナログ/デジタル コン
バータ101からフレームにて受信され、フレーム セ
グメンタ102によってセグメント化されたデジタルサ
ンプルを処理する0個々のフレームは、好ましくは18
0個のサンプルから成る。あるフレームが発声領域であ
るか非発声領域であるかの決定は、以下の方法で行なわ
れる。LPC計算器111はフレームのデジタル サン
プルに応答して人の声帯(vocal tract)を
モデル化するLPC係数及び残留信号を生成する。これ
ら係数及びエネルギーの生成は合衆国特許第3,740
,467号に開示され、本発明の譲受人と同一譲受人に
譲渡された装置、あるいは他の当分野において周知の装
置によって遂行される。ピッチ検出器109は経路12
2を介して受信される残留信号及び経路121を介して
フレームセグメンタ ブロック102から受信される音
声サンプルに応答して、そのフレームが発声領域である
か非発声領域であるか決定する。ピッチ検出器109が
、フレームが発声領域であることを決定したときは、ブ
ロック141から147がフレームのシヌソイダル符号
化を遂行する。
一方、そのフレームが非発声領域であると決定された場
合は、ノイズ/多重パルス判定ブロック112によって
シンセサイザ200がこれもLPC計算器ブロック11
1によって計算されるLPC係数によって定義されるフ
ィルタを励振するためにノイズ励振を使用すべきかある
いは多重パルス励振を使用すべきかが決定される。ノイ
ズ励振を使用する場合は、この事実がパラメータ符号化
ブロック113を介してシンセサイザ200に伝えられ
る。一方、多重パルス励振を使用する場合は、ブロック
110はパルス トレイン位置及び振幅を決定し、この
情報を経路128及び129を介して後に第2図のシン
セサイザ200に送るためにパラメータ符号化ブロック
113に送る。
アナライザ100とシンセサイザ200の間の通信チャ
ネルがパケットを使用して実現される場合の発声フレー
ムに対して伝送されるパケットが第3図に示され、ホワ
イト ノイズ励振を使用する非発声フレームに対して伝
送されるパケットが第4図に示され、そして多重パルス
励振を使用する非発声フレームに対するパケットが第5
図に示される。
次に、非発声フレームに対するアナライザ100の動作
を詳細に説明する。ピッチ検出器109が経路130を
介してそのフレームが非発声領域であることを伝えると
、ノイズ/多重パルス判定ブロック112は、この信号
に応答してノイズ励振を使用すべきか多重パルス励振を
使用すべきかを決定する。多重パルス励振を使用する場
合は、この事実を示す信号が経路124を介して多重パ
ルス アナライザ ブロック110に送られる。このア
ナライザは、経路124上のこの信号及びピッチ検出器
109から経路125及び126を介して伝送される2
つのセットのパルスに応答する。多重パルス アナライ
ザ ブロック110は選択されたパルスの位置並びに選
択されたパルスの振幅をパラメータ符号器113に送る
。この符号器はまた経路123を介してLPC計算器1
11から受信されるLPC係数に応答して第5図に示さ
れるパケットを生成する。
ノイズ/多重パルス判定ブロック112がノイズ励振を
使用することを決定した場合は、これはこの事実を経路
124を介してパラメータ符号器113に信号を送るこ
とによって示す。符号器113はこの信号に応答してブ
ロック111からのLPC係数並びにブロック115に
よって残留信号から計算された利得を使用して第4図に
示されるパケットを生成する。
次に発声フレームに対するアナライザ190の動作を詳
細に説明する0発声フレームの間にアナライザ100か
らシンセサイザ200に送られる情報が第3図に示され
る。LPC係数はLPC計算器110によって生成され
径路123を介してパラメータ符号器113に送られ;
フレームが発声フレームであることを示す指標がピッチ
検出器109から径路130を介して送られる0発声領
域の基本振動数はピッチ検出器109によって径路13
1を介してピッチ周期として送られる。パラメータ符号
器113はこのピッチ周期に応答して、このピッチ周期
を基本振動数に変換した後にチャネル139上に送る。
フレーム内の音声の総エネルギー、eOがエネルギー計
算器103によって計算される。計算器103はデジタ
ル サンプルの総和の二乗の平方根をとることによって
eoを生成する。このデジタルサンプルがフレームセグ
メンタ102から径路121を介して受信され、エネル
ギー計算器103は結果としての計算エネルギーを径路
135を介してパラメータ符号器113に送る。
個々のフレーム、例えば、第6図に示されるフレームA
は好ましくは180のサンプルから構成される。音声フ
レーム セグメンタ141は、アナログ/デジタル コ
ンバータ101からのデジタル サンプルに応答してデ
ータサンプルのセグメントを抽出する0個々のセグメン
トは第6図のセグメントA及びフレームAによって示さ
れるように1つのフレームをオーバラップする。1つの
セグメントは、好ましくは256個のサンプルから構成
される。シヌソイダル分析を遂行する前にフレームをオ
ーバラップすることの目的は、フレームの終端ポイント
により多くの情報を提供することにある。ダウンサンプ
ラ142は発声フレーム セグメンタ141の出力tこ
応答して、256個のサンプル セグメントのサンプル
を1つおきに選択する。結果として、好ましくは、12
8サンプルのサンプル群が得られる。このダウン サン
プリングの目的は、ブロック143及び114によって
遂行される計算の繁雑さを削減することにある。
ハミング ウィンドウ ブロック143はブロック14
2からのデータ、snに応答して、以下の式によって与
えられるウインドニング動作を遂行する。
sn:5n(0,54−0,46cos((2πn)/
127))、(2)0(n<127 このウインドニング動作の目的は、フレームの終端ポイ
ントの所の不連続性を排除し、スペクトル分解能を向上
させることにある。
ウインドニング動作が遂行された後、ブロック144は
、最初、ブロック143からのサンプルにゼロを挿入す
る。この挿入の結果として、以下の式によって定義され
る、好ましくは、256個のデータ ポイントから成る
新たなシーケンスが生成される。
次にブロック144によって以下の式によって定義され
る離散フーリエ変換が遂行される。
ここで、s子 はこのゼロを挿入されたシーケンスsp
のn番目のポイントを表わす0式4の評価は速いフーリ
エ変換(fast Fouriertransform
、 F F T )法を使用して行なわれる。
FFT計算を遂行した後、ブロック144は式(4)の
計算を遂行した結果とて得られる個々の複素振動数デー
タ ポイントから以下の式によってスペクトルSを得る
s、  =  F、  F、  、  O<  k  
<  255.       (5)ここで、傘 は複
素共役を表わす。
高調波ピーク ロケータ145はピッチ検出器109に
よって計算された周期及びブロック144によって計算
されたスペクトルに応答して基本振動数の後の最初の5
つの高調波に対応するスペクトル内のピークを決定する
。この探索は高調波の数に基本振動数を掛けた値に等し
い理論的高調波振動数をスペクトルの開始ポイントとし
て使用し、この理論高周波からの所定の距離内の最も高
いサンプルに向かって傾斜を昇っていくことによって行
なわれる。
このスペクトルは限られた数のデータ サンプルに基づ
くため、高周波挿間器146が高調波ピーク ロケータ
145によって決定された高調波ピークの回りの二次挿
間を遂行する。これによってその高調波に対して決定さ
れた値がずばりの値により一致される。個々の高調波に
対して使用されるこの二次挿間は以下の式によって定義
される。
ここで、Mは256である。S (q)は発見されたピ
ークにより近いサンプル ポイントを表わし、高調波振
動数はPkにサンプリング周波数を掛けた値に等しい。
高調波計算器147はこの修正された高調波振動数及び
ピッチに応答して理論高調波ピークと計算高調波ピーク
との間のオフセットを計算する。このオフセットは次に
後にシンセサイザ200に送るためパラメータ符号器1
13に送られる。
第2図にシンセサイザ200が示される。
シンセサイザはチャネル139を介して受信される声帯
モデル及び励振情報あるいはシヌソイダル情報に応答し
て第1図のアナライザ100によって符号化された元の
アナログ音声の複製を生成する。受信された情報がフレ
ームが発声領域であることを示す場合は、ブロック21
1から214がシヌソイダル合成を遂行し式(1)に従
って元の発声フレーム情報が再生され、この再生された
音声がセレクタ206を介してデジタル/アナログ コ
ンバータ208に送られる。コンバータ208は受信さ
れたデジタル情報をアナログ信号に変換する。
受信された符号化情報が非発声フレームであると指定さ
れる場合は、ノイズ励振あるいは多重パルス励振を使用
して合成フィルタ207が励振される。径路227を介
して送られるノイズ/多重パルス、N/M信号によって
ノイズ励振を使用するか多重パルスを使用するかが決定
される。N / M信号はまたセレクタ205を動作し
指定の発生器203あるいは204のいずれかの出力を
合成フィルタ207に送る。合成フィルタ207はLP
C係数を使用して声帯をモデル化する。これに加えて、
非発声フレームが非発声領域の最初のフレームである場
合は、後続の発声フレームから径路225を介してLP
C係数が得られ、これが合成フィルタ207を初期化す
るのに使用される。
次に発声フレームが受信された場合の動作を説明する。
第3図に示される発声情報パケットが受信されると、チ
ャネル復号器201は径路221を介して基本振動数(
ピッチ)を、そして径路222を介して基本振動数オフ
セット情報を低高調波振動数計算器212及び高高調波
振動数計算器211に送る。音声フレーム エネルギー
、eo及びLPC係数がそれぞれ経路220及び216
を介して高調波振幅計算器213に送られる。発声/非
発声(voicsd/unvoiced 、 V / 
U )  信号が高調波振動数計算器211及び212
に送られる。V/U信号が1”に等しいことはそのフレ
ームが発声フレームであることを意味する。低高調波計
算器212は“1″に等しいV/U信号を受信し、これ
に応答して基本振動数及び高調波振動数オフセット情報
に基づいて最初の5つの高調波振動数を計算する。
計算器212は次にこの最初の5つの高調波振動数を経
路223を介してブロック213及び214に送る。
高高調波振動数計算器211は、基本振動数及びV/U
信号に応答してフレームの残りの高調波振動数を計算し
、これら高調波振動数を経路229を介してブロック2
13及び214に送る。
高周波振幅計算器213は計算器212及び211から
の高調波振動数、経路220を介して受信されるフレー
ムエネルギー情報、及び経路216を介して受信される
LPC係数に応答してこれら高調波振動数の振幅を計算
する。シヌソイダル発生器214は計算器211及び2
12から受信される振動数情報に応答して高調波位相情
報を決定し、この位相情報及び計算器213から受信さ
れる高調波振幅を使用して式(1)によって示される計
算を遂行する。
チャネル復号器201が第4図に示されるようなノイズ
励振パケットを受信すると、チャネル復号器201は経
路227を介してセレクタ205にホワイト ノイズ発
生器203の出力を選択するように指示する信号を送り
、また経路215を介してセレクタ206に合成フィル
タ207の出力を選択するように指示する信号を送る。
これに加えて、チャネル復号器201は経路228を介
してホワイトノイズ発生器203に利得を送る。この利
得は第1図に示されるアナライザ100の利得計算器1
15によって生成される0合成フィルタ207は、チャ
ネル復号器201から経路216を介して受信されるL
PC係数及びセレクタ205を介して受信されるホワイ
トノイズ発生器203の出力に応答して音声のデジタル
 サンプルを生成する。
チャネル復号器201がチャネル139から第5図に示
されるようなパルス励振パケットを受信すると、復号器
201は受信されたパルスの位置及び振幅を経路210
を介してパルス発生器204に送る。 これに加えて。
チャネル復号器201は経路227を介してセレクタ2
05がパルス発生器204の出力を選択するように指令
し、この出力を合成フィルタ207に送る0合成フィル
タ207及びデジタル/アナログコンバータ208は次
に音声を再生する。コンバータ208はコンバータの出
力の所に内蔵ロー パス フィルタを持つ。
次に発声フレームのシヌソイダル合成を遂行するブロッ
ク211,212,213及び214の動作を詳細に説
明する。低高調波振動数計算器212は経路211を介
して受信される基本振動数Frに応答して経路222を
介して受信される高調波オフセットh。
を使用して、好ましくは、5つのサブセットの高調波振
動数を計算する。理論高調波振動数t5.  は、単に
高調波の番号に基本振動数を掛けることによって得られ
る。個々の高調波に対するi番目の振動数は以下の式に
よって定義される。
hf7 =  isI+ holfr。
1<i<5゜ ここで、frはスペクトル サンプル ポイント間の振
動数分解能を表わす。
計算器211は基本振動数Frに応答して以下の式を使
用して高調波振動数hf、(ここでi≧6)を生成する
hfI=iFr、6< i  < h、  (7)ここ
で、hは現フレーム内の高調波の最高数を表わす。
計算器211のもう1つの実施態様においては、基本振
動数に応答して以下の式を使用して第5番目の高調波以
上の高調波振動数が計算される。
hf 1  =  na  、  6  <   i 
  <  h  、      (8)ここで、hは高
調波の最高数を表わし、aはこのシンセサイザで許され
る振動数分解能を表わす、好ましくは、変数aは2Hz
に選択される。i番目の振動数に対する整数nは以下の
式を最小化することによって発見され。
(iFr−na)”      (9)ここで、iFr
はi番目の理論高調波振動数を表わす、こうして、異な
るパターンの小さなオフセットが生成される。
計算器211のもう1つの実施態様においては、基本振
動数及び好ましくは最初から5つの高調波振動数に対す
るオフセットに応答して好ましくは5番目の高調波以上
の高調波振動数がこれらオフセットを残りの高調波を5
つのグループに分けこれらグループにこれらオフセット
を加えることによって生成される。これらグループは(
k□+1 、、、、2 k□)。
(2k1+、、、、 3 kl)、、、、によって表わ
される。 ここで、好ましくは k工=5とされる。
以下の式はmk□+1から(rn + 1 ) k x
にて表わされる一群の高調波に対するこの実施態様を定
義する。
h f r =jF r  +  h OJここで j  =  mk1+1.、、、(m+1)kmに対し
て (ho)=Perm (ho、) i=1.2.、、、
、、に1(10)I         A+ ここで、mは整数である。
これら置換は変数m(グループ番号)の関数である。 
 原則として、高調波の数かに□の倍数でないときは最
後のグループは完結しないことに注意する。これら置換
は周知の技術を使用して個々の音声フレームに対してラ
ンダムに、決定論的に、あるいは発見的に定義される。
計算器211及び212は、基本振動数及び個々の高調
波振動数に対して1つの値を生成する。この値は合成さ
れる音声フレームの中心に位置するものと想定される。
フレーム内の個々のサンプルに対する残りのサンプル当
たりの振動数は隣接する発声フレームの振動数あるいは
隣接する非発声フレームに対する所定の境界状態の線形
挿間によって得られる。この挿間はシヌソイダル発生器
214内で遂行されるが、これに関しては後に詳細に説
明される。
高調波振幅計算器213は計算器211及び212によ
って計算された振動数、計算器216を介して受信され
るLPC係数、及び経路220を介して受信されるフレ
ーム エネルギーeoに応答して高調波振幅を計算する
。個々の発声フレームに対するLPC反射係数は個々の
フレームの間の声帯を表わす音響チューブ モデルを定
義する。この情報から相対高調波振幅が決定される。た
だし、LPC係数は声帯の構造をモデル化するもので、
個々のこれら高調波振動数のエネルギーの量を表わす情
報は含まない。この情報は計算器213によって経路2
20を介して受信されるフレーム エネルギーを使用し
て決定される0個々のフレームに対して、計算器213
は高調波振幅を計算する。これは、振動数の計算と同様
にこの振幅がフレームの中心に位置するものと想定する
。次に線形挿間を使用し、隣接する発声フレームからの
振幅情報あるいは隣接する非発声フレームに対する所定
の境界状態を使用してこのフレームを通じて残りの振幅
が計算される。
これら振幅は声帯が以下によって表わされるオール ボ
ール フィルタにて記述できることから発見できる。
ここで、 である。
定義により、係数a0は1である。オールボール フィ
ルタを記述するのに必要な係数a  、1≦m≦10 
は、マーケル、J、D。
(Markel、 J、D、)、及びグレイ、Jr、A
、H。
(Gray、 Jr、、 A、H,)による文献[音声
の線形予測(Linear Pradiction o
f 5peech) ]、スプリンガ バーラッグ(S
 pringer−Berlag)、ニューヨーク、ニ
ューヨーク、1976年に説明の反復ステップアップ手
順を使用して経路216を介して受信される反射係数か
ら得ることができる。式(11)及び式(12)にて記
述されるフィルタを使用して以下の方法で個々のフレー
ムに対する高調波成分の振幅が計算される。計算される
べき高調波振幅を ha 、O≦i≦hと表わすものと
する。
ここで、hは高調波の数を表わす。すると、未スケール
(unsealed)の高調波寄与値he 。
O≦i≦hが個々の高調波振動数hf  に対して以下
の式から得られる。
ここで、srはサンプリング速度を表わす。
全高開披の総未スケール エネルギーEは以下によって
得られる。
ここで、 と仮定すると、1番目のスケール済み(scaled)
高調波振幅hadは以下によって計算できる。
ここで、eOはアナライザ100によって計算された伝
送された音声フレームのエネルギーを表わす。
次にシヌソイダル発生器214がいかに計算器、、21
1,212.及び213から受信される情報を使用して
式(1)によって記述される計算を遂行するか説明する
。任意のフレームに対して、計算器211,212.及
び213は発生器214に対してそのフレーム内の個々
の高調波に対する1つの振動数及び振幅を与える。発生
器214はこれら振動数及び振幅の両方の線形挿間を遂
行し、振動数情報を位相情報に変換し、フレームを通じ
ての個々のサンプル ポイントに対する位相及び振幅を
与える。
この線形挿間は以下のように遂行される。
第7図は5つの音声フレーム及び0番目の高調波振動数
であるともみなされる基本振動数に対するその線形挿間
を示す、他の高調波も類似に表現できる。大まかに言っ
て、ある発声フレームに対して3つの境界状態が存在す
る。第1の場合、発声フレームは1つの先行非発声フレ
ーム及び1つの後続発声フレームを持つ、第2の状態で
は、発声フレームは他の発声フレームによってとりまか
れる。第3の状態では、発声フレームは1つの先行発声
フレーム及び1つの後続非発声フレームを持つ、第7図
において、フレームC、ポイント701から703は第
1の状態を表わしフ振動数hf  は701によって定
義されるこのフレームの開始から一定であると想定され
る。
基本振動数に対しては、 iはOである。 Cはこれが
Cフレームであることを示す、フレームbは フレーム
Cの後に来るが、ポイント703から705によって定
義され、第2の状態を表わし;線形挿間がポイント70
2と704の間でそれぞれポイント702と704の間
で起こる振動数hf、及びhf。
を使用して遂行される。第3の状態はポイント705か
ら707に延びるフレームによって代表され、フレーム
aに続くフレームは非発声フレーム、つまりポイント7
07から708である。この状態においては、高調波振
動数hf、 はフレームaの終端のポイント707まで
一定である。
第8図は振幅の挿間を示す。連続の発声フレーム、例え
ば、フレームC及びbにて定義されるフレームでは、挿
間は振動数に対する挿間と同一である。ただし、先行フ
レームが非発声フレームである場合1例えば、フレーム
Cの前にポイント800から801によって定義される
非発声フレームが存在するような関係においては、この
フレームの開始点はポイント801によって示されるよ
うに0の振幅を持つものと想定される。同様に、発声フ
レームの後に非発声フレームが続く場合、例えば、 フ
レームaとポイント807から808によって表わされ
るフレームの関係では、終端ポイント、例えば、ポイン
ト807は0の振幅を持つものと想定される。
発生器214は上に説明の挿間を以下の式を使用して遂
行する。n番目のサンプルのバーサンプル(per−s
ample)位相は以下によって定義される。
二こで、0  はi番目の高調波のバーサンプル(pe
r−sample)位相を表わし、srは出力サンプル
速度を表わす、これら位相を解くためには、バーサンプ
ル振動数W。、1 を知ることのみが必要であり、これ
らバーサンプル振動数は挿間を行なうことによって発見
できる。第7図のフレームbのように発声フレームが隣
接する発声フレームに対する振動数の線形挿間は以下に
よって定義される。
ここで、h  は隣接するどちらかのフレーム内の高調
波の最小数を表わす。非発声フレームからの発声フレー
ムへの遷移1例えば、フレームCは以下の式によってバ
ーサンプル高調波振動数を計算すること1こよって処理
される。
発声フレームから非発声フレームへの遷移。
例えば、フレームaは以下の式によってバーサンプル高
調波振動数を計算することによって処理される。
hmlnが2つの隣接するフレーム内のいずれかの高調
波の最低数を表わすものとすると、フレームbがフレー
ムCより多くの高調波を持つような場合は、式(20)
を使用してhmln以上の高調波に対するバーサンプル
高調波振幅数が計算される。フレームbがフレーム a
 より多数の高調波を持つ場合は、式(21)を使用し
てり。1n 以上の高調波に対するバーサンプル高調波
振動数が計算される。
このバーサンプル高調波振幅An、はha7から発声フ
レームbに対する以下の式によって定義されるように類
似の方法で計算される。
90<n<179.O<i<h 及び フレームが発声領域の開始、例えば、フレームCの開始
ポイン1〜であるような場合は、バーサンプル高調波振
幅は以下によって決定される。
A o 、 +’ =O+ O’ x ’ h    
 (24)及び ここで、hはフレーム内の高調波の数を表わす。
フレームが発声領域の終端である場合、例えば、フレー
ムaのような場合は、バーサンプル振幅は以下によって
計算される。
ここで、hはフレームa内の高調波の数を表わす。ある
フレーム、例えば、フレームbが先行発声フレーム、例
えば、フレームCより多くの高調波を持つ場合は、式(
24)及び式(25)を使用してh□in 以上の高調
波に対する高調波振幅が計算される。フレームbがフレ
ームaより多数の高調波を持つ場合は、式(18)を使
用してh  以上の高調波に対する高調波振幅が計算さ
れる。
次に、第1図に示されるアナライザを詳細に説明する。
第10図及び第11図は、第1図のフレーム セグメン
タ141を実現するのに必要なステップを示す。個々の
サンプルSが、A/Dブロック101から受信されると
、セグメンタ141は個々のサンプルを循環バッファB
に格納する。ブロック1001から1005は、iイン
デックスを使用してサンプルを循環バッファ已に連続的
に格納する。判定ブロック1002によって、jとバッ
ファの終端を定義するNとを比較することによって循環
バッファBが終端に到達したか決定される。Nはまた、
そのスペクトル分析におけるポイントの数を表わす。好
ましくは、Nは256とされ、Wは180とされる。j
が順番バッファの終端を越えると、ブロック10o3に
よってiがOにセットされ、次にサンプルが循環バッフ
ァBの始めから格納される。判定ブロック1005によ
って循環バッファB内に格納されたサンプルの数がカウ
ントされ;Wによって定義される1つのフレームを構成
する好ましくは180個のサンプルが格納されると、ブ
ロック1006が実行され;まだWに達してない場合は
、1007が実行され、第10図に示されるステップは
単にブロック101からの次のサンプルを待つ。180
ポイントが受信されると、第10図及び第11図のブロ
ック1006から1106によって循環バッファBから
の情報がアレイCに送られ、アレイC内の情報が次に第
6図に示されるセグメントの1つを記述する。
ダウン サンプラ142及びハミング ウイントウ ブ
ロック143は第11図のブロック1107から111
0によって実現される。ブロック142によって遂行さ
れるダウン サンプリングはブロック1108によって
実現され;式(2)によって定義されるハミングウイン
ドニング機能はブロック1109によって遂行される6
判定ブロック1107及びコネクタ ブロック1110
によってアレイC内に格納されるデータ ポイントの全
てに対するこれら動作の遂行が制御される。
第12図のブロック1201から1207はFFTスペ
クトル規模ブロック144の機能を実現する。式(3)
によって定義されるゼロの挿入はブロック1201から
1203によって遂行される。ブロック1201から1
203から結果として得られるデータ ポイントに関す
る速いフーリエ変換の実現はブロック1204によって
遂行され、これによって式(4)によって定義されるの
と同一結果が得られる。ブロック1205から1207
は式(5)によって定義されるスペクトルを得るのに使
用される。
第1図のブロック145,146及び147は第12図
及び第13図のブロック1208から1314によって
示されるステップによって実現される。第1図の経路1
31を介してピッチ検出器109から受信されるピッチ
周期はブロック12o8によって基本振動数Frに変換
される。
この変換は高調波ピーク ロケータ145及び高調波計
算器147の両方によって遂行される。基本振動数が、
好ましくは、 60Hzと決定される所定の振動数Q以
下である場合は、判定ブロック1209は制御をブロッ
ク1301及び1302にパスし、ここで高調波オフセ
ットが0にセットされる。基本振動数が所定の値Qより
大きな場合は、判定ブロック1209によって制御が判
定ブロック1303にパスされる。判定ブロック13o
3及びコネクタ ブロック1314は、好ましくは、高
調波1から5のサブセットの高調波オフセットの計算を
制御する。初期高調波はに、によって定義され1にセッ
トされ、上限高調波値はに□によって定義され5にセッ
トされる。ブロック1304は現在計算中の高調波がス
ペクトルS内に発見されるかの初期推定を行なう。ブロ
ック1305から1308は現在計算中の高調波と関連
するピークの位置を探索し発見する。これらブロックは
高調波ピーク ロケータ145を実現する。ピークの位
置が発見されると、ブロック1309によってブロック
146の高調波挿間機能が遂行される。
高調波計算器147はブロック1310から1313に
よって実現される。最初、現在計算中の高調波に対する
未スケール オフセットがブロック1310の実行によ
って得られる。次に、ブロック131oの結果がブロッ
ク1311Lこよってスケールされ、整数が得られる0
判定ブロック1321によって検出された高調波ピーク
がエラーでないことを保証するためオフセットが所定の
範囲内にあるかチェックされる。計算されたオフセット
が所定の範囲より大きな場合は、オフセットがブロック
1313の実行によって0にセットされる。全ての高調
波オフセットが計算されると、制御は第1図のパラメー
タ符号器113にパスされる。
第14図から第19図は第2図のシンセサイザ200を
実現するためにプロセッサ803によって実行されるス
テップの詳細を示す。
第2図の高調波振動数計算器212及び211は第14
図のブロック1418から1424によって実現される
。ブロック1418はこの動作において使用されるパラ
メータを初期化する。ブロック1419から1420は
最初に伝送ピッチとして得られる基本振動数にに+1を
掛けることによって個々の高調波振動数hfhを計算す
る。全ての理論高調波振動数が計算されたら、スケール
され伝送されたオフセットがブロック1421から14
24によって最初の5つの理論高調波振動数に加えられ
る。定数に0及びに1がブロック1421によってそれ
ぞれ1”及び115 I+にセットされる。
高調波振幅計算器213は第8図のプロセッサ803に
よって第14図及び第15図のブロック1401から1
417を実行することによって実現される。ブロック1
401から1407は式(11)によって与えられる声
帯のオール ボール フィルタ記述に対するLPC反射
係数を変換するためのステップアップ手順を実行する。
ブロック1408から1412は個々の高調波に対して
式(13)にて定義される未スケール高調波エネルギー
を計算する。ブロック1413から1415は式(14
)によって定義される総未スケール エネルギーEを計
算するのに使用される。
ブロック1416及び1417は式(16)によって定
義されるi番目のフレームのスケールされた高調波振幅
hab を計算する6第15図から第18図のブロック
1501から1521及びブロック1601から161
4はプロセッサ803によって第7図及び第8図に示さ
れるように個々の高調波に対する振動数及び振幅を挿間
するために遂行される動作を示す。これら動作は、フレ
ームの最初の部分をブロック1501から1521によ
って処理し、フレームの第2の部分をブロック1601
から1514によって処理することによって遂行される
。第7図に示されるように、フレームCの最初の半分は
ポイント701から702に延び、フレームCの後半は
ポイント702から703に延びる。これらブロックに
よって遂行される最初の動作は先行フレームが発声フレ
ームであるか非発声フレームであるか決定する動作であ
る。
より具体的には、第15図のブロック1501によって
初期値がセットされる。判定ブロック1502は先行フ
レームが発声フレームであるか非発声フレームであるか
の判定を行なう。先行フレームが非発声フレームである
場合は、判定ブロック1504から1510が実行され
る。第17図のブロック1504及び1507はフレー
ムの開始において個々の高調波に対する高調波振動数及
び振幅の最初のデータ ポイントを位相に対してhf3
、そして振幅に対してap=oに初期化する。
これは第7図及び第8図の図解に対応する。
フレームの最初のデータ ポイントに対する初期値がセ
ットしたら次にこのフレームに対する残りの値がブロッ
ク15o8から1510を実行することによってセット
される。高調波振動数の場合は、これら振動数は第7図
に示されるように中心振動数にセットされる。
高調波振幅の場合は第8図のフレームCに対して示され
るように個々のデータ ポイントがフレームの開始点の
所のゼロから中点振幅に向かって線形近似セットされる
ブロック1502において先行フレームが発声フレーム
であると判定された場合は、第16図の判定ブロックが
遂行される。判定ブロック1503は先行フレームが現
在のフレームより多くの高調波を持つか否かを決定する
。高調波の数は変数shによって示される。
どちらのフレームが多くの高調波を持つかによって、ブ
ロック1505が実行されるかブロック1506が実行
されるかが決定される。
変数hmin  はいずれかのフレームの高調波の最低
数にセットされる。ブロック1505あるいは 150
6が実行された後、ブロック1511及び1512が実
行される。これらブロックは振動数及び振幅の両方に対
する現フレームの初期ポイントを先行フレームの最終ポ
イントを計算することによって決定する。
この動作を全ての高調波に対して遂行した後に、ブロッ
ク15]3から1515によって全ての高調波に対する
振動数及び振幅の両方に対する個々のサンプル毎の値が
それぞれ式(22)及び式(26)によって定義される
ように計算される。
変数り。、nにて定義されるように全ての高調波に対す
るバーサンプル振動数及びバーサンプル振幅が計算され
たら、ブロック1516から1521が現在のフレーム
が先行フレームよりも多くの高調波を持つ事実が考慮さ
れるように計算される。現在のフレームが先行フレーム
よりも多数の高調波を持つ場合は、判定ブロック151
6は制御をブロック1517に渡す、現在のフレーム内
に先行フレームより多数の高調波が含まれる場合は、ブ
ロック1517から 1521が実行されるが、 これ
ら動作は先に説明のブロック1504から1510と同
一である。
フレームの後半の個々の高調波に対する振動数及び振幅
に対するバーサンプル ポイントの計算がブロック16
01から1614によって図解される。ブロック160
1によって次のフレームが発声フレームであるか非発声
フレームであるか決定される。次のフレームが非発声フ
レームである場合は、ブロック1603から1607が
実行される。初期ポイントは振動数及び振幅の両方とも
フレームの中間ポイントであるため、ブロック1504
及び1507によって遂行されるような初期値の決定は
必要でない。ブロック1603からブロック1607は
ブロック1508から1510によって遂行されるのと
類似する機能を遂行する。次のフレームが発声フレーム
である場合は、判定ブロック1602及び16Q4ある
いは1605が実行される。これらブロックの実行は前
述のブロック1503゜1505、及び1506におけ
る説明と類似する。ブロック1608から1611の動
作は前述のブロック1513から1516の動作と類似
する。フレームの後半では振動数及び振幅に対して初期
状態をセットする必要はない。ブロック1621から1
614の動作は前述のブロック1519から1521の
動作に類似する。
発生器214によって遂行される最後の動作は前述のよ
うにして個々の高調波に対して計算されたバーサンプル
振動数及び振幅を使用しズ゛音声の実際のシヌソイダル
合成を行な・51″:、とである、第1−9図のブロッ
ク1701かE、、 L 707は先に計算された振動
数情報を使用してこれら振動数から高調波の位相を計算
し5次←こ式(]、)によって定義される計算を遂行す
るゆブロック17o2及び1703はフレームの口4始
に対する初期音声サンプルを決定する。、7の初期・f
インl−= 六<決定された後、プロッタ1704か”
p 1 ’707によってこI−7リー11/−ム仁゛
々9する残りの音声サンプルが快定さfl、 2”19
次にこれらブロックからの出力・デデジタル/アナログ
 コンバー・夕208に伝送される9 2−iプ器211の生、・うコ・2の実!l’+!態様
は、第2.0図に示されるように伝送された高調波オフ
セットを再使用して5以し−の高調波に対する計算理論
高調波振動数を修正する。ブロック2003から200
5は5番目の高調波以上の高調波を5つのグループにグ
ループ化し、次にブロック2006及び2007によっ
てこれらグループの個々の理論高調波振動数に対応する
伝送された高調波オフセットが加えられる。
第21図は計算器211の第2の実施態様に示すが、 
これは第20図に示される実施態様とはブロック210
0によって最初の5個の高調波以上の個々のグループの
高調源振!I′I数に対してオフセラ1−の順番がラン
ダムに同′換される点が異なる。第21図のブロック2
10]から2108は第20図の対応するブロックと類
似する機能を遂行する。
第22図は計算器211の第3の実施態様を示す。この
実施態様はブロック2202及び2205の制御下で個
々の高調波振動数に対してブロック2203及び220
4に示される計算を遂行することによって第2図の計算
器213及び214に伝送された理論高調波振動数の修
正高調波振動数を得る。
上に説明の実施態様は単に本発明の原理を解説するため
のものであり、本発明の精神及び範囲から逸脱すること
なく他の構成を考案できることは明白である。
【図面の簡単な説明】
第1図は本発明による音声アナライザのブロック図; 第2図は本発明による音声シンセサイザのブロック図; 第3図は発声領域の間に音声を再生するための情報を含
むパケットを示す図; 第4図は非発声領域の間にノイズ励振を使用して音声を
再生するための情報を含むパケットを示す図; 第5図は非発声領域の間にパルス励振を使用して音声を
再生するための情報を含むパケットを示す図; 第6図は第1図の音声フレーム セグメンタ141が音
声フレームを音声セグメントにて、いかにオーバラップ
させるかを示す図7第7図は第2図のシンセサイザによ
って基本及び高調波振動数に対して遂行される挿間をグ
ラフ形式にて示す図; 第8図は第2図のシンセサイザによって基本及び高調波
振動数の振幅に対して遂行される挿間をグラフ形式にて
示す図; 第9図は第1図及び第2図のデジタル信号プロセッサの
構成を示す図; 第10図から第13図は第9図の信号プロセッサ903
を制御して第1図のアナライザ回路を動作させるための
プログラムの流れ図;第14図から第19図は第9図の
デジタル信号プロセッサ903の実行を制御して第2図
のシンセサイザを動作させるためのプログラムの流れ図
:そして 第20図、第21図、及び第22図は第9図のデジタル
信号プロセッサ903の実行を制御して第2図の高高調
波計算器221を動作させるためのその他のプログラム
 ルーチンの流れ図である。 [主要部分の符号の説明] A/D  コンバータ ・・・・・・・・・・・・・・
・・・・101フレームセグメンタ ・・・・・・・・
・・・・・・・・102エネルギー計算器・・・・・・
・・・・・・・・・・・・・1030−バスフイルタ 
・・・・・・・・・・・・・・・・・104パラメータ
符号器・・・・・・・・・・・・・・・・・・・113
チャネル復号器・φ・・・・・・・・・・・・・・・・
・・・201ホワイト ノイズ発生器・・・・・・・・
・・・・・・203パルス発生器・・・・・・・・・・
・・・・・・・・・・・・・204選択スイッチ・・・
・・・・・・・・・・・・・・・205.206合成フ
ィルタ ・・・・・・・・・・・・・・・・・・・・・
・・207D/A コンバータ ・・・・・・・・・・
・・・・・・・・208FIG、6 将ち数 1挨中冨 堝中亀の坤r昌 FIO,8 FIG、 10 FIG、 II FIG、 /2 Fl(9,14 Flに、 15 Hダ15 F/に、 /7 FIG、 /9 W庄斐#?豚208へ FIG、20 F1a、2/ Flσ、22

Claims (1)

  1. 【特許請求の範囲】 1、人の音声を符号化するための処理シ ステムにおいて、該システムが: 音声を個々が音声の瞬時振幅の所定の数の 均一な間隔のサンプルを持ちまた個々が所定の数のサン
    プルだけ先行フレーム及び後続フレームにオーバラップ
    する複数の音声フレームにセグメント化するためのセグ
    メンタ、例えば(102、141); 個々のフレームに対して声帯を定義するセ ットの音声パラメータ信号を計算するためのLPC計算
    器、例えば(111);及び 音声サンプルのフレーム当たりのフレーム エネルギーを計算するためのエネルギー計算器、例えば
    (103)を含み、 該処理システムがさらに 個々のフレームに対するスペクトルを生成 するために個々のフレームの該音声サンプルのスペクト
    ル分析を遂行するためのスペクトルアナライザ、例えば
    (142、143、 144); 個々のフレームに対応するスペクトルから 個々のフレームに対する基本振動数信号を検出するため
    のピッチ検出器、例えば(109);個々のフレームに
    対応するスペクトルから 個々のフレームに対するサブセットの高調波振動数信号
    を計算するための高調波ピーク発見器、例えば(145
    ); 個々の該高調波振動数信号と該基本振動数 信号の倍数との差を表わすオフセット信号を計算するた
    めの高調波計算器、例えば(147);及び 該フレームエネルギーを表わす符号化信 号、該セットの音声パラメータ、該基本振動数信号及び
    該オフセット信号を後の音声合成のために伝送するため
    のパラメータ符号器、例えば(113)を含むことを特
    徴とするシステム。 2、特許請求の範囲第1項に記載のシス テムにおいて、該スペクトルアナライザが 該音声サンプルをダウンサンプリングするためのサンプ
    ラ、例えば(142)を含み、これによって計算の量が
    軽減されることを特徴とするシステム。 3、特許請求の範囲第2項に記載のシス テムにおいて、該ピッチ検出器がさらにフレームを発声
    フレーム及び非発声フレームに識別し、該システムがさ
    らにあるフレームの音声が人の喉頭内のノイズ様のソー
    スに起因し該検出器が非発声フレームであることを示す
    場合はノイズ様励振を使用することを指示する信号を送
    るためのノイズ/多重パルス判定回路、例えば(112
    );及び 該ノイズ様ソースが存在せず該手段が非発 声フレームであることを示す場合は多重パルス励振ソー
    スから励振情報を生成するための多重パルスアナライザ
    、例えば(110) を含み、 該パラメータ符号器がさらに該多重パルス 励振情報及び該セットの音声パラメータに応答して多重
    パルス励振情報及び該セットの音声パラメータの符号化
    信号を後の音声合成のために伝送することを特徴とする
    システム。 4、音声フレームを表わす符号化情報か ら音声を合成するための方法において、該フレームの個
    々が音声の瞬時振幅の所定の数の均一な間隔のサンプル
    を持ち、個々のフレームを表わす該符号化情報がフレー
    ムエネル ギー、セットの音声パラメータ、音声の基本振動数及び
    基本振動数信号から派生された理論高調波振動数と実際
    のサブセットの高調波振動数との間の差を表わすオフセ
    ット信号から成り、該方法が: 該オフセット信号に対応するサブセットの 高調波位相信号を計算するステップ; 該フレームに対する残りの高調波位相信号 を該基本振動数信号から計算するステップ;該基本信号
    、該サブセットの高調波位相信 号及び該残りの高調波位相信号の振幅を該フレームのフ
    レームエネルギー及びセットの 音声パラメータから決定するステップ;及び該フレーム
    に対する該基本信号、該サブセ ット及び残りの位相信号並びに該計算された振幅に応答
    して複製音声を生成するステップを含むことを特徴とす
    る方法。 5、特許請求の範囲第4項に記載の方法 において、該残りの高調波位相信号を計算するステップ
    が個々の高調波の数を該基本振動数信号に掛けることに
    よって該個々の残りの高調波位相信号に対する振動数を
    生成するステップ; 該生成される振動数を算術的に修正するス テップ;及び 該残りの位相信号を該修正された振動数か ら計算するステップを含むことを特徴とする方法。 6、特許請求の範囲第4項に記載の方法 において、該残りの高調波位相信号を計算するステップ
    が該残りの高調波位相信号に対応する残りの高調波振動
    数信号を該基本振動数信号に該個々の残りの高調波信号
    に対する高調波の数を掛けることによって生成するステ
    ップ; 該掛けられた振動数信号を個々が該サブセ ットの高調波位相信号と同数の高調波を持つ複数のサブ
    セットにグループ化するステップ;該個々のオフセット
    信号を該複数の個々の サブセットの対応するグループ化された振動数信号に加
    えることによって修正された残りの高調波振動数信号を
    生成するステップ;及び 該修正された高調波振動数信号から該残り の高調波位相信号を生成するステップを含むことを特徴
    とする方法。 7、特許請求の範囲第6項に記載の方法 において、該修正された残りの高調波振動数信号を生成
    するために該オフセットを加えるステップが該複数の個
    々のサブセットの対応するグループ化された振動数信号
    に該信号を加える前に該オフセット信号の順番を並べ変
    えるステップが含まれることを特徴とする方法。 8、特許請求の範囲第4項に記載の方 法において、該振幅を計算するステップがあるフレーム
    に対する該セットの音声パラメータから該個々の高調波
    位相信号の未スケールエネルギーを計算するステップ; 該フレームに対する該高調波位相信号の全 てを通じての該未スケールエネルギーの総 和を求めるステップ;及び 該高調波位相信号の振幅を個々の高調波信 号の該高調波エネルギー、総和未スケール エネルギー及び該フレームに対するフレームエネルギー
    に応答して計算するステップが含まれることを特徴とす
    る方法。
JP62171340A 1986-09-11 1987-07-10 人の音声の符号化処理システム Expired - Lifetime JPH0833753B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US906424 1986-09-11
US06/906,424 US4771465A (en) 1986-09-11 1986-09-11 Digital speech sinusoidal vocoder with transmission of only subset of harmonics

Publications (2)

Publication Number Publication Date
JPS6370300A true JPS6370300A (ja) 1988-03-30
JPH0833753B2 JPH0833753B2 (ja) 1996-03-29

Family

ID=25422427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62171340A Expired - Lifetime JPH0833753B2 (ja) 1986-09-11 1987-07-10 人の音声の符号化処理システム

Country Status (9)

Country Link
US (1) US4771465A (ja)
EP (1) EP0259950B1 (ja)
JP (1) JPH0833753B2 (ja)
KR (1) KR960002387B1 (ja)
AT (1) ATE73251T1 (ja)
AU (1) AU575515B2 (ja)
CA (1) CA1307344C (ja)
DE (1) DE3777028D1 (ja)
SG (1) SG123392G (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003514266A (ja) * 1999-11-16 2003-04-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 広帯域オーディオ伝送システム

Families Citing this family (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
JP2586043B2 (ja) * 1987-05-14 1997-02-26 日本電気株式会社 マルチパルス符号化装置
US5023910A (en) * 1988-04-08 1991-06-11 At&T Bell Laboratories Vector quantization in a harmonic speech coding arrangement
US5179626A (en) * 1988-04-08 1993-01-12 At&T Bell Laboratories Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis
US5127054A (en) * 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
DE3851887T2 (de) * 1988-07-18 1995-04-20 Ibm Verfahren und Einrichtung zur Sprachkodierung mit niedriger Bitrate.
US5293448A (en) * 1989-10-02 1994-03-08 Nippon Telegraph And Telephone Corporation Speech analysis-synthesis method and apparatus therefor
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
DE69233794D1 (de) * 1991-06-11 2010-09-23 Qualcomm Inc Vocoder mit veränderlicher Bitrate
US5189701A (en) * 1991-10-25 1993-02-23 Micom Communications Corp. Voice coder/decoder and methods of coding/decoding
JP3277398B2 (ja) * 1992-04-15 2002-04-22 ソニー株式会社 有声音判別方法
FI95085C (fi) * 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
IT1257431B (it) * 1992-12-04 1996-01-16 Sip Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi
US5448679A (en) * 1992-12-30 1995-09-05 International Business Machines Corporation Method and system for speech data compression and regeneration
JP3137805B2 (ja) * 1993-05-21 2001-02-26 三菱電機株式会社 音声符号化装置、音声復号化装置、音声後処理装置及びこれらの方法
US5787387A (en) * 1994-07-11 1998-07-28 Voxware, Inc. Harmonic adaptive speech coding method and system
TW271524B (ja) * 1994-08-05 1996-03-01 Qualcomm Inc
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
JP2861889B2 (ja) * 1995-10-18 1999-02-24 日本電気株式会社 音声パケット伝送システム
JPH09185397A (ja) * 1995-12-28 1997-07-15 Olympus Optical Co Ltd 音声情報記録装置
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
US5778337A (en) * 1996-05-06 1998-07-07 Advanced Micro Devices, Inc. Dispersed impulse generator system and method for efficiently computing an excitation signal in a speech production model
EP0917709B1 (en) 1996-07-30 2000-06-07 BRITISH TELECOMMUNICATIONS public limited company Speech coding
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
KR19980025793A (ko) * 1996-10-05 1998-07-15 구자홍 음성데이타 보정방법 및 장치
TW429700B (en) * 1997-02-26 2001-04-11 Sony Corp Information encoding method and apparatus, information decoding method and apparatus and information recording medium
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
CN1145925C (zh) * 1997-07-11 2004-04-14 皇家菲利浦电子有限公司 具有改进语音编码器和解码器的发射机
KR100578265B1 (ko) * 1997-07-11 2006-05-11 코닌클리케 필립스 일렉트로닉스 엔.브이. 개선된 고조파 스피치 인코더를 갖는 송신기
US6029133A (en) * 1997-09-15 2000-02-22 Tritech Microelectronics, Ltd. Pitch synchronized sinusoidal synthesizer
US6230130B1 (en) 1998-05-18 2001-05-08 U.S. Philips Corporation Scalable mixing for speech streaming
US6810409B1 (en) 1998-06-02 2004-10-26 British Telecommunications Public Limited Company Communications network
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6453287B1 (en) * 1999-02-04 2002-09-17 Georgia-Tech Research Corporation Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
EP1203369B1 (en) * 2000-06-20 2005-08-31 Koninklijke Philips Electronics N.V. Sinusoidal coding
CN1324558C (zh) * 2001-11-02 2007-07-04 松下电器产业株式会社 编码设备,解码设备以及音频数据分配系统
US20030108108A1 (en) * 2001-11-15 2003-06-12 Takashi Katayama Decoder, decoding method, and program distribution medium therefor
JP2003255976A (ja) * 2002-02-28 2003-09-10 Nec Corp 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法
US7027980B2 (en) * 2002-03-28 2006-04-11 Motorola, Inc. Method for modeling speech harmonic magnitudes
US7343283B2 (en) * 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
US20050065787A1 (en) * 2003-09-23 2005-03-24 Jacek Stachurski Hybrid speech coding and system
CN101542593B (zh) * 2007-03-12 2013-04-17 富士通株式会社 语音波形内插装置及方法
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
WO2009078093A1 (ja) * 2007-12-18 2009-06-25 Fujitsu Limited 非音声区間検出方法及び非音声区間検出装置
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
KR20100006492A (ko) * 2008-07-09 2010-01-19 삼성전자주식회사 부호화 방식 결정 방법 및 장치
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
WO2013141638A1 (ko) * 2012-03-21 2013-09-26 삼성전자 주식회사 대역폭 확장을 위한 고주파수 부호화/복호화 방법 및 장치
CN103811011B (zh) * 2012-11-02 2017-05-17 富士通株式会社 音频弦波检测方法和装置
CA2915437C (en) 2013-06-21 2017-11-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals
KR20150032390A (ko) * 2013-09-16 2015-03-26 삼성전자주식회사 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법
US9323878B2 (en) * 2014-02-07 2016-04-26 Freescale Semiconductor, Inc. Method of optimizing the design of an electronic device with respect to electromagnetic emissions based on frequency spreading introduced by data post-processing, computer program product for carrying out the method and associated article of manufacture
US9400861B2 (en) 2014-02-07 2016-07-26 Freescale Semiconductor, Inc. Method of optimizing the design of an electronic device with respect to electromagnetic emissions based on frequency spreading introduced by software, computer program product for carrying out the method and associated article of manufacture
US9323879B2 (en) 2014-02-07 2016-04-26 Freescale Semiconductor, Inc. Method of optimizing the design of an electronic device with respect to electromagnetic emissions based on frequency spreading introduced by hardware, computer program product for carrying out the method and associated article of manufacture
RU2584462C2 (ru) * 2014-06-10 2016-05-20 Федеральное государственное образовательное бюджетное учреждение высшего профессионального образования Московский технический университет связи и информатики (ФГОБУ ВПО МТУСИ) Способ передачи и приема сигналов, представленных параметрами ступенчатого модуляционного разложения, и устройство для его осуществления
CN109741757B (zh) * 2019-01-29 2020-10-23 桂林理工大学南宁分校 用于窄带物联网的实时语音压缩和解压的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5543554A (en) * 1978-09-25 1980-03-27 Nippon Musical Instruments Mfg Electronic musical instrument
JPS56119194A (en) * 1980-02-23 1981-09-18 Sony Corp Sound source device for electronic music instrument
JPS56125795A (en) * 1980-03-05 1981-10-02 Sony Corp Sound source for electronic music instrument
JPS6035792A (ja) * 1983-07-25 1985-02-23 株式会社河合楽器製作所 非高調波上音を発生する装置
JPS6121000A (ja) * 1984-07-10 1986-01-29 日本電気株式会社 Csm型音声合成器

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4058676A (en) * 1975-07-07 1977-11-15 International Communication Sciences Speech analysis and synthesis system
US4304965A (en) * 1979-05-29 1981-12-08 Texas Instruments Incorporated Data converter for a speech synthesizer
US4701954A (en) * 1984-03-16 1987-10-20 American Telephone And Telegraph Company, At&T Bell Laboratories Multipulse LPC speech processing arrangement
AU597573B2 (en) * 1985-03-18 1990-06-07 Massachusetts Institute Of Technology Acoustic waveform processing
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5543554A (en) * 1978-09-25 1980-03-27 Nippon Musical Instruments Mfg Electronic musical instrument
JPS56119194A (en) * 1980-02-23 1981-09-18 Sony Corp Sound source device for electronic music instrument
JPS56125795A (en) * 1980-03-05 1981-10-02 Sony Corp Sound source for electronic music instrument
JPS6035792A (ja) * 1983-07-25 1985-02-23 株式会社河合楽器製作所 非高調波上音を発生する装置
JPS6121000A (ja) * 1984-07-10 1986-01-29 日本電気株式会社 Csm型音声合成器

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003514266A (ja) * 1999-11-16 2003-04-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 広帯域オーディオ伝送システム
JP2012027498A (ja) * 1999-11-16 2012-02-09 Koninkl Philips Electronics Nv 広帯域オーディオ伝送システム

Also Published As

Publication number Publication date
CA1307344C (en) 1992-09-08
ATE73251T1 (de) 1992-03-15
JPH0833753B2 (ja) 1996-03-29
AU7530287A (en) 1988-03-17
EP0259950A1 (en) 1988-03-16
DE3777028D1 (de) 1992-04-09
EP0259950B1 (en) 1992-03-04
KR960002387B1 (ko) 1996-02-16
SG123392G (en) 1993-02-19
KR880004425A (ko) 1988-06-07
US4771465A (en) 1988-09-13
AU575515B2 (en) 1988-07-28

Similar Documents

Publication Publication Date Title
JPS6370300A (ja) 人の音声の符号化処理システム
KR960002388B1 (ko) 언어 엔코딩 처리 시스템 및 음성 합성방법
US5305421A (en) Low bit rate speech coding system and compression
CA1337665C (en) Computationally efficient sine wave synthesis for acoustic waveform processing
US5794182A (en) Linear predictive speech encoding systems with efficient combination pitch coefficients computation
US5787387A (en) Harmonic adaptive speech coding method and system
JP5373217B2 (ja) 可変レートスピーチ符号化
US6871176B2 (en) Phase excited linear prediction encoder
CA1065490A (en) Emphasis controlled speech synthesizer
US4821324A (en) Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
US4776015A (en) Speech analysis-synthesis apparatus and method
EP0640952A2 (en) Voiced-unvoiced discrimination method
KR20070086726A (ko) Celp 트랜스코딩
KR100503415B1 (ko) 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법
US4890328A (en) Voice synthesis utilizing multi-level filter excitation
US4969193A (en) Method and apparatus for generating a signal transformation and the use thereof in signal processing
US6115685A (en) Phase detection apparatus and method, and audio coding apparatus and method
JPH0782360B2 (ja) 音声分析合成方法
JP3398968B2 (ja) 音声分析合成方法
CN120564735B (zh) 基于人工智能的音频实时转换与分析管理系统及方法
KR960011132B1 (ko) 씨이엘피(celp) 보코더에서의 피치검색방법
JPH0650440B2 (ja) Lsp型パタンマツチングボコ−ダ
WO2001009880A1 (en) Multimode vselp speech coder
JPH07114396A (ja) ピッチ検出方法
KR100310930B1 (ko) 음성합성장치및그방법