JPH11249699A - 音声パラメータの合同量子化 - Google Patents

音声パラメータの合同量子化

Info

Publication number
JPH11249699A
JPH11249699A JP10344083A JP34408398A JPH11249699A JP H11249699 A JPH11249699 A JP H11249699A JP 10344083 A JP10344083 A JP 10344083A JP 34408398 A JP34408398 A JP 34408398A JP H11249699 A JPH11249699 A JP H11249699A
Authority
JP
Japan
Prior art keywords
parameters
frame
voicing
bits
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10344083A
Other languages
English (en)
Other versions
JP4101957B2 (ja
Inventor
John Clark Hardwick
ジョン・クラーク・ハードウィック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Digital Voice Systems Inc
Original Assignee
Digital Voice Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Voice Systems Inc filed Critical Digital Voice Systems Inc
Publication of JPH11249699A publication Critical patent/JPH11249699A/ja
Application granted granted Critical
Publication of JP4101957B2 publication Critical patent/JP4101957B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 背景ノイズ及びチャネルエラーに影響されな
い低データ伝送速度、高品質の音声コーダを提供する。 【解決手段】 音声信号を、デジタル化してデジタル音
声サンプル列とし、次いでサブフレーム列に分割する。
各サブフレームについてモデルパラメータセットを推定
し、モデルパラメータは、サブフレームの有声化情報を
表す有声化メトリクスのセットを含む。サブフレーム列
から2つ以上のサブフレームを1つのフレームに対応さ
せ、フレーム内のサブフレームからの有声化メトリクス
を合同で量子化する。この合同量子化は、先行フレーム
からの量子化された有声化情報から有声化予測情報を形
成し、残余パラメータを有声化情報と有声化予測情報と
の差として演算し、フレーム内の両サブフレームからの
残余パラメータを結合し、結合された残余パラメータを
量子化してビットフレーム内に含まれる符号化された有
声化情報ビットセットとする。基本周波数情報について
も同様に符号化する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声の符号化と復
号化に関する。
【0002】
【従来の技術】音声の符号化及び復号化は多大なアプリ
ケーションを有し、広範な研究が行われてきた。概し
て、音声圧縮と称される音声コーティングタイプは、音
声の品質または了解度を事実上低減することなしに、音
声信号表示に必要なデータ伝送速度を低減しようと努め
ている。音声圧縮技術は、音声コーダによって実行する
ことができる。
【0003】音声コーダは通常、エンコーダとデコーダ
を含むものとされている。エンコーダは、マイクロフォ
ンで生成されたアナログ信号をアナログ・デジタル変換
器を使用して変換することにより生成可能であるような
デジタル表示音声から、圧縮されたビットストリームを
生成する。デコーダは、圧縮されたビットストリーム
を、デジタル・アナログ変換器及びスピーカを通じた再
生に適する音声のデジタル表現に変換する。実際のアプ
リケーションでは、エンコーダとデコーダは物理的に分
離され、両者間をビットストリームが通信チャネルを使
用して伝送されることが多い。
【0004】音声コーダの主要パラメータはコーダが達
成する圧縮の程度であり、これは、エンコーダによって
生成されるビットストリームのビット伝送速度で測られ
る。エンコーダのビット伝送速度は、概して、希望する
忠実度(即ち、音声品質)と使用する音声コーダタイプ
との関数である。様々なタイプの音声コーダが、高速
(毎秒8kbを越えるもの)、中速(毎秒3−8kb)
及び低速(毎秒3kb未満)で作動するように設計され
ている。最近は、広範な移動通信アプリケーション(セ
ルラ電話、衛星電話、陸上移動無線、機内電話等)に関
連して、中速及び低速の音声コーダが注目されている。
こうしたアプリケーションは典型的には、高品質の音
声、及び音響ノイズ、チャネルノイズ(ビットエラー
等)に起因する人工物に対する強靭さを必要としてい
る。
【0005】ボコーダは、移動通信に対する高度な適用
可能性が実証されている音声コーダの一種である。ボコ
ーダは、短い時間間隔の励起に対するシステムの応答と
して音声をモデル化する。ボコーダシステムの例として
は、線形予測ボコーダ、準同形ボコーダ、チャネルボコ
ーダ、正弦変換コーダ(「STC」)、多帯域励起
(「MBE」)ボコーダ、改良型多帯域励起(「IMB
E(登録商標)」)ボコーダ等がある。こうしたボコー
ダでは、音声が、各々モデルパラメータのセットによっ
て特徴づけられた複数の短いセグメント(典型的には、
10−40ms)に分割される。こうしたパラメータは
典型的には、セグメントのピッチ、有声化状態、スペク
トル包絡線等、各音声セグメントの基本的なエレメント
を表現している。ボコーダは、こうした各パラメータに
関して、多くの周知の表現のうちの1つを使用すること
ができる。例えば、ピッチは、ピッチ周期、基本周波数
または長期予測遅延として表現が可能である。同様に、
有声化状態は、1つまたは複数の有声化メトリクス、有
声化確率測定値または周期的エネルギーと確率的エネル
ギーの比によって表示が可能である。スペクトル包絡線
は、全極フィルタレスポンスによって表現されることが
多いが、スペクトル振幅のセットまたはその他のスペク
トル測定値によって表示することもできる。
【0006】
【発明が解決しようとする課題】ほんの少数のパラメー
タを使用して音声セグメントを表現できることから、ボ
コーダのようなモデルを基礎とする音声コーダは、典型
的には、中速乃至低速のデータ伝送速度で作動可能であ
る。しかしながら、モデルベースのシステムの品質は、
基礎となるモデルの精度に依存する。従って、こうした
音声コーダが高性能音声を達成しようとするならば、高
忠実度のモデルを使用しなければならない。
【0007】高性能音声を提供し、中低速のビット伝送
速度で良好に作動することが実証されている音声モデル
の1つに、グリフィン(Griffin)とリム(Li
m)によって開発された多帯域励起(MBE)音声モデ
ルがある。このモデルは、より自然に響く音声の生成を
可能にするフレキシブルな有声化構造を使用しており、
音響的な背景ノイズの存在に対してより強靭となってい
る。この特性によって、MBE音声モデルは、多くの商
業的な移動通信アプリケーションに使用されている。
【0008】MBE音声モデルは、基本周波数、バイナ
リ有声化/無声化(V/UV)メトリクスまたは決定セ
ット及びスペクトル振幅のセットを使用して音声セグメ
ントを表現する。MBEモデルは、セグメント毎の従来
式の単一V/UV決定を、各決定が特定の周波数帯域内
の有声化状態を表示する決定セットに標準化する。有声
化モデルに於けるこの自在性の付加により、MBEモデ
ルは、多少の摩擦音等の混合された有声音に対してより
順応したものとなっている。この自在性の付加はまた、
音響的背景ノイズによって悪化した音声のより正確な表
現を可能にしている。広範な試験は、この一般化によっ
て声の品質及び了解度が向上することを実証している。
【0009】MBEベースの音声コーダのエンコーダ
は、各音声セグメントについてモデルパラメータセット
を推定する。MBEモデルパラメータには、基本周波数
(ピッチ周期の逆数)、有声化状態を特徴づけるV/U
Vメトリクスまたは決定セット及びスペクトル包絡線を
特徴づけるスペクトル振幅のセットが含まれる。各セグ
メントについてMBEモデルパラメータを推定した後、
エンコーダは、同パラメータを量子化してビットフレー
ムを生成する。エンコーダは選択的に、こうしたビット
をエラー修正/検出コードで保護した上で、最終的なビ
ットストリームを対応するデコーダへ向けてインタリー
ブし、伝送することができる。
【0010】デコーダは、受信したビットストリームを
元の個々のフレームに変換する。この変換の一部とし
て、デコーダは、逆インタリーブ及びエラー制御復号化
を実行してビットエラーを修正または検出することがで
きる。デコーダは次に、ビットフレームを使用してMB
Eモデルパラメータを再構成する。デコーダは、これを
使用して、知覚的にオリジナル音声に類似した音声信号
を合成する。デコーダは、有声化された要素と無声化さ
れた要素を別個に合成し、次に有声化要素と無声化要素
とを加えて最終的な音声信号を生成することができる。
【0011】MBEベースのシステムでは、エンコーダ
は、スペクトル振幅を使用して、推測された基本周波数
の各高調波に於けるスペクトル包絡線を表示する。エン
コーダは次に、各高調波周波数のスペクトル振幅を推定
する。各高調波は、対応する高調波を含む周波数帯域が
有声化または無声化の何れであると言明されているかに
よって、有声化されているか無声化されているかが指定
される。高調波周波数が有声化されていると指定されて
いるときは、エンコーダは、高調波周波数が無声化され
ていると指定されている場合に使用される振幅推定量と
は異なる振幅推定量を使用することができる。デコーダ
では、有声化された高調波と無声化された高調波とが識
別され、有声化要素と無声化要素とが異なる手順を使用
して別々に合成される。無声化要素は、白色ノイズ信号
を濾過するために、重複加重法を使用して合成が可能で
ある。当該方法によって使用されるフィルタは、有声化
されていると指定された全ての周波数帯域をゼロに設定
し、それ以外は、無声化されていると指定された領域の
スペクトル振幅に整合させる。有声化要素は、同調され
た発振器バンクを使用して合成される。有声化されてい
ると指定された各高調波に対して、発振器1つが割り当
てられている。瞬時の振幅、周波数及び位相が補間され
て、隣接セグメントに於ける対応パラメータとの整合が
行われる。
【0012】MBEベースの音声コーダには、IMBE
(登録商標)音声コーダ及びAMBE(登録商標)音声
コーダが含まれる。AMBE(登録商標)音声コーダ
は、初期のMBEベース技術を改良して開発されたもの
であり、励起パラメータ(基本周波数及び有声化決定)
のより粗である推定方法を含んでいる。この方法は、実
際の音声に於いて発見される変化及びノイズをより良く
追跡する能力がある。AMBE(登録商標)音声コーダ
は、典型的には16チャネルを含むフィルタバンクと非
線形性を使用して、励起パラメータの高信頼的推定を可
能にする元となるチャネル出力セットを生成する。チャ
ネル出力は、結合、処理されて基本周波数が推定され
る。その後、数個(例、8つ)の有声化帯域の各々に於
けるチャネルが処理され、各有声化帯域の有声化決定
(またはその他の有声化メトリクス)が推定される。
【0013】AMBE(登録商標)はまた、有声化決定
とは別にスペクトル振幅も推定することができる。これ
を行うために、音声コーダは、ウィンドウ内に表示され
た各音声サブフレームの高速フーリエ変換(FFT)を
演算し、推定された基本周波数の倍数である周波数領域
に於けるエネルギーを平均する。この方法にはさらに、
推定されたスペクトル振幅から、FFTサンプリンググ
リッドによって導入された人工物を除去する補正を含め
ることができる。
【0014】AMBE(登録商標)音声コーダはまた、
有声化された音声の合成に使用される位相情報を、当該
位相情報をエンコーダからデコーダへ明確に伝送するこ
となく再生する位相合成要素を包含することができる。
IMBE(登録商標)音声コーダの場合と同じく、有声
化決定を基礎とするランダム位相合成の適用が可能であ
る。代替として、デコーダは、再生されたスペクトル振
幅に平滑核を印加して、ランダムに生成された位相情報
よりも知覚的にオリジナル音声のそれに近い可能性のあ
る位相情報を生成することができる。
【0015】上述の技術は、例えば、フラナガン(Fl
anagan)著「音声の解析、合成及び認識」Spr
inger−Verlag、1972年、378−38
6頁(周波数を基礎とした音声解析−合成システムにつ
いて記述している)、ジャヤン(Jayant)他著
「波形のデジタルコーディング」Prentice−H
all、1984年(音声のコード化について概説して
いる)、米国特許第4,885,790号(正弦処理方
法について記述している)、米国特許第5,054,0
72号(正弦処理方法について記述している)、アルメ
イダ(Almeida)他著「有声化音声の非定常モデ
リング」IEEE TASSP、ASSP−31巻 第
3号、1983年6月、664−677頁(調波モデリ
ングと関連コーダについて記述している)、アルメイダ
(Almeida)他著「可変周波数の合成:改良型高
調波コーディング法」IEEE会報 ICASSP 8
4、27.5.1−27.5.4頁(多項有声化合成法
について記述している)、クォーティエリ(Quati
eri)他著「正弦表示を基礎とする音声変換」IEE
E TASSP、ASSP34巻 第6号、1986年
12月、1449−1986頁(正弦表示に基づく解析
−合成技術について記述している)、マッカレイ(Mc
Aulay)他著「音声の正弦表示を基礎とする中速コ
ーティング」会報ICASSP 85、945−948
頁、Tampa、FL、1985年3月26−29日
(正弦変換音声コーダについて記述している)、グリフ
ィン(Griffin)著「マルチバンド励起ボコー
ダ」Ph.D.Thesis、M.I.T、1987年
(MBE音声モデルと毎秒8000バイトのMBE音声
コーダについて記述している)、ハードウィック(Ha
rdwick)著「4.8kbpsマルチバンド励起音
声コーダ」SM.Thesis、M.I.T、1988
年5月(毎秒4800バイトのMBE音声コーダについ
て記述している)、通信産業連盟(TIA)「APCO
プロジェクト25ボコーダ解説」1.3版、1993年
7月15日、IS102BABA(APCOプロジェク
ト25スタンダードの毎秒7.2キロバイトのIMBE
(登録商標)音声コーダについて記述している)、米国
特許第5,081,681号(IMBE(登録商標)ラ
ンダム位相合成について記述している)、米国特許第
5,247,579号(MBEを基礎とする音声コーダ
のチャネルエラー軽減方法とフォーマット強化方法につ
いて記述している)、米国特許第5,226,084号
(欧州特許出願第92902772.0号)(MBEを
基礎とする音声コーダの量子化及びエラー軽減方法につ
いて記述している)、米国特許第5,517,511号
(欧州特許出願第94902473.1号)(MBEを
基礎とする音声コーダのビット優先順位決定方法とFE
Cエラー制御方法について記述している)等に記述され
ている。
【0016】
【課題を解決するための手段】本発明は、例えば、無線
通信チャネルを低いデータ伝送速度で伝送されるビット
ストリームから高品質の音声を生成するための無線通信
システムに於いて使用する音声コーダを特徴としてい
る。本音声コーダは、低いデータ伝送速度、高品質音声
及び背景ノイズ及びチャネルエラーに対する強靭さを結
合させたものである。本音声コーダは、2つ以上の連続
するサブフレームから推定された有声化メトリクスを合
同で量子化する多重サブフレーム有声化メトリクス量子
化器によって高性能を達成している。この量子化器は、
先行システムよりも少ないビット数を使用して有声化メ
トリクスの量子化を行ない、先行システムと比肩しうる
忠実度を達成する。本音声コーダは、AMBE(登録商
標)音声コーダとして実行することができる。AMBE
(登録商標)音声コーダは、「励起パラメータの推定」
と題する1998年2月3日発行の米国特許第5,71
5,365号(欧州特許出願第95302290.2
号)、「マルチバンド励起音声コーダのスペクトル表
示」と題する1998年5月19日発行の米国特許第
5,754,974号及び「再生位相情報を使用する音
声合成」と題する1997年12月31日発行の米国特
許第5,701,390号に於いて概説されている。
【0017】ある態様に於いては、概して、音声が符号
化されてビットフレームとなる。音声信号は、デジタル
化されてデジタル音声サンプル列となる。デジタル音声
サンプル群に関して、有声化メトリクスパラメータセッ
トが推定される。当該セットは、多数の有声化メトリク
スパラメータを含んでいる。有声化メトリクスパラメー
タは次に、合同で量子化されてエンコーダ有声化メトリ
クスビットセットが生成される。その後、エンコーダ有
声化メトリクスビットはビットフレームに包含される。
【0018】実行に際しては、以下のような1つまたは
複数の特徴を包含することができる。デジタル音声サン
プルは、各々が多数のデジタル音声サンプルを含むサブ
フレーム列に分割することができる。この列内のサブフ
レームは、1フレームに対応するものとして指定が可能
である。デジタル音声サンプル群は、フレームのサブフ
レームに対応することが可能である。多数の有声化メト
リクスパラメータの合同量子化は、多数のサブフレーム
の各々に関して少なくとも1つの有声化メトリクスパラ
メータを合同で量子化すること、または単一のサブフレ
ームに関して多数の有声化メトリクスパラメータを合同
で量子化すること、を包含可能である。
【0019】合同量子化は、有声化メトリクス残余パラ
メータを、有声化エラーベクトルと有声化エネルギーベ
クトルとの変換比として演算することを包含可能であ
る。サブフレームからの残余有声化メトリクスパラメー
タは結合が可能であり、結合された残余パラメータは量
子化が可能である。
【0020】フレームのサブフレームからの残余パラメ
ータは、残余パラメータに対して線形変換を実行するこ
とにより結合が可能であり、次に結合される各サブフレ
ームの変換残余係数が生成される。結合された残余パラ
メータは、ベクトル量子化器を使用して量子化が可能で
ある。
【0021】ビットフレームは、少なくとも幾つかのエ
ンコーダ有声化メトリクスビットを保護する残余エラー
制御ビットを包含可能である。有声化メトリクスパラメ
ータは、MBEベースの音声モデルについて推定された
有声化状態を表現することができる。
【0022】有声化メトリクスパラメータ以外の音声モ
デルパラメータを合同で量子化することにより、追加的
なエンコーダビットを生成することができる。この追加
的エンコーダビットは、ビットフレーム内に包含するこ
とができる。追加音声モデルパラメータには、スペクト
ル振幅及び基本周波数を表すパラメータが含まれる。
【0023】その他の一般的な態様に於いては、1フレ
ームの複数のサブフレームの複数の基本周波数パラメー
タが合同で量子化され、エンコーダ基本周波数ビットセ
ットが生成される。これは、ビットフレーム内に包含さ
れる。合同量子化は、残余基本周波数パラメータを基本
周波数パラメータの変換平均と各基本周波数パラメータ
との差として演算することを包含可能である。サブフレ
ームからの残余基本周波数パラメータは結合が可能であ
り、結合された残余パラメータは量子化が可能である。
【0024】残余基本周波数パラメータは、残余パラメ
ータに対して線形変換を実行することにより結合が可能
であり、各サブフレームの変換残余係数が生成される。
結合された残余パラメータは、ベクトル量子化器を使用
して量子化が可能である。ビットフレームは、少なくと
も幾つかのエンコーダ基本周波数ビットを保護する残余
エラー制御ビットを包含可能である。基本周波数パラメ
ータは、MBEベースの音声モデルについて推定された
基本周波数の対数を表示することができる。
【0025】有声化メトリクスパラメータ以外の音声モ
デルパラメータを量子化することにより、追加的なエン
コーダビットを生成することができる。この追加的エン
コーダビットは、ビットフレーム内に包含することがで
きる。
【0026】他の一般的な態様に於いては、1フレーム
の1サブフレームの1つの基本周波数パラメータが量子
化され、量子化された基本周波数パラメータを使用して
当該フレームの他のサブフレームの1つの基本周波数パ
ラメータが補間される。次いで、量子化された基本周波
数パラメータと補間された基本周波数パラメータが結合
され、エンコーダ基本周波数ビットセットが生成され
る。
【0027】さらに他の一般的な態様に於いては、上述
の通りに符号化されているビットフレームから音声が復
号される。デコーダ有声化メトリクスビットがビットフ
レームから抽出され、音声フレームの複数のサブフレー
ムに関する有声化メトリクスパラメータの合同再構成に
使用される。サブフレームの再構成された有声化メトリ
クスパラメータの幾つかまたは全てを含む音声モデルパ
ラメータを使用して、音声フレーム内の各サブフレーム
についてデジタル音声サンプルが合成される。
【0028】実行に際しては、以下のような1つまたは
複数の特徴を包含することができる。合同再構成は、デ
コーダ有声化メトリクスビットを逆量子化してフレーム
の結合された残余パラメータセットを再構成することを
包含可能である。結合された残余パラメータからは、各
サブフレームの残余パラメータを別々に演算することが
できる。有声化メトリクスビットから、有声化メトリク
スパラメータを形成することができる。
【0029】各サブフレーム別の残余パラメータは、フ
レームの結合残余パラメータからフレームの有声化メト
リクス残余パラメータを分離することによって演算する
ことができる。フレームの有声化メトリクス残余パラメ
ータについて逆変換を実行し、各サブフレーム別の残余
パラメータを生成することができる。有声化メトリクス
デコーダパラメータについて逆ベクトル量子化変換を実
行することにより、変換された残余パラメータから別々
の有声化メトリクス残余パラメータを演算することがで
きる。
【0030】ビットフレームは、有声化メトリクスパラ
メータ以外の音声モデルパラメータを表示する追加的な
デコーダビットを包含可能である。音声モデルパラメー
タには、スペクトル振幅、基本周波数またはスペクトル
振幅、基本周波数双方を表示するパラメータが含まれ
る。
【0031】再構成される有声化メトリクスパラメータ
は、多帯域励起(MBE)音声モデルに於いて使用可能
な有声化メトリクスを表すことができる。ビットフレー
ムは、少なくとも幾つかのデコーダ有声化メトリクスビ
ットを保護する冗長エラー制御ビットを包含可能であ
る。逆ベクトル量子化を1つまたは複数のベクトルに適
用して、フレームの結合残余パラメータセットを再構成
することができる。
【0032】その他の態様に於いては、上述の通りに符
号化されているビットフレームから音声が復号される。
デコーダ基本周波数ビットがビットフレームから抽出さ
れる。デコーダ基本周波数ビットを使用して、音声フレ
ームの複数のサブフレームに関する基本周波数パラメー
タが合同で再構成される。サブフレームの再構成された
基本周波数パラメータを含む音声モデルパラメータを使
用して、音声フレーム内の各サブフレームについてデジ
タル音声サンプルが合成される。
【0033】実行に際しては、以下のような特徴を包含
することができる。合同再構成は、デコーダ基本周波数
ビットを逆量子化してフレームの結合された残余パラメ
ータセットを再構成することを包含可能である。結合さ
れた残余パラメータからは、各サブフレームの残余パラ
メータを別々に演算することができる。フレームの平均
基本周波数残余パラメータの対数を演算可能であり、ま
た各サブフレームの基本周波数微分残余パラメータの対
数を演算可能である。別々の微分残余パラメータを平均
基本周波数残余パラメータの対数に加算して、フレーム
内の各サブフレームに関する再構成された基本周波数パ
ラメータを形成することができる。
【0034】上述の技術は、コンピュータのハードウェ
アまたはソフトウェア、或いは両者を結合したものに於
いて実行することができる。しかしながら、本技術は、
任意の特定のハードウェアまたはソフトウェアに限定さ
れない。本技術は、音声の符号化または復号化に使用可
能なあらゆる演算または処理環境に於いて適用の場を見
い出すことができる。本技術は、デジタル信号処理チッ
プによって実行され、例えば当該チップに付属する記憶
装置等に保存可能なソフトウェアとして実行することが
できる。本技術はまた、各々がプロセッサ、プロセッサ
による読み取りが可能な保存媒体(揮発性及び不揮発性
メモリ及び/或いは格納要素を含む)及び2つ以上の出
力装置を含む複数のプログラマブルコンピュータ上で実
行されるコンピュータプログラムに於いて実行が可能で
ある。入力装置を使用して入力されたデータにプログラ
ムコードが印加され、上述の機能が実行されて出力情報
が生成される。出力情報は、1つまたは複数の出力装置
に印加される。
【0035】各プログラムは、高レベルの手順または目
的指向性プログラミング言語に於いて実行され、コンピ
ュータシステムと通信することができる。本プログラム
はまた、希望があればアッセンブラ言語または機械語に
於いて実行可能である。何れの場合も、言語は、コンパ
イラ言語または翻訳言語であることも可能である。
【0036】こうした各コンピュータプログラムは、汎
用または専用プログラマブルコンピュータによる読み取
りが可能な記憶媒体または装置(CD−ROM、ハード
ディスクまたは磁気ディスケット等)に格納することが
可能であり、コンピュータは、記憶媒体または装置がコ
ンピュータによって読み取られると本明細書に記述され
た手順を実行するように構成され、作動する。本システ
ムはまた、記憶媒体の形態に起因してコンピュータが特
定または予定の方法で作動するような、コンピュータプ
ログラムに付随して形成された、コンピュータによる読
み取りが可能な記憶媒体として実行可能であると考える
ことができる。
【0037】その他の特徴及び優位点は、図面を含む以
下の説明及び特許請求の範囲から明らかとなるであろ
う。
【0038】
【発明の実施の形態】ある実施例を、セルラ電話または
衛星電話、移動無線、エアホン及びボイスページャ等の
無線通信に、またセキュアテレフォニー及び音声マルチ
プレクサ等の有線通信に、また留守番電話及び口述録音
機等に於ける音声のデジタル保存に適用可能な新規AM
BE(登録商標)音声コーダ、またはボコーダ、の文脈
に於いて説明する。図1を参照すると、AMBE(登録
商標)エンコーダが、サンプル抽出された入力音声を処
理し、5−30ミリ秒毎にサブフレームパラメータセッ
トを生成するAMBE(登録商標)解析器120を使用
して入力音声110の第1回目の解析を行って出力ビッ
トストリームを生成する。2つの連続するサブフレー
ム、130及び140からのサブフレームパラメータ
は、フレームパラメータ量子化器150に供給される。
パラメータは次にフレームパラメータ量子化器150に
よって量子化され、量子化された出力ビットフレームが
形成される。フレームパラメータ量子化器150の出力
は、オプションである前方向エラー訂正(FEC)エン
コーダ160へと供給される。エンコーダによって生成
されたビットストリーム170は、チャネルを通って伝
送されるか、記録媒体に保存が可能である。FECエン
コーダ160によって提供されたエラーコーティング
は、伝送チャネルまたは記録媒体によって導入されるほ
とんどのエラーを修正することができる。伝送または記
憶媒体にエラーがない場合は、FECエンコーダ160
は、さらなる冗長性を付加することなく、フレームパラ
メータ量子化器150によって生成されたビットをエン
コーダ出力170へと通過させることができる。
【0039】図2は、フレームパラメータ量子化器15
0のより詳細なブロック図である。2つの連続するサブ
フレームの基本周波数パラメータが、基本周波数量子化
器210によって合同で量子化されている。両サブフレ
ームの有声化メトリクスは、有声化量子化器220によ
って処理される。両サブフレームのスペクトル振幅は、
振幅量子化器230によって処理される。量子化された
ビットは、結合器240内で結合され、フレームパラメ
ータ量子化器の出力250が形成される。
【0040】図3は、基本周波数量子化器の1実施例を
示している。基本周波数量子化器210によって受信さ
れた2つの基本周波数パラメータは、fund1及びf
und2として示されている。量子化器210は、ログ
プロセッサ305及び306を使用して、両基本周波数
パラメータの対数(典型的には底は2)を生成する。ロ
グプロセッサ305(log2(fund1))及び3
06(log2(fund2))の出力は、平均化器3
10によって平均され、0.5(log2(fund
1)+log2(fund2))として表示可能な出力
が生成される。平均化器310の出力は、4ビットスカ
ラー量子化器320によって量子化される。但し、ビッ
ト数の変動は、容易に調整される。本質的に、スカラー
量子化器320は、平均化器310の高精度出力、これ
は例えば、16または32ビット長である可能性があ
る、を、16の量子化レベルの内の1つに関連して4ビ
ット出力に写す。特別な量子化レベルを表すこの4ビッ
ト数字は、可能性のある16の量子化レベルの各々を平
均化器の出力と比較し、最も近いものを量子化器出力と
して選択することにより決定することができる。オプシ
ョンとして、スカラー量子化器がユニホームスカラー量
子化器であれば、この4ビット出力は、平均化器の出力
プラス偏差を予定のステップサイズΔで除し、ビット数
によって決定された許容可能領域内の最も近い整数に丸
めることにより決定することができる。
【0041】ユニホーム4ビットスカラー量子化器で使
用される典型的な公式は、以下の通りである。
【数1】
【0042】スカラー量子化器によって演算された出
力、ビット数、は、結合器350を通過し、基本周波数
量子化器の出力360の4つの最重要ビットが形成され
る。量子化器320の4つの出力ビットはまた、4ビッ
ト逆スカラー量子化器330にも入力される。4ビット
逆スカラー量子化器330は、この4ビットを、平均化
器310の出力に類似してやはり高精度値であるその元
の関連量子化器レベルへと変換する。この変換は、4つ
の出力ビットに対する各可能性が単一の量子化レベルに
関連しているテーブルルックアップを通じて実行が可能
である。オプションとして、逆スカラー量子化器がユニ
ホームスカラー量子化器であれば、この変換は以下のよ
うに、4つのビット数に予定のステップサイズΔを乗
じ、偏差を加算して出力量子化qlを演算することによ
り達成が可能である。
【0043】
【数2】 ここで、Δは、量子化器320で使用されたものと同じ
である。減算ブロック335及び336は、log
2(fund1)及びlog2(fund2)から逆量子
化器330の出力を減算し、6ビットベクトル量子化器
340に入力される2要素差分ベクトルを生成する。
【0044】6ビットベクトル量子化器340への2つ
の入力は、二次元の差分ベクトル:(z0,z1)とし
て処理される。両成分z0、z1は、1つのフレームに
含まれる2つのサブフレームからの差分要素(即ち、0
番目のサブフレームの後に1番目のサブフレームが続
く)を表している。この二次元ベクトルは、付録Aの
「基本周波数VQコードブック(6ビット)」のような
表に於ける二次元ベクトル(x0(i),x1(i))
と比較される。この比較は、典型的には以下のように計
算される距離測度、e(i)、に基づいて行われる。
【0045】
【数3】e(i)=w0*[x0(i)−z0]2+w1
*[x1(i)−z1]2 ここで、i=0,1,...,63。 但し、w0及びw1は、有声化エネルギーの多いサブフ
レームからの要素に対してはエラー貢献度を低減し、有
声化エネルギーの少ないサブフレームからの要素に対し
てはエラー貢献度を増大させる重み値である。好適な重
みは、以下のように演算される。
【0046】
【数4】 但しC=定数であり、好適な値は0.25である。変数
veneri(0)及びveneri(1)は、i番目の
周波数帯域の各々0番目と1番目のサブフレームの有声
化エネルギー項を表し、変数verri(0)及びve
rri(1)は、i番目の周波数帯域の各々0番目と1
番目のサブフレームの有声化エラー項を表している。e
(i)を最小にするベクトルの指数iは、ベクトル量子
化器340の6ビット出力を生成するために表から選択
される。
【0047】ベクトル量子化器は、任意の二次元ベクト
ルに対して提供する量子化パターン数を低減することに
より、基本周波数の符号化に必要なビット数を低減させ
る。経験的データは、任意の話者に関して、基本周波数
はサブフレーム毎に極度に変化しないことを示してお
り、従って、表2,表3によって提供されている量子化
パターンは、x0(n)及びx1(n)の小値へとより
密に集束される。基本周波数の小さい変動に高密度の量
子化レベルが存在することから、ベクトル量子化器は、
サブフレーム間の基本周波数のこうした小さな変化をよ
り正確に写すことができる。従って、ベクトル量子化器
は、音声品質を極度に低下させることなく、基本周波数
の符号化に必要なビット数を低減させる。
【0048】6ビットベクトル量子化器340の出力
は、結合器350によって4ビットスカラー量子化器3
20の出力と結合される。スカラー量子化器320から
の4ビットは、基本周波数量子化器210の出力360
に於ける最重要ビットを形成し、ベクトル量子化器34
0からの6ビットは、出力360の重要度の低いビット
を形成する。
【0049】図4は、合同基本周波数量子化器の第2の
実施例を示している。ここでもやはり、基本周波数量子
化器210によって受信される2つの基本周波数パラメ
ータがfund1及びfund2として示されている。
量子化器210は、ログプロセッサ405及び406を
使用して、両基本周波数パラメータの対数(典型的には
底は2)を生成する。第2サブフレームに関するログプ
ロセッサ405の出力log2(fund1)は、N=
4乃至8ビット(一般的には、N=6)を使用してスカ
ラー量子化420される。典型的には、ユニホームスカ
ラー量子化器が以下の公式を使用して適用される。
【0050】
【数5】 量子化レベル表で構成される非ユニホームスカラー量子
化器もまた、適用が可能である。出力であるビット数
は、結合器450へと移行し、基本周波数量子化器の出
力460のN個の最重要ビットを形成する。出力ビット
はまた、逆スカラー量子化器430へと送られる。逆ス
カラー量子化器430は、log2(fund1)に対
応し、入力されたビットから以下の公式に従って再構成
された量子化レベルを出力する。
【0051】
【数6】 現行フレームの再構成された量子化レベルql(0)
は、1フレーム遅延要素410に入力される。1フレー
ム遅延要素410は、先行フレームからの類似値(即
ち、先行フレームの第2サブフレームに対応する量子化
レベル)を出力する。現行及びql(−1)として明示
された遅延量子化レベルは、共に2ビットまたは類似の
補間器に入力される。2ビット補間器は、表1に示され
た補間規則から、可能性のある4つの出力のうちでlo
2(fund2)に最も近いものを選択する。但し、
ql(0)=ql(−1)である場合は、量子化の精度
を向上させるために他とは異なる規則が使用される。
【0052】
【表1】 log2(fund2)に最も近い結果を生じさせる補
間規則の2ビット指数iは、補間器440から出力さ
れ、結合器450に入力されて基本周波数量子化器46
0の出力の2つのLSBを形成する。
【0053】図5を参照すると、有声化メトリクス量子
化器220は、連続するサブフレームについて有声化メ
トリクスの合同量子化を実行する。有声化メトリクス
は、n番目のサブフレームのk番目の周波数帯域に於け
るエネルギーを表す有声化エネルギー510、vene
k(n)、と、n番目のサブフレームのk番目の周波
数帯域に於ける非高調波周波数でのエネルギーを表す有
声化エラー項520、verrk(n)、との関数とし
て表示することができる。変数nの値は、先行フレーム
の最終サブフレームは−1、現行フレームの2つのサブ
フレームは0及び1、次のフレームの最初のサブフレー
ム(遅延を考慮した上で利用可能であるとき)は2であ
る。変数kは、8つの離散的周波数帯域に対応する0か
ら7までの値を有している。
【0054】平滑器530は、現行フレームに於ける2
つのサブフレームの各々について有声化メトリクスに平
滑化操作を適用し、出力値εk(0)及びεk(1)を生
成する。εk(0)の値は、以下のようにして計算され
る。
【数7】 また、εk(1)の値は、次の2つの方法のうちの何れ
かによって計算される。1つの追加的な遅延サブフレー
ムをボイスエンコーダに加えることにより予めvene
k(2)及びverrk(2)が演算されているとき
は、εk(1)は以下のようにして計算される。
【0055】
【数8】 venerk(2)及びverrk(2)が予め演算され
ていないときは、εk(1)の値は以下のようにして計
算される。
【0056】
【数9】 Tは有声化限界値であって基準値0.2を有し、βは定
数であって基準値0.67を有する。
【0057】平滑器530からの両サブフレームの出力
値εkは、非線形変換器540に入力され、以下のよう
にして出力値lvkが生成される。
【数10】 ここで、k=0,1,...、但し、γの基準値は0.
5であり、オプションとして、ρ(n)は単純化して定
数値である0.5に等しく設定し、d0(n)とd
1(n)の計算の必要性をなくすることができる。
【0058】現行フレームに関する非線形変換器の出力
である、k=0,1...7、n=0,1のときの16
個の要素lvk(n)は、有声化ベクトルを形成する。
このベクトルは、次いで、対応する有声化エネルギー項
550、venerk(0)、と共にベクトル量子化器
550に入力される。典型的には、2つの方法のうちの
1つがベクトル量子化器560によって適用されるが、
多くの変形方法も使用が可能である。
【0059】第1の方法では、ベクトル量子化器が、単
一ステップに於いて16要素有声化ベクトル全体を量子
化する。このベクトル量子化器は、その入力された有声
化ベクトルを処理し、これを表4,表5に於ける「16
要素有声化メトリクスVQコードブック(6ビット)」
のような関連するコードブック表の中のあらゆる可能な
量子化ベクトルxj(i)、j=0,1,...,1
5、と比較する。ベクトル量子化器によって比較される
可能性のある量子化ベクトルの数は、典型的には2N
ある。ここで、Nは当該ベクトル量子化器によって出力
されるビット数である(典型的には、N=6)。この比
較は、加重平方距離、e(i)、を基礎としており、N
ビットベクトル量子化器のe(i)は、以下のようにし
て計算される。
【0060】
【数11】 ベクトル量子化器560の出力は、コードブック表にあ
るe(i)を最小にすることが発見されている量子化ベ
クトルのNビット指数、i、であり、ベクトル量子化の
この出力が、各フレームの有声化量子化器220の出力
を形成する。
【0061】第2の方法では、ベクトル量子化器が有声
化ベクトルを複数のサブベクトルに分割し、その各々が
個々にベクトル量子化される。量子化に先だって大きい
ベクトルを複数のサブベクトルに分割することにより、
ベクトル量子化器の複雑さとメモリ要件が低減される。
多くの異なる分割を適用すれば、サブベクトルの数及び
長さに多くの変形を生み出すことができる(例、8+
8、5+5+6、4+4+4+4、...)。可能性の
ある1つの変形は、有声化ベクトルを、2つの8要素サ
ブベクトル、lvk(0)、k=0,1...7、及び
lvk(1)、k=0,1...7、に分割することで
ある。これは、有声化ベクトルを、第1サブフレームの
ための1つのサブベクトルと、第2サブフレームのため
の他のサブベクトルとに有効に分割する。各サブベクト
ルは個々にベクトル量子化され、以下のように、Nビッ
トベクトル量子化器のen(i)が最小にされる。
【0062】
【数12】 ここで、i=0,1,...,2N−1、但し、n=
0,1である。各2N量子化ベクトル、xj(i)、但し
i=0,1,...,2N−1、は、8要素長(即ち、
j=0,1,...,7)である。有声化ベクトルをサ
ブフレームによって等しく分割することの1つの優位点
は、フレーム内の2つのサブフレーム間では概して統計
値に変化がないことから、両サブベクトルのベクトル量
子化に同一のコードブック表を使用できることにある。
表6には、4ビットコードブックの例「8要素有声化メ
トリクス分割VQコードブック(4ビット)」が示され
ている。有声化量子化器220の出力でもあるベクトル
量子化器560の出力は、個々のベクトル量子化器から
出力されるビット数を結合して生成される。個々のベク
トル量子化器は、2つの8要素サブベクトルのベクトル
量子化に各々Nビットが使用されるとして、分割段階で
2Nビットを出力する。
【0063】新たな基本量子化器及び有声化量子化器
は、スペクトル振幅を量子化する様々な方法によって結
合が可能である。図6が示すように、振幅量子化器23
0は、AMBE(登録商標)解析器から2つの連続する
サブフレームの振幅パラメータ601a及び601bを
受信する。パラメータ601aは、奇数番号のサブフレ
ーム(即ち、フレームの最終サブフレーム)のスペクト
ル振幅を表し、指数1が与えられている。奇数付番され
たサブフレームの振幅パラメータ数は、L1で示されて
いる。パラメータ601bは、偶数番号のサブフレーム
(即ち、フレームの最初のサブフレーム)のスペクトル
振幅を表し、指数0が与えられている。偶数付番された
サブフレームの振幅パラメータ数は、L0で示されてい
る。
【0064】パラメータ601aは、対数圧伸器602
aを通過する。対数圧伸器602aは、パラメータ60
1aに含まれる各L1振幅に対して2を底とする対数演
算を実行し、L1要素から成るベクトルである信号60
3aを生成する。
【数13】 y[i]=log2(x[i]) ここで、i=1,2,...,L1、但し、x[i]は
パラメータ601aを表し、y[i]は、信号603a
を表している。圧伸器602bは、パラメータ601b
に含まれる各L0振幅に対して2を底とする対数演算を
実行し、L0要素から成るベクトルである信号603b
を生成する。
【0065】
【数14】 y[i]=log2(x[i]) ここで、i=1,2,...,L0、但し、x[i]は
パラメータ601bを表し、y[i]は、信号603b
を表している。平均値計算機604a及び604bは、
対数圧伸器602a及び602bによって生成された信
号603a及び603bを受信し、各サブフレームの平
均値605a及び605bを算出する。この平均値、ま
たはゲイン値、は当該サブフレームの平均音声レベルを
表しており、両サブフレームのスペクトル振幅の対数の
平均を演算してサブフレーム内の調波数に依存するオフ
セットを加えることにより決定される。
【0066】信号603aの場合、平均値は以下のよう
に計算される。
【数15】 但し、出力y1は、各フレームの最終サブフレームに対
応する平均信号605aを表している。信号603bの
場合、平均値は以下のように計算される。
【0067】
【数16】 但し、出力y0は、各フレームの第1サブフレームに対
応する平均信号605bを表している。
【0068】平均信号605a及び605bは、平均ベ
クトル量子化器606によって量子化される。平均ベク
トル量子化器606は、典型的には8ビットを使用し、
演算された平均ベクトル(y0,y1)を、表7〜表12
に示す「平均ベクトルVQコードブック(8ビット)」
のようなコードブック表に記載された各候補ベクトルと
比較する。この比較は、候補コードブックベクトル(x
0(i),x1(i))の典型的には以下のように計算
される距離測度、e(i)、に基づいて行われる。
【数17】 e(i)=[x0(i)−y02
[x1(i)−y12 ここで、i=0,1,...,255。 e(i)を最小にする候補ベクトルの8ビット指数i
が、平均ベクトル量子化器608bの出力を形成する。
平均ベクトル量子化器の出力は、次いで結合器609に
送られ、振幅量子化器の出力の一部を形成する。この平
均ベクトル量子化器に適用される他のハイブリッドベク
トル/スカラー方法が、1997年3月14日に提出さ
れた「スペクトルパラメータの多重サブフレーム量子
化」と題する米国特許出願第08/818,130号に
記述されている。
【0069】再度図6を参照すると、信号603a及び
603bは、ブロックDCT量子化器607に入力され
る。但し、このブロックDCT量子化器607には、他
の形式の量子化器も使用可能である。ブロックDCT量
子化器の変形は、一般に採用されている。第1の変形例
では、2つのサブフレーム信号603a及び603bが
順番に量子化される(先に最初のフレーム、次いで最終
フレーム)が、第2の変形例では、信号603a及び6
03bが合同で量子化される。第1変形例の優位点は、
予測の基礎を先行フレームの最終サブフレームではなく
先行サブフレーム(即ち、最初のサブフレーム)とし得
ることから、最終サブフレームの予測がより有効である
ことにある。さらに、第1変形例は典型的に第2変形例
ほど複雑でなく、必要な係数記憶も少ない。第2変形例
の優位点は、合同量子化に2つのサブフレーム間の冗長
性をより良く活用する傾向があり、量子化歪みが低下
し、音声品質が向上することにある。
【0070】ブロックDCT量子化器607の例は、米
国特許第5,226,084号(欧州特許出願第929
02772.0号)に記述されている。この例では、先
行サブフレームに基づいて予測信号を演算し、次いでこ
の予測信号をスケーリング及び減算して差分信号を生成
することにより、信号603a及び603bが順次量子
化される。各サブフレームの差分信号は、次いで少数の
ブロック、典型的には1サブフレーム当たり6または8
ブロック、に分割され、各ブロック毎に離散的余弦変換
(DCT)が演算される。各サブフレーム毎に、各ブロ
ックからの第1DCT係数がPRBAベクトルの形成に
使用され、各ブロックの残りのDCT係数が、可変長の
HOCベクトルを形成する。PRBAベクトル及びHO
Cベクトルは、次いで、ベクトルまたはスカラー量子化
の何れかを使用して量子化される。出力ビットは、ブロ
ックDCT量子化器の出力608aを形成する。
【0071】ブロックDCT量子化器607のその他の
例は、1997年3月14日に提出された「スペクトル
パラメータの多重サブフレーム量子化」と題する米国特
許出願第08/818,130号に開示されている。こ
の例では、ブロックDCT量子化器が、両サブフレーム
からのスペクトルパラメータを合同で量子化する。ま
ず、各サブフレームの予測信号が、先行フレームの最終
サブフレームを基礎として演算される。この予測信号
は、縮小され(典型的な縮尺係数は0.65または0.
8)、両信号603a、603bから減算される。結果
として得られた差分信号は、次いで複数のブロック(1
サブフレームにつき4ブロック)に分割され、各ブロッ
クがDCTで処理される。各ブロックからの最初から2
つのDCT係数をさらなる2×2変換セット及び8点D
CTへ送ることにより、各サブフレームの8要素PRB
Aベクトルが形成される。各ブロックの残りのDCT係
数は、サブフレーム毎に4HOCベクトルセットを形成
する。次に、現行フレームの2つのサブフレームからの
対応するPRBAベクトル及びHOCベクトル間で、和
/差演算が実行される。結果的に得られた和/差成分は
ベクトル量子化され、ベクトル量子化器の結合された出
力はブロックDCT量子化器608aの出力を形成す
る。
【0072】さらなる例では、米国特許出願第08/8
18,130号に開示された合同サブフレーム方法は、
先行フレームの最終サブフレームからでなく、先行サブ
フレームから各サブフレームの予測信号を演算し、2つ
のサブフレームからのPRBA及びHOCベクトルの結
合に使用される和/差演算を省くことによって、連続サ
ブフレーム量子化器に転換可能である。PRBA及びH
OCベクトルは、次いでベクトル量子化され、結果とし
て得られた両サブフレームのビット数が結合されてスペ
クトル量子化器8aの出力を形成する。この方法は、よ
り効率的なブロック分割及びDCT演算と結合された、
より有効な予測戦略の使用を可能にする。しかしなが
ら、この場合は、合同量子化によって追加される効率か
ら利益は得られない。
【0073】スペクトル量子化器608aからの出力ビ
ットは、結合器609に於いて606から出力される量
子化されたゲインビット608bと結合され、その結
果、振幅量子化器の出力610が形成される。出力61
0はまた、図2の振幅量子化器230の出力をも形成す
る。
【0074】実施例についてもまた、AMBE(登録商
標)音声デコーダの文脈に於いて記述することができ
る。図7が示すように、デジタル化され符号化された音
声は、FECデコーダ710によって処理が可能であ
る。フレームパラメータ逆量子化器720は、次いで、
本質的には上述の量子化工程の逆を行って、フレームパ
ラメータデータをサブフレームパラメータ730及び7
40に変換する。サブフレームパラメータ730及び7
40は、次いでAMBE(登録商標)音声デコーダ75
0に送られ、音声出力760に変換される。
【0075】図8は、フレームパラメータ逆量子化器の
詳細図である。デバイダ810は、着信する符号化され
た音声信号を、基本周波数逆量子化器820と、有声化
逆量子化器830と、多重サブフレーム振幅逆量子化器
840とに分割する。こうした逆量子化器は、サブフレ
ームパラメータ850及び860を生成する。
【0076】図9は、図3に示した量子化器を補足する
基本周波数逆量子化器820の一例を示している。基本
周波数量子化ビットはデバイダ910に供給され、デバ
イダ910は、同ビットを4ビット逆一様スカラー量子
化器920と、6ビット逆ベクトル量子化器930とに
供給する。スカラー量子化器の出力940は、加算器9
60及び965を使用して、逆ベクトル量子化器の出力
950及び955と結合される。結果的な信号は、次い
で逆圧伸器970及び975を通り、サブフレーム基本
周波数パラメータfund1及びfund2を形成す
る。先に編入した参考文献に記述されているような、或
いは上述の量子化技術を補足するような他の逆量子化技
術の使用は可能である。他の実施例は、特許請求の範囲
の権利範囲内に存在する。
【表2】
【表3】
【表4】
【表5】
【表6】
【表7】
【表8】
【表9】
【表10】
【表11】
【表12】
【図面の簡単な説明】
【図1】 AMBE(登録商標)ボコーダシステムのブ
ロック図である。
【図2】 合同パラメータ量子化器のブロック図であ
る。
【図3】 基本周波数量子化器のブロック図である。
【図4】 代替の基本周波数量子化器のブロック図であ
る。
【図5】 有声化メトリクス量子化器のブロック図であ
る。
【図6】 多重サブフレームスペクトル振幅量子化器の
ブロック図である。
【図7】 AMBE(登録商標)デコーダシステムのブ
ロック図である。
【図8】 合同パラメータ逆量子化器のブロック図であ
る。
【図9】 基本周波数逆量子化器のブロック図である。
【符号の説明】
110…音声入力、 120…AMBEサブフレーム解
析器、 130…サブフレーム1パラメータ、 140
…サブフレーム2パラメータ、 150…フレームパラ
メータ電子化器、 160…FECエンコーダ、 21
0…基本周波数量子化器、 220…有声化電子化器、
230…多重サブフレーム振幅量子化器。

Claims (31)

    【特許請求の範囲】
  1. 【請求項1】 音声を符号化してビットフレームにする
    方法であって、 音声信号をデジタル化してデジタル音声サンプル列にす
    ることと、 一群のデジタル音声サンプルに関して、多数の有声化メ
    トリクスパラメータを含む有声化メトリクスパラメータ
    セットを推定することと、 有声化メトリクスパラメータを合同で量子化して、エン
    コーダ有声化メトリクスビットセットを生成すること
    と、 ビットフレームにエンコーダ有声化メトリクスビットを
    包含すること、を含む方法。
  2. 【請求項2】 デジタル音声サンプルを、各サブフレー
    ムが多数のデジタル音声サンプルを含むサブフレーム列
    に分割することと、 サブフレーム列からのサブフレームを1つのフレームに
    対応するものとして指定すること、をさらに含み、 デジタル音声サンプル群が上記フレームに対応するサブ
    フレームに対応している請求項1記載の方法。
  3. 【請求項3】 多数の有声化メトリクスパラメータの合
    同量子化が、各多重サブフレームの少なくとも1つの有
    声化メトリクスパラメータの合同量子化を含む請求項2
    記載の方法。
  4. 【請求項4】 多数の有声化メトリクスパラメータの合
    同量子化が、単一サブフレームの多数の有声化メトリク
    スパラメータの合同量子化を含む請求項2記載の方法。
  5. 【請求項5】 合同量子化が、 有声化メトリクス残余パラメータを、音声エラーベクト
    ルと音声エネルギーベクトルとの変換比として演算する
    ことと、 有声化メトリクス残余パラメータを結合することと、 結合された残余パラメータを量子化すること、を含む請
    求項1記載の方法。
  6. 【請求項6】 上記残余パラメータの結合が、残余パラ
    メータに対して線形変換を実行し各サブフレームの変換
    残余係数セットを生成することを含む請求項5記載の方
    法。
  7. 【請求項7】 結合された残余パラメータの量子化が、
    少なくとも1つのベクトル量子化器を使用することを含
    む請求項5記載の方法。
  8. 【請求項8】 ビットフレームが、少なくともエンコー
    ダ有声化メトリクスビットの幾つかを保護する冗長エラ
    ー制御ビットを含む請求項1記載の方法。
  9. 【請求項9】 有声化メトリクスパラメータが、多帯域
    励起(MBE)音声モデルのために推定された有声化状
    態を表す請求項1記載の方法。
  10. 【請求項10】 有声化メトリクスパラメータ以外の追
    加的な音声モデルパラメータを量子化することによって
    追加エンコーダビットを生成することと、追加エンコー
    ダビットをフレームビット内に包含すること、をさらに
    含む請求項1記載の方法。
  11. 【請求項11】 追加音声モデルパラメータが、スペク
    トル振幅を表すパラメータを含む請求項10記載の方
    法。
  12. 【請求項12】 追加音声モデルパラメータが、基本周
    波数を表すパラメータを含む請求項10記載の方法。
  13. 【請求項13】 追加音声モデルパラメータが、スペク
    トル振幅を表すパラメータを含む請求項12記載の方
    法。
  14. 【請求項14】 音声を符号化してビットフレームにす
    る方法であって、 音声信号をデジタル化してデジタル音声サンプル列にす
    ることと、 デジタル音声サンプルを、各サブフレームが多数のデジ
    タル音声サンプルを含むサブフレーム列に分割すること
    と、 各サブフレームの基本周波数パラメータを推定すること
    と、 サブフレーム列からのサブフレームをフレームに対応す
    るものとして指定することと、 フレームのサブフレームから基本周波数パラメータを合
    同的に量子化してエンコーダ基本周波数ビットセットを
    生成することと、 エンコーダ基本周波数ビットをビットフレーム内に包含
    すること、を含む方法。
  15. 【請求項15】 合同量子化が、 基本周波数残余パラメータを基本周波数パラメータの変
    換された平均値と各基本周波数パラメータとの差として
    演算することと、 フレームのサブフレームから残余基本周波数パラメータ
    を結合することと、 結合された残余パラメータを量子化すること、を含む請
    求項14記載の方法。
  16. 【請求項16】 フレームのサブフレームからの残余パ
    ラメータの結合が、残余パラメータに対して線形変換を
    実行し、各サブフレームの変換残余係数セットを生成す
    ることを含む請求項15記載の方法。
  17. 【請求項17】 基本周波数パラメータが、多帯域励起
    (MBE)音声モデルのために推定された基本周波数の
    対数を表す請求項14記載の方法。
  18. 【請求項18】 基本周波数パラメータ以外の追加的な
    音声モデルパラメータの量子化によって追加エンコーダ
    ビットを生成することと、追加エンコーダビットをビッ
    トフレーム内に包含すること、をさらに含む請求項14
    記載の方法。
  19. 【請求項19】 追加音声モデルパラメータが、スペク
    トル振幅を表すパラメータを含む請求項18記載の方
    法。
  20. 【請求項20】 音声を符号化してビットフレームにす
    る方法であって、 音声信号をデジタル化してデジタル音声サンプル列にす
    ることと、 デジタル音声サンプルを、各サブフレームが多数のデジ
    タル音声サンプルを含むサブフレーム列に分割すること
    と、 各サブフレームの基本周波数パラメータを推定すること
    と、 サブフレーム列からのサブフレームをフレームに対応す
    るものとして指定することと、 フレームの1サブフレームからの基本周波数パラメータ
    を量子化することと、 フレームの1サブフレームからの量子化された基本周波
    数パラメータを使用してフレームの他のサブフレームの
    基本周波数パラメータを補間することと、 量子化された基本周波数パラメータと補間された基本周
    波数パラメータを結合させてエンコーダ基本周波数ビッ
    トセットを生成することと、 エンコーダ基本周波数ビットをビットフレーム内に包含
    すること、を含む方法。
  21. 【請求項21】 音声を符号化してビットフレームにす
    る音声エンコーダであって、 音声信号をデジタル化してデジタル音声サンプル列にす
    るための手段と、 一群のデジタル音声サンプルに関して、多数の有声化メ
    トリクスパラメータを含む有声化メトリクスパラメータ
    セットを推定するための手段と、 有声化メトリクスパラメータを合同で量子化してエンコ
    ーダ有声化メトリクスビットセットを生成するための手
    段と、 エンコーダ有声化メトリクスビットを含むビットフレー
    ムを形成するための手段と、を備えたエンコーダ。
  22. 【請求項22】 デジタル音声サンプルを、各サブフレ
    ームが多数のデジタル音声サンプルを含むサブフレーム
    列に分割するための手段と、 サブフレーム列からサブフレームを1つのフレームに対
    応するものとして指定するための手段と、をさらに備
    え、 デジタル音声サンプル群がフレームに対応するサブフレ
    ームに一致する請求項21記載の音声エンコーダ。
  23. 【請求項23】 多数の有声化メトリクスパラメータを
    合同で量子化するための手段が、各多重サブフレームの
    少なくとも1つの有声化メトリクスパラメータを合同で
    量子化する請求項22記載の音声エンコーダ。
  24. 【請求項24】 多数の有声化メトリクスパラメータを
    合同で量子化するための手段が、単一サブフレームの多
    数の有声化メトリクスパラメータを合同で量子化する請
    求項22記載の音声エンコーダ。
  25. 【請求項25】 音声信号をデジタル化してデジタル音
    声サンプル列にすることと、一群のデジタル音声サンプ
    ルに関して、多数の有声化メトリクスパラメータを含む
    有声化メトリクスパラメータセットを推定することと、
    有声化メトリクスパラメータを合同で量子化して、エン
    コーダ有声化メトリクスビットセットを生成すること
    と、ビットフレームにエンコーダ有声化メトリクスビッ
    トを包含すること、によって符号化されているビットフ
    レームから音声を復号する方法であって、 ビットフレームからデコーダ有声化メトリクスビットを
    抽出することと、 デコーダ有声化メトリクスビットを使用して有声化メト
    リクスパラメータを合同で再構成することと、 再構成された有声化メトリクスパラメータの幾つかまた
    は全てを包含する音声モデルパラメータを使用してデジ
    タル音声サンプルを合成すること、を含む方法。
  26. 【請求項26】 合同再構成が、 デコーダ有声化メトリクスビットを逆量子化してフレー
    ムの結合された残余パラメータセットを再構成すること
    と、 結合された残余パラメータから各サブフレームの個別残
    余パラメータを演算す ることと、有声化メトリクスビットから有声化メトリク
    スパラメータを形成すること、を含む請求項25記載の
    音声復号方法。
  27. 【請求項27】 各サブフレームの個別残余パラメータ
    の演算が、 フレームの結合された残余パラメータから、フレームの
    有声化メトリクス残余パラメータを分離することと、 フレームの有声化メトリクス残余パラメータに対して逆
    変換を実行し、フレームの各サブフレームの個別残余パ
    ラメータを生成すること、を含む請求項26記載の方
    法。
  28. 【請求項28】 音声信号をデジタル化してデジタル音
    声サンプル列にすることと、一群のデジタル音声サンプ
    ルに関して、多数の有声化メトリクスパラメータを含む
    有声化メトリクスパラメータセットを推定することと、
    有声化メトリクスパラメータを合同で量子化して、エン
    コーダ有声化メトリクスビットセットを生成すること
    と、ビットフレームにエンコーダ有声化メトリクスビッ
    トを包含すること、によって符号化されているビットフ
    レームから音声を復号するためのデコーダであって、 ビットフレームからデコーダ有声化メトリクスビットを
    抽出するための手段と、 デコーダ有声化メトリクスビットを使用して有声化メト
    リクスパラメータを合同で再構成するための手段と、 再構成された有声化メトリクスパラメータの幾つかまた
    は全てを包含する音声モデルパラメータを使用してデジ
    タル音声サンプルを合成するための手段と、を備えたデ
    コーダ。
  29. 【請求項29】 プロセッサ読み取り可能な媒体上のソ
    フトウェアであって、 一群のデジタル音声サンプルに関して多数の有声化メト
    リクスパラメータを含む有声化メトリクスパラメータセ
    ットを推定する作業と、 有声化メトリクスパラメータを合同で量子化してエンコ
    ーダ有声化メトリクスビットセットを生成する作業と、 エンコーダ有声化メトリクスビットを含むビットフレー
    ムを形成する作業とをプロセッサに実行させるための指
    示を含むソフトウェア。
  30. 【請求項30】 プロセッサ読み取り可能な媒体が、プ
    ロセッサを含むデジタル信号処理チップに付随するメモ
    リを備えた請求項29記載のソフトウェア。
  31. 【請求項31】 通信システムであって、 音声信号をデジタル化してデジタル音声サンプル列に
    し、 一群のデジタル音声サンプルに関して多数の有声化メト
    リクスパラメータを含む有声化メトリクスパラメータセ
    ットを推定し、 有声化メトリクスパラメータを合同で量子化してエンコ
    ーダ有声化メトリクスビットセットを生成し、 エンコーダ有声化メトリクスビットを含むビットフレー
    ムを形成し、 ビットフレームを送信するように構築された送信機と、 ビットフレームを受信、処理して音声信号を生成するよ
    うに構築された受信機と、を備えた通信システム。
JP34408398A 1997-12-04 1998-12-03 音声パラメータの合同量子化 Expired - Lifetime JP4101957B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/985262 1997-12-04
US08/985,262 US6199037B1 (en) 1997-12-04 1997-12-04 Joint quantization of speech subframe voicing metrics and fundamental frequencies

Publications (2)

Publication Number Publication Date
JPH11249699A true JPH11249699A (ja) 1999-09-17
JP4101957B2 JP4101957B2 (ja) 2008-06-18

Family

ID=25531324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34408398A Expired - Lifetime JP4101957B2 (ja) 1997-12-04 1998-12-03 音声パラメータの合同量子化

Country Status (5)

Country Link
US (1) US6199037B1 (ja)
EP (1) EP0927988B1 (ja)
JP (1) JP4101957B2 (ja)
CA (1) CA2254567C (ja)
DE (1) DE69815650T2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001222297A (ja) * 1999-11-29 2001-08-17 Digital Voice Syst Inc マルチバンドハーモニック変換コーダ
JP2003510644A (ja) * 1999-09-22 2003-03-18 マイクロソフト コーポレイション スーパーフレーム構造のlpcハーモニックボコーダ
JP2004310088A (ja) * 2003-04-01 2004-11-04 Digital Voice Systems Inc 半レート・ボコーダ
JP2005318580A (ja) * 2004-04-14 2005-11-10 Ma Com Inc 安全な無線通信用の汎用マイクロフォン
JP2005326862A (ja) * 2004-05-13 2005-11-24 Samsung Electronics Co Ltd 音声信号圧縮装置及び方法、音声信号復元装置及び方法、ならびにコンピュータ読取可能な記録媒体
JP2008102520A (ja) * 2006-10-18 2008-05-01 Polycom Inc オーディオ信号の2重変換符号化

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE519563C2 (sv) * 1998-09-16 2003-03-11 Ericsson Telefon Ab L M Förfarande och kodare för linjär prediktiv analys-genom- synteskodning
WO2000022606A1 (en) * 1998-10-13 2000-04-20 Motorola Inc. Method and system for determining a vector index to represent a plurality of speech parameters in signal processing for identifying an utterance
US7092881B1 (en) * 1999-07-26 2006-08-15 Lucent Technologies Inc. Parametric speech codec for representing synthetic speech in the presence of background noise
US6876953B1 (en) * 2000-04-20 2005-04-05 The United States Of America As Represented By The Secretary Of The Navy Narrowband signal processor
KR100375222B1 (ko) * 2000-07-19 2003-03-08 엘지전자 주식회사 스케일러블 칼라 히스토그램 엔코딩 방법
US7243295B2 (en) * 2001-06-12 2007-07-10 Intel Corporation Low complexity channel decoders
US20030135374A1 (en) * 2002-01-16 2003-07-17 Hardwick John C. Speech synthesizer
US7970606B2 (en) 2002-11-13 2011-06-28 Digital Voice Systems, Inc. Interoperable vocoder
AU2003297732A1 (en) * 2002-12-06 2004-06-30 Attensity Corporation Systems and methods for providing a mixed data integration service
US7634399B2 (en) * 2003-01-30 2009-12-15 Digital Voice Systems, Inc. Voice transcoder
US6961696B2 (en) * 2003-02-07 2005-11-01 Motorola, Inc. Class quantization for distributed speech recognition
US6915256B2 (en) * 2003-02-07 2005-07-05 Motorola, Inc. Pitch quantization for distributed speech recognition
US7272557B2 (en) * 2003-05-01 2007-09-18 Microsoft Corporation Method and apparatus for quantizing model parameters
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US8630849B2 (en) * 2005-11-15 2014-01-14 Samsung Electronics Co., Ltd. Coefficient splitting structure for vector quantization bit allocation and dequantization
US8036886B2 (en) 2006-12-22 2011-10-11 Digital Voice Systems, Inc. Estimation of pulsed speech model parameters
JP5197774B2 (ja) * 2011-01-18 2013-05-15 株式会社東芝 学習装置、判定装置、学習方法、判定方法、学習プログラム及び判定プログラム
CN102117616A (zh) * 2011-03-04 2011-07-06 北京航空航天大学 一种ambe-2000声码器无格式码流的实时编解码纠错方法
CN102664012B (zh) * 2012-04-11 2014-02-19 成都林海电子有限责任公司 卫星移动通信终端及终端中xc5vlx50t与ambe2000信息交互的方法
CN103680519A (zh) * 2012-09-07 2014-03-26 成都林海电子有限责任公司 卫星移动终端语音编解码器全双工语音输出功能测试方法
CN103684574A (zh) * 2012-09-07 2014-03-26 成都林海电子有限责任公司 卫星移动通信终端的语音编解码器自闭环性能测试方法
KR101475894B1 (ko) * 2013-06-21 2014-12-23 서울대학교산학협력단 장애 음성 개선 방법 및 장치
US11270714B2 (en) 2020-01-08 2022-03-08 Digital Voice Systems, Inc. Speech coding using time-varying interpolation
US12254895B2 (en) 2021-07-02 2025-03-18 Digital Voice Systems, Inc. Detecting and compensating for the presence of a speaker mask in a speech signal
US11990144B2 (en) 2021-07-28 2024-05-21 Digital Voice Systems, Inc. Reducing perceived effects of non-voice data in digital speech
US12451151B2 (en) 2022-04-08 2025-10-21 Digital Voice Systems, Inc. Tone frame detector for digital speech

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3706929A (en) 1971-01-04 1972-12-19 Philco Ford Corp Combined modem and vocoder pipeline processor
US3982070A (en) 1974-06-05 1976-09-21 Bell Telephone Laboratories, Incorporated Phase vocoder speech synthesis system
US3975587A (en) 1974-09-13 1976-08-17 International Telephone And Telegraph Corporation Digital vocoder
US4091237A (en) 1975-10-06 1978-05-23 Lockheed Missiles & Space Company, Inc. Bi-Phase harmonic histogram pitch extractor
US4422459A (en) 1980-11-18 1983-12-27 University Patents, Inc. Electrocardiographic means and method for detecting potential ventricular tachycardia
DE3266042D1 (en) 1981-09-24 1985-10-10 Gretag Ag Method and apparatus for reduced redundancy digital speech processing
AU570439B2 (en) 1983-03-28 1988-03-17 Compression Labs, Inc. A combined intraframe and interframe transform coding system
NL8400728A (nl) 1984-03-07 1985-10-01 Philips Nv Digitale spraakcoder met basisband residucodering.
US4583549A (en) 1984-05-30 1986-04-22 Samir Manoli ECG electrode pad
US4622680A (en) 1984-10-17 1986-11-11 General Electric Company Hybrid subband coder/decoder method and apparatus
US4885790A (en) 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US5067158A (en) 1985-06-11 1991-11-19 Texas Instruments Incorporated Linear predictive residual representation via non-iterative spectral reconstruction
US4879748A (en) 1985-08-28 1989-11-07 American Telephone And Telegraph Company Parallel processing pitch detector
US4720861A (en) 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
US4797926A (en) 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
US5054072A (en) 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US5095392A (en) 1988-01-27 1992-03-10 Matsushita Electric Industrial Co., Ltd. Digital signal magnetic recording/reproducing apparatus using multi-level QAM modulation and maximum likelihood decoding
US5023910A (en) 1988-04-08 1991-06-11 At&T Bell Laboratories Vector quantization in a harmonic speech coding arrangement
US4821119A (en) 1988-05-04 1989-04-11 Bell Communications Research, Inc. Method and apparatus for low bit-rate interframe video coding
US4979110A (en) 1988-09-22 1990-12-18 Massachusetts Institute Of Technology Characterizing the statistical properties of a biological signal
JPH0782359B2 (ja) 1989-04-21 1995-09-06 三菱電機株式会社 音声符号化装置、音声復号化装置及び音声符号化・復号化装置
WO1990013112A1 (fr) 1989-04-25 1990-11-01 Kabushiki Kaisha Toshiba Codeur vocal
US5036515A (en) 1989-05-30 1991-07-30 Motorola, Inc. Bit error rate detection
US5081681B1 (en) 1989-11-30 1995-08-15 Digital Voice Systems Inc Method and apparatus for phase synthesis for speech processing
US5226108A (en) 1990-09-20 1993-07-06 Digital Voice Systems, Inc. Processing a speech signal with estimated pitch
US5216747A (en) 1990-09-20 1993-06-01 Digital Voice Systems, Inc. Voiced/unvoiced estimation of an acoustic signal
US5226084A (en) 1990-12-05 1993-07-06 Digital Voice Systems, Inc. Methods for speech quantization and error correction
US5247579A (en) 1990-12-05 1993-09-21 Digital Voice Systems, Inc. Methods for speech transmission
US5517511A (en) 1992-11-30 1996-05-14 Digital Voice Systems, Inc. Digital transmission of acoustic signals over a noisy communication channel
CA2154911C (en) * 1994-08-02 2001-01-02 Kazunori Ozawa Speech coding device
US5664053A (en) * 1995-04-03 1997-09-02 Universite De Sherbrooke Predictive split-matrix quantization of spectral parameters for efficient coding of speech
US5806038A (en) * 1996-02-13 1998-09-08 Motorola, Inc. MBE synthesizer utilizing a nonlinear voicing processor for very low bit rate voice messaging
US6014622A (en) * 1996-09-26 2000-01-11 Rockwell Semiconductor Systems, Inc. Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
US6131084A (en) * 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003510644A (ja) * 1999-09-22 2003-03-18 マイクロソフト コーポレイション スーパーフレーム構造のlpcハーモニックボコーダ
JP2001222297A (ja) * 1999-11-29 2001-08-17 Digital Voice Syst Inc マルチバンドハーモニック変換コーダ
JP2004310088A (ja) * 2003-04-01 2004-11-04 Digital Voice Systems Inc 半レート・ボコーダ
JP2005318580A (ja) * 2004-04-14 2005-11-10 Ma Com Inc 安全な無線通信用の汎用マイクロフォン
JP2005326862A (ja) * 2004-05-13 2005-11-24 Samsung Electronics Co Ltd 音声信号圧縮装置及び方法、音声信号復元装置及び方法、ならびにコンピュータ読取可能な記録媒体
US8019600B2 (en) 2004-05-13 2011-09-13 Samsung Electronics Co., Ltd. Speech signal compression and/or decompression method, medium, and apparatus
JP2008102520A (ja) * 2006-10-18 2008-05-01 Polycom Inc オーディオ信号の2重変換符号化

Also Published As

Publication number Publication date
US6199037B1 (en) 2001-03-06
CA2254567C (en) 2010-11-16
EP0927988A2 (en) 1999-07-07
DE69815650D1 (de) 2003-07-24
EP0927988A3 (en) 2001-04-11
DE69815650T2 (de) 2004-04-29
CA2254567A1 (en) 1999-06-04
EP0927988B1 (en) 2003-06-18
JP4101957B2 (ja) 2008-06-18

Similar Documents

Publication Publication Date Title
JP4101957B2 (ja) 音声パラメータの合同量子化
US7957963B2 (en) Voice transcoder
CA2169822C (en) Synthesis of speech using regenerated phase information
RU2214048C2 (ru) Способ кодирования речи (варианты), кодирующее и декодирующее устройство
US6377916B1 (en) Multiband harmonic transform coder
US5754974A (en) Spectral magnitude representation for multi-band excitation speech coders
US8595002B2 (en) Half-rate vocoder
JP4166673B2 (ja) 相互使用可能なボコーダ
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
US6161089A (en) Multi-subframe quantization of spectral parameters
JPH03211599A (ja) 4.8kbpsの情報伝送速度を有する音声符号化/復号化器
US11270714B2 (en) Speech coding using time-varying interpolation
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP2002366195A (ja) 音声符号化パラメータ符号化方法及び装置
JP3878254B2 (ja) 音声圧縮符号化方法および音声圧縮符号化装置
KR0155798B1 (ko) 음성신호 부호화 및 복호화 방법
JP3453116B2 (ja) 音声符号化方法及び装置
KR100220783B1 (ko) 음성 양자화 및 에러 보정 방법

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20050120

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050223

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050428

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070828

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070904

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080321

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120328

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130328

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130328

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140328

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term