JPH09190197A - フレーム消失の間のピッチ遅れ修正方法 - Google Patents
フレーム消失の間のピッチ遅れ修正方法Info
- Publication number
- JPH09190197A JPH09190197A JP8182613A JP18261396A JPH09190197A JP H09190197 A JPH09190197 A JP H09190197A JP 8182613 A JP8182613 A JP 8182613A JP 18261396 A JP18261396 A JP 18261396A JP H09190197 A JPH09190197 A JP H09190197A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- speech
- frame
- codebook
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B7/00—Radio transmission systems, i.e. using radiation field
- H04B7/24—Radio transmission systems, i.e. using radiation field for communication between two or more posts
- H04B7/26—Radio transmission systems, i.e. using radiation field for communication between two or more posts at least one of which is mobile
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/013—Adapting to target pitch
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
を改善する。 【解決手段】 本発明による音声復号方法は、圧縮音声
情報の連続する第1フレームおよび第2フレームのそれ
ぞれの少なくとも一部を信頼性良く受信することができ
ない場合に音声復号器において使用される。音声復号器
は、ピッチ周期情報を表す信号に応答してベクトル信号
を出力する(適応)コードブックメモリを有する。この
ベクトル信号は、復号された音声信号を生成する際に使
用される。本発明の方法は、第1フレームに対応するピ
ッチ周期情報を表す値を有する信号を記憶するステップ
と、コードブックメモリが信号のインクリメントされた
値に応答してベクトル信号を出力するように、第2フレ
ームで使用するために信号の値をインクリメントするス
テップとからなる。
Description
いる音声符号化方式に関し、特に、伝送中にバースト誤
りが生じた場合の音声符号器の動作方法に関する。
ステムのような多くの通信システムは、情報を通信する
ために無線チャネルに基づいている。情報の通信中に、
無線通信チャネルは、マルチパスフェージングのような
いくつかの誤り源からの影響を受けることがある。この
ような誤り源は、とりわけ、フレーム消失の問題を引き
起こすことがある。消失とは、受信器へ通信されるビッ
トの集合の全損失または全部もしくは一部の破損のこと
である。フレームとは、通信チャネルを通じて一部ロッ
クとして通信されるあらかじめ定められた固定数のビッ
トのことである。従って、フレームは音声信号の時間セ
グメントを表すこともある。
合、受信器には解釈すべきビットはない。このような状
況では、受信器は無意味な結果を生じる可能性がある。
一フレーム分の受信ビットが破損しているため信頼性が
ない場合、受信器は非常に歪んだ結果を生じる可能性が
ある。いずれの場合にも、そのフレームは受信器が利用
(使用)不能であるという意味で、そのフレームのビッ
トは「消失」したとみなすことができる。
とともに、利用可能な無線システム帯域幅を最大限に利
用する必要性が生じている。システム帯域幅の使用の効
率性を高める一つの方法は、信号圧縮技術を使用するこ
とである。音声信号を伝送する無線システムでは、音声
圧縮(あるいは音声符号化)技術がこの目的のために使
用される。このような音声符号化技術には、周知の符号
励振線形予測(CELP)音声符号器のような「合成に
よる分析」音声符号器がある。
におけるパケット損失の問題は、無線の場合のフレーム
消失と良く類似している。すなわち、パケット損失によ
り、音声復号器は、フレームを受信することができない
か、または、多数のビットが欠けたフレームを受信する
ことがある。いずれの場合でも、音声復号器には同じ本
質的な問題が提示される。すなわち、圧縮された音声情
報の損失にもかかわらず音声を合成する必要があるとい
う問題である。「フレーム消失」および「パケット損
失」はいずれも伝送ビットの損失を引き起こす通信チャ
ネル(あるいはネットワーク)に関係する。本明細書で
は、「フレーム消失」という用語は「パケット損失」を
含むものと考える。
号を符号化するために励振信号のコードブックを使用す
る。この励振信号は、励振利得倍にスケールされ、励振
に応答して音声信号(または音声信号の何らかの前駆
体)を合成するフィルタを「励振」するために使用され
る。合成された音声信号は原音声信号と比較される。原
音声信号に最も良く一致する合成音声信号を生じるコー
ドブック励振信号が識別される。その後、識別された励
振信号のコードブックインデックスおよび利得の表示
(これ自体が利得コードブックインデックスであること
も多い)がCELP復号器へ通信される(CELP方式
のタイプに応じて、線形予測(LPC)フィルタ係数の
ような他のタイプの情報も通信されることもある)。復
号器はCELP符号器のものと同一のコードブックを有
する。復号器は、送信されたインデックスを用いて励振
信号および利得値を選択する。この選択されたスケール
された励振信号は、復号器のLPCフィルタを励振する
ために使用される。このように励振されると、復号器の
LPCフィルタは復号された(あるいは量子化された)
音声信号(これは、前に原音声信号に最も近いと判定さ
れたのと同じ音声信号である)を生成する。
えば、ピッチ予測フィルタあるいは適応コードブック)
のような他の要素を使用する。このモデルは、有声音性
の周期性をシミュレートする。このようなCELP方式
では、これらの要素に関係するパラメータも復号器へ送
信されなければならない。適応コードブックの場合、復
号器が音声合成過程で適応コードブックの動作を再生成
することができるように、ピッチ周期(遅延)および適
応コードブック利得を表す信号も復号器へ送信されなけ
ればならない。
無線システムおよびその他のシステムは、音声を圧縮し
ないシステムよりもフレーム消失の問題に敏感となるこ
とがある。この敏感さは、符号化音声の冗長度が減少す
ることにより伝送される各ビットの損失が(符号化され
ていない音声に比べて)重大になることによる。フレー
ム消失を受けるCELP音声符号器の場合、励振信号コ
ードブックインデックスおよびフレーム内で音声を表す
その他の信号が損失またはかなり破損することにより、
復号器における音声の正しい合成が妨げられることがあ
る。例えば、消失フレームのため、CELP復号器は、
音声を合成するためにコードブック内のどのエントリを
使用すべきかを信頼性良く識別することができないこと
がある。その結果、音声符号化システムのパフォーマン
スは大幅に劣化する可能性がある。
デックス、LPC係数、適応コードブック遅延情報、な
らびに適応コードブックおよび固定コードブックの利得
情報の損失を引き起こすため、音声復号器において励振
信号を合成するための通常の技術は有効でない。従っ
て、これらの通常の技術を別の方法で置き換えなければ
ならない。
中のコードブック利得情報の欠損の問題を解決する。本
発明によれば、現フレームの圧縮音声情報の少なくとも
一部を信頼性良く受信することができない場合に、コー
ドブックに基づく音声復号器は、前の音声フレームから
の利得を減衰したコードブック利得を用いる。
よび信号増幅器を有する音声復号器である。これらのメ
モリおよび増幅器は、圧縮音声情報に基づいて復号され
た音声信号を生成する際に使用される。圧縮音声情報
は、コードベクトルをスケールする際に増幅器によって
使用されるスケール因子を含む。フレーム消失が起きた
場合、前音声フレームに対応するスケール因子を減衰さ
せ、この減衰したスケール因子を用いて、現在の消失し
た音声フレームに対応するコードブックベクトルを増幅
する。本発明の実施例についての具体的な詳細は、以下
の説明の第II.D節に記載されている。
応コードブック処理の両方に適用可能であり、また、コ
ードブックとその増幅器の間に復号器システムやその他
のシステム(例えばピッチ予測フィルタ)を挿入したシ
ステムにも適用可能である。
されたビットストリーム中の連続するビットのグループ
の損失であって、そのグループは通常は音声を合成する
ために使用される)を受ける音声符号化システムの動作
に関する。以下の説明は、例として、国際標準G.72
9として採用されるためにITUに提案された8kbi
t/sのCELP音声符号化方式に適用された本発明の
特徴に関するものである。読者の便のため、G.729
標準の予備的勧告草案を「付録」として添付する(この
草案を以下では「G.729草案」と呼ぶ)。G.72
9草案は、音声符号器および音声復号器の詳細な記述を
含む(それぞれG.729草案第3節および第4節参
照)。本発明の実施例は、G.729草案第4.3節に
詳細に記載されているような、通常のG.729復号器
動作の改良に関するものである。本発明を実現するため
に符号器には変更の必要はない。
に適用可能であるだけでなく、当業者であれば、本発明
の特徴は他の音声符号化方式にも適用可能であることが
理解される。
が、本発明の実施例への入力信号eである。このような
情報は、当業者に周知の任意の従来の方法で取得可能で
ある。例えば、全部または一部が破損したフレームは、
通常の誤り検出符号の使用により検出可能である。フレ
ームが消失していると判定された場合、e=1とされ、
後述のような特別の手続きが開始される。そうでない場
合、すなわち、消失していない場合(e=0)、通常の
手続きが使用される。従来の誤り保護符号が、無線通信
システムの従来の無線送受審査部システムの一部として
実装可能である。
正手段の完全なセットの適用に加えて、本発明の復号器
は、パリティ誤りが検出された場合にそのような手段の
サブセットを使用する。パリティビットは、符号化され
た音声のフレームの2個のサブフレームのうちの第1の
サブフレームのピッチ遅延インデックスに基づいて計算
される(G.729草案第3.7.1節参照)。このパ
リティビットは復号器によって計算され、符号器から受
信されるパリティビットと比べて検査される。二つのパ
リティビットが同じでない場合、遅延インデックスは破
損しているとされ(実施例ではPE=1)、ピッチ遅延
の特別の処理が呼び出される。
は、個別の機能ブロックからなるものとして提示され
る。これらのブロックが表している機能は、ソフトウェ
アを実行可能なハードウェアを含む共用または専用のハ
ードウェアの使用により提供可能である(しかし、その
ようなものに限定されるものではない)。例えば、図1
に示されるブロックは、単一の共用プロセッサによって
提供可能である。(「プロセッサ」という用語の使用
は、ソフトウェアを実行可能なハードウェアのみを指す
ものと解釈してはならない。)
SP32Cのようなディジタル信号プロセッサ(DS
P)ハードウェア、後述の動作を実行するソフトウェア
を記憶する読み出し専用メモリ(ROM)、および、D
SPの結果を記憶するランダムアクセスメモリ(RA
M)からなることが可能である。超大規模集積(VLS
I)ハードウェアによる実施例や、カスタムVLSI回
路を汎用DSP回路と組み合わせた実施例も可能であ
る。
良されたG.729草案のブロック図を示す(図1は、
G.728標準草案の図3を、本発明の特徴を明確に例
示するように修正したものである)。通常動作時(すな
わち、フレーム消失を受けていない場合)には、復号器
はG.729草案に従って第4.1〜4.2節に記載さ
れているように動作する。フレーム消失中は、図1の実
施例の動作は、符号器からの情報の消失を補償する特別
の処理によって改良される。
に記載された符号器は、10msごとに圧縮された音声
を表すデータのフレームを出力する。このフレームは8
0ビットからなり、G.729草案の表1〜表9に詳細
に記載されている。圧縮された音声の各80ビットフレ
ームは通信チャネルを通じて復号器へ送信される。復号
器は、符号器によって生成されたフレームに基づいて音
声信号(2サブフレームを表す)を合成する。フレーム
が通信されるチャネル(図示せず)は任意の種類(例え
ば通常の電話網、パケット網、セルラあるいは無線網、
ATM網など)が可能であり、また、記憶媒体(例えば
磁気記憶装置、半導体RAMまたはROM、CD−RO
Mのような光記憶装置など)からなることも可能であ
る。
ク(ACB)部分および固定コードブック(FCB)部
分の両方を有する。ACB部分はACB50および利得
増幅器55を有する。FCB部分は、FCB10、ピッ
チ予測フィルタ(PPF)20、および利得増幅器30
を有する。復号器は、伝送されたパラメータ(G.72
9草案第4.1節参照)を復号し、合成を実行して再構
成音声を取得する。
インデックスIに応答して動作する。インデックスIは
スイッチ40を通じて受信される。FCB10は、サブ
フレームに等しい長さのベクトルc(n)を生成する
(G.729草案第4.1.2節参照)。このベクトル
はPPF20に入力される。PPF20は、FCB利得
増幅器30に入力するためのベクトルを生成するように
動作する(G.729草案第3.8節および第4.1.
3節参照)。この増幅器は、チャネルからの利得g^c
を加え、PPF20によって生成されるベクトルをスケ
ールしたベクトルを生成する(G.729草案第4.
1.3節参照)。増幅器30の出力信号は(スイッチ4
2を通じて)加算器85に供給される。
加えられる利得は、符号器によって提供される情報に基
づいて決定される。この情報は、コードブックインデッ
クスとして通信される。復号器は、このインデックスを
受信し、利得補正因子γ^を合成する(G.729草案
第4.1.4節参照)。この利得補正因子γ^は、コー
ドベクトル予測エネルギー(E−)プロセッサ120に
供給される。E−プロセッサ120は、以下の式に従っ
て、コードベクトル予測誤差エネルギーR^の値を決定
する。 R^(n)=20logγ^ [dB] R^の値はプロセッサバッファに記憶される。プロセッ
サバッファは、R^の最近の(連続する)5個の値を保
持する。R^(n)は、サブフレームnにおける固定コー
ドベクトルの予測誤差エネルギーを表す。コードベクト
ルの予測される平均除去エネルギーは、R^の過去の値
の重み付き和として形成される。
9]であり、R^の過去の値はバッファから取得され
る。次に、この予測エネルギーはプロセッサ120から
予測利得プロセッサ125に出力される。
よって供給されるコードベクトルの実際のエネルギーを
決定する。これは、次式に従ってなされる。
る。すると、予測利得は次式のように計算される。
B)である。
得)が、受信された利得補正因子γに予測利得gc′を
乗算器130で乗じることによって計算される。その
後、この値は、PPF20によって提供される固定コー
ドブック寄与をスケールするために増幅器30に供給さ
れる。
って生成された出力信号も供給される。ACB部分は、
過去の励振信号と、チャネルを通じて符号器から(スイ
ッチ43を通じて)受信されるACBピッチ周期Mとに
基づいて、1サブフレームに等しい長さの励振信号v
(n)を生成するACB50を有する(G.729草案
第4.1.1節参照)。このベクトルは、チャネルを通
じて受信される利得因子g^pに基づいて増幅器250
でスケールされる。このスケールされたベクトルがAC
B部分の出力である。
ACB部分からの信号に応答して励振信号u(n)を生
成する。励振信号u(n)はLPC合成フィルタ90に
入力される。LPC合成フィルタ90は、チャネルを通
じて受信されるLPC係数aiに基づいて音声信号を合
成する(G.729草案第4.1.6節参照)。
ポストプロセッサ100に供給される。ポストプロセッ
サ100は、適応ポストフィルタリング(G.729草
案第4.2.1〜4.2.4節参照)、高域フィルタリ
ング(G.729草案第4.2.5節参照)、およびア
ップスケーリング(G.729草案第4.2.5節参
照)を実行する。
レーム消失がある場合、図1の復号器は、(何かを受信
したとしても)励振信号u(n)を合成するための信頼
性のある情報を受信しない。従って、復号器は、どのベ
クトルの信号サンプルをコードブック10から抽出すべ
きか、あるいは、適応コードブック50に使用するため
の正しい遅延値は何かがわからないことになる。この場
合、復号器は、音声信号を合成する際に用いる代用励振
信号を取得しなければならない。フレーム消失期間中の
代用励振信号の生成は、消失したフレームが有声(周期
的)と分類されるかそれとも無声(非周期的)と分類さ
れるかに依存する。消失フレームの周期性の表示はポス
トプロセッサ100から得られる。ポストプロセッサ1
00は、正しく受信した各フレームを周期的または非周
期的と分類する(G.729草案第4.2.1節参
照)。消失フレームは、ポストフィルタによって処理さ
れた前フレームと同じ周期性分類を有するようにされ
る。周期性を表す二進信号vが、ポストフィルタ変数g
pitに従って決定される。gpit>0の場合v=1であ
り、それ以外の場合v=0である。従って、例えば、最
後の良好なフレームが周期的と分類された場合、v=1
であり、そうでない場合にはv=0である。
周期的な(v=1)音声を表していたと考えられる消失
フレーム(e=1)に対して、固定コードブックの寄与
は0に設定される。これは、スイッチ42の状態を、増
幅器30を加算器85に接続する通常の(バイアスされ
た)動作位置から、固定コードブック寄与を励振信号u
(n)から切断する位置に(矢印の向きに)切り替える
ことによってなされる。この状態切替は、ANDゲート
110によって出力される制御信号に従って実行され
る。(このANDゲート110は、フレームが消失して
おり(e=1)、かつ、周期的フレームである(v=
1)という条件をテストする。)他方、適応コードブッ
クの寄与は、(e=1であるがnot_v=0であるた
め)スイッチ45によって、通常動作位置に保持され
る。
て使用されるピッチ遅延Mは遅延プロセッサ60によっ
て決定される。遅延プロセッサ60は、符号器から最近
に受信したピッチ遅延を記憶する。この値は、引き続き
受信されるそれぞれのピッチ遅延で上書きされる。「良
好な」(正しく受信された)フレームに続く最初の消失
フレームに対して、遅延プロセッサ60は、最後の良好
なフレーム(すなわち、前フレーム)のピッチ遅延に等
しいMの値を生成する。過度の周期性を避けるため、引
き続く各消失フレームに対して、プロセッサ60はMの
値を1だけインクリメントする。プロセッサ60は、M
の値を、143サンプルに制限する。スイッチ43は、
有声フレームの消失の表示に応答して(e=1かつv=
1であるため)、その状態を通常動作位置から「有声フ
レーム消失」位置に変更することによって、ピッチ遅延
をプロセッサ60から適応コードブック50に入力す
る。
ック利得もまた、以下の第C節で説明する手続きに従っ
て合成される。注意すべき点であるが、スイッチ44
は、その状態を通常動作位置から「有声フレーム消失」
位置に変更することによって、合成された適応コードブ
ック利得の入力を行うという点で、スイッチ43と同様
に動作する。
失]非周期的な(v=0)音声を表していたと考えられ
る消失フレーム(e=1)に対して、適応コードブック
の寄与は0に設定される。これは、スイッチ45の状態
を、増幅器55を加算器85に接続する通常の(バイア
スされた)動作位置から、適応コードブック寄与を励振
信号u(n)から切断する位置に(矢印の向きに)切り
替えることによってなされる。この状態切替は、AND
ゲート75によって出力される制御信号に従って実行さ
れる。(このANDゲート75は、フレームが消失して
おり(e=1)、かつ、非周期的フレームである(no
t_v=1)という条件をテストする。)他方、固定コ
ードブックの寄与は、(e=1であるがv=0であるた
め)スイッチ42によって、通常動作位置に保持され
る。
ードブックベクトル符号は消失のため使用することがで
きない。コードブックベクトルc(n)を決定するため
の固定コードブックインデックスおよび符号インデック
スを合成するため、乱数発生器49が使用される。乱数
発生器49の出力はスイッチ40を通じて固定コードブ
ック10に入力される。スイッチ40は、通常は、イン
デックスIおよび符号情報を固定コードブックに接続す
る状態にある。しかし、非周期的フレームの消失が起き
た場合(e=1かつnot_v=1)、ゲート47が制
御信号をこのスイッチに入力することにより、スイッチ
は状態を変化させる。
ードブックインデックスおよび符号を生成する。 seed=seed*31821+13849 発生器45の初期シード(seed)値は21845で
ある。与えられた符号器サブフレームに対して、コード
ブックインデックスは乱数の下位13ビットである。ラ
ンダム符号は、次の乱数の下位4ビットである。従っ
て、乱数発生器は、必要な各固定コードブックベクトル
ごとに2回動作する。注意すべき点であるが、ノイズベ
クトルは、FCBとともに乱数発生器を使用するのでは
なく、サンプルごとに発生することも可能である。
ドブック利得もまた、以下の第D節で説明する手続きに
従って合成される。注意すべき点であるが、スイッチ4
1は、その状態を通常動作位置から「有声フレーム消
失」位置に変更することによって、合成された固定コー
ドブック利得の入力を行うという点で、スイッチ40と
同様に動作する。
PF20は周期性を加えるため、PPF20は非周期的
フレームの消失の場合には使用すべきではない。従っ
て、スイッチ21は、e=0のときにはFCB10の出
力を選択し、e=1の時にはPPF20の出力を選択す
る。
数]消失フレーム中に合成された励振信号u(n)はL
PC合成フィルタ90に入力される。符号器からのデー
タに依存する復号器の他の構成要素と同様に、LPC合
成フィルタ90は消失フレーム中に代用LPC係数ai
を有しなければならない。これは、最後の良好なフレー
ムのLPC係数を反復することによってなされる。非消
失フレームにおいて符号器から受信されるLPC係数は
メモリ95によって記憶される。フレーム消失が起きる
と、メモリ95に記憶されている係数がスイッチ46を
通じてLPC合成フィルタに供給される。スイッチ46
は通常は、良好なフレームで受信されるLPC係数をフ
ィルタ90に入力するようにバイアスされる。しかし、
フレーム消失の場合(e=1)、このスイッチはメモリ
95をフィルタ90に接続するように(矢印の向きに)
状態を変更する。
ブックの利得の減衰]上記のように、適応コードブック
50および固定コードブック10はいずれも、コードブ
ック出力信号にスケール因子を加える対応する利得増幅
器55、30を有する。通常は、これらの増幅器のスケ
ール因子の値は符号器によって供給される。しかし、フ
レーム消失の場合、スケール因子情報は符号器から利用
可能ではない。従って、スケール因子情報を合成しなけ
ればならない。
の両方に対して、スケール因子の合成は、前サブフレー
ムで使用されたスケール因子の値をスケール(特に減
衰)させる減衰プロセッサ65および115によってな
される。すなわち、良好なフレームに続くフレーム消失
の場合、増幅器によって使用される消失フレームの第1
サブフレームのスケール因子の値は、その良好なフレー
ムからの第2スケール因子に減衰因子を乗じたものとな
る。連続してサブフレームが消失した場合、後に消失し
たほうのサブフレーム(サブフレームn)は、前に消失
したサブフレーム(サブフレームn−1)からのスケー
ル因子にその減衰因子を乗じた値を使用する。いかに多
くの連続する消失フレーム(およびサブフレーム)が生
じてもこの技術が使用される。減衰プロセッサ65、1
15は、次のサブフレームが消失サブフレームである場
合、良好なフレームで受信されたか消失フレームに対し
て合成されたかにかかわらず、それぞれの新たなスケー
ル因子を記憶する。
って、消失サブフレームnに対する固定コードブック利
得gcを合成する。 gc (n)=0.98gc (n-1) 減衰プロセッサ65は、次式に従って、消失サブフレー
ムnに対する適応コードブック利得gpを合成する。 gp (n)=0.9gp (n-1) さらに、プロセッサ65は、合成された利得の値を0.
9未満に制限(クリッピング)する。利得を減衰させる
プロセスは、好ましくない知覚効果を避けるために実行
される。
うに、E−プロセッサ120の一部を形成し、予測誤差
エネルギーの最近の5個の値を記憶するバッファがあ
る。このバッファは、固定コードブックからのコードベ
クトルの予測エネルギーの値を予測するために使用され
る。
ネルギーの新たな値を得るための情報が、符号器から復
号器に通信されないことがある。従って、このような値
は合成しなければならないことになる。この合成は、次
式に従ってE−プロセッサ120によってなされる。
の平均から4dBを引いたものとして計算される。R^
の値の減衰は、良好なフレームが受信された後に好まし
くない音声歪みが生じないことを保証するように実行さ
れる。合成されたRの値は−14dBより低くならない
ように制限される。
に、本発明は、無線音声通信システムへの応用を有す
る。図2に、本発明の実施例を使用する無線通信システ
ムの実施例を示す。図2は、送信機600および受信機
700を含む。送信機600の実施例は、無線基地局で
ある。受信機700の実施例は、セルラあるいは無線電
話機またはその他のパーソナル通信システム装置のよう
な、移動ユーザ端末である。(当然、無線基地局および
ユーザ端末はそれぞれ受信機および送信機の回路を含む
ことも可能である。)送信機600は、音声符号器61
0を有する。音声符号器610は、例えば、G.729
草案による符号器である。送信機はさらに、誤り検出
(あるいは検出および訂正)機能を備えた従来のチャネ
ル符号器620と、従来の変調器630と、従来の無線
送信回路640とを有する。これらのチャネル符号器6
20、変調器630および無線送信回路640は当業者
には周知である。送信機600によって送信された無線
信号は、伝送チャネルを通じて受信機700によって受
信される。例えば、送信された信号のさまざまなマルチ
パス成分の破壊的干渉により、受信機700は、送信ビ
ットの明瞭な受信を妨げる重大なフェージングを受ける
ことがある。このような状況では、フレーム消失が起こ
る可能性がある。
0と、従来の復調器720、チャネル復号器730と、
本発明による音声復号器740とを有する。注意すべき
点であるが、チャネル復号器は、多数のビット誤り(ま
たは受信されないビット)があると判断したときにはい
つもフレーム消失信号を生成する。あるいは(またはチ
ャネル復号器からのフレーム消失信号に加えて)、復調
器720が復号器740にフレーム消失信号を提供する
ことも可能である。
「増幅器」という用語を用いたが、当業者には理解され
るように、この用語はディジタル信号のスケーリングを
包含する。さらに、このようなスケーリングとしては、
1より大きい値とともに、1以下(負の値を含む)のス
ケール因子(あるいは利得)で実行可能である。
符号化を用いた8kbit/sでの音声の符号化 1995年6月7日 バージョン4.0
[0118] 3.2.3 LPからLSPへの変換 [0119] 3.2.4 LSP係数の量子化 [0121] 3.2.5 LSP係数の補間 [0130] 3.2.6 LSPからLPへの変換 [0131] 3.3 知覚的重み付け [0133] 3.4 開ループピッチ分析 [0135] 3.5 インパルス応答の計算 [0137] 3.6 目標信号の計算 [0138] 3.7 適応コードブック探索 [0141] 3.7.1 適応コードブックベクトルの生成 [01
46] 3.7.2 適応コードブック遅延に対する符号語計算
[0147] 3.7.3 適応コードブック利得の計算 [015
0] 3.8 固定コードブック:構造および探索 [015
1] 3.8.1 固定コードブック探索手続き [015
3] 3.8.2 固定コードブックの符号語計算 [015
9] 3.9 利得の量子化 [0160] 3.9.1 利得予測 [0161] 3.9.2 利得量子化のためのコードブック探索
[0165] 3.9.3 利得量子化器に対する符号語計算 [01
67] 3.10 メモリ更新 [0168] 3.11 符号器および復号器の初期化 [0169] 4 復号器の機能的記述 [0170] 4.1 パラメータ復号手続き [0171] 4.1.1 LPフィルタパラメータの復号 [017
2] 4.1.2 適応コードブックベクトルの復号 [01
74] 4.1.3 固定コードブックベクトルの復号 [01
77] 4.1.4 適応コードブックおよび固定コードブック
の利得の復号 [0178] 4.1.5 パリティビットの計算 [0179] 4.1.6 再構成音声の計算 [0180] 4.2 後処理 [0182] 4.2.1 ピッチポストフィルタ [0183] 4.2.2 短期ポストフィルタ [0184] 4.2.3 傾斜補償 [0185] 4.2.4 適応利得制御 [0187] 4.2.5 高域フィルタリングおよびアップスケーリ
ング [0188] 4.3 フレーム消失およびパリティ誤りの隠蔽 [0
190] 4.3.1 LPフィルタパラメータの反復 [019
4] 4.3.2 適応コードブックおよび固定コードブック
の利得の減衰 [0195] 4.3.3 利得予測子のメモリの減衰 [0196] 4.3.4 置換励振の生成 [0197] 5 CS−ACELP符号器/復号器のビット精度での
記述 [0199] 5.1 シミュレーションソフトウェアの使用法 [0
200] 5.2 シミュレーションソフトウェアの構成 [02
01]
数的符号励振線形予測(CS−ACELP)符号化を用
いた8kbit/sでの音声の符号化のアルゴリズムの
記述を含む。
信号の電話帯域フィルタリング(ITU勧告G.71
0)を実行し、8000Hzでサンプリングした後、符
号器への入力に対して16ビット線形PCMへの変換を
実行することによって得られるディジタル信号に対して
動作するように設計されている。復号器の出力は、同様
の手段によってアナログ信号に変換されるべきものであ
る。他の入出力特性(例えば、64kbit/sのPC
Mデータに対してITU勧告G.711によって規定さ
れたもの)は、符号化前に16ビット線形PCMに、あ
るいは、復号前に16ビット線形PCMから適当なフォ
ーマットに、変換しなければならない。符号器から復号
器へのビットストリームは、この標準内で定義される。
節では、CS−ACELPアルゴリズムの概略を説明す
る。第3節および第4節では、CS−ACELP符号器
およびCS−ACELP復号器の原理をそれぞれ説明す
る。第5節では、16ビット固定小数点計算でこの符号
器/復号器を定義するソフトウェアについて説明する。
−ACELP符号器/復号器は、符号励振線形予測(C
ELP)符号化モデルに基づく。この符号器/復号器
は、8000サンプル/秒のサンプリングレートでの8
0サンプルに対応する10msの音声フレームに作用す
る。10msecのフレームごとに、音声信号が分析さ
れ、CELPモデルのパラメータ(LPフィルタ係数、
適応コードブックおよび固定コードブックのインデック
スおよび利得)が抽出される。これらのパラメータは符
号化され送信される。符号器パラメータのビット割当て
を表1に示す。復号器では、これらのパラメータは、励
振および合成フィルタパラメータを取得するために使用
される。音声は、図5に示されるようなLP合成フィル
タによって、この励振をフィルタリングすることにより
再構成される。短期合成フィルタは、10次線形予測
(LP)フィルタに基づく。長期すなわちピッチ合成フ
ィルタは、いわゆる適応コードブック法を使用して、サ
ブフレーム長より短い遅延に対して実装される。再構成
音声を計算した後、ポストフィルタによってさらに増強
される。
ローを図6に示す。入力信号は、前処理ブロックで高域
フィルタリングされ、スケールされる。前処理された信
号は、後続のすべての分析のための入力信号として使用
される。LP分析は、LPフィルタ係数を計算するため
に10msフレームあたり1回行われる。これらの係数
は、線スペクトル対(LSP)に変換され、予測2段ベ
クトル量子化(VQ)を使用して18ビットで量子化さ
れる。励振シーケンスは、合成による分析探索手続きを
使用することによって選択される。この手続きでは、も
との音声と合成された音声の間の誤差が、知覚的重み付
き歪み尺度に従って最小化される。これは、知覚的重み
付けフィルタで誤差信号をフィルタリングすることによ
り行われる。このフィルタの係数は、量子化前のLPフ
ィルタから導出される。知覚的重み付けの量は、平坦周
波数応答を有する入力信号に対するパフォーマンスを改
善するように適応させられる。
適応コードブックのパラメータ)は、それぞれ5ms
(40サンプル)のサブフレームごとに決定される。第
2サブフレームに対しては量子化後および量子化前のL
Pフィルタ係数が使用されるが、第1サブフレームで
は、保管されたLPフィルタ係数が使用される(量子化
前および量子化後の両方)。開ループピッチ遅延は、知
覚的重み付き音声信号に基づいて10msフレームごと
に1回評価される。その後、以下の動作が各サブフレー
ムごとに反復される。目標信号x(n)は、LP残差を
重み付け合成フィルタW(z)/A^(z)でフィルタ
リングすることによって計算される。これらのフィルタ
の初期状態は、LP残差と励振の間の誤差をフィルタリ
ングすることにより更新される。これは、重み付き音声
信号から重み付き合成フィルタの0入力応答を減算する
という通常の方法と同等である。重み付き合成フィルタ
のインパルス応答h(n)が計算される。次に、目標x
(n)およびインパルス応答h(n)を使用して、開ル
ープピッチ遅延の値の付近を探索することによって、閉
ループピッチ分析が(適応コードブックの遅延および利
得を求めるために)行われる。1/3分解能の分数ピッ
チ遅延が使用される。このピッチ遅延は、第1サブフレ
ームでは8ビットで符号化され、第2サブフレームでは
5ビットで差分符号化される。目標信号x(n)は、適
応コードブック寄与(フィルタリングされた適応コード
ベクトル)を除去することにより更新され、この新しい
目標x2(n)が、固定代数的コードブック探索で(最
適な励振を求めるために)使用される。固定コードブッ
ク励振には、17ビットの代数的コードブックが使用さ
れる。適応コードブックおよび固定コードブックの利得
は7ビットで量子化されたベクトル(固定コードブック
利得にはMA予測を適用)である。最後に、決定された
励振信号を使用して、フィルタメモリが更新される。
ローを図7に示す。まず、パラメータインデックスが受
信ビットストリームから抽出される。これらのインデッ
クスは、10msの音声フレームに対応する符号器パラ
メータを取得するために復号される。これらのパラメー
タは、LSP係数、2個の分数ピッチ遅延、2個の固定
コードブックベクトル、ならびに2セットの適応コード
ブックおよび固定コードブックの利得である。LSP係
数は補間され、各サブフレームごとにLPフィルタ係数
に変換される。その後、40サンプルのサブフレームご
とに、以下のステップが実行される。 ・それぞれの利得でスケールされた適応コードブックお
よび固定コードブックのベクトルを加算することにより
励振が構成される。 ・LP合成フィルタで励振をフィルタリングすることに
より音声が再構成される。 ・再構成された音声信号は、後処理段を通る。この段
は、長期および短期の合成フィルタに基づく適応ポスト
フィルタと、それに続く高域フィルタおよびスケーリン
グ作用からなる。
の他のオーディオ信号を10msのフレームで符号化す
る。さらに、5msのルックアヘッドがあり、その結
果、アルゴリズムの総遅延は15msとなる。この符号
器の実装におけるすべての付加的遅延は以下の原因によ
る。 ・符号化および復号作用に要する処理時間 ・通信リンク上の伝送時間 ・オーディオデータを他のデータと組み合わせる際の多
重化遅延
音声符号化アルゴリズムの記述は、ビット精度の固定小
数点数学演算を用いてなされる。第5節で示されるAN
SI Cコードは、この勧告の重要な一部を構成する
が、このビット精度の固定小数点記述法を反映する。符
号器(第3節)、および復号器(第4節)の数学的記述
は、他のいくつかの方法で実装することも可能である
が、この勧告に従わないコーデックの実装になる可能性
がある。従って、矛盾が発見された場合には、第5節の
Cコードのアルゴリズム記述のほうが、第3節および第
4節の数学的記述に優先する。Cコードとともに使用可
能な試験シーケンスの網羅的ではないセットが、ITU
から入手可能である。
て、以下の記法的規約を維持するようにする。 ・コードブックは草書体文字(例えば次の数1)で表
す。
クスで表す(例えばs(n))。記号nはサンプル時刻
インデックスとして使用される。 ・上付き添字の時間インデックス(例えばgm)は、そ
の変数がサブフレームmに対応することを表す。 ・上付き添字は、係数配列の特定の要素を指定する。 ・^はパラメータの量子化バージョンを表す。 ・範囲記述は、角括弧を用いてなされ、境界は含まれる
(例えば[0.6,0.9])。 ・logは10を底とする対数を表す。 表2に、この文書を通じて使用される最も重要な記号を
列挙する。最も重要な信号の用語集を表3に与える。表
4は、重要な変数およびその次元を要約している。定数
パラメータを表5に列挙する。この勧告で使用される頭
字語を表6に要約する。
図5のブロックに表された符号器のさまざまな機能につ
いて記述する。
に、音声符号器への入力は16ビットPCMであると仮
定される。符号化プロセスの前に二つの前処理機能
(1:信号スケーリング、2:高域フィルタリング)が
適用される。
固定小数点実装におけるオーバーフローの可能性を縮小
することからなる。高域フィルタは、好ましくない低周
波成分に対する予防措置として使用される。遮断周波数
140Hzの2次極/零点フィルタが使用される。この
フィルタの分子の係数を2で除することによって、スケ
ーリングおよび高域フィルタリングの両方が組み合わさ
れる。結果として得られるフィルタは次式で与えられ
る。
で表す。この信号は後続のすべての符号器作用で使用さ
れる。
期の分析フィルタおよび合成フィルタは、10次線形予
測(LP)フィルタに基づく。LP合成フィルタは次式
で定義される。
た)線形予測(LP)係数である。短期予測あるいは線
形予測分析は、30msの非対称窓による自己相関法を
用いて、音声フレームごとに1回実行される。80サン
プル(10ms)ごとに、窓をかけられた音声の自己相
関係数が計算され、レヴィンソンのアルゴリズムを用い
てLP係数に変換される。その後、これらのLP係数
は、量子化および補間のために、LSP領域に変換され
る。補間された、量子化後および量子化前のフィルタは
(各サブフレームにおいて合成フィルタおよび重み付け
フィルタを構成するために)LPフィルタ係数に再び変
換される。
LP分析窓は二つの部分からなる。第1の部分はハミン
グ窓の半分であり、第2の部分は余弦関数周期の4分の
1である。この窓は次式で与えられる。
る。これは、未来の音声フレームから40サンプルが必
要とされることを意味する。これは、符号器段における
5msの追加遅延となる。LP分析窓は、過去の音声フ
レームからの120サンプル、現在の音声フレームから
の80サンプル、および未来のフレームからの40サン
プルにかかる。LP分析における窓を図8に図示する。
(0)の値はr(0)=1.0という下限を有する。6
0Hzの帯域拡張が、自己相関係数を次式に乗じること
により適用される。
0Hzはサンプリング周波数である。さらに、r(0)
は、白色補正因子1.0001を乗じられる。これは、
−40dBにおけるノイズ下限を加えることに同等であ
る。
アルゴリズム]変形自己相関係数 r’(0)=1.0001r(0) r’(k)=wlag(k)r(k), k=1,...,10 (7) を使用して、次の方程式系を解くことにより、LPフィ
ルタ係数ai(i=1,...,10)が得られる。
ゴリズムを用いて解かれる。このアルゴリズムは、以下
の反復を使用する。
えられる。
LPフィルタ係数ai(i=1,...,10)は、量子化
および補間のために線スペクトル対(LSP)表現に変
換される。10次LPフィルタの場合、LSP係数は、
以下のような和および差の多項式の根として定義され
る。 F1’(z)=A(z)+z-11A(z-1) (9) F2’(z)=A(z)−z-11A(z-1) (10) 多項式F1’(z)は対称であり、F2’(z)は反対称
である。これらの多項式のすべての根は単位円上にあ
り、互いに交互に現れることを証明することができる。
F1’(z)は根z=−1(ω=π)を有し、F2’
(z)はz=1(ω=0)を有する。これらの二つの根
を除くため、次のように新たな多項式を定義する。 F1(z)=F1’(z)/(1+z-1) (11) F2(z)=F2’(z)/(1−z-1) (12) 各多項式は単位円上に5個の共役根(exp(±j
ωi))を有するため、これらの多項式は次のように書
くことができる。
トル周波数(LSF)であって順序性0<ω1<ω2<・
・・<ω10<πを満たす。qiを余弦領域におけるLS
P係数と呼ぶ。
も対称であるため、各多項式の最初の5個の係数のみを
計算すればよい。これらの多項式の係数は、以下の再帰
的関係式によって求められる。 f1(i+1)=ai+1+a10-i−f1(i), i=0,...,4 f2(i+1)=ai+1−a10-i+f2(i), i=0,...,4 (15 ) ただし、f1(0)=f2(0)=1.0である。LSP
係数は、0とπの間の等間隔の60点で多項式F
1(z)およびF2(z)を評価し、符号変化をチェック
することによって求められる。符号変化は根の存在を意
味し、符号変化区間は、根をより良く追跡するために四
つに分割される。チェビシェフ多項式がF1(z)およ
びF2(z)を評価するために使用される。この方法で
は、根は余弦領域{qi}で直接求められる。z=ex
p(jω)で評価した多項式F1(z)およびF2(z)
は次のように書くことができる。
シェフ多項式であり、f(i)(i=1,...,5)
は、式(15)を用いて計算したF1(z)またはF
2(z)のいずれかの係数である。多項式C(x)は、
次の再帰的関係式を用いて、x=cos(ω)のある値
において評価される。
フィルタ係数は、周波数領域におけるLSP表現を用い
て量子化される。すなわち、 ωi=arccos(qi), i=1,...,10 (18) であり、ただし、ωiは、正規化された周波数領域
[0,π]における線スペクトル周波数(LSF)であ
る。切替4次MA予測が、LSF係数の現在のセットを
予測するために使用される。計算された係数セットと予
測された係数セットの間の差が、2段ベクトル量子化器
を用いて量子化される。第1段は128エントリ(7ビ
ット)を有するコードブックL1を用いた10次元VQ
である。第2段は、それぞれ32エントリ(5ビット)
を含む2個の5次元コードブックL2およびL3を用い
た分割VQとして実装された10ビットVQである。
プロセスについて記述するのが好都合である。各係数
は、二つのコードブックの和から得られる。
ックスである。量子化されたLP合成フィルタにおける
鋭い共鳴を避けるため、係数liは、隣接する係数が最
小距離Jを有するように配置される。その再配置ルーチ
ンは以下のとおりである。
00001という値で実行され、次に、J=0.000
095という値で実行される。
nに対する量子化されたLSF係数ω^i (m)が、前の量
子化器出力l(m-k)と、現在の量子化器出力l(m)の重み
付き和から得られる。
るMA予測子は、別のビットL0によって定義される。
スタートアップ時に、li (k)の初期値は、すべてのk<
0に対してli=iπ/11によって定義される。
安定性がチェックされる。これは以下のように行われ
る。 1.係数ω^iを値の増大する順に整列する。 2.ω^1<0.005の場合、ω^1=0.005とす
る。 3.ω^i+1−ω^i<0.0001の場合、ω^i+1=
ω^i+0.0001とする(i=1,...,9)。 4.ω^10>3.135の場合、ω^10=3.135と
する。
いては以下のようにまとめることができる。二つのMA
予測子のそれぞれに対して、現在のLSFベクトルの最
良近似を求めなければならない。その最良近似は、次の
重み付き平均二乗誤差を最小化するものとして定義され
る。
して適応化される。
れる。
ベクトルは次式から得られる。
みなし)平均二乗誤差を最小化するエントリL1が選択
される。この後、第2のコードブックL2の探索を行
う。これは、第2段の下位部を定義する。可能な各候補
ごとに、式(20)を用いて部分ベクトルω^i(i=
1,...,5)が再構成され、最小距離0.0001を
保証するように再配置される。第1段の候補に加算し再
配置した後に重み付きMSEの意味で対応する目標の下
位部を最も良く近似するインデックスL2を有するベク
トルが選択される。選択された第1段ベクトルL1およ
び第2段の下位部(L2)を用いて、第2段の上位部が
コードブックL3から探索される。この場合も、最小距
離0.0001を保証するために再配置手続きが用いら
れる。全体の重み付きMSEを最小化するベクトルL3
が選択される。
二つのMA予測子のそれぞれについて行われ、最小の重
み付きMSEを生成するMA予測子L0が選択される。
された(および量子化されていない)LP係数が、第2
のサブフレームに対して使用される。第1のサブフレー
ムに対しては、量子化された(および量子化されていな
い)LP係数は、隣接するサブフレームにおける対応す
るパラメータの線形補間から得られる。この補間は、q
領域におけるLSP係数に対して行われる。qi (m)を、
フレームmの第2サブフレームでのLSP係数とし、q
i ( m-1)を、過去のフレーム(m−1)の第2サブフレー
ムでのLSP係数とする。これらの2個のサブフレーム
のそれぞれにおける(量子化されていない)補間LSP
係数は次式で与えられる。 サブフレーム1:q1i=0.5qi (m-1)+0.5qi (m), i=1,..., 10 サブフレーム2:q2i=qi (m), i=1,...,10 (24) 同じ補間手続きが、qiをq^iに置き換えることによっ
て、量子化されたLSP係数の補間に使用される。
LSP係数は、量子化され補間された後、LP係数{a
i}に変換される。LP領域への変換は以下のように行
われる。F1(z)およびF2(z)の係数は、量子化さ
れ補間されたLSP係数を既知として式(13)および
式(14)を展開することによって求められる。以下の
再帰的関係式が、qiからfi(i=1,...,5)を計
算するために使用される。
である。係数f2(i)は、q2i-1をq2iで置き換える
ことによって同様に計算される。
た後、F1(z)およびF2(z)にそれぞれ1+z-1お
よび1−z-1を乗じることにより、F1’(z)および
F2’(z)が得られる。すなわち、次式のようにな
る。 f1’(i)=f1(i)+f1(i−1) i=1,...,5 f2’(i)=f2(i)−f2(i−1) i=1,...,5 (25) 最後に、LP係数は次式によって得られる。
(z))/2から導出される。F1’(z)およびF2’
(z)がそれぞれ対称および反対称の多項式であるため
である。
けフィルタは、量子化前のLPフィルタ係数に基づいて
おり、次式で与えられる。
決定する。これらの変数の適当な調節により、重み付け
をより効果的にすることが可能である。これは、γ1お
よびγ2を、入力信号のスペクトル形状の関数とするこ
とにより達成される。この適応は10msフレームごと
に1回行われるが、各第1サブフレームごとに補間手続
きが、この適応プロセスを円滑にするために使用され
る。スペクトル形状は、レヴィンソン=ダービン漸化式
(第3.2.2節)からの副産物として得られる2次線
形予測フィルタから得られる。反射係数kiは次式によ
り対数面積比(LAR)oiに変換される。
第1サブフレームに対するLAR係数は、前フレームか
らのLARパラメータとの線形補間により得られ、次式
で与えられる。 サブフレーム1:o1i=0.5oi (m-1)+0.5oi (m), i=1,2 サブフレーム2:o2i=oi (m), i=1,2 (29) スペクトル包絡線は、平坦(flat=1)または傾斜
(flat=0)のいずれかとして特徴づけられる。各
サブフレームごとに、この特性は、LAR係数にしきい
値関数を適用することによって得られる。急激な変化を
避けるため、前サブフレーム(m−1)におけるfla
tの値を考慮することによるヒステリシスが用いられ
る。
る(flat(m)=1)として分類された場合、重み因
子はγ1=0.94およびγ2=0.6に設定される。ス
ペクトルが傾斜している(flat(m)=0)として分
類された場合、γ1の値は0.98に設定され、γ2の値
はLP合成フィルタにおける共鳴の強度に適応させられ
るが、0.4と0.7の間に制限される。強い共鳴が存
在する場合、γ2の値は上限の近くに設定される。この
適応は、現在のサブフレームに対する2個の連続するL
SP係数の間の最小距離に基づく判断基準によって達成
される。この最小距離は次式で与えられる。 dmin=min[ωi+1−ωi] i=1,...,9 (31) 以下の線形関係式が、γ2を計算するために使用され
る。 γ2=−6.0*dmin+1.0 かつ 0.4≦γ2≦0.7 (32)
式で与えられる。
チ遅延の評価を求めるために使用される。
応コードブック遅延の探索の複雑さを縮小するため、探
索範囲は、開ループピッチ分析から得られる候補遅延T
opの付近に制限される。この開ループピッチ分析はフレ
ーム(10ms)ごとに1回行われる。開ループピッチ
評価は、式(33)の重み付き音声信号sw(n)を使
用し、以下のように行われる。第1ステップでは、相関
より正規化される。
ほうの範囲における値の遅延が大きくなるようにするこ
とにより選択される。これは、長いほうの遅延に対応す
る正規化相関に重みを付けることによってなされる。最
良の開ループ遅延Topは以下のように決定される。
のセクションに有利になるようにするこの手続きは、ピ
ッチ倍音を選択することを避けるために用いられる。
き合成フィルタW(z)/A^(z)のインパルス応答
h(n)は、各サブフレームごとに計算される。このイ
ンパルス応答は、適応コードブックおよび固定コードブ
ックの探索のために必要とされる。インパルス応答h
(n)は、零点により延長されたフィルタA(z/
γ1)の係数のベクトルを、2個のフィルタ1/A^
(z)および1/A(z/γ2)によってフィルタリン
グすることにより計算される。
ック探索のための目標信号x(n)は、通常、重み付き
合成フィルタW(z)/A^(z)=A(z/γ1)/
[A^(z)A(z/γ2)]の0入力応答を、式(3
3)の重み付き音声信号sw(n)から減算することに
より計算される。これは、サブフレームごとに行われ
る。
る同等な手続きは、合成フィルタ1/A^(z)と重み
付けフィルタA(z/γ1)/A(z/γ2)の組合せに
より、LP残差信号r(n)をフィルタリングすること
である。サブフレームの励振を決定した後、これらのフ
ィルタの初期状態は、LP残差と励振の間の差をフィル
タリングすることにより更新される。これらのフィルタ
のメモリ更新については第3.10節で説明する。
残差信号r(n)は、過去の励振のバッファを拡張する
ために適応コードブック探索においても使用される。こ
れは、次節で説明するように、サブフレームサイズであ
る40より小さい遅延に対する適応コードブック探索手
続きを簡単化する。LP残差は次式で与えられる。
ードブックパラメータ(あるいはピッチパラメータ)は
遅延および利得である。ピッチフィルタを実装するため
の適応コードブック法では、励振は、サブフレーム長よ
り小さい遅延に対して反復される。探索段では、励振
は、閉ループ探索を簡単化するために、LP残差により
延長される。適応コードブック探索は(5msの)サブ
フレームごとに行われる。第1のサブフレームでは、分
解能1/3の分数ピッチ遅延T1が範囲[19(1/
3),84(2/3)]の範囲で使用され、整数は範囲
[85,143]のみで使用される。第2のサブフレー
ムでは、分解能1/3の遅延T2が範囲[(int)T1
−5(2/3),(int)T1+4(2/3)]の範
囲で常に使用される。ただし、(int)T1は、第1
サブフレームの分数ピッチ遅延T1に最も近い整数であ
る。この範囲は、T1が遅延範囲の境界にまたがるよう
な場合に適応している。
み付き平均二乗誤差を最小化する閉ループ分析を用いて
決定される。第1サブフレームにおいて、遅延T1は、
開ループ遅延Top(第3.4節参照)付近の遅延値の小
範囲(6サンプル)を探索することにより求められる。
探索境界tminおよびtmaxは次のように定義される。
遅延T2を見つけるために、第1サブフレームで選択さ
れたピッチの付近で行われる。探索境界は、tmin−2
/3とtmax+2/3の間である。ただし、tminおよび
tmaxはT1から以下のように導出される。
された音声の間の平均二乗重み付き誤差を最小化する。
これは、次の項を最大化することによって達成される。
延kにおける過去のフィルタリングされた励振(h
(n)と畳込みをとった過去の励振)である。注意すべ
き点であるが、探索範囲はあらかじめ選択された値の付
近に制限されており、その値は、第1サブフレームでは
閉ループピッチTopであり、第2サブフレームではT1
である。
され、探索範囲k=tmin+1,...,tmaxではその他
の整数遅延に対して計算され、次の再帰的関係式を用い
て更新される。 yk(n)=yk-1(n−1)+u(−k)h(n), n=39,...,0 (38) ただし、u(n)(n=−143,...,39)は励振
バッファであり、yk-1(−1)=0である。注意すべ
き点であるが、探索段では、サンプルu(n)(n=
0,...,39)は未知であり、これらは40より小さ
いピッチ遅延に対して必要とされる。探索を簡単化する
ため、式(38)の関係がすべての遅延に対して妥当に
なるように、LP残差がu(n)にコピーされる。
延が84より小さい場合にはT1の決定のため、最適整
数遅延付近の分数をテストしなければならない。分数ピ
ッチ探索は、式(37)における正規化相関を補間し、
その最大値を探索することによりなされる。補間は、s
inc関数を±11で切り落とし±12で0を埋め合わ
せた(b12(12)=0)ハミング窓sinc関数に基
づくFIRフィルタb12を用いてなされる。このフィル
タは、オーバーサンプリング領域内の3600Hzに遮
断周波数(−3dB)を有する。分数−2/3、−1/
3、0、1/3、および2/3に対して補間されたR
(k)の値は、次の補間公式を用いて得られる。
よび2/3に対応する。注意すべき点であるが、正しい
補間を行うためには、範囲tmin−4,tmax+4を用い
て式(37)における相関項を計算することが必要であ
る。
の生成]非整数のピッチ遅延が決定された後、適応コー
ドブックベクトルv(n)が、与えられた整数遅延kに
おける過去の励振信号u(n)と分数tを補間すること
によって次のように計算される。
し±30で0を埋め合わせた(b30(30)=0)ハミ
ング窓sinc関数に基づく。このフィルタは、オーバ
ーサンプリング領域において3600Hzに遮断周波数
(−3dB)を有する。
する符号語計算]ピッチ遅延T1は第1サブフレームに
おいて8ビットで符号化され、第2サブフレームにおけ
る相対遅延は5ビットで符号化される。分数遅延Tは、
その整数部分(int)Tと、分数部分frac/3
(frac=−1,0,1)によって表現される。ピッ
チインデックスP1は次のように符号化される。
対的に符号化される。前と同じ解釈を用いて、整数部分
(int)T2と、分数部分frac/3(frac=
−1,0,1)によって表現される分数遅延T2は、次
のように符号化される。 P2=((int)T2−tmin)*3+frac+2 (42) ただし、tminは前と同様にT1から導出される。
強固にするため、第1サブフレームの遅延インデックス
に対してパリティビットP0が計算される。このパリテ
ィビットは、P1の6個の上位ビットに対するXOR演
算により生成される。復号器で、このパリティビットは
再計算され、再計算結果の値が送信された値と一致しな
い場合、誤り隠蔽手続きが適用される。
算]適応コードブック遅延が決定された後、適応コード
ブック利得gpが次のように計算される。
ブックベクトル(v(n)に対するW(z)/A^
(z)の0状態応答)である。このベクトルは、v
(n)とh(n)の畳込みをとることにより得られる。
ことにより、ほとんどの場合gp>0である。信号が負
の相関のみを含む場合、gpの値は0に設定される。
探索]固定コードブックは、インタリーブされた単一パ
ルス置換(ISSP)設計を用いた代数的コードブック
構造に基づく。このコードブックでは、各コードブック
ベクトルは4個の非零パルスを含む。各パルスは+1ま
たは−1のいずれかの振幅を有することが可能であり、
表7に与えられる位置をとることが可能である。
トルをとり、求められた位置に4個の単位パルスを置
き、対応する符号を乗じることによって構成される。 c(n)=s0δ(n−i0)+s1δ(n−i1)+s2δ(n−i2) +s3δ(n−i3), n=0,...,39 (45) ただし、δ(0)は単位パルスである。このコードブッ
クに組み込まれた特徴は、選択されるコードブックベク
トルが、合成される音声の品質を改善するように倍音成
分を増強する適応前置フィルタP(z)によりフィルタ
リングされることである。ここで、このフィルタとして
は P(z)=1/(1−βz-T) (46) が使用される。ただし、Tは現在のサブフレームのピッ
チ遅延の整数成分であり、βはピッチ利得である。βの
値は、0.2から0.8までに制限される前サブフレー
ムからの量子化された適応コードブック利得を用いるこ
とによって適応化される。 β=g^p (m-1) 0.2≦β≦0.8 (47) このフィルタは、サブフレームサイズ40より小さい遅
延に対して倍音構造を増強する。この修正は、次式に従
ってインパルス応答h(n)を修正することにより固定
コードブック探索に組み込まれる。 h(n)=h(n)+βh(n−T), n=T,...,39 (48)
き]固定コードブックは、式(33)の重み付き入力音
声sw(n)と、重み付き再構成音声の間の平均二乗誤
差を最小化することによって探索される。閉ループピッ
チ探索で使用される目標信号は、適応コードブック寄与
を減算することによって更新される。すなわち次式のよ
うになる。 x2(n)=x(n)−gpy(n), n=0,...,39 (49) ただし、y(n)は、式(44)のフィルタリングされ
た適応コードブックベクトルである。
線にh(1),...,h(39)を有する下三角テープ
リッツ畳込み行列として定義される。ckがインデック
スkにおける代数的コードベクトルである場合、コード
ブックは、次の項を最大化することによって探索され
る。
応答h(n)の間の相関であり、Φ=HtHは、h
(n)の相関行列である。信号d(n)および行列Φは
コードブック探索の前に計算される。d(n)の要素は
次式から計算される。
化するために、必要な要素のみが計算され、効率的な記
憶手続きが設計されている。
ドブックベクトルckは非零パルスを4個だけ含むた
め、高速な探索手続きが可能となる。与えられたベクト
ルckに対して式(50)の分子の相関は次式で与えら
れる。
振幅である。式(50)の分母のエネルギーは次式で与
えられる。
は、信号d(n)を量子化することによってあらかじめ
決定される。これは、ある位置におけるパルスの振幅を
その位置におけるd(n)の符号に等しいと設定するこ
とによってなされる。コードブック探索の前に、以下の
ステップが実行される。第1に、信号d(n)が二つの
信号、すなわち、絶対値信号d’(n)=|d(n)|
と、符号信号sign[d(n)]に分解される。第2
に、行列Φは、符号情報を含むように修正される。すな
わち、次式のようになる。 φ’(i,j)=sign[d(i)]sign[d(j)]φ(i,j) , i=0,...,39, j=i,...,39 (55) 式(54)における因子2を除去するため次のように置
く。 φ’(i,i)=0.5φ(i,i), i=0,...,39 (56) すると、式(53)の相関は次式で与えられる。 C=d’(m0)+d’(m1)+d’(m2)+d’(m3) (57) また、式(54)のエネルギーは次式で与えられる。
探索法が用いられる。この方法では、最後のループには
入る前に、あらかじめ計算されたしきい値がテストさ
れ、このしきい値を越える場合に限りループに入る。コ
ードブックのうちの小さい割合を探索するように、ルー
プに入ることが可能な最大回数は固定される。しきい値
は、相関Cに基づいて計算される。コードブック探索の
前に、最初の3個のパルスの寄与による最大絶対相関お
よび平均相関(max3およびav3)が求められる。し
きい値は次式で与えられる。 thr3=av3+K3(max3−av3) (59) 絶対相関(3個のパルスによる)がthr3を越えると
きに限り第4のループに入る。ただし0≦K3<1であ
る。K3の値は、コードブック探索の割合を制御し、こ
こでは0.4に設定される。注意すべき点であるが、こ
の結果、探索時間は可変となり、探索をさらに制御する
には、最終ループに入る回数(2個のサブフレームに対
して)はある最大値を越えることはできない。この最大
値はここでは180(サブフレームあたり最悪の場合が
平均90回)に設定される。
計算]パルスi0、i1、およびi2のパルス位置はそ
れぞれ3ビットで符号化され、i3の位置は4ビットで
符号化される。各パルス振幅は1ビットで符号化され
る。これにより、4パルスに対して全部で17ビットと
なる。符号が正の場合s=1、符号が負の場合s=0と
定義することにより、符号符号語は次式から得られる。 S=s0+2*s1+4*s2+8*s3 (60) また、固定コードブック符号語は次式から得られる。 C=(i0/5)+8*(i1/5)+64*(i2/5)+512*(2 *(i3/5)+jx) (61) ただし、i3=3,8,...の場合jx=0であり、i
3=4,9,...の場合jx=1である。
ク利得(ピッチ利得)および固定(代数的)コードブッ
ク利得は7ビットを用いてベクトル量子化される。利得
コードブック探索は、もとの音声と再構成音声の間の平
均二乗重み付き誤差を最小化することによってなされ
る。この誤差は次式で与えられる。 E=xtx+gp 2yty+gc 2ztz−2gpxty−2gcxtz+2gpgcyt z (62) ただし、xは目標ベクトル(第3.6節参照)、yは式
(44)のフィルタリングされた適応コードブックベク
トル、および、zは、次式のように、固定コードブック
ベクトルとh(n)の畳込みである。
ク利得gcは次のように表すことができる。 gc=γgc’ (64) ただし、gc’は、以前の固定コードブックエネルギー
に基づいて予測される利得であり、γは補正因子であ
る。
次式で与えられる。
後、スケールされた固定コードブックのエネルギーは2
0log(gc)+Eで与えられる。E(m)を、次式で与
えられる、サブフレームmにおける(スケールされた)
固定コードブック寄与の平均除去エネルギー(単位d
B)とする。 E(m)=20log(gc)+E−E ただし、E=30dBは、固定コードブック励振の平均
エネルギーである。利得gcは、E(m)、E、およびEの
関数として次のように表すことができる。
ク寄与の対数エネルギーから現在の固定コードブック寄
与の対数エネルギーを予測することによって求められ
る。4次MA予測は以下のように行われる。予測エネル
ギーは次式で与えられる。
8 0.34 0.19]はMA予測係数であり、R^
(m)は、サブフレームmにおける予測誤差R(m)の量子化
バージョンであって次式で定義される。 R(m)=E(m)−R^(m) (69)
(m)をその予測値で置き換えることによって求められ
る。
れる。 R(m)=E(m)−E (m)=20log(γ) (71)
ブック探索]適応コードブック利得gpおよび補正因子
γは、2段共役構造化コードブックを用いてベクトル量
子化される。第1段は、3ビットの2次元コードブック
GAからなり、第2段は、4ビットの2次元コードブッ
クGBからなる。各コードブックにおける第1の要素
は、量子化された適応コードブック利得g^pを表し、
第2の要素は、量子化された固定コードブック利得補正
因子γ^を表す。GAおよびGBそれぞれに対するコー
ドブックインデックスmおよびnが与えられた場合、量
子化された適応コードブック利得は次式で与えられる。
られる。
ることによって、コードブック探索を簡単化する。最適
なピッチ利得gpおよび固定コードブック利得gcは式
(62)から導出され、前選択のために使用される。コ
ードブックGAは8個のエントリを含み、その第2の要
素(gcに対応する)は一般に第1の要素(gpに対応す
る)よりも大きい値を有する。このバイアスにより、g
cの値を用いた前選択が可能となる。この前選択プロセ
スでは、第2の要素がgxcに近いような4個のベクト
ルからなるクラスタがgcおよびgpから導出される。同
様に、コードブックGBは16個のエントリを含み、そ
れらのエントリは第1の要素(gpに対応する)へ向か
うバイアスを有する。第1の要素がgpに近いような8
個のベクトルからなるクラスタが選択される。こうし
て、各コードブックごとに、最良の50%の候補ベクト
ルが選択される。この後、2個のインデックスの組合せ
が式(62)の重み付き平均二乗誤差を最小化するよう
に、残りの4×8=32個の可能性にわたる全数探索が
行われる。
語計算]利得量子化器に対する符号語GAおよびGB
は、最良選択に対応するインデックスから得られる。単
一ビット誤りの影響を軽減するため、コードブックイン
デックスはマッピングされる。
よび重み付けフィルタの状態の更新が、次のサブフレー
ムにおける目標信号の計算のために必要である。二つの
利得が量子化された後、現在のサブフレームの励振信号
u(n)は次式により求められる。 u(n)=g^pv(n)+g^cc(n), n=0,...,39 (7 4) ただし、g^pおよびg^cは、それぞれ、量子化された
適応コードブックおよび固定コードブックの利得であ
り、v(n)は適応コードブックベクトル(補間された
過去の励振)であり、c(n)は固定コードブックベク
トル(ピッチ先鋭化を含む代数的コードベクトル)であ
る。フィルタの状態は、40サンプルのサブフレームに
対してフィルタ1/A^(z)およびA(z/γ1)/
A(z/γ2)により信号r(n)−u(n)(残差と
励振の差)をフィルタリングし、フィルタの状態を保存
することによって更新することができる。これは、三つ
のフィルタ動作を必要とする。1回のフィルタリングし
か必要としないさらに簡単な方法は以下のとおりであ
る。局所合成音声s^(n)が、1/A^(z)により
励振信号をフィルタリングすることによって計算され
る。入力r(n)−u(n)によるこのフィルタの出力
は、e(n)=s(n)−s^(n)と等価である。従
って、合成フィルタ1/A^(z)の状態はe(n)
(n=30,...,39)によって与えられる。フィル
タA(z/γ1)/A(z/γ2)の状態の更新は、誤差
信号e(n)をこのフィルタによりフィルタリングして
知覚的重み付き誤差ew(n)を求めることにより行う
ことができる。しかし、信号ew(n)は、次式によっ
ても求めることができる。 ew(n)=x(n)−g^py(n)+g^cz(n) (75) 信号x(n)、y(n)、およびz(n)は利用可能で
あるため、重み付けフィルタの状態は、n=3
0,...,39に対して式(75)のようにしてew
(n)を計算することにより更新される。これにより、
2回のフィルタ動作が節約される。
化]すべての静的な符号器変数は、表8に列挙した変数
を除いては0に初期化される。これらの変数は復号器に
対しても同様に初期化する必要がある。
る信号フローを図7に示した。まず、パラメータ(LP
係数、適応コードブックベクトル、固定コードブックベ
クトル、および利得)が復号される。これらの復号され
たパラメータは、再構成音声信号を計算するために使用
される。このプロセスを第4.1節で説明する。この再
構成信号は、ポストフィルタおよび高域フィルタからな
る後処理動作によって増強される(第4.2節)。第
4.3節では、パリティ誤りが起きたとき、または、フ
レーム消失フラグがセットされたときに使用される誤り
隠蔽手続きについて説明する。
れるパラメータを図9に列挙する。起動時には、すべて
の静的符号器変数は、表8に列挙した変数を除いては0
に初期化される。復号プロセスは、以下の順序で行われ
る。
復号]受信したLSP量子化器のインデックスL0、L
1、L2、およびL3は、第3.2.4節で説明した手
続きで用いられる量子化LSP係数を再構成するために
使用される。第3.2.5節で説明した補間手続きを用
いて、2個の補間LSPベクトル(2このサブフレーム
に対応する)を得る。各サブフレームごとに、補間LS
PベクトルはLPフィルタ係数aiに変換され、これら
は、そのサブフレームにおける再構成音声を合成するた
めに使用される。
反復される。 1.適応コードブックベクトルの復号。 2.固定コードブックベクトルの復号。 3.適応コードブックおよび固定コードブックの利得の
復号。 4.再構成音声の計算。
の復号]受信した適応コードブックインデックスは、ピ
ッチ遅延の整数部分および小数部分を求めるために使用
される。T1の整数部分(int)T1および小数部分f
racはP1から以下のようにして得られる。
びtminから以下のようにして得られる。tminはP1か
ら導出される。
(40)を用いて(ピッチ遅延における)過去の励振u
(n)を補間することにより求められる。
の復号]受信した固定コードブックインデックスCは、
励振パルスの位置を抽出するために使用される。パルス
の符号はSから得られる。パルスの位置および符号が復
号されると、固定コードブックベクトルc(n)を構成
することができる。ピッチ遅延Tの整数部分がサブフレ
ームサイズ40より小さい場合、ピッチ増強手続きが適
用され、式(48)に従ってc(n)を修正する。
定コードブックの利得の復号]受信した利得コードブッ
クインデックスは、適応コードブック利得g^pおよび
固定コードブック利得補正因子γ^を与える。この手続
きは第3.9節に詳細に説明した。推定される固定コー
ドブック利得gc’は式(70)を用いて求められる。
固定コードブックベクトルは、量子化された利得補正因
子と、この予測利得との積から得られる(式(6
4))。適応コードブック利得は式(72)を用いて再
構成される。
声を再構成する前に、パリティビットが、適応コードブ
ック遅延から再計算される(第3.7.2節)。このビ
ットが送信されたパリティビットP0と同一でない場
合、送信中にビット誤りが生じた可能性があり、第4.
3節の誤り隠蔽手続きが使用される。
ィルタの入力における励振u(n)(式(74)参照)
は、LP合成フィルタへの入力である。サブフレームに
対する再構成音声は次式で与えられる。
る。
説明するポストプロセッサによって処理される。
すなわち、適応ポストフィルタリング、高域フィルタリ
ング、および信号アップスケーリングからなる。適応ポ
ストフィルタは、3個のフィルタ、すなわち、ピッチポ
ストフィルタHp(z)、短期ポストフィルタH
f(z)、および傾斜補償フィルタHt(z)のカスケー
ドである。ポストフィルタは、5msのサブフレームご
とに更新される。ポストフィルタリングプロセスは以下
のように編成される。最初に、合成音声s^(n)は、
A^(z/γn)により逆フィルタリングされ、残差信
号r^(n)を生成する。信号r^(n)は、ピッチ遅
延Tおよび利得gpitを計算するために用いられる。信
号r^(n)は、ピッチポストフィルタHp(z)によ
りフィルタリングされて信号r’(n)が生成される。
続いて信号r’(n)は、合成フィルタ1/[gfA^
(z/γd)]によりフィルタリングされる。最後に、
合成フィルタ1/[gfA^(z/γd)]の出力信号
は、傾斜補償フィルタHt(z)を通り、ポストフィル
タリングされた合成音声信号sf(n)が生成される。
その後、適応利得制御がsf(n)とs^(n)の間に
適用され、信号sf’(n)が生成される。その後、高
域フィルタリングおよびスケーリング操作が、ポストフ
ィルタリングされた信号sf’(n)に作用する。
ッチ(倍音)ポストフィルタは次式で与えられる。
えられる利得因子である。 g0=γpgpit (78) ただし、gpitはピッチ利得である。ピッチ遅延および
ピッチ利得はいずれも、復号器出力信号から決定され
る。注意すべき点であるが、gpitは1を限界とし、ピ
ッチ予測利得が3dBより小さい場合には0に設定され
る。因子γpは、倍音ポストフィルタリングの量を制御
し、γp=0.5という値を有する。ピッチ遅延および
ピッチ利得は、音声s^(n)をA^(z/γn)でフ
ィルタリングすることによって得られる残差信号r^
(n)から計算される。残差信号r^(n)は、次式の
ように、短期ポストフィルタの分子である(第4.2.
2節参照)。
パスは、範囲[T1−1,T1+1]において最良の整数
T0を選択する。ただし、T1は第1サブフレームにおけ
る(送信された)ピッチ遅延の整数部分である。最良の
整数遅延は、次式の相関を最大化するものである。
延Tを選択する。これは、次式の正規化相関を最大にす
る遅延を求めることによりなされる。
る。最適遅延Tが求められた後、対応する相関値がしき
い値と比較される。R’(T)<0.5の場合、倍音ポ
ストフィルタは、gpit=0と設定することによって無
効化される。そうでない場合、gpitの値は次式から計
算される。
フィルタを用いて計算される。Tの選択後、r^
k(n)は、より長い長さ129の補間フィルタで再計
算される。この新しい信号は、長いほうのフィルタが
R’(T)の値を増加させた場合に限り前の値を置き換
える。
ポストフィルタは次式で与えられる。
(LP分析は復号器では行われない)であり、因子γn
およびγdは短期ポストフィルタリングの量を制御し、
γn=0.55およびγd=0.7に設定される。利得項
gfは、フィルタA^(z/γn)/A^(z/γd)の
打切りインパルス応答hf(n)に対して計算され、次
式で与えられる。
タHt(z)は、短期ポストフィルタHf(z)における
傾斜を補償し、次式で与えられる。
して計算された第1反射係数であり、次式で与えられ
る。
の減少効果を補償する。さらに、積フィルタHf(z)
Ht(z)は一般に利得がないことが示されている。
て用いられる。k1が負の場合、γt=0.9であり、k
1が正の場合、γt=0.2である。
御は、再構成音声信号s^(n)とポストフィルタリン
グされた信号sf(n)の間の利得差を補償するために
用いられる。現在のサブフレームに対する利得スケール
因子Gは次式により計算される。
sf’(n)は次式で与えられる。 sf’(n)=g(n)sf(n), n=0,...,39 (88) ただし、g(n)は、サンプルごとに更新され、次式で
与えられる。 g(n)=0.85g(n−1)+0.15G, n=0,...,39 (89) g(−1)の初期値は1.0である。
アップスケーリング]遮断周波数100Hzにおける高
域フィルタが、再構成されポストフィルタリングされた
音声sf’(n)に適用される。このフィルタは次式で
与えられる。
グされた出力に因子2を乗じて入力信号レベルを取得す
ることからなる。
りの隠蔽]ビットストリームにおけるフレーム消失また
はランダム誤りによる再構成音声の劣化を縮小するた
め、復号器に誤り隠蔽手続きが組み込まれている。この
誤り隠蔽手続きは、(i)符号器パラメータのフレーム
(10msフレームに対応する)が消失していると識別
されたとき、または(ii)ピッチ遅延インデックスP
1に対するパリティビットにチェックサム誤りが生じた
ときに機能する。後者は、ビットストリームがランダム
ビット誤りによって破損したときにも起こりうる。
T1は前フレームの遅延の値に設定される。T2の値は、
この新しいT1の値を用いて、第4.1.2節で概説し
た手続きで導出される。連続してパリティ誤りが生じた
場合、T1の前の値を1だけインクリメントして使用す
る。
は定義されず、アプリケーションに依存することにな
る。隠蔽ストラテジは、前に受信した情報に基づいて現
在のフレームを再構成しなければならない。使用される
方法は、欠けている励振信号を、類似の特性のうちの一
つにより、そのエネルギーを徐々に減衰させながら置換
する。これは、長期予測利得に基づく有声分類子を使用
することによってなされる。長期予測利得は、長期ポス
トフィルタ分析の一部として計算される。ピッチポスト
フィルタ(第4.2.1節参照)は、予測利得が3dB
より大きい長期予測子を求める。これは、正規化相関
R’(k)(式(81))に対するしきい値を0.5に
設定することによってなされる。誤り隠蔽プロセスに対
して、これらのフレームは周期的と分類される。それ以
外の場合、フレームは非周期的であると宣言される。消
失したフレームは、先行する(再構成された)音声フレ
ームからそのクラスを継承する。注意すべき点である
が、有声分類は、この再構成音声信号に基づいて絶えず
更新される。従って、多くの連続する消失フレームに対
しては分類は変わることがある。一般に、これは、もと
の分類が周期的であった場合にのみ起こる。
ップは以下の通りである。 1.LPフィルタパラメータの反復。 2.適応コードブックおよび固定コードブックの利得の
減衰。 3.利得予測子のメモリの減衰。 4.置換励振の生成。
反復]最後の良好なフレームのLPパラメータが使用さ
れる。LSF予測子の状態は、受信符号語liの値を含
む。現在の符号語が利用可能でないため、これは、反復
されたLSFパラメータω^iおよび予測子メモリから
次式により計算される。
定コードブックの利得の減衰]前の固定コードブック利
得の減衰バージョンが使用される。 gc (m)=0.98gc (m-1) (92) 適応コードブック利得に対しても同じことが行われる。
さらに、クリッピング作用を用いてその値を0.9未満
に保つ。 gp (m)=0.90gp (m-1)かつgp (m)<0.9 (93)
衰]利得予測子は、以前に選択されたコードブックのエ
ネルギーを用いる。良好なフレームを受信した後の符号
器の滑らかな連続性を可能にするため、利得予測子のメ
モリは、コードブックエネルギーの減衰バージョンで更
新される。現在のサブフレームnに対するR^(m)の値
は、平均した量子化利得予測誤りを4dBだけ減衰させ
たものに設定される。
る励振は、周期性分類に依存する。最後に正しく受信し
たフレームが周期的であると分類された場合、現在のフ
レームも同様に周期的であるとみなされる。その場合、
適応コードブックのみが使用され、固定コードブック寄
与は0に設定される。ピッチ遅延は最後に正しく受信し
たピッチ遅延に基づき、後続の各フレームに対して反復
される。過度の周期性を回避するため、遅延は、次のサ
ブフレームごとに1だけ増加されるが、143を限度と
する。適応コードブック利得は、式(93)に滴って減
衰した値に基づく。
であると分類された場合、現在のフレームも同様に非周
期的であるとみなされ、適応コードブック寄与は0に設
定される。固定コードブック寄与は、コードブックイン
デックスおよび符号インデックスをランダムに選択する
ことによって生成される。乱数発生器は次の関数に基づ
く。 seed=seed*31821+13849 (95) seedの初期値は21845である。ランダムなコー
ドブックインデックスは、次の乱数の13個の下位ビッ
トから導出される。ランダムな符号は、次の乱数の4個
の下位ビットから導出される。固定コードブック利得は
式(92)に従って減衰される。
ビット精度での記述]16ビット固定小数点でのCS−
ACELP符号器/復号器をシミュレートするANSI
CコードがITU−Tから利用可能である。以下の節
では、このシミュレーションコードの使用法、および、
そのソフトウェアがどのように編成されているかについ
て概説する。
の使用法]Cコードは二つのメインプログラムからな
る。coder.cは符号器をシミュレートし、dec
oder.cは復号器をシミュレートする。符号器は次
のように実行される。 coder inputfile bstreamfi
le inputfile(入力ファイル)およびoutpu
tfile(出力ファイル)は、16ビットPCM信号
を含むサンプリングされたデータファイルである。bs
treamfile(ビットストリームファイル)は8
1個の16ビットワードを含む。第1ワードはフレーム
消失を示すために使用可能であり、残りの80ワードは
それぞれ1ビットを含む。復号器はこのビットストリー
ムファイルを受け取り、16ビットPCM信号を含むポ
ストフィルタリングされた出力ファイルを生成する。 decoder bstreamfile outpu
tfile
の構成]固定小数点ANSI Cシミュレーションで
は、表10に示すように2種類の固定小数点データのみ
が使用される。シミュレーションコードの実装を容易に
するため、ループインデックス、ブール値およびフラグ
は型Flagを使用する。これは、ターゲットプラット
フォームに応じて16ビットまたは32ビットのいずれ
かとなる。
本演算子のセットを用いてなされる。これらの演算子の
記述を表11に示す。シミュレーション符号器によって
使用されるテーブルを表12に要約する。これらのメイ
ンプログラムは、表13、表14、および表15に要約
されるライブラリルーチンを使用する。
器のブロック図である。
信システムの実施例の図である。
図である。
図である。
ターンは対応する励振およびLP分析フレームを識別す
る。
ッサ 125 予測利得プロセッサ 130 乗算器 250 増幅器 600 送信機 610 音声符号器 620 チャネル符号器 630 変調器 640 無線送信回路 700 受信機 710 無線受信回路 720 復調器 730 チャネル復号器 740 音声復号器
Claims (5)
- 【請求項1】 圧縮音声情報の連続する第1フレームお
よび第2フレームのそれぞれの少なくとも一部を信頼性
良く受信することができない音声復号器において使用さ
れる音声復号方法において、 前記音声復号器は、ピッチ周期情報を表す信号に応答し
てベクトル信号を出力するコードブックメモリを有し、
当該ベクトル信号は、復号された音声信号を生成する際
に使用され、前記方法は、 前記第1フレームに対応するピッチ周期情報を表す値を
有する信号を記憶するステップと、 前記コードブックメモリが前記信号のインクリメントさ
れた値に応答してベクトル信号を出力するように、前記
第2フレームで使用するために前記信号の値をインクリ
メントするステップとからなることを特徴とする音声復
号方法。 - 【請求項2】 ピッチ周期情報を表す信号の値は音声情
報を表す信号のサンプルの単位であることを特徴とする
請求項1の方法。 - 【請求項3】 前記インクリメントするステップは、ピ
ッチ周期を表すサンプルの数をインクリメントするステ
ップからなることを特徴とする請求項2の方法。 - 【請求項4】 第1フレームに対応するピッチ周期情報
を表す値を有する信号は、情報の受信に障害がなかった
場合のフレームで受信されるピッチ周期情報の値に等し
いことを特徴とする請求項1の方法。 - 【請求項5】 圧縮音声情報の連続する第1フレームお
よび第2フレームの少なくとも一部を信頼性良く受信す
ることができない音声復号器において使用される音声復
号方法において、 前記音声復号器は、ピッチ周期情報を表す信号に応答し
て、復号された音声信号を生成する際に使用されるベク
トル信号を出力する適応コードブックメモリを有し、前
記方法は、 前記第1フレームに対応するピッチ周期情報を表す値を
有する信号を記憶するステップと、 記憶された値がしきい値を越えない場合、前記第2フレ
ームで使用するために前記信号の値をインクリメントす
るステップとからなることを特徴とする音声復号方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US482709 | 1995-06-07 | ||
| US08/482,709 US5699485A (en) | 1995-06-07 | 1995-06-07 | Pitch delay modification during frame erasures |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH09190197A true JPH09190197A (ja) | 1997-07-22 |
| JP3432082B2 JP3432082B2 (ja) | 2003-07-28 |
Family
ID=23917124
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP18261396A Expired - Lifetime JP3432082B2 (ja) | 1995-06-07 | 1996-06-07 | フレーム消失の間のピッチ遅れ修正方法 |
Country Status (9)
| Country | Link |
|---|---|
| US (1) | US5699485A (ja) |
| EP (1) | EP0747882B1 (ja) |
| JP (1) | JP3432082B2 (ja) |
| KR (1) | KR100389179B1 (ja) |
| AU (1) | AU709754B2 (ja) |
| CA (1) | CA2177421C (ja) |
| DE (1) | DE69613907T2 (ja) |
| ES (1) | ES2161974T3 (ja) |
| MX (1) | MX9602145A (ja) |
Cited By (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
| WO2003010752A1 (fr) * | 2001-07-26 | 2003-02-06 | Nec Corporation | Appareil d'elargissement de la largeur de bande vocale et procede d'elargissement de la largeur de bande vocale |
| KR100413039B1 (ko) * | 2002-01-16 | 2003-12-31 | 어뮤즈텍(주) | 피치보정방법 및 그 장치 |
| JP2004501391A (ja) * | 2000-04-24 | 2004-01-15 | クゥアルコム・インコーポレイテッド | 可変レート音声符号器におけるフレーム消去補償方法 |
| JP2004508597A (ja) * | 2000-09-05 | 2004-03-18 | フランス テレコム | オーディオ信号における伝送エラーの抑止シミュレーション |
| JP2008026912A (ja) * | 2004-12-13 | 2008-02-07 | Fraunhofer Ges Zur Foerderung Der Angewandten Forschung Ev | 平方値に線形従属する計算結果の表示を生成する方法 |
| JP2009503559A (ja) * | 2005-07-22 | 2009-01-29 | フランス テレコム | レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法 |
| US7684979B2 (en) | 2002-10-31 | 2010-03-23 | Nec Corporation | Band extending apparatus and method |
| JP2010154307A (ja) * | 2008-12-25 | 2010-07-08 | Fujitsu Telecom Networks Ltd | 伝送装置及び音声信号伝送方法 |
| JP2014512028A (ja) * | 2011-04-21 | 2014-05-19 | サムスン エレクトロニクス カンパニー リミテッド | 線形予測係数の量子化装置、サウンド符号化装置、線形予測係数の逆量子化装置、サウンド復号化装置及び電子機器 |
| JP2014519044A (ja) * | 2011-04-21 | 2014-08-07 | サムスン エレクトロニクス カンパニー リミテッド | 線形予測係数量子化方法、サウンド符号化方法、線形予測係数逆量子化方法、サウンド復号化方法、その記録媒体及び電子機器 |
| JP2015515644A (ja) * | 2013-02-15 | 2015-05-28 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | 音声符号化のための混合コードブック励振のためのシステムおよび方法 |
Families Citing this family (100)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08179796A (ja) * | 1994-12-21 | 1996-07-12 | Sony Corp | 音声符号化方法 |
| FR2729246A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
| SE9500858L (sv) * | 1995-03-10 | 1996-09-11 | Ericsson Telefon Ab L M | Anordning och förfarande vid talöverföring och ett telekommunikationssystem omfattande dylik anordning |
| TW317051B (ja) * | 1996-02-15 | 1997-10-01 | Philips Electronics Nv | |
| US6298057B1 (en) * | 1996-04-19 | 2001-10-02 | Nortel Networks Limited | System and method for reliability transporting aural information across a network |
| US5867530A (en) * | 1996-06-14 | 1999-02-02 | Trw Inc. | Method and apparatus for accomodating signal blockage in satellite mobile radio systems |
| WO1998006091A1 (en) * | 1996-08-02 | 1998-02-12 | Matsushita Electric Industrial Co., Ltd. | Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus |
| US6075974A (en) * | 1996-11-20 | 2000-06-13 | Qualcomm Inc. | Method and apparatus for adjusting thresholds and measurements of received signals by anticipating power control commands yet to be executed |
| GB2322778B (en) * | 1997-03-01 | 2001-10-10 | Motorola Ltd | Noise output for a decoded speech signal |
| KR100198476B1 (ko) * | 1997-04-23 | 1999-06-15 | 윤종용 | 노이즈에 견고한 스펙트럼 포락선 양자화기 및 양자화 방법 |
| DK0978172T3 (da) * | 1997-04-23 | 2000-11-20 | Fraunhofer Ges Forschung | Fremgangsmåde til sløring af fejl i en adiodatastrøm |
| IL120788A (en) * | 1997-05-06 | 2000-07-16 | Audiocodes Ltd | Systems and methods for encoding and decoding speech for lossy transmission networks |
| FI113903B (fi) * | 1997-05-07 | 2004-06-30 | Nokia Corp | Puheen koodaus |
| FR2774827B1 (fr) * | 1998-02-06 | 2000-04-14 | France Telecom | Procede de decodage d'un flux binaire representatif d'un signal audio |
| CN1134762C (zh) * | 1998-05-27 | 2004-01-14 | Ntt移动通信网株式会社 | 语音译码器和语音译码方法 |
| EP1001542B1 (en) * | 1998-05-27 | 2011-03-02 | Ntt Mobile Communications Network Inc. | Voice decoder and voice decoding method |
| US6810377B1 (en) * | 1998-06-19 | 2004-10-26 | Comsat Corporation | Lost frame recovery techniques for parametric, LPC-based speech coding systems |
| US7072832B1 (en) | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
| US6104992A (en) * | 1998-08-24 | 2000-08-15 | Conexant Systems, Inc. | Adaptive gain reduction to produce fixed codebook target signal |
| JP4249821B2 (ja) * | 1998-08-31 | 2009-04-08 | 富士通株式会社 | ディジタルオーディオ再生装置 |
| US6397178B1 (en) * | 1998-09-18 | 2002-05-28 | Conexant Systems, Inc. | Data organizational scheme for enhanced selection of gain parameters for speech coding |
| JP3599581B2 (ja) * | 1998-11-25 | 2004-12-08 | キヤノン株式会社 | 電子装置及びコンピュータ読み取り可能な記憶媒体 |
| US6889183B1 (en) * | 1999-07-15 | 2005-05-03 | Nortel Networks Limited | Apparatus and method of regenerating a lost audio segment |
| US6393394B1 (en) * | 1999-07-19 | 2002-05-21 | Qualcomm Incorporated | Method and apparatus for interleaving line spectral information quantization methods in a speech coder |
| EP1075101A3 (en) * | 1999-08-05 | 2005-06-22 | Alcatel | Method and system for synchronising frames |
| US7315815B1 (en) | 1999-09-22 | 2008-01-01 | Microsoft Corporation | LPC-harmonic vocoder with superframe structure |
| US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
| US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
| US6826527B1 (en) * | 1999-11-23 | 2004-11-30 | Texas Instruments Incorporated | Concealment of frame erasures and method |
| US7574351B2 (en) * | 1999-12-14 | 2009-08-11 | Texas Instruments Incorporated | Arranging CELP information of one frame in a second packet |
| US6704703B2 (en) * | 2000-02-04 | 2004-03-09 | Scansoft, Inc. | Recursively excited linear prediction speech coder |
| CN1383544A (zh) * | 2000-07-05 | 2002-12-04 | 皇家菲利浦电子有限公司 | 计算线谱频率的方法 |
| US6678651B2 (en) * | 2000-09-15 | 2004-01-13 | Mindspeed Technologies, Inc. | Short-term enhancement in CELP speech coding |
| EP1199709A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Error Concealment in relation to decoding of encoded acoustic signals |
| US6968309B1 (en) * | 2000-10-31 | 2005-11-22 | Nokia Mobile Phones Ltd. | Method and system for speech frame error concealment in speech decoding |
| CA2430319C (en) * | 2000-11-30 | 2011-03-01 | Matsushita Electric Industrial Co., Ltd. | Speech decoding apparatus and speech decoding method |
| ATE439666T1 (de) * | 2001-02-27 | 2009-08-15 | Texas Instruments Inc | Verschleierungsverfahren bei verlust von sprachrahmen und dekoder dafer |
| JP2002268697A (ja) * | 2001-03-13 | 2002-09-20 | Nec Corp | パケット誤り耐性付き音声復号装置、音声符号化復号装置、及びその方法 |
| US7212517B2 (en) * | 2001-04-09 | 2007-05-01 | Lucent Technologies Inc. | Method and apparatus for jitter and frame erasure correction in packetized voice communication systems |
| US7013267B1 (en) * | 2001-07-30 | 2006-03-14 | Cisco Technology, Inc. | Method and apparatus for reconstructing voice information |
| US7590525B2 (en) * | 2001-08-17 | 2009-09-15 | Broadcom Corporation | Frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
| US7711563B2 (en) * | 2001-08-17 | 2010-05-04 | Broadcom Corporation | Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
| DE60223580T2 (de) * | 2001-08-17 | 2008-09-18 | Broadcom Corp., Irvine | Verbessertes verbergen einer rahmenlöschung für die prädiktive sprachcodierung auf der basis einer extrapolation einer sprachsignalform |
| US7353168B2 (en) * | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
| JP4108317B2 (ja) * | 2001-11-13 | 2008-06-25 | 日本電気株式会社 | 符号変換方法及び装置とプログラム並びに記憶媒体 |
| CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
| EP1383110A1 (fr) * | 2002-07-17 | 2004-01-21 | STMicroelectronics N.V. | Procédé et dispositif d'encodage de la parole à bande élargie, permettant en particulier une amélioration de la qualité des trames de parole voisée |
| US20040064308A1 (en) * | 2002-09-30 | 2004-04-01 | Intel Corporation | Method and apparatus for speech packet loss recovery |
| US6961696B2 (en) * | 2003-02-07 | 2005-11-01 | Motorola, Inc. | Class quantization for distributed speech recognition |
| GB2416467B (en) * | 2003-05-14 | 2006-08-30 | Oki Electric Ind Co Ltd | Apparatus and method for concealing erased periodic signal data |
| KR20050008356A (ko) * | 2003-07-15 | 2005-01-21 | 한국전자통신연구원 | 음성의 상호부호화시 선형 예측을 이용한 피치 지연 변환장치 및 방법 |
| US7729267B2 (en) | 2003-11-26 | 2010-06-01 | Cisco Technology, Inc. | Method and apparatus for analyzing a media path in a packet switched network |
| US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
| US9197857B2 (en) | 2004-09-24 | 2015-11-24 | Cisco Technology, Inc. | IP-based stream splicing with content-specific splice points |
| US8966551B2 (en) | 2007-11-01 | 2015-02-24 | Cisco Technology, Inc. | Locating points of interest using references to media frames within a packet flow |
| KR101034129B1 (ko) * | 2004-11-11 | 2011-05-13 | 엘지전자 주식회사 | 인버터 시스템의 과전류 제한장치 및 방법 |
| US8364494B2 (en) | 2005-04-01 | 2013-01-29 | Qualcomm Incorporated | Systems, methods, and apparatus for split-band filtering and encoding of a wideband signal |
| SI1875463T1 (sl) | 2005-04-22 | 2019-02-28 | Qualcomm Incorporated | Sistemi, postopki in naprava za glajenje faktorja ojačenja |
| US7930176B2 (en) * | 2005-05-20 | 2011-04-19 | Broadcom Corporation | Packet loss concealment for block-independent speech codecs |
| US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
| US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
| US7177804B2 (en) | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
| US9058812B2 (en) * | 2005-07-27 | 2015-06-16 | Google Technology Holdings LLC | Method and system for coding an information signal using pitch delay contour adjustment |
| KR100792209B1 (ko) | 2005-12-07 | 2008-01-08 | 한국전자통신연구원 | 디지털 오디오 패킷 손실을 복구하기 위한 방법 및 장치 |
| US7457746B2 (en) * | 2006-03-20 | 2008-11-25 | Mindspeed Technologies, Inc. | Pitch prediction for packet loss concealment |
| US20070282601A1 (en) * | 2006-06-02 | 2007-12-06 | Texas Instruments Inc. | Packet loss concealment for a conjugate structure algebraic code excited linear prediction decoder |
| WO2008007700A1 (en) * | 2006-07-12 | 2008-01-17 | Panasonic Corporation | Sound decoding device, sound encoding device, and lost frame compensation method |
| US7877253B2 (en) * | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
| EP2538405B1 (en) | 2006-11-10 | 2015-07-08 | Panasonic Intellectual Property Corporation of America | CELP-coded speech parameter decoding method and apparatus |
| KR101292771B1 (ko) * | 2006-11-24 | 2013-08-16 | 삼성전자주식회사 | 오디오 신호의 오류은폐방법 및 장치 |
| US7738383B2 (en) * | 2006-12-21 | 2010-06-15 | Cisco Technology, Inc. | Traceroute using address request messages |
| CN101226744B (zh) * | 2007-01-19 | 2011-04-13 | 华为技术有限公司 | 语音解码器中实现语音解码的方法及装置 |
| US7706278B2 (en) * | 2007-01-24 | 2010-04-27 | Cisco Technology, Inc. | Triggering flow analysis at intermediary devices |
| WO2008108081A1 (ja) * | 2007-03-02 | 2008-09-12 | Panasonic Corporation | 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 |
| JP5233986B2 (ja) * | 2007-03-12 | 2013-07-10 | 富士通株式会社 | 音声波形補間装置および方法 |
| US8023419B2 (en) | 2007-05-14 | 2011-09-20 | Cisco Technology, Inc. | Remote monitoring of real-time internet protocol media streams |
| US7936695B2 (en) | 2007-05-14 | 2011-05-03 | Cisco Technology, Inc. | Tunneling reports for real-time internet protocol media streams |
| US7835406B2 (en) * | 2007-06-18 | 2010-11-16 | Cisco Technology, Inc. | Surrogate stream for monitoring realtime media |
| US7817546B2 (en) | 2007-07-06 | 2010-10-19 | Cisco Technology, Inc. | Quasi RTP metrics for non-RTP media flows |
| CN101207665B (zh) * | 2007-11-05 | 2010-12-08 | 华为技术有限公司 | 一种衰减因子的获取方法 |
| US8214201B2 (en) * | 2008-11-19 | 2012-07-03 | Cambridge Silicon Radio Limited | Pitch range refinement |
| US8301982B2 (en) | 2009-11-18 | 2012-10-30 | Cisco Technology, Inc. | RTP-based loss recovery and quality monitoring for non-IP and raw-IP MPEG transport flows |
| GB0920729D0 (en) * | 2009-11-26 | 2010-01-13 | Icera Inc | Signal fading |
| US8542766B2 (en) * | 2010-05-04 | 2013-09-24 | Samsung Electronics Co., Ltd. | Time alignment algorithm for transmitters with EER/ET amplifiers and others |
| US8819714B2 (en) | 2010-05-19 | 2014-08-26 | Cisco Technology, Inc. | Ratings and quality measurements for digital broadcast viewers |
| US8924200B2 (en) * | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
| US9263049B2 (en) * | 2010-10-25 | 2016-02-16 | Polycom, Inc. | Artifact reduction in packet loss concealment |
| US8774010B2 (en) | 2010-11-02 | 2014-07-08 | Cisco Technology, Inc. | System and method for providing proactive fault monitoring in a network environment |
| US8559341B2 (en) | 2010-11-08 | 2013-10-15 | Cisco Technology, Inc. | System and method for providing a loop free topology in a network environment |
| US8982733B2 (en) | 2011-03-04 | 2015-03-17 | Cisco Technology, Inc. | System and method for managing topology changes in a network environment |
| US8670326B1 (en) | 2011-03-31 | 2014-03-11 | Cisco Technology, Inc. | System and method for probing multiple paths in a network environment |
| US8724517B1 (en) | 2011-06-02 | 2014-05-13 | Cisco Technology, Inc. | System and method for managing network traffic disruption |
| US8830875B1 (en) | 2011-06-15 | 2014-09-09 | Cisco Technology, Inc. | System and method for providing a loop free topology in a network environment |
| US9450846B1 (en) | 2012-10-17 | 2016-09-20 | Cisco Technology, Inc. | System and method for tracking packets in a network environment |
| BR112015017082B1 (pt) * | 2013-02-13 | 2021-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Método de ocultação de erro de quadro com base em quadros incluindo vetores de coeficiente de transformada, meio legível por computador, decodificador, e, terminal de usuário |
| CN110289005B (zh) * | 2013-06-21 | 2024-02-09 | 弗朗霍夫应用科学研究促进协会 | 用于产生舒缓噪声的自适应频谱形状的装置及方法 |
| MY177559A (en) * | 2013-06-21 | 2020-09-18 | Fraunhofer Ges Forschung | Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pitch lag estimation |
| CN108364657B (zh) | 2013-07-16 | 2020-10-30 | 超清编解码有限公司 | 处理丢失帧的方法和解码器 |
| CN105225666B (zh) | 2014-06-25 | 2016-12-28 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
| KR20180026528A (ko) | 2015-07-06 | 2018-03-12 | 노키아 테크놀로지스 오와이 | 오디오 신호 디코더를 위한 비트 에러 검출기 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3102015B2 (ja) * | 1990-05-28 | 2000-10-23 | 日本電気株式会社 | 音声復号化方法 |
| US5550544C1 (en) * | 1994-02-23 | 2002-02-12 | Matsushita Electric Industrial Co Ltd | Signal converter noise shaper ad converter and da converter |
| US5550543A (en) * | 1994-10-14 | 1996-08-27 | Lucent Technologies Inc. | Frame erasure or packet loss compensation method |
-
1995
- 1995-06-07 US US08/482,709 patent/US5699485A/en not_active Expired - Lifetime
-
1996
- 1996-05-27 CA CA002177421A patent/CA2177421C/en not_active Expired - Lifetime
- 1996-05-29 ES ES96303796T patent/ES2161974T3/es not_active Expired - Lifetime
- 1996-05-29 EP EP96303796A patent/EP0747882B1/en not_active Expired - Lifetime
- 1996-05-29 DE DE69613907T patent/DE69613907T2/de not_active Expired - Lifetime
- 1996-05-31 AU AU54641/96A patent/AU709754B2/en not_active Expired
- 1996-06-04 MX MX9602145A patent/MX9602145A/es not_active Application Discontinuation
- 1996-06-05 KR KR1019960020163A patent/KR100389179B1/ko not_active Expired - Fee Related
- 1996-06-07 JP JP18261396A patent/JP3432082B2/ja not_active Expired - Lifetime
Cited By (20)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004501391A (ja) * | 2000-04-24 | 2004-01-15 | クゥアルコム・インコーポレイテッド | 可変レート音声符号器におけるフレーム消去補償方法 |
| JP4870313B2 (ja) * | 2000-04-24 | 2012-02-08 | クゥアルコム・インコーポレイテッド | 可変レート音声符号器におけるフレーム消去補償方法 |
| JP2004508597A (ja) * | 2000-09-05 | 2004-03-18 | フランス テレコム | オーディオ信号における伝送エラーの抑止シミュレーション |
| JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
| WO2003010752A1 (fr) * | 2001-07-26 | 2003-02-06 | Nec Corporation | Appareil d'elargissement de la largeur de bande vocale et procede d'elargissement de la largeur de bande vocale |
| KR100413039B1 (ko) * | 2002-01-16 | 2003-12-31 | 어뮤즈텍(주) | 피치보정방법 및 그 장치 |
| US7684979B2 (en) | 2002-10-31 | 2010-03-23 | Nec Corporation | Band extending apparatus and method |
| JP2008026912A (ja) * | 2004-12-13 | 2008-02-07 | Fraunhofer Ges Zur Foerderung Der Angewandten Forschung Ev | 平方値に線形従属する計算結果の表示を生成する方法 |
| JP2008523450A (ja) * | 2004-12-13 | 2008-07-03 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 平方値に線形従属する計算結果の表示を生成する方法 |
| JP2009503559A (ja) * | 2005-07-22 | 2009-01-29 | フランス テレコム | レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法 |
| JP2010154307A (ja) * | 2008-12-25 | 2010-07-08 | Fujitsu Telecom Networks Ltd | 伝送装置及び音声信号伝送方法 |
| JP2014512028A (ja) * | 2011-04-21 | 2014-05-19 | サムスン エレクトロニクス カンパニー リミテッド | 線形予測係数の量子化装置、サウンド符号化装置、線形予測係数の逆量子化装置、サウンド復号化装置及び電子機器 |
| JP2014519044A (ja) * | 2011-04-21 | 2014-08-07 | サムスン エレクトロニクス カンパニー リミテッド | 線形予測係数量子化方法、サウンド符号化方法、線形予測係数逆量子化方法、サウンド復号化方法、その記録媒体及び電子機器 |
| US9626980B2 (en) | 2011-04-21 | 2017-04-18 | Samsung Electronics Co., Ltd. | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium and electronic device therefor |
| US9626979B2 (en) | 2011-04-21 | 2017-04-18 | Samsung Electronics Co., Ltd. | Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefore |
| US10224051B2 (en) | 2011-04-21 | 2019-03-05 | Samsung Electronics Co., Ltd. | Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefore |
| US10229692B2 (en) | 2011-04-21 | 2019-03-12 | Samsung Electronics Co., Ltd. | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium and electronic device therefor |
| US9972325B2 (en) | 2012-02-17 | 2018-05-15 | Huawei Technologies Co., Ltd. | System and method for mixed codebook excitation for speech coding |
| JP2015515644A (ja) * | 2013-02-15 | 2015-05-28 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | 音声符号化のための混合コードブック励振のためのシステムおよび方法 |
| JP2017134436A (ja) * | 2013-02-15 | 2017-08-03 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | 音声符号化のための混合コードブック励振のためのシステムおよび方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| US5699485A (en) | 1997-12-16 |
| CA2177421C (en) | 2001-02-06 |
| AU709754B2 (en) | 1999-09-09 |
| EP0747882A3 (en) | 1997-09-10 |
| KR970004468A (ko) | 1997-01-29 |
| JP3432082B2 (ja) | 2003-07-28 |
| AU5464196A (en) | 1996-12-19 |
| DE69613907D1 (de) | 2001-08-23 |
| DE69613907T2 (de) | 2002-04-04 |
| EP0747882A2 (en) | 1996-12-11 |
| EP0747882B1 (en) | 2001-07-18 |
| ES2161974T3 (es) | 2001-12-16 |
| MX9602145A (es) | 1997-09-30 |
| KR100389179B1 (ko) | 2003-09-22 |
| CA2177421A1 (en) | 1996-12-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3432082B2 (ja) | フレーム消失の間のピッチ遅れ修正方法 | |
| JPH09120298A (ja) | フレーム消失の間の音声復号に使用する音声の有声/無声分類 | |
| JP3272953B2 (ja) | 適応コードブックに基づく音声圧縮システム | |
| AU2003233724B2 (en) | Method and device for efficient frame erasure concealment in linear predictive based speech codecs | |
| US5495555A (en) | High quality low bit rate celp-based speech codec | |
| JP5519334B2 (ja) | 音声符号化用開ループピッチ処理 | |
| WO2007073604A1 (en) | Method and device for efficient frame erasure concealment in speech codecs | |
| JPH1091194A (ja) | 音声復号化方法及び装置 | |
| JPH09120297A (ja) | フレーム消失の間のコードブック利得減衰 | |
| LeBlanc et al. | An enhanced full rate speech coder for digital cellular applications | |
| MXPA96002142A (en) | Speech classification with voice / no voice for use in decodification of speech during decorated by quad | |
| Hernandez-Gomez et al. | Short-time synthesis procedures in vector adaptive transform coding of speech | |
| CODER | ITU-Tg. 723.1 | |
| MXPA96002143A (en) | System for speech compression based on adaptable codigocifrado, better | |
| HK1076907A (en) | Method and device for efficient frame erasure concealment in linear predictive based speech codecs | |
| HK1076907B (en) | Method and device for efficient frame erasure concealment in linear predictive based speech codecs |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090523 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100523 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100523 Year of fee payment: 7 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100523 Year of fee payment: 7 |
|
| R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100523 Year of fee payment: 7 |
|
| R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 8 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 8 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 10 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| EXPY | Cancellation because of completion of term |