JPH11122120A

JPH11122120A - 符号化方法及び装置、並びに復号化方法及び装置

Info

Publication number: JPH11122120A
Application number: JP9285903A
Authority: JP
Inventors: Yuji Maeda; 祐児前田
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1997-10-17
Filing date: 1997-10-17
Publication date: 1999-04-30
Also published as: KR19990037152A; EP0910066A3; EP0910066A2; US6230124B1; CN1221169A; CN1154283C

Abstract

(57)【要約】【課題】低ビットレート、例えば２ｋｂｐｓ又は４ｋ
ｂｐｓの音声符号化方式により得られた符号化ビット
は、特定のオーディオ情報内容にとらわれない、一般的
なオーディオとして、通信、コンピュータ、放送などの
分野に広く適用されるため、伝送路で発生する誤りに対
して強く保護する必要がある。【解決手段】音声符号化器３は、入力音声信号を時間
軸上で所定の符号化単位で区分して各符号化単位で符号
化を行って複数種類の音声符号化パラメータを出力す
る。ＣＲＣ符号計算部５は、この音声符号化器３からの
複数種類の音声符号化パラメータの内で聴感上重要な重
要ビット群を選択し、この重要ビット群からＣＲＣ検査
符号を生成する。畳み込み符号化器６は、ＣＲＣ符号計
算部５からの上記ＣＲＣ検査符号と上記重要ビット群に
畳み込み符号化を施す。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入力音声信号をブ
ロックやフレームなどの所定の符号化単位で区分して、
区分された符号化単位毎に符号化処理を行うような符号
化方法及び装置、並びにこの符号化された信号を復号化
する復号化方法及び装置に関する。

【０００２】

【従来の技術】オーディオ信号（音声信号や音響信号を
含む）の時間領域や周波数領域における統計的性質と人
間の聴感上の特性を利用して信号圧縮を行うような符号
化方法が種々知られている。この符号化方法として、い
わゆるＣＥＬＰ（Code ExcitedLinear Prediction：符
号励起線形予測）符号化系の符号化方式であるＶＳＥＬ
Ｐ（Vector Sum Excited Linear Prediction：ベクトル
和励起線形予測）符号化方式や、ＰＳＩ−ＣＥＬＰ（Pi
tch Synchronus Innovation - CELP：ピッチ同期雑音励
振源−ＣＥＬＰ）符号化方式等が低ビットレートの音声
符号化方式として近年着目されている。

【０００３】このＣＥＬＰ符号化方式等の波形符号化方
式においては、入力音声信号の所定数のサンプルを符号
化単位としてブロック化あるいはフレーム化し、ブロッ
クあるいはフレーム毎の音声時間軸波形に対して、合成
による分析（analysis by synthesis）法を用いて最適
ベクトルのクローズドループサーチを行うことにより波
形のベクトル量子化を行い、そのベクトルのインデック
スを出力している。

【０００４】

【発明が解決しようとする課題】ところで、上記低ビッ
トレート、例えば２ｋｂｐｓ又は４ｋｂｐｓの音声符号
化方式により得られた符号化ビットは、特定のオーディ
オ情報内容にとらわれない、一般的なオーディオとし
て、通信、コンピュータ、放送などの分野に広く適用さ
れるため、伝送路で発生する誤りに対して強く保護する
必要がある。

【０００５】伝送路で連続的に誤りが発生した場合、音
声復号時に音の欠け等が長い時間にわたり続いてしま
い、音声品質の低下を招いてしまうことになる。

【０００６】本発明は、上記実情に鑑みてなされたもの
であり、伝送路の誤りに強く、品質の低下を改善できる
符号化方法及び装置、並びに復号化方法及び装置の提供
を目的とする。

【０００７】

【課題を解決するための手段】本発明に係る符号化方法
は、上記課題を解決するために、入力音声信号を時間軸
上で所定の符号化単位で区分して各符号化単位で符号化
を行って複数種類の音声符号化パラメータを出力する音
声符号化工程と、上記音声符号化工程からの複数種類の
音声符号化パラメータの内で聴感上重要な重要ビット群
を選択し、この重要ビット群から誤り検査符号を生成す
る誤り検査符号生成工程と、上記誤り検査符号生成工程
からの上記誤り検査符号と上記重要ビット群に畳み込み
符号化を施す畳み込み符号化工程とを備える。このた
め、聴感上重要なビット群を伝送路誤りから保護でき
る。

【０００８】ここで、上記音声符号化工程は、入力音声
信号の短期予測残差を求める短期予測残差算出工程と、
求められた短期予測残差をサイン波分析符号化するサイ
ン波分析符号化工程と、上記入力音声信号を波形符号化
により符号化する波形符号化工程とを備えてなる。

【０００９】そして、上記誤り検査符号生成工程は、上
記短期予測残差算出工程が短期予測残差を求めるときに
生成したパラメータの一部又は全部と、上記サイン波分
析符号化工程の符号化出力の一部又は全部と、上記波形
符号化工程の符号化出力の一部又は全部を上記重要ビッ
ト群として選択し、これらの重要ビット群から誤り検査
符号を生成する。

【００１０】なお、上記短期予測残差算出工程が短期予
測残差を求めるために生成したパラメータとは上記入力
音声信号の周波数スペクトルの概形を形成する線スペク
トル対パラメータであり、上記サイン波分析符号化工程
の符号化出力とは上記入力音声信号が有声音か無声音か
を示す有声音／無声音判定パラメータ、及び上記入力音
声信号が有声音であるときのピッチパラメータ、及び上
記短期予測符号化残差信号のスペクトルエンベロープを
示すスペクトル符号帳インデクス及びゲインインデクス
であり、また上記波形符号化工程の符号化出力とは入力
信号が無声音であるときの短期予測残差に基づいた雑音
符号帳インデクス及びゲインインデクスである。

【００１１】また、本発明に係る符号化装置は、上記課
題を解決するために、入力音声信号を時間軸上で所定の
符号化単位で区分して各符号化単位で符号化を行って複
数種類の音声符号化パラメータを出力する音声符号化手
段と、上記音声符号化手段からの複数種類の音声符号化
パラメータの内で聴感上重要な重要ビット群を選択し、
この重要ビット群から誤り検査符号を生成する誤り検査
符号生成手段と、上記誤り検査符号生成手段からの上記
誤り検査符号と上記重要ビット群に畳み込み符号化を施
す畳み込み符号化手段とを備える。このため、聴感上重
要なビット群を伝送路誤りから保護できる。

【００１２】また、本発明に係る復号化方法は、入力音
声信号を時間軸上で所定の符号化単位で区分し、この符
号化単位で符号化を行って得られる複数種類の音声符号
化パラメータの内で聴感上重要な重要ビット群から生成
した誤り検査符号と、上記重要ビット群とに畳み込み符
号化を施して得た畳み込み符号化出力に、上記重要ビッ
ト群を除いたビット群を接合して伝送されてきた符号化
データを復号化するものであり、上記課題を解決するた
めに、上記畳み込み符号化出力に畳み込み復号化を施
し、上記誤り検査符号が付加されたままの上記重要ビッ
ト群と、上記重要ビット群を除いたビット群とを畳み込
み復号化出力とする畳み込み復号化工程と、上記畳み込
み復号化工程からの畳み込み復号化出力に付加されてい
る上記誤り検査符号を用いて伝送誤りを検査する誤り検
査工程と、上記誤り検査工程での誤り検査結果に応じて
上記畳み込み復号化出力を調整する出力調整工程と、上
記出力調整工程からの畳み込み復号化出力に音声復号化
処理を施す音声復号化工程とを備える。

【００１３】ここで、上記出力調整工程は、上記誤り検
査工程で誤りが検出されたときには、上記畳み込み復号
化出力の代わりに、補間処理により得た補間データを出
力する。

【００１４】また、上記出力調整工程は、上記誤り検査
結果に応じて上記畳み込み復号化出力にバッドフレーム
マスキング処理を施す。

【００１５】また、本発明に係る復号化装置は、入力音
声信号を時間軸上で所定の符号化単位で区分し、この符
号化単位で符号化を行って得られる複数種類の音声符号
化パラメータの内で聴感上重要な重要ビット群から生成
した誤り検査符号と、上記重要ビット群とに畳み込み符
号化を施して得た畳み込み符号化出力に、上記重要ビッ
ト群を除いたビット群を接合して伝送されてきた符号化
データを復号化する装置であり、上記課題を解決するた
めに、上記畳み込み符号化出力に畳み込み復号化を施
し、上記誤り検査符号が付加されたままの上記重要ビッ
ト群と、上記重要ビット群を除いたビット群とを畳み込
み復号化出力とする畳み込み復号化手段と、上記畳み込
み復号化手段からの畳み込み復号化出力に付加されてい
る上記誤り検査符号を用いて伝送誤りを検査し、この検
査結果に応じて上記畳み込み復号化出力を調整する誤り
検査及び出力調整手段と、上記誤り検査及び出力調整手
段からの畳み込み復号化出力に音声復号化処理を施す音
声復号化手段とを備える。

【００１６】

【発明の実施の形態】以下、本発明に係る符号化方法及
び装置、並びに復号化方法及び装置の実施の形態につい
て説明する。

【００１７】この実施の形態は、本発明に係る符号化方
法及び装置、並びに復号化方法及び装置を図１に示すよ
うに、音声符号化器３と伝送路符号化器４とからなる符
号化装置として、並びに伝送路復号化器１４と音声復号
化器１７とからなる復号化装置として用いた携帯電話装
置である。伝送路符号化器４はＣＲＣ符号計算部５と畳
み込み符号化器６からなり、伝送路復号化器１４は畳み
込み復号化器１６とＣＲＣ符号比較部＆フレームマスク
部１５からなる。

【００１８】すなわち、この携帯電話装置において、本
発明に係る符号化方法を適用した符号化装置は、入力音
声信号を時間軸上で所定の符号化単位で区分して各符号
化単位で符号化を行って複数種類の音声符号化パラメー
タを出力する音声符号化器３と、この音声符号化器３か
らの複数種類の音声符号化パラメータの内で聴感上重要
な重要ビット群を選択し、この重要ビット群からＣＲＣ
（Cyclic RedundancyCheck ：巡回冗長チェック）検査
符号を生成するＣＲＣ符号計算部５と、このＣＲＣ符号
計算部５からの上記ＣＲＣ検査符号と上記重要ビット群
に畳み込み符号化を施す畳み込み符号化器６とを備えて
なる。

【００１９】また、この携帯電話装置において、本発明
に係る復号化方法を適用した復号化装置は、入力音声信
号を時間軸上で所定の符号化単位で区分し、この符号化
単位で符号化を行って得られる複数種類の音声符号化パ
ラメータの内で聴感上重要な重要ビット群から生成した
ＣＲＣ検査符号と、上記重要ビット群とに畳み込み符号
化を施して得た畳み込み符号化出力に、上記重要ビット
群を除いたビット群を接合して伝送されてきた符号化デ
ータを復号化する装置であり、上記畳み込み符号化出力
に畳み込み復号化を施し、上記誤り検査符号が付加され
たままの上記重要ビット群と、上記重要ビット群を除い
たビット群とを畳み込み復号化出力とする畳み込み復号
化器１６と、この畳み込み復号化器１６からの畳み込み
復号化出力に付加されている上記ＣＲＣ検査符号と上記
重要ビット群を除いたビット群より計算したＣＲＣ誤り
検査符号とを比較し、その比較結果に応じて上記畳み込
み復号化出力を調整するＣＲＣ符号比較＆フレームマス
ク部１５と、このＣＲＣ符号比較＆フレームマスク部１
５からの畳み込み復号化出力に音声復号化処理を施す音
声復号化器１７とを備えてなる。

【００２０】この携帯電話装置において、送信時には、
マイクロホン１から入力された音声信号を、Ａ／Ｄ変換
器２によりディジタル信号に変換し、音声符号化器３に
より２ｋｂｐｓ／４ｋｂｐｓという低ビットレートの符
号化を施し、伝送路符号化器４により伝送路の品質が音
声品質に影響を受けにくいように符号化した後、変調器
７で変調し、送信機８で出力ビットに送信処理を施し、
アンテナ共用器９を通して、アンテナ１０から送信す
る。

【００２１】また、受信時には、アンテナ１０で捉えた
電波を、アンテナ共用器９を通じて受信機１１で受信
し、復調器１３で復調し、伝送路復号化器１４で伝送路
誤りを訂正し、音声復号化器１７で復号し、Ｄ／Ａ変換
器１８でアナログ音声信号に戻して、スピーカ１９から
出力する。

【００２２】また、制御部２０は上記各部をコントロー
ルし、シンセサイザ１２は送受信周波数を送信機８、及
び受信機１１に与えている。また、キーパッド２１及び
ＬＣＤ表示器２２はマンマシンインターフェースに利用
される。

【００２３】このような構成の携帯電話装置の中で、伝
送路符号化器４を構成するＣＲＣ符号計算部５は、上記
重要ビット群として、上記音声信号の周波数スペクトル
の概形を形成する線スペクトル対（ＬＳＰ）パラメータ
の一部又は全部、上記音声信号が有声音（Voice：Ｖ）
か無声音（Un Voice：ＵＶ）かを示す有声音（Ｖ）／無
声音（ＵＶ）判定パラメータの全部、上記音声信号が有
声音であるときのピッチ（Pith）パラメータの一部又は
全部、同じく上記音声信号が有声音でるあるときの線形
予測符号化（ＬＰＣ）残差信号のスペクトルエンベロー
プを示すスペクトル符号帳インデクス及びゲインインデ
クスの一部又は全部、及び上記音声信号が無声音である
ときの線形予測符号化（ＬＰＣ）残差信号の雑音符号帳
インデクス及びゲインインデクスの一部又は全部を選択
し、これらの重要ビット群からＣＲＣ検査符号を生成す
る。

【００２４】これらの各重要ビット群は、音声符号化器
３により得られる。この音声符号化器３が行う音声符号
化工程は、入力音声信号の短期予測残差を求める短期予
測残差算出工程と、求められた短期予測残差をサイン波
分析符号化するサイン波分析符号化工程と、上記入力音
声信号を波形符号化により符号化する波形符号化工程と
を備えてなる。この音声符号化器３について図２及び図
３を用いて説明する。

【００２５】図２の音声符号化器３の基本的な考え方
は、入力音声信号の短期予測残差例えばＬＰＣ（線形予
測符号化）残差を求めてサイン波分析（sinusoidal ana
lysis）符号化、例えばハーモニックコーディング（har
monic coding ）を行う第１の符号化部１１０と、入力
音声信号に対して位相再現性のある波形符号化により符
号化する第２の符号化部１２０とを有し、入力信号の有
声音（Ｖ：Voiced）の部分の符号化に第１の符号化部１
１０を用い、入力信号の無声音（ＵＶ：Unvoiced）の部
分の符号化には第２の符号化部１２０を用いるようにす
ることである。

【００２６】上記第１の符号化部１１０には、例えばＬ
ＰＣ残差をハーモニック符号化やマルチバンド励起（Ｍ
ＢＥ）符号化のようなサイン波分析符号化を行う構成が
用いられる。上記第２の符号化部１２０には、例えば合
成による分析法を用いて最適ベクトルのクローズドルー
プサーチによるベクトル量子化を用いた符号励起線形予
測（ＣＥＬＰ）符号化の構成が用いられる。

【００２７】図２の例では、入力端子１０１に供給され
た音声信号が、第１の符号化部１１０のＬＰＣ逆フィル
タ１１１及びＬＰＣ分析・量子化部１１３に送られてい
る。ＬＰＣ分析・量子化部１１３から得られたＬＰＣ係
数あるいはいわゆるαパラメータは、ＬＰＣ逆フィルタ
１１１に送られて、このＬＰＣ逆フィルタ１１１により
入力音声信号の線形予測残差（ＬＰＣ残差）が取り出さ
れる。また、ＬＰＣ分析・量子化部１１３からは、後述
するようにＬＳＰ（線スペクトル対）の量子化出力が取
り出され、これが出力端子１０２に送られる。ＬＰＣ逆
フィルタ１１１からのＬＰＣ残差は、サイン波分析符号
化部１１４に送られる。サイン波分析符号化部１１４で
は、ピッチ検出やスペクトルエンベロープ振幅計算が行
われると共に、Ｖ（有声音）／ＵＶ（無声音）判定部１
１５によりＶ／ＵＶの判定が行われる。サイン波分析符
号化部１１４からのスペクトルエンベロープ振幅データ
がベクトル量子化部１１６に送られる。スペクトルエン
ベロープのベクトル量子化出力としてのベクトル量子化
部１１６からのコードブックインデクスは、スイッチ１
１７を介して出力端子１０３に送られ、サイン波分析符
号化部１１４からの出力は、スイッチ１１８を介して出
力端子１０４に送られる。また、Ｖ／ＵＶ判定部１１５
からのＶ／ＵＶ判定出力は、出力端子１０５に送られる
と共に、スイッチ１１７、１１８の制御信号として送ら
れており、上述した有声音（Ｖ）のとき上記インデクス
及びピッチが選択されて各出力端子１０３及び１０４か
らそれぞれ取り出される。

【００２８】図２の第２の符号化部１２０は、この例で
はＣＥＬＰ（符号励起線形予測）符号化構成を有してお
り、雑音符号帳１２１からの出力を、重み付きの合成フ
ィルタ１２２により合成処理し、得られた重み付き音声
を減算器１２３に送り、入力端子１０１に供給された音
声信号を聴覚重み付けフィルタ１２５を介して得られた
音声との誤差を取り出し、この誤差を距離計算回路１２
４に送って距離計算を行い、誤差が最小となるようなベ
クトルを雑音符号帳１２１でサーチするような、合成に
よる分析（Analysis by Synthesis ）法を用いたクロー
ズドループサーチを用いた時間軸波形のベクトル量子化
を行っている。このＣＥＬＰ符号化は、上述したように
無声音部分の符号化に用いられており、雑音符号帳１２
１からのＵＶデータとしてのコードブックインデクス
は、上記Ｖ／ＵＶ判定部１１５からのＶ／ＵＶ判定結果
が無声音（ＵＶ）のときオンとなるスイッチ１２７を介
して、出力端子１０７より取り出される。

【００２９】図３は、上記図２に示した音声符号化器３
のより具体的な構成を示す図である。なお、この図３に
おいて、上記図２の各部と対応する部分には同じ指示符
号を付している。

【００３０】この図３に示された音声符号化器３におい
て、入力端子１０１に供給された音声信号は、ハイパス
フィルタ（ＨＰＦ）１０９にて不要な帯域の信号を除去
するフィルタ処理が施された後、ＬＰＣ（線形予測符号
化）分析・量子化部１１３のＬＰＣ分析回路１３２と、
ＬＰＣ逆フィルタ回路１１１とに送られる。

【００３１】ＬＰＣ分析・量子化部１１３のＬＰＣ分析
回路１３２は、入力信号波形の２５６サンプル程度の長
さを１ブロックとしてハミング窓をかけて、自己相関法
により線形予測係数、いわゆるαパラメータを求める。
データ出力の単位となるフレーミングの間隔は、１６０
サンプル程度とする。サンプリング周波数ｆｓが例えば
８ｋHzのとき、１フレーム間隔は１６０サンプルで２０
ｍsec となる。

【００３２】ＬＰＣ分析回路１３２からのαパラメータ
は、α→ＬＳＰ変換回路１３３に送られて、線スペクト
ル対（ＬＳＰ）パラメータに変換される。これは、直接
型のフィルタ係数として求まったαパラメータを、例え
ば１０個、すなわち５対のＬＳＰパラメータに変換す
る。変換は例えばニュートン−ラプソン法等を用いて行
う。このＬＳＰパラメータに変換するのは、αパラメー
タよりも補間特性に優れているからである。

【００３３】α→ＬＳＰ変換回路１３３からのＬＳＰパ
ラメータは、ＬＳＰ量子化器１３４によりマトリクスあ
るいはベクトル量子化される。このとき、フレーム間差
分をとってからベクトル量子化してもよく、複数フレー
ム分をまとめてマトリクス量子化してもよい。ここで
は、２０ｍsec を１フレームとし、２０ｍsec 毎に算出
されるＬＳＰパラメータを２フレーム分まとめて、マト
リクス量子化及びベクトル量子化している。

【００３４】このＬＳＰ量子化器１３４からの量子化出
力、すなわちＬＳＰ量子化のインデクスは、端子１０２
を介して取り出され、また量子化済みのＬＳＰベクトル
は、ＬＳＰ補間回路１３６に送られる。

【００３５】ＬＳＰ補間回路１３６は、上記２０ｍsec
あるいは４０ｍsec 毎に量子化されたＬＳＰのベクトル
を補間し、８倍のレートにする。すなわち、２．５ｍse
c 毎にＬＳＰベクトルが更新されるようにする。これ
は、残差波形をハーモニック符号化復号化方法により分
析合成すると、その合成波形のエンベロープは非常にな
だらかでスムーズな波形になるため、ＬＰＣ係数が２０
ｍsec 毎に急激に変化すると異音を発生することがある
からである。すなわち、２．５ｍsec 毎にＬＰＣ係数が
徐々に変化してゆくようにすれば、このような異音の発
生を防ぐことができる。

【００３６】このような補間が行われた２．５ｍsec 毎
のＬＳＰベクトルを用いて入力音声の逆フィルタリング
を実行するために、ＬＳＰ→α変換回路１３７により、
ＬＳＰパラメータを例えば１０次程度の直接型フィルタ
の係数であるαパラメータに変換する。このＬＳＰ→α
変換回路１３７からの出力は、上記ＬＰＣ逆フィルタ回
路１１１に送られ、このＬＰＣ逆フィルタ１１１では、
２．５ｍsec 毎に更新されるαパラメータにより逆フィ
ルタリング処理を行って、滑らかな出力を得るようにし
ている。このＬＰＣ逆フィルタ１１１からの出力は、サ
イン波分析符号化部１１４、具体的には例えばハーモニ
ック符号化回路、の直交変換回路１４５、例えばＤＦＴ
（離散フーリエ変換）回路に送られる。

【００３７】ＬＰＣ分析・量子化部１１３のＬＰＣ分析
回路１３２からのαパラメータは、聴覚重み付けフィル
タ算出回路１３９に送られて聴覚重み付けのためのデー
タが求められ、この重み付けデータが後述する聴覚重み
付きのベクトル量子化器１１６と、第２の符号化部１２
０の聴覚重み付けフィルタ１２５及び聴覚重み付きの合
成フィルタ１２２とに送られる。

【００３８】ハーモニック符号化回路等のサイン波分析
符号化部１１４では、ＬＰＣ逆フィルタ１１１からの出
力を、ハーモニック符号化の方法で分析する。すなわ
ち、ピッチ検出、各ハーモニクスの振幅Ａｍの算出、有
声音（Ｖ）／無声音（ＵＶ）の判別を行い、ピッチによ
って変化するハーモニクスのエンベロープあるいは振幅
Ａｍの個数を次元変換して一定数にしている。

【００３９】図３に示すサイン波分析符号化部１１４の
具体例においては、一般のハーモニック符号化を想定し
ているが、特に、ＭＢＥ（Multiband Excitation: マル
チバンド励起）符号化の場合には、同時刻（同じブロッ
クあるいはフレーム内）の周波数軸領域いわゆるバンド
毎に有声音（Voiced）部分と無声音（Unvoiced）部分と
が存在するという仮定でモデル化することになる。それ
以外のハーモニック符号化では、１ブロックあるいはフ
レーム内の音声が有声音か無声音かの択一的な判定がな
されることになる。なお、以下の説明中のフレーム毎の
Ｖ／ＵＶとは、ＭＢＥ符号化に適用した場合には全バン
ドがＵＶのときを当該フレームのＵＶとしている。ここ
で上記ＭＢＥの分析合成手法については、本件出願人が
先に提案した特願平４−９１４２２号明細書及び図面に
詳細な具体例を開示している。

【００４０】図３のサイン波分析符号化部１１４のオー
プンループピッチサーチ部１４１には、上記入力端子１
０１からの入力音声信号が、またゼロクロスカウンタ１
４２には、上記ＨＰＦ（ハイパスフィルタ）１０９から
の信号がそれぞれ供給されている。サイン波分析符号化
部１１４の直交変換回路１４５には、ＬＰＣ逆フィルタ
１１１からのＬＰＣ残差あるいは線形予測残差が供給さ
れている。オープンループピッチサーチ部１４１では、
入力信号のＬＰＣ残差をとってオープンループによる比
較的ラフなピッチのサーチが行われ、抽出された粗ピッ
チデータは高精度ピッチサーチ１４６に送られて、後述
するようなクローズドループによる高精度のピッチサー
チ（ピッチのファインサーチ）が行われる。また、オー
プンループピッチサーチ部１４１からは、上記粗ピッチ
データと共にＬＰＣ残差の自己相関の最大値をパワーで
正規化した正規化自己相関最大値ｒ(p) が取り出され、
Ｖ／ＵＶ（有声音／無声音）判定部１１５に送られてい
る。

【００４１】直交変換回路１４５では例えばＤＦＴ（離
散フーリエ変換）等の直交変換処理が施されて、時間軸
上のＬＰＣ残差が周波数軸上のスペクトル振幅データに
変換される。この直交変換回路１４５からの出力は、高
精度ピッチサーチ部１４６及びスペクトル振幅あるいは
エンベロープを評価するためのスペクトル評価部１４８
に送られる。

【００４２】高精度（ファイン）ピッチサーチ部１４６
には、オープンループピッチサーチ部１４１で抽出され
た比較的ラフな粗ピッチデータと、直交変換部１４５に
より例えばＤＦＴされた周波数軸上のデータとが供給さ
れている。この高精度ピッチサーチ部１４６では、上記
粗ピッチデータ値を中心に、0.２〜0.５きざみで±数サ
ンプルずつ振って、最適な小数点付き（フローティン
グ）のファインピッチデータの値へ追い込む。このとき
のファインサーチの手法として、いわゆる合成による分
析 (Analysis by Synthesis)法を用い、合成されたパワ
ースペクトルが原音のパワースペクトルに最も近くなる
ようにピッチを選んでいる。このようなクローズドルー
プによる高精度のピッチサーチ部１４６からのピッチデ
ータについては、スイッチ１１８を介して出力端子１０
４に送っている。

【００４３】スペクトル評価部１４８では、ＬＰＣ残差
の直交変換出力としてのスペクトル振幅及びピッチに基
づいて各ハーモニクスの大きさ及びその集合であるスペ
クトルエンベロープが評価され、高精度ピッチサーチ部
１４６、Ｖ／ＵＶ（有声音／無声音）判定部１１５及び
聴覚重み付きのベクトル量子化器１１６に送られる。

【００４４】Ｖ／ＵＶ（有声音／無声音）判定部１１５
は、直交変換回路１４５からの出力と、高精度ピッチサ
ーチ部１４６からの最適ピッチと、スペクトル評価部１
４８からのスペクトル振幅データと、オープンループピ
ッチサーチ部１４１からの正規化自己相関最大値ｒ(p)
と、ゼロクロスカウンタ１４２からのゼロクロスカウン
ト値とに基づいて、当該フレームのＶ／ＵＶ判定が行わ
れる。さらに、ＭＢＥの場合の各バンド毎のＶ／ＵＶ判
定結果の境界位置も当該フレームのＶ／ＵＶ判定の一条
件としてもよい。このＶ／ＵＶ判定部１１５からの判定
出力は、出力端子１０５を介して取り出される。

【００４５】ところで、スペクトル評価部１４８の出力
部あるいはベクトル量子化器１１６の入力部には、デー
タ数変換（一種のサンプリングレート変換）部が設けら
れている。このデータ数変換部は、上記ピッチに応じて
周波数軸上での分割帯域数が異なり、データ数が異なる
ことを考慮して、エンベロープの振幅データ｜Ａ_m｜を
一定の個数にするためのものである。すなわち、例えば
有効帯域を３４００ｋHzまでとすると、この有効帯域が
上記ピッチに応じて、８バンド〜６３バンドに分割され
ることになり、これらの各バンド毎に得られる上記振幅
データ｜Ａ_m｜の個数ｍ_MX＋１も８〜６３と変化するこ
とになる。このためデータ数変換部１１９では、この可
変個数ｍ_MX＋１の振幅データを一定個数Ｍ個、例えば４
４個、のデータに変換している。

【００４６】このスペクトル評価部１４８の出力部ある
いはベクトル量子化器１１６の入力部に設けられたデー
タ数変換部からの上記一定個数Ｍ個（例えば４４個）の
振幅データあるいはエンベロープデータが、ベクトル量
子化器１１６により、所定個数、例えば４４個のデータ
毎にまとめられてベクトルとされ、重み付きベクトル量
子化が施される。この重みは、聴覚重み付けフィルタ算
出回路１３９からの出力により与えられる。ベクトル量
子化器１１６からの上記エンベロープのインデクスは、
スイッチ１１７を介して出力端子１０３より取り出され
る。なお、上記重み付きベクトル量子化に先だって、所
定個数のデータから成るベクトルについて適当なリーク
係数を用いたフレーム間差分をとっておくようにしても
よい。

【００４７】次に、第２の符号化部１２０について説明
する。第２の符号化部１２０は、いわゆるＣＥＬＰ（符
号励起線形予測）符号化構成を有しており、特に、入力
音声信号の無声音部分の符号化のために用いられてい
る。この無声音部分用のＣＥＬＰ符号化構成において、
雑音符号帳、いわゆるストキャスティック・コードブッ
ク（stochastic code book）１２１からの代表値出力で
ある無声音のＬＰＣ残差に相当するノイズ出力を、ゲイ
ン回路１２６を介して、聴覚重み付きの合成フィルタ１
２２に送っている。重み付きの合成フィルタ１２２で
は、入力されたノイズをＬＰＣ合成処理し、得られた重
み付き無声音の信号を減算器１２３に送っている。減算
器１２３には、上記入力端子１０１からＨＰＦ（ハイパ
スフィルタ）１０９を介して供給された音声信号を聴覚
重み付けフィルタ１２５で聴覚重み付けした信号が入力
されており、合成フィルタ１２２からの信号との差分あ
るいは誤差を取り出している。なお、聴覚重み付けフィ
ルタ１２５の出力から聴覚重み付き合成フィルタの零入
力応答を事前に差し引いておくものとする。この誤差を
距離計算回路１２４に送って距離計算を行い、誤差が最
小となるような代表値ベクトルを雑音符号帳１２１でサ
ーチする。このような合成による分析（Analysisby Syn
thesis ）法を用いたクローズドループサーチを用いた
時間軸波形のベクトル量子化を行っている。

【００４８】このＣＥＬＰ符号化構成を用いた第２の符
号化部１２０からのＵＶ（無声音）部分用のデータとし
ては、雑音符号帳１２１からのコードブックのシェイプ
インデクスと、ゲイン回路１２６からのコードブックの
ゲインインデクスとが取り出される。雑音符号帳１２１
からのＵＶデータであるシェイプインデクスは、スイッ
チ１２７ｓを介して出力端子１０７ｓに送られ、ゲイン
回路１２６のＵＶデータであるゲインインデクスは、ス
イッチ１２７ｇを介して出力端子１０７ｇに送られてい
る。

【００４９】ここで、これらのスイッチ１２７ｓ、１２
７ｇ及び上記スイッチ１１７、１１８は、上記Ｖ／ＵＶ
判定部１１５からのＶ／ＵＶ判定結果によりオン／オフ
制御され、スイッチ１１７、１１８は、現在伝送しよう
とするフレームの音声信号のＶ／ＵＶ判定結果が有声音
（Ｖ）のときオンとなり、スイッチ１２７ｓ、１２７ｇ
は、現在伝送しようとするフレームの音声信号が無声音
（ＵＶ）のときオンとなる。

【００５０】以上のように構成される音声符号化器３が
出力した各パラメータ、すなわち、ＬＳＰパラメータ、
有声音／無声音判定パラメータ、ピッチパラメータ、ス
ペクトルエンベロープの符号帳パラメータ及びゲインイ
ンデクス、雑音符号帳パラメータ及びゲインインデクス
を２ｋ／４ｋｂｐｓ符号化に分けて示したのが次の表１
である。この表１には、割り当てのビット数も記載して
いる。

【００５１】

【表１】

【００５２】そして、上記伝送路符号化器４は、上記表
１に示した各パラメータの一部又は全部を聴感上重要な
ビット群としてＣＲＣ符号計算部５で選択し、さらにＣ
ＲＣ符号を計算し、このＣＲＣ符号と上記重要ビット群
とを畳み込み符号化器６で畳み込み符号化する。

【００５３】２ｋｂｐｓの場合では、２フレーム４０ms
ec当たりの１２０ビットに対し、表２に示すように、重
要ビット群８０ビットをクラスIとし、その他の４０ビ
ットをクラスIIとする。

【００５４】

【表２】

【００５５】クラスIの８０ビットを基にＣＲＣ符号計
算部５は、ＣＲＣ符号を１４ビット生成する。そして、
畳み込み符号化器６は、クラス１の８０ビットと上記１
４ビットのＣＲＣ符号と、テールビット１０ビットとを
使って畳み込み符号化を行う。

【００５６】この畳み込み符号化器６によって得られた
１０４ビットと、クラスIIの４０ビットの合計１４４ビ
ットに対してビットインターリーブ及び２フレームにわ
たるインターリーブを施して伝送することにより２ｋｂ
ｐｓでの音声符号化を実現できる。なお、実際に伝送す
るときには、他の冗長ビットを付加している。

【００５７】また、４ｋｂｐｓの場合では、表２に示す
ように、重要ビット群１１２ビットをクラスIとし、そ
の他の１０４ビットをクラスIIとする。

【００５８】クラスIの１１２ビットを基にＣＲＣ符号
計算部５は、ＣＲＣ符号を１４ビット生成する。そし
て、畳み込み符号化器６は、クラス１の１１２ビットと
上記１４ビットのＣＲＣ符号と、テールビット１０ビッ
トとを使って畳み込み符号化を行う。

【００５９】この畳み込み符号化器６によって得られた
１３６ビットと、クラスIIの１０４ビットの合計２４０
ビットに対してビットインターリーブ及び２フレームに
わたるインターリーブを施して伝送することにより４ｋ
ｂｐｓでの音声符号化を実現できる。なお、実際に伝送
するときには、他の冗長ビットを付加している。

【００６０】ここで、表３には、２ｋｂｐｓ時の各パラ
メータに対するクラスIとクラスIIとの割り当て例を示
す。クラスIが保護ビット数として割り当てられている
重要ビットであり、クラスIIが非保護ビット数として割
り当てられているビットである。なお、ここでは、１フ
レーム２０msec当たりの割り当て例を示す。

【００６１】

【表３】

【００６２】また、表４には、４ｋｂｐｓ時の各パラメ
ータに対するクラスIとクラスIIとの割り当て例を示
す。

【００６３】

【表４】

【００６４】上記表２及び表３に示した保護ビット／非
保護ビットの割り当て例、すなわち聴感上重要なビット
の割り当て例は、上記音声信号の周波数スペクトルの概
形を形成する線スペクトル対（ＬＳＰ）パラメータの一
部又は全部、上記音声信号が有声音（Voice：Ｖ）か無
声音（Un Voice：ＵＶ）かを示す有声音（Ｖ）／無声音
（ＵＶ）判定パラメータの全部、上記音声信号が有声音
であるときのピッチ（Pith）パラメータの一部又は全
部、同じく上記音声信号が有声音でるあるときの線形予
測符号化（ＬＰＣ）残差信号のスペクトルエンベロープ
を示すスペクトル符号帳インデクス及びゲインインデク
スの一部又は全部、及び上記音声信号が無声音であると
きの線形予測符号化（ＬＰＣ）残差信号の雑音符号帳イ
ンデクス及びゲインインデクスの一部又は全部を対象と
している。

【００６５】携帯電話装置では、通話の品質を維持する
必要上、上記ＬＳＰパラメータの初段ＬＳＰ０は符号帳
より求めた実際のＬＳＰ係数に近時したＬＳＰ周波数で
あり、正確な伝送が望まれるので、保護ビットを総数６
ビットの全てとしている。また、Ｖ／ＵＶ判定パラメー
タであるＶＵＶパラメータはその信号の質を表している
ので総数２ビットの全てを保護している。また、ピッチ
パラメータ（ＰＣＨ）は信号の基本周波数であるので、
総数７ビットの内の６ビットまでを保護している。ま
た、有声音時のＬＰＣ残差信号のスペクトルエンベロー
プを示す符号帳のゲインインデクスは信号の音量（レベ
ル）になっており、正確な伝達が望まれるので、総数５
ビットの全てを保護ビットとしている。

【００６６】つまり、このような重要ビット群は、伝送
路誤りの起きやすい環境下においてある程度通話品質を
維持し、そのビットが誤ることで生じ得る異音の発生を
未然に防止できるという目的で選定される。

【００６７】次に、ＣＲＣ符号計算部５でのＣＲＣ符号
計算と、畳み込み符号化器６での畳み込み符号化の詳細
について説明する。

【００６８】なお、以下の表５と表６には、２ｋｂｐｓ
時のクラスI、４ｋｂｐｓ時のクラスIのＣＲＣ生成多項
式への入力ビット順Ｐ[i]を示す。ここで、各パラメー
タの添え字“ｐ”は１フレーム前のパラメータを示すも
のである。また、ビット０はＬＳＢを示す。１つの項に
２個のパラメータが書かれているのは、上段が有声音
時、下段が無声音時である。

【００６９】

【表５】

【００７０】

【表６】

【００７１】ＣＲＣ符号計算部５は、次の（１）式に示
すＣＲＣ多項式により、１フレーム当たり７ビットのＣ
ＲＣ符号ＣＲＣ[i]を得る。

【００７２】

【数１】

【００７３】但し、

【００７４】

【数２】

【００７５】

【数３】

【００７６】である。

【００７７】上記（２）式において、２ｋｂｐｓ時には
Ｎ＝３９、４ｋｂｐｓ時にはＮ＝５５である。以下、特
にことわりのないときにはこれに従う。

【００７８】そして、上記（１）式〜（３）式により求
めたＣＲＣ符号ＣＲＣ[i]と、上記表５、表６に示した
Ｐ[i]を使って、以下の（４）式に示すように畳み込み
符号化器６の入力ビット列ＣＶin[i]を作成する。

【００７９】

【数４】

【００８０】畳み込み符号化器６は、上記入力ビット列
ＣＶin[i]と上記重要ビット群を入力し、次の（５）
式、（６）式に示す二つの生成多項式により畳み込み符
号化を行う。

【００８１】

【数５】

【００８２】

【数６】

【００８３】この畳み込み符号化器６は、Ｇ₁（Ｄ）か
ら始まり、上記（５）式、（６）式の多項式により交互
に畳み込み符号化を実行する。

【００８４】なお、下記の表７、表８には、２ｋｂｐ
ｓ、４ｋｂｐｓのクラスIIのビット順を示す。この入力
順に、クラスIIのビット群を上記畳み込み符号化器６の
符号化出力と接合して伝送する。

【００８５】

【表７】

【００８６】

【表８】

【００８７】なお、表８に示した４ｋｂｐｓのクラスII
のビット順では、ビット数が１０４と多いため、２フレ
ームセットで並んでいる分の片方だけを示している。実
際には前のフレームと次のフレームのビットが交互に並
べてある。

【００８８】次に、上記復号化装置側では、例えば他の
携帯電話装置の符号化装置からの受信した畳み込み符号
化出力であるビット列を復調した後、畳み込み復号化器
１６で畳み込み復号化し、ＣＲＣ符号比較＆フレームマ
スク部１５でこの畳み込み復号化器１６からの畳み込み
復号化出力に付加されている上記ＣＲＣ検査符号と上記
重要ビット群を除いたビット群より計算したＣＲＣ誤り
検査符号とを比較し、その比較結果に応じて上記畳み込
み復号化出力を調整する。

【００８９】ＣＲＣ符号比較＆フレームマスク部１５
は、畳み込み復号化器１６が実行する上記畳み込み復号
化工程からの畳み込み復号化出力に付加されている上記
誤り検査符号を用いて伝送誤りを検査する誤り検査工程
と、上記誤り検査工程での誤り検査結果に応じて上記畳
み込み復号化出力を調整する出力調整工程とを実行す
る。

【００９０】特に、ＣＲＣ符号が一致しない時には、そ
のフレームのデータを用いて音声復号化を行うと、音声
品質を非常に劣化させるので、誤りの検出の連続する度
合いに応じて、パラメータ置換などの処理を行った後
に、音声復号化器１７に調整出力を供給する。パラメー
タ置換処理としては、バッドフレームマスキング（BadF
rame Masking）処理が考えられる。

【００９１】図４は、バッドフレームマスキング処理に
よる状態遷移図である。ＣＲＣ符号検査工程の結果によ
り、現フレームの状態変数（state）を変更する。各状
態（状態０から状態７）は、矢印で示した方向に遷移す
る。遷移は状態０から始まり、遷移線上の“１”は誤り
フレームの場合の遷移方向を、“０”は誤りのないフレ
ームの場合の遷移方向を表す。

【００９２】通常は、「状態０」でＣＲＣ誤りがないこ
とを示す。例えば、「状態６」には、最低６回連続でＣ
ＲＣ不成立となる場合に遷移する。また、「状態０」で
は何も処理しない。すなわち、通常の復号化が行われ
る。

【００９３】例えば、上記ＬＳＰパラメータを復号する
場合、状態変数stateが「状態１」〜「状態６」である
ときには、ＬＳＰパラメータは１フレーム前のものを用
いる。また、「状態７」のときで、ＬＳＰパラメータが
ストレートモードのときにはＬＳＰ０〜ＬＳＰ５を使っ
て求め、差分モードのときには第０ＬＳＰ符号インデク
スＬＳＰ０のみを使って求める。

【００９４】また、例えば、上記状態変数state変数の
値に応じて、出力音の音量を制御するミュート変数mute
を以下の表９のように設定する。ただし、状態変数stat
e＝７でのmute(p)は１フレーム前のmute変数を示す。

【００９５】

【表９】

【００９６】また、例えば、ＶＵＶ判定パラメータがＶ
であるときには、状態変数state＝１〜６では、スペク
トルパラメータidS0、idS1、スペクトルゲインパラメー
タidG、４ｋｂｐｓ用スペクトルパラメータidS0_４ｋ〜
idS３_４ｋは１フレーム前のものを使う。

【００９７】また、出力音声の音量を制御する意味で残
差信号の周波数スペクトル変数Am[00..44]を次の（７）
式のようにする。ここで、パラメータより求めたAm[i]
をAm₍ _org)[i]とする。

【００９８】

【数７】

【００９９】また、例えば、ＶＵＶ判定パラメータがＵ
Ｖであるときには、状態変数state＝１〜６のとき、雑
音符号帳ゲインパラメータidGL00、idGL01、4kbps用雑
音符号帳ゲインパラメータidGL10〜idGL13は１フレーム
前のものを使う。雑音符号帳パラメータidSL00、idSL0
1、4kbps用雑音符号帳パラメータidSL10〜idSL13は個々
のビット数の範囲で一様乱数を発生させてできたものを
使う。

【０１００】また、出力音声の音量を制御する意味で生
成された残差信号reｓ[00..159]を次の（８）式のよう
にする。ここで、パラメータより求めたres[i]をres
_(org)[i]とする。

【０１０１】

【数８】

【０１０２】このようにしてＣＲＣ符号比較部＆フレー
ムマスク部１５でバッドフレームマスキング処理が施さ
れた畳み込み符号化出力は、音声復号化器１７に供給さ
れる。

【０１０３】この音声復号化器１７の構成を図５及び図
６に示す。ＣＲＣ符号比較部＆フレームマスク部１５か
らは、端子２０２を介して上記図３の端子１０２からの
上記ＬＳＰ（線スペクトル対）の量子化出力に相当する
コードブックインデクスが、端子２０３、２０４、及び
２０５を介して、上記図３の各端子１０３、１０４、及
び１０５からの各出力に相当するエンベロープ量子化出
力としてのインデクス、ピッチ、及びＶ／ＵＶ判定出力
がそれぞれ取り出され、また、端子２０７を介して、上
記図３の端子１０７からの出力に相当するＵＶ（無声
音）用のデータとしてのインデクスが取り出される。さ
らに、ＣＲＣ符号比較部＆フレームマスク部１５でＣＲ
Ｃ検査されて得られたＣＲＣエラー信号は、無声音合成
部２２０に送られている。

【０１０４】端子２０３からのエンベロープ量子化出力
としてのインデクスは、逆ベクトル量子化器２１２に送
られて逆ベクトル量子化され、ＬＰＣ残差のスペクトル
エンベロープが求められて有声音合成部２１１に送られ
る。有声音合成部２１１は、サイン波合成により有声音
部分のＬＰＣ（線形予測符号化）残差を合成するもので
あり、この有声音合成部２１１には端子２０４及び２０
５からのピッチ及びＶ／ＵＶ判定出力も供給されてい
る。有声音合成部２１１からの有声音のＬＰＣ残差は、
ＬＰＣ合成フィルタ２１４に送られる。また、端子２０
７からのＵＶデータのインデクスは、無声音合成部２２
０に送られて、雑音符号帳を参照することにより無声音
部分の励起ベクトルであるＬＰＣ残差が取り出される。
このＬＰＣ残差もＬＰＣ合成フィルタ２１４に送られ
る。ＬＰＣ合成フィルタ２１４では、上記有声音部分の
ＬＰＣ残差と無声音部分のＬＰＣ残差とがそれぞれ独立
に、ＬＰＣ合成処理が施される。あるいは、有声音部分
のＬＰＣ残差と無声音部分のＬＰＣ残差とが加算された
ものに対してＬＰＣ合成処理を施すようにしてもよい。
ここで端子２０２からのＬＳＰのインデクスは、ＬＰＣ
パラメータ再生部２１３に送られて、ＬＰＣのαパラメ
ータが取り出され、これがＬＰＣ合成フィルタ２１４に
送られる。ＬＰＣ合成フィルタ２１４によりＬＰＣ合成
されて得られた音声信号は、出力端子２０１より取り出
される。

【０１０５】次に、図６は、上記図５に示した音声復号
化器１７のより具体的な構成を示している。この図６に
おいて、上記図５の各部と対応する部分には、同じ指示
符号を付している。

【０１０６】この図６において、入力端子２０２には、
上記ＣＲＣ符号比較部＆フレームマスク部１５を介した
図２、３の出力端子１０２からの出力に相当するＬＳＰ
のベクトル量子化出力、いわゆるコードブックのインデ
クスが供給されている。

【０１０７】このＬＳＰのインデクスは、ＬＰＣパラメ
ータ再生部２１３のＬＳＰの逆ベクトル量子化器２３１
に送られてＬＳＰ（線スペクトル対）データに逆ベクト
ル量子化され、ＬＳＰ補間回路２３２、２３３に送られ
てＬＳＰの補間処理が施された後、ＬＳＰ→α変換回路
２３４、２３５でＬＰＣ（線形予測符号）のαパラメー
タに変換され、このαパラメータがＬＰＣ合成フィルタ
２１４に送られる。ここで、ＬＳＰ補間回路２３２及び
ＬＳＰ→α変換回路２３４は有声音（Ｖ）用であり、Ｌ
ＳＰ補間回路２３３及びＬＳＰ→α変換回路２３５は無
声音（ＵＶ）用である。またＬＰＣ合成フィルタ２１４
は、有声音部分のＬＰＣ合成フィルタ２３６と、無声音
部分のＬＰＣ合成フィルタ２３７とを分離している。す
なわち、有声音部分と無声音部分とでＬＰＣの係数補間
を独立に行うようにして、有声音から無声音への遷移部
や、無声音から有声音への遷移部で、全く性質の異なる
ＬＳＰ同士を補間することによる悪影響を防止してい
る。

【０１０８】また、図４の入力端子２０３には、上記Ｃ
ＲＣ符号比較部＆フレームマスク部１５を介した図２、
図３のエンコーダ側の端子１０３からの出力に対応する
スペクトルエンベロープ（Ａｍ）の重み付けベクトル量
子化されたコードインデクスデータが供給され、入力端
子２０４には、上記ＣＲＣ符号比較部＆フレームマスク
部１５を介した上記図２、図３の端子１０４からのピッ
チのデータが供給され、入力端子２０５には、上記ＣＲ
Ｃ符号比較部＆フレームマスク部１５を介した上記図
２、図３の端子１０５からのＶ／ＵＶ判定データが供給
されている。

【０１０９】入力端子２０３からのスペクトルエンベロ
ープＡｍのベクトル量子化されたインデクスデータは、
逆ベクトル量子化器２１２に送られて逆ベクトル量子化
が施され、上記データ数変換に対応する逆変換が施され
て、スペクトルエンベロープのデータとなって、有声音
合成部２１１のサイン波合成回路２１５に送られてい
る。

【０１１０】なお、エンコード時にスペクトルのベクト
ル量子化に先だってフレーム間差分をとっている場合に
は、ここでの逆ベクトル量子化後にフレーム間差分の復
号を行ってからデータ数変換を行い、スペクトルエンベ
ロープのデータを得る。

【０１１１】サイン波合成回路２１５には、入力端子２
０４からのピッチ及び入力端子２０５からの上記Ｖ／Ｕ
Ｖ判定データが供給されている。サイン波合成回路２１
５からは、上述した図２、図３のＬＰＣ逆フィルタ１１
１からの出力に相当するＬＰＣ残差データが取り出さ
れ、これが加算器２１８に送られている。このサイン波
合成の具体的な手法については、例えば本件出願人が先
に提案した、特願平４−９１４２２号の明細書及び図
面、あるいは特願平６−１９８４５１号の明細書及び図
面に開示されている。

【０１１２】また、逆ベクトル量子化器２１２からのエ
ンベロープのデータと、入力端子２０４、２０５からの
ピッチ、Ｖ／ＵＶ判定データとは、有声音（Ｖ）部分の
ノイズ加算のためのノイズ合成回路２１６に送られてい
る。このノイズ合成回路２１６からの出力は、重み付き
重畳加算回路２１７を介して加算器２１８に送ってい
る。これは、サイン波合成によって有声音のＬＰＣ合成
フィルタへの入力となるエクサイテイション（Excitati
on：励起、励振）を作ると、男声等の低いピッチの音で
鼻づまり感がある点、及びＶ（有声音）とＵＶ（無声
音）とで音質が急激に変化し不自然に感じる場合がある
点を考慮し、有声音部分のＬＰＣ合成フィルタ入力すな
わちエクサイテイションについて、音声符号化データに
基づくパラメータ、例えばピッチ、スペクトルエンベロ
ープ振幅、フレーム内の最大振幅、残差信号のレベル等
を考慮したノイズをＬＰＣ残差信号の有声音部分に加え
ているものである。

【０１１３】加算器２１８からの加算出力は、ＬＰＣ合
成フィルタ２１４の有声音用の合成フィルタ２３６に送
られてＬＰＣの合成処理が施されることにより時間波形
データとなり、さらに有声音用ポストフィルタ２３８ｖ
でフィルタ処理された後、加算器２３９に送られる。

【０１１４】次に、図６の入力端子２０７ｓ及び２０７
ｇには、上記図３の出力端子１０７ｓ及び１０７ｇから
のＵＶデータとしてのシェイプインデクス及びゲインイ
ンデクスがそれぞれ供給され、無声音合成部２２０に送
られている。端子２０７ｓからのシェイプインデクス
は、無声音合成部２２０の雑音符号帳２２１に、端子２
０７ｇからのゲインインデクスはゲイン回路２２２にそ
れぞれ送られている。雑音符号帳２２１から読み出され
た代表値出力は、無声音のＬＰＣ残差に相当するノイズ
信号成分であり、これがゲイン回路２２２で所定のゲイ
ンの振幅となり、窓かけ回路２２３に送られて、上記有
声音部分とのつなぎを円滑化するための窓かけ処理が施
される。

【０１１５】窓かけ回路２２３からの出力は、無声音合
成部２２０からの出力として、ＬＰＣ合成フィルタ２１
４のＵＶ（無声音）用の合成フィルタ２３７に送られ
る。合成フィルタ２３７では、ＬＰＣ合成処理が施され
ることにより無声音部分の時間波形データとなり、この
無声音部分の時間波形データは無声音用ポストフィルタ
２３８ｕでフィルタ処理された後、加算器２３９に送ら
れる。

【０１１６】加算器２３９では、有声音用ポストフィル
タ２３８ｖからの有声音部分の時間波形信号と、無声音
用ポストフィルタ２３８ｕからの無声音部分の時間波形
データとが加算され、出力端子２０１より取り出され
る。

【０１１７】この出力端子２０１から取り出された音声
復号化出力は、Ｄ／Ａ変換器１８によりアナログ音声信
号とされ、スピーカ１９から音声として発せられる。

【０１１８】図７及び図８には、上記携帯電話装置が行
う符号化方法と、音声復号化工程をまとめたフローチャ
ートを示す。

【０１１９】すなわち、携帯電話装置の符号化装置側が
実行する音声符号化処理とは、ステップＳ１の音声符号
化工程により入力音声信号を符号化し、ステップＳ２で
ステップＳ１からの複数種類の音声符号化パラメータの
内で聴感上重要な重要ビット群を選択し、この重要ビッ
ト群からＣＲＣ検査符号を計算し、ステップＳ３でステ
ップＳ２で計算したＣＲＣ検査符号と上記重要ビット群
に畳み込み符号化を行う処理である。

【０１２０】また、上記携帯電話装置の復号化装置側が
実行する音声復号化処理とは、ステップＳ１１で他の携
帯電話装置からの畳み込み符号化出力に畳み込み復号化
を施し、ステップＳ１２でステップＳ１１からの畳み込
み復号化出力に付加されているＣＲＣ検査符号を用いて
ＣＲＣ誤り検査を行い、ステップＳ１３でＣＲＣ符号に
エラーが有るときには、ステップＳ１４に進み、バッド
フレームマスキング処理を行い、そして、ステップＳ１
５で音声復号化を行う処理である。

【０１２１】このように、本発明に係る符号化方法及び
装置を適用した伝送路符号化器４と、符号化器３を符号
化装置として送信側に備える携帯電話装置では、伝送路
の誤りに強い符号化データを出力することができる。

【０１２２】また、本発明に係る復号化方法及び装置を
適用した伝送路復号化器と、音声復号化器とを復号化装
置として受信側に備えた携帯電話装置では、伝送路誤り
による品質の低下を抑えた音声を復号できる。

【０１２３】

【発明の効果】本発明に係る符号化方法及び装置は、伝
送路の誤りに強い符号化データを出力することができ
る。

【０１２４】また、本発明に係る復号化方法及び装置
は、伝送路誤りによる品質の低下を抑えた音声を復号で
きる。

【図面の簡単な説明】

【図１】本発明に係る符号化方法及び装置、並びに復号
化方法及び装置の実施の形態となる携帯電話装置の構成
を示すブロック図である。

【図２】上記携帯電話装置を構成する音声符号化器の基
本的な構成を示すブロック図である。

【図３】上記音声符号化器の詳細な構成を示すブロック
図である。

【図４】上記携帯電話装置を構成する伝送路復号化器の
動作を説明するための状態遷移図である。

【図５】上記携帯電話装置を構成する音声復号化器の基
本的な構成を示すブロック図である。

【図６】上記音声復号化器の詳細な構成を示すブロック
図である。

【図７】上記携帯電話装置が行う符号化方法を説明する
ためのフローチャートである。

【図８】上記携帯電話装置が行う復号化方法を説明する
ためのフローチャートである。

【符号の説明】

４伝送路符号化器、５ＣＲＣ符号計算部、６畳み
込み符号化器、１４伝送路復号化器、１５ＣＲＣ符号
比較部＆フレームマスク部、１６畳み込み復号化器

Claims

【特許請求の範囲】

【請求項１】入力音声信号を時間軸上で所定の符号化
単位で区分して各符号化単位で符号化を行って複数種類
の音声符号化パラメータを出力する音声符号化工程と、上記音声符号化工程からの複数種類の音声符号化パラメ
ータの内で聴感上重要な重要ビット群を選択し、この重
要ビット群から誤り検査符号を生成する誤り検査符号生
成工程と、上記誤り検査符号生成工程からの上記誤り検査符号と上
記重要ビット群に畳み込み符号化を施す畳み込み符号化
工程とを備えることを特徴とする符号化方法。
【請求項２】上記音声符号化工程は、入力音声信号の
短期予測残差を求める短期予測残差算出工程と、求めら
れた短期予測残差をサイン波分析符号化するサイン波分
析符号化工程と、上記入力音声信号を波形符号化により
符号化する波形符号化工程とを備えてなることを特徴と
する請求項１記載の符号化方法。
【請求項３】上記誤り検査符号生成工程は、上記短期
予測残差算出工程が短期予測残差を求めるときに生成し
たパラメータの一部又は全部と、上記サイン波分析符号
化工程の符号化出力の一部又は全部と、上記波形符号化
工程の符号化出力の一部又は全部を上記重要ビット群と
して選択し、これらの重要ビット群から誤り検査符号を
生成することを特徴とする請求項２記載の符号化方法。
【請求項４】上記誤り検査符号生成工程は、上記短期
予測残差算出工程が短期予測残差を求めるときに生成し
た線スペクトル対パラメータの一部又は全部、有声音／
無声音判定パラメータの全部、ピッチパラメータの一部
又は全部、上記サイン波分析符号化工程の符号化出力で
ある短期予測残差信号のスペクトルエンベロープゲイン
パラメータの一部又は全部、上記短期予測残差の波形符
号化出力である雑音コードブックゲインパラメータの一
部又は全部を上記重要ビット群として選択し、これらの
重要ビット群から誤り検査符号を生成することを特徴と
する請求項２記載の符号化方法。
【請求項５】上記短期予測残差算出工程が短期予測残
差を求めるために生成したパラメータとは上記入力音声
信号の周波数スペクトルの概形を形成する線スペクトル
対パラメータであり、上記サイン波分析符号化工程の符
号化出力とは上記入力音声信号が有声音か無声音かを示
す有声音／無声音判定パラメータ、及び上記入力音声信
号が有声音であるときのピッチパラメータ、及び上記短
期予測符号化残差信号のスペクトルエンベロープを示す
スペクトル符号帳インデクス及びゲインインデクスであ
り、また上記波形符号化工程の符号化出力とは入力音声
信号が無声音であるときの短期予測残差に基づいた雑音
符号帳インデクス及びゲインインデクスであることを特
徴とする請求項３記載の符号化方法。
【請求項６】上記音声符号化工程は、２ｋ／４ｋｂｐ
ｓの音声符号化を上記入力音声信号に施すことを特徴と
する請求項１記載の符号化方法。
【請求項７】入力音声信号を時間軸上で所定の符号化
単位で区分して各符号化単位で符号化を行って複数種類
の音声符号化パラメータを出力する音声符号化手段と、上記音声符号化手段からの複数種類の音声符号化パラメ
ータの内で聴感上重要な重要ビット群を選択し、この重
要ビット群から誤り検査符号を生成する誤り検査符号生
成手段と、上記誤り検査符号生成手段からの上記誤り検査符号と上
記重要ビット群に畳み込み符号化を施す畳み込み符号化
手段とを備えることを特徴とする符号化装置。
【請求項８】入力音声信号を時間軸上で所定の符号化
単位で区分し、この符号化単位で符号化を行って得られ
る複数種類の音声符号化パラメータの内で聴感上重要な
重要ビット群から生成した誤り検査符号と、上記重要ビ
ット群とに畳み込み符号化を施して得た畳み込み符号化
出力に、上記重要ビット群を除いたビット群を接合して
伝送されてきた符号化データを復号化する復号化方法で
あって、上記畳み込み符号化出力に畳み込み復号化を施し、上記
誤り検査符号が付加されたままの上記重要ビット群と、
上記重要ビット群を除いたビット群とを畳み込み復号化
出力とする畳み込み復号化工程と、上記畳み込み復号化工程からの畳み込み復号化出力に付
加されている上記誤り検査符号を用いて伝送誤りを検査
する誤り検査工程と、上記誤り検査工程での誤り検査結果に応じて上記畳み込
み復号化出力を調整する出力調整工程と、上記出力調整工程からの畳み込み復号化出力に音声復号
化処理を施す音声復号化工程とを備えることを特徴とす
る復号化方法。
【請求項９】上記誤り検査工程は、上記畳み込み符号
化出力の内、上記短期予測残差算出工程が短期予測残差
を求めるときに生成した線スペクトル対パラメータの一
部又は全部、有声音／無声音判定パラメータの全部、ピ
ッチパラメータの一部又は全部、上記サイン波分析符号
化工程の符号化出力である短期予測残差信号のスペクト
ルエンベロープゲインパラメータの一部又は全部、上記
短期予測残差の波形符号化出力である雑音コードブック
ゲインパラメータの一部又は全部を上記重要ビット群と
して選択し、これらの重要ビット群から生成した誤り検
査符号と上記畳み込み符号化出力より得られた上記誤り
検査符号を用いて伝送誤りを検出することを特徴とする
請求項８記載の復号化方法。
【請求項１０】上記出力調整工程は、上記誤り検査工
程で誤りが検出されたときには、上記畳み込み復号化出
力の代わりに、補間処理により得た補間データを出力す
ることを特徴とする請求項８記載の復号化方法。
【請求項１１】上記出力調整工程は、上記誤り検査結
果に応じて上記畳み込み復号化出力にバッドフレームマ
スキング処理を施すことを特徴とする請求項８記載の復
号化方法。
【請求項１２】上記符号化データは、２ｋ／４ｋｂｐ
ｓの音声符号化を上記入力音声信号に施して得られたも
のであることを特徴とする請求項８記載の復号化方法。
【請求項１３】入力音声信号を時間軸上で所定の符号
化単位で区分し、この符号化単位で符号化を行って得ら
れる複数種類の音声符号化パラメータの内で聴感上重要
な重要ビット群から生成した誤り検査符号と、上記重要
ビット群とに畳み込み符号化を施して得た畳み込み符号
化出力に、上記重要ビット群を除いたビット群を接合し
て伝送されてきた符号化データを復号化する復号化装置
であって、上記畳み込み符号化出力に畳み込み復号化を施し、上記
誤り検査符号が付加されたままの上記重要ビット群と、
上記重要ビット群を除いたビット群とを畳み込み復号化
出力とする畳み込み復号化手段と、上記畳み込み復号化手段からの畳み込み復号化出力に付
加されている上記誤り検査符号を用いて伝送誤りを検査
し、この検査結果に応じて上記畳み込み復号化出力を調
整する誤り検査及び出力調整手段と、上記誤り検査及び出力調整手段からの畳み込み復号化出
力に音声復号化処理を施す音声復号化手段とを備えるこ
とを特徴とする復号化装置。