JPH1091193A

JPH1091193A - 音声符号化方法および音声復号方法

Info

Publication number: JPH1091193A
Application number: JP8246443A
Authority: JP
Inventors: Ko Amada; 皇天田; Masami Akamine; 政巳赤嶺
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1996-09-18
Filing date: 1996-09-18
Publication date: 1998-04-10

Abstract

(57)【要約】【課題】計算量が少なくかつ高音質である音声符号化方
法を提供する。【解決手段】適応符号帳１１０から適応符号ベクトルを
ピッチ励振信号として取り出して合成フィルタ１０２に
よりピッチ応答信号を生成し、変換パターン符号帳１０
４から取り出された変換パターンでピッチ応答信号に変
換部１０５により変換を施して変換応答信号を生成す
る。ピッチ応答信号および変換応答信号をゲイン乗算器
１０６，１０７を介して加算器１０９で合成して合成音
声信号１３１を生成し、入力音声信号１３２に対する合
成音声信号１３１の歪が最小となる適応符号ベクトルお
よび変換パターンを符号帳１０１，１０４から探索し
て、合成フィルタ１０２の係数と符号帳１０１，１０４
から探索した適応符号ベクトルおよび変換パターンを示
すインデックスを符号化パラメータとして出力する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、ディジタル電話等
において音声信号を圧縮符号化するための音声符号化方
法および音声復号方法に関する。

【０００２】

【従来の技術】近年、電話帯域の音声を効率良く圧縮符
号化する方法として、ＣＥＬＰ(CodeExcited Linear Pr
ediction)方式が良く用いられている。ＣＥＬＰ方式に
関しては、M.R.Schroeder and B.S.Atal, “Ｃode Exci
ted Linear Prediction (CELP): High Quality Speech
at Very Low Bit Rates,”Proc. ICASSP, pp.937-940,1
985（文献１）、および W.S.Kleijin, D.J.Krasinski e
t al.“Improved Speech Quality and Efficient Vecto
r Quantization in SELP,”Proc.ICASSP, pp155-158,19
88 （文献２）で詳しく述べられている。

【０００３】ＣＥＬＰ方式における主要な符号化パラメ
ータはフィルタ係数、駆動信号、ゲインである。符号化
方式は、いわゆるAnalysis-by-synthesis 、すなわち分
析合成法に基づく方式であるため、エンコーダにデコー
ダがそのまま含まれている。エンコーダでは、前述の符
号化パラメータの値を変えながら、このデコーダを用い
て実際に復号を行い（ローカルデコード）、復号音声と
入力音声の歪みがより小さくなる符号化パラメータの組
合せを探して、これを伝送する。デコーダでは、送られ
てきた符号化パラメータの組合せで復号を行い、復号音
声を得る。

【０００４】典型的なＣＥＬＰ方式によるエンコーダを
図６に、デコーダを図７にそれぞれ示す。まず、図６に
示すエンコーダでは、フレーム単位に分割された音声が
入力端子１０６０に入力され、これを線形予測分析部１
０５０で分析することによって、聴感重み付き合成フィ
ルタ１０３０の係数と聴感重みフィルタ１０４０の係数
を決定する。次に、聴感重みフィルタ１０４０で重み付
けされた重み付き入力音声１０４１と復号音声１０３１
との誤差を誤差評価部１０７０で評価し、この誤差つま
り復号音声１０３１の歪みが最小になるように、適応符
号帳１０１１と雑音符号帳１０１２の符号ベクトルを選
択する。通常、これら二つの符号帳１０１１，１０１２
は逐次探索される。すなわち、まず最初に適応符号帳１
０１１の探索を行って適応符号ベクトルを決定し、次に
雑音符号帳１０１２の探索を行って雑音符号ベクトルを
決定する。最後に、ゲイン乗算器１０２１，１０２２で
適応符号ベクトル、雑音符号ベクトルにそれぞれ乗じる
べきゲインをゲイン符号帳１０１３から求める。ゲイン
乗算器１０２１，１０２２で適応符号ベクトル、雑音符
号ベクトルにゲインを乗じた後、加算器１０２３で足し
合わせて得られる駆動信号で聴感重み付き合成フィルタ
１０３０を駆動することにより、復号音声１０３１が得
られる。

【０００５】そして、線形予測分析部１０５０で生成さ
れＬＰＣ量子化部１０８０で量子化されたＬＰＣ係数
（聴感重み付き合成フィルタ１０３０の係数）と、適応
符号帳１０１１および雑音符号帳１０１２のインデック
ス（駆動信号）およびゲイン符号帳１０１３のインデッ
クス（ゲイン）が符号化パラメータとして出力される。

【０００６】一方、デコーダは図７に示すように図６に
示したエンコーダの一部と同じ構造になっている。エン
コーダから送られてきた符号化パラメータを基に、適応
符号帳２０１１および雑音符号帳２０１２から符号ベク
トル、ゲイン符号帳２０１３からゲインをそれぞれ復号
し、さらにＬＰＣ逆量子化部２０８１で合成フィルタ２
０３５の係数を復号する。ゲイン乗算器２０２１，２０
２２でゲインを乗じた後、加算器２０２３で足し合わせ
て得られた駆動信号で合成フィルタ２０３５を駆動する
ことにより、復号音声が得られる。通常、聴覚的な品質
を向上させるために、復号音声はさらにポストフィルタ
２０９０を通して出力される。

【０００７】ＣＥＬＰ方式は高音質ではあるが、エンコ
ーダで多くの計算量を必要とする方式として知られてい
る。計算量の大半は、適応符号帳１０１１および雑音符
号帳１０１２からの符号ベクトルの探索に費やされてい
る。この探索では適応符号帳１０１１および雑音符号帳
１０１２に格納されている全ての符号ベクトルに対し
て、駆動信号を重み付き合成フィルタ１０３０を通した
後に目標ベクトルに対する歪みを計算するため、フィル
タリングに多くの演算量が必要となる。この演算量をい
かに削減するかが実現上のポイントであった。

【０００８】符号帳１０１１，１０１２のうち、特に適
応符号帳１０１１の探索は計算量の削減がしやすい。適
応符号帳１０１１は、ピッチ成分を表す符号ベクトルを
生成するため、入力信号や過去の復号音声のピッチ周期
を分析することで、おおよそどの符号ベクトルが適して
いるか見当を付けることが可能であるからである。こう
して見当を付けた符号ベクトルとその周辺を探すこと
で、ほぼ最適な符号ベクトルを探索することができる。

【０００９】これに対し、雑音符号帳１０１２の探索は
計算量の削減がしにくい。雑音符号帳１０１２は、適応
符号ベクトルで表し切れなかった、目標ベクトルとのず
れを表す役割がある。したがって、格納されているベク
トルも相関の少ない雑音的な符号ベクトルであり、適応
符号帳１０１１の探索のように見当を付けて探すことが
難しい。

【００１０】そこで、従来より計算量が削減できるよう
に符号帳の構造に手を加えた、いわゆる構造化符号帳が
広く用いられてきている。ＶＳＥＬＰ，ＡＣＥＬＰなど
は、この構造化符号帳を用いて符号化を行う典型的な例
である。しかし、構造化符号帳を用いることは、計算量
の削減には有効であるが、格納する符号ベクトルに制約
を課していることになるため、構造化しない場合に比べ
て音質が劣化する問題があった。

【００１１】

【発明が解決しようとする課題】上述したように、ＣＥ
ＬＰ方式による従来の音声符号化方法では、特に雑音符
号帳からの符号ベクトルの探索に多くの計算を必要とす
るという問題があり、また計算量を削減するため符号帳
の構造化を行うと、音質が劣化するという問題点があっ
た。本発明は、計算量が少なくかつ高音質である音声符
号化方法および音声復号方法を提供することを目的とす
る。

【００１２】

【課題を解決するための手段】上記の課題を解決するた
め、本発明の音声符号化方法では、入力音声信号の分析
結果に基づいて係数が決定される合成フィルタを駆動す
るための過去の駆動信号に基づいて生成される適応符号
ベクトルを格納した適応符号帳から適応符号ベクトルを
取り出してピッチ励振信号とし、このピッチ励振信号を
合成フィルタに通して第１の応答信号を生成する。一
方、複数の変換パターンを格納した変換パターン符号帳
を用意し、この符号帳から取り出される変換パターンで
第１の応答信号に変換を施して第２の応答信号を生成す
る。そして、これら第１および第２の応答信号を合成し
て合成音声信号を生成し、入力音声信号に対する合成音
声信号の歪がより小さくなる適応符号ベクトルおよび変
換パターンを適応符号帳および変換パターン符号帳から
それぞれ探索して、少なくとも合成フィルタの係数の情
報と適応符号帳および変換パターン符号帳から探索した
適応符号ベクトルおよび変換パターンを示す情報を符号
化パラメータとして出力する。

【００１３】この音声符号化方法では、従来方法の畳み
込まれた雑音符号ベクトルに相当する第２の応答信号を
求める際に、第１の応答信号に対して変換パターン符号
帳に格納された変換パターンに従って様々な変換を適用
し、入力音声信号に対する合成音声信号の歪みが最小に
なる変換パターンを探索して、この変換パターンを示す
インデックスを出力する。

【００１４】このようにすることで、従来の雑音符号帳
探索で必要であった雑音符号ベクトルのフィルタリング
演算が不要となる。最適な変換を探索するために増加す
る計算量はフィルタリング演算に比べ僅かなので、全体
として第２の応答信号を従来よりも大幅に少ない計算量
で求めることが可能になる。

【００１５】ここで、変換パターン符号帳に格納される
変換パターンとしては、例えば行列演算が用いられる。
また、最適な変換パターンを探索するための計算を行う
際、この行列の多くの要素を零とし、一部が非零である
ように、例えば各行に非零の要素が５個以下となるよう
に構成する。このようにすると、計算量削減の効果がさ
らに大きくなる。

【００１６】一方、この音声符号化方法に対応する本発
明の音声復号方法では、符号化側からの少なくとも合成
フィルタのフィルタ係数と適応符号ベクトルおよび変換
パターンを示すインデックスを符号化パラメータとして
入力し、適応符号ベクトルを格納した適応符号帳から符
号化パラメータに従って取り出される適応符号ベクトル
をピッチ励振信号として、このピッチ励振信号を前記符
号化パラメータに従って係数が決定される合成フィルタ
に通して第１の応答信号を生成する。また、複数の変換
パターンを格納した変換パターン符号帳から符号化パラ
メータに従って取り出される変換パターンで第１の応答
信号に変換を施して、第２の応答信号を生成する。そし
て、これら第１および第２の応答信号を合成して復号音
声信号を生成する。

【００１７】本発明の音声合成方法は、合成フィルタが
ない構成でもよく、その場合は適応符号帳から適応符号
ベクトルを取り出して第１のピッチ信号とし、変換パタ
ーン符号帳から取り出された変換パターンで第１のピッ
チ信号に変換を施して第２のピッチ信号を生成し、これ
ら第１および第２のピッチ信号を合成して合成音声信号
を生成する。そして、入力音声信号に対する合成音声信
号の歪がより小さくなる適応符号ベクトルおよび変換パ
ターンを適応符号帳および変換パターン符号帳からそれ
ぞれ探索し、少なくとも適応符号帳および変換パターン
符号帳から探索した適応符号ベクトルおよび変換パター
ンを示すインデックスを符号化パラメータとして出力す
る。

【００１８】この音声符号化方法に対応する本発明の音
声復号方法では、符号化側からの少なくとも適応符号ベ
クトルおよび変換パターンを示すインデックスを符号化
パラメータとして入力し、適応符号帳から符号化パラメ
ータに従って取り出される適応符号ベクトルを第１のピ
ッチ信号とし、変換パターン符号帳から符号化パラメー
タに従って取り出される変換パターンで第１のピッチ信
号に変換を施して第２のピッチ信号を生成する。そし
て、これら第１および第２のピッチ信号を合成して復号
音声信号を生成する。

【００１９】

【発明の実施の形態】

（第１の実施形態）図１に、第１の実施形態に係る音声
符号化方法を適用した音声符号化装置の構成を示す。こ
の音声符号化装置は、適応符号帳１０１、合成フィルタ
１０２、この合成フィルタ１０２の逆フィルタである分
析フィルタ１０３、変換パターン符号帳１０４、変換部
１０５、ゲイン乗算器１０６，１０７、利得符号帳１０
８、加算器１０９、線形予測分析部１１０、入力音声信
号１３２の入力端子１１１、減算器１１２、聴感重みフ
ィルタ１１３および評価部１１４から構成される。

【００２０】適応符号帳１０１は、合成フィルタ１０２
を駆動する過去の駆動信号から作られる複数の適応符号
ベクトルを格納している。ここで、駆動信号は入力音声
信号１３２を分析する線形予測分析部１１０によりフィ
ルタ係数が決定される分析フィルタ１０３に合成音声信
号１３１を通すことによって得られる。合成フィルタ１
０２は、同様に線形予測分析部１１０によりフィルタ係
数が決定され、適応符号帳１０１から取り出される適応
符号ベクトルをピッチ励振信号として入力して、ピッチ
応答信号（第１の応答信号）を出力する。

【００２１】変換パターン符号帳１０４は、合成フィル
タ１０２からのピッチ応答信号に施すべき変換を表す複
数の変換パターンを格納しており、変換部１０５は変換
パターン符号帳１０４から取り出された変換パターンで
ピッチ応答信号に変換を施して、変換応答信号（第２の
応答信号）を出力する。

【００２２】合成フィルタ１０２から出力されるピッチ
応答信号および変換部１０５から出力される変換応答信
号は、それぞれゲイン乗算器１０６，１０７により利得
符号帳１０８から与えられるゲインが乗じられた後、加
算器１０９で足し合わせられ、合成音声信号１３１が生
成される。減算器１１２は、この合成音声信号１３１と
入力音声信号１３２との差信号を出力する。聴感重みフ
ィルタ１１３は、この差信号に聴感重み付けを行う。

【００２３】評価部１１４は、聴感重みフィルタ１１３
によって聴感重み付けられた差信号の評価を行い、この
差信号のパワが最小になるように、すなわち、入力音声
信号１３２に対する合成音声信号１３１の聴感重み付き
の歪が最小となるように、適応符号帳１０１、変換パタ
ーン符号帳１０４および利得符号帳１０８の探索を行
う。

【００２４】評価部１１４による探索の結果、利得符号
帳１０８のインデックス１２１、変換パターン符号帳１
０４のインデックス１２２、合成フィルタ１０２のイン
デックス１２３および適応符号帳１０１のインデックス
１２４が得られ、これらのインデックスが符号化パラメ
ータとして出力される。

【００２５】次に、本実施形態における音声符号化処理
の手順を図２に示すフローチャートを用いて説明する。［ステップＳ１］まず、線形予測分析部１１０におい
て、入力端子１１１に所定フレーム長で入力される入力
音声信号１３２を線形予測分析し、合成フィルタ１０
２、分析フィルタ１０３および聴感重みフィルタ１１３
の係数を求める。合成フィルタ１０２の係数は、通常ベ
クトル量子化され、合成フィルタ１０２のインデックス
１２３として出力される。

【００２６】［ステップＳ２］次に、適応符号帳１０１
の探索を行う。すなわち、聴感重みフィルタ１１３で重
み付けした差信号が最小となるピッチ励振信号が出力さ
れるように、適応符号帳１０１から一つの適応符号ベク
トルを探索する。適応符号帳１０１からピッチ励振信号
の候補となる適応符号ベクトルを探索する方法は、当該
技術分野において周知であり、本実施形態においてもそ
の方法を用いることができる。この探索結果は、適応符
号帳１０１のインデックスとして出力される。また、こ
うして求められた最適なピッチ励振信号を合成フィルタ
１０２に通して、ピッチ応答信号を求めておく。

【００２７】［ステップＳ３］次に、変換部１０５にお
いて、変換パターン符号帳１０４に格納されている変換
パターンで示される変換をピッチ応答信号に施して変換
応答信号を作り、ステップＳ２で求められたピッチ応答
信号と合わせた時に聴感重み付きの差信号のパワが最小
になる変換パターンを探索し、探索結果を変換パターン
符号帳１０４のインデックス１２２として出力する。

【００２８】［ステップＳ４］次に、目標ベクトルとの
聴感重み付き誤差が最小になるように、ゲイン乗算器１
０６，１０７で乗じるゲインを利得符号帳１０８から探
索し、その探索結果を利得符号帳１０８のインデックス
１２１として出力する。

【００２９】［ステップＳ５］最後に、入力音声信号１
３２の次のフレームの処理に備えるため、合成音声信号
１３１を分析フィルタ１０３に入力して残差信号を生成
し、この残差信号を用いて適応符号帳１０１の内容を更
新する。

【００３０】次に、本実施形態による効果について述べ
る。従来の雑音符号帳探索では、符号帳に格納されてい
る符号ベクトル全てに対してフィルタによる畳み込み演
算を行う必要があり、この畳み込み演算が計算量増加の
主要な原因になっていた。

【００３１】これに対し、本実施形態ではステップＳ２
の適応符号帳１０１の探索終了時にはピッチ励振信号は
確定しており、これを合成フィルタ１０２で畳み込んだ
ピッチ応答信号を活用することにより、従来の雑音符号
帳探索に相当する計算量を削減できる。すなわち、ステ
ップＳ３に示したようにピッチ応答信号に適当な変換を
施すことで、従来の雑音符号ベクトルの応答に相当する
変換応答信号を作り出すものである。このようにするこ
とで、従来の雑音符号帳探索での畳み込み演算を不要に
し、計算量の大幅な削減が可能になる。

【００３２】次に、本発明の特徴をなす変換パターン符
号帳１０４および変換部１０５について具体的に説明す
る。変換部１０５によりピッチ応答信号に対して施され
る変換の変換パターン、すなわち変換パターン符号帳１
０４に格納されている変換パターンは、例えば行列演算
で表される。合成フィルタ１０２から出力されるピッチ
応答信号を表すべクトルをｐ、変換パターンを表す行列
をＡｉ（ｉ＝１，…，Ｍ、ただしＭは変換パターンの
数）とした場合、変換部１０５から出力される変換応答
信号を表すベクトルｘｉはｘｉ＝Ａｉｐ（１）と表すことができる。

【００３３】評価部１１４により変換部パターン符号帳
１０４の探索を行う際には、全てのＡｉ（ｉ＝１，…，
Ｍ）に対しｘｉを計算して、目標べクトルに対する歪み
を最小にするｘｉを求め、その時のＡｉを最適な変換パ
ターンとして、その変換パターンを表す変換パターン符
号帳１０４のインデックスｉを出力する。

【００３４】ベクトルｘｉとｐは通常、フレーム（また
はサブフレーム）長の次元のベクトルであり、この次元
をＮとすると、ＡｉはＮ＊Ｎの行列になる。従って、こ
の要素が全て非零の要素であると、ｘｉを求める計算量
が大きくなり、従来の雑音符号帳を用い方式に比べた場
合の計算量削減のメリットが低下する。しかし、非零の
要素数を制限する、例えばどの行も非零の要素は５個以
下に制限することによって、変換に必要な計算量を畳み
込み演算の場合と比べて大幅に削減することができる。

【００３５】このことは、変換部１０５から出力される
変換応答信号のバリエーションを制限しているようにも
見えるが、もともとＮ次元ベクトルの変換にＮ＊Ｎの冗
長な行列を用いているため、制限していることにはなら
ない。実際に、非零の要素がＮ個あれば、任意の応答ベ
クトルを生成することが可能である。各行に１つだけ非
零の要素を持ち、その他を零とした場合、ｘｉを求める
変換をＮ回の演算で行うことができ、従来法に比べ計算
量を大幅に削減することができる。

【００３６】数式を用いて説明すると、本実施形態にお
ける変換パターン符号帳１０４の探索は、入力音声信号
１３２から作られる目標ベクトルをｒとした場合、次式
で示される評価値Ｅ＝＜ｒ，ｘｉ＞² ／｜ｘｉ｜² （２）を最大にするｘｉを探索する。この評価値Ｅの値を一回
計算するのに必要な演算量は、（１）式の計算でＮ回、
（２）式の分子でＮ＋１回、分母でＮ回なので、約３Ｎ
回である。

【００３７】これに対し、従来の雑音符号帳探索は合成
フィルタによる畳み込みを行列Ｈ、雑音符号ベクトルを
ｃｉで表すと、Ｅ＝＜ｒ，Ｈｃｉ＞² ／｜Ｈｃｉ｜² （３）を計算する必要がある。この方法では、Ｈｃｉの畳み込
み演算にＮ（Ｎ＋１）／２回の演算が必要であり、分母
と分子の内積でそれぞれＮ回の演算が必要になるため、
合計２Ｎ＋Ｎ（Ｎ＋１）／２回の計算量が必要になる。

【００３８】今、サブフレーム長Ｎ＝４０（５ｍｓｅ
ｃ）で８ビットの符号帳を用いたと仮定すると、雑音符
号帳を用いる従来方式は（２＊４０＋４０＊４１／２）
＊２５６／５ｍｓｅｃ＝４６．１ＭＯＰＳとなるのに対
し、本実施形態では３＊４０＊２５６／５ｍｓｅｃ＝
６．１ＭＯＰＳで変換パターン符号帳１０４の探索を行
うことができ、探索に必要な計算量は従来方式の１／７
以下に低減される。

【００３９】（２）（３）式の評価式は、探索の方法に
よって変わる。例えば直交化探索法を用いた場合は、ｘ
ｉの代わりにこれをピッチ応答ベクトルに対し直交化し
たベクトルｘｉ′を用いればよい。

【００４０】さらに、本実施形態におけるピッチ応答信
号を変換して得られた変換応答信号は、入力音声信号１
３２の性質に合った応答信号となる利点もある。ピッチ
励振信号となる適応符号帳１０１に格納された適応符号
ベクトルは、過去の駆動信号から作られるため、既に符
号化した入力音声信号の性質を反映しているからであ
る。従って、これを変形して得られる変換応答信号には
その性質が残るため、入力音声信号に合った応答信号が
得られ、音質の向上につながるのである。

【００４１】なお、従来の雑音符号帳探索では、複数の
符号帳を備えておき、入力音声信号に応じて切替えて用
いる方法や、入力音声信号のピッチ周期で符号ベクトル
を周期化する方法など、入力音声信号に適応化しようと
する試みはあるが、本実施形態のように自動的に入力音
声信号に合った変換応答信号を生成することは極めて困
難であった。

【００４２】ＣＥＬＰ方式では通常、計算量を削減する
ため、合成音声信号と入力音声信号との差をとる前に、
それぞれの信号に聴感重みフィルタによるフィルタリン
グを施しておくことが多い。本実施形態に関しても、こ
のような工夫を行うことは可能である。図１のブロック
図は、探索の仕組みを理解しやすくするために理論に即
した表記をしたものであり、聴感重みフィルタ１１３の
位置を限定するものではない。

【００４３】ステップＳ４のゲイン探索法も、他に様々
な方法がある。例えば、ステップＳ２でピッチ励振信号
が確定した直後に、ゲイン乗算器１０７で乗じるゲイン
の値を確定し、その後にステップＳ３の処理を行い、ス
テップＳ４ではゲイン乗算器１０６で乗じるゲインの値
を決めるといった具合に、逐次ゲインを確定してゆく方
法をとってもよい。すなわち、ステップＳ４でのゲイン
の確定方法は一例であり、これに限定されるものではな
い。

【００４４】次に、図３を用いて本実施形態に係る音声
復号装置の構成を説明する。本発明は分析合成法に基づ
く音声符号化方法であるため、復号装置は符号化装置に
組み込まれている復号装置（ローカルデコーダ）と同様
である。すなわち、この音声復号装置は適応符号帳２０
１、合成フィルタ２０２、合成フィルタ２０２の逆フィ
ルタ２０３、変換パターン符号帳２０４、変換部２０
５、ゲイン乗算器２０６，２０７、利得符号帳２０８、
加算器２０９、逆量子化部２１０、符号化パラメータの
入力端子２２１，２２２，２２３および２２４により構
成される。

【００４５】図３において、入力端子２２１，２２２，
２２３および２２４には、符号化パラメータとして、図
１の音声符号化装置から出力された利得符号帳１０８の
インデックス１２１、変換パターン符号帳１０４のイン
デックス１２２、合成フィルタ１０２のインデックス１
２３および適応符号帳１０１のインデックス１２４がそ
れぞれ入力される。

【００４６】インデックス１２１は利得符号帳２０８に
与えられ、これに基づき利得符号帳２０８からゲイン乗
算器２０６，２０７にゲインの値が読み出される。イン
デックス１２２は変換パターン符号帳２０４に与えら
れ、これに基づき変換パターンが変換部２０５に与えら
れる。インデックス１２３は逆量子化部２１０を介して
合成フィルタ２０２および逆フィルタ２０３に与えら
れ、これらのフィルタ２０２，２０３の係数が決定され
る。インデックス１２４は適応符号帳２０１に与えら
れ、合成フィルタ２０２に入力されるピッチ励振信号と
なる適応符号ベクトルが選択される。

【００４７】この結果、合成フィルタ２０２から出力さ
れるピッチ応答信号と変換部２０５から出力される変換
応答信号がゲイン乗算器２０６，２０７でゲインを乗じ
られた後、加算器２０９で加算されることによって、復
号音声信号２１１が生成される。この復号音声信号２１
１は、必要に応じて図示しないポストフィルタで聴覚的
に品質が向上するように処理されることがある。

【００４８】（第２の実施形態）図４に、第２の実施形
態に係る音声符号化方法を適用した音声符号化装置を示
す。本実施形態は、第１の実施形態と比較して聴感重み
フィルタの位置が異なっている。

【００４９】第１の実施形態の説明において聴感重みフ
ィルタの位置はどこでも良いと述べたが、本実施形態の
構成をとった場合、第１の実施形態と等価にはならな
い。なぜなら、本実施形態では合成フィルタ１０２から
出力されるピッチ応答信号を聴感重みフィルタ１４１に
通した後に変換を行うのに対し、第１の実施形態ではピ
ッチ応答信号を変換した後に聴感重みフィルタ１１３に
通すからである。一般には、変換とフィルタリングの順
番は入れ換えられないため、等価ではない。等価である
か否かは本発明の効果とは関係がなく、どちらの構成で
も変換パターン符号帳１０４をその構成に合うように設
計すれば良い。なお、本実施形態では合成フィルタ１０
２の出力側に聴感重みフィルタ１４１を設けたことに伴
い、逆フィルタ１０３の入力側に聴感重み逆フィルタ１
４０を設け、さらに入力音声信号も聴感重みフィルタ１
４２を通して減算器１１２に入力している。

【００５０】（第３の実施形態）第１の実施形態では計
算量は削減できるが、変換を表す行列Ａｉのためのメモ
リ量が比較的大きくなる。つまり、各行に非零が１要素
だけとしても２５６候補用意するには、４０＊２５６＝
１０ｋワードのメモリが必要になる。

【００５１】そこで、本実施形態では、変換パターン符
号帳１０４をオーバラップ符号帳、特に非零の要素をオ
ーバラップ構造とすることと、各Ａｉは対角方向に非零
の要素を持つようにすることで、メモリ量を大幅に削減
している。

【００５２】図５に、その様子を摸式的に示す。対角成
分を格納した−本のオーバラップ符号帳のｉ番目の位置
からサブフレーム長のべクトルを切り出し、Ａｉの対角
要素とする。従って、ＡｉとＡｉ＋１はＮ−１個の共通
した要素、すなわち重複した成分を持つことになる。こ
のときのメモリ量は、Ｎ＋Ｍ−１（Ｍは変換パターンの
数）となる。これは第１の実施形態で説明したと同様
に、Ｎ＝４０，Ｍ＝２５６では、０．２９５ｋワードと
なり、より低メモリでの実装が容易となる。

【００５３】なお、ここではオーバラップ符号帳のシフ
ト数を１としたが、シフト数を２以上の値にすることも
可能である。この場合、隣り合う変換行列がＮ−２以下
の重複した要素を持つことになり、これだけ自由度が高
くなるが、メモリ量は若干増加する。

【００５４】また、ここでは変換行列として対角成分の
み値を持ち、この対角成分をオーバラップさせたが、値
を持つ成分を対角方向だけに限定する必要はなく、例え
ば帯状行列としてオーバラップ化することも可能であ
る。

【００５５】なお、ＣＥＬＰ方式には図１および図３に
示したように合成フィルタ１０２，２０２が通常存在す
るが、本発明は合成フィルタを用いない、言い換えれば
合成フィルタの重みが１である場合にも適用することが
できる。

【００５６】合成フィルタを用いない場合、符号化側で
は適応符号帳１０１から取り出した適応符号ベクトルを
第１のピッチ信号とし、変換パターン符号帳１０４から
取り出した変換パターンで第１のピッチ信号を変換した
第２のピッチ信号と合成して合成音声信号を生成すれば
よい。この場合、当然のことながら符号化パラメータに
は合成フィルタのフィルタ係数は含まれない。一方、復
号側においては少なくとも適応符号ベクトルおよび変換
パターンを示すインデックスを符号化パラメータとして
入力し、符号化側と同様に適応符号帳から取り出した適
応符号ベクトルを第１のピッチ信号とし、変換パターン
符号帳から取り出した変換パターンで第１のピッチ信号
を変換した第２のピッチ信号と合成して復号音声信号を
生成すればよい。

【００５７】

【発明の効果】以上説明したように、本発明によれば従
来の雑音符号帳探索に必要であったフィルタリングの演
算が不要になり、低演算量での符号化が可能になるとと
もに、入力音声信号の性質に合った合成音声信号を生成
しやすく、音質が向上するという効果がある。

【図面の簡単な説明】

【図１】本発明の第１の実施形態に係る音声符号化装置
の構成を示すブロック図

【図２】同実施形態の処理手順を示すフローチャート

【図３】同実施形態に係る音声復号装置の構成を示すブ
ロック図

【図４】本発明の第２の実施形態に係る音声符号化装置
の構成を示すブロック図

【図５】本発明における第１の応答信号に施す変換の様
子を模式的に示す図

【図６】従来のＣＥＬＰ方式の音声符号化装置の構成を
示すブロック図

【図７】従来のＣＥＬＰ方式の音声復号化装置の構成を
示すブロック図

【符号の説明】

１０１…適応符号帳１０２…合成フィルタ１０３…分析フィルタ１０４…変換パターン符号帳１０５…変換部１０６，１０７…ゲイン乗算器１０８…利得符号帳１０９…加算器１１０…線形予測分析部１１１…入力端子１１２…減算器１１３，１４１，１４２…聴感重みフィルタ１４０…聴感重み逆フィルタ１１４…評価部１２１…利得符号帳のインデックス１２２…変換パターン符号帳のインデックス１２３…合成フィルタのインデックス１２４…適応符号帳のインデックス１３１…合成音声信号１３２…入力音声信号２１０…逆量子化部２０１〜２０４…入力端子２０１…適応符号帳２０２…合成フィルタ２０３…分析フィルタ２０４…変換パターン符号帳２１０５…変換部２０６，２０７…ゲイン乗算器２０８…利得符号帳２０９…加算器２１０…逆量子化部２１１…復号音声信号信号１０１１…適応符号帳１０１２…雑音符号帳１０１３…ゲイン符号帳１０２１，１０２２，…ゲイン乗算器１０２３…加算器１０３０…聴感重み付き合成フィルタ１０３１…復号音声信号２０３５…合成フィルタ１０４０…聴感重みフィルタ１０４１…聴感重み付き入力音声信号１０５０…線形予測分析部１０６０…入力端子１０７０…誤差評価部１０７１…減算器１０８０…ＬＰＣ量子化部２０１１…適応符号帳２０１２…雑音符号帳２０１３…ゲイン符号帳２０２１，２０２２，…ゲイン乗算器２０２３…加算器２０３５…合成フィルタ２０８１…ＬＰＣ逆量子化部２０９０…ポストフィルタ

Claims

【特許請求の範囲】

【請求項１】入力音声信号の分析結果に基づいて係数が
決定される合成フィルタを駆動するための過去の駆動信
号に基づいて生成される適応符号ベクトルを格納した適
応符号帳から適応符号ベクトルを取り出してピッチ励振
信号とし、このピッチ励振信号を前記合成フィルタに通して第１の
応答信号を生成し、複数の変換パターンを格納した変換パターン符号帳から
取り出された変換パターンで前記第１の応答信号に変換
を施して第２の応答信号を生成し、前記第１および第２の応答信号を合成して合成音声信号
を生成し、前記入力音声信号に対する合成音声信号の歪がより小さ
くなる適応符号ベクトルおよび変換パターンを前記適応
符号帳および変換パターン符号帳からそれぞれ探索し、少なくとも前記合成フィルタの係数と前記適応符号帳お
よび変換パターン符号帳から探索した適応符号ベクトル
および変換パターンを示すインデックスを符号化パラメ
ータとして出力することを特徴とする音声符号化方法。
【請求項２】過去の合成音声信号に基づいて生成される
適応符号ベクトルを格納した適応符号帳から適応符号ベ
クトルを取り出して第１のピッチ信号とし、複数の変換パターンを格納した変換パターン符号帳から
取り出された変換パターンで前記第１のピッチ信号に変
換を施して第２のピッチ信号を生成し、前記第１および第２のピッチ信号を合成して合成音声信
号を生成し、入力音声信号に対する合成音声信号の歪がより小さくな
る適応符号ベクトルおよび変換パターンを前記適応符号
帳および変換パターン符号帳からそれぞれ探索し、少なくとも前記適応符号帳および変換パターン符号帳か
ら探索した適応符号ベクトルおよび変換パターンを示す
インデックスを符号化パラメータとして出力することを
特徴とする音声符号化方法。
【請求項３】前記変換パターン符号帳に格納された複数
の変換パターンは、行列演算で表されることを特徴とす
る請求項１または２に記載の音声符号化方法。
【請求項４】前記行列に非零の成分が５個以下である行
が存在することを特徴とする請求項３に記載の音声符号
化方法。
【請求項５】前記行列が対角行列であり、前記変換パタ
ーン符号帳は、隣り合う行列の対角成分が重複する成分
を持つように構成されていることを特徴とする請求項３
に記載の音声符号化方法。
【請求項６】少なくとも合成フィルタのフィルタ係数と
適応符号ベクトルおよび変換パターンを示すインデック
スを符号化パラメータとして入力し、適応符号ベクトルを格納した適応符号帳から前記符号化
パラメータに従って取り出される適応符号ベクトルをピ
ッチ励振信号として、このピッチ励振信号を前記符号化
パラメータに従って係数が決定される合成フィルタに通
して第１の応答信号を生成し、複数の変換パターンを格納した変換パターン符号帳から
前記符号化パラメータに従って取り出される変換パター
ンで前記第１の応答信号に変換を施して第２の応答信号
を生成し、前記第１および第２の応答信号を合成して復号音声信号
を生成することを特徴とする音声復号化方法。
【請求項７】少なくとも適応符号ベクトルおよび変換パ
ターンを示すインデックスを符号化パラメータとして入
力し、適応符号ベクトルを格納した適応符号帳から前記符号化
パラメータに従って取り出される適応符号ベクトルを第
１のピッチ信号とし、複数の変換パターンを格納した変換パターン符号帳から
前記符号化パラメータに従って取り出される変換パター
ンで前記第１のピッチ信号に変換を施して第２のピッチ
信号を生成し、前記第１および第２のピッチ信号を合成して復号音声信
号を生成することを特徴とする音声復号化方法。