JPH0744200A

JPH0744200A - 音声符号化方式

Info

Publication number: JPH0744200A
Application number: JP5187937A
Authority: JP
Inventors: Kazunori Ozawa; 一範小澤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1993-07-29
Filing date: 1993-07-29
Publication date: 1995-02-14
Anticipated expiration: 2012-06-25
Also published as: JP2624130B2; US5797119A; CA2129161A1; CA2129161C

Abstract

(57)【要約】【目的】比較的少ない演算量およびメモリ量により、伝
送路誤りに敏感でなく、４．８ｋｂ／ｓ以下で音質の良
好な音声符号化方式の提供。【構成】音声信号のサブフレームのスペクトルパラメー
タを求める回路２００と、これを量子化する回路２１０
と、適応コードブックによりサブフレーム毎に音声信号
のピッチ周期を求める回路３００と、音源コードブック
により歪の小さい順に一定個数の音源コードベクトルを
選択する回路３５０と、この音源コードベクトルをピッ
チ周期に等しい遅延を有する一定の次数と重み係数の非
再帰形フイルタに通した後に最良の音源コードベクトル
を選択する回路３５６と、ゲインコードブックにより回
路３５６の出力に対応するゲインコードベクトルを探索
し最良のゲインコードベクトルを選択する回路３６５と
を含んでいる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は音声符号化方式に関し、
特に音声信号を４．８ｋｂ／ｓ以下の低いビットレート
で高品質に符号化するための音声符号化方式に関する。

【０００２】

【従来の技術】音声信号を４．８ｋｂ／ｓ以下の低いビ
ットレートで符号化する方式としては、例えば、エム．
シュレーダー氏とビー．アタル氏（Ｍ．Ｓｃｈｒｏｅｄ
ｅｒａｎｄＢ．Ａｔａｌ）による″コードイクサイ
テドリニアプレデイクション：ハイクオリテイ
スピーチアトベリロウビットレイツ（Ｃｏｄ
ｅ−ｅｘｃｉｔｅｄｌｉｎｅａｒｐｒｅｄｉｃｔｉ
ｏｎ：Ｈｉｇｈｑｕａｌｉｔｙｓｐｅｅｃｈａｔ
ｖｅｒｙｌｏｗｂｉｔｒａｔｅｓ）″（Ｐｒｏ
ｃ．ＩＣＡＳＳＰ，ｐｐ．９３７−９４０，１９８５
年）と題した論文（文献１）や、クレイン（Ｋｌｅｉｊ
ｎ）氏らによる″インプルーブドスピーチクオリテ
イアンドエフイシェントベクトルクワンチゼイ
ションインセルプ（Ｉｍｐｒｏｖｅｄｓｐｅｅｃｈ
ｑｕａｌｉｔｙａｎｄｅｆｆｉｃｉｅｎｔｖｅ
ｃｔｏｒｑｕａｎｔｉｚａｔｉｏｎｉｎＳＥＬ
Ｐ″（Ｐｒｏｃ．ＩＣＡＳＳＰ，ｐｐ．１５５−１５
８，１９８８年）と題した論文（文献２）等に記載され
ているＣＥＬＰ（ＣｏｄｅＥｘｃｉｔｅｄＬＰＣＣ
ｏｄｉｎｇ）が知られている。

【０００３】この方法では、送信側では、フレーム毎
（例えば２０ｍｓ）に音声信号から線形予測（ＬＰＣ）
分析を用いて、音声信号のスペクトル特性を表すスペク
トルパラメータを抽出し、フレームをさらにサブフレー
ム（例えば５ｍｓ）に分割し、サブフレーム毎に過去の
音源信号をもとに適応コードブックにおけるパラメータ
（遅延パラメータとゲインパラメータ）を抽出し、適応
コードブックにより前記サブフレームの音声信号をピッ
チ予測し、ピッチ予測して求めた残差信号に対して、予
め定められた種類の雑音信号からなる音源コードブック
（ベクトル量子化コードブック）から最適音源コードベ
クトルを選択し最適なゲインを計算する。音源コードベ
クトルの選択の仕方は、選択した雑音信号により合成し
た信号と、前記残差信号との誤差電力を最小化するよう
に行なう。そして選択されたコードベクトルの種類を表
すインデクスとゲインならびに、前記スペクトルパラメ
ータと適応コードブックのパラメータを伝送する。受信
側の説明は省略する。

【０００４】

【発明が解決しようとする課題】上述した文献１、２の
従来の音声符号化方式では、ビットレートを低減化する
とコードブックのサイズが小さくなり、特に女性音の音
質が急激に劣化するという問題点があった。

【０００５】この問題点を解決するために、送信側で音
源信号に対してコムフイルタリングを行ない、音源信号
のピッチ性を強調させることにより音質を改善する方法
が提案されている。

【０００６】この方法の詳細は、例えばエス．ワング
（Ｓ．Ｗａｎｇ）氏らによる″インプルーブドイクサ
イテイションフオアフオネテイカリ−セグメンテド
ブイエックスシースピーチコーデイングベロウ
４ｋｂ／ｓ（ＩｍｐｒｏｖｅｄＥｘｃｉｔａｔｉｏ
ｎｆｏｒＰｈｏｎｅｔｉｃａｌｌｙ−Ｓｅｇｍｅｎ
ｔｅｄＶＸＣＳｐｅｅｃｈＣｏｄｉｎｇＢｅｌ
ｏｗ４ｋｂ／ｓ″（Ｐｒｏｃ．ＧＬＯＢＥＣＯＭ，ｐ
ｐ．９４６−９５０，１９９０）と題した論文（文献
３）等を参照できる。

【０００７】文献３の方法を使用すると、音質は改善さ
れるものもあるが、適応コードブックと音源コードブッ
クの両者の探索の時に、全てのコードベクトルにコムフ
イルタリングを施しているので、演算量が膨大になるこ
と、伝送路誤りによりピッチ情報が誤ったときには、受
信側で、大幅な音質劣化が生ずるなどの問題点があっ
た。

【０００８】本発明の目的は、上述した問題点を解決
し、比較的少ない演算量およびメモリ量により、伝送路
誤りに敏感でなく、４．８ｋｂ／ｓ以下で音質の良好な
音声符号化方式を提供することにある。

【０００９】

【課題を解決するための手段】第１の発明の音声符号化
方式は、音声信号を入力し予め定められた時間長のフレ
ームに分割し前記フレームの音声信号をフレームよりも
時間的に短い複数個のサブフレームに分割し少なくとも
一つのサブフレームに対して前記音声信号のスペクトル
的特徴を表すスペクトルパラメータを求めるスペクトル
パラメータ計算手段と、前記スペクトルパラメータを量
子化するスペクトルパラメータ量子化手段と、適応コー
ドブックを使用してサブフレーム毎に音声信号のピッチ
周期を求めるピッチ周期生成手段と、音源コードブック
を使用して歪の小さい順に予め定められた個数の音源コ
ードベクトルを選択する音源量子化手段と、前記予備選
択した音源コードベクトルを前記ピッチ周期に等しい遅
延を有する予め定められた次数と重み係数の非再帰形フ
イルタに通した後に最良の音源コードベクトルを探索選
択するフイルタ手段と、ゲインコードブックを使用して
前記フイルタ手段の出力に対応するゲインコードベクト
ルを探索し最良のゲインコードベクトルを選択するゲイ
ン量子化手段とを含んで構成される。

【００１０】第２の発明の音声符号化方式は、音声信号
を入力し予め定められた時間長のフレームに分割し前記
フレームの音声信号をフレームよりも時間的に短い複数
個のサブフレームに分割し少なくとも一つのサブフレー
ムに対して前記音声信号のスペクトル的特徴を表すスペ
クトルパラメータを求めるスペクトルパラメータ計算手
段と、前記スペクトルパラメータを量子化するスペクト
ルパラメータ量子化手段と、適応コードブックを使用し
てサブフレーム毎に音声信号のピッチ周期を求めるピッ
チ周期生成手段と、音源コードブックを使用して歪の小
さい順に予め定められた個数の音源コードベクトルを選
択する音源量子化手段と、前記予備選択した音源コード
ベクトルを前記ピッチ周期に等しい遅延を有する予め定
められた次数と重み係数の非再帰形フイルタに通すフイ
ルタ手段と、ゲインコードブックを使用して前記フイル
タ手段の各出力に対応するゲインコードベクトルを探索
し最良の音源コードベクトルとゲインコードベクトルの
組み合せを選択するゲイン量子化手段とを含んで構成さ
れる。

【００１１】第３の発明の音声符号化方式は、音声信号
を入力し予め定められた時間長のフレームに分割し前記
フレームの音声信号をフレームよりも時間的に短い複数
個のサブフレームに分割し少なくとも一つのサブフレー
ムに対して前記音声信号のスペクトル的特徴を表すスペ
クトルパラメータを求めるスペクトルパラメータ計算手
段と、前記スペクトルパラメータを量子化するスペクト
ルパラメータ量子化手段と、適応コードブックを使用し
てサブフレーム毎に音声信号のピッチ周期を求めるピッ
チ周期生成手段と、音源コードブックを使用して歪の小
さい順に予め定められた個数の音源コードベクトルを選
択する音源量子化手段と、ゲインコードブックから供給
されるゲインコードベクトルの値から決定された重み係
数を有しかつ前記ピッチ周期に等しい遅延を有する予め
定められた次数の非再帰形フイルタに前記予備選択した
音源コードベクトルを通した後に最良の音源コードベク
トルとゲインコードベクトルの組み合せを選択するフイ
ルタ手段とを含んで構成される。

【００１２】

【作用】本発明による音声符号化方式の作用を説明す
る。

【００１３】音声信号をフレーム（例えば４０ｍｓ）に
分割し、さらに、サブフレーム（例えば８ｍｓ）に分割
する。フレーム毎に音声のスペクトル的特徴を表すスペ
クトルパラメータを計算し量子化する。

【００１４】ピッチ周期生成手段では、サブフレーム毎
に、適応コードブックを使用して音声のピッチ周期に対
応する遅延を計算する。

【００１５】音源量子化手段では、音源コードブックの
探索を行ない、歪の小さい順に複数個（例えばＭ個）の
音源コードベクトルを予備選択する。

【００１６】予備選択された音源コードベクトルの各々
に対して、下式により非再帰形フイルタ（以下ＭＡ形コ
ムフイルタと呼ぶ）に通すことによりコムフイルタリン
グを行なう。

【００１７】ここで、コムフイルタの遅延は、前記ピッ
チ周期に応じた遅延とする。また、コムフイルタの次数
は予め定められた次数とする。以下では、簡単のため
に、次数＝１とし、その場合についてのコムフイルタリ
ングした音源コードベクトルｃ_jz（ｎ）は下式で示され
る。

【００１８】

【００１９】上式で、ｃ_j（ｎ）は予備選択された音源
コードベクトル、ηはＭＡ形コムフイルタの重み係数で
あり、予め定められた値を有する。Ｔはピッチ周期生成
手段において求められた遅延である。

【００２０】予備選択された各音源コードベクトルにつ
いて（１）式によりコムフイルタリングを行ない、コム
フイルタリングされた音源コードベクトルｃ_jz（ｎ）の
中から、次式の歪を最小化する最良の音源コードベクト
ルを１種類選択する。

【００２１】

【００２２】上式で、ｘ_w（ｎ）は後述の聴感重み付け
回路の出力、ｖ（ｎ−Ｔ）はピッチ周期生成手段の出
力、βはピッチ周期生成手段のゲイン、γは音源コード
ブックの最適ゲイン、ｈ_w（ｎ）は聴感重み付け合成フ
イルタのインパルス応答である。

【００２３】次に、ゲイン量子化手段において、ゲイン
コードブックを用いてゲイン（β，γ）を量子化する。

【００２４】第２の発明では、音源コードベクトルを複
数個予備選択し、複数個に対して、各々の音源コードベ
クトルに対してゲインコードベクトルを探索するとき
に、（１）式で音源コードベクトルをコムフイルタリン
グして行なう。

【００２５】つまり、下式の歪を最小化するような、ゲ
インコードベクトルと音源コードベクトルの組を１組選
択する。

【００２６】

【００２７】上式で、（β’_k，γ’_k）はｋ番目のゲ
インコードベクトルである。ここでゲインコードベクト
ルは２次元のものを使用している。

【００２８】第３の発明では、コムフイルタの重み係数
ηとして、第１および第２の発明のように予め定められ
た値を用いるのではなく、ゲインコードブックの探索の
時に、ゲインコードベクトルから得られる値を用いるこ
とを特徴とする。

【００２９】コムフイルタ回路では、下記の歪を最小化
するように、ゲインコードベクトル（β’_k，γ’_k）
と音源コードベクトルｃ_j（ｎ）の組を選択する。

【００３０】

【００３１】ここで、

【００３２】

【００３３】であり、ε・β’_kは、ｋ番目のゲインコ
ードベクトル（β’_k，γ’_k）の第１次目を用いて求
めたコムフイルタの重み係数である。ここで、εは予め
定められた定数である。

【００３４】

【実施例】次に、本発明の実施例について図面を参照し
て説明する。

【００３５】図１は第１の発明の音声符号化方式の一実
施例を示すブロック図である。

【００３６】図１において、入力端子１００から音声信
号を入力し、フレーム分割回路１１０では音声信号をフ
レーム（例えば４０ｍｓ）毎に分割し、サブフレーム分
割回路１２０では、フレームの音声信号をフレームより
も短いサブフレーム（例えば８ｍｓ）に分割する。

【００３７】スペクトルパラメータ計算回路２００で
は、少なくとも一つのサブフレームの音声信号に対し
て、サブフレーム長よりも長い窓（例えば２４ｍｓ）を
かけて音声を切り出してスペクトルパラメータを予め定
められた次数（例えばＰ＝１０次）計算する。

【００３８】スペクトルパラメータは、特に子音、母音
間での過渡区間では時間的に大きく変化するので、短い
時間毎に分析する方が望ましいが、そのようにすると分
析に必要な演算量が増大するため、ここでは、フレーム
中のいずれかＬ個（Ｌ＞１）のサブフレーム（例えばＬ
＝３とし、第１、３、５サブフレーム）に対してスペク
トルパラメータを計算することにする。

【００３９】そして、分析をしなかったサブフレーム
（ここでは第２、４サブフレーム）では、それぞれ、第
１と第３サブフレーム、第３と第５サブフレームのスペ
クトルパラメータを後述のＬＳＰ上で直線補間したもの
をスペクトルパラメータとして使用する。

【００４０】ここでスペクトルパラメータの計算には、
周知のＬＰＣ分析や、Ｂｕｒｇ分析等を用いることがで
きる。ここでは、Ｂｕｒｇ分析を用いることとする。Ｂ
ｕｒｇ分析の詳細については、中溝著による″信号解析
とシステム同定″と題した単行本（コロナ社１９８８年
刊）の８２〜８７頁（文献４）に記載されているので説
明は略する。

【００４１】さらにスペクトルパラメータ計算回路２０
０では、Ｂｕｒｇ法により計算された線形予測係数α_i
（ｉ＝１〜１０）を量子化や補間に適したＬＳＰパラメ
ータに変換する。ここで、線形予測係数からＬＳＰへの
変換は、菅村他による″線スペクトル対（ＬＳＰ）音声
分析合成方式による音声情報圧縮″と題した論文（電子
通信学会論文誌、Ｊ６４−Ａ、ｐｐ．５９９−６０６、
１９８１年）（文献５）を参照することができる。

【００４２】つまり、第１、３、５サブフレームでＢｕ
ｒｇ法により求めた線形予測係数をＬＳＰパラメータに
変換し、第２、４サブフレームのＬＳＰを直線補間によ
り求めて、第２、４サブフレームのＬＳＰを逆変換して
線形予測係数に戻し、第１〜５サブフレームの線形予測
係数α_il（ｉ＝１〜１０，ｌ＝１〜５）を聴感重み付け
回路２３０に出力する。また第１〜５サブフレームのＬ
ＳＰをスペクトルパラメータ量子化回路２１０へ出力す
る。

【００４３】スペクトルパラメータ量子化回路２１０で
は、ＬＳＰコードブック２１１を使用して、予め定めら
れたサブフレームのＬＳＰパラメータを効率的に量子化
する。以下では、量子化法として、ベクトル量子化を用
いるものとし、第５サブフレームのＬＳＰパラメータを
量子化するものとする。

【００４４】ＬＳＰパラメータのベクトル量子化の手法
は周知の手法を用いることができる。具体的な方法は、
例えば、特開平４−１７１５００（文献６）や特開平４
−３６３０００（文献７）や、特開平５−６１９９（文
献８）や、野村氏他による「ＬＳＰパラメータの効率的
な量子化、補間法の検討」（電子情報通信学会秋季全
大、１９９３年９月）と題した論文（文献９）等を参照
できるのでここでは説明は略する。

【００４５】また、スペクトルパラメータ量子化回路２
１０では、第５サブフレームで量子化したＬＳＰパラメ
ータをもとに、第１〜第４サブフレームのＬＳＰパラメ
ータを復元する。ここでは、現フレームの第５サブフレ
ームの量子化ＬＳＰパラメータと１つ過去のフレームの
第５サブフレームの量子化ＬＳＰを直線補間して、第１
〜第４サブフレームのＬＳＰを復元する。

【００４６】ここで、量子化前のＬＳＰと量子化後のＬ
ＳＰとの誤差電力を最小化するコードベクトルをＬＳＰ
コードブック２１１から１種類選択した後に、直線補間
により第１〜第４サブフレームのＬＳＰを復元できる。
さらに性能を向上させるためには、前記誤差電力を最小
化するコードベクトルを複数候補選択したのちに、各々
の候補について、累積歪を評価し、累積歪を最小化する
候補と補間ＬＳＰの組を選択するようにすることができ
る。

【００４７】以上により復元した第１〜４サブフレーム
のＬＳＰと第５サブフレームの量子化ＬＳＰをサブフレ
ーム毎に線形予測係数α’_il（ｉ＝１〜１０，ｌ＝１〜
５）に変換し、インパルス応答計算回路３１０へ出力す
る。また、第５サブフレームの量子化ＬＳＰのコードベ
クトルを表すインデクスをマルチプレクサ４００に出力
する。

【００４８】上記において、直線補間のかわりに、ＬＳ
Ｐの補間パターンを予め定められたビット数（例えば２
ビット）分用意しておき、これらのパターンの各々に対
して１〜４サブフレームのＬＳＰを復元して累積歪を最
小化するコードベクトルと補間パターンの組を選択する
ようにしてもよい。このようにすると補間パターンのビ
ット数だけで伝送情報が増加するが、ＬＳＰのフレーム
内での時間的な変化をより精密に表すことができる。

【００４９】ここで、補間パターンは、トレーニング用
のＬＳＰデータを用いて予め学習して作成してもよい
し、予め定められたパターンを格納しておいてもよい。
予め定められたパターンとしては、例えば、テー．タニ
グチ他（Ｔ．Ｔａｎｉｇｕｃｈｅｔａｌ）による″イ
ンプルーブドセルプスピーチコーデイングアト
４ｋｂ／ｓアンドべロウ（ＩｍｐｒｏｖｅｄＣＥ
ＬＰｓｐｅｅｃｈｃｏｄｉｎｇａｔ４ｋｂ／ｓ
ａｎｄｂｅｌｏｗ）″と題した論文（Ｐｒｏｃ．ＩＣ
ＳＬＰ，ｐｐ．４１−４４，１９９２）（文献１０）等
に記載のパターンを用いることができる。

【００５０】またさらに、性能を改善するためには、補
間パターンを選択した後に、予め定められたサブフレー
ムにおいて、ＬＳＰの真の値とＬＳＰの補間値との誤差
信号を求め、前記誤差信号をさらに誤差コードブックで
表すようにしてもよい。詳細は、前記文献９等を参照で
きる。

【００５１】モード分類回路２５０では、モード分類を
行なうときの特徴量として、スペクトルパラメータの予
測誤差電力を用いる。スペクトルパラメータ計算回路２
００により計算された線形予測係数を５サブフレーム分
入力し、ｋパラメータに変換し、５サブフレーム分の累
積予測誤差電力Ｅを計算する。Ｅの値を予め定められた
しきい値と比較して、複数種類のモードに分類する。例
えば、Ｅの小さい順にモード０〜３の４種類のモードに
分類するときは、３種類のしきい値と比較することによ
り行なう。

【００５２】そして、得られたモード情報をピッチ周期
生成回路３００へ出力すると共に、モード情報を表すイ
ンデクス（４種類のモード情報のときは２ビット）をマ
ルチプレクサ４００へ出力する。

【００５３】聴感重み付け回路２３０は、スペクトルパ
ラメータ計算回路２００から、各サブフレーム毎に量子
化前の線形予測係数α_il（ｉ＝１〜１０，ｌ＝１〜５）
を入力し、サブフレームの音声信号に対して聴感重み付
けを行ない、聴感重み付け信号を出力する。

【００５４】応答信号計算回路２４０は、スペクトルパ
ラメータ計算回路２００から、各サブフレーム毎に線形
予測係数α_ilを入力し、スペクトルパラメータ量子化回
路２１０から、量子化、補間して復元した線形予測係数
α’_ilをサブフレーム毎に入力し、保存されているフイ
ルタメモリの値を用いて、入力信号ｄ（ｎ）＝０とした
応答信号を１サブフレーム分計算し、減算器２３５へ出
力する。ここで、応答信号ｘ_z（ｎ）は下式で表され
る。

【００５５】

【００５６】ここで、γは聴感重み付け量を制御する重
み係数であり、下記の（８）式のγと同一の値である。
また、ｙ（ｎ）は聴感重み付け合成フイルタの出力信号
である。

【００５７】減算器２３５は、下式により、聴感重み付
け信号から応答信号を１サブフレーム分減算したｘ_w’
（ｎ）をピッチ周期生成回路３００へ出力する。

【００５８】

【００５９】インパルス応答計算回路３１０は、ｚ変換
が下式で表される聴感重み付け合成フイルタのインパル
ス応答ｈ_w（ｎ）を予め定められた点数Ｌだけ計算し、
ピッチ周期生成回路３００、音源量子化回路３５０へ出
力する。

【００６０】

【００６１】ピッチ周期生成回路３００は、適応コード
ブックを使用して、モード分類回路２５０からのモード
情報を入力し、予め定められたモード（例えばモード１
〜３）のときのみピッチパラメータを求める。そして、
求めたサブフレーム毎の遅延値に対応するインデクスを
マルチプレクサ４００に出力する。

【００６２】音源量子化回路３５０は、減算器２３５の
出力信号、ピッチ周期生成回路３００の出力信号、イン
パルス応答計算回路３１０の出力信号を入力し、音源コ
ードブックの探索を行なう。ここで、音源コードブック
の段数は２とし、図１では２段のベクトル量子化コード
ブックを音源コードブック３５１₁〜３５１₂として表
している。各段のコードベクトルの探索は（９）式を最
小化するように行なう。

【００６３】

【００６４】ただし、ｘ’_w（ｎ）は減算器２３５の出
力信号である。βはピッチ周期生成回路３００のゲイ
ン、ｑ（ｎ）はピッチ周期生成回路３００の出力信号で
ある。

【００６５】なお、モード０ではピッチ周期生成回路３
００を使用しないため、（９）式のかわりに（１０）式
を最小化するコードベクトルを探索する。

【００６６】

【００６７】ここで、γ₁、γ₂はそれぞれ、１段目、
２段目の音源コードブックの最適ゲインである。

【００６８】（９）式、（１０）式を最小化するための
１段目、２段目のコードベクトルの探索法は種々ある
が、ここでは、探索に要する演算量を低減化するため
に、１段目、２段目から複数種類（Ｍ）の候補を選択
し、選択後に、１、２段目の候補のＭ＊Ｍの組み合わせ
探索を行ない、（９）式の歪を最小化する候補の組み合
わせを複数個（Ｌ）選択し出力する。具体的な探索法は
前記文献７を参照できる。また、１段目、２段目の音源
コードベクトルは、前述の探索法を考慮して、予め多量
の音声データベースを用いて設計しておく。具体的な設
計法は、前記文献７を参照できる。

【００６９】次に、コムフイルタ回路３５６では、モー
ド１〜３において、選択されたＬ個の音源コードベクト
ル候補の各々に対して、（１）式に従い、ＭＡ形コムフ
イルタを通す。以下の説明では、コムフイルタの次数を
１とする。また、コムフイルタの重み係数は、予め定め
られた値を用いるが、モード毎に異なる値を用いること
もできる。

【００７０】音源コードベクトルの各々に対して、コム
フイルタを通した信号ｃ_jz（ｎ）を用いて下式の歪を評
価し、歪を最小化する音源コードベクトルを１種選択し
出力する。

【００７１】

【００７２】以上により決定された１段目、２段目のコ
ードベクトルのインデクスＩ_c1、Ｉ_c2をマルチプレクサ
４００に出力する。

【００７３】ゲイン量子化回路３６５は、ゲインコード
ブック３５５の探索、ゲインの量子化を行なう。ゲイン
コードブック３５５は、ピッチ周期生成回路３００を使
用するモード１〜３では、音源コードブックの決定され
たインデクスを用いて下式を最小化するようにゲインコ
ードブック３５５を使用してゲインコードベクトルを探
索する。

【００７４】

【００７５】ここで、β’_k、γ’_1k、γ’_2kは、それ
ぞれ、適応コードベクトル、１段目、２段目の音源コー
ドベクトルの量子化されたゲインを示す。ここで、
（β’_k，γ’_1k，γ’_2k）はそのｋ番目のコードベク
トルである。

【００７６】（１２）式を最小化するには、例えば、全
てのゲインコードベクトル（ｋ＝０，……，２^B−１）
に対して（１２）式を計算し、（１２）式を最小化する
ゲインコードベクトルを求めてもよいし、ゲインコード
ベクトルの候補を複数種類予備選択しておき、その複数
種類のなかから、（１２）式を最小化するものを選択し
てもよい。

【００７７】ゲインコードベクトル決定後、選択された
ゲインコードベクトルを示すインデクスＩ_gを出力す
る。一方、ピッチ周期生成回路３００を用いないモード
では、下式を最小化するようにゲインコードブック３５
５を探索する。ここでは２次元のゲインコードブックを
使用する。

【００７８】

【００７９】重み付け信号計算回路３６０は、スペクト
ルパラメータ計算回路２００の出力パラメータおよび、
それぞれのインデクスを入力し、インデクスからそれに
対応するコードベクトルを読みだし、まず下式にもとづ
き駆動音源信号ｖ（ｎ）を求める。

【００８０】

【００８１】ただし、ピッチ周期生成回路３００を使用
しないモードでは、β’＝０とする。

【００８２】次に、スペクトルパラメータ計算回路２０
０の出力パラメータ、スペクトルパラメータ量子化回路
２１０の出力パラメータを用いて下式により、重み付け
信号ｓ_w（ｎ）をサブフレーム毎に計算し、応答信号計
算回路２４０へ出力する。

【００８３】

【００８４】ここでｐ（ｎ）は聴感重み付け合成フイル
タの出力信号である。

【００８５】以上により第１の発明に対応する実施例の
説明を終える。

【００８６】図２は第２の発明の音声符号化方式の一実
施例を示すブロック図である。図１の実施例と同一の参
照番号を付した構成要素は、図１と同様の動作を行なう
ので説明を省略する。

【００８７】図２において、コムフイルタ回路３５７
は、モード１〜３では、音源コードベクトルのＬ個の候
補の各々に対して、（１）式に従いＭＡ形コムフイリタ
リングを行ない、Ｌ個のコムフイリタリングされた信号
をゲイン量子化回路３６６に出力する。モード０ではコ
ムフイルタリングは行なわない。ここで、モード１〜３
でのコムフイルタの重み係数は、予め定められた値を用
いるが、モード毎に異なる値を用いることもできる。

【００８８】ゲイン量子化回路３６６は、モード１〜３
では、Ｌ個のコムフイルタリングされた信号の各々に対
して、下式を最小化するように３次元のゲインコードブ
ック３５５を使用してゲインコードベクトルを探索す
る。

【００８９】

【００９０】ここで、β’_k、γ’_1k、γ’_2kは、それ
ぞれ、適応コードベクトル、１段目、２段目の音源コー
ドベクトルの量子化されたゲインを示す。ここで、
（β’_k，γ’_1k，γ’_2k）はそのｋ番目のコードベク
トルである。

【００９１】（１６）式を最小化するには、例えば、全
てのゲインコードベクトル（ｋ＝０，……，２^B−１）
に対して（１６）式を計算し、（１６）式を最小化する
ゲインコードベクトルを求めてもよいし、ゲインコード
ベクトルの候補を予め複数種類予備選択しておき、その
複数種類のなかから、（１６）式を最小化するものを選
択してもよい。

【００９２】（１６）式をＬ個の信号に対して繰り返
し、歪を最小化する信号ｃ_z（ｎ）とゲインコードベク
トルとの組み合わせを１種類選択し出力する。

【００９３】一方、ピッチ周期生成回路３００を用いな
いモードでは、下式を最小化するようにゲインコードブ
ック３５５を探索する。ここでは２次元のゲインコード
ブックを使用する。

【００９４】

【００９５】以上で、第２の発明の実施例の説明を終了
する。

【００９６】図３は第３の発明の音声符号化方式の一実
施例を示すブロック図である。図１の実施例と同一の参
照番号を付した構成要素は、図１と同様の動作を行なう
ので説明を省略する。

【００９７】コムフイルタ回路３５８は、モード１〜３
では、音源コードベクトルのＬ個の候補の各々に対し
て、（１）式に従いＭＡ形コムフイルタリングを行なう
が、このときに、ゲインコードブック３５５からゲイン
コードベクトルを入力して、ゲインコードベクトルから
得られる値を用いてコムフイルタの重み係数を求め、
（５）式により、Ｌ個の音源コードベクトルの各々に対
してコムフイルタリングを行ない、ｃ_j’_z（ｎ）を求
める。ここで、（５）式のεは、予め定められた定数で
あり、モードによらず一定値としてもよいし、モード毎
に異なる値としてもよい。

【００９８】

【００９９】コムフイルタリングをしたＬ個の信号の各
々に対して、（１８）式を最小化するように、ゲインコ
ードベクトルを求め、それらの中から、（１８）式の歪
が最も小さいゲインコードベクトルと音源コードベクト
ルとの組み合わせを１種類選択し、マルチプレクサ４０
０へ出力する。

【０１００】重み付け信号計算回路３６１は、スペクト
ルパラメータ計算回路２００の出力パラメータおよびそ
れぞれのインデクスを入力し、インデクスからそれに対
応するコードベクトルを読みだし、まず、下式にもとづ
き駆動音源信号ｖ（ｎ）を求める。

【０１０１】

【０１０２】ただし、ピッチ周期生成回路３００を使用
しないモードでは、β’＝０とする。

【０１０３】以上により、第３の発明の実施例の説明を
終了する。

【０１０４】本発明の意向を損なうことなく、上述した
実施例以外にも種々の変形が可能である。

【０１０５】スペクトルパラメータはＬＳＰ以外にも他
の周知なパラメータを用いることができる。

【０１０６】スペクトルパラメータ計算回路２００では
フレーム中で少なくとも１つのサブフレームでスペクト
ルパラメータを計算するときに、前のサブフレームと現
在のサブフレームとのＲＭＳの変化あるいはパワの変化
を測定し、これらの変化が大きな複数個のサブフレーム
に対してスペクトルパラメータを計算するようにしても
よい。このようにすると、音声の変化点では必ずスペク
トルパラメータを分析することになり、分析するサブフ
レーム数を低減しても性能の劣化を防ぐことができる。

【０１０７】スペクトルパラメータの量子化には、ベク
トル量子化、スカラ量子化、ベクトル−スカラ量子化な
ど周知な方法を用いることができる。

【０１０８】スペクトルパラメータ量子化回路２１０に
おける補間パターンの選択には、他の周知な距離尺度を
用いることができる。

【０１０９】モード分類回路２５０における特徴量は、
他の周知なものを用いることができる。例えば、ピッチ
予測による予測ゲインを用いることができる。

【０１１０】ピッチ周期生成回路３００ならびにコムフ
イルタ回路３５６、３５７および３５８における遅延
は、整数値でも小数値でもよい。

【０１１１】また、音源量子化回路３６０において、
（９）〜（１７）式で、ゲインγ₁とγ₂を同一とする
こともできる。このときは、ゲインコードブック３５５
はピッチ周期生成回路３００を用いるモードでは、
（β’，γ’）の２次元ゲインとなり、ピッチ周期生成
回路３００を用いないモードでは（γ’）の１次元ゲイ
ンとなる。

【０１１２】また、モード毎に、音源コードブックの段
数、あるいは各段の音源コードブックのビット数、ゲイ
ンコードブックのビット数を変えることもできる。例え
ば、モード０は３段で、モード１〜３は２段とすること
もできる。

【０１１３】また、音源コードブックの構成は、例え
ば、２段構成のときに、１段目のコードベクトルに対応
させて２段目のコードブックを設計しておき、１段目で
選択されたコードベクトルに応じて２段目で探索するコ
ードブックを切り換えるようにすると、メモリ量は増大
するが、性能はさらに改善される。

【０１１４】また、音源コードブックはレギュラーパル
ス構成とすることにより、探索に必要な演算量、格納に
必要なメモリ量を低減化できる。

【０１１５】また、音源コードブックの探索、ならびに
学習のときの距離尺度は、他の周知な尺度を用いること
もできる。

【０１１６】コムフイルタ回路３５６、３５７および３
５８の次数は、高次（例えば３次）とすることもでき
る。このようにすると、演算量がやや増加するが、性能
はさらに改善される。

【０１１７】また、ゲインコードブック３５５は、伝送
ビット数よりも全体で数倍大きなサイズのコードブック
をあらがじめ学習し、予め定められたモード毎に前記コ
ードブックの一部の領域を使用領域としてアサインして
おき、符号化するときは、モードに応じて使用領域を切
り換えて使用することもできる。

【０１１８】また、ピッチ周期生成回路３００での探
索、ならびに音源量子化回路３６０での探索には、それ
ぞれ、（９）〜（１２）式のように、インパルス応答ｈ
_w（ｎ）を用いて畳み込み演算を行なったが、これは、
伝達特性が（８）式で表されるような重み付けフイルタ
を用いてフイルタリング演算により行なうこともでき
る。このようにすると、演算量は増大するが、性能はさ
らに向上する。

【０１１９】

【発明の効果】以上説明したように、本発明の音声符号
化方式によれば、予備選択された複数個の音源コードベ
クトルに対して、非再帰形コムフイルタを通し、歪を最
小化する音源コードベクトルを選択するか、非再帰形コ
ムフイルタを通してゲインコードベクトルと音源コード
ベクトルの組み合わせを選択するかしているので、低ビ
ットレートでも比較的少ない演算量で音質の改善を行な
うことができるという効果がある。さらに、非再帰形コ
ムフイルタを使用しているので、伝送路誤りによる音質
の劣化が少ないという効果がある。

【図面の簡単な説明】

【図１】第１の発明の音声符号化方式の一実施例を示す
ブロック図である。

【図２】第２の発明の音声符号化方式の一実施例を示す
ブロック図である。

【図３】第３の発明の音声符号化方式の一実施例を示す
ブロック図である。

【符号の説明】

１１０フレーム分割回路１２０サブフレーム分割回路２００スペクトルパラメータ計算回路２１０スペクトルパラメータ量子化回路２１１ＬＳＰコードブック２３０聴感重み付け回路２３５減算回路２４０応答信号計算回路２５０モード分類回路３００ピッチ周期生成回路３１０インパルス応答計算回路３５０音源量子化回路３５１₁、３５１₂ 音源コードブック３５５ゲインコードブック３５６、３５７、３５８コムフイルタ回路３６０、３６１重み付け信号計算回路３６５、３６６ゲイン量子化回路４００マルチプレクサ

Claims

【特許請求の範囲】

【請求項１】音声信号を入力し予め定められた時間長
のフレームに分割し前記フレームの音声信号をフレーム
よりも時間的に短い複数個のサブフレームに分割し少な
くとも一つのサブフレームに対して前記音声信号のスペ
クトル的特徴を表すスペクトルパラメータを求めるスペ
クトルパラメータ計算手段と、前記スペクトルパラメー
タを量子化するスペクトルパラメータ量子化手段と、適
応コードブックを使用してサブフレーム毎に音声信号の
ピッチ周期を求めるピッチ周期生成手段と、音源コード
ブックを使用して歪の小さい順に予め定められた個数の
音源コードベクトルを選択する音源量子化手段と、前記
予備選択した音源コードベクトルを前記ピッチ周期に等
しい遅延を有する予め定められた次数と重み係数の非再
帰形フイルタに通した後に最良の音源コードベクトルを
探索選択するフイルタ手段と、ゲインコードブックを使
用して前記フイルタ手段の出力に対応するゲインコード
ベクトルを探索し最良のゲインコードベクトルを選択す
るゲイン量子化手段とを含むことを特徴とする音声符号
化方式。
【請求項２】音声信号を入力し予め定められた時間長
のフレームに分割し前記フレームの音声信号をフレーム
よりも時間的に短い複数個のサブフレームに分割し少な
くとも一つのサブフレームに対して前記音声信号のスペ
クトル的特徴を表すスペクトルパラメータを求めるスペ
クトルパラメータ計算手段と、前記スペクトルパラメー
タを量子化するスペクトルパラメータ量子化手段と、適
応コードブックを使用してサブフレーム毎に音声信号の
ピッチ周期を求めるピッチ周期生成手段と、音源コード
ブックを使用して歪の小さい順に予め定められた個数の
音源コードベクトルを選択する音源量子化手段と、前記
予備選択した音源コードベクトルを前記ピッチ周期に等
しい遅延を有する予め定められた次数と重み係数の非再
帰形フイルタに通すフイルタ手段と、ゲインコードブッ
クを使用して前記フイルタ手段の各出力に対応するゲイ
ンコードベクトルを探索し最良の音源コードベクトルと
ゲインコードベクトルの組み合せを選択するゲイン量子
化手段とを含むことを特徴とする音声符号化方式。
【請求項３】音声信号を入力し予め定められた時間長
のフレームに分割し前記フレームの音声信号をフレーム
よりも時間的に短い複数個のサブフレームに分割し少な
くとも一つのサブフレームに対して前記音声信号のスペ
クトル的特徴を表すスペクトルパラメータを求めるスペ
クトルパラメータ計算手段と、前記スペクトルパラメー
タを量子化するスペクトルパラメータ量子化手段と、適
応コードブックを使用してサブフレーム毎に音声信号の
ピッチ周期を求めるピッチ周期生成手段と、音源コード
ブックを使用して歪の小さい順に予め定められた個数の
音源コードベクトルを選択する音源量子化手段と、ゲイ
ンコードブックから供給されるゲインコードベクトルの
値から決定された重み係数を有しかつ前記ピッチ周期に
等しい遅延を有する予め定められた次数の非再帰形フイ
ルタに前記予備選択した音源コードベクトルを通した後
に最良の音源コードベクトルとゲインコードベクトルの
組み合せを選択するフイルタ手段とを含むことを特徴と
する音声符号化方式。