JPS5994797A

JPS5994797A - 音声の適応変換符号化方式

Info

Publication number: JPS5994797A
Application number: JP57204850A
Authority: JP
Inventors: 守谷健弘; 誉田雅彰
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: NTT Inc
Priority date: 1982-11-22
Filing date: 1982-11-22
Publication date: 1984-05-31
Also published as: JPS5936280B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】この発明は音声信号を周波数領域に袈換し、その量子化
を適応的に変化させる適応変換符号化方式に関する。

〈従来技術〉この種の音声符号化方式は例えば゛特開昭５５−５’７
９００号「音声信号処理回路」に示されている。この方
式は第１図に示すように、入力端子１１よりの入力音声
は例えば８ＫＨｚでサンプリングされ、各サンプル値が
ディジタル信号として直交変換部１２に入力され、直交
変換部１２は例えば第２図Ａに示す一定数の入力音声サ
ンプルＳ１・・・・・Ｓ２ｎを離散的フーリエ変換によ
り周波数領域の信号（スペクトル）　ｆ１ｆ２・・・・
ｆｎ　（第２図Ｂ）に変換されて適応量子化部１３へ送
られる。一方端子１１の入力音声はスペクトル包絡抽出
部１４に入力さね、入力音声のスペクトルの包絡が線形
予６１す分析により推定され、このスペクトル包絡及び
ピッチ周期は適応情報割当部１５に供給される。

適応情報割当部１５は周波数領域の信号ｆ＞ｆ２・・・
・・ｆｎのそれぞれにおけるスペクトル包絡の瞬時レベ
ルに応じて、このレベルが太きければ割当てビットを多
くシ、小さければ割当てビットを少なくするように、ピ
ッチ周期をも考慮して量子化部１３における各信号ｆ１
ｆ２・・・・ｆｎに対する量子化ビラトラ適応的に鉱化
する。このようにして量子化されだ□Ｈ￥　報と、ビッ
ト割当てを示す情報とが合成回路１６で合成されて符号
化出力として送出される。

この手法によって８ＫＨｚサンプリングの音声信号を１
６　ＫｂｐＳ程度の情報量で能率よく符号化でき、高品
質の音声が得られる。しかし、ビット割当て情報に２Ｋ
ｂｐＳ程度の情報量が必要であるため、全体で９’、　
６　ｒ＜ｂｐｓ　（一般に用いられている伝送連層の１
つ）以下の情報量で符号化する際には信号ｆ　１．　ｆ
　２・・・・ｆｎを１ビツト／サンプル以下で量子化す
る必要がある。この際、周波数の成分中の強さの小さい
区間にはほとんど情報を割当てることができず、音声品
質の大きな劣化を招く。

〈発明の概要〉この発明は入力音声信号を周波数領域に変換し、その変
換されたスペクトルをブロック単位に分割し、その単位
でベクトル量子化をスペクトル包絡情報に応じて適応的
に行うことにより、例えば符号化速度が９．６Ｋｂｌ）
Ｓ以下においても音声品質の劣化を少なくするようにし
た音声の適応変換符号化方式を提供することにある。ま
たスペクトルをブロック分割する前にスペクトルは平坦
イヒしておくことによシベクトル量子化を効率的に行う
ことができる。

〈第１実施例〉第３図はこの発明による音声符号化方式の実施例を示す
。端子１１からの入力信号は直交ｆ　？Ａ部１２で１フ
レームを単位に、離散的フーリエ変換（ＤＦＴ）、離散
的余弦変換（ＤＣＴ）などの直交変換によシ周波数領域
の信号、即ちスペクトルに変換され、このスペクトルは
スペクトル平滑部１７において、別に求められ、量子化
されたスペクトル包絡の情報で大域的に平坦化される。

即ち端子１１の入力音声はスペクトル包絡抽出部１４に
おいて線形予測分析によりスペクトル包絡が推定され、
このスペクトル包絡情報及び音声パワは量子化部１８で
補助情報としてカ（子化され、この量子化出力は烏合１
５後号部１９で復号され、その復号されたｉＩｉ助情報
によシスベクトルｆ　１’ｆ　２・・・・ｆｎがスペク
トル平滑部１７で割算される。

この平坦化されたスペクトルはブロック分割部２１で第
４図に示すように連続するｐ個ずつのブロックにＦｌ＝
（ｆ　１１　ｆ　１２−・・・ｆｔｐ）、Ｆ２＝＝（ｆ
２ｔｆ２２・・・・ｆ２　）、・・・・・Ｆｓ−（ｆＳ
ｌｆＳ２・・・・ｆＳｐ）に分　　　１割される。スペ
クトルの性成分子　ｉｊ（１＝＝ｌ・・・Ｓ。

ｊ＝１・・・・・ｐ）はそれぞれ実部Ｒ（ｆｉｊ）と虚
部工（ｆｉｊ）とよりなり、各ブロックごとにこれら実
部を要撚とするベクトルＲ（Ｆ　１）＝（Ｒ（ｆ　１１
）Ｒ（ｆ　１２　）・・・・Ｒ（ｆ’ｔｐ）’）、Ｒ（
Ｆ２）−（Ｒ（ｆ２ｔ）Ｒ（ｆｚ２）・・・・・Ｒ（ｆ
２ｐ））”・Ｒ（Ｆｓ）＝（Ｒ（ｆｓｘ）Ｒ（ｆｓ２）
””・Ｒ（ｆｓｐ））と、同様に谷虚部を要素とする８
個のベクトルＩ（Ｆｉ　）＝（Ｉ（ｆ　ｉ　ｊ刀とを作
る。

これらベクトルが、予め用意した辞書中の何れの標準ベ
クトルと最もよく対応するかを検出してベクトル量子化
をベクトル量子化部２２で行う。

つま９辞書として予測される複数の標準的なベクトルを
記憶しておき、入力音声のベクトルが何れの標準ベクト
ルに近いかを検出し、その一致乃至類似した標準ベクト
ルを示す番号などの符号を出力する。従って各スペクト
ル成分の強さを量子化するよりも少ないビット数で符号
化することができる。しかもこのベクトル量子化に対す
るビット割当てを適応的に変化する。

即ち局部復号化部１９の出力である補助情報の復号出力
に応じて前記ブロックごとにビット数を割当てる。一般
的には強いスペクトルが含捷れるブロックには多くのビ
ットを割当て、弱いスペクトル量子化部２２では多くの
ビット数が割当てられる時は、比較すべき標準ベクトル
の数が多い辞書を参照し、少いビット数が割当てられる
時は、標準ベクトル数が少い辞書を参照する。標準ベク
トルの要素の数ｐは一定であるから標準ベクトル数が多
い辞書は記憶されている標準ベクトルは微細なパターン
をも表示していることになシ、標準ベクトルの数が少い
辞書に記憶されている標赫ベクトルは大ざっばなパター
ンを示すに過ぎないと云える。

この適応的情報割当（ビット割当）は入力信号と出力信
号のフレームごとのＳＮ比を最大化することを目的とし
て行われる。直交変換してもＳＮ比は不変であるから符
号化器２４のスペクトル平滑部１７の出力と受信側の復
号化器２５のスペクトル再生出力との歪を最小とするよ
うにすればよく、歪尺度はユークリッド距離とする。１
フレームあたりの歪りは次式である。

まだ全サンプル（スペクトル）数はｐ’ｓであってサン
プルあたシの平均情報量（平均量子化ビット数）Ｂは、Ｂ＝り゛　ｂｊ／（ｐ−８） −１である。Ｂは一定に保持するから歪りを最小化する量子
化ビット数ｂｊは次式となる。

とのｂｊ　　を整数値化し、２５ｊ個からなる辞書から
歪最小となるものを選択することで量子化が実行される
。

なお量子化部１８における量子化もベクトル量子化する
ことができる。このスペクトル包絡の量子化出力、つま
り補助情報と、ベクトル量子化部２２の出力である波形
情報とは合成されて符号化出力として復号イヒ器２５へ
送られる。

復号化器２５では入力された波形情報が平滑化スペクト
ル再生部２６で、符号化器２４におけるベクトル量子化
部２２で用いた辞書と同一のものを用いて椰準ベクトル
を各ブロックの量子化符号により読出して、平滑化スペ
クトルを再生する。

一方入力された補助情報はスペクトル包絡再生部２７で
スペクトル包絡が再生され、これとパワとを再生された
平滑化スペクトルに対してスペクトル再生部２８で乗算
してスペクトルを再生する。

この再生されたスペクトルを逆変換部２９で時間領域に
逆変換して出力端子３１に再生音声信号を得る。

〈第２実施例〉上述においては直交度お冬を行った後にスペクトル平滑
化を行ったが、入力音声を逆フィルタに通した後に、直
交変換を行ってもよい。例えば第５図に第３図と対応す
る部分に同一符号を付けて示すように入力端子１１から
の入力音声信号は逆フィルタ３２を通して直交変換部１
２へ供給される。

−実入力音声信号は線形予測分析器３３でスペクトル包
絡が分析され、その分析予測係数は量子化部１８でベク
トル量子化され、その量子化出力は局部復号化部１９で
復号化され、その復号出力、つまり線形予測係数によシ
逆フィルタ３２のフィルタ定数が制御される。この逆フ
ィルタ３２の出力は残差信号であり、これを直交変換し
て前述と同様に符号化して送出する。復号化器２５では
スペクトル再生部２６でベクトル量子化された符号を復
号して残差信号のスペクトルを再生し、これを時間領域
に逆変換して線形予測合成フィルタ部３４へ送出する。

この合成フィルタ部３４のフィルタ定数は、スペクトル
包絡再生部２７で再生された予測係数によシ制御され、
フィルタ部３４より音声信号か再生される。

第６図Ａに、入力音声信号の波形ａｔ、その直交変換出
力の実部の波形ａ２、虚部の波形ａ３を示し、第６図Ｂ
に入力音声信号の波形ａ１を逆フイルタ部３２に通した
後の残差信号波形ｂ１を、との残差信号の直交変換出力
の実部の波形ｂ２を、虚部の波形ｂ８をそれぞれ示す。

音声入力波形ａｌのスペクトル包絡１１ｂ４と、各ブロ
ックに対する割当ビットｂ５をそれぞれ示す。たソしｐ
＝＝１３、Ｂ＝１．０の例である。

上述において量子化の単位となるベクトルの次元Ｐを入
力音声のピッチ周波数に適応させ、１フレームの長さを
ピッチ周期の整数倍とすることで；ｊ量子化の効率をさ
らに高めることができる。この場合はピッチ周波数は時
間的に変化するためピッチ周波数も補助情報に含める。

また、ベクトルを実部、虚部独立とせず、複素数のま捷
の単位として処理することも可能である。また上述にお
ける各部はそれぞれ独立した或は共通の電子計算様で処
理することができる。

〈効　果〉以上説明したように、周波数領域で平坦化された信号を
ブロックに分割し適応的情報割当をすることで量子化効
率を高めることができ、特に９．６Ｋｂｐｓ°以下でス
カラ量子化の従来の適応変換符号化方式より高いＳＮ比
を持つ音声を再生することができる。周波数領域の平坦
化によシベクトル量子化の標準ベクトルの数が少なくて
済む。また１ブロツクあたシに割当てられる情報量が整
数であればよく、１サンプルあたりの情報量は１／Ｐビ
ツトの単位で細かく割当てられる。このことにょシ従来
方式の欠点であった情報量がまったく割当てられない周
波数成分が存在し、かつそれが適応的に変化することに
起因する聴覚的劣化を避けることができる。

次に実験例を述べる。サンプリング周波数を８ＫＨｚ、
線形予測分析部３３の分析次数を８次、分析長（変換部
）を２６〜３１ｍ５．分析の重複２ｍ５（台形窓で接続
）、ベクトル次元数を６〜１２（ピッチ適応）とした場
合の情報量Ｂ（ビット／サンプル）に対するＳＮ比を第
７図に示す。第６図において曲ｇ１４１は均一量子化で
、各１サンプルごとに符号化した場合、曲線４２は均一
量子化で６次元固定ベクトル符号化した場合、曲線４３
は均一量子化でベクトルの次元をピッチ周波数に応じて
変化させて符号化した場合、曲線４４は適応量子化で各
サンプルごとに符号化する場合（従来方式）、曲線４５
はこの発明の方式で６次元固定ベクトル量子化による符
号化する場合、曲線４６はこの発明の方式でベクトルの
次元をピッチ周波数に応じて適応的に変化させて符号化
する場合である。これらよシ、均−量子化（曲＠４１〜
４３）よシも適応量子化（曲線４４〜４６）の方が優れ
、適応量子化でも従来方式（曲線４４）よりもこの発明
方式（曲線４５．４６）の方が優れていることが理邊角
！トされる。０．５〜１．１ビット／サンプル域で、こ
のＳＮ比の向上は学習サンプル外でも女声で２．５ｄＢ
，男声でｘ．ｏａＢｓ度得られた。スペクトル包絡もベ
クトル量子化することによりピッチ、パワなどを含めて
補助情報は８　０　０　ｂｐｓ程要と見積ることができ
るから、残差信号１サンプル当シの情報量Ｂが０．　５
で４．　８　Ｋｂｐｓ，　　１．　１で９．６Ｋｂｐｓ
の符号化が可能である。

【図面の簡単な説明】

Ｈｓ　１図は従来の適応変換符号化方式を示すブロック
図、第２図はその動作の説明に供する図、第３図はこの
発明による適応変換符号化方式の一例を示すブロック図
、第４図はそのブロック分割の例を示す図、第５図はこ
の発明の他の例を示すブロック図、第６図はその動作例
を示す図、第７図は各種符号化方式のＳＮ比−情報量Ｂ
との関係を　　　□示す図である。１１：音声入力、１２：直交変換部、１４ニスベクトル
包絡抽出器、１７：スペクトル平滑部、１８：ベクトル
量子化器、１９：局部復号化器、２１ニブロック分割部
、２２：ベクトル量子化器、２３：適応情報割当部、２
４：符号化器。特許出願人　　日本電信電話公社代　　理　　人　　　草　　野　　　　草汁１図７１７２　　図丼３図

Claims

【特許請求の範囲】

（１）音声信号のサンプル値系列を一定の個数ごとに１
フレームとし、■フレームごとに直交変換によシスベク
トルを求め、適応的に量子化する符号化方式において、
上記スペクトルの包絡を求めてパワとともに量子化して
補助情報として符号化するスペクトル包絡抽出手段と、
その補助情報を復号する局部復号化手段と、その復号さ
れた補助情報を使って上記スペクトルを周波数軸上で平
坦化されたスペクトル信号系列とする平滑手段と、その
平坦化されたスペクトル復号系列を周波数軸上でブロッ
クに分割するブロック分割手段と、その分割された各ブ
ロックに対して上記補助情報を使って適応的に情報割当
を行う適応情報割当手段と１、そび１割当によって上記
分割されたスペクトル信号系列をベクトル量子化するベ
クトル量子化手段とを備えた音声の適応変換符号化方式
。
（２）音声信号のサンプル値系列を１フレームを単位と
して分析して符号化する符号化方式において上記音声信
号を線形予測分析し、そのスペクトル包絡を求め、パワ
とともに量子化し補助情報として符号化する線形予測分
析手段と、その補助情報を復号する局部復号化手段と、
その復号された補助情報の線形予測係数によシフィルタ
定数が制御されると共に上記音声信号のサンプル値系列
が入力されて残差信号を出力する逆フイルタ手段と、そ
の残差信号を１フレームごとに直交変換してスペクトル
を求める直交変換手段と、このスペクトルを周波数軸上
でブロックに分割するブロック分割手段と、その分割さ
れた各ブロックに対して上記補助情報を使って適応的に
情報割当を行う適応情報割当手段と、その割当に従って
上記分割されたスペクトル残差信号系列をベク）／しせ
子化するベクトル量子化手段とを備えだ音声の適応変換
符号化方式。