JPH02272500A

JPH02272500A - コード駆動音声符号化方式

Info

Publication number: JPH02272500A
Application number: JP1093568A
Authority: JP
Inventors: Fumio Amano; 文雄天野; Tomohiko Taniguchi; 智彦谷口; Yoshiaki Tanaka; 良紀田中; Takashi Ota; 恭士大田; Shigeyuki Umigami; 重之海上
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1989-04-13
Filing date: 1989-04-13
Publication date: 1990-11-07
Also published as: CA2014279C; US5138662A; CA2014279A1; DE69013738D1; DE69013738T2; EP0392517B1; EP0392517A2; EP0392517A3

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔概要〕高能率音声符号化方式に使用されるコード駆動音声符号
化方式に関し、号アルタイムで小型の音声符号器を提供できる様にする
ことを目的とし、人力信号の線形予測を行って第１の線形予測パラメータ
を抽出する第１の線形予測分析処理部と。

（１／Ｍ）に間引きされた白色雑音系列がコードとして
蓄えられ、入力するコード番号に対応した白色雑音が取
り出されるコードブックと、入力した該第１の線形予測
パラメータと該コードブックから取り出された白色雑音
とから第１の再生信号を生成する予測部と、該第１の再
生信号と該入力信号とを比較して誤差を求める比較部と
、第２の線形予測分析部とを設け、該予測部と比較部と
で全てのコード番号について第１の再生信号を生成して
入力信号との誤差を求め、誤差が最少となる最適コード
番号を選択した後、該第２の線形予測分析処理部で該最
適コード番号を用いて合成した第２の再生信号と人力信
号との残差成分の自乗和を最少とする第２の線形予測パ
ラメータを再計算し。

該第２の線形予測パラメータと最適コード番号とを音声
符号化情報とする様に構成する。

〔産業上の利用分野〕

本発明は高能率音声符号化方式に使用されるコード駆動
音声符号化方式に関するものである。

一般に、高能率音声符号化方式を通信システムに適用す
ることにより、■音声の低ビツトレート伝送により回線
コストの低減が図れる。■音声信号と非音声信号との同
時通信が容易となり経済性および利便性が向上する。■
無線周波数の有効利用や音声蓄積メモリの経済化を図る
ことができる等の利点が得られる。

そこで、上記の高能率符号化方式は企業内通信システム
、ディジタル移動無線システム、音声蓄積応答システム
への適用が期待されるが、特に通信システムや無線シス
テムではリアルタイムで小型の音声符号器を提供できる
様にすることが必要である。

〔従来の技術〕

音声通信は信号源、受信源ともに人間である為。

音声信号には相当の冗長性が含まれている。この為、音
声を伝送したり、蓄積する際に音声の持つ情報を完全に
送受しなくても十分品質の良い音声を再現することが可
能で、この冗長性を除いて音声を効率よく圧縮する高能
率音声符号化方式の研究が進められている。

この高能率音声符号化方式の１つにコード駆動音声符号
化方式（以下、　ＣＥＬＰ方式と省略する）があるが、
このＣＥＬＰ方式は低ビツトレート音声符号化方式の一
つとして知られ、非常に優れた再生音声品質が得られる
。

さて、第５図は従来例のブロック図、第６図は処理フロ
ー図を示す、以下、第６図を参照して第５図の動作を説
明する。

先ず、音声は肺から押し出される呼気流によって声帯振
動や乱流雑音などの音源を生成し、それに声道の形を変
形させてさまざまな音色を付加して作られる。そこで、
音声の言語的な内容は声道の形によって表現される部分
が多いが、声道の形状は音声の周波数スペクトルが反映
しているので。

音韻情報はスペクトル分析によって抽出することができ
る。

このスペクトル分析の手法の一つに線形予測分析法があ
るが、この分析法は音声信号のサンプル値がそれ以前の
時刻のいくつかのサンプル値の線形結合で近似されると
云う考えに基づいている。

さて、入力信号はあらかじめ９例えば２０ｍ５の長さの
処理フレームに切り出されて線形予測分析処理部１１に
加えられ、その処理フレームについてのスペクトル包絡
を予測分析して線形予測係数ａｉ（例えば、ｉ・１〜１
０）とピッチ周期、ピッチ予測係数が抽出され、線形予
測係数ａ！は短期予測器１３に、ピッチ周期、ピッチ予
測係数は長即予測器１４に加えられる（第６図−■参照
）。

尚、線形予測分析により残差信号が得られるが。

ＣＥＬＰ方式ではこの残差信号は駆動源として使用せず
、後述する白色雑音波形を駆動源として使用する。また
、短期予測器１３．長期予測器１４は入力“０″゛で駆
動されて入力信号から差し引かれ、前の処理フレームの
影響が除去される（第６図−■参照）。

一方、白色雑音コードブック１６には駆動源として使用
する白色雑音波形の系列（以下、雑音波形と省略する）
がコードとして蓄えられている。尚。

この雑音波形のレベルは正規化されている。

次に、白色雑音コードブック１６は入力コード番号に対
応する雑音波形を出力するが、この雑音波形は前記の様
に正規化されているので、所定の評価式により得られる
利得を有する増幅器１５を通った後、長期予測器１４で
ピンチ周期性の予測を行い。

更に短期予測器１３で近接サンプル間の予測をして再生
信号を生成するが、この信号を比較器１２に加える。

比較器１２には入力信号も加えられているので。

比較されて差分信号が取り出され、聴覚重み付は処理部
１７で雑音波形のスペクトルに対して人間の音声スペク
トルに合わせた形で重み付けをして誤差信号として誤差
評価部１８に加える。誤差評価部１８では誤差信号の自
乗和を取って後述するサブフレーム内での誤差電力を評
価する。

これを白色雑音コードブック中の全てのコード番号につ
いて同様な処理を行って評価し、最少の誤差電力を与え
るコード番号を選択しく公知のＡｂＳ法による最適化）
、対応するコード番号を相手側に伝送する（第６図−■
参照）。

ここで、前記の線形予測係数ａｉの値は１つの処理フレ
ーム（例えば、　２０ｍ５）の間は変化しないがコード
はこの処理フレームを構成するサブフレーム（例えば、
　　５ｍ５）ごとに変化する。

〔発明が解決しようとする課題〕

ここで、上記の様に最適化を行うにはサブフレーム毎に
全コードに対する再生信号を算出する必要があるが、こ
の為には短期予測器、長期予測器で構成される合成フィ
ルタの伝達函数Ｈとサブフレーム当たりのコードＣとの
たたみ込み演算（ΣＨ，−Ｃ”　ｎ−ｉ　）を行う必要
がある。

ここで、伝達関数Ｈの次数をＮとすると一回のたたみ込
み演算にはＮ回の累積演算を行わなければならず、白色
雑音コードブックの大きさをＫとすると、全演算量とし
てほぼに−Ｎ回の乗算が必要となる。

そこで、所要演算量が膨大となり、リアルタイムで小型
の音声符号器を実現することが困難であると云う問題が
ある。

〔課題を解決する為の手段〕

第１図は本発明の原理ブロック図を示す。

図中、２は入力信号の線形予測を行って第１の線形予測
パラメータを抽出する第１の線形予測分析処理部で、４
は（１／Ｍ）に間引きされた白色雑音系列がコードとし
て蓄えられ、入力するコード番号に対応した白色雑音が
取り出されるコードブックである。

また、３は入力した該第１の線形予測パラメータと該コ
ードブックから取り出された白色雑音とから第１の再生
信号を生成する予測部で、６は該第１の再生信号と該入
力信号とを比較して誤差を求める比較部であり、５は第
２の線形予測分析部である。そして、該予測部と比較部
とで全てのコード番号について第１の再生信号を生成し
て入力信号との誤差を求め、誤差が最少となる最適コー
ド番号を選択した後、ＦＸ第２の線形予測分析処理部で
該最適コード番号を用いて合成した第２の再生信号と入
力信号との残差成分の自乗和を最少とする第２の線形予
測パラメータを再計算し、該第２の線形予測パラメータ
と最適コード番号とを音声符号化情報とする。

〔作用〕

本発明は白色雑音コードブックとして従来例に示す白色
雑音系列を１／Ｍに間引きした白色雑音系列をコードと
して蓄える。

即ち８Ｍサンプルの中で有意なサンプルは１サンプルの
みであり、残りのサンプルはＯである。

従って１回のたたみこみ演算に必要な累積演算はＮ７Ｍ
回でよいことになり、所要演算量をほぼ１／Ｍにするこ
とができるが、再生信号の品質はＭの値が大きい程、劣
化する。

・そこで、入力信号と再往信号との誤差が最少となるコ
ードを選択した後、線形予測係数ａｉの再計夏を行って
、再生信号の品質を改善する。

即ち、第２図−■に示す様に入力信号を線形予測係数ａ
ムを有する予測逆フィルタを通すと残差信号（ａ）が得
られ、この残差信号を用いて図中の太い左矢印の樺に逆
向きに予測逆フィルタを駆動すると再生信号が生成され
る。

しかし、本発明では前述の様に残差信号の代わりに白色
雑音コードブックから選択した最適コードに対応する雑
音波形（ｂ）で上記の逆向きの予測逆フィルタを駆動す
るので第２図−■に示す様に（ａ）−（ｂ）で駆動され
た分が再生信号の誤差となる。

ここで、第２図−〇に示す様に［有］）で駆動された再
生信号と誤差（ａ）　−（ｂ）で駆動された再生信号と
の和を取れば厳密な再生信号が得られる。尚、線形予測
係数ａ、は（ａ）　−（ｂ）で駆動された再生信号が最
少になる様に設定されているのでなく、残差信号（ａ）
の電力が最少になる様になっている。

そこで、再生信号の誤差を小さ（する為、褐鼓への影響
を削減した残差信号の電力が最少になる様に、再度、線
形予測分析を行って第２図−■に示す様に第２の線形予
測係数ａ直°を求めると。

これは■の誤差（ａ）　’　−（ｂ）が最少になる様に
求めたａｔ　　＋であるから（ａ）　−（ｂ）よりも誤
差が小となり。

再生信号の品質が改善される。

ここで、（ａ）“は入力信号を予測逆フィルタａｌに通
した時の残差信号であり、第２の線形予測パラメータａ
　、　　ｌと最適コード番号を音声符号化情報として送
出する。

〔実施例〕

第３図は実施例のブロック図、第４図は第３図の処理フ
ロー図を示す。

ここで、線形予測分析処理部２１．聴覚重み付は処理部
２２は第１の線形予測分析処理部２の構成部分、聴覚重
み付は処理部３１．３１°、短期予測器３２゜３２°、
長期予測器３３．３３°、増幅器３４は予測部３の構成
部分、線形予測分析処理部５１は第２の線形予測分析処
理部５の構成部分、比較器６１．６１’誤差評価部分６
２は比較部分６の構成部分を示す。

以下、第４図を参照して第３図の動作を説明する。尚、
白色雑音コードブック４は従来例のコードブックに比較
してＭ−３，即ち１／３に間引きしている。

先ず、入力信号は線形予測分析処理部２１に加えられて
予測分析、ピッチ予測分析が行われて、線形予測係数ａ
ｉとピッチ周期、ピッチ予測係数が抽出され、線形予測
係数は短期予測器３２．３２’に。

ピッチ周期、ピッチ予測係数は長期予測器３３．３３°
に加えられる（第４図−■参照）。

また、短期予測器３２°、長期予測器３３°は加えられ
た抽出パラメータをもとに“′０”入力による駆動が行
われ、入力信号から差し引かれて前の処理フレームの影
響が除去される。第３図中の°の付いた符号の部分はこ
の様な処理があると云うことを示す為にブロック図に書
いである（第４図−■参照）。

さて、１／３に間引きされた白色雑音コードブック４か
ら出力された雑音波形は増幅器３４を通った後、長期予
測器３３でピッチ周期性の予測を行い。

更に短期予測器３２で近接サンプル間の予測をして再生
信号を生成し、聴覚重み付は処理部３１で人間の音声ス
ペクトルに合わせた形で重み付けをして比較器６１に加
える。

この比較器には聴覚重み付は処理部２２を通った入力信
号が加えられているので、誤差信号が取り出されて誤差
評価部分６２に加えられる。ここでは。

誤差信号の自乗和を取って前記のサブフレーム内での誤
差電力を評価する。これを白色雑音コードブック中の全
てのコードについて同様な処理をし。

評価をして最少の誤差電力を与える最適コードを選択す
る（第４図−■参照）。

次に、第４図−■の部分に付いて説明する。

最初に聴覚補正を行い、前の処理フレームの影響も除去
して処理上の初期化をした後の時刻ｎにおける入力信号
をＳ１％Ｉ残差信号をｅ１１＋　コードのサンプル値を
ｖ７とする。また、聴覚重み付は処理部３１内の聴覚補
正フィルタ及び利得を含めた線形予測バラメーをａｔと
する。但しＩＶｌｌは３サンプリングに１回しか有意な
値を持たない。そして、残差モデルとして次の式を考え
る。

この時、評価関数を但し＋Ｓ’　ｎ　・Ｓ　ｎ　＋ｖ　ｎ　　ｎ　・３　ｔ
ａＳ’ｓ　＝　Ｓ　ｎ　　　　　ｎ　：３　ｍ＋１．３
　ｍ＋２とおくと。

誤差を最少とするａｔ（ここで、ｉ・１〜ｐ）はｄＢ。

ｄａｍ　＝０よりこれより／尚、第４図−■の線形予測分析では（３）式の左辺のＱ
　（Ｋ）の代わりにＲ（ｋ）を用い、　Ｌｅ　Ｉｏｕｘ
法などの公知のアルゴリズムでａ！を算出するが、（３
）式でも全く同様な考え方でａｌを算出できる。

（３）式では第４図−■、■の過程で求まったＶｆｉの
影響を除いて再評価するので再生音声の品質は改善され
ることになる。

以上はＭ−３の場合について説明したが、他の値を取る
場合にも同様の議論が成立することは明らかである。

そこで、所要演算量をコードブックの中身の間引き率に
ほぼ比例した割合で低減でき、実時間処理で比較的小型
のハードウェアを実現できる。

Ｎ＋Ｐ−１但し、　Ｑ　（Ｋ）・　Σ（Ｓ’ ・ｓ　ｎ−ｋ　）ｎ・０〔発明の効果〕以上詳細に説明した様に本発明によればリアルタイムで
小型の音声符号器を提供できると云う効果がある。

なる連立方程式を解いて求めることができる。

【図面の簡単な説明】

第１図は本発明の原理ブロック図、第２図は第１図の動作説明図、第３図は本発明の実施例のブロック図、第４図は第３図
の処理フロー図、第５図は従来例のブロック図、第６図は第５図の処理フロー図を示す。図において、２は第１の線形予測予測分析処理部、３は予測部、４はコードブック、５は第２の線形予測分析処理部、６は比較部を示す。木谷■耳／）＃Ｂ！プロ・ツク閉第　１［第１匹イρ動イＦみ地せ丹　し］第！第３固ｑ怠理７ＩＴ−図第不〔泉イダＩの７０ツク図第５７第５図のＸ賜理フロー図 ≠６　ｚ

Claims

【特許請求の範囲】入力信号の線形予測を行って第１の線形予測パラメータ
を抽出する第１の線形予測分析処理部（２）と、（１／
Ｍ）（Ｍは正の整数）に間引きされた白色雑音系列がコ
ードとして蓄えられ、入力するコード番号に対応した白
色雑音が取り出されるコードブック（４）と、入力した該第１の線形予測パラメータと該コードブック
から取り出された白色雑音とから第１の再生信号を生成
する予測部（３）と、該第１の再生信号と該入力信号と
を比較して誤差を求める比較部（６）と、第２の線形予
測分析部（５）とを設け、該予測部と比較部とで全ての
コード番号について第１の再生信号を生成して入力信号
との誤差を求め、誤差が最少となる最適コード番号を選
択した後、該第２の線形予測分析処理部で該最適コード番号を用い
て合成した第２の再生信号と入力信号との残差成分の自
乗和を最少とする第２の線形予測パラメータを再計算し
、該第２の線形予測パラメータと最適コード番号とを音声
符号化情報とすることを特徴としたコード駆動音声符号
化方式。