JPH07253795A - 励振信号直交化音声符号化法 - Google Patents

励振信号直交化音声符号化法

Info

Publication number
JPH07253795A
JPH07253795A JP6043519A JP4351994A JPH07253795A JP H07253795 A JPH07253795 A JP H07253795A JP 6043519 A JP6043519 A JP 6043519A JP 4351994 A JP4351994 A JP 4351994A JP H07253795 A JPH07253795 A JP H07253795A
Authority
JP
Japan
Prior art keywords
vector
coding method
random number
speech coding
random
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6043519A
Other languages
English (en)
Other versions
JP3293709B2 (ja
Inventor
Takehiro Moriya
健弘 守谷
Shigeaki Sasaki
茂明 佐々木
Akitoshi Kataoka
章俊 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP04351994A priority Critical patent/JP3293709B2/ja
Publication of JPH07253795A publication Critical patent/JPH07253795A/ja
Application granted granted Critical
Publication of JP3293709B2 publication Critical patent/JP3293709B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 励振信号中の乱数ベクトルを決定するための
演算量を低減する。 【構成】 第1段階で適応符号帳ベクトルPを決定し、
HP,XT HP,‖HP‖2 を計算する(S1 )。第2
段階で入力音声Xを合成フィルタ通過後に第1段階のベ
クトルHPと直交させた信号X′=X−(XT HP)H
P/‖HP‖2 と、X′T Hを計算、X′T Hと乱数ベ
クトルC0j,C1jによりd0j=X′T HC 0j,d1j
X′T HC1jを計算(S3 ),d0jとd1jのそれぞれの
中の大きいものから順にn個をとり、そのn個のd0j
びd1jと対応するC0j及びC1jを予備選択して残す(S
5 )。これら残された2n個のC0j,C1jについてU0j
とU1jをそれぞれ計算し、E={XT (U0j+U1j)}
2 /‖U0j+U1j2 を最大とするC0j,C1jを探す
(S6 )。その後、P,C0j,C1jの各ベクトルの利得
1 ,g2 の最適な組を探す(S7 )。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は音声信号を符号化によ
り生じる歪をできるだけ小さく保ったまま、できるだけ
少ない情報量でディジタル符号化する音声符号化におけ
る励振信号音符号化法に関する。
【0002】
【従来の技術】現在、音声を高能率に符号化する方法と
して、原音声をフレームと呼ばれる5〜50ms程度の
一定間隔の区間に分割し、その1フレームの音声を周波
数スペクトルの包絡形状と、その包絡形状に対応する線
形フィルタを駆動するための駆動音源信号という2つの
情報に分離し、それぞれを符号化することが提案されて
いる。その場合、駆動音源信号を符号化する方法とし
て、駆動音源信号を音声の基本周波数(ピッチ周期)に
対応すると考えられる周期成分と、それ以外の成分(言
い換えれば非周期成分)とに分離して符号化する方法が
知られている。この駆動音源情報の符号化法として符号
駆動線形予測符号化( Code-Excited LinearPrediction
Coding:CELP )およびベクトル和駆動線形予測符号化
( Vector SumExcited Linear Prodiction Coding:VSEL
P )法がある。それぞれの技術については、M.R.Schroed
er and B.S.Atal :“Code-Excited Linear Prediction
(CELP):Highquality Speech at Very Low Bit Rate
s”,Proc.ICASSP'85,25.1.1,pp.937-940,1985 、およ
びI.A.Gerson and M.A.Jasiuk : "Vector Sum Excited
LinearPrediction (VSELP)Speech Coding at 8 kbps",
Proc. ICASSP'90,S9.3, pp.461-464,1990 、に述べられ
ている。
【0003】これらの符号化では図2に示すように入力
音声Xはフレームを単位として線形予測分析部11で線
形予測分析されて予測係数が算出され、量子化されたの
ち、補助情報として伝送されると共にまた合成フィルタ
12の係数として用いられる。励振源のうち適応符号帳
13の出力ベクトルはピッチ周期を決めることで決定さ
れる。一方図2の場合、2系統(チャネル)の乱数符号
帳14,15をもち、2つのベクトルの和で最終的な出
力と入力音声Xの歪が最小となる組合せを符号帳から選
択する。適応符号帳13からのベクトルと乱数符号帳1
4,15からのベクトルはそれぞれに最適な利得(ゲイ
ン)の組をゲイン符号帳16から探索して決定する。な
お、乱数符号帳が1乃至複数系統であるのがCELP
で、乱数符号帳の系統が割り当てられたビット数Bと同
じであって、各乱数符号帳に唯一の基本ベクトルしか持
たない場合がVSELPである。図2はこれらを一般化
し、特に2系統の例を示している。
【0004】乱数符号帳の符号を決定するときには図3
に示す処理を行うことで、歪を小さくすることができ
る。まず適応符号帳13の出力ベクトルPを決定する
(ステップS1 )。次に各乱数ベクトルCij(i=0,
・・・L−1,j=0,・・・N−1,L:乱数符号帳
の数、N:乱数符号帳あたりのベクトル数)を合成フィ
ルタに通してHCijを作る(S2 )。Hはインパルス応
答行列である。次にHCijをHPと直交させてUijを作
る。
【0005】 Uij=HCij−(PT T HCijHP)/‖HP‖2 (1) 上付添字Tは転置行列を示す。次に入力ベクトルX(前
フレームから合成フィルタの応答分を除いたもの)とU
ijとの歪dを求め、 d=‖X−ΣUij2 (2) Σはi=0からL−1まで この歪dを最小化するベクトル番号J(0)・・・J
(L−1)を決める(S3)。
【0006】その後、次式を最小とする利得の和g1
2 を決定する(S4 )。 ‖X−{g1 HP+g2 H(ΣCij(0) )}‖2 (3) Σはi=0からL−1まで、ベクトルはすべてM次元と
している。図3の右に各ステップにおける計算回数を示
す。VSELPの場合には割り当てられるビット数Bが
例えば12の場合、これらの処理に関係するベクトルの
総数Tも12であるため、現実的な演算量の範囲で処理
が可能である。しかしながらCELPでは極性ビットを
除いた11ビットに対応する符号帳ベクトルの個数Tは
11個となり、膨大な演算量となり、実時間処理が困難
となる。
【0007】この問題を解決するために、本出願人は図
4に示すように合成フィルタ演算をできるだけ少なくし
て探索を行う方法(音声符号化における励振信号符号化
法:特開平5−100697号公報)を提案している。
先に提案した音声符号化法は適応符号帳ベクトルPを決
定し(ステップS1),次にXT H=a,PT T H=
b,‖HP‖2 =Cをそれぞれ計算する(S2),Xは前
フレームからの応答分を除いた入力ベクトル、Hは合成
フィルタの伝達関数であるインパルス応答行列、HPは
ステップS1 で計算したものを用いる。
【0008】一方の乱数符号帳14の乱数ベクトルC0j
は、C0j−(bC0jP)/C=eを計算し(S3),さら
にd0j=deを計算し(S4),d0jのうち大きいものか
ら順にn個をとり、そのn個のd0jと対応するC0jを予
備選択として残す。同様に他方の乱数符号帳15につい
てd1jを求め、n個のC1jを予備選択して残す(S6),
これら残された2nの乱数ベクトルC0j,C1jについて
合成フィルタ12を通過させてHPと直交させてU0j
HC0j−(bHP)/CおよびU1j=HC1j−(bH
P)/Cをそれぞれ計算し(S7),E={XT (U0j
1j)}2 /‖U0j+U1j2 を最大とするC0j,C1j
を探索し(S8),その後P,C0j,C1jの各ベクトルの
利得g1 ,g2 の最適な組を決定する(S9)。
【0009】この先に提案した音声符号化における励振
信号符号化法によれば予備選択によりしぼられた2n個
の乱数ベクトル候補だけから歪が最小となる乱数ベクト
ルC 0j,C1jの組を探索するから演算処理量を図3の場
合より大幅に少なくすることができる。
【0010】
【発明が解決しようとする課題】しかしながら、この先
に提案した音声符号化における励振信号符号化法によっ
ても予備選択に多くの演算量が要求される不都合があ
る。この発明の目的は、先に提案した音声符号化法より
予備選択に要する演算処理量を低減することができる励
振信号符号化法を提案しようとするものである。
【0011】
【課題を解決するための手段】この発明では音声信号を
フレーム単位で線形予測分析して予測係数を求め、ピッ
チ周期成分をもつ適応符号帳と複数の系統の乱数符号帳
としてからの各ベクトルの利得付き和を励振源として先
に求められた予測係数に基づいて合成された音声と入力
音声Xとの誤差を最小とするようなピッチ周期、乱数ベ
クトルの符号、利得を決定する音声符号化法において、
第1段階で適応符号帳からのベクトルPを決定し、ベク
トルPを合成フィルタ通過後のHPを求め、第2段階で
上記第1段階で求めたHPに直交させた信号X′を作
り、X′を合成フィルタを通過後のX′Hを求め、この
X′Hと乱数ベクトルCijとの内積値を基準に乱数ベク
トルCijを選択する。
【0012】つまり、doj=XT HCojとd1j=X′T
HC1jを計算し、それぞれの大きいものから順にn個を
とり、そのn個のdojおよびd1jと対応する乱数ベクト
ルC ojおよびC1jを予備選択して残す。この予備選択の
手順を採ることにより、XTHP,‖HP‖2 および
X′T Hを先に1回だけ計算しておけば、数多くの乱数
ベクトルCijに対する合成演算を行う必要がなく、演算
量を低減することができる。
【0013】
【実施例】図3の従来の符号決定法をもとにこの発明に
よる処理を説明する。図3の距離部の計算を展開する。 D=‖X−gΣUij2 =XT X−2gXΣUij+g2 ‖ΣUij2 (4) ここでL,M,Nはそれぞれ符号帳の系統(チャンネ
ル)数、ベクトルの次元数、系統あたりのベクトル数Σ
はi=0からL−1である。ゲインgは励振ベクトル決
定後に量子化するので、gは任意の値をとることができ
る。このときDの最小化はEの最大化と等価となる。
【0014】 E=(XΣUij2 /‖ΣUij2 (5) 従って、Eの分子の内積にMLN回、分母のエネルギー
にMNL 回の積和演算が必要で、さらにNL 回の加減
算、除算、比較が必要である。このほか合成部でM2
L,直交部で2MNL回程度の積和演算が必要である。
なお、HPの演算は適応符号ベクトルを決定するときに
求められているのでここでの演算量には含めない。
【0015】簡単のため、特にL=2の場合についてこ
の発明の処理の背景を説明する。Eをもう一度以下のよ
うに書き直す。 E=(XT oj+XT 1j2 /‖Uoj+U1j2 (6) 例えばB=12で、極性を除いて各系統に5ビットを割
り当てるとすると、N=32となる。このとき分子の積
和演算回数は64回に対し、分母のエネルギーは102
4回のベクトル演算を要する。従って、積和演算のみで
予備選択を行い、少数の候補ベクトルのみでエネルギー
を計算することで演算量を削減できる。(6)式の分子
の項D2 をdojとd1jにわけて展開する。
【0016】 D2 =−2(XT oj+XT 1j) =−2(doj+d1j) (7) doj=XT H[Coj−{(PT T HCoj)/‖HP‖2 }P] (8) d1j=XT H[C1j−{(PT T HC1j)/‖HP‖2 }P] (9) 上記のなかでHCの合成演算に多くの演算を必要とする
のでこれを避ける必要がある。その一つの方法が、音声
符号化における励振信号符号化法:特開平5−1006
97号公報に示されている。しかし、この発明では、さ
らに以下のように変形する。
【0017】 doj=XT HCoj−{(XT HP)/‖HP‖2 }PT T HCoj (10) doj=[X−{(XT HP)/‖HP‖2 }HP]T HCoj (11) すなわち、XをHPに直交させたX′を使って内積計算
をすればよいことが解る。 X′=X−(XT HP)HP/‖HP‖2 (12) doj=X′T HCoj (13) 同様に d1j=X′T HC1j (14) となる。D2 の計算の範囲ではXT HP,‖HP‖2
よびX′T Hを先に1回だけ計算しておけば数多くの乱
数ベクトルCijに対する合成演算(フィルタの畳み込
み)をする必要がなくなる。また乱数ベクトルCijに対
する内積演算も最小限に抑えられる。そこで各系統独立
にdoj,d1jを高速に計算し、それぞれの系統で内積の
大きなものから候補を残し、少ないベクトルの組み合わ
せで最終的な歪が最小となるものを選択する。この計算
手順をまとめて図1に示す。
【0018】一般のLについてXT HPおよび‖HP‖
2 の計算にM+M(ステップS1),X′T Hの計算にM
2 +M(S2 ,S3),またdijの演算(S4)にLMN回
の積和が必要である。さらにNのなかからnを選ぶソー
ティングもL回必要である(S5)。以上が予備選択で、
本選択は見かけ上、乱数符号帳のベクトル数が小さくな
って従来どおりの距離計算を行うことになる。
【0019】以上の例では適応符号帳からのPを第1段
階のベクトル、乱数符号帳からの乱数ベクトルCijを第
2段階のベクトルとする2段階の励振ベクトルの決定に
おける2段階目の探索にかかわる直交法を示した。n段
階(n≧3)以上でベクトルを決定する場合にも同様に
適用できることは明らかである。また乱数ベクトルC ij
の要素のほとんどが0であるようなベクトルの場合、そ
れを利用して予備選択の計算をさらに削減する方法と併
用することが可能である。
【0020】
【発明の効果】実施例で示したように、この発明よれば
乱数ベクトルの距離計算部において、数多くの乱数ベク
トルに対する合成フィルタ演算をまったく行わず、内積
演算の回数も最小化することができ、予備選択で絞られ
た候補についてのみエネルギーの計算を行うため、演算
量を大幅に削減することができる。この結果、M=8
0,L=2,N=32の条件で予備選択の部分の演算量
を比較すると特開平5−100697号公報で提案した
音声符号化における励振信号符号化法の約半分の演算量
で全く同じ結果が得られる。
【図面の簡単な説明】
【図1】この発明の乱数ベクトルを決定するための計算
手順を示す流れ図。
【図2】音声符号化における励振信号符号化法の一般的
構成の要部を示すブロック図。
【図3】乱数符号を最適に決定する従来の計算手順を示
す流れ図。
【図4】乱数符号を少ない演算で決定する従来の計算手
順を示す流れ図。
【符号の説明】
11 線形予測分析部 12 合成フィルタ 13 適応符号帳 14,15 乱数符号帳 16 ゲイン符号帳 X 入力音声ベクトル X′ 入力音声Xを合成フィルタ通過後にベクトルH
Pと直交させたベクトル P 適応符号帳から生成した符号ベクトル HP 合成フィルタを通った符号ベクトル H 合成フィルタのインパルス応答行列 g 利得 Cij 乱数ベクトル HCij 合成フィルタを通った乱数ベクトル Uij HCijをHPと直交させたベクトル d 歪 M ベクトルの次元数 L 乱数符号帳の数 N 乱数符号帳あたりのベクトル数

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 音声信号をフレーム単位で線形予測分析
    して予測係数を求め、ピッチ周期成分をもつ適応符号帳
    と複数の系統の乱数符号帳とからの各ベクトルの利得付
    き和を励振源として、先に求められた予測係数に基づい
    て合成された音声と入力音声との誤差を最小とするよう
    なピッチ周期、乱数ベクトルの符号、利得を決定する音
    声符号化法において、 第1段階で適応符号帳からのベクトルPを決定し、 第2段階で乱数ベクトルCijを探索する際に、入力音声
    Xを合成フィルタ通過後に第1段階のベクトルHPに直
    交させた信号X′を作り、X′Hと各乱数ベクトルCij
    との内積の値を基準に乱数ベクトルCijを選択すること
    を特徴とする励振信号直交化音声符号化法。
  2. 【請求項2】 請求項1記載の励振信号直交化音声符号
    化法においてXT P,‖HP‖2 ,X′=X−(XT
    P)HP/‖HP‖2 からX′T Hを予め計算し、X′
    T Hと乱数ベクトルCijとの内積dijの大きいものから
    順にn個を残し、このn個の内積を定める乱数ベクトル
    ijを予備選択することを特徴とする励振信号直交化音
    声符号化法。
  3. 【請求項3】 請求項1または2記載の励振信号直交化
    音声符号化法において、第n段階(n≧3)以後のベク
    トルの選択にも同様の方法を用いることを特徴とする励
    振信号直交化音声符号化法。
JP04351994A 1994-03-15 1994-03-15 励振信号直交化音声符号化法 Expired - Lifetime JP3293709B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04351994A JP3293709B2 (ja) 1994-03-15 1994-03-15 励振信号直交化音声符号化法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04351994A JP3293709B2 (ja) 1994-03-15 1994-03-15 励振信号直交化音声符号化法

Publications (2)

Publication Number Publication Date
JPH07253795A true JPH07253795A (ja) 1995-10-03
JP3293709B2 JP3293709B2 (ja) 2002-06-17

Family

ID=12666002

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04351994A Expired - Lifetime JP3293709B2 (ja) 1994-03-15 1994-03-15 励振信号直交化音声符号化法

Country Status (1)

Country Link
JP (1) JP3293709B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006505828A (ja) * 2002-11-08 2006-02-16 モトローラ・インコーポレイテッド 情報信号を符号化する方法および装置
WO2015025454A1 (ja) * 2013-08-22 2015-02-26 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声符号化装置およびその方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006505828A (ja) * 2002-11-08 2006-02-16 モトローラ・インコーポレイテッド 情報信号を符号化する方法および装置
JP4820934B2 (ja) * 2002-11-08 2011-11-24 モトローラ モビリティ インコーポレイテッド 情報信号を符号化する方法および装置
WO2015025454A1 (ja) * 2013-08-22 2015-02-26 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声符号化装置およびその方法

Also Published As

Publication number Publication date
JP3293709B2 (ja) 2002-06-17

Similar Documents

Publication Publication Date Title
EP0443548B1 (en) Speech coder
US7359855B2 (en) LPAS speech coder using vector quantized, multi-codebook, multi-tap pitch predictor
JP3151874B2 (ja) 音声パラメータ符号化方式および装置
JP3114197B2 (ja) 音声パラメータ符号化方法
JP3094908B2 (ja) 音声符号化装置
JP3196595B2 (ja) 音声符号化装置
JP3224955B2 (ja) ベクトル量子化装置およびベクトル量子化方法
JPH04134400A (ja) 音声符号化装置
JP2800618B2 (ja) 音声パラメータ符号化方式
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JPH05216500A (ja) 音声符号化装置
JP2624130B2 (ja) 音声符号化方式
JP2970407B2 (ja) 音声の励振信号符号化装置
JP2658816B2 (ja) 音声のピッチ符号化装置
JP3293709B2 (ja) 励振信号直交化音声符号化法
JP3353252B2 (ja) 音声符号化方法
JP3209248B2 (ja) 音声の励振信号符号化法
JP3228389B2 (ja) 利得形状ベクトル量子化装置
JP3153075B2 (ja) 音声符号化装置
JP3194930B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3471892B2 (ja) ベクトル量子化方法及び装置
JPH08185199A (ja) 音声符号化装置
JPH06282298A (ja) 音声の符号化方法
JP3229784B2 (ja) 音声符号化復号化装置及び音声復号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090405

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090405

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100405

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110405

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120405

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130405

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140405

Year of fee payment: 12

EXPY Cancellation because of completion of term