JPH07253795A - 励振信号直交化音声符号化法 - Google Patents
励振信号直交化音声符号化法Info
- Publication number
- JPH07253795A JPH07253795A JP6043519A JP4351994A JPH07253795A JP H07253795 A JPH07253795 A JP H07253795A JP 6043519 A JP6043519 A JP 6043519A JP 4351994 A JP4351994 A JP 4351994A JP H07253795 A JPH07253795 A JP H07253795A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- coding method
- random number
- speech coding
- random
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
演算量を低減する。 【構成】 第1段階で適応符号帳ベクトルPを決定し、
HP,XT HP,‖HP‖2 を計算する(S1 )。第2
段階で入力音声Xを合成フィルタ通過後に第1段階のベ
クトルHPと直交させた信号X′=X−(XT HP)H
P/‖HP‖2 と、X′T Hを計算、X′T Hと乱数ベ
クトルC0j,C1jによりd0j=X′T HC 0j,d1j=
X′T HC1jを計算(S3 ),d0jとd1jのそれぞれの
中の大きいものから順にn個をとり、そのn個のd0j及
びd1jと対応するC0j及びC1jを予備選択して残す(S
5 )。これら残された2n個のC0j,C1jについてU0j
とU1jをそれぞれ計算し、E={XT (U0j+U1j)}
2 /‖U0j+U1j‖2 を最大とするC0j,C1jを探す
(S6 )。その後、P,C0j,C1jの各ベクトルの利得
g 1 ,g2 の最適な組を探す(S7 )。
Description
り生じる歪をできるだけ小さく保ったまま、できるだけ
少ない情報量でディジタル符号化する音声符号化におけ
る励振信号音符号化法に関する。
して、原音声をフレームと呼ばれる5〜50ms程度の
一定間隔の区間に分割し、その1フレームの音声を周波
数スペクトルの包絡形状と、その包絡形状に対応する線
形フィルタを駆動するための駆動音源信号という2つの
情報に分離し、それぞれを符号化することが提案されて
いる。その場合、駆動音源信号を符号化する方法とし
て、駆動音源信号を音声の基本周波数(ピッチ周期)に
対応すると考えられる周期成分と、それ以外の成分(言
い換えれば非周期成分)とに分離して符号化する方法が
知られている。この駆動音源情報の符号化法として符号
駆動線形予測符号化( Code-Excited LinearPrediction
Coding:CELP )およびベクトル和駆動線形予測符号化
( Vector SumExcited Linear Prodiction Coding:VSEL
P )法がある。それぞれの技術については、M.R.Schroed
er and B.S.Atal :“Code-Excited Linear Prediction
(CELP):Highquality Speech at Very Low Bit Rate
s”,Proc.ICASSP'85,25.1.1,pp.937-940,1985 、およ
びI.A.Gerson and M.A.Jasiuk : "Vector Sum Excited
LinearPrediction (VSELP)Speech Coding at 8 kbps",
Proc. ICASSP'90,S9.3, pp.461-464,1990 、に述べられ
ている。
音声Xはフレームを単位として線形予測分析部11で線
形予測分析されて予測係数が算出され、量子化されたの
ち、補助情報として伝送されると共にまた合成フィルタ
12の係数として用いられる。励振源のうち適応符号帳
13の出力ベクトルはピッチ周期を決めることで決定さ
れる。一方図2の場合、2系統(チャネル)の乱数符号
帳14,15をもち、2つのベクトルの和で最終的な出
力と入力音声Xの歪が最小となる組合せを符号帳から選
択する。適応符号帳13からのベクトルと乱数符号帳1
4,15からのベクトルはそれぞれに最適な利得(ゲイ
ン)の組をゲイン符号帳16から探索して決定する。な
お、乱数符号帳が1乃至複数系統であるのがCELP
で、乱数符号帳の系統が割り当てられたビット数Bと同
じであって、各乱数符号帳に唯一の基本ベクトルしか持
たない場合がVSELPである。図2はこれらを一般化
し、特に2系統の例を示している。
に示す処理を行うことで、歪を小さくすることができ
る。まず適応符号帳13の出力ベクトルPを決定する
(ステップS1 )。次に各乱数ベクトルCij(i=0,
・・・L−1,j=0,・・・N−1,L:乱数符号帳
の数、N:乱数符号帳あたりのベクトル数)を合成フィ
ルタに通してHCijを作る(S2 )。Hはインパルス応
答行列である。次にHCijをHPと直交させてUijを作
る。
フレームから合成フィルタの応答分を除いたもの)とU
ijとの歪dを求め、 d=‖X−ΣUij‖2 (2) Σはi=0からL−1まで この歪dを最小化するベクトル番号J(0)・・・J
(L−1)を決める(S3)。
g2 を決定する(S4 )。 ‖X−{g1 HP+g2 H(ΣCij(0) )}‖2 (3) Σはi=0からL−1まで、ベクトルはすべてM次元と
している。図3の右に各ステップにおける計算回数を示
す。VSELPの場合には割り当てられるビット数Bが
例えば12の場合、これらの処理に関係するベクトルの
総数Tも12であるため、現実的な演算量の範囲で処理
が可能である。しかしながらCELPでは極性ビットを
除いた11ビットに対応する符号帳ベクトルの個数Tは
211個となり、膨大な演算量となり、実時間処理が困難
となる。
4に示すように合成フィルタ演算をできるだけ少なくし
て探索を行う方法(音声符号化における励振信号符号化
法:特開平5−100697号公報)を提案している。
先に提案した音声符号化法は適応符号帳ベクトルPを決
定し(ステップS1),次にXT H=a,PT HT H=
b,‖HP‖2 =Cをそれぞれ計算する(S2),Xは前
フレームからの応答分を除いた入力ベクトル、Hは合成
フィルタの伝達関数であるインパルス応答行列、HPは
ステップS1 で計算したものを用いる。
は、C0j−(bC0jP)/C=eを計算し(S3),さら
にd0j=deを計算し(S4),d0jのうち大きいものか
ら順にn個をとり、そのn個のd0jと対応するC0jを予
備選択として残す。同様に他方の乱数符号帳15につい
てd1jを求め、n個のC1jを予備選択して残す(S6),
これら残された2nの乱数ベクトルC0j,C1jについて
合成フィルタ12を通過させてHPと直交させてU0j=
HC0j−(bHP)/CおよびU1j=HC1j−(bH
P)/Cをそれぞれ計算し(S7),E={XT (U0j+
U1j)}2 /‖U0j+U1j‖2 を最大とするC0j,C1j
を探索し(S8),その後P,C0j,C1jの各ベクトルの
利得g1 ,g2 の最適な組を決定する(S9)。
信号符号化法によれば予備選択によりしぼられた2n個
の乱数ベクトル候補だけから歪が最小となる乱数ベクト
ルC 0j,C1jの組を探索するから演算処理量を図3の場
合より大幅に少なくすることができる。
に提案した音声符号化における励振信号符号化法によっ
ても予備選択に多くの演算量が要求される不都合があ
る。この発明の目的は、先に提案した音声符号化法より
予備選択に要する演算処理量を低減することができる励
振信号符号化法を提案しようとするものである。
フレーム単位で線形予測分析して予測係数を求め、ピッ
チ周期成分をもつ適応符号帳と複数の系統の乱数符号帳
としてからの各ベクトルの利得付き和を励振源として先
に求められた予測係数に基づいて合成された音声と入力
音声Xとの誤差を最小とするようなピッチ周期、乱数ベ
クトルの符号、利得を決定する音声符号化法において、
第1段階で適応符号帳からのベクトルPを決定し、ベク
トルPを合成フィルタ通過後のHPを求め、第2段階で
上記第1段階で求めたHPに直交させた信号X′を作
り、X′を合成フィルタを通過後のX′Hを求め、この
X′Hと乱数ベクトルCijとの内積値を基準に乱数ベク
トルCijを選択する。
HC1jを計算し、それぞれの大きいものから順にn個を
とり、そのn個のdojおよびd1jと対応する乱数ベクト
ルC ojおよびC1jを予備選択して残す。この予備選択の
手順を採ることにより、XTHP,‖HP‖2 および
X′T Hを先に1回だけ計算しておけば、数多くの乱数
ベクトルCijに対する合成演算を行う必要がなく、演算
量を低減することができる。
よる処理を説明する。図3の距離部の計算を展開する。 D=‖X−gΣUij‖2 =XT X−2gXΣUij+g2 ‖ΣUij‖2 (4) ここでL,M,Nはそれぞれ符号帳の系統(チャンネ
ル)数、ベクトルの次元数、系統あたりのベクトル数Σ
はi=0からL−1である。ゲインgは励振ベクトル決
定後に量子化するので、gは任意の値をとることができ
る。このときDの最小化はEの最大化と等価となる。
にMNL 回の積和演算が必要で、さらにNL 回の加減
算、除算、比較が必要である。このほか合成部でM2 N
L,直交部で2MNL回程度の積和演算が必要である。
なお、HPの演算は適応符号ベクトルを決定するときに
求められているのでここでの演算量には含めない。
の発明の処理の背景を説明する。Eをもう一度以下のよ
うに書き直す。 E=(XT Uoj+XT U1j)2 /‖Uoj+U1j‖2 (6) 例えばB=12で、極性を除いて各系統に5ビットを割
り当てるとすると、N=32となる。このとき分子の積
和演算回数は64回に対し、分母のエネルギーは102
4回のベクトル演算を要する。従って、積和演算のみで
予備選択を行い、少数の候補ベクトルのみでエネルギー
を計算することで演算量を削減できる。(6)式の分子
の項D2 をdojとd1jにわけて展開する。
のでこれを避ける必要がある。その一つの方法が、音声
符号化における励振信号符号化法:特開平5−1006
97号公報に示されている。しかし、この発明では、さ
らに以下のように変形する。
をすればよいことが解る。 X′=X−(XT HP)HP/‖HP‖2 (12) doj=X′T HCoj (13) 同様に d1j=X′T HC1j (14) となる。D2 の計算の範囲ではXT HP,‖HP‖2 お
よびX′T Hを先に1回だけ計算しておけば数多くの乱
数ベクトルCijに対する合成演算(フィルタの畳み込
み)をする必要がなくなる。また乱数ベクトルCijに対
する内積演算も最小限に抑えられる。そこで各系統独立
にdoj,d1jを高速に計算し、それぞれの系統で内積の
大きなものから候補を残し、少ないベクトルの組み合わ
せで最終的な歪が最小となるものを選択する。この計算
手順をまとめて図1に示す。
2 の計算にM+M(ステップS1),X′T Hの計算にM
2 +M(S2 ,S3),またdijの演算(S4)にLMN回
の積和が必要である。さらにNのなかからnを選ぶソー
ティングもL回必要である(S5)。以上が予備選択で、
本選択は見かけ上、乱数符号帳のベクトル数が小さくな
って従来どおりの距離計算を行うことになる。
階のベクトル、乱数符号帳からの乱数ベクトルCijを第
2段階のベクトルとする2段階の励振ベクトルの決定に
おける2段階目の探索にかかわる直交法を示した。n段
階(n≧3)以上でベクトルを決定する場合にも同様に
適用できることは明らかである。また乱数ベクトルC ij
の要素のほとんどが0であるようなベクトルの場合、そ
れを利用して予備選択の計算をさらに削減する方法と併
用することが可能である。
乱数ベクトルの距離計算部において、数多くの乱数ベク
トルに対する合成フィルタ演算をまったく行わず、内積
演算の回数も最小化することができ、予備選択で絞られ
た候補についてのみエネルギーの計算を行うため、演算
量を大幅に削減することができる。この結果、M=8
0,L=2,N=32の条件で予備選択の部分の演算量
を比較すると特開平5−100697号公報で提案した
音声符号化における励振信号符号化法の約半分の演算量
で全く同じ結果が得られる。
手順を示す流れ図。
構成の要部を示すブロック図。
す流れ図。
順を示す流れ図。
Pと直交させたベクトル P 適応符号帳から生成した符号ベクトル HP 合成フィルタを通った符号ベクトル H 合成フィルタのインパルス応答行列 g 利得 Cij 乱数ベクトル HCij 合成フィルタを通った乱数ベクトル Uij HCijをHPと直交させたベクトル d 歪 M ベクトルの次元数 L 乱数符号帳の数 N 乱数符号帳あたりのベクトル数
Claims (3)
- 【請求項1】 音声信号をフレーム単位で線形予測分析
して予測係数を求め、ピッチ周期成分をもつ適応符号帳
と複数の系統の乱数符号帳とからの各ベクトルの利得付
き和を励振源として、先に求められた予測係数に基づい
て合成された音声と入力音声との誤差を最小とするよう
なピッチ周期、乱数ベクトルの符号、利得を決定する音
声符号化法において、 第1段階で適応符号帳からのベクトルPを決定し、 第2段階で乱数ベクトルCijを探索する際に、入力音声
Xを合成フィルタ通過後に第1段階のベクトルHPに直
交させた信号X′を作り、X′Hと各乱数ベクトルCij
との内積の値を基準に乱数ベクトルCijを選択すること
を特徴とする励振信号直交化音声符号化法。 - 【請求項2】 請求項1記載の励振信号直交化音声符号
化法においてXT P,‖HP‖2 ,X′=X−(XT H
P)HP/‖HP‖2 からX′T Hを予め計算し、X′
T Hと乱数ベクトルCijとの内積dijの大きいものから
順にn個を残し、このn個の内積を定める乱数ベクトル
Cijを予備選択することを特徴とする励振信号直交化音
声符号化法。 - 【請求項3】 請求項1または2記載の励振信号直交化
音声符号化法において、第n段階(n≧3)以後のベク
トルの選択にも同様の方法を用いることを特徴とする励
振信号直交化音声符号化法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP04351994A JP3293709B2 (ja) | 1994-03-15 | 1994-03-15 | 励振信号直交化音声符号化法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP04351994A JP3293709B2 (ja) | 1994-03-15 | 1994-03-15 | 励振信号直交化音声符号化法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH07253795A true JPH07253795A (ja) | 1995-10-03 |
| JP3293709B2 JP3293709B2 (ja) | 2002-06-17 |
Family
ID=12666002
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP04351994A Expired - Lifetime JP3293709B2 (ja) | 1994-03-15 | 1994-03-15 | 励振信号直交化音声符号化法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3293709B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006505828A (ja) * | 2002-11-08 | 2006-02-16 | モトローラ・インコーポレイテッド | 情報信号を符号化する方法および装置 |
| WO2015025454A1 (ja) * | 2013-08-22 | 2015-02-26 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音声符号化装置およびその方法 |
-
1994
- 1994-03-15 JP JP04351994A patent/JP3293709B2/ja not_active Expired - Lifetime
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006505828A (ja) * | 2002-11-08 | 2006-02-16 | モトローラ・インコーポレイテッド | 情報信号を符号化する方法および装置 |
| JP4820934B2 (ja) * | 2002-11-08 | 2011-11-24 | モトローラ モビリティ インコーポレイテッド | 情報信号を符号化する方法および装置 |
| WO2015025454A1 (ja) * | 2013-08-22 | 2015-02-26 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音声符号化装置およびその方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3293709B2 (ja) | 2002-06-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0443548B1 (en) | Speech coder | |
| US7359855B2 (en) | LPAS speech coder using vector quantized, multi-codebook, multi-tap pitch predictor | |
| JP3151874B2 (ja) | 音声パラメータ符号化方式および装置 | |
| JP3114197B2 (ja) | 音声パラメータ符号化方法 | |
| JP3094908B2 (ja) | 音声符号化装置 | |
| JP3196595B2 (ja) | 音声符号化装置 | |
| JP3224955B2 (ja) | ベクトル量子化装置およびベクトル量子化方法 | |
| JPH04134400A (ja) | 音声符号化装置 | |
| JP2800618B2 (ja) | 音声パラメータ符号化方式 | |
| JP2002268686A (ja) | 音声符号化装置及び音声復号化装置 | |
| JPH05216500A (ja) | 音声符号化装置 | |
| JP2624130B2 (ja) | 音声符号化方式 | |
| JP2970407B2 (ja) | 音声の励振信号符号化装置 | |
| JP2658816B2 (ja) | 音声のピッチ符号化装置 | |
| JP3293709B2 (ja) | 励振信号直交化音声符号化法 | |
| JP3353252B2 (ja) | 音声符号化方法 | |
| JP3209248B2 (ja) | 音声の励振信号符号化法 | |
| JP3228389B2 (ja) | 利得形状ベクトル量子化装置 | |
| JP3153075B2 (ja) | 音声符号化装置 | |
| JP3194930B2 (ja) | 音声符号化装置 | |
| JP3192051B2 (ja) | 音声符号化装置 | |
| JP3471892B2 (ja) | ベクトル量子化方法及び装置 | |
| JPH08185199A (ja) | 音声符号化装置 | |
| JPH06282298A (ja) | 音声の符号化方法 | |
| JP3229784B2 (ja) | 音声符号化復号化装置及び音声復号化装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090405 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090405 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100405 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110405 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120405 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130405 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140405 Year of fee payment: 12 |
|
| EXPY | Cancellation because of completion of term |