JPH0473700A - 音声符号化方法 - Google Patents

音声符号化方法

Info

Publication number
JPH0473700A
JPH0473700A JP2184234A JP18423490A JPH0473700A JP H0473700 A JPH0473700 A JP H0473700A JP 2184234 A JP2184234 A JP 2184234A JP 18423490 A JP18423490 A JP 18423490A JP H0473700 A JPH0473700 A JP H0473700A
Authority
JP
Japan
Prior art keywords
codebook
signal
code book
sound source
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2184234A
Other languages
English (en)
Other versions
JP3102017B2 (ja
Inventor
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP02184234A priority Critical patent/JP3102017B2/ja
Publication of JPH0473700A publication Critical patent/JPH0473700A/ja
Application granted granted Critical
Publication of JP3102017B2 publication Critical patent/JP3102017B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声信号を低いビ・ントレート、特に8〜4
.8kb/s程度で高品質に符号化するための音声符号
化方式に関する。
(従来の技術) 音声信号を8〜4.8kb/s程度の低いビットレート
で符号化する方式としては、例えば、M、5chroe
der and B、Ata1氏による”Code−e
xcited 1inearpredict:on: 
 lIigh  quality  5peech  
at  very  lowbit rates″(P
roc、 TCASSP、 pp、937−940.1
985年)と題した論文(文献1)等に記載されている
CELP(Code Excited LPCCodi
ng)が知られている。この方法では、送信側では、フ
レーム毎(例えば2゜ms)に音声信号から音声信号の
スペクトル特性を表すスペクトルパラメータを抽出し、
フレームをさらに小区間サブフレーム(例えば5 ms
)に分割し、サブフレーム毎に過去の音源信号をもとに
長時間相関(ピッチ相関)を表す適応コードブックのピ
ッチパラメータを抽出し、ピッチパラメータによりサブ
フレームの音声信号を長期予測し、長期予測して求めた
残差信号に対して、予め定められた種類の雑音信号から
なるコードブックから選択した信号により合成した信号
と、音声信号との誤差電力を最小化するように一種類の
雑音信号を選択するとともに、最適なゲインを計算する
。そして選択された雑音信号の種類を表すインデクスと
ゲイン、ならびに、前記スペクトルパラメータとピッチ
パラメータを伝送する。
〔発明が解決しようとする課題] 上述した文献Iの従来方式では、高音質を得るためには
、一般に、雑音信号から構成されるコードブックのビッ
トサイズを10ビット以上にきわめて大きくする必要が
あるため、コードブックを探索して最適な雑音信号(コ
ードワード)を求めるために膨大な演算量が必要である
という問題点があった。さらに、コードブックが基本的
に雑音信号から構成されるために、コードブックから選
択された音源信号により再生された再生音声の音質は雑
音域がともなうという問題点があった。さらにビットレ
ートを低減するためにコードブックのサイズを低減させ
ると音質は急速に劣化するという問題点があった。
本発明の目的は、上述した問題点を解決し、比較的少な
い演算量およびメモリ量により、8〜4.8kb/s程
度で音質の良好な音声符号化方式を提供することにある
[課題を解決するための手段] 第1の発明は、入力した離散的な音声信号を予め定めら
れた時間長のフレームに分割し、前記音声信号のスペク
トル包絡を表すスペクトルパラメータを求めて出力し、
前記フレームを予め定められた時間長の小区間に分割し
、過去の音源信号をもとに再生した信号が前記音声信号
に近くなるようにピッチパラメータを求め、前記音声信
号の音源信号を第1のコードブックから選択した信号と
第2のコードブックから選択した信号との線形結合によ
り表す音声符号化方式において、前記第2のコ−ドブツ
クから選択した信号をもとに前記第1のコードブックを
修正することを特徴とする。
第2の発明は、入力した離散的な音声信号を予め定めら
れた時間長のフレームに分割し、前記音声信号のスペク
トル包絡を表すスペクトルパラメータを求めて出力し、
前記フレームを予め定められた時間長の小区間に分割し
、過去の音源信号をもとに再生した信号が前記音声信号
に近くなるようにピッチパラメータを求め、前記音声信
号の音源信号を第1のコードブックから選択した信号と
第2のコードブックから選択した信号との線形結合によ
り表す音声符号化方式において、前記第1のコードブッ
クから選択した信号をもとに前記第2のコードブックを
修正することを特徴とする。
第3の発明は、入力した離散的な音声信号を予め定めら
れた時間長のフレームに分割し、前記音声信号のスペク
トル包絡を表すスペクトルパラメ−夕を求めて出力し、
前記フレームを予め定められた時間長の小区間に分割し
、前記小区間毎にピッチパラメータを求めてピッチ予測
音源信号を求め、前記ピッチ予測音源信号とコードブッ
クから選択した信号とにより前記音声信号の音源信号を
表す音声符号化方式において、 前記ピッチ予測音源信号をもとに前記コードブックを修
正するか、あるいは、前記コードブックから選択した信
号により前記予測音源信号を修正することを特徴とする
〔作用] 本発明による音声符号化方式の作用を示す。
第1の発明では、フレームを分割したサブフレーム毎に
、下式を最小化するように音源信号を求める。
E=Σ [(x  (n)−βv  (n−M)  *
h  (n)−d (n)*h  (n)l  *w 
(n)]・ ・ ・ (1) ここでβ1Mは長期相関にもとづくピッチ予測(適応コ
ードブック)のピッチパラメータ、すなわちゲインおよ
び遅延であり、v (n)は過去の音源信号である。 
h (n)はスペクトルパラメータにより構成される合
成フィルタのインパルス応答、w (n)は聴感重み付
はフィルタのインパルス応答を示す。記号*は畳み込み
演算を示す。なお、w (n)の詳細については前記文
献1を参照できる。
また、d (n)はコードブックにより表される音源信
号を示し、下式のように、第1のコードブックから選択
されたコードベクトルc、(n)と第2のコードブック
から選択されたコードベクトルc−(n)との線形結合
で表される。
d (n) =ΣTtCt (n) =T+C+i (n) +rz
cz; (n)・ ・ ・ (2) ここで、Tt+7’zは、選択されたコードワードC1
(n)、C2、(n)のゲインを示す。従って、本発明
では、2種類のコードブックを分解して音源信号が表さ
れることになるため、各コードブックはコードブック全
体のビット数の1/2でよい。
例えばコードブック全体のビット数を10ビツトとする
と、第12のコードブックは例えば、5ピントずつでよ
く、コードブック探索の演算量を大幅に低減できる。
各コードブックとして前記文献lのような雑音コードブ
ックを用いる場合、(2)式のように分割すると、特性
的には10ビット分のコードブックよりも劣化し全体で
7〜8ビット分の性能しか出せない。
そこで、高性能を得るために、第1のコードブックはト
レーニングデータを用いて予め学習させることにより構
成する。学習によるコードブックの構成法としては、例
えば、L i nde らによる“AnAlgorit
hm for Vector Quantizatio
n De−sign”と題した論文(IEEE Tra
ns、 C0M−28,I)9.84−951980年
)(文献2)等が知られている。
学習のときの距離尺度としては、通常、2乗距離(ユー
クリッド距離)が用いられるが、本発明では2乗距離よ
りも性能の良好な次式による聴感重み付は距離尺度を用
いる。
=Σ [(t、(n) −C1(n)* h  (n)
)*W  (n)  )  ”           
  (3)ここでtJ(n)はj番目のトレーニングデ
ータ、c、(n)はクラスタ1のコードワードである。
クラスタlのセントロイド(代表コードワード)は、ク
ラスタl内のトレーニングデータを用いて(4)式ある
いは(5)式を最小化するように求める。
一Σ Σ [(tit (n) −3cL (n) *
 h  (n) 1*w  (n)  ) 2(4) =Σ Σ [(tjL(n)   g−set(n)*
h*w  (n)  ) ”           (
5)(5)式において、gは最適ゲインを示す。
次に、第2のコードブックは、第1のコードブックによ
るトレーニングデータ依存性を救済するために、第1の
コードブックの寄与分を音源信号から減算した残りの信
号に対して、前記文献2の方法により学習により求めた
コードブックや、前(n) 記文献1のガウス性雑音信号のような予め統計的特性が
確定した雑音信号あるいは乱数信号からなるコードブッ
クや、他の特性を有するコードブックを使用する。なお
、雑音コードブックに対して、ある距離尺度のもとて学
習を行うことにより、さらに特性が改善される。詳細は
、T0Moriya氏らによる”Transform 
Coding of 5peech using a 
Weighted Vector Quantizer
、”と題した論文(IEEEJ、Se1.^reas 
Commun、、 pp、425−43L 19B8年
)(文献3)等を参照することができる。
第1の発明では、第2のコードブックにより選択された
コードベクトルを用いて、第1のコードベクトルを修正
することに特徴がある。これは、第1のコードブックを
、入力信号の短時間特性に適応させ、少ないコードブッ
クサイズでより良好な特性を得るために行う。第1のコ
ードブックの修正は下式にしたがう。
C’lj (n) ”:(+j(n) +sign (r+)  ・sig
n (rz)  ・B°cz+(n)        
       (6)ここでBは収束を決める正の微小
量である。また、sign(T)はTの符号を表す。(
6)式にしたがい、送信側、受信側共に第1のコードブ
ックを修正する。
また、伝送路誤りに強くすると共に誤った修正の影響を
防くために、(6)弐の代りに下式を用いることもでき
る。
cl 、 J(n ) −(1−δ)−c、、(n)+A・δ’cz;(n)・
・・ (7) ここでδは、誤った修正を防くと共に、伝送路誤りの影
響を低減させるための正の微小量(例えば104〜10
−’) 、Aは下式で決まる収束係数である。
A−72/ r +                
(8)ここで、入力ベクトルと1段目で選択したベクト
ルとの誤差が小さくなれば、1段目と2段目のゲインの
比Tz/T+ は小さくなるので、修正が進みにくくな
る。
さらに、簡略化した(9)式や(10)式を用いること
もできる。
C’、j (n) =(1−δ)・C1J(n)十A・δ     (9)
C’lj (n) −(1−δ)・c+J(n) +sign (r+)  ・sign (rz)  ・
δ    (10)次に、第2の発明では、第2のコー
ドブックを第1のコートフックから選択されたコードベ
クトルを用いて修正する。修正には(11)式あるいは
、(12)式を用いる。
C’zi(n) =sigロ (T+)   ・ sign  (rz)
   ・ B  −C+j  (n)+ Czr (n
 )               (11)C’zi
(n) =A・δ−C1j (n)+ (l−δ)  −Chi
 (rl)・・・(12) また、簡略化した(13)、  (14)式を用いるこ
ともできる。
C’z((n) −”δ+(1−δ)  ・Chi (
n)・ ・ ・(13) +2゜(n) =sign (r+)  °sign (T2)  0
 δ+ (1−δ)  ・Czt (n)      
     (14)さらに第3の発明では、音声信号の
音源信号を、前記文献1のように適応コードブックとコ
ートフックとで表す。適応コードブックにより過去の音
源信号をもとに求めたピッチ予測音源信号を用いて、コ
ードブックで選択されたコードベクトルを修正する。修
正は(15)式あるいは(16)式に従う。
C′、(n) =sign (β)  ・sign (7+) B−v
 (n −M)±Cj ’(n )         
      (15)C′、(n) −A・δ−v (n−M) + (1−δ)−Cj(n
)・・・(16) ここでv(n−M)は、適応コードブックで求めたピッ
チ予測音源信号である。また、c=(n)はコードブッ
クから選択されたj番目のコードベクトルである。
また、簡略化した(17)、  (18)式を用いるこ
ともできる。
C′、(n) =A・δ+(1−δ) ・cJ(n)      (1
7)C’J(n) −sign (β)  ・sign(r+)  Hδ+
(1−δ)・C5(n )          (18
)また、コードブックから選択されたコードベクトルC
4(n)を用いてピンチ予測音源信号を修正することも
できる。
[実施例] 第1図は第1の発明による音声符号化方式を実施する音
声符号化装置を示すブロック図である。
送信側では、入力端子110から音声信号を入力し、1
フレ一ム分(例えば20m5 )の音声信号をバッファ
メモリ120に格納する。
LPG計算回路130は、フレームの音声信号のスペク
トル特性を表すパラメータとして、LSPパラメータを
フレームの音声信号から周知のLPG分析を行い、予め
定められた次数したけ計算する。この具体的な計算法に
ついては前記文献1を参照することかできる。
次にLSP量子化回路140は、LSPパラメータを予
め定められた量子化ビット数で量子化し、得た符号lk
をマルチプレクサ260へ出力するとともに、これを復
号化してさらに線形予測係数a;’(i=1〜L)に変
換して、重み付は回路200.インパルス応答計算回路
1701合成フィルタ281へ出力する。LSPパラメ
ータの符号化、 LSPパラメータから線形予測係数へ
の変換の方法については、Sugamura氏らによる
Quantizer design in LSP 5
peechanalysis−synthesis”と
題した論文(IEEE J、Sel。
Areas Commun、、 pp、432−440
.1988)  (文献4)等を参照することができる
サブフレーム分割回路150は、フレームの音声信号を
サブフレームに分割する。ここで例えばフレーム長は2
0m5、サブフレーム長は5msとする。
重み付は回路200は、減算した信号に対して周知の聴
感重み付けを行う。聴感重み付は関数の詳細は、前記文
献lを参照できる。
減算器190は、サブフレームに分割された人力信号か
ら合成フィルタ281の出力を減算して出力する。
適応コードブック210は、合成フィルタ281 の人
力信号v (n)を遅延回路206を介して入力し、さ
らにインパルス応答出力回路170から重み付はインパ
ルス応答hw (n) 、重み付は回路200から重み
付は信号を入力し、長期相関にもとづくピンチ予測を行
い、ピッチパラメータとして遅延Mとゲインβを計算す
る。以下の説明では適応コードブックの予測次数は1と
するが、2次以上の高次とすることもできる。1次の適
応コードブックにおける遅延M、ゲインβの計算法は、
Kleijin″Improved 5peech q
uality and efficient vect
or quantization in 5ELP”と
題した論文(Proc。
ICASSP、 pp、155−158.1988年)
(文献5)等に記載されている。さらに求めたゲインβ
をゲイン量子化器により予め定められた量子化ビット数
で量子化復号化し、ゲインβ′を求め、これを用いて次
式により予測信号9w(n)を計算し減算器205に出
力する。また遅延Mをマルチプレクサ260へ出力する
xw(n)−β’ −v (n−M) * h、 (n
)  (19)上式でv(n−M)は過去の音源信号で
、合成フィルタ281の入力信号である。h、(n)は
インパルス応答計算回路170で求めた重み付はインパ
ルス応答である。
遅延回路206は、合成フィルタ入力信号v (n)を
1サブフレ一ム分遅延させて適応コードブック210へ
出力する。
減算器205は、次式により重み付は回路200の出力
信号から適応コードブック210の出力を減算し、残差
信号e、(n)を第1のコードブック探索回路230に
出力する。
el、1(n)=x、1(n)−x、(n)     
 (20)インパルス応答計算回路170は、聴感重み
付けした合成フィルタのインパルス応答hl、(n)を
、予め定められたサンプル数りだけ計算する。具体的な
計算法は、前記文献1等を参照できる。
第1のコードブック探索回路230は、第1のコードブ
ック235を用いて最適なコードワードC1j(n)を
探索する。ここで作用の項に記したように、第1のコー
ドブックは、予めトレーニング信号を用いて学習してお
く。最適なコードベクトルC+=(n)の探索法は、特
願平2−42956号明細書(文献6)等を参照できる
。そして最適なゲインγ1を求め、これとC1j(n)
を用いて前記文献6の方法により重み付は再生信号yw
(n)を求め出力する。
減算器255は、ew(n)からy、(n)を減算して
第2のコードブック探索回路270へ出力する。
第2のコードブック探索回路270は、第2のコードブ
ック275から最適なコードワードを計算する。第2の
コードブック探索回路の構成は、第1のコードブック探
索回路の構成と基本的に同一の構成を用いることができ
る。また、コードワードの探索法としては、第1のコー
ドブック235の探索と同一の方法を用いることができ
る。第2のコードブックの構成法としては、作用の項で
述べたように、学習コードブックの高効率を保ちながら
トレーニングデータ依存性を救済するために、乱数系列
からなるコードブックを用いる。乱数系列からなるコー
ドブックの構成法は前記文献1を参照できる。
また、コードブック探索の演算量の低減化のために、第
2のコードブック275として、重畳型(0νerla
p)乱数コードブックを用いることができる。重畳型乱
数コードブックの構成法、コードワード探索法について
は前記文献5等を参照できる。
また、第1のコードブックと同様に予め学習して構成す
ることもできる。
ゲイン量子化器286は、作用に述べた方法により、予
め学習により(12)、 (13)式を用いて作成した
ゲインコードブンク287を用いて、ゲインγ、。
γ2をベクトル量子化する。詳細な前記文献6等を参照
できる。
修正回路280は、作用の項で述べた(6)〜(10)
式を用いて、第1のコードブック探索回路230におい
て選択されたコードベクトルC1j(n)の修正を行う
加算器290は、適応コードブック210の予測音源信
号と、第1のコードブック探索回路230の出力音源信
号と、第2のコードブック探索回路270の出力音源信
号とを加算して合成フィルタ281へ出力する。
合成フィルタ281は、加算器290の出力v (n)
を入力し、下式により合成音声を1フレーム分求め、さ
らにもう1フレ一ム分は0の系列をフィルタに入力して
応答信号系列を求め、1フレ一ム分の応答信号系列を減
算器190に出力する。
(0<η< 1 )   (21) ただし マルチプレクサ260は、LSP量子化回路140.適
応コードジンク210.第1のコードブック探索回路2
30.第2のコードブック探索回路270.ゲイン量子
化器286の出力符号系列を組みあわせて出力する。
以上で第1の発明の詳細な説明を終える。
第2図は、第2の発明による音声符号化方式を実施する
音声符号化装置を示すブロック図である。
図において、第1図と同一の番号を付した構成要素は、
第1図の構成要素と同一の動作を行うので説明を省略す
る。
修正回路380は、第1のコードブック探索回路230
において選択されたコードベクトルC1j(n)を用い
て、作用の項で述べた(11)〜(14)式にもとづき
、第2のコードブック探索回路270において選択され
たコードベクトルCz;(n)の修正を行つ。
以上で第2の発明の説明を終える。
第3図は、第3の発明による音声符号化方式を実施する
音声符号化装置を示すブロック図である。
図において、第1図と同一の番号を付した構成要素は、
第1図の構成要素と同一の動作を行うので説明を省略す
る。
音源コードブック探索回路430は、第1のコードブッ
ク探索回路230と同一の動作を行い、最適な音源信号
を音源コードブック435から選択する。
修正回路480は、適応コードブック210で求められ
たピンチ予測音源信号v(n−M)を用いて、(15)
〜(18)式を用いて、音源コードブック探索回路43
0により選択された音源信号C4、(n)の修正を行う
以上により第3の発明の詳細な説明を終える。
修正回路における修正方法においては、実施例で述べた
方法以外に、下記の方法を用いることもできる。例えば
、第1の発明を例にとると、C’lj (n) −(1−δ)  ・C+j (n) +sign・l 
T2/ ’r・δ・Cz+ (n)         
    (23)ここでsignは正あるいは負の符号
を示す。符号は次式を最小化する方を選択する。
E−Σ [et、+ (n)”−TIC’la (n)
* h、、(n)] 2          (24)
ここでe、1(n)は減算器205の出力信号である。
上式を最小化するには、上式をT1で偏微分してOとお
いた下式を最小化すればよい。
−r、X ew (n)fc’+; (n)*hw(n
)l k ”/Σ (C’+i (n)  *hw (
n))  2   (2,1))従って、(23)弐の
符号を正と負乙こした両者について(25)式を計算し
、(25)式がより大きな値をとる方の符号を1ピント
で伝送する。
第2および第3の発明においても上述と同様な構成をと
ることができる。
また、上述の実施例では、適応コートフ7・りのゲイン
、第1.第2のコードブックのゲイン、あるいは、適応
コードブックのゲインと音源コードブックのゲインには
同時最適化を施さなかったが、適応コードブック第1の
コードブック第2のコードブックのゲインについて、同
時最適化を行い、さらに特性を改善する。この同時最適
化は、第1.2のコードブックのコードベクトルを求め
るときになお、演算量の低減化のために、第1のコード
ブックのコードベクトル探索のときにのみゲイン最適化
を行い、第2のコードブックの探索のときには行わない
構成とすることもできる。
また、さらに演算量を低減するためには、コードブック
のコードへり!・ルの探索のときにはゲインの最適化を
行わずに、適応コードブックと第1のコードブックのゲ
インの同時最適化を行い、さらに、適応コードブックと
第1.2のコードブックのゲインを同時に最適化する構
成を用いることもできる。詳細は前記文献5等を参照で
きる。
また、さらに演算量を低減化するためには、第1.2の
コードブックのコードベクトルが選択された後に、適応
コードブックのゲインβと、第12のコードブックのゲ
インT++Tzの3種を同時に最適化するような構成と
することもできる。詳細は前記文献6等を参照できる。
また、第1のコードブックの探索法は実施例の方法以外
にも他の周知な方法を用いることができる。例えば、前
記文献1に記載の方法や、予めコードブックの各コード
ワードC+;(n)の直交変換CI(k)と求めて格納
しておき、サブフレーム毎に、重み付はインパルス応答
り。(n)の直交変換H,(k)と、残差信号e、(n
)の直交変換E1.1(k)を予め定められた点数だけ
求め、周波数軸上で探索することもできる。詳細は前記
文献5等を参照できる。
また、第2のコードブックの探索法としては、前記実施
例の方法以外にも上記で示した方法や、前記文献6に記
載の方法や、他の周知な良好な方法を用いることができ
る。
また、第2のコードブックの構成法としては、前記実施
例に記載した方法以外に、例えば予め膨大な乱数系列を
コードブックとして用意して、それらを用いてトレーニ
ングデータに対して乱数系列の探索を行い、選択される
頻度が高いものからコードワードとして登録して第2の
コードブックを構成することもできる。なお、この構成
法は、第1のコードブックの構成にも適用することがで
きる。
また、上記実施例では、適応コードブックのゲインと第
1.第2のコードブックのゲインは別々ニヘクトル量子
化したが、3種のゲインβ、TT2あるいはβ、T1を
まとめてベクトル量子化するような構成をとることもで
きる。詳細は前記文献5や、1.Gerson氏らによ
る”Vector sum excited 1ine
ar prediction” (VSELP) 5p
eech codingat 8kbp/s ” と題
した1命文(Proc、 ICASSP、 pp。
461−464.1990)  (文献7)等を参照で
きる。
また、前記実施例では、適応コードブ・ンクの次数は1
次としたが、2次以上の高次とすることもできる。また
、次数は1次のままで遅延を整数値ではなく小数値とす
ることもできる。これらについての詳細は、例えばP、
Kroon氏らによる’ P i tchpredic
tors with high temporal r
esolution”と題した論文(Proc、 IC
ASSP、 pp、661−664.1990)(文献
8)等を参照できる。以上のようにした方が特性は向上
するが、ゲインあるいは遅延の伝送に必要な情報量が若
干増大する。
また、前記の実施例では、スペクトルパラメータとして
にパラメータ、 LSPパラメータを符号化し、その分
析法としてLPG分析を用いたが、スペクトルパラメー
タとしては他の周知なパラメータ、例えばLPCケプス
トラム、ケプストラム、改良ケプヌトラム、一般化ケプ
スドラム、メルケブストラムなどを用いることもできる
。また各パラメータに最適な分析法を用いることができ
る。
また、フレームで求めたLPC係数をLSP上や線形予
測係数上でサブフレーム毎に補関し、補間した係数を用
いて適応コードブック、第1.第2のコードブックの探
索を行う構成としてもよい。このような構成とすること
により、音質がさらに改善される。
また、LSP係数は周知の方法により、ベクトル量子化
あるいはへクトルースカラ量子化することにより、さら
に効率的に符号化することができる。
ヘクトルースカラ量子化の方法については例えば前記文
献3等を参照できる。
また、受信側では、量子化雑音を整形することにより聴
覚的に聞き易くするために、ピッチとスペクトル包絡の
少なくとも1つについて動作する適応形ポストフィルタ
を付加してもよい。適応型ポストフィルタの構成につい
ては、例えば、Kroon氏らによる”A C1ass
 of Analysis−by−synthesis
Predictive  Coders  for  
)figh  [1uality  5peechCo
din(Hat Rates  betiyeen 4
.8 and  16kb/s、”  (JEEEJS
AC,vol、6.2.353−363.1988) 
(文献9)等を参照できる。
〔発明の効果〕
以上述べたように、本発明によれば、第1あるいは第2
のコードブックにより選択されたコードベクトルを、第
2あるいは第1のコードブックにより選択されたコード
ベクトルをもとに修正するか、あるいは、適応コードブ
ックにより選択されたピッチ予測音源信号をもとに音源
コードブ・ンクにより選択されたコードベクトルを修正
するか、あるいは、前記コードベクトルによりピッチ予
測音源信号を修正しているので、コードブックの特性を
人力信号の特性に適応化させることが可能となり、低ビ
ツトレートにおいてコードブックサイズを低減しても従
来方式よりも良好な特性が得られるという大きな効果が
ある。
【図面の簡単な説明】
第1図は第1の発明による音声符号化方式を実施する音
声符号化装置を示すブロック図、第2図は第2の発明に
よる音声符号化方式を実施する音声符号化装置を示すブ
ロック図、第3図は第3の発明による音声符号化方式を
実施する音声符号化装置を示すブロック図である。 110  ・・・・・バッファメモリ 130  ・・・・・LPC計算回路 140  ・・・・・量子化回路 150  ・・・・・サブフレーム分割回路170  
・・・・・インパルス応答計算回路190、205.2
55  ・・・減算器200  ・・・・・重み付は回
路 206  ・・・・・遅延回路 210  ・・・・・適応コードブック230  ・・
・・・第1のコードブック探索回路235  ・・・・
・第1のコードブック281  ・・・・・合成フィル
タ 270  ・・・・・第2のコードブック探索回路27
5  ・・・・・第2のコードブンク380、480 
 ・・・修正回路 ・・・・・ゲイン量子化器 ・ ・・ ・ ・ゲインコードブック ・・・・・音源コードブック探索回路 ・・・・・音源コードブック

Claims (3)

    【特許請求の範囲】
  1. (1)入力した離散的な音声信号を予め定められた時間
    長のフレームに分割し、前記音声信号のスペクトル包絡
    を表すスペクトルパラメータを求めて出力し、前記フレ
    ームを予め定められた時間長の小区間に分割し、過去の
    音源信号をもとに再生した信号が前記音声信号に近くな
    るようにピッチパラメータを求め、前記音声信号の音源
    信号を第1のコードブックから選択した信号と第2のコ
    ードブックから選択した信号との線形結合により表す音
    声符号化方式において、 前記第2のコードブックから選択した信号をもとに前記
    第1のコードブックを修正することを特徴とする音声符
    号化方式。
  2. (2)入力した離散的な音声信号を予め定められた時間
    長のフレームに分割し、前記音声信号のスペクトル包絡
    を表すスペクトルパラメータを求めて出力し、前記フレ
    ームを予め定められた時間長の小区間に分割し、過去の
    音源信号をもとに再生した信号が前記音声信号に近くな
    るようにピッチパラメータを求め、前記音声信号の音源
    信号を第1のコードブックから選択した信号と第2のコ
    ードブックから選択した信号との線形結合により表す音
    声符号化方式において、 前記第1のコードブックから選択した信号をもとに前記
    第2のコードブックを修正することを特徴とする音声符
    号化方式。
  3. (3)入力した離散的な音声信号を予め定められた時間
    長のフレームに分割し、前記音声信号のスペクトル包絡
    を表すスペクトルパラメータを求めて出力し、前記フレ
    ームを予め定められた時間長の小区間に分割し、前記小
    区間毎にピッチパラメータを求めてピッチ予測音源信号
    を求め、前記ピッチ予測音源信号とコードブックから選
    択した信号とにより前記音声信号の音源信号を表す音声
    符号化方式において、 前記ピッチ予測音源信号をもとに前記コードブックを修
    正するか、あるいは、前記コードブックから選択した信
    号により前記予測音源信号を修正することを特徴とする
    音声符号化方式。
JP02184234A 1990-07-13 1990-07-13 音声符号化方法 Expired - Lifetime JP3102017B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02184234A JP3102017B2 (ja) 1990-07-13 1990-07-13 音声符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02184234A JP3102017B2 (ja) 1990-07-13 1990-07-13 音声符号化方法

Publications (2)

Publication Number Publication Date
JPH0473700A true JPH0473700A (ja) 1992-03-09
JP3102017B2 JP3102017B2 (ja) 2000-10-23

Family

ID=16149725

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02184234A Expired - Lifetime JP3102017B2 (ja) 1990-07-13 1990-07-13 音声符号化方法

Country Status (1)

Country Link
JP (1) JP3102017B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5432883A (en) * 1992-04-24 1995-07-11 Olympus Optical Co., Ltd. Voice coding apparatus with synthesized speech LPC code book
JPH0844398A (ja) * 1994-08-02 1996-02-16 Nec Corp 音声符号化装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01232829A (ja) * 1988-03-12 1989-09-18 Graphics Commun Technol:Kk 学習型多段ベクトル量子化方法と装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01232829A (ja) * 1988-03-12 1989-09-18 Graphics Commun Technol:Kk 学習型多段ベクトル量子化方法と装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5432883A (en) * 1992-04-24 1995-07-11 Olympus Optical Co., Ltd. Voice coding apparatus with synthesized speech LPC code book
JPH0844398A (ja) * 1994-08-02 1996-02-16 Nec Corp 音声符号化装置

Also Published As

Publication number Publication date
JP3102017B2 (ja) 2000-10-23

Similar Documents

Publication Publication Date Title
EP0409239B1 (en) Speech coding/decoding method
KR100264863B1 (ko) 디지털 음성 압축 알고리즘에 입각한 음성 부호화 방법
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
JP4064236B2 (ja) 広帯域信号コーディング用の代数コードブック中のパルス位置と符号の索引付け方法
JP3143956B2 (ja) 音声パラメータ符号化方式
JPH0854898A (ja) 音声符号化装置
JPH0473700A (ja) 音声符号化方法
JP2956068B2 (ja) 音声符号化復号化方式
JP3232701B2 (ja) 音声符号化方法
JP3662597B2 (ja) 一般化された合成による分析音声符号化方法と装置
US7716045B2 (en) Method for quantifying an ultra low-rate speech coder
JP3252285B2 (ja) 音声帯域信号符号化方法
JP3194930B2 (ja) 音声符号化装置
JP3256215B2 (ja) 音声符号化装置
JP3089967B2 (ja) 音声符号化装置
JP3296411B2 (ja) 音声符号化方法および復号化方法
JP3578933B2 (ja) 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体
JP3192051B2 (ja) 音声符号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3092436B2 (ja) 音声符号化装置
JPH08320700A (ja) 音声符号化装置
JPH0455899A (ja) 音声信号符号化方式
JP3144244B2 (ja) 音声符号化装置
JPH08202398A (ja) 音声符号化装置
JP2808841B2 (ja) 音声符号化方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070825

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080825

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080825

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090825

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090825

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100825

Year of fee payment: 10

EXPY Cancellation because of completion of term