JPH041800A - 音声帯域信号符号化方法 - Google Patents
音声帯域信号符号化方法Info
- Publication number
- JPH041800A JPH041800A JP2101834A JP10183490A JPH041800A JP H041800 A JPH041800 A JP H041800A JP 2101834 A JP2101834 A JP 2101834A JP 10183490 A JP10183490 A JP 10183490A JP H041800 A JPH041800 A JP H041800A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- codebook
- signals
- gain
- code book
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims description 37
- 230000005236 sound signal Effects 0.000 claims description 18
- 230000003595 spectral effect Effects 0.000 claims description 14
- 238000012549 training Methods 0.000 abstract description 12
- 230000008878 coupling Effects 0.000 abstract 2
- 238000010168 coupling process Methods 0.000 abstract 2
- 238000005859 coupling reaction Methods 0.000 abstract 2
- 238000004364 calculation method Methods 0.000 description 30
- 230000003044 adaptive effect Effects 0.000 description 21
- 238000013139 quantization Methods 0.000 description 18
- 238000003786 synthesis reaction Methods 0.000 description 16
- 230000015572 biosynthetic process Effects 0.000 description 14
- 230000004044 response Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000005311 autocorrelation function Methods 0.000 description 5
- 238000005314 correlation function Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000007774 longterm Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000059 patterning Methods 0.000 description 1
- 102220110933 rs151253274 Human genes 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
Abstract
め要約のデータは記録されません。
Description
ム信号を低いビットレート、特に8〜4.8kb/s程
度で高品質に符号化するための音声帯域信号符号化方式
に関する。
で符号化する方式としては、例えば、M、5chroe
derand B、Ata1氏による°’Code−e
xctted 1inear predi−ction
: Fligh Quality 5peech at
very low bitrates” (Proc
、ICASSP、 pp、937−940.1985年
)と題した論文(文献1)等に記載されているCBLP
(Code Excited LPCCoding)が
知られている。この方法では、送信側では、フレーム毎
(例えば20n+s )に音声信号から音声信号のスペ
クトル特性を表すスペクトルパラメータを抽出し、フレ
ームをさらに小区間サブフレーム(例えば5m5)に分
割し、サブフレーム毎に過去の音源信号をもとに長時間
相関(ピッチ相関)を表すピッチパラメータを抽出し、
ピッチパラメータによりサブフレームの音声信号を長期
予測し、長期予測して求めた残差信号に対して、予め定
められた種類の雑音信号からなるコードブックから選択
した信号により合成した信号と、音声信号との誤差電力
を最小化するように一種類の雑音信号を選択するととも
に、最適なゲインを計算する。そして選択された雑音信
号の種類を表すインデクスとゲイン、ならびにスペクト
ルパラメータとピッチパラメータを伝送する。
、一般に、雑音信号から構成されるコードブックのビッ
トサイズを10ビット以上に極めて大きくする必要があ
るため、コードブックを探索して最適な雑音信号(コー
ドワード)を求めるために膨大な演算量が必要であると
いう問題点があった。さらに、コードブックが基本的に
雑音信号から構成されるために、コードブックから選択
された音源信号により再生された再生音声の音質は雑音
感が伴うという問題点があった。
したときに、コードブックがモデムに最適でないために
、特性が劣化するという問題点があった。
い演算量及びメモリ量により、8〜4.8kb/s程度
で音質が良好で、かつ音声帯域のモデム信号に対しても
良好な特性の得られる音声帯域信号符号化方式を提供す
ることにある。
められた時間長のフレームに分割し、前記入力信号のス
ペクトラム包絡を表すスペクトルパラメータを求めて出
力し、前記フレームを予め定められた時間長の小区間に
分割し、過去の音源信号をもとに再生した信号が前記入
力信号に近くなるようにピッチパラメータを求め、音声
信号ならびに前記音声信号以外の音声帯域信号をもとに
予め学習して構成した異なる複数種類の第1のコードブ
ックから選択した信号と、予め定められた特性を有する
信号が格納された第2のコードブックから選択した信号
との線形結合により前記入力信号の音源信号を表して出
力することを特徴とする。
められた時間長のフレームに分割し、前記入力信号のス
ペクトラム包絡を表すスペクトルパラメータを求めて出
力し、前記フレームを予め定められた時間長の小区間に
分割し、過去の音源信号をもとに再生した信号が前記入
力信号に近くなるようにピッチパラメータを求め、音声
信号ならびに前記音声信号以外の音声帯域信号をもとに
予め学習して構成した異なる複数種類の第1のコードブ
ックから選択した信号と、予め定められた特性を有する
信号が格納された第2のコードブックから選択した信号
との線形結合により前記入力信号の音源信号を表し、予
め構成した第3のコードブックを用いて前記ピッチパラ
メータあるいは前記音源信号のゲインの少なくとも一方
を量子化して出力することを特徴とする。
。
、下式を最小化するように、入力音声帯域信号を表す音
源信号を求める。
n) ]2(1)ここでx (n)は音声帯域信号、β
9Mは長期相関にもとづくピッチ予測(適応コードブッ
ク)のピッチパラメータ、すなわちゲイン及び遅延であ
り、v (n)は過去の音源信号である。h (n)は
スペクトルパラメータにより構成される合成フィルタの
インパルス応答、w (n)は聴感型み付はフィルタの
インパルス応答を示す。記号*は畳み込み演算を示す。
きる。
号を示し、下式のように、第1のコードブックから選択
されたコードワードCt (n)と第2のコードブック
から選択されたコードワードc、(n)との線形結合で
表される。
(n)+rzCz=(n) (2)ここで11.T
zは選択されたコードワードC,j(n)、Czi (
n)のゲインを示す。従って、本発明では、2種類のコ
ードブックに分解して音源信号が表されることになるた
め、各コードブックはコードブック全体のビット数の1
/2でよい。
と、第1.第2のコードブックは5ビツトずつでよく、
コードブック探索の演算量を大幅に低減できる。
ックを用い、(2)式のように分割すると、特性的には
10ビット分のコードブックよりも劣化し全体で7〜8
ビット分の性能しか出せない。
ドブックはトレーニングデータを用いて予め学習させる
ことにより構成する。ここで第1のコードブックとして
は、音声信号に対して学習したコードブックと、音声以
外の音声帯域信号に対して学習したコードブックとを有
する。以下では、入力信号として、音声信号と音声帯域
のモデム信号とを対象とし、音声信号に対して最適に学
習したコードブックと、音声帯域のモデム信号に対して
最適に学習したコードブックとの2種類を第1のコード
ブックとして有するものとする。
indeらによる“^n Algorithm for
VectorQuantization Desig
n”と題した論文(IEEE Trans。
2)等が知られている。
クリッド距離)が用いられるが、本発明では2乗距離よ
りも性能の良好な次式による聴感型み付は距離尺度を用
いる。
)ここでtj(n)はj番目のトレーニングデータ、c
、(n)はクラスタ1のコードワードである。
ラスタ1内のトレーニングデータを用いて(4)式ある
いは(5)弐を最小化するように求める。
*h(n) 1w (n)) 2 E=Σ Σ [(t++ (n) g −3et
(n)*h (n))1w (n))”
(5)(5)式においてgは最適ゲインを示す。
るトレーニングデータ依存性を救済するために、前記文
献1のガウス性雑音信号のような予め統計的特性が確定
した雑音信号あるいは乱数信号からなるコードブックや
、他の特性を有するコードブックを使用する。なお、雑
音コードブックに対して、ある距離尺度のもとて選別を
行うことにより、さらに特性が改善される。詳細はT、
?toriya氏らによる“↑ransform Co
ding of Speechusing a Wei
ghted Vector Quantizer、”
と題した論文(IEEE、 J、Sel、 Areas
、 Commun、+ pp、425−43L1989
年)(文献3)等を参照することができる。
号との誤差信号を用いて第2のコードブックを学習によ
り構成することもできる。
コードワードを選択した後に、ピッチパラメータのゲイ
ンと第1.第2のコードブックのゲインγ1.T2の少
なくとも一つを、予め学習により構成したコードブック
(第3のコードブック)を用いて効率的にベクトル量子
化する。
量子化するとすると、ベクトル量子化において、最適コ
ードワードの探索は、次式を最小化するコードワードを
選択する。
*h (n)−Σ r’sci (n)* h
(n))*w (n)]・ ・ ・ (C6 ここでγ′五は各コードワードの示すベクトル量子化し
たゲインの値である。またc=(n)は、第1.第2の
コードブックから選択されたコードワードである。(6
)式において、 ew (n)=x (n)*w (n)−βv(n−M
)*h (n) *w (n) (7)とす
ると、(6)、 (7)式から次式を得る。
(n) (9)s、z (n)=(、(n)* h
(n)*w (n)(10)である。また、(8)
式の第1項は定数であるから、コードワードの探索は(
8)式の第2項を最大化するものを選択すればよい。
には、下式に従いコードワードの選択を行ってもよい。
インの値からなるトレーニングデータを用いて予め学習
により構成する。コードブックの学習には前記文献2の
方法を用いることができる。
らに特性を改善するために、次式の距離尺度を用いる。
−ΣT’=IC4(n)*h (n)*w (n))”
・・・(12) ここでγt、はトレーニング用のゲインデータである。
表コードワードである。
けるセントロイドSc、、は次式を最小化するように求
める。
n)− Σ Sct+c= (n)*h (n)*w
(n)]・ ・ ・(13) 一方、学習における演算量を大幅に低減するためには通
常の2乗距離による次式の距離尺度を用いてもよい。
(14)〔実施例〕 第1図は、第1の発明による音声帯域符号化方式の一実
施例に適用される音声帯域信号符号化装置を示すブロッ
ク図である。
を入力し、■フレーム分(例えば20ss )の音声信
号をバッファメモリ110に格納する。
トル特性を表すパラメータとして、LSPパラメータを
フレームの音声信号から周知のLPG分析を行い予め定
められた次数りだけ計算する。この具体的な計算法につ
いては前記文献1を参照することができる。次にLSP
量子化回路140は、LSPパラメータを予め定められ
た量子化ビット数で量子化し、得た符号lkをマルチプ
レクサ260へ出力するとともに、これを復号化してさ
らに線形予測係数ai+ (i=1〜L)に変換して
重み付は回路200.インパルス応答計算回路1701
合成フィルタ281へ出力する。LSPパラメータの符
号化、LSPパラメータから線形予測係数への変換の方
法についてはSugamura氏らによる”Quant
ize Design 1nLSP 5peech A
nalysis−Synthesis”と題した論文(
IEEE J、Sel、 Areas、 Commun
、+ pp、432−440+1988年)(文献4)
等を参照することができる。
域信号をサブフレームに分割する。ここで例えばフレー
ム長は2011s、サブフレーム長は511ISとする
。
ら合成フィルタ281の出力を減算して出力する。
感重み付けを行う。聴感重み付は関数の詳細は前記文献
1を参照できる。
信号v (n)を遅延回路206を介して入力し、さら
にインパルス応答出力回路170から重み付はインパル
ス応答り。(n)、重み付は回路200から重み付は信
号を入力し、長期相関にもとづくピッチ予測を行い、ピ
ッチパラメータとして遅延Mとゲインβを計算する。以
下の説明では適応コードブック210の予測次数は1と
するが、2次以上の高次とすることもできる。1次の適
応コードブックにおける遅延M、ゲインβの計算法は、
Kleijin ”Improved 5pee
ch quality and efficie
ntvector quantization in
5ELP″と題した論文(ICASSP、 pp、15
5−158年、1988年)(文献5)等に記載されて
いる。さらに求めたゲインβをゲイン量子化器220に
より予め定められた量子化ビット数で量子化復号化し、
ゲインβ′を求め、これを用いて次式により予測信号’
Qw(n)を計算し減算器205に出力する。また遅延
Mをマルチプレクサ260へ出力する。
) (19)上式でv(n−M)は過去の音源信号で
、合成フィルタ281の入力信号である。hw(n)は
インパルス応答計算回路170で求めた重み付はインパ
ルス応答である。
1サブフレ一ム分遅延させて適応コードブック210へ
出力する。
応コードブック210の出力を減算し次式の残差信号e
、(n)を第1のコードブック探索回路230に出力す
る。
0)インパルス応答計算回路170は、聴感重み付けし
た合成フィルタのインパルス応答hw(n)を予め定め
られたサンプル数したけ計算する。具体的な計算法は、
前記文献1等を参照できる。
て学習して構成したコードブック235と音声帯域モデ
ム信号に対して学習して構成したコードブック236と
の両者を探索し、用いて最適なコードワードC+j(n
)を探索する。ここで作用の項に記したように、コード
ブック235.236は、あらかじめトレーニング信号
を用いて学習しておく。
すブロック図である。コードワードの探索は下式に従う
。
)式をγ1で偏微分して0とおくことにより得た下式を
用いる。
ただし GJ = Σ e、(n) (c、J(n)*hw(
n))・ ・ ・(23) このとき(21)式は となる。ここで(25)式の第1項は定数であるので、
第2項を最大化するようにコードブック235゜236
の各々を全て探索してコードワードCj (n)を選択
し、(22)式からゲインT、を計算する。
3)式の計算を行い、自己相関関数計算回路420は(
24)式の計算を行い、判別回路430は(25)式の
計算を行い、コードワードCj (n)を選択し、それ
を表すインデクスを出力する。
は、以下の方法を用いることもできる。
(27)CJ=tt (0)Vm (0)+2 芥u
(i)Vm (i)・ ・ ・(28) ここでtt (i)、vm(i)は、それぞれり、(n
)のi次遅れの自己相関、コードワードc+*(n)の
i次遅れの自己相関を示す。
をマルチプレクサ260に出力する。また、選択された
コードワードC4(n)を乗算器241に出力する。ま
た、2種のコードブック235.236のうち、いずれ
のコードブックを用いるかの判別符号をマルチプレクサ
260に出力する。つまり、最適なコードワードCj(
n)がコードブック235から選択されたときは、コー
ドブック235を示す符号を、コードブック236から
選択されたときはコードブック236を示す符号を出力
する。
1を下式により乗じて次式の音源信号q (n)を求め
合成フィルタ250へ出力する。
(29)合成フィルタ250は乗算器241の出力q
(n)を入力し、下式に従い重み付は合成信号yw
(n)を求め出力する。
(30)減算器255は、e、(n)からy、(
n)を減算して第2のコードブック探索回路270へ出
力する。
ック275から最適なコードワードを計算する。第2の
コードブック探索回路の構成は、第2図に示した第1の
コードブック探索回路の構成と基本的に同一の構成を用
いることができる。また、コードワードの探索法として
は、第1のコードブックの探索と同一の方法を用いるこ
とができ、第2のコードブックの構成法としては、作用
の項で述べたように、学習コードブックの高効率を保ち
ながらトレーニングデータ依存性を救済するために、乱
数系列からなるコードブックを用いる。乱数系列からな
るコードブックの構成法は前記文献2を参照できる。
2のコードブックとして、重畳型(overlap )
乱数コードブックを用いることができる。
については、前記文献2等を参照できる。
め学習により前記(12)、 (13)式を用いて音声
信号に対して最適に作成したゲインコードブック287
と、音声帯域モデム信号に対して最適に作成したコード
ブック288とを用いて、ゲインT、。
前記(8)弐を用いる。
である。図において、再生回路505は、c+(n)、
cz(n)、h、(n)を入力して前記(9)式、 (
10)式にもとづき、Sw+(n)。
10は、eユ(n)、再生回路505の出力であるSw
l (n) 、SwZ (n) %ゲインコードブック
287.288の出力であるコードワードを入力し、前
記(8)式の第2項以下の各項を計算する。最大値判別
回路520は、コードブック287.288を併せて第
(8)弐の第2項以下の最大値を判別し、そのときのコ
ードワードを示すインデクスを出力する。
を復号化して出力する。そしてコードブックのインデク
スをマルチプレクサ260に出力する。
出力する。
されたコードワードC,(n)、c、(n)に対してそ
れぞれ量子化復号化したゲインγ1′。
を入力し、下式により合成音声を1フレーム分求め、さ
らにもう1フレ一ム分はOの系列をフィルタに入力して
応答信号系列を求め、1フレ一ム分の応答信号系列を減
算器190に出力する。
のコードブック探索回路230.第2のコードブック探
索回路270.ゲイン量子化器286の出力符号系列を
組みあわせて出力する。
る。図において、第1図と同一の番号を付した構成要素
は、第1図と同一の動作を行うので説明を省略する。
7)式にもとづき予め学習して構成したコードブック2
26を用いて、適応コードブックのゲインをベクトル量
子化する。最適なコードワードの選択には前記(15)
式を用いる。さらに量子化器225は、選択されたコー
ドワードのインデクスを示す符号をマルチプレクサ26
0へ出力すると共に、ゲインを量子化復号化して出力す
る。
2のコードブックのゲインには同時最適化を施さなかっ
たが、適応コードブック、第1のコードブック、第2の
コードブックのゲインについて、同時最適化を行い、さ
らに特性を改善する。
2のコードブックのコードワードを求めるときに適用す
るとさらに特性が改善される。
に、第1のコードブックのコードワードC1j(n)、
ゲインTIを探索するときに、各コードワード毎に、次
式を最小化するように解いてβとT1を同時最適化する
。
(n)−rIcrJ(n)*h (n))*w (
n)]”ここで、 ・ ・ ・ (35a) R32= *h、(n)) ・ ・ ・ (35b) ・ ・ ・ (35d) Pz= Σ x、(n) (C+= (n)*hw(
n))・ ・ ・ (35e) である。
小化するように適応コードブックのゲイン、第1.第2
のコードブックのゲインを同時最適化する。
h (n) ) *w (n) コ ”
(36)なお、減算量の低減化のため
に、第1のコードブックのコードワード探索のときに前
記(33)式によるゲイン最適化を行い、第2のコード
ブックの探索のときには行わない構成とすることもでき
る。
のコードワードの探索のときにはゲインの最適化を行わ
ずに、第1のコードブックのコードワードが選択された
ときに、適応コードブックと第1のコードブックのゲイ
ンの同時最適化を行い、第2のコードブックのコードワ
ードが選択されたときには、適応コードブックと第1.
第2のコードブックのゲインを同時に最適化する構成を
用いることもできる。
のコードブックのコードワードが選択された後に、適応
コードブックのゲインβと、第1゜第2のコードブック
のゲインT In T zの3種を同時に最適化するよ
うな構成とすることもできる。
ブックのゲインγ1.γ2のベクトル量子化における最
適コードワードの選択には、演算量低減化のためにそれ
ぞれ前記(18)式、 (11)式を用いることもでき
る。
ーム毎にコードブック235.236のいずれから最適
なコードワードが選択されたかを判別して、ゲインのベ
クトル量子化を行うときに、この判別信号を用いて、コ
ードブック287.288を予め選択しておき片方のみ
のゲインコードブックを探索するようにしてもよい。こ
のような構成とすることにより、ゲインコードブックは
両方を探索する必要がないので、演算量を低減化できる
。
法は実施例の方法以外にも他の周知な方法を用いること
ができる。例えば、前記文献1に記載の方法や、予めコ
ードブックの各コードワードC1j(n)の直交変換C
I (k)を求めて格納しておき、サブフレーム毎に、
重み付はインパルス応答hw(n)の直交変換H,(k
)と、残差信号e、(n)の直交変換E、(k)を予め
定められた点数だけ求め、前記(13)、 (14)式
の代わりに下式を用いてもよい。
k))(O≦に≦N −1) (37) c、(k)= (C,j(k)H,(k))”(0≦に
≦N−1) (38) そして(3’7)、 (3B)式を逆直交変換して、相
互相関関数GJ、自己相関関数C5を計算し、前記(2
5) 。
するような構成としてもよい。このとき、直交変換とし
ては、フーリエ変換、あるいはFFT 、コサイン変換
などを用いることができる。この方法によれば、前記(
13)、 (14)式の畳み込み演算を周波数軸上で乗
算に帰着できるので演算量を低減することができる。
例の方法以外にも上記で示した方法や、前記文献5に記
載の方法や、他の周知な良好な方法を用いることができ
る。
例に記載した方法以外に、例えば予め膨大な乱数系列を
コードブックとして用意して、それらを用いてトレーニ
ングデータに対して乱数系列の探索を行い、選択される
頻度が高いものからコードワードとして登録して第2の
コードブックを構成することもできる。なお、この構成
法は、第1のコードブックの構成にも適用することがで
きる。
インをベクトル量子化したが、適応コードブックのゲイ
ンβと、第1.第2のコードブックのゲインγ1.γ2
を別々に、あるいはこれらをまとめてベクトル量子化す
るような構成をとることもできる。このとき、これらの
コードブックを音声信号に対して最適に学習したコード
ブックと、音声帯域モデム信号に対して最適に学習した
コードブックを用意しておく。このときの学習によるベ
クトル量子化器のコードブックの作成は、前記文献2を
参照できる。
したが、2次以上の高次とすることもできる。また、次
数は1次のままで遅延を整数値ではなく少数値とするこ
ともできる。これらについての詳細は、例えばMarq
ue氏らによる“Pitch Prediction
evtth Fractional Delays i
n CELP Codingと題した論文(EURO3
PEECH,pp、509−513.1989年)(文
献6)等を参照できる。以上のようにした方が特性は向
上するが、ゲインあるいは遅延の伝送に必要な情報量が
若干増大する。
パラメータ、LSPパラメータを符号化し、その分析法
としてLPG分析を用いたが、スペクトルパラメータと
しては他の周知なパラメータ、例えばLPCケプストラ
ム1ケプストラム、改良ケプストラム、一般化ケブスト
ラム1メルヶプストラムなどを用いることもできる。ま
た各パラメータに最適な分析法を用いることができる。
測係数上でサブフレーム毎に補間し、補間した係数を用
いて適応コードブック、第1.第2のコードブックの探
索を行う構成としてもよい。このような構成とすること
により、音質がさらに改善される。
、あるいはベクトルースカラ量子化することにより、さ
らに効率的に符号化することができる。ベクトルースカ
ラ量子化の方法については、例えば前記文献3等を参照
できる。このような構成とするときは、ベクトル量子化
のコードブックとして、音声信号に対して最適に学習し
たコードブックと、音声帯域モデム信号に対して最適に
学習したコードブックとを有しておき、これらから最良
なコードワードを選択する構成とすることにより、さら
に特性を改善できる。
計算を省略することもできる。これによって、送信側に
おける合成フィルタ281.減算器190は不要となり
演算量低減が可能となるが、音質は若干低下する。
サブフレーム分割回路150の前に配置させ、合成フィ
ルタ281では下式により重み付は合成信号を計算する
ようにしてもよい。
ある。
覚的に聞き易くするために、ピッチとスペクトル包絡の
少なくとも1つについて動作する適応形ポストフィルタ
を付加してもよい。適応型ポストフィルタの構成につい
ては、例えば、Kroon氏らによる”A C1ass
of Analysis−by−synthesis
Predictive Coders for Hig
h Quality 5peech C。
8 and 16kb/s、’ (IEEEJSAC,
vol、6.2.353−363.1988) (文
献7)等を参照できる。
に、自己相関関数は周波数軸上でバヮスヘクトルに、相
互相関関数はクロスパワスペクトルに対応しているので
、これらから計算することもできる。これらの計算法に
ついては、Oppenheim氏らによる“Digit
al Signal Processing”(Pre
ntice−Hall、 1975)と題した刊行物(
文献8)を参照できる。
ードブックを2段に分離して、第1のコ−ドブツクは、
予め音声信号に対して最適に学習して求めたコードブッ
クと、音声信号以外の音声帯域信号、例えばデータモデ
ム信号に対して最適に学習して構成したコードブックと
を有して、最良のコードワードを両者から選択し、第2
のコードブックは予め定められた統計的特性を有するコ
ードブックを用い、さらに前記コードブックのゲインや
ピッチ予測による適応コードブックのゲインのうち、少
なくとも一つを予め多量のトレーニング信号に対して学
習して構成したコードブックを用いてベクトル量子化す
ることにより、従来方式に比べてより少ない演算量で、
音声信号に対しても音声信号以外の音声帯域信号、例え
ばデータモデム信号などに対しても、従来より良好な特
性を得ることができるという効果がある。また、コード
ブックのゲインを最適化することによりさらに特性が改
善される。
kb/sのビットレートで、良好な音声帯域信号符号化
方式を得ることができるという大きな効果がある。
実施例が適用される音声帯域信号符号化装置の構成を示
すブロック図、 第2図は第1図のコードブック探索回路の構成を示すブ
ロック図、 第3図は第1図のゲイン量子化器の構成を示すブロック
図、 第4図は第2の発明による音声帯域信号符号化方式の一
実施例が適用される音声帯域信号符号化装置の構成を示
すブロック図である。 110 ・・・・・バッファメモリ 130 ・・・・・LPC分析回路 140 ・・・・・LSP量子化回路150 ・・
・・・サブフレーム分割回路170 ・・・・・イン
パルス応答計算回路190、205.255 ・・・
減算器200 ・・・・・重み付は回路 206 ・・・・・遅延回路 210 ・ ・ ・ 220 ・ ・ ・ 225 ・ ・ ・ 286 ・ ・ ・ 230 ・ ・ ・ 235.236・ 250.281・ 241.242・ 270 ・ ・ ・ 275 ・ ・ ・ 287 ・ ・ ・ 410.500・ 420.510・ 430.520・ 530 ・ ・ ・ 適応コードブック ゲイン量子化器 量子化器 ゲイン量子化器 第1のコードブック探索回路 コードブック 合成フィルタ 乗算器 第2のコードブック探索回路 第2のコードブック ゲインコードブック 相互相関関数計算回路 自己相関関数計算回路 判別回路 ゲイン復号回路
Claims (2)
- (1)入力した離散的な音声帯域信号を予め定められた
時間長のフレームに分割し、前記入力信号のスペクトラ
ム包絡を表すスペクトルパラメータを求めて出力し、前
記フレームを予め定められた時間長の小区間に分割し、
過去の音源信号をもとに再生した信号が前記入力信号に
近くなるようにピッチパラメータを求め、音声信号なら
びに前記音声信号以外の音声帯域信号をもとに予め学習
して構成した異なる複数種類の第1のコードブックから
選択した信号と、予め定められた特性を有する信号が格
納された第2のコードブックから選択した信号との線形
結合により前記入力信号の音源信号を表して出力するこ
とを特徴とする音声帯域信号符号化方式。 - (2)入力した離散的な音声帯域信号を予め定められた
時間長のフレームに分割し、前記入力信号のスペクトラ
ム包絡を表すスペクトルパラメータを求めて出力し、前
記フレームを予め定められた時間長の小区間に分割し、
過去の音源信号をもとに再生した信号が前記入力信号に
近くなるようにピッチパラメータを求め、音声信号なら
びに前記音声信号以外の音声帯域信号をもとに予め学習
して構成した異なる複数種類の第1のコードブックから
選択した信号と、予め定められた特性を有する信号が格
納された第2のコードブックから選択した信号との線形
結合により前記入力信号の音源信号を表し、予め構成し
た第3のコードブックを用いて前記ピッチパラメータあ
るいは前記音源信号のゲインの少なくとも一方を量子化
して出力することを特徴とする音声帯域信号符号化方式
。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10183490A JP3252285B2 (ja) | 1990-04-19 | 1990-04-19 | 音声帯域信号符号化方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10183490A JP3252285B2 (ja) | 1990-04-19 | 1990-04-19 | 音声帯域信号符号化方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH041800A true JPH041800A (ja) | 1992-01-07 |
| JP3252285B2 JP3252285B2 (ja) | 2002-02-04 |
Family
ID=14311116
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10183490A Expired - Lifetime JP3252285B2 (ja) | 1990-04-19 | 1990-04-19 | 音声帯域信号符号化方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3252285B2 (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06202697A (ja) * | 1993-01-07 | 1994-07-22 | Nippon Telegr & Teleph Corp <Ntt> | 励振信号の利得量子化方法 |
| US5432883A (en) * | 1992-04-24 | 1995-07-11 | Olympus Optical Co., Ltd. | Voice coding apparatus with synthesized speech LPC code book |
| CN113205820A (zh) * | 2021-04-22 | 2021-08-03 | 武汉大学 | 一种用于声音事件检测的声音编码器的生成方法 |
-
1990
- 1990-04-19 JP JP10183490A patent/JP3252285B2/ja not_active Expired - Lifetime
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5432883A (en) * | 1992-04-24 | 1995-07-11 | Olympus Optical Co., Ltd. | Voice coding apparatus with synthesized speech LPC code book |
| JPH06202697A (ja) * | 1993-01-07 | 1994-07-22 | Nippon Telegr & Teleph Corp <Ntt> | 励振信号の利得量子化方法 |
| CN113205820A (zh) * | 2021-04-22 | 2021-08-03 | 武汉大学 | 一种用于声音事件检测的声音编码器的生成方法 |
| CN113205820B (zh) * | 2021-04-22 | 2022-05-13 | 武汉大学 | 一种用于声音事件检测的声音编码器的生成方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3252285B2 (ja) | 2002-02-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0443548B1 (en) | Speech coder | |
| JP3042886B2 (ja) | ベクトル量子化器の方法および装置 | |
| EP1224662B1 (en) | Variable bit-rate celp coding of speech with phonetic classification | |
| JP3114197B2 (ja) | 音声パラメータ符号化方法 | |
| US5359696A (en) | Digital speech coder having improved sub-sample resolution long-term predictor | |
| JPH09127991A (ja) | 音声符号化方法及び装置、音声復号化方法及び装置 | |
| JPH0353300A (ja) | 音声符号化装置 | |
| JPH03211599A (ja) | 4.8kbpsの情報伝送速度を有する音声符号化/復号化器 | |
| JPH09127990A (ja) | 音声符号化方法及び装置 | |
| RU2005137320A (ru) | Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи | |
| JP3143956B2 (ja) | 音声パラメータ符号化方式 | |
| KR19990077753A (ko) | 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치 | |
| JPH10124092A (ja) | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 | |
| JP3344962B2 (ja) | オーディオ信号符号化装置、及びオーディオ信号復号化装置 | |
| JP3062226B2 (ja) | 条件付き確率的励起符号化法 | |
| JPH10214100A (ja) | 音声合成方法 | |
| US6330531B1 (en) | Comb codebook structure | |
| JP3095133B2 (ja) | 音響信号符号化方法 | |
| JPH0854898A (ja) | 音声符号化装置 | |
| JPH041800A (ja) | 音声帯域信号符号化方法 | |
| JP3194930B2 (ja) | 音声符号化装置 | |
| JP3256215B2 (ja) | 音声符号化装置 | |
| KR0155798B1 (ko) | 음성신호 부호화 및 복호화 방법 | |
| JP3102017B2 (ja) | 音声符号化方法 | |
| JPH02280200A (ja) | 音声符号化復号化方式 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071122 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081122 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081122 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091122 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091122 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101122 Year of fee payment: 9 |
|
| EXPY | Cancellation because of completion of term | ||
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101122 Year of fee payment: 9 |