JPH056199A - 音声パラメータ符号化方式 - Google Patents

音声パラメータ符号化方式

Info

Publication number
JPH056199A
JPH056199A JP3155049A JP15504991A JPH056199A JP H056199 A JPH056199 A JP H056199A JP 3155049 A JP3155049 A JP 3155049A JP 15504991 A JP15504991 A JP 15504991A JP H056199 A JPH056199 A JP H056199A
Authority
JP
Japan
Prior art keywords
codebook
parameter
subframes
subframe
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3155049A
Other languages
English (en)
Other versions
JP3143956B2 (ja
Inventor
Kazunori Ozawa
一範 小沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP03155049A priority Critical patent/JP3143956B2/ja
Publication of JPH056199A publication Critical patent/JPH056199A/ja
Application granted granted Critical
Publication of JP3143956B2 publication Critical patent/JP3143956B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 音声信号のスペクトルパラメータを、従来よ
りも少ないビット数で量子化可能とする。 【構成】 入力した音声信号をフレームに分割し、さら
にフレームよりも短い複数個のサブフレームに分割し、
前記サブフレームの少なくとも一つについて前記音声信
号に対してスペクトルパラメータを予め定められた次数
だけ求め、ベクトル量子化部110は、一つのサブフレ
ームのスペクトルパラメータを予め構成した第1のコー
ドブック120を用いて量子化して出力する。また、補
間ベクトル量子化部130では、他の少なくとも一つの
サブフレームのスペクトルパラメータを、当該フレーム
でのスペクトルパラメータの量子化値と過去のフレーム
でのスペクトルパラメータの量子化値と第2のコードブ
ック140を用いて量子化して出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声信号を低いビットレ
ート、特に8kb/s以下のビットレートで高品質に符
号化する音声符号化方式に供するための音声パラメータ
符号方式に関する。
【0002】
【従来の技術】音声信号を8kb/s以下の低いビット
レートで符号化する方式としては、例えば、M.Sch
roeder and B.Atal氏による”Cod
e−excited linear predicti
on:High quality speech at
very low bit rates”(Pro
c.ICASSP,pp.937−940,1985
年)と題した論文(文献1)や、Kleijn氏らによ
る”Improved speech quality
and efficient vector qua
ntizationin SELP”(Proc.IC
ASSP,pp.155−158,1988年)と題し
た論文(文献2)等に記載されているCELP(od
xcited LPC Coding)方式が知
られている。この方式では、まず送信側は、音声信号の
スペクトル特性を表すスペクトルパラメータをフレーム
毎(例えば20ms)に音声信号から抽出し、さらにフ
レームを小区間サブフレーム(例えば5ms)に分割す
る。次にこのサブフレーム毎に、過去の音源信号をもと
に長時間相関(ピッチ相関)を表すピッチパラメータを
抽出し、このピッチパラメータにより前述のサブフレー
ムの音声信号を長期予測する。次に長期予測して求めた
残差信号に対して、予め定められた種類の雑音信号から
なるコードブックから選択した信号により合成した信号
と、前述の音声信号との誤差電力を最小化するように一
種類の雑音信号を選択し、この種類を表すインデクス及
びゲイン並びに前述のスペクトルパラメータ及びピッチ
パラメータを伝送する。
【0003】CELP方式では、音声のスペクトルパラ
メータとしてはLPC分析により求めたLPCパラメー
タを用い、このLPCパラメータを量子化する。量子化
法としては、通常スカラ量子化が用いられており、10
次のLPC係数を量子化するのにフレーム当り34ビッ
ト(1.7kb/s)程度のビット数が必要であり、ビ
ット数をさらに低減すると音質が低下する。LPCパラ
メータをより効率的に量子化する方法として、Mori
ya氏らによる”Transform coding
of speech using a weighte
d vector quantizer,”と題した論
文(IEEE J.Sel.Areas,Commu
n.,pp.425−431,1988年)(文献3)
等に記載されたベクトル−スカラ量子化法などが提案さ
れているが、フレーム当り27〜30ビット程度のビッ
ト数が必要である。
【0004】
【発明が解決しようとする課題】上述したCELP方式
のビットレートをさらに低減するためには、スペクトル
パラメータの効率的な量子化法が必要であるが、スペク
トルパラメータの量子化に必要なビット数を下げるため
にフレーム長を長くとると、スペクトルの時間的変化を
良好に表すことが困難となり、時間歪が増大し音質が大
幅に劣化していた。
【0005】本発明の目的は、上述した問題点を解決
し、スペクトルパラメータを従来よりも少ないビット数
で量子化しても良好な音質を提供できる音声パラメータ
符号化方式を提供することにある。
【0006】
【課題を解決するための手段】第1の発明の音声パラメ
ータ符号化方式は、入力した音声信号フレームに分割
し、さらにフレームよりも短い複数個のサブフレームに
分割する手段と、前記サブフレームの少なくとも一つに
ついて前記音声信号に対してスペクトルパラメータを予
め定められた次数だけ求める手段と、一つのサブフレー
ムのスペクトルパラメータを予め構成した第1のコード
ブックを用いて量子化し、他の少なくとも一つサブフレ
ームのスペクトルパラメータを、当該フレームでのスペ
クトルパラメータの量子化値と、過去のフレームでのス
ペクトルパラメータの量子化値と、第2のコードブック
とを用いて量子化することを特徴とする。
【0007】第2の発明の音声パラメータ符号化方式
は、第1の発明において、第1のコードブック又は第2
のコードブックの少なくとも一方において、量子化歪の
小さい順に複数種類の候補を出力し、他のサブフレーム
においては、スペクトルパラメータを当該フレームでの
スペクトルパラメータの量子化値と、過去のフレームで
のスペクトルパラメータの量子化値と、第2のコードブ
ックとを用いて量子化して量子化歪を求め前記量子化歪
を複数サブフレームにわたり累積し、前記累積値を最小
にする候補を選択し出力することを特徴とする。
【0008】第3の発明の音声パラメータ符号化方式
は、入力した音声信号をフレームに分割し、さらにフレ
ームよりも短い複数個のサブフレームに分割する手段
と、前記サブフレームの少なくとも一つについて前記音
声信号に対してスペクトルパラメータを予め定められた
次数だけ求める手段と、一つのサブフレームのスペクト
ルパラメータを予め構成した第1のコードブックを用い
て量子化し、他の少なくとも一つのサブフレームでは当
該フレームでのスペクトルパラメータの量子化値と過去
のフレームでのスペクトルパラメータの量子化値とを用
いてあらかじめ定められた方法によりスペクトルパラメ
ータを復元し、当該サブフレームのスペクトルパラメー
タと前記復元値との誤差を小さくするように第2のコー
ドブックを選択することを特徴とする。
【0009】第4の発明の音声パラメータ符号化方式
は、第2の発明において、第1のコードブック又は第2
のコードブックの少なくとも一方において、量子化歪の
小さい順に複数種類の候補を出力し、他のサブフレーム
においては、当該サブフレームのスペクトルパラメータ
と前記復元値との誤差電力を複数サブフレームにわたり
累積し、前記累積値を最小にする候補を選択し出力する
ことを特徴とする。
【0010】第5の発明の音声パラメータ符号化方式
は、入力した音声信号をフレームに分割し、さらにフレ
ームよりも短い複数個のサブフレームに分割する手段
と、前記サブフレームの少なくとも一つについて前記音
声信号に対してスペクトルパラメータを予め定められた
次数だけ求める手段と、一つのサブフレームのスペクト
ルパラメータを予め構成した第1のコードブックを用い
て量子化し、量子化歪の小さい順に複数種類の候補を出
力し、他のサブフレームにおいては、当該フレームの量
子化スペクトルパラメータと過去のフレームの量子化ス
ペクトルパラメータを用いて予め定められた方法により
スペクトルパラメータを復元し、サブフレームのスペク
トルパラメータと前記復元値との誤差電力を複数サブフ
レームにわたり累積し、前記累積値を最小にする候補を
選択し出力する手段とを有することを特徴とする。
【0011】
【作用】本発明による音声パラメータ符号化方式の作用
を示す。図1は第1及び第2の発明の作用を、図3は第
3及び第4の発明の作用を、図4は第5の発明の作用を
各々説明するための図である。以下の説明では音声のス
ペクトルパラメータとしてLSPパラメータを用いるも
のとする。
【0012】入力した音声信号を予め定められた時間長
のフレーム(例えば30〜40ms)に分割し、さらに
フレームの音声信号を、フレームよりも短い複数個のサ
ブフレーム(例えば5〜8ms)に分割し、フレーム内
の少なくとも一つのサブフレームに対して、周知のLP
C分析を行いスペクトルパラメータを求める。ここで
は、フレーム長を40ms、サブフレーム長を8msと
し、図2に示すサブフレーム、、、についてL
PC分析をおこなうものとする。
【0013】最初に第1の発明の作用について図1を用
いて説明する。
【0014】一例として、第サブフレームについてL
PC分析により求められたスペクトルパラメータを、端
子100から入力し、第、、サブフレームについ
て求めたスペクトルパラメータを端子105から順に入
力する。スペクトルパラメータとしては、ここでは線ス
ペクトル対(LSP)パラメータを用いて説明を行う。
LSPの具体的な計算法は、菅村氏らによる”Quan
tizerdesign in LSP speech
analysis−synthesis,”と題した
論文(IEEE J.Sel.Areas Commu
n.,pp.425−431,1988年)(文献4)
等を参照できる。ベクトル量子化部110は、コードブ
ック120(第1のコードブック)を用いて、入力した
LSPパラメータをベクトル量子化する。コードブック
120には、トレーニング用の多量のLSPパラメータ
系列を用いて予め学習させておく。学習の方法は、例え
ばLinde,Buzo,Gray氏による”An a
lgorithm for vector quant
ization design”と題した論文(IEE
E Trans.Commun.,pp.84−95,
1980)(文献5)等を参照できる。コードベクトル
を探索するときの歪尺度は、種々のものが知られている
が、ここではLSPの2乗距離を用いる。LSPの2乗
距離は(1)式で与えられる。
【0015】
【数1】
【0016】ここではLSP(i)は入力したi次目の
LSP係数を示す。PはLSPの次数である。LSP’
(i)はコードブックが有するj番目のコードベクトル
であり、j=1〜2B (Bはコードブックのビット数)
である。(1)式を最小化するコードベクトルを補間ベ
クトル量子化部130と端子155へ出力する。
【0017】補間ベクトル量子化部130は、ベクトル
量子化部110の出力コードベクトルと、この出力コー
ドベクトルを1フレーム遅延させて得た1フレーム過去
のスペクトルパラメータの量子化値とを入力する。補間
係数コードブック140(コードブック2)を用いて、
端子105より入力したサブフレーム、、のLS
P系列を補間ベクトル量子化して復元する。つまり、
(2)式により、補間係数コードベクトルによる量子化
歪を計算し、量子化歪を最小にする補間係数コードベク
トルAj をサブフレーム毎に選択する。
【0018】
【数2】
【0019】(2)式において、LSPl (i)は第l
サブフレームでの入力のi次目のLSP。LSP’
n - 1 (i)、LSP’n (i)は、それぞれ1フレー
ム過去のLSPの量子化値、現フレームでのLSPの量
子化値(ベクトル量子化部110の出力値)を示す。A
jは補間係数コードブック140の有するj番目のコー
ドベクトルである。補間ベクトル量子化部130は、
(2)式を最小化する補間係数コードベクトルをサブフ
レーム、、に対して求め、(3)式によりサブフ
レームにおけるスペクトルパラメータを復元し端子15
0から出力する。
【0020】 LSP’n l (i)= LSP’n - 1 (i)・Aj −(1−Aj )LSP’(i) (3) Aj は、トレーニング用LSP信号に対して、(4)式
を最小化するように、前述の文献5等を用いて予め学習
しておく。
【0021】
【数3】
【0022】ここでnはフレーム番号、kはトレーニン
グ全信号のフレーム数を示す。
【0023】次に、第2の発明の作用について同じく図
1を用いて説明する。
【0024】ベクトル量子化部110は、コードブック
120(第1のコードブック)を用いて(1)式の量子
化歪の小さい順に複数種類(M種類)のコードベクトル
を出力する。次に、複数種類の各々のコードベクトルに
対して、補間ベクトル量子化部130は、補間係数コー
ドブック140(第2のコードブック)を用いて、
(2)式の量子化歪を最小化するコードベクトルを出力
する。次に、補間ベクトル量子化部130は、M種類の
コードベクトルの組合せの各々に対して、複数サブフレ
ームにわたり(5)式の累積歪を計算し、累積歪を最小
化する第1のコードブックと第2のコードブックのコー
ドベクトルの組合せを出力する。
【0025】
【数4】
【0026】ここで、LSP’n k (i)は第1のコー
ドブックから選択されたk番目(k=1〜M)の候補で
ある。Lは歪を累積するサブフレームの個数である。
【0027】次に第3の発明の作用について図3を用い
て説明する。ここで図1と同一の番号を付した構成要素
は図1と同様の動作を行うので説明は略す。
【0028】第1の発明と異なる点は、現在のフレーム
のスペクトルパラメータの量子化値と過去のフレームの
スペクトルパラメータの量子化値とを用いて、予め定め
られた補間法により補間してサブフレーム、、の
スペクトルパラメータを復元し、各サブフレームのスペ
クトルパラメータと前述の復元値の誤差を小さくするよ
うに第2のコードブックを選択することにある。
【0029】図3において、補間部115は、1フレー
ム過去のスペクトルパラメータの量子化値とベクトル量
子化部110の出力値(現在のフレームのスペクトルパ
ラメータの量子化値)とを用いて、あらかじめ定められ
た方法によりサブフレームのスペクトルパラメータを復
元する。ここでは、一例として、(6)式により直線補
間により復元するものとする。
【0030】 LSP’l (i)= αl LSP’n - 1 (i)+(1−αl )LSP’n (i) (6) ここで、LSP’l (1)は直線補間により復元した第
lサブフレームのLSPである。またαl は第lサブフ
レームでの予め定められた補間係数である。
【0031】補間ベクトル量子化部135は、補間係数
コードブック145(第2のコードブック)を用いて、
次式の誤差電力を最小化するように、サブフレーム毎に
コードベクトルをAj 選択する。
【0032】
【数5】
【0033】そして(8)式により、サブフレーム、
、に対して復元した値を端子150から出力する。
【0034】 LSP’’l (i)=LSP’l (i)+LSP’n - 1 (i)・Aj +(1 −Aj )LSP’n (i) (8) 次に第4の発明の作用について同じく図3を用いて説明
する。
【0035】ベクトル量子化部110は、コードブック
120(第1のコードブック)を用いて(1)式の量子
化歪の小さい順に複数種類(M種類)のコードベクトル
を出力する。次に、複数種類の各々のコードベクトルに
対して、補間部115において補間し、さらに、補間ベ
クトル量子化部135において、補間係数コードブック
145(第2のコードブック)を用いて、(7)式の量
子化歪を最小化するコードベクトルを出力する。次に、
M種類のコードベクトルの組合せの各々に対して、次式
の複数サブフレームにわたる累積歪を計算し、累積歪を
最小化する第1のコードブックと第2のコードブックの
コードベクトルの組合せを出力する。
【0036】
【数6】
【0037】ここで、LSP’’l k (i)は第1のコ
ードブックから選択されたk番目(k=1〜M)の候補
を用いて復元したlサブフレームのLSPである。
【0038】第1から第4の発明の作用の例では、全て
のサブフレームに対して共通の補間係数コードブックを
構成したが、サブフレーム毎に異なる補間係数コードブ
ックを構成しても良い。また、この場合、複数サブフレ
ーム分の補間コードブックをまとめてマストリクスコー
ドブックを構成しても良い。
【0039】また、補間係数コードブックの学習、探索
には上記の2乗距離や、重み付け距離など他の周知の距
離尺度を用いても良い。
【0040】また、ベクトル量子化部では、周知のベク
トルースカラ量子化を用いても良い。
【0041】第5の発明の作用について図4を用いて説
明する。ここで図1、図3と同一の番号を付した構成要
素は図1、図3と同様の動作を行うので説明は略す。
【0042】ベクトル量子化部180では、コードブッ
ク120(第1のコードブック)を用いて(1)式の量
子化歪の小さい順に複数種類(M種類)のコードベクト
ルを出力する。次に、複数種類の各々のコードベクトル
に対して、補間部115において例えば直線補間を用い
て補間処理を行い、(6)式に従い、、、サブフ
レームのLSPを復元する。累積歪計算部160では、
各候補に対して、サブフレームのスペクトルパラメータ
と前述の復元値との誤差電力を複数サブフレームにわた
り累積し、(10)式の累積歪を計算する。
【0043】
【数7】
【0044】判定部165では、(10)式を最小化す
るコードベクトルを選択し、ベクトル量子化部の候補は
端子170から、サブフレームの復元値は端子170か
ら出力する。
【0045】上記説明において、ベクトル量子化部で
は、周知のベクトル−スカラ量子化を用いることもでき
る。また、補間処理は周知の方法を用いることができ
る。また、コードブックの探索には重み付け距離などの
他の周知な距離尺度を用いることができる。
【0046】
【実施例】図5は第1、2、3、4及び5の発明の音声
パラメータ符号化方式の一実施例を示すブロック図であ
る。
【0047】図5において、入力端子400から音声信
号を入力し、1フレーム分(例えば40ms)の音声信
号をバッファメモリ410に格納する。
【0048】サブフレーム分割回路420は、フレーム
の音声信号を予め定められたサブフレーム(例えば8m
s)に分割する。
【0049】LPC分析回路430は、少なくとも一つ
のサブフレーム位置(例えば図2の、、、ある
いは、、、、あるいは、あるいは、
など任意の組合せが考えられる)の音声信号のスペクト
ル特性を表すパラメータとして、LSPパラメータを周
知のLPC分析を行いあらかじめ定められた次数Pだけ
計算する。この具体的な計算法については前述文献4等
を参照することができる。
【0050】LSP量子化回路440は、一つのサブフ
レームで求めたLSPパラメータを予め定められた量子
化ビット数で量子化し、得た符号1k を出力端子450
から出力する。
【0051】最初に、第1の発明におけるLSP量子化
回路440の構成を図6を用いて説明する。
【0052】図6において、入力端子500からサブフ
レームのLSPパラメータを入力する。また、第、
、サブフレームについて求めたスペクトルパラメー
タを端子505から順に入力し、バッファメモリ506
に格納する。
【0053】ベクトル量子化回路510は、コードブッ
ク520を用いて、入力したLSPパラメータを周知の
手段によりベクトル量子化する。コードブック520
は、トレーニング用の多量のLSPパラメータ系列を用
いて予め学習して構成する。ベクトル量子化回路510
は、(1)式を最小化するコードベクトルを補間ベクト
ル量子化部530と端子555へ出力する。
【0054】補間ベクトル量子化回路530は、ベクト
ル量子化回路510の出力コードベクトルと、遅延回路
545による1フレーム過去のスペクトルパラメータの
量子化値とを入力する。補間係数コードブック540を
もちいてバッファメモリ506に格納されたサブフレー
ム、、のLSP系列を補間して復元する。つま
り、(2)式により、各補間係数コードベクトルによる
量子化歪を計算し、量子化歪を最小にする補間係数コー
ドベクトルAj をサブフレーム毎に選択して(3)式に
よりLSPパラメータを復元し、バッファメモリ535
に一旦格納した後に端子550へ出力する。
【0055】補間係数コードブック540の補間係数
は、トレーニング用LSP信号に対して、(4)式を最
小化するように、前述文献5等を用いて予め学習して構
成することができる。
【0056】次に、第2の発明におけるLSP量子化回
路440の構成を図7を用いて説明する。図7において
図6と同一の番号を付した構成要素は図6と同様の動作
を行うので説明は省略する。
【0057】図7において、ベクトル量子化回路600
は、コードブック520(第1のコードブック)を用い
て(1)式の量子化歪の小さい順に複数種類(M種類)
のコードベクルトを出力し、候補格納回路610へ格納
する。補間ベクトル量子化回路615は、候補格納回路
610から各候補を入力し、さらに遅延回路545から
1フレーム過去のLSPのベクトル量子化値を入力し、
バッファメモリ506に格納された各サブフレームのL
SPを補間ベクトル量子化する。補間ベクトル量子化に
は補間係数コードブック540(第2のコードブック)
を用いて、(2)式の量子化歪を最小化するコードベク
トルを出力する。累積歪計算回路620では、各候補に
対して、(5)式の累積歪を計算する。(5)式におい
てL=3とする。選択回路625では、累積歪を最小化
する第1のコードブックと第2のコードブックのコード
ベクトルの組合せを用いてベクトル量子化されたLSP
を復元しバッファメモリ535に格納した後に、端子5
55から出力する。遅延回路545は、第4サブフレー
ムでのLSPの量子化値を1フレーム遅延させる。
【0058】次に、第3の発明におけるLSP量子化回
路440の構成を図8を用いて説明する。図8において
図6と同一の番号を付した構成要素は図6と同様の動作
を行うので説明は省略する。
【0059】図8において、補間回路630は、遅延回
路545の出力値(過去のフレームのLSPのベクトル
量子化値)と、ベクトル量子化回路510の出力値(現
在のフレームのLSPのベクトル量子化値)とを用い
て、あらかじめ定められた補間方法により各サブフレー
ムのLSPを復元する。補間方法としては種々のものが
知られているがここでは一例として、(6)式による直
線補間により復元するものとする。
【0060】補間ベクトル量子化部635は、補間係数
コードブック645(第2のコードブック)を用いて、
(7)式の誤差電力を最小化するように、サブフレーム
毎にコードベクトルを選択する。そして(8)式によ
り、サブフレーム、、、に対して復元した値を
バッファメモリ535に格納した後に、端子555から
出力する。
【0061】遅延回路545は、第4サブフレームのL
SPの量子化値を1フレーム遅延させる。
【0062】次に、第4の発明におけるLSP量子化回
路440の構成を図9を用いて説明する。図9におい
て、図7と同一の番号を付した構成要素は図7と同様の
動作を行うので説明は省略する。
【0063】図9において、ベクトル量子化回路600
は、コードブック520(第1のコードブック)を用い
て(1)式の量子化歪の小さい順に複数種類(M種類)
のコードベクトルを出力し、候補格納回路610に格納
する。複数種類の各々のコードベクトルに対して、補間
回路630において補間し、さらに、補間ベクトル量子
化回路635において、補間係数コードブック645
(第2のコードブック)を用いて、(7)式の量子化歪
を最小化するコードベクトルを出力する。累積歪計算回
路620では、M種類の候補の各々に対して、(9)式
の累積歪を計算する。ここではL=3とする。選択回路
625は、累積歪を最小化する第1のコードブックと第
2のコードブックのコードベクトルの組合せを求め、こ
のときのLSPを復元してバッファメモリ535に格納
した後に端子555から出力する。遅延回路545は、
第4サブフレームで量子化されたLSPを1フレーム遅
延させる。
【0064】補間係数コードブックは複数種類のサブフ
レームについて共通して使用しても良い。又は、サブフ
レーム毎に最適な補間係数コードブックを用いても良
い。後者のときは、複数サブフレーム分をまとめたマト
リクス構成のコードブックを構成すれば、さらに補間係
数コードブックのビット数を低減化できる。マトリクス
コードブックの作成法は、例えば、C.Tsao氏らに
よる”Matrix quantizer desig
n for LPC speech usingthe
generalized Lloyd algori
thm,”と題した論文(IEEE Trans.AS
SP,pp.537−545,1985年)(文献6)
を参照できる。
【0065】また、補間係数コードブックの学習、探索
には上記の2乗距離や、重み付け距離など他の周知の距
離尺度を用いることができる。
【0066】また、ベクトル量子化部では、周知のベク
トル−スカラ量子化を用いることもできる。
【0067】次に、第5の発明におけるLSP量子化回
路440の構成を図10を用いて説明する。図10にお
いて、図6と同一の番号を付した構成要素は、図6と同
様の動作を行うので、説明は省略する。
【0068】図10において、ベクトル量子化回路60
0は、コードブック520(第1のコードブック)を用
いて(1)式の量子化歪の小さい順に複数種類(M種
類)のコードベクトルを出力し、候補格納回路610に
格納する。補間回路630は、複数種類の各々のコード
ベクトルに対して、補間処理を行い、(6)式に従い、
、、サブフレームのLSPを復元する。ここで、
補間処理は種々の方法が考えられるが、一例として、直
線補間を用いるものとする。累積歪計算回路620は、
各候補に対して、サブフレームのLSPと前述の補間処
理によるLSP復元値との誤差電力を複数サブフレーム
にわたり累積し、(10)式の累積歪を計算する。ここ
ではL=3とする。選択回路625は、(10)式を最
小化するコードベクトル候補を選択し、LSPをサブフ
レーム毎に復元してバッファメモリ535に格納した後
に端子555より出力する。遅延回路545は、第4サ
ブフレームにおいて選択された候補1フレーム遅延させ
る。
【0069】最後に、以上の説明について補足する。
【0070】まずベクトル量子化回路は、周知のベクト
ル−スカラ量子化を用いても良い。
【0071】補間回路630は、補間位置又は補間方法
を複数種類もち、これらの全ての組合せに対して累積歪
を計算し、累積歪を最小にする補間位置又は補間方法を
フレーム毎に補助情報として数ビットで伝送しても良
い。ただし、このようにすると性能は改善されるが補助
情報伝送のため、ビット数が若干増加する。
【0072】また、補間回路630における補間は、直
線補間以外に、対数補間などの他の周知の方法を用いて
も良い。また、各サブフレームに最適な補間係数をトレ
ーニング信号を用いて学習して構成しても良い。
【0073】また、LSPのベクトル量子化及び累積歪
の計算にはLSPの2乗距離を用いたが、他の周知の距
離尺度を用いても良い。例えばLSPの重み付け2乗距
離や、LPCケプストラム距離などである。
【0074】また、ベクトル量子化回路としては、全探
索型ベクトル量子化回路を用いたが、コードベクトルの
探索に要する演算量を低減するために、木探索型、格子
型、他段型又は、他の周知な構成のベクトル量子化回路
を用いても良い。これらの演算量低減化法の詳細につい
ては、例えばR.Gray氏による”Vectorqu
antization,”と題した論文(IEEE A
SSP Magazine,pp.4−29,1984
年)(文献7)等を参照できる。
【0075】また、4つのサブフレームについて入力音
声をLPC分析してLSP係数を計算したが、演算量を
低減化するために任意の方法を用いることができる。例
えば、2つ又は3つのサブフレーム(2つのときは例え
ば図2のと、又はと、又はと又は、と
)に対してのみLSPを計算し、他のサブフレームで
はこれらのLSPを補間してLSPを求めるようにして
も良い。又は、2つ又は3つのサブフレームに対してL
SPを計算し、1つのサブフレームでLSPを量子化
し、他のサブフレームのLSPは補間又は第2のコード
ブック、あるいは補間と第2のコードブックの組み合わ
せで表わすようにしてもよい。
【0076】
【発明の効果】以上述べたように、本発明によれば、音
声のスペクトル特性を表すスペクトルパラメータを量子
化するときに、フレームをそれよりも短いサブフレーム
に分割し、少なくとも1つのサブフレームでスペクトル
パラメータを求めて第1のコードブックを用いて量子化
し、他のサブフレームのスペクトルパラメータは、当該
フレームの量子化値と過去のフレームの量子化値との補
間処理で表すか、第2のコードブックを使用して表す
か、あるいは補間処理と第2のコードブックを用いて表
す。また、第1のコードブックの探索において、量子化
歪の小さい順に複数種類の候補を求め、各候補に対して
補間処理、あるいは第2のコードブック、あるいは補間
処理と第2のコードブックを用いてスペクトルパラメー
タを復元し、複数サブフレームにわたる累積歪を求め、
累積歪を小さくするように前記候補を選択している。従
って、ビットレースを低減するためにフレーム長を増大
させても、少ないビット数及び演算量でスペクトルパラ
メータを良好に量子化できると共に、時間変化も良好に
表すことができるという大きな効果がある。
【図面の簡単な説明】
【図1】第1及び第2の発明の音声パラメータ符号化方
式の作用を説明するためのブロック図。
【図2】フレームとサブフレームの関係を表す図。
【図3】第3及び第4の発明の音声パラメータ符号化方
式の作用を説明するためのブロック図。
【図4】第5の発明の音声パラメータ符号化方式の作用
を説明するためのブロック図。
【図5】第1,2,3,4及び5の発明の音声パラメー
タ符号化方式の一実施例を示すブロック図。
【図6】第1の発明におけるLPC量子化回路の構成を
示すブロック図。
【図7】第2の発明におけるLPC量子化回路の構成を
示すブロック図。
【図8】第3の発明におけるLPC量子化回路の構成を
示すブロック図。
【図9】第4の発明におけるLPC量子化回路の構成を
示すブロック図。
【図10】第5の発明におけるLPC量子化回路の構成
を示すブロック図。
【符号の説明】
110 ベクトル量子化部 120 コードブック 130 補間ベクトル量子化部 140 補間係数コードブック 190 遅延部 115 補間部 135 補間ベクトル量子化部 145 補間係数コードブック 180 ベクトル量子化部 160 累積歪計算部 165 判別部 410 バッファメモリ 420 サブフレーム分割回路 430 LPC分析回路 440 LPC量子化回路 506 バッファメモリ 510 ベクトル量子化部 520 コードブック 530 補間ベクトル量子化回路 535 バッファメモリ 540 補間係数コードブック 545 遅延回路 600 ベクトル量子化回路 610 補間格納回路 615 補間ベクトル量子化回路 620 累積歪計算回路 625 選択回路 630 補間回路 635 補間ベクトル量子化回路 645 補間係数コードブック

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 入力した音声信号をフレームに分割し、
    さらにフレームよりも短い複数個のサブフレームに分割
    する手段と、前記サブフレームの少なくとも一つについ
    て前記音声信号に対してスペクトルパラメータを予め定
    められた次数だけ求める手段と、一つのサブフレームの
    スペクトルパラメータを予め構成した第1のコードブッ
    クを用いて量子化し、他の少なくとも一つのサブフレー
    ムのスペクトルパラメータを、当該フレームでのスペク
    トルパラメータの量子化値と、過去のフレームでのスペ
    クトルパラメータの量子化値と、第2のコードブックと
    を用いて量子化する手段とを有することを特徴とする音
    声パラメータ符号化方式。
  2. 【請求項2】 第1のコードブック又は第2のコードブ
    ックの少なくとも一方において、量子化歪の小さい順に
    複数種類の候補を出力し、他のサブフレームにおいて
    は、スペクトルパラメータを当該フレームでのスペクト
    ルパラメータの量子化値と、過去のフレームでのスペク
    トルパラメータの量子化値と、第2のコードブックとを
    用いて量子化して量子化歪を求め前記量子化歪を複数サ
    ブフレームにわたり累積し、前記累積値を最小にする候
    補を選択し出力することを特徴とする請求項1記載の音
    声パラメータ符号化方式。
  3. 【請求項3】 入力した音声信号をフレームに分割し、
    さらにフレームよりも短い複数個のサブフレームに分割
    する手段と、前記サブフレームの少なくとも一つについ
    て前記音声信号に対してスペクトルパラメータを予め定
    められた次数だけ求める手段と、一つのサブフレームの
    スペクトルパラメータを予め構成した第1のコードブッ
    クを用いて量子化し、他の少なくとも一つのサブフレー
    ムでは当該フレームでのスペクトルパラメータの量子化
    値と過去のフレームでのスペクトルパラメータの量子化
    値とを用いてあらかじめ定められた方法によりスペクト
    ルパラメータを復元し、当該サブフレームのスペクトル
    パラメータと前記復元値との誤差を小さくするように第
    2のコードブックを選択することを特徴とする音声パラ
    メータ符号化方式。
  4. 【請求項4】 第1のコードブック又は第2のコードブ
    ックの少なくとも一方において、量子化歪の小さい順に
    複数種類の候補を出力し、他のサブフレームにおいて
    は、当該サブフレームのスペクトルパラメータと前記復
    元値との誤差電力を複数サブフレームにわたり累積し、
    前記累積値を最小にする候補を選択し出力することを特
    徴とする請求項2記載の音声パラメータ符号化方式。
  5. 【請求項5】 入力した音声信号をフレームに分割し、
    さらにフレームよりも短い複数個のサブフレームに分割
    する手段と、前記サブフレームの少なくとも一つについ
    て前記音声信号に対してスペクトルパラメータを予め定
    められた次数だけ求める手段と、一つのサブフレームの
    スペクトルパラメータを予め構成した第1のコードブッ
    クを用いて量子化し、量子化歪の小さい順に複数種類の
    候補を出力し、他のサブフレームにおいては、当該フレ
    ームの量子化スペクトルパラメータと過去のフレームの
    量子化スペクトルパラメータを用いて予め定められた方
    法によりスペクトルパラメータを復元し、サブフレーム
    のスペクトルパラメータと前記復元値との誤差電力を複
    数サブフレームにわたり累積し、前記累積値を最小にす
    る候補を選択し出力する手段とを有することを特徴とす
    る音声パラメータ符号化方式。
JP03155049A 1991-06-27 1991-06-27 音声パラメータ符号化方式 Expired - Lifetime JP3143956B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03155049A JP3143956B2 (ja) 1991-06-27 1991-06-27 音声パラメータ符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03155049A JP3143956B2 (ja) 1991-06-27 1991-06-27 音声パラメータ符号化方式

Publications (2)

Publication Number Publication Date
JPH056199A true JPH056199A (ja) 1993-01-14
JP3143956B2 JP3143956B2 (ja) 2001-03-07

Family

ID=15597558

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03155049A Expired - Lifetime JP3143956B2 (ja) 1991-06-27 1991-06-27 音声パラメータ符号化方式

Country Status (1)

Country Link
JP (1) JP3143956B2 (ja)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0744200A (ja) * 1993-07-29 1995-02-14 Nec Corp 音声符号化方式
EP0696026A2 (en) 1994-08-02 1996-02-07 Nec Corporation Speech coding device
EP0696793A2 (en) 1994-08-11 1996-02-14 Nec Corporation A speech coder
EP0756268A2 (en) 1995-07-27 1997-01-29 Nec Corporation Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits
US5737484A (en) * 1993-01-22 1998-04-07 Nec Corporation Multistage low bit-rate CELP speech coder with switching code books depending on degree of pitch periodicity
US5787389A (en) * 1995-01-17 1998-07-28 Nec Corporation Speech encoder with features extracted from current and previous frames
US5826226A (en) * 1995-09-27 1998-10-20 Nec Corporation Speech coding apparatus having amplitude information set to correspond with position information
US5832180A (en) * 1995-02-23 1998-11-03 Nec Corporation Determination of gain for pitch period in coding of speech signal
US5857168A (en) * 1996-04-12 1999-01-05 Nec Corporation Method and apparatus for coding signal while adaptively allocating number of pulses
US5873060A (en) * 1996-05-27 1999-02-16 Nec Corporation Signal coder for wide-band signals
US5884252A (en) * 1995-05-31 1999-03-16 Nec Corporation Method of and apparatus for coding speech signal
US5902244A (en) * 1997-02-05 1999-05-11 Olympus Optical Co., Ltd. Ultrasonic diagnosis apparatus including simple digital scan converter
US5963896A (en) * 1996-08-26 1999-10-05 Nec Corporation Speech coder including an excitation quantizer for retrieving positions of amplitude pulses using spectral parameters and different gains for groups of the pulses
US6023672A (en) * 1996-04-17 2000-02-08 Nec Corporation Speech coder
US6581031B1 (en) 1998-11-27 2003-06-17 Nec Corporation Speech encoding method and speech encoding system
US6856955B1 (en) 1998-07-13 2005-02-15 Nec Corporation Voice encoding/decoding device
KR100446594B1 (ko) * 1997-04-15 2005-06-02 삼성전자주식회사 음성선스펙트럼주파수의부호화/복호화장치및그방법
US6973424B1 (en) 1998-06-30 2005-12-06 Nec Corporation Voice coder
US6978235B1 (en) 1998-05-11 2005-12-20 Nec Corporation Speech coding apparatus and speech decoding apparatus
US7680669B2 (en) 2001-03-07 2010-03-16 Nec Corporation Sound encoding apparatus and method, and sound decoding apparatus and method
JP2011501889A (ja) * 2007-09-26 2011-01-13 ディズニー エンタープライゼス インコーポレイテッド モバイル装置ユーザに対してマルチメディアプレゼンテーションを提供する方法およびシステム

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5737484A (en) * 1993-01-22 1998-04-07 Nec Corporation Multistage low bit-rate CELP speech coder with switching code books depending on degree of pitch periodicity
JPH0744200A (ja) * 1993-07-29 1995-02-14 Nec Corp 音声符号化方式
EP0696026A2 (en) 1994-08-02 1996-02-07 Nec Corporation Speech coding device
US5778334A (en) * 1994-08-02 1998-07-07 Nec Corporation Speech coders with speech-mode dependent pitch lag code allocation patterns minimizing pitch predictive distortion
EP0696793A2 (en) 1994-08-11 1996-02-14 Nec Corporation A speech coder
US5774840A (en) * 1994-08-11 1998-06-30 Nec Corporation Speech coder using a non-uniform pulse type sparse excitation codebook
US5787389A (en) * 1995-01-17 1998-07-28 Nec Corporation Speech encoder with features extracted from current and previous frames
US5832180A (en) * 1995-02-23 1998-11-03 Nec Corporation Determination of gain for pitch period in coding of speech signal
US5884252A (en) * 1995-05-31 1999-03-16 Nec Corporation Method of and apparatus for coding speech signal
US6006178A (en) * 1995-07-27 1999-12-21 Nec Corporation Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits
EP0756268A2 (en) 1995-07-27 1997-01-29 Nec Corporation Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits
US5826226A (en) * 1995-09-27 1998-10-20 Nec Corporation Speech coding apparatus having amplitude information set to correspond with position information
US5857168A (en) * 1996-04-12 1999-01-05 Nec Corporation Method and apparatus for coding signal while adaptively allocating number of pulses
US6023672A (en) * 1996-04-17 2000-02-08 Nec Corporation Speech coder
US5873060A (en) * 1996-05-27 1999-02-16 Nec Corporation Signal coder for wide-band signals
US5963896A (en) * 1996-08-26 1999-10-05 Nec Corporation Speech coder including an excitation quantizer for retrieving positions of amplitude pulses using spectral parameters and different gains for groups of the pulses
US5902244A (en) * 1997-02-05 1999-05-11 Olympus Optical Co., Ltd. Ultrasonic diagnosis apparatus including simple digital scan converter
KR100446594B1 (ko) * 1997-04-15 2005-06-02 삼성전자주식회사 음성선스펙트럼주파수의부호화/복호화장치및그방법
US6978235B1 (en) 1998-05-11 2005-12-20 Nec Corporation Speech coding apparatus and speech decoding apparatus
US6973424B1 (en) 1998-06-30 2005-12-06 Nec Corporation Voice coder
US6856955B1 (en) 1998-07-13 2005-02-15 Nec Corporation Voice encoding/decoding device
US6581031B1 (en) 1998-11-27 2003-06-17 Nec Corporation Speech encoding method and speech encoding system
US7680669B2 (en) 2001-03-07 2010-03-16 Nec Corporation Sound encoding apparatus and method, and sound decoding apparatus and method
JP2011501889A (ja) * 2007-09-26 2011-01-13 ディズニー エンタープライゼス インコーポレイテッド モバイル装置ユーザに対してマルチメディアプレゼンテーションを提供する方法およびシステム

Also Published As

Publication number Publication date
JP3143956B2 (ja) 2001-03-07

Similar Documents

Publication Publication Date Title
US5208862A (en) Speech coder
JP3114197B2 (ja) 音声パラメータ符号化方法
JP3143956B2 (ja) 音声パラメータ符号化方式
JP2746039B2 (ja) 音声符号化方式
JP3151874B2 (ja) 音声パラメータ符号化方式および装置
JP3196595B2 (ja) 音声符号化装置
CA2202825C (en) Speech coder
JPH0353300A (ja) 音声符号化装置
JP2800618B2 (ja) 音声パラメータ符号化方式
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JPH05216500A (ja) 音声符号化装置
JP2624130B2 (ja) 音声符号化方式
JPH0944195A (ja) 音声符号化装置
JP3308764B2 (ja) 音声符号化装置
JPH0854898A (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3256215B2 (ja) 音声符号化装置
JP3194930B2 (ja) 音声符号化装置
US5978758A (en) Vector quantizer with first quantization using input and base vectors and second quantization using input vector and first quantization output
JP3252285B2 (ja) 音声帯域信号符号化方法
JP3102017B2 (ja) 音声符号化方法
JPH08185199A (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3428595B2 (ja) 音声符号化方式
JPH1069297A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20001128

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080105

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090105

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100105

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110105

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120105

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120105

Year of fee payment: 11