JPH04363000A - 音声パラメータ符号化方式および装置 - Google Patents
音声パラメータ符号化方式および装置Info
- Publication number
- JPH04363000A JPH04363000A JP3261925A JP26192591A JPH04363000A JP H04363000 A JPH04363000 A JP H04363000A JP 3261925 A JP3261925 A JP 3261925A JP 26192591 A JP26192591 A JP 26192591A JP H04363000 A JPH04363000 A JP H04363000A
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- vector
- spectral
- spectral parameters
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013139 quantization Methods 0.000 claims abstract description 214
- 239000013598 vector Substances 0.000 claims abstract description 188
- 230000001186 cumulative effect Effects 0.000 claims abstract description 50
- 230000003595 spectral effect Effects 0.000 claims description 111
- 238000000034 method Methods 0.000 claims description 66
- 230000005236 sound signal Effects 0.000 claims description 51
- 238000012545 processing Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 28
- 238000001228 spectrum Methods 0.000 abstract description 12
- 238000010586 diagram Methods 0.000 description 33
- 238000004458 analytical method Methods 0.000 description 17
- 238000012549 training Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 2
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 2
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 2
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 101000582320 Homo sapiens Neurogenic differentiation factor 6 Proteins 0.000 description 1
- 101000622137 Homo sapiens P-selectin Proteins 0.000 description 1
- 102100030589 Neurogenic differentiation factor 6 Human genes 0.000 description 1
- 102100023472 P-selectin Human genes 0.000 description 1
- 101000873420 Simian virus 40 SV40 early leader protein Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
め要約のデータは記録されません。
Description
ート、特に8kb/s以下で高品質に符号化する音声符
号化方式に供するための音声パラメータ符号化方式およ
び装置に関する。
レートで符号化する方式としては、例えば、M.Sch
roeder and B.Atal氏による“C
ode−excited linear pred
iction:High quality spe
ech at very low bit
rates”(Proc.ICASSP,pp.937
−940,1985年)と題した論文(文献1)や、K
leijn氏らによる“Improved spee
ch quality and efficie
nt vector quantizationi
n SELP”(Proc.ICASSP,pp.1
55−158,1988年)と題した論文(文献2)等
に記載されているCELP(CodeExcited
LPC Coding)が知られている。この方法
では、送信側では、フレーム毎(例えば20ms)に音
声信号から音声信号のスペクトル特性を表すスペクトル
パラメータを抽出し、フレームをさらに小区間サブフレ
ーム(例えば5ms)に分割し、サブフレーム毎に過去
の音源信号をもとに長時間相関(ピッチ相関)を表すピ
ッチパラメータを抽出し、ピッチパラメータによりサブ
フレームの音声信号を長期予測し、長期予測して求めた
残差信号に対して、予め定められた種類の雑音信号から
なるコードブックから選択した信号により合成した信号
と、音声信号との誤差電力を最小化するように一種類の
雑音信号を選択するとともに、最適なゲインを計算する
。そして選択された雑音信号の種類を表すインデクスと
ゲインならびに、スペクトルパラメータとピッチパラメ
ータを伝送する。
するためには、音源信号のみならずスペクトルパラメー
タの効率的な量子化法が重要である。
では、スペクトルパラメータとしてLPC分析により求
めたLPCパラメータを量子化する。量子化法としては
、通常スカラ量子化が用いられており、10次のLPC
係数を量子化するのにフレーム当り34ビット(1.7
kb/s)程度のビット数が必要であった。CELPの
ビット数を4.8kb/s以下に低減化するためにはス
ペクトルパラメータのビット数をできる限り低減する必
要があるが、これを低減すると音質が低下していた。 LPCパラメータをより効率的に量子化する方法として
、Moriya氏による“Transform co
ding of speech using
a weighted vector quan
tizer,”と題した論文(IEEE J.Sel
.Areas,Commun.,pp425−431,
1988年)(文献3)等に記載されたベクトル−スカ
ラ量子化法などが提案されているが、それでもフレーム
あたり27〜30ビット程度のビット数が必要であり、
ビットレートの低減には一層効率的な方法が必要であっ
た。
必要なビット数を下げためにフレーム長を長くとると、
スペクトルの時間的変化を良好に表すことが困難となり
、時間歪が増大し音質が劣化していた。
、スペクトルパラメータを従来よりもより少ないビット
数で量子化しても良好な音質の得られる音声パラメータ
符号化方式および装置を提供することにある。
パラメータ符号化方式は、音声信号を入力し前記音声信
号を予め定められた時間長のフレームに分割し、前記フ
レーム毎に前記音声信号のスペクトルパラメータを予め
定められた次数だけ求め、前記スペクトルパラメータを
前記次数よりも小さい予め定められた次元毎に分割し、
前記分割したスペクトルパラメータに対してコードブッ
クを探索し、複数候補のコードベクトルを出力し、前記
コードベクトルの組合せに対して次数全体で累積歪を求
め、前記累積歪を最小化するコードベクトルの組合せを
選択することにより前記スペクトルパラメータを量子化
することを特徴とする。
式は、入力した音声信号をフレームに分割し、前記フレ
ーム毎に前記音声信号のスペクトルパラメータを予め定
められた次数だけ求め、前記スペクトルパラメータを複
数種類のコードブックの多段縦続接続で表し、前記多段
縦続接続における少なくとも一つの段では複数候補のコ
ードベクトルを出力し、前記多段縦続接続における少な
くとも一つの段では、前記次数よりも小さい予め定めら
れた次元毎にスペクトルパラメータを分割し、前記分割
したスペクトルパラメータに対してコードブックを探索
して複数候補のコードベクトルを出力し、前記候補の組
合せに対して縦続接続全体で累積歪を求め、前記累積歪
を最小化するコードベクトルの組合せを選択することに
より前記スペクトルパラメータを量子化することを特徴
とする。
式は、入力した音声信号をフレームに分割しさらにフレ
ームよりも短い複数個のサブフレームに分割し、前記サ
ブフレームの少なくとも一つについて前記音声信号に対
してスペクトルパラメータを予め定められた次数だけ求
め、一つのサブフレームのスペクトルパラメータを予め
構成した第1のコードブックを用いて量子化し、他の少
なくとも一つのサブフレームのスペクトルパラメータを
前記量子化した値と予め構成した第2のコードブックあ
るいは非線形処理とを用いて量子化することを特徴とす
る。
式は、入力した音声信号をフレームに分割しさらにフレ
ームよりも短い複数個のサブフレームに分割し、前記サ
ブフレームの少なくとも一つについて前記音声信号に対
してスペクトルパラメータを予め定められた次数だけ求
め、一つのサブフレームのスペクトルパラメータを予め
構成した第1のコードブックを用いて量子化し、他の少
なくとも一つのサブフレームのスペクトルパラメータと
前記量子化した値との差分信号を求め、前記差分信号を
予め構成した第2のコードブックを用いて量子化するこ
とを特徴とする。
置は、入力した音声信号をフレームに分割する手段と、
前記音声信号に対してスペクトルパラメータを予め定め
られた次数だけ求める手段と、前記スペクトルパラメー
タをベクトル量子化する手段と、前記スペクトルパラメ
ータと前記ベクトル量子化値との差分信号をスカラ量子
化する手段とを有する音声パラメータ符号化装置におい
て、前記ベクトル量子化器における予め定められた個数
のコードベクトルの各々に対し前記スカラ量子化におけ
る量子化範囲を予め定められた次数分だけ定めてスカラ
量子化を行う手段を有することを特徴とする。
置は、入力した音声信号をフレームに分割する手段と、
前記音声信号に対してスペクトルパラメータを予め定め
られた次数だけ求める手段と、前記スペクトルパラメー
タをベクトル量子化する手段と、前記スペクトルパラメ
ータと前記ベクトル量子化値との差分信号をスカラ量子
化する手段とを有する音声パラメータ符号化装置におい
て、前記スカラ量子化手段においてスペクトルパラメー
タの各次数で複数候補の量子化値を出力する手段と、前
記候補の各々を用いて隣接するスペクトルパラメータの
量子化範囲を修正する手段と、前記量子化値による量子
化歪を予め定められた次数だけ累積し前記累積歪を最小
化する量子化値系列を出力する手段とを有することを特
徴とする。
置は、入力した音声信号をフレームに分割する手段と、
前記音声信号に対してスペクトルパラメータを予め定め
られた次数だけ求める手段と、前記スペクトルパラメー
タをベクトル量子化する手段と、前記スペクトルパラメ
ータと前記ベクトル量子化値との差分信号をスカラ量子
化する手段とを有する音声パラメータ符号化装置におい
て、前記ベクトル量子化器における予め定められた個数
のコードベクトルの各々に対し前記スカラ量子化におけ
る量子化範囲を予め定められた次数分だけ定める手段と
、前記スカラ量子化においてスペクトルパラメータの各
次数で複数候補の量子化値を出力する手段と、前記候補
の各々を用いて隣接するスペクトルパラメータの量子化
範囲を修正する手段と、前記量子化値による量子化歪を
予め定められた次数だけ累積し前記累積歪を最小化する
量子化値系列を出力する手段とを有することを特徴とす
る。
を説明する。
ック図である。図において、フレーム毎の音声信号から
計算されたスペクトルパラメータを予め定められた次数
(例えばP次)入力する。スペクトルパラメータの分析
には周知の線形予測(LPC)分析法を用いることがで
きる。ここでスペクトルパラメータとしては種々のもの
が知られているが、ここでは線スペクトル対(LSP)
パラメータを用いて説明を行う。LSPの具体的な計算
法は、菅村氏らによる“Quantizerdesig
n in LSP speech analy
sis−synthesis,”と題した論文(IEE
E J.Sel.Areas Commun.,p
p425−431,1988年)(文献4)等を参照で
きる。
次元ずつ分割し(K<P)、K次元ずつのLSPをベク
トル量子化部110へ出力する。ベクトル量子化部11
0では、分割数(例えばN)に対応したN種類のコード
ブック150−1〜150−NをK次元毎に予め構成し
ておく。ここでこれらのコードブックは、LSPに対し
てそのまま構成することもできるが、ここではLSPが
次数間で相関が強い性質を利用し、より効率的に表すた
めに、スペクトルパラメータの次数間の差分値を表すよ
うに構成する。これらのコードブックに含まれるコード
ベクトルを用いてi次目のスペクトルパラメータは以下
のように表せる。
れるj番目のコードベクトルである。
Nは、予め定められた次元数毎のスペクトルパラメータ
に対して、次数間の差分値をトレーニング信号として学
習して構成する。学習の方法は、例えばLinde,B
uzo,Gray氏による“An algorith
m for vector quantizat
iondesign”と題した論文(文献5)等を参照
できる。
次式で量子化歪を計算する。
ω’IJはj番目のコードベクトルを用いて表したi次
目のLSPである。ベクトル量子化部110では数2を
最小化するコードベクトルの候補をK次元毎に歪の小さ
い順にM種類出力する。累積歪計算部160では、K次
元毎に出力されたM種のコードベクトルの全ての組合せ
に対して累積歪を下式により計算する。
する候補の組合せを求め、このときのコードベクトルの
組合せを出力する。
発明が第1の発明と異なる点は、ベクトル量子化コード
ブックが各段のコードブックの多段縦続接続となってお
り、次の段では、前段の入力信号と前段の出力信号との
誤差信号を入力してコードブックで表す点が異なってい
る。また、少なくとも一つの段において、第1の発明と
同様に、コードブックがスペクトルパラメータの次数間
の差分を表すように構成されている。ここでは一例とし
て、段数を2とし、1段目は分割無しで、2段目ではK
次元毎にスペクトルパラメータを分割して表す場合につ
いて、図2を用いて説明する。
タを入力し、P次元のスペクトルパラメータを予め学習
して構成した第1のコードブック210を用いて量子化
する。ここでコードブック210のコードベクトルjに
対して数2の歪を計算し、歪の小さい順にM種の候補を
出力する。減算器220は、M種の候補の各々について
、入力のスペクトルパラメータとの誤差信号を計算し、
これを第2のベクトル量子化部230へ出力する。 第2のベクトル量子化部230では、誤差信号を予め定
められたK次元毎に分割する。さらに、K次元毎に次数
間の差分を表す第2のコードブック240−1〜240
−Nを用いて誤差信号を表す。ここで歪の計算には数1
,数2を用いる。さらに、K次元毎に、数2の歪が小さ
い順にM種類のコードベクトルを候補として出力する。 累積歪計算部250では、1段目で出力されたM種の候
補と、2段目でK次元毎に出力された候補の全ての組合
せに対して累積歪を計算する。最小判別部260では、
累積歪を最小化する候補の組合せを求め、このときのコ
ードベクトルの組合わせを出力する。
レーニング用のP次のLSPに対して前記文献5を用い
て行う。また、第2のコードブックの学習は、誤差信号
に対して、第1の発明と同様の方法により行う。
号化方式の作用を説明する。
ック図である。入力した音声信号を予め定められた時間
長のフレーム(例えば30〜40ms)に分割し、さら
にフレームの音声信号を、フレームよりも短いサブフレ
ーム(例えば5〜8ms)に分割し、フレーム内の少な
くとも一つのサブフレームに対して、周知のLPC分析
を行いスペクトルパラメータを求める。以下では、一例
として、フレーム内の2つのサブフレームに対してLP
C分析を行うものとする。以下では、フレーム内で2つ
のサブフレームに対してスペクトルパラメータを求める
こととする。サブフレームの位置は、図4に示すフレー
ムとサブフレームの関係より、例えば、■,■番目のサ
ブフレームについてLPC分析をするものとする。求め
たスペクトルパラメータを、図3の端子300,305
を通して入力する。端子300からサブフレーム■のス
ペクトルパラメータを入力し、端子305から■番目の
サブフレームのスペクトルパラメータを入力するものと
する。スペクトルパラメータとしては、ここでは線スペ
クトル対(LSP)パラメータを用いて説明を行う。L
SPの具体的な計算法は、前記文献4等を参照できる。 ベクトル量子化部310は、コードブック320(第1
のコードブック)を用いて、入力したLSPパラメータ
をベクトル量子化する。コードブック320は、トレー
ニング用の多量のLSPパラメータ系列を用いて予め学
習して構成する。学習の方法は、例えば前記文献5等を
参照できる。コードベクトルを探索するときの歪尺度は
、種々のものが知られているが、ここではLSPの2乗
距離を用いる。LSPの2乗距離は下式で与えられる。
SP係数を示す。LSP’J (i)はコードブックが
有するj番目のコードベクトルであり、j=1〜2B
(Bはコードブックのビット数)である。数4を最小化
するコードベクトルを端子340から出力すると共に、
予測ベクトル量子化部330へも出力する。
量子化部310の出力コードベクトルと係数コードブッ
ク360(コードブック2)を用いて、端子305より
入力した他のサブフレームのLSP系列を予測し、次式
により、予測による量子化歪を計算する。
量子化部310で求めたコードベクトルである。AL
(i)は係数コードブック360の有するl番目のコー
ドベクトルである。予測ベクトル量子化部330は、数
5を最小化する係数コードベクトルを求め、これらをサ
ブフレームにおけるスペクトルパラメータの量子化値と
して端子350から出力する。係数コードブック360
の予測係数は、トレーニング用LSP信号に対して、数
5を最小化するように、前記文献5等を用いて予め学習
して構成することができる。
て非線形予測を行う構成も考えられる。この方法は次の
2種に分けられる。一つは、係数コードブック360と
して非線形予測コードブックを用いる方法である。非線
形予測コードブックの学習法は、例えば、S.Wang
氏らによる“Performance of no
nlinear prediction of
speech”と題した論文(Proc.ICSLP,
pp.29−32,1990年)(文献6)等を参照で
きる。もう一つは、予測ベクトル量子化部330及び係
数コードブック360の代わりに、神経回路網による予
測を用いる方法も考えられる。神経回路網による予測法
の詳細は、Iso氏らによる“Speaker−ind
ependentword recognition
using a neural predi
ction model”と題した論文(Proc.
ICASSP,pp.441−444,1990年)(
文献7)等を参照できる。
。図5は第4の発明の作用を示すブロック図である。 第4の発明では、差分ベクトル量子化部470,差分コ
ードブック480が第3の発明と異なるので、この部分
について説明する。
5から入力したLSP系列とベクトル量子化部410に
よりベクトル量子化した出力との差分信号を下式により
計算する。
ではB=1として話を進める。
コードブック480を用いてベクトル量子化を行う。こ
こで差分コードブック480は、差分LSPのトレーニ
ング信号に対して、前記文献5等の方法により予め学習
して構成する。量子化歪を最小化するコードベクトルを
選択しこれを端子450から出力する。
。図6は、第5の発明の構成を示すブロック図である。 端子101から入力した音声信号を予め定められた時間
長のフレーム(例えば30〜40ms)に分割し、LS
P分析部105では周知の分析法を行いスペクトルパラ
メータを求める。スペクトルパラメータとしては、ここ
では線スペクトル対(LSP)パラメータを用いて説明
を行う。LSPの具体的な計算法は、前記文献4等を参
照できる。ベクトル量子化部110は、コードブック1
20を用いて、入力したLSPパラメータをベクトル量
子化する。コードブック120は、トレーニング用の多
量のLSPパラメータ系列を用いて予め学習して構成す
る。学習の方法は、前記文献5等を参照できる。コード
ベクトルを探索するときの歪尺度は、種々のものが知ら
れているが、ここではLSPの2乗距離を用いる。 LSPの2乗距離は下式で与えられる。
SP係数を示す。PはLSPの次数である。LSP’j
(i)はコードブックが有するj番目のコードベクト
ルであり、j=1〜2B (Bはコードブックのビット
数)である。数7を小さくするコードベクトルを求め減
算器130へ出力する。ここで、コードベクトルは数7
を最小化するものを1種類選択してもよいし、数7の小
さい順に複数種類選択してもよい。また、ベクトル量子
化部110は、選択されたコードベクトルを示すインデ
クスjをスカラ量子化部140と端子155へ出力する
。
たコードベクトルの値とを減算して残差信号e(i)を
求めこれを出力する。
20において予め定められたM種類(M≦2B :ここ
でBはコードブック120のビット数を示す)のコード
ベクトルの各々に対して、減算器130により計算され
る残差信号の分布範囲を次数i毎に予め測定しておく。 分布範囲の具体的な測定法としては、例えば前記文献4
を参照できる。さらに、ベクトル量子化部110から出
力されたインデクスjを用いて、この分布範囲を切り替
えて、次数i毎に予め定められたビット数を用いてe(
i)をスカラ量子化する。そしてスカラ量子化した結果
を端子145へ出力する。
7において図6と同一の番号を付した構成要素は図6と
同一の動作を行うので説明は省略する。
出力である残差信号e(i)に対して、次数i毎に残差
信号の存在範囲を予め測定しておく。さらに、e(i)
をスカラ量子化するときには次のように行う。次数i毎
に定められた存在範囲を量子化の最大,最小として量子
化範囲を決定し、予め定められたレベル数Lにより最大
,最小間を分割する。ここでL=2B である。次に、
各次数毎に、次式により、スカラ量子化の量子化値の各
々について、量子化歪を計算し、量子化歪の小さい順に
M種類(ここでM≦L)の候補を求める。
の出力する量子化値のM番目の候補である。文献4等で
よく知られているように、LSPの存在範囲は次数間で
大部分重複している。また、LSPの順序関係について
は、必ず下式が成立する。
値e’M (i)を用いてi−1次のスカラ量子化器の
量子化範囲を次のように制限する。
値>i次でのLSPのベクトル−スカラ量子化値ならば
、前記最大値=i次でのLSPのベクトル−スカラ量子
化値とする。
より、各次数毎に残差信号を予め定められたビット数で
スカラ量子化する。
カラ量子化値の候補の各々に対して求めた量子化歪を各
次数毎に累積した累積歪を計算する。
次数毎に求めこのときのスカラ量子化値を端子145か
ら出力する。
。図8は、第7の発明の構成を示すブロック図である。 図において、図6,7と同一の番号を付した構成要素は
、図6,7と同一の動作をするので説明は省略する。図
において、スカラ量子化部175は、コードブック12
0において予め定められたM種類(M<2B :ここで
Bはコードブック120のビット数を示す)のコードベ
クトルの各々に対して、減算器130により計算される
残差信号の分布範囲を次数i毎に予め測定しておく。さ
らに、ベクトル量子化部110から出力されたインデク
スjを用いて、この分布範囲を切り替えて、次数i毎に
予め定められたビット数を用いてe(i)をスカラ量子
化する。さらに残差信号の次数毎にスカラ量子化を行う
際に、第6の発明と同様に、i次において複数候補の量
子化値を求め、これを用いてi−1次のスカラ量子化の
量子化範囲を制限し、各候補の各々に対して量子化歪を
累積し、累積歪を最小化する量子化値次数毎に求めこれ
らを端子145から出力する。
探索には重み付け距離などの他の周知な距離尺度を用い
ることができる。
化方式を実施する符号化装置の一例を示すブロック図で
ある。
を入力し、1フレーム分(例えば20ms)の音声信号
をバッファメモリ510に格納する。
信号のスペクトル特性を表すパラメータとして、LSP
パラメータを前記フレームの音声信号から周知のLPC
分析を行い予め定められた次数Pだけ計算する。
めたLSPパラメータを予め定められた量子化ビット数
で量子化し、得た符号lKを出力端子550から出力す
る。
示すブロック図である。図において、入力端子600か
らフレームのLSPパラメータをP次入力する。
K次元ずつ分割し(K<P)、K次元ずつのLSPをベ
クトル量子化回路620へ出力する。ベクトル量子化回
路620では、分割数(例えばN)に対応したN種類の
コードブック650−1〜650−NをK次元毎に予め
構成しておく。これらのコードブックは、予め定められ
たビット数できまる種類のコードベクトルから構成され
る。またこれらのコードブックは、作用の項で述べたよ
うに、LSPの次数間の差分値を表すように構成してお
く。ベクトル量子化回路620では、LSPの1次目か
らK次元毎に数2に従い量子化歪を計算し、量子化歪の
小さい順にコードベクトルの候補をK次元毎にM種類出
力する。例えば最初のK次元でM種類の候補を出した後
に、次のK次元では、M種類の各候補を初期値として数
1に従いコードブック650−2を用いてLSPを表し
、数2に従い量子化歪を求め、量子化歪の小さい順にM
種の候補を求める。以下これらの処理を分割数Nだけ繰
り返す。
力されたM種のコードベクトルの全ての組合せに対して
累積歪を数3により計算する。
する候補の組合せを求め、このときのコードベクトルの
インデクスの組合せを端子680から出力する。
施する符号化装置の一例を示すブロック図である。図に
おいて図9と同一の番号を付した構成要素は、図9と同
一の動作を行うので説明は省略する。
図12にて説明する。
例として2とする。P次元のスペクトルパラメータを端
子705から入力し、第1のベクトル量子化回路706
において、P次元のスペクトルパラメータを、予め学習
して構成した第1のコードブック710を用いて量子化
する。ここでコードブック710の各コードベクトルに
対して数2の歪を計算し、歪の小さい順にM種の候補を
出力する。減算器707は、M種の候補の各々について
、入力のスペクトルパラメータとの誤差信号を計算し、
これを分割回路712へ出力する。分割回路712では
、P次元の誤差信号を予め定められたK次元毎に分割す
る(K<P)。第2のベクトル量子化回路715では、
K次元毎に次数間の差分を表すように構成した第2のコ
ードブック720−1〜720−Nを用いて誤差信号を
K次元毎にベクトル量子化する。ここで歪の計算には数
1,数2を用いる。さらに、K次元毎に、数2の歪が小
さい順にM種類のコードベクトルを候補として出力する
。具体的な動作は図10のベクトル量子化回路620と
同様である。
されたM種の候補と、2段目でK次元毎に出力された候
補の全ての組合せに対し量子化歪を累積し累積歪を計算
する。最小判別回路760では、累積歪を最小化する候
補の組合せを求め、このときのコードベクトルを表すイ
ンデクスの組合せを端子770から出力する。
符号化方式を実施する符号化装置の一例を示すブロック
図である。
を入力し、1フレーム分(例えば30〜40ms)の音
声信号をバッファメモリ810に格納する。
の音声信号を予め定められたサブフレーム(例えば5〜
8ms)に分割する。
サブフレーム位置(例えば図4の■,■)の音声信号の
スペクトル特性を表すパラメータとして、LSPパラメ
ータを前記フレームの音声信号から周知のLPC分析を
行い予め定められた次数Pだけ計算する。この具体的な
計算法については前記文献4等を参照することができる
。
めたLSPパラメータを予め定められた量子化ビット数
で量子化し、得た符号lK を出力端子850から出力
する。以下で一例として、LSP量子化回路では少ない
演算量、並びにメモリ量で実現できるベクトル量子化と
して、分割型ベクトル量子化を行うものとする。
示すブロック図である。図において、入力端子900か
らフレームのLSPパラメータを入力する。
K次元ずつ分割し(K<P)、K次元ずつのLSPをベ
クトル量子化回路920へ出力する。ベクトル量子化回
路920では、分割数(例えばN)に対応したN種類の
コードブック950−1〜950−NをK次元毎に予め
構成しておく。これらのコードブックは、予め定められ
たビット数Lで決まる種類(2L )のコードベクトル
から構成される。またこれらのコードブックは、LSP
の次数間の差分値を表すように構成する。これらのコー
ドブックに含まれるコードベクトルを用いてi次目のス
ペクトルパラメータは以下のように表せる。
予め定められた次元数毎のスペクトルパラメータに対し
て、次数間の差分値をトレーニング信号として学習して
構成する。学習の方法は、前記文献5等を参照できる。
次元毎に次式で量子化歪を計算する。
ω’IJはj番目のコードベクトルを用いて表したi次
目のLSPである。ベクトル量子化回路920では、L
SPの1次目からK次元毎に数5に従い量子化歪を計算
し、量子化歪の小さい順にコードベクトルの候補をK次
元毎にM種類出力する。例えば最初のK次元でM種類の
候補を出した後に、次のK次元では、M種類の各候補を
初期値として数4に従いコードブック950−2を用い
てLSPを表し、数5に従い量子化歪を求め、量子化歪
の小さい順にM種の候補を求める。以下これらの処理を
分割数Nだけ繰り返す。
されたM種のコードベクトルの全ての組合せに対して累
積歪を下式により計算する。
化する候補の組合せを求め、このときのコードベクトル
の組合せを出力する。
判別回路970の出力コードベクトルと係数コードブッ
ク980を用いて、端子905より入力した他のサブフ
レームのLSP系列を予測し、数5により、予測による
量子化歪を計算する。数5を最小化する係数コードベク
トルを求め、このコードベクトルと最小判別回路970
の出力のコードベクトルとを、2つのサブフレームにお
けるスペクトルパラメータの量子化値として端子995
から出力する。
化方式を実施する符号化装置の一例を示すブロック図で
ある。第3の発明の実施例との違いは、LSP量子化回
路1000にあるので、LSP量子化回路1000の動
作を図16を用いて説明する。
した構成要素は、図15と同一の動作を行うので説明は
省略する。図16において、差分ベクトル量子化回路1
010は、端子905から入力した他のサブフレームの
LSP系列と、最小判別回路970の出力との差分信号
を数6により計算し、差分信号に対して差分コードブッ
ク1020を用いてベクトル量子化を行い、量子化歪を
最小化するコードベクトルと、最小判別回路970の出
力であるコードベクトルとを端子995から出力する。
符号化装置の一実施例を示すブロック図である。
を入力し、1フレーム分(例えば40ms)の音声信号
をバッファメモリ103に格納する。LSP分析回路1
07は周知のLPC分析を行い、スペクトルパラメータ
としてLSP係数を求める。
ク120を用いて、入力したLSPパラメータをベクト
ル量子化する。コードブック120は、トレーニング用
の多量のLSPパラメータ系列を用いて予め学習して構
成する。コードベクトルを探索するときの歪尺度は、種
々のものが知られているが、ここではLSPの2乗距離
を用いる。数7を小さくするコードベクトルを求め減算
回路130へ出力する。ここで、コードベクトルは数7
を最小化するものを1種類選択してもよいし、数7の小
さい順に複数種類選択してもよい。また、ベクトル量子
化回路112は、選択されたコードベクトルを示すイン
デクスjをスカラ量子化回路142と端子155へ出力
する。
れたコードベクトルの値とを数8に従い減算して残差信
号e(i)を求めこれを出力する。
120において予め定められたM種類(M<2B :こ
こでBはコードブック120のビット数を示す)のコー
ドベクトルの各々に対して、減算回路130により計算
される残差信号の分布範囲を次数i毎に予め測定し量子
化範囲テーブル165に格納しておく。ベクトル量子化
回路112から出力されたインデクスjを用いて、テー
ブルの量子化範囲を切り替えて、次数i毎に予め定めら
れたビット数を用いてe(i)をスカラ量子化する。そ
してスカラ量子化した結果を端子145へ出力する。
て説明する。図18において図17と同一の番号を付し
た構成要素は図17と同一の動作を行うので、説明は省
略する。
0の出力である残差信号e(i)に対して、次数i毎に
残差信号の存在範囲を予め測定し量子化範囲テーブル1
65に格納しておく。作用の項で述べたように、各次数
毎に数9により、スカラ量子化の量子化値の各々につい
て、量子化歪を計算し、量子化歪の小さい順にM種類(
ここでM<L)の候補を求め、候補の各々に対する量子
化歪の値を累積歪計算回路175へ出力する。次に作用
の項で述べたように候補の値を用いて量子化範囲を制限
し、各次数毎に残差信号を予め定められたビット数でス
カラ量子化する。
、スカラ量子化値の候補の各々に対して求めた量子化歪
を各次数毎に累積した累積歪を計算する。
するような候補を次数毎に求め、このときのスカラ量子
化値を端子145から出力する。
ック図である。図において、図17,18と同一の番号
を付した構成要素は、図17,18と同一の動作をする
ので説明は省略する。
コードブック225において予め定められたM種類(M
<2B :ここでBはコードブック225のビット数を
示す)のコードベクトルの各々に対して、減算器130
により計算される残差信号の分布範囲を次数i毎に予め
測定し量子化範囲テーブル165へ格納しておく。さら
に、ベクトル量子化回路112から出力されたインデク
スjを用いて、この量子化範囲を切り替えて、次数i毎
に予め定められたビット数を用いて残差信号e(i)を
スカラ量子化する。さらに残差信号の次数毎にスカラ量
子化を行う際に、第6の発明と同様に、i次において複
数候補の量子化値を求め、これを用いてi−1次のスカ
ラ量子化の量子化範囲を制限し、各候補の各々に対して
スカラ量子化を行う。
候補の各々に対して次数毎に量子化歪を累積する。
量子化値を次数毎に求めこれらを端子145から出力す
る。
変形が可能である。
してLSPパラメータを用いたが、他の周知なパラメー
タ、例えばPARCOR,LAR,ケプストラムなどを
用いることもできる。
、数2で表されるLSPの2乗距離以外に他の周知な距
離尺度を用いることができる。例えば、聴感重み付け2
乗距離などが知られており、例えば、誉田氏による“重
みつき対数スペクトル歪尺度を用いたLPCパラメータ
のベクトル量子化、”と題した論文(音響学会講演論文
集,pp.195−196、1990年10月)(文献
8)等を参照することができる。
回路において、P次元のパラメータをK次元毎に均等分
割したが、不均等に分割することもできる。
ームのLSP係数のベクトル量子化には2段のベクトル
量子化器を用いたが、これは任意の段数のベクトル量子
化器を用いることができる。
分割毎、あるいは各段のベクトル量子化毎にM個の候補
を求めたが、このようにすると全次数あるいは全段では
候補数が指数的に増大する(例えば3段のベクトル量子
化では全ての候補数はM2 )。そこで、2番目の分割
以降あるいは、2段目以降のベクトル量子化では、各段
毎に累積歪を求め、累積歪の小さい順に各段毎に予め定
められた一定の候補数(例えばM種)で枝がりを行うこ
とにより、各段、全段共に候補数はMとなり、候補数が
指数的に増大するのを防ぐことができる。このようにす
ると、実施例の方式に比べ、演算量を大幅に低減するこ
とができるが、性能は若干低下する。
は、全ての分割において候補を求めるのではなく、予め
定められた段数のベクトル量子化器のみ複数種の候補を
求めて出力するようにしてもよい。
きに、スペクトルパラメータの差分を表すコードブック
の学習法としては、実施例で述べた方法以外に、下式の
誤差電力あるいは、重み付け誤差電力を最小化するよう
に、コードブックΔω’I をトレーニング信号を符号
化しながら学習することもできる。
な高速計算法、例えば、ダイナミックプログラミング法
などを用いることもできる。
型ベクトル量子化器を用いたが、コードベクトルの探索
に要する演算量を低減するために、木探索,格子型,多
段型あるいは、他の周知な構成のベクトル量子化器を用
いることもできる。これらの演算量低減化法の詳細につ
いては、例えばR.Gray氏による“Vectorq
uantization,”と題した論文(IEEE
ASSP Magazine,pp.4−29,1
984年)(文献9)等を参照できる。
コードブック1〜コードブックNは、LSPの次数間の
差分を表すコードブックを用いる例について説明したが
、LSPをそのまま表すコードブックを用いる構成とし
てもよい。
最小判別回路970を予測ベクトル量子化回路990あ
るいは差分ベクトル量子化回路1010の後ろに移動さ
せ、ベクトル量子化回路920で出力した候補の各々に
対して、予測ベクトル量子化、あるいは差分ベクトル量
子化を行い、累積歪計算回路960で求めた各候補に対
する累積歪と予測ベクトル量子化あるいは差分ベクトル
量子化による量子化歪を加算して総歪を求め、最小判定
回路970で、総歪を最小化するコードベクトルの組と
予測コードベクトルあるいは、差分コードベクトルとを
選択するようにしてもよい。このようにすると、演算量
は増大するが、さらに特性が改善される。
ル量子化方法としては、他の周知な方法を用いることも
できる。例えば、複数種のコードブックを多段縦続接続
する多段ベクトル量子化と実施例の分割ベクトル量子化
とを組み合わせてもよい。
20において、各分割毎のベクトル量子化でM個の候補
を求めたが、このようにすると全次数では候補数が指数
的に増大する(例えば3分割では全候補数はM2 )。 そこで、2番目の分割以降では、各段毎に累積歪を求め
、累積歪の小さい順に予め定められた一定の候補数(例
えばM種)で枝がりを行うことにより、候補数は全体で
常にMとなり、候補数が指数的に増大するのを防ぐこと
ができる。このようにすると、実施例の方式に比べ、演
算量を大幅に低減することができるが、性能は若干低下
する。
ではなく、予め定められた分割のベクトル量子化器のみ
複数種の候補を求めて出力するようにしてもよい。
きに、スペクトルパラメータの差分を表すコードブック
の学習法としては、実施例で述べた方法以外に、下式の
誤差電力あるいは、重み付け誤差電力を最小化するよう
に、コードブックΔω’I をクローズドループ法によ
りトレーニング信号を符号化しながら学習することもで
きる。
分コードブックを独立に学習するのではなく、トレーニ
ング信号を用いて交互に学習をくり返すことにより、最
適学習を行ってもよい。
LSPをK次元毎に均等分割したが、不均等分割でもよ
い。
な高速計算法、例えば、ダイナミックプログラミング法
などを用いることもできる。
フレーム単位で予測係数コードブックを作成するのでは
なく、複数サブフレームをまとめてコードブックを作成
する、マトリクスコードブックを用いるようにしてもよ
い。マトリクスコードブックの作成法は例えば、C.T
sao氏らによる“Matrix quantize
r design for LPC spee
ch using the generaliz
ed Lloyd algorithm,”と題し
た論文(IEEE Trans.ASSP,pp.5
37−545,1985年)(文献10)を参照できる
。マトリクスコードブックを用いる構成によれば、複数
サブフレームをまとめてコードベクトルで表現すること
になるので、予測係数コードベクトル伝送に必要なビッ
ト数を低減することができる。
のBは1以外の値を用いることもできる。またBをコー
ドブックとしてもち、最適な係数をコードブックから選
択するようにしてもよい。
スカラ量子化における距離尺度としては、2乗距離以外
に他の周知な距離尺度、例えば、重み付け距離尺度,ケ
プストラム距離尺度,メルケプストラム距離尺度などを
用いることもできる。
トルパラメータを計算したが、フレームをそれよりも短
いサブフレームに分割し、予め定められたサブフレーム
に対してスペクトルパラメータを計算しベクトル−スカ
ラ量子化してもよい。
トル量子化の予め定められた個数のコードベクトルに対
して、スカラ量子化における量子化範囲を予め定められ
た次数だけ定めるときに、全てのコードベクトル(2B
)の各々に対して量子化範囲を測定しても良いし、少
ない種類のコードベクトルの各々に対して量子化範囲を
測定しておいてもよい。また、コードベクトル毎に異な
る量子化範囲を定めてもよいし、いくつかのコードベク
トルについては共通の量子化範囲を定めてもよい。また
、量子化範囲を測定するときは、スペクトルパラメータ
の全ての次数に対して測定しても良いし、少ない次数に
対してのみ測定しておき、それ以外の次数に対しては、
予め定められた量子化範囲を与えておいてもよい。
ームに分割し、一つのサブフレームに対して本発明を適
用してスペクトルパラメータを量子化し、他の少なくと
も一つのサブフレームに対しては、前記当該フレームで
のスペクトルパラメータの量子化値と過去のフレームで
のスペクトルパラメータの量子化値と補間係数あるいは
補間係数コードブックとを用いて表すようにしてもよい
。
、音声のスペクトル特性を表すスペクトルパラメータを
量子化するときに、スペクトルパラメータを分割して分
割毎にベクトル量子化を行う。さらに、複数の候補を出
力し、全次数における各候補の組合せに対する量子化歪
の累積値を求め、これを最小化する候補の組合せを選択
しているので、少ないビット数でも比較的少ない演算量
で、性能のよい量子化器を提供することができるという
効果がある。
続接続ベクトル量子化に組み合わせており、コードブッ
ク蓄積に必要なメモリと演算量をさらに低減したうえで
性能の良好なベクトル量子化器を提供できるという効果
がある。
トル特性を表すスペクトルパラメータを量子化するとき
に、フレームをそれよりも短いサブフレームに分割し、
少なくとも1つのサブフレームでスペクトルパラメータ
を求めてベクトル量子化し、他のサブフレームのスペク
トルパラメータは、ベクトル量子化した値をもとにして
予測で表しているので、ビットレートを低減するために
フレーム長を増大させても、少ないビット数及び演算量
でスペクトルパラメータを良好に量子化できると共に、
時間変化も良好に表すことができるという大きな効果が
ある。
ームのスペクトルパラメータは、差分信号をベクトル量
子化して表しているので、ビットレートを低減するため
にフレーム長を増大させても、少ないビット数及び演算
量でスペクトルパラメータを良好に量子化できると共に
、時間変化も良好に表すことができるという大きな効果
がある。
号のスペクトルパラメータをベクトル量子化し、スペク
トルパラメータとベクトル量子化値との差分信号をスカ
ラ量子化する際に、ベクトル量子化の予め定められた個
数のコードベクトルに対してスカラ量子化における量子
化範囲を予め定められた次数分だけ定めてスカラ量子化
を行う。また、第5〜第7の発明によれば、差分信号を
スカラ量子化する際に、スカラ量子化で複数候補の量子
化値を出力しこの量子化値を用いて隣接するスペクトル
パラメータの量子化範囲を修正し、候補の各々に対して
スカラ量子化したときの量子化歪を予め定められた次数
分だけ累積し、累積歪を最小にする量子化値系列を出力
している。従って、スペクトルパラメータの量子化に必
要なビット数を従来法よりも低減化することができると
いう大きな効果がある。
作用を示すブロック図である。
作用を示すブロック図である。
作用を示すブロック図である。
。
作用を示すブロック図である。
作用を説明するためのブロック図である。
作用を説明するためのブロック図である。
作用を説明するためのブロック図である。
実施する符号化装置の一例を示すブロック図である。
ク図である。
を実施する符号化装置の一例を示すブロック図である。
ック図である。
を実施する符号化装置の一例を示すブロック図である。
ック図である。
を実施する符号化装置の一例を示すブロック図である。
ック図である。
実施例を示すブロック図である。
実施例を示すブロック図である。
実施例を示すブロック図である。
量子化範囲テーブル 175 累積歪計算回路 185 判別回路 530 LPC分析回路 540,700 LSP量子化回路 650,720 コードブック 660,750 累積歪計算回路 670,760 最小判別回路 706 第1のベクトル量子化回路 707 減算器 710 第1のコードブック 715 第2のベクトル量子化回路 810 バッファメモリ 820 サブフレーム分割回路 830 LPC分析回路 840,1000 LSP量子化回路920 ベク
トル量子化回路 960 累積歪計算回路 970 最小判別回路 980 係数コードブック 990 予測ベクトル量子化回路 1010 差分ベクトル量子化回路 1020 差分コードブック
Claims (7)
- 【請求項1】音声信号を入力し前記音声信号を予め定め
られた時間長のフレームに分割し、前記フレーム毎に前
記音声信号のスペクトルパラメータを予め定められた次
数だけ求め、前記スペクトルパラメータを前記次数より
も小さい予め定められた次元毎に分割し、前記分割した
スペクトルパラメータに対してコードブックを探索し、
複数候補のコードベクトルを出力し、前記コードベクト
ルの組合せに対して次数全体で累積歪を求め、前記累積
歪を最小化するコードベクトルの組合せを選択すること
により前記スペクトルパラメータを量子化することを特
徴とする音声パラメータ符号化方式。 - 【請求項2】入力した音声信号をフレームに分割し、前
記フレーム毎に前記音声信号のスペクトルパラメータを
予め定められた次数だけ求め、前記スペクトルパラメー
タを複数種類のコードブックの多段縦続接続で表し、前
記多段縦続接続における少なくとも一つの段では複数候
補のコードベクトルを出力し、前記多段縦続接続におけ
る少なくとも一つの段では、前記次数よりも小さい予め
定められた次元毎にスペクトルパラメータを分割し、前
記分割したスペクトルパラメータに対してコードブック
を探索して複数候補のコードベクトルを出力し、前記候
補の組合せに対して縦続接続全体で累積歪を求め、前記
累積歪を最小化するコードベクトルの組合せを選択する
ことにより前記スペクトルパラメータを量子化すること
を特徴とする音声パラメータ符号化方式。 - 【請求項3】入力した音声信号をフレームに分割しさら
にフレームよりも短い複数個のサブフレームに分割し、
前記サブフレームの少なくとも一つについて前記音声信
号に対してスペクトルパラメータを予め定められた次数
だけ求め、一つのサブフレームのスペクトルパラメータ
を予め構成した第1のコードブックを用いて量子化し、
他の少なくとも一つのサブフレームのスペクトルパラメ
ータを前記量子化した値と予め構成した第2のコードブ
ックあるいは非線形処理とを用いて量子化することを特
徴とする音声パラメータ符号化方式。 - 【請求項4】入力した音声信号をフレームに分割しさら
にフレームよりも短い複数個のサブフレームに分割し、
前記サブフレームの少なくとも一つについて前記音声信
号に対してスペクトルパラメータを予め定められた次数
だけ求め、一つのサブフレームのスペクトルパラメータ
を予め構成した第1のコードブックを用いて量子化し、
他の少なくとも一つのサブフレームのスペクトルパラメ
ータと前記量子化した値との差分信号を求め、前記差分
信号を予め構成した第2のコードブックを用いて量子化
することを特徴とする音声パラメータ符号化方式。 - 【請求項5】入力した音声信号をフレームに分割する手
段と、前記音声信号に対してスペクトルパラメータを予
め定められた次数だけ求める手段と、前記スペクトルパ
ラメータをベクトル量子化する手段と、前記スペクトル
パラメータと前記ベクトル量子化値との差分信号をスカ
ラ量子化する手段とを有する音声パラメータ符号化装置
において、前記ベクトル量子化器における予め定められ
た個数のコードベクトルの各々に対し前記スカラ量子化
における量子化範囲を予め定められた次数分だけ定めて
スカラ量子化を行う手段を有することを特徴とする音声
パラメータ符号化装置。 - 【請求項6】入力した音声信号をフレームに分割する手
段と、前記音声信号に対してスペクトルパラメータを予
め定められた次数だけ求める手段と、前記スペクトルパ
ラメータをベクトル量子化する手段と、前記スペクトル
パラメータと前記ベクトル量子化値との差分信号をスカ
ラ量子化する手段とを有する音声パラメータ符号化装置
において、前記スカラ量子化手段においてスペクトルパ
ラメータの各次数で複数候補の量子化値を出力する手段
と、前記候補の各々を用いて隣接するスペクトルパラメ
ータの量子化範囲を修正する手段と、前記量子化値によ
る量子化歪を予め定められた次数だけ累積し前記累積歪
を最小化する量子化値系列を出力する手段とを有するこ
とを特徴とする音声パラメータ符号化装置。 - 【請求項7】入力した音声信号をフレームに分割する手
段と、前記音声信号に対してスペクトルパラメータを予
め定められた次数だけ求める手段と、前記スペクトルパ
ラメータをベクトル量子化する手段と、前記スペクトル
パラメータと前記ベクトル量子化値との差分信号をスカ
ラ量子化する手段とを有する音声パラメータ符号化装置
において、前記ベクトル量子化器における予め定められ
た個数のコードベクトルの各々に対し前記スカラ量子化
における量子化範囲を予め定められた次数分だけ定める
手段と、前記スカラ量子化においてスペクトルパラメー
タの各次数で複数候補の量子化値を出力する手段と、前
記候補の各々を用いて隣接するスペクトルパラメータの
量子化範囲を修正する手段と、前記量子化値による量子
化歪を予め定められた次数だけ累積し前記累積歪を最小
化する量子化値系列を出力する手段とを有することを特
徴とする音声パラメータ符号化装置。
Priority Applications (9)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP26192591A JP3151874B2 (ja) | 1991-02-26 | 1991-10-09 | 音声パラメータ符号化方式および装置 |
| DE69229974T DE69229974T2 (de) | 1991-02-26 | 1992-02-25 | Verfahren und Vorrichtung zur Kodierung von Sprachparametern |
| EP98124813A EP0910063B1 (en) | 1991-02-26 | 1992-02-25 | Speech parameter coding method |
| EP92103179A EP0504627B1 (en) | 1991-02-26 | 1992-02-25 | Speech parameter coding method and apparatus |
| DE69232879T DE69232879T2 (de) | 1991-02-26 | 1992-02-25 | Sprachparameterkodierungsvorrichtung |
| DE69232887T DE69232887T2 (de) | 1991-02-26 | 1992-02-25 | Sprachkodierungsverfahren |
| EP98124814A EP0910064B1 (en) | 1991-02-26 | 1992-02-25 | Speech parameter coding apparatus |
| CA002061832A CA2061832C (en) | 1991-02-26 | 1992-02-25 | Speech parameter coding method and apparatus |
| US07/841,726 US5487128A (en) | 1991-02-26 | 1992-02-26 | Speech parameter coding method and appparatus |
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10326791 | 1991-02-26 | ||
| JP3-103267 | 1991-02-26 | ||
| JP26192591A JP3151874B2 (ja) | 1991-02-26 | 1991-10-09 | 音声パラメータ符号化方式および装置 |
| US07/841,726 US5487128A (en) | 1991-02-26 | 1992-02-26 | Speech parameter coding method and appparatus |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH04363000A true JPH04363000A (ja) | 1992-12-15 |
| JP3151874B2 JP3151874B2 (ja) | 2001-04-03 |
Family
ID=27309938
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP26192591A Expired - Lifetime JP3151874B2 (ja) | 1991-02-26 | 1991-10-09 | 音声パラメータ符号化方式および装置 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US5487128A (ja) |
| EP (1) | EP0504627B1 (ja) |
| JP (1) | JP3151874B2 (ja) |
| CA (1) | CA2061832C (ja) |
Cited By (25)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0744200A (ja) * | 1993-07-29 | 1995-02-14 | Nec Corp | 音声符号化方式 |
| EP0696793A2 (en) | 1994-08-11 | 1996-02-14 | Nec Corporation | A speech coder |
| EP0756268A2 (en) | 1995-07-27 | 1997-01-29 | Nec Corporation | Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits |
| US5737484A (en) * | 1993-01-22 | 1998-04-07 | Nec Corporation | Multistage low bit-rate CELP speech coder with switching code books depending on degree of pitch periodicity |
| US5778334A (en) * | 1994-08-02 | 1998-07-07 | Nec Corporation | Speech coders with speech-mode dependent pitch lag code allocation patterns minimizing pitch predictive distortion |
| US5787389A (en) * | 1995-01-17 | 1998-07-28 | Nec Corporation | Speech encoder with features extracted from current and previous frames |
| US5826226A (en) * | 1995-09-27 | 1998-10-20 | Nec Corporation | Speech coding apparatus having amplitude information set to correspond with position information |
| US5832180A (en) * | 1995-02-23 | 1998-11-03 | Nec Corporation | Determination of gain for pitch period in coding of speech signal |
| US5857168A (en) * | 1996-04-12 | 1999-01-05 | Nec Corporation | Method and apparatus for coding signal while adaptively allocating number of pulses |
| US5873060A (en) * | 1996-05-27 | 1999-02-16 | Nec Corporation | Signal coder for wide-band signals |
| US5884252A (en) * | 1995-05-31 | 1999-03-16 | Nec Corporation | Method of and apparatus for coding speech signal |
| US5902244A (en) * | 1997-02-05 | 1999-05-11 | Olympus Optical Co., Ltd. | Ultrasonic diagnosis apparatus including simple digital scan converter |
| JPH11511299A (ja) * | 1995-05-15 | 1999-09-28 | グラハム クレイブン、ピーター | 波形データ用無損失符号化法 |
| US5963896A (en) * | 1996-08-26 | 1999-10-05 | Nec Corporation | Speech coder including an excitation quantizer for retrieving positions of amplitude pulses using spectral parameters and different gains for groups of the pulses |
| US6009388A (en) * | 1996-12-18 | 1999-12-28 | Nec Corporation | High quality speech code and coding method |
| US6023672A (en) * | 1996-04-17 | 2000-02-08 | Nec Corporation | Speech coder |
| US6581031B1 (en) | 1998-11-27 | 2003-06-17 | Nec Corporation | Speech encoding method and speech encoding system |
| US6856955B1 (en) | 1998-07-13 | 2005-02-15 | Nec Corporation | Voice encoding/decoding device |
| US6973424B1 (en) | 1998-06-30 | 2005-12-06 | Nec Corporation | Voice coder |
| US6978235B1 (en) | 1998-05-11 | 2005-12-20 | Nec Corporation | Speech coding apparatus and speech decoding apparatus |
| WO2007132750A1 (ja) * | 2006-05-12 | 2007-11-22 | Panasonic Corporation | Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法 |
| WO2010073977A1 (ja) * | 2008-12-22 | 2010-07-01 | 日本電信電話株式会社 | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 |
| JP2010256932A (ja) * | 1998-10-06 | 2010-11-11 | Robert Bosch Gmbh | 音声信号標本値の符号化または復号化のための方法並びに符号化器ないし復号化器 |
| JP5687706B2 (ja) * | 2010-09-17 | 2015-03-18 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 量子化装置及び量子化方法 |
| JP2019139670A (ja) * | 2018-02-15 | 2019-08-22 | 株式会社東芝 | データ処理装置、データ処理方法およびプログラム |
Families Citing this family (33)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6007676A (en) * | 1992-09-29 | 1999-12-28 | Boehringer Ingelheim International Gmbh | Atomizing nozzle and filter and spray generating device |
| DE4315319C2 (de) * | 1993-05-07 | 2002-11-14 | Bosch Gmbh Robert | Verfahren zur Aufbereitung von Daten, insbesondere von codierten Sprachsignalparametern |
| DE4315313C2 (de) * | 1993-05-07 | 2001-11-08 | Bosch Gmbh Robert | Vektorcodierverfahren insbesondere für Sprachsignale |
| JP2655046B2 (ja) * | 1993-09-13 | 1997-09-17 | 日本電気株式会社 | ベクトル量子化装置 |
| JPH07160297A (ja) * | 1993-12-10 | 1995-06-23 | Nec Corp | 音声パラメータ符号化方式 |
| US5692100A (en) * | 1994-02-02 | 1997-11-25 | Matsushita Electric Industrial Co., Ltd. | Vector quantizer |
| JP3557255B2 (ja) * | 1994-10-18 | 2004-08-25 | 松下電器産業株式会社 | Lspパラメータ復号化装置及び復号化方法 |
| US5751903A (en) * | 1994-12-19 | 1998-05-12 | Hughes Electronics | Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset |
| JPH08179796A (ja) * | 1994-12-21 | 1996-07-12 | Sony Corp | 音声符号化方法 |
| JP2982637B2 (ja) * | 1995-01-17 | 1999-11-29 | 日本電気株式会社 | スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置 |
| JPH08292797A (ja) * | 1995-04-20 | 1996-11-05 | Nec Corp | 音声符号化装置 |
| KR100322706B1 (ko) * | 1995-09-25 | 2002-06-20 | 윤종용 | 선형예측부호화계수의부호화및복호화방법 |
| AU7481296A (en) * | 1995-10-31 | 1997-05-22 | Motorola, Inc. | Method and system for compressing a speech signal using nonlinear prediction |
| US6175817B1 (en) * | 1995-11-20 | 2001-01-16 | Robert Bosch Gmbh | Method for vector quantizing speech signals |
| US6393391B1 (en) * | 1998-04-15 | 2002-05-21 | Nec Corporation | Speech coder for high quality at low bit rates |
| WO1997027578A1 (en) * | 1996-01-26 | 1997-07-31 | Motorola Inc. | Very low bit rate time domain speech analyzer for voice messaging |
| US6192336B1 (en) * | 1996-09-30 | 2001-02-20 | Apple Computer, Inc. | Method and system for searching for an optimal codevector |
| KR100389897B1 (ko) * | 1996-10-31 | 2003-10-17 | 삼성전자주식회사 | 분할된 lsf 벡터의 예측-연결 양자화 방법 |
| JP3067676B2 (ja) * | 1997-02-13 | 2000-07-17 | 日本電気株式会社 | Lspの予測符号化装置及び方法 |
| US6009387A (en) * | 1997-03-20 | 1999-12-28 | International Business Machines Corporation | System and method of compression/decompressing a speech signal by using split vector quantization and scalar quantization |
| KR100446594B1 (ko) * | 1997-04-15 | 2005-06-02 | 삼성전자주식회사 | 음성선스펙트럼주파수의부호화/복호화장치및그방법 |
| CN1124590C (zh) * | 1997-09-10 | 2003-10-15 | 三星电子株式会社 | 改善话音信号编码器性能的方法 |
| US6151414A (en) * | 1998-01-30 | 2000-11-21 | Lucent Technologies Inc. | Method for signal encoding and feature extraction |
| EP1062657A4 (en) * | 1998-02-12 | 2004-10-06 | Motorola Inc | SYSTEM AND METHOD FOR PROVIDING VECTOR SEGMENTS, QUANTIFICATION DATA ENCODING |
| US6064955A (en) | 1998-04-13 | 2000-05-16 | Motorola | Low complexity MBE synthesizer for very low bit rate voice messaging |
| SE521225C2 (sv) * | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
| SE9804455L (sv) * | 1998-12-21 | 2000-06-22 | Ericsson Telefon Ab L M | Förfarande och arrangemang för att finna en optimal rekonstruktionspunkt |
| JP3426207B2 (ja) * | 2000-10-26 | 2003-07-14 | 三菱電機株式会社 | 音声符号化方法および装置 |
| AU2002224116A1 (en) * | 2000-11-27 | 2002-06-03 | Matsushita Electric Industrial Co., Ltd. | Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound |
| AU2003267713A1 (en) * | 2002-10-03 | 2004-04-23 | Koninklijke Philips Electronics N.V. | Encoding and decoding a media signal |
| US8352248B2 (en) * | 2003-01-03 | 2013-01-08 | Marvell International Ltd. | Speech compression method and apparatus |
| KR100651712B1 (ko) * | 2003-07-10 | 2006-11-30 | 학교법인연세대학교 | 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법 |
| US9588155B2 (en) * | 2014-10-16 | 2017-03-07 | Freescale Semiconductor, Inc. | Current detection circuit with over-current protection |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA1323934C (en) * | 1986-04-15 | 1993-11-02 | Tetsu Taguchi | Speech processing apparatus |
| GB2210236B (en) * | 1987-09-24 | 1991-12-18 | Newbridge Networks Corp | Speech processing system |
| US4852179A (en) * | 1987-10-05 | 1989-07-25 | Motorola, Inc. | Variable frame rate, fixed bit rate vocoding method |
| DE3883701T2 (de) * | 1987-10-30 | 1994-02-10 | Nippon Telegraph & Telephone | Verfahren und Vorrichtung für multiplexierte Vektorquantifizierung. |
| US5194950A (en) * | 1988-02-29 | 1993-03-16 | Mitsubishi Denki Kabushiki Kaisha | Vector quantizer |
| JP2625998B2 (ja) * | 1988-12-09 | 1997-07-02 | 沖電気工業株式会社 | 特徴抽出方式 |
| JPH0365822A (ja) * | 1989-08-04 | 1991-03-20 | Fujitsu Ltd | ベクトル量子化符号器及びベクトル量子化復号器 |
| JP3256215B2 (ja) * | 1990-02-22 | 2002-02-12 | 日本電気株式会社 | 音声符号化装置 |
| US5208862A (en) * | 1990-02-22 | 1993-05-04 | Nec Corporation | Speech coder |
| US5271089A (en) * | 1990-11-02 | 1993-12-14 | Nec Corporation | Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits |
-
1991
- 1991-10-09 JP JP26192591A patent/JP3151874B2/ja not_active Expired - Lifetime
-
1992
- 1992-02-25 CA CA002061832A patent/CA2061832C/en not_active Expired - Lifetime
- 1992-02-25 EP EP92103179A patent/EP0504627B1/en not_active Expired - Lifetime
- 1992-02-26 US US07/841,726 patent/US5487128A/en not_active Expired - Lifetime
Cited By (29)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5737484A (en) * | 1993-01-22 | 1998-04-07 | Nec Corporation | Multistage low bit-rate CELP speech coder with switching code books depending on degree of pitch periodicity |
| JPH0744200A (ja) * | 1993-07-29 | 1995-02-14 | Nec Corp | 音声符号化方式 |
| US5778334A (en) * | 1994-08-02 | 1998-07-07 | Nec Corporation | Speech coders with speech-mode dependent pitch lag code allocation patterns minimizing pitch predictive distortion |
| EP0696793A2 (en) | 1994-08-11 | 1996-02-14 | Nec Corporation | A speech coder |
| US5774840A (en) * | 1994-08-11 | 1998-06-30 | Nec Corporation | Speech coder using a non-uniform pulse type sparse excitation codebook |
| US5787389A (en) * | 1995-01-17 | 1998-07-28 | Nec Corporation | Speech encoder with features extracted from current and previous frames |
| US5832180A (en) * | 1995-02-23 | 1998-11-03 | Nec Corporation | Determination of gain for pitch period in coding of speech signal |
| JPH11511299A (ja) * | 1995-05-15 | 1999-09-28 | グラハム クレイブン、ピーター | 波形データ用無損失符号化法 |
| US5884252A (en) * | 1995-05-31 | 1999-03-16 | Nec Corporation | Method of and apparatus for coding speech signal |
| US6006178A (en) * | 1995-07-27 | 1999-12-21 | Nec Corporation | Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits |
| EP0756268A2 (en) | 1995-07-27 | 1997-01-29 | Nec Corporation | Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits |
| US5826226A (en) * | 1995-09-27 | 1998-10-20 | Nec Corporation | Speech coding apparatus having amplitude information set to correspond with position information |
| US5857168A (en) * | 1996-04-12 | 1999-01-05 | Nec Corporation | Method and apparatus for coding signal while adaptively allocating number of pulses |
| US6023672A (en) * | 1996-04-17 | 2000-02-08 | Nec Corporation | Speech coder |
| US5873060A (en) * | 1996-05-27 | 1999-02-16 | Nec Corporation | Signal coder for wide-band signals |
| US5963896A (en) * | 1996-08-26 | 1999-10-05 | Nec Corporation | Speech coder including an excitation quantizer for retrieving positions of amplitude pulses using spectral parameters and different gains for groups of the pulses |
| US6009388A (en) * | 1996-12-18 | 1999-12-28 | Nec Corporation | High quality speech code and coding method |
| US5902244A (en) * | 1997-02-05 | 1999-05-11 | Olympus Optical Co., Ltd. | Ultrasonic diagnosis apparatus including simple digital scan converter |
| US6978235B1 (en) | 1998-05-11 | 2005-12-20 | Nec Corporation | Speech coding apparatus and speech decoding apparatus |
| US6973424B1 (en) | 1998-06-30 | 2005-12-06 | Nec Corporation | Voice coder |
| US6856955B1 (en) | 1998-07-13 | 2005-02-15 | Nec Corporation | Voice encoding/decoding device |
| JP2010256932A (ja) * | 1998-10-06 | 2010-11-11 | Robert Bosch Gmbh | 音声信号標本値の符号化または復号化のための方法並びに符号化器ないし復号化器 |
| US6581031B1 (en) | 1998-11-27 | 2003-06-17 | Nec Corporation | Speech encoding method and speech encoding system |
| WO2007132750A1 (ja) * | 2006-05-12 | 2007-11-22 | Panasonic Corporation | Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法 |
| WO2010073977A1 (ja) * | 2008-12-22 | 2010-07-01 | 日本電信電話株式会社 | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 |
| JP5253518B2 (ja) * | 2008-12-22 | 2013-07-31 | 日本電信電話株式会社 | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 |
| JP5687706B2 (ja) * | 2010-09-17 | 2015-03-18 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 量子化装置及び量子化方法 |
| JP2019139670A (ja) * | 2018-02-15 | 2019-08-22 | 株式会社東芝 | データ処理装置、データ処理方法およびプログラム |
| US10853400B2 (en) | 2018-02-15 | 2020-12-01 | Kabushiki Kaisha Toshiba | Data processing device, data processing method, and computer program product |
Also Published As
| Publication number | Publication date |
|---|---|
| EP0504627B1 (en) | 1999-09-15 |
| US5487128A (en) | 1996-01-23 |
| CA2061832A1 (en) | 1992-08-27 |
| EP0504627A2 (en) | 1992-09-23 |
| EP0504627A3 (en) | 1993-02-24 |
| JP3151874B2 (ja) | 2001-04-03 |
| CA2061832C (en) | 1996-04-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH04363000A (ja) | 音声パラメータ符号化方式および装置 | |
| US5208862A (en) | Speech coder | |
| JP3114197B2 (ja) | 音声パラメータ符号化方法 | |
| JP3042886B2 (ja) | ベクトル量子化器の方法および装置 | |
| EP1353323B1 (en) | Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound | |
| JP3254687B2 (ja) | 音声符号化方式 | |
| JP3196595B2 (ja) | 音声符号化装置 | |
| JP3143956B2 (ja) | 音声パラメータ符号化方式 | |
| US5682407A (en) | Voice coder for coding voice signal with code-excited linear prediction coding | |
| JP2800618B2 (ja) | 音声パラメータ符号化方式 | |
| US5819224A (en) | Split matrix quantization | |
| JPH11143498A (ja) | Lpc係数のベクトル量子化方法 | |
| JPH08292797A (ja) | 音声符号化装置 | |
| JP3194930B2 (ja) | 音声符号化装置 | |
| EP0910064B1 (en) | Speech parameter coding apparatus | |
| JP3335650B2 (ja) | 音声符号化方式 | |
| JPH06282298A (ja) | 音声の符号化方法 | |
| JP3428595B2 (ja) | 音声符号化方式 | |
| JP3144194B2 (ja) | 音声符号化装置 | |
| JPH04328800A (ja) | 音声の線形予測パラメータ符号化方法 | |
| JPH0455899A (ja) | 音声信号符号化方式 | |
| JPH08194499A (ja) | 音声符号化装置 | |
| JP3092344B2 (ja) | 音声符号化装置 | |
| JPH10105196A (ja) | 音声符号化装置 | |
| JPH05341800A (ja) | 音声符号化装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080126 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090126 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100126 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110126 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110126 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120126 Year of fee payment: 11 |
|
| EXPY | Cancellation because of completion of term | ||
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120126 Year of fee payment: 11 |