JPH02272500A - コード駆動音声符号化方式 - Google Patents
コード駆動音声符号化方式Info
- Publication number
- JPH02272500A JPH02272500A JP1093568A JP9356889A JPH02272500A JP H02272500 A JPH02272500 A JP H02272500A JP 1093568 A JP1093568 A JP 1093568A JP 9356889 A JP9356889 A JP 9356889A JP H02272500 A JPH02272500 A JP H02272500A
- Authority
- JP
- Japan
- Prior art keywords
- linear prediction
- signal
- error
- white noise
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Peptides Or Proteins (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概要〕
高能率音声符号化方式に使用されるコード駆動音声符号
化方式に関し、 号アルタイムで小型の音声符号器を提供できる様にする
ことを目的とし、 人力信号の線形予測を行って第1の線形予測パラメータ
を抽出する第1の線形予測分析処理部と。
化方式に関し、 号アルタイムで小型の音声符号器を提供できる様にする
ことを目的とし、 人力信号の線形予測を行って第1の線形予測パラメータ
を抽出する第1の線形予測分析処理部と。
(1/M)に間引きされた白色雑音系列がコードとして
蓄えられ、入力するコード番号に対応した白色雑音が取
り出されるコードブックと、入力した該第1の線形予測
パラメータと該コードブックから取り出された白色雑音
とから第1の再生信号を生成する予測部と、該第1の再
生信号と該入力信号とを比較して誤差を求める比較部と
、第2の線形予測分析部とを設け、該予測部と比較部と
で全てのコード番号について第1の再生信号を生成して
入力信号との誤差を求め、誤差が最少となる最適コード
番号を選択した後、該第2の線形予測分析処理部で該最
適コード番号を用いて合成した第2の再生信号と人力信
号との残差成分の自乗和を最少とする第2の線形予測パ
ラメータを再計算し。
蓄えられ、入力するコード番号に対応した白色雑音が取
り出されるコードブックと、入力した該第1の線形予測
パラメータと該コードブックから取り出された白色雑音
とから第1の再生信号を生成する予測部と、該第1の再
生信号と該入力信号とを比較して誤差を求める比較部と
、第2の線形予測分析部とを設け、該予測部と比較部と
で全てのコード番号について第1の再生信号を生成して
入力信号との誤差を求め、誤差が最少となる最適コード
番号を選択した後、該第2の線形予測分析処理部で該最
適コード番号を用いて合成した第2の再生信号と人力信
号との残差成分の自乗和を最少とする第2の線形予測パ
ラメータを再計算し。
該第2の線形予測パラメータと最適コード番号とを音声
符号化情報とする様に構成する。
符号化情報とする様に構成する。
本発明は高能率音声符号化方式に使用されるコード駆動
音声符号化方式に関するものである。
音声符号化方式に関するものである。
一般に、高能率音声符号化方式を通信システムに適用す
ることにより、■音声の低ビツトレート伝送により回線
コストの低減が図れる。■音声信号と非音声信号との同
時通信が容易となり経済性および利便性が向上する。■
無線周波数の有効利用や音声蓄積メモリの経済化を図る
ことができる等の利点が得られる。
ることにより、■音声の低ビツトレート伝送により回線
コストの低減が図れる。■音声信号と非音声信号との同
時通信が容易となり経済性および利便性が向上する。■
無線周波数の有効利用や音声蓄積メモリの経済化を図る
ことができる等の利点が得られる。
そこで、上記の高能率符号化方式は企業内通信システム
、ディジタル移動無線システム、音声蓄積応答システム
への適用が期待されるが、特に通信システムや無線シス
テムではリアルタイムで小型の音声符号器を提供できる
様にすることが必要である。
、ディジタル移動無線システム、音声蓄積応答システム
への適用が期待されるが、特に通信システムや無線シス
テムではリアルタイムで小型の音声符号器を提供できる
様にすることが必要である。
音声通信は信号源、受信源ともに人間である為。
音声信号には相当の冗長性が含まれている。この為、音
声を伝送したり、蓄積する際に音声の持つ情報を完全に
送受しなくても十分品質の良い音声を再現することが可
能で、この冗長性を除いて音声を効率よく圧縮する高能
率音声符号化方式の研究が進められている。
声を伝送したり、蓄積する際に音声の持つ情報を完全に
送受しなくても十分品質の良い音声を再現することが可
能で、この冗長性を除いて音声を効率よく圧縮する高能
率音声符号化方式の研究が進められている。
この高能率音声符号化方式の1つにコード駆動音声符号
化方式(以下、 CELP方式と省略する)があるが、
このCELP方式は低ビツトレート音声符号化方式の一
つとして知られ、非常に優れた再生音声品質が得られる
。
化方式(以下、 CELP方式と省略する)があるが、
このCELP方式は低ビツトレート音声符号化方式の一
つとして知られ、非常に優れた再生音声品質が得られる
。
さて、第5図は従来例のブロック図、第6図は処理フロ
ー図を示す、以下、第6図を参照して第5図の動作を説
明する。
ー図を示す、以下、第6図を参照して第5図の動作を説
明する。
先ず、音声は肺から押し出される呼気流によって声帯振
動や乱流雑音などの音源を生成し、それに声道の形を変
形させてさまざまな音色を付加して作られる。そこで、
音声の言語的な内容は声道の形によって表現される部分
が多いが、声道の形状は音声の周波数スペクトルが反映
しているので。
動や乱流雑音などの音源を生成し、それに声道の形を変
形させてさまざまな音色を付加して作られる。そこで、
音声の言語的な内容は声道の形によって表現される部分
が多いが、声道の形状は音声の周波数スペクトルが反映
しているので。
音韻情報はスペクトル分析によって抽出することができ
る。
る。
このスペクトル分析の手法の一つに線形予測分析法があ
るが、この分析法は音声信号のサンプル値がそれ以前の
時刻のいくつかのサンプル値の線形結合で近似されると
云う考えに基づいている。
るが、この分析法は音声信号のサンプル値がそれ以前の
時刻のいくつかのサンプル値の線形結合で近似されると
云う考えに基づいている。
さて、入力信号はあらかじめ9例えば20m5の長さの
処理フレームに切り出されて線形予測分析処理部11に
加えられ、その処理フレームについてのスペクトル包絡
を予測分析して線形予測係数ai(例えば、i・1〜1
0)とピッチ周期、ピッチ予測係数が抽出され、線形予
測係数a!は短期予測器13に、ピッチ周期、ピッチ予
測係数は長即予測器14に加えられる(第6図−■参照
)。
処理フレームに切り出されて線形予測分析処理部11に
加えられ、その処理フレームについてのスペクトル包絡
を予測分析して線形予測係数ai(例えば、i・1〜1
0)とピッチ周期、ピッチ予測係数が抽出され、線形予
測係数a!は短期予測器13に、ピッチ周期、ピッチ予
測係数は長即予測器14に加えられる(第6図−■参照
)。
尚、線形予測分析により残差信号が得られるが。
CELP方式ではこの残差信号は駆動源として使用せず
、後述する白色雑音波形を駆動源として使用する。また
、短期予測器13.長期予測器14は入力“0″゛で駆
動されて入力信号から差し引かれ、前の処理フレームの
影響が除去される(第6図−■参照)。
、後述する白色雑音波形を駆動源として使用する。また
、短期予測器13.長期予測器14は入力“0″゛で駆
動されて入力信号から差し引かれ、前の処理フレームの
影響が除去される(第6図−■参照)。
一方、白色雑音コードブック16には駆動源として使用
する白色雑音波形の系列(以下、雑音波形と省略する)
がコードとして蓄えられている。尚。
する白色雑音波形の系列(以下、雑音波形と省略する)
がコードとして蓄えられている。尚。
この雑音波形のレベルは正規化されている。
次に、白色雑音コードブック16は入力コード番号に対
応する雑音波形を出力するが、この雑音波形は前記の様
に正規化されているので、所定の評価式により得られる
利得を有する増幅器15を通った後、長期予測器14で
ピンチ周期性の予測を行い。
応する雑音波形を出力するが、この雑音波形は前記の様
に正規化されているので、所定の評価式により得られる
利得を有する増幅器15を通った後、長期予測器14で
ピンチ周期性の予測を行い。
更に短期予測器13で近接サンプル間の予測をして再生
信号を生成するが、この信号を比較器12に加える。
信号を生成するが、この信号を比較器12に加える。
比較器12には入力信号も加えられているので。
比較されて差分信号が取り出され、聴覚重み付は処理部
17で雑音波形のスペクトルに対して人間の音声スペク
トルに合わせた形で重み付けをして誤差信号として誤差
評価部18に加える。誤差評価部18では誤差信号の自
乗和を取って後述するサブフレーム内での誤差電力を評
価する。
17で雑音波形のスペクトルに対して人間の音声スペク
トルに合わせた形で重み付けをして誤差信号として誤差
評価部18に加える。誤差評価部18では誤差信号の自
乗和を取って後述するサブフレーム内での誤差電力を評
価する。
これを白色雑音コードブック中の全てのコード番号につ
いて同様な処理を行って評価し、最少の誤差電力を与え
るコード番号を選択しく公知のAbS法による最適化)
、対応するコード番号を相手側に伝送する(第6図−■
参照)。
いて同様な処理を行って評価し、最少の誤差電力を与え
るコード番号を選択しく公知のAbS法による最適化)
、対応するコード番号を相手側に伝送する(第6図−■
参照)。
ここで、前記の線形予測係数aiの値は1つの処理フレ
ーム(例えば、 20m5)の間は変化しないがコード
はこの処理フレームを構成するサブフレーム(例えば、
5m5)ごとに変化する。
ーム(例えば、 20m5)の間は変化しないがコード
はこの処理フレームを構成するサブフレーム(例えば、
5m5)ごとに変化する。
ここで、上記の様に最適化を行うにはサブフレーム毎に
全コードに対する再生信号を算出する必要があるが、こ
の為には短期予測器、長期予測器で構成される合成フィ
ルタの伝達函数Hとサブフレーム当たりのコードCとの
たたみ込み演算(ΣH,−C” n−i )を行う必要
がある。
全コードに対する再生信号を算出する必要があるが、こ
の為には短期予測器、長期予測器で構成される合成フィ
ルタの伝達函数Hとサブフレーム当たりのコードCとの
たたみ込み演算(ΣH,−C” n−i )を行う必要
がある。
ここで、伝達関数Hの次数をNとすると一回のたたみ込
み演算にはN回の累積演算を行わなければならず、白色
雑音コードブックの大きさをKとすると、全演算量とし
てほぼに−N回の乗算が必要となる。
み演算にはN回の累積演算を行わなければならず、白色
雑音コードブックの大きさをKとすると、全演算量とし
てほぼに−N回の乗算が必要となる。
そこで、所要演算量が膨大となり、リアルタイムで小型
の音声符号器を実現することが困難であると云う問題が
ある。
の音声符号器を実現することが困難であると云う問題が
ある。
第1図は本発明の原理ブロック図を示す。
図中、2は入力信号の線形予測を行って第1の線形予測
パラメータを抽出する第1の線形予測分析処理部で、4
は(1/M)に間引きされた白色雑音系列がコードとし
て蓄えられ、入力するコード番号に対応した白色雑音が
取り出されるコードブックである。
パラメータを抽出する第1の線形予測分析処理部で、4
は(1/M)に間引きされた白色雑音系列がコードとし
て蓄えられ、入力するコード番号に対応した白色雑音が
取り出されるコードブックである。
また、3は入力した該第1の線形予測パラメータと該コ
ードブックから取り出された白色雑音とから第1の再生
信号を生成する予測部で、6は該第1の再生信号と該入
力信号とを比較して誤差を求める比較部であり、5は第
2の線形予測分析部である。そして、該予測部と比較部
とで全てのコード番号について第1の再生信号を生成し
て入力信号との誤差を求め、誤差が最少となる最適コー
ド番号を選択した後、FX第2の線形予測分析処理部で
該最適コード番号を用いて合成した第2の再生信号と入
力信号との残差成分の自乗和を最少とする第2の線形予
測パラメータを再計算し、該第2の線形予測パラメータ
と最適コード番号とを音声符号化情報とする。
ードブックから取り出された白色雑音とから第1の再生
信号を生成する予測部で、6は該第1の再生信号と該入
力信号とを比較して誤差を求める比較部であり、5は第
2の線形予測分析部である。そして、該予測部と比較部
とで全てのコード番号について第1の再生信号を生成し
て入力信号との誤差を求め、誤差が最少となる最適コー
ド番号を選択した後、FX第2の線形予測分析処理部で
該最適コード番号を用いて合成した第2の再生信号と入
力信号との残差成分の自乗和を最少とする第2の線形予
測パラメータを再計算し、該第2の線形予測パラメータ
と最適コード番号とを音声符号化情報とする。
本発明は白色雑音コードブックとして従来例に示す白色
雑音系列を1/Mに間引きした白色雑音系列をコードと
して蓄える。
雑音系列を1/Mに間引きした白色雑音系列をコードと
して蓄える。
即ち8Mサンプルの中で有意なサンプルは1サンプルの
みであり、残りのサンプルはOである。
みであり、残りのサンプルはOである。
従って1回のたたみこみ演算に必要な累積演算はN7M
回でよいことになり、所要演算量をほぼ1/Mにするこ
とができるが、再生信号の品質はMの値が大きい程、劣
化する。
回でよいことになり、所要演算量をほぼ1/Mにするこ
とができるが、再生信号の品質はMの値が大きい程、劣
化する。
・そこで、入力信号と再往信号との誤差が最少となるコ
ードを選択した後、線形予測係数aiの再計夏を行って
、再生信号の品質を改善する。
ードを選択した後、線形予測係数aiの再計夏を行って
、再生信号の品質を改善する。
即ち、第2図−■に示す様に入力信号を線形予測係数a
ムを有する予測逆フィルタを通すと残差信号(a)が得
られ、この残差信号を用いて図中の太い左矢印の樺に逆
向きに予測逆フィルタを駆動すると再生信号が生成され
る。
ムを有する予測逆フィルタを通すと残差信号(a)が得
られ、この残差信号を用いて図中の太い左矢印の樺に逆
向きに予測逆フィルタを駆動すると再生信号が生成され
る。
しかし、本発明では前述の様に残差信号の代わりに白色
雑音コードブックから選択した最適コードに対応する雑
音波形(b)で上記の逆向きの予測逆フィルタを駆動す
るので第2図−■に示す様に(a)−(b)で駆動され
た分が再生信号の誤差となる。
雑音コードブックから選択した最適コードに対応する雑
音波形(b)で上記の逆向きの予測逆フィルタを駆動す
るので第2図−■に示す様に(a)−(b)で駆動され
た分が再生信号の誤差となる。
ここで、第2図−〇に示す様に[有])で駆動された再
生信号と誤差(a) −(b)で駆動された再生信号と
の和を取れば厳密な再生信号が得られる。尚、線形予測
係数a、は(a) −(b)で駆動された再生信号が最
少になる様に設定されているのでなく、残差信号(a)
の電力が最少になる様になっている。
生信号と誤差(a) −(b)で駆動された再生信号と
の和を取れば厳密な再生信号が得られる。尚、線形予測
係数a、は(a) −(b)で駆動された再生信号が最
少になる様に設定されているのでなく、残差信号(a)
の電力が最少になる様になっている。
そこで、再生信号の誤差を小さ(する為、褐鼓への影響
を削減した残差信号の電力が最少になる様に、再度、線
形予測分析を行って第2図−■に示す様に第2の線形予
測係数a直°を求めると。
を削減した残差信号の電力が最少になる様に、再度、線
形予測分析を行って第2図−■に示す様に第2の線形予
測係数a直°を求めると。
これは■の誤差(a) ’ −(b)が最少になる様に
求めたat +であるから(a) −(b)よりも誤
差が小となり。
求めたat +であるから(a) −(b)よりも誤
差が小となり。
再生信号の品質が改善される。
ここで、(a)“は入力信号を予測逆フィルタalに通
した時の残差信号であり、第2の線形予測パラメータa
、 lと最適コード番号を音声符号化情報として送
出する。
した時の残差信号であり、第2の線形予測パラメータa
、 lと最適コード番号を音声符号化情報として送
出する。
第3図は実施例のブロック図、第4図は第3図の処理フ
ロー図を示す。
ロー図を示す。
ここで、線形予測分析処理部21.聴覚重み付は処理部
22は第1の線形予測分析処理部2の構成部分、聴覚重
み付は処理部31.31°、短期予測器32゜32°、
長期予測器33.33°、増幅器34は予測部3の構成
部分、線形予測分析処理部51は第2の線形予測分析処
理部5の構成部分、比較器61.61’誤差評価部分6
2は比較部分6の構成部分を示す。
22は第1の線形予測分析処理部2の構成部分、聴覚重
み付は処理部31.31°、短期予測器32゜32°、
長期予測器33.33°、増幅器34は予測部3の構成
部分、線形予測分析処理部51は第2の線形予測分析処
理部5の構成部分、比較器61.61’誤差評価部分6
2は比較部分6の構成部分を示す。
以下、第4図を参照して第3図の動作を説明する。尚、
白色雑音コードブック4は従来例のコードブックに比較
してM−3,即ち1/3に間引きしている。
白色雑音コードブック4は従来例のコードブックに比較
してM−3,即ち1/3に間引きしている。
先ず、入力信号は線形予測分析処理部21に加えられて
予測分析、ピッチ予測分析が行われて、線形予測係数a
iとピッチ周期、ピッチ予測係数が抽出され、線形予測
係数は短期予測器32.32’に。
予測分析、ピッチ予測分析が行われて、線形予測係数a
iとピッチ周期、ピッチ予測係数が抽出され、線形予測
係数は短期予測器32.32’に。
ピッチ周期、ピッチ予測係数は長期予測器33.33°
に加えられる(第4図−■参照)。
に加えられる(第4図−■参照)。
また、短期予測器32°、長期予測器33°は加えられ
た抽出パラメータをもとに“′0”入力による駆動が行
われ、入力信号から差し引かれて前の処理フレームの影
響が除去される。第3図中の°の付いた符号の部分はこ
の様な処理があると云うことを示す為にブロック図に書
いである(第4図−■参照)。
た抽出パラメータをもとに“′0”入力による駆動が行
われ、入力信号から差し引かれて前の処理フレームの影
響が除去される。第3図中の°の付いた符号の部分はこ
の様な処理があると云うことを示す為にブロック図に書
いである(第4図−■参照)。
さて、1/3に間引きされた白色雑音コードブック4か
ら出力された雑音波形は増幅器34を通った後、長期予
測器33でピッチ周期性の予測を行い。
ら出力された雑音波形は増幅器34を通った後、長期予
測器33でピッチ周期性の予測を行い。
更に短期予測器32で近接サンプル間の予測をして再生
信号を生成し、聴覚重み付は処理部31で人間の音声ス
ペクトルに合わせた形で重み付けをして比較器61に加
える。
信号を生成し、聴覚重み付は処理部31で人間の音声ス
ペクトルに合わせた形で重み付けをして比較器61に加
える。
この比較器には聴覚重み付は処理部22を通った入力信
号が加えられているので、誤差信号が取り出されて誤差
評価部分62に加えられる。ここでは。
号が加えられているので、誤差信号が取り出されて誤差
評価部分62に加えられる。ここでは。
誤差信号の自乗和を取って前記のサブフレーム内での誤
差電力を評価する。これを白色雑音コードブック中の全
てのコードについて同様な処理をし。
差電力を評価する。これを白色雑音コードブック中の全
てのコードについて同様な処理をし。
評価をして最少の誤差電力を与える最適コードを選択す
る(第4図−■参照)。
る(第4図−■参照)。
次に、第4図−■の部分に付いて説明する。
最初に聴覚補正を行い、前の処理フレームの影響も除去
して処理上の初期化をした後の時刻nにおける入力信号
をS1%I残差信号をe11+ コードのサンプル値を
v7とする。また、聴覚重み付は処理部31内の聴覚補
正フィルタ及び利得を含めた線形予測バラメーをatと
する。但しIVllは3サンプリングに1回しか有意な
値を持たない。そして、残差モデルとして次の式を考え
る。
して処理上の初期化をした後の時刻nにおける入力信号
をS1%I残差信号をe11+ コードのサンプル値を
v7とする。また、聴覚重み付は処理部31内の聴覚補
正フィルタ及び利得を含めた線形予測バラメーをatと
する。但しIVllは3サンプリングに1回しか有意な
値を持たない。そして、残差モデルとして次の式を考え
る。
この時、評価関数を
但し+S’ n ・S n +v n n ・3 t
aS’s = S n n :3 m+1.3
m+2とおくと。
aS’s = S n n :3 m+1.3
m+2とおくと。
誤差を最少とするat(ここで、i・1〜p)はdB。
dam =0より
これより
/
尚、第4図−■の線形予測分析では(3)式の左辺のQ
(K)の代わりにR(k)を用い、 Le Ioux
法などの公知のアルゴリズムでa!を算出するが、(3
)式でも全く同様な考え方でalを算出できる。
(K)の代わりにR(k)を用い、 Le Ioux
法などの公知のアルゴリズムでa!を算出するが、(3
)式でも全く同様な考え方でalを算出できる。
(3)式では第4図−■、■の過程で求まったVfiの
影響を除いて再評価するので再生音声の品質は改善され
ることになる。
影響を除いて再評価するので再生音声の品質は改善され
ることになる。
以上はM−3の場合について説明したが、他の値を取る
場合にも同様の議論が成立することは明らかである。
場合にも同様の議論が成立することは明らかである。
そこで、所要演算量をコードブックの中身の間引き率に
ほぼ比例した割合で低減でき、実時間処理で比較的小型
のハードウェアを実現できる。
ほぼ比例した割合で低減でき、実時間処理で比較的小型
のハードウェアを実現できる。
N+P−1
但し、 Q (K)・ Σ(S’
・s n−k )
n・0
〔発明の効果〕
以上詳細に説明した様に本発明によればリアルタイムで
小型の音声符号器を提供できると云う効果がある。
小型の音声符号器を提供できると云う効果がある。
なる連立方程式を解いて求めることができる。
第1図は本発明の原理ブロック図、
第2図は第1図の動作説明図、
第3図は本発明の実施例のブロック図、第4図は第3図
の処理フロー図、 第5図は従来例のブロック図、 第6図は第5図の処理フロー図を示す。 図において、 2は第1の線形予測予測分析処理部、 3は予測部、 4はコードブック、 5は第2の線形予測分析処理部、 6は比較部を示す。 木谷■耳/)#B!プロ・ツク閉 第 1[ 第1 匹イρ動イFみ地せ丹 し] 第 ! 第3 固q怠理7IT−図 第 不〔泉イダIの70ツク図 第57 第5図のX賜理フロー図 ≠6 z
の処理フロー図、 第5図は従来例のブロック図、 第6図は第5図の処理フロー図を示す。 図において、 2は第1の線形予測予測分析処理部、 3は予測部、 4はコードブック、 5は第2の線形予測分析処理部、 6は比較部を示す。 木谷■耳/)#B!プロ・ツク閉 第 1[ 第1 匹イρ動イFみ地せ丹 し] 第 ! 第3 固q怠理7IT−図 第 不〔泉イダIの70ツク図 第57 第5図のX賜理フロー図 ≠6 z
Claims (1)
- 【特許請求の範囲】 入力信号の線形予測を行って第1の線形予測パラメータ
を抽出する第1の線形予測分析処理部(2)と、(1/
M)(Mは正の整数)に間引きされた白色雑音系列がコ
ードとして蓄えられ、入力するコード番号に対応した白
色雑音が取り出されるコードブック(4)と、 入力した該第1の線形予測パラメータと該コードブック
から取り出された白色雑音とから第1の再生信号を生成
する予測部(3)と、該第1の再生信号と該入力信号と
を比較して誤差を求める比較部(6)と、第2の線形予
測分析部(5)とを設け、該予測部と比較部とで全ての
コード番号について第1の再生信号を生成して入力信号
との誤差を求め、誤差が最少となる最適コード番号を選
択した後、 該第2の線形予測分析処理部で該最適コード番号を用い
て合成した第2の再生信号と入力信号との残差成分の自
乗和を最少とする第2の線形予測パラメータを再計算し
、 該第2の線形予測パラメータと最適コード番号とを音声
符号化情報とすることを特徴としたコード駆動音声符号
化方式。
Priority Applications (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1093568A JPH02272500A (ja) | 1989-04-13 | 1989-04-13 | コード駆動音声符号化方式 |
| CA002014279A CA2014279C (en) | 1989-04-13 | 1990-04-10 | Speech coding apparatus |
| EP90106960A EP0392517B1 (en) | 1989-04-13 | 1990-04-11 | Speech coding apparatus |
| DE69013738T DE69013738T2 (de) | 1989-04-13 | 1990-04-11 | Einrichtung zur Sprachcodierung. |
| US07/508,553 US5138662A (en) | 1989-04-13 | 1990-04-13 | Speech coding apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1093568A JPH02272500A (ja) | 1989-04-13 | 1989-04-13 | コード駆動音声符号化方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02272500A true JPH02272500A (ja) | 1990-11-07 |
Family
ID=14085859
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1093568A Pending JPH02272500A (ja) | 1989-04-13 | 1989-04-13 | コード駆動音声符号化方式 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US5138662A (ja) |
| EP (1) | EP0392517B1 (ja) |
| JP (1) | JPH02272500A (ja) |
| CA (1) | CA2014279C (ja) |
| DE (1) | DE69013738T2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003514266A (ja) * | 1999-11-16 | 2003-04-15 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 広帯域オーディオ伝送システム |
| JP2003323200A (ja) * | 2002-04-29 | 2003-11-14 | Docomo Communications Laboratories Usa Inc | 音声符号化のための線形予測係数の勾配降下最適化 |
Families Citing this family (27)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5230038A (en) * | 1989-01-27 | 1993-07-20 | Fielder Louis D | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
| US5265190A (en) * | 1991-05-31 | 1993-11-23 | Motorola, Inc. | CELP vocoder with efficient adaptive codebook search |
| CA2078927C (en) * | 1991-09-25 | 1997-01-28 | Katsushi Seza | Code-book driven vocoder device with voice source generator |
| US5457783A (en) * | 1992-08-07 | 1995-10-10 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear prediction |
| FI95086C (fi) * | 1992-11-26 | 1995-12-11 | Nokia Mobile Phones Ltd | Menetelmä puhesignaalin tehokkaaksi koodaamiseksi |
| US5812534A (en) | 1993-01-08 | 1998-09-22 | Multi-Tech Systems, Inc. | Voice over data conferencing for a computer-based personal communications system |
| US5453986A (en) * | 1993-01-08 | 1995-09-26 | Multi-Tech Systems, Inc. | Dual port interface for a computer-based multifunction personal communication system |
| US5864560A (en) | 1993-01-08 | 1999-01-26 | Multi-Tech Systems, Inc. | Method and apparatus for mode switching in a voice over data computer-based personal communications system |
| US7082106B2 (en) | 1993-01-08 | 2006-07-25 | Multi-Tech Systems, Inc. | Computer-based multi-media communications system and method |
| US5754589A (en) | 1993-01-08 | 1998-05-19 | Multi-Tech Systems, Inc. | Noncompressed voice and data communication over modem for a computer-based multifunction personal communications system |
| US5535204A (en) * | 1993-01-08 | 1996-07-09 | Multi-Tech Systems, Inc. | Ringdown and ringback signalling for a computer-based multifunction personal communications system |
| US6009082A (en) | 1993-01-08 | 1999-12-28 | Multi-Tech Systems, Inc. | Computer-based multifunction personal communication system with caller ID |
| US5452289A (en) * | 1993-01-08 | 1995-09-19 | Multi-Tech Systems, Inc. | Computer-based multifunction personal communications system |
| US5546395A (en) * | 1993-01-08 | 1996-08-13 | Multi-Tech Systems, Inc. | Dynamic selection of compression rate for a voice compression algorithm in a voice over data modem |
| US5617423A (en) | 1993-01-08 | 1997-04-01 | Multi-Tech Systems, Inc. | Voice over data modem with selectable voice compression |
| FI96248C (fi) * | 1993-05-06 | 1996-05-27 | Nokia Mobile Phones Ltd | Menetelmä pitkän aikavälin synteesisuodattimen toteuttamiseksi sekä synteesisuodatin puhekoodereihin |
| DE4315319C2 (de) * | 1993-05-07 | 2002-11-14 | Bosch Gmbh Robert | Verfahren zur Aufbereitung von Daten, insbesondere von codierten Sprachsignalparametern |
| AU5095193A (en) * | 1993-08-27 | 1995-03-21 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear prediction |
| US5682386A (en) | 1994-04-19 | 1997-10-28 | Multi-Tech Systems, Inc. | Data/voice/fax compression multiplexer |
| US5757801A (en) | 1994-04-19 | 1998-05-26 | Multi-Tech Systems, Inc. | Advanced priority statistical multiplexer |
| US5890110A (en) * | 1995-03-27 | 1999-03-30 | The Regents Of The University Of California | Variable dimension vector quantization |
| TW321810B (ja) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
| JPH10247098A (ja) * | 1997-03-04 | 1998-09-14 | Mitsubishi Electric Corp | 可変レート音声符号化方法、可変レート音声復号化方法 |
| US5987405A (en) * | 1997-06-24 | 1999-11-16 | International Business Machines Corporation | Speech compression by speech recognition |
| US6760674B2 (en) * | 2001-10-08 | 2004-07-06 | Microchip Technology Incorporated | Audio spectrum analyzer implemented with a minimum number of multiply operations |
| DE102006022346B4 (de) * | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
| US8077821B2 (en) * | 2006-09-25 | 2011-12-13 | Zoran Corporation | Optimized timing recovery device and method using linear predictor |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
-
1989
- 1989-04-13 JP JP1093568A patent/JPH02272500A/ja active Pending
-
1990
- 1990-04-10 CA CA002014279A patent/CA2014279C/en not_active Expired - Fee Related
- 1990-04-11 DE DE69013738T patent/DE69013738T2/de not_active Expired - Fee Related
- 1990-04-11 EP EP90106960A patent/EP0392517B1/en not_active Expired - Lifetime
- 1990-04-13 US US07/508,553 patent/US5138662A/en not_active Expired - Fee Related
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003514266A (ja) * | 1999-11-16 | 2003-04-15 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 広帯域オーディオ伝送システム |
| JP2003323200A (ja) * | 2002-04-29 | 2003-11-14 | Docomo Communications Laboratories Usa Inc | 音声符号化のための線形予測係数の勾配降下最適化 |
Also Published As
| Publication number | Publication date |
|---|---|
| CA2014279C (en) | 1994-03-29 |
| DE69013738D1 (de) | 1994-12-08 |
| US5138662A (en) | 1992-08-11 |
| EP0392517A2 (en) | 1990-10-17 |
| EP0392517A3 (en) | 1991-05-15 |
| CA2014279A1 (en) | 1990-10-13 |
| EP0392517B1 (en) | 1994-11-02 |
| DE69013738T2 (de) | 1995-04-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH02272500A (ja) | コード駆動音声符号化方式 | |
| JP4005359B2 (ja) | 音声符号化及び音声復号化装置 | |
| JPH0395600A (ja) | 音声コーディング装置及び音声エンコーディング方法 | |
| JPWO2001020595A1 (ja) | 音声符号化及び音声復号化装置 | |
| JPH09152896A (ja) | 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置 | |
| EP1619666B1 (en) | Speech decoder, speech decoding method, program, recording medium | |
| JPH07199997A (ja) | 音声信号の処理システムにおける音声信号の処理方法およびその処理における処理時間の短縮方法 | |
| WO2006070760A1 (ja) | スケーラブル符号化装置およびスケーラブル符号化方法 | |
| JPS5917839B2 (ja) | 適応形線形予測装置 | |
| JP3583945B2 (ja) | 音声符号化方法 | |
| JP3163206B2 (ja) | 音響信号符号化装置 | |
| JPS6238500A (ja) | 高能率音声符号化方式とその装置 | |
| JP3138574B2 (ja) | 線形予測係数補間装置 | |
| JP2900431B2 (ja) | 音声信号符号化装置 | |
| JPH028900A (ja) | 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置 | |
| Nagarajan et al. | Efficient implementation of linear predictive coding algorithms | |
| JP2003323200A (ja) | 音声符号化のための線形予測係数の勾配降下最適化 | |
| JPH0573098A (ja) | 音声処理装置 | |
| JP2615862B2 (ja) | 音声符号化復号化方法とその装置 | |
| KR100205060B1 (ko) | 정규 펄스 여기 방식을 이용한 celp 보코더의 피치검색 방법 | |
| JPH0468400A (ja) | 音声符号化方式 | |
| JPH0378637B2 (ja) | ||
| JP3144244B2 (ja) | 音声符号化装置 | |
| JPH03243999A (ja) | 音声符号化装置 | |
| JPH041800A (ja) | 音声帯域信号符号化方法 |