JP2000330594A - 音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体 - Google Patents
音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体Info
- Publication number
- JP2000330594A JP2000330594A JP11137893A JP13789399A JP2000330594A JP 2000330594 A JP2000330594 A JP 2000330594A JP 11137893 A JP11137893 A JP 11137893A JP 13789399 A JP13789399 A JP 13789399A JP 2000330594 A JP2000330594 A JP 2000330594A
- Authority
- JP
- Japan
- Prior art keywords
- bits
- signal
- audio signal
- speech
- calculating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【課題】 固定小数点演算を用いる音声符号化装置にお
いて、相関値の計算を正規化して行うことによって、演
算精度の低下に基づく音質の劣化を防止する。 【解決手段】 開示される音声符号化装置は、LPC分
析部2と、ピッチ分析部4と、適応コードブック計算部
6と、利得計算部8とを備え、入力音声信号と再生音声
信号との誤差が最小になるように各部において制御を行
ったときの各部のパラメータを多重して音声符号化信号
を生成する音声符号化装置において、LPC分析部2に
おいて正規化制御量を求めるとともに、他の各部で相関
値を求めて所定の演算を行う際に、相関値に対して、L
PC分析部2において求められた正規化制御量によって
正規化処理を行ったのち所定の演算を行うように構成さ
れている。
いて、相関値の計算を正規化して行うことによって、演
算精度の低下に基づく音質の劣化を防止する。 【解決手段】 開示される音声符号化装置は、LPC分
析部2と、ピッチ分析部4と、適応コードブック計算部
6と、利得計算部8とを備え、入力音声信号と再生音声
信号との誤差が最小になるように各部において制御を行
ったときの各部のパラメータを多重して音声符号化信号
を生成する音声符号化装置において、LPC分析部2に
おいて正規化制御量を求めるとともに、他の各部で相関
値を求めて所定の演算を行う際に、相関値に対して、L
PC分析部2において求められた正規化制御量によって
正規化処理を行ったのち所定の演算を行うように構成さ
れている。
Description
【0001】
【発明の属する技術分野】この発明は、固定小数点演算
を用いたことに基づく、演算精度不足による音質劣化
と、入力音声のレベル変動による符号化品質の劣化とを
低減した音声符号化装置及び方法並びに音声符号化プロ
グラムを記録した記憶媒体に関する。
を用いたことに基づく、演算精度不足による音質劣化
と、入力音声のレベル変動による符号化品質の劣化とを
低減した音声符号化装置及び方法並びに音声符号化プロ
グラムを記録した記憶媒体に関する。
【0002】
【従来の技術】音声符号化の次世代国際標準として、M
PEG(Motion Picture Image Coding Experts Grou
p)−4音声符号化方式の実用化が進められている。M
PEG−4音声符号化方式においては、放送,インター
ネット,電話等のアプリケーションの融合と、スケーラ
ブル性の向上を図るために、それぞれの音声圧縮符号化
方式を統合した、複数の品質の音声の符号化と復号化が
可能な、階層符号化された、高品質,高機能,低演算量
の音声コーディックを実現することが求められている。
PEG(Motion Picture Image Coding Experts Grou
p)−4音声符号化方式の実用化が進められている。M
PEG−4音声符号化方式においては、放送,インター
ネット,電話等のアプリケーションの融合と、スケーラ
ブル性の向上を図るために、それぞれの音声圧縮符号化
方式を統合した、複数の品質の音声の符号化と復号化が
可能な、階層符号化された、高品質,高機能,低演算量
の音声コーディックを実現することが求められている。
【0003】MPEG−4音声符号化方式においては、
音声符号化の方法として、CELP(Code Exited Line
ar Prediction)方式を用いる。CELP方式において
は、人体の発声器官をモデル化することによって音声を
符号化する。すなわち、CELP方式においては、人間
の声帯をモデル化した音源と、声道をモデル化したLP
(Linear Prediction)合成フィルタとを用いて音声を
合成する際の、それぞれのパラメータを符号化して伝送
する。そして復号側では、これらのパラメータに基づい
て生成した音源と、LP合成フィルタとを用いて音声を
再生する。
音声符号化の方法として、CELP(Code Exited Line
ar Prediction)方式を用いる。CELP方式において
は、人体の発声器官をモデル化することによって音声を
符号化する。すなわち、CELP方式においては、人間
の声帯をモデル化した音源と、声道をモデル化したLP
(Linear Prediction)合成フィルタとを用いて音声を
合成する際の、それぞれのパラメータを符号化して伝送
する。そして復号側では、これらのパラメータに基づい
て生成した音源と、LP合成フィルタとを用いて音声を
再生する。
【0004】図7は、CELP方式の音声符号化装置の
基本的な構成を示したものである。この従来例の音声符
号化装置は、図7に示すように、スケーリング/高域通
過フィルタ101と、LPC(Linear Prediction Coef
ficients)分析部102と、音源計算部103と、利得
計算部104と、合成フィルタ105と、聴感重み付け
誤差最小化部106とから概略構成されている。図7に
示された音声符号化装置では、入力音声信号に対して、
スケーリング/高域通過フィルタ101を適用すること
によって、低域成分を遮断するための処理と、固定少数
点演算におけるオーバーフローを回避するためのスケー
リング(信号振幅縮小)の処理とを行ったのち、LPC
分析部102において、音声信号のスペクトル包絡を表
すスペクトルパラメータを線形予測(LP)分析によっ
て求める。また、音源計算部103では、音源パルスの
位置と振幅とを計算し、利得計算部104では、音源パ
ルスに対する利得を計算することによって、生成された
音源パルスを所要の大きさで合成フィルタ105に供給
する。合成フィルタ105では、入力された音源パルス
に対して、LPC分析部102で求められた音声信号の
スペクトル成分のパラメータによって指定されるフィル
タ特性を適用することによって、再生音声信号を生成す
る。聴感重み付け誤差最小部106では、再生音声信号
に対して、人間の聴感特性に基づく重み付けを行うとと
もに、入力音声信号と再生音声信号との誤差(残差信
号)を求める。そして、この残差信号に基づいて、音源
計算部103における音源パルスの振幅等を制御し、利
得計算部104における音源パルスに対する利得を制御
することによって、入力音声信号と再生音声信号との誤
差が最小になるように制御を行う。このような制御が収
束したときの、LPC分析部102,音源計算部10
3,利得計算部104等のパラメータを、図示されない
マルチプレクサを介して多重し符号化することによっ
て、入力音声信号に対応する音声符号化信号を生成して
出力する。
基本的な構成を示したものである。この従来例の音声符
号化装置は、図7に示すように、スケーリング/高域通
過フィルタ101と、LPC(Linear Prediction Coef
ficients)分析部102と、音源計算部103と、利得
計算部104と、合成フィルタ105と、聴感重み付け
誤差最小化部106とから概略構成されている。図7に
示された音声符号化装置では、入力音声信号に対して、
スケーリング/高域通過フィルタ101を適用すること
によって、低域成分を遮断するための処理と、固定少数
点演算におけるオーバーフローを回避するためのスケー
リング(信号振幅縮小)の処理とを行ったのち、LPC
分析部102において、音声信号のスペクトル包絡を表
すスペクトルパラメータを線形予測(LP)分析によっ
て求める。また、音源計算部103では、音源パルスの
位置と振幅とを計算し、利得計算部104では、音源パ
ルスに対する利得を計算することによって、生成された
音源パルスを所要の大きさで合成フィルタ105に供給
する。合成フィルタ105では、入力された音源パルス
に対して、LPC分析部102で求められた音声信号の
スペクトル成分のパラメータによって指定されるフィル
タ特性を適用することによって、再生音声信号を生成す
る。聴感重み付け誤差最小部106では、再生音声信号
に対して、人間の聴感特性に基づく重み付けを行うとと
もに、入力音声信号と再生音声信号との誤差(残差信
号)を求める。そして、この残差信号に基づいて、音源
計算部103における音源パルスの振幅等を制御し、利
得計算部104における音源パルスに対する利得を制御
することによって、入力音声信号と再生音声信号との誤
差が最小になるように制御を行う。このような制御が収
束したときの、LPC分析部102,音源計算部10
3,利得計算部104等のパラメータを、図示されない
マルチプレクサを介して多重し符号化することによっ
て、入力音声信号に対応する音声符号化信号を生成して
出力する。
【0005】図7に示された音声符号化装置における、
各部の演算処理は、通常、固定小数点演算によって行わ
れる。これは、演算量を低減して演算処理を簡潔にする
とともに、装置構成を簡単化するためである。しかしな
がら、音声符号化装置において、各部における演算を固
定小数点方式によって行うことによって、入力音声信号
の振幅過大の場合には、各部のオーバーフローに基づく
歪み等が発生するとともに、入力音声信号の振幅が小さ
い場合には、演算精度が低下するために、符号化された
音声信号の品質が劣化するという問題が発生する。
各部の演算処理は、通常、固定小数点演算によって行わ
れる。これは、演算量を低減して演算処理を簡潔にする
とともに、装置構成を簡単化するためである。しかしな
がら、音声符号化装置において、各部における演算を固
定小数点方式によって行うことによって、入力音声信号
の振幅過大の場合には、各部のオーバーフローに基づく
歪み等が発生するとともに、入力音声信号の振幅が小さ
い場合には、演算精度が低下するために、符号化された
音声信号の品質が劣化するという問題が発生する。
【0006】図8は、固定小数点演算の特性を説明する
ものである。例えば、nビットの演算装置を用いて、n
ビット精度の数どうしの乗算を行った場合は、図8
(a)に示すように、演算結果は2nビットとなる可能
性があり、また、nビット精度の数どうしの加算を行っ
た場合は、図8(b)に示すように、演算結果はn+1
ビットとなる可能性があるため、いずれの場合も、演算
装置においてオーバーフローが発生する。CELP方式
の符号化装置では、相関値演算のために畳み込み演算を
用いることが多いが、この際2乗の次元をもつ演算が行
われるため、固定小数点演算を行う演算装置では、オー
バーフローが発生する可能性が高い。
ものである。例えば、nビットの演算装置を用いて、n
ビット精度の数どうしの乗算を行った場合は、図8
(a)に示すように、演算結果は2nビットとなる可能
性があり、また、nビット精度の数どうしの加算を行っ
た場合は、図8(b)に示すように、演算結果はn+1
ビットとなる可能性があるため、いずれの場合も、演算
装置においてオーバーフローが発生する。CELP方式
の符号化装置では、相関値演算のために畳み込み演算を
用いることが多いが、この際2乗の次元をもつ演算が行
われるため、固定小数点演算を行う演算装置では、オー
バーフローが発生する可能性が高い。
【0007】そこで、図7に示された音声符号化装置で
は、スケーリング/高域通過フィルタ101において、
入力音声信号のレベルを一定の割合で低下させるスケー
リングを施すとともに、LPC分析部102,利得計算
部104等では、所要の制御を行うために、相関値,歪
み値等の演算を行う際に飽和演算を行って、一定レベル
以上又は以下の演算結果に対しては、演算結果を最大値
又は最小値でクリップして出力するようにしている。こ
の際、スケーリングと飽和演算とを併用せずに、いずれ
か一方のみを用いる場合もある。なお、このような音声
符号化装置については、例えば、ITU(Internationa
l Telecommunication Union)のITU−T勧告G.7
29に準拠する、TTC(Telecommunication Technolo
gy Committee)のJT−G729標準に記載されてい
る。
は、スケーリング/高域通過フィルタ101において、
入力音声信号のレベルを一定の割合で低下させるスケー
リングを施すとともに、LPC分析部102,利得計算
部104等では、所要の制御を行うために、相関値,歪
み値等の演算を行う際に飽和演算を行って、一定レベル
以上又は以下の演算結果に対しては、演算結果を最大値
又は最小値でクリップして出力するようにしている。こ
の際、スケーリングと飽和演算とを併用せずに、いずれ
か一方のみを用いる場合もある。なお、このような音声
符号化装置については、例えば、ITU(Internationa
l Telecommunication Union)のITU−T勧告G.7
29に準拠する、TTC(Telecommunication Technolo
gy Committee)のJT−G729標準に記載されてい
る。
【0008】
【発明が解決しようとする課題】しかしながら、従来の
音声符号化装置では、固定小数点演算を採用した場合
に、入力音声信号の振幅過大による、各部のオーバーフ
ローに基づく歪み等が発生するのを防止するため、入力
音声信号に対してスケーリングを行うとともに、相関
値,歪み値等の演算時に飽和演算を行っているが、これ
によって、入力音声信号のレベル変動が大きい場合に、
演算精度が低下し、符号品質が劣化する、という問題が
あった。
音声符号化装置では、固定小数点演算を採用した場合
に、入力音声信号の振幅過大による、各部のオーバーフ
ローに基づく歪み等が発生するのを防止するため、入力
音声信号に対してスケーリングを行うとともに、相関
値,歪み値等の演算時に飽和演算を行っているが、これ
によって、入力音声信号のレベル変動が大きい場合に、
演算精度が低下し、符号品質が劣化する、という問題が
あった。
【0009】これは、符号化装置において、入力音声信
号をスケーリングしてから、符号化処理を行うため、小
さい音声レベルの場合の符号化品質が低下するととも
に、演算部において飽和演算を使用しているため、大き
い音声レベルの場合に、符号化品質が低下するためであ
る。
号をスケーリングしてから、符号化処理を行うため、小
さい音声レベルの場合の符号化品質が低下するととも
に、演算部において飽和演算を使用しているため、大き
い音声レベルの場合に、符号化品質が低下するためであ
る。
【0010】この発明は、上述の事情に鑑みてなされた
もので、固定小数点演算を用いた音声符号化装置におい
て、演算精度不足に基づく音質劣化と、入力音声のレベ
ル変動による符号化品質の劣化とを低減できるようにす
ることを目的としている。
もので、固定小数点演算を用いた音声符号化装置におい
て、演算精度不足に基づく音質劣化と、入力音声のレベ
ル変動による符号化品質の劣化とを低減できるようにす
ることを目的としている。
【0011】
【課題を解決するための手段】上記課題を解決するた
め、請求項1記載の発明は、音声符号化装置に係り、入
力音声信号のスペクトル包絡を示すパラメータを線型予
測によって求める第1の手段と、音声信号の概略ピッチ
周期を計算する第2の手段と、ターゲット信号(重み付
け合成フィルタの零入力応答を重み付け音声信号から減
じた信号)によって上記概略ピッチ周期の前後で微小部
分を計算する第3の手段と、マルチパルス音源とピッチ
周期から前記再生音声信号を生成するための利得を計算
する第4の手段とを少なくとも備え、入力音声信号と再
生音声信号との誤差が最小になるように上記各手段にお
いて制御を行ったときの各部のパラメータを多重して音
声符号化信号を生成する音声符号化装置において、上記
各手段のうち少なくとも1の手段において、相関値を求
めて所定の演算を行う際に、該相関値に対して正規化処
理を行ったのち所定の演算を行うように構成されている
ことを特徴としている。
め、請求項1記載の発明は、音声符号化装置に係り、入
力音声信号のスペクトル包絡を示すパラメータを線型予
測によって求める第1の手段と、音声信号の概略ピッチ
周期を計算する第2の手段と、ターゲット信号(重み付
け合成フィルタの零入力応答を重み付け音声信号から減
じた信号)によって上記概略ピッチ周期の前後で微小部
分を計算する第3の手段と、マルチパルス音源とピッチ
周期から前記再生音声信号を生成するための利得を計算
する第4の手段とを少なくとも備え、入力音声信号と再
生音声信号との誤差が最小になるように上記各手段にお
いて制御を行ったときの各部のパラメータを多重して音
声符号化信号を生成する音声符号化装置において、上記
各手段のうち少なくとも1の手段において、相関値を求
めて所定の演算を行う際に、該相関値に対して正規化処
理を行ったのち所定の演算を行うように構成されている
ことを特徴としている。
【0012】また、請求項2記載の発明は、請求項1記
載の音声符号化装置に係り、上記正規化処理が、上記求
められた相関値を、他のいずれか1の手段において求め
られた正規化制御量だけシフトすることによって行われ
るものであることを特徴としている。
載の音声符号化装置に係り、上記正規化処理が、上記求
められた相関値を、他のいずれか1の手段において求め
られた正規化制御量だけシフトすることによって行われ
るものであることを特徴としている。
【0013】請求項3記載の発明は、請求項2記載の音
声符号化装置に係り、上記正規化制御量が、上記第1の
手段において、入力音声信号の自己相関係数の計算時
に、該自己相関係数を所定ビット数に正規化するための
シフト量として求められるものであることを特徴として
いる。
声符号化装置に係り、上記正規化制御量が、上記第1の
手段において、入力音声信号の自己相関係数の計算時
に、該自己相関係数を所定ビット数に正規化するための
シフト量として求められるものであることを特徴として
いる。
【0014】請求項4記載の発明は、請求項2又は3記
載の音声符号化装置に係り、上記正規化制御量が、入力
音声信号レベルに応じてその値を定められるものである
ことを特徴としている。
載の音声符号化装置に係り、上記正規化制御量が、入力
音声信号レベルに応じてその値を定められるものである
ことを特徴としている。
【0015】請求項5記載の発明は、請求項2乃至4の
いずれか1に記載の音声符号化装置に係り、上記正規化
制御量が、入力音声信号の自己相関係数を第1の所定ビ
ット数精度で計算して得たビット数が第2の所定ビット
数より大きいときは、該計算結果のビット数を第2の所
定ビット数に正規化するための第1のシフト量と、該第
1のシフト量によって入力音声信号をスケーリングして
上記第1の所定ビット数精度で自己相関係数を計算して
得たビット数を上記第2の所定ビット数に正規化するた
めの第2のシフト量との差のシフト量として求められ、
上記計算結果のビット数が上記第2の所定ビット数より
大きくないときは、該計算結果のビット数を上記第2の
所定ビット数に正規化するためのシフト量として求めら
れることを特徴としている。
いずれか1に記載の音声符号化装置に係り、上記正規化
制御量が、入力音声信号の自己相関係数を第1の所定ビ
ット数精度で計算して得たビット数が第2の所定ビット
数より大きいときは、該計算結果のビット数を第2の所
定ビット数に正規化するための第1のシフト量と、該第
1のシフト量によって入力音声信号をスケーリングして
上記第1の所定ビット数精度で自己相関係数を計算して
得たビット数を上記第2の所定ビット数に正規化するた
めの第2のシフト量との差のシフト量として求められ、
上記計算結果のビット数が上記第2の所定ビット数より
大きくないときは、該計算結果のビット数を上記第2の
所定ビット数に正規化するためのシフト量として求めら
れることを特徴としている。
【0016】請求項6記載の発明は、音声符号化装置に
係り、入力音声信号をCELP符号化する音声符号化装
置であって、該音声符号化装置を構成する各手段のうち
いずれか1の手段において、入力音声信号の自己相関係
数を所定ビット数に正規化するための正規化制御量を求
めるとともに、他の少なくともいずれか1の手段におい
て、該正規化制御量を用いて相関値を正規化して、所定
の演算を行うように構成されていることを特徴としてい
る。
係り、入力音声信号をCELP符号化する音声符号化装
置であって、該音声符号化装置を構成する各手段のうち
いずれか1の手段において、入力音声信号の自己相関係
数を所定ビット数に正規化するための正規化制御量を求
めるとともに、他の少なくともいずれか1の手段におい
て、該正規化制御量を用いて相関値を正規化して、所定
の演算を行うように構成されていることを特徴としてい
る。
【0017】また、請求項7記載の発明は、音声符号化
方法に係り、入力音声信号のスペクトル包絡を示すパラ
メータを線型予測によって求める第1のステップと、音
声信号の概略ピッチ周期を計算する第2のステップと、
ターゲット信号(重み付け合成フィルタの零入力応答を
重み付け音声信号から減じた信号)によって上記概略ピ
ッチ周期の前後で微小部分を計算する第3のステップ
と、マルチパルス音源とピッチ周期から上記再生音声信
号を生成するための利得を計算する第4のステップとを
少なくとも備え、入力音声信号と再生音声信号との誤差
が最小になるように上記各ステップにおいて制御を行っ
たときの各ステップのパラメータを多重して音声符号化
信号を生成する音声符号化方法において、上記各ステッ
プのうち少なくともいずれか1のステップにおいて、相
関値を求めて所定の演算を行う際に、該相関値に対して
正規化処理を行ったのち所定の演算を行うことを特徴と
している。
方法に係り、入力音声信号のスペクトル包絡を示すパラ
メータを線型予測によって求める第1のステップと、音
声信号の概略ピッチ周期を計算する第2のステップと、
ターゲット信号(重み付け合成フィルタの零入力応答を
重み付け音声信号から減じた信号)によって上記概略ピ
ッチ周期の前後で微小部分を計算する第3のステップ
と、マルチパルス音源とピッチ周期から上記再生音声信
号を生成するための利得を計算する第4のステップとを
少なくとも備え、入力音声信号と再生音声信号との誤差
が最小になるように上記各ステップにおいて制御を行っ
たときの各ステップのパラメータを多重して音声符号化
信号を生成する音声符号化方法において、上記各ステッ
プのうち少なくともいずれか1のステップにおいて、相
関値を求めて所定の演算を行う際に、該相関値に対して
正規化処理を行ったのち所定の演算を行うことを特徴と
している。
【0018】請求項8記載の発明は、請求項7記載の音
声符号化方法に係り、上記正規化処理を、上記求められ
た相関値を、他のいずれか1の手段において求められた
正規化制御量だけシフトすることによって行うことを特
徴としている。
声符号化方法に係り、上記正規化処理を、上記求められ
た相関値を、他のいずれか1の手段において求められた
正規化制御量だけシフトすることによって行うことを特
徴としている。
【0019】請求項9記載の発明は、請求項8記載の音
声符号化方法に係り、上記正規化制御量を、上記第1の
ステップにおいて、入力音声信号の自己相関係数の計算
時に、該自己相関係数を所定ビット数に正規化するため
のシフト量として求めることを特徴としている。
声符号化方法に係り、上記正規化制御量を、上記第1の
ステップにおいて、入力音声信号の自己相関係数の計算
時に、該自己相関係数を所定ビット数に正規化するため
のシフト量として求めることを特徴としている。
【0020】請求項10記載の発明は、請求項8又は9
記載の音声符号化方法に係り、上記正規化制御量を、入
力音声信号の自己相関係数を第1の所定ビット数精度で
計算して得たビット数が第2の所定ビット数より大きい
ときは、該計算結果のビット数を第2の所定ビット数に
正規化するための第1のシフト量と、該第1のシフト量
によって入力音声信号をスケーリングして上記第1の所
定ビット数精度で自己相関係数を計算して得たビット数
を上記第2の所定ビット数に正規化するための第2のシ
フト量との差のシフト量として求め、上記計算結果のビ
ット数が上記第2の所定ビット数より大きくないとき
は、該計算結果のビット数を上記第2の所定ビット数に
正規化するためのシフト量として求めることを特徴とし
ている。
記載の音声符号化方法に係り、上記正規化制御量を、入
力音声信号の自己相関係数を第1の所定ビット数精度で
計算して得たビット数が第2の所定ビット数より大きい
ときは、該計算結果のビット数を第2の所定ビット数に
正規化するための第1のシフト量と、該第1のシフト量
によって入力音声信号をスケーリングして上記第1の所
定ビット数精度で自己相関係数を計算して得たビット数
を上記第2の所定ビット数に正規化するための第2のシ
フト量との差のシフト量として求め、上記計算結果のビ
ット数が上記第2の所定ビット数より大きくないとき
は、該計算結果のビット数を上記第2の所定ビット数に
正規化するためのシフト量として求めることを特徴とし
ている。
【0021】請求項11記載の発明は、音声符号化プロ
グラムを記録した記憶媒体に係り、請求項9記載の音声
符号化方法を実行するプログラムを記録したコンピュー
タ読み取り可能な記憶媒体であって、入力音声信号のス
ペクトル包絡を示すパラメータを線型予測によって求め
る第1のステップと、音声信号の概略ピッチ周期を計算
する第2のステップと、ターゲット信号(重み付け合成
フィルタの零入力応答を重み付け音声信号から減じた信
号)によって上記概略ピッチ周期の前後で微小部分を計
算する第3のステップと、マルチパルス音源とピッチ周
期から上記再生音声信号を生成するための利得を計算す
る第4のステップとを少なくとも備え、入力音声信号と
再生音声信号との誤差が最小になるように上記各ステッ
プにおいて制御を行ったときの各ステップのパラメータ
を多重して音声符号化信号を生成する際に、上記第1の
ステップにおいて、入力音声信号の自己相関係数の計算
時に、該自己相関係数を所定ビット数に正規化するため
のシフト量として正規化制御量を求め、上記第2乃至第
4のステップのうち少なくともいずれか1のステップに
おいて、相関値を求めて所定の演算を行う際に、上記正
規化制御量を用いて該相関値に対して正規化処理を行っ
たのち所定の演算を行うプログラムを記録したことを特
徴としている。
グラムを記録した記憶媒体に係り、請求項9記載の音声
符号化方法を実行するプログラムを記録したコンピュー
タ読み取り可能な記憶媒体であって、入力音声信号のス
ペクトル包絡を示すパラメータを線型予測によって求め
る第1のステップと、音声信号の概略ピッチ周期を計算
する第2のステップと、ターゲット信号(重み付け合成
フィルタの零入力応答を重み付け音声信号から減じた信
号)によって上記概略ピッチ周期の前後で微小部分を計
算する第3のステップと、マルチパルス音源とピッチ周
期から上記再生音声信号を生成するための利得を計算す
る第4のステップとを少なくとも備え、入力音声信号と
再生音声信号との誤差が最小になるように上記各ステッ
プにおいて制御を行ったときの各ステップのパラメータ
を多重して音声符号化信号を生成する際に、上記第1の
ステップにおいて、入力音声信号の自己相関係数の計算
時に、該自己相関係数を所定ビット数に正規化するため
のシフト量として正規化制御量を求め、上記第2乃至第
4のステップのうち少なくともいずれか1のステップに
おいて、相関値を求めて所定の演算を行う際に、上記正
規化制御量を用いて該相関値に対して正規化処理を行っ
たのち所定の演算を行うプログラムを記録したことを特
徴としている。
【0022】請求項12記載の発明は、音声符号化プロ
グラムを記録した記憶媒体に係り、請求項10記載の音
声符号化方法を実行するプログラムを記録したコンピュ
ータ読み取り可能な記憶媒体であって、上記正規化制御
量を、入力音声信号の自己相関係数を第1の所定ビット
数精度で計算して得たビット数が第2の所定ビット数よ
り大きいときは、該計算結果のビット数を第2の所定ビ
ット数に正規化するための第1のシフト量と、該第1の
シフト量によって入力音声信号をスケーリングして上記
第1の所定ビット数精度で自己相関係数を計算して得た
ビット数を上記第2の所定ビット数に正規化するための
第2のシフト量との差のシフト量として求め、上記計算
結果のビット数が上記第2の所定ビット数より大きくな
いときは、該計算結果のビット数を上記第2の所定ビッ
ト数に正規化するためのシフト量として求めるプログラ
ムを記録したことを特徴としている。
グラムを記録した記憶媒体に係り、請求項10記載の音
声符号化方法を実行するプログラムを記録したコンピュ
ータ読み取り可能な記憶媒体であって、上記正規化制御
量を、入力音声信号の自己相関係数を第1の所定ビット
数精度で計算して得たビット数が第2の所定ビット数よ
り大きいときは、該計算結果のビット数を第2の所定ビ
ット数に正規化するための第1のシフト量と、該第1の
シフト量によって入力音声信号をスケーリングして上記
第1の所定ビット数精度で自己相関係数を計算して得た
ビット数を上記第2の所定ビット数に正規化するための
第2のシフト量との差のシフト量として求め、上記計算
結果のビット数が上記第2の所定ビット数より大きくな
いときは、該計算結果のビット数を上記第2の所定ビッ
ト数に正規化するためのシフト量として求めるプログラ
ムを記録したことを特徴としている。
【0023】
【作用】この発明の構成では、相関値演算を行う場合
に、正規化を行うことによって、固定小数点演算時の精
度低下を防止する。例えば、ピッチ分析部/適応コード
ブック計算部において、重み付けされた音声信号sw
(n)に対して、式(1)によって評価値C(j) を
求め、
に、正規化を行うことによって、固定小数点演算時の精
度低下を防止する。例えば、ピッチ分析部/適応コード
ブック計算部において、重み付けされた音声信号sw
(n)に対して、式(1)によって評価値C(j) を
求め、
【0024】
【数1】
【0025】jを17〜144の範囲で変化させて、評
価値C(j) が最大になるjの値を求めて、ピッチ周
期を決定する。この際、評価値C(j) の最大値を探
索するために、 cWx2/cWc→(cWx/y)2/(cWc/y) (2) としても等価となる。また、固定小数点演算において
は、式(2)の演算は、式(3)のように、表現でき
る。 (cWx>>y)2/(cWc>>y) (3) ここで>>yは、所定ビット数にするためにyビットだ
け右シフトすることを示す。このようにした場合、音声
信号sw(n)のパワーが小さいときは、誤差が大きく
なるが、この発明では、LPC分析部において、シフト
量yが、音声信号sw(n)のパワーの大きさに比例し
て大きくなるようにする。従って、音声信号sw(n)
のパワーが小さいときは、シフト量yが0になるか又は
yだけ左シフトするので、誤差が大きくなることはな
い。
価値C(j) が最大になるjの値を求めて、ピッチ周
期を決定する。この際、評価値C(j) の最大値を探
索するために、 cWx2/cWc→(cWx/y)2/(cWc/y) (2) としても等価となる。また、固定小数点演算において
は、式(2)の演算は、式(3)のように、表現でき
る。 (cWx>>y)2/(cWc>>y) (3) ここで>>yは、所定ビット数にするためにyビットだ
け右シフトすることを示す。このようにした場合、音声
信号sw(n)のパワーが小さいときは、誤差が大きく
なるが、この発明では、LPC分析部において、シフト
量yが、音声信号sw(n)のパワーの大きさに比例し
て大きくなるようにする。従って、音声信号sw(n)
のパワーが小さいときは、シフト量yが0になるか又は
yだけ左シフトするので、誤差が大きくなることはな
い。
【0026】また、利得計算部では、ターゲット信号,
適応コードブック信号,マルチパルス信号のそれぞれの
相関値から、式(4)によって、評価値E(j)を求め
て、 E(j)=zp−a(j)・zsax−b(j)・fzscl+a(j)・b( j)・ fsalscl+a(j) 2・sasa+b(j) 2・fsclscl,( j=0〜63) (4) jを0〜63の範囲で変化させて、評価値E(j) が
最小になるjの値を求めて利得を決定する。この場合
も、式(5)のように、すべての項をyで割る(yだけ
シフトする)処理を行っても、誤差が大きくなることは
ない。 E(j)=(zp>>y)−a(j)・(zsax>>y)−b(j)・(fz scl>>y)+a(j)・b(j)・(fsalscl>>y)+a(j) 2・ sasa>>y)+b(j) 2(fsclscl>>y) (5)
適応コードブック信号,マルチパルス信号のそれぞれの
相関値から、式(4)によって、評価値E(j)を求め
て、 E(j)=zp−a(j)・zsax−b(j)・fzscl+a(j)・b( j)・ fsalscl+a(j) 2・sasa+b(j) 2・fsclscl,( j=0〜63) (4) jを0〜63の範囲で変化させて、評価値E(j) が
最小になるjの値を求めて利得を決定する。この場合
も、式(5)のように、すべての項をyで割る(yだけ
シフトする)処理を行っても、誤差が大きくなることは
ない。 E(j)=(zp>>y)−a(j)・(zsax>>y)−b(j)・(fz scl>>y)+a(j)・b(j)・(fsalscl>>y)+a(j) 2・ sasa>>y)+b(j) 2(fsclscl>>y) (5)
【0027】
【発明の実施の形態】以下、図面を参照して、この発明
の実施の形態について説明する。説明は、実施例を用い
て具体的に行う。図1は、この発明の一実施例の音声符
号化装置の構成を示すブロック図、図2は、LPC分析
部の動作を示すフローチャート、図3は、LPC分析部
における自己相関係数の計算と正規化制御量の検出の手
順を示すフローチャート、図4は、ピッチ分析部/適応
コードブック計算部におけるピッチ周期の計算手順を示
すフローチャート、図5は、利得計算部の動作を示すフ
ローチャート、また、図6は、利得計算部における各種
相関係数の計算手順を示すフローチャートである。この
例の音声符号化装置は、MPEG−4/狭帯域CELP
符号化装置の構成を例示し、図1に示すように、バッフ
ァメモリ1と、LPC(Linear Prediction Coefficien
ts)分析部2と、RMS(Root Mean Square)計算部3
と、ピッチ分析部4と、ターゲット信号生成部5と、適
応コードブック計算部6と、マルチパルス音源計算部7
と、利得計算部8と、駆動信号復元部9と、合成フィル
タ10と、マルチプレクサ11とから概略構成されてい
る。
の実施の形態について説明する。説明は、実施例を用い
て具体的に行う。図1は、この発明の一実施例の音声符
号化装置の構成を示すブロック図、図2は、LPC分析
部の動作を示すフローチャート、図3は、LPC分析部
における自己相関係数の計算と正規化制御量の検出の手
順を示すフローチャート、図4は、ピッチ分析部/適応
コードブック計算部におけるピッチ周期の計算手順を示
すフローチャート、図5は、利得計算部の動作を示すフ
ローチャート、また、図6は、利得計算部における各種
相関係数の計算手順を示すフローチャートである。この
例の音声符号化装置は、MPEG−4/狭帯域CELP
符号化装置の構成を例示し、図1に示すように、バッフ
ァメモリ1と、LPC(Linear Prediction Coefficien
ts)分析部2と、RMS(Root Mean Square)計算部3
と、ピッチ分析部4と、ターゲット信号生成部5と、適
応コードブック計算部6と、マルチパルス音源計算部7
と、利得計算部8と、駆動信号復元部9と、合成フィル
タ10と、マルチプレクサ11とから概略構成されてい
る。
【0028】バッファメモリ1は、入力音声信号を保持
してフレーム化して出力する。LPC分析部2は、入力
音声信号フレームのスペクトル包絡を示すスペクトルパ
ラメータを線型予測によって求める。RMS計算部3
は、符号化対象フレームの平均パワーを計算する。ピッ
チ分析部4は、バッファメモリ1の出力音声信号におけ
るピッチ周期を計算する。ターゲット信号生成部5は、
入力音声信号と再生音声信号との残差信号に聴感重み付
けを施してターゲット信号を生成する。適応コードブッ
ク計算部6は、ターゲット信号に対して、ピッチ分析部
4で求めた整数ピッチ周期の前後で、さらに分周ピッチ
周期を計算する。マルチパルス音源計算部7は、音源と
なる複数のパルスの位置と振幅を計算する。利得計算部
8は、ターゲット信号と、適応コードブック信号とマル
チパルス音源信号とに対する利得を計算する。駆動信号
復元部9は、適応コーブック信号と、マルチパルス音源
信号と、利得計算部で求められた利得とから、再生音声
信号を合成するための駆動信号を復元する。合成フィル
タ10は、駆動信号復元部9からの駆動信号によって再
生音声信号を合成する。マルチプレクサ11は、LPC
分析部2と、RMS計算部3と、ピッチ分析部4と、適
応コードブック計算部6と、マルチパルス音源計算部7
と、利得計算部8のそれぞれで得られたパラメータを多
重して符号化信号を出力する。
してフレーム化して出力する。LPC分析部2は、入力
音声信号フレームのスペクトル包絡を示すスペクトルパ
ラメータを線型予測によって求める。RMS計算部3
は、符号化対象フレームの平均パワーを計算する。ピッ
チ分析部4は、バッファメモリ1の出力音声信号におけ
るピッチ周期を計算する。ターゲット信号生成部5は、
入力音声信号と再生音声信号との残差信号に聴感重み付
けを施してターゲット信号を生成する。適応コードブッ
ク計算部6は、ターゲット信号に対して、ピッチ分析部
4で求めた整数ピッチ周期の前後で、さらに分周ピッチ
周期を計算する。マルチパルス音源計算部7は、音源と
なる複数のパルスの位置と振幅を計算する。利得計算部
8は、ターゲット信号と、適応コードブック信号とマル
チパルス音源信号とに対する利得を計算する。駆動信号
復元部9は、適応コーブック信号と、マルチパルス音源
信号と、利得計算部で求められた利得とから、再生音声
信号を合成するための駆動信号を復元する。合成フィル
タ10は、駆動信号復元部9からの駆動信号によって再
生音声信号を合成する。マルチプレクサ11は、LPC
分析部2と、RMS計算部3と、ピッチ分析部4と、適
応コードブック計算部6と、マルチパルス音源計算部7
と、利得計算部8のそれぞれで得られたパラメータを多
重して符号化信号を出力する。
【0029】次に、図1を参照して、この例の音声符号
化装置の動作を説明する。図示されない高域ろ波器を経
て、低周波成分を除去された、ディジタル化された音声
信号は、一旦、バッファメモリ1に蓄積されたのち、一
定サンプル数からなフレームごとに分割されて出力され
る。LPC分析部2では、フレームごとに、入力音声信
号に対して、LP(線形予測)分析を行って、10次ま
でのLPC係数を求めて、その値をマルチプレクサ11
へ送る。また、RMS計算部3では、フレームごとに、
入力音声信号の平均パワーを求めて、その値をマルチプ
レクサ11へ送る。さらにピッチ分析部4では、フレー
ムごとに、入力信号から聴感特性に基づいて重み付けを
行って聴感重み付け信号を生成し、ピッチ分析を行う。
ピッチ分析部4では、ピッチ周期(整数)と有音/無音
を判定し、ピッチ周期を適応コードブック計算部6へ送
り、有音/無音情報をマルチプレクサ11へ送る。
化装置の動作を説明する。図示されない高域ろ波器を経
て、低周波成分を除去された、ディジタル化された音声
信号は、一旦、バッファメモリ1に蓄積されたのち、一
定サンプル数からなフレームごとに分割されて出力され
る。LPC分析部2では、フレームごとに、入力音声信
号に対して、LP(線形予測)分析を行って、10次ま
でのLPC係数を求めて、その値をマルチプレクサ11
へ送る。また、RMS計算部3では、フレームごとに、
入力音声信号の平均パワーを求めて、その値をマルチプ
レクサ11へ送る。さらにピッチ分析部4では、フレー
ムごとに、入力信号から聴感特性に基づいて重み付けを
行って聴感重み付け信号を生成し、ピッチ分析を行う。
ピッチ分析部4では、ピッチ周期(整数)と有音/無音
を判定し、ピッチ周期を適応コードブック計算部6へ送
り、有音/無音情報をマルチプレクサ11へ送る。
【0030】一方、ターゲット信号生成部5では、重み
付け合成フィルタの零入力応答を重み付け音声信号から
減じた信号であるターゲット信号を生成して出力する。
すなわち、ターゲット信号生成部内に、合成フィルタと
重み付けフィルタとを有し、合成フィルタの入力として
零(無入力)を入れることによって生成された信号を、
聴感重み付けフィルタに入れることによって生成された
信号を、バッファメモリ1の出力信号を重み付けフィル
タに入れて得た信号から減算して、ターゲット信号を生
成する。このターゲット信号に対して、適応コードブッ
ク計算部6では、ターゲット信号との相関が最も強い、
過去において再生した励振信号(適応コードブック信
号)を適応的に探索することによって、ピッチ分析部4
で求めた整数ピッチ周期の前後で、さらに詳細な分数ピ
ッチ周期を計算する。そして、マルチパルス音源計算部
7では、ターゲット信号と適応コードブック信号との残
差信号を求め、この残差信号に対して歪みが最小になる
パルス位置と振幅を求めて得られた複数のパルスからな
るパルス列(マルチパルス)を、マルチパルス音源信号
として出力する。
付け合成フィルタの零入力応答を重み付け音声信号から
減じた信号であるターゲット信号を生成して出力する。
すなわち、ターゲット信号生成部内に、合成フィルタと
重み付けフィルタとを有し、合成フィルタの入力として
零(無入力)を入れることによって生成された信号を、
聴感重み付けフィルタに入れることによって生成された
信号を、バッファメモリ1の出力信号を重み付けフィル
タに入れて得た信号から減算して、ターゲット信号を生
成する。このターゲット信号に対して、適応コードブッ
ク計算部6では、ターゲット信号との相関が最も強い、
過去において再生した励振信号(適応コードブック信
号)を適応的に探索することによって、ピッチ分析部4
で求めた整数ピッチ周期の前後で、さらに詳細な分数ピ
ッチ周期を計算する。そして、マルチパルス音源計算部
7では、ターゲット信号と適応コードブック信号との残
差信号を求め、この残差信号に対して歪みが最小になる
パルス位置と振幅を求めて得られた複数のパルスからな
るパルス列(マルチパルス)を、マルチパルス音源信号
として出力する。
【0031】利得計算部8では、ターゲット信号と適応
コードブック信号とマルチパルス音源信号とに対して、
減算器12における誤差パワーが最小になるように利得
を計算する。駆動信号復元部9では、適応コードブック
信号とマルチパルス音源信号とに対して、利得計算部8
で求められた利得を適用して、合成フィルタ10を駆動
するための駆動信号を生成し、これによって、合成フィ
ルタ10において再生音声信号を生成して、減算器12
に出力する。このような制御が繰り返し行われて、入力
音声信号と再生音声信号との誤差(歪み)が最小になっ
たとき、LPC分析部2と、RMS計算部3と、ピッチ
分析部4と、適応コードブック計算部6と、マルチパル
ス音源計算部7と、利得計算部8とにおいて求められた
それぞれのパラメータを、マルチプレクサ11において
多重し符号化することによって、入力音声信号に対応す
るCELP符号化信号を出力する。
コードブック信号とマルチパルス音源信号とに対して、
減算器12における誤差パワーが最小になるように利得
を計算する。駆動信号復元部9では、適応コードブック
信号とマルチパルス音源信号とに対して、利得計算部8
で求められた利得を適用して、合成フィルタ10を駆動
するための駆動信号を生成し、これによって、合成フィ
ルタ10において再生音声信号を生成して、減算器12
に出力する。このような制御が繰り返し行われて、入力
音声信号と再生音声信号との誤差(歪み)が最小になっ
たとき、LPC分析部2と、RMS計算部3と、ピッチ
分析部4と、適応コードブック計算部6と、マルチパル
ス音源計算部7と、利得計算部8とにおいて求められた
それぞれのパラメータを、マルチプレクサ11において
多重し符号化することによって、入力音声信号に対応す
るCELP符号化信号を出力する。
【0032】このような符号化の過程において、図1に
示す、LPC分析部2,ピッチ分析部4,コードブック
計算部6,利得計算部8等においては、それぞれの演算
処理中において、固定小数点演算によって相関計算が行
われるが、この際、計算結果の正規化を行うことによっ
て、限られたビット数で、精度のよい演算を行うことが
できるようにしている。以下においては、各部における
演算の概要と、その際における、相関演算の正規化の方
法とについて説明する。
示す、LPC分析部2,ピッチ分析部4,コードブック
計算部6,利得計算部8等においては、それぞれの演算
処理中において、固定小数点演算によって相関計算が行
われるが、この際、計算結果の正規化を行うことによっ
て、限られたビット数で、精度のよい演算を行うことが
できるようにしている。以下においては、各部における
演算の概要と、その際における、相関演算の正規化の方
法とについて説明する。
【0033】まず、図2を用いて、LPC分析部の動作
を説明する。LPC分析部21においては、入力音声信
号s(n)(nはフレーム中のサンプル番号。以下同
様)のフレーム化時における高調波成分の発生を防止す
るために、適当な窓関数を乗算する窓かけ処理を行う
(ステップS1)。窓処理としては、例えばハミング窓
とコサイン関数周期の窓かけとが行われる。次に、窓か
けが行われた音声信号に対して、自己相関計算が行われ
て、正規化された自己相関係数r'(k)が求められる
(ステップS2)。自己相関係数は、式(6)によって
計算される。
を説明する。LPC分析部21においては、入力音声信
号s(n)(nはフレーム中のサンプル番号。以下同
様)のフレーム化時における高調波成分の発生を防止す
るために、適当な窓関数を乗算する窓かけ処理を行う
(ステップS1)。窓処理としては、例えばハミング窓
とコサイン関数周期の窓かけとが行われる。次に、窓か
けが行われた音声信号に対して、自己相関計算が行われ
て、正規化された自己相関係数r'(k)が求められる
(ステップS2)。自己相関係数は、式(6)によって
計算される。
【0034】
【数2】
【0035】ここで、k=0,…,10は自己相関の次数
である。このとき、自己相関計算結果r(k)を所定ビ
ット数に正規化するための正規化制御量λが決定される
とともに、この正規化制御量λを適用することによっ
て、正規化された自己相関係数r'(k)が求められる。
次に、正規化された自己相関係数r'(k)に対して、レ
ビンソン・ダービンアルゴリズムによる再帰演算を行う
ことによって(ステップS3)、LPC係数αが求めら
れる。
である。このとき、自己相関計算結果r(k)を所定ビ
ット数に正規化するための正規化制御量λが決定される
とともに、この正規化制御量λを適用することによっ
て、正規化された自己相関係数r'(k)が求められる。
次に、正規化された自己相関係数r'(k)に対して、レ
ビンソン・ダービンアルゴリズムによる再帰演算を行う
ことによって(ステップS3)、LPC係数αが求めら
れる。
【0036】次に、図3を用いて、自己相関係数と正規
化制御量λを求める際の手順を詳細に説明する。図3
(a)に示すフローチャートにおいて、前述のように、
窓かけされた音声信号s'(n)に対して、40ビット精
度で0次の自己相関係数r(0)を計算する(ステップ
Q1)。 r(0)=s'(n)*s'(n) (7) 自己相関係数r(0)は、式(7)に示すように、音声
信号s'(n)どうしの畳み込み演算("*”は畳み込み
演算を表す。以下、同様)によって求められる。そし
て、r(0)>231であったときは(ステップQ
2)、次のようにして、正規化制御量λ1を求める。4
0ビットから32ビットへの正規化制御量を求めるため
に、まず、r(0)を16ビットだけ右シフトする(ス
テップQ3)。これは、演算装置が、32ビット以下の
値しか扱うことができないためである。
化制御量λを求める際の手順を詳細に説明する。図3
(a)に示すフローチャートにおいて、前述のように、
窓かけされた音声信号s'(n)に対して、40ビット精
度で0次の自己相関係数r(0)を計算する(ステップ
Q1)。 r(0)=s'(n)*s'(n) (7) 自己相関係数r(0)は、式(7)に示すように、音声
信号s'(n)どうしの畳み込み演算("*”は畳み込み
演算を表す。以下、同様)によって求められる。そし
て、r(0)>231であったときは(ステップQ
2)、次のようにして、正規化制御量λ1を求める。4
0ビットから32ビットへの正規化制御量を求めるため
に、まず、r(0)を16ビットだけ右シフトする(ス
テップQ3)。これは、演算装置が、32ビット以下の
値しか扱うことができないためである。
【0037】次に、以下のようにして、32ビットへの
正規化制御量を計算する(ステップQ4)。まず、式
(8)によって32ビットへの第1の正規化制御量λ1
を求める。 λ1=exp(r(0)) (8) ここで、exp(r(0))関数の演算は、図3(b)
に示すように、32ビットへの正規化制御量を求める演
算であり、λ1は、32ビットへの正規化制御量を表し
ている。そして、r(0)のオーバーフロー量(32ビッ
トに収まらないビット数)を計算するため、第1の正規
化制御量λ1として、式(9)に示す値を用いる。 λ1=15−λ1 (9) 次に、式(10)によって、正規化制御量λ1を2ビッ
トだけ右シフトする。r(0)は、畳み込み演算によっ
て、信号s'(n)を2乗して求めているので、r(0)を
1/4にする(2ビット右シフト)するためには、信号
s'(n)を1/2にする必要がある。 λ1=λ1>>2 (10) また、式(11)によって、正規化制御量λ1を2ビッ
トだけ左シフトする。演算量の増加を抑えるために、信
号s'(n)のスケーリング量を"2”刻みにするが、そ
のためには、λ1を4で除算してその商を用いて上記式
を実行すると、λ1は2の倍数となる。 λ1=2<<λ1 (11)
正規化制御量を計算する(ステップQ4)。まず、式
(8)によって32ビットへの第1の正規化制御量λ1
を求める。 λ1=exp(r(0)) (8) ここで、exp(r(0))関数の演算は、図3(b)
に示すように、32ビットへの正規化制御量を求める演
算であり、λ1は、32ビットへの正規化制御量を表し
ている。そして、r(0)のオーバーフロー量(32ビッ
トに収まらないビット数)を計算するため、第1の正規
化制御量λ1として、式(9)に示す値を用いる。 λ1=15−λ1 (9) 次に、式(10)によって、正規化制御量λ1を2ビッ
トだけ右シフトする。r(0)は、畳み込み演算によっ
て、信号s'(n)を2乗して求めているので、r(0)を
1/4にする(2ビット右シフト)するためには、信号
s'(n)を1/2にする必要がある。 λ1=λ1>>2 (10) また、式(11)によって、正規化制御量λ1を2ビッ
トだけ左シフトする。演算量の増加を抑えるために、信
号s'(n)のスケーリング量を"2”刻みにするが、そ
のためには、λ1を4で除算してその商を用いて上記式
を実行すると、λ1は2の倍数となる。 λ1=2<<λ1 (11)
【0038】このようにして、正規化制御量λ1が求め
られたとき、信号s'(n)のスケーリングを、式(1
2)のようにして行う(ステップQ5)。 s'(n)=s'(n)>>λ1 (12) このような演算を信号s'(n)について、繰り返して実
行して、r(0)が32ビット以下になるようにする。
られたとき、信号s'(n)のスケーリングを、式(1
2)のようにして行う(ステップQ5)。 s'(n)=s'(n)>>λ1 (12) このような演算を信号s'(n)について、繰り返して実
行して、r(0)が32ビット以下になるようにする。
【0039】一方、r(0)>231でないときは(ス
テップQ2)、式(13)によって、32ビットへの第
2の正規化制御量λ2を求める。 λ2=exp(r(0)) (13) そして、r(0)を正規化制御量λ2によって、32ビ
ットへ正規化する。式(14)は、r(0)を正規化制
御量λ2ビットだけ左シフトすることによって、32ビ
ットに正規化されることを示している。 r'(0)=r(0)<<λ2 (14)
テップQ2)、式(13)によって、32ビットへの第
2の正規化制御量λ2を求める。 λ2=exp(r(0)) (13) そして、r(0)を正規化制御量λ2によって、32ビ
ットへ正規化する。式(14)は、r(0)を正規化制
御量λ2ビットだけ左シフトすることによって、32ビ
ットに正規化されることを示している。 r'(0)=r(0)<<λ2 (14)
【0040】このようにして求められた、正規化制御量
λ1とλ2とによって、以後の演算に用いる正規化制御
量λを決定する(ステップQ8)。 λ=λ1−λ2 (15) これは、正規化制御量λ1を適用したために、スケーリ
ングが過剰になった分を、正規化制御量λ2によって補
償することによって、r'(0)を正しく32ビットに正
規化できることを示している。もしも、始めからr
(0)>231でないときは、制御制御量λは−λ2と
なるので、単純に左シフトのみによって、32ビットに
正規化された自己相関係数r'(0)が求められる。
λ1とλ2とによって、以後の演算に用いる正規化制御
量λを決定する(ステップQ8)。 λ=λ1−λ2 (15) これは、正規化制御量λ1を適用したために、スケーリ
ングが過剰になった分を、正規化制御量λ2によって補
償することによって、r'(0)を正しく32ビットに正
規化できることを示している。もしも、始めからr
(0)>231でないときは、制御制御量λは−λ2と
なるので、単純に左シフトのみによって、32ビットに
正規化された自己相関係数r'(0)が求められる。
【0041】正規化制御量が決定されたことによって、
以後、i=1,…,10についてループすることによって
(ステップQ9)、1次から10次までの自己相関係数
r'(0)〜r'(10)を求める。まず、式(16)のよう
に、40ビット精度で自己相関係数r(i)を計算する
(ステップQ10)。 r(i)=s'(n)*s'(n+i) (16) 次に、式(17)によって、自己相関係数r(i)を正
規化制御量λ2を用いて、32ビットへ正規化する(ス
テップQ11)。 r'(i)=r(i)<<λ2 (17) ここで正規化制御量としてλ2を用いるのは、一般に0
次の自己相関係数r(0)の値は最大であって、1次〜
10次の自己相関関数r(1)〜r(10)の値は、こ
れより小さい。一方、r(0)について32ビット以下
になるようにスケーリングを行っているので、この場
合、1次〜10次の自己相関係数r(i)は32ビット
以下になるためである。i=1,…,10について、ルー
プを終了したとき、自己相関係数r'(0)〜r'(10)が
求められる(ステップQ12)。
以後、i=1,…,10についてループすることによって
(ステップQ9)、1次から10次までの自己相関係数
r'(0)〜r'(10)を求める。まず、式(16)のよう
に、40ビット精度で自己相関係数r(i)を計算する
(ステップQ10)。 r(i)=s'(n)*s'(n+i) (16) 次に、式(17)によって、自己相関係数r(i)を正
規化制御量λ2を用いて、32ビットへ正規化する(ス
テップQ11)。 r'(i)=r(i)<<λ2 (17) ここで正規化制御量としてλ2を用いるのは、一般に0
次の自己相関係数r(0)の値は最大であって、1次〜
10次の自己相関関数r(1)〜r(10)の値は、こ
れより小さい。一方、r(0)について32ビット以下
になるようにスケーリングを行っているので、この場
合、1次〜10次の自己相関係数r(i)は32ビット
以下になるためである。i=1,…,10について、ルー
プを終了したとき、自己相関係数r'(0)〜r'(10)が
求められる(ステップQ12)。
【0042】次に、図4を用いて、ピッチ分析部/適応
コードブック計算部におけるピッチ周期の計算手順を説
明する。ピッチ分析部4においては、バッファメモリ1
から出力された音声信号s(n)に対して、聴感特性に
基づく聴感重み付けを行って重み付け音声信号sw
(n)を生成し、この重み付け信号からピッチ周期la
g(整数部)を計算する。また適応コードブック計算部
6においては、ターゲット信号生成部5において生成さ
れた、聴感特性に基づく聴感重み付けを行ったターゲッ
ト信号から、ピッチ周期lag(分数部)を計算する。
コードブック計算部におけるピッチ周期の計算手順を説
明する。ピッチ分析部4においては、バッファメモリ1
から出力された音声信号s(n)に対して、聴感特性に
基づく聴感重み付けを行って重み付け音声信号sw
(n)を生成し、この重み付け信号からピッチ周期la
g(整数部)を計算する。また適応コードブック計算部
6においては、ターゲット信号生成部5において生成さ
れた、聴感特性に基づく聴感重み付けを行ったターゲッ
ト信号から、ピッチ周期lag(分数部)を計算する。
【0043】ピッチ分析部4及び適応コードブック計算
部6におけるピッチ周期の計算は、図4に示すようにし
て行われる。まず、重み付けされた音声信号sw(n)
に対して、40ビット精度で、自己相関係数cWc、相
互相関係数cWxと、自己相関係数と相互相関係数との
相関値すなわち歪み量を表す評価値とを計算する(ステ
ップR1)。自己相関係数、相互相関係数、評価値は、
前述の(1)式によって、重み付けされた音声信号sw
(n)から計算される。ここで、nはフレーム中のサン
プル番号を示し、i=17,…,144は、探索する位置
(信号周期)を示している。
部6におけるピッチ周期の計算は、図4に示すようにし
て行われる。まず、重み付けされた音声信号sw(n)
に対して、40ビット精度で、自己相関係数cWc、相
互相関係数cWxと、自己相関係数と相互相関係数との
相関値すなわち歪み量を表す評価値とを計算する(ステ
ップR1)。自己相関係数、相互相関係数、評価値は、
前述の(1)式によって、重み付けされた音声信号sw
(n)から計算される。ここで、nはフレーム中のサン
プル番号を示し、i=17,…,144は、探索する位置
(信号周期)を示している。
【0044】次に、LPC分析部2において求められた
正規化制御量λを用いて、式(18),(19)によっ
て、自己相関係数cWc及び相互相関係数cWxを正規
化して、正規化された自己相関係数cWc'、相互相関
係数cWx'を求める(ステップR2)。 cWc'=cWc>>λ (18) cWx'=cWx>>λ (19) このような自己相関係数cWc'、相互相関係数cWx'
について、すべてのiの範囲で評価値を計算し、評価値
が最も大きくなるiの値を求めて、このiに対応する周
期をピッチ周期lagとする。
正規化制御量λを用いて、式(18),(19)によっ
て、自己相関係数cWc及び相互相関係数cWxを正規
化して、正規化された自己相関係数cWc'、相互相関
係数cWx'を求める(ステップR2)。 cWc'=cWc>>λ (18) cWx'=cWx>>λ (19) このような自己相関係数cWc'、相互相関係数cWx'
について、すべてのiの範囲で評価値を計算し、評価値
が最も大きくなるiの値を求めて、このiに対応する周
期をピッチ周期lagとする。
【0045】次に、図5を用いて、利得計算部における
動作を説明する。利得計算部22においては、ターゲッ
ト信号生成部5からのターゲット信号z(n)と、適応
コードブック計算部6からの適応コードブック信号fs
al(n)と、マルチパルス音源計算部7からのマルチ
パルス音源信号fscl(n)とから、声道の形状に基
づく、声道各部の反射係数を計算する(ステップU
1)。次に、ターゲット信号fz(n)とマルチパルス
音源信号fscl(n)の相互相関値と、適応コードブ
ック信号fsal(n)とマルチパルス音源信号fsc
l(n)の相互相関値と、マルチパルス音源信号fsc
l(n)の自己相関値とを計算する(ステップU2)。
動作を説明する。利得計算部22においては、ターゲッ
ト信号生成部5からのターゲット信号z(n)と、適応
コードブック計算部6からの適応コードブック信号fs
al(n)と、マルチパルス音源計算部7からのマルチ
パルス音源信号fscl(n)とから、声道の形状に基
づく、声道各部の反射係数を計算する(ステップU
1)。次に、ターゲット信号fz(n)とマルチパルス
音源信号fscl(n)の相互相関値と、適応コードブ
ック信号fsal(n)とマルチパルス音源信号fsc
l(n)の相互相関値と、マルチパルス音源信号fsc
l(n)の自己相関値とを計算する(ステップU2)。
【0046】次に、利得計算を行う(ステップU3)。
利得計算は、式(20)によって評価値E(j) を求
める。 E(j)=zp−a(j)・zsax−b(j)・fzscl+a(j)・b( j)・ fsalscl+a(j) 2・sasa+b(j) 2・fsclscl,( j=0〜63) (20) ここで、zpはターゲット信号z(n)の自己相関値、
zsaxはターゲット信号z(n)と適応コードブック
信号fsal(n)との相互相関値、fzsclは、タ
ーゲット信号z(n)とマルチパルス音源信号fscl
(n)の相互相関値、fsalsclは適応コードブッ
ク信号fsal(n)とマルチパルス音源信号fscl
(n)の相互相関値、sasaは適応コードブック信号
fsal(n)の自己相関値、fsclsclはマルチ
パルス音源信号fscl(n)の自己相関値である。a
(j),b(j)は係数であって、利得を表すテーブル
中の値を指している。利得計算は、式(20)におい
て、係数a(j),b(j)を、j=0〜63の範囲で
変化させて歪みを表す評価値E(j)が最小になるとき
のa(j),b(j)の組み合わせを求めて、このとき
のa(j),b(j)によって定まる利得を、所望の利
得値とする。
利得計算は、式(20)によって評価値E(j) を求
める。 E(j)=zp−a(j)・zsax−b(j)・fzscl+a(j)・b( j)・ fsalscl+a(j) 2・sasa+b(j) 2・fsclscl,( j=0〜63) (20) ここで、zpはターゲット信号z(n)の自己相関値、
zsaxはターゲット信号z(n)と適応コードブック
信号fsal(n)との相互相関値、fzsclは、タ
ーゲット信号z(n)とマルチパルス音源信号fscl
(n)の相互相関値、fsalsclは適応コードブッ
ク信号fsal(n)とマルチパルス音源信号fscl
(n)の相互相関値、sasaは適応コードブック信号
fsal(n)の自己相関値、fsclsclはマルチ
パルス音源信号fscl(n)の自己相関値である。a
(j),b(j)は係数であって、利得を表すテーブル
中の値を指している。利得計算は、式(20)におい
て、係数a(j),b(j)を、j=0〜63の範囲で
変化させて歪みを表す評価値E(j)が最小になるとき
のa(j),b(j)の組み合わせを求めて、このとき
のa(j),b(j)によって定まる利得を、所望の利
得値とする。
【0047】次に、図6を用いて、利得計算時におけ
る、各相関値の計算手順について説明する。ターゲット
信号z(n)と、適応コードブック信号fsal(n)
と、マルチパルス音源信号fscl(n)とから、式
(21)によって、40ビット精度で、ターゲット信号
z(n)とマルチパルス音源信号fscl(n)の相互
相関値を計算し、式(22)によって、40ビット精度
で、適応コードブック信号fsal(n)とマルチパル
ス音源信号fscl(n)の相互相関値を計算し、式
(23)によって、40ビット精度で、マルチパルス音
源信号fscl(n)の自己相関値とを計算する(ステ
ップV1)。 fzscl=z(n)*fscl(n) (21) fsalscl=fsal(n)*fscl(n) (22) fsclscl=fscl(n)*fscl(n) (23)
る、各相関値の計算手順について説明する。ターゲット
信号z(n)と、適応コードブック信号fsal(n)
と、マルチパルス音源信号fscl(n)とから、式
(21)によって、40ビット精度で、ターゲット信号
z(n)とマルチパルス音源信号fscl(n)の相互
相関値を計算し、式(22)によって、40ビット精度
で、適応コードブック信号fsal(n)とマルチパル
ス音源信号fscl(n)の相互相関値を計算し、式
(23)によって、40ビット精度で、マルチパルス音
源信号fscl(n)の自己相関値とを計算する(ステ
ップV1)。 fzscl=z(n)*fscl(n) (21) fsalscl=fsal(n)*fscl(n) (22) fsclscl=fscl(n)*fscl(n) (23)
【0048】次に、LPC分析部2で求められた正規化
制御量λによって、各相関値を32ビットに正規化する
(式(24)〜(26)、ステップV2)。 fzscl=fzscl>>λ (24) fsalscl=fsalscl>>λ (25) fsclscl=fsclscl>>λ (26)
制御量λによって、各相関値を32ビットに正規化する
(式(24)〜(26)、ステップV2)。 fzscl=fzscl>>λ (24) fsalscl=fsalscl>>λ (25) fsclscl=fsclscl>>λ (26)
【0049】このようにして正規化された各相関値を用
いたとき、式(20)に示された評価値E(j)は、式
(27)で与えられる。 E(j)=(zp>>λ)−a(j)・(zsax>>λ)−b(j)・(fz scl>>λ)+a(j)・b(j)・(fsalscl>>λ)+a(j) 2・ (sasa>>λ)+b(j) 2・(fsclscl>>λ),(j=0〜63 ) (27) これによって、固定小数点演算によって、利得計算を行
うことができる。
いたとき、式(20)に示された評価値E(j)は、式
(27)で与えられる。 E(j)=(zp>>λ)−a(j)・(zsax>>λ)−b(j)・(fz scl>>λ)+a(j)・b(j)・(fsalscl>>λ)+a(j) 2・ (sasa>>λ)+b(j) 2・(fsclscl>>λ),(j=0〜63 ) (27) これによって、固定小数点演算によって、利得計算を行
うことができる。
【0050】このように、この例の音声符号化装置で
は、符号化の初期において、LPC分析部において求め
られた正規化制御量を用いて、LPC分析部と、ピッチ
分析部及び適応コードブック計算部と、利得計算部とに
おける相関関数計算時に、求められた相関値を演算装置
のビット数に正規化して計算をを行うので、固定小数点
演算を行っても、演算精度の低下が少なくなるので、符
号化に伴う音質の低下が少ない。かつこの際の正規化制
御量は、入力音声信号のパワーの大小に応じて定められ
るので、正規化に伴う計算誤差は、入力音声信号のパワ
ーが小さい程小さくなり、従って、入力音声信号のレベ
ルが低い状態での音質劣化を少なくすることができる。
は、符号化の初期において、LPC分析部において求め
られた正規化制御量を用いて、LPC分析部と、ピッチ
分析部及び適応コードブック計算部と、利得計算部とに
おける相関関数計算時に、求められた相関値を演算装置
のビット数に正規化して計算をを行うので、固定小数点
演算を行っても、演算精度の低下が少なくなるので、符
号化に伴う音質の低下が少ない。かつこの際の正規化制
御量は、入力音声信号のパワーの大小に応じて定められ
るので、正規化に伴う計算誤差は、入力音声信号のパワ
ーが小さい程小さくなり、従って、入力音声信号のレベ
ルが低い状態での音質劣化を少なくすることができる。
【0051】以上、この発明の実施例を図面により詳述
してきたが、具体的な構成はこの実施例に限られたもの
ではなく、この発明の要旨を逸脱しない範囲の設計の変
更等があってもこの発明に含まれる。例えば、この発明
は、ハードウェア構成によって実現する場合に限らず、
ソフトウェアによって実現することもできる。この場
は、ハードウェア構成として、中央処理装置(CPU)
やディジタルシグナルプロセッサ(DSP)等の処理装
置と、CPU等とバスを介して接続された、プログラム
やデータを蓄積するための大容量の低速メモリと、CP
U等の作業領域となる高速メモリと、外部接続とデータ
の授受のための入力装置及び出力装置等を有する周知の
システムを備え、これにこの発明の方法を実行するため
のプログラムを装備することによって容易に実現され
る。さらに、このようなプログラムを、処理装置が読み
取り可能な、任意の形式の媒体に記録した状態で予め用
意することによって、同様なシステムを具備する場合
に、同一の方法を普遍的に実現することができる。
してきたが、具体的な構成はこの実施例に限られたもの
ではなく、この発明の要旨を逸脱しない範囲の設計の変
更等があってもこの発明に含まれる。例えば、この発明
は、ハードウェア構成によって実現する場合に限らず、
ソフトウェアによって実現することもできる。この場
は、ハードウェア構成として、中央処理装置(CPU)
やディジタルシグナルプロセッサ(DSP)等の処理装
置と、CPU等とバスを介して接続された、プログラム
やデータを蓄積するための大容量の低速メモリと、CP
U等の作業領域となる高速メモリと、外部接続とデータ
の授受のための入力装置及び出力装置等を有する周知の
システムを備え、これにこの発明の方法を実行するため
のプログラムを装備することによって容易に実現され
る。さらに、このようなプログラムを、処理装置が読み
取り可能な、任意の形式の媒体に記録した状態で予め用
意することによって、同様なシステムを具備する場合
に、同一の方法を普遍的に実現することができる。
【0052】
【発明の効果】以上説明したように、この発明の音声符
号化装置によれば、LPC分析部で得られた自己相関係
数の正規化制御量を用いて、ピッチ分析部,適応コード
ブック計算部,利得計算部等における相関値計算,歪み
計算等における正規化量の制御を行うので、音声符号化
処理のための演算量を減少させることができ、従って、
従来よりも低い動作周波数で装置を動作させることがで
きるので、装置を安価に構成できるとともに、消費電力
の低下を図ることができる。さらにこの発明によれば、
固定少数点演算装置を使用可能になるとともに、スケー
リング,飽和演算が不要になるので、固定小数点演算に
よる演算精度不足に基づく音質劣化を改善できるととも
に、入力音声信号のレベル変化に対して、均一の符号化
品質を得ることができる。
号化装置によれば、LPC分析部で得られた自己相関係
数の正規化制御量を用いて、ピッチ分析部,適応コード
ブック計算部,利得計算部等における相関値計算,歪み
計算等における正規化量の制御を行うので、音声符号化
処理のための演算量を減少させることができ、従って、
従来よりも低い動作周波数で装置を動作させることがで
きるので、装置を安価に構成できるとともに、消費電力
の低下を図ることができる。さらにこの発明によれば、
固定少数点演算装置を使用可能になるとともに、スケー
リング,飽和演算が不要になるので、固定小数点演算に
よる演算精度不足に基づく音質劣化を改善できるととも
に、入力音声信号のレベル変化に対して、均一の符号化
品質を得ることができる。
【図1】この発明の一実施例の音声符号化装置の構成を
示すブロック図である。
示すブロック図である。
【図2】LPC分析部の動作を示すフローチャートであ
る。
る。
【図3】LPC分析部における自己相関係数の計算と正
規化制御量の検出の手順を示すフローチャートである。
規化制御量の検出の手順を示すフローチャートである。
【図4】ピッチ分析部/適応コードブック計算部におけ
るピッチ周期の計算手順を示すフローチャートである。
るピッチ周期の計算手順を示すフローチャートである。
【図5】利得計算部の動作を示すフローチャートであ
る。
る。
【図6】利得計算部における各種相関係数の計算手順を
示すフローチャートである。
示すフローチャートである。
【図7】CELP方式の音声符号化装置の基本的な構成
を示す図である。
を示す図である。
【図8】固定小数点演算の特性を説明するための図であ
る。
る。
2 LPC分析部(第1の手段) 3 RMS計算部 4 ピッチ分析部(第2の手段) 5 ターゲット信号生成部 6 適応コードブック計算部(第3の手段) 7 マルチパルス音源計算部 8 利得計算部(第4の手段)
Claims (12)
- 【請求項1】 入力音声信号のスペクトル包絡を示すパ
ラメータを線型予測によって求める第1の手段と、音声
信号の概略ピッチ周期を計算する第2の手段と、ターゲ
ット信号によって前記概略ピッチ周期の前後で微小部分
を計算する第3の手段と、マルチパルス音源とピッチ周
期から前記再生音声信号を生成するための利得を計算す
る第4の手段とを少なくとも備え、入力音声信号と再生
音声信号との誤差が最小になるように前記各手段におい
て制御を行ったときの各部のパラメータを多重して音声
符号化信号を生成する音声符号化装置において、 前記各手段のうち少なくとも1の手段において、相関値
を求めて所定の演算を行う際に、該相関値に対して正規
化処理を行ったのち所定の演算を行うように構成されて
いることを特徴とする音声符号化装置。 - 【請求項2】 前記いずれか1の手段における前記正規
化処理が、前記求められた相関値を、他のいずれか1の
手段において求められた正規化制御量だけシフトするこ
とによって行われるものであることを特徴とする請求項
1記載の音声符号化装置。 - 【請求項3】 前記正規化制御量が、前記第1の手段に
おいて、入力音声信号の自己相関係数の計算時に、該自
己相関係数を所定ビット数に正規化するためのシフト量
として求められるものであることを特徴とする請求項2
記載の音声符号化装置。 - 【請求項4】 前記正規化制御量が、入力音声信号レベ
ルに応じてその値を定められるものであることを特徴と
する請求項2又は3記載の音声符号化装置。 - 【請求項5】 前記正規化制御量が、入力音声信号の自
己相関係数を第1の所定ビット数精度で計算して得たビ
ット数が第2の所定ビット数より大きいときは、該計算
結果のビット数を第2の所定ビット数に正規化するため
の第1のシフト量と、該第1のシフト量によって入力音
声信号をスケーリングして前記第1の所定ビット数精度
で自己相関係数を計算して得たビット数を前記第2の所
定ビット数に正規化するための第2のシフト量との差の
シフト量として求められ、 前記計算結果のビット数が前記第2の所定ビット数より
大きくないときは、該計算結果のビット数を前記第2の
所定ビット数に正規化するためのシフト量として求めら
れることを特徴とする請求項2乃至4のいずれか1に記
載の音声符号化装置。 - 【請求項6】 入力音声信号をCELP符号化する音声
符号化装置であって、該音声符号化装置を構成する各手
段のうちいずれか1の手段において、入力音声信号の自
己相関係数を所定ビット数に正規化するための正規化制
御量を求めるとともに、他の少なくともいずれか1の手
段において、該正規化制御量を用いて相関値を正規化し
て、所定の演算を行うように構成されていることを特徴
とする音声符号化装置。 - 【請求項7】 入力音声信号のスペクトル包絡を示すパ
ラメータを線型予測によって求める第1のステップと、
音声信号の概略ピッチ周期を計算する第2のステップ
と、ターゲット信号によって前記概略ピッチ周期の前後
で微小部分を計算する第3のステップと、マルチパルス
音源とピッチ周期から前記再生音声信号を生成するため
の利得を計算する第4のステップとを少なくとも備え、
入力音声信号と再生音声信号との誤差が最小になるよう
に前記各ステップにおいて制御を行ったときの各ステッ
プのパラメータを多重して音声符号化信号を生成する音
声符号化方法において、 前記各ステップのうち少なくともいずれか1のステップ
において、相関値を求めて所定の演算を行う際に、該相
関値に対して正規化処理を行ったのち所定の演算を行う
ことを特徴とする音声符号化方法。 - 【請求項8】 前記正規化処理を、前記求められた相関
値を、他のいずれか1の手段において求められた正規化
制御量だけシフトすることによって行うことを特徴とす
る請求項7記載の音声符号化方法。 - 【請求項9】 前記正規化制御量を、前記第1のステッ
プにおいて、入力音声信号の自己相関係数の計算時に、
該自己相関係数を所定ビット数に正規化するためのシフ
ト量として求めることを特徴とする請求項8記載の音声
符号化方法。 - 【請求項10】 前記正規化制御量を、入力音声信号の
自己相関係数を第1の所定ビット数精度で計算して得た
ビット数が第2の所定ビット数より大きいときは、該計
算結果のビット数を第2の所定ビット数に正規化するた
めの第1のシフト量と、該第1のシフト量によって入力
音声信号をスケーリングして前記第1の所定ビット数精
度で自己相関係数を計算して得たビット数を前記第2の
所定ビット数に正規化するための第2のシフト量との差
のシフト量として求め、前記計算結果のビット数が前記
第2の所定ビット数より大きくないときは、該計算結果
のビット数を前記第2の所定ビット数に正規化するため
のシフト量として求めることを特徴とする請求項8又は
9記載の音声符号化方法。 - 【請求項11】 請求項9記載の音声符号化方法を実行
するプログラムを記録したコンピュータ読み取り可能な
記憶媒体であって、入力音声信号のスペクトル包絡を示
すパラメータを線型予測によって求める第1のステップ
と、音声信号の概略ピッチ周期を計算する第2のステッ
プと、ターゲット信号によって前記概略ピッチ周期の前
後で微小部分を計算する第3のステップと、マルチパル
ス音源とピッチ周期から前記再生音声信号を生成するた
めの利得を計算する第4のステップとを少なくとも備
え、入力音声信号と再生音声信号との誤差が最小になる
ように前記各ステップにおいて制御を行ったときの各ス
テップのパラメータを多重して音声符号化信号を生成す
る際に、前記第1のステップにおいて、入力音声信号の
自己相関係数の計算時に、該自己相関係数を所定ビット
数に正規化するためのシフト量として正規化制御量を求
め、前記第2乃至第4のステップのうち少なくともいず
れか1のステップにおいて、相関値を求めて所定の演算
を行う際に、前記正規化制御量を用いて該相関値に対し
て正規化処理を行ったのち所定の演算を行うプログラム
を記録したことを特徴とする音声符号化プログラムを記
録した記憶媒体。 - 【請求項12】 請求項10記載の音声符号化方法を実
行するプログラムを記録したコンピュータ読み取り可能
な記憶媒体であって、前記正規化制御量を、入力音声信
号の自己相関係数を第1の所定ビット数精度で計算して
得たビット数が第2の所定ビット数より大きいときは、
該計算結果のビット数を第2の所定ビット数に正規化す
るための第1のシフト量と、該第1のシフト量によって
入力音声信号をスケーリングして前記第1の所定ビット
数精度で自己相関係数を計算して得たビット数を前記第
2の所定ビット数に正規化するための第2のシフト量と
の差のシフト量として求め、前記計算結果のビット数が
前記第2の所定ビット数より大きくないときは、該計算
結果のビット数を前記第2の所定ビット数に正規化する
ためのシフト量として求めるプログラムを記録したこと
を特徴とする音声符号化プログラムを記録した記憶媒
体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP13789399A JP3365346B2 (ja) | 1999-05-18 | 1999-05-18 | 音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP13789399A JP3365346B2 (ja) | 1999-05-18 | 1999-05-18 | 音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2000330594A true JP2000330594A (ja) | 2000-11-30 |
| JP3365346B2 JP3365346B2 (ja) | 2003-01-08 |
Family
ID=15209151
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP13789399A Expired - Fee Related JP3365346B2 (ja) | 1999-05-18 | 1999-05-18 | 音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3365346B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2003015080A1 (en) * | 2001-08-02 | 2003-02-20 | Matsushita Electric Industrial Co., Ltd. | Pitch cycle search range setting device and pitch cycle search device |
| JP2012163981A (ja) * | 2005-05-31 | 2012-08-30 | Microsoft Corp | オーディオコーデックポストフィルタ |
-
1999
- 1999-05-18 JP JP13789399A patent/JP3365346B2/ja not_active Expired - Fee Related
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2003015080A1 (en) * | 2001-08-02 | 2003-02-20 | Matsushita Electric Industrial Co., Ltd. | Pitch cycle search range setting device and pitch cycle search device |
| US7177802B2 (en) | 2001-08-02 | 2007-02-13 | Matsushita Electric Industrial Co., Ltd. | Pitch cycle search range setting apparatus and pitch cycle search apparatus |
| CN1312661C (zh) * | 2001-08-02 | 2007-04-25 | 松下电器产业株式会社 | 音调周期搜索装置、语音编码装置、和语音信号发射装置 |
| CN100354926C (zh) * | 2001-08-02 | 2007-12-12 | 松下电器产业株式会社 | 音调周期搜索装置 |
| CN100354927C (zh) * | 2001-08-02 | 2007-12-12 | 松下电器产业株式会社 | 解码自适应声源向量产生装置及其语音解码装置 |
| US7542898B2 (en) | 2001-08-02 | 2009-06-02 | Panasonic Corporation | Pitch cycle search range setting apparatus and pitch cycle search apparatus |
| JP2012163981A (ja) * | 2005-05-31 | 2012-08-30 | Microsoft Corp | オーディオコーデックポストフィルタ |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3365346B2 (ja) | 2003-01-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11721349B2 (en) | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates | |
| RU2257556C2 (ru) | Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением | |
| JP2776050B2 (ja) | 音声符号化方式 | |
| KR20070118170A (ko) | 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 | |
| CN102985966A (zh) | 音频编码器和解码器及用于音频信号的编码和解码的方法 | |
| JP3365346B2 (ja) | 音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体 | |
| JP6400801B2 (ja) | ベクトル量子化装置及びベクトル量子化方法 | |
| JPWO2008072732A1 (ja) | 音声符号化装置および音声符号化方法 | |
| JP3785363B2 (ja) | 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法 | |
| JP3552201B2 (ja) | 音声符号化方法および装置 | |
| CN104637486B (zh) | 一种数据帧的内插方法及装置 | |
| JP3024467B2 (ja) | 音声符号化装置 | |
| JP4007730B2 (ja) | 音声符号化装置、音声符号化方法および音声符号化アルゴリズムを記録したコンピュータ読み取り可能な記録媒体 | |
| JP2658438B2 (ja) | 音声符号化方法とその装置 | |
| HK40130480A (en) | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates | |
| JP3146511B2 (ja) | 音声符号化方式 | |
| HK40036813B (en) | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates | |
| HK40036813A (en) | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates | |
| JPH10105200A (ja) | 音声符号化/復号化方法 | |
| HK40011418A (en) | Method, device and computer-readable non-transitory memory for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates | |
| HK40011418B (en) | Method, device and computer-readable non-transitory memory for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates | |
| JP2002366172A (ja) | ピッチ成分を抑圧した線形予測分析方法及び線形予測分析回路 | |
| HK40104768B (en) | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates | |
| HK40104768A (en) | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates | |
| JP2003195899A (ja) | 音声/音響信号の符号化方法及び電子装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |