JPH0477800A - ベクトル量子化コードブック作成方式 - Google Patents
ベクトル量子化コードブック作成方式Info
- Publication number
- JPH0477800A JPH0477800A JP2191595A JP19159590A JPH0477800A JP H0477800 A JPH0477800 A JP H0477800A JP 2191595 A JP2191595 A JP 2191595A JP 19159590 A JP19159590 A JP 19159590A JP H0477800 A JPH0477800 A JP H0477800A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- centroid
- codebook
- distance
- weighting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、音声信号の音源信号をヘクトル量子化するた
めのコードブックを作成するベクトル量子化コードブッ
ク作成方式に関するものである。
めのコードブックを作成するベクトル量子化コードブッ
ク作成方式に関するものである。
従来、ヘクトル量子化のためのコートブ・ツクを作成す
るベクトル量子化コー)゛ブック作成の基本方式として
、Y、Linde、八、Buzo and R,t’1
.Grayによる “八n Algorithm
for Vector Quantizer D
esign(IEEE Trans、 on Comm
un、、 Vol、2B、 pp、84−951.98
0) と題した論文(文献1)に記載されているLB
G法と呼ばれる方式が知られている。
るベクトル量子化コー)゛ブック作成の基本方式として
、Y、Linde、八、Buzo and R,t’1
.Grayによる “八n Algorithm
for Vector Quantizer D
esign(IEEE Trans、 on Comm
un、、 Vol、2B、 pp、84−951.98
0) と題した論文(文献1)に記載されているLB
G法と呼ばれる方式が知られている。
[発明が解決しようとする課題〕
しかしながら従来のLBG方式では、セントロイドの具
体的な計算法は示されてはいない。距離尺度が2乗距離
の時のセントロイドは単なる重心になることは容易に判
明するが、2乗距離以外の距離尺度に対するセンドロイ
l′の具体的な計算法は明らかではなかった。特に、距
離尺度が、最適ゲインを用いた2乗距離、聴感重み付け
再生2乗距離、最適ゲインを用いた聴感重み付け再生2
乗距離の時のセントロイドの具体的な計算法は明らかで
はなかった。
体的な計算法は示されてはいない。距離尺度が2乗距離
の時のセントロイドは単なる重心になることは容易に判
明するが、2乗距離以外の距離尺度に対するセンドロイ
l′の具体的な計算法は明らかではなかった。特に、距
離尺度が、最適ゲインを用いた2乗距離、聴感重み付け
再生2乗距離、最適ゲインを用いた聴感重み付け再生2
乗距離の時のセントロイドの具体的な計算法は明らかで
はなかった。
本発明の目的は、上述した問題を解決し、音源信号をよ
り効率的にベクトル量子化するためのコードブックを作
成するベクトル量子化コードブ。
り効率的にベクトル量子化するためのコードブックを作
成するベクトル量子化コードブ。
り作成方式を提供することにある。
(課題を解決するだめの手段〕
第1の発明によるベクトル量子化コートブック作成方式
は、 1〜レーニング用の音声信号に対し線形予測分析を施し
、線形予測残差から適応コードブックまたはピッチ予測
信号を引いた残差信号とセントロイトとの聴感重み付け
再生2乗距離をクラスクリングの距離尺度とし、クラス
タ内の前記残差信号と前記セントロイドとの聴感重み付
け再生2乗距離の総和を最小にするように前記セントロ
イトを計算することによりコードブックを作成すること
を特徴とする。
は、 1〜レーニング用の音声信号に対し線形予測分析を施し
、線形予測残差から適応コードブックまたはピッチ予測
信号を引いた残差信号とセントロイトとの聴感重み付け
再生2乗距離をクラスクリングの距離尺度とし、クラス
タ内の前記残差信号と前記セントロイドとの聴感重み付
け再生2乗距離の総和を最小にするように前記セントロ
イトを計算することによりコードブックを作成すること
を特徴とする。
第2の発明によるベクトル量子化コートブック作成方式
は、 l・レーニング用の音声信号に対し線形予測分析を施し
、線形予測残差から適応コードブックまたはピッチ予測
信号を引いた残差信号と最適ゲインを掛けたセントロイ
トとの聴感重み付け再生2乗置陥(をクラスタリングの
距離尺度とし、クラスタ内の前記残差信号とクラスタリ
ング時の最適ゲインを掛けたセン)・ロイドとの2乗距
離の総和を最小にするように前記セン1ヘロイ1゛を計
算することによりコードブックを作成することを特徴と
する。
は、 l・レーニング用の音声信号に対し線形予測分析を施し
、線形予測残差から適応コードブックまたはピッチ予測
信号を引いた残差信号と最適ゲインを掛けたセントロイ
トとの聴感重み付け再生2乗置陥(をクラスタリングの
距離尺度とし、クラスタ内の前記残差信号とクラスタリ
ング時の最適ゲインを掛けたセン)・ロイドとの2乗距
離の総和を最小にするように前記セン1ヘロイ1゛を計
算することによりコードブックを作成することを特徴と
する。
第3の発明によるベクトル量子化コートブック作成方式
は、 トレーニング用の音声信号に対し線形予測分析を施し、
線形予測残差から適応コードブックまたはピンチ予測信
号を引いた残差信号と最適ゲインを掛けたセンドロイ1
′との聴感重み付け再生2乗距離をクラスタリングの距
離尺度とし、クラスタ内の前記残差信号とクラスタリン
グ時の最適ゲインを掛けたセントロイドとの聴感重み付
け再生2乗距離の総和を最小にするように前記セントロ
イドを計算することによりコードブックを作成すること
を特徴とする。
は、 トレーニング用の音声信号に対し線形予測分析を施し、
線形予測残差から適応コードブックまたはピンチ予測信
号を引いた残差信号と最適ゲインを掛けたセンドロイ1
′との聴感重み付け再生2乗距離をクラスタリングの距
離尺度とし、クラスタ内の前記残差信号とクラスタリン
グ時の最適ゲインを掛けたセントロイドとの聴感重み付
け再生2乗距離の総和を最小にするように前記セントロ
イドを計算することによりコードブックを作成すること
を特徴とする。
〔作用]
本発明によるベクトル量子化コートブック作成方式の作
用を説明する。
用を説明する。
まず、第1から第3までのどの発明も、予めトレーニン
グ用の音声信号に対し線形予測分析を施し、線形予測残
差から適応コードブックまたはピッチ予測信号を引いた
残差信号を、LGB法のトレーニングデータとする。こ
こで適応コードブックまたはピッチ予測信号を求める方
法は、Kleijn。
グ用の音声信号に対し線形予測分析を施し、線形予測残
差から適応コードブックまたはピッチ予測信号を引いた
残差信号を、LGB法のトレーニングデータとする。こ
こで適応コードブックまたはピッチ予測信号を求める方
法は、Kleijn。
Krasinski and KetchumによるI
IImproved 5peechQuality a
nd Efficient Vector Quant
ization inS E L P″ (Proc
、 ICASSP、 pp、155−158. 1
988) とにnした論文(文献2)に記されてい
る。
IImproved 5peechQuality a
nd Efficient Vector Quant
ization inS E L P″ (Proc
、 ICASSP、 pp、155−158. 1
988) とにnした論文(文献2)に記されてい
る。
LBG法でのクラスタリングの時に用いる距離尺度は、
第1の発明では、トレーニングデータとセントロイドと
の聴感重み付け再生2乗距離、を用い、第2.3の発明
では、トレーニングデータと最適ゲインを掛けたセント
ロイドとの聴感重み付け再生2乗距離、 丈 (h*x (n) −r−h*c、(n))”
(2)を用いる。ここで、Xはトレーニングデータ、h
はXに対応した線形予測フィルタの聴感重み付けインパ
ルス応答、C4はi番目のセンドロイl、γはXの聴感
重み付け再生信号に対するC3の最適ゲイン、NはI・
レーニングデータの次元である。
第1の発明では、トレーニングデータとセントロイドと
の聴感重み付け再生2乗距離、を用い、第2.3の発明
では、トレーニングデータと最適ゲインを掛けたセント
ロイドとの聴感重み付け再生2乗距離、 丈 (h*x (n) −r−h*c、(n))”
(2)を用いる。ここで、Xはトレーニングデータ、h
はXに対応した線形予測フィルタの聴感重み付けインパ
ルス応答、C4はi番目のセンドロイl、γはXの聴感
重み付け再生信号に対するC3の最適ゲイン、NはI・
レーニングデータの次元である。
このとき、h*cH(r+)は、Xに対応した適応コー
トヘクトルでh*c、(n)を直交化したものに、ゲイ
ンγはその直交化したものに対するゲインに取り替えて
もよい。ここで聴感重み付けインパルス応答は、前記文
献2に従い計算できる。
トヘクトルでh*c、(n)を直交化したものに、ゲイ
ンγはその直交化したものに対するゲインに取り替えて
もよい。ここで聴感重み付けインパルス応答は、前記文
献2に従い計算できる。
次に、第1の発明では、次式で表される歪を最小にする
ようにセントロイドを計算する。
ようにセントロイドを計算する。
・ ・ ・(3)
ただし、h”4はX”、に対応した線形予測フィルルタ
の聴感重み付けインパルス応答、Mはi番目のクラスタ
に属しているトレーニングデータの総数である。このセ
ントロイドを、具体的に求めるには、(3)式を各Ci
(k)で偏微分して、0(!:おくことにより、次の
連立方程式の解として求められる。
の聴感重み付けインパルス応答、Mはi番目のクラスタ
に属しているトレーニングデータの総数である。このセ
ントロイドを、具体的に求めるには、(3)式を各Ci
(k)で偏微分して、0(!:おくことにより、次の
連立方程式の解として求められる。
この式は、対称テープリンツ性を持っているので、高速
算法として知られているダービン・レビンソン算法を使
って求めることができる。ダービンレビンソン算法に関
しては、L、R,RabinerとR,W、 5cha
ferによる”DIGITAL PROcEssING
0FSPEECH5IGNALS” (Prent
jce−flail、 Inc、、 1978)と題し
た参考書(文献3)のChapter8を参照できる。
算法として知られているダービン・レビンソン算法を使
って求めることができる。ダービンレビンソン算法に関
しては、L、R,RabinerとR,W、 5cha
ferによる”DIGITAL PROcEssING
0FSPEECH5IGNALS” (Prent
jce−flail、 Inc、、 1978)と題し
た参考書(文献3)のChapter8を参照できる。
R”4は、h”4の自己相関関数である。つまり、Lを
インパルス応答長とすると、 ・ ・(5) また、別の解法として、(4)弐を離散フーリエ変換す
ると、 となる。ただし、F []は、離散フーリエ変換を表す
。従って、 c、(n) 求めるには、(8〕式を各c、(k)で偏微分して、0
とおくことにより、次式で求められる。
インパルス応答長とすると、 ・ ・(5) また、別の解法として、(4)弐を離散フーリエ変換す
ると、 となる。ただし、F []は、離散フーリエ変換を表す
。従って、 c、(n) 求めるには、(8〕式を各c、(k)で偏微分して、0
とおくことにより、次式で求められる。
c=(n、)
・ ・ ・(9)
第3の発明においては、次式で表される歪を最小にする
ようにセントロイドを計算する。
ようにセントロイドを計算する。
となる。F−’ []は、逆離散フーリエ変換を表す。
このようにしても、セントロイドを求めることができる
。
。
第2の発明においては、次式で表される歪を最小にする
ようにセントロイドを計算する。
ようにセントロイドを計算する。
・ ・ ・(8)
ここで、γ゛、は、X 1 、とi番目のクラスタ前の
セントロイドに対してクラスタリング時に求めた最適ゲ
インとする。このセントロイドを具体的にγ・ ・h’
J* c、(n)) 2 ただし、7 i、は、X 1 、とi番目のクラスタ前
のセントロイドに対してクラスタリング時に求めた最適
ゲインとする。このセントロイドを、具体的に求めるに
は、00)式を各C! (k)で偏微分して、0とおく
ことにより、次の連立方程式の解として求められる。
セントロイドに対してクラスタリング時に求めた最適ゲ
インとする。このセントロイドを具体的にγ・ ・h’
J* c、(n)) 2 ただし、7 i、は、X 1 、とi番目のクラスタ前
のセントロイドに対してクラスタリング時に求めた最適
ゲインとする。このセントロイドを、具体的に求めるに
は、00)式を各C! (k)で偏微分して、0とおく
ことにより、次の連立方程式の解として求められる。
・ ・ ・(11)
この式は、対称テープリッツ性を持っているので、高速
算法として知られているダービン・レビンソン算法を使
って求めることができる。
算法として知られているダービン・レビンソン算法を使
って求めることができる。
また、別の解決として、(11)弐を離散フーリエ変換
すると、 ・F [Ci] (t) ・ ・ ・02) となる。従って、求めたいセントロイドは、C1(rl
) ・F[x”j](Il、)) ・ ・ ・03) となる。このようにしても、セントロイドを求めること
ができる。
すると、 ・F [Ci] (t) ・ ・ ・02) となる。従って、求めたいセントロイドは、C1(rl
) ・F[x”j](Il、)) ・ ・ ・03) となる。このようにしても、セントロイドを求めること
ができる。
以上のようにして、コードブックを作成する。
また、こうして作成されたコードブックを用いて、符号
化を行い、そのときの適応コードブックを線形予測残差
から引いた信号をトレーニングデータとすることにより
、トレーニングを何度も繰り返し、クローズトループ学
習を行うこともできる。
化を行い、そのときの適応コードブックを線形予測残差
から引いた信号をトレーニングデータとすることにより
、トレーニングを何度も繰り返し、クローズトループ学
習を行うこともできる。
(実施例〕
第1図は本発明によるベクトル量子化ヨー1−フック作
成方弐の一実施例を示すフローチャートである。
成方弐の一実施例を示すフローチャートである。
トレーニング用の音声信号に対し線形予測分析を施し、
線形予測残差から適応コードブックまたはピッチ予測信
号を引いた残差信号をトレーニングデータとして入力す
る(ステップSl)。
線形予測残差から適応コードブックまたはピッチ予測信
号を引いた残差信号をトレーニングデータとして入力す
る(ステップSl)。
初期設定(ステップS2)では、最初のセントロイドを
トレーニングデータの重心とする。
トレーニングデータの重心とする。
スプリッティング(ステップS3)では、セントロイド
の各成分にある値を足すことと、引くことによりセント
ロイドを2倍に増やす。
の各成分にある値を足すことと、引くことによりセント
ロイドを2倍に増やす。
クラスタリング(ステップS4)では、第1の発明に対
しては(1)式、第2,3の発明に対しては(2)式で
表された距離尺度によりトレーニングデータをクラスタ
に分割する。
しては(1)式、第2,3の発明に対しては(2)式で
表された距離尺度によりトレーニングデータをクラスタ
に分割する。
歪み計算(ステップS5)では、各クラスタでの歪みを
、第1の発明に対しては(1)式、第2,3の発明に対
しては(2)弐で表された距離尺度により計算し、合計
する。ここで各クラスタでの歪みとは、各クラスタ内で
の全トレーニングデータとそのクラスタのセントロイド
との距離の総和のことである。
、第1の発明に対しては(1)式、第2,3の発明に対
しては(2)弐で表された距離尺度により計算し、合計
する。ここで各クラスタでの歪みとは、各クラスタ内で
の全トレーニングデータとそのクラスタのセントロイド
との距離の総和のことである。
収束判定(ステップS6)では、現歪みと前歪みとの比
を計算し、定められた値より小さくなればビット数判定
を、小さくならなければセントロイド計算を行う。
を計算し、定められた値より小さくなればビット数判定
を、小さくならなければセントロイド計算を行う。
セントロイド計算(ステップS7)では、各クラスタの
セントロイドを、第1の発明に対しては(4)式の解を
ダービン・レビンソン算法あるいは(6)。
セントロイドを、第1の発明に対しては(4)式の解を
ダービン・レビンソン算法あるいは(6)。
(7)式により求め、第2の発明に対しては(9)式よ
り求め、第3の発明に対しては(II)式の解をダービ
ン・レビンソン算法あるいは02)、 03)弐により
求め、クラスタリングに戻る。
り求め、第3の発明に対しては(II)式の解をダービ
ン・レビンソン算法あるいは02)、 03)弐により
求め、クラスタリングに戻る。
ビット数判定(ステップS8)では、定められたビット
数に達しているかどうかを判定し、達していなければス
プリッティングに戻り、達していれば終了する。
数に達しているかどうかを判定し、達していなければス
プリッティングに戻り、達していれば終了する。
第2図は、トレーニングデータ作成の一例を示す装置ブ
ロック図である。
ロック図である。
入力端子100より音声信号を入力し、1フレ一ム分(
例えば20m5 )の音声信号をLPC分析器110と
サブフレーム分割器120へ送る。
例えば20m5 )の音声信号をLPC分析器110と
サブフレーム分割器120へ送る。
LPC分析器110はLPC分析を行い、LPGバラメ
ークを逆フィルタ130と重み付けフィルタ140と適
応コードブック器150へ出力する。
ークを逆フィルタ130と重み付けフィルタ140と適
応コードブック器150へ出力する。
サブフレーム分割器120は、入力した1フレ一ム分の
音声信号を4つのサブフレームに分割し、逆フィルタ1
30と重み付けフィルタ140へ出力する。
音声信号を4つのサブフレームに分割し、逆フィルタ1
30と重み付けフィルタ140へ出力する。
逆フィルタ130は、LPG分析器110からLPCパ
ラメータを、サブフレーム分割5120から音声信号を
入力し、線形予測残差を出力する。
ラメータを、サブフレーム分割5120から音声信号を
入力し、線形予測残差を出力する。
重み付けフィルタ140は、LPC分析器110がらL
PGパラメータを、サブフレーム分割器120から音声
信号を入力し、聴感重み付けを行う。
PGパラメータを、サブフレーム分割器120から音声
信号を入力し、聴感重み付けを行う。
適応コードブック器150は、逆フィルタ130から入
力した線形予測残差を用いて適応コードブ・ンクを作り
、LPG分析器110から入力したL P Gパラメー
タによって聴感重み付け再生をし、重み付けフィルタ1
40から入力した聴感重み(=jけ音声信号と最適ゲイ
ンをかけた適応コートヘクトルの聴感重み付け再生信号
との2乗距離が最小となる適応コードベクトルを探索し
、その適応コードヘクトルに最適ゲインをかけた信号を
出力する。
力した線形予測残差を用いて適応コードブ・ンクを作り
、LPG分析器110から入力したL P Gパラメー
タによって聴感重み付け再生をし、重み付けフィルタ1
40から入力した聴感重み(=jけ音声信号と最適ゲイ
ンをかけた適応コートヘクトルの聴感重み付け再生信号
との2乗距離が最小となる適応コードベクトルを探索し
、その適応コードヘクトルに最適ゲインをかけた信号を
出力する。
減算器155は、逆フィルタ130の出力から適応コー
ドブック器150の出力を減算した信号を出力端子16
0へ出力する。
ドブック器150の出力を減算した信号を出力端子16
0へ出力する。
第3図は、クローズトループ学習法の場合のトレーニン
グデータ作成の一例を示す装置ブロック図である。
グデータ作成の一例を示す装置ブロック図である。
入力端子170より音声信号を入力し、1フレ一ム分(
例えば20m5 )の音声信号をL P C分析器19
0とサブフレーム分割器180へ送る。
例えば20m5 )の音声信号をL P C分析器19
0とサブフレーム分割器180へ送る。
L P C分析器190はI−P C分析を行い、i−
p cパラメータを重み付けフィルタ200.影響信Σ
減算器210.適応コードブンク器2203重み付け再
任。
p cパラメータを重み付けフィルタ200.影響信Σ
減算器210.適応コードブンク器2203重み付け再
任。
フィルタ230.音源コードブ・7982405重み付
け再生フィルタ250.逆フィルタ260へ出力する。
け再生フィルタ250.逆フィルタ260へ出力する。
サブフレーム分割器180は、入力した1フレ一ム分の
音声信号を4つのサブフレームに分割し、重み付けフィ
ルタ200へ出力する。
音声信号を4つのサブフレームに分割し、重み付けフィ
ルタ200へ出力する。
重み付けフィルタ200は、L P C分析器190か
らLPCパラメータを、サブフレーム分割hsxg。
らLPCパラメータを、サブフレーム分割hsxg。
から音声信号を入力し、重み付け再生フィルタ250か
ら入力した前サブフレームの終わりのLPG次数分の重
み付け再生信号を初期値として聴感重み付けを行う。
ら入力した前サブフレームの終わりのLPG次数分の重
み付け再生信号を初期値として聴感重み付けを行う。
影響信号減算器210は、重み付けフィルタ200から
入力した重み付け信号から、重み付け再生フィルタ25
0から入力した前サブフレームの終わりのLPG次数分
の重み付け再生信号による影啓信号を減算する。
入力した重み付け信号から、重み付け再生フィルタ25
0から入力した前サブフレームの終わりのLPG次数分
の重み付け再生信号による影啓信号を減算する。
適応コードブック器220は、過去の音源信号を用いて
適応コードブックを作り、影響信号減算器210から入
力した信号と最適ゲインをかけた適応コードブックトル
の聴感重み付け再生信号との2乗距離が最小となる適応
コードヘクトルを探索し、その適応コードベクトルに最
適ゲインをかけた信号を出力する。
適応コードブックを作り、影響信号減算器210から入
力した信号と最適ゲインをかけた適応コードブックトル
の聴感重み付け再生信号との2乗距離が最小となる適応
コードヘクトルを探索し、その適応コードベクトルに最
適ゲインをかけた信号を出力する。
重み付け再生フィルタ230は、適応コードブ・ツク器
220から人力した信号を聴感重み付け再生する。
220から人力した信号を聴感重み付け再生する。
減算器235は、影響信号減算器210の出力から重み
付け再生フィルタ230の出力を減算する。
付け再生フィルタ230の出力を減算する。
音源コードブック器240は、減算した信号を人力し、
その入力信号と最適ゲインをかけた音源コードブックの
聴感重み付け再生信号との2乗距離が最小となる音源コ
ードベクトルを探索し、その音源コードベクトルに最適
ゲインをかけた信号を出力する。
その入力信号と最適ゲインをかけた音源コードブックの
聴感重み付け再生信号との2乗距離が最小となる音源コ
ードベクトルを探索し、その音源コードベクトルに最適
ゲインをかけた信号を出力する。
加算器245は、適応コードブ・ツク器220の出力と
音源コードブック器240の出力の和を重み付け再生フ
ィルタ250へ出力する。
音源コードブック器240の出力の和を重み付け再生フ
ィルタ250へ出力する。
重み付け再生フィルタ250は、その入力信号の聴感重
み付け再生信号を重み付けフィルタ200と影響信号減
算器210へ出力する。
み付け再生信号を重み付けフィルタ200と影響信号減
算器210へ出力する。
逆フィルタ260は、減算器235の出力を入力し、そ
の入力信号の重み付けられたL P G係数による線形
予測残差を出力端子270へ出力する。
の入力信号の重み付けられたL P G係数による線形
予測残差を出力端子270へ出力する。
以上述べたように、本発明によれば、距離尺度として最
適ゲインを用いた2乗距離、あるいは聴感重み付け再生
2乗距離、あるいは最適ゲインを用いた聴感重み付け再
生2乗距離を用いたLBG法によって音源信号のコード
ブックを作成するので、通常の2乗距離を用いたり、
B G法によって作成されたコードブックに比べ、同し
コードブ・ツクサイズでより良好な音声が得られるとい
う大きな効果がある。
適ゲインを用いた2乗距離、あるいは聴感重み付け再生
2乗距離、あるいは最適ゲインを用いた聴感重み付け再
生2乗距離を用いたLBG法によって音源信号のコード
ブックを作成するので、通常の2乗距離を用いたり、
B G法によって作成されたコードブックに比べ、同し
コードブ・ツクサイズでより良好な音声が得られるとい
う大きな効果がある。
第1図は、本発明によるヘクトル量子化コードブック作
成方式の一実施例を示すブローチ+−1−1第2図は、
トレーニングデータ作成の一例を示ず装置ブ【コック図
、 第3図は、クローズトループ学習法の場合のトレーニン
グデータ作成の一例を示す装置ブロック図である。 110 ・ ・ ・ ・ ・ L P C分羊斤
器120 ・・・・・サブフレーム分割器130
・ ・ ・ ・ ・逆フィルタ140 ・・・・・重
み付けフィルタ150 ・ ・・ ・ ・適応コード
ブック器180 ・・・・・サブフレーム分割器19
0 ・・・・・LPC分析器 200 ・・・・・重み付けフィルタ210 ・・
・・・影口信号減算器 220 ・ ・ ・ ・ ・適応コートブック器23
0 ・・・・・重み付け再生フィルタ240 ・
・ ・ ・ ・音源コードブック器250 ・・・・
・重み付け再生フィルタ260 ・・・・・逆フィル
タ 代理人 弁理士 岩 佐 義 幸 Cフ ーゴ しゝ−〇
成方式の一実施例を示すブローチ+−1−1第2図は、
トレーニングデータ作成の一例を示ず装置ブ【コック図
、 第3図は、クローズトループ学習法の場合のトレーニン
グデータ作成の一例を示す装置ブロック図である。 110 ・ ・ ・ ・ ・ L P C分羊斤
器120 ・・・・・サブフレーム分割器130
・ ・ ・ ・ ・逆フィルタ140 ・・・・・重
み付けフィルタ150 ・ ・・ ・ ・適応コード
ブック器180 ・・・・・サブフレーム分割器19
0 ・・・・・LPC分析器 200 ・・・・・重み付けフィルタ210 ・・
・・・影口信号減算器 220 ・ ・ ・ ・ ・適応コートブック器23
0 ・・・・・重み付け再生フィルタ240 ・
・ ・ ・ ・音源コードブック器250 ・・・・
・重み付け再生フィルタ260 ・・・・・逆フィル
タ 代理人 弁理士 岩 佐 義 幸 Cフ ーゴ しゝ−〇
Claims (3)
- (1)トレーニング用の音声信号に対し線形予測分析を
施し、線形予測残差から適応コードブックまたはピッチ
予測信号を引いた残差信号とセントロイドとの聴感重み
付け再生2乗距離をクラスタリングの距離尺度とし、ク
ラスタ内の前記残差信号と前記セントロイドとの聴感重
み付け再生2乗距離の総和を最小にするように前記セン
トロイドを計算することによりコードブックを作成する
ことを特徴とするベクトル量子化コードブック作成方式
。 - (2)トレーニング用の音声信号に対し線形予測分析を
施し、線形予測残差から適応コードブックまたはピッチ
予測信号を引いた残差信号と最適ゲインを掛けたセント
ロイドとの聴感重み付け再生2乗距離をクラスタリング
の距離尺度とし、クラスタ内の前記残差信号とクラスタ
リング時の最適ゲインを掛けたセントロイドとの2乗距
離の総和を最小にするように前記セントロイドを計算す
ることによりコードブックを作成することを特徴とする
ベクトル量子化コードブック作成方式。 - (3)トレーニング用の音声信号に対し線形予測分析を
施し、線形予測残差から適応コードブックまたはピッチ
予測信号を引いた残差信号と最適ゲインを掛けたセント
ロイドとの聴感重み付け再生2乗距離をクラスタリング
の距離尺度とし、クラスタ内の前記残差信号とクラスタ
リング時の最適ゲインを掛けたセントロイドとの聴感重
み付け再生2乗距離の総和を最小にするように前記セン
トロイドを計算することによりコードブックを作成する
ことを特徴とするベクトル量子化コードブック作成方式
。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2191595A JPH0477800A (ja) | 1990-07-19 | 1990-07-19 | ベクトル量子化コードブック作成方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2191595A JPH0477800A (ja) | 1990-07-19 | 1990-07-19 | ベクトル量子化コードブック作成方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0477800A true JPH0477800A (ja) | 1992-03-11 |
Family
ID=16277254
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2191595A Pending JPH0477800A (ja) | 1990-07-19 | 1990-07-19 | ベクトル量子化コードブック作成方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0477800A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6246979B1 (en) * | 1997-07-10 | 2001-06-12 | Grundig Ag | Method for voice signal coding and/or decoding by means of a long term prediction and a multipulse excitation signal |
-
1990
- 1990-07-19 JP JP2191595A patent/JPH0477800A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6246979B1 (en) * | 1997-07-10 | 2001-06-12 | Grundig Ag | Method for voice signal coding and/or decoding by means of a long term prediction and a multipulse excitation signal |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2369917C2 (ru) | Способы улучшения характеристик многоканальной реконструкции на основе прогнозирования | |
| JPH11249699A (ja) | 音声パラメータの合同量子化 | |
| JP2002526798A (ja) | 複数チャネル信号の符号化及び復号化 | |
| CN119096296A (zh) | 声码器技术 | |
| US7792672B2 (en) | Method and system for the quick conversion of a voice signal | |
| JP4180677B2 (ja) | 音声符号化並びに復号化方法及びその装置 | |
| CN119152863A (zh) | 基于神经网络的音频编解码方法、装置、设备及存储介质 | |
| EP1995723B1 (en) | Neuroevolution training system | |
| JP3248215B2 (ja) | 音声符号化装置 | |
| CN113096685A (zh) | 音频处理方法及装置 | |
| JP2970407B2 (ja) | 音声の励振信号符号化装置 | |
| JP2002123298A (ja) | 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体 | |
| JP3179291B2 (ja) | 音声符号化装置 | |
| JPH0477800A (ja) | ベクトル量子化コードブック作成方式 | |
| DE69624207T2 (de) | Sprachkodierer mit Vorrichtung zur Abschätzung der Abweichung des Leistungsverlaufs eines synthetischen Signals von einem Eingangssignal | |
| JP2008519308A5 (ja) | ||
| CN112447165B (zh) | 信息处理、模型训练和构建方法、电子设备、智能音箱 | |
| JP3192051B2 (ja) | 音声符号化装置 | |
| JP3089967B2 (ja) | 音声符号化装置 | |
| CN115440186B (zh) | 一种音频特征信息生成方法、装置、设备和存储介质 | |
| JP3102017B2 (ja) | 音声符号化方法 | |
| JP2946528B2 (ja) | 音声符号化復号化方法及びその装置 | |
| Kim et al. | A preprocessor for low-bit-rate speech coding | |
| JPH05232994A (ja) | 統計コードブック | |
| Söderberg | Optimization of the FARGAN Model for Speech Compression: Exploring Different Frame Partitions |