JPH02250100A - 音声符合化装置 - Google Patents
音声符合化装置Info
- Publication number
- JPH02250100A JPH02250100A JP1070399A JP7039989A JPH02250100A JP H02250100 A JPH02250100 A JP H02250100A JP 1070399 A JP1070399 A JP 1070399A JP 7039989 A JP7039989 A JP 7039989A JP H02250100 A JPH02250100 A JP H02250100A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- sound source
- distortion
- calculation
- vectors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Analogue/Digital Conversion (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
この発明は、音声信号を情報圧縮し、ディジタル伝送、
または蓄積を行う音声符号化装置に関するものである。
または蓄積を行う音声符号化装置に関するものである。
音声信号を合成フィルタを表すパラメータと音源を表す
パラメータとに分離することで情報圧縮を行う音声符号
化方式の中に、コード−エキサイテツド リニア プレ
ディクション(Code−Exci tedljnea
r Prediction、以下CELPという)があ
る。 このCELPの一例としては、エム、アール。 シュローダ、ビー、ニス、アタル、″コードーエキサイ
テツド リニア プレディクション(シーイーエルピー
):ハイクラオリティー スピーチアット ベリー ロ
ー ビット レイク”、プロシーデインゲス アイイー
イーイー インターナショナル コンファレンス オン
アクスティックス、スピーチ、アンド シグナル プ
ロセッシング(M、R,5chroeder、 B、S
、Atal、 ”Code−ExcitedLine
ar Prediction(CE L P):
旧gh−qua1+tyspeech at very
10%1 bit rates”、Proceedi
ngsIEEIl! International
Conference on Acoustics。 5peech、and Signal Proces
sing)、pp、937−940(1985)があり
、合成フィルタを表すパラメータを10m5ec毎に分
析により求め、一方40点(サンプリング周波数が13
kHzのときは5m)毎に区切られた音声に時間対応し
た音源を表すパラメータとして、乱数により生成した4
0点の雑音の時系列。 すなわち40次元のベクトル(以下、音源ベクトルとい
う)を用いている。 上記引例で行っている音声符号化を、周波数領域で行う
装置として、アイ、エム、トランコッソ。 ビー、ニス、アタル、“エフィシェント′ ブロシージ
ャーズ フォー ファインディング ジオブティマム
イノベイジョン イン ストカスティック コーダーズ
”、ブロシーデインダスアイイーイーイー インターナ
ショナル コンファレンス オン アクスティックス、
スピーチ。 アンド シグナル プロセッシング(1,M、Tran
coso+B、S、Atal、 ”Efficien
t procedures for findingt
he optia+um 1nnovation in
5tochastic coders+Procee
dings IEEE International
Conference onAcoustics、
5peech and Signal Process
ing)+I)I)、2375−2378(1986)
に示された音声符号化装置がある(第3図)。 図において、3は3点のサンプリング値系列である音源
ベクトルを2・N点離散フーリエ変換(以下DFTとい
う)して得られるN次元のDFT音源ベクトル、1はL
個のDFT音源ベクトルから構成される符号帳、5は前
記符号帳1に格納されるDFT音源ベクトル3を選択す
る切換スイッチ、15は前記DF’T音源ベクトル3及
び合成フィルタのインパルス応答を2・N点DFTして
得られる周波数特性(以下、評価重みフィルタという)
の振幅項の2乗値16 (以下、2乗評価重みという)
から歪計算の分母項17を出力する分母項計算回路、8
は前記DFT音源ベクトル3及び3点のサンプリング値
系列である入力音声を2・N点DFTしたものの共役複
素数と評価重みフィルタとの積(以下、重み付きDFT
入力音声7という)を入力し、歪計算の分子項ベクトル
積和1゜を出力するベクトル積和演算回路、12は前記
分子項ベクトル積和10及び分母項17から周波数領域
における再生音声と入力音声の歪量18を計算する歪量
最終計算回路、19は前記歪量18のうち最小値の音源
ベクトルに対応する音源ベクトルコード20を選択する
最適音源ベクトル選択回路、Aは歪量計算手段である。 次に動作について第4図のフローチャートを用いて説明
する。 符号帳1のL個のDFT音源ベクトル3のうちに番目を
用いた場合の歪量18は、X (i)をDFT入力音声
のi番目の成分、 H(i)を評価重みフィルタのi番
目の成分、 C(i、k)をに番目のDFT音源ベクト
ルのi番目の成分、 g (k)を歪量E (k)を
最小化する利得係数とする一般にであることが知られて
いる。 まず、ベクトル積和演算回路8は、DFT音源ベクトル
C(i、k)と重み付きDFT入力音声Y (i)を入
力し、分子項ベクトル積和P (k)を出力する(ステ
ップ5TI)。ここで、Y (i)”はY(i)の共役
複素数を表わし、Y (i)はY(i)= X (i)
・H(i)なる関係を満たしている。また、記号R
e、は複素数の実数部、In、は複素数の虚数部を表す
ものとする。 分母項計算回路15はDFT音源ベクトルC(ik)と
2乗評価重みa(i)”を入力し、分母項17Ea(i
)2・I C(i、k) l” −(3)を出力す
る(ステップ5T2)。ここで、a(i)2、は評価重
みフィルタH(i)の2乗値であるから、a (i)”
= l H(i) l ”の関係を満たす。 次に最終歪量計算回路12は、第2式で表される分子項
ベクトル積和P (k)と第3式で表される分母項17
を入力して、歪量E (k)を出力する(ステップ5T
3)。ここで、第4式は第1式の歪量E (k)を最小
とする利得係数g (k)を選ぶことで得られ、第4式
と等価であることは承知である。 さらに、前記最終歪量計算回路12では、L個のDFT
音源ベクトル3すべてについて歪量18を計算すると(
ステップ5T4) 、最適音源ベクトル選択回路19に
より、L個の歪量18の内、最小値を与えるDFT音源
ベクトルの番号を最適音源ベクトルコード20として選
択する(ステップ5T5)。
パラメータとに分離することで情報圧縮を行う音声符号
化方式の中に、コード−エキサイテツド リニア プレ
ディクション(Code−Exci tedljnea
r Prediction、以下CELPという)があ
る。 このCELPの一例としては、エム、アール。 シュローダ、ビー、ニス、アタル、″コードーエキサイ
テツド リニア プレディクション(シーイーエルピー
):ハイクラオリティー スピーチアット ベリー ロ
ー ビット レイク”、プロシーデインゲス アイイー
イーイー インターナショナル コンファレンス オン
アクスティックス、スピーチ、アンド シグナル プ
ロセッシング(M、R,5chroeder、 B、S
、Atal、 ”Code−ExcitedLine
ar Prediction(CE L P):
旧gh−qua1+tyspeech at very
10%1 bit rates”、Proceedi
ngsIEEIl! International
Conference on Acoustics。 5peech、and Signal Proces
sing)、pp、937−940(1985)があり
、合成フィルタを表すパラメータを10m5ec毎に分
析により求め、一方40点(サンプリング周波数が13
kHzのときは5m)毎に区切られた音声に時間対応し
た音源を表すパラメータとして、乱数により生成した4
0点の雑音の時系列。 すなわち40次元のベクトル(以下、音源ベクトルとい
う)を用いている。 上記引例で行っている音声符号化を、周波数領域で行う
装置として、アイ、エム、トランコッソ。 ビー、ニス、アタル、“エフィシェント′ ブロシージ
ャーズ フォー ファインディング ジオブティマム
イノベイジョン イン ストカスティック コーダーズ
”、ブロシーデインダスアイイーイーイー インターナ
ショナル コンファレンス オン アクスティックス、
スピーチ。 アンド シグナル プロセッシング(1,M、Tran
coso+B、S、Atal、 ”Efficien
t procedures for findingt
he optia+um 1nnovation in
5tochastic coders+Procee
dings IEEE International
Conference onAcoustics、
5peech and Signal Process
ing)+I)I)、2375−2378(1986)
に示された音声符号化装置がある(第3図)。 図において、3は3点のサンプリング値系列である音源
ベクトルを2・N点離散フーリエ変換(以下DFTとい
う)して得られるN次元のDFT音源ベクトル、1はL
個のDFT音源ベクトルから構成される符号帳、5は前
記符号帳1に格納されるDFT音源ベクトル3を選択す
る切換スイッチ、15は前記DF’T音源ベクトル3及
び合成フィルタのインパルス応答を2・N点DFTして
得られる周波数特性(以下、評価重みフィルタという)
の振幅項の2乗値16 (以下、2乗評価重みという)
から歪計算の分母項17を出力する分母項計算回路、8
は前記DFT音源ベクトル3及び3点のサンプリング値
系列である入力音声を2・N点DFTしたものの共役複
素数と評価重みフィルタとの積(以下、重み付きDFT
入力音声7という)を入力し、歪計算の分子項ベクトル
積和1゜を出力するベクトル積和演算回路、12は前記
分子項ベクトル積和10及び分母項17から周波数領域
における再生音声と入力音声の歪量18を計算する歪量
最終計算回路、19は前記歪量18のうち最小値の音源
ベクトルに対応する音源ベクトルコード20を選択する
最適音源ベクトル選択回路、Aは歪量計算手段である。 次に動作について第4図のフローチャートを用いて説明
する。 符号帳1のL個のDFT音源ベクトル3のうちに番目を
用いた場合の歪量18は、X (i)をDFT入力音声
のi番目の成分、 H(i)を評価重みフィルタのi番
目の成分、 C(i、k)をに番目のDFT音源ベクト
ルのi番目の成分、 g (k)を歪量E (k)を
最小化する利得係数とする一般にであることが知られて
いる。 まず、ベクトル積和演算回路8は、DFT音源ベクトル
C(i、k)と重み付きDFT入力音声Y (i)を入
力し、分子項ベクトル積和P (k)を出力する(ステ
ップ5TI)。ここで、Y (i)”はY(i)の共役
複素数を表わし、Y (i)はY(i)= X (i)
・H(i)なる関係を満たしている。また、記号R
e、は複素数の実数部、In、は複素数の虚数部を表す
ものとする。 分母項計算回路15はDFT音源ベクトルC(ik)と
2乗評価重みa(i)”を入力し、分母項17Ea(i
)2・I C(i、k) l” −(3)を出力す
る(ステップ5T2)。ここで、a(i)2、は評価重
みフィルタH(i)の2乗値であるから、a (i)”
= l H(i) l ”の関係を満たす。 次に最終歪量計算回路12は、第2式で表される分子項
ベクトル積和P (k)と第3式で表される分母項17
を入力して、歪量E (k)を出力する(ステップ5T
3)。ここで、第4式は第1式の歪量E (k)を最小
とする利得係数g (k)を選ぶことで得られ、第4式
と等価であることは承知である。 さらに、前記最終歪量計算回路12では、L個のDFT
音源ベクトル3すべてについて歪量18を計算すると(
ステップ5T4) 、最適音源ベクトル選択回路19に
より、L個の歪量18の内、最小値を与えるDFT音源
ベクトルの番号を最適音源ベクトルコード20として選
択する(ステップ5T5)。
従来の音声符号化装置は以上のように構成されているの
で、L個の歪量を計算するために、ベクトル積和演算回
路の中でL個の分子項ベクトル積和の計算を行うが、十
分な品質(再生音声にノイズ等を含まない)で音声を符
号化するためにはLを大きくとる(例えばL=1024
)必要がある。 Lを大きくとると、この歪量計算に要する演算量が莫大
となり、同時に符号帳に要するメモリ量も莫大となるた
め、装置化した場合の装置規模が非常に大きくなるとい
う課題があった。 この発明は上記のような課題を解消するためになされた
もので、歪量計算に要する演算量を小さくするとともに
小規模な音声符号化装置を得ることを目的としている。
で、L個の歪量を計算するために、ベクトル積和演算回
路の中でL個の分子項ベクトル積和の計算を行うが、十
分な品質(再生音声にノイズ等を含まない)で音声を符
号化するためにはLを大きくとる(例えばL=1024
)必要がある。 Lを大きくとると、この歪量計算に要する演算量が莫大
となり、同時に符号帳に要するメモリ量も莫大となるた
め、装置化した場合の装置規模が非常に大きくなるとい
う課題があった。 この発明は上記のような課題を解消するためになされた
もので、歪量計算に要する演算量を小さくするとともに
小規模な音声符号化装置を得ることを目的としている。
この発明に係る音声符号化装置は、符号帳から抽出した
複数の縮小符号帳と、この複数の縮小符号帳からそれぞ
れ選択された音源ベクトルを加算して1個の音源ベクト
ルを生成するベクトル加算器と、このベクトル加算器で
生成された音源ベクトルと、前記複数の縮小符号帳から
それぞれ選択された音源ベクトルから歪量を計算する歪
量計算手段を備えるようにしたものである。
複数の縮小符号帳と、この複数の縮小符号帳からそれぞ
れ選択された音源ベクトルを加算して1個の音源ベクト
ルを生成するベクトル加算器と、このベクトル加算器で
生成された音源ベクトルと、前記複数の縮小符号帳から
それぞれ選択された音源ベクトルから歪量を計算する歪
量計算手段を備えるようにしたものである。
この発明におけるベクトル加算器は、複数の縮小符号帳
からそれぞれ選択された音源ベクトルを加算して1個の
音源ベクトルを生成し、歪量計算手段は前記ベクトル加
算器により生成された音源ベクトルと複数の縮小符号帳
からそれぞれ選択された音源ベクトルから歪量を計算す
る。
からそれぞれ選択された音源ベクトルを加算して1個の
音源ベクトルを生成し、歪量計算手段は前記ベクトル加
算器により生成された音源ベクトルと複数の縮小符号帳
からそれぞれ選択された音源ベクトルから歪量を計算す
る。
以下、この発明の一実施例を図について説明する。第1
図は縮小符号帳を2個備えた周波数領域における音声符
号化装置の構成を示すブロック図であり、従来の周波数
領域における音声符号化装置(第3図)と同一部分には
同一符号を付して説明を省略する。 図において、2a、2bはM個(ただしL−=M”)の
DFT音源ベクトルから構成される第1及び第2の縮小
符号帳、4a、4bは前記第1及び第2の縮小符号帳2
a、2bに格納されている第1及び第2のDFT音源ベ
クトル、5a、5bは前記第1及び第2の符号帳2a、
2bからそれぞれ第1・及び第2のDFT音源ベクトル
4a、4bを選択する第1及び第2の切換スイッチ、9
a、9bは前記第1及び第2のDFT音源ベクトル4a
。 4bをそれぞれ入力し、重み付きDFT人力音声7との
分子項ベクトル積和をそれぞれ出力する第1及び第2の
ベクトル積和演算回路、13は前記第1及び第2のDF
T音源ベクトルを加算して、1個のDFT音源ベクトル
14を生成するベクトル加算器である。 次に第2図のフローチャートを用いて動作を説明する。 まず、第1の縮小符号帳のに1番目及び第2の縮小符号
帳のに2番目のそれぞれの第1のDFT音源ベクトル及
び第2のDFT音源ベクトルを用いた場合、A (t、
に、)をに0番目の第1のDFT音源ベクトルのi番目
成分、B (i、kz)をに2番目の第2のDFT音源
ベクトルのi番目成分とし、以下使用するパラメータは
従来技術の説明でのパラメータと同一であり、説明を省
略する。 第1及び第2の切換スイッチ6a、6bにより選択され
た第1のDFT音源ベクトルA(i、kg)と第2のD
FT音源ベクトルB(i、kt)は、それぞれ第1のベ
クトル積和演算回路9aにより第2式と同様に第1の分
子項ベクトル積和p’(kI)をM個当力しくステップ
ST6,5T7) 、第2のベクトル積和演算回路9b
により第2式と同様に第2の分子項ベクトルq’(kz
) をM個当力する(ステップST8,5T9)。 ベクトル加算器13は前記第1のDFT音源ベクトルA
(i、に+)と第2のDFT音源ベクトルB (t、
kz)を加算し、1個のDFT音源ベクトルC’
(i、 k) C”(i 、 k) = A (i 、 kυ 十〇
(tlkg) ・・・ (7)回につきに2をM回
度化させるため1からLまでのL個与えられることにな
り、よってC’ (i+ k)はL個生成される。さ
らに分母項計算回路15は前記1個のDFT音源ベクト
ルC”(i、 k)から第3式と同様に分母項17 Ea(i)” Ic’(i、k) l” −(8)
を出力する(ステップ5TII)。最終歪量計算回路1
2は前記第1の分子項ベクトル積和p’(kI)、第2
の分子項ベクトル積和u’(kz)、及び分母項17か
ら第4式と同様に歪量E (k)を出力する(ステップ
5T12)。ここで、第4式の分子項ベクトル積和は、
第7式の関係よりを生成する(ステップ5TIO)。k
は、kI 1から得られる。 上記の計算により歪量E (k)がL個すべて得られる
と(ステップ5T13)、最適音源ベクトル選択回路1
9により、L個の歪量18の内、最小値を与えるDFT
音源ベクトルの番号を最適音源ベクトルコード20とし
て選択する(ステップ5T14)。 この発明の特徴は、第4式の第2項分子全体に必要な演
算量が大幅に削減できる点であり、従来技術による第2
式のL回のベクトル積和演算が、この発明の第5及び第
6式による2F口(L=M2より)回のベクトル積和演
算と、第9式の第2項分子のE「回のスカラー値加算に
なることで演算量が削減される。 次に、演算量について比較を行う。まず、従来技術につ
いて述べる。 ベクトル積和演算回路8の第2式の計算は、実際には次
の第10式のように、また、分母項計算回路15の第3
式の計算は、次の第11式のように計算される。 Im、 (C(f、k))) このときに必要な演算量は第10式では、乗算が2・L
−N回、加減算が2・L−N回であり、第11式では、
乗算が3・L−N回、加算が2・L−N回である。そし
て、歪量最終計算回路12では、第4式の第2項の2乗
のための乗算をL回。 そして、除算をL回行う。なお、第4式の第1項はkに
関係なく一定であるので、最適音源ベクトルの選択には
関係ないので計算は行わない。ここで、1回の乗算に要
する演算量をp、1回の加減算に要する演算量を(1,
1回の除算に要する演算量をrとすると、第4式の第2
頂金体に必要な演算量は、(5・L−N+L) ・p
+4・L−N・q+L−rである。 次にこの発明の場合について述べる。2つのベクトル積
和演算回路9a、9bの第5式および第6式の計算は、
実際には次の第12式、第13式のように、また、ベク
トル加算器13および分母項計算回路15の第7式、第
8式の計算は、次の第14式のように計算される。 1m、(A(i、に+))) 木 口゛(kz)=Σ (Re、(Y(i) )ネ ・Re、 (B(i、kz)) −1m、 (Y(i)
) ・1m、 (B(i、kz)) 1 このときに必要な演算量は、第12及び第13式では乗
算が4・[・N回、加減算が4・fr・N回であり、第
14弐では、乗算が3・L−N回、加算が4・L−N回
であり、歪量最終計算回路12では分子項ベクトル積和
と第2の分子項ベクトル積和との和のための加算がL回
、2乗のための乗算がL回、そして、除算がL回である
。よって、第9式の第2頂金体に必要な演算量は、(4
・匡・N+3・L−N+L) ・p+(4・[−・N
+4・L−N+L)・q+L−rである。 従って、Lが次式を満たし、かつ、ある整数の2乗であ
るとき、 L〉16・N2 ・ (p+q)/ (2・N−p−q
)2となり、この発明により演算量の削減が図れる。 なお、上記実施例では、2つの符号帳内の音源ベクトル
数が等しい場合について述べたが、これが等しくない場
合で実現してもよい。 また、上記実施例では、ベクトル加算器によりDFT加
算音源ベクトルを作成したが、これを符号帳内に持って
いてもよく、その場合は第7式の演算が不要となり、−
層の演算量削減が可能となる。 また、上記実施例では、周波数領域での装置について説
明したが、ウオルシュアダマール変換領域も、また特異
値分解を用いる方法でも実現できる。さらに、上記実施
例では2個の縮小符号帳を用いたが、2個以上の符号帳
を用いても同様の効果を奏する。
図は縮小符号帳を2個備えた周波数領域における音声符
号化装置の構成を示すブロック図であり、従来の周波数
領域における音声符号化装置(第3図)と同一部分には
同一符号を付して説明を省略する。 図において、2a、2bはM個(ただしL−=M”)の
DFT音源ベクトルから構成される第1及び第2の縮小
符号帳、4a、4bは前記第1及び第2の縮小符号帳2
a、2bに格納されている第1及び第2のDFT音源ベ
クトル、5a、5bは前記第1及び第2の符号帳2a、
2bからそれぞれ第1・及び第2のDFT音源ベクトル
4a、4bを選択する第1及び第2の切換スイッチ、9
a、9bは前記第1及び第2のDFT音源ベクトル4a
。 4bをそれぞれ入力し、重み付きDFT人力音声7との
分子項ベクトル積和をそれぞれ出力する第1及び第2の
ベクトル積和演算回路、13は前記第1及び第2のDF
T音源ベクトルを加算して、1個のDFT音源ベクトル
14を生成するベクトル加算器である。 次に第2図のフローチャートを用いて動作を説明する。 まず、第1の縮小符号帳のに1番目及び第2の縮小符号
帳のに2番目のそれぞれの第1のDFT音源ベクトル及
び第2のDFT音源ベクトルを用いた場合、A (t、
に、)をに0番目の第1のDFT音源ベクトルのi番目
成分、B (i、kz)をに2番目の第2のDFT音源
ベクトルのi番目成分とし、以下使用するパラメータは
従来技術の説明でのパラメータと同一であり、説明を省
略する。 第1及び第2の切換スイッチ6a、6bにより選択され
た第1のDFT音源ベクトルA(i、kg)と第2のD
FT音源ベクトルB(i、kt)は、それぞれ第1のベ
クトル積和演算回路9aにより第2式と同様に第1の分
子項ベクトル積和p’(kI)をM個当力しくステップ
ST6,5T7) 、第2のベクトル積和演算回路9b
により第2式と同様に第2の分子項ベクトルq’(kz
) をM個当力する(ステップST8,5T9)。 ベクトル加算器13は前記第1のDFT音源ベクトルA
(i、に+)と第2のDFT音源ベクトルB (t、
kz)を加算し、1個のDFT音源ベクトルC’
(i、 k) C”(i 、 k) = A (i 、 kυ 十〇
(tlkg) ・・・ (7)回につきに2をM回
度化させるため1からLまでのL個与えられることにな
り、よってC’ (i+ k)はL個生成される。さ
らに分母項計算回路15は前記1個のDFT音源ベクト
ルC”(i、 k)から第3式と同様に分母項17 Ea(i)” Ic’(i、k) l” −(8)
を出力する(ステップ5TII)。最終歪量計算回路1
2は前記第1の分子項ベクトル積和p’(kI)、第2
の分子項ベクトル積和u’(kz)、及び分母項17か
ら第4式と同様に歪量E (k)を出力する(ステップ
5T12)。ここで、第4式の分子項ベクトル積和は、
第7式の関係よりを生成する(ステップ5TIO)。k
は、kI 1から得られる。 上記の計算により歪量E (k)がL個すべて得られる
と(ステップ5T13)、最適音源ベクトル選択回路1
9により、L個の歪量18の内、最小値を与えるDFT
音源ベクトルの番号を最適音源ベクトルコード20とし
て選択する(ステップ5T14)。 この発明の特徴は、第4式の第2項分子全体に必要な演
算量が大幅に削減できる点であり、従来技術による第2
式のL回のベクトル積和演算が、この発明の第5及び第
6式による2F口(L=M2より)回のベクトル積和演
算と、第9式の第2項分子のE「回のスカラー値加算に
なることで演算量が削減される。 次に、演算量について比較を行う。まず、従来技術につ
いて述べる。 ベクトル積和演算回路8の第2式の計算は、実際には次
の第10式のように、また、分母項計算回路15の第3
式の計算は、次の第11式のように計算される。 Im、 (C(f、k))) このときに必要な演算量は第10式では、乗算が2・L
−N回、加減算が2・L−N回であり、第11式では、
乗算が3・L−N回、加算が2・L−N回である。そし
て、歪量最終計算回路12では、第4式の第2項の2乗
のための乗算をL回。 そして、除算をL回行う。なお、第4式の第1項はkに
関係なく一定であるので、最適音源ベクトルの選択には
関係ないので計算は行わない。ここで、1回の乗算に要
する演算量をp、1回の加減算に要する演算量を(1,
1回の除算に要する演算量をrとすると、第4式の第2
頂金体に必要な演算量は、(5・L−N+L) ・p
+4・L−N・q+L−rである。 次にこの発明の場合について述べる。2つのベクトル積
和演算回路9a、9bの第5式および第6式の計算は、
実際には次の第12式、第13式のように、また、ベク
トル加算器13および分母項計算回路15の第7式、第
8式の計算は、次の第14式のように計算される。 1m、(A(i、に+))) 木 口゛(kz)=Σ (Re、(Y(i) )ネ ・Re、 (B(i、kz)) −1m、 (Y(i)
) ・1m、 (B(i、kz)) 1 このときに必要な演算量は、第12及び第13式では乗
算が4・[・N回、加減算が4・fr・N回であり、第
14弐では、乗算が3・L−N回、加算が4・L−N回
であり、歪量最終計算回路12では分子項ベクトル積和
と第2の分子項ベクトル積和との和のための加算がL回
、2乗のための乗算がL回、そして、除算がL回である
。よって、第9式の第2頂金体に必要な演算量は、(4
・匡・N+3・L−N+L) ・p+(4・[−・N
+4・L−N+L)・q+L−rである。 従って、Lが次式を満たし、かつ、ある整数の2乗であ
るとき、 L〉16・N2 ・ (p+q)/ (2・N−p−q
)2となり、この発明により演算量の削減が図れる。 なお、上記実施例では、2つの符号帳内の音源ベクトル
数が等しい場合について述べたが、これが等しくない場
合で実現してもよい。 また、上記実施例では、ベクトル加算器によりDFT加
算音源ベクトルを作成したが、これを符号帳内に持って
いてもよく、その場合は第7式の演算が不要となり、−
層の演算量削減が可能となる。 また、上記実施例では、周波数領域での装置について説
明したが、ウオルシュアダマール変換領域も、また特異
値分解を用いる方法でも実現できる。さらに、上記実施
例では2個の縮小符号帳を用いたが、2個以上の符号帳
を用いても同様の効果を奏する。
以上のように、この発明によれば、ベクトル加算器によ
り複数の符号帳からそれぞれ選択された音源ベクトルを
加算し、1個の音源ベクトルを生成し、このベクトル加
算器で生成され音源ベクトルと前記複数の縮小符号帳か
らそれぞれ選択された音源ベクトルから歪量計算手段に
より、歪量を計算するようにしたので、大きな演算量の
必要なベクトル積和演算回路における分子項ベクトル積
和演算をHf1T回行うのみでよいので、Lが大きいと
きは歪量計算に要する演算量が大幅に縮小される。また
、符号帳内のDFT音源ベクトルの数は2F「個であり
、必要なメモリ量は従来の2t−1/Z倍に縮小される
。この2点により小規模な装置規模でも十分大きなLを
設定でき、十分な品質で音声を符号化することができる
。
り複数の符号帳からそれぞれ選択された音源ベクトルを
加算し、1個の音源ベクトルを生成し、このベクトル加
算器で生成され音源ベクトルと前記複数の縮小符号帳か
らそれぞれ選択された音源ベクトルから歪量計算手段に
より、歪量を計算するようにしたので、大きな演算量の
必要なベクトル積和演算回路における分子項ベクトル積
和演算をHf1T回行うのみでよいので、Lが大きいと
きは歪量計算に要する演算量が大幅に縮小される。また
、符号帳内のDFT音源ベクトルの数は2F「個であり
、必要なメモリ量は従来の2t−1/Z倍に縮小される
。この2点により小規模な装置規模でも十分大きなLを
設定でき、十分な品質で音声を符号化することができる
。
第1図はこの発明の一実施例による音声符号化装置の構
成を示すブロック図、第2図はこの発明の一実施例によ
る動作を説明するフローチャート、第3図は従来の音声
符号化装置の構成を示すブロック図、第4図は従来の音
声符号化装置の動作を説明するフローチャートである。 図において、1は符号帳、2a、2bは第1及び第2の
縮小符号帳、4a、4bは第1及び第2のDFT音源ベ
クトル、13はベクトル加算器、A、Bは歪量計算手段
である。 なお、図中、同一符号は同一、または相当部分を示す。 特 許 出 順 人 三菱電機株式会社第 図 手 続 補 正 書 (自 発) 6 。 補正の内容 ■ 明細書第3頁第5行に 「5m」 とあるのを r 5 m5ecJ と補正する。 明細書筒5真第1 5行に 「とする一般に」 とあるのを「とすると、 一般に」 と補正する。 2、発明の名称 明細書第 2頁第1 4行から第1 6行に 音声符号化装置 3、補正をする者 事件との関係 特許出願人 住 所 東京都千代田区丸の内二丁目2番3号名
称 (601)三菱電機株式会社代表者 志岐守哉 とあるのを 4、代理人 住所 郵便番号 105 東京都港区西新橋1丁目4番10号 明細書の発明の詳細な説明の欄 と補正する。 明細書第 7頁第2行に 「2個以上の符号 帳」 とあるのを 「2個以上の縮小符号帳」 と補正 する。 以 上
成を示すブロック図、第2図はこの発明の一実施例によ
る動作を説明するフローチャート、第3図は従来の音声
符号化装置の構成を示すブロック図、第4図は従来の音
声符号化装置の動作を説明するフローチャートである。 図において、1は符号帳、2a、2bは第1及び第2の
縮小符号帳、4a、4bは第1及び第2のDFT音源ベ
クトル、13はベクトル加算器、A、Bは歪量計算手段
である。 なお、図中、同一符号は同一、または相当部分を示す。 特 許 出 順 人 三菱電機株式会社第 図 手 続 補 正 書 (自 発) 6 。 補正の内容 ■ 明細書第3頁第5行に 「5m」 とあるのを r 5 m5ecJ と補正する。 明細書筒5真第1 5行に 「とする一般に」 とあるのを「とすると、 一般に」 と補正する。 2、発明の名称 明細書第 2頁第1 4行から第1 6行に 音声符号化装置 3、補正をする者 事件との関係 特許出願人 住 所 東京都千代田区丸の内二丁目2番3号名
称 (601)三菱電機株式会社代表者 志岐守哉 とあるのを 4、代理人 住所 郵便番号 105 東京都港区西新橋1丁目4番10号 明細書の発明の詳細な説明の欄 と補正する。 明細書第 7頁第2行に 「2個以上の符号 帳」 とあるのを 「2個以上の縮小符号帳」 と補正 する。 以 上
Claims (1)
- 予め複数の音源ベクトルを格納している符号帳と、前記
音源ベクトルを音源として、入力音声の分析により求め
られた合成フィルタを駆動させることで得られる再生音
声と前記入力音声との歪量を計算する歪量計算手段とを
備え、該歪量が最小となる前記音源ベクトルを選択する
音声符号化装置において、前記符号帳から抽出された複
数の縮小符号帳と、前記複数の縮小符号帳からそれぞれ
選択された音源ベクトルを加算し、1個の音源ベクトル
を生成するベクトル加算器と、前記ベクトル加算器から
生成された1個の音源ベクトルと前記複数の縮小符号帳
からそれぞれ選択された音源ベクトルから歪量を計算す
る歪量計算手段とを備えたことを特徴とする音声符号化
装置。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1070399A JPH02250100A (ja) | 1989-03-24 | 1989-03-24 | 音声符合化装置 |
| US07/488,870 US5119423A (en) | 1989-03-24 | 1990-03-05 | Signal processor for analyzing distortion of speech signals |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1070399A JPH02250100A (ja) | 1989-03-24 | 1989-03-24 | 音声符合化装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02250100A true JPH02250100A (ja) | 1990-10-05 |
Family
ID=13430336
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1070399A Pending JPH02250100A (ja) | 1989-03-24 | 1989-03-24 | 音声符合化装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US5119423A (ja) |
| JP (1) | JPH02250100A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0753841A3 (en) * | 1990-11-02 | 1997-04-23 | Nec Corp | Method for coding a speech parameter capable of transmitting a spectral parameter at a reduced rate |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
| US5651026A (en) * | 1992-06-01 | 1997-07-22 | Hughes Electronics | Robust vector quantization of line spectral frequencies |
| US5457783A (en) * | 1992-08-07 | 1995-10-10 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear prediction |
| CA2135629C (en) * | 1993-03-26 | 2000-02-08 | Ira A. Gerson | Multi-segment vector quantizer for a speech coder suitable for use in a radiotelephone |
| AU5095193A (en) * | 1993-08-27 | 1995-03-21 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear prediction |
| US5517595A (en) * | 1994-02-08 | 1996-05-14 | At&T Corp. | Decomposition in noise and periodic signal waveforms in waveform interpolation |
| SE521225C2 (sv) * | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
| US6721701B1 (en) * | 1999-09-20 | 2004-04-13 | Lucent Technologies Inc. | Method and apparatus for sound discrimination |
| GB0123310D0 (en) * | 2001-09-28 | 2001-11-21 | Honeywell Normalair Garrett | Breathing gas supply system |
| JPWO2020129422A1 (ja) * | 2018-12-20 | 2021-11-11 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4827517A (en) * | 1985-12-26 | 1989-05-02 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
| US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
| US4910781A (en) * | 1987-06-26 | 1990-03-20 | At&T Bell Laboratories | Code excited linear predictive vocoder using virtual searching |
| US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
-
1989
- 1989-03-24 JP JP1070399A patent/JPH02250100A/ja active Pending
-
1990
- 1990-03-05 US US07/488,870 patent/US5119423A/en not_active Expired - Lifetime
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0753841A3 (en) * | 1990-11-02 | 1997-04-23 | Nec Corp | Method for coding a speech parameter capable of transmitting a spectral parameter at a reduced rate |
Also Published As
| Publication number | Publication date |
|---|---|
| US5119423A (en) | 1992-06-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Wang et al. | Neural source-filter-based waveform model for statistical parametric speech synthesis | |
| US6782359B2 (en) | Determining linear predictive coding filter parameters for encoding a voice signal | |
| JPH02250100A (ja) | 音声符合化装置 | |
| EP0770989A2 (en) | Speech encoding method and apparatus | |
| WO1992005541A1 (en) | Voice coding system | |
| EP0550657B1 (en) | A method of, and system for, coding analogue signals | |
| JPH04505670A (ja) | 音声認識の際の雑音のロバストネスを改善するためにスペクトル的推定を行う方法 | |
| HK1006874B (en) | A method of, and system for, coding analogue signals | |
| JP3064947B2 (ja) | 音声・楽音符号化及び復号化装置 | |
| JP2624130B2 (ja) | 音声符号化方式 | |
| JPH1185194A (ja) | 声質変換音声合成装置 | |
| JP3531780B2 (ja) | 音声符号化方法および復号化方法 | |
| CN107221321A (zh) | 一种用于任意源和目标语音之间的语音转换方法 | |
| Atal et al. | Beyond multipulse and CELP towards high quality speech at 4 kb/s | |
| JP2709926B2 (ja) | 声質変換方法 | |
| EP1557825B1 (en) | Bandwidth expanding device and method | |
| JP3583945B2 (ja) | 音声符号化方法 | |
| JP3228389B2 (ja) | 利得形状ベクトル量子化装置 | |
| JP3233184B2 (ja) | 音声符号化方法 | |
| JP2702157B2 (ja) | 最適音源ベクトル探索装置 | |
| JP3420222B2 (ja) | 利得形状ベクトル量子化方法とこれを用いた音声符号化方法及び装置 | |
| Nagarajan et al. | Efficient implementation of linear predictive coding algorithms | |
| JP3471892B2 (ja) | ベクトル量子化方法及び装置 | |
| JP3319551B2 (ja) | ベクトル量子化装置 | |
| JPH03243999A (ja) | 音声符号化装置 |