JPS6235680B2 - - Google Patents
Info
- Publication number
- JPS6235680B2 JPS6235680B2 JP55136282A JP13628280A JPS6235680B2 JP S6235680 B2 JPS6235680 B2 JP S6235680B2 JP 55136282 A JP55136282 A JP 55136282A JP 13628280 A JP13628280 A JP 13628280A JP S6235680 B2 JPS6235680 B2 JP S6235680B2
- Authority
- JP
- Japan
- Prior art keywords
- circuit
- calculation circuit
- spectrum
- signal
- quantization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000001228 spectrum Methods 0.000 claims description 58
- 238000000034 method Methods 0.000 claims description 33
- 230000003044 adaptive effect Effects 0.000 claims description 32
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 23
- 230000005236 sound signal Effects 0.000 claims description 23
- 230000005540 biological transmission Effects 0.000 claims description 18
- 238000005070 sampling Methods 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 description 79
- 238000013139 quantization Methods 0.000 description 59
- 239000011295 pitch Substances 0.000 description 42
- 238000003775 Density Functional Theory Methods 0.000 description 35
- 230000006870 function Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 8
- 230000008929 regeneration Effects 0.000 description 7
- 238000011069 regeneration method Methods 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 7
- 230000006866 deterioration Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000007493 shaping process Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 238000012886 linear function Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 238000000819 phase cycle Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本発明は音声信号の高能率符号化伝送方式に関
し、特に伝送速度が10Kビツト/秒前後の低速の
音声信号伝送方式に関する。 音声信号の高能率符号化伝送方式の一つとし
て、直交変換を用いて音声信号を時間領域から周
波数領域に変換し、周波数領域で信号のスペクト
ラムを量子化および符号化して伝送する方式が提
案されている。この方式の代表的なものとして
は、アイ・イー・イー・イー・トランザクシヨン
ズ・オン・アコーステイクス・スピーチ・アン
ド・シグナル・プロセツシング(IEEE
Transactions on Acoustics,Speech,and
Signal Processing)誌の1977年第25巻、8月号
第299〜309頁(PP.299〜309,VOL.ASSP−25,
AUGUST,1977)掲載の「アダプテイブ・トラ
ンスフオーム・コーデイング・オブ・スピーチ・
シグナルズ」(“Adaptive Transform Codig of
Speech Signals”)と題する論文(文献1)所載
のアダプテイブ・トランスフオーム・コーデイン
グ(Adeptive Transform Coding;以下ATCと
記す)方式が知られている。また、前記ATC方
式を改善し、より少ない伝送情報量で高品質な音
声信号伝送を可能にした方式として、アール・イ
ー・クロシヤー(R・E・CROCHIERE)氏ら
により提案されたボコーダ・ドリブン・アダプテ
イブ・トランスフオーム・コーデイング
(“Vocoder driven Adaptive Transform
Codig”;以下、VD−ATCと記す。)方式が知ら
れており、その詳細は、アイ・イー・イー・イ
ー・トランザクシヨンズ・オン・アコーステイク
ス・スピーチ・アンド・シグナルプロセツシング
(IEEE Transactions on Acoustics,Speech,
and Signal Processing)誌の1979年第27巻、10
月号、512〜530頁(PP.512〜530,VOL.ASSP−
27,OCTOBER,1979)掲載の「フリーケンシ
ヤ・ドメイン・コーデイング・オブ・スピーチ」
(“Frequency Domain Coding of Speech.”)と
題する論文(文献2)を参照できる。 第1図はVD−ATC方式を説明するブロツク図
である。図において、送信側では、入力端子10
には標本化された音声信号系例x(n)が入力さ
れる。バツフアメモリ15は入力信号をMサンプ
ルずつブロツク処理するためにMサンプルずつ入
力信号を記憶する。窓関数回路20はバツフアメ
モリ15に格納されているMサンプルの信号に対
してあらかじめ定められた窓関数を掛ける。第2
図は前記文献2で述べられている窓関数の一例を
示す。第2図において、nはサンプル時刻を示
し、mは重なりあうサンプル数を示す。ここでM
個のサンプル値から構成されるサンプル値系列を
ブロツクと定義すると、第2図の実線部は現ブロ
ツクの窓関数を示し、破線部はその前後のブロツ
クの窓関数を示す。窓関数回路20の出力値は離
散的コサイン変換回路(以下、DCT回路と記
す)30に入力される。ここでMサンプルの離散
的コサイン変換(Discrete Cosine Transform;
以下DCTと記す)は、前記文献2によれば(1)お
よび(2)式に従つて計算される。 ここで
し、特に伝送速度が10Kビツト/秒前後の低速の
音声信号伝送方式に関する。 音声信号の高能率符号化伝送方式の一つとし
て、直交変換を用いて音声信号を時間領域から周
波数領域に変換し、周波数領域で信号のスペクト
ラムを量子化および符号化して伝送する方式が提
案されている。この方式の代表的なものとして
は、アイ・イー・イー・イー・トランザクシヨン
ズ・オン・アコーステイクス・スピーチ・アン
ド・シグナル・プロセツシング(IEEE
Transactions on Acoustics,Speech,and
Signal Processing)誌の1977年第25巻、8月号
第299〜309頁(PP.299〜309,VOL.ASSP−25,
AUGUST,1977)掲載の「アダプテイブ・トラ
ンスフオーム・コーデイング・オブ・スピーチ・
シグナルズ」(“Adaptive Transform Codig of
Speech Signals”)と題する論文(文献1)所載
のアダプテイブ・トランスフオーム・コーデイン
グ(Adeptive Transform Coding;以下ATCと
記す)方式が知られている。また、前記ATC方
式を改善し、より少ない伝送情報量で高品質な音
声信号伝送を可能にした方式として、アール・イ
ー・クロシヤー(R・E・CROCHIERE)氏ら
により提案されたボコーダ・ドリブン・アダプテ
イブ・トランスフオーム・コーデイング
(“Vocoder driven Adaptive Transform
Codig”;以下、VD−ATCと記す。)方式が知ら
れており、その詳細は、アイ・イー・イー・イ
ー・トランザクシヨンズ・オン・アコーステイク
ス・スピーチ・アンド・シグナルプロセツシング
(IEEE Transactions on Acoustics,Speech,
and Signal Processing)誌の1979年第27巻、10
月号、512〜530頁(PP.512〜530,VOL.ASSP−
27,OCTOBER,1979)掲載の「フリーケンシ
ヤ・ドメイン・コーデイング・オブ・スピーチ」
(“Frequency Domain Coding of Speech.”)と
題する論文(文献2)を参照できる。 第1図はVD−ATC方式を説明するブロツク図
である。図において、送信側では、入力端子10
には標本化された音声信号系例x(n)が入力さ
れる。バツフアメモリ15は入力信号をMサンプ
ルずつブロツク処理するためにMサンプルずつ入
力信号を記憶する。窓関数回路20はバツフアメ
モリ15に格納されているMサンプルの信号に対
してあらかじめ定められた窓関数を掛ける。第2
図は前記文献2で述べられている窓関数の一例を
示す。第2図において、nはサンプル時刻を示
し、mは重なりあうサンプル数を示す。ここでM
個のサンプル値から構成されるサンプル値系列を
ブロツクと定義すると、第2図の実線部は現ブロ
ツクの窓関数を示し、破線部はその前後のブロツ
クの窓関数を示す。窓関数回路20の出力値は離
散的コサイン変換回路(以下、DCT回路と記
す)30に入力される。ここでMサンプルの離散
的コサイン変換(Discrete Cosine Transform;
以下DCTと記す)は、前記文献2によれば(1)お
よび(2)式に従つて計算される。 ここで
【式】
(1)式において、v(n)(n=0,1,…,M
−1)は窓関数回路20の出力値であり、Vc(k)
(k=0,1,…,M−1)はV(n)のMサン
プルのDCT係数を示す。(以下、同様な表現を用
いる。)また、逆コサイン変換(以下IDCTと記
す)は、次式に従い計算される。 MサンプルのDCT係数の計算法としては、2M
サンプルの離散的フーリエ変換(Discrete
Fourier Transform;以下DFTと記す)を用い
る計算法が知られている。この計算法を以下に簡
単に説明する。 今、u(n)をMサンプルのサンプル値系列と
し、次の様に定義する。 2MサンプルのDFTをU(k)とすると、U(k)は 従つて、MサンプルのDCT系数、Vc(k)は次の様
に求まる。 Vc(k)=Re{c(k)exp(−jπk/2M)U(k)} k=0,1,2…,M−1 (6) 上式で記号Re{ }は、実数部を表わす。ま
た、演算量を大幅に低減させる計算法としては、
ジエー・マクホウル(J.MAKHOUL)氏による
アイ・イー・イー・イー・トランザクシヨンズ・
オン・アコーステイクス・スピーチ・アンド・シ
グナルプロセツシング(IEEE Transactions on
Acoustics,Speech,and Signal Processing)
誌の1980年、第28巻、2月号第27頁〜第34頁掲載
の「ア・フアースト・コサイン・トランスフオー
ム・イン・ワン・アンド・トウー・デイメンシヨ
ンズ」(“A Fast Cosine Transform in One
and Two Dimensions”」と題する論文に詳細に
説明されているので、ここでは説明を省略する。
再び第2図に戻つて、DCT回路30の出力値、
すなわち、MサンプルDCT係数は、自己相関々
数計算回路40とDCT係数量子化符号化回路1
10に入力される。自己相関々数計算回路40は
入力値であるMサンプルの各DCT係数の2乗値
を計算し、これら計算結果に2Mサンプルの逆
DFT(IDFT)を施し、M個の擬似自己相関々数
を計算する。M個の擬似自己相関々数は、ピツチ
抽出回路50及び予測パラメータ計算回路70に
それぞれ与えられる。ピツチ抽出回路50は、M
個の自己相関々数を用いてピツチ周期P及びピツ
チゲインPGを計算し、量子化器60に与える。
予測パラメータ計算回路70は、M個の自己相
関々数を用いて所定の数の予測パラメータ値系列
(一例としてKパラメータ値系列とする。)を計算
し、このKパラメータ値系列を量子化器60に供
給する。尚、Kパラメータはパーコールパラメー
タとも呼ばれる。量子化器60は、ピツチ周期
P、ピツチゲインPGおよびKパラメータ値系列
を所定の量子化ビツト数で量子化し、得られた量
子化パラメータ値を逆量子化器65及びサイド情
報符号器130に与える。逆量子化器65は、入
力した量子化パラメータ値を逆量子化し、得られ
たピツチ周期P′およびピツチゲインPG′をスペク
トラム再生回路90に供給する。また、逆量子化
して得たKパラメータ値系列をパラメータ変換回
路80に与える。パラメータ変換回路80は、入
力されたKパラメータ値系列をスペクトラム再生
に適したパラメータ値系列(例えば、αパラメー
タ値系列)に変換し、このαパラメータ値系列を
スペクトラム再生回路90に与える。尚、αパラ
メータは線形予測係数とも呼ばれる。スペクトラ
ム再生回路90は、ピツチ周期P′とピツチゲイン
PG′とを用いてピツチスペクトラムσp(k)を計算
する。また、αパラメータ値系列を用いて包絡ス
ペクトラムσf(k)を計算する。ここで、包絡スペ
クトラムはフオルマントスペクトラムとも呼ばれ
る。さらに、σp(k)とσf(k)とを用いてスペクトラ
ムを再生する。以下、再生スペクトラムをσ(k)
(k=0,1…,M−1)と記すことにする。次
にσf(k),σ(k)は、ビツト割り当てステツプサイ
ズ計算回路100に入力される。ビツト割り当て
ステツプサイズ計算回路100の計算アルゴリズ
ムを次に説明する。まず、最初にステツプサイズ
計算アルゴリズムを示す。 Δ(k)=Q・A(b(k))・σ(k) (k=0,1,…,M−1) (7) ここで、Δ(k)は、第k番目のDCT係数を量子
化する際の量子化ステツプサイズを示し、σ(k)は
前記再生スペクトラムである。b(k)は割り当てビ
ツト数であり、A(b(k))は、b(k)により決まる
定数である。Qは、負荷係数であり、負荷に対す
る量子化器の雑音特性を決める。次に、ビツト割
り当て計算アルゴリズムを示す。k番目のDCT
係数に対する割り当てビツト数は、次式により計
算される。 b(k)=δ+1/2log2w(k)σ2(k)/D (k=0,1,…,M−1) (8) ここで、δは実際の量子化器に適用する際の修
正項、w(k)は周波数重み関数、Dは次式で示され
る量子化雑音電力を示す。 ここで、σe 2(k)は、k番目のDCT係数の量子
化雑音電力を示す。前記周波数重み関数w(k)は、
次の様に表わされる。 w(k)=σf 2〓(k)(k=0,1,…,M−1) (10) ここで、σf(k)は前述の包絡スペクトラムであ
る。γは量子化雑音電力の周波数特性を決定する
因子で、−1≦γ≦0の値をとる。γの値による
量子化雑音電力σe 2(k)の変化を第3図に示す。
第3図において、横軸はkの値を示し、縦軸は対
数電力を示す。また、実線部は、信号電力スペク
トラムを示し、破線部は、量子化雑音電力スペク
トラムを示す。γ=0の時は、量子化雑音電力ス
ペクトラムは平坦な特性を示し、γ=−1の時
は、信号電力スペクトラムと同様な特性を示す。
γの値としては、普通は−1<γ<0の値を用い
る。γの値によつて量子化雑音電力スペクトラム
の特性を変化させる手法を、ノイズ・シエイピン
グ(Noise Shaping)と呼ぶ。次にDCT係数適応
型量子化符号化回路110を説明する。DCT係
数適応型量子化符号化回路110は、ビツト割り
当てステツプサイズ計算回路100の出力値であ
る量子化ステツプサイズΔ(k)と割り当てビツト数
b(k)を用いて、DCT回路30の出力値である
DCT係数を適応的に量子化、符号化する。符号
化されたDCT係数は、マルチプレクサ120に
与えられる。サイド情報符号器130は、量子化
器60からの量子化パラメータ値をサイド情報と
して符号化し、マルチプレクサ120に供給す
る。マルチプレクサ120は、サイド情報符号器
130の出力符号とDCT係数適応型量子化符号
化回路110の出力符号とを、Mサンプル時刻毎
に送信側出力端子140を介して伝送する。 次に受信側の動作を説明する。受信側では、受
信側入力端子150に受信した送信符号はデマル
チプレクサ160に与えられ、この受信符号を、
DCT係数を表わす符号と、サイド情報を表わす
符号として分離する。分離されたDCT係数を表
わす符号はDCT係数適応型復号器200に与え
られ、サイド情報を表わす符号はサイド情報復号
器170に与えられる。サイド情報復号器170
は入力された符号を復号し、ピツチ周期P′及びピ
ツチゲインPG′と、Kパラメータ値系列とを分離
し、Kパラメータ値系列をパラメータ変換回路1
75に与え、ピツチ周期P′とピツチゲインPG′と
をスペクトラム再生回路180に与える。ここ
で、パラメータ変換回路175は、送信側のパラ
メータ変換回路80と同一の動作を行ない、Kパ
ラメータ値系列をαパラメータ値系列へ変換し、
αパラメータ値系列をスペクトラム再生回路18
0に与える。スペクトラム再生回路180は、送
信側におけるスペクトラム再生回路90と同一の
動作を行ない、再生スペクトラムσ(k)及び包絡ス
ペクトラムσf(k)を、ビツト割り当てステツプサ
イズ計算回路190に供給する。ビツト割り当て
ステツプサイズ計算回路190は、送信側におけ
るビツト割り当てステツプサイズ計算回路100
と同一の動作を行ない、量子化ステツプサイズΔ
(k)及び割り当てビツト数b(k)をDCT係数適応型
復号器200に供給する。DCT係数適応型復号
器200は、前記Δ(k)及びb(k)を用いて、デマル
チプレクサ160から入力した値を復号化して
DCT係数を得る。得られたDCT係数は、逆DCT
(IDCT)回路210に入力され、Mサンプルの
DCT係数に逆コサイン変換を施し、Mサンプル
の再生信号(n)(n=0,1,…,M−1)
を得る。バツフアメモリ回路220は、Mサンプ
ルの(n)を一旦蓄積した後に、受信側出力端
子230を介して出力する。 以上説明したVD−ATC方式は、16kビツト/
秒前後の伝送速度において非常に高品質な音声信
号を得ることができる。しかしながら、このVD
−ATC方式は、DCT係数とサイド情報の双方を
伝送しなければならないので、大幅な伝送情報量
の圧縮が難しく、また低速伝送(例えば9.6kビツ
ト/秒以下)においては、再生音声の品質が劣化
するという欠点がある。音声品質劣化の一例とし
ては、ピツチ情報が充分に再現されないことによ
り再生音声がしわがれた感じの音になることが挙
げられる。これは、低速伝送においては、包絡ス
ペクトラム及びピツチスペクトラム等を充分に再
現できないことに起因する。 本発明の目的は、伝送情報量を低減でき、かつ
低速伝送においても高品質な音声信号の再生が可
能な適応型音声信号伝送方法を提供することにあ
る。 本発明による伝送方法は、音声信号をサンプリ
ングして得たサンプル値系列を直交変換した直交
変換系列を適応的に量子化して伝送する適応型音
声信号伝送方法において、前記サンプル値系列の
直交変換離散系列を表わす第1の信号系列を発生
し、前記第1の信号系列に基づいて前記第1の信
号系列が有する特徴を表わす第2の信号系列を発
生し、前記第2の信号系列に基づいてスペクトラ
ムを表わす第3の信号系列を発生し、前記第1の
信号系列と前記第3の信号系列との差分系列を計
算し、前記差分系列を適応量子化した第4の信号
系列を発生し、前記第2の信号系列と前記第4の
信号系列とを組み合わせて伝送することを特徴と
している。 次に、本発明を図面を参照して詳細に説明す
る。第4図は、本発明の第1の実施例を示すブロ
ツク図である。本実施例においては、直交変換と
してDCTを用いている。第4図の送信側におい
て、バツフアメモリ15および窓関数回路20
は、第1図の同一番号の構成要素と同一の動作を
行う。DCT回路300は窓関数回路20のM個
の出力値に対して離散的コサイン変換(DCT)
を施し、DCT係数Vc(k)(k=0,1,…,M−
1)を出力する。DCTの計算法としては、前記
VD−ATC方式の説明の所で述べた様に、DFTま
たは文献3等で明されている方法に従つて計算で
きる。絶対値回路310は、入力されたVc(k)
(k=0,1,…,M−1)の符号情報を適応型
量子化符号器390に与える。また、Vc(k)の絶
対値|Vc(k)|を計算し、その計算結果を対数計
算回路320と減算器380に与える。対数計算
回路320は、DCT係数の絶対値|Vc(k)|(k
=0,1,…,M−1)の対数LOG|Vc(k)|
(k=0,1,…,M−1)の値を計算する。2M
点の逆離散的フーリエ変換(Irverse Discrete
Fourier Transform;以下IDFTと記す)回路3
20は、前記対数計算回路320の出力値の
IDFTを計算し、擬似ケプストラムC(h)(n=
0,1,…,2M−1)を得る。ここで擬似と表
現したのは、DCT係数よりケプストラムを求め
ているためである。 尚、ケブストラムの詳細は、デイー・ジー・チ
ルダーズ(D.G.CHILDERS)氏らによるプロシ
ーデイングズ・オブ・アイー・イー・イー・イー
(PROCEEDINGS OF THE IEEE)誌の1977
年、第65巻、10月号1428頁〜1443頁に掲載の
「ザ・ケプストラム:ア・ガイド・トウー・プロ
セツシング」(“The Cepstrum:AGuide to
Processing”)と題する論文に述べられているの
で、ここでは説明を省略する。 擬似ケプストラムC(n)は、リフタ回路34
0に入力される。リフタ回路340は、擬似ケプ
ストラムC(n)に所定の窓関数を乗じ、低時間
部分と高時間部分とを分離して抽出し、低時間部
分を量子化器350に与え、高時間部分をピツチ
検出回路345に与える。一般に、ケプストラム
の低時間部分は、入力音声信号の包絡スペクトラ
ム情報を含み、高時間部分はピツチ(ピツチ周期
及びピツチゲイン)を含んでいることが知られて
いることから擬似ケプストラムに対しても同様な
ことが成立すると考えられる。ピツチ検出回路3
45は、ピツチ周期Pと、ピツチゲインPGを検
出して量子化器350に与える。量子化器350
は、リフタ回路340から出力された擬似ケプス
トラムの低時間部分と、ピツチ検出回路345よ
り出力されたピツチ周期PおよびピツチゲインP
Gとを所定の量子化ビツト数で量子化する。以
後、擬似ケプストラムの低時間部分と、ピツチ周
期PおよびピツチゲインPGとの量子化値をサイ
ド情報と呼ぶことにする。量子化器350より出
力されたサイド情報は、復号器355と、サイド
情報符号器410とに入力される。復号器355
はサイド情報を復号化して、DFT計算回路36
0に与える。離散的フーリエ変換(Discrete
Fourier Transform;以下DFTと記す)回路3
60は、復号されたサイド情報に2M点のDFTを
施し、対数領域における再生スペクトラムを得
る。この内の最初のM点の再生スペクトラムをσ
L′(k)(k=0,1,…,M−1)とすると、σ
L′(k)は、ピツチスペクトラムσP′(k)と包絡スペク
トラムσf′(k)(k=0,1,…,M−1)とから
構成されている。ここで、包絡スペクトラムσ
f′(k)、ピツチスペクトラムσP′(k)及び再生スペク
トラムσL′(k)の一例を第5図a,b,cに示す。
第5図において、横軸はいずれもkの値(0〜M
−1)を表わし、縦軸は対数振幅を表わす。尚、
図においては、視覚的にわかりやすくするため
に、各スペクトラム値を連続的に示してある。 対数領域における再生スペクトラムσL′(k)は、
指数計算回路370およびビツト割り当てステツ
プサイズ計算回路400に与えられる。指数計算
回路370は、入力値に対して指数を計算する。
すなわち、対数計算回路320における処理と逆
処理を行う。指数計算回路370の出力値σ′(k)
(k=0,1,…,M−1)は、減算器380に
与えられ、絶対値回路310の出力値である|V
c(k)|と指数計算回路370の出力値σ′(k)との差
分e(k)(k=0,1,…,M−1)を計算し、計
算結果を適応型量子化符号器390に与える。適
応型量子化符号器390は、ビツト割り当て量子
化ステツプサイズ計算回路400から出力される
量子化ステツプサイズと割り当てビツト数とを用
いて、前記e(k)を適応的に量子化するとともに、
絶対値計算回路310から供給されるVc(k)の符
号情報を用いて符号化する。適応型量子化符号器
からの符号系列は、マルチプレクサ420に与え
られる。ビツト割り当て量子化ステツプサイズ計
算回路400は、DFT計算回路360から供給
された再生スペクトラムσL′(k)を用いて差分e(k)
に対する量子化ビツト数及び量子化ステツプサイ
ズを計算する。量子化ステツプサイズの計算法と
しては、前記(7)式を適用できる。量子化ビツト数
の割り当て方法の最も簡単な方法としては、全て
等しいビツト数(例えば2ビツト)を割り当てる
方法が考えられる。この様な量子化ビツト割り当
て方法では、量子化雑音電力スペクトラムは、信
号電力スペクトラムと相似な特性をもつ。即ち、
第3図において、γ=−1とした場合と同様な特
性となる。従来のVD−ATC方式においては、等
しいビツト数で量子化する場合には、DCT係数
Vc(k)に対して少なからぬビツト数(4ビツトあ
るいは5ビツト)を割り当てる必要があり、この
ため、伝送情報量が非常に増大してしまうという
欠点があつたが、本発明では、CT係数の量子化
ではなく、差分e(k)を量子化しているので、少な
いビツト数でも音質劣化はほとんどなく、伝送情
報量もそれほど増大しない。勿論、適応型ビツト
割り当て、あるいはノイズ・シエイピングを施す
ことも可能であり、その様にする場合には、前記
(8)〜(10)式を適用すればよい。しかしながら、本実
施例の場合にノイズ・シエイピングを効果的に適
用するためには、γの値として従来のVD−ATC
方式の説明で述べた値と異なる値を採用しなくて
はならない。つまり、本実施例の場合には量子化
雑音電力スペクトラムの特性は、γ=1の時に平
坦な特性となり、γ=0の時には、信号電力スペ
クトラムと相似な特性となる。従つて、γの値と
しては、0<γ<1の値を採用しなくてはならな
い。 マルチプレクサ420は、適応型量子化符号器
390の出力符号系列とサイズ情報符号器410
の出力符号系列とを受け、これらの符号系列を多
重化して送信側出力端子140を介し受信側へ伝
送する。 次に、受信側の動作を説明する。受信側におい
ては、伝送された符号系列を受信側入力端子15
0を介して受信し、デマルチプレクサ430に与
える。デマルチプレクサ430は、差分e(k)(k
=0,1,…,M−1)を表わす符号系列と、サ
イド情報を表わす符号系列とを分離し、前者を適
応型復号器470に供給し、後者をサイド情報復
号器440に供給する。サイド情報復号器440
は、入力された符号系列を復号化し復号化サイド
情報を得て、これらをDFT計算回路450に出
力する。ここで、DFT計算回路450は、送信
側のDFT計算回路360と同一の動作を行な
い、復号化サイド情報を用いて対数領域のスペク
トラムσL′(k)(k=0,1,…,M−1)を再生
する。σL′(k)は、ビツト割り当てステツプサイズ
計算回路460と指数計算回路490とに出力さ
れる。ビツト割り当てステツプサイズ計算回路4
60は、送信側のビツト割り当てステツプサイズ
計算回路400と同一の動作を行なう。また、指
数計算回路490は、送信側の指数計算回路37
0と同一の動作を行なう。指数計算回路370の
出力値σ′(k)(k=0,1,…,M−1)は、加
算器480に出力される。適応型復号器470
は、送信側における適応型量子化符号器390と
逆の動作を行なう。すなわち、入力された符号系
列からDCT係数の符号情報を分離してこれを
IDCT回路500に与える。また、割り当てビツ
ト数及び量子化ステツプサイズとを用いて、差分
e(k)を表わす符号を復号化したe(k)を加算器48
0に与える。加算器480は、差分e(k)とσ′(k)
とを加算し、DCT係数の絶対値を表わす|c(k)
|(k=0,1,…,M−1)を得る。|c(k)
|は、IDCT(逆コサイン変換)回路500に与
えられる。IDCT回路500は、DCT係数の符号
情報と|c(k)|とからDCT係数c(k)(k=0,
1,…,M−1)を求め、M点の逆DCTをDCT
係数c(k)に対して施し、再生信号(n)((n
=0,1,…,M−1)を得る。IDCT回路50
0の出力値(n)は、バツフアメモリ回路22
0に与えられ、Mサンプル分信号が蓄積された後
に、再生音声信号として受信側出力端子230を
介して出力される。 このような構成により、従来のVD−ATC方式
と比較して次のような効果がある。 (1) 本実施例によればDCT係数を直接量子化す
るのではな、差分e(k)を量子化して伝送してい
るので、差分e(k)を量子化して伝送するための
情報量を、従来方式のDCT係数を伝送する場
合と比べ、1/2近くまで抵減させることが可能
で、少ない伝送情報量で従来方式VD−ATC方
式と同等の音質が得られる。 (2) 従来VD−ATC方式においては、サイド情報
は量子化ステツプサイズ及び割り当てビツト数
の計算に寄与し伝送情報量を9.6kbps以下とし
た場合に、ススペクトラムの欠落が増大し、受
信側において音声信号の再生に必要なスペクト
ラム構造、すなわちスペクトラム包絡構造及び
ピツチ構造を忠実に再現できないこと等の理由
により、音質的劣化が生じているが、本実施例
の構成によれば、受信側において伝送されたサ
イド情報を用いて、音声信号の再生に必要なス
ペクトラム構造を再現することができるので、
伝送情報量を9.6kビツト/秒以下に低減して
も、高品質な再生音声を得ることができる。 (3) 演算量低減のために割り当てビツト数の計算
方法として簡単な方法(一例として全ての差分
に対して2ビツトを割り当てる)を用いても、
音質の劣化はほとんどない。なお、DCT係数
の計算において、5.a,5.b,(6)式で示し
た様に、DFTを用いて計算する場合には、ケ
プストラムの計算をDFT係数を用いて行なつ
てもよい。この様にして求めたケプストラム
は、DCT係数より計算した擬似ケプストラム
と比較して、入力信号のスペクトラム構造をよ
り良好に近似することが能である。この様にし
た場合には、2M点DFT計算回路360および
450のかわりに、M点DCT計算回路を用い
ることも可能である。M点DCT計算回路を用
いることによつて、DCT計算に必要な演算量
を約1/2に低減できるとともに差分伝送情報量
を減少させることができる。 なお、第4図においては、直接、ケプストラム
を量子化したが、ケプストラムは、比較的量子化
の影響を受け易いので、スペクトラム包絡を表わ
す低時間領域ケプストラムを量子化の影響に対し
てさほど敏感でないパラメータ値(一例として、
Kパラメータ)に変換した後に、量子化を施して
もよい。この様にした場合は、Kパラメータの量
子化ビツト数を低減させることが可能となり、サ
イド情報の伝送情報量を低減させることができ
る。尚、スペクトラム構造を少ないビツト数で表
わす手段としては、ケプストラム以外の手段(例
えば従来VD−ATC方式の様な擬似自己相関々数
から求めたKパラメータを用いることが考えられ
る)を用いることも可能である。 一例として第9図a〜iに、入力音声信号系列
の任意のブロツクを本発明の方式によつて処理し
た場合の各部の信号を示す。尚、図では離散信号
系列を連続信号として表現している。第9図a
は、第4図の実施例における窓関数回路20の出
力信号波形を示す。これは、入力音声信号系列の
任意のブロツク内のMサンプルの信号波形であ
る。第9図aの横軸は時間、縦軸は振幅である。
第9図bは第4図のDCT回路300の出力信号
で、第9図aの信号波形の離散的コサイン変換波
形を示す。第9図bの横軸は周波数、縦軸は振幅
である。第9図cは第4図の対数計算回路320
の出力信号であり、横軸は周波数、縦軸は振幅を
示す。第9図dは第4図のIDFT計算回路330
の出力信号である。この信号はケプストラムと呼
ばれている。横軸は時間、縦軸は振幅を示す。第
9図eは第4図のDFT計算回路360の出力信
号である。横軸は周波数を、縦軸は振幅を示す。
第9図fは第4図の指数計算回路370における
出力波形を示す。横軸は周波数、縦軸は振幅であ
る。第9図gは第4図のビツト割り当て量子化ス
テツプ計算回路400の出力である割り当てビツ
ト数を示す。横軸は周波数、縦軸は割り当てビツ
ト数である。第9図hは第4図のIDCT回路50
0の入力信号を示す。横軸は周波数、縦軸は振幅
である。第9図iは第4図のIDCT回路500の
出力信号波形であり、再生音声信号を示す。横軸
は時間、縦軸は振幅を示す。 第6図は本発明の第2の実施例を示すブロツク
図である。本実施例においては、送信側における
減算操作と、受信側における加算操作とを線形
(Linear)領域ではなく、対数領域で実行してい
る。第6図において、第4図と同一番号を記した
構成要素は、第4図と同一の動作をすることを示
す。この様な構成においては、送信側において、
指数計算回路が不要になることおよび差分スペク
トラムをより少ない量子化ビツト数で量子化する
ことができるため、伝送情報量を更に低減させる
ことが可能となる。 第7図は本発明の第3の実施例を示すブロツク
図である。第7図において、第4図と同一の番号
を記した構成要素は、第4図と同一の動作を行な
う。最初に、送信側の説明を行なう。DFT計算
回路600は窓関数回路20のM点の出力サンプ
ル値に対してM点DFTを施す。DFT係数をX(k)
(k=0,1,…,M−1),X(k)の実数部および
虚数部をそれぞれXR(k),XI(k)(k=0,1,
…,M−1)とすると,XR(k),XI(k)は絶対値位
相計算回路610に与えられる。計算回路610
における計算方法の一例を次に示す。 |X(k)|=√(R(k))2+(I(k))2 (11.a) arg(X(k))=tan-1(XI(k)/XR(k)) (11.b) (k=0,1,…,M−1) 上式において、|X|はXの絶対値,arg(x)は
Xの位相を表わす。ここで、DFTの入力信号は
音声信号であり、実数である。DFTの性質よ
り、実数信号をDFTした場合に、DFT係数の実
数部は偶関数、虚数部は奇関数となることが知ら
れている。従つて、DFT係数の絶対値は偶関
数、位相は奇関数となる。故に、入力信号の全情
報は、DFT係数のM/2点の絶対値および位相系
列に含まれていることは明白である。以後、M/2
点の絶対値および位相系列をそれぞれ|X(k)|
〓,arg(X(k))〓(k=0,1,…,M/2−1)と 表わす。M点の|X(k)|は減算器380と対数計
算回路320とに与えられ,M/2点のarg(X
(k))〓は、位相量子化符号器620に与えられ
る。対数計算回路320は、第4図の対数計算回
路320と同一の動作を行なう。IDFT計算回路
335は、対数計算回路320の出力値に対して
M点の逆DFT計算を行なう。本実施例の構成に
よれば、IDFT計算回路335の出力としてケプ
ストラムCP(n)(n=0,1,…,M−1)が
得られる。よく知られている様に、ケプストラム
CP(n)は偶関数である。リフタ回路340,
ピツチ検出回路345,量子化器350,復号器
355,サイド情報符号器410は、第4図にお
いて同一番号を記した構成要素と同一動作を行な
うので、説明を省略する。またDFT計算回路3
65は、M点のDFT計算を行なう。本実施例の
構成によれば、ケプストラムに対してDFT計算
を行なつてスペクトラム構造を求めているので、
高品質な対数領域再生スペクトラム|XL′(k)|
(k=0,1,…,M−1)を得ることができ
る。勿論,|XL′(k)|は偶関数であるため、
DFT計算回路360のM点の出力系列のうち、
M/2点系列(以下|XL′(k)|〓と記す。)が指数
計算回路370及びビツト割り当て/量子化ステ
ツプサイズ計算回路400に供給される。構成要
素370及び400は、第4図における同一番号
を記した構成要素と同一の動作を行なう。但し、
本実施例の構成を採用した場合には、構成要素3
70及び400はM/2点系列を対象とする。減算
器380は、絶対値位相計算回路610のM点の
絶対値出力|X(k)|(k=0,1,…,M−1)
のうちのM/2点系列、すなわち|X(k)|〓と、指
数計算回路370のM/2点の出力系列|′(k)|
〓との引き算を行ない、その差分を適応型量子化
符号器39に出力する。適応型量子化符号器39
0は、第4図における同一番号を記した構成要素
と同一の動作を行なう。位相量子化符号器620
は、arg(X(k))〓を量子化する。位相量子化符
号器620の量子化方法の一例としては、簡単な
方法として各位相成分に対して等ビツト(例えば
2ビツト程度)を割り当てて量子化を行なう方法
が考えられる。マルチプレクサ630は、位相量
子化器620の出力値は、適応型量子化符号器3
90の出力符号系列及びサイド情報符号器410
の出力符号系列を受け、これらを多重化して送信
側出力端子140を介して受信側へ伝送する。 受信側では、入力端子150に受信した符号を
デマルチプレクサ640に与え、受信符号系列か
ら位相を表わす符号系列と、差分を表わす符号系
列と、サイド情報を表わす符号系列とをそれぞれ
分離し、位相を表わす符号系列を位相復号器65
0に与え、差分を表わす符号系列を適応型後号器
470に与え、サイド情報を表わす符号系列をサ
イド情報復号器440に与える。位相復号器65
0は、入力符号系列からM/2点の位相系列を復号
し、変換回路660に出力する。サイド情報復号
器440は、第4図における同一番号の構成要素
と同一の動作を行なうが、本実施例の構成をとつ
た場合には、復号器440の出力としてケプスト
ラムが得られる。ケプストラムはDFT計算回路
455に与えられる。DFT計算回路450、指
数計算回路490及びビツト割り当て量子化ステ
ツプサイズ計算回路は、それぞれ送信側における
DFT計算回路365、指数計算回路370及び
ビツト割り当て量子化ステツプサイズ計算回路4
00と同一の動作を行なう。適応型復号器470
は、差分情報を復号し、加算器480に出力す
る。加算器480は、適応型復号器470の出力
値と、指数計算回路490のM/2点出力系列|
X′(k)|〓(k=0,1,…,M/2−1)とを加算し たM/2点絶対値系列|(k)|〓(k=0,1,
…,M/2−1)を変換回路660に出力する。変換 回路660は位相系列が奇関数,絶対値系列が偶
関数であることを利用してM/2点の位相系列およ
び絶対値系列からM点の位相系列および絶対値系
列を得て、これらをM点の実数部系列R(k)を
IDFT計算回路670に出力する。IDFT計算回
路670は、M点のR(k)及びI(k)に逆DFT計
算を行ない、再生信号(n)(n=0,1,
…,M−1)を得る。バツフアメモリ回路220
及び受信側出力端子230は、第4図における同
一番号の構成要素と同一の動作を行なう。 本実施例の構成により、第1の実施例の説明で
述べた(1)〜(3)と同様の効果が得られる。また、第
1の実施例同様、ケプストラムを他のパラメータ
(例えばKパラメータ)に変換して量子化し伝送
してもよいし、ケプストラム以外の手段を用いて
もよい。さらに、第2の実施例に示した様に、減
算、加算領域を対数領域としてもよい。この様に
することによる効果は第1、第2の実施例の場合
と同様である。 一般に、人間の耳は信号の位相成分に対しては
それほど敏感でないことが知られているため、本
実施例においては、位相成分に対しかなり粗い量
子化を施しても音質的劣化はほとんどない。位相
成分に対する量子化を粗くすることによつて、伝
送情報量を低減できるという効果がある。また位
相量子化の方法としては、本実施例で説明した方
法の他のブロツク内で位相成分を一次関数で近似
して、一次関数の傾きと、各位相成分の一次関数
の対応値との差異とを量子化して伝送してもよ
い。 さらにまた、入力音声系列に対して最小位相条
件を適用することも可能である。すなわち、入力
音声系列が最小位相条件を満足すると仮定して処
理を行なうものである。人間の耳が位相に対して
それほど敏感でないという前述の理由により最小
位相条件を適用しても音声劣化は少ない。この様
にした場合には、位相成分を受信側で再生するこ
とが可能となるので、位相成分を伝送する必要が
ない。従つて、差分に関する伝送情報量は1/2と
なり、全体的にみて伝送情報量の大幅な低減が可
能となる。 第8図は、最小位相条件を適用した本発明の第
4の実施例を表わすブロツク図である。第8図に
おいて、第7図における構成要素と同一番号を記
した構成要素は、第7図と同一の動作を行なうの
で、ここでは説明を省略する。第8図におけるリ
フタ回路700の高時間領域における動作は、第
7図におけるリフタ回路340と同一である。し
かしながら、低時間領域の動作においては、ケプ
ストラムに施すケプストラム窓は次に示す様にな
る。
−1)は窓関数回路20の出力値であり、Vc(k)
(k=0,1,…,M−1)はV(n)のMサン
プルのDCT係数を示す。(以下、同様な表現を用
いる。)また、逆コサイン変換(以下IDCTと記
す)は、次式に従い計算される。 MサンプルのDCT係数の計算法としては、2M
サンプルの離散的フーリエ変換(Discrete
Fourier Transform;以下DFTと記す)を用い
る計算法が知られている。この計算法を以下に簡
単に説明する。 今、u(n)をMサンプルのサンプル値系列と
し、次の様に定義する。 2MサンプルのDFTをU(k)とすると、U(k)は 従つて、MサンプルのDCT系数、Vc(k)は次の様
に求まる。 Vc(k)=Re{c(k)exp(−jπk/2M)U(k)} k=0,1,2…,M−1 (6) 上式で記号Re{ }は、実数部を表わす。ま
た、演算量を大幅に低減させる計算法としては、
ジエー・マクホウル(J.MAKHOUL)氏による
アイ・イー・イー・イー・トランザクシヨンズ・
オン・アコーステイクス・スピーチ・アンド・シ
グナルプロセツシング(IEEE Transactions on
Acoustics,Speech,and Signal Processing)
誌の1980年、第28巻、2月号第27頁〜第34頁掲載
の「ア・フアースト・コサイン・トランスフオー
ム・イン・ワン・アンド・トウー・デイメンシヨ
ンズ」(“A Fast Cosine Transform in One
and Two Dimensions”」と題する論文に詳細に
説明されているので、ここでは説明を省略する。
再び第2図に戻つて、DCT回路30の出力値、
すなわち、MサンプルDCT係数は、自己相関々
数計算回路40とDCT係数量子化符号化回路1
10に入力される。自己相関々数計算回路40は
入力値であるMサンプルの各DCT係数の2乗値
を計算し、これら計算結果に2Mサンプルの逆
DFT(IDFT)を施し、M個の擬似自己相関々数
を計算する。M個の擬似自己相関々数は、ピツチ
抽出回路50及び予測パラメータ計算回路70に
それぞれ与えられる。ピツチ抽出回路50は、M
個の自己相関々数を用いてピツチ周期P及びピツ
チゲインPGを計算し、量子化器60に与える。
予測パラメータ計算回路70は、M個の自己相
関々数を用いて所定の数の予測パラメータ値系列
(一例としてKパラメータ値系列とする。)を計算
し、このKパラメータ値系列を量子化器60に供
給する。尚、Kパラメータはパーコールパラメー
タとも呼ばれる。量子化器60は、ピツチ周期
P、ピツチゲインPGおよびKパラメータ値系列
を所定の量子化ビツト数で量子化し、得られた量
子化パラメータ値を逆量子化器65及びサイド情
報符号器130に与える。逆量子化器65は、入
力した量子化パラメータ値を逆量子化し、得られ
たピツチ周期P′およびピツチゲインPG′をスペク
トラム再生回路90に供給する。また、逆量子化
して得たKパラメータ値系列をパラメータ変換回
路80に与える。パラメータ変換回路80は、入
力されたKパラメータ値系列をスペクトラム再生
に適したパラメータ値系列(例えば、αパラメー
タ値系列)に変換し、このαパラメータ値系列を
スペクトラム再生回路90に与える。尚、αパラ
メータは線形予測係数とも呼ばれる。スペクトラ
ム再生回路90は、ピツチ周期P′とピツチゲイン
PG′とを用いてピツチスペクトラムσp(k)を計算
する。また、αパラメータ値系列を用いて包絡ス
ペクトラムσf(k)を計算する。ここで、包絡スペ
クトラムはフオルマントスペクトラムとも呼ばれ
る。さらに、σp(k)とσf(k)とを用いてスペクトラ
ムを再生する。以下、再生スペクトラムをσ(k)
(k=0,1…,M−1)と記すことにする。次
にσf(k),σ(k)は、ビツト割り当てステツプサイ
ズ計算回路100に入力される。ビツト割り当て
ステツプサイズ計算回路100の計算アルゴリズ
ムを次に説明する。まず、最初にステツプサイズ
計算アルゴリズムを示す。 Δ(k)=Q・A(b(k))・σ(k) (k=0,1,…,M−1) (7) ここで、Δ(k)は、第k番目のDCT係数を量子
化する際の量子化ステツプサイズを示し、σ(k)は
前記再生スペクトラムである。b(k)は割り当てビ
ツト数であり、A(b(k))は、b(k)により決まる
定数である。Qは、負荷係数であり、負荷に対す
る量子化器の雑音特性を決める。次に、ビツト割
り当て計算アルゴリズムを示す。k番目のDCT
係数に対する割り当てビツト数は、次式により計
算される。 b(k)=δ+1/2log2w(k)σ2(k)/D (k=0,1,…,M−1) (8) ここで、δは実際の量子化器に適用する際の修
正項、w(k)は周波数重み関数、Dは次式で示され
る量子化雑音電力を示す。 ここで、σe 2(k)は、k番目のDCT係数の量子
化雑音電力を示す。前記周波数重み関数w(k)は、
次の様に表わされる。 w(k)=σf 2〓(k)(k=0,1,…,M−1) (10) ここで、σf(k)は前述の包絡スペクトラムであ
る。γは量子化雑音電力の周波数特性を決定する
因子で、−1≦γ≦0の値をとる。γの値による
量子化雑音電力σe 2(k)の変化を第3図に示す。
第3図において、横軸はkの値を示し、縦軸は対
数電力を示す。また、実線部は、信号電力スペク
トラムを示し、破線部は、量子化雑音電力スペク
トラムを示す。γ=0の時は、量子化雑音電力ス
ペクトラムは平坦な特性を示し、γ=−1の時
は、信号電力スペクトラムと同様な特性を示す。
γの値としては、普通は−1<γ<0の値を用い
る。γの値によつて量子化雑音電力スペクトラム
の特性を変化させる手法を、ノイズ・シエイピン
グ(Noise Shaping)と呼ぶ。次にDCT係数適応
型量子化符号化回路110を説明する。DCT係
数適応型量子化符号化回路110は、ビツト割り
当てステツプサイズ計算回路100の出力値であ
る量子化ステツプサイズΔ(k)と割り当てビツト数
b(k)を用いて、DCT回路30の出力値である
DCT係数を適応的に量子化、符号化する。符号
化されたDCT係数は、マルチプレクサ120に
与えられる。サイド情報符号器130は、量子化
器60からの量子化パラメータ値をサイド情報と
して符号化し、マルチプレクサ120に供給す
る。マルチプレクサ120は、サイド情報符号器
130の出力符号とDCT係数適応型量子化符号
化回路110の出力符号とを、Mサンプル時刻毎
に送信側出力端子140を介して伝送する。 次に受信側の動作を説明する。受信側では、受
信側入力端子150に受信した送信符号はデマル
チプレクサ160に与えられ、この受信符号を、
DCT係数を表わす符号と、サイド情報を表わす
符号として分離する。分離されたDCT係数を表
わす符号はDCT係数適応型復号器200に与え
られ、サイド情報を表わす符号はサイド情報復号
器170に与えられる。サイド情報復号器170
は入力された符号を復号し、ピツチ周期P′及びピ
ツチゲインPG′と、Kパラメータ値系列とを分離
し、Kパラメータ値系列をパラメータ変換回路1
75に与え、ピツチ周期P′とピツチゲインPG′と
をスペクトラム再生回路180に与える。ここ
で、パラメータ変換回路175は、送信側のパラ
メータ変換回路80と同一の動作を行ない、Kパ
ラメータ値系列をαパラメータ値系列へ変換し、
αパラメータ値系列をスペクトラム再生回路18
0に与える。スペクトラム再生回路180は、送
信側におけるスペクトラム再生回路90と同一の
動作を行ない、再生スペクトラムσ(k)及び包絡ス
ペクトラムσf(k)を、ビツト割り当てステツプサ
イズ計算回路190に供給する。ビツト割り当て
ステツプサイズ計算回路190は、送信側におけ
るビツト割り当てステツプサイズ計算回路100
と同一の動作を行ない、量子化ステツプサイズΔ
(k)及び割り当てビツト数b(k)をDCT係数適応型
復号器200に供給する。DCT係数適応型復号
器200は、前記Δ(k)及びb(k)を用いて、デマル
チプレクサ160から入力した値を復号化して
DCT係数を得る。得られたDCT係数は、逆DCT
(IDCT)回路210に入力され、Mサンプルの
DCT係数に逆コサイン変換を施し、Mサンプル
の再生信号(n)(n=0,1,…,M−1)
を得る。バツフアメモリ回路220は、Mサンプ
ルの(n)を一旦蓄積した後に、受信側出力端
子230を介して出力する。 以上説明したVD−ATC方式は、16kビツト/
秒前後の伝送速度において非常に高品質な音声信
号を得ることができる。しかしながら、このVD
−ATC方式は、DCT係数とサイド情報の双方を
伝送しなければならないので、大幅な伝送情報量
の圧縮が難しく、また低速伝送(例えば9.6kビツ
ト/秒以下)においては、再生音声の品質が劣化
するという欠点がある。音声品質劣化の一例とし
ては、ピツチ情報が充分に再現されないことによ
り再生音声がしわがれた感じの音になることが挙
げられる。これは、低速伝送においては、包絡ス
ペクトラム及びピツチスペクトラム等を充分に再
現できないことに起因する。 本発明の目的は、伝送情報量を低減でき、かつ
低速伝送においても高品質な音声信号の再生が可
能な適応型音声信号伝送方法を提供することにあ
る。 本発明による伝送方法は、音声信号をサンプリ
ングして得たサンプル値系列を直交変換した直交
変換系列を適応的に量子化して伝送する適応型音
声信号伝送方法において、前記サンプル値系列の
直交変換離散系列を表わす第1の信号系列を発生
し、前記第1の信号系列に基づいて前記第1の信
号系列が有する特徴を表わす第2の信号系列を発
生し、前記第2の信号系列に基づいてスペクトラ
ムを表わす第3の信号系列を発生し、前記第1の
信号系列と前記第3の信号系列との差分系列を計
算し、前記差分系列を適応量子化した第4の信号
系列を発生し、前記第2の信号系列と前記第4の
信号系列とを組み合わせて伝送することを特徴と
している。 次に、本発明を図面を参照して詳細に説明す
る。第4図は、本発明の第1の実施例を示すブロ
ツク図である。本実施例においては、直交変換と
してDCTを用いている。第4図の送信側におい
て、バツフアメモリ15および窓関数回路20
は、第1図の同一番号の構成要素と同一の動作を
行う。DCT回路300は窓関数回路20のM個
の出力値に対して離散的コサイン変換(DCT)
を施し、DCT係数Vc(k)(k=0,1,…,M−
1)を出力する。DCTの計算法としては、前記
VD−ATC方式の説明の所で述べた様に、DFTま
たは文献3等で明されている方法に従つて計算で
きる。絶対値回路310は、入力されたVc(k)
(k=0,1,…,M−1)の符号情報を適応型
量子化符号器390に与える。また、Vc(k)の絶
対値|Vc(k)|を計算し、その計算結果を対数計
算回路320と減算器380に与える。対数計算
回路320は、DCT係数の絶対値|Vc(k)|(k
=0,1,…,M−1)の対数LOG|Vc(k)|
(k=0,1,…,M−1)の値を計算する。2M
点の逆離散的フーリエ変換(Irverse Discrete
Fourier Transform;以下IDFTと記す)回路3
20は、前記対数計算回路320の出力値の
IDFTを計算し、擬似ケプストラムC(h)(n=
0,1,…,2M−1)を得る。ここで擬似と表
現したのは、DCT係数よりケプストラムを求め
ているためである。 尚、ケブストラムの詳細は、デイー・ジー・チ
ルダーズ(D.G.CHILDERS)氏らによるプロシ
ーデイングズ・オブ・アイー・イー・イー・イー
(PROCEEDINGS OF THE IEEE)誌の1977
年、第65巻、10月号1428頁〜1443頁に掲載の
「ザ・ケプストラム:ア・ガイド・トウー・プロ
セツシング」(“The Cepstrum:AGuide to
Processing”)と題する論文に述べられているの
で、ここでは説明を省略する。 擬似ケプストラムC(n)は、リフタ回路34
0に入力される。リフタ回路340は、擬似ケプ
ストラムC(n)に所定の窓関数を乗じ、低時間
部分と高時間部分とを分離して抽出し、低時間部
分を量子化器350に与え、高時間部分をピツチ
検出回路345に与える。一般に、ケプストラム
の低時間部分は、入力音声信号の包絡スペクトラ
ム情報を含み、高時間部分はピツチ(ピツチ周期
及びピツチゲイン)を含んでいることが知られて
いることから擬似ケプストラムに対しても同様な
ことが成立すると考えられる。ピツチ検出回路3
45は、ピツチ周期Pと、ピツチゲインPGを検
出して量子化器350に与える。量子化器350
は、リフタ回路340から出力された擬似ケプス
トラムの低時間部分と、ピツチ検出回路345よ
り出力されたピツチ周期PおよびピツチゲインP
Gとを所定の量子化ビツト数で量子化する。以
後、擬似ケプストラムの低時間部分と、ピツチ周
期PおよびピツチゲインPGとの量子化値をサイ
ド情報と呼ぶことにする。量子化器350より出
力されたサイド情報は、復号器355と、サイド
情報符号器410とに入力される。復号器355
はサイド情報を復号化して、DFT計算回路36
0に与える。離散的フーリエ変換(Discrete
Fourier Transform;以下DFTと記す)回路3
60は、復号されたサイド情報に2M点のDFTを
施し、対数領域における再生スペクトラムを得
る。この内の最初のM点の再生スペクトラムをσ
L′(k)(k=0,1,…,M−1)とすると、σ
L′(k)は、ピツチスペクトラムσP′(k)と包絡スペク
トラムσf′(k)(k=0,1,…,M−1)とから
構成されている。ここで、包絡スペクトラムσ
f′(k)、ピツチスペクトラムσP′(k)及び再生スペク
トラムσL′(k)の一例を第5図a,b,cに示す。
第5図において、横軸はいずれもkの値(0〜M
−1)を表わし、縦軸は対数振幅を表わす。尚、
図においては、視覚的にわかりやすくするため
に、各スペクトラム値を連続的に示してある。 対数領域における再生スペクトラムσL′(k)は、
指数計算回路370およびビツト割り当てステツ
プサイズ計算回路400に与えられる。指数計算
回路370は、入力値に対して指数を計算する。
すなわち、対数計算回路320における処理と逆
処理を行う。指数計算回路370の出力値σ′(k)
(k=0,1,…,M−1)は、減算器380に
与えられ、絶対値回路310の出力値である|V
c(k)|と指数計算回路370の出力値σ′(k)との差
分e(k)(k=0,1,…,M−1)を計算し、計
算結果を適応型量子化符号器390に与える。適
応型量子化符号器390は、ビツト割り当て量子
化ステツプサイズ計算回路400から出力される
量子化ステツプサイズと割り当てビツト数とを用
いて、前記e(k)を適応的に量子化するとともに、
絶対値計算回路310から供給されるVc(k)の符
号情報を用いて符号化する。適応型量子化符号器
からの符号系列は、マルチプレクサ420に与え
られる。ビツト割り当て量子化ステツプサイズ計
算回路400は、DFT計算回路360から供給
された再生スペクトラムσL′(k)を用いて差分e(k)
に対する量子化ビツト数及び量子化ステツプサイ
ズを計算する。量子化ステツプサイズの計算法と
しては、前記(7)式を適用できる。量子化ビツト数
の割り当て方法の最も簡単な方法としては、全て
等しいビツト数(例えば2ビツト)を割り当てる
方法が考えられる。この様な量子化ビツト割り当
て方法では、量子化雑音電力スペクトラムは、信
号電力スペクトラムと相似な特性をもつ。即ち、
第3図において、γ=−1とした場合と同様な特
性となる。従来のVD−ATC方式においては、等
しいビツト数で量子化する場合には、DCT係数
Vc(k)に対して少なからぬビツト数(4ビツトあ
るいは5ビツト)を割り当てる必要があり、この
ため、伝送情報量が非常に増大してしまうという
欠点があつたが、本発明では、CT係数の量子化
ではなく、差分e(k)を量子化しているので、少な
いビツト数でも音質劣化はほとんどなく、伝送情
報量もそれほど増大しない。勿論、適応型ビツト
割り当て、あるいはノイズ・シエイピングを施す
ことも可能であり、その様にする場合には、前記
(8)〜(10)式を適用すればよい。しかしながら、本実
施例の場合にノイズ・シエイピングを効果的に適
用するためには、γの値として従来のVD−ATC
方式の説明で述べた値と異なる値を採用しなくて
はならない。つまり、本実施例の場合には量子化
雑音電力スペクトラムの特性は、γ=1の時に平
坦な特性となり、γ=0の時には、信号電力スペ
クトラムと相似な特性となる。従つて、γの値と
しては、0<γ<1の値を採用しなくてはならな
い。 マルチプレクサ420は、適応型量子化符号器
390の出力符号系列とサイズ情報符号器410
の出力符号系列とを受け、これらの符号系列を多
重化して送信側出力端子140を介し受信側へ伝
送する。 次に、受信側の動作を説明する。受信側におい
ては、伝送された符号系列を受信側入力端子15
0を介して受信し、デマルチプレクサ430に与
える。デマルチプレクサ430は、差分e(k)(k
=0,1,…,M−1)を表わす符号系列と、サ
イド情報を表わす符号系列とを分離し、前者を適
応型復号器470に供給し、後者をサイド情報復
号器440に供給する。サイド情報復号器440
は、入力された符号系列を復号化し復号化サイド
情報を得て、これらをDFT計算回路450に出
力する。ここで、DFT計算回路450は、送信
側のDFT計算回路360と同一の動作を行な
い、復号化サイド情報を用いて対数領域のスペク
トラムσL′(k)(k=0,1,…,M−1)を再生
する。σL′(k)は、ビツト割り当てステツプサイズ
計算回路460と指数計算回路490とに出力さ
れる。ビツト割り当てステツプサイズ計算回路4
60は、送信側のビツト割り当てステツプサイズ
計算回路400と同一の動作を行なう。また、指
数計算回路490は、送信側の指数計算回路37
0と同一の動作を行なう。指数計算回路370の
出力値σ′(k)(k=0,1,…,M−1)は、加
算器480に出力される。適応型復号器470
は、送信側における適応型量子化符号器390と
逆の動作を行なう。すなわち、入力された符号系
列からDCT係数の符号情報を分離してこれを
IDCT回路500に与える。また、割り当てビツ
ト数及び量子化ステツプサイズとを用いて、差分
e(k)を表わす符号を復号化したe(k)を加算器48
0に与える。加算器480は、差分e(k)とσ′(k)
とを加算し、DCT係数の絶対値を表わす|c(k)
|(k=0,1,…,M−1)を得る。|c(k)
|は、IDCT(逆コサイン変換)回路500に与
えられる。IDCT回路500は、DCT係数の符号
情報と|c(k)|とからDCT係数c(k)(k=0,
1,…,M−1)を求め、M点の逆DCTをDCT
係数c(k)に対して施し、再生信号(n)((n
=0,1,…,M−1)を得る。IDCT回路50
0の出力値(n)は、バツフアメモリ回路22
0に与えられ、Mサンプル分信号が蓄積された後
に、再生音声信号として受信側出力端子230を
介して出力される。 このような構成により、従来のVD−ATC方式
と比較して次のような効果がある。 (1) 本実施例によればDCT係数を直接量子化す
るのではな、差分e(k)を量子化して伝送してい
るので、差分e(k)を量子化して伝送するための
情報量を、従来方式のDCT係数を伝送する場
合と比べ、1/2近くまで抵減させることが可能
で、少ない伝送情報量で従来方式VD−ATC方
式と同等の音質が得られる。 (2) 従来VD−ATC方式においては、サイド情報
は量子化ステツプサイズ及び割り当てビツト数
の計算に寄与し伝送情報量を9.6kbps以下とし
た場合に、ススペクトラムの欠落が増大し、受
信側において音声信号の再生に必要なスペクト
ラム構造、すなわちスペクトラム包絡構造及び
ピツチ構造を忠実に再現できないこと等の理由
により、音質的劣化が生じているが、本実施例
の構成によれば、受信側において伝送されたサ
イド情報を用いて、音声信号の再生に必要なス
ペクトラム構造を再現することができるので、
伝送情報量を9.6kビツト/秒以下に低減して
も、高品質な再生音声を得ることができる。 (3) 演算量低減のために割り当てビツト数の計算
方法として簡単な方法(一例として全ての差分
に対して2ビツトを割り当てる)を用いても、
音質の劣化はほとんどない。なお、DCT係数
の計算において、5.a,5.b,(6)式で示し
た様に、DFTを用いて計算する場合には、ケ
プストラムの計算をDFT係数を用いて行なつ
てもよい。この様にして求めたケプストラム
は、DCT係数より計算した擬似ケプストラム
と比較して、入力信号のスペクトラム構造をよ
り良好に近似することが能である。この様にし
た場合には、2M点DFT計算回路360および
450のかわりに、M点DCT計算回路を用い
ることも可能である。M点DCT計算回路を用
いることによつて、DCT計算に必要な演算量
を約1/2に低減できるとともに差分伝送情報量
を減少させることができる。 なお、第4図においては、直接、ケプストラム
を量子化したが、ケプストラムは、比較的量子化
の影響を受け易いので、スペクトラム包絡を表わ
す低時間領域ケプストラムを量子化の影響に対し
てさほど敏感でないパラメータ値(一例として、
Kパラメータ)に変換した後に、量子化を施して
もよい。この様にした場合は、Kパラメータの量
子化ビツト数を低減させることが可能となり、サ
イド情報の伝送情報量を低減させることができ
る。尚、スペクトラム構造を少ないビツト数で表
わす手段としては、ケプストラム以外の手段(例
えば従来VD−ATC方式の様な擬似自己相関々数
から求めたKパラメータを用いることが考えられ
る)を用いることも可能である。 一例として第9図a〜iに、入力音声信号系列
の任意のブロツクを本発明の方式によつて処理し
た場合の各部の信号を示す。尚、図では離散信号
系列を連続信号として表現している。第9図a
は、第4図の実施例における窓関数回路20の出
力信号波形を示す。これは、入力音声信号系列の
任意のブロツク内のMサンプルの信号波形であ
る。第9図aの横軸は時間、縦軸は振幅である。
第9図bは第4図のDCT回路300の出力信号
で、第9図aの信号波形の離散的コサイン変換波
形を示す。第9図bの横軸は周波数、縦軸は振幅
である。第9図cは第4図の対数計算回路320
の出力信号であり、横軸は周波数、縦軸は振幅を
示す。第9図dは第4図のIDFT計算回路330
の出力信号である。この信号はケプストラムと呼
ばれている。横軸は時間、縦軸は振幅を示す。第
9図eは第4図のDFT計算回路360の出力信
号である。横軸は周波数を、縦軸は振幅を示す。
第9図fは第4図の指数計算回路370における
出力波形を示す。横軸は周波数、縦軸は振幅であ
る。第9図gは第4図のビツト割り当て量子化ス
テツプ計算回路400の出力である割り当てビツ
ト数を示す。横軸は周波数、縦軸は割り当てビツ
ト数である。第9図hは第4図のIDCT回路50
0の入力信号を示す。横軸は周波数、縦軸は振幅
である。第9図iは第4図のIDCT回路500の
出力信号波形であり、再生音声信号を示す。横軸
は時間、縦軸は振幅を示す。 第6図は本発明の第2の実施例を示すブロツク
図である。本実施例においては、送信側における
減算操作と、受信側における加算操作とを線形
(Linear)領域ではなく、対数領域で実行してい
る。第6図において、第4図と同一番号を記した
構成要素は、第4図と同一の動作をすることを示
す。この様な構成においては、送信側において、
指数計算回路が不要になることおよび差分スペク
トラムをより少ない量子化ビツト数で量子化する
ことができるため、伝送情報量を更に低減させる
ことが可能となる。 第7図は本発明の第3の実施例を示すブロツク
図である。第7図において、第4図と同一の番号
を記した構成要素は、第4図と同一の動作を行な
う。最初に、送信側の説明を行なう。DFT計算
回路600は窓関数回路20のM点の出力サンプ
ル値に対してM点DFTを施す。DFT係数をX(k)
(k=0,1,…,M−1),X(k)の実数部および
虚数部をそれぞれXR(k),XI(k)(k=0,1,
…,M−1)とすると,XR(k),XI(k)は絶対値位
相計算回路610に与えられる。計算回路610
における計算方法の一例を次に示す。 |X(k)|=√(R(k))2+(I(k))2 (11.a) arg(X(k))=tan-1(XI(k)/XR(k)) (11.b) (k=0,1,…,M−1) 上式において、|X|はXの絶対値,arg(x)は
Xの位相を表わす。ここで、DFTの入力信号は
音声信号であり、実数である。DFTの性質よ
り、実数信号をDFTした場合に、DFT係数の実
数部は偶関数、虚数部は奇関数となることが知ら
れている。従つて、DFT係数の絶対値は偶関
数、位相は奇関数となる。故に、入力信号の全情
報は、DFT係数のM/2点の絶対値および位相系
列に含まれていることは明白である。以後、M/2
点の絶対値および位相系列をそれぞれ|X(k)|
〓,arg(X(k))〓(k=0,1,…,M/2−1)と 表わす。M点の|X(k)|は減算器380と対数計
算回路320とに与えられ,M/2点のarg(X
(k))〓は、位相量子化符号器620に与えられ
る。対数計算回路320は、第4図の対数計算回
路320と同一の動作を行なう。IDFT計算回路
335は、対数計算回路320の出力値に対して
M点の逆DFT計算を行なう。本実施例の構成に
よれば、IDFT計算回路335の出力としてケプ
ストラムCP(n)(n=0,1,…,M−1)が
得られる。よく知られている様に、ケプストラム
CP(n)は偶関数である。リフタ回路340,
ピツチ検出回路345,量子化器350,復号器
355,サイド情報符号器410は、第4図にお
いて同一番号を記した構成要素と同一動作を行な
うので、説明を省略する。またDFT計算回路3
65は、M点のDFT計算を行なう。本実施例の
構成によれば、ケプストラムに対してDFT計算
を行なつてスペクトラム構造を求めているので、
高品質な対数領域再生スペクトラム|XL′(k)|
(k=0,1,…,M−1)を得ることができ
る。勿論,|XL′(k)|は偶関数であるため、
DFT計算回路360のM点の出力系列のうち、
M/2点系列(以下|XL′(k)|〓と記す。)が指数
計算回路370及びビツト割り当て/量子化ステ
ツプサイズ計算回路400に供給される。構成要
素370及び400は、第4図における同一番号
を記した構成要素と同一の動作を行なう。但し、
本実施例の構成を採用した場合には、構成要素3
70及び400はM/2点系列を対象とする。減算
器380は、絶対値位相計算回路610のM点の
絶対値出力|X(k)|(k=0,1,…,M−1)
のうちのM/2点系列、すなわち|X(k)|〓と、指
数計算回路370のM/2点の出力系列|′(k)|
〓との引き算を行ない、その差分を適応型量子化
符号器39に出力する。適応型量子化符号器39
0は、第4図における同一番号を記した構成要素
と同一の動作を行なう。位相量子化符号器620
は、arg(X(k))〓を量子化する。位相量子化符
号器620の量子化方法の一例としては、簡単な
方法として各位相成分に対して等ビツト(例えば
2ビツト程度)を割り当てて量子化を行なう方法
が考えられる。マルチプレクサ630は、位相量
子化器620の出力値は、適応型量子化符号器3
90の出力符号系列及びサイド情報符号器410
の出力符号系列を受け、これらを多重化して送信
側出力端子140を介して受信側へ伝送する。 受信側では、入力端子150に受信した符号を
デマルチプレクサ640に与え、受信符号系列か
ら位相を表わす符号系列と、差分を表わす符号系
列と、サイド情報を表わす符号系列とをそれぞれ
分離し、位相を表わす符号系列を位相復号器65
0に与え、差分を表わす符号系列を適応型後号器
470に与え、サイド情報を表わす符号系列をサ
イド情報復号器440に与える。位相復号器65
0は、入力符号系列からM/2点の位相系列を復号
し、変換回路660に出力する。サイド情報復号
器440は、第4図における同一番号の構成要素
と同一の動作を行なうが、本実施例の構成をとつ
た場合には、復号器440の出力としてケプスト
ラムが得られる。ケプストラムはDFT計算回路
455に与えられる。DFT計算回路450、指
数計算回路490及びビツト割り当て量子化ステ
ツプサイズ計算回路は、それぞれ送信側における
DFT計算回路365、指数計算回路370及び
ビツト割り当て量子化ステツプサイズ計算回路4
00と同一の動作を行なう。適応型復号器470
は、差分情報を復号し、加算器480に出力す
る。加算器480は、適応型復号器470の出力
値と、指数計算回路490のM/2点出力系列|
X′(k)|〓(k=0,1,…,M/2−1)とを加算し たM/2点絶対値系列|(k)|〓(k=0,1,
…,M/2−1)を変換回路660に出力する。変換 回路660は位相系列が奇関数,絶対値系列が偶
関数であることを利用してM/2点の位相系列およ
び絶対値系列からM点の位相系列および絶対値系
列を得て、これらをM点の実数部系列R(k)を
IDFT計算回路670に出力する。IDFT計算回
路670は、M点のR(k)及びI(k)に逆DFT計
算を行ない、再生信号(n)(n=0,1,
…,M−1)を得る。バツフアメモリ回路220
及び受信側出力端子230は、第4図における同
一番号の構成要素と同一の動作を行なう。 本実施例の構成により、第1の実施例の説明で
述べた(1)〜(3)と同様の効果が得られる。また、第
1の実施例同様、ケプストラムを他のパラメータ
(例えばKパラメータ)に変換して量子化し伝送
してもよいし、ケプストラム以外の手段を用いて
もよい。さらに、第2の実施例に示した様に、減
算、加算領域を対数領域としてもよい。この様に
することによる効果は第1、第2の実施例の場合
と同様である。 一般に、人間の耳は信号の位相成分に対しては
それほど敏感でないことが知られているため、本
実施例においては、位相成分に対しかなり粗い量
子化を施しても音質的劣化はほとんどない。位相
成分に対する量子化を粗くすることによつて、伝
送情報量を低減できるという効果がある。また位
相量子化の方法としては、本実施例で説明した方
法の他のブロツク内で位相成分を一次関数で近似
して、一次関数の傾きと、各位相成分の一次関数
の対応値との差異とを量子化して伝送してもよ
い。 さらにまた、入力音声系列に対して最小位相条
件を適用することも可能である。すなわち、入力
音声系列が最小位相条件を満足すると仮定して処
理を行なうものである。人間の耳が位相に対して
それほど敏感でないという前述の理由により最小
位相条件を適用しても音声劣化は少ない。この様
にした場合には、位相成分を受信側で再生するこ
とが可能となるので、位相成分を伝送する必要が
ない。従つて、差分に関する伝送情報量は1/2と
なり、全体的にみて伝送情報量の大幅な低減が可
能となる。 第8図は、最小位相条件を適用した本発明の第
4の実施例を表わすブロツク図である。第8図に
おいて、第7図における構成要素と同一番号を記
した構成要素は、第7図と同一の動作を行なうの
で、ここでは説明を省略する。第8図におけるリ
フタ回路700の高時間領域における動作は、第
7図におけるリフタ回路340と同一である。し
かしながら、低時間領域の動作においては、ケプ
ストラムに施すケプストラム窓は次に示す様にな
る。
【表】
上式において、(n)は、ケプストラム窓を
示し、n0はピツチ周期tよりも短い任意の正の値
である。 尚、以上述べてきた4つの実施例における
DFT計算に関しては、高速に演算するアルゴリ
ズムとして高速フーリエ変換(Fast Fourier
Trans form;以下FFTと記す)が知られている
ので、FFTを用いれば演算速度は大幅に減少す
る。 また、ケプストラムからの入力信号の構造スペ
クトラムを再生する際に、前述の実施例において
はピツチスペクトラムと包絡スペクトラムの両者
を用いて再生を行なつたが、ピツチスペクトラム
を除いて、包絡スペクトラムのみを用いて再生を
行なつてもよい。この様にすれば、ピツチに関す
る情報は差分系列に含まれて伝送されるので、ピ
ツチ検出回路は不要となり、ピツチ検出回路にお
けるピツチ情報の検出誤りを防ぐことができる。 以上述べたように、本発明によれば、直交変換
係数とサイド情報から再生されるスペクトラムと
の差分を伝送しているので、直交変換係数を伝送
する従来方式と比べ、伝送情報を1/2近くまで低
減することが可能であり、従来方式では音質が劣
化していた9.6Kビツト/秒以下の低伝送速度に
おいても高品質な音声信号を得ることができる。
示し、n0はピツチ周期tよりも短い任意の正の値
である。 尚、以上述べてきた4つの実施例における
DFT計算に関しては、高速に演算するアルゴリ
ズムとして高速フーリエ変換(Fast Fourier
Trans form;以下FFTと記す)が知られている
ので、FFTを用いれば演算速度は大幅に減少す
る。 また、ケプストラムからの入力信号の構造スペ
クトラムを再生する際に、前述の実施例において
はピツチスペクトラムと包絡スペクトラムの両者
を用いて再生を行なつたが、ピツチスペクトラム
を除いて、包絡スペクトラムのみを用いて再生を
行なつてもよい。この様にすれば、ピツチに関す
る情報は差分系列に含まれて伝送されるので、ピ
ツチ検出回路は不要となり、ピツチ検出回路にお
けるピツチ情報の検出誤りを防ぐことができる。 以上述べたように、本発明によれば、直交変換
係数とサイド情報から再生されるスペクトラムと
の差分を伝送しているので、直交変換係数を伝送
する従来方式と比べ、伝送情報を1/2近くまで低
減することが可能であり、従来方式では音質が劣
化していた9.6Kビツト/秒以下の低伝送速度に
おいても高品質な音声信号を得ることができる。
第1図は適応型変換符号化方式における従来方
式の一例を示すVD−ATC(Vocoder Diwen
Adaptive Transform Coding)方式のブロツク
図、第2図は窓関数の一例を示す図、第3図はノ
イズ・シエイピング(Noise Shaping)を適用し
た場合の信号スペクトラムの一例を示す図、第4
図は本発明の第1の実施例を示すブロツク図、第
5図は音声信号のスペクトラム構造を表わす信号
スペクトラムの一例を示す図、第6図は本発明の
第2の実施例を示すブロツク図、第7図は本発明
の第3の実施例を示すブロツク図、第8図は本発
明の第4の実施例を示すブロツク図および第9図
(a)〜(i)は第4図の装置の動作を説明する波形図で
ある。 図において、10……送信側入力端子、15…
…バツフアメモリ回路、20……窓関数回路、3
0,300……逆散的コサイン変換(DCT)回
路、40……自己相関々数計算回路、50……ピ
ツチ検出回路、60……量子化器、65……逆量
子化器、70……予測パラメータ計算回路、80
……パラメータ変換回路、90……スペクトラム
再生回路、100……ビツト割り当てステツプサ
イズ計算回路、110……DCT係数適応型量子
化符号化回路、120,420,630……マル
チプレクサ、130,410……サイド情報符号
器、140……送信側出力端子、150……受信
側入力端子、160,430,640……デマル
チプレクサ、170,440……サイド情報復号
器、175……パラメータ変換回路、180……
スペクトラム再生回路、190……ビツト割り当
てステツプサイズ計算回路、200……DCT係
数適応型復号器、210,500……逆離散的コ
サイン変換(IDCT)回路、220……バツフア
メモリ回路、230……受信側出力端子、310
……絶対値回路、320……対数計算回路、33
0,335,670……逆離散的フーリエ変換
(IDFT)計算回路、340,700……リフタ
回路、345……ピツチ検出回路、350……量
子化器、355……復号器、360,365,4
50,455,600……離散的フーリエ変換
(DFT)計算回路、37,490……指数計算回
路、380……減算器、390……適応型量子化
符号器、400,460……ビツト割り当て量子
化ステツプサイズ計算回路、470……適応型復
号器、480……加算器、610……絶対値位相
計算回路、620……位相量子化符号器、650
位相復号器、660……変換回路、をそれぞれ示
す。
式の一例を示すVD−ATC(Vocoder Diwen
Adaptive Transform Coding)方式のブロツク
図、第2図は窓関数の一例を示す図、第3図はノ
イズ・シエイピング(Noise Shaping)を適用し
た場合の信号スペクトラムの一例を示す図、第4
図は本発明の第1の実施例を示すブロツク図、第
5図は音声信号のスペクトラム構造を表わす信号
スペクトラムの一例を示す図、第6図は本発明の
第2の実施例を示すブロツク図、第7図は本発明
の第3の実施例を示すブロツク図、第8図は本発
明の第4の実施例を示すブロツク図および第9図
(a)〜(i)は第4図の装置の動作を説明する波形図で
ある。 図において、10……送信側入力端子、15…
…バツフアメモリ回路、20……窓関数回路、3
0,300……逆散的コサイン変換(DCT)回
路、40……自己相関々数計算回路、50……ピ
ツチ検出回路、60……量子化器、65……逆量
子化器、70……予測パラメータ計算回路、80
……パラメータ変換回路、90……スペクトラム
再生回路、100……ビツト割り当てステツプサ
イズ計算回路、110……DCT係数適応型量子
化符号化回路、120,420,630……マル
チプレクサ、130,410……サイド情報符号
器、140……送信側出力端子、150……受信
側入力端子、160,430,640……デマル
チプレクサ、170,440……サイド情報復号
器、175……パラメータ変換回路、180……
スペクトラム再生回路、190……ビツト割り当
てステツプサイズ計算回路、200……DCT係
数適応型復号器、210,500……逆離散的コ
サイン変換(IDCT)回路、220……バツフア
メモリ回路、230……受信側出力端子、310
……絶対値回路、320……対数計算回路、33
0,335,670……逆離散的フーリエ変換
(IDFT)計算回路、340,700……リフタ
回路、345……ピツチ検出回路、350……量
子化器、355……復号器、360,365,4
50,455,600……離散的フーリエ変換
(DFT)計算回路、37,490……指数計算回
路、380……減算器、390……適応型量子化
符号器、400,460……ビツト割り当て量子
化ステツプサイズ計算回路、470……適応型復
号器、480……加算器、610……絶対値位相
計算回路、620……位相量子化符号器、650
位相復号器、660……変換回路、をそれぞれ示
す。
Claims (1)
- 1 音声信号をサンプリングして得たサンプル値
系列を直交変換した直交変換系列を適応的に量子
化して伝送する適応型音声信号伝送方法におい
て、前記サンプル値系列の直交変換離散系列を表
わす第1の信号系列を発生し、前記第1の信号系
列に基づいて前記第1の信号系列が有する特徴を
表わす第2の信号系列を発生し、前記第2の信号
系列に基づいてスペクトラムを表わす第3の信号
系列を発生し、前記第1の信号系列と前記第3の
信号系列との差分系列を計算し、前記差分系列を
適応量子化した第4の信号系列を発生し、前記第
2の信号系列と前記第4の信号系列とを組み合わ
せて伝送することを特徴とする適応型音声信号伝
送方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP55136282A JPS5762096A (en) | 1980-09-30 | 1980-09-30 | Method and device for transmitting adaptive voice signal |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP55136282A JPS5762096A (en) | 1980-09-30 | 1980-09-30 | Method and device for transmitting adaptive voice signal |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5762096A JPS5762096A (en) | 1982-04-14 |
| JPS6235680B2 true JPS6235680B2 (ja) | 1987-08-03 |
Family
ID=15171531
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP55136282A Granted JPS5762096A (en) | 1980-09-30 | 1980-09-30 | Method and device for transmitting adaptive voice signal |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5762096A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01281173A (ja) * | 1988-05-09 | 1989-11-13 | Toshiba Silicone Co Ltd | 未加硫シリコーンゴムに連続的に粉体を塗布する方法 |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB8416495D0 (en) * | 1984-06-28 | 1984-08-01 | King R A | Encoding method |
| JP3185214B2 (ja) * | 1990-06-12 | 2001-07-09 | 日本電気株式会社 | 改良dctの順変換計算装置および逆変換計算装置 |
| JP4735711B2 (ja) * | 2008-12-17 | 2011-07-27 | ソニー株式会社 | 情報符号化装置 |
-
1980
- 1980-09-30 JP JP55136282A patent/JPS5762096A/ja active Granted
Non-Patent Citations (2)
| Title |
|---|
| IEEE TRANSACTION ON ACOUSTICS SPEECH AND SIGNAL PROCESSING FREQUENCY DOMAIN CODING OF SPEECH=1979 * |
| SPEECH COMMUNICATION PAPERS ASA50 SPEECH COMMUNICATION PREPRINT EXPERIMENT AN ADAPTIVE-TRANSFORM BASEBAND CODER=1979 * |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01281173A (ja) * | 1988-05-09 | 1989-11-13 | Toshiba Silicone Co Ltd | 未加硫シリコーンゴムに連続的に粉体を塗布する方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPS5762096A (en) | 1982-04-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5983172A (en) | Method for coding/decoding, coding/decoding device, and videoconferencing apparatus using such device | |
| US6263312B1 (en) | Audio compression and decompression employing subband decomposition of residual signal and distortion reduction | |
| KR100209870B1 (ko) | 오디오 신호의 순서화된 타임 시퀸스 처리 방법 및 오디오 신호 전송 방법 | |
| JP3881943B2 (ja) | 音響符号化装置及び音響符号化方法 | |
| US5808569A (en) | Transmission system implementing different coding principles | |
| EP0279451B1 (en) | Speech coding transmission equipment | |
| RU2670797C9 (ru) | Способ и устройство для формирования из представления hoa-сигналов в области коэффициентов смешанного представления упомянутых hoa-сигналов в пространственной области/области коэффициентов | |
| JPS6161305B2 (ja) | ||
| KR100840439B1 (ko) | 음성부호화장치 및 음성복호장치 | |
| JP3144009B2 (ja) | 音声符号復号化装置 | |
| US6212495B1 (en) | Coding method, coder, and decoder processing sample values repeatedly with different predicted values | |
| JP3158932B2 (ja) | 信号符号化装置及び信号復号化装置 | |
| JP3344944B2 (ja) | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 | |
| JPS6235680B2 (ja) | ||
| US5727125A (en) | Method and apparatus for synthesis of speech excitation waveforms | |
| JP2958726B2 (ja) | 反復性をもつサンプル化アナログ信号をコード化しデコードするための装置 | |
| JP3417362B2 (ja) | 音声信号復号方法及び音声信号符号化復号方法 | |
| JP3011038B2 (ja) | 音声情報圧縮方法及び装置 | |
| JP3010655B2 (ja) | 圧縮符号化装置及び方法、並びに復号装置及び方法 | |
| JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
| JPH037120B2 (ja) | ||
| JP2946528B2 (ja) | 音声符号化復号化方法及びその装置 | |
| JP2637965B2 (ja) | 音声符号化復号化方法とその装置 | |
| JP2018124304A (ja) | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、プログラム、および記録媒体 | |
| KR960003626B1 (ko) | 변환 부호화된 오디오 신호의 난청자용 복호화 방법 |