JPS5994797A - 音声の適応変換符号化方式 - Google Patents

音声の適応変換符号化方式

Info

Publication number
JPS5994797A
JPS5994797A JP57204850A JP20485082A JPS5994797A JP S5994797 A JPS5994797 A JP S5994797A JP 57204850 A JP57204850 A JP 57204850A JP 20485082 A JP20485082 A JP 20485082A JP S5994797 A JPS5994797 A JP S5994797A
Authority
JP
Japan
Prior art keywords
information
auxiliary information
spectrum
vector
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57204850A
Other languages
English (en)
Other versions
JPS5936280B2 (ja
Inventor
守谷健弘
誉田雅彰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57204850A priority Critical patent/JPS5936280B2/ja
Publication of JPS5994797A publication Critical patent/JPS5994797A/ja
Publication of JPS5936280B2 publication Critical patent/JPS5936280B2/ja
Expired legal-status Critical Current

Links

Landscapes

  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発明は音声信号を周波数領域に袈換し、その量子化
を適応的に変化させる適応変換符号化方式に関する。
〈従来技術〉 この種の音声符号化方式は例えば゛特開昭55−5’7
900号「音声信号処理回路」に示されている。この方
式は第1図に示すように、入力端子11よりの入力音声
は例えば8KHzでサンプリングされ、各サンプル値が
ディジタル信号として直交変換部12に入力され、直交
変換部12は例えば第2図Aに示す一定数の入力音声サ
ンプルS1・・・・・S2nを離散的フーリエ変換によ
り周波数領域の信号(スペクトル) f1f2・・・・
fn (第2図B)に変換されて適応量子化部13へ送
られる。一方端子11の入力音声はスペクトル包絡抽出
部14に入力さね、入力音声のスペクトルの包絡が線形
予61す分析により推定され、このスペクトル包絡及び
ピッチ周期は適応情報割当部15に供給される。
適応情報割当部15は周波数領域の信号f>f2・・・
・・fnのそれぞれにおけるスペクトル包絡の瞬時レベ
ルに応じて、このレベルが太きければ割当てビットを多
くシ、小さければ割当てビットを少なくするように、ピ
ッチ周期をも考慮して量子化部13における各信号f1
f2・・・・fnに対する量子化ビラトラ適応的に鉱化
する。このようにして量子化されだ□H¥ 報と、ビッ
ト割当てを示す情報とが合成回路16で合成されて符号
化出力として送出される。
この手法によって8KHzサンプリングの音声信号を1
6 KbpS程度の情報量で能率よく符号化でき、高品
質の音声が得られる。しかし、ビット割当て情報に2K
bpS程度の情報量が必要であるため、全体で9’、 
6 r<bps (一般に用いられている伝送連層の1
つ)以下の情報量で符号化する際には信号f 1. f
 2・・・・fnを1ビツト/サンプル以下で量子化す
る必要がある。この際、周波数の成分中の強さの小さい
区間にはほとんど情報を割当てることができず、音声品
質の大きな劣化を招く。
〈発明の概要〉 この発明は入力音声信号を周波数領域に変換し、その変
換されたスペクトルをブロック単位に分割し、その単位
でベクトル量子化をスペクトル包絡情報に応じて適応的
に行うことにより、例えば符号化速度が9.6Kbl)
S以下においても音声品質の劣化を少なくするようにし
た音声の適応変換符号化方式を提供することにある。ま
たスペクトルをブロック分割する前にスペクトルは平坦
イヒしておくことによシベクトル量子化を効率的に行う
ことができる。
〈第1実施例〉 第3図はこの発明による音声符号化方式の実施例を示す
。端子11からの入力信号は直交f ?A部12で1フ
レームを単位に、離散的フーリエ変換(DFT)、離散
的余弦変換(DCT)などの直交変換によシ周波数領域
の信号、即ちスペクトルに変換され、このスペクトルは
スペクトル平滑部17において、別に求められ、量子化
されたスペクトル包絡の情報で大域的に平坦化される。
即ち端子11の入力音声はスペクトル包絡抽出部14に
おいて線形予測分析によりスペクトル包絡が推定され、
このスペクトル包絡情報及び音声パワは量子化部18で
補助情報としてカ(子化され、この量子化出力は烏合1
5後号部19で復号され、その復号されたiIi助情報
によシスベクトルf 1’f 2・・・・fnがスペク
トル平滑部17で割算される。
この平坦化されたスペクトルはブロック分割部21で第
4図に示すように連続するp個ずつのブロックにFl=
(f 11 f 12−・・・ftp)、F2==(f
2tf22・・・・f2 )、・・・・・Fs−(fS
lfS2・・・・fSp)に分   1割される。スペ
クトルの性成分子 ij(1==l・・・S。
j=1・・・・・p)はそれぞれ実部R(fij)と虚
部工(fij)とよりなり、各ブロックごとにこれら実
部を要撚とするベクトルR(F 1)=(R(f 11
)R(f 12 )・・・・R(f’tp)’)、R(
F2)−(R(f2t)R(fz2)・・・・・R(f
2p))”・R(Fs)=(R(fsx)R(fs2)
””・R(fsp))と、同様に谷虚部を要素とする8
個のベクトルI(Fi )=(I(f i j刀とを作
る。
これらベクトルが、予め用意した辞書中の何れの標準ベ
クトルと最もよく対応するかを検出してベクトル量子化
をベクトル量子化部22で行う。
つま9辞書として予測される複数の標準的なベクトルを
記憶しておき、入力音声のベクトルが何れの標準ベクト
ルに近いかを検出し、その一致乃至類似した標準ベクト
ルを示す番号などの符号を出力する。従って各スペクト
ル成分の強さを量子化するよりも少ないビット数で符号
化することができる。しかもこのベクトル量子化に対す
るビット割当てを適応的に変化する。
即ち局部復号化部19の出力である補助情報の復号出力
に応じて前記ブロックごとにビット数を割当てる。一般
的には強いスペクトルが含捷れるブロックには多くのビ
ットを割当て、弱いスペクトル量子化部22では多くの
ビット数が割当てられる時は、比較すべき標準ベクトル
の数が多い辞書を参照し、少いビット数が割当てられる
時は、標準ベクトル数が少い辞書を参照する。標準ベク
トルの要素の数pは一定であるから標準ベクトル数が多
い辞書は記憶されている標準ベクトルは微細なパターン
をも表示していることになシ、標準ベクトルの数が少い
辞書に記憶されている標赫ベクトルは大ざっばなパター
ンを示すに過ぎないと云える。
この適応的情報割当(ビット割当)は入力信号と出力信
号のフレームごとのSN比を最大化することを目的とし
て行われる。直交変換してもSN比は不変であるから符
号化器24のスペクトル平滑部17の出力と受信側の復
号化器25のスペクトル再生出力との歪を最小とするよ
うにすればよく、歪尺度はユークリッド距離とする。1
フレームあたりの歪りは次式である。
まだ全サンプル(スペクトル)数はp’sであってサン
プルあたシの平均情報量(平均量子化ビット数)Bは、 B=り゛ bj/(p−8) −1 である。Bは一定に保持するから歪りを最小化する量子
化ビット数bjは次式となる。
とのbj  を整数値化し、25j個からなる辞書から
歪最小となるものを選択することで量子化が実行される
なお量子化部18における量子化もベクトル量子化する
ことができる。このスペクトル包絡の量子化出力、つま
り補助情報と、ベクトル量子化部22の出力である波形
情報とは合成されて符号化出力として復号イヒ器25へ
送られる。
復号化器25では入力された波形情報が平滑化スペクト
ル再生部26で、符号化器24におけるベクトル量子化
部22で用いた辞書と同一のものを用いて椰準ベクトル
を各ブロックの量子化符号により読出して、平滑化スペ
クトルを再生する。
一方入力された補助情報はスペクトル包絡再生部27で
スペクトル包絡が再生され、これとパワとを再生された
平滑化スペクトルに対してスペクトル再生部28で乗算
してスペクトルを再生する。
この再生されたスペクトルを逆変換部29で時間領域に
逆変換して出力端子31に再生音声信号を得る。
〈第2実施例〉 上述においては直交度お冬を行った後にスペクトル平滑
化を行ったが、入力音声を逆フィルタに通した後に、直
交変換を行ってもよい。例えば第5図に第3図と対応す
る部分に同一符号を付けて示すように入力端子11から
の入力音声信号は逆フィルタ32を通して直交変換部1
2へ供給される。
−実入力音声信号は線形予測分析器33でスペクトル包
絡が分析され、その分析予測係数は量子化部18でベク
トル量子化され、その量子化出力は局部復号化部19で
復号化され、その復号出力、つまり線形予測係数によシ
逆フィルタ32のフィルタ定数が制御される。この逆フ
ィルタ32の出力は残差信号であり、これを直交変換し
て前述と同様に符号化して送出する。復号化器25では
スペクトル再生部26でベクトル量子化された符号を復
号して残差信号のスペクトルを再生し、これを時間領域
に逆変換して線形予測合成フィルタ部34へ送出する。
この合成フィルタ部34のフィルタ定数は、スペクトル
包絡再生部27で再生された予測係数によシ制御され、
フィルタ部34より音声信号か再生される。
第6図Aに、入力音声信号の波形at、その直交変換出
力の実部の波形a2、虚部の波形a3を示し、第6図B
に入力音声信号の波形a1を逆フイルタ部32に通した
後の残差信号波形b1を、との残差信号の直交変換出力
の実部の波形b2を、虚部の波形b8をそれぞれ示す。
音声入力波形alのスペクトル包絡11b4と、各ブロ
ックに対する割当ビットb5をそれぞれ示す。たソしp
==13、B=1.0の例である。
上述において量子化の単位となるベクトルの次元Pを入
力音声のピッチ周波数に適応させ、1フレームの長さを
ピッチ周期の整数倍とすることで;j量子化の効率をさ
らに高めることができる。この場合はピッチ周波数は時
間的に変化するためピッチ周波数も補助情報に含める。
また、ベクトルを実部、虚部独立とせず、複素数のま捷
の単位として処理することも可能である。また上述にお
ける各部はそれぞれ独立した或は共通の電子計算様で処
理することができる。
〈効 果〉 以上説明したように、周波数領域で平坦化された信号を
ブロックに分割し適応的情報割当をすることで量子化効
率を高めることができ、特に9.6Kbps°以下でス
カラ量子化の従来の適応変換符号化方式より高いSN比
を持つ音声を再生することができる。周波数領域の平坦
化によシベクトル量子化の標準ベクトルの数が少なくて
済む。また1ブロツクあたシに割当てられる情報量が整
数であればよく、1サンプルあたりの情報量は1/Pビ
ツトの単位で細かく割当てられる。このことにょシ従来
方式の欠点であった情報量がまったく割当てられない周
波数成分が存在し、かつそれが適応的に変化することに
起因する聴覚的劣化を避けることができる。
次に実験例を述べる。サンプリング周波数を8KHz、
線形予測分析部33の分析次数を8次、分析長(変換部
)を26〜31m5.分析の重複2m5(台形窓で接続
)、ベクトル次元数を6〜12(ピッチ適応)とした場
合の情報量B(ビット/サンプル)に対するSN比を第
7図に示す。第6図において曲g141は均一量子化で
、各1サンプルごとに符号化した場合、曲線42は均一
量子化で6次元固定ベクトル符号化した場合、曲線43
は均一量子化でベクトルの次元をピッチ周波数に応じて
変化させて符号化した場合、曲線44は適応量子化で各
サンプルごとに符号化する場合(従来方式)、曲線45
はこの発明の方式で6次元固定ベクトル量子化による符
号化する場合、曲線46はこの発明の方式でベクトルの
次元をピッチ周波数に応じて適応的に変化させて符号化
する場合である。これらよシ、均−量子化(曲@41〜
43)よシも適応量子化(曲線44〜46)の方が優れ
、適応量子化でも従来方式(曲線44)よりもこの発明
方式(曲線45.46)の方が優れていることが理邊角
!トされる。0.5〜1.1ビット/サンプル域で、こ
のSN比の向上は学習サンプル外でも女声で2.5dB
,男声でx.oaBs度得られた。スペクトル包絡もベ
クトル量子化することによりピッチ、パワなどを含めて
補助情報は8 0 0 bps程要と見積ることができ
るから、残差信号1サンプル当シの情報量Bが0. 5
で4. 8 Kbps,  1. 1で9.6Kbps
の符号化が可能である。
【図面の簡単な説明】
Hs 1図は従来の適応変換符号化方式を示すブロック
図、第2図はその動作の説明に供する図、第3図はこの
発明による適応変換符号化方式の一例を示すブロック図
、第4図はそのブロック分割の例を示す図、第5図はこ
の発明の他の例を示すブロック図、第6図はその動作例
を示す図、第7図は各種符号化方式のSN比−情報量B
との関係を   □示す図である。 11:音声入力、12:直交変換部、14ニスベクトル
包絡抽出器、17:スペクトル平滑部、18:ベクトル
量子化器、19:局部復号化器、21ニブロック分割部
、22:ベクトル量子化器、23:適応情報割当部、2
4:符号化器。 特許出願人  日本電信電話公社 代  理  人   草  野    草汁1図 7172  図 丼3図

Claims (2)

    【特許請求の範囲】
  1. (1)音声信号のサンプル値系列を一定の個数ごとに1
    フレームとし、■フレームごとに直交変換によシスベク
    トルを求め、適応的に量子化する符号化方式において、
    上記スペクトルの包絡を求めてパワとともに量子化して
    補助情報として符号化するスペクトル包絡抽出手段と、
    その補助情報を復号する局部復号化手段と、その復号さ
    れた補助情報を使って上記スペクトルを周波数軸上で平
    坦化されたスペクトル信号系列とする平滑手段と、その
    平坦化されたスペクトル復号系列を周波数軸上でブロッ
    クに分割するブロック分割手段と、その分割された各ブ
    ロックに対して上記補助情報を使って適応的に情報割当
    を行う適応情報割当手段と1、そび1割当によって上記
    分割されたスペクトル信号系列をベクトル量子化するベ
    クトル量子化手段とを備えた音声の適応変換符号化方式
  2. (2)音声信号のサンプル値系列を1フレームを単位と
    して分析して符号化する符号化方式において上記音声信
    号を線形予測分析し、そのスペクトル包絡を求め、パワ
    とともに量子化し補助情報として符号化する線形予測分
    析手段と、その補助情報を復号する局部復号化手段と、
    その復号された補助情報の線形予測係数によシフィルタ
    定数が制御されると共に上記音声信号のサンプル値系列
    が入力されて残差信号を出力する逆フイルタ手段と、そ
    の残差信号を1フレームごとに直交変換してスペクトル
    を求める直交変換手段と、このスペクトルを周波数軸上
    でブロックに分割するブロック分割手段と、その分割さ
    れた各ブロックに対して上記補助情報を使って適応的に
    情報割当を行う適応情報割当手段と、その割当に従って
    上記分割されたスペクトル残差信号系列をベク)/しせ
    子化するベクトル量子化手段とを備えだ音声の適応変換
    符号化方式。
JP57204850A 1982-11-22 1982-11-22 音声の適応変換符号化方式 Expired JPS5936280B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57204850A JPS5936280B2 (ja) 1982-11-22 1982-11-22 音声の適応変換符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57204850A JPS5936280B2 (ja) 1982-11-22 1982-11-22 音声の適応変換符号化方式

Publications (2)

Publication Number Publication Date
JPS5994797A true JPS5994797A (ja) 1984-05-31
JPS5936280B2 JPS5936280B2 (ja) 1984-09-03

Family

ID=16497426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57204850A Expired JPS5936280B2 (ja) 1982-11-22 1982-11-22 音声の適応変換符号化方式

Country Status (1)

Country Link
JP (1) JPS5936280B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE38593E1 (en) 1996-07-01 2004-09-21 Nec Corporation Adaptive transform coding system, adaptive transform decoding system and adaptive transform coding/decoding system
JP2014016625A (ja) * 2008-01-04 2014-01-30 Dolby International Ab オーディオコーディングシステム、オーディオデコーダ、オーディオコーディング方法及びオーディオデコーディング方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE38593E1 (en) 1996-07-01 2004-09-21 Nec Corporation Adaptive transform coding system, adaptive transform decoding system and adaptive transform coding/decoding system
USRE41370E1 (en) 1996-07-01 2010-06-08 Nec Corporation Adaptive transform coding system, adaptive transform decoding system and adaptive transform coding/decoding system
JP2014016625A (ja) * 2008-01-04 2014-01-30 Dolby International Ab オーディオコーディングシステム、オーディオデコーダ、オーディオコーディング方法及びオーディオデコーディング方法

Also Published As

Publication number Publication date
JPS5936280B2 (ja) 1984-09-03

Similar Documents

Publication Publication Date Title
KR100209870B1 (ko) 오디오 신호의 순서화된 타임 시퀸스 처리 방법 및 오디오 신호 전송 방법
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
US5983172A (en) Method for coding/decoding, coding/decoding device, and videoconferencing apparatus using such device
JPS6161305B2 (ja)
GB2323759A (en) Audio coding and decoding with compression
JPH045200B2 (ja)
JPS62234435A (ja) 符号化音声の復号化方式
KR20120008537A (ko) 복호화 장치 및 복호화 방법, 및 복호화 장치를 구비하는 통신 단말 장치 및 기지국 장치
WO1995027335A1 (en) Method and device for encoding information, method and device for decoding information, information transmitting method, and information recording medium
JP2002372996A (ja) 音響信号符号化方法及び装置、音響信号復号化方法及び装置、並びに記録媒体
JP3765171B2 (ja) 音声符号化復号方式
JPH07297726A (ja) 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
KR100840439B1 (ko) 음성부호화장치 및 음성복호장치
JPH07261800A (ja) 変換符号化方法、復号化方法
JP3406275B2 (ja) ディジタル信号符号化方法、ディジタル信号復号化方法、これらの装置及びその各プログラム記録媒体
JP4399185B2 (ja) 符号化装置および復号化装置
Zelinski et al. Approaches to adaptive transform speech coding at low bit rates
US20090106030A1 (en) Method of signal encoding
KR100952065B1 (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP4191503B2 (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JP2523286B2 (ja) 音声符号化及び復号化方法
JPS5994797A (ja) 音声の適応変換符号化方式
JP4574320B2 (ja) 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体
JPH09130260A (ja) 音響信号の符号化装置及び復号化装置