JPH04270397A - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JPH04270397A
JPH04270397A JP3103261A JP10326191A JPH04270397A JP H04270397 A JPH04270397 A JP H04270397A JP 3103261 A JP3103261 A JP 3103261A JP 10326191 A JP10326191 A JP 10326191A JP H04270397 A JPH04270397 A JP H04270397A
Authority
JP
Japan
Prior art keywords
delay
signal
sound source
output
codebook
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3103261A
Other languages
English (en)
Other versions
JP3146511B2 (ja
Inventor
Keiichi Funaki
舟木 慶一
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP10326191A priority Critical patent/JP3146511B2/ja
Publication of JPH04270397A publication Critical patent/JPH04270397A/ja
Application granted granted Critical
Publication of JP3146511B2 publication Critical patent/JP3146511B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号を低いビット
レート、特に8〜4kb/s程度で高品質に符号化する
ための音声符号化方式に関する。
【0002】
【従来の技術】音声信号を8〜4kb/s程度の低いビ
ットレートで符号化する方式としては、例えば、M.S
chroeder  and  B.S.Atal氏に
よる“Code−excited  linear  
prediction:High  quality 
 speech  at  low  bit  ra
tes”と題した論文(Proc.ICASSP,pp
.937−940,1985年)(文献1)等に記載さ
れているCELP(Code  Excited  L
PC  Coding)が知られている。この方法では
、送信側ではフレーム毎(例えば20ms)に音声信号
から音声信号のスペクトル特性を表すスペクトルパラメ
ータを抽出し、フレームをさらに小区間のサブフレーム
に分割し、サブフレーム毎に過去の音源信号から長区間
相関(ピッチ相関)を表すピッチパラメータを抽出し、
ピッチパラメータによりサブフレームの音声信号を長期
予測する。長期予測して求められた残差信号に対して、
予め用意された種類の雑音信号からなるコードブックか
ら選択した信号により合成した信号と、残差信号と誤差
電力を最小化するように一種類の雑音信号を選択すると
共に、最適なゲインを計算する。そして選択された雑音
信号の種類を表すインデクスとゲイン、ならびに、スペ
クトルパラメータとピッチパラメータを伝送する。受信
側の説明は省略する。
【0003】また、長期予測の方法としては、例えば、
W.Kleijn“Anefficient  sto
chastically  excited  lin
earpredictive  coding  al
gorithm  for  highquality
  low  bit  rate  transmi
ssionof  speech”と題した論文(Sp
eech  Communication,7,pp.
305−316,1988年)(文献2)等に記載のよ
うに、過去の音源を1サンプルずつずらして、重み付け
2乗誤差を最小にする過去の音源のずらし値(整数遅延
)とずらした音源に対応する音源のゲインを求める方法
が知られている。しかしながら、適応コードブックだけ
では音声の周期性を完全に記述できないために、CEL
P系の符号化方式の場合、再生信号に雑音感が残ってし
まう。この問題点を解決するために、合成フィルタの入
力となる、適応コードブックと音源コードブックの和に
適応コードブックの遅延で規定される適応コムフィルタ
を掛ける手法が知られている。具体的な方法は例えば、
S.Wang氏らによる“Improved  exc
itation  for  phoneticall
y−segmented  VXC  speech 
 coding  below  4kb/s”と題し
た論文(Proc.Globecom,pp.946−
950,1990年)(文献3)等を参照できる。この
手法により、遅延が音声信号のピッチ周期と一致し正し
くもとまったときは、雑音感が減少し、音質が向上する
【0004】
【発明が解決しようとする課題】しかし、適応コムフィ
ルタリングは、遅延が正しくもとまらないと、かえって
音質は劣化してしまうという問題点があった。
【0005】本発明の目的は、上述した問題点を解決し
、なめらな遅延と高調波成分が付加された適応コードブ
ックの音源により、8〜4kb/sにおいて音質の良好
な音声符号化方式を提供することにある。
【0006】
【課題を解決するための手段】第1の発明における音声
符号化方式は、音声信号を蓄積する手段と、音声信号の
有声性判定を行う手段と、音声信号をサブフレームに分
割する手段と、音声信号を分析する手段と、音声信号に
対して聴覚上の重み付けを加える手段と、有声と判定さ
れたフレームのみ適応コードブックの出力にその遅延で
規定されるコムフィルタリングを行う手段と、コムフィ
ルタの出力を用いて最適な遅延を決定する手段と、重み
付け信号から最適遅延に相当する適応コードブックの出
力を減算する手段と、音源コードブックから最適な音源
を抽出する手段とを有することを特徴とする。
【0007】第2の発明における音声符号化方式は、音
声信号を蓄積する手段と、音声信号の有声性判定を行う
手段と、音声信号をサブフレームに分割する手段と、音
声信号を分析する手段と、音声信号に対して聴覚上の重
み付けを加える手段と、有声と判定されたフレームのみ
適応コードブックの出力にその遅延で規定されるコムフ
ィルタリングを行う手段と、コムフィルタの出力を用い
て最適な遅延を決定する手段と、最適な遅延に相当する
コムフィルタの出力を重み付け信号から減算する手段と
、音源コードブックから最適音源を抽出する手段とを有
することを特徴とする。
【0008】
【作用】第1の発明においては、評価尺度を従来の重み
付け2乗距離ではなく、適応コードブックの出力にその
遅延で規定されるコムフィルタをかけ、高調波成分の強
調を行い、コムフィルタの出力と重み付け信号の2乗距
離を評価尺度にし、これを最小化する遅延を最適な遅延
として決定する。コムフィルタを掛けることにより調波
成分を強調するだけでなく、雑音成分を抑圧することに
なるため、より正確な遅延を推定できる。
【0009】第2の発明においては、評価尺度にコムフ
ィルタを加えることにより、より正確な遅延を推定でき
るとともに、適応コードブックの出力として、コムフィ
ルタの出力を用いることにより、CELP系の符号化方
式の問題点であった雑音感を低減することができる。
【0010】
【実施例】図1は第1の発明の実施例であり、図2は第
2の発明の実施例である。
【0011】最初に各モジュールの動作説明をする。
【0012】バッファ装置105は、音声信号を記憶し
ておく装置である。
【0013】有声判定器110は、そのフレームの音声
が有声か否かの判定を行う装置である。
【0014】サブフレーム分割器120は、バッファに
蓄積された音声信号をいくつかのサブフレームに分割す
る装置である。
【0015】LPC分析器200は、フレーム毎に音声
のスペクトルパラメータであるLPC係数を抽出する装
置である。
【0016】以上のバッファ装置105,音声判定器1
10,サブフレーム分割器120,LPC分析器200
は既存のものを用いる。
【0017】LPC係数量子化器210は、LPC係数
を量子化する装置であり、いかなる方法を用いても構わ
ない。
【0018】重み付けフィルタ130は、サブフレーム
に分割された音声信号に対して周知の聴感重み付けを行
う。
【0019】影響信号減算器140は、重み付けされた
合成フィルタを初期状態を1サブフレーム前の重み付け
合成信号の最後の状態とし零励振することにより計算さ
れた影響信号を重み付けされた信号より減算する。
【0020】適応コードブック器150は、過去の音源
を遅延させた音源を生成する。遅延は整数でも小数でも
よいが、小数の方が音質がより良好となる。小数の場合
、過去の音源をポリフェーズフィルタリングにより小数
化する。ポリフェーズフィルタリングの詳細は、例えば
、P.Kroon“Pitch  predictor
s  with  high  temporal  
resolution”と題した論文(Proc.IC
ASSP,pp.661−664,1990年)(文献
4)等を参照できる。
【0021】コムフィルタ160は、適応コードブック
器150で生成された過去の音源の遅延音源をその遅延
に応じたコムフィルタリングを行う。コムフィルタの形
としては、IIR型,FIR型いずれでも構わない。具
体的な方法は前記文献3等を参照できる。
【0022】重み付けフィルタ170は、分析により得
られたLPC係数を周知の聴感重み付けしたフィルタ係
数による合成を行う。
【0023】遅延決定器180は、コムフィルタリング
された過去の遅延ありの音源と重み付け信号を2乗距離
が最小になる遅延を決定する回路である。
【0024】音源コードブック探索器190で音源コー
ドブックの探索を行う。この場合、音源コードブックは
雑音コードブックでもLBG法等のVQアルゴリズムに
より学習された学習コードブックでも何でも構わない。 前者は前記文献1を参照できる。また、後者は特願平2
−42955号明細書(文献5)や、特願平2−429
56号明細書(文献6)等を参照できる。220はマル
チプレクサである。
【0025】まず、図1の実施例の動作を説明する。
【0026】信号線100から音声信号を入力しバッフ
ァ105で音声信号を記憶しておき、記憶された信号を
用いて有声判定器110で母音の判別を行う。LPC分
析器200でLPC分析し、スペクトルパラメータであ
るLPC係数を算出する。算出されたLPC係数はLP
C係数量子化器210で量子化されマルチプレクサに送
られるとともに、再度LPC係数に復号化され以下の処
理に用いられる。記憶された音声信号をサブフレーム分
割器120で分割し、各サブフレーム毎の信号に対して
、以下の処理を行う。まず、重み付けフィルタ130で
音声信号に聴感重み付けを施し、影響信号減算器140
では影響信号を算出し、重み付け信号から差し引く。 適応コードブック器150で過去の音源を遅延させた音
源信号を生成し、有声判定器110で有声と判定された
フレームでは、コムフィルタ160でその遅延値に応じ
たコムフィルタリングを行う。有声でないと判定された
場合、コムフィルタリングは行わない。次に、コムフィ
ルタ160の出力を入力とし、重み付け合成を行う。重
み付け合成信号と重み付け信号の2乗距離が最小になる
遅延を遅延決定器180で決定する。最適な遅延が決定
された後、最適な遅延に対応する適応コードブックの出
力を入力とし、重み付け合成を行い、重み付け信号から
適応コードブックによる重み付け合成信号を減算する。 減算された信号に対して、音源コードブック探索器19
0で音源コードブックの探索を行う。マルチプレクサ2
20は、LPC係数量子化器210,適応コードブック
遅延決定器180,音源コードブック探索器190の出
力符号系列を組み合わせて出力する。これらの処理を各
サブフレーム毎に行う。
【0027】次に、図2の実施例の動作を説明する。
【0028】第1の発明では、コムフィルタ160の出
力は遅延の決定のみに用いられていたが、第2の発明で
は、コムフィルタ160の出力を適応コードブックの出
力として用いるところのみが異なっている。ここでは、
その点のみを説明する。遅延決定器180で遅延の決定
がされた後、コムフィルタ160の出力を適応コードブ
ックの出力として用い、合成フィルタ170でそれを入
力として重み付け合成を行った後、重み付け信号から減
算し、音源コードブック探索器190で音源コードブッ
クを探索する。
【0029】以上で本発明による実施例の説明を終える
【0030】本実施例の構成以外にも種々の変形が可能
である。
【0031】適応コードブックの遅延の計算では、演算
量を低減するために、入力の重み付け信号等を用いて相
関演算により遅延の候補を複数種類求め、各候補に対し
て、近傍数サンプルの範囲で最適な小数遅延を決定する
構成をとることもできる。
【0032】また、適応コードブック,音源コードブッ
クをサブフレームでは一意に決定せずに、誤差電力の小
さい順に複数種類の候補を求め、これをフレーム全体で
累積し、フレーム全体での累積誤差電力を最小化する適
応コードブック,音源コードブックの組合せを選択する
ようにしてもよい。
【0033】
【発明の効果】以上述べたように、本発明によれば、音
声の有声区間で適応コードブックに適応コムフィルタを
使用することにより、スムーズな遅延を得ることができ
ると共に適応コードブックの遅延が誤ったときでも雑音
感の少ない良好な再生音声が得られるという大きな効果
がある。
【図面の簡単な説明】
【図1】第1の本発明の実施例を示す構成図である。
【図2】第2の発明の実施例を示す構成図である。
【符号の説明】
100  音声入力ポート 105  バッファ装置 110  有声判定器 120  サブフレーム分割器 130  重み付けフィルタ 140  影響信号減算器 150  適応コードブック器 160  コムフィルタ 170  重み付け合成フィルタ 180  遅延決定器 190  音源コードブック探索器 200  LPC分析器 210  LPC係数量子化器 220  マルチプレクサ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】音声信号を蓄積する手段と、音声信号の有
    声性判定を行う手段と、音声信号をサブフレームに分割
    する手段と、音声信号を分析する手段と、音声信号に対
    して聴覚上の重み付けを加える手段と、有声と判定され
    たフレームのみ適応コードブックの出力にその遅延で規
    定されるコムフィルタリングを行う手段と、コムフィル
    タの出力を用いて最適な遅延を決定する手段と、重み付
    け信号から最適遅延に相当する適応コードブックの出力
    を減算する手段と、音源コードブックから最適な音源を
    抽出する手段とを有することを特徴とする音声符号化方
    式。
  2. 【請求項2】音声信号を蓄積する手段と、音声信号の有
    声性判定を行う手段と、音声信号をサブフレームに分割
    する手段と、音声信号を分析する手段と、音声信号に対
    して聴覚上の重み付けを加える手段と、有声と判定され
    たフレームのみ適応コードブックの出力にその遅延で規
    定されるコムフィルタリングを行う手段と、コムフィル
    タの出力を用いて最適な遅延を決定する手段と、最適な
    遅延に相当するコムフィルタの出力を重み付け信号から
    減算する手段と、音源コードブックから最適音源を抽出
    する手段とを有することを特徴とする音声符号化方式。
JP10326191A 1991-02-26 1991-02-26 音声符号化方式 Expired - Fee Related JP3146511B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10326191A JP3146511B2 (ja) 1991-02-26 1991-02-26 音声符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10326191A JP3146511B2 (ja) 1991-02-26 1991-02-26 音声符号化方式

Publications (2)

Publication Number Publication Date
JPH04270397A true JPH04270397A (ja) 1992-09-25
JP3146511B2 JP3146511B2 (ja) 2001-03-19

Family

ID=14349497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10326191A Expired - Fee Related JP3146511B2 (ja) 1991-02-26 1991-02-26 音声符号化方式

Country Status (1)

Country Link
JP (1) JP3146511B2 (ja)

Also Published As

Publication number Publication date
JP3146511B2 (ja) 2001-03-19

Similar Documents

Publication Publication Date Title
US5781880A (en) Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
JP3254687B2 (ja) 音声符号化方式
EP0503684A2 (en) Vector adaptive coding method for speech and audio
JPH08328591A (ja) 短期知覚重み付けフィルタを使用する合成分析音声コーダに雑音マスキングレベルを適応する方法
JPH04270400A (ja) 音声符号化方式
US5884251A (en) Voice coding and decoding method and device therefor
KR100463417B1 (ko) 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치
KR100647290B1 (ko) 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법
Kleijn et al. A 5.85 kbits CELP algorithm for cellular applications
KR20010073069A (ko) 음성코딩을 위한 적응성 표준
US5924063A (en) Celp-type speech encoder having an improved long-term predictor
EP1204092A2 (en) Speech decoder capable of decoding background noise signal with high quality
JP3095133B2 (ja) 音響信号符号化方法
EP0899720A2 (en) Quantization of linear prediction coefficients
US9620139B2 (en) Adaptive linear predictive coding/decoding
KR100550003B1 (ko) 상호부호화기에서 개회로 피치 추정 방법 및 그 장치
JPH04270397A (ja) 音声符号化方式
JP3088204B2 (ja) コード励振線形予測符号化装置及び復号化装置
JP2892462B2 (ja) コード励振線形予測符号化器
JPH08211895A (ja) ピッチラグを評価するためのシステムおよび方法、ならびに音声符号化装置および方法
Serizawa et al. Joint optimization of LPC and closed-loop pitch parameters in CELP coders
Kondoz et al. The Turkish narrow band voice coding and noise pre-processing Nato Candidate
EP1212750A1 (en) Multimode vselp speech coder
JP2000330594A (ja) 音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体
JPH0473700A (ja) 音声符号化方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080112

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090112

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100112

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees