JPH02299000A - 音声符号化復号化方法及びその装置 - Google Patents

音声符号化復号化方法及びその装置

Info

Publication number
JPH02299000A
JPH02299000A JP1118631A JP11863189A JPH02299000A JP H02299000 A JPH02299000 A JP H02299000A JP 1118631 A JP1118631 A JP 1118631A JP 11863189 A JP11863189 A JP 11863189A JP H02299000 A JPH02299000 A JP H02299000A
Authority
JP
Japan
Prior art keywords
circuit
sound source
spectral parameter
signal
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1118631A
Other languages
English (en)
Other versions
JP2946528B2 (ja
Inventor
Eisuke Hanada
英輔 花田
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1118631A priority Critical patent/JP2946528B2/ja
Publication of JPH02299000A publication Critical patent/JPH02299000A/ja
Application granted granted Critical
Publication of JP2946528B2 publication Critical patent/JP2946528B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声信号を低いビットレートで効率的に符号
化、復号化するための音声符号化復号化方法と音声符号
化装置と音声復号化装置に関する。
〔従来の技術〕
音声信号を低いビットレート、例えば16kb/s程度
以下で伝送する方法としては、マルチパルス符号化法な
どが知られている。これらは音源信号を複数個のパルス
の組合せ(マルチパルス)で表し、声道の特徴をデジタ
ルフィルタで表し、音源パルスの情報とフィルタの係数
を、一定時間区間(フレーム)毎に求めて伝送している
。この方法の詳細については、例えばアラセキ、オザワ
、オノ、オチアイ氏による”Multi−pulse 
Excited 5peechCoder Ba5ed
 on Maximum Cross−correla
tion 5e−arch Algorithm”、 
(GLOBECOM 83. IEEE Global
Telecommunication、講演番号23.
3.1983)  (文献1)に記載されている。この
方法では、声道情報と音源信号を分離してそれぞれ表現
すること、および音源信号を表現する手段として複数の
パルス列の組合せ(マルチパルス)を用いることにより
、復号後に良好な音声信号を出力することができる。
〔発明が解決しようとする課題] しかしながら、この従来方法ではビットレートが充分に
高く音源パルスの数が充分なときは音質が良好であった
が、ビットレートを下げて行くと音質が低下するという
問題点があった。
この問題点を改善するために、伝送する音源パルス数を
削減する方法として、マルチパルス音源のピッチ毎の半
周期性(ピッチ相関)を利用したピッチ予測マルチパル
ス法が提案されている。この方法の詳細は、例えば、特
願昭58−139022号明細書(文献2)に詳しく記
載されている。しかし、削減が可能なパルス数には限界
がある。
一方、伝送すべきスペクトルパラメータは、1フレーム
に対して分析次数の個数存在する。スペクトルパラメー
タを量子化する方法としては、周知の方法であるスカラ
ー量子化、または効率よく量子化する方法として周知の
方法であるベクトル量子化を用いることが多い。ベクト
ル量子化については、例えばアール・エム・グレイ氏に
よる“ベクトル・クオンタイゼイション・フォー・スピ
ーチ・コーディング・アンド・リコグニション゛(アメ
リカ音響学会誌80、旧、 1986)  (R,M、
叶ay。
Vector quantization for 5
peech coding andrecogniti
on’  (J、  Acoust、  Soc、  
八n+erica、  vol、80゜5upp1.1
. Ql、 1986) )  (文献3)に詳しく記
載されている。
さらに、予め定められた個数の関数を用いてスペクトル
パラメータを効率よく表現する手法として、テンポラル
デコンポジションがある。テンポラルデコンポジション
については、例えばビー・ニス・アタール氏によるI′
エフイシエント・コーディング・オブ・エルピーシ−・
バラメターズ・パイ・テンポラル・デコンポジション゛
° (アイ・シー・ニー・ニー・ニス・ピー83、講演
番号2.61983)  (B、S、八ta1.  ”
EFFICIENT  C0DING  OF  LP
CPAREME−TER3BY TEMPORAL D
ECOMPO5IT[ON” ([CAASP 83,
2.6 pp、81−84.1983)  (文献4)
に詳しく記載されている。
しかし、スカラー量子化を用いた場合は、伝送するべき
情報が多くなり、このままでビットレートを下げて行く
と顕著に音質が劣化するという問題点がある。また、ベ
クトル量子化を用いた場合にも、伝送効率はよくなるも
のの、最適なベクトルを求めるための計算量が非常に多
く、また再生された音質も低下するという問題点があっ
た。さらに、前記文献4にみられるようなテンポラルデ
コンポジションについても、最適な関数を求めるための
計算量が非常に多いうえ計算方法が複雑であり、実用に
供するのは困難であった。
本発明の目的は、ビットレートが高いところでも、また
ビットレートを下げていっても従来よりも良好な音声を
再生することが可能で、少ない演算量で実現可能な音声
符号化復号化方法と音声符号化装置と音声復号化装置と
を提供することにある。
〔課題を解決するための手段〕
本発明は、離散的な音声信号を入力し、予め定められた
時間長のフレーム毎にスペクトル包絡を表すスペクトル
パラメータと音源信号を抽出し、前記スペクトルパラメ
ータと前記音源信号を量子化して組み合わせて伝送し、
前記組み合わされた信号から前記音源信号と前記スペク
トルパラメータを分離し復元し、前記音声信号を良好に
再生して出力する音声符号化復号化方法において、前記
スペクトルパラメータを、予め複数個の関数を有し前記
関数の中から前記予め用意された関数の自己相関と、前
記予め用意された関数と前記入力信号との相互相関を用
いて最適なものを選択して、前記スペクトルパラメータ
を量子化することを特徴とする。
本発明の音声符号化装置は、 入力した離散的な音声信号系列から短時間スペクトル特
性を表すスペクトルパラメータを求めるスペクトルパラ
メータ計算回路と、 前記音声信号を予め複数個の関数を有し前記関数の中か
ら、前記予め用意された関数の自己相関と、前記予め用
意された関数と前記入力信号との相互相関を用いて最適
なものを選択して表現するスペクトルパラメータ量子化
回路と、 前記量子化されたスペクトルパラメータを逆量子化する
逆量子化回路と、 前記逆量子化回路の出力を用いて前記音声信号の音源信
号を複数個のパルス列を用いて表して符号化する音源信
号計算回路と、 前記スペクトルパラメータを表す関数を表す符号と前記
マルチパルス列を表す符号とを組み合わせて出力するマ
ルチプレクサ回路とを有することを特徴とする。
本発明の音声復号化装置は、 音源信号を表す符号と前記音声信号のスペクトルパラメ
ータを表す関数を表す符号とを入力して分離し復号化す
るデマルチプレクサ回路と、前記復号化されたスペクト
ルパラメータを表す関数から短時間スペクトル特性を表
すスペクトルパラメータを復号するスペクトルパラメー
タ復号回路と、 音源信号を用いてマルチパルス列を復元し音源信号を復
元する音源信号復元回路と、 前記復元された音源信号と前記復号されたスペクトルパ
ラメータとを用いて音声信号を合成する合成フィルタ回
路とを有することを特徴とする。
〔作用〕
本発明は、前記文献2のピッチ予測マルチパルス符号化
法において、少ない伝送情報量で、音声信号を従来方法
より効率的に表現するために、伝送するべきスペクトル
パラメータを予め定められた複数個の関数の中から、前
記入力された信号を最適に表現するものを少ない計算量
で選択して表す。
本発明の作用を、第2図を用いて説明する。第2図は、
スペクトルパラメータを予め定められた個数の関数を用
いて表現するための量子化器のブロック図である。
第2図において、入力端子300からは量子化すべきス
ペクトルパラメータの時系列)’t (n)が入力され
る。コードブック250には、予め定められた複数個の
関数φ、(n)がコードとして納められている。最適な
コード及びゲインを計算するために自己相関、計算回路
252はコードの自己相関を、相互相関計算回路251
はコードと入力信号との相互相関を計算する。自己相関
計算回路252の出力と相互相関計算回路251の出力
を用いて、ゲイン計算回路260は選択されたコードに
かけるべき最適なゲインを計算する。誤差計算回路26
5は、選択されたコードにゲインをかけ、入力信号との
誤差を計算し、選択したコードのインデクス及び最適な
ゲイン、及び誤差を出力する。コードブック選択回路2
70は、各コードブックに対する誤差計算回路265の
出力を保持し、全てのコードブッりに対して求めた誤差
の内最小となる最適なコードのインデクス及び前記最適
なコードに対応する前記最適なゲインを出力する。
以下、本発明の作用を式を用いて説明する。入力音声か
ら算出された複数個のスペクトルパラメータの時系列の
うち、1番目のもの(以下、これをi次のパラメータ時
系列と呼ぶ)をy= (n)とする。このi次のパラメ
ータ時系列yt(n)を表現するために用いる関数をφ
で表し、そのうちに番目のものをφk(n)で表す。こ
れを用いると、次の式(1)が成り立つ。
;1(n)=aikφM(n)          (
1)ここでy= (n)は、関数φ、(n)を用いてパ
ラメータ時系列y、(n)を近似した時系列を表し、a
ikは、i次のパラメータ時系列における、関数φ、(
n)にかかるゲインである。従って、最適な近似を行う
ためには最適な関数φ、(n)及びゲインaikを見つ
ければよい。従来技術では、前記文献4に示されている
ような誤差尺度を用いて最適な関数を算出している、さ
らに文献4においては、前記算出された関数と計算され
たゲインを再度交互的に修正して誤差を小さくしている
これに対し、本発明においては、次の式(2)で表す誤
差Eを考える。
(2)式は、分析次数の個数だけ存在するパラメータ時
系列のうちi次のパラメータ時系列に対する関数φk(
n)及びゲインaikを用いた場合の入力信号)’i 
(n)との誤差を示す弐である。ここでnl は関数φ
、(n)を用いて表現しようとするパラメータ時系列区
間(フレーム)の始端を表し、n2は前記表現しようと
する区間の終端を表す。
前記(2)式をゲインafkについて最小化すると、a
、アは(3)弐によって求められる。
このとき、誤差Eは次の形となるので、・ ・ ・(4
) Eを最小化する関数φア(n)は、(4)弐の第2項を
最大化する、即ちゲインaikを最大化するように選択
すればよい。なお、関数φ、(n)は、種々の多項式関
数を用いてもよいし、音声信号中から学習によって求め
てもよい。
以上水したような方法を用いることによって、前記文献
4における方法に対して大幅に計算量を削減した上、誤
差を良好に小さく保つことが可能である。
〔実施例〕
第1図は、音声符号化復号化方法を実施する音声符号化
装置及び音声復号化装置を示す。
音声符号化装置の入力端子500から離散的な音声信号
を入力する 時間分割回路510は、入力された音声信号を、時間的
に一様なフレーム毎(例えば100m5ec、毎)に分
割する。
ピッチパラメータ計算回路515は、ピッチの微細構造
を表すピッチパラメータを計算する。計算方法は、前記
文献2に示されているような方法を用いる。
量子化器516は、前記求められたピッチパラメータを
量子化する。
逆量子化器518は、量子化した結果を用いて逆量子化
Qて出力する。
スペクトルパラメータ計算回路520では、前記分割し
た区間の音声信号のスペクトルを表すスペクトルパラメ
ータを、周知のLPG分析法によって求める。求められ
たスペクトルパラメータに対しては、コードブック52
1の中に予め定められた個数用意されたコードを用いて
、作用の項において説明したような方法によりゲイン回
路522において各コードに対して最適なゲインを計算
する。
コードブック選択回路525は、各コードブックに対す
るゲイン計算回路522の出力である誤差の内最小であ
るものを選択し、選択されたコードのインデクスと最適
なゲインを出力する。
逆量子化器530は、コードブック選択回路525の出
力である前記選択されたコードのインデクスと最適なゲ
インを用いて逆量子化して出力する。
重み付は回路540は、逆量子化されたスペクトルパラ
メータを用いて前記分割された音声信号に重み付けを行
う。重み付けの方法は、特願昭59−272435号明
細書(文献5)の重み付は回路200を参照することが
できる。
インパルス応答計算回路550は、逆量子化されたピッ
チパラメータと逆量子化されたスペクトルパラメータを
用いてインパルス応答を計算する。
具体的な方法は前記文献2を参照できる。
自己相関計算回路560は、前記インパルス応答の自己
相関を計算し音源パルス計算回路580へ出力する。自
己相関の計算法は、前記文献2の自己相関関数計算回路
180を参照することができる。
相互相関計算回路570は、前記重み付けられた信号と
前記インパルス応答との相互相関を計算して、音源パル
ス計算回路580へ出力する。具体的な方法は前記文献
2を参照できる。
音源パルス計算回路580では、マルチパルスをピッチ
予測により、予め定められた個数だけ求める。マルチパ
ルス列の計算方法については、前記文献2の音源パルス
計算回路210を参照することができる。
量子化器585は、音源マルチパルス列を量子化して符
号を出力する。
量子化器590の出力であるマルチパルス列を量子化し
た符号、量子化器516の出力であるピンチパラメータ
を量子化した符号、さらに量子化器525の出力である
前記選択されたコードのインデクスと最適なゲインを表
す符号は、それぞれマルチプレクサ630の入力となる
。マルチプレクサ630は以上の各符号を組み合わせて
出力する。
一方、受信側では、デマルチプレクサ710は、マルチ
パルス列の符号、ピッチパラメータの符号、前記選択さ
れたコードのインデクスと最適なゲインを表す符号を分
離して出力する。
音源パルス復号器720は、マルチパルスの振幅。
位置を復号する。
コードブック選択回路752は、インデクスを復号し、
受信側と同じコードブック751の中から前記復号した
インデクスに対応するコードを選択する。
ゲイン回路750は、ゲインを復号し、前記選択された
コードと復号されたゲインを用いてスペクトルパラメー
タを復号し出力する。
ピッチパラメータ復号器740は、送信側の逆量子化・
器518と同じ働きをする。
パルス発生H730は、前記マルチパルス列による音源
信号を発生させる。
ピッチ再生フィルタ755は、前記重められた音源信号
と前記復号されたピッチパラメータを入力として、ピッ
チを再生した合成音源信号を再生する。
スペクトル包絡フィルタ回路760では、前記音源信号
及び前記復号されたスペクトルパラメータを用いて合成
音声波形を求めて出力端子770へ出力する。
以上述べた構成は本発明の一構成にすぎず、種々の変形
も可能である。
マルチパルスの計算方法としては、前記文献工に示した
方法の他に、種々の周知な方法を用いることができる。
また、スペクトルパラメータとしては、他の周知なパラ
メータ(線スペクトル対、ケプストラム。
ノルケプストラム。対数断面積比等)を用いることもで
きる。
〔発明の効果〕
本発明によれば、スペクトルパラメータを予め定められ
た複数個の関数を用いて表すことで、従来方法に比べ非
常に少ない計算量で、かつ従来方法に比べ少ない伝送情
報量で音声信号を良好に表すことができるという大きな
効果がある。
【図面の簡単な説明】
第1図は本発明による音声符号化復号化方法とその装置
の一実施例の構成を示すブロック図、第2図は本発明の
作用を示すブロック図である。 500 ・・・・・入力端子 510  ・・・・・時間分割回路 515  ・・・・・ピッチパラメータ計算回路520
  ・・・・・スペクトルパラメータ計算回路516.
590・・・量子化器 518、530・・・逆量子化器 521、751・・・コードブック 522、260・・・ゲイン計算回路 540  ・・・・・重み付は回路 550  ・・・・・インパルス応答計算回路560、
252・・・自己相関計算回路570、251・・・相
互相関計算回路580  ・・・・・音源パルス計算回
路730  ・・・・・パルス発生器 755  ・・・・・ピッチ再生フィルタ760  ・
・・・・スペクトル包絡フィルタ630  ・・・・・
マルチプレクサ 710  ・・・・・デマルチプレクサ720  ・・
・・・音源パルス復号器740  ・・・・・ピッチパ
ラメータ復号器750  ・・・・・ゲイン回路 770  ・・・・・出力端子

Claims (3)

    【特許請求の範囲】
  1. (1)離散的な音声信号を入力し、予め定められた時間
    長のフレーム毎にスペクトル包絡を表すスペクトルパラ
    メータと音源信号を抽出し、前記スペクトルパラメータ
    と前記音源信号を量子化して組み合わせて伝送し、前記
    組み合わされた信号から前記音源信号と前記スペクトル
    パラメータを分離し復元し、前記音声信号を良好に再生
    して出力する音声符号化復号化方法において、 前記スペクトルパラメータを、予め複数個の関数を有し
    前記関数の中から前記予め用意された関数の自己相関と
    、前記予め用意された関数と前記入力信号との相互相関
    を用いて最適なものを選択して、前記スペクトルパラメ
    ータを量子化することを特徴とする音声符号化復号化方
    法。
  2. (2)入力した離散的な音声信号系列から短時間スペク
    トル特性を表すスペクトルパラメータを求めるスペクト
    ルパラメータ計算回路と、 前記音声信号を予め複数個の関数を有し前記関数の中か
    ら、前記予め用意された関数の自己相関と、前記予め用
    意された関数と前記入力信号との相互相関を用いて最適
    なものを選択して表現するスペクトルパラメータ量子化
    回路と、 前記量子化されたスペクトルパラメータを逆量子化する
    逆量子化回路と、 前記逆量子化回路の出力を用いて前記音声信号の音源信
    号を複数個のパルス列を用いて表して符号化する音源信
    号計算回路と、 前記スペクトルパラメータを表す関数を表す符号と前記
    マルチパルス列を表す符号とを組み合わせて出力するマ
    ルチプレクサ回路とを有することを特徴とする音声符号
    化装置。
  3. (3)音源信号を表す符号と前記音声信号のスペクトル
    パラメータを表す関数を表す符号とを入力して分離し復
    号化するデマルチプレクサ回路と、前記復号化されたス
    ペクトルパラメータを表す関数から短時間スペクトル特
    性を表すスペクトルパラメータを復号するスペクトルパ
    ラメータ復号回路と、 音源信号を用いてマルチパルス列を復元し音源信号を復
    元する音源信号復元回路と、 前記復元された音源信号と前記復号されたスペクトルパ
    ラメータとを用いて音声信号を合成する合成フィルタ回
    路とを有することを特徴とする音声復号化装置。
JP1118631A 1989-05-15 1989-05-15 音声符号化復号化方法及びその装置 Expired - Lifetime JP2946528B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1118631A JP2946528B2 (ja) 1989-05-15 1989-05-15 音声符号化復号化方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1118631A JP2946528B2 (ja) 1989-05-15 1989-05-15 音声符号化復号化方法及びその装置

Publications (2)

Publication Number Publication Date
JPH02299000A true JPH02299000A (ja) 1990-12-11
JP2946528B2 JP2946528B2 (ja) 1999-09-06

Family

ID=14741312

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1118631A Expired - Lifetime JP2946528B2 (ja) 1989-05-15 1989-05-15 音声符号化復号化方法及びその装置

Country Status (1)

Country Link
JP (1) JP2946528B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5058115A (en) * 1989-03-10 1991-10-15 International Business Machines Corp. Fault tolerant computer memory systems and components employing dual level error correction and detection with lock-up feature

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3035960B2 (ja) 1990-03-09 2000-04-24 日本電気株式会社 音声符号化復号化方法及びその装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5058115A (en) * 1989-03-10 1991-10-15 International Business Machines Corp. Fault tolerant computer memory systems and components employing dual level error correction and detection with lock-up feature

Also Published As

Publication number Publication date
JP2946528B2 (ja) 1999-09-06

Similar Documents

Publication Publication Date Title
US20060074644A1 (en) Voice code conversion apparatus
JPH0353300A (ja) 音声符号化装置
JP2903533B2 (ja) 音声符号化方式
US5826221A (en) Vocal tract prediction coefficient coding and decoding circuitry capable of adaptively selecting quantized values and interpolation values
US5091946A (en) Communication system capable of improving a speech quality by effectively calculating excitation multipulses
KR20070029754A (ko) 음성 부호화 장치 및 그 방법과, 음성 복호화 장치 및 그방법
EP1881488A1 (en) Encoder, decoder, and their methods
JPH02299000A (ja) 音声符号化復号化方法及びその装置
JP3303580B2 (ja) 音声符号化装置
KR0155798B1 (ko) 음성신호 부호화 및 복호화 방법
Rebolledo et al. A multirate voice digitizer based upon vector quantization
JPH028900A (ja) 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置
JP2004348120A (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP2615862B2 (ja) 音声符号化復号化方法とその装置
JP3035960B2 (ja) 音声符号化復号化方法及びその装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
WO2000003385A1 (en) Voice encoding/decoding device
JPH05127700A (ja) 音声符号化復号化方法およびそのための装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP3128226B2 (ja) 音声符号化方法
JPH02170199A (ja) 音声符号化復号化方式
JPH01263700A (ja) 音声符号化復号化方法並びに音声符号化装置及び音声復号化装置
JPH0612097A (ja) 音声の予測符号化方法および装置
JPH01233499A (ja) 音声信号符号化復号化方法及びその装置
JPH01293400A (ja) 音声符号化復号化方法並びに音声符号化装置及び音声復号化装置