JPH07248800A - 音声処理装置 - Google Patents

音声処理装置

Info

Publication number
JPH07248800A
JPH07248800A JP6042569A JP4256994A JPH07248800A JP H07248800 A JPH07248800 A JP H07248800A JP 6042569 A JP6042569 A JP 6042569A JP 4256994 A JP4256994 A JP 4256994A JP H07248800 A JPH07248800 A JP H07248800A
Authority
JP
Japan
Prior art keywords
search
codebook
speech
adaptive codebook
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6042569A
Other languages
English (en)
Inventor
Kai Gi
回 魏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP6042569A priority Critical patent/JPH07248800A/ja
Publication of JPH07248800A publication Critical patent/JPH07248800A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】本発明は、処理速度を速めることができる音声
処理装置を提供する。 【構成】入力音声1のフレームを構成する各サブフレー
ムについて適応符号帳の符号語P^の検索結果から音声
波形P´を生成し、この音声波形P´を逆合成フィルタ
4を通して駆動信号源P1 を生成するとともに、該駆動
信号源P1 を用いて雑音符号帳5の符号語P1 ^との直
接比較によって雑音符号帳5の検索を行うようにしてい
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、符号励振形線形予測
(CELP)方式を採用した音声処理装置に関するもの
である。
【0002】
【従来の技術】最近、通信回線を介して音声信号を送る
システムが実用に向け開発されているが、このようなシ
ステムでは、通信回線を介して送受信される信号量を最
小限にするため音声信号を圧縮、伸張して情報量を少な
くして、一方の端末より入力される音声入力を圧縮し、
この圧縮された信号を通信回線を介して相手側に送信
し、一方、相手側より通信回線を介して受信した信号を
伸張し、この伸張した音声信号を出力するようにしたも
のがある。
【0003】このような圧縮、伸張方式の1つとしてC
ELP方式がある。このCELP方式を採用した音声処
理装置では、送信側の音声信号圧縮手段として、音声信
号を1フレーム毎に短期線形予測をし、この短期線形予
測により予測された信号と入力信号との差を複数のサブ
フレームに分割し、これらサブフレームに対しコードブ
ックを用意しておき、入力される音声信号の各サブフレ
ームに対し最も類似する代表ベクトルをコードブックか
ら検索し、この検索された代表ベクトルの符号コードを
圧縮信号として出力し、一方、受信側の音声信号伸張手
段として、上述したと同様なコードブックを用意してお
き、通信回線を介して受けとった符号コードから該当す
る代表ベクトルを伸張信号として選択し、音声信号の各
サブフレームを再現するようになっている。
【0004】ところで、このようなCELP方式による
コードブック検索は、音声信号のフレーム全長に亘って
歪みが最小になるように、各サブフレームを2つのコー
ドブックに対して行うようにしている。つまり、音声を
合成する励振源は、ピッチ周期成分と雑音成分からなっ
ているが、これらピッチ周期成分と雑音成分に対応する
適応符号帳と雑音符号帳の2つのコードブックを用い、
これら2つのコードブックに対して各サブフレーム単位
で最小誤差評価により検索を行うようにしている。
【0005】図4は、従来のサブフレームに対するコー
ドブックの検索方法を説明するもので、差音声S(入力
音声と予測音声との差)を聴覚重み付けフィルタ22を
通して第1の検索原波形Pを生成し、この第1の検索原
波形Pにより適応符号帳の検索により最適な符号語を検
索して、これを適応ベクトル励振源P^として出力す
る。ここで得られた波形P^と第1の検索波形Pとの比
較結果により第2の検索波形P´を求め、さらに雑音符
号帳23の全符号語について10次乗算フィルタなどか
らなる合成フィルタ24を通して合成波形P´^を生成
し、この音声波形P´から合成波形P´^を減算すると
ともに、これらが波形上最小誤差になるように距離計算
・最適音源選択部25での最小誤差評価による検索を実
行するようにしている。
【0006】つまり、従来の検索方法では、合成波形と
音声波形の波形上誤差最小化する目的で、雑音符号帳2
3の全符号語についてそれぞれ合成フィルタ24を通す
ことにより一旦音声信号を再生しながら最小誤差評価を
行うようになっている。
【0007】
【発明が解決しようとする課題】ところが、このように
した検索方法を採用すると、合成フィルタ24の係数
は、サブフレーム毎に変化するため、各サブフレームの
毎回の検索に対し雑音符号帳23の全符号語について、
それぞれ係数を変更しながら合成フィルタ24を通して
最小誤差評価を行う処理を行わなければならず、このた
めに処理に多大の時間が掛かってしまい、処理速度が著
しく遅くなるという問題点があった。本発明は、上記事
情に鑑みてなされたもので、処理速度を速めることがで
きる音声処理装置を提供することを目的とする。
【0008】
【課題を解決するための手段】本発明によれば、入力音
声を所定の量子化幅でベクトル量子化するものにおい
て、入力音声信号を代表ベクトルと同じ符号語に変換す
る変換手段と、この変換手段により変換された入力音声
信号と代表ベクトルを直接比較することにより最適な代
表ベクトルを選択するベクトル量子化手段とにより構成
されている。
【0009】また、本発明によれば、ベクトル量子化手
段は、前記変換手段により変換された入力音声信号と複
数の代表ベクトルとを一度にそれぞれ直接比較すること
により最適な代表ベクトルを選択するように構成されて
いる。
【0010】また、本発明によれば、複数のサブフレー
ムからなるフレームに多分割された入力音声の各サブフ
レームについて適応符号帳の検索処理を行う適応符号帳
検索手段と、この適応符号帳検索手段の検索結果より駆
動信号源を生成する逆合成フィルタと、この逆合成フィ
ルタより生成された駆動信号源を用い雑音符号帳の符号
語との直接比較により検索処理を行う雑音符号帳検索手
段とを具備し、前記適応符号帳および雑音符号帳の検索
結果より符号化データを出力可能に構成されている。
【0011】また、本発明によれば、複数のサブフレー
ムからなるフレームに多分割された入力音声の各サブフ
レームの全体長について適応符号帳の検索処理を行う適
応符号帳検索手段と、この適応符号帳検索処理手段の検
索結果より駆動信号源を生成する逆合成フィルタと、こ
の逆合成フィルタより生成された駆動信号源を用い雑音
符号帳の複数の符号語との直接比較により該複数の符号
語の中から最適な符号語を検索する雑音符号帳検索手段
とを具備し、前記適応符号帳および雑音符号帳の検索結
果から符号データを出力可能に構成されている。
【0012】
【作用】この結果、本発明によれば、入力音声を所定の
量子化幅でベクトル量子化する際に、入力音声信号を代
表ベクトルと同じ符号語に変換し、この変換された入力
音声信号と代表ベクトルを直接比較することで最適な代
表ベクトルを選択するようにしているので、いかなる入
力音声に対しても入力音声に最も類似する最適な代表ベ
クトルによりベクトル量子化を行うことができる。
【0013】また、本発明によれば、変換された入力音
声信号と複数の代表ベクトルとを一度にそれぞれ直接比
較することにより最適な代表ベクトルを選択するように
しているので、選択のための時間を大幅に短縮すること
ができる。
【0014】また、本発明によれば、複数のサブフレー
ムからなるフレームに多分割された入力音声の各サブフ
レームについて適応符号帳検索手段により適応符号帳の
検索処理を行い、この検索結果より逆合成フィルタによ
り駆動信号源を生成するとともに、この生成された駆動
信号源を用い雑音符号帳検索手段により雑音符号帳の符
号語との直接比較により検索処理を可能にして、これら
の検索結果よりパラメータ符号化データを生成するよう
にしたので、雑音符号帳での検索時間を大幅に短縮する
ことができる。
【0015】また、本発明によれば、複数のサブフレー
ムからなるフレームに多分割された入力音声の各サブフ
レームの全体長について適応符号帳検索手段により適応
符号帳の検索処理を行い、この検索結果より逆合成フィ
ルタにより駆動信号源を生成するとともに、この生成さ
れた駆動信号源を用い雑音符号帳検索手段により雑音符
号帳の符号語との直接比較を可能にして前記サブフレー
ムの全体長および前記サブフレームの前後半の1/2長
に対して検索処理を行い、これらの検索結果と該検索結
果に対応する入力音声との類似度の最も高いものからパ
ラメータ符号データを生成するようにしたので、いかな
る入力音声に対しても入力音声に最も類似する最適な符
号長検索結果によりパラメータ符号データを生成するこ
とができる。
【0016】
【実施例】以下、本発明の実施例を図面に従い説明す
る。 (第1実施例)図1は第1実施例の概略構成を示してい
る。図において、1は入力音声で、この入力音声1は複
数のフレームに多分割して入力される。ここでの1フレ
ームは複数(例えば4個)のサブフレームからなってい
る。
【0017】このような入力音声1をサブフレーム毎に
聴覚重み付きフィルタ2を通し原波形Pとして生成する
ようにしている。この原波形Pを、適応符号帳の符号語
P^とともに加算器3に与える。この場合、原波形Pに
より適応符号帳の符号語P^を検索し、これにより得ら
れた波形と原波形Pとの加算結果により音声波形P´を
生成するようにしている。
【0018】そして、この音声波形P´を逆合成フィル
タ4に与え、符号語に変換して駆動信号源P1 を生成す
る。また、逆合成フィルタ4からの駆動信号源P1 を雑
音符号帳5の符号語P1 ^の負入力とともに加算器6に
与え、この加算器6の減算結果を距離計算・最適音源選
択部7に与えるようにしている。
【0019】距離計算・最適音源選択部7は、駆動信号
源P1 と符号語P1 ^の関係が波形上最小誤差になるよ
うに最小誤差評価による検索を実行し、雑音符号成分を
生成するようにしている。
【0020】しかして、このような構成に対して図2に
示すフローチャートの制御が実行される。まず、ステッ
プ201で入力音声1の最初のフレームを取り込む。
【0021】次に、ステップ202で、過去のフレーム
から今回の音声を線形予測して、入力音声から減算す
る。そして、ステップ203で減算結果Sの最初のフレ
ームの1番目のサブフレームを取り込む。この場合、サ
ブフレーム単位の入力音声1を聴覚重み付きフィルタ2
を通し第1の検索波形Pとして生成する。
【0022】そして、ステップ204でサブフレームの
全体長Nに対する適応符号帳の検索を行う。この場合、
第1の検索波形Pを、適応符号帳の符号語を聴覚重み付
きフィルタおよび合成フィルタ(図示せず)を介して再
生した適応ベクトル励振音源P^の負入力とともに加算
器3に与え、この加算器3の獅子が最小になるように第
1の検索波形Pにより適応符号帳の符号語を検索し、こ
れにより得られた最適符号語に対応する励振音源P^の
負入力と第1の検索波形Pの加算結果により第2の検索
波形P´を求める。そして、この音声波形P´を逆合成
フィルタ4に与え、符号語に変換された駆動信号源P1
を生成する。
【0023】次に、ステップ205で駆動信号源P1
用いてサブフレームの全体長Nに対する雑音符号帳5の
検索を行う。この場合、逆合成フィルタ4の駆動信号源
1と雑音符号帳5の符号語P1 ^の負入力を加算器6
に与え、ここでの加算結果を距離計算・最適音源選択部
7に与え、駆動信号源P1 と符号語P1 ^の関係が波形
上最小誤差になるように最小誤差評価による検索を実行
し、距離の近い代表ベクトルを雑音符号成分を生成す
る。つまり、逆合成フィルタ4の駆動信号源P1を用い
て雑音符号帳5の符号語P1 ^との直接比較により雑音
符号帳5の検索を行うことになる。
【0024】これにより、1番目のサブフレームに対し
て下式が成立し、これにより得られる励振源E(i)に
基づいて圧縮したパラメータ符号化データ(それぞれの
符号帳のインデックスおよびゲイン)が生成されるよう
になる。
【0025】 E(i)=α*A(i)+β*C(i) 0≦i<N …(1) 但し、A(i)は、適応符号帳検索によるピッチ周期成
分、C(i)は、雑音符号帳検索による雑音成分、αは
適応符号ゲイン、βは雑音符号ゲイン。
【0026】そして、ステップ206に進み、ここで最
終サブフレームを判断しなければ、ステップ207で次
サブフレームを取り込んでステップ204に戻り、上述
したと同様な動作を繰り返す。
【0027】その後、ステップ206で最終サブフレー
ムを判断すると、ステップ208に進み、ここで入力音
声の最終フレームかを判断し、NOならばステップ20
9で次のフレームを取り込み、ステップ203に戻り、
上述したと同様な動作を繰り返す。
【0028】従って、このような第1実施例によれば、
入力音声1のフレームを構成する各サブフレームについ
て適応符号帳の符号語P^の検索結果から音声波形P´
を生成し、この音声波形P´を逆合成フィルタ4を通し
て駆動信号源P1 を生成するとともに、該駆動信号源P
1 を用いて雑音符号帳5の符号語P1 ^との直接比較に
よって雑音符号帳5の検索を行うようにできるので、従
来の雑音符号帳の全符号語について、その係数を変更す
るような合成フィルタを用いて合成波形を生成し、この
合成波形について検索を行うものと比べ、雑音符号帳5
での検索時間を大幅に短縮することができ、処理速度を
一段と速めることが可能になる。
【0029】ちなみに、実際の音声データを用いて実験
したところ、音声の品質は多少落ちたものの、検索速度
が従来のものに比べ30%も上昇し、その利用効果が大
きいことが確認された。
【0030】なお、適応符号帳に対しても同様に直接符
号語により検索することが考えられるが、音声品質が劣
化が著しいので、それぞれの符号帳のサイズなどを考慮
すると、上記実施例がよいと思われる。
【0031】(第2実施例)図3は、第2実施例の概略
構成を示すもので、図1と同一部分には同符号を付して
いる。
【0032】第2実施例では、第1実施例で問題となっ
た音声品質を改善するものである。第1実施例では、雑
音符号帳5を符号語により直接検索するとき、1つの候
補でしか検索していなかった。このため、必ずしも選択
された符号語か最適とは限らなかった。
【0033】そこで、第2実施例では、複数(第2実施
例では3候補)の候補の中から最適なものを選択するも
のである。この場合、雑音符号帳5に対して3つの候補
を選択するルーチン51、52、53を設け、駆動信号
源P1 からそれぞれのルーチンの出力P1 ^P2 ^P3
を減算して、それぞれ距離計算・最適音源選択部7に出
力する。距離計算・最適音源選択部7でそれぞれの減産
結果の中から最適なものを選択することにより音声品質
を保ったままで符号語により直接検索することができ
る。勿論、この場合も第1実施例と同様に雑音符号帳5
での検索時間を大幅に短縮することができ、処理速度を
一段と速めることが可能になる。なお、本発明は上記実
施例にのみ限定されず、要旨を変更しない範囲で適宜変
形して実施できる。
【0034】
【発明の効果】以上述べたように本発明によれば、入力
音声を所定の量子化幅でベクトル量子化する際に、入力
音声信号を代表ベクトルと同じ符号語に変換し、この変
換された入力音声信号と代表ベクトルを直接比較するこ
とで最適な代表ベクトルを選択するようにしているの
で、いかなる入力音声に対しても入力音声に最も類似す
る最適な代表ベクトルにより最適なベクトル量子化を行
うことができる。
【0035】また、本発明によれば、変換された入力音
声信号と複数の代表ベクトルとを一度にそれぞれ直接比
較することにより最適な代表ベクトルを選択するように
しているので、代表ベクトル選択のための時間を大幅に
短縮することができ、一連の処理に要する速度を速める
ことができる。
【0036】また、本発明によれば、複数のサブフレー
ムからなるフレームに多分割された入力音声の各サブフ
レームについて適応符号帳検索手段により適応符号帳の
検索処理を行い、この検索結果より逆合成フィルタによ
り駆動信号源を生成するとともに、この生成された駆動
信号源を用い雑音符号帳検索手段により雑音符号帳の符
号語との直接比較により検索処理を可能にして、これら
の検索結果よりパラメータ符号化データを生成するよう
にしたので、雑音符号帳での検索時間を大幅に短縮する
ことができ、処理に要する速度を一段と速めることがで
きる。
【0037】また、本発明によれば、複数のサブフレー
ムからなるフレームに多分割された入力音声の各サブフ
レームの全体長について適応符号帳検索手段により適応
符号帳の検索処理を行い、この検索結果より逆合成フィ
ルタにより駆動信号源を生成するとともに、この生成さ
れた駆動信号源を用い雑音符号帳検索手段により雑音符
号帳の符号語との直接比較を可能にして前記サブフレー
ムの全体長および前記サブフレームの前後半の1/2長
に対して検索処理を行い、これらの検索結果と該検索結
果に対応する入力音声との類似度の最も高いものからパ
ラメータ符号データを生成するようにしたので、雑音符
号帳での検索時間を大幅に短縮できることは勿論、いか
なる入力音声に対しても入力音声に最も類似する最適な
符号長検索結果によりパラメータ符号データを生成する
ことができ、処理速度を一段と速めることが可能にな
る。
【図面の簡単な説明】
【図1】本発明の第1実施例の概略構成を示す図。
【図2】第1実施例の動作を説明するためのフローチャ
ート。
【図3】本発明の第2実施例の概略構成を示す図。
【図4】従来の雑音符号帳の検索方法を説明するための
図。
【符号の説明】
1…入力音声、 2…聴覚重み付きフィルタ、 3…加算器、4…逆合成フィルタ、 5…雑音符号帳、 6…加算器、 7…距離計算・最適音源選択部。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力音声を所定の量子化幅でベクトル量
    子化するものにおいて、 入力音声信号を代表ベクトルと同じ符号語に変換する変
    換手段と、 この変換手段により変換された入力音声信号と代表ベク
    トルを直接比較することにより最適な代表ベクトルを選
    択するベクトル量子化手段と、 を具備したことを特徴とする音声処理装置。
  2. 【請求項2】 上記ベクトル量子化手段は、前記変換手
    段により変換された入力音声信号と複数の代表ベクトル
    とを一度にそれぞれ直接比較することにより最適な代表
    ベクトルを選択することを特徴とする請求項1記載の音
    声処理装置。
  3. 【請求項3】 複数のサブフレームからなるフレームに
    多分割された入力音声の各サブフレームについて適応符
    号帳の検索処理を行う適応符号帳検索手段と、 この適応符号帳検索手段の検索結果より駆動信号源を生
    成する逆合成フィルタと、 この逆合成フィルタより生成された駆動信号源を用い雑
    音符号帳の符号語との直接比較により検索処理を行う雑
    音符号帳検索手段とを具備し、 前記適応符号帳および雑音符号帳の検索結果より符号化
    データを出力可能にしたことを特徴とする音声処理装
    置。
  4. 【請求項4】 複数のサブフレームからなるフレームに
    多分割された入力音声の各サブフレームの全体長につい
    て適応符号帳の検索処理を行う適応符号帳検索手段と、 この適応符号帳検索処理手段の検索結果より駆動信号源
    を生成する逆合成フィルタと、 この逆合成フィルタより生成された駆動信号源を用い雑
    音符号帳の複数の符号語との直接比較により該複数の符
    号語の中から最適な符号語を検索する雑音符号帳検索手
    段とを具備し、 前記適応符号帳および雑音符号帳の検索結果から符号デ
    ータを出力可能にしたことを特徴とする音声処理装置。
JP6042569A 1994-03-14 1994-03-14 音声処理装置 Pending JPH07248800A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6042569A JPH07248800A (ja) 1994-03-14 1994-03-14 音声処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6042569A JPH07248800A (ja) 1994-03-14 1994-03-14 音声処理装置

Publications (1)

Publication Number Publication Date
JPH07248800A true JPH07248800A (ja) 1995-09-26

Family

ID=12639703

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6042569A Pending JPH07248800A (ja) 1994-03-14 1994-03-14 音声処理装置

Country Status (1)

Country Link
JP (1) JPH07248800A (ja)

Similar Documents

Publication Publication Date Title
JP2746039B2 (ja) 音声符号化方式
US5724480A (en) Speech coding apparatus, speech decoding apparatus, speech coding and decoding method and a phase amplitude characteristic extracting apparatus for carrying out the method
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
US6978235B1 (en) Speech coding apparatus and speech decoding apparatus
US5864797A (en) Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors
KR20030076725A (ko) 음성 부호화 장치와 방법, 및 음성 복호화 장치와 방법
JP2624130B2 (ja) 音声符号化方式
EP1093230A1 (en) Voice coder
JP3303580B2 (ja) 音声符号化装置
JP2538450B2 (ja) 音声の励振信号符号化・復号化方法
JP2613503B2 (ja) 音声の励振信号符号化・復号化方法
JP3360545B2 (ja) 音声符号化装置
JP3144284B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JPH07248800A (ja) 音声処理装置
JP3153075B2 (ja) 音声符号化装置
JP3471542B2 (ja) 音声符号化装置
JP3252285B2 (ja) 音声帯域信号符号化方法
JPH02282800A (ja) 音声符号化方式
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3192051B2 (ja) 音声符号化装置
JP3319551B2 (ja) ベクトル量子化装置
JP3199128B2 (ja) 音声の符号化方法
JP3576805B2 (ja) 音声符号化方法及びシステム並びに音声復号化方法及びシステム
JP3714786B2 (ja) 音声符号化装置