JPH1020895A - 音声符号化装置および記録媒体 - Google Patents

音声符号化装置および記録媒体

Info

Publication number
JPH1020895A
JPH1020895A JP8171485A JP17148596A JPH1020895A JP H1020895 A JPH1020895 A JP H1020895A JP 8171485 A JP8171485 A JP 8171485A JP 17148596 A JP17148596 A JP 17148596A JP H1020895 A JPH1020895 A JP H1020895A
Authority
JP
Japan
Prior art keywords
codebook
speech
candidate
analyzer
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8171485A
Other languages
English (en)
Inventor
Takuya Kawashima
嶋 拓 也 河
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP8171485A priority Critical patent/JPH1020895A/ja
Publication of JPH1020895A publication Critical patent/JPH1020895A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 ディレイドディシジョン法を常時適用する場
合の処理量の増加を低減し、かつ聴感的に劣化の無い符
号化音声を得る。 【解決手段】 聴覚重み付け合成フィルタ108からの
合成音声と聴覚重み付けフィルタ103からの聴覚重み
付けされた入力音声との誤差が最小となる候補系列を各
コードブック105、106、107から選択するため
の評価情報を2乗誤差最小化制御手段109が出力し、
この評価情報をもとに、ディレイドディシジョン制御手
段110が、パワー分析器104からの音声信号レベル
や有音・無音情報によりそれ以降のディレイド ディシ
ジョンの必要度を計算して実行するか否かの制御を行
う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、移動体通信に用い
られ、入力音声信号を一定区間のフレームに分割し、声
道情報と音源情報とに分離し、声道情報を線形予測パラ
メータ、音源情報を数種のコードブックにより表現する
音声符号化装置に関する。
【0002】
【従来の技術】従来、この種の音声符号化装置として、
4 〜8kbps 程度のビットレートので符号化するCELP
(Code Excited Linear Prediction coding: 線形予測符
号化)方式がある。CELP方式は、入力音声信号をあ
らかじめ定められた時間長の音声フレームに分割し、各
音声フレームを線形予測分析器により分析して線形予測
係数を算出し、この線形予測係数により構成される聴覚
重み付け合成フィルタを、コードブックから選択した音
源信号により励振することによって合成音声信号を得る
方法である。コードブックとしては、過去の音源信号を
蓄えておき、入力信号のピッチ周期に応じて切り出して
用いる適応コードブックと、あらかじめ学習により作成
した音源信号を格納していて、その中から音源信号とし
て最もふさわしいものを取り出して用いる雑音コードブ
ックとを有し、これらコードブックの線形和を音源信号
として聴覚重み付け合成フィルタに入力し、符号化音声
を得る。
【0003】以下、図3を参照してこの種の音声符号化
装置について説明する。まず、ピッチ分析器301によ
り算出されたピッチ候補に応じて、適応コードブック3
05に蓄えられた過去の音源信号から適応コードブック
候補を選択する。選択された適応コードブック候補と雑
音コードブック306の雑音コードブック候補との線形
和により表される駆動音源候補を生成し、この駆動音源
候補と線形予測分析器302により入力信号から算出さ
れた線形予測係数とから聴覚重み付け合成フィルタ30
8により合成音声を得る。この合成音声と聴覚重み付け
フィルタ303を通した入力音声との誤差が最小となる
ように、2乗誤差最小化手段309によりコードブック
候補系列が選ばれる。ただし、聴覚重み付けされた入力
音声と聴覚重み付けされた合成音声との誤差を、各コー
ドブックの全組合せについて計算するには膨大な演算が
必要であるため、実際には各コードブックについて逐次
的に最適なコードブックを決定していく方法がとられ
る。上記構成例を用いて説明すると、まず第一段階とし
て適応コードブック305の候補を決定し、第二段階と
して、その候補に対して最適な組合せとなる雑音コード
ブック306の候補を選択し、最終段階として誤差が最
小となるゲインをゲインコードブック307で決定する
ことにより、コードブックの候補系列を決定している。
そして、これらコードブックからのインデックスと線形
予測係数とパワー分析器304からの入力音声のパワー
とをマルチプレクサ310で合成して符号化音声を出力
する。
【0004】
【発明が解決しようとする課題】しかしながら、このよ
うな逐次的な選択方法では、最適なコードブックの組合
せを得ることは保証されないため、PDCハーフレート
音声符号化方式であるPSI−CELP方式(RCR−
27D)のように、第一段階である適応コードブックの
候補を2候補残し、それぞれの候補に対して誤差が最小
となるように、雑音コードブック、ゲインコードブック
の候補が選択され、最終的に誤差が少ない適応コードブ
ック、雑音コードブック、ゲインコードブックの候補の
組が選択されるディレイドディシジョン法が適用されて
いるが、このような最終ステップにおいてそれぞれの候
補の組み合わせの誤差が最小となる候補系列を選択する
ディレイドディシジョン法を常時適用していたのでは、
通常第一段階に候補を決定する適応コードブックにおい
て、2種類の候補を残すだけでも処理量が大幅に増えて
しまうという問題点を有していた。
【0005】本発明は、上記従来の問題を解決するもの
で、音声信号の音声レベルやコードベクトル決定時の評
価値等を用いて、サブフレーム毎にディレイドディシジ
ョンを実行するか否かを決定することにより、常にディ
レイドディシジョンを行う場合と比較して、処理量を効
果的に低減し、なおかつ聴感的に劣化の無い符号化音声
を得ることのできる音声符号化装置を提供することを目
的とする。
【0006】
【課題を解決するための手段】上記目的を達成するため
に本発明は、従来のCELP符号化装置に音声信号の音
声レベルや音源コードブック候補決定時の評価値から、
それ以後のディレイドディシジョンの必要度を計算して
実行するか否かの制御を行うディレイドディシジョン制
御手段を備えたものである。これにより、処理量を効果
的に低減し、なおかつ常にディレイドディシジョンを行
う場合と比較しても、聴感的に劣化の無い符号化音声を
得ることができる。
【0007】
【発明の実施の形態】本発明の請求項1に記載の発明
は、入力音声信号を一定区間のフレームに分割し、声道
情報と音源情報とに分離し、声道情報を線形予測パラメ
ータ、音源情報を数種のコードブックにより表現する音
声符号化装置において、入力音声信号からピッチ候補を
算出するピッチ分析器と、入力音声信号から線形予測係
数を算出する線形予測分析器と、入力音声信号に対して
聴覚重み付けを行う聴覚重み付けフィルタと、入力音声
信号の音声レベルを求めるパワー分析器と、過去の音源
信号を蓄積してピッチ分析器からのピッチ候補に応じて
適応コードブック候補を選択する適応コードブックと、
あらかじめ学習により作成された音源信号を蓄積した雑
音コードブックと、適応コードブック候補および雑音コ
ードブック候補のゲインを選択するゲインコードブック
と、線形予測分析器からの線形予測係数と各コードブッ
ク候補の線形和とから合成音声を生成する聴覚重み付け
合成フィルタと、聴覚重み付け合成フィルタからの合成
音声と聴覚重み付けフィルタからの聴覚重み付けされた
入力音声との誤差が最小となる候補系列を各コードブッ
クから選択するための評価情報を出力する2乗誤差最小
化制御手段と、出力された評価情報をもとに適応コード
ブックおよび雑音コードブックからコードブック候補を
選択するとともに、その評価情報とパワー分析器からの
音声信号レベルや有音・無音情報により、それ以降のデ
ィレイドディシジョンの必要度を計算して実行するか否
かの制御を行うディレイドディシジョン制御手段とを備
えた音声符号化装置であり、常時ディレイドディシジョ
ンを行なう場合に比べ、処理量を削減しつつ、かつ音質
劣化の無い合成音声を得ることができる。
【0008】また、請求項2に記載の発明は、請求項1
に記載の音声符号化装置を、信号処理プロセッサを用い
てソフトウェアで実現するためのプログラムを記憶させ
た記憶媒体であり、例えば、プログラムをROMや磁気
ディスク等に記憶させることにより、パーソナルコンピ
ュータ等の汎用信号処理装置上で、ソフトウェアにより
本発明の音声符号化装置を実現できるものである。
【0009】以下、本発明の実施の形態について、図1
および図2を用いて説明する。 (実施の形態)図1は本発明の形態における音声符号化
装置の構成を示すものであり、従来のCELP符号化装
置に、入力音声レベルや各コードブックにおける候補選
択時の評価値によりディレイドディシジョンの制御を行
なう構成を付加したものである。図1において、101
は入力音声からピッチ候補を算出するピッチ分析器、1
02は入力音声から線形予測係数を算出する線形予測分
析器、103は入力音声に対して聴覚重み付けを行う聴
覚重み付けフィルタ、104は入力音声の音声レベルを
求めるパワー分析器、105は過去の音源信号を蓄積し
てピッチ分析器101からのピッチ候補に応じて適応コ
ードブック候補を選択する適応コードブック、106は
あらかじめ学習により作成された音源信号を蓄積した雑
音コードブック、107は適応コードブック候補および
雑音コードブック候補のゲインを選択するゲインコード
ブック、108は線形予測分析器102からの線形予測
係数と各コードブック候補の線形和とから合成音声を生
成する聴覚重み付け合成フィルタ、109は聴覚重み付
け合成フィルタ108からの合成音声と聴覚重み付けフ
ィルタ103からの聴覚重み付けされた入力音声との誤
差が最小となる候補系列を各コードブック105、10
6、107から選択するための評価情報を出力する2乗
誤差最小化制御手段、110は出力された評価情報をも
とに適応コードブック105および雑音コードブック1
06からコードブック候補を選択するとともに、その評
価情報とパワー分析器104からの音声信号レベルや有
音・無音情報により、それ以降のディレイドディシジョ
ンの必要度を計算して実行するか否かの制御を行うディ
レイドディシジョン制御手段、111は適応コードブッ
ク105、雑音コードブック106およびゲインコード
ブック107から選択された各コードブック候補と線形
予測分析器102からの線形予測係数とパワー分析器1
04からの音声信号レベル情報を合成して符号化音声を
出力するマルチプレクサである。
【0010】次に、上記のように構成された音声符号化
装置の動作を図2を参照しながら説明する。図1におい
て、入力音声は線形予測分析器102により線形予測係
数を算出し、この係数を用いて聴覚重み付け合成フィル
タ108を構成する。音源コードベクトルの出力は、聴
覚重み付け合成フィルタ108を通すことにより合成音
声が合成され、この合成音声と入力音声を聴覚重み付け
フィルタ103によって聴覚重み付けされたターゲット
ベクトルとの差が最小となるものが、2乗誤差最小化制
御手段109により選択される。具体的には、式(1)
に示す評価値を最小とする音源コードブックの候補が選
択される。 E2 =|t−gc ・H・cj 2 ・・・(1) ここで、tは入力音声を聴覚重み付けフィルタ103に
よって聴覚重み付けされたターゲットベクトル、gc
ゲイン、cj は音源コードベクトル、jは音源コードベ
クトルインデクス、Hは聴覚重み付けフィルタを表す。
複数のコードブックから逐次的にコードベクトルを選択
するには、ターゲットベクトルtから前段階で選択した
コードベクトルの値を減算するか、または選択しようと
するコードブックのコードベクトルを、前段階で選択し
たコードベクトルに対して直行化させてから選択する。
PSI−CELPにおいては、適応コードブック候補を
選択する場合に、誤差E2 が最小のもの2つを常に残
し、それぞれの候補に対して、雑音コードブック、ゲイ
ンコードブックの候補を選択し、最終的にE2 が最小の
候補系列を一つ選択する。
【0011】次に図2を用いて、ディレイドディシジョ
ン制御手段110における制御手順について説明する。
説明の簡単のため、音源コードブックは、適応コードブ
ック105、雑音コードブック106、ゲインコードブ
ック107により構成され、この順で候補が確定するも
のとする。また、適応コードブック105の候補を最大
2つ残すものとし、雑音コードブック106、ゲインコ
ードブック107は適応コードブック候補一つに対し、
唯一決定するものとする。まず、ステップ201で音声
レベルの判定を行なう。一般に音声レベルが小さい場合
には、聴感上影響が小さいため、高音質であることに固
執する必要が無い。これより、閾値をε s とおくと、音
声レベルがεs より大きい場合にはステップ204へ、
つまり適応コードブック候補を2つ残し、それ以外であ
る時には、ステップ202、つまり適応コードブック候
補を1つのみ残すものとする。ステップ202を選択し
た場合には、ステップ203で雑音コードブック候補、
ステップ208でゲインコードブックの候補をそれぞれ
一つずつ選択し、音源コードブック候補系列が決定す
る。
【0012】次に、ステップ204を選択した場合の説
明をする。ステップ205において残された2つの適応
コードブック候補を選択する際に算出された選択評価値
を比較する。ここでは式(1)に示すE2 を選択評価値
とし、この評価値が最小のものからが第一候補、第二候
補、・・・として選ばれるとする。この時、2つの候補
の選択評価値がある程度の差内である場合には、どちら
の候補が最終的に選択されるか判断できないため、ステ
ップ206で2候補とも選択するものとする。一方、2
つの候補の選択評価値がある程度差が大きい場合には、
第1候補の適応度が十分高いと考え、ステップ207で
適応コードブックの第一候補のみ残すものとする。ステ
ップ207の場合には、ステップ202で行った場合と
同様に雑音コードブック候補、ゲインコードブック候補
を一意に決定する。またステップ206の場合には、各
適応コードブック候補に対して、それぞれ雑音コードブ
ック候補、ゲインコードブック候補を一意に決定し、最
終的に誤差の少ない候補系列を選択するものとする。こ
のようにして、音声信号の音声レベルや音源コードブッ
ク候補決定時の評価値から、それ以後のディレイドディ
シジョンの必要度を計算して実行するか否かの制御を行
う。
【0013】なお以上の説明では、ディレイドディシジ
ョン選択基準として音声レベル、適応コードブック候補
選択評価値を用いた例で説明したが、その他の音声パラ
メータを用いたり、ニューラルネットワークにより、あ
らかじめ音声パターンとディレイドディシジョン実行率
等を学習させておき、ニューラルネットワークにより制
御する方法を用いても同様の効果を期待できる。
【0014】
【発明の効果】以上のように、本発明は、従来のCEL
P符号化装置にディレイドディシジョン制御手段を設け
ることにより、処理量を大幅に増やすことなく、音声品
質を向上させることができるという効果が得られる。
【図面の簡単な説明】
【図1】本発明の実施の形態における音声符号化装置の
ブロック図
【図2】本発明の実施の形態におけるディレイドディシ
ジョン制御手段の動作説明のためのフロー図
【図3】従来のCELP方式音声符号化装置のブロック
【符号の説明】
101 ピッチ分析器 102 線形予測分析器 103 聴覚重み付けフィルタ 104 パワー分析器 105 適応コードブック 106 雑音コードブック 107 ゲインコードブック 108 聴覚重み付け合成フィルタ 109 自乗誤差最小化制御手段 110 ディレイドディシジョン制御手段 111 マルチプレクサ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力音声信号を一定区間のフレームに分
    割し、声道情報と音源情報とに分離し、声道情報を線形
    予測パラメータ、音源情報を数種のコードブックにより
    表現する音声符号化装置において、入力音声信号からピ
    ッチ候補を算出するピッチ分析器と、入力音声信号から
    線形予測係数を算出する線形予測分析器と、入力音声信
    号に対して聴覚重み付けを行う聴覚重み付けフィルタ
    と、入力音声信号の音声レベルを求めるパワー分析器
    と、過去の音源信号を蓄積してピッチ分析器からのピッ
    チ候補に応じて適応コードブック候補を選択する適応コ
    ードブックと、あらかじめ学習により作成された音源信
    号を蓄積した雑音コードブックと、適応コードブック候
    補および雑音コードブック候補のゲインを選択するゲイ
    ンコードブックと、線形予測分析器からの線形予測係数
    と各コードブック候補の線形和とから合成音声を生成す
    る聴覚重み付け合成フィルタと、聴覚重み付け合成フィ
    ルタからの合成音声と聴覚重み付けフィルタからの聴覚
    重み付けされた入力音声との誤差が最小となる候補系列
    を各コードブックから選択するための評価情報を出力す
    る2乗誤差最小化制御手段と、出力された評価情報をも
    とに適応コードブックおよび雑音コードブックからコー
    ドブック候補を選択するとともに、その評価情報とパワ
    ー分析器からの音声信号レベルや有音・無音情報によ
    り、それ以降のディレイドディシジョンの必要度を計算
    して実行するか否かの制御を行うディレイドディシジョ
    ン制御手段とを備えた音声符号化装置。
  2. 【請求項2】請求項1記載の音声符号化装置を、信号処
    理プロセッサを用いてソフトウェアで実現するためのプ
    ログラムを記憶させた記憶媒体。
JP8171485A 1996-07-01 1996-07-01 音声符号化装置および記録媒体 Pending JPH1020895A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8171485A JPH1020895A (ja) 1996-07-01 1996-07-01 音声符号化装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8171485A JPH1020895A (ja) 1996-07-01 1996-07-01 音声符号化装置および記録媒体

Publications (1)

Publication Number Publication Date
JPH1020895A true JPH1020895A (ja) 1998-01-23

Family

ID=15923983

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8171485A Pending JPH1020895A (ja) 1996-07-01 1996-07-01 音声符号化装置および記録媒体

Country Status (1)

Country Link
JP (1) JPH1020895A (ja)

Similar Documents

Publication Publication Date Title
CA2636552C (en) A method for speech coding, method for speech decoding and their apparatuses
EP1959435B1 (en) Speech encoder
US9153237B2 (en) Audio signal processing method and device
JPH0944195A (ja) 音声符号化装置
JP3490324B2 (ja) 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体
JPH10207496A (ja) 音声符号化装置及び音声復号装置
JP3510643B2 (ja) 音声信号のピッチ周期処理方法
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JPH1020895A (ja) 音声符号化装置および記録媒体
JP3845316B2 (ja) 音声符号化装置及び音声復号装置
JP3332132B2 (ja) 音声符号化方法および装置
JP3563400B2 (ja) 音声復号化装置及び音声復号化方法
JPH10149200A (ja) 線形予測符号化装置
JPH08194499A (ja) 音声符号化装置
JP2004252490A (ja) 音声符号化装置及び音声復号装置
JP2004126628A (ja) 音声符号化装置及び音声復号装置
JPH10105200A (ja) 音声符号化/復号化方法
JPH10124091A (ja) 音声符号化装置および情報記憶媒体
JPH06130997A (ja) 音声符号化装置
KR19980031894A (ko) 음성부호화에 있어서 선스펙트럼쌍 계수의 양자화 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050207