JPH06208398A - 音源波形生成方法 - Google Patents

音源波形生成方法

Info

Publication number
JPH06208398A
JPH06208398A JP5001504A JP150493A JPH06208398A JP H06208398 A JPH06208398 A JP H06208398A JP 5001504 A JP5001504 A JP 5001504A JP 150493 A JP150493 A JP 150493A JP H06208398 A JPH06208398 A JP H06208398A
Authority
JP
Japan
Prior art keywords
sound source
frame
codebook
subframe
lag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5001504A
Other languages
English (en)
Inventor
Hideo Osawa
英男 大沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Radio Co Ltd
Original Assignee
Japan Radio Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Radio Co Ltd filed Critical Japan Radio Co Ltd
Priority to JP5001504A priority Critical patent/JPH06208398A/ja
Publication of JPH06208398A publication Critical patent/JPH06208398A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 語頭及び語尾における量子化雑音を低減し再
生音声品質を向上させる。 【構成】 入力音声の立ち上がり又は立ち下がり時に、
該当フレームから次フレームへの電力遷移を検出し、こ
れに相当する振幅遷移を該当フレームを構成する各音源
波形に与える。 【効果】 入力音声の語頭及び語尾のように振幅が立ち
上がり又は立ち下がっている時にも、良好なピッチ抽出
を行うことができ、また、量子化雑音の低減により再生
音声品質が向上する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、CELP(code excit
ed linear prediction:符号励振線形予測)符号化方式
における音源コードブックの音源波形生成方法に関す
る。
【0002】
【従来の技術】例えばディジタル自動車電話に使用され
る音声CODEC等には、ディジタル音声信号の符号化
速度を、4kbpsから8kbps程度に低減すること
が要請されている。図6には、このような目的で使用さ
れる音源波形の生成方法の一例が示されている。
【0003】この図に示される方法は、CELP符号化
方式において音源コードブックで音源波形を生成する方
法方法である。図において10で示されるのが音源コー
ドブックであり、音源コードブック10には過去のフレ
ームにおいて音源信号として使用された信号が格納され
ている。すなわち、音源コードブック10及び雑音コー
ドブック12の後段に設けられゲインβ(スカラ)の係
数乗算器14、ゲインγ(スカラ)の係数乗算器16及
びベクトル加算を行う加算器18から構成される線形加
算手段の出力は、現フレームにおいて音源信号として使
用されると共に、音源コードブック10に帰還入力され
る。
【0004】ここにいうフレームは、音源信号として使
用される音声信号を、20msec程度の長さでフレー
ム化したものであり、サンプリング周波数として8kH
zを用いている場合、1フレームに属するサンプル数は
8kHz×20msec=160サンプルとなる。フレ
ーム長は、音声信号が定常的であると見なせる長さ、す
なわちその性質に大きな変化がないと見なせる長さに設
定する必要があり、通常は、20〜30msec程度に
設定する。音源コードブック10は、最も古い音源信号
を廃棄しつつ、帰還入力される新しい音源信号を逐次蓄
える(音源コードブック10の更新)。この結果、音源
コードブック10には、前のフレームで音源信号として
使用された信号、その前のフレームで音源信号として使
用された信号、…というように、過去のフレームの音源
信号が格納される。その際、1個のフレームは4個のサ
ブフレームに分割して取り扱われる。すなわち、音源コ
ードブック10は、このサブフレームを単位として、す
なわち160/4=40サンプルを単位として、最も新
しいサブフレームが先頭に位置するよう、更新される。
【0005】音源コードブック10に格納される例えば
160サンプルの音声信号は、数十サンプル(上の例で
は40サンプル)まとめられた状態で、線形加算手段に
出力される。このように信号を数十サンプルまとめたも
のを、ベクトルと呼ぶ。特に、音源コードブック10か
ら出力されるベクトルは、音源コードベクトルと呼ばれ
る。
【0006】最適な音源信号生成のために必要となる音
源コードベクトルは、A−b−S(analysis by synthe
sis :合成による分析)法により得られる。A−b−S
法は、最も誤差電力の小さい信号を生成するために、実
際に合成を行い閉ループを用いてフィードバックを加え
る手法である。図6におけるA−b−S法は、主に、音
源コードブック10における最適ラグの決定及び雑音コ
ードブック12における最適インデックスの決定により
実現される。
【0007】まず、音源コードブック10における最適
ラグの決定は、重み付け合成フィルタ20の出力の聴覚
重み付けフィルタ22の出力に対する誤差電力に基づ
き、音源コードブック10においてラグを探索すること
により、行われる。音源コードブック10と雑音コード
ブック12の各ベクトルの探索は独立に行われる。
【0008】前述のように、音源コードブック10から
出力される音源コードベクトルは、係数乗算器14及び
16並びに加算器18により雑音コードブック12の出
力と線形加算された上で、音源信号として重み付け合成
フィルタ20に入力される。音源コードベクトル探索時
は雑音コードブック12からの入力を零とする。重み付
け合成フィルタ20は、聴覚重み付けフィルタ22の出
力と比較可能な態様に音源信号を変換するためのフィル
タであり、加算器18の出力に所定の重み付けを施す。
一方、入力される音声(符号化すべき音声)は、聴覚重
み付けフィルタ22により重み付けされる。減算器24
は、聴覚重み付けフィルタ22の出力に対する重み付け
合成フィルタ20の出力の誤差電力をベクトル減算によ
り求める。減算器24の後段に設けられている誤差電力
最小化部26は、得られた誤差電力が最小となるよう、
音源コードブック10における探索を実行する。誤差電
力最小化部26は、重み付け合成フィルタ20の出力が
聴覚重み付けフィルタ22の出力と最も類似したベクト
ルとなるよう、あらかじめ定められている探索範囲を探
索する。誤差電力が最小となるラグは、最適ラグと呼ば
れる。
【0009】ここに、ラグとは、音源コードブック10
中の最も新しいサンプルから見たサンプルの古さをい
う。前述のように、音源コードブック10には過去にお
いて音源信号として使用された信号が格納されている。
探索範囲を例えば−20〜−146サンプル(音源コー
ドブック10中の最も新しいサンプルから見て20サン
プル前から146サンプル前まで)とすると、誤差電力
最小化部26は、この探索範囲に属する任意のサンプル
を始点とする40サンプル(1ベクトル)を順次取り出
し、探索範囲の全体に亘って、誤差電力が最小となるか
否かの探索(最適ラグの探索)を行う。始点となるサン
プルの位置をラグと呼び、誤差電力が最小となるベクト
ルのラグを最適ラグと呼ぶ。ラグは、声帯振動の周期に
対応しており、最適ラグは、入力音声が男声である場合
には長くなり、女性である場合には短くなる。探索範囲
は、符号化速度を下げる(ビットレートを下げる)とき
には、狭く設定する。
【0010】このように探索を行うことにより得られる
最適ラグは、復号時にも使用できる。すなわち、符号化
側と復号側とで同一の手法により音源コードブック10
を更新するようにすれば、符号化側から復号側に最適ラ
グの情報を伝送するのみで、音源コードブック10に係
る情報を与えることができる。さらに、上述の探索範囲
の設定例では、ラグは7ビットで表現できる。
【0011】A−b−S法は、図6では、このような最
適ラグ決定に加え、雑音コードブック12における最適
インデックスの決定により実現されている。雑音コード
ブック12は、互いに異なる数十サンプル(上述の例で
は40サンプル=1ベクトル)の雑音信号を所定個数
(例えば128個)蓄えている。このように雑音コード
ブック12に蓄えられているベクトルを、雑音コードベ
クトルと呼ぶ。雑音コードブック12に蓄えられている
雑音コードベクトルの個数が128である場合、7ビッ
トのインデックスにより、各雑音コードベクトルを特定
できる。雑音コードブック12の内容は、符号化側と復
号側とで同一の内容とする。このようにすれば、符号化
側から復号側に最適インデックスの情報を伝送するのみ
で、雑音コードブック12に係る情報を与えることがで
きる。
【0012】誤差電力最小化部26は、音源コードブッ
ク10について前述の最適ラグ探索を実施した上で、雑
音コードブック12について上記インデックスの最適化
を実施する。
【0013】このようにして得られた最適ラグ及び最適
インデックスは、符号化側から復号側に伝送される。す
なわち、図6に示される符号化側の装置の出力は、誤差
電力最小化部26によって得られる最適ラグ及び最適イ
ンデックスである。言い換えれば、CELP符号化方式
では、音源コードベクトルと雑音コードベクトルの和で
重み付け合成フィルタ20を駆動した出力により、入力
音声を表現している。このようなベクトル単位での量子
化をベクトル量子化という。
【0014】これに加え、重み付け合成フィルタ20の
駆動条件たる情報、すなわち各コードベクトルに乗ぜら
れるゲインβ及びγ並びに重み付け合成フィルタ20の
各種パラメタも伝送される。伝送されるゲインβ及びγ
は、それぞれ誤差電力を用いて最適化した最適ゲインで
ある。例えばゲインγの最適値γopt は、次の式により
求められる誤差電力EがdE/dγ=0の条件を満
たすγ=γopt である。
【0015】E=Σ{p(n)−γ×e(n)*h
(n−t)} ただし、Eはi番目の雑音コードベクトルの誤差電
力、e(n)はi番目の雑音コードベクトル中のn番
目のサンプル、p(n)は既に計算された最適な音源ベ
クトルを重み付けして合成した信号を、聴覚重み付けさ
れた入力信号から減じた信号、h(n−t)は重み付け
合成フィルタ20のインパルス応答である。*はコンボ
ルーションを、Σは40個のサンプルについての総和
を、それぞれ示している。あるiについて最適ゲインγ
opt を求め、この値を上式に代入すると、各iについて
真の誤差電力E(opt)が求められる。このことか
ら明らかなように、iが異なると最適ゲインγopt も異
なる。これは、ゲインβの最適値βopt についても同様
である。
【0016】復号側では、符号化側と同様のコードブッ
クにより、伝送された情報に基づき各コードベクトルを
求め、合成フィルタを駆動して再生信号を出力する。
【0017】なお、フレーム長又はサブフレーム長は、
音源信号の周期とは関係なく固定されている。上述のよ
うに最適ラグの探索範囲を−20〜−146サンプルの
範囲に設定した場合には、例えばラグが20サンプルで
あると、このラグを始点とする40サンプルを取り出す
ことができない。このような場合には、誤差電力最小化
部26は、最新の20サンプルを2回繰り返させること
により40サンプルを生成させ、これを線形加算及び重
み付け合成に供するようにする。また、女声のようにピ
ッチ周波数が高い音声が入力された場合、最適ラグは短
くなる。このような場合、音源信号の長さがフレーム長
に満たないラグが最適となることがある。この場合、当
該音源信号を繰り返して使用して音源信号に使用する。
【0018】
【発明が解決しようとする課題】入力音声のレベルが定
常的な領域では、上述のような処理により好適に符号化
を行うことができるが、語頭及び語尾の領域では、当該
定常的な領域と波形は同じであるにしてもレベルが異な
る。すなわち、語頭及び語尾の領域では、入力音声に立
ち上がり又は立ち下がりが生じているため、音源コード
ブックにより生成されるも立ち上がり又は立ち下がりが
生じていると考えられる。この領域を定常的な領域と同
様に扱うと、符号化側から復号側に伝送する情報により
復号器で再生される再生信号の量子化雑音が特に語頭及
び語尾で発生し、再生音声品質の低下が生じることがあ
る。この対策としては、フレーム長又はサブフレーム長
を短くする方法が考えられるが、この場合、単位時間あ
たりのビット数が増え符号化の効率が悪くなる。
【0019】本発明は、このような問題点を解決するこ
とを課題としてなされたものであり、CELP符号化方
式により女声のように短いピッチ周期を有する入力音声
を符号化する際に、語頭及び語尾の再生音声品質を改善
することを目的とする。
【0020】
【課題を解決するための手段】このような目的を達成す
るために、本発明は、所定のフレーム又はサブフレーム
長を有し音源コードブックにより得られる音源コードベ
クトルと雑音コードブックにより得られる雑音コードベ
クトルの一次結合を求め、重み付け合成フィルタに入力
し、その出力信号と聴覚重み付けされた入力音声とを比
較して得られる誤差電力が最小化されるよう、音源コー
ドブックの探索において最適ラグ及び最適ゲインを設定
し、設定された最適ラグ及び最適ゲインを含む情報を伝
送すると共に、最適ラグがフレーム又はサブフレーム長
より短い場合に当該最適ラグに係る音源波形を繰り返す
ことにより音源コードベクトルを生成するA−b−S法
を用いたCELP符号化方式において、あるフレーム又
はサブフレームから次のフレーム又はサブフレームに亘
って入力音声のフレーム又はサブフレーム電力が立ち上
がり又は立ち下がっている場合に、音源コードブックか
ら出力される信号に含まれる音源波形の振幅を、入力音
声の立ち上がり又は立ち下がりに係る振幅遷移と同様に
遷移させることを特徴とする。
【0021】
【作用】本発明においては、あるフレーム又はサブフレ
ームから次のフレーム又はサブフレームに亘って入力音
声のフレーム又はサブフレーム電力が立ち上がり又は立
ち下がっている場合に、音源コードブックから出力され
る信号に含まれる音源波形の振幅が、入力音声の立ち上
がり又は立ち下がりに係る振幅遷移と同様に遷移する。
従って、女声のように短いピッチ周期を有する入力音声
を符号化する際にも、その立ち上がり又は立ち下がりに
係る傾斜を音源波形に重み付けられるため、適正な音源
波形が得られ、適正なピッチ抽出が行える。また、フレ
ーム又はサブフレーム長より短いラグが最適である場合
に、立ち上がり及び立ち下がりに係るフレーム又はサブ
フレームの量子化雑音を低減できるから、入力音声の語
頭及び語尾に係るフレーム又はサブフレームの量子化雑
音が低減され、再生音声品質が改善される。
【0022】
【実施例】以下、本発明の好適な実施例について図面に
基づき説明する。なお、図6に示される従来例と同様の
構成には同一の符号を付し説明を省略する。
【0023】図1には、本発明の一実施例に係る方法が
ブロック図により示されている。この図に示される装置
は、図6に示される従来の装置に、さらに立ち上がり、
立ち下がり検出回路28及び音源波形生成回路30を付
加した構成である。また、音源コードブック10の出力
は、直接に係数乗算器14に入力されるのではなく、音
源波形生成回路30を介して係数乗算器14に入力され
る。
【0024】立ち上がり、立ち下がり検出回路28は、
入力音声のフレーム(又はサブフレーム)電力を演算
し、これをしきい値判別することにより入力音声の立ち
上がり及び立ち下がりを検出すると共に、立ち上がり及
び立ち下がりの傾斜を求める。音源波形生成回路30
は、立ち上がり、立ち下がり検出回路28により入力音
声のフレーム(又はサブフレーム)電力の及び立ち上が
り又は立ち下がりが検出された場合に、当該立ち上がり
又は立ち下がりの傾斜に応じて音源コードベクトルの振
幅を線形的に変化させる。
【0025】いま、入力音声のフレーム(又はサブフレ
ーム)電力が立ち上がった場合を考える。前フレーム
(又はサブフレーム)までは入力音声が無音であり、現
フレーム(又はサブフレーム)、すなわち該当フレーム
(又はサブフレーム)から有音になり、さらに次フレー
ム(又はサブフレーム)の電力が図2に示されるように
該当フレーム(又はサブフレーム)に比べ増加したとす
る。
【0026】立ち上がり、立ち下がり検出回路28は、
この立ち上がりをしきい値判別により検出すると共に、
図3に示されるように立ち上がりの傾斜を検出する。音
源波形生成回路30は、この傾斜に従い、図4及び図5
に示されるように該当フレーム(又はサブフレーム)内
においてその出力振幅を遷移させる。音源コードブック
10から出力される信号のレベルは同一フレーム(又は
サブフレーム)中において一定であり、また、係数乗算
器14のゲインβは誤差電力最小化部26により最適設
定される。
【0027】従って、このような処理により、フレーム
長より短いラグで入力音声が立ち上がり又は立ち下がっ
ている場合でも、その傾斜を音源波形に重み付けられる
ため、適正な音源波形が得られ、適正なピッチ抽出が行
える。また、フレーム長より短いラグが最適である場合
に、立ち上がり及び立ち下がりに係るフレームの量子化
雑音を低減できるから、入力音声の語頭及び語尾におけ
る量子化雑音の発生を防止でき、再生音声品質を改善で
きる。さらに、CELP符号化方式では、通常、フレー
ム電力も伝送パラメータとして伝送しているため、本実
施例を実現するに当たって新たな伝送パラメータが必要
とされない。
【0028】なお、この例では、ラグがフレーム長の1
/2である。この例と異なり、探索しているラグの音源
波形が、1フレームに整数個入らないときには、最後の
繰り返し波形(1波形分入っていない)のレベルは1つ
前の音源波形のレベルと同等とする。
【0029】
【発明の効果】以上説明したように、本発明によれば、
あるフレーム又はサブフレームから次のフレーム又はサ
ブフレームに亘って入力音声のフレーム又はサブフレー
ム電力が立ち上がり又は立ち下がっている場合に、音源
コードブックから出力される信号に含まれる音源波形の
振幅を、入力音声の立ち上がり又は立ち下がりに係る振
幅遷移と同様に遷移させるようにしたため、女声のよう
に短いピッチ周期を有する入力音声を符号化する際に
も、その立ち上がり又は立ち下がりに係る傾斜を音源波
形に重み付けられ、適正な音源波形が得られ、適正なピ
ッチ抽出が行える。また、フレーム又はサブフレーム長
より短いラグが最適である場合に、立ち上がり及び立ち
下がりに係るフレーム又はサブフレームの量子化雑音を
低減できるから、入力音声の語頭及び語尾に係るフレー
ム又はサブフレームの量子化雑音が低減され、再生音声
品質が改善される。また、フレーム又はサブフレーム電
力を復号側に伝送している場合には、新たな伝送パラメ
ータは必要とされない。
【図面の簡単な説明】
【図1】本発明の一実施例に係る方法を装置のブロック
構成として示すブロック図である。
【図2】立ち上がり時の該当フレームから次フレームへ
のフレーム電力の遷移を示す図である。
【図3】この電力遷移に伴う振幅遷移を示す図である。
【図4】該当フレームにおいて音源波形に付与される振
幅レベルの傾斜を示す図である。
【図5】該当フレームに係る音源波形を示す図である。
【図6】従来例に係る方法を装置のブロック構成として
示すブロック図である。
【符号の説明】
10 音源コードブック 12 雑音コードブック 14,16 係数乗算器 18 加算器 20 重み付け合成フィルタ 22 聴覚重み付けフィルタ 24 減算器 26 誤差電力最小化部 28 立ち上がり、立ち下がり検出回路 30 音源波形生成回路

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 所定のフレーム又はサブフレーム長を有
    し音源コードブックにより得られる音源コードベクトル
    と雑音コードブックにより得られる雑音コードベクトル
    の一次結合を求め、重み付け合成フィルタに入力し、そ
    の出力信号と聴覚重み付けされた入力音声とを比較して
    得られる誤差電力が最小化されるよう、音源コードブッ
    クの探索において最適ラグ及び最適ゲインを設定し、設
    定された最適ラグ及び最適ゲインを含む情報を伝送する
    と共に、最適ラグがフレーム又はサブフレーム長より短
    い場合に当該最適ラグに係る音源波形を繰り返すことに
    より音源コードベクトルを生成するA−b−S法を用い
    たCELP符号化方式において、 あるフレーム又はサブフレームから次のフレーム又はサ
    ブフレームに亘って入力音声のフレーム又はサブフレー
    ム電力が立ち上がり又は立ち下がっている場合に、音源
    コードブックから出力される信号に含まれる音源波形の
    振幅を、入力音声の立ち上がり又は立ち下がりに係る振
    幅遷移と同様に遷移させることを特徴とする音源波形生
    成方法。
JP5001504A 1993-01-08 1993-01-08 音源波形生成方法 Pending JPH06208398A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5001504A JPH06208398A (ja) 1993-01-08 1993-01-08 音源波形生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5001504A JPH06208398A (ja) 1993-01-08 1993-01-08 音源波形生成方法

Publications (1)

Publication Number Publication Date
JPH06208398A true JPH06208398A (ja) 1994-07-26

Family

ID=11503309

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5001504A Pending JPH06208398A (ja) 1993-01-08 1993-01-08 音源波形生成方法

Country Status (1)

Country Link
JP (1) JPH06208398A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005031083A (ja) * 2003-07-07 2005-02-03 Mitsubishi Electric Information Technology Centre Europa Bv 信号間の遅延を求める方法、装置、および方法を用いる閉ループフィードバックシステム
CN115904855A (zh) * 2023-03-02 2023-04-04 上海合见工业软件集团有限公司 基于信号动态追踪确定目标驱动源码的系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005031083A (ja) * 2003-07-07 2005-02-03 Mitsubishi Electric Information Technology Centre Europa Bv 信号間の遅延を求める方法、装置、および方法を用いる閉ループフィードバックシステム
CN115904855A (zh) * 2023-03-02 2023-04-04 上海合见工业软件集团有限公司 基于信号动态追踪确定目标驱动源码的系统

Similar Documents

Publication Publication Date Title
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
JP3483891B2 (ja) スピーチコーダ
US5953697A (en) Gain estimation scheme for LPC vocoders with a shape index based on signal envelopes
US6910009B1 (en) Speech signal decoding method and apparatus, speech signal encoding/decoding method and apparatus, and program product therefor
JP2002258896A (ja) 音声符号化方法および音声符号化装置
JP2903533B2 (ja) 音声符号化方式
JPH07129195A (ja) 音声復号化装置
JP3558031B2 (ja) 音声復号化装置
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP3490324B2 (ja) 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体
JPH0782360B2 (ja) 音声分析合成方法
JP3303580B2 (ja) 音声符号化装置
JPH06208398A (ja) 音源波形生成方法
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JP3299099B2 (ja) 音声符号化装置
JPH0519795A (ja) 音声の励振信号符号化・復号化方法
JP3552201B2 (ja) 音声符号化方法および装置
JP3468862B2 (ja) 音声符号化装置
JP3785363B2 (ja) 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法
JP2900431B2 (ja) 音声信号符号化装置
JP2004151424A (ja) トランスコーダ及び符号変換方法
JPH0519796A (ja) 音声の励振信号符号化・復号化方法
JP2853170B2 (ja) 音声符号化復号化方式
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置