JPH0446440B2 - - Google Patents

Info

Publication number
JPH0446440B2
JPH0446440B2 JP59053757A JP5375784A JPH0446440B2 JP H0446440 B2 JPH0446440 B2 JP H0446440B2 JP 59053757 A JP59053757 A JP 59053757A JP 5375784 A JP5375784 A JP 5375784A JP H0446440 B2 JPH0446440 B2 JP H0446440B2
Authority
JP
Japan
Prior art keywords
phase
waveform
filter
residual waveform
pulse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59053757A
Other languages
English (en)
Other versions
JPS60196800A (ja
Inventor
Masaaki Yoda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP59053757A priority Critical patent/JPS60196800A/ja
Priority to EP85103191A priority patent/EP0163829B1/en
Priority to CA000477005A priority patent/CA1218745A/en
Publication of JPS60196800A publication Critical patent/JPS60196800A/ja
Priority to US07/255,566 priority patent/US4850022A/en
Publication of JPH0446440B2 publication Critical patent/JPH0446440B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】
この発明は、音声波形をその相関を除去するフ
イルタに通して予測残差波形を得その予測残差波
形を用いる音声信号処理方式に関するものであ
る。 <従来技術> 従来、音声符号化には波形符号化と分析合成系
(ボコーダ)との2つのクラスがある。後者の分
析合成系のクラスに属する線形予測符号化
(LPC)方式では、第1図に示すように音声のス
ペクトル包絡を表わす全極形のフイルタ(予測フ
イルタ)を、入力端子11からの音声波形につい
て線形予測分析によつて求めた後、それと逆の特
性をもつ全零形のフイルタ(逆フイルタ)12に
音声波形を通して予測残差波形を求め、この残差
波形を特徴づけるパラメータとしての周期性の有
無(有声、無声の判定)、ピツチ周期、および平
均電力をパラメータ抽出部13で抽出し、これと
前記予測フイルタ係数とを送出する。合成側では
予測残差波形の代りに、有声の場合は周期パルス
列、無声の場合は雑音波形を音源生成部14で用
いて予測フイルタ15を駆動し、予測フイルタ1
5のフイルタ係数を前記フイルタ係数で設定して
音声波形を生成して出力端子16に出力する。 一方、前者の波形符号化のクラスに属する適応
符号化(APC)では第2図に示すようにLPCボ
コーダと同様な手段で予測残差波形を求めた後、
この残差波形のサンプル値をそのまま量子化部1
7で量子化(符号化)し、これと予測フイルタ係
数とを送出する。合成側では、復合か部18で復
合化された残差波形を用いて予測フイルタ15を
駆動することにより音声波形を生成する。 これら2つの従来方式の違いは予測残差波形の
符号化の方法にある。第1図のLPCボコーダで
は残差波形については、その特徴パラメータだけ
を伝送すれば良いので、残差波形のサンプル毎の
量子化値を伝送する第2図のAPC方式にくらべ
てビツトレートの大幅な低減が図れる。しかし、
その反面第1図に示した方式は残差波形をパルス
列あるいは雑音で置き換えることによる品質劣下
はまぬがれず、ビツトレートを高くしても6kb/
s程度で品質が飽和し、自然な音声品質を提供し
得ない欠点があり、また残差波形の特徴パラメー
タの誤抽出が品質劣下を引き起こす欠点があつ
た。一方、第2図に示したSPC方式では残差波形
の量子化ビツト数を高めることにより原音声に限
り無く近い音声品質を実現できる反面、ビツトレ
ートが16kb/s以下になると量子化歪が増大
して音声品質が急激に劣下するこという欠点があ
つた。 また従来において音声信号のピツチの変更や音
声信号の継ぎ足し時に、エネルギの集中している
個所で行うおそれがあり、その場合は不自然なも
のとなる欠点があつた。 <発明の構成> この発明の目的は例えば音声信号を継ぎ足す場
合に自然性が得られるようにすることを可能とす
る音声信号処理方式を提供することにある。 この発明の他の目的はビツトレートが16kb/
s以下でも比較的良好な音声品質を保持できる音
声信号処理方式を提供することにある。 この発明によれば音声波形を線形予測分析して
予測残差波形を得、この予測残差波形についてそ
の短時間(例えばピツチ周期程度以下)位相特性
と逆の特性をもつ線形フイルタ(位相等化フイル
タ)のフイルタ係数を残差波形から適応的に決定
し、その位相等化フイルタに前記音声波形又は予
測残差波形を通して予測残差波形を零位相化、つ
まり位相等化する。この位相等化された予測残差
波形エネルギーがインパルス的に集中し、従つて
そのエネルギーが集中してない部分で、例えば音
声波形の継ぎ足しを行うことにより自然性のよい
音声波形が得られる。また前記位相等化した音声
波形又は予測残差波形を符号化する際に、例えば
そのエネルギーが集中している部分に多くの情報
を割り当てることにより、効率的に符号化するこ
とができ16kb/s以下でも可成り良い音声品質
を得ることができる。 <発明の原理> まず、この発明による音声信号処理方式の原理
について述べる。音声波形のサンプル値をS
(n)、音声波形を線形予測分析して得られる予測
係数をa(k)(k=1,2……P)とすると、予
測残差波形のサンプル値e(n)は次式で表わさ
れる。 e(n)=pk=0 a(k)・S(n−k) ……(1) ただし、a(0)=1である。残差波形e(n)
は、音声波形のスペクトル包絡成分を除去したも
の、つまり音声波形のサンプル値間の相関を除去
したもので平坦なスペクトル包絡をもち、かつ有
声音については音声のピツチ周期成分をもつてい
る。そこで、このような残差波形の特徴を次のよ
うなパルス列として理想化して実現する。 eM(n)=L-1l=0 δ(n−nl) ……(2) ここで、δ(n)はクロネツカーのデルタ関数
で、δ(0)=1、およびδ(n)=0(n≠0)で
ある。nlはパルス位置を表わし、nl−nl-1は音声
のピツチ周期に対応する。つまりこのパルス列eM
(n)はピツチ位置nlのみにパルスが存在し、そ
の他はゼロである。残差波形e(n)とパルス列
eM(n)は共に平坦なスペクトル包絡とピツチ周
期成分とをもつから、両波形の差は主に短時間、
つまりピツチ周期程度以下の時間での位相特性の
違いによる。そこで、残差波形の短時間位相の逆
特性を持つ線形フイルタのインパルス応答をh
(m)とすると、この線形フイルタ(位相等化フ
イルタ)に残差波形e(n)を通して位相等化
(零位相化)つまりスペクトラムの各成分が同一
位相化された残差波形ep(n)は次式で算出され
る。 ep(n)=Mm=0 h(m)e(n−m) ……(3) このインパルス応答h(m)は、eP(n)とeM
(n)との平均二乗誤差を最小化することにより
求められる。その平均二乗誤差を次式で表わす。 J=1/NN-1n=0 {eP(n)−eM(n)}2 ……(4) (4)式に(2),(3)式を代入して、h(m)で偏微分
して零とおくとインパルス応答h(m)は次の連
立方程式の解として求められる。 Mk=0 v(|m−k|)h(k)=L-1l=0 e(nl−m)
……(5) (m=0,1,……;M) ここでv(k)は残差波形の自己相関関数であ
り次式で算出される。 v(k)=N-k-1n=0 e(n)e(n+k) ……(6) (k=0,1,……M) 位相等化フイルタのタツプ数M+1と対応した
時間、つまり応答時間がピツチ周期より短かい場
合は自己相関関数は、残差波形が平坦なスペクト
ルをもつことからv(k)v0δ(k)として近
似できる。つまりk=0の時だけ値をもつからそ
の場合、(5)式はm=kの時だけ値をもち次のよう
に簡単化できる。 h(m)=1/v0L-1l=0 e(nl−m) ……(7) さらに、分析窓長Nがピツチ周期より短い場合
はL=1となり(パルスが1個となり)、インパ
ルス応答は次式で算出される。 h(m)=1/v0e(n0−m) ……(8) 即ち、インパルス応答h(m)は時点n0を原点
として残差波形の時間軸を反転したものとなる。
また、残差波形の電力スペクトルが完全に白色
(すべての周波数成分の振幅が一定)であるとす
ると、インパルス応答h(m)のフーリエ変換は
次式で表わされる。 (ただし、ゲインは正規化) ここで、E(k)は残差波形e(n)のフーリエ
変換を表わす。したがつて、位相等化された残差
波形ep(n)のフーリエ変換Ep(k)は(3)式より
Ep(k)=H(k)・E(k)であり、またE(k)=
|E(K)|e aargE(k)であるから、これに(9)式
を代入して次式が得られる。 (10)式より位相等化された残差波形ep(n)は直
線位相成分
【式】を除いて残差波形e(n) を零位相化(スペクトラムをすべて同位相化)し
たものとなる。理想的に|E(k)|=E0(一定)
ならばep(n)は完全に無位相となり単一パルス
波形となる。要するに前述のようなフイルタ係数
h(m)をもつ位相等化フイルタ残差波形e(n)
を通すと、ピツチ位置に主としてエネルギーが集
中した、つまり単一パルス化に近い波形となる。 <第1実施例> 次に、この発明の音声信号処理方式の具体的実
施例を第3図に沿つて説明する。入力端子11か
らは、標本化された音声波形のサンプル値S(n)
が入力され、線形予測分析部21および逆フイル
タ部22に供給される。線形予測分析部21では
音声波形S(n)から線形予測分析を用いて、(1)
式における予測係数a(k)を算出する。逆フイ
ルタ部22では、音声波形S(n)を入力として
(1)式に示すようなフイルタリング演算を行い、予
測残差波形e(n)を出力する。予測残差波形e
(n)はフイルタ係数決定部23中の有声無声判
定部24、ピツチ位置検出部25およびフイルタ
係数数算出部26に供給される。有声・無声判定
部24では、残差波形e(n)の自己相関関数を
一定の遅延サンプル点数で求め、その最大ピーク
値が一定のしきい値以上なら有声、それ以下なら
無声として有声・無声の判定を行なう。この判定
結果V/UVは、以降の位相等化フイルタ係数を
求める処理モードを制御するのに用いられる。位
相等化フイルタは残差波形の位相の時間的変化に
適応化するため、有声部ではピツチ周期ごとに適
応化する。いま、時点nがl−1番目のピツチ位
置nl-1にあるとして、その時点における位相等化
フイルタ係数をh*(m.nl-1)(m=0,1……M)
として表わす。ピツチ位置検出部25ではピツチ
位置nl-1およびフイルタ係数*(m,nl-1)を用い
て次のピツチ位置nl検出する。 第4図は、ピツチ位置検出部25の内部構成を
示す。入力端子27からは逆フイルタ部23より
の残差波形e(n)が入力され、入力端子28か
らは有声無声判定部24よりの有声・無声判定結
果V/UVが入力される。処理モードスイツチ2
9では有声無声判定入力V/UVに応じて処理モ
ードをスイツチする。有声Vの場合は残差波形e
(n)は位相等化フイルタ部31に入力され、入
力端子32から入力されるフイルタ係数h*(m,
nl-1)との間のたたみ込み演算((3)式と同様な演
算)が行なわれ、位相等化された残差波形ep(n)
が出力される。相対振幅算出部33では、位相等
化された残差波形ep(n)の時点nでの相対振幅
を次式で算出する。 振幅比較部34では相対振幅mep(n)をあら
かじめ定められたしきい値mthと比較し、 mep(n)>mth (n>nl-1
……(12) を満たす場合、時点nをピツチ位置nlとして出力
端子35に出力する。 次に、ピツチ位置nlは第3図中のフイルタ係数
算出部26に入力され、ピツチ位置nlにおける位
相等化フイルタ係数h*(m,nl)がフイルタ係数
算出部26において次式により算出され、フイル
タ係数補間部37および第4図中の位相等化フイ
ルタ部31へ供給される。 ただし、(13)式は(8)式とくらべてフイルタのゲ
インを正規化するとともに、直線位相成分((10)式
中の
【式】の遅れを補正したものとなつて いる。つまり(10)式より明らかなように(8)式により
得られるh(m)は実際のものよりM/2サンプ
ル分遅れたものとなるので、(13)式を用いる。 一方、有声・無声判定結果が無声UVの場合
は、処理モードスイツチ29により残差波形e
(n)をピツチ位置リセツト部36に入力してピ
ツチ位置nlを分析窓内の最後のサンプル時点に設
定し、またフイルタ係数算出部26において、フ
イルタ係数をh*(m,nl)=1(m=0)h*(m,
nl)=0(m≠0)に設定する。各時点nにおける
フイルタ係数h(m,n)は、フイルタ係数補間
部37において、たとえば次式で表される一次の
フイルタを用いて平滑化した値として算出され
る。 h(m,n)=αh(m,m−1)+(1+α)h*
(m,nl) (nl-1<n≦nl) ……(14) ここで、αはフイルタ係数の変化速度を制御す
る係数でα<1を満たす定数である。 位相等化フイルタ部38では入力端子11の入
力音声波形S(n)と、フイルタ係数補間部37
のフイルタ係数h(m,n)とを用いて、次式で
示されるたたみ込み演算を行ない、位相等化され
た音声波形Sp(n)を出力端子39に出力する。 Sp(n)=Mm=0 h(m,n)S(n−m) ……(15) <第2実施例> 次に、位相等化された音声波形Sp(n)のデジ
タル符号化について説明する。この符号化の基本
的構成例を第5図に示す。入力端子11から入力
される音声波形S(n)に対して、第3図で示さ
れた構成の位相等化処理部41において位相等化
処理を行ない、位相等化音声波形Sp(n)を出力
する、符号化部42ではこの位相等化音声波形Sp
(n)をデイジタル符号化し、符号系列を伝送路
43に送出する。受信側では復号化部44で位相
等化音声波形Sp(n)を復元して出力端子16に
出力する。このように、符号化・復号化は音声波
形S(n)の代りに、位相等化音声波形Sp(n)を
対象として行なう。音声波形S(n)を位相等化
した音声波形Sp(n)は原音声波形S(n)と品質
的に変りない、よつてフイルタ係数h(m)は伝
送する必要がなく、位相等化音声Sp(n)を再生
すればよい。特に残差波形e(n)を位相等化し
た残差波形ep(n)はエネルギーが集中するため、
その部分により多くの情報を与えるように適応的
に符号化することにより少ないビツト数で高品質
の伝送が可能となる。符号化部42での符号化の
方法としては、種々の方法が適用できる。ここで
は、位相等化音声波形に適した符号化法として3
つの実施例を示す。 可変レート木符号化を用いる方法 可変レート木符号化法は音声波形を線形予測分
析して得られる予測残差波形の時間方向での振幅
変化に応じて、情報量を適応的に制御することを
特徴とした符号化方式である。第6図に、この発
明による位相等化処理と可変レート木符号化を組
み合せた符号化方式の実施例を示す。入力端子1
1から入力される音声波形S(n)に対し、線形
予測分析部21で線形予測分析を行なつて予測係
数akを算出し、逆フイルタ部22で音声波形S
(n)の予測残差波形e(n)を求める。フイルタ
係数決定部23では第3図について述べたように
して残差波形e(n)の短時間位相を等化する位
相等化フイルタの係数h(m,n)を算出し、こ
れを位相等化フイルタ部38のフイルタ係数とし
て設定する。位相等化フイルタ部38で入力音声
波形S(n)を位相等化処理し、その位相等化音
声波形Sp(n)を端子39へ出力する。 一方、残差波形e(n)は位相等化フイルタ部
45で位相等化した後、部分区間設定部46にお
いて残差波形振幅の偏りに応じて時間軸を分割す
る部分区間を設定し、電力算出部47ではその設
定された各部分区間での残差波形の電力を算出す
る。部分区間の設定法としては、例えば第7図に
示すように分析窓内でのピツチ位置(nl)の区間
(ただし1サンプル点のみ)およびピツチ周期Tp
を等分割する各区間として設定する。部分区間で
の残差電力uiは次式で算出される。 ui=1/NTi 〓 n∈Tie2 p(n) ……(16) ここで、Tiはサンプル時点nが属する部分区間
を表わし、NTiは部分区間に含まれるサンプル点
の数である。ビツト割当て部48では、各部分区
間の残差電力uiから各サンプル時点に割り当てら
れる情報ビツト数R(n)を次式で算出する。 ここで、は残差波形ep(n)に対する平均ビ
ツトレート、Nsは部分区間数、wiは部分区間の
時間長比率であり、 wi=NTiNSj=1 NTj で与えられる。また、量子化ステツプ幅△(n)
はステツプ幅算出部49で残差電力uiから次式で
算出される。 △(n)=Q(R(n))√i n〓Ti (18) ここで、Q(R(n))はR(n)ビツトのガウス
性量子化器のステツプ幅である。ビツト割当て部
48とステツプ幅算出部49で算出されたビツト
数R(n)とステツプ幅△(n)は木符号生成部
51を制御する。木符号生成部51は第8図に示
すように、可変レートの木構造をもち、符号系列
C(n)={C(n−L),……,C(n−1),C
(n)}によつて定まるパス経路に沿つて、各技に
対応づけられたサンプル値q(n)を出力する。
各ノードから出る技の数は2R(n)として与えられ
る。また、各技に対応づけられるサンプル値f
(l,n)は△(n)とR(n)から次式で与えら
れる。 f(l,n)=Sgn(l)|l|+0.5/2△(n) , l=±1,±2……,±2R(n)-1 (19) ここで、Sgn(l)は、lの正負のサイン符号
を表わす。また、q(n)はパス上の技をl*とし
て、q(n)=5(l*,n)として与えられる。木
符号生成部51から出力されるサンプル値p(n)
は予測フイルタ部52へ入力され、全極形のフイ
ルタを用いて局部復号化値S^p(n)を次式で算出
する。 S^p(n)=pk=1 a(k)S^p(n−k)+q(n) ……(20) ここで、a(k)は予測係数であり、線形予測
分析部21からの出力によつて制御される。局部
復号化値S^p(n)と位相等化された音声波形Sp
(n)は減算器53において両値間の差がとられ、
符号系列最適化部54へ入力される。符号系列最
適化部54では、S^p(n)とSp(n)間の平均二乗
誤差を最小にするように、木符号のパスすなわち
符号系列C(n)={C(n−L),……C(n−1)

C(n)}を探索する。最適パスの探索手法として
は、例えばMLアルゴリズムを用いる。MLアル
ゴリズムでは第8図に示すような木符号におい
て、符号系列の候補をCn(n)={Cn(n−L),…
…,Cn(n−1),Cn(n)}(m=1,2,……
M′)として、各ノードにおける誤差の評価値d
(m,n)を、符号系列候補Cn(n)に対して与
えられるサンプル値Sp(n)と入力サンプル値Sp
(n)の時系列間の二乗誤差として次式で算出す
る。 d(m,n)=Mt=n-L {Sp(t)−S^p(t)}2 次にM′個の符号系列候補の中から評価値d
(m,n)が最小となる符号系列Cn(n)を選択
し、そのパスにおける時点n−Lでの符号Cn(n
−L)を最適な符号として決定する。n+1時点
での符号系列の候補Cn(n+1)={Cn(n+1−
L),……Cn(n),Cn(n+1)}は、d(m,n)
の値の小さい順にM個の符号系列Cn(n)を選択
した後、各符号系列にn+1時点でとり得る全て
の符号C(n+1)を追加した系列として与えら
れる。以上の処理は各時点ごとに逐次行なわれ、
時点nにおいて、時点n−Lでの最適符号C(n
−L)が出力される。なお第8図中の符号*は
null符号を示す。 この実施例における符号化方式では、残差波形
の符号C(n)とともに補助情報として線形予測
分析部21から出力される予測係数ak、部分区
間設定部46から出力される部分区間の周期Tp
と位置Td、電力算出部47から出力される部分
区間残差電力uiを多重化部55で多重化した後伝
送路43へ送出する。 受信側では多重分離部56で各情報を分離した
後、残差波形生成部57において符号系列に応じ
て残差波形の復号化値q(n)を算出し、その復
号化値q(n)を駆動音源情報として予測フイル
タ15を駆動して音声波形Sp(n)を復元して出
力端子16に出力する。 残差波形e(n)を位相等化することによりパ
ルス化、つまりエネルギを果し、その部分につい
てはビツト数を多く割当て、また木符号の枚数を
多くすることにより、小さなビツトレートで効率
的に情報を伝送することができる。 マルチパルス符号化を用いる方法 マルチパルスの基本原理はAtalによつて1982
年の音響・音声信号国際会議(Proceedinhg
ICASSPpp.614−617)において提案された。こ
の手法は、音声の予測残差波形を複数個のパルス
列で表わし、各パルスの時間的位置と強さを、こ
のマルチパルス残差波形で合成した音声波形と入
力音声波形との誤差を最小にするように決定する
方式である。この方式では音声波形そのものを直
接符号化しているが、この発明の実施例では位相
等価した後の音声波形を入力としてマルチパルス
符号化を行なう。第9図に位相等価処理とこのマ
ルチパルス符号化を融合した符号化方式の実施例
を示す。 入力端子11から入力される音声波形のサンプ
ル値S(n)に対して、線形予測分析部21で予
測係数を算出し、予測逆フイルタ部22で音声波
形S(n)の予測残差波形を求める。次に、フイ
ルタ係数決定部23では残差波形e(n)からサ
ンプル点ごとの位相等化フイルタの係数n(m,
n)およびピツチ位置nlを出力する。位相等化フ
イルタ部38のフイルタ係数はh(m,n)に設
定され、位相等化フイルタ部38に音声波形SN
を位相等化し、その出力は減算器53でマルチパ
ルス符号化値S^p(n)との差をとり、その差出力
はパルス時点算出部58とパルス振幅算出部59
へ入力される。符号化値S^p(n)は、マルチパル
ス生成部61から出力されるマルチパルス信号e^e
(n)を予測フイルタ62に通すことにより次式
で算出される。 S^p(n)=−pk=1 akS^p(n−k)+e(n) ここで、e^e(n)はパルス時点をti。パルス振
幅をmiとして次式で表わされる。 e^e(n)=δ(t−ti) パルス時点tiとパルス振幅miは、それぞれパル
ス時点算出部58とパルス振幅算出部59におい
て、波形値Sp(n)とS^p(n)との差の平均電力
Peを最小とするように決定されている。前述の
論文で示されたアルゴリスムでは、l−1個分の
tiとmiが与えられる場合、l番目のパルス位置tl
は可能な全ての時点(但し、tl≠ti(i=1……l
−1))に対して平均電力Peが最小となるパルス
振幅miを最小二乗法によつて求め、その中でPe
が最小となる時点として決定される。この手順
は、l=1より始めてl=qまで逐次行ない、全
てのパルス時点と振幅が決定される。このアルゴ
リズムは、ピツチ時点の算出に多大な処理を必要
とする。しかしこの実施例では処理量を低減する
ため、位相等化処理の中で求まるピツチ位置ni
(i=1,2……q′)を利用し、始めのq′個分の
パルス時点をti=ni(i=1,2……q′)として決
定する。 予測係数ak、ピツチ時点(位置)tiおよびピツ
チ振幅miを多重化部55で多重化して送出し、
受信側ではこれけらを多重分離器56で分離した
後、マルチパルス生成部63でマルチパルス信号
を生成し、これを予測フイルタ15に通して符号
化信号出力を端子に得る。 パルス化残差波形を用いる音声分析合成系 この実施例では、前述した位相等化処理によつ
て位相等化された予測残差波形のサンプル値時系
列において、ピツチ位置でのサンプル値を残し、
それ以外のサンプル値を零にすることにより、予
測残差波形をパルス化し、このパルス列を駆動音
源として予測フイルタを駆動することにより合成
音声を生成する。すなわち第10図に示す。入力
端子11から入力される音声波形のサンプル値S
(n)に対し、線形予測分析部21で予測係数ak
を算出後、予測逆フイルタ22によつて音声波形
Sの予測残差波形e(n)を求める。次に残差波
形e(n)からフイルタ係数決定部23において
位相等化フイルタ係数h(m,n)、有声・無声判
定値V/UVおよびピツチ位置nlを算出する。残
差波形e(n)は、位相等化フイルタ部64で位
相等化された後、パルス化処理部65において、
ピツチ位置nlでの位相等化残差波形ep(n)のサ
ンプル値をml=ep(nl)(l=1,2……L)とす
る。ここではLは分析窓内でのピツチ位置の数で
ある。サンプル値mlは、量子化ステツプ幅算出
部66から与えられる量子化ステツプ幅△を用い
て量子化器67で量子化される。多重化部55は
量子化出力C(n)、ピツチ位置nl、予測係数ak、
有声無声判定値V/UVおよび残差電力vを多重
化して送出する。多重分離部56で多重分離し、
有声部68では量子化出力C(n)を逆量子化し、
これとピツチ位置とnlからパルス列e^p(n)=Ll=1 ml
〓(n−nl)を作る。無声部69では電力がvに
等しくなる白色雑音を駆動音源とする。有声・無
声判定値V/UVに応じてスイツチ71を制御し
て有声Vで有声部68の出力を、無声UVで無声
部69の出力を予測フイルタ15へ駆動音源情報
として供給し、合成音声S^p(n)を出力端子16
に出力する。 <効果> 以上述べたように、この発明による音声信号処
理方式は予測残差波形の短時間位相特性を、その
時間的変化に応じて適応的に位相等化することに
より、残差波形振幅の時間的集中度を高める効果
を有し、それによつて音声波形のピツチ周期、ピ
ツチ位置を検出することができ、また例えばエネ
ルギーが集中していない部分を除去して時間を短
縮し、又はゼロを挿入して時間を長くして音声波
形のピツチを変更しても自然性が保持でき、更に
符号化の効率を大幅に向上させる利点をもつ。 位相等化処理のみを施こした場合の音声品質
は、7,6ビツト対数圧伸PCMと同等であり、
この処理による波形歪はほとんど知覚されない。
したがつて、位相等化された音声波形を符号化入
力としても、入力段階での品質劣下は生じていな
い。また位相等化された音声波形を正しく再生で
きれば、この位相等化された音声波形を駆動音源
信号としても高い品質の音声が得られる。 前記実施例で示した符号化法はいづれも、音声
の予測残差波形の振幅の時間的集中度が高められ
ることにより符号化効率が向上する。可変レート
木符号化では、波形振幅の偏りに応じて時間的に
情報を割り当てており、位相等化によつてその偏
りを高めることにより情報割当ての効果が大きく
なり、符号化効率が向上する。1ビツト1サンプ
ル(約10kb/s)で符号化した時、符号化音声
のSN比は19.0dBであり、位相等化処理を含めな
い場合にくらべて4.4dB向上する。また品質的に
は5.5ビツトPCM相当の品質が6.6ビツトPCM相
当の品質に向上する。7ビツトPCMが品質的に
問題ないことより、この例では16kb/s以下の
ビツトレートとしても比較的高い品質が得られ
る。 マルチパルス符号化では、位相等化処理によつ
て残差波形がパルス化されるため、よりマルチパ
ルス表現が適合し、従来の入力音声そのものを用
いる場合とくらべて少ないパルス数で残差波形が
表現できる。また、マルチパルス符号化における
パルス位置の多くは、この位相等化処理における
ピツチ位置と一致するため、このピツチ位置の情
報を利用することによりマルチパルス符号化での
パルス位置の決定処理を簡単化することができ
る。パルス数を20(1ビツト1サンプル符号化に
相当し、約10kb/s)とした時のマルチパルス
符号化の性能は、直接音声入力の場合SN比で
11.3dB、位相等化音声の場合は15.0dBであり、
位相等化処理によりSN比は3.7dB向上する。ま
た、品質的には4.5ビツトPCM相当が位相等化処
理により、6ビツトPCM相当に改善される。従
来はビツトレートが16kb/s以下になると音声
品質が急激に劣化するが、このマルチパルス符号
化を適用する場合もビツトレートが10kb/sで
も可成り良好な音声品質が得られる。 なお、位相等可フイルタ部38のフイルタ係数
としてh*(m,nl)を用い、フイルタ係数の補間
部37を省略してもよい。また上述における各部
はそれぞれ独立したハードウエア、あるいはマイ
クロプロセツサにより構成してもよく、または複
数の部分を1つのマイクロプロセツサや電子計算
機で兼用しもよい。
【図面の簡単な説明】
第1図は従来の線形予測分析合成方式の基本構
成を示すブロツク図、第2図は従来の適応予測符
号化の基本構成を示すブロツク図、第3図はこの
発明による音声信号処理方式、特に適応的位相等
化処理方式の構成例を示すブロツク図、第4図は
ピツチ位置検出部25の内部構成を示したブロツ
ク図、第5図は位相等化処理を用いた音声符号化
の基本構成を示すブロツク図、第6図は位相等化
処理を用いる可変レート木符号化の構成例を示す
ブロツク図、第7図は部分区間の設定法に関する
説明図、第8図は可変レート木符号の構造を表わ
す説明図、第9図は位相等化処理を用いるマルチ
パルス符号化の構成例を示すブロツク図、第10
図はパルス化残差波形による音声分析合成系の構
成例を示すブロツク図である。 11……入力端子、21……線形予測分析部、
22……逆フイルタ部、24……有声・無声判定
部、25……ピツチ位置検出部、26……フイル
タ係数算出部、37……フイルタ係数補間部、3
8……位相等化フイルタ部、39……出力端子、
41……位相等化処理部、45……位相等化フイ
ルタ部、。46……部分区間算出部、47……電
力算出部、48……ビツト割り当て部、49……
ステツプ幅算出部、51……木符号生成部、52
……予測フイルタ部、53……減算器、54……
符号系列最適化部。

Claims (1)

  1. 【特許請求の範囲】 1 音声波形のサンプル値からそのサンプル値間
    の相関を除去する予測フイルタを用いて予測残差
    波形のサンプル値を求める手段と、その予測残差
    波形あるいは上記音声波形が供給され、上記予測
    残差波形を零位相化する位相等化フイルタと、上
    記予測残差波形からその位相特性と逆の特性をも
    つ位相等化フイルタ係数を決定する手段と、その
    位相等化フイルタ係数により上記予測残差波形の
    位相の時間的変化に応じて上記位相等化フイルタ
    を適応化する手段とを具備する音声信号処理方
    式。 2 入力音声信号を上記位相等化フイルタを位相
    等化し、その位相等化出力をデイジタル符号化方
    式を用いて符号化し、その結果をそのまま符号化
    音声出力とする特許請求の範囲第1項記載の音声
    信号処理方式。 3 上記デイジタル符号化方式は可変レート木符
    号化方式であつて、その木符号の各ノードから出
    る枝の数(ビツト数)と各技に割り当てられる木
    符号の出力サンプル値とを制御するために必要な
    情報を、上記位相等化処理の中で得られる予測残
    差信号から抽出することを特徴とする特許請求の
    範囲第2項記載の音声信号処理方式。 4 上記デイジタル符号化方式はマルチパルス符
    号化方式であつて、パルス位置のいくつかを上記
    位相等化処理の中で得られるピツチ位置として決
    定することを特徴とする特許請求の範囲第2項記
    載の音声信号処理方式。 5 上記デイジタル符号化方式は、上記位相等化
    された予測残差波形のサンプル値時系列におい
    て、ピツチ位置でのサンプル値のみを残しそれ以
    外のサンプル値を零にしたパルス列を作る手段で
    あつて、そのパルス列を有声音の駆動音源として
    予測フイルタを駆動して合成音声を得ることを特
    徴とする特許請求の範囲第2項記載の音声信号処
    理方式。
JP59053757A 1984-03-21 1984-03-21 音声信号処理方式 Granted JPS60196800A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP59053757A JPS60196800A (ja) 1984-03-21 1984-03-21 音声信号処理方式
EP85103191A EP0163829B1 (en) 1984-03-21 1985-03-19 Speech signal processing system
CA000477005A CA1218745A (en) 1984-03-21 1985-03-20 Speech signal processing system
US07/255,566 US4850022A (en) 1984-03-21 1988-10-11 Speech signal processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59053757A JPS60196800A (ja) 1984-03-21 1984-03-21 音声信号処理方式

Publications (2)

Publication Number Publication Date
JPS60196800A JPS60196800A (ja) 1985-10-05
JPH0446440B2 true JPH0446440B2 (ja) 1992-07-29

Family

ID=12951685

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59053757A Granted JPS60196800A (ja) 1984-03-21 1984-03-21 音声信号処理方式

Country Status (1)

Country Link
JP (1) JPS60196800A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06250694A (ja) * 1993-02-25 1994-09-09 Idou Tsushin Syst Kaihatsu Kk 音声符号化復号化装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4011193A (en) * 1972-12-13 1977-03-08 General Electric Company Reinforced thermoplastic polyester compositions
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
JPS5714643A (en) * 1980-06-30 1982-01-25 Toray Ind Inc Polyethylene terephthalate composition for molding
JPS58145994A (ja) * 1982-02-24 1983-08-31 株式会社日立製作所 残差波形の抽出方法

Also Published As

Publication number Publication date
JPS60196800A (ja) 1985-10-05

Similar Documents

Publication Publication Date Title
CA1218745A (en) Speech signal processing system
Atal Predictive coding of speech at low bit rates
EP0673014B1 (en) Acoustic signal transform coding method and decoding method
US4716592A (en) Method and apparatus for encoding voice signals
USRE43099E1 (en) Speech coder methods and systems
CA2327041A1 (en) A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US4791670A (en) Method of and device for speech signal coding and decoding by vector quantization techniques
JP3033060B2 (ja) 音声予測符号化・復号化方式
JP3396480B2 (ja) 多重モード音声コーダのためのエラー保護
JP2001154699A (ja) フレーム消去の隠蔽及びその方法
JP4281131B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3531780B2 (ja) 音声符号化方法および復号化方法
US5719993A (en) Long term predictor
JPH01261930A (ja) 音声復号器のポスト雑音整形フィルタ
WO2000074036A1 (en) Device for encoding/decoding voice and for voiceless encoding, decoding method, and recorded medium on which program is recorded
JPH0446440B2 (ja)
JP3232701B2 (ja) 音声符号化方法
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JPS6134697B2 (ja)
JP3232728B2 (ja) 音声符号化方法
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JPH0481199B2 (ja)
Viswanathan et al. Medium and low bit rate speech transmission
JPH03116199A (ja) 音声信号符号化装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term