JPH01261700A - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JPH01261700A
JPH01261700A JP63089050A JP8905088A JPH01261700A JP H01261700 A JPH01261700 A JP H01261700A JP 63089050 A JP63089050 A JP 63089050A JP 8905088 A JP8905088 A JP 8905088A JP H01261700 A JPH01261700 A JP H01261700A
Authority
JP
Japan
Prior art keywords
sound source
power
residual
amplitude
unvoiced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63089050A
Other languages
English (en)
Inventor
Yoshiaki Asakawa
浅川 吉章
Kazuhiro Kondo
和弘 近藤
Hiroshi Ichikawa
市川 熹
Toshiro Suzuki
鈴木 俊郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63089050A priority Critical patent/JPH01261700A/ja
Publication of JPH01261700A publication Critical patent/JPH01261700A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声符号化方式に係り、特に音声情報を8 
kbps前後に圧縮する際に符号化音声の品質を向上さ
せるための方式に関するものである。
〔従来の技術〕
音声信号をディジタル化して伝送するためには、音声信
号をサンプリングし、量子化して2進のディジタル符号
に変換することにより、PCM伝送する。
一方、専用ディジタル回線を用いて通信ネットワークを
構築する場合、通信コストの低減は非常に重要な課題で
あり、64kbpsにも及ぶ音声信号の情報量は多過ぎ
るため、そのままでは非常に不経済である。そこで、伝
送のための音声信号の情報圧縮(つまり低ビツトレール
符号化)が必要となる。
音声信号を8 kbps前後で圧縮する音声符号化方式
としては、音声をスペクトル包絡情報と音源情報とに分
離して、各々を符号化する方法が知られている。その中
で、音源情報を単一パルス列と白色雑音でモデル化した
ものが、いわゆるPARCOR(Partial Au
tocorrelation :  偏自己相関)法で
あり、この方法では低ビツトレートで符号化できるが、
その反面、品質の劣化が大きい。これに対して、音源を
複数のパルス列で表現する方法として、マルチパルス法
(例えば、小浜、他「マルチパルス駆動形音声符号化法
の品質改善」日本音響学会音声研究会資料583−78
(1984,1)参照)や、あるいは残差圧縮法(桟用
、他、「残差情報を利用した音声合成法の検討」日本音
響学会講演論文集3−1−7 (昭和59.10)参照
)等がある。
残差圧縮法としては、例えば特開昭60−150100
に記載された方法が提案されており、また同61−29
6398号、同62−194296号の各明細書にも記
載されている。
これらの方法では、音源の表現が精密化する分だけ、P
ARCOR法に比べて品質が向上している。
〔発明が解決しようとする課題〕
前述の従来技術においては、音源である複数のパルス列
を、フレーム毎に独立して一定の基準で生成する。ここ
で、フレームとは、音声を分析する時間単位であって、
通常は20m5程度に設定される6 ところで、音声波形は、サンプリングされてサンプル値
xtの系列に変換されているものとする。
現在値をXt とし、それから過去にさかのぼる9個の
サンプル値を(xt−i) 、 (i = 1 、2 
、・・・。
p)とする、ここで、音声波形は近似的に過去の9個の
サンプルから予測できるものと仮定する。
予測の中で最も簡単なものは線形予測であるから、過去
のサンプル値の各々にある一定の係数を乗じて加え合わ
せたもので、現在の値が近似されるものと考える。この
とき、現在点tでの実現値Xtと予測値ytとの差を、
予測誤差εtとする。この予測誤差Et を、予測残差
または単に残差と呼ぶ。
音声波形の予測残差波形は、2種類の波形の和と考えら
れる。ぞの1つは、いわゆる誤差成分であり、その振幅
はあまり大きくなく、ランダムな雑音波形に近い、また
、他の1つは、入力に声帯振動によるパルスが加わった
ときの誤差であって、予測が大きく狂い、振幅の大きな
残差波形となる。
この残差成分は、音源の周期性に対応して、繰り返し周
期的に現われる。
音声は周期性を有する区間(有声音)と1周期性が顕著
でない区間(無音声)とに大別されるので、それに対応
して、予測残差波形も、有声音部では周期性を有してい
る。
一方、マルチパルス法や残差圧縮法において生成される
パルス列は、残差の近似と見なすことができるので、有
声音部では周期性を有するはずである。そこで例えば残
差圧縮法では前記特開昭61−296398号に開示し
である手法を用いて、1ピッチ周期につき所定本数の代
表残差パルス数を抽出し、復号時にこれをピッチ周期毎
にくり返すことにより実効的に駆動音源パルス数を増や
す工夫がなされている。ところが無声音の場合には、特
開昭60−150100号あるいは特開昭62−194
296号に開示しである方法は、基本的には予測残差か
ら振幅の小さいものを取り除く、すなわち振幅の大きな
残差パルスのみを用いることを意味しており、所定のビ
ット・レートにするためには使用できる残差パルスの実
効的な数は、有声音の場合はど多くすることができない
、その結果、パルス数不足のために、本来ランダム雑音
性の強い無音摩擦音部でも、合成された音声の品質に「
チリチリ」、「ブチブチ」するといった劣化が生じる問
題があった。
これは有声無声で処理を切替える方式のマルチパルス法
においても同様である。
このような間厘点で解決する方法として、特開昭62−
31222がある。これはマルチパルス法において無声
と判定されたフレームにおいては、パワの原残差のパワ
と一致させるようらマルチパルス列に白色雑音を付加す
るものである。しかしながらこの方法によれば、無声フ
レームに一様に雑音が付加されるため、復号音声に雑音
感が増えたり。
本来有声フレームを誤って無声フレームと判定した場合
にはバースト的な雑音感が発生するという問題があった
本発明の目的は、このような従来の問題を解決し、マル
チパルス法や残差圧縮法における無声摩擦音の品質劣化
を改善し、かつ他に悪影響を与えることのない音声符号
化方式を提供することにある。
〔課題を解決するための手段〕
上記目的を達成するため、本発明の音声符号化方式は、
有声/無声判定手段と、無声摩擦音を検出する手段を有
し、該検出された無声フレームにおいては、復号器側で
生成された音源パルス列にパワ(振幅)を制御した白色
雑音(ランダム雑音)を付加する手段を具備することに
特徴がある。
〔作用〕
本発明の作用を残差圧縮法を例として説明する。
残差圧縮法では符号化側で有声/無声の判定を行い、有
声フレームでは例えば前記特開昭61−296398号
の手法により予測残差を間引き符号化し、無声フレーム
においては、例えば特開昭62−194296号の手法
により予測残差を間引き符号化する。これらの圧縮残差
情報はスペクトル包絡パラメータであるにパラメータな
どの補助情報と共に復号化側へ伝送される。
一方、復号化側では伝送されてきた圧縮残差情報から残
差を復号する。復号化された残差は合成フィルタに入力
され、合成波形が出力される。
以上が残差圧縮法の動作の概略であるが1次に無声摩擦
音の検出について述べる。無声摩擦音は音韻では/ s
 /や/f/に相当し、パワは比較的小さく、スペクト
ルは高域にエネルギを持っている。また継続時間長も比
較的長いのが特徴である。
音声符号化では実時間処理が必要なため、遅延時間の大
きくなる継続時間長に関する特徴は利用できないが、他
の特徴は安定に利用することができる。スペクトル形状
が高域上がすなことは、例えば1次のにパラメータの値
が小さいことを、そしてパワが小さいことは原音声や原
残差、ひいては復号残差のパワが小さいことを意味して
おり、これらの特徴量を用いることにより容易に無声摩
擦音を検出することが出来る。
無声摩擦音と判定されたフレームにおいては。
原残差のパワと復号残差のパワの差に相当するパワを持
つ白色雑音を付加し、新たに復号残差とする。この新復
号残差は原残差と類似の構造を持つことになり、これを
駆動源として音声を合成すると、より自然に近い無声摩
擦音が得られる。
〔実施例〕
以下、本発明の実施例を、図面により詳細に説明する。
第1図は、本発明の音声符号化方式を残差圧縮法を用い
た音声符号化装置(音声GODEC)に適用した場合の
ブロック構成図であって、同図aが符号化部であり、b
が復号化部である。
本発明の符号化部は、ディジタル音声信号入力端子1と
、同信号を格納するバッファメモリ2と、線形予測を行
う線形予測回路4と、パラメータ5を用いて制御される
逆フィルタ6と、残差相関法等を用いて音声のピッチを
抽出するピッチ抽出回路8と、有声無声判定回路1oと
、有声無声判定結果に応じて無声音源パルスを生成する
無声音源生成回路12aと、同様に有声音源パルスを生
成する有声音源生成回路12bと、残差波形信号7のパ
ワを計算するパワ計算回路14と、量子化符号化回路1
6を具備している。
また本発明の復号化部は、入力信号を5種のパラメータ
に分離する復号逆量子化回路19と、復号化されたスペ
クトル包絡パラメータ5′を格納するバッファメモリ2
1と、有声無声判定結果11′によって圧縮化残差情報
13′を切替して無声音源パルスを再生する無声音源パ
ルス再生回路20aと、有声音源パルスを再生する有声
音源パルス再生回路20bがあり、これにはピッチ周期
9′も入力される。さらに、原残差パワ15′とバッフ
ァメモリ21から読み出したスペクトル包絡パラメータ
とを用いて無声摩擦音を検出する無声摩擦音検出回路2
2と、無声音源パルス列24のパワを計算するパワ計算
回路25と、該パワ26と原残差パワ15’ とから雑
音発生回路27の出力であるランダム雑音パルス列28
の最大振幅を決定する振幅計算回路29と、それによっ
て決定された雑音30を無声摩擦音検出回路22の検出
結果23に基づいて切替えるスイッチ31と、無声音源
パルス列24に雑音を付加する加算回路32と、再生音
源パルス列3;3を入力として、上記の処理遅延を補正
するためにバッファメモリ21から読み出されたスペク
トル包絡パラメータを係数とする合成フィルタ34と、
合成音声35を出力する出力@36とを具備している。
第1図(a)において、符号化時にディジタル化された
音声信号は、バッファメモリ2に1フレ一ム分格納され
、よく知られている線形予測回路4により、スペクトル
包絡を表わすパラメータ(例えば、偏自己相関係数)5
に変換される。次に、このスペクトル包絡パラメータ5
を係数に用いて逆フィルタ6を構成し、これを音声信号
3を入力することにより、残差波形信号7を得る。
ピッチ抽出回路8は、残差相関法やΔMDF(アベレー
ジ マグニチュード ディファレンシャル ファンクシ
ョン: Average MagnitudeDiff
erential Function)法等の良く知ら
れた手法を用いており、残差信号7を入力としてフレー
ムのピッチ周期9を抽出する。なおピッチ抽出回路の入
力としては、残差信号7のかわりに、音声信号3を用い
ることも可能である。有声無声判定回路10は良く知ら
れているように、スペクトル包絡を表わすパラメータ5
や残差波形7などを入力として、そのフレームが有声で
あるか無声であるかの判定結果11を出力する。
この判定結果に従って、残差信号7はフレームが無声の
場合には無声音源生成回路12aによりまた有声の場合
には有声音源生成回路1.2 bによりそれぞれ残差圧
縮さ九、圧縮化残差情報13が出力される。無声音源生
成回路12aとしては。
例えば特開昭62−1.94296号に開示されている
手法を、また有声音源生成回路12bとしては、例えば
特開昭61〜29639111号に開示されている手法
をそれぞれ用いることが出来る。
パワ計算回路14では、1フレ一ム分の残差信号7のパ
ワを次式により計算し、原残差パワ15を得るものであ
る。
i=1 ここに11はフレーム内のアドレスiの残差信号の振幅
を示し、Nはフレームの残差パルス数である。
量子化符号化回路16は、スペクトル包絡パラメータ5
と有声無声判定結果11と、圧縮化残差情報13とピッ
チ周期9と原残差パワ15とを受けとり、所定のビット
数に量子化して、所定の書式に変換された結果であるデ
ィジタルデータ17を、ディジモル回I!18に送出す
る。
第1図(b)において、1復号時には、ディジタル回線
18から受信されたディジタルデータ17が復号逆量子
化回路19に入力されると、5種のパラメータ(スペク
トル包絡パラメータ5′、原残差パワ15′、有声無声
判定結果11′、圧縮化残差情報13′、ピッチ周期9
′)に分離される。上記パラメータのうちスペクトル包
絡パラメータ5′は一旦バッファメモリ21に格納して
おく、圧縮化残差情報13′は有無声判定結果11′の
値に従って、無声音源パルス再生回路20aに接続され
、無声音源パルス列24aを出力するか、有声音源パル
ス再生回路20bに接続され、ピッチ周期9′も入力し
て有声音源パルス列24bを出力する。無声有源パルス
再生回路20aには前記特開昭62−194296に開
示されている手法を、有声音源パルス再生回路20bに
は特開昭61−296398に開示されている手法を用
いている。
バッファメモリ21から読み出されたスペクトル包絡を
表わすパラメータであるkx  (1次の偏自己相関係
数)と原残差パワ15′が無声摩擦音検出回路22に入
力される。この検出回路では次に示す判定論理によって
無声摩擦音を検出する。
ここにに1は1次の偏自己相関係数の値、PWRは原残
差パワ15′の値、θ1.θ、はそれぞれ前もって定め
られた閾値である。(2)式を満足するときにこのフレ
ームを無声摩擦音と判定し、結果23を出力する。
パワ計算回路25では1フレ一ム分の無声音源パルス列
24aのパワPWR’ 26を出力する。
振幅計算回路29では、原残差パワ15′と無声音源パ
ルス列24のパワ26とを入力として、雑音発生回路2
7からのランダム雑音パルス列28の振幅を制御する。
1フレームが20 m s、すなわちN=160サンプ
ルのとき、無声音源パルス列24aのパルス数をMとす
ると、付加するランダム雑音パルス数はL=N−Mとな
る。このときのランダム雑音パルス列28のパワをPW
Rrとすると。
PWR= PWR’  + PWRr    −(3)
なる関係が成立するようにランダム雑音パルス列28の
振幅を制御すれば良い、雑音パルスが−様なランダムパ
ルスとすれば、その最大振幅をaとすればL本分のパワ
は近似的に となる。よって(3)式と(4)式とからランダム雑音
の最大振幅aを次式に従って決定すれば、ランダム雑音
を付加したあとの再生音源パルス列33のパワは原残差
のパワ15′に一致する。
a=  3(PWR−PWR’)/L  ・=(5)こ
のようにして最大振幅を決定したランダム雑音パルス列
28を、無声摩擦音検出部の検出結果23に従ってスイ
ッチ31で制御し、雑音加算回路32に入力する。雑音
加算回路32では無声音源パルス列の振幅がOのところ
に振幅を制御した雑音パルス30を付加し、再生音源パ
ルス列33を生成する。上記処理における遅延を補正し
た上で、バッファメモリ21の出方を合成フィルタ34
の係数として用いる。再生音源パルス列33をこの合成
フィルタ34に入力することにより、その出力として合
成音声35が得られ、出力端子36へ接続される。
以上説明したように、本発明によれば、無声摩擦音にお
いて原残差と性質(スペクトル)が近くかつパワの等し
い再生音源を得ることが出来るので1合成音声の品質を
向上することができる。
次に本発明の第2の実施例について説明する。
第2図は、本発明の音声符号化方式を、残差圧縮法を用
いた音声符号化装置(音声C0DEC)に適用した第2
の場合のブロック構成図であって、同図(a)が符号化
部であり、同図すが復号化部である。
この第2の実施例においては、第1の実施例と共通する
点も多いので、異なる部分を中心に説明する。
符号化部については、第1図(a)の符号化部から原残
差パワの計算部14を省略した形になっており、従って
、伝送パラメータもスペクトル包絡パラメータ5と、有
声無声判定結果11と、圧縮化残差情報13と、ピッチ
周期9の4通りとなっている。
一方、第2図(b)に示す復号化部においては上記4つ
のパラメータを受信2分離する、有声無声判定結果11
′に従って圧縮化残差情報13′は無声音源パルス再生
回路20aに接続されている。ここで第2図(a)の無
声音源生成回路12aと同図(b)の無声音源パルス再
生回路20aは、特開昭60−150100号に開示し
である手法によっており、再生された音源パルスは原残
差パルスのうち振幅の大きな値に予め定められたパルス
数だけ元の残差の時系列と同順に並んだものになってい
る。この再生された無声音源パルスのパワがパワ計算回
路25で計算され、パワPWR’ 26が出力される。
無声摩擦音検出回路22′では基本的には第1図(b)
の無声摩擦音検出回路22と同じであるが、式(2)に
おいて、 とすることによって、無声摩擦音を検出する。ここにθ
P′ は再生音源パルス列のパワPWR’に対する閾値
であり、一般に式(2)のOFよりも小さ目に設定され
る。
次に振幅計算回路29′では、無声音源パルス列24a
を入力として、雑音発生回路27の出力゛であるランダ
ム雑音パルス列28の最大振幅を決定する。すでに述べ
たように、無声音源パルス列24aの振幅は、原人差7
の振幅の大きい順に持ってきたものであるから、その最
小値以下のパルスの振幅はOとなっている。そこでそれ
を補う意味でランダム雑音パルス列28を付加すると考
えると、ランダム雑音パルス列28の最大振幅としては
無声音源パルス列24aの最小振幅に一致させるのが妥
当である。すなわち、ランダム雑音パルス列28の最大
振幅aを a =min  (l E ’  tl)      
   ・・16)i=1.M と決定すれば良い、ここにε、′ は振幅がOでない無
声再生残差パルス(パルス数はM)の振幅である。この
ようにした場合、雑音が付加された再生音源パルス列3
3のパルスが原人差のパワに一致するという保証はない
が、実験によれば第1の実施例と同程度の音質改善の効
果が認めら九た。
また第2の実施例では原人差のパワ情報と伝送する必要
がないので、その分だけ他に情報を配分することが可能
である。
〔発明の効果〕
以上説明したように1本発明によれば、復号時に無声摩
擦音部において駆動音源パルス数の不足によって生じて
いた音質の劣化が、雑音パルスの付加により原人差と類
似度の高い駆動音源パルスを生成することができるので
、符号化音声の品質を向上させることが可能である。さ
らに従来のように無声と判定されたフレームに無条件に
雑音を付加させることによる合成音声の品質の劣化や、
本来有声と判定されるべきフレームが無声と判定される
ことによって生じるバースト的な雑音による劣化が、無
声摩擦音検出機能を付加したことにより防止される。
【図面の簡単な説明】
第1図は本発明の第1の実施例を示す音声符号化システ
ムのブロック図で、(a)は符号化部。 (b)は復号化部である。第2図は本発明の第2の実施
例を示す音声符号化システムのブロック図で、(a)は
符号化部、(b)は復号化部である。 4・・・線形予測回路、6・・・逆フィルタ、8・・・
ピッチ抽出回路、10・・・有声無声判定回路、12a
・・・無声音源生成回路、12b・・・有声音源生成回
路。 14.25・・・パワ計算回路、20a・・・無声音源
パルス再生回路、20b・・・有声音源パルス再生回路

Claims (1)

  1. 【特許請求の範囲】 1、音声信号をフレームごとに分析し、かつスペクトル
    包絡情報と音源情報とに分離し、駆動音源として複数本
    のパルスを用いた音声符号化方式において、上記音声フ
    レームが無声摩擦音であることを検出する手段と、雑音
    発生手段と、該雑音発生手段の出力である雑音系列の振
    幅制御手段と、上記無音摩擦音が検出された場合に前記
    音源パルスに上記振幅を制御した雑音系列を重畳する手
    段とを具備することを特徴とする音声符号化方式。 2、上記雑音系列の振幅の制御においては、音声信号の
    予測残差信号を抽出する手段と、そのパワを算出する手
    段と、前記駆動音源パルス列のパワを算出する手段とを
    具備し、該駆動音源パルス列のパワとそれに重畳する雑
    音系列のパワとの和が前記原残差信号のパワと一致する
    ようにしたことを特徴とする特許請求の範囲第1項記載
    の音声符号化方式。 3、上記雑音系列の振幅の制御においては、前記駆動音
    源パルス列の最小値を検出する手段を具備し、前記雑音
    系列の振幅の最大値が、上記駆動音源パルス振幅の最小
    値に一致するようにしたことを特徴とする特許請求の範
    囲第1項記載の音声符号化方式。
JP63089050A 1988-04-13 1988-04-13 音声符号化方式 Pending JPH01261700A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63089050A JPH01261700A (ja) 1988-04-13 1988-04-13 音声符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63089050A JPH01261700A (ja) 1988-04-13 1988-04-13 音声符号化方式

Publications (1)

Publication Number Publication Date
JPH01261700A true JPH01261700A (ja) 1989-10-18

Family

ID=13960050

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63089050A Pending JPH01261700A (ja) 1988-04-13 1988-04-13 音声符号化方式

Country Status (1)

Country Link
JP (1) JPH01261700A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2741743A1 (fr) * 1995-11-23 1997-05-30 Thomson Csf Procede et dispositif pour l'amelioration de l'intelligibilite de la parole dans les vocodeurs a bas debit
CN107945813A (zh) * 2012-08-29 2018-04-20 日本电信电话株式会社 解码方法、解码装置、程序和记录介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2741743A1 (fr) * 1995-11-23 1997-05-30 Thomson Csf Procede et dispositif pour l'amelioration de l'intelligibilite de la parole dans les vocodeurs a bas debit
CN107945813A (zh) * 2012-08-29 2018-04-20 日本电信电话株式会社 解码方法、解码装置、程序和记录介质
CN107945813B (zh) * 2012-08-29 2021-10-26 日本电信电话株式会社 解码方法、解码装置、和计算机可读取的记录介质

Similar Documents

Publication Publication Date Title
JP2707564B2 (ja) 音声符号化方式
WO2003010752A1 (fr) Appareil d'elargissement de la largeur de bande vocale et procede d'elargissement de la largeur de bande vocale
JP2002268696A (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JPH09330097A (ja) 音声再生装置
JPH01261700A (ja) 音声符号化方式
JP3227929B2 (ja) 音声符号化装置およびその符号化信号の復号化装置
JP4793539B2 (ja) 符号変換方法及び装置とプログラム並びにその記憶媒体
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP2900987B2 (ja) 無音圧縮音声符号化復号化装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JPS62102294A (ja) 音声符号化方式
JP2853170B2 (ja) 音声符号化復号化方式
JP3515216B2 (ja) 音声符号化装置
JPH0411040B2 (ja)
Oh et al. Recursive Randomized Tree Coding of Speech
JPS61262800A (ja) 音声符号化方式
JPH05224698A (ja) ピッチサイクル波形を平滑化する方法及び装置
JP3271966B2 (ja) 符号化装置及び符号化方法
JPH0481199B2 (ja)
JPH0122640B2 (ja)
JPH01293398A (ja) 音声符号化方式
JPS61296398A (ja) 音声分析合成方式
JP2000163097A (ja) 音声変換装置、音声変換方法および音声変換プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH09185396A (ja) 音声符号化装置