JPH11305797A - 音声分析合成器 - Google Patents

音声分析合成器

Info

Publication number
JPH11305797A
JPH11305797A JP10113076A JP11307698A JPH11305797A JP H11305797 A JPH11305797 A JP H11305797A JP 10113076 A JP10113076 A JP 10113076A JP 11307698 A JP11307698 A JP 11307698A JP H11305797 A JPH11305797 A JP H11305797A
Authority
JP
Japan
Prior art keywords
analyzer
residual signal
signal
residual
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10113076A
Other languages
English (en)
Other versions
JP3472704B2 (ja
Inventor
Tomokazu Morio
智一 森尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP11307698A priority Critical patent/JP3472704B2/ja
Publication of JPH11305797A publication Critical patent/JPH11305797A/ja
Application granted granted Critical
Publication of JP3472704B2 publication Critical patent/JP3472704B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 従来のピッチ相関値に基づいて有声/無声を
判定する音声分析合成器において、ピッチ周波数の存在
する周期的な信号の立ち上がり区間等ではピッチ相関値
が低く、無声と判定され、合成した音声が雑音的になる
という課題があった。 【解決手段】 音声分析器側に、線形予測分析フィルタ
3から出力される残差信号cと、ピッチ分析器5から出
力されるピッチ周波数dとを入力して、パルス性度合が
予め設定された閾値より高い場合には、有声判定を行う
パルス性分析器を設ける。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、音声信号を圧縮
して符号化復号化する装置に関する。
【0002】
【従来の技術】一般にボコーダと呼ばれる音声分析合成
技術がある(例えば、「音声情報処理の基礎」斎藤、中
田、オーム社、1981年)。図3は、従来のボコーダ
の構成図であり、点線の上側のA′が音声分析器、下側
のB′が音声合成器である。音声分析器A′は、101
が入力端子、102が音声信号aを入力して線形予測係
数bを算出する線形予測分析器、103が音声信号aと
線形予測係数bとを入力して、第1の残差信号cを算出
する線形予測分析フィルタ、104が第1の残差信号c
を入力して、残差パワーgを算出する残差パワー分析
器、105が第1の残差信号cを入力して、有声/無声
の判定e′とピッチ周波数dとを算出するピッチ分析器
である。
【0003】音声合成器B′は、111が有声/無声の
判定e′とピッチ周波数dを入力して、第2の残差信号
f′を生成する残差信号生成器、112が第2の残差信
号f′と残差パワーgとを入力して、第2の残差信号
f′を増幅する増幅器、113は増幅された第2の残差
信号h′と線形予測係数bとを入力して、音声信号i′
を生成する線形予測合成フィルタ、114が出力端子で
ある。
【0004】次に、図3に示すボコーダの動作を簡単に
説明する。以下の処理は、ある一定長(例えば5mse
c.)毎のフレーム単位に行われる。音声分析器A′側の
処理は、入力端子101から音声信号aを入力する。図
2(1)は、その音声信号aの音声波形例である。
【0005】線形予測分析器102により線形予測係数
bを算出し、線形予測分析フィルタ103に出力すると
共に、音声合成器B′の線形予測合成フィルタ113に
も送信する。線形予測分析フィルタ103は、音声信号
aと線形予測係数bとを入力し、第1の残差信号cを出
力する。図2(2)は、図2(1)の音声信号aから求
めた第1の残差信号cの例である。残差パワー分析器1
04は、第1の残差信号cの残差パワーgを算出し、音
声合成器B′の増幅器112に送信する。ピッチ分析器
105は、第1の残差信号cを入力し、第1の残差信号
cの相関値(以下ピッチ相関値と呼ぶ)をもとに、ピッ
チ周期性が高いか否か判定し、高い場合には有声の、低
い場合には無声の判定結果e′と、ピッチ周波数dとを
音声合成器B′の残差信号生成器111に送信する。
【0006】ピッチ周波数とピッチ相関値の算出方法
は、一般に広く使われているピッチ探索の手法を用いる
ことができる。探索手法は、残差信号を分析対象とし
て、ピッチ周波数に対応する時間間隔(時間シフト量)
を変量とし、正規化自己相関値を最大にする時間間隔か
ら、ピッチ周波数を決定する。また、そのときの正規化
自己相関値をピッチ相関値とする手法を用いることがで
きる。
【0007】音声合成器B′側の処理は、残差信号生成
器111は、音声分析器A′側から送られた有声/無声
の判定結果e′と、ピッチ周波数dの情報から、有声の
場合は、ピッチ周波数dで決められる周期的信号(例え
ばパルス列)を生成し、無声の場合は、雑音信号(例え
ば白色雑音)を生成する。この様子を図4に示す。
【0008】図4は、残差信号生成器を模式的に示して
おり、周期的信号生成器と雑音信号生成器とから構成さ
れている。音声が有声の場合は、ピッチ周期波dの情報
に従って周期的信号を、無声の場合は、雑音信号を切り
換えて出力するようになっている。
【0009】増幅器112は、音声分析器A′側から送
られた残差パワーgの情報を元に、第1の残差信号cの
パワーと同じになるように、残差信号生成器111から
出力される第2の残差信号f′を増幅する。この様子を
図2(3)に模式的に示す。線形予測合成フィルタ11
3は、音声分析器A′側から送られた線形予測係数bの
情報と、増幅された第2の残差信号h′とから音声信号
i′を合成し、出力端子114に出力する。
【0010】このように音源信号を、周期的信号と雑音
信号とを切り替えてモデル化する方式の他に、有声信号
と無声信号とが混合した信号をモデル化することによ
り、分析合成音声の品質を向上させる技術もある(例え
ば、“High−Quality Harmonic
Coding At Very Low Bit Ra
tes”、G.Yang、H.Leich、ICASS
P、1994)。混合比率の制御は、例えばピッチ相関
値に基づいて行われる。周期性の度合が強いと周期的信
号を多く混合し、逆に周期性が弱いと雑音信号を多く混
合する。
【0011】
【発明が解決しようとする課題】上記音声分析合成器に
おいて、音源信号を適切にモデル化することが重要であ
る。しかしながら、ピッチ相関値にしたがって有声/無
声の判定をする処理において、ピッチ周波数の存在する
周期的な信号の立ち上がり区間などではピッチ相関値が
低く、無声に判定されてしまい、合成した音声が雑音的
になるという課題があった。
【0012】
【課題を解決するための手段】上記課題を解決するため
に、本発明の音声分析合成器は、音声分析器と音声合成
器とで構成される音声分析合成器において、音声信号を
入力して線形予測係数を算出し、線形予測分析フィルタ
と上記音声合成器に出力する線形予測分析器と、上記音
声信号と上記線形予測係数とを入力して第1の残差信号
を算出して、上記音声分析器内の後続の処理手段に出力
する上記線形予測分析フィルタと、上記第1の残差信号
を入力して残差パワーを算出し、上記音声合成器に出力
する残差パワー分析器と、上記第1の残差信号を入力し
て、ピッチ周波数を算出し、パルス性分析器に出力する
ピッチ分析器とを備える音声分析器と、上記パルス性分
析器からの有声/無声の判定結果と、上記ピッチ分析器
で算出されたピッチ周波数とを入力して第2の残差信号
を生成し、増幅器に出力する残差信号生成器と、上記第
2の残差信号と、上記残差パワー分析器からの残差パワ
ーとを入力して第2の残差信号を増幅する増幅器と、上
記増幅された第2の残差信号と、上記線形予測分析器か
ら出力される上記線形予測係数とを入力して、音声信号
を生成して、出力する線形予測合成フィルタとで構成さ
れる音声合成器とを備え、上記第1の残差信号を分析
し、パルス性度合が設定された閾値より高い場合には、
有声判定を行う上記パルス性分析器を、上記音声分析器
に備える。
【0013】また、上記線形予測分析器と、上記線形予
測分析フィルタと、上記残差パワー分析器と、上記第1
の残差信号を入力して有声/無声の混合比率と、上記ピ
ッチ周波数を算出して、上記パルス性分析器に出力する
ピッチ分析器とを備える音声分析器と、上記パルス性分
析器から出力される有声/無声の混合比率と、上記ピッ
チ周波数とを入力して、第3の残差信号を生成する上記
残差信号生成器と、上記増幅器と、上記線形予測合成フ
ィルタとで構成される音声合成器とを備え、上記第1の
残差信号を分析し、上記ピッチ分析器から出力されるパ
ルス性度合に従って有声/無声の混合比率を変更する上
記パルス性分析器を備える。
【0014】線形予測分析器は、入力された音声信号の
線形予測係数を算出する。線形予測分析フィルタは、音
声信号と線形予測係数を入力し、残差信号を出力する。
残差パワー分析器は、残差信号のパワーを算出する。ピ
ッチ分析器は、残差信号を入力し、残差信号の相関値を
もとにピッチ周波数を出力する。パルス性分析器は、残
差信号の波形のパルス性を判定し、パルス性度合に従っ
て有声/無声の混合比率を変更する。
【0015】
【発明の実施の形態】〔実施の形態1〕図1は、本発明
の音声分析合成器の実施の一形態を示すブロック図であ
る。図3に示す従来技術と異なるのは、音声分析器A側
にパルス性分析器6が追加され、ピッチ分析器5の出力
を、このパルス性分析器6に入力している点である。
【0016】音声分析器Aの1は入力端子、2は音声信
号aを入力して線形予測係数bを算出する線形予測分析
器、3は音声信号aと線形予測係数bを入力して、第1
の残差信号cを算出する線形予測分析フィルタ、4は第
1の残差信号cを入力して、残差パワーgを算出する残
差パワー分析器、5は第1の残差信号cを入力して、ピ
ッチ周波数dを算出するピッチ分析器、6は第1の残差
信号cとピッチ周波数dとを入力して、パルス性度合に
基づいて有声/無声の判定eを行うパルス性分析器であ
る。
【0017】音声合成器Bの11は、有声/無声の判定
結果eとピッチ周波数dとを入力して、第2の残差信号
fを生成する残差信号生成器、12は第2の残差信号f
と残差パワーgとを入力して、第2の残差信号fを増幅
する増幅器、13は増幅された第2の残差信号hと線形
予測係数bとを入力して、音声信号iを生成する線形予
測合成フィルタ、14は出力端子である。
【0018】次に、図1に示すボコーダの動作を説明す
る。以下の処理は、ある一定長(例えば5msec.)毎の
フレーム単位に行われる。音声分析器A側の処理は、入
力端子1から音声信号aを入力する。図2(1)は、音
声信号aの音声波形例である。線形予測分析器2により
線形予測係数bを算出し、線形予測分析フィルタ3に出
力すると共に、音声合成器Bの線形予測合成フィルタ1
3にも送信する。線形予測分析フィルタ3は、音声信号
aと線形予測係数bとを入力し、第1の残差信号cを出
力する。
【0019】図2(2)は、図2(1)の音声信号aか
ら求めた第1の残差信号cの例である。残差パワー分析
器4は、残差信号cの残差パワーgを算出し、音声合成
器Bの増幅器12に送信する。ピッチ分析器5は第1の
残差信号cを入力し、ピッチ周波数dを算出して、パル
ス性分析器6に出力する。パルス性分析器6は、第1の
残差信号cの相関値(以下ピッチ相関値と呼ぶ)をもと
に、ピッチ周期性が高いか否か判定し、高い場合には有
声の、低い場合には無声の判定結果eと、ピッチ周波数
dとを音声合成器Bの残差信号生成器11に送信する。
【0020】図2(2)に示すように、一般に、ピッチ
周波数が存在する音声区間の残差信号は、元の音声信号
に比べて波形がパルス的になる性質がある。パルス性分
析器6は第1の残差信号cを入力し、第1の残差信号c
のパルス性度合を算出する。パルス性度合の算出方法と
しては、(1)式で表わされる、フレーム内残差信号波
形の最大絶対値と平均絶対値との比、或いは、(2)式
で表わされる、フレーム内残差信号波形の二乗平均平方
根値と最大絶対値との比などを用いることができる。或
いは(1)式、(2)式で算出される値を、1以下の値
に正規化して取り扱い易くするために、(3)式のよう
にフレーム長の平方根で正規化することもできる。
【0021】 Ymax=Max(|Y1|,|Y2|,...,|YN|) Yave=(|Y1|+|Y2|+...+|YN|)/N Yrms=Sqrt((Y1*Y1+Y2*Y2+...+YN*YN)/N) Pulse=Ymax/Yave (1) Pulse=Ymax/Yrms (2) Pulse=Ymax/(Yrms*Sqrt(N)) (3) ここで、Nはフレーム内のサンプル数(例えば40) Yi(i=1,2,...,N) はフレーム内残差信号の波高
値 |x| は、xの絶対値 Max(Y1,Y2,...,YN)は、Y1,Y2,...,YNの最
大値 Sqrt(x) は、xの平方根を表わす。
【0022】(3)式を用いた場合、例えば最もパルス
性の強い例として、フレーム内に1本のパルスのみ存在
する場合は、算出される値は1になり、逆に最もパルス
性の弱い例として、フレーム内全て等振幅の信号が存在
する場合は、算出される値は1/Sqrt(N)となる。
【0023】次に算出されたパルス性の指標値を、ある
判定閾値(例えば0.5)と比較して、パルス性の指標
値の方が大きければ、ピッチ分析器5から入力した有声
/無声の判定信号を有声判定に設定する。この場合ピッ
チ周波数としては、ピッチ相関値から最もピッチ周波数
の可能性の高い(ピッチ相関値が高い)値に設定する方
法や、ある一定の値に決めるなどの方法が考えられる。
【0024】音声合成器B側の処理は、残差信号生成器
11は、音声分析器A側から送られた有声/無声の判定
結果eと、ピッチ周波数dの情報から、有声の場合は、
ピッチ周波数dで決められる周期的信号(例えばパルス
列)を生成し、無声の場合は、雑音信号(例えば白色雑
音)を生成する。この様子を図4に示す。
【0025】増幅器12は、音声分析器A側から送られ
た残差パワーgの情報を元に、第1の残差信号cのパワ
ーと同じになるように、残差信号生成器11から出力さ
れる第2の残差信号fを増幅する。この様子を図2
(4)に模式的に示す。図2(4)の縦軸及び、横軸の
スケームは、図2(1)乃至、図2(3)と同じであ
る。但し、この方法は、パルスが生成される位置の情報
がないため、パルスの位置は分析フレーム内のどこに立
つかは、図2(3)、(4)と、図2(1)、(2)と
は異なる。線形予測合成フィルタ13は、音声分析器A
側から送られた線形予測係数bの情報と、増幅された第
2の残差信号hとから音声信号iを合成し、出力端子1
4に出力する。
【0026】音声信号に対する処理内容を図2の場合で
例示すると、従来の技術では、ピッチの立ち上がり区間
は、ピッチ相関値が低く算出されてしまい、図2(3)
に示すように3.880秒から3.885秒の区間は無
声と判定されて、雑音信号が生成されているが、本発明
では、残差信号のパルス性の度合が高く、図2(4)に
示すように有声判定が行われ、周期的信号(ここではパ
ルス列)が生成されている。
【0027】〔実施の形態2〕上記実施の一形態では、
音源信号である残差信号を周期的信号か、雑音信号かで
表現していたが、従来技術で説明したように、有声信号
と無声信号とを混合した信号で表現するシステムに適用
することもできる。この場合も図1と同様に、新たに追
加される処理ブロックはパルス性分析器6だけである。
処理内容は実施形態1と同様に、残差信号のパルス性度
合を、例えば(3)式を用いて算出する。算出されたパ
ルス性度合の指標値に従い、ピッチ分析器5から入力し
たピッチ相関値を変更し、音声合成器B側に出力する。
ピッチ相関値の変更は、パルス性度合が高い程、ピッチ
相関値を高く変更するように処理する。例えば(4)式
のような処理が考えられる。
【0028】 Pcor=Pulse,Pulse>Pcorの場合 Pcor=Pcor,Pluse<=Pcor場合 (4) ここで、Pcorは1以下の値に正規化されているピッチ
相関値 Pulseはパルス性度合を表わし、例えば(3)式で求め
られる。
【0029】このように、残差信号波形のパルス性度合
に従ってピッチ相関値を変更することで、ピッチの立ち
上がり区間で、従来法よりも早く周期的信号(例えばパ
ルス列)成分を多く生成することができ、音質を改善す
ることができる。
【0030】
【発明の効果】本発明によれば、音声のピッチの立ち上
がり区間など、ピッチ抽出が困難な区間においても、有
声判定を行うことにより、音質を向上した音声分析合成
器が実現できる。
【図面の簡単な説明】
【図1】本発明の音声分析合成器の実施形態を示すブロ
ック図である。
【図2】従来技術及び、本発明の音声分析合成器の処理
に係る音声信号の波形図である。
【図3】従来技術の音声分析合成器の実施例を示すブロ
ック図である。
【図4】従来技術の音声分析合成器の残差信号生成器の
動作の説明図である。
【符号の説明】
1,101 入力端子 2,102 線形予測分析器 3,103 線形予測分析フィルタ 4,104 残差パワー分析器 5,105 ピッチ分析器 6 パルス性分析器 11,111 残差信号生成器 12,112 増幅器 13,113 線形予測合成フィルタ 14,114 出力端子

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 音声分析器と音声合成器とで構成される
    音声分析合成器において、 音声信号を入力して線形予測係数を算出し、線形予測分
    析フィルタと上記音声合成器とに出力する線形予測分析
    器と、 上記音声信号と上記線形予測係数とを入力して第1の残
    差信号を算出して、上記音声分析器内の後続の処理手段
    に出力する上記線形予測分析フィルタと、 上記第1の残差信号を入力して残差パワーを算出し、上
    記音声合成器に出力する残差パワー分析器と、 上記第1の残差信号を入力して、ピッチ周波数を算出
    し、パルス性分析器に出力するピッチ分析器とを備える
    上記音声分析器と、 上記パルス性分析器からの有声/無声の判定結果と、上
    記ピッチ分析器で算出されたピッチ周波数とを入力して
    第2の残差信号を生成し、増幅器に出力する残差信号生
    成器と、 上記第2の残差信号と、上記残差パワー分析器からの残
    差パワーとを入力して第2の残差信号を増幅する増幅器
    と、 上記増幅された第2の残差信号と、上記線形予測分析器
    から出力される上記線形予測係数とを入力して、音声信
    号を生成し、出力する線形予測合成フィルタで構成され
    る音声合成器とを備え、 上記第1の残差信号を分析し、パルス性度合が設定され
    た閾値より高い場合には、有声判定を行う上記パルス性
    分析器を、上記音声分析器に備えたことを特徴とする音
    声分析合成器。
  2. 【請求項2】 上記線形予測分析器と、上記線形予測分
    析フィルタと、上記残差パワー分析器と、上記第1の残
    差信号を入力して有声/無声の混合比率と、上記ピッチ
    周波数を算出して、上記パルス性分析器に出力するピッ
    チ分析器とを備える音声分析器と、 上記パルス性分析器から出力される有声/無声の混合比
    率と、上記ピッチ周波数とを入力して、第3の残差信号
    を生成する上記残差信号生成器と、 上記第3の残差信号を増幅する増幅器と、 上記線形予測合成フィルタとで構成される音声合成器と
    を備え、 上記第1の残差信号を分析し、上記ピッチ分析器から出
    力されるパルス性度合に従って、有声/無声の混合比率
    を変更する上記パルス性分析器を備えたことを特徴とす
    る請求項1記載の音声分析合成器。
JP11307698A 1998-04-23 1998-04-23 音声分析器および音声分析合成器 Expired - Fee Related JP3472704B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11307698A JP3472704B2 (ja) 1998-04-23 1998-04-23 音声分析器および音声分析合成器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11307698A JP3472704B2 (ja) 1998-04-23 1998-04-23 音声分析器および音声分析合成器

Publications (2)

Publication Number Publication Date
JPH11305797A true JPH11305797A (ja) 1999-11-05
JP3472704B2 JP3472704B2 (ja) 2003-12-02

Family

ID=14602880

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11307698A Expired - Fee Related JP3472704B2 (ja) 1998-04-23 1998-04-23 音声分析器および音声分析合成器

Country Status (1)

Country Link
JP (1) JP3472704B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008013135A1 (en) 2006-07-27 2008-01-31 Nec Corporation Audio data decoding device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008013135A1 (en) 2006-07-27 2008-01-31 Nec Corporation Audio data decoding device
US8327209B2 (en) 2006-07-27 2012-12-04 Nec Corporation Sound data decoding apparatus

Also Published As

Publication number Publication date
JP3472704B2 (ja) 2003-12-02

Similar Documents

Publication Publication Date Title
KR100615480B1 (ko) 음성 대역 확장 장치 및 음성 대역 확장 방법
TR199600519A2 (tr) Konusma sinyallerinin olusturulmasina mahsus yöntem ve cihaz ve sinyallerin iletilmesine mahsus yöntem.
Ahmadi et al. Analysis-by-synthesis method for whisper-speech reconstruction
KR0155315B1 (ko) Lsp를 이용한 celp보코더의 피치 검색방법
JPH11305797A (ja) 音声分析合成器
JPH03119398A (ja) 音声分析合成方法
KR100715013B1 (ko) 대역확장장치 및 방법
KR100715014B1 (ko) 트랜스코더 및 부호변환방법
KR100310930B1 (ko) 음성합성장치및그방법
JP3057907B2 (ja) 音声符号化装置
JP3166797B2 (ja) 音声符号化法及び音声復号化法並びに音声符復号化装置
JP2000122698A (ja) 音声符号化装置
JPH0235997B2 (ja)
JPS61236599A (ja) 音声信号符号化復号化方法とその装置
JPH06208398A (ja) 音源波形生成方法
JPS61262800A (ja) 音声符号化方式
JPH10222196A (ja) 音声符号化における波形利得見積方法
JPS6189737A (ja) 音声分析合成装置
JPH10232698A (ja) 話速変換装置
JPH0675598A (ja) 音声符号化方法及び音声合成方法
JPH043876B2 (ja)
JPS63181517A (ja) マルチパルス符号化装置
JPH09114498A (ja) 音声符号化装置
JPH0242239B2 (ja)
JPH043880B2 (ja)

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080912

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080912

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090912

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees