JPH0225520B2

JPH0225520B2 -

Info

Publication number: JPH0225520B2
Application number: JP57053007A
Authority: JP
Inventors: Keiko Ayukawa
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1982-03-31
Filing date: 1982-03-31
Publication date: 1990-06-04
Also published as: JPS58171097A

Description

【発明の詳細な説明】 (a) 発明の技術分野本発明は音声合成システムに係り、特に合成音
声の異音を除去するための音声パラメータ修正方
法に関する。

(b) 技術の背景音声波形を線形予測符号化方式によつて分析し
て得られた偏自己相関係数等のスペクトル包絡情
報と、その最終結果として得られた残差波形から
基本周期情報、パルス振幅情報、雑音情報を得て
該スペクトル包絡情報、基本周期情報、パルス振
幅情報、雑音情報から構成される音声パラメータ
を用いる所謂PARCOR法で音声合成する音声合
成システムに於て、単語を合成した場合無音部と
有音部の境界付近で異音の発生することがあるこ
とが知られている。即ち単語の発声の始め部分に
異音が発生することがあるが音声合成システムに
於ては異音の送出は非常に聞き苦しい事になるた
め、その対策が望まれている。

(c) 発明の目的本発明の目的は上記要望に基づき、PARCOR
法における総ての異音発生原因に対処し得るよう
にするもので、例えば、音源振幅の抽出エラーや
音源振幅の不連続に起因するものの外に、原音か
ら抽出されるスペクトル情報の抽出エラーに起因
するものや、ピツチ情報の抽出エラーに起因する
もの等に対処するため、無音部より有音部に移る
境界付近で発生する異音を含むフレームを削除
し、削除した複数フレームを構成する音素列と同
一音素列を持つ同数の異音を含まないフレームを
挿入し、聞き苦しい合成音声の送出を防止するこ
とにある。

(d) 発明の構成本発明の構成は音声波形を線形予測符号化方式
によつて分析して得られた偏自己相関係数等のス
ペクトル包絡情報と、その最終結果として得られ
た残差波形から基本周期情報、パルス振幅情報、
雑音情報を得て該スペクトル包絡情報、基本周期
情報、パルス振幅情報、雑音情報から構成される
音声パラメータを用いて音声合成する音声合成シ
ステムに於て、合成音声の無音部と有音部の境界
付近で異音の原因となる複数のフレームを削除
し、該削除し複数フレームを構成する音素列と同
種の音素列を持つ同数の異音を含まないフレーム
を挿入することで単語を合成するようにしたもの
である。

(e) 発明の実施例第１図は本発明の一実施例を説明する図であ
る。第１図Ａは「KAWASAKI」という合成音
声の単語の無音部から有音部へ移る境界付近を形
成する「KA」の部分で異音が発生した場合、第
１図Ｂで示す如く同種の音素列で始まる
「KAWAGUCHI」という単語のパラメータより
「KA」に相当する複数のフレームを、第１図Ａ
の「KA」に相当す複数のフレームと交換するも
のである。これは、人間が同じ音声を何度発声し
ても、音声波形として全く同じものは一つも無
い。従つて、その波形を分析して得られる結果は
異なり、分析エラーに起因して異音がある場合と
無い場合があるためである。尚、この場合交換す
るフレームの数は同数である。又第１図Ａの
「KA」と第１図Ｂの「KA」ではパラメータに差
があるが音声として人間が聞く時は大差なく特に
異和音を感ずることはない。

第２図は本発明の一実施例を示す回路のブロツ
ク図である。制御部３は音素列比較部５を経て線
形予想符号化方式による偏自己相関係数により分
析して得られた音声パラメータの格納されている
パラメータフアイル１２より単語のパラメータを
フレーム制御部６へ送ると共に音声合成部１に送
出して合成音を送出する。オペレータは該合成音
を聞き異音の発生を認めると指令入力部２より異
音除去の指令を制御部３に与える。制御部３は異
音の検出された単語と同種の音素列をもち、予め
異音のない単語として、パラメータフアイル１２
に格納された単語を音素列比較部５によりパラメ
ータフアル１２から選択させフレーム制御部６に
送る。従つてフレーム制御部６には異音を発生し
た単語のパラメータのフレームと同種の音素列を
もつ単語のパラメータのフレームとが記憶され
る。例えば「KAWASAKI」という単語の無音
部より有音部に移る境界付近を形成する「KA」
に異音があつた場合同種の音素列で始まる
「KAWAGUCHI」という単語のパラメータが該
「KAWASAKI」という単語のパラメータと共に
フレーム制御部６に記憶される。前記２つの単語
のパラメータの各フレームは第１フレームより第
２、第３フレームと順々に夫々比較部７及び比較
部８に送出され音声始端検出閾値格納部４よりの
閾値により無音部か有音部かを判定される。比較
部７には異音を発生した単語のフレームが送出さ
れるとすると、制御部３は比較部７で有音部と判
定されたフレームより予め定められた数だけ有音
部のフレームを削除してフレーム格納部９に該単
語のフレームを格納する。比較部８には異音発生
単語と同種の音素列をもつ単語のフレームが送出
され前記同様に有音部と判定されたフレームより
前記の予め定められた数だけフレーム格納部１０
に格納される。置換部１１はフレーム格納部９よ
りのフレームの削除された部分にフレーム格納部
１０よりのフレームを挿入し、フレーム制御部６
に送る。フレーム制御部６は音素列比較部５を経
てパラメータフアイル１２に該修正された単語の
パラメータを再格納する。

尚本実施例はハードウエアで説明したが上記動
作は制御部に格納したソフトウエアでも実行可能
であることは勿論である。

(f) 発明の効果以上説明した如く本発明は合成音の異音を除去
することが出来るため、その効果は大なるものが
ある。

【図面の簡単な説明】

第１図は本発明の一実施例を説明する図、第２
図は本発明の一実施例を示す回路のブロツク図で
ある。１は音声合成部、２は指令入力部、３は制御
部、４は音声始端検出閾値格納部、５は音素列比
較部、６はフレーム制御部、７，８は比較部、
９，１０はフレーム格納部、１１は置換部、１２
はパラメータフアイルである。

Claims

【特許請求の範囲】

１音声波形を線形予測符号化方式によつて分析
して得られた偏自己相関係数等のスペクトル包絡
情報と、その最終結果として得られた残差波形か
ら基本周期情報、パルス振幅情報、雑音情報を得
て該スペクトル包絡情報、基本周期情報、パルス
振幅情報、雑音情報から構成される音声パラメー
タを用いて音声合成する音声合成システムに於
て、合成音声の無音部と有音部の境界付近で複数
の有音部の異音を含むフレームを削除し、該削除
した複数フレームを構成する音素列と同一音素列
を持つ同数の異音を含まないフレームを挿入する
ことを特徴とする音声パラメータ修正方法。