JPH0225520B2 - - Google Patents

Info

Publication number
JPH0225520B2
JPH0225520B2 JP57053007A JP5300782A JPH0225520B2 JP H0225520 B2 JPH0225520 B2 JP H0225520B2 JP 57053007 A JP57053007 A JP 57053007A JP 5300782 A JP5300782 A JP 5300782A JP H0225520 B2 JPH0225520 B2 JP H0225520B2
Authority
JP
Japan
Prior art keywords
information
speech
frames
word
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57053007A
Other languages
English (en)
Other versions
JPS58171097A (ja
Inventor
Keiko Ayukawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57053007A priority Critical patent/JPS58171097A/ja
Publication of JPS58171097A publication Critical patent/JPS58171097A/ja
Publication of JPH0225520B2 publication Critical patent/JPH0225520B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Diaphragms For Electromechanical Transducers (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)

Description

【発明の詳細な説明】 (a) 発明の技術分野 本発明は音声合成システムに係り、特に合成音
声の異音を除去するための音声パラメータ修正方
法に関する。
(b) 技術の背景 音声波形を線形予測符号化方式によつて分析し
て得られた偏自己相関係数等のスペクトル包絡情
報と、その最終結果として得られた残差波形から
基本周期情報、パルス振幅情報、雑音情報を得て
該スペクトル包絡情報、基本周期情報、パルス振
幅情報、雑音情報から構成される音声パラメータ
を用いる所謂PARCOR法で音声合成する音声合
成システムに於て、単語を合成した場合無音部と
有音部の境界付近で異音の発生することがあるこ
とが知られている。即ち単語の発声の始め部分に
異音が発生することがあるが音声合成システムに
於ては異音の送出は非常に聞き苦しい事になるた
め、その対策が望まれている。
(c) 発明の目的 本発明の目的は上記要望に基づき、PARCOR
法における総ての異音発生原因に対処し得るよう
にするもので、例えば、音源振幅の抽出エラーや
音源振幅の不連続に起因するものの外に、原音か
ら抽出されるスペクトル情報の抽出エラーに起因
するものや、ピツチ情報の抽出エラーに起因する
もの等に対処するため、無音部より有音部に移る
境界付近で発生する異音を含むフレームを削除
し、削除した複数フレームを構成する音素列と同
一音素列を持つ同数の異音を含まないフレームを
挿入し、聞き苦しい合成音声の送出を防止するこ
とにある。
(d) 発明の構成 本発明の構成は音声波形を線形予測符号化方式
によつて分析して得られた偏自己相関係数等のス
ペクトル包絡情報と、その最終結果として得られ
た残差波形から基本周期情報、パルス振幅情報、
雑音情報を得て該スペクトル包絡情報、基本周期
情報、パルス振幅情報、雑音情報から構成される
音声パラメータを用いて音声合成する音声合成シ
ステムに於て、合成音声の無音部と有音部の境界
付近で異音の原因となる複数のフレームを削除
し、該削除し複数フレームを構成する音素列と同
種の音素列を持つ同数の異音を含まないフレーム
を挿入することで単語を合成するようにしたもの
である。
(e) 発明の実施例 第1図は本発明の一実施例を説明する図であ
る。第1図Aは「KAWASAKI」という合成音
声の単語の無音部から有音部へ移る境界付近を形
成する「KA」の部分で異音が発生した場合、第
1図Bで示す如く同種の音素列で始まる
「KAWAGUCHI」という単語のパラメータより
「KA」に相当する複数のフレームを、第1図A
の「KA」に相当す複数のフレームと交換するも
のである。これは、人間が同じ音声を何度発声し
ても、音声波形として全く同じものは一つも無
い。従つて、その波形を分析して得られる結果は
異なり、分析エラーに起因して異音がある場合と
無い場合があるためである。尚、この場合交換す
るフレームの数は同数である。又第1図Aの
「KA」と第1図Bの「KA」ではパラメータに差
があるが音声として人間が聞く時は大差なく特に
異和音を感ずることはない。
第2図は本発明の一実施例を示す回路のブロツ
ク図である。制御部3は音素列比較部5を経て線
形予想符号化方式による偏自己相関係数により分
析して得られた音声パラメータの格納されている
パラメータフアイル12より単語のパラメータを
フレーム制御部6へ送ると共に音声合成部1に送
出して合成音を送出する。オペレータは該合成音
を聞き異音の発生を認めると指令入力部2より異
音除去の指令を制御部3に与える。制御部3は異
音の検出された単語と同種の音素列をもち、予め
異音のない単語として、パラメータフアイル12
に格納された単語を音素列比較部5によりパラメ
ータフアル12から選択させフレーム制御部6に
送る。従つてフレーム制御部6には異音を発生し
た単語のパラメータのフレームと同種の音素列を
もつ単語のパラメータのフレームとが記憶され
る。例えば「KAWASAKI」という単語の無音
部より有音部に移る境界付近を形成する「KA」
に異音があつた場合同種の音素列で始まる
「KAWAGUCHI」という単語のパラメータが該
「KAWASAKI」という単語のパラメータと共に
フレーム制御部6に記憶される。前記2つの単語
のパラメータの各フレームは第1フレームより第
2、第3フレームと順々に夫々比較部7及び比較
部8に送出され音声始端検出閾値格納部4よりの
閾値により無音部か有音部かを判定される。比較
部7には異音を発生した単語のフレームが送出さ
れるとすると、制御部3は比較部7で有音部と判
定されたフレームより予め定められた数だけ有音
部のフレームを削除してフレーム格納部9に該単
語のフレームを格納する。比較部8には異音発生
単語と同種の音素列をもつ単語のフレームが送出
され前記同様に有音部と判定されたフレームより
前記の予め定められた数だけフレーム格納部10
に格納される。置換部11はフレーム格納部9よ
りのフレームの削除された部分にフレーム格納部
10よりのフレームを挿入し、フレーム制御部6
に送る。フレーム制御部6は音素列比較部5を経
てパラメータフアイル12に該修正された単語の
パラメータを再格納する。
尚本実施例はハードウエアで説明したが上記動
作は制御部に格納したソフトウエアでも実行可能
であることは勿論である。
(f) 発明の効果 以上説明した如く本発明は合成音の異音を除去
することが出来るため、その効果は大なるものが
ある。
【図面の簡単な説明】
第1図は本発明の一実施例を説明する図、第2
図は本発明の一実施例を示す回路のブロツク図で
ある。 1は音声合成部、2は指令入力部、3は制御
部、4は音声始端検出閾値格納部、5は音素列比
較部、6はフレーム制御部、7,8は比較部、
9,10はフレーム格納部、11は置換部、12
はパラメータフアイルである。

Claims (1)

    【特許請求の範囲】
  1. 1 音声波形を線形予測符号化方式によつて分析
    して得られた偏自己相関係数等のスペクトル包絡
    情報と、その最終結果として得られた残差波形か
    ら基本周期情報、パルス振幅情報、雑音情報を得
    て該スペクトル包絡情報、基本周期情報、パルス
    振幅情報、雑音情報から構成される音声パラメー
    タを用いて音声合成する音声合成システムに於
    て、合成音声の無音部と有音部の境界付近で複数
    の有音部の異音を含むフレームを削除し、該削除
    した複数フレームを構成する音素列と同一音素列
    を持つ同数の異音を含まないフレームを挿入する
    ことを特徴とする音声パラメータ修正方法。
JP57053007A 1982-03-31 1982-03-31 音声パラメ−タ修正方法 Granted JPS58171097A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57053007A JPS58171097A (ja) 1982-03-31 1982-03-31 音声パラメ−タ修正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57053007A JPS58171097A (ja) 1982-03-31 1982-03-31 音声パラメ−タ修正方法

Publications (2)

Publication Number Publication Date
JPS58171097A JPS58171097A (ja) 1983-10-07
JPH0225520B2 true JPH0225520B2 (ja) 1990-06-04

Family

ID=12930848

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57053007A Granted JPS58171097A (ja) 1982-03-31 1982-03-31 音声パラメ−タ修正方法

Country Status (1)

Country Link
JP (1) JPS58171097A (ja)

Also Published As

Publication number Publication date
JPS58171097A (ja) 1983-10-07

Similar Documents

Publication Publication Date Title
US6266637B1 (en) Phrase splicing and variable substitution using a trainable speech synthesizer
EP0140777B1 (en) Process for encoding speech and an apparatus for carrying out the process
USRE39336E1 (en) Formant-based speech synthesizer employing demi-syllable concatenation with independent cross fade in the filter parameter and source domains
JP4202090B2 (ja) スムージングフィルタを用いた音声合成システム及びその方法並びにスムージングフィルタ特性制御装置及びその方法
JPS62160495A (ja) 音声合成装置
EP0380572A1 (en) SPEECH SYNTHESIS FROM SEGMENTS OF DIGITAL COARTICULATED VOICE SIGNALS.
JPH031200A (ja) 規則型音声合成装置
US11915714B2 (en) Neural pitch-shifting and time-stretching
JP6669081B2 (ja) 音声処理装置、音声処理方法、およびプログラム
KR102072627B1 (ko) 음성 합성 장치 및 상기 음성 합성 장치에서의 음성 합성 방법
Buron Generation of a 1000-word vocabulary for a pulse-excited vocoder operating as an audio response unit
Schwartz et al. Diphone synthesis for phonetic vocoding
JP3618217B2 (ja) 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体
JP4778402B2 (ja) 休止時間長算出装置及びそのプログラム、並びに音声合成装置
US5729657A (en) Time compression/expansion of phonemes based on the information carrying elements of the phonemes
JPH0225520B2 (ja)
US6934680B2 (en) Method for generating a statistic for phone lengths and method for determining the length of individual phones for speech synthesis
EP1589524B1 (en) Method and device for speech synthesis
EP1640968A1 (en) Method and device for speech synthesis
JP3241582B2 (ja) 韻律制御装置及び方法
JPH0358100A (ja) 規則型音声合成装置
Smith Production Rate and Weapon System Cost: Research Review, Case Studies, and Planning Model.
KR20240060961A (ko) 음성 데이터 생성 방법, 음성 데이터 생성 장치 및 컴퓨터로 판독 가능한 기록 매체
JPS63269200A (ja) 音声認識装置
JPS61259300A (ja) 音声合成方式