JPH0115880B2 - - Google Patents

Info

Publication number
JPH0115880B2
JPH0115880B2 JP56064633A JP6463381A JPH0115880B2 JP H0115880 B2 JPH0115880 B2 JP H0115880B2 JP 56064633 A JP56064633 A JP 56064633A JP 6463381 A JP6463381 A JP 6463381A JP H0115880 B2 JPH0115880 B2 JP H0115880B2
Authority
JP
Japan
Prior art keywords
pitch
frame
initialization
digital filter
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56064633A
Other languages
English (en)
Other versions
JPS57179899A (en
Inventor
Sumio Fujita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Instruments Inc
Original Assignee
Seiko Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Instruments Inc filed Critical Seiko Instruments Inc
Priority to JP56064633A priority Critical patent/JPS57179899A/ja
Priority to GB8211983A priority patent/GB2097636B/en
Priority to US06/372,282 priority patent/US4520502A/en
Priority to CH2602/82A priority patent/CH648945A5/fr
Publication of JPS57179899A publication Critical patent/JPS57179899A/ja
Publication of JPH0115880B2 publication Critical patent/JPH0115880B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Analogue/Digital Conversion (AREA)

Description

【発明の詳細な説明】 本発明は、PARCOR方式で代表される線形予
測符号方式の音声分析合成手法に基づく音声合成
に関する。
音声合成装置で合成に必要な1フレームの合成
パラメータは、振幅・ピツチ・リピート回数・有
音声/無音声識別・PARCOR係数等であつて、
フレーム間の合成パラメータのつながりを滑らか
にする為、補間処理を行ない、良好な合成音質を
得ていることは特願昭56−011871の通りである。
上記合成パラメータを用いて合成音声を発生さ
せる演算部がデイジタルフイルタ部である。この
デイジタルフイルタ部が演算を開始するにあた
り、前フレームの演算データがデイジタルフイル
タ部内に残つていると今後の演算に悪い影響を出
てしまう。具体的に言うと、このデイジタルフイ
ルタの出力をD−A変換器を介して音声として聞
くならば、期待している音声にはならず、雑音の
多い聞きずらい音になつてしまう。上記の理由に
よつて、フレームの最初では必ずデイジタルフイ
ルタは初期化されていなければならない。
この初期化により前フレームに影響されない新
たなフレーム演算が開始されることになる。
補間とは有声音のフレームと有声音のフレーム
が続く場合に、前フレームの合成パラメータを時
間的変化に伴なつて後フレームの合成パラメータ
に近づけることである。この補間によつて、音声
の滑らかなつながりが得られるはずである。しか
し本音声合成装置にみられるような1ピツチを基
本としてフレームを構成しているピツチ同期式分
析合成装置においては、フレームの最初に遅延回
路を零にするフレームの初期化(フレームイニシ
ヤライズ)だけでは相隣るフレームのつながりに
不自然さが現われることがある。このような現象
をもつ「ことば」もしくは「文章」を聞いた場
合、不自然で聞きずらいものとなつてしまう。こ
の不自然なつながりをもつフレームをなくすた
め、ピツチ同期式方析合成装置では、ピツチ周期
毎に初期化(ピツチイニシヤライズ)を行ない、
相隣るフレームのつながりをよくしている。この
ことによりフレームイニシヤライズしたものより
も聴覚上「ことば」の自然さが増し、原音声によ
り近くなる効果がある。
以下にフレームイニシヤライズとピツチイニシ
ヤライズの音声波形をもつて本発明の実施例を説
明する。
第1図は本音声分析合成装置の要部である合成
回路のブロツク図である。
第1図はシフト回路14で構成されるフレーム
間隔を求める回路部、カウンタ23、ピツチ位相
検出回路30で構成されるピツチ周期発生回路、
AMP補間回路20、切換スイツチ21、メモリ
22、及びPARCOR係数補間回路17、補間値
メモリ18、切換スイツチ19,27等で構成さ
れる補間する回路部、カウンタ23、及びシフト
回路14,15、カウンタ16で構成される補間
タイミング信号発生回路部、さらにデイジタルフ
イルタ部5等で構成される合成部とで構成されて
いる。ピツチ周期発生回路は、メモリ10b中の
PITCHデータが格納されているプリセツタブル
ダウンカウンタ23と、前記カウンタの出力信号
でPITCH時間経過する毎に出力されているカウ
ントアツプ信号C2を検出し、デイジタルフイル
タ部5の動作に同期させてイニシヤライズ信号を
発生させているピツチ位相検出回路30とから構
成されている。
他の構成の詳しい機能および動作は、特願昭56
−011871号に記載する通りである。
第2図は第1図のデイジタルフイルタ部5の一
実施例であり、1段あたり2個の乗算器51と2
個の加算器52と1個の遅延回路53で構成され
た10段のデイジタルフイルタになつている。イニ
シヤライズ信号として入力されるものは、フレー
ムイニシヤライズの場合はREPEAT用カウンタ
3からの信号C3であり、ピツチイニシヤライズ
の場合はPITCH用カウンタ23とピツチ位相検
出回路30とからなるピツチ周期発生回路からの
信号C4である。この信号により遅延回路53は
リセツトされ、デイジタルフイルタ内の初期状態
が決まることになる。
第3図、第4図は「私は」の音声波形で「−S
−i−」の部分を抜き出した図である。第3図は
フレームイニシヤライズ、第4図はピツチイニシ
ヤライズしたものである。第5図は第3図、第4
図の波形を合成させる為の合成パラメータであ
る。「S」の無声音のフレームは図から省略され
ている。1ピツチとは波形101,103に相当
する1周期の波形である。1フレームとは波形1
02,104に相当し、1ピツチの波形がリピー
ト回数だけ集まつたものである。次に合成パラメ
ータと対応させてみる。波形101はフレーム1
02の最初の1ピツチであるので、回路的には第
2図で示すイニシヤライズ信号が入力され遅延回
路53は初期状態になつていて、前フレームの演
算データに影響されない為に第3図、第4図とも
に同じ波形になつている。同じことが次フレーム
104の1ピツチの波形103についても言え
る。また、フレーム102の各ピツチの波形が次
第に大きくなつていくのは、振幅、PARCOR係
数が次フレーム104の振幅、PARCOR係数が
次フレーム104の振幅、PARCOR係数に向か
つて直線的に補間されているために現われる現象
である。さて、第3図はフレームイニシヤライズ
であるため、最初の1ピツチの波形101以後、
7ピツチ分の間はデイジタルフイルタ部5の遅延
回路53にイニシヤライズ信号は入らない。波形
101のあとに続く7ピツチ分の音声波形は常に
前ピツチ波形の演算データを使つて合成を実行し
ていることになる。すなわち、遅延回路53に蓄
積された上記演算データがリセツトされないで演
算されるために誤差となつて徐々に重なつてい
き、補間していつた最後のピツチの波形と次フレ
ーム104の最初の1ピツチ波形103とがつな
がりの悪い波形になつてしまう。第4図はピツチ
イニシヤライズであるので、遅延回路53にはピ
ツチ周期毎にイニシヤライズ信号が入る。従つて
波形101に続く7ピツチ分の音声波形は遅延回
路53に蓄積された上記演算データが使われてい
ないことになる。これにより誤差の積み重なりが
なくなり、次フレーム104の最初の1ピツチ波
形103に滑らかにつながつていく。
さらに顕著な実施例が第6図と第7図である。
第6図はフレームイニシヤライズ、第7図はピツ
チイニシヤライズしたものである。これは「セイ
コー」の「−i−」であつて、合成パラメータは
第8図に揚げてある。フレームイニシヤライズの
第6図に注目すると、ピツチ2.6ミリ秒の音声波
形105(順次補間されている。)が4回きたあ
と、次フレーム108とのつながりがよくない。
これは第3図と同様の現象である。さらに、合成
パラメータの第8図で、次フレーム108と次々
フレーム110の振幅に注目されたい。振幅82か
ら振幅52と小さくなつている。フレーム108の
補間を行なうと波形が徐々に小さくなることは感
覚的にもわかる。すなわちピツチイニシヤライズ
を行なつている第7図弐の音声波形になる。とこ
ろがフレームイニシヤライズの第6図では全く逆
の現象になつてしまう。従つてフレームイニシヤ
ライズの音声「セイコー」は自然さが欠けた、聞
きづらいものになる。
以上のことからピツチ同期式分析合成器におい
ては、ピツチイニシヤライズすることによつて、
より原音声に近い合成音声を発生させる効果があ
る。なお、本文で用いている「PARCOR係数」
とは、正確には、反射係数と呼ばれるもので、
PARCOR係数とは絶対値が等しく符号が反対で
ある。
【図面の簡単な説明】
第1図は本発明に係る音声分析合成装置のブロ
ツク図である。第2図はデイジタルフイルタの一
実施例である。第3図はフレームイニシヤライズ
による合成音声波形を示す。第4図はピツチイニ
シヤライズによる合成音声波形を示す。第3図と
第4図の横軸方向すなわち時間軸は合致してお
り、同じ合成パラメータを使用している。第5図
は、第3図・第4図の合成音声波形合成パラメー
タを示す。第6図はフレームイニシヤライズによ
る合成音声波形を示す。第7図はピツチイニシヤ
ライズによる合成音声波形を示す。第6図と第7
図の横軸方向すなわち時間軸は合致しており、同
じ合成パラメータを使用している。第8図は、第
6図・第7図の合成音声波形の合成パラメータを
示す。 1……スピーカ、4……バスライン、17……
PARCOR係数補間回路、18……補間値メモリ、
23……プリセツタブルダウンカウンタ、30…
…ピツチ位相検出回路、Tf……フレーム間隔、
△t……補間周期、C4……イニシヤライズ信
号、51……乗算器、52……加算器、53……
遅延回路。

Claims (1)

  1. 【特許請求の範囲】 1 線形予測符号化方式の音声合成手法に基づく
    音声合成装置であつて、原音声の1ビツチを基本
    時間とし、かつほぼ同一波形の繰返しをリピート
    回数として与え(1ピツチ)×(リピート回数)を
    1フレーム長とする可変長フレーム方式とし、与
    えられる音声データ中のピツチデータとリピート
    回数からフレーム間隔を求める回路部と、合成パ
    ラメータを補間する回路部と、補間タイミング信
    号を発生する回路部と、前記合成パラメータに基
    づいて音声合成(演算)を実行するデイジタルフ
    イルタ部とを有する音声合成装置において、ピツ
    チ周期毎にデイジタルフイルタ部を初期化するこ
    とを特徴とする音声合成装置。 2 前記初期化は、ピツチ周期発生回路から生じ
    るイニシヤライズ信号を、前記デイジタルフイル
    タ部の遅延回路に与え、前記遅延回路をリセツト
    することによつて行なうことを特徴とする特許請
    求の範囲第1項記載の音声合成装置。
JP56064633A 1981-04-28 1981-04-28 Voice synthesizer Granted JPS57179899A (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP56064633A JPS57179899A (en) 1981-04-28 1981-04-28 Voice synthesizer
GB8211983A GB2097636B (en) 1981-04-28 1982-04-26 Speech synthesizer
US06/372,282 US4520502A (en) 1981-04-28 1982-04-27 Speech synthesizer
CH2602/82A CH648945A5 (fr) 1981-04-28 1982-04-28 Synthetiseur de paroles.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56064633A JPS57179899A (en) 1981-04-28 1981-04-28 Voice synthesizer

Publications (2)

Publication Number Publication Date
JPS57179899A JPS57179899A (en) 1982-11-05
JPH0115880B2 true JPH0115880B2 (ja) 1989-03-20

Family

ID=13263862

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56064633A Granted JPS57179899A (en) 1981-04-28 1981-04-28 Voice synthesizer

Country Status (4)

Country Link
US (1) US4520502A (ja)
JP (1) JPS57179899A (ja)
CH (1) CH648945A5 (ja)
GB (1) GB2097636B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2130852B (en) * 1982-11-19 1986-03-12 Gen Electric Co Plc Speech signal reproducing systems
JP3219093B2 (ja) * 1986-01-03 2001-10-15 モトロ−ラ・インコ−ポレ−テッド 外部のボイシングまたはピッチ情報を使用することなく音声を合成する方法および装置
US5933808A (en) * 1995-11-07 1999-08-03 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for generating modified speech from pitch-synchronous segmented speech waveforms
US6240384B1 (en) 1995-12-04 2001-05-29 Kabushiki Kaisha Toshiba Speech synthesis method

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3109070A (en) * 1960-08-09 1963-10-29 Bell Telephone Labor Inc Pitch synchronous autocorrelation vocoder
US4344148A (en) * 1977-06-17 1982-08-10 Texas Instruments Incorporated System using digital filter for waveform or speech synthesis
JPS5650398A (en) * 1979-10-01 1981-05-07 Hitachi Ltd Sound synthesizer
NL8000361A (nl) * 1980-01-21 1981-08-17 Philips Nv Inrichting en werkwijze voor het opwekken van een spraaksignaal.

Also Published As

Publication number Publication date
JPS57179899A (en) 1982-11-05
GB2097636B (en) 1984-11-28
CH648945A5 (fr) 1985-04-15
GB2097636A (en) 1982-11-03
US4520502A (en) 1985-05-28

Similar Documents

Publication Publication Date Title
Verfaille et al. Adaptive digital audio effects (A-DAFx): A new class of sound transformations
Laroche et al. Improved phase vocoder time-scale modification of audio
US3982070A (en) Phase vocoder speech synthesis system
US5933808A (en) Method and apparatus for generating modified speech from pitch-synchronous segmented speech waveforms
CA1065490A (en) Emphasis controlled speech synthesizer
WO2009034167A1 (en) Audio signal transforming
KR20080001708A (ko) 통신 시스템에서 은닉 프레임들을 발생시키는 방법
JPWO2011004579A1 (ja) 声質変換装置、音高変換装置および声質変換方法
JP3430985B2 (ja) 合成音生成装置
JP3732793B2 (ja) 音声合成方法、音声合成装置及び記録媒体
JPH0115880B2 (ja)
JP2699629B2 (ja) 楽音信号生成装置
JPS642960B2 (ja)
JPH10116088A (ja) 効果付与装置
KR100417092B1 (ko) 음성합성 방법
JPS5925239B2 (ja) パラメ−タ補間方式
JPH0518117B2 (ja)
JP3083830B2 (ja) 音声の発声時間長制御方法および装置
JPH04104200A (ja) 音声速度変換装置と音声速度変換方法
JP3206128B2 (ja) ループ波形生成装置及びループ波形生成方法
WO2017098307A1 (zh) 基于谐波模型和声源-声道特征分解的语音分析合成方法
JPS6036597B2 (ja) 音声合成装置
JP3206129B2 (ja) ループ波形生成装置及びループ波形生成方法
JPS6098498A (ja) 音声合成装置
JP3237226B2 (ja) ループ波形生成装置及びループ波形生成方法