JPH0447840B2 - - Google Patents

Info

Publication number
JPH0447840B2
JPH0447840B2 JP58127999A JP12799983A JPH0447840B2 JP H0447840 B2 JPH0447840 B2 JP H0447840B2 JP 58127999 A JP58127999 A JP 58127999A JP 12799983 A JP12799983 A JP 12799983A JP H0447840 B2 JPH0447840 B2 JP H0447840B2
Authority
JP
Japan
Prior art keywords
speech
segment
pitch
syllable
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58127999A
Other languages
English (en)
Other versions
JPS6021098A (ja
Inventor
Takashi Yato
Takashi Miki
Makoto Morito
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP58127999A priority Critical patent/JPS6021098A/ja
Publication of JPS6021098A publication Critical patent/JPS6021098A/ja
Publication of JPH0447840B2 publication Critical patent/JPH0447840B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 (技術分野) 本発明は、自然有声音における1ピツチの音声
素片に相当する波形データを素片単位として記憶
しておき、合成すべき音声に関する入力情報に応
じて作成された素片単位選択情報の系列に従つて
その素片単位を編集再生することにより音声を合
成する方法に関し、特に、前記入力情報に応じて
作成されるピツチ周期の系列と前記素片単位選択
情報の系列とを良好な音韻性と良好な韻律性とを
保持しつつ対応づけるようにした音声合成方法に
関する。
(従来技術) 汎用的な目的で大量の語彙、もしくは人名、会
社名、地名といつた任意の音声の出力を必要とす
る装置の要求が高まつている。音声の波形を観測
すると、母音などの有音声の区間ではよく似た波
形が繰り返されているのが分かる。この周期をピ
ツチ周期と呼び、この1つの周期内の波形を1ピ
ツチ単位の音声素片という。この音声素片の内容
の変化が音韻性を表し、この周期の変化の時間的
パタンがアクセントを与え、韻律性に一要素を表
す。母音等の有声音区間では殆ど同じ形の波形が
繰り返され、同じ種類の音声では似た形の波形が
現われる。従つて、音声中に現われる波形の中で
音声を作り上げるために必要な特徴的音声素片波
形を記憶装置に蓄積しておき、これを読み出して
編集することにより任意の連続した音声を合成で
きると考えられる。
また、日本語の任意の文章は基本的に百数十種
の単音節で表すことができる。波形領域の合成に
おいて、記憶装置に格納された音声単位を素材と
して此等の韻律を適性に制御するためには、声の
高さ、振幅及び時間長を制御情報の辞書の指示に
従つて変化させながら連続音声を作り上げていく
必要がある。
任意語彙音声合成方法における音声の基本単位
としては、記憶容量と韻律性を考慮すると音声素
片を用いた方がよく、音韻的には単音節レベルよ
り大きい単位が優れていると考えられている。
この理由から音韻的には単音節を制御単位と
し、韻律の上では音声素片を制御単位とする方法
が提案されている。即ち、記憶装置に記憶されて
いる音声素片を単音節をブロツクとしてその内部
で順次的に配列しておく方法がある。この方法に
おいては、音声素片が単音節毎に時系列で連続に
取り出されることによつて音韻性が保たれ、ま
た、韻律の制御に当たつて音声素片を単位として
用いることが出来る。
(従来技術の問題点) ところで、このような波形領域の音声データを
用いた任意語彙合成方式ではピツチを制御するこ
とによつて1つの問題が生じる。
自然音声から切り出して記憶装置内に格納され
たある単音節波形が第1図aのごとくn個のピツ
チ素片波形の時系列で構成されているとする。ま
た、簡単のため、此等のn個の素片波形が全てP
なるピツチ周期を持つとすれば、この単音節の時
間長PHLaはP×nで与えられる。合成音に自然
性をもたせるためには、この単音節が用いられる
状況に応じて此等の素片波形に各々適性なピツチ
変化が与えられなければならないが、音声のピツ
チの変化幅はかなり大きく、女性音声の場合、最
短ピツチと最長ピツチとの間には1オクターブ以
上の差がある。従つて、例えば、第1図aの音素
データを用いてその標準的な場合の半分のピツチ
でこの単音節を合成したとすると合成波形は第1
図bのようになり、その継続時間PHLbも半分に
なる。
即ち、ピツチ制御を行うことによつて、継続時
間もそれに比例して変化する。本来、ピツチの変
化は声帯振動周期の変化を表し、継続時間の変化
は声道形状の変化状況を表すものと考えられ、互
いに多少の関係はあるもののほぼ分離したものと
見做せる。従つて、ピツチを変化させたとしても
継続時間に対するその他の変化要因がない限り継
続時間は一定に保たれるべきであつて、このよう
に音韻の継続時間が適正でない合成音は、テンポ
の乱れタイミングやリズムの不整を印象付ける。
また、ピツチ制御による影響は、継続時間の変
化のみではなく、音韻性にも大きな影響を与え
る。即ち、第1図aにおいては、時間長PHLaの
間で移り変つていた音韻の変化状況が第1図bに
おいてはその半分の時間内PHLbで集約されてし
まう。
従来、この種の合成装置ではピツチ制御による
継続時間への影響は一般的にあまり考慮されてい
ない。これに対して、音節内の後端部の素片を繰
り返し用いたり、削除してしまうことによつて、
音節全体の継続時間だけは一定に保つ方式は見ら
れるが、この方式でも音節内の音韻の変化速度と
いう点では何等解決するものではない。
(発明の目的) 本発明は、以上述べた従来技術の欠点を解決す
るために為されたものであり、合成時に与えられ
たピツチに対して、ピツチ毎の素片の開始時点に
於いて、当該区間が如何なる音韻を表現すべき区
間であるかを、記憶装置内に格納された標準音声
データを参照して判断し、合成時に用いる音素片
データを選択することによつて合成音の継続時間
と音韻性を適正に保つことを目的としたものであ
る。
(発明の概要) 第2図及び第3図は本発明による音声素片選択
方法を示す。第2図及び第3図における上側の図
は標準音声データを示すもので、ある音節或いは
音素等の音声単位がS1〜Soのn個の音声素片から
構成されているとする。此等の音声素片データ
は、音声素片データの時系列であると同時に、継
続時間TPHにおいて時々刻々変化する音韻性の時
系列を表している。即ち、音声素片Siは音声単位
全体の継続時間TPH内における時間ti-1〜tiの区間
の音韻性を表現するもので、この時間長Liを音声
素片Siの音韻長と名付け、音声単位を構成する音
声素片系列(S1〜So)と共に音韻長系列(L1
Lo)として、音声単位に関する標準音声データ
として記憶装置に格納しておく。
従来技術の第1図aのように自然音声から切り
出した単音節で、しかもピツチ周期毎の素片波形
を音声素片とした場合には、個々の1ピツチ波形
が音声素片Siに相当し、また、各1ピツチ波形の
ピツチ周期が音韻長Liに相当する。
音声単位合成時には与えられたピツチ周期にお
ける各音声素片の開始時点において、当該区間が
如何なる音韻性を表現すべき区間であるかを、記
憶装置内に記憶されている標準音声データと対比
して判断し、適切な音声素片を選択する。
第2図は標準音韻長よりも長いピツチ周期で合
成を行う場合を示し、第3図は標準音韻長よりも
短いピツチ周期で合成を行う場合の音声素片選択
方法を示している。
第2図において、音声単位の開始時点tP0はt0
対応するので、当然音声素片S1を用いて合成す
る。音声素片S1には、合成時のピツチ制御によつ
て音韻長L1より長いピツチ周期P1が与えられ、
次の音声素片の開始時点はtp1となる。ここで、
再び次ぎなる音声素片を選択する為に、標準音声
データを参照する。時刻tp1は、標準音声データ
に於いて音声素片S2が使用されるべき区間t1〜t2
であるから、音声素片S2が選択される。更に次の
音声素片の開始時点tp2では、順序からすると従
来の方法では音声素片S3が選択されるところであ
るが、本発明に於いては、標準音声データを参照
した時、時刻tp2は音声素片S4を表現すべき区間t3
〜t4であり、S3の次のS4を選択する。以後同様に
して各音声素片の開始時点tp1毎に使用する音声
素片を決定する。
一方、標準音韻長よりも短いピツチ周期で合成
を行う第3図の例では、はじめに音声素片S1を選
択して合成を行つた後、第2の素片開始時点tp1
は、ピツチ周期P1が標準音韻長L1よりも短いた
めにまだ音声素片S1を選択すべき区間t0〜t1にあ
る。このような場合には、音声素片S1を再び使用
する。
以上のように音声単位合成時に与えられたピツ
チ周期における各音声素片の開始時点において、
当該区間が如何なる音韻性を表現すべき区間であ
るかを記憶装置内に記憶されている標準音声デー
タと対比して判断し、適切な音声素片を選択する
ことによつて、合成時においてピツチを変化させ
た場合においても音韻性及び音声単位全体の継続
時間を適正に保つことが出来る。
(実施例) 第4図は本発明による音声合成装置の一例を示
したもので、マイクロプロセツサ1、タイプライ
タ2、韻律メモリ3、音節メモリ4、素片メモリ
5、波形再生器6から構成される。素片メモリ5
には任意の単語を合成するのに必要な音声素片デ
ータが格納されている。
この種の合成装置では大部分が女性音であるこ
とが要求されていることを考慮して、音声の標本
化周波数を8kHzとして女性音声のピツチ周期を
カバーするのに充分な64サンプルのデータ長とし
ている。
音節メモリ4は1音節を1ブロツクとして音節
を構成する音声素片データの先頭アドレスが順に
格納されており、更にその音節における各音声素
片の音韻長が格納されている。
韻律メモリ3には入力単語に対するアクセン
ト、イントネーシヨン等の韻律制御情報がコード
化されて記憶されている。以下、第4図に従つ
て、合成装置の動作を説明する。
先ず、タイプライタ2に対して出力すべき単語
の文字列が入力される。
マイクロプロセツサ1では、入力単語に対する
アクセント、イントネーシヨン等の韻律制御情報
を韻律メモリ3から検索する。韻律メモリ3から
検索される制御情報はアクセント型、イントネー
シヨン型等のコード形式になつており、マイクロ
プロセツサ1は此等の実際の制御データ、即ち区
間毎のピツチデータ、振幅データに変換する。
更にマイクロプロセツサ1は入力文字列を音節
に分解し、音節毎に音節メモリ4から各音節を構
成する音声素片の先頭アドレスと当該音声素片の
音韻長を順次入力する。このようにして得られた
アドレス及び制御データは其々編集合成のための
データとなる。
次に本発明の主旨である音声素片選択動作を第
5図のフローチヤートをもとに説明する。
本発明は基準となる音韻変化を表すデータを参
照することによつて合成時の音素データを選択す
るものであるが、音節メモリ4から読み出された
音声素片の先頭アドレス列とその各々に対応する
音韻長データが基準の音韻変化を表すデータとし
て用いられる。
第5図に於いて、PHNOは入力文字列を音節に
分解したときの音節数、PH(i)(i=1〜
PHNO)は、分解された各音節の各々に対応する
音節メモリ4のアドレス系列を一時的に格納する
配列、iは音節アドレス列を示すポインタ、
PHADは音節メモリ4を読み出す音節アドレス、
SNOは、合成すべき音節を構成している音声素片
の素片数を表す変数、S(j)は、音節メモリ4
から読み出した音声素片先頭アドレス系列を格納
する配列、L(j)は、音節メモリ4から読み出
した音韻長系列を格納する配列、P(j)は、合
成すべき音節に関して音韻長区間毎に生成された
ピツチ系列を格納する配列、jは前記配列S
(j),L(j),P(j)を指し示す素片ポインタ、
SADは現時点が如何なる音声素片を用いて合成す
べき区間か、即ち、使用すべき音声素片のアドレ
スを示す参照音声素片アドレスである。また、
CLはサンプリングクロツクにより音韻長を係数
する音韻長カウンタ変数、CPはサンプリングク
ロツクによりピツチを計数するピツチカウンタ変
数、CADは素片メモリ5から音声素片データを1
サンプルずつ読み出す音声素片読み出しアドレス
カウンタである。
ステツプSP1は合成開始時点における初期設定
を行うステツプで、各変数の初期化及び入力文字
列に応じて定まる音節アドレス系列PH(i)と
その数PHNOを設定する。
ステツプSP2では、センプリングクロツク毎の
音韻長を計数する音韻長カウンタ変数CLが0か
否かを判定して音韻長区間の終了判定を行う。即
ち、CL=0であれば素片ポインタjを進め(ス
テツプSP3)、更に後続のステツプSP10,SP11に
おいて参照音声素片アドレスSAD及び音韻長カウ
ンタ変数CLを更新する。但し、音韻長区間の終
了が音節区間あるいは単語区間の終了となる場合
があるため、ステツプSP4。ステツプSP6で其々
音節区間、単語区間の終了を判定している。
ステツプSP4で、音節区間が終了していれば
(j>SNO)音節ポインタiを進め(ステツプ
SP5)、次の音節の情報を音節メモリ4から読み
出して、素片数SNO、音声素片先頭アドレス列S
(j)音韻長系列L(j)、及びピツチ系列P(j)
を新たに設定する(ステツプSP7〜SP9)。
以上の一連の処理により参照音声素片アドレス
SADには、常にその時点において選択されるべき
標準の音声素片の先頭アドレスが設定される。
一方、ステツプSP12以降の処理では、前記音
韻長計数による参照音声素片アドレス更新処理
と、同一サンプルクロツク内で平行して行われる
ピツチ周期毎の音声素片開始時点での音声素片の
選択処理が行われる。
ステツプSP12ではサンプリングクロツク毎に
ピツチ周期を計数するピツチカウンタCPが0か
否かを判定し、CP=0であれば、次の合成に用
いる音声素片の先頭アドレスを参照音声素片アド
レスSADを参照して、音声素片読み出しアドレス
カウンタCADにセツトする。
ステツプSP15,SP16では音声素片読み出しア
ドレスカウンタCADに従つて、素片メモリ5から
音声素片データを1サンプルずつ読み出し、波形
再生を行う。
ステツプSP12〜SP17の一連の処理は、1サン
プルクロツク毎に行われるもので、最後のステツ
プSP17で、CADのインクリメント及びCL,CPのデ
クリメントを行う。
(発明の効果) 以上、詳細に説明したように、本発明によれば
音素波形再生時における各ピツチ周期の音声素片
の開始時点において、当該区間が如何なる音韻を
表現すべき区間であるかを、標準データを参照す
ることによつて逐一判定し、適切な音声素片を選
択するようにしている為、如何なるピツチ周期に
対しても合成音の継続時間及び音韻性が常に良好
に保たれ自然は合成音声を得ることが出来る。従
つて、本発明の方法を波形領域の任意語彙合成装
置に適用することにより、自然な合成音を得るこ
とが出来るという効果がある。
【図面の簡単な説明】
第1図は、波形領域合成における音韻性と韻律
性との対応関係を示す図、第2図と第3図は本発
明における音声素片とピツチ周期との対応関係を
示す説明図、第4図は本発明の一実施例を示すブ
ロツク図、第5図は音声素片選択の処理手順を示
す図である。 1……マイクロプロセツサ、2……タイプライ
タ、3……韻律メモリ、4……単音節メモリ、5
……素片メモリ、6……波形再生器。

Claims (1)

  1. 【特許請求の範囲】 1 自然音声における1ピツチ単位の音声素片に
    相当するデータを素片単位として多数記憶してお
    き、前記素片単位が音韻、音節、あるいは単語等
    の一連の音声区間(音声単位)毎に時系列で連続
    して取り出される機能を備え、前記素片単位のデ
    ータを読み出して編集再生することによつて音声
    を合成する音声合成方法において、 前記音声単位は、素片単位の時系列Si(i=1,
    2,……)と、自然音声を基準として定めた前記
    素片単位の時系列に対応する音韻長系列Li(i=
    1,2,……)とで表され、 音声合成に際しては、前記音韻長Liを係数する
    毎に合成に使用すべき素片単位を順次更新する手
    段と、 合成時に与えられたピツチ周期を係数する毎に
    合成すべき素片単位を選択する手段を有すること
    を特徴とする音声合成方法。
JP58127999A 1983-07-15 1983-07-15 音声合成方法 Granted JPS6021098A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58127999A JPS6021098A (ja) 1983-07-15 1983-07-15 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58127999A JPS6021098A (ja) 1983-07-15 1983-07-15 音声合成方法

Publications (2)

Publication Number Publication Date
JPS6021098A JPS6021098A (ja) 1985-02-02
JPH0447840B2 true JPH0447840B2 (ja) 1992-08-05

Family

ID=14973950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58127999A Granted JPS6021098A (ja) 1983-07-15 1983-07-15 音声合成方法

Country Status (1)

Country Link
JP (1) JPS6021098A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6022195A (ja) * 1983-07-18 1985-02-04 沖電気工業株式会社 音声合成方法
JP3673471B2 (ja) 2000-12-28 2005-07-20 シャープ株式会社 テキスト音声合成装置およびプログラム記録媒体

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5197303A (ja) * 1975-02-21 1976-08-26
JPS55111995A (en) * 1979-02-20 1980-08-29 Sharp Kk Method and device for voice synthesis

Also Published As

Publication number Publication date
JPS6021098A (ja) 1985-02-02

Similar Documents

Publication Publication Date Title
JP3985814B2 (ja) 歌唱合成装置
US5659664A (en) Speech synthesis with weighted parameters at phoneme boundaries
JP5560769B2 (ja) 音素符号変換装置および音声合成装置
JP5360489B2 (ja) 音素符号変換装置および音声合成装置
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
JPH0447840B2 (ja)
WO2004027753A1 (en) Method of synthesis for a steady sound signal
GB2284328A (en) Speech synthesis
JP3233036B2 (ja) 歌唱音合成装置
JP7183556B2 (ja) 合成音生成装置、方法、及びプログラム
JPH1165597A (ja) 音声合成装置、音声合成及びcg合成出力装置、ならびに対話装置
JP3081300B2 (ja) 残差駆動型音声合成装置
JPS5914752B2 (ja) 音声合成方式
Bonada et al. Sample-based singing voice synthesizer using spectral models and source-filter decomposition.
JPH0895588A (ja) 音声合成装置
JP2001117576A (ja) 音声合成方法
JPH06250685A (ja) 音声合成方式および規則合成装置
JPH04280B2 (ja)
JP2004004440A5 (ja)
JPH0572599B2 (ja)
O'Shaughnessy Recent progress in automatic text-to-speech synthesis
JPS60113299A (ja) 音声合成装置
JPS5912189B2 (ja) 音声合成装置
JPH06149291A (ja) 信号再生装置
JPH03296100A (ja) 音声合成装置