JPH0439698A - 音声合成装置 - Google Patents
音声合成装置Info
- Publication number
- JPH0439698A JPH0439698A JP2148231A JP14823190A JPH0439698A JP H0439698 A JPH0439698 A JP H0439698A JP 2148231 A JP2148231 A JP 2148231A JP 14823190 A JP14823190 A JP 14823190A JP H0439698 A JPH0439698 A JP H0439698A
- Authority
- JP
- Japan
- Prior art keywords
- synthesis
- speech
- text
- parameter
- synthesis parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は 音声合成装置に関するものであ4従来の技術
従来の音声合成装置としてζよ 例えは 古井:ディジ
タル音声処理p、146(東海大学出版会 1985)
に示されていも 第1図はこの従来の音声合成装置およ
び本発明実施例1の構成を示すブロック図であも 1は
文字列入力端で漢字かな混じり文が入力されム 2はテ
キスト解析部で、入力された漢字かな混じり文は辞書3
を用いて単語に分割され 各々の読み・アクセント型・
品詞等が付与されも 4は韻律制御部で、各単語・付属
語のアクセント型から文節のアクセント型の決定 ポー
ズ位置や文全体のイントネーション等の決定を規則によ
り行う。 5は音韻制御部で、テキスト解析部で得られ
た読みに対し 母音の無声化や鼻音化処凰 仮名表記と
発声表記の異なる場合等の処理(「私は」の「は」は「
わ」と発声される)を行(\ 音声表記を得ム 6は合
成パラメータ作成部で、韻律情報や音声表記情報から合
成に必要な合成パラメータ列を得も 合成パラメータと
は音の高さを決める基本周波数 音声の大きさを決める
復線 声道の状態を決める声道記述パラメータ(PAR
COR係数やホルマント周波数など)、声帯の状態を決
める有声/無声判定フラグ等があり、パラメータテーブ
ル7に格納されていも ここでは 従来例・実施例とも
へ 基本周波数付与には藤崎モデ/k 合成器として
、直・並列型ホルマント合成器を用いも 藤崎モデルに
ついて(よ例えば 藤崎他: 音響学会誌vo1.27
no、9 pp、445−pp456(1971
) ニ解説されティ、4 また 直・並列型ホルマ
ント合成器については 例えζL アレン エト アル
著 70ム テキスト トウ スピーチ : サゝ エ
ムアイ トーク システム(ケン7ゝリッジ′ユニハゝ
−シディ 7°レス 1987) (Alien
et al著From Text to 5peec
h: The MITalk system第12章(
Cambridge Univercity Pres
s 1987 ))に解説されていム 8はパラメータ
補間部で、パラメータテーブル7で得られた各音素毎の
パラメータを補間して一定時間毎の合成パラメータ列を
得も 9は音声合成部で、 8で得られた合成パラメー
タ列から実際の音声を合成し 合成音声出力端10に音
声波形を得る。
タル音声処理p、146(東海大学出版会 1985)
に示されていも 第1図はこの従来の音声合成装置およ
び本発明実施例1の構成を示すブロック図であも 1は
文字列入力端で漢字かな混じり文が入力されム 2はテ
キスト解析部で、入力された漢字かな混じり文は辞書3
を用いて単語に分割され 各々の読み・アクセント型・
品詞等が付与されも 4は韻律制御部で、各単語・付属
語のアクセント型から文節のアクセント型の決定 ポー
ズ位置や文全体のイントネーション等の決定を規則によ
り行う。 5は音韻制御部で、テキスト解析部で得られ
た読みに対し 母音の無声化や鼻音化処凰 仮名表記と
発声表記の異なる場合等の処理(「私は」の「は」は「
わ」と発声される)を行(\ 音声表記を得ム 6は合
成パラメータ作成部で、韻律情報や音声表記情報から合
成に必要な合成パラメータ列を得も 合成パラメータと
は音の高さを決める基本周波数 音声の大きさを決める
復線 声道の状態を決める声道記述パラメータ(PAR
COR係数やホルマント周波数など)、声帯の状態を決
める有声/無声判定フラグ等があり、パラメータテーブ
ル7に格納されていも ここでは 従来例・実施例とも
へ 基本周波数付与には藤崎モデ/k 合成器として
、直・並列型ホルマント合成器を用いも 藤崎モデルに
ついて(よ例えば 藤崎他: 音響学会誌vo1.27
no、9 pp、445−pp456(1971
) ニ解説されティ、4 また 直・並列型ホルマ
ント合成器については 例えζL アレン エト アル
著 70ム テキスト トウ スピーチ : サゝ エ
ムアイ トーク システム(ケン7ゝリッジ′ユニハゝ
−シディ 7°レス 1987) (Alien
et al著From Text to 5peec
h: The MITalk system第12章(
Cambridge Univercity Pres
s 1987 ))に解説されていム 8はパラメータ
補間部で、パラメータテーブル7で得られた各音素毎の
パラメータを補間して一定時間毎の合成パラメータ列を
得も 9は音声合成部で、 8で得られた合成パラメー
タ列から実際の音声を合成し 合成音声出力端10に音
声波形を得る。
発明が解決しようとする課題
音声規則合成装置を表 WP文章の読み合わせや公共案
内放送等いろいろな分野で利用されっつあム 合成され
た音声の内容が理解できるという明瞭性の観点からは
実用化レベルにあるといえるカミ 自然性といった品質
の観点からはまだまだレベルは低いといわざるを得なし
も 自然性が低1.X。
内放送等いろいろな分野で利用されっつあム 合成され
た音声の内容が理解できるという明瞭性の観点からは
実用化レベルにあるといえるカミ 自然性といった品質
の観点からはまだまだレベルは低いといわざるを得なし
も 自然性が低1.X。
言い替えれば非常に機械的な音声になってしまう一つの
要因は 合成音声が非常に単調であることが考えられも
ある一定の韻律で合成されるために変化の乏しい機械
的な品質となるのである。本発明ζ戴 かかる従来技術
の課題に鑑みてなされたもので、合成規則に色々の変化
をもたせることにより、合成品質の改良をはかるもので
あム例えば 「それζよ 牛です。」 「それは 男k
」という2つの文章の第2文節のアクセント核(アクセ
ントのある音節位置)について考えた場合、ともに「う
しで′す」 「おとこ′だ」と4モ一ラ文節で3モーラ
目にアクセントのある形となり、従来の規則合成装置で
は全く同じイントネーションで発声されることになも
しかしなが収 前者の文の場合はアクセント核を持つ語
が「です」という付属語であり、後者の文でζよ 「男
」という自立語にアクセント核が存在し 同じイントネ
ーションにはならなしも 請求項1に記載の発明はかかる従来技術の課題に鑑みて
なされたもので、合成する文章のアクセント核の存在す
る語の品詞に応じて合成パラメータを制御することによ
り、変化に富んだ自然性の高い合成音を提供することを
目的としていもまた 規則合成装置は合成フレーム長(
10m5ec〜30m5ecで合成器によって一定に決
まっている)内で41 定常と仮定して合成処理を行
う力(実際の音声では化なりのゆらぎを含む。例えは2
50Hzの高さで「あ」という音を合成する場合、ピッ
チを250Hzで固定して合成したので3表ブザーのよ
うな音となり自然性が損なわれも そこでゆらぎを付加
して自然性を向上させる力(定のゆらぎ付与ではやはり
不自然な合成音となム請求項2に記載の発明はかかる従
来技術の課題に鑑みてなされたもので、揺らぎ付与手段
を有し合成パラメータの振幅に応じてゆらぎ成分の大き
さを制御することにより、変化に富んだ自然性の高い合
成音を提供することを目的としていもまた 各音素の時
間長や音程(イントネーション)に関する合成パラメー
タを作成する基準となる発声速度や基準基本周波数1よ
可変であるが文章あるいは文節ごとに基準値を設定す
るのは煩雑であるので、 1つの文章・段落等では同じ
値が用いられていも 請求項3に記載の発明はかかる従来技術の課題に鑑みて
なされたもので、合成パラメータ作成時に発声速度等の
基準値を自動的に変化させることにより、変化に富んだ
自然性の高い合成音を提供することを目的としていも 課題を解決するための手段 (1)文字列もしくは記号列(以後テキストという)を
入力するテキスト入力手段と、前記入力手段から入力さ
れたテキストを解析するテキスト解析手段と、前記テキ
スト解析手段で参照する辞書情報格納手段と前記テキス
ト解析手段の結果に従って合成パラメータを作成する合
成パラメータ作成手段と、前記合成パラメータから音声
を合成する音声合成手段を有し 前記パラメータ作成手
段部(友 前記テキスト解析手段から得られるアクセン
ト核を有する語の品詞情報にしたがって合成パラメータ
を制御する音声合成装置を構成すも(2)文字列もしく
は記号列(以後テキストという)を入力するテキスト入
力手段と、前記入力手段から入力されたテキストを解析
するテキスト解析手段と、前記テキスト解析手段で参照
する辞書情報格納手段と前記テキスト解析手段の結果に
従って合成パラメータを作成する合成パラメータ作成手
段と、前記合成パラメータにゆらぎを与えるゆらぎ付与
手段と前記合成パラメータから音声を合成する音声合成
手段を有し 前記揺らぎ付与手段では前記合成パラメー
タ作成手段で獲られた振幅情報にしたがって揺らぎ成分
を制御する音声合成装置を構成すも (3)文字列もしくは記号列(以後テキストという)を
入力するテキスト入力手段と、前記入力手段から入力さ
れたテキストを解析するテキスト解析手段と、前記テキ
スト解析手段で参照する辞書情報格納手段と、前記テキ
スト解析手段の結果に従って合成パラメータを作成する
合成パラメータ作成手段と、前記合成パラメータから音
声を合成する音声合成手段を有し 前記合成パラメータ
作成手段ζよ 基準値を選択する手段を含む音声合成装
置を構成すも 作用 上記の構成により、アクセント核のある語の品詞情報や
振幅情報により、合成パラメータや揺らぎ成分を制御し
また合成パラメータ作成の基準値を制御することによ
り、変化に富んだ自然性の高い合成音を提供すム 実施例1 第1図(よ 請求項1に記載の発明の一実施例における
音声合成装置の構成を示すブロック図であム これ(友
従来例共通であるので各ブロックに関する説明は割愛
すも 各処理の詳細について実例を用いて説明すも 「
これこそ音声合成です。」という文章が入力された場合
について考えも テキスト解析部2により入力文章は以
下のように分割され アクセントや読みの情報を得も(
入力文章)「これこそ音声合成です。」(単語分割)
これ/こそ/音声/合成/です。
要因は 合成音声が非常に単調であることが考えられも
ある一定の韻律で合成されるために変化の乏しい機械
的な品質となるのである。本発明ζ戴 かかる従来技術
の課題に鑑みてなされたもので、合成規則に色々の変化
をもたせることにより、合成品質の改良をはかるもので
あム例えば 「それζよ 牛です。」 「それは 男k
」という2つの文章の第2文節のアクセント核(アクセ
ントのある音節位置)について考えた場合、ともに「う
しで′す」 「おとこ′だ」と4モ一ラ文節で3モーラ
目にアクセントのある形となり、従来の規則合成装置で
は全く同じイントネーションで発声されることになも
しかしなが収 前者の文の場合はアクセント核を持つ語
が「です」という付属語であり、後者の文でζよ 「男
」という自立語にアクセント核が存在し 同じイントネ
ーションにはならなしも 請求項1に記載の発明はかかる従来技術の課題に鑑みて
なされたもので、合成する文章のアクセント核の存在す
る語の品詞に応じて合成パラメータを制御することによ
り、変化に富んだ自然性の高い合成音を提供することを
目的としていもまた 規則合成装置は合成フレーム長(
10m5ec〜30m5ecで合成器によって一定に決
まっている)内で41 定常と仮定して合成処理を行
う力(実際の音声では化なりのゆらぎを含む。例えは2
50Hzの高さで「あ」という音を合成する場合、ピッ
チを250Hzで固定して合成したので3表ブザーのよ
うな音となり自然性が損なわれも そこでゆらぎを付加
して自然性を向上させる力(定のゆらぎ付与ではやはり
不自然な合成音となム請求項2に記載の発明はかかる従
来技術の課題に鑑みてなされたもので、揺らぎ付与手段
を有し合成パラメータの振幅に応じてゆらぎ成分の大き
さを制御することにより、変化に富んだ自然性の高い合
成音を提供することを目的としていもまた 各音素の時
間長や音程(イントネーション)に関する合成パラメー
タを作成する基準となる発声速度や基準基本周波数1よ
可変であるが文章あるいは文節ごとに基準値を設定す
るのは煩雑であるので、 1つの文章・段落等では同じ
値が用いられていも 請求項3に記載の発明はかかる従来技術の課題に鑑みて
なされたもので、合成パラメータ作成時に発声速度等の
基準値を自動的に変化させることにより、変化に富んだ
自然性の高い合成音を提供することを目的としていも 課題を解決するための手段 (1)文字列もしくは記号列(以後テキストという)を
入力するテキスト入力手段と、前記入力手段から入力さ
れたテキストを解析するテキスト解析手段と、前記テキ
スト解析手段で参照する辞書情報格納手段と前記テキス
ト解析手段の結果に従って合成パラメータを作成する合
成パラメータ作成手段と、前記合成パラメータから音声
を合成する音声合成手段を有し 前記パラメータ作成手
段部(友 前記テキスト解析手段から得られるアクセン
ト核を有する語の品詞情報にしたがって合成パラメータ
を制御する音声合成装置を構成すも(2)文字列もしく
は記号列(以後テキストという)を入力するテキスト入
力手段と、前記入力手段から入力されたテキストを解析
するテキスト解析手段と、前記テキスト解析手段で参照
する辞書情報格納手段と前記テキスト解析手段の結果に
従って合成パラメータを作成する合成パラメータ作成手
段と、前記合成パラメータにゆらぎを与えるゆらぎ付与
手段と前記合成パラメータから音声を合成する音声合成
手段を有し 前記揺らぎ付与手段では前記合成パラメー
タ作成手段で獲られた振幅情報にしたがって揺らぎ成分
を制御する音声合成装置を構成すも (3)文字列もしくは記号列(以後テキストという)を
入力するテキスト入力手段と、前記入力手段から入力さ
れたテキストを解析するテキスト解析手段と、前記テキ
スト解析手段で参照する辞書情報格納手段と、前記テキ
スト解析手段の結果に従って合成パラメータを作成する
合成パラメータ作成手段と、前記合成パラメータから音
声を合成する音声合成手段を有し 前記合成パラメータ
作成手段ζよ 基準値を選択する手段を含む音声合成装
置を構成すも 作用 上記の構成により、アクセント核のある語の品詞情報や
振幅情報により、合成パラメータや揺らぎ成分を制御し
また合成パラメータ作成の基準値を制御することによ
り、変化に富んだ自然性の高い合成音を提供すム 実施例1 第1図(よ 請求項1に記載の発明の一実施例における
音声合成装置の構成を示すブロック図であム これ(友
従来例共通であるので各ブロックに関する説明は割愛
すも 各処理の詳細について実例を用いて説明すも 「
これこそ音声合成です。」という文章が入力された場合
について考えも テキスト解析部2により入力文章は以
下のように分割され アクセントや読みの情報を得も(
入力文章)「これこそ音声合成です。」(単語分割)
これ/こそ/音声/合成/です。
(読み) コレ コツ オンセ
ー コ゛−セー テ゛ス(アクセント)OD
1 0 b(品詞) 代名 副動 名
名 助動ここで、 「こそ」 「です」に対して与え
られているアクセント型りやbier、NHKアクセン
ト辞典・解説付録(日本放送出版会 1985年)に記
載されているもので、自立語と結合して文節を構成する
際の結合アクセント型を示したものであム また 各単
語のアクセント型(よ アクセントのある音節位置を示
したものであム 次に韻律処理部5で、ポーズ位置や文節のアクセント瓢
文全体のイントネーションを決定すも「これこ″そ(
ポーズ)おんせ−ご°−せ−です」とな4 すなわち第
1文節は4モーラ3型で付属語にアクセント核が存在し
第2文節は10モーラ5型で自立語にアクセント核が
存在すも 音響制御部5で実際の音声表記を得も 以上
で得られた韻律情報・音韻情報に従ってパラメータ作成
部6で実際の合成パラメータを得も パラメータ補間部
9で1戴 こうして得られた各音素のパラメータ値を補
間L10msec毎のパラメータ列を殊 音声合成部1
0でホルマント型の合成器を用いて合成すも パラメータ作成部における基本周波数(ピッチ)(よ
原画モデルを用いて求めも 原画モデルは次式で現わさ
れも In FO(t) = In Fm1
n 十 Σ ApiGpi(t−TOi)
+ΣAaj(Gaj(t−tlj)−Gaj(t−t2
j) )Gpi(t) = 3.0本3,0tex
p(−3,0t) for t >−0G
aj(t) = Min[1−(1−20t)ex
p(−20t)、 0.9コfor t >−0 api : フレーズ成分の振幅 0.43(文
頭)、−0,50(文末) aaj : アクセント成分の振幅 0.40(
起伏)、0.20(平板) i : フレーズ成分の数 j : アクセント成分の数 toi : フレーズ成分立ち上がり位置tii
: アクセント成分立ち上がり位置t2i
: アクセント成分立ち下がり位置Pugin :
基準値 (=80)ここで、アクセント成分の振幅
は起伏を 平板型で企画化されていも 即ち例では 3
型・5型とともに起伏型なので0.40が用いられるこ
とになム本実施例で(よ アクセント核の存在する語の
品詞によりアクセント成分の振幅値を制御すム 即杖第
1文節は付属語にアクセント核が存在するので、振幅値
を0.30とす4 な耘 実施例において合成単位は音素(C,V)ホルマ
ント合成方式を用いた力(これに限定されるものではな
(を 以上のように本実施例によれば アクセント核の存在す
る品詞情報に応じて、アクセント振幅値を制御すること
により、変化に富んだ自然性の高い合成音声を提供する
ことが出来も 実施例2 第2図Cヨ 請求項2に記載の発明の実施例における
音声合成装置の構成を示したブロック図であ4 なお実
施例1と共通する要素には同一番号をつけていも 1は
文字列入力端で漢字かな混じり文が入力されム 2はテ
キスト解析部で、入力された漢字かな混じり文は辞書3
を用いて単語に分割され 各々の読み・アクセント型・
品詞等が付与されも 4は韻律制御部で、各単語・付属
語のアクセント型から文節のアクセント型の決定 ポー
ズ位置や文全体のイントネーション等の決定を規則によ
り行う。 5は音韻制御部で、テキスト解析部で得られ
た読みに対し 母音の無声化や鼻音化処珠 仮名表記と
発声表記の異なる場合等の処理(「私は」の「は」は「
わ」と発声される)を行t〜 音声表記を得ム 6は合
成パラメータ作成部て 韻律情報や音声表記情報から合
成に必要な合成パラメータ列を得も 合成バラメ゛−夕
はパラメータテーブル7に納されていム 8はパラメー
タ補間部で7で得られた各音素毎のパラメータを補間し
て一定時間毎の合成パラメータ列を得allは揺らぎ成
分付与部で本実施例では乱数を用いて基本周波数のみに
ゆらぎを付与するものとすム 9は音声合成部で、8で
得られた合成パラメータ列から実際の音声を合成し 合
成音声出力端lOに音声波形を得も 次に揺らぎ成分付与部11について説明すもパラメータ
補間部9で10m5ec毎の基本周波数として、次のパ
ラメータ値が得られたとする。
ー コ゛−セー テ゛ス(アクセント)OD
1 0 b(品詞) 代名 副動 名
名 助動ここで、 「こそ」 「です」に対して与え
られているアクセント型りやbier、NHKアクセン
ト辞典・解説付録(日本放送出版会 1985年)に記
載されているもので、自立語と結合して文節を構成する
際の結合アクセント型を示したものであム また 各単
語のアクセント型(よ アクセントのある音節位置を示
したものであム 次に韻律処理部5で、ポーズ位置や文節のアクセント瓢
文全体のイントネーションを決定すも「これこ″そ(
ポーズ)おんせ−ご°−せ−です」とな4 すなわち第
1文節は4モーラ3型で付属語にアクセント核が存在し
第2文節は10モーラ5型で自立語にアクセント核が
存在すも 音響制御部5で実際の音声表記を得も 以上
で得られた韻律情報・音韻情報に従ってパラメータ作成
部6で実際の合成パラメータを得も パラメータ補間部
9で1戴 こうして得られた各音素のパラメータ値を補
間L10msec毎のパラメータ列を殊 音声合成部1
0でホルマント型の合成器を用いて合成すも パラメータ作成部における基本周波数(ピッチ)(よ
原画モデルを用いて求めも 原画モデルは次式で現わさ
れも In FO(t) = In Fm1
n 十 Σ ApiGpi(t−TOi)
+ΣAaj(Gaj(t−tlj)−Gaj(t−t2
j) )Gpi(t) = 3.0本3,0tex
p(−3,0t) for t >−0G
aj(t) = Min[1−(1−20t)ex
p(−20t)、 0.9コfor t >−0 api : フレーズ成分の振幅 0.43(文
頭)、−0,50(文末) aaj : アクセント成分の振幅 0.40(
起伏)、0.20(平板) i : フレーズ成分の数 j : アクセント成分の数 toi : フレーズ成分立ち上がり位置tii
: アクセント成分立ち上がり位置t2i
: アクセント成分立ち下がり位置Pugin :
基準値 (=80)ここで、アクセント成分の振幅
は起伏を 平板型で企画化されていも 即ち例では 3
型・5型とともに起伏型なので0.40が用いられるこ
とになム本実施例で(よ アクセント核の存在する語の
品詞によりアクセント成分の振幅値を制御すム 即杖第
1文節は付属語にアクセント核が存在するので、振幅値
を0.30とす4 な耘 実施例において合成単位は音素(C,V)ホルマ
ント合成方式を用いた力(これに限定されるものではな
(を 以上のように本実施例によれば アクセント核の存在す
る品詞情報に応じて、アクセント振幅値を制御すること
により、変化に富んだ自然性の高い合成音声を提供する
ことが出来も 実施例2 第2図Cヨ 請求項2に記載の発明の実施例における
音声合成装置の構成を示したブロック図であ4 なお実
施例1と共通する要素には同一番号をつけていも 1は
文字列入力端で漢字かな混じり文が入力されム 2はテ
キスト解析部で、入力された漢字かな混じり文は辞書3
を用いて単語に分割され 各々の読み・アクセント型・
品詞等が付与されも 4は韻律制御部で、各単語・付属
語のアクセント型から文節のアクセント型の決定 ポー
ズ位置や文全体のイントネーション等の決定を規則によ
り行う。 5は音韻制御部で、テキスト解析部で得られ
た読みに対し 母音の無声化や鼻音化処珠 仮名表記と
発声表記の異なる場合等の処理(「私は」の「は」は「
わ」と発声される)を行t〜 音声表記を得ム 6は合
成パラメータ作成部て 韻律情報や音声表記情報から合
成に必要な合成パラメータ列を得も 合成バラメ゛−夕
はパラメータテーブル7に納されていム 8はパラメー
タ補間部で7で得られた各音素毎のパラメータを補間し
て一定時間毎の合成パラメータ列を得allは揺らぎ成
分付与部で本実施例では乱数を用いて基本周波数のみに
ゆらぎを付与するものとすム 9は音声合成部で、8で
得られた合成パラメータ列から実際の音声を合成し 合
成音声出力端lOに音声波形を得も 次に揺らぎ成分付与部11について説明すもパラメータ
補間部9で10m5ec毎の基本周波数として、次のパ
ラメータ値が得られたとする。
但しここで合成音のサンプリング周波数はl0KHzと
すム フレーム番号 1 2 3 基本周波数 250 250 248 (Hz)ピッ
チ 40 40 40 (X 1/10m
5ec)合成部10で用いられるピッチパルスのサンプ
ルNoζ瓜 次のようになム フレームNo 1
2 3サン7°ルNOO,40,
80,120,160,200,240,280しかし
なか仮 実際の音声は基本周波数250H2として耘
このように規則的にピッチパルスが有るわけではなくゆ
らいでおり、このゆらぎが自然性を向上させていも こ
のピッチパルス列に対して、乱数を用いて例えば±2の
ゆらぎを与えると以下のようになa フレームNo 1
2 3サン7°ルNO0,39,
80,122,161,200,238,280この与
えるゆらぎの幅を、振幅パラメータの大きさに関連して
決定する。振幅の小さい部分ではゆらぎの幅は大きく、
振幅の大きい部分ではゆらぎの幅を小さ(すも 本実施
例でζよ 振幅をampとした隊 ゆらぎの幅を次の式
で与えもf (ゆらぎ)=5−amp/20 ;即t
lxamp=40のとき、±3の乱数でゆらぎを与、i
、、amp=80では±1のゆらぎを与えるものとすも このよう級 ゆらぎの幅を振幅情報にしたがって制御す
ることにより、規則合成音の単調さを軽減し 変化に富
んだ自然性の高い合成音声を提供することが出来も 実施例3 第3図1′!、請求項3に記載の発明の実施例における
音声合成装置の構成を示したブロック図であa なお実
施例1と共通する要素には同一番号をつけてい、klは
文字列入力端で漢字かな混じり文が入力され21o2は
テキスト解析部で、入力された漢字かな混じり文は辞書
3を用いて単語に分割され 各々の読み・アクセント型
・品詞等が付与されも 4は韻律制御部で、各単語・付
属語のアクセント型から文節のアクセント型の決定 ポ
ーズ位置や文全体のイントネーション等の決定を規則に
より行う。5は音韻制御部六 テキスト解析部で得られ
た読みに対し 母音の無声化や鼻音化処班 仮名表記と
発声表記の異なる場合等の処理(「私は」の「は」は「
わ」と発声される)を行匹 音声表記を得& 12は
基準値選択手段で、次のパラメータ作成部で基本周波数
パラメータ作成に用いる基準値を決定すム 6は合成パ
ラメータ作成部で、韻律情報や音声表記情報から合成に
必要な合成パラメータ列を得も 合成パラメータはパラ
メータテーブル7に納されてい48はパラメータ補間部
で7で得られた各音素毎のパラメータを補間して一定時
間毎の合成パラメータ列を得も 9は音声合成部で、
8で得られた合成パラメータ列から実際の音声を合成し
合成音声出力端10に音声波形を得も パラメータ作成部における基本周波数(ピッチ)は 藤
崎モデルを用いて求めも 藤崎モデルは次式で現わされ
も In FO(t) = In Fm1
n 十 Σ ApiGpi(t−TOi)
+ΣAaj[Gaj(t−tlj)−Gaj(t−t2
j))Gpi(t) −3,0本3.0texp(−
3,Ot) for t >−0Gaj(t)
−Min[1−(1−20t)exp(−20t)、
0.91for t >= Q api : フレーズ成分の振幅 0.43(文
頭)、−0,50(文末) aaj : アクセント成分の振幅 0.40(
起伏)、0.20(平板) i : フレーズ成分の数 j : アクセント成分の数 toi ; フレーズ成分立ち上がり位置tli
: アクセント成分立ち上がり位置t2i
: アクセント成分立ち下がり位置Fm1n :
基準値 実施例1で&友 基準値として80(Hz)を用いてい
ため(これでは同じモーラ数同じアクセント型の文章が
続いた場合、作成される基本周波数パラメータは尾同−
となり、合成音は単調なものになム そこで、本発明で
lよ 基準値選択手段6で乱数(ran)を求数 基準
値Fm1nを次式で設定すム Fm1n = 80 + ran ;このよ
う!ミ 基準値を変化させることにより、合成音の単調
さを軽減することができも ここで、制御するパラメー
タとして基本周波数 制御する基準値としてFm1nを
用いた力(これは本発明を何隻拘束するものではな(〜 以上のように本実施例によれ(戯 音質情報を合成時に
ダイナミックに登録することが出来 変化に富んだ効果
的な合成音声を提供することが出来も 発明の効果 本発明によれば 合成音の単調さを軽減し 変化に富ん
だ自然性の高い効果的な合成音を提供することが出来も
すム フレーム番号 1 2 3 基本周波数 250 250 248 (Hz)ピッ
チ 40 40 40 (X 1/10m
5ec)合成部10で用いられるピッチパルスのサンプ
ルNoζ瓜 次のようになム フレームNo 1
2 3サン7°ルNOO,40,
80,120,160,200,240,280しかし
なか仮 実際の音声は基本周波数250H2として耘
このように規則的にピッチパルスが有るわけではなくゆ
らいでおり、このゆらぎが自然性を向上させていも こ
のピッチパルス列に対して、乱数を用いて例えば±2の
ゆらぎを与えると以下のようになa フレームNo 1
2 3サン7°ルNO0,39,
80,122,161,200,238,280この与
えるゆらぎの幅を、振幅パラメータの大きさに関連して
決定する。振幅の小さい部分ではゆらぎの幅は大きく、
振幅の大きい部分ではゆらぎの幅を小さ(すも 本実施
例でζよ 振幅をampとした隊 ゆらぎの幅を次の式
で与えもf (ゆらぎ)=5−amp/20 ;即t
lxamp=40のとき、±3の乱数でゆらぎを与、i
、、amp=80では±1のゆらぎを与えるものとすも このよう級 ゆらぎの幅を振幅情報にしたがって制御す
ることにより、規則合成音の単調さを軽減し 変化に富
んだ自然性の高い合成音声を提供することが出来も 実施例3 第3図1′!、請求項3に記載の発明の実施例における
音声合成装置の構成を示したブロック図であa なお実
施例1と共通する要素には同一番号をつけてい、klは
文字列入力端で漢字かな混じり文が入力され21o2は
テキスト解析部で、入力された漢字かな混じり文は辞書
3を用いて単語に分割され 各々の読み・アクセント型
・品詞等が付与されも 4は韻律制御部で、各単語・付
属語のアクセント型から文節のアクセント型の決定 ポ
ーズ位置や文全体のイントネーション等の決定を規則に
より行う。5は音韻制御部六 テキスト解析部で得られ
た読みに対し 母音の無声化や鼻音化処班 仮名表記と
発声表記の異なる場合等の処理(「私は」の「は」は「
わ」と発声される)を行匹 音声表記を得& 12は
基準値選択手段で、次のパラメータ作成部で基本周波数
パラメータ作成に用いる基準値を決定すム 6は合成パ
ラメータ作成部で、韻律情報や音声表記情報から合成に
必要な合成パラメータ列を得も 合成パラメータはパラ
メータテーブル7に納されてい48はパラメータ補間部
で7で得られた各音素毎のパラメータを補間して一定時
間毎の合成パラメータ列を得も 9は音声合成部で、
8で得られた合成パラメータ列から実際の音声を合成し
合成音声出力端10に音声波形を得も パラメータ作成部における基本周波数(ピッチ)は 藤
崎モデルを用いて求めも 藤崎モデルは次式で現わされ
も In FO(t) = In Fm1
n 十 Σ ApiGpi(t−TOi)
+ΣAaj[Gaj(t−tlj)−Gaj(t−t2
j))Gpi(t) −3,0本3.0texp(−
3,Ot) for t >−0Gaj(t)
−Min[1−(1−20t)exp(−20t)、
0.91for t >= Q api : フレーズ成分の振幅 0.43(文
頭)、−0,50(文末) aaj : アクセント成分の振幅 0.40(
起伏)、0.20(平板) i : フレーズ成分の数 j : アクセント成分の数 toi ; フレーズ成分立ち上がり位置tli
: アクセント成分立ち上がり位置t2i
: アクセント成分立ち下がり位置Fm1n :
基準値 実施例1で&友 基準値として80(Hz)を用いてい
ため(これでは同じモーラ数同じアクセント型の文章が
続いた場合、作成される基本周波数パラメータは尾同−
となり、合成音は単調なものになム そこで、本発明で
lよ 基準値選択手段6で乱数(ran)を求数 基準
値Fm1nを次式で設定すム Fm1n = 80 + ran ;このよ
う!ミ 基準値を変化させることにより、合成音の単調
さを軽減することができも ここで、制御するパラメー
タとして基本周波数 制御する基準値としてFm1nを
用いた力(これは本発明を何隻拘束するものではな(〜 以上のように本実施例によれ(戯 音質情報を合成時に
ダイナミックに登録することが出来 変化に富んだ効果
的な合成音声を提供することが出来も 発明の効果 本発明によれば 合成音の単調さを軽減し 変化に富ん
だ自然性の高い効果的な合成音を提供することが出来も
第1図は1本発明の第1の実施侭 および従来例の音声
合成装置の構成を示すブロック図 第2図(友 本発明
の第2の実施例における音声合成装置の構成を示すブロ
ック図 第3図は、 本発明の第3の実施例における
音声合成装置の構成を示すブロック図であa 1・・・文字列人力能 2・・・テキスト解析服 3・
・・辞書、 4・・・韻律処理眼 5・・・音韻処理区
6・・・合成パラメータ作成眼 7・・・パラメータ
テーブノに8・・・パラメータ補間i9・・・音声合成
ff1k 10・・・合成音声出力能 11・・・ゆ
らぎ付与IK 12・・・基準値選択糺
合成装置の構成を示すブロック図 第2図(友 本発明
の第2の実施例における音声合成装置の構成を示すブロ
ック図 第3図は、 本発明の第3の実施例における
音声合成装置の構成を示すブロック図であa 1・・・文字列人力能 2・・・テキスト解析服 3・
・・辞書、 4・・・韻律処理眼 5・・・音韻処理区
6・・・合成パラメータ作成眼 7・・・パラメータ
テーブノに8・・・パラメータ補間i9・・・音声合成
ff1k 10・・・合成音声出力能 11・・・ゆ
らぎ付与IK 12・・・基準値選択糺
Claims (3)
- (1)文字列もしくは記号列(以後テキストという)を
入力するテキスト入力手段と、前記入力手段から入力さ
れたテキストを解析するテキスト解析手段と、前記テキ
スト解析手段で参照する辞書情報格納手段と前記テキス
ト解析手段の結果に従って合成パラメータを作成する合
成パラメータ作成手段と、前記合成パラメータから音声
を合成する音声合成手段を有し、前記パラメータ作成手
段部は、前記テキスト解析手段から得られるアクセント
核を有する語の品詞情報にしたがって合成パラメータを
制御することを特徴とする音声合成装置。 - (2)文字列もしくは記号列(以後テキストという)を
入力するテキスト入力手段と、前記入力手段から入力さ
れたテキストを解析するテキスト解析手段と、前記テキ
スト解析手段で参照する辞書情報格納手段と前記テキス
ト解析手段の結果に従って合成パラメータを作成する合
成パラメータ作成手段と、前記合成パラメータにゆらぎ
を与えるゆらぎ付与手段と前記合成パラメータから音声
を合成する音声合成手段を有し、前記揺らぎ付与手段で
は前記合成パラメータ作成手段で獲られた振幅情報にし
たがって揺らぎ成分を制御することを特徴とする音声合
成装置。 - (3)文字列もしくは記号列(以後テキストという)を
入力するテキスト入力手段と、前記入力手段から入力さ
れたテキストを解析するテキスト解析手段と、前記テキ
スト解析手段で参照する辞書情報格納手段と、前記テキ
スト解析手段の結果に従って合成パラメータを作成する
合成パラメータ作成手段と、前記合成パラメータから音
声を合成する音声合成手段を有し、前記合成パラメータ
作成手段は、基準値を選択する手段を含むことを特徴と
する音声合成装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2148231A JPH0439698A (ja) | 1990-06-05 | 1990-06-05 | 音声合成装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2148231A JPH0439698A (ja) | 1990-06-05 | 1990-06-05 | 音声合成装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0439698A true JPH0439698A (ja) | 1992-02-10 |
Family
ID=15448203
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2148231A Pending JPH0439698A (ja) | 1990-06-05 | 1990-06-05 | 音声合成装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0439698A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102169818B1 (ko) * | 2019-12-17 | 2020-10-26 | 주식회사분도이엔지 | 다용도 시스템 가구 |
-
1990
- 1990-06-05 JP JP2148231A patent/JPH0439698A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102169818B1 (ko) * | 2019-12-17 | 2020-10-26 | 주식회사분도이엔지 | 다용도 시스템 가구 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8340967B2 (en) | Speech samples library for text-to-speech and methods and apparatus for generating and using same | |
| Tora et al. | Implementation of Turkish text-to-speech synthesis on a voice synthesizer card with prosodic features | |
| Rama et al. | Thirukkural: a text-to-speech synthesis system | |
| JPH0439698A (ja) | 音声合成装置 | |
| JPH0580791A (ja) | 音声規則合成装置および方法 | |
| JP3124791B2 (ja) | 音声合成装置 | |
| Karjalainen | Review of speech synthesis technology | |
| Rudzicz | Speech Synthesis | |
| JPH01321496A (ja) | 音声合成装置 | |
| Muralishankar et al. | Human touch to Tamil speech synthesizer | |
| JP3267659B2 (ja) | 日本語音声合成方法 | |
| JPH03196199A (ja) | 音声合成装置 | |
| Hinterleitner | Speech synthesis | |
| Khudoyberdiev | The Algorithms of Tajik Speech Synthesis by Syllable | |
| JPH09292897A (ja) | 音声合成装置 | |
| JP2573587B2 (ja) | ピッチパタン生成装置 | |
| JPH02285400A (ja) | 音声合成装置 | |
| Shi | A speech synthesis-by-rule system for Modern Standard Chinese | |
| JPH06118981A (ja) | 音声合成装置 | |
| JPH08328578A (ja) | テキスト音声合成装置 | |
| JPH01112297A (ja) | 音声合成装置 | |
| JPH06138894A (ja) | 音声合成装置及び音声合成方法 | |
| Morris | Speech Generation | |
| JPH04190398A (ja) | 音声合成方法 | |
| Zhu et al. | A new chinese speech synthesis method apply in chinese poetry learning |