JPH0887296A - 音声合成装置 - Google Patents
音声合成装置Info
- Publication number
- JPH0887296A JPH0887296A JP6221683A JP22168394A JPH0887296A JP H0887296 A JPH0887296 A JP H0887296A JP 6221683 A JP6221683 A JP 6221683A JP 22168394 A JP22168394 A JP 22168394A JP H0887296 A JPH0887296 A JP H0887296A
- Authority
- JP
- Japan
- Prior art keywords
- pitch pattern
- accent
- point pitch
- point
- pitch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【目的】 音声合成装置において、点ピッチモデルの欠
点を改良し、自然なピッチパタンを生成し、高品質な合
成音をつくり出す。 【構成】 音声合成装置において、アクセント型による
点ピッチパタンを記憶した第1のデータベース部21と、
アクセント型と音韻の結合に対応した規則を記憶した第
2のデータベース部24と、音声合成の対象となる文節に
対応した点ピッチパタンを第1のデータベース部より検
索し、得られた点ピッチパタンから第2のデータベース
部の規則を基に新たな点ピッチパタンを生成するピッチ
パタン生成部8を設ける。これにより、点ピッチパタン
の母音重心点のみならず、音韻境界にもピッチが与えら
れ、合成音における語頭、アクセント核における母音連
鎖の自然性を向上させる。
点を改良し、自然なピッチパタンを生成し、高品質な合
成音をつくり出す。 【構成】 音声合成装置において、アクセント型による
点ピッチパタンを記憶した第1のデータベース部21と、
アクセント型と音韻の結合に対応した規則を記憶した第
2のデータベース部24と、音声合成の対象となる文節に
対応した点ピッチパタンを第1のデータベース部より検
索し、得られた点ピッチパタンから第2のデータベース
部の規則を基に新たな点ピッチパタンを生成するピッチ
パタン生成部8を設ける。これにより、点ピッチパタン
の母音重心点のみならず、音韻境界にもピッチが与えら
れ、合成音における語頭、アクセント核における母音連
鎖の自然性を向上させる。
Description
【0001】
【産業上の利用分野】本発明は、音声合成装置に関し、
特に、音声合成装置におけるピッチパタンを生成する技
術に関するものである。本願発明の音声合成装置は、例
えば、セキュリティ機器における音声合成装置として使
用される。
特に、音声合成装置におけるピッチパタンを生成する技
術に関するものである。本願発明の音声合成装置は、例
えば、セキュリティ機器における音声合成装置として使
用される。
【0002】
【従来の技術】従来、音声規則合成のピッチ制御は、母
音の中心位置におけるピッチ周波数を与え、母音間を線
形に補間する「点ピッチモデル」(特開昭50−128
40号、特許第1087848号参照)が使われてい
た。点ピッチモデルを用いた音声合成とは、日本語のア
クセント型に対応した、いくつかのパタンをあらかじめ
数値化しデータベース化しておき、合成したい文節のア
クセント型の情報を基に、その数値化された点ピッチパ
タンを検索し、合成パラメータとして利用する方法であ
る。
音の中心位置におけるピッチ周波数を与え、母音間を線
形に補間する「点ピッチモデル」(特開昭50−128
40号、特許第1087848号参照)が使われてい
た。点ピッチモデルを用いた音声合成とは、日本語のア
クセント型に対応した、いくつかのパタンをあらかじめ
数値化しデータベース化しておき、合成したい文節のア
クセント型の情報を基に、その数値化された点ピッチパ
タンを検索し、合成パラメータとして利用する方法であ
る。
【0003】点ピッチモデルは、母音のエネルギー中心
位置におけるピッチ周波数が人間の聴覚にとって支配的
であるという特徴を利用したモデルであり、ピッチ制御
にとって、効率のよい考え方といえる。
位置におけるピッチ周波数が人間の聴覚にとって支配的
であるという特徴を利用したモデルであり、ピッチ制御
にとって、効率のよい考え方といえる。
【0004】
【発明が解決しようとする課題】ところが、自然の発声
においては、同じアクセント型、同じモーラ数の文節で
あっても、その文節を構成する音韻の並びによっては、
明らかに点ピッチパタンと異なったピッチパタンをとる
事がある。これは、自然の発声系における、ピッチと調
音機構の相互作用によって、聞こえのアクセント型が、
点ピッチパタンの形と必ずしも一致しない事による。
においては、同じアクセント型、同じモーラ数の文節で
あっても、その文節を構成する音韻の並びによっては、
明らかに点ピッチパタンと異なったピッチパタンをとる
事がある。これは、自然の発声系における、ピッチと調
音機構の相互作用によって、聞こえのアクセント型が、
点ピッチパタンの形と必ずしも一致しない事による。
【0005】その結果、文節によっては、検索した点ピ
ッチパタンと文節本来のアクセントが必ずしも一致せ
ず、変にアクセントが強調され、イントネーションがお
かしくなることがある等の不自然性が問題になってい
た。本発明は、上記従来の点ピッチモデルの欠点を改良
し、自然なピッチパタンを生成し、高品質な合成音をつ
くり出すことを目的とする。
ッチパタンと文節本来のアクセントが必ずしも一致せ
ず、変にアクセントが強調され、イントネーションがお
かしくなることがある等の不自然性が問題になってい
た。本発明は、上記従来の点ピッチモデルの欠点を改良
し、自然なピッチパタンを生成し、高品質な合成音をつ
くり出すことを目的とする。
【0006】
【課題を解決するための手段】本発明は前記問題を解決
するために、従来の点ピッチパタンの解釈を拡大し、母
音重心点のみならず、音韻境界にもピッチを与えられる
モデルとする。これを拡張点ピッチモデルと呼び、与え
られるピッチを拡張点ピッチと呼ぶ事にする。拡張点ピ
ッチは、母音重心位置に与える点ピッチと、音韻の並び
から、音韻境界のピッチ(以下、「境界ピッチ」とい
う。)を規則によって決定し、合成パラメータとして利
用する。
するために、従来の点ピッチパタンの解釈を拡大し、母
音重心点のみならず、音韻境界にもピッチを与えられる
モデルとする。これを拡張点ピッチモデルと呼び、与え
られるピッチを拡張点ピッチと呼ぶ事にする。拡張点ピ
ッチは、母音重心位置に与える点ピッチと、音韻の並び
から、音韻境界のピッチ(以下、「境界ピッチ」とい
う。)を規則によって決定し、合成パラメータとして利
用する。
【0007】本発明は、これを実現するため、音声合成
装置において、アクセント型による点ピッチパタンを記
憶した第1のデータベース部と、アクセント型と音韻の
結合に対応した規則を記憶した第2のデータベース部
と、音声合成の対象となる文節に対応した点ピッチパタ
ンを第1のデータベース部より検索し、得られた点ピッ
チパタンから第2のデータベース部の規則を基に新たな
点ピッチパタンを生成するピッチパタン生成部を設け
る。
装置において、アクセント型による点ピッチパタンを記
憶した第1のデータベース部と、アクセント型と音韻の
結合に対応した規則を記憶した第2のデータベース部
と、音声合成の対象となる文節に対応した点ピッチパタ
ンを第1のデータベース部より検索し、得られた点ピッ
チパタンから第2のデータベース部の規則を基に新たな
点ピッチパタンを生成するピッチパタン生成部を設け
る。
【0008】また、本発明は、前記第2のデータベース
部に記憶されている規則を、アクセント型と音韻の結合
とモーラ数との組合せに対応したものとすることができ
る。さらに、前記第1のデータベース部に記憶されてい
る点ピッチパタンに下降成分を加えた後、前記第2のデ
ータベース部の規則を適用し、新たな点ピッチパタンを
生成することができる。
部に記憶されている規則を、アクセント型と音韻の結合
とモーラ数との組合せに対応したものとすることができ
る。さらに、前記第1のデータベース部に記憶されてい
る点ピッチパタンに下降成分を加えた後、前記第2のデ
ータベース部の規則を適用し、新たな点ピッチパタンを
生成することができる。
【0009】
【作用】第1のデータベース部より検索し得られた点ピ
ッチパタンに対して第2のデータベース部の規則を適用
することにより、与えられた点ピッチと音韻の並びから
境界ピッチを規則によって決定し、合成パラメータとし
て利用する。これにより、点ピッチパタンの母音重心点
のみならず、音韻境界にもピッチが与えられ、合成音に
おける語頭、アクセント核における母音連鎖の自然性を
向上させる。
ッチパタンに対して第2のデータベース部の規則を適用
することにより、与えられた点ピッチと音韻の並びから
境界ピッチを規則によって決定し、合成パラメータとし
て利用する。これにより、点ピッチパタンの母音重心点
のみならず、音韻境界にもピッチが与えられ、合成音に
おける語頭、アクセント核における母音連鎖の自然性を
向上させる。
【0010】また、第2のデータベースに記憶されてい
る規則を、アクセント型と音韻の結合とモーラ数との組
合せに対応させることにより、さらには、点ピッチパタ
ンに下降成分を加えることにより、アクセント型におけ
る母音連鎖の自然性を更に向上させることができる。
る規則を、アクセント型と音韻の結合とモーラ数との組
合せに対応させることにより、さらには、点ピッチパタ
ンに下降成分を加えることにより、アクセント型におけ
る母音連鎖の自然性を更に向上させることができる。
【0011】
【実施例】以下、本発明の実施例について図面を参照し
て説明する。図2は本発明の実施例に係る日本語音声合
成システムの構成を示す図である。図において、文章入
力装置1は、音声合成をしようとする合成文章が入力さ
れる。
て説明する。図2は本発明の実施例に係る日本語音声合
成システムの構成を示す図である。図において、文章入
力装置1は、音声合成をしようとする合成文章が入力さ
れる。
【0012】テキスト解析部2は、この合成文章を発音
情報生成規則3を用いて解析し、音声合成処理に必要な
アクセントの情報、ポーズ、母音の無音声化などといっ
た発音情報を加えた音韻記号列に変換する。音韻継続時
間長生成部4は、テキスト解析部2によって生成された
音韻記号列について、リズム規則5により音韻継続時間
長を決定する。音韻継続時間長生成部4の出力は、音源
振幅パタン生成部6、ピッチパタン生成部8、スペクト
ルパタン生成部11に入力される。
情報生成規則3を用いて解析し、音声合成処理に必要な
アクセントの情報、ポーズ、母音の無音声化などといっ
た発音情報を加えた音韻記号列に変換する。音韻継続時
間長生成部4は、テキスト解析部2によって生成された
音韻記号列について、リズム規則5により音韻継続時間
長を決定する。音韻継続時間長生成部4の出力は、音源
振幅パタン生成部6、ピッチパタン生成部8、スペクト
ルパタン生成部11に入力される。
【0013】音源振幅パタン生成部6は、音声のパワー
包絡をパワー規則7により決定する。なお、この音源振
幅パタン生成部6及びパワー規則7図の詳細について
は、本出願人が既に出願した特願平5−247994号
で説明されている。ピッチパタン生成部8は、韻律制御
規則9から各アクセント句について点ピッチパタンを決
めて、それらを補間して連続点ピッチパタンを生成す
る。
包絡をパワー規則7により決定する。なお、この音源振
幅パタン生成部6及びパワー規則7図の詳細について
は、本出願人が既に出願した特願平5−247994号
で説明されている。ピッチパタン生成部8は、韻律制御
規則9から各アクセント句について点ピッチパタンを決
めて、それらを補間して連続点ピッチパタンを生成す
る。
【0014】音源生成部10は、前記パワーパタンと前
記ピッチパタンを基に音源を生成する。スペクトルパタ
ン生成部11は、音韻性向上規則12により、母音・子
音といった音韻の種類から、音声合成基本単位データベ
ース13を検索し、音韻結合規則14により各音韻のス
ペクトルを結合し、フォルマントパタンを作成する。
記ピッチパタンを基に音源を生成する。スペクトルパタ
ン生成部11は、音韻性向上規則12により、母音・子
音といった音韻の種類から、音声合成基本単位データベ
ース13を検索し、音韻結合規則14により各音韻のス
ペクトルを結合し、フォルマントパタンを作成する。
【0015】音声合成器15は、前記音源生成部10か
ら得られた音源情報と前記スペクトルパタン生成部11
から得られたフォルマントパタンから合成音声を作成す
る。作成された合成音声はスピーカ16により外部に発
声される。次に本発明の特徴部であるピッチパタン生成
部8及び韻律制御規則9について図1を用いて説明す
る。
ら得られた音源情報と前記スペクトルパタン生成部11
から得られたフォルマントパタンから合成音声を作成す
る。作成された合成音声はスピーカ16により外部に発
声される。次に本発明の特徴部であるピッチパタン生成
部8及び韻律制御規則9について図1を用いて説明す
る。
【0016】韻律制御規則9は、正規化点ピッチパタン
を記憶した第1のデータベース21、アクセント句内下
降成分規則22、アクセント句間下降成分規則23及
び、変形規則を記憶した第2のデータベース24を具備
している。最初に、ピッチパタン生成部8の概略の動作
について説明をする。ピッチパタン生成部8は、韻律制
御規則9の第1のデータベース21に記憶された正規化
点ピッチパタンから、合成しようとしている文節のモー
ラ数及びアクセント型で決まる1つの正規化点ピッチパ
タンを検索する(ステップS1)。
を記憶した第1のデータベース21、アクセント句内下
降成分規則22、アクセント句間下降成分規則23及
び、変形規則を記憶した第2のデータベース24を具備
している。最初に、ピッチパタン生成部8の概略の動作
について説明をする。ピッチパタン生成部8は、韻律制
御規則9の第1のデータベース21に記憶された正規化
点ピッチパタンから、合成しようとしている文節のモー
ラ数及びアクセント型で決まる1つの正規化点ピッチパ
タンを検索する(ステップS1)。
【0017】次に、ピッチパタン生成部8は、検索して
取り出した点ピッチパタンに対して、アクセント句内下
降成分規則22を用いて、アクセント句内下降成分を付
与し(ステップS2)、さらに、アクセント句間下降成
分規則23を用いて、アクセント句間下降成分を付与す
る(ステップS3)。最後に、ピッチパタン生成部8
は、点ピッチパタンに対して、第2のデータベース24
に記憶された規則を用い、点ピッチパタンのアクセント
型と音韻の結合とモーラ数に対応した変形を行う(ステ
ップS4)。
取り出した点ピッチパタンに対して、アクセント句内下
降成分規則22を用いて、アクセント句内下降成分を付
与し(ステップS2)、さらに、アクセント句間下降成
分規則23を用いて、アクセント句間下降成分を付与す
る(ステップS3)。最後に、ピッチパタン生成部8
は、点ピッチパタンに対して、第2のデータベース24
に記憶された規則を用い、点ピッチパタンのアクセント
型と音韻の結合とモーラ数に対応した変形を行う(ステ
ップS4)。
【0018】以上簡単に説明した各処理について、以下
に詳細に説明をする。第1のデータベース21に記憶さ
れている正規化点ピッチパタンについて説明をする。正
規化点ピッチパタンは、あらかじめ自然発声の点ピッチ
を分析しておいて、これに正規化を施してデータベース
化してある。図3〜図6は、第1のデータベース21に
記憶された正規化点ピッチパタンの例を示し、アクセン
ト型Nごとにまとめて表示されている。図3は0型正規
化点ピッチパタン、図4は1型正規化点ピッチパタン、
図5は2型正規化点ピッチパタン、図6は3型正規化点
ピッチパタンを示す。以下図示は省略するが、本例では
9型正規化点ピッチパタンまでが用意される。
に詳細に説明をする。第1のデータベース21に記憶さ
れている正規化点ピッチパタンについて説明をする。正
規化点ピッチパタンは、あらかじめ自然発声の点ピッチ
を分析しておいて、これに正規化を施してデータベース
化してある。図3〜図6は、第1のデータベース21に
記憶された正規化点ピッチパタンの例を示し、アクセン
ト型Nごとにまとめて表示されている。図3は0型正規
化点ピッチパタン、図4は1型正規化点ピッチパタン、
図5は2型正規化点ピッチパタン、図6は3型正規化点
ピッチパタンを示す。以下図示は省略するが、本例では
9型正規化点ピッチパタンまでが用意される。
【0019】ここで、アクセント型のNはアクセント核
の位置を表す。アクセント核とは、アクセントがついた
際に、周波数が下降する直前のモーラである。つまり、
図4の1型とはアクセント核が第1モーラであること、
図5の2型とはアクセント核が第2モーラであること、
図6の3型とはアクセント核が第3モーラであること、
図3の0型とはアクセント核がないことを意味する。
の位置を表す。アクセント核とは、アクセントがついた
際に、周波数が下降する直前のモーラである。つまり、
図4の1型とはアクセント核が第1モーラであること、
図5の2型とはアクセント核が第2モーラであること、
図6の3型とはアクセント核が第3モーラであること、
図3の0型とはアクセント核がないことを意味する。
【0020】また、図3〜図6には、1つのアクセント
型Nについてモーラ数Mの異なる複数のパタンが図示さ
れている。通常、それぞれのパタンをMモーラN型と呼
ぶ。以上の説明から明らかなように、パタンの種類は、
モーラ数Mとアクセント型N(ただし常にM>N>=
0)の組み合わせ数の和となる。通常、Mはたかだか1
<M<10程度なので、パタンの総数は1から10まで
の和(42)を超えることはない。
型Nについてモーラ数Mの異なる複数のパタンが図示さ
れている。通常、それぞれのパタンをMモーラN型と呼
ぶ。以上の説明から明らかなように、パタンの種類は、
モーラ数Mとアクセント型N(ただし常にM>N>=
0)の組み合わせ数の和となる。通常、Mはたかだか1
<M<10程度なので、パタンの総数は1から10まで
の和(42)を超えることはない。
【0021】図1のステップS1において、ピッチパタ
ン生成部8は、上記複数記憶された正規化点ピッチパタ
ンから、合成しようとしている文節のモーラ数及びアク
セント型で決まる1つの正規化点ピッチパタンを検索す
る。次に、図1のステップS2及びステップS3のピッ
チ下降成分の付与について説明する。
ン生成部8は、上記複数記憶された正規化点ピッチパタ
ンから、合成しようとしている文節のモーラ数及びアク
セント型で決まる1つの正規化点ピッチパタンを検索す
る。次に、図1のステップS2及びステップS3のピッ
チ下降成分の付与について説明する。
【0022】自然発声から分析された点ピッチパタン
は、呼気圧の減少による緩やかなピッチ下降成分が重畳
されている。そこで合成時に、自然発声音に近づけるた
めに、下降成分を点ピッチパタンに与える。ピッチパタ
ン生成部8は、検索により取り出した点ピッチパタンに
対して、アクセント句内下降成分規則22を用いて、ア
クセント句内での下降成分を付与する。
は、呼気圧の減少による緩やかなピッチ下降成分が重畳
されている。そこで合成時に、自然発声音に近づけるた
めに、下降成分を点ピッチパタンに与える。ピッチパタ
ン生成部8は、検索により取り出した点ピッチパタンに
対して、アクセント句内下降成分規則22を用いて、ア
クセント句内での下降成分を付与する。
【0023】下降成分は、1型以外のパタンについて
は、図7に示すように、1モーラ目を基準とし、右さが
りになる様に整形する。1型の場合、平均ピッチがほぼ
Mモーラの中央のM/2の位置で0となるようにシフト
させる。いずれの型についても、ダイナミックレンジは
一定値をとるようにする。さらに、ピッチパタン生成部
8は、アクセント句内下降成分を付与した点ピッチパタ
ンに対して、アクセント句間下降成分規則23を用い
て、図8に示すようにアクセント句間での下降成分を付
与する。
は、図7に示すように、1モーラ目を基準とし、右さが
りになる様に整形する。1型の場合、平均ピッチがほぼ
Mモーラの中央のM/2の位置で0となるようにシフト
させる。いずれの型についても、ダイナミックレンジは
一定値をとるようにする。さらに、ピッチパタン生成部
8は、アクセント句内下降成分を付与した点ピッチパタ
ンに対して、アクセント句間下降成分規則23を用い
て、図8に示すようにアクセント句間での下降成分を付
与する。
【0024】次に、図1のステップS4の変形規則の適
用について説明する。ピッチパタン生成部8は、ステッ
プS3までで作られた点ピッチパタンに対し、第2のデ
ータベース24に記憶された変形規則を用いて、得られ
た点ピッチの値を基に、音韻境界に新たなピッチを与え
る、あるいは点ピッチパタンからあるピッチを削除する
というパタンの変形を行う。
用について説明する。ピッチパタン生成部8は、ステッ
プS3までで作られた点ピッチパタンに対し、第2のデ
ータベース24に記憶された変形規則を用いて、得られ
た点ピッチの値を基に、音韻境界に新たなピッチを与え
る、あるいは点ピッチパタンからあるピッチを削除する
というパタンの変形を行う。
【0025】変形方法について図9〜11を用いて説明
をする。なお、以下の説明において、Vは母音、Nは撥
音を表す。 1.語頭における拡張方法の例を図9を用いて説明す
る。本例の規則は、文節のアクセント型、音韻結合、モ
ーラ数が以下の条件を満たすときに適用される。
をする。なお、以下の説明において、Vは母音、Nは撥
音を表す。 1.語頭における拡張方法の例を図9を用いて説明す
る。本例の規則は、文節のアクセント型、音韻結合、モ
ーラ数が以下の条件を満たすときに適用される。
【0026】条件 (1型以外)&(語頭におけるVV,VN,NV)&
(4モーラ以上) すなわち、アクセント型が1型以外のものであり、語頭
つまり、第1モーラと第2モーラが、V−V,V−N,
N−Vのいずれかで結合され、モーラ数が4以上である
という3つの条件を満たしたとき、点ピッチパタンは以
下の規則により操作される。
(4モーラ以上) すなわち、アクセント型が1型以外のものであり、語頭
つまり、第1モーラと第2モーラが、V−V,V−N,
N−Vのいずれかで結合され、モーラ数が4以上である
という3つの条件を満たしたとき、点ピッチパタンは以
下の規則により操作される。
【0027】操作規則 a.第1モーラの母音重心点ピッチは、そのアクセント
句のアクセント核ピッチとする。なお、アクセント句と
は、1つの点ピッチパタンに代表される最小単位をい
う。 b.ただし、0型の場合は、最終モーラに一致させる。
句のアクセント核ピッチとする。なお、アクセント句と
は、1つの点ピッチパタンに代表される最小単位をい
う。 b.ただし、0型の場合は、最終モーラに一致させる。
【0028】c.第2モーラの重心点ピッチを、第1、
第2モーラの境界点ピッチへ移動させる。 d.ただし、2型の場合は、元の第1モーラピッチとの
平均値を、第1、第2モーラの境界点ピッチとする。 e.第2モーラの重心点ピッチは破棄する 以上の操作の結果、図9(a)の点ピッチパタンは
(b)の拡張点ピッチパタンに変形される。なお、図中
のCは子音を表す。
第2モーラの境界点ピッチへ移動させる。 d.ただし、2型の場合は、元の第1モーラピッチとの
平均値を、第1、第2モーラの境界点ピッチとする。 e.第2モーラの重心点ピッチは破棄する 以上の操作の結果、図9(a)の点ピッチパタンは
(b)の拡張点ピッチパタンに変形される。なお、図中
のCは子音を表す。
【0029】2.アクセント核における拡張方法の例を
図10を用いて説明する。本例の規則は、文節のアクセ
ント型及び音韻結合が以下の条件を満たすときに適用さ
れる。
図10を用いて説明する。本例の規則は、文節のアクセ
ント型及び音韻結合が以下の条件を満たすときに適用さ
れる。
【0030】条件 (1型以外)&(アクセント核と後続モーラがVV,V
N,NV) すなわち、アクセント型が1型以外のものであり、アク
セント核とその直後のモーラが、VV,VN,NVのい
ずれかで結合されるという2つの条件を満たしたとき、
以下の規則により操作される。
N,NV) すなわち、アクセント型が1型以外のものであり、アク
セント核とその直後のモーラが、VV,VN,NVのい
ずれかで結合されるという2つの条件を満たしたとき、
以下の規則により操作される。
【0031】操作規則 a.アクセント核モーラと後続モーラとの境界点ピッチ
は、アクセント核の重心点ピッチをそのまま使う。 b.後続モーラの重心ピッチは次の例外を除き破棄す
る。 b1.後続モーラの次のモーラが無声化される場合。
は、アクセント核の重心点ピッチをそのまま使う。 b.後続モーラの重心ピッチは次の例外を除き破棄す
る。 b1.後続モーラの次のモーラが無声化される場合。
【0032】b2.アクセント型が(アクセント句のモ
ーラ数−1)である場合。 以上の操作の結果、図10(a)の点ピッチパタンは
(b)の拡張点ピッチパタンに変形される。 3.1型アクセント句における拡張方法の例を図11を
用いて説明する。本例の規則は、文節のアクセント型及
び音韻結合が以下の条件を満たすときに適用される。
ーラ数−1)である場合。 以上の操作の結果、図10(a)の点ピッチパタンは
(b)の拡張点ピッチパタンに変形される。 3.1型アクセント句における拡張方法の例を図11を
用いて説明する。本例の規則は、文節のアクセント型及
び音韻結合が以下の条件を満たすときに適用される。
【0033】条件 (1型である)&(第一モーラと第二モーラがVV,V
N,NV) すなわち、アクセント型が1型である場合、第1モーラ
と第2モーラが、VV,VN,NVのいずれかで結合さ
れるという2つの条件を満たしたとき、以下の規則によ
り操作される。
N,NV) すなわち、アクセント型が1型である場合、第1モーラ
と第2モーラが、VV,VN,NVのいずれかで結合さ
れるという2つの条件を満たしたとき、以下の規則によ
り操作される。
【0034】操作規則 a.第1モーラ重心点ピッチを第1、第2モーラ境界ピ
ッチへ移動する。 b.第2モーラ重心点ピッチを破棄する。 c.ただし、2モーラ句の場合は、第2モーラの重心点
ピッチは保留する。 以上の操作の結果、図11(a)の点ピッチパタンは
(b)の拡張点ピッチパタンに変形される。
ッチへ移動する。 b.第2モーラ重心点ピッチを破棄する。 c.ただし、2モーラ句の場合は、第2モーラの重心点
ピッチは保留する。 以上の操作の結果、図11(a)の点ピッチパタンは
(b)の拡張点ピッチパタンに変形される。
【0035】これらの規則は、自然音声の分析値観測の
結果から、経験的に得られたものであるが、生成された
拡張点ピッチパタンは、自然音と比べて遜色ないパタン
が得られており、合成された音声は従来の点ピッチモデ
ルに比べ自然性が向上されている。なお、以上の規則
は、アクセント型と音韻の結合のみに対応した規則とす
ることもできる。
結果から、経験的に得られたものであるが、生成された
拡張点ピッチパタンは、自然音と比べて遜色ないパタン
が得られており、合成された音声は従来の点ピッチモデ
ルに比べ自然性が向上されている。なお、以上の規則
は、アクセント型と音韻の結合のみに対応した規則とす
ることもできる。
【0036】この様に、拡張点ピッチモデルは、従来技
術の点ピッチモデルと同じピッチパタンデータベースを
用いながら、自然音声の現象に合致する様に制御の自由
度を上げ、規則によってそれを実現したものである。上
記で上げた変形規則は、品質に大きく影響する語頭やア
クセント核におけるVV結合であるが、この他にも、プ
ロミネンス制御、声質制御、促音化、無声化、発話速速
度変化によって変化する様々なピッチパタンを、本モデ
ルは表現する事が可能である。
術の点ピッチモデルと同じピッチパタンデータベースを
用いながら、自然音声の現象に合致する様に制御の自由
度を上げ、規則によってそれを実現したものである。上
記で上げた変形規則は、品質に大きく影響する語頭やア
クセント核におけるVV結合であるが、この他にも、プ
ロミネンス制御、声質制御、促音化、無声化、発話速速
度変化によって変化する様々なピッチパタンを、本モデ
ルは表現する事が可能である。
【0037】
【発明の効果】以上で説明したように、本発明によれ
ば、従来方法の点ピッチパタンを用い、規則により境界
ピッチを設定する事によって、より自然音声に近いピッ
チパタンを得る事ができるようになる。その結果、合成
音の自然性は向上する。
ば、従来方法の点ピッチパタンを用い、規則により境界
ピッチを設定する事によって、より自然音声に近いピッ
チパタンを得る事ができるようになる。その結果、合成
音の自然性は向上する。
【図1】本発明の実施例のピッチパタン生成部及び韻律
制御規則の詳細を示すブロック図。
制御規則の詳細を示すブロック図。
【図2】本発明の実施例の日本語音声合成システム全体
の構成を示す図。
の構成を示す図。
【図3】正規化点ピッチパタンを示す図(その1)。
【図4】正規化点ピッチパタンを示す図(その2)。
【図5】正規化点ピッチパタンを示す図(その3)。
【図6】正規化点ピッチパタンを示す図(その4)。
【図7】アクセント句内での下降成分の付与方法を説明
する図。
する図。
【図8】アクセント句間での下降成分の付与方法を説明
する図。
する図。
【図9】図1のピッチパタン生成部により実行される語
頭における拡張方法を説明するための図。
頭における拡張方法を説明するための図。
【図10】図1のピッチパタン生成部により実行される
アクセント核における拡張方法を説明するための図。
アクセント核における拡張方法を説明するための図。
【図11】図1のピッチパタン生成部により実行される
1型アクセント句における拡張方法を説明するための
図。
1型アクセント句における拡張方法を説明するための
図。
8…ピッチパタン生成部 9…韻律制御規則 21…第1のデータベース(正規化点ピッチパタン) 22…アクセント句内下降成分規則 23…アクセント句間下降成分規則 24…第2のデータベース(変形規則)
Claims (3)
- 【請求項1】 音声合成装置において、アクセント型に
よる点ピッチパタンを記憶した第1のデータベース部
と、アクセント型と音韻の結合に対応した規則を記憶し
た第2のデータベース部と、音声合成の対象となる文節
に対応した点ピッチパタンを第1のデータベース部より
検索し、得られた点ピッチパタンから第2のデータベー
ス部の規則を基に新たな点ピッチパタンを生成するピッ
チパタン生成部を具備することを特徴とする音声合成装
置。 - 【請求項2】 前記第2のデータベース部に記憶されて
いる規則は、アクセント型と音韻の結合とモーラ数との
組合せに対応したものであることを特徴とする請求項1
記載の音声合成装置。 - 【請求項3】 前記第1のデータベース部に記憶されて
いる点ピッチパタンに下降成分を加えた後、前記規則を
適用し、新たな点ピッチパタンを生成することを特徴と
する請求項1記載の音声合成装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6221683A JPH0887296A (ja) | 1994-09-16 | 1994-09-16 | 音声合成装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6221683A JPH0887296A (ja) | 1994-09-16 | 1994-09-16 | 音声合成装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0887296A true JPH0887296A (ja) | 1996-04-02 |
Family
ID=16770646
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6221683A Pending JPH0887296A (ja) | 1994-09-16 | 1994-09-16 | 音声合成装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0887296A (ja) |
Cited By (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH1169476A (ja) * | 1997-08-26 | 1999-03-09 | Secom Co Ltd | 発声補助用人工喉頭 |
| US7428411B2 (en) * | 2000-12-19 | 2008-09-23 | At&T Delaware Intellectual Property, Inc. | Location-based security rules |
| US7593712B2 (en) | 2000-12-19 | 2009-09-22 | At&T Intellectual Property I, L.P. | System and method for using location information to execute an action |
| US8843515B2 (en) | 2012-03-07 | 2014-09-23 | Snap Trends, Inc. | Methods and systems of aggregating information of social networks based on geographical locations via a network |
| US8874140B2 (en) | 2000-12-19 | 2014-10-28 | At&T Intellectual Property I, L.P. | Location blocking service from a wireless service provider |
| US8887177B2 (en) | 2008-03-14 | 2014-11-11 | William J. Johnson | System and method for automated content distribution objects |
| US8886226B2 (en) | 2008-03-14 | 2014-11-11 | William J. Johnson | System and method for timely whereabouts determination by a mobile data processing system |
| US8897742B2 (en) | 2009-11-13 | 2014-11-25 | William J. Johnson | System and method for sudden proximal user interface |
| US8942693B2 (en) | 2008-03-14 | 2015-01-27 | William J. Johnson | System and method for targeting data processing system(s) with data |
| US8942732B2 (en) | 2008-03-14 | 2015-01-27 | William J. Johnson | Location based exchange operating system |
| US9466076B2 (en) | 2000-12-19 | 2016-10-11 | At&T Intellectual Property I, L.P. | Location blocking service from a web advertiser |
| US9477991B2 (en) | 2013-08-27 | 2016-10-25 | Snap Trends, Inc. | Methods and systems of aggregating information of geographic context regions of social networks based on geographical locations via a network |
| US9501780B2 (en) | 2000-12-19 | 2016-11-22 | At&T Intellectual Property I, L.P. | Surveying wireless device users by location |
| US9571958B2 (en) | 2000-06-30 | 2017-02-14 | At&T Intellectual Propery I, L.P. | Anonymous location service for wireless networks |
| US9648454B2 (en) | 2000-12-19 | 2017-05-09 | At&T Intellectual Property I, L.P. | System and method for permission to access mobile location information |
| US9894489B2 (en) | 2013-09-30 | 2018-02-13 | William J. Johnson | System and method for situational proximity observation alerting privileged recipients |
| US10477994B2 (en) | 2008-03-14 | 2019-11-19 | William J. Johnson | System and method for location based exchanges of data facilitiating distributed locational applications |
-
1994
- 1994-09-16 JP JP6221683A patent/JPH0887296A/ja active Pending
Cited By (41)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH1169476A (ja) * | 1997-08-26 | 1999-03-09 | Secom Co Ltd | 発声補助用人工喉頭 |
| US9571958B2 (en) | 2000-06-30 | 2017-02-14 | At&T Intellectual Propery I, L.P. | Anonymous location service for wireless networks |
| US9852450B2 (en) | 2000-12-19 | 2017-12-26 | At&T Intellectual Property I, L.P. | Location blocking service from a web advertiser |
| US10354079B2 (en) | 2000-12-19 | 2019-07-16 | Google Llc | Location-based security rules |
| US8874140B2 (en) | 2000-12-19 | 2014-10-28 | At&T Intellectual Property I, L.P. | Location blocking service from a wireless service provider |
| US10217137B2 (en) | 2000-12-19 | 2019-02-26 | Google Llc | Location blocking service from a web advertiser |
| US7593712B2 (en) | 2000-12-19 | 2009-09-22 | At&T Intellectual Property I, L.P. | System and method for using location information to execute an action |
| US9763091B2 (en) | 2000-12-19 | 2017-09-12 | At&T Intellectual Property I, L.P. | Location blocking service from a wireless service provider |
| US9648454B2 (en) | 2000-12-19 | 2017-05-09 | At&T Intellectual Property I, L.P. | System and method for permission to access mobile location information |
| US9584647B2 (en) | 2000-12-19 | 2017-02-28 | At&T Intellectual Property I, L.P. | System and method for remote control of appliances utilizing mobile location-based applications |
| US7428411B2 (en) * | 2000-12-19 | 2008-09-23 | At&T Delaware Intellectual Property, Inc. | Location-based security rules |
| US9501780B2 (en) | 2000-12-19 | 2016-11-22 | At&T Intellectual Property I, L.P. | Surveying wireless device users by location |
| US9466076B2 (en) | 2000-12-19 | 2016-10-11 | At&T Intellectual Property I, L.P. | Location blocking service from a web advertiser |
| US9204275B2 (en) | 2008-03-14 | 2015-12-01 | William J. Johnson | System and method for targeting data processing system(s) with data |
| US9456303B2 (en) | 2008-03-14 | 2016-09-27 | William J. Johnson | System and method for service access via hopped wireless mobile device(s) |
| US9078095B2 (en) | 2008-03-14 | 2015-07-07 | William J. Johnson | System and method for location based inventory management |
| US9088868B2 (en) | 2008-03-14 | 2015-07-21 | William J. Johnson | Location based exchange permissions |
| US9088869B2 (en) | 2008-03-14 | 2015-07-21 | William J. Johnson | System and method for application search results by locational conditions |
| US9100792B2 (en) | 2008-03-14 | 2015-08-04 | William J. Johnson | System and method for service-free location based applications |
| US9113295B2 (en) | 2008-03-14 | 2015-08-18 | William J. Johnson | System and method for location based exchange vicinity interest specification |
| US9014658B2 (en) | 2008-03-14 | 2015-04-21 | William J. Johnson | System and method for application context location based configuration suggestions |
| US9253597B2 (en) | 2008-03-14 | 2016-02-02 | William J. Johnson | System and method for determining mobile users of interest |
| US9392408B2 (en) | 2008-03-14 | 2016-07-12 | William J. Johnson | System and method for location based exchanges of data facilitating distributed locational applications |
| US9445238B2 (en) | 2008-03-14 | 2016-09-13 | William J. Johnson | System and method for confirming data processing system target(s) |
| US8886226B2 (en) | 2008-03-14 | 2014-11-11 | William J. Johnson | System and method for timely whereabouts determination by a mobile data processing system |
| US8942733B2 (en) | 2008-03-14 | 2015-01-27 | William J. Johnson | System and method for location based exchanges of data facilitating distributed location applications |
| US10477994B2 (en) | 2008-03-14 | 2019-11-19 | William J. Johnson | System and method for location based exchanges of data facilitiating distributed locational applications |
| US8942732B2 (en) | 2008-03-14 | 2015-01-27 | William J. Johnson | Location based exchange operating system |
| US8942693B2 (en) | 2008-03-14 | 2015-01-27 | William J. Johnson | System and method for targeting data processing system(s) with data |
| US8923806B2 (en) | 2008-03-14 | 2014-12-30 | William J. Johnson | System and method for presenting application data by data processing system(s) in a vicinity |
| US9584993B2 (en) | 2008-03-14 | 2017-02-28 | William J. Johnson | System and method for vector processing on behalf of image aperture aim |
| US8887177B2 (en) | 2008-03-14 | 2014-11-11 | William J. Johnson | System and method for automated content distribution objects |
| US9055406B2 (en) | 2008-03-14 | 2015-06-09 | William J. Johnson | Server-less synchronized processing across a plurality of interoperating data processing systems |
| US10111034B2 (en) | 2008-03-14 | 2018-10-23 | Billjco Llc | System and method for sound wave triggered content |
| US8897741B2 (en) | 2009-11-13 | 2014-11-25 | William J. Johnson | System and method for mobile device usability by locational conditions |
| US8897742B2 (en) | 2009-11-13 | 2014-11-25 | William J. Johnson | System and method for sudden proximal user interface |
| US9626446B2 (en) | 2012-03-07 | 2017-04-18 | Snap Trends, Inc. | Methods and systems of advertising based on aggregated information of social networks within geographical locations via a network |
| US8843515B2 (en) | 2012-03-07 | 2014-09-23 | Snap Trends, Inc. | Methods and systems of aggregating information of social networks based on geographical locations via a network |
| US9477991B2 (en) | 2013-08-27 | 2016-10-25 | Snap Trends, Inc. | Methods and systems of aggregating information of geographic context regions of social networks based on geographical locations via a network |
| US9894489B2 (en) | 2013-09-30 | 2018-02-13 | William J. Johnson | System and method for situational proximity observation alerting privileged recipients |
| US10194293B2 (en) | 2013-09-30 | 2019-01-29 | William J. Johnson | System and method for vital signs alerting privileged recipients |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4302788B2 (ja) | 音声合成用の基本周波数テンプレートを収容する韻律データベース | |
| US6470316B1 (en) | Speech synthesis apparatus having prosody generator with user-set speech-rate- or adjusted phoneme-duration-dependent selective vowel devoicing | |
| JP3361066B2 (ja) | 音声合成方法および装置 | |
| KR102168529B1 (ko) | 인공신경망을 이용한 가창음성 합성 방법 및 장치 | |
| JPH0887296A (ja) | 音声合成装置 | |
| EP1688911B1 (en) | Singing voice synthesizing apparatus and method | |
| JPH11249677A (ja) | 音声合成装置の韻律制御方法 | |
| JPH0632020B2 (ja) | 音声合成方法および装置 | |
| JP2761552B2 (ja) | 音声合成方法 | |
| JPH0887297A (ja) | 音声合成システム | |
| JP3437064B2 (ja) | 音声合成装置 | |
| JPH07140996A (ja) | 音声規則合成装置 | |
| JPH0580791A (ja) | 音声規則合成装置および方法 | |
| JPH06318094A (ja) | 音声規則合成装置 | |
| JPH037995A (ja) | 歌音声合成データの作成装置 | |
| Waghmare et al. | Analysis of pitch and duration in speech synthesis using PSOLA | |
| Khalil et al. | Arabic speech synthesis based on HMM | |
| JP2755478B2 (ja) | テキスト音声合成装置 | |
| JP3368948B2 (ja) | 音声規則合成装置 | |
| JP2006084854A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
| JPH04350699A (ja) | テキスト音声合成装置 | |
| JP2995814B2 (ja) | 音声合成方法 | |
| JP3314116B2 (ja) | 音声規則合成装置 | |
| Zaki et al. | Rules based model for automatic synthesis of F0 variation for declarative arabic sentences | |
| JPH1097268A (ja) | 音声合成装置 |