JPS593497A - 規則合成方式における補間制御方式 - Google Patents
規則合成方式における補間制御方式Info
- Publication number
- JPS593497A JPS593497A JP57112881A JP11288182A JPS593497A JP S593497 A JPS593497 A JP S593497A JP 57112881 A JP57112881 A JP 57112881A JP 11288182 A JP11288182 A JP 11288182A JP S593497 A JPS593497 A JP S593497A
- Authority
- JP
- Japan
- Prior art keywords
- information
- fundamental frequency
- rule
- interpolation
- amplitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Analogue/Digital Conversion (AREA)
- Supply And Distribution Of Alternating Current (AREA)
- Feedback Control In General (AREA)
- Filters And Equalizers (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は規則合成方式の蒔声合成装+tic関し、簡単
な制御により十分な性能が得られるようにしたものであ
る。
な制御により十分な性能が得られるようにしたものであ
る。
〔発明の従来技術J
音声出力装置に杜大別して2通シの出力方式がある。1
つは出力すべき単語ないし文章をすべて側窓しておき、
それらを所望の組合わせで順次出力するものであるが、
出力すべき文章の種類が多数の場合には膨大な記憶容量
を必要とする欠点がある7 辷れに対して本願の対象とする出力方式は、自然音声の
音韻単位を必要な種類だけバラメータ化して用意してお
き、任意の単語ないし文章をそれら音韻単位から合成す
る規則合成方式である この場合、各音韻単位を並べる
だけでなく、それらのピッチや振幅を制御して、より自
然な音声とすることができる。1 〔従来技術の問題点〕 従来方式に訃いて、人間の発声に近い滑らかな基本周波
数の時間変化パターンを得るためには、10m5ec程
度の短い時間間隔にて、関数近位等の1を雑な手段を用
いて基本周波数を設定する必要があった。
つは出力すべき単語ないし文章をすべて側窓しておき、
それらを所望の組合わせで順次出力するものであるが、
出力すべき文章の種類が多数の場合には膨大な記憶容量
を必要とする欠点がある7 辷れに対して本願の対象とする出力方式は、自然音声の
音韻単位を必要な種類だけバラメータ化して用意してお
き、任意の単語ないし文章をそれら音韻単位から合成す
る規則合成方式である この場合、各音韻単位を並べる
だけでなく、それらのピッチや振幅を制御して、より自
然な音声とすることができる。1 〔従来技術の問題点〕 従来方式に訃いて、人間の発声に近い滑らかな基本周波
数の時間変化パターンを得るためには、10m5ec程
度の短い時間間隔にて、関数近位等の1を雑な手段を用
いて基本周波数を設定する必要があった。
乙
また、これら基本周波数の計算処理は、一般周波数の対
数値を用いて行なわれる。とれは人間の聴感上は周波数
の対数に応じて操作する方が優れた近似が得られること
による。しかし、この基本周波数情報に応じて音声信号
を作成する、いわゆる音声合成r、5xFiすべて基本
周期(周波数の逆数)を入力するようになっておシ従っ
て周波数の対数を周期に変換する必要があシ、その六め
の複雑な回路及び変換処理時間を要するという問題があ
る。
数値を用いて行なわれる。とれは人間の聴感上は周波数
の対数に応じて操作する方が優れた近似が得られること
による。しかし、この基本周波数情報に応じて音声信号
を作成する、いわゆる音声合成r、5xFiすべて基本
周期(周波数の逆数)を入力するようになっておシ従っ
て周波数の対数を周期に変換する必要があシ、その六め
の複雑な回路及び変換処理時間を要するという問題があ
る。
さらに、2つの音韻単位を接続する場合、第1の音韻単
位の最終振幅と第2の音韻単位の初期捩輻とが異なる場
合、その間を清らかになるよう補間する必要がある。こ
の振幅情報社一般に対数表示をさらに情報圧縮した形式
のパラメータで与えられるが、これを補間するには一但
整数表現にしてから補間し、再度元のパラメータ形式に
戻して音声合成LSIに入力しておシ、そのための回路
及び処理時間も大きくなるという問題がある、 (発明の目的〕 御所の羽的号一 本発明はこれらの問題を解決し、簡単な回路で高速処理
ができ、かつ十分な性能を得られる音声合成制御方式を
提供することにある。
位の最終振幅と第2の音韻単位の初期捩輻とが異なる場
合、その間を清らかになるよう補間する必要がある。こ
の振幅情報社一般に対数表示をさらに情報圧縮した形式
のパラメータで与えられるが、これを補間するには一但
整数表現にしてから補間し、再度元のパラメータ形式に
戻して音声合成LSIに入力しておシ、そのための回路
及び処理時間も大きくなるという問題がある、 (発明の目的〕 御所の羽的号一 本発明はこれらの問題を解決し、簡単な回路で高速処理
ができ、かつ十分な性能を得られる音声合成制御方式を
提供することにある。
本発明は上記欠点を解決するため、先ず、基本周波数を
制御する情報は大まかな近似で与え、その情報(デジタ
ル情報)をデジタルフィルタによシ平滑化することで、
細かい近似で与えた場合に近い滑らかさを得るようにし
ている。
制御する情報は大まかな近似で与え、その情報(デジタ
ル情報)をデジタルフィルタによシ平滑化することで、
細かい近似で与えた場合に近い滑らかさを得るようにし
ている。
また、この基本周波数情報をピッチ周期に基づくパラメ
ータに変換するのにテープlv索引方式を採用し、ハー
ドウェアの単純化、特性変更の容易化を達成する。
ータに変換するのにテープlv索引方式を採用し、ハー
ドウェアの単純化、特性変更の容易化を達成する。
また、振幅情報の補間処理においては、−但整数値に変
換することをせず、捩幅パヲメータをそのまま純2進数
と見なして補間することによシ、高速かつ高性能の補間
処理を行なうようにしている。
換することをせず、捩幅パヲメータをそのまま純2進数
と見なして補間することによシ、高速かつ高性能の補間
処理を行なうようにしている。
第1図は、規則合成方式の説明図であり、「ヤマガタ」
という単語を合成する場合を例にしている。音韻単位の
分は形にはいくつかの方式があるが、ここではいわゆる
VCV (母音・子音・母音)の組合わせを用いている
。
という単語を合成する場合を例にしている。音韻単位の
分は形にはいくつかの方式があるが、ここではいわゆる
VCV (母音・子音・母音)の組合わせを用いている
。
[YAMAGATAJは5つの音韻単位「YAJ。
1’−AMAJ 、 [AGAJ 、 [ATAJ 、
[AJを接続して得られる。(同図(a)) 各単位間は同一母音で接続すればよいので、自然な接続
が比較的容易に得られる。
[AJを接続して得られる。(同図(a)) 各単位間は同一母音で接続すればよいので、自然な接続
が比較的容易に得られる。
同図(b)は、基本周波数情報(対数表現)を示してお
シ、「マ」にアクセントがあることを示している。
シ、「マ」にアクセントがあることを示している。
同図(c)は、基本周波数のピッチ(周期)表現を示し
ておシ、対数表現では直線のものが周期では曲線になっ
ている。
ておシ、対数表現では直線のものが周期では曲線になっ
ている。
第2図は、本発明の一実施例ブロック図であり、1は合
成すべき単語/文章を文字コードで入力する手段・2は
文字列を音韻単位(VCV)の系列情報へ変換する手段
、3は音韻単位の系列をV、Cの系列情報へ分解整列す
る手段、4はアクセント、イントネーションのパターン
を指定する手段、5は韻律テーブルでイントネーション
等に応じたパラメータを与えるもの、6は基本周波数や
各音韻間の接続時間の時系列的なパターンを作成する手
段、7はデジタルフィルタ、8は変換テーブル、9は各
音韻単位(VCV )が、例えば10m5ecのサンプ
リング周期でバフメータ化されて格納されたファイル、
10はvC■パラメータを結合する手段、11がパラメ
ータに応じて音声信号を合成する手段、12はスピーカ
である。
成すべき単語/文章を文字コードで入力する手段・2は
文字列を音韻単位(VCV)の系列情報へ変換する手段
、3は音韻単位の系列をV、Cの系列情報へ分解整列す
る手段、4はアクセント、イントネーションのパターン
を指定する手段、5は韻律テーブルでイントネーション
等に応じたパラメータを与えるもの、6は基本周波数や
各音韻間の接続時間の時系列的なパターンを作成する手
段、7はデジタルフィルタ、8は変換テーブル、9は各
音韻単位(VCV )が、例えば10m5ecのサンプ
リング周期でバフメータ化されて格納されたファイル、
10はvC■パラメータを結合する手段、11がパラメ
ータに応じて音声信号を合成する手段、12はスピーカ
である。
イントネーション情報等によって音韻テープ/L15を
索引して基本周波数情報(log f)を求める場合、
従来では充分滑らかなlogf曲線を得るには、この音
韻テーブル5の情報を上記サンプリング周期と同程度の
周期で詳細に用意するか、又はテープ/%15の情報は
粗っぽくしてその代シ比較的複雑な所定の関数を用いて
その間を補間するかしていた。
索引して基本周波数情報(log f)を求める場合、
従来では充分滑らかなlogf曲線を得るには、この音
韻テーブル5の情報を上記サンプリング周期と同程度の
周期で詳細に用意するか、又はテープ/%15の情報は
粗っぽくしてその代シ比較的複雑な所定の関数を用いて
その間を補間するかしていた。
これに対して本発明ではテープ/L15の情報は例えば
100111161j 毎程度に粗つホ<シ、かつ補
間は直線補間等の単純な関数で行なう。その代り、その
情報はデジタルフィルり7にて平滑化を施される。
100111161j 毎程度に粗つホ<シ、かつ補
間は直線補間等の単純な関数で行なう。その代り、その
情報はデジタルフィルり7にて平滑化を施される。
第3図は、デジタルフィルタ7の一実施例であり、入力
Xは減算器31にて出力Yの遅延(Z”’)したものY
X’□Iのと差をとられ、それをアンプ32でa倍(1
>a>O)L、それにYX]を加算器33で加算して出
力される。出力Yは1サンプリング周期(例えば10m
mee)遅延素子34で遅延されて減算@?;3X+加
算器33にフィードバックされる。この回路の伝達特性
は、 Y a であり、Z = 1− aのときに極であり、S平面に
写像すると、Z=e”πfT となる。ここでfは極
周波数、Tはサンプリング周期である。
Xは減算器31にて出力Yの遅延(Z”’)したものY
X’□Iのと差をとられ、それをアンプ32でa倍(1
>a>O)L、それにYX]を加算器33で加算して出
力される。出力Yは1サンプリング周期(例えば10m
mee)遅延素子34で遅延されて減算@?;3X+加
算器33にフィードバックされる。この回路の伝達特性
は、 Y a であり、Z = 1− aのときに極であり、S平面に
写像すると、Z=e”πfT となる。ここでfは極
周波数、Tはサンプリング周期である。
今、a−1/4 、 T == 0.01秒とすると、
ハf−J n (1a )中4.6Hz 。
ハf−J n (1a )中4.6Hz 。
2πT
即ち、カットオフ周波数4.6Hz、−6db10ct
のローパス・フィルタトナル。
のローパス・フィルタトナル。
このようなフィルタを用いれば第1図(b)の実線のよ
うな直線近似でも同図点線のような滑らかなlog f
情報となる。
うな直線近似でも同図点線のような滑らかなlog f
情報となる。
さらに、このようにして得た基本周波数の対数表現情報
を周期情報に変換するには変換テーブル8を用いる。第
4図はテーブルの一実施例ヲ示シ、ROM (リードオ
ンリーメモリ)を用い、入力には例えば8ビツト2進数
で(0〜255)+oが与えられ、これに対して出力に
は7ビツト2進数で(111〜21)10が出力される
。
を周期情報に変換するには変換テーブル8を用いる。第
4図はテーブルの一実施例ヲ示シ、ROM (リードオ
ンリーメモリ)を用い、入力には例えば8ビツト2進数
で(0〜255)+oが与えられ、これに対して出力に
は7ビツト2進数で(111〜21)10が出力される
。
このようなテーブル変換方式によればROMを変換又は
切換えるのみで、任意の特性の装置に変換することがで
きる。例えば男声から女声への変更等が容易に行なえる
。。
切換えるのみで、任意の特性の装置に変換することがで
きる。例えば男声から女声への変更等が容易に行なえる
。。
また、各音韻単位間の振幅補間は以下のとおシに行なう
。
。
尚、VCVファイル9には各音韻単位が10malee
毎の各種パラメータの時系列集合として記憶されている
。振幅情報もそのパラメータの1つである。第1図(a
)の[YAJの最後と[AMAJの最初のように同一母
音rAJでもその振幅は一般に異なっており、それらを
接続するときには滑らかにつながるように補間を施す必
要がある。パラメータ中の振幅W報は一般に次表のよう
に表わされる。
毎の各種パラメータの時系列集合として記憶されている
。振幅情報もそのパラメータの1つである。第1図(a
)の[YAJの最後と[AMAJの最初のように同一母
音rAJでもその振幅は一般に異なっており、それらを
接続するときには滑らかにつながるように補間を施す必
要がある。パラメータ中の振幅W報は一般に次表のよう
に表わされる。
即ち、lO進整数は浮動小数点の2進表示にされ、その
小数点以下第1桁は常に”1”であるので(正規化しで
ある故)それを省いてビット数を圧縮している。
小数点以下第1桁は常に”1”であるので(正規化しで
ある故)それを省いてビット数を圧縮している。
例えば、ある音韻の最終振幅パフメータが”10001
”で、次の音韻の最初の振幅パラメータが10101”
の場合、従来は各パラメータを整数値”10”と”20
″とに一但変換し、その間の直線補間をとって再びパラ
メータ形式に戻し7ている。
”で、次の音韻の最初の振幅パラメータが10101”
の場合、従来は各パラメータを整数値”10”と”20
″とに一但変換し、その間の直線補間をとって再びパラ
メータ形式に戻し7ている。
これに対して本発明ではパラメータ形式をそのまま純2
進数と見なして直接に直線補間を行なう。即ち、」1記
の例では10001 ”と”101旧”の差は0010
0”であシ、仮りに4点間に直線補間するとすれば、各
点に”00001”の差をつければよい。
進数と見なして直接に直線補間を行なう。即ち、」1記
の例では10001 ”と”101旧”の差は0010
0”であシ、仮りに4点間に直線補間するとすれば、各
点に”00001”の差をつければよい。
従って前夫のとおりパラメータ形式は、”10001″
から10101″ 捷で”00001″きざみで補間さ
れる。これを10進表示に直してみると、610″、”
12’、’14″、″16”、′20”となり、指数関
数的な補間になっているのが判この方法は無駄な変換が
不要なだけでなく、b むしち聴感特性上も優れているという効果がある。とい
うのは人間の聴感上は周波数、振幅等が対数的に変化し
ても、それが直線的な変化にしか感じないという特性が
あり、補間を施すにも対数関数的な補間の方が優れてい
るのである。
から10101″ 捷で”00001″きざみで補間さ
れる。これを10進表示に直してみると、610″、”
12’、’14″、″16”、′20”となり、指数関
数的な補間になっているのが判この方法は無駄な変換が
不要なだけでなく、b むしち聴感特性上も優れているという効果がある。とい
うのは人間の聴感上は周波数、振幅等が対数的に変化し
ても、それが直線的な変化にしか感じないという特性が
あり、補間を施すにも対数関数的な補間の方が優れてい
るのである。
第5図に補間用回路の例を示すが、この回路はVCV結
合部10の中にあると考えてよい。
合部10の中にあると考えてよい。
前回の音韻単位の最終振幅パラメータはレジスタ41に
、また次音韻単位の先頭振幅パフメータはVジメタ42
にセットされ、夫々を純2進数として減算器43にて差
をとる。
、また次音韻単位の先頭振幅パフメータはVジメタ42
にセットされ、夫々を純2進数として減算器43にて差
をとる。
一方、音韻単位間の接続時間を決定する手段6からの接
続時間(サンプル点数)でその差を除算器44で割り、
その商を加算器45にて前回最終振幅値に加算して行け
ばよい。
続時間(サンプル点数)でその差を除算器44で割り、
その商を加算器45にて前回最終振幅値に加算して行け
ばよい。
以上の如く本発明によれば、単純な回路で単純な処理を
行なうことで従来と同等、或いはより優れた特性を得る
ことができ、音声出力装置のコストダウン化に有効であ
る。
行なうことで従来と同等、或いはより優れた特性を得る
ことができ、音声出力装置のコストダウン化に有効であ
る。
第1図は規則合成方式の説明図、第2図は本発明の一寮
施例概略ブロック図、第3図はテ゛ジタルフィルりの一
実施例ブロック図、第4図は変換テーブルの一夾施例グ
ロック図、第5図は第1 図 躬 2 回
施例概略ブロック図、第3図はテ゛ジタルフィルりの一
実施例ブロック図、第4図は変換テーブルの一夾施例グ
ロック図、第5図は第1 図 躬 2 回
Claims (1)
- 複数の音韻単位を所定周期でサンプリングし、少なくと
も周波数情報又は振幅情報を正規化された2進浮動小数
点表現に変換し、さらにその小数点以下第1桁を削除し
た形式で蓄積し、所望の音韻単位を接続して音声合成す
る規則合成方式において、上記形式の情報の補間処理に
当たって上記形式の指数部及び第1桁を削除された小数
点部を純2進数の上位桁とみなして直線補間することを
特徴とする規則合成方式における補間制御方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57112881A JPS593497A (ja) | 1982-06-30 | 1982-06-30 | 規則合成方式における補間制御方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57112881A JPS593497A (ja) | 1982-06-30 | 1982-06-30 | 規則合成方式における補間制御方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS593497A true JPS593497A (ja) | 1984-01-10 |
| JPH0358519B2 JPH0358519B2 (ja) | 1991-09-05 |
Family
ID=14597857
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57112881A Granted JPS593497A (ja) | 1982-06-30 | 1982-06-30 | 規則合成方式における補間制御方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS593497A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7155390B2 (en) | 2000-03-31 | 2006-12-26 | Canon Kabushiki Kaisha | Speech information processing method and apparatus and storage medium using a segment pitch pattern model |
-
1982
- 1982-06-30 JP JP57112881A patent/JPS593497A/ja active Granted
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7155390B2 (en) | 2000-03-31 | 2006-12-26 | Canon Kabushiki Kaisha | Speech information processing method and apparatus and storage medium using a segment pitch pattern model |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0358519B2 (ja) | 1991-09-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CA1065490A (en) | Emphasis controlled speech synthesizer | |
| US5490234A (en) | Waveform blending technique for text-to-speech system | |
| US3158685A (en) | Synthesis of speech from code signals | |
| EP1422693A1 (en) | PITCH WAVEFORM SIGNAL GENERATION APPARATUS, PITCH WAVEFORM SIGNAL GENERATION METHOD, AND PROGRAM | |
| Bonada et al. | Sample-based singing voice synthesizer by spectral concatenation | |
| WO1982002109A1 (en) | Method and system for modelling a sound channel and speech synthesizer using the same | |
| GB2050125A (en) | Data converter for a speech synthesizer | |
| US6480550B1 (en) | Method of compressing an analogue signal | |
| JPH0642149B2 (ja) | 電子楽器 | |
| JPS593497A (ja) | 規則合成方式における補間制御方式 | |
| JPS593496A (ja) | 規則合成方式における基本周波数制御方式 | |
| WO2002013182A1 (en) | Digital signal processing method, learning method, apparatuses for them, and program storage medium | |
| JPS593495A (ja) | 規則合成方式における基本周波数制御方式 | |
| JPH03233500A (ja) | 音声合成方式およびこれに用いる装置 | |
| JP4468506B2 (ja) | 音声データ作成装置および声質変換方法 | |
| JPS58161000A (ja) | 音声合成器 | |
| JPH05127697A (ja) | ホルマントの線形転移区間の分割による音声の合成方法 | |
| Makhoul | Methods for nonlinear spectral distortion of speech signals | |
| JP2003066983A (ja) | 音声合成装置および音声合成方法、並びに、プログラム記録媒体 | |
| JPS5915996A (ja) | 音声合成装置 | |
| JPS5968793A (ja) | 音声合成装置 | |
| JPS63285597A (ja) | 音素接続形パラメ−タ規則合成方式 | |
| KR20020084201A (ko) | 오디오 또는 음성 신호를 인코딩하기 위한 파라메트릭인코더 및 방법 | |
| Ainsworth | A real-time speech synthesis system | |
| JPS61172200A (ja) | 音声合成装置 |