JPH01262598A - 音声合成装置の発声速度制御回路 - Google Patents

音声合成装置の発声速度制御回路

Info

Publication number
JPH01262598A
JPH01262598A JP63091131A JP9113188A JPH01262598A JP H01262598 A JPH01262598 A JP H01262598A JP 63091131 A JP63091131 A JP 63091131A JP 9113188 A JP9113188 A JP 9113188A JP H01262598 A JPH01262598 A JP H01262598A
Authority
JP
Japan
Prior art keywords
speech
spectrum
conversion means
converting
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63091131A
Other languages
English (en)
Other versions
JP2956936B2 (ja
Inventor
Yoshinori Kitahara
義典 北原
Yoichi Higashikura
東倉 洋一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
A T R SHICHIYOUKAKU KIKO KENKYUSHO KK
Original Assignee
A T R SHICHIYOUKAKU KIKO KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by A T R SHICHIYOUKAKU KIKO KENKYUSHO KK filed Critical A T R SHICHIYOUKAKU KIKO KENKYUSHO KK
Priority to JP63091131A priority Critical patent/JP2956936B2/ja
Publication of JPH01262598A publication Critical patent/JPH01262598A/ja
Application granted granted Critical
Publication of JP2956936B2 publication Critical patent/JP2956936B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は音声合成装置の発声速度制御回路に関し、特
に、音声合成装置において発声速度を変化させた場合で
あっても、聴取者にとって自然で聞きやすい合成音を出
力するような発声速度制御回路に関する。
【従来の技術および発明が解決しようとする課功]従来
の音声合成装置は、たとえば特開昭50−153807
号公報に記載されているように、/p/、/l/、/に
/のような破裂性の短時間子音では伸縮率を小さくし、
また安定した母音では伸縮率を大きくして、音韻単位で
合成音の発声速度を制御するようにしていた。しかしな
がら、単に音韻側に伸縮率を変えるだけでは、細かい音
韻性の保存に対する配慮が不十分であり、合成音を聴取
したとき、不自然さが残るという欠点があった。
それゆえに、この発明の主たる目的は、音声合成装置に
おいて発声速度を変化させた場合であっても、聴取者に
とって自然で聞きやすい合成音声を生成できるような発
声速度制御回路を提供することである。
[課題を解決するための手段] 第1請求項に係る発明は、音声を入力するための入力手
段と、入力された音声をディジタル信号に変換するため
のA/D変換手段と、A/D変換されたディジタル音声
信号を分析して特徴パラメータを抽出する分析手段と、
抽出された特徴パラメータを合成音声に変換する合成音
声変換手段と、変換された合成音声をアナログ信号に変
換して出力するD/A変換手段とを備えた音声合成装置
において、A/D変換されたディジタル音声信号をスペ
クトルに変換し、そのスペクトルの時間的変化を解析し
てスペクトル変化率を算出するスペクトル変化解析手段
を設け、スペクトル変化率と発声速度との間に関数関係
を持たせるように発声速度制御回路を構成したものであ
る。
請求項第2項に係る発明は、文字列または記号列を入力
するための入力手段と、入力された文字列または記号列
を読み列に変換するための読み列変換手段と、変換され
た読み列を合成音声に変換する合成音声変換手段と、変
換された合成音声をアナログ信号に変換するD/A変換
手段とを備えた音声合成装置において、変換された読み
列をスペクトルに変換し、そのスペクトルの時間的変化
を解析してスペクトル変化率を算出するスペクトル変化
解析手段を設け、スペクトル変化率と発声速度との間に
関数関係を持たせるように発声速度制御回路を構成した
ものである。
[作用] この発明に係る音声合成装置の発声速度制御回路は、音
声信号または変換された読み列をスペクトルに関するパ
ラメータに変換し、そのスペクトルパラメータの時間的
変化を算出し、その時間的変化に対応させて合成音声信
号の時間伸縮を行なって出力する。
[発明の実施例] 第1図はこの発明の一実施例の概略ブロック図である。
第1図において、音声入力部10は発声された音声が入
力されるものであって、その発声された音声は、A/D
変換変換部1に入力され、所定の間隔のサンプリング信
号によりディジタル信号に変換される。ディジタル信号
に変換された音声は、スペクトル分析部3に与えられ、
音韻性情報を担ったスペクトルパラメータに変換される
。このスペクトルパラメータとしては、たとえば斉藤・
中田著″音声情報処理の基礎′ (オーム社発行)に紀
裁されているようなPARCOR係数などがある。なお
、このPARCOR係数はスペクトルパラメータの一例
であり、この発明は特にこれに限定されるものではない
A/D変換部1から出力された音声のディジタル信号は
音声分析部2にも入力され、音声のディジタル信号から
音源情報であるピッチ周期やパワー情報などの音源パラ
メータが抽出される。音源分析部2によって抽出された
音源パラメータとスペクトル分析部3によって分析され
たスペクトルパラメータは合成部5に与えられる。合成
部5はスペクトルパラメータおよび音源パラメータを用
いて合成音声を生成する。
すなわち、合成部5では、前述のピッチ周期の間隔で単
位フレーム内のスペクトルパラメータヲ繰返し、音声パ
ラメータの列に変換する。この合成部5としては、たと
えばJ、D、Markeland  A、H,Gray
  Jr著、鈴木訳″音声の線形予測″ (コロナ社発
行)に記載されているような2乗算器格子形音声合成フ
ィルタを用いて、前述のスペクトルパラメータおよび音
源パラメータにより音声波形を合成する。なお、2乗算
器格子形音声合成フィルタは一例であって、他の音声合
成手段を用いるようにしてもよい。合成された音声波形
はD/A変換部7を介して音声として出力される。
次に、前述の合成音声の発声速度の制御について説明す
る。合成音声の発声速度の制御は、合成部5において、
音源パラメータおよびスペクトルパラメータより音声波
形を合成する際に、音源パルスおよびスペクトルパラメ
ータの合成フレーム周期を変えることによって実現され
る。このような発声の制御を行なうものが、スペクトル
変化分析部4および発声速度制御部6である。まず、ス
ペクトル変化分析部4では、スペクトル分析部3におい
て算出されたスペクトルパラメータを用いて時間的な変
化率Δを求める。たとえば、嵯峨山。
板倉著、“音声の動的尺度に含まれる個人性情報。
日本音響学会講演論文集(昭和54年6月発行)に記載
されているようなLPCケプストラム回帰係数を用いた
動的尺度をスペクトル変化率Δとして使用することがで
きる。もちろんスペクトル変化率の尺度はこれに限定さ
れるものではない。
第2図(a)は音声のスペクトル変化率Δの時間変化の
一例を示したものであり、この変化率Δのフレームごと
の平均値を示したものが第2図(b)である。第2図(
c)は原音声と同じ速度で発声させる場合の音源パルス
およびスペクトルパラメータの例であり、第2図(C)
においては、第iフレーム目と第jフレーム目の音源を
表示して示す。また、それぞれのフレームにおけるスペ
クトルパラメータは、それぞれベクトル(P、。
P1□・・・p′= + 、  (P’、 、  P’
2・・・p’m lで表わされでいる。
次に、合成音声の発声速度を低下させる、すなわち音声
を時間軸方向に伸長させる場合について説明する。この
発明の一実施例では、第2図(b)に示すように、フレ
ームごとに求めたスペクトル変化率Δに基づいて、音源
パルスの時間長を決定する。第2図(b)に示した例で
は、第iフレームのスペクトル変化率Δi、第2図(C
)に示シた例では第iフレーム目の原音声の音源パルス
の時間長Liに対して、新たな音源パルス時間長しNi
を次の第(1)式により決定する。
LN i =L i XΔmax/Δ1−(1)ここで
、Δmax””maxΔに ト である。このようにして、スペクトル変化率Δの値の大
きさと伸縮率の間に逆相量関係を持たせて、新しく音源
パルスおよび第2図(d)に示すようにスペクトルパラ
メータ fP’+ 、  P′2・・・P−) を配置
する。
上述の手続きは合成音声発声速度を上げる場合にも適用
でき、第(1)式を LNi−r、txΔi/Δmax−(2)とし、新しい
音源パルス時間長LNiを決定する。
ここで、スペクトル変化率と伸縮率の間の関係は、逆相
関でなくてもよく、任意の関数を用いることができる。
第3図はこの発明の他の実施例を示す概略ブロック図で
ある。
第3図において、入力端子20には、図示しないOCR
やキーボードなどの人力手段が文字列または記号列で表
現された文章や単語などが入力される。入力された文章
や単語は、形態素解析部8によって、形態素辞書部9に
記憶されている内容に基づいて、形態素の列に変換され
る。形態素辞書部9は少なくとも“読み”および″品詞
”を記憶しており、入力された文字列または記号列に対
して、たとえば相沢、江原著″計算機によるかな漢字変
換’、NHK技術研究、25−5に記載されているよう
な最長一致法などの手段を用いて形態素への分割を行な
う。この最長一致法は、形態素分割のための手段の一例
であり、これに限定されるものではない。
形態素解析部8によって解析された形態素は、ピッチ制
御処理部10に与えられ、アクセント辞書部11および
アクセント結合規則部12に記憶されている内容に基づ
いて、音の高低を表わすピッチ周波数成分が決定される
。ピッチ周波数成分の付与された形態素列は、音声パラ
メータ生成部13に与えられ、音素片辞書部14に記憶
されている内容に基づいて、音素のパラメータの列に変
換される。音素片辞書部14は音素片すなわち、文章や
単語を構成している音素、またはCV、VCなどの音韻
連鎖をパラメータとして保持しており、形態素を構成す
る音素またはCV、VCなどの音韻の順に従って該音素
片を配列し、上述のピッチ周波数の間隔で単位フレーム
内のパラメータを繰返し音声パラメータの列に変換する
以下、スペクトル分析部15.スペクトル変化分析部1
61合成部170発声速度制御部18およびD/A変換
部19は前述の第1図に示した実施例と同様の動作を行
なう。
〔発明の効果〕
以上のように、この発明によれば、合成音声の発声速度
を変化させる場合に、スペクトル変化の大きさに応じて
伸縮率を変化させ、音源およびスペクトルパラメータの
合成フレーム周期を決定するようにしたので、スペクト
ル変化の激しい音韻の時間伸縮による崩壊を防ぐことが
でき、自然で聞きやすい音声を得ることができる。
【図面の簡単な説明】
第1図はこの発明の一実施例の概略ブロック図である。 第2図(a)はスペクトル変化率の一例を示す図であり
、第2図(b)は第2図(a)に示したスペクトル変化
率をフレームごとに平均化して示したものであり、第2
図(c)は原音声と同じ速度の場合の音源パルスおよび
びスペクトルパラメータの配置図であり、第2図(d)
は第2図(b)に示したスペクトル変化率に基づいて決
定した新しい音源パルスおよびスペクトルパラメータの
配置を示す図である。第3図はこの発明の他の実施例の
概略ブロック図である。 図において、1はA/D変換部、2は音源分析部、3,
15はスペクトル分析部、4.16はスペクトル変化分
析部、5.ニアは合成部、6,18は発声速度制御部、
7,19はD/A変換部、8は形態素解析部、9は形態
素辞書部、10はピッチ制御処理部、11はアクセント
辞書部、12はアクセント結合規則部、13は音声パラ
メータ生成部、14は音素片辞書部を示す。 特許出願人 株式会社エイ・ティ・アールト2−一  
−輪 手続補正書(、filc) 昭和63年8月10日 1、事件の表示 昭和63年特許願第 91131  号昭和  年  
月  口提出の特性別 2、発明の名称 音声合成装置の発声速度制御回路 3、補正をする者 事件との関係  特許出願人 住 所 京都府)■楽部精華町大字乾谷小字三平谷5番
地名 称 株式会社エイ・ティ・アール現聴宛機構研究
所代表者淀用英司 4、代理人 住 所  大阪市北区南森町2丁目1番29号 住友銀
行南森町ビル6、補正の対象 図面 7、補正の内容 図面の第2図を別紙のとおり補正する。 以上

Claims (2)

    【特許請求の範囲】
  1. (1)音声を入力するための入力手段と、 前記入力手段から入力された音声をディジタル信号に変
    換するためのA/D変換手段と、前記A/D変換手段に
    よって変換されたディジタル音声信号を分析して特徴パ
    ラメータを抽出する分析手段と、 前記分析手段によって抽出された特徴パラメータを合成
    音声に変換する合成音声変換手段と、前記合成音声変換
    手段によって変換された合成音声をアナログ信号に変換
    して出力するD/A変換手段とを備えた音声合成装置に
    おいて、 前記A/D変換手段によって変換されたディジタル音声
    信号をスペクトルに変換し、該スペクトルの時間的変化
    を解析してスペクトル変化率を算出するスペクトル変化
    解析手段を含み、 前記スペクトル変化率と発声速度との間に関数関係を持
    たせることを特徴とする、発声速度制御回路。
  2. (2)文字列または記号列を入力するための入力手段と
    、 前記入力手段によって入力された文字列または記号列を
    読み列に変換するための読み列変換手段と、 前記読み列変換手段によって変換された読み列を合成音
    声に変換する合成音声変換手段と、前記合成音声変換手
    段によって変換された合成音声をアナログ信号に変換す
    るD/A変換手段とを備えた音声合成装置において、 前記読み列変換手段によって変換された読み列をスペク
    トルに変換し、該スペクトルの時間的変化を解析してス
    ペクトル変化率を算出するスペクトル変化解析手段を含
    み、 前記スペクトル変化率と発声速度との間に関数関係を持
    たせることを特徴とする、発声速度制御回路。
JP63091131A 1988-04-13 1988-04-13 音声合成装置の発声速度制御回路 Expired - Lifetime JP2956936B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63091131A JP2956936B2 (ja) 1988-04-13 1988-04-13 音声合成装置の発声速度制御回路

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63091131A JP2956936B2 (ja) 1988-04-13 1988-04-13 音声合成装置の発声速度制御回路

Publications (2)

Publication Number Publication Date
JPH01262598A true JPH01262598A (ja) 1989-10-19
JP2956936B2 JP2956936B2 (ja) 1999-10-04

Family

ID=14017982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63091131A Expired - Lifetime JP2956936B2 (ja) 1988-04-13 1988-04-13 音声合成装置の発声速度制御回路

Country Status (1)

Country Link
JP (1) JP2956936B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005331588A (ja) * 2004-05-18 2005-12-02 Nippon Telegr & Teleph Corp <Ntt> 音声再生速度調節方法、音声再生速度調節プログラム、およびこれを格納した記録媒体

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6364098A (ja) * 1986-09-05 1988-03-22 株式会社日立製作所 音声合成方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6364098A (ja) * 1986-09-05 1988-03-22 株式会社日立製作所 音声合成方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005331588A (ja) * 2004-05-18 2005-12-02 Nippon Telegr & Teleph Corp <Ntt> 音声再生速度調節方法、音声再生速度調節プログラム、およびこれを格納した記録媒体

Also Published As

Publication number Publication date
JP2956936B2 (ja) 1999-10-04

Similar Documents

Publication Publication Date Title
Isewon et al. Design and implementation of text to speech conversion for visually impaired people
Choi et al. Korean singing voice synthesis based on auto-regressive boundary equilibrium gan
JPH0632020B2 (ja) 音声合成方法および装置
Dua et al. Spectral warping and data augmentation for low resource language ASR system under mismatched conditions
JPH0772900A (ja) 音声合成の感情付与方法
Cherif et al. Pitch detection and formant analysis of Arabic speech processing
Sawada et al. The NITech text-to-speech system for the Blizzard Challenge 2018
Kumar et al. Building a light weight intelligible text-to-speech voice model for Indian accent Telugu
US6829577B1 (en) Generating non-stationary additive noise for addition to synthesized speech
JP3109778B2 (ja) 音声規則合成装置
JPH01262598A (ja) 音声合成装置の発声速度制御回路
RU61924U1 (ru) Статистическая модель речи
JP2536169B2 (ja) 規則型音声合成装置
JPH0580791A (ja) 音声規則合成装置および方法
Schröder Interpolating expressions in unit selection
JP3081300B2 (ja) 残差駆動型音声合成装置
JPH02106799A (ja) 合成音声情緒付与回路
JP2703253B2 (ja) 音声合成装置
JPH02293900A (ja) 音声合成装置
JP2907828B2 (ja) 音声対話型文書作成装置
JPH02236600A (ja) 合成音声情緒付与回路
WO2023182291A1 (ja) 音声合成装置、音声合成方法及びプログラム
Singh et al. Removal of spectral discontinuity in concatenated speech waveform
JPH06250685A (ja) 音声合成方式および規則合成装置
JPH0667685A (ja) 音声合成装置