JPH02230300A - 音声合成器 - Google Patents
音声合成器Info
- Publication number
- JPH02230300A JPH02230300A JP1049958A JP4995889A JPH02230300A JP H02230300 A JPH02230300 A JP H02230300A JP 1049958 A JP1049958 A JP 1049958A JP 4995889 A JP4995889 A JP 4995889A JP H02230300 A JPH02230300 A JP H02230300A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- information
- pitch pulse
- pulse
- period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015572 biosynthetic process Effects 0.000 claims description 15
- 238000003786 synthesis reaction Methods 0.000 claims description 15
- 230000003595 spectral effect Effects 0.000 claims description 8
- 230000005236 sound signal Effects 0.000 claims description 4
- 230000005284 excitation Effects 0.000 abstract description 11
- 230000002194 synthesizing effect Effects 0.000 abstract description 2
- 238000004458 analytical method Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は音声分析器で分析されたスペクトラル包絡情報
と音源情報とを合成する音声合成器に関する。
と音源情報とを合成する音声合成器に関する。
従来、この種の音声合成器は、入力音声信号の巨視的構
造を示すスペクトラル包絡情報と微細構造を示す音源情
報とを入力し、これら分析情報に基づいて人力音声信号
を再生するものである。すなわち、このような音声合成
器においては、分析情報として伝送されるスペクトラル
包絡情報を音源情報で駆動する全極型のディジタルフィ
ルタが音声合成フィルタとして備えられている。
造を示すスペクトラル包絡情報と微細構造を示す音源情
報とを入力し、これら分析情報に基づいて人力音声信号
を再生するものである。すなわち、このような音声合成
器においては、分析情報として伝送されるスペクトラル
包絡情報を音源情報で駆動する全極型のディジタルフィ
ルタが音声合成フィルタとして備えられている。
スペクトラル包絡情報は、通常は入力音声信号をLPG
分析(線形予測分析; LinearPredicti
ve Coefficient) Lて求められるαパ
ラメータやKパラメータのごとき線形予測係数をフィル
タ係数としたものである。
分析(線形予測分析; LinearPredicti
ve Coefficient) Lて求められるαパ
ラメータやKパラメータのごとき線形予測係数をフィル
タ係数としたものである。
一方、音源情報はピッチ周期に基づいたインバルス列(
ピッチパルス列)、有声無声無音情報、その他音声電力
等であり、音源情報の持つ波形情報は切り揄でて、音源
のピッチ周期と有声無声無音情報および音声電力等をモ
デル化したもので、音声合成フィルタを駆動するように
している。すなわち、有声音源はそのピッチ周期のイン
パルス列で、また無声無音は白色雑音によるモデル化表
現で、音声合成フィルタを駆動するようにしている。
ピッチパルス列)、有声無声無音情報、その他音声電力
等であり、音源情報の持つ波形情報は切り揄でて、音源
のピッチ周期と有声無声無音情報および音声電力等をモ
デル化したもので、音声合成フィルタを駆動するように
している。すなわち、有声音源はそのピッチ周期のイン
パルス列で、また無声無音は白色雑音によるモデル化表
現で、音声合成フィルタを駆動するようにしている。
しかしながら、従来のこのような波掛非伝送の分析情報
を用いて音声合成フィルタを駆動する音声合成器にあっ
ては、波形伝送型の音声合成器、例えばマルチパルスボ
コーダと比較すると、本質的に位相情報に欠け、またピ
ッチ周期情報にも曖昧性が入り込み易い。特に、音声合
成フィルタは分析側から合成側に伝送されるピッチ周期
情報に対応して発生するピッチパルス位置をパルス励起
点として駆動されるので、そのパルス励起点にエネルギ
の過度の集中が起こる。ピッチ周期を利用しての励振は
、定周期的にエネルギの集中を発生することになり、自
然性に乏しい機械音的な合成音質となるという欠点があ
った。
を用いて音声合成フィルタを駆動する音声合成器にあっ
ては、波形伝送型の音声合成器、例えばマルチパルスボ
コーダと比較すると、本質的に位相情報に欠け、またピ
ッチ周期情報にも曖昧性が入り込み易い。特に、音声合
成フィルタは分析側から合成側に伝送されるピッチ周期
情報に対応して発生するピッチパルス位置をパルス励起
点として駆動されるので、そのパルス励起点にエネルギ
の過度の集中が起こる。ピッチ周期を利用しての励振は
、定周期的にエネルギの集中を発生することになり、自
然性に乏しい機械音的な合成音質となるという欠点があ
った。
本発明は、音声合成フィルタをピッチ周期に基づいたイ
ンパルス列もしくは白色雑音でモデル化音源で駆動する
ことによって入力音声信号を合成するにあたって、ピッ
チ周期に基づいたピッチパルス列(インパルス列)の発
生周期を可変するピッチパルス可変器を設けたことを特
徴とする。
ンパルス列もしくは白色雑音でモデル化音源で駆動する
ことによって入力音声信号を合成するにあたって、ピッ
チ周期に基づいたピッチパルス列(インパルス列)の発
生周期を可変するピッチパルス可変器を設けたことを特
徴とする。
ピッチパルス可変器により、パルス励起点であるピッチ
パルス位置が、ピッチパルス可変器で定まる周期によっ
て変化するので、エネルギの集中が避けられ、自然性に
近い合成音を得ることができる。
パルス位置が、ピッチパルス可変器で定まる周期によっ
て変化するので、エネルギの集中が避けられ、自然性に
近い合成音を得ることができる。
以下、図面に示す一実施例を参照して、本発明を詳細に
説明する。
説明する。
第1図は本発明の音声合成器の一実施例を示すブロック
図である。デマルチプレクサ11は伝送路12を介して
、合成すべき音声信号の分析情報を人力する。この分析
情報は音声分析器によるスペクトラル包絡情報と音源情
報との多重化信号であり、スペクトラル包絡情報として
のLPG係数データa1音源情報としての有声無声無音
情報bとピッチ周期情報Cおよび短時間音声電力データ
dが含まれる。
図である。デマルチプレクサ11は伝送路12を介して
、合成すべき音声信号の分析情報を人力する。この分析
情報は音声分析器によるスペクトラル包絡情報と音源情
報との多重化信号であり、スペクトラル包絡情報として
のLPG係数データa1音源情報としての有声無声無音
情報bとピッチ周期情報Cおよび短時間音声電力データ
dが含まれる。
ここで、音声信号を分析する音声分析器は、LPG分析
器、ピッチ抽出器、有声無声無音判別器、電力計測器等
からなり、分析した分析情報をメモリ回路に記憶すると
共に、マルチプレクサ等で適宜組み合わせて多重化し、
これを伝送符号化して伝送路12に送出し、第1図に示
す音声合成器に供給する。
器、ピッチ抽出器、有声無声無音判別器、電力計測器等
からなり、分析した分析情報をメモリ回路に記憶すると
共に、マルチプレクサ等で適宜組み合わせて多重化し、
これを伝送符号化して伝送路12に送出し、第1図に示
す音声合成器に供給する。
音声合成器では、入力された分析情報に基づき、デマル
チプレクサ11によって多重化データの多重化分離と復
号化とを行う。
チプレクサ11によって多重化データの多重化分離と復
号化とを行う。
復号化したLPG係数データaは、音声合成フィルタ1
3に、ピッチ周期情報Cはピッチ,{Jレス発生器14
に、有声無声無音情報bは切替器15に、また短時間音
声電力データdは可変増幅器16にそれぞれ供給される
。音声合成フィルタ13は、予め定めた次数の全極型デ
ィジタルフィルタとして構成され、LPG係数データa
はこのフィルタの係数として利用される。
3に、ピッチ周期情報Cはピッチ,{Jレス発生器14
に、有声無声無音情報bは切替器15に、また短時間音
声電力データdは可変増幅器16にそれぞれ供給される
。音声合成フィルタ13は、予め定めた次数の全極型デ
ィジタルフィルタとして構成され、LPG係数データa
はこのフィルタの係数として利用される。
有声無声無音情報bは切替器15に供給され、このデー
タが有声を指定するときはピッチパルス発生器14の出
力を可変増幅器16に、また無声無音のときは雑音発生
器17の出力を可変増幅器l6に供給するように切替器
15を切り替えさせる。
タが有声を指定するときはピッチパルス発生器14の出
力を可変増幅器16に、また無声無音のときは雑音発生
器17の出力を可変増幅器l6に供給するように切替器
15を切り替えさせる。
雑音発生器17は白色雑音を発生し、有声無声無音情報
bが無声か無音かを指定するときは、この白色雑音が可
変増幅器16に供給される。
bが無声か無音かを指定するときは、この白色雑音が可
変増幅器16に供給される。
ピッチ周期情報Cを供給されたピッチパルス発生器l4
は、このピッチ周期に対応する周波数のピッチパルス列
を発生し、更に前述のパルス列を本発明の特徴であるピ
ッチパルス可変器18の指示に基づいた位置に修正した
のち、切替器15に供給する。
は、このピッチ周期に対応する周波数のピッチパルス列
を発生し、更に前述のパルス列を本発明の特徴であるピ
ッチパルス可変器18の指示に基づいた位置に修正した
のち、切替器15に供給する。
可変増幅器16はこうして入力するピッチパルスもしく
は白色雑音に対し、別に入力する短時間音声電力データ
dの大きさに対応した重み付け増幅を実施したのち、こ
れを音声合成フィルタ13に供給し、このフィルタの駆
動音源とする。
は白色雑音に対し、別に入力する短時間音声電力データ
dの大きさに対応した重み付け増幅を実施したのち、こ
れを音声合成フィルタ13に供給し、このフィルタの駆
動音源とする。
音声合成フィルタ13は、こうして入力するLPG係数
データaをフィルタ係数とし、駆動音源によって駆動さ
れ、分析フレームごとに量子化合成波形を再生し、D/
Aコンバータl9に供給する。
データaをフィルタ係数とし、駆動音源によって駆動さ
れ、分析フレームごとに量子化合成波形を再生し、D/
Aコンバータl9に供給する。
D/Aコンバータ19は、こうして入力した量子化合成
波形をアナログ波形に変換し、LPF(Low Pas
s Filter) 2Qに送出する。LPF20は、
所定の高城周波数遮断フィルタリングを行い、合成音声
として出力ライン21に送出する。
波形をアナログ波形に変換し、LPF(Low Pas
s Filter) 2Qに送出する。LPF20は、
所定の高城周波数遮断フィルタリングを行い、合成音声
として出力ライン21に送出する。
ところで、従来の音声合成器は、前述した通り、音声合
成フィルタ13を駆動するパルス励起点にピッチ周期、
すなわち定周期的な過度のエネルギの集中が生起し、自
然性に乏しい合成音声となっていたが、本発明によるこ
の実施例では、パルス励起点をピッチパルス可変器18
により意図的に動かす。これによって、定周期(ピッチ
周期)ごとに発生する過度のエネルギの集中をピッチ周
期を基本としながら分散させる。つまり、ピッチ周期、
もしくはその周期よりも少し前もしくは少し後というよ
うにパルスの励起点を意図的に動かすことにより、従来
は定周期的に発生した過度のエネルギの発生を時間的に
分散させることができ、聴覚的違和感をなくし、合成音
声の自然性を著しく改善している。
成フィルタ13を駆動するパルス励起点にピッチ周期、
すなわち定周期的な過度のエネルギの集中が生起し、自
然性に乏しい合成音声となっていたが、本発明によるこ
の実施例では、パルス励起点をピッチパルス可変器18
により意図的に動かす。これによって、定周期(ピッチ
周期)ごとに発生する過度のエネルギの集中をピッチ周
期を基本としながら分散させる。つまり、ピッチ周期、
もしくはその周期よりも少し前もしくは少し後というよ
うにパルスの励起点を意図的に動かすことにより、従来
は定周期的に発生した過度のエネルギの発生を時間的に
分散させることができ、聴覚的違和感をなくし、合成音
声の自然性を著しく改善している。
ここで、ピッチパルス可変器18は、擬似乱数として代
表的なM系列を利用しており、M系列の下位2ビットが
(0.0)(1.1)のときは、ピッチ周期通りのパル
ス励起とし、(1.0)のときはピッチ周期よりも1サ
ンプル(125μSec)早く励起し、(1.0)のと
きは1サンプル遅く励起する構成となっている。そして
、ピッチパルス可変器18の内容は1サンプルごとに更
新する構成となっている。
表的なM系列を利用しており、M系列の下位2ビットが
(0.0)(1.1)のときは、ピッチ周期通りのパル
ス励起とし、(1.0)のときはピッチ周期よりも1サ
ンプル(125μSec)早く励起し、(1.0)のと
きは1サンプル遅く励起する構成となっている。そして
、ピッチパルス可変器18の内容は1サンプルごとに更
新する構成となっている。
以上説明したように本発明によれば、音声合成器にピッ
チ可変器を設け、ピッチパルス周期およびその近傍でパ
ルス励起点を定めるので、過度のエネルギの集中を防止
することができ、自然性のない機械音的な合成音となる
ことを防ぐことができる。このように、エネルギの励振
点を可変するピッチパルス可変器により、エネルギを時
間的に分散せしめ、聴覚的違和感のない自然性のよい合
成音声が生成できる。
チ可変器を設け、ピッチパルス周期およびその近傍でパ
ルス励起点を定めるので、過度のエネルギの集中を防止
することができ、自然性のない機械音的な合成音となる
ことを防ぐことができる。このように、エネルギの励振
点を可変するピッチパルス可変器により、エネルギを時
間的に分散せしめ、聴覚的違和感のない自然性のよい合
成音声が生成できる。
【図面の簡単な説明】
第1図は本発明の音声合成器の一実施例を示すブロック
図である。 11・・・・・・デマルチブレクサ、12・・・・・・
伝送路、13・・・・・・音声合成フィルタ、 14・・・・・・ピッチパルス発生器、15・旧・・切
替器、16・・・・・・可変増幅器、17・・・・・・
雑音発生器、18・・・・・・ピッチパルス可変器、1
9・・・・・・D/Aコンバータ、20・・・・・・L
PF.躬1図
図である。 11・・・・・・デマルチブレクサ、12・・・・・・
伝送路、13・・・・・・音声合成フィルタ、 14・・・・・・ピッチパルス発生器、15・旧・・切
替器、16・・・・・・可変増幅器、17・・・・・・
雑音発生器、18・・・・・・ピッチパルス可変器、1
9・・・・・・D/Aコンバータ、20・・・・・・L
PF.躬1図
Claims (1)
- 音声分析器で分析された音声信号の巨視的構造を示すス
ペクトラル包絡情報と前記音声信号の微細構造を示す音
源情報とを入力し、前記スペクトラル包絡情報を前記音
源情報で駆動し、音声合成フィルタで音声を合成する音
声合成器において、前記音源情報のうちのピッチ周期情
報に基づいて所定の周波数のピッチパルス列を発生する
ピッチパルス発生器と、このピッチパルス発生器で発生
するピッチパルス列の発生位置を変化させるためのピッ
チパルス可変器と、白色雑音を発生するための雑音発生
器と、前記音源情報のうちの有声無声無音情報が有声情
報であるときは前記ピッチパルス発生器の出力を選択し
、無声無音情報であるときは前記雑音発生器の出力を選
択する切替器と、この切替器の出力に基づいて前記音声
合成フィルタを駆動することを特徴とする音声合成器。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1049958A JPH02230300A (ja) | 1989-03-03 | 1989-03-03 | 音声合成器 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1049958A JPH02230300A (ja) | 1989-03-03 | 1989-03-03 | 音声合成器 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02230300A true JPH02230300A (ja) | 1990-09-12 |
Family
ID=12845541
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1049958A Pending JPH02230300A (ja) | 1989-03-03 | 1989-03-03 | 音声合成器 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02230300A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1526105A2 (en) | 1998-01-20 | 2005-04-27 | Gannett Satellite Information Network, Inc. | Information distribution system for use in an elevator |
| JP2016505873A (ja) * | 2013-01-11 | 2016-02-25 | 華為技術有限公司Huawei Technologies Co.,Ltd. | オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58186800A (ja) * | 1982-04-26 | 1983-10-31 | 日本電気株式会社 | 音声合成装置 |
| JPS60260100A (ja) * | 1984-06-07 | 1985-12-23 | 日本電気株式会社 | 音声合成器 |
-
1989
- 1989-03-03 JP JP1049958A patent/JPH02230300A/ja active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58186800A (ja) * | 1982-04-26 | 1983-10-31 | 日本電気株式会社 | 音声合成装置 |
| JPS60260100A (ja) * | 1984-06-07 | 1985-12-23 | 日本電気株式会社 | 音声合成器 |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1526105A2 (en) | 1998-01-20 | 2005-04-27 | Gannett Satellite Information Network, Inc. | Information distribution system for use in an elevator |
| JP2016505873A (ja) * | 2013-01-11 | 2016-02-25 | 華為技術有限公司Huawei Technologies Co.,Ltd. | オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置 |
| JP2017138616A (ja) * | 2013-01-11 | 2017-08-10 | 華為技術有限公司Huawei Technologies Co.,Ltd. | オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置 |
| US9805736B2 (en) | 2013-01-11 | 2017-10-31 | Huawei Technologies Co., Ltd. | Audio signal encoding and decoding method, and audio signal encoding and decoding apparatus |
| US10373629B2 (en) | 2013-01-11 | 2019-08-06 | Huawei Technologies Co., Ltd. | Audio signal encoding and decoding method, and audio signal encoding and decoding apparatus |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5682502A (en) | Syllable-beat-point synchronized rule-based speech synthesis from coded utterance-speed-independent phoneme combination parameters | |
| JPH06110498A (ja) | 音声合成システムの音声断片コーディングおよびそのピッチ調節方法とその有声音合成装置 | |
| WO2003010752A1 (fr) | Appareil d'elargissement de la largeur de bande vocale et procede d'elargissement de la largeur de bande vocale | |
| TW326070B (en) | The estimation method of the impulse gain for coding vocoder | |
| JPH02230300A (ja) | 音声合成器 | |
| JP3510168B2 (ja) | 音声符号化方法及び音声復号化方法 | |
| JPH10207496A (ja) | 音声符号化装置及び音声復号装置 | |
| JP2583883B2 (ja) | 音声分析装置および音声合成装置 | |
| JP3057907B2 (ja) | 音声符号化装置 | |
| JPS6346498A (ja) | 韻律生成方式及びタイミング点パターン生成方式 | |
| JP3166697B2 (ja) | 音声符号化・復号装置及びシステム | |
| JP3368949B2 (ja) | 音声分析合成装置 | |
| JPS60260100A (ja) | 音声合成器 | |
| JPH0411040B2 (ja) | ||
| JPS5914752B2 (ja) | 音声合成方式 | |
| JP2898641B2 (ja) | 音声符号化装置 | |
| JPH05165497A (ja) | コード励振線形予測符号化器及び復号化器 | |
| JP2956936B2 (ja) | 音声合成装置の発声速度制御回路 | |
| JPH0377999B2 (ja) | ||
| JP2000099094A (ja) | 時系列信号処理装置 | |
| JP2580123B2 (ja) | 音声合成装置 | |
| JPS61255000A (ja) | 線形予測型音声分析合成装置 | |
| JP2844590B2 (ja) | 音声符号化方式とその装置 | |
| JPH08160993A (ja) | 音声分析合成器 | |
| JPH10232699A (ja) | Lpcボコーダ |