JPS5853348B2 - 音声合成器 - Google Patents
音声合成器Info
- Publication number
- JPS5853348B2 JPS5853348B2 JP54022318A JP2231879A JPS5853348B2 JP S5853348 B2 JPS5853348 B2 JP S5853348B2 JP 54022318 A JP54022318 A JP 54022318A JP 2231879 A JP2231879 A JP 2231879A JP S5853348 B2 JPS5853348 B2 JP S5853348B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- circuit
- adder
- spectral envelope
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Landscapes
- Electrophonic Musical Instruments (AREA)
Description
【発明の詳細な説明】
この発明は、音声の特徴を低ビットな情報量で表現して
伝送あるいはメモリに蓄積し、これらの情報から原音声
と同程度の音声を合成することを可能とする音声合成器
に関するものである。
伝送あるいはメモリに蓄積し、これらの情報から原音声
と同程度の音声を合成することを可能とする音声合成器
に関するものである。
音声の特徴を低ビットの情報量で表現し、それから音声
を合成する方式としては、部分自己相関係数による合成
方式とホルマント合成方式とがある。
を合成する方式としては、部分自己相関係数による合成
方式とホルマント合成方式とがある。
前者の方式は部分自己相関係数を乗算の係数としてもつ
合成フィルタに、音源信号を通すことによって、音声を
合成することができる。
合成フィルタに、音源信号を通すことによって、音声を
合成することができる。
部分自己相関係数は、音声波形を分析することによって
得られ、その絶対値がすべて1より小さいという条件が
成り立てば、合成フィルタは安定であるという特徴をも
つ。
得られ、その絶対値がすべて1より小さいという条件が
成り立てば、合成フィルタは安定であるという特徴をも
つ。
部分自己相関係数は、比較的少ない情報量で音声合成が
できる反面、パラメータの種類によるスペクトル感度の
差が大きく、補間特性も悪い。
できる反面、パラメータの種類によるスペクトル感度の
差が大きく、補間特性も悪い。
このためパラメータの補間によって音声とは別の雑音を
発生することがある。
発生することがある。
また部分自己相関係数は、ホルマント周波数などの物理
特性に対応していないため、規則による制御を行うのに
見通しが悪く、例えば得られている部分自己相関係数を
処理して原音声よりも周波数が高い音声を合成すること
が困難であり、規則合成には不向きなパラメータである
。
特性に対応していないため、規則による制御を行うのに
見通しが悪く、例えば得られている部分自己相関係数を
処理して原音声よりも周波数が高い音声を合成すること
が困難であり、規則合成には不向きなパラメータである
。
これに対しホルマント合成方式は、ホルマント周波数と
そのバンド幅をパラメータとして音声を合成する方式で
あり、パラメータの量子化ピット数が少くて済むという
特徴をもつ。
そのバンド幅をパラメータとして音声を合成する方式で
あり、パラメータの量子化ピット数が少くて済むという
特徴をもつ。
またパラメータの物理的な対応が得やすいことにおいて
は優れているが、ホルマント周波数を抽出するためには
パラメータの大局的な動特性や統計的な性質を利用する
必要があり完全自動抽出が困難であるという欠点をもつ
。
は優れているが、ホルマント周波数を抽出するためには
パラメータの大局的な動特性や統計的な性質を利用する
必要があり完全自動抽出が困難であるという欠点をもつ
。
この発明は、これらの欠点を解決するため、音声のスペ
クトル包絡情報を、ホルマントに類似した周波数領域の
パラメータで表現したもので、これらのパラメータ抽出
には、ホルマント抽出における不確実な判断過程をさけ
ることができ、完全自動抽出ができ、これらのパラメー
タにより音源信号が入力されるフィードバックループに
含マレる反共振回路の反共振周波数を設定することによ
り、原音声に近い音声を再生できる特徴を有し、その目
的は少ない情報量で音声を合成することにある。
クトル包絡情報を、ホルマントに類似した周波数領域の
パラメータで表現したもので、これらのパラメータ抽出
には、ホルマント抽出における不確実な判断過程をさけ
ることができ、完全自動抽出ができ、これらのパラメー
タにより音源信号が入力されるフィードバックループに
含マレる反共振回路の反共振周波数を設定することによ
り、原音声に近い音声を再生できる特徴を有し、その目
的は少ない情報量で音声を合成することにある。
以下図面を用いてこの発明による音声合成器の実施例を
参照して説明しよう。
参照して説明しよう。
音源信号発生器11よりの音源信号が、フィードバック
ループに反共振回路を含むスペクトル包絡形成部12に
供給される。
ループに反共振回路を含むスペクトル包絡形成部12に
供給される。
音源信号発生器11には入力端子14から例えばピッチ
、有声音、無声音の区別などを示す情報が一定時間ごと
に供給され、これ等に基づいて音源発生器11で、音声
の特徴に応じた音源信号が発生される。
、有声音、無声音の区別などを示す情報が一定時間ごと
に供給され、これ等に基づいて音源発生器11で、音声
の特徴に応じた音源信号が発生される。
一方、入力端子14からの入力信号中の音声のスペクト
ル包絡情報を表わす信号は、パラメータ復号器15に送
られ、スペクトル包絡形成部12の制御パラメータ、つ
まり反共振周波数を制御する信号に変換される。
ル包絡情報を表わす信号は、パラメータ復号器15に送
られ、スペクトル包絡形成部12の制御パラメータ、つ
まり反共振周波数を制御する信号に変換される。
これらのパラメータは必要に応じてパラメータ補間器1
6に送られ、スペクトル包絡がなめらかに変化するよう
に一定時間ごとに補間値が計算される。
6に送られ、スペクトル包絡がなめらかに変化するよう
に一定時間ごとに補間値が計算される。
補間されたパラメータによりスペクトル包絡形成部12
の反共振周波数が制御される。
の反共振周波数が制御される。
反共振回路12の出力はディジタルアナログ変換器17
を経て合成音声のアナログ出力が出力端子18に得られ
る。
を経て合成音声のアナログ出力が出力端子18に得られ
る。
なお音源信号発生器11に供給する一部の信号もパラメ
ータ補間器16により補間することもできる。
ータ補間器16により補間することもできる。
音源信号発生器11及びスペクトル包絡形成部12は例
えば第2図に示すように構成される。
えば第2図に示すように構成される。
音源信号発生器11は従来より知られているものを用い
ることができ、例えば端子14aから音の高さを示すピ
ッチ周期信号がフレーム周期毎に入力されてピッチレジ
スタ20に格納される。
ることができ、例えば端子14aから音の高さを示すピ
ッチ周期信号がフレーム周期毎に入力されてピッチレジ
スタ20に格納される。
端子14bからは補間された振幅信号が入力されて音源
振幅回路21に格納される。
振幅回路21に格納される。
音声の有声、無声に関する情報は端子14c及び14d
から入力される。
から入力される。
端子22からの標本化周波数のパルスが計数回路23で
カウントされ、このカウント数はピッチレジスタ20の
内容と比較器24で比較される。
カウントされ、このカウント数はピッチレジスタ20の
内容と比較器24で比較される。
有声音の場合は端子14cからの信号によりデート回路
25が開けられ、比較器24の一致出力がゲート回路2
5を経てゲート回路26に供給されてこれを開き、音源
振幅回路21の内容がインパルス的に加算器27に入力
される。
25が開けられ、比較器24の一致出力がゲート回路2
5を経てゲート回路26に供給されてこれを開き、音源
振幅回路21の内容がインパルス的に加算器27に入力
される。
その後ゲート回路25の分岐出力が遅延回路28を通じ
て計数回路23へ供給され、カウント数は零にリセット
される。
て計数回路23へ供給され、カウント数は零にリセット
される。
従はつピッチレジスタ20にセットされたピッチ周期ご
とにその時の音源振幅回路21の振幅値が加算器27へ
供給される。
とにその時の音源振幅回路21の振幅値が加算器27へ
供給される。
一方、無声音の場合には端子22のパルスにより擬似ラ
ンダム信号発生回路28が駆動されており、この回路2
8からのランダムパルスによりゲート回路29が開られ
、このゲート回路29を通じて音源振幅回路21の内容
がゲート回路31へ供給される。
ンダム信号発生回路28が駆動されており、この回路2
8からのランダムパルスによりゲート回路29が開られ
、このゲート回路29を通じて音源振幅回路21の内容
がゲート回路31へ供給される。
ゲート回路31は端子14dの無声音を示す信号により
開られ、その出力は加算器27に入力される。
開られ、その出力は加算器27に入力される。
このようにして加算器21から音源信号が得られる。
この音源信号は必要に応じて増幅器32で増幅された後
、スペクトル包絡形成部12に入力される。
、スペクトル包絡形成部12に入力される。
スペクトル包絡形成部12は例えば出力をそのまま帰還
するループ33と、反共振回路を経て帰還するループ3
4と備えている。
するループ33と、反共振回路を経て帰還するループ3
4と備えている。
即ち増幅器32の出力は加算器35に供給されて加算器
36の出力と加算され、加算器35の出力はスペクトル
包絡形成部12の出力として端子31へ供給されると共
に加算器36へ帰還されてループ33が構成される。
36の出力と加算され、加算器35の出力はスペクトル
包絡形成部12の出力として端子31へ供給されると共
に加算器36へ帰還されてループ33が構成される。
また反共振回路として二つの回路38.39が設けられ
、その各入力側は出力端子3γに接続され各出力側は加
算器41の入力側に接続され、その出力は圭剰算器42
を通じて加算器36へ保給される。
、その各入力側は出力端子3γに接続され各出力側は加
算器41の入力側に接続され、その出力は圭剰算器42
を通じて加算器36へ保給される。
反共振回路38.39を通じて帰還ループ34が構成さ
れる。
れる。
反共振回路38.39はその伝送特性が複素平面上の単
位円上に複数個の零点をもつものが用いられる。
位円上に複数個の零点をもつものが用いられる。
反共振回路38.39はそれぞれ1次、2次のフィルタ
の多段縦続接続として構成でき、これ等はデジタルフィ
ルタとして作る場合は、例えば第3図Aに示すように1
サンプル周期の遅延回路43と、これにより遅延された
ものと遅延されないものとを加算する加算器45とによ
る1次フィルタ、また第3図Aに示すように、遅延回路
43を2段通じたものと通じないものとを加算器45で
加算した2次フィルタ、更に第3図Cに示すように遅延
回路43を通じて乗算器46でcosωiの乗算がされ
たものと、遅延回路43を2段通じたものと、遅延され
ないものとを加算器45で加算した2次フィルタなどを
用いることができる。
の多段縦続接続として構成でき、これ等はデジタルフィ
ルタとして作る場合は、例えば第3図Aに示すように1
サンプル周期の遅延回路43と、これにより遅延された
ものと遅延されないものとを加算する加算器45とによ
る1次フィルタ、また第3図Aに示すように、遅延回路
43を2段通じたものと通じないものとを加算器45で
加算した2次フィルタ、更に第3図Cに示すように遅延
回路43を通じて乗算器46でcosωiの乗算がされ
たものと、遅延回路43を2段通じたものと、遅延され
ないものとを加算器45で加算した2次フィルタなどを
用いることができる。
なお、第3図A、B及びCにそれぞれ示したフィルタの
伝達関数はそれぞれ1±Z−1,1−Z−2及び1−2
coso7Z−” +Z2である。
伝達関数はそれぞれ1±Z−1,1−Z−2及び1−2
coso7Z−” +Z2である。
これ等フィルタの縦続接続のみならず、更に高次のフィ
ルタを用いてもよい。
ルタを用いてもよい。
第1図のパラメータ補間器16により補間された制御パ
ラメータは第2図の端子46.47を通じて反共振回路
38.39に与えられる。
ラメータは第2図の端子46.47を通じて反共振回路
38.39に与えられる。
制御パラメータは反共振周波数を示すもので、反共振回
路38.39における乗算器46の乗数ω・が制御され
る。
路38.39における乗算器46の乗数ω・が制御され
る。
反共振周波数においては、反共振回路の出力は零になる
。
。
したがって反共振回路38゜39に入力される反共振周
波数が接近すると、加算器41の出力は零に近くなり、
帰還回路のループゲインは1に近くなる。
波数が接近すると、加算器41の出力は零に近くなり、
帰還回路のループゲインは1に近くなる。
よって出力端子3γには強い共振特性が現れる。
つまり反共振回路を通じない帰還ループ33で発振が生
じ、その共振出力は反共振回路38.39の帰還量で制
御され、かつ反共振回路38.39の反共振周波に応じ
て周波数特性が制御される。
じ、その共振出力は反共振回路38.39の帰還量で制
御され、かつ反共振回路38.39の反共振周波に応じ
て周波数特性が制御される。
第4図には、次数が偶数で10の場合のスペクトル包絡
形成部12の構成例を示す。
形成部12の構成例を示す。
出力端子3γより直接帰還されるものは反共振回路38
゜39の各終段の加算器にそれぞれ供給した場合である
。
゜39の各終段の加算器にそれぞれ供給した場合である
。
反共振回路38.39においてω1〜ω、。θ1〜θ、
が反共振周波数であり、音声のスペクトル包絡情報を特
徴づける。
が反共振周波数であり、音声のスペクトル包絡情報を特
徴づける。
これらのパラメータとスペクトル包絡特性とは第5図に
示すような関係があり、隣接するパラメータの近さでス
ペクトルの共振4性が表現できる。
示すような関係があり、隣接するパラメータの近さでス
ペクトルの共振4性が表現できる。
これらのパラメータはO〈θ1〈ω1〈θ2〈ω2〈θ
3〈ω3〈θ4〈ω4ル八〈ω、〈πの順序関係があり
、逆にこの関係が満たされれば、スペクトル包絡形成部
12は安定であるという特徴をもつ。
3〈ω3〈θ4〈ω4ル八〈ω、〈πの順序関係があり
、逆にこの関係が満たされれば、スペクトル包絡形成部
12は安定であるという特徴をもつ。
つまり反共振回路を1個のみ用いてはループが安定し難
い場合があるが、2個を並列に設け、その反共振周波数
を先に示した関係にすると、安定なものを容易に得るこ
とができる。
い場合があるが、2個を並列に設け、その反共振周波数
を先に示した関係にすると、安定なものを容易に得るこ
とができる。
第4図において1次及び2次フィルタの順序は任意でも
よく、また次数は奇数でもよく任意に定められる。
よく、また次数は奇数でもよく任意に定められる。
等価変換により誘導される構成によるフィルタ形式も可
能であり、つまり例えば1次フィルタ及び2次フィルタ
の2段縦続接続の代りに1個の3次フィルタを用いるこ
ともできる。
能であり、つまり例えば1次フィルタ及び2次フィルタ
の2段縦続接続の代りに1個の3次フィルタを用いるこ
ともできる。
更にデジタルフィルタは遅延、加算、乗算動作によりp
波を行うものであり、いわゆる計算機を用いて演算処理
によりフィルタ作用を行わせることができる。
波を行うものであり、いわゆる計算機を用いて演算処理
によりフィルタ作用を行わせることができる。
つまり、端子37の信号を演算処理して、加算器41乃
至は加算器35へ供給するようにしてもよい。
至は加算器35へ供給するようにしてもよい。
第5図から理解されるようにθ1〜θ6.ω1〜ω、を
選定することにより、スペクトルの包絡線を変更するこ
とが容易であり、例えば合成しようとする音声をスペク
トル分析し、そのホルマント周波数付近に隣接するθと
ωとを接近して位置させればよく、スペクトルの共振特
性の対応も得やすい。
選定することにより、スペクトルの包絡線を変更するこ
とが容易であり、例えば合成しようとする音声をスペク
トル分析し、そのホルマント周波数付近に隣接するθと
ωとを接近して位置させればよく、スペクトルの共振特
性の対応も得やすい。
スペクトル包絡線は比較的複雑であるが、例えば10個
程度の共振両派数で表現でき、必要とする情報は僅かで
ある。
程度の共振両派数で表現でき、必要とする情報は僅かで
ある。
したがってこの音声合成器は部分自己相関係数による音
声合成とホルマント合成の両者の長所を備えるものであ
り、これを利用して少ない情報量で音声を合成したり、
規則による音声合成を行なうことができる。
声合成とホルマント合成の両者の長所を備えるものであ
り、これを利用して少ない情報量で音声を合成したり、
規則による音声合成を行なうことができる。
以上説明したようにこの発明は、音声のスペクトル包絡
情報をホルマントに類似した周波数領域のパラメータで
表現しているため、パラメータとスペクトル情報との直
観点な対応が得やすい。
情報をホルマントに類似した周波数領域のパラメータで
表現しているため、パラメータとスペクトル情報との直
観点な対応が得やすい。
及び補間特性に優れているなどの利点があり、このため
従来の方法より、より少ない情報量で音声を表現でき、
それだけ音声の伝送を少ない情報で行うことができ、ま
た音声情報を小さい記憶容量のメモリに蓄積できる。
従来の方法より、より少ない情報量で音声を表現でき、
それだけ音声の伝送を少ない情報で行うことができ、ま
た音声情報を小さい記憶容量のメモリに蓄積できる。
またすでに説明した実施例を用いれば原音声と同程度の
品質の音声を合成できる。
品質の音声を合成できる。
したがって音声の狭帯域伝送を行って経済的な通信を実
現させたり、音声を利用した各種サービスにおけるメモ
リ容量の有効利用、音声認識などに応用できる。
現させたり、音声を利用した各種サービスにおけるメモ
リ容量の有効利用、音声認識などに応用できる。
第1図はこの発明の音声合成器を示す構成図、第2図は
第1図の音源信号発生器及びスペクトル包絡形成部の一
例を示すブロック図、第3図はスペクトル包絡形成部を
構成する1次または2次フィルタの例を示す図、第4図
はスペクトル包絡形成部の具体例を示す図、第5図は反
共振周波数とスペクトル包絡との対応関係の例を示す図
である。 11:音源信号発生器、12ニスベクトル包絡形威部、
14:入力端子、15:パラメータ復号器、16:パラ
メータ補間器、38 、39 :反共振回路、46.4
7:反共振周波数制御端子。
第1図の音源信号発生器及びスペクトル包絡形成部の一
例を示すブロック図、第3図はスペクトル包絡形成部を
構成する1次または2次フィルタの例を示す図、第4図
はスペクトル包絡形成部の具体例を示す図、第5図は反
共振周波数とスペクトル包絡との対応関係の例を示す図
である。 11:音源信号発生器、12ニスベクトル包絡形威部、
14:入力端子、15:パラメータ復号器、16:パラ
メータ補間器、38 、39 :反共振回路、46.4
7:反共振周波数制御端子。
Claims (1)
- 1 音源信号がスペクトル包絡形成部に入力され、その
スペクトル包絡形成部は複素平面上の単位円上に複数個
の零点をもつ伝送特性の反共振回路がフィードバックル
ープに含まれ、この反共振回路の反共振周波数を制御す
ることによって音声のスペクトル包絡特性が変化され、
音声が合成されることを特徴とする音声合成器。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP54022318A JPS5853348B2 (ja) | 1979-02-26 | 1979-02-26 | 音声合成器 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP54022318A JPS5853348B2 (ja) | 1979-02-26 | 1979-02-26 | 音声合成器 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS55113100A JPS55113100A (en) | 1980-09-01 |
| JPS5853348B2 true JPS5853348B2 (ja) | 1983-11-29 |
Family
ID=12079369
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP54022318A Expired JPS5853348B2 (ja) | 1979-02-26 | 1979-02-26 | 音声合成器 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5853348B2 (ja) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5786898A (en) * | 1980-11-19 | 1982-05-31 | Nippon Electric Co | Voice synthetic filter |
| US4536886A (en) * | 1982-05-03 | 1985-08-20 | Texas Instruments Incorporated | LPC pole encoding using reduced spectral shaping polynomial |
| JPS58198096A (ja) * | 1982-05-14 | 1983-11-17 | 日本電気株式会社 | 線スペクトル型音声分析合成装置 |
-
1979
- 1979-02-26 JP JP54022318A patent/JPS5853348B2/ja not_active Expired
Also Published As
| Publication number | Publication date |
|---|---|
| JPS55113100A (en) | 1980-09-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS5853352B2 (ja) | 音声合成器 | |
| JPH04181996A (ja) | 音源装置 | |
| US8750530B2 (en) | Method and arrangement for processing audio data, and a corresponding corresponding computer-readable storage medium | |
| US6564187B1 (en) | Waveform signal compression and expansion along time axis having different sampling rates for different main-frequency bands | |
| Välimäki et al. | Spectral delay filters | |
| JPS5853348B2 (ja) | 音声合成器 | |
| JPH09230896A (ja) | 音声合成装置 | |
| US20080215330A1 (en) | Audio Signal Modification | |
| JP7179250B1 (ja) | 音質生成手段と音響データ生成手段 | |
| JPH02137889A (ja) | 信号記録方法及び装置 | |
| JPH04116700A (ja) | 音声分析・合成装置 | |
| JPH04279B2 (ja) | ||
| FI131506B1 (en) | Signal processing method | |
| JPH0318720B2 (ja) | ||
| US5264658A (en) | Electronic musical instrument having frequency dependent tone control | |
| JPS6091227A (ja) | 音響解析装置の合成装置 | |
| JPH1062460A (ja) | 信号分離装置 | |
| JPS62235996A (ja) | 合成音質変化方法 | |
| JP2010513940A (ja) | ノイズ合成 | |
| JPH0235994B2 (ja) | ||
| DE3943795C2 (de) | Interpolationsfilter | |
| Timoney et al. | EPS models of AM-FM vocoder output for new sounds generations | |
| DE3938312C2 (de) | Verfahren zum Erzeugen von Quelltondaten | |
| JP2000512776A (ja) | 人間の音声を後に再生するための人間の音声を符号化する方法及びシステム | |
| JPS6194100A (ja) | 音声合成装置 |