JPS60500A - 音声分析合成方法 - Google Patents
音声分析合成方法Info
- Publication number
- JPS60500A JPS60500A JP58108766A JP10876683A JPS60500A JP S60500 A JPS60500 A JP S60500A JP 58108766 A JP58108766 A JP 58108766A JP 10876683 A JP10876683 A JP 10876683A JP S60500 A JPS60500 A JP S60500A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- sound source
- voiced
- analysis
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は音声信号をディジタル化した後、分析し、分析
して得られたパラメー′夕を低データレートで伝送また
は記憶し、再び音声信号に復元する音声分析合成装置に
関するものである。−従来例の構成とその問題点 通常、音声分析合成装置においては入力された音声から
分析器で声道パラメータと音源ノ(ラメータを抽出し、
各パラメータにコード化等のデータレート低減のための
処理を施し、伝送路または記憶素子へ送出し、これを合
成器で音声に再合成する。この場合の方式として従来、
音源)くラメータの違いにより、(1)分析時に抽出さ
れる分析残差波形をそのまま或いは差分等の処理でデー
タ圧縮して伝送または記憶する方式、(2り音声の大き
さを表わす振幅パラメータ、声の高さを表わすピッチ・
(ラメータおよび有声無声切換情報を抽出して伝送また
は記憶する方式、(3)音声データを記憶する例では前
記2の方式の各ノ(ラメータと話者の分析残差波形の一
部を記憶しておき再合成する方式がある0 (1)の方式では話者の声質をよく再合成できる反面伝
送または記憶時のデータレートが高いという欠点がある
0 し)の方式では(1)の方式と反対にデータレートは低
いが話者の違いに関係なく一定の有声音源データを使用
するため声のつや等の個性的特徴が失なわれた合成音と
なる欠点がある。
して得られたパラメー′夕を低データレートで伝送また
は記憶し、再び音声信号に復元する音声分析合成装置に
関するものである。−従来例の構成とその問題点 通常、音声分析合成装置においては入力された音声から
分析器で声道パラメータと音源ノ(ラメータを抽出し、
各パラメータにコード化等のデータレート低減のための
処理を施し、伝送路または記憶素子へ送出し、これを合
成器で音声に再合成する。この場合の方式として従来、
音源)くラメータの違いにより、(1)分析時に抽出さ
れる分析残差波形をそのまま或いは差分等の処理でデー
タ圧縮して伝送または記憶する方式、(2り音声の大き
さを表わす振幅パラメータ、声の高さを表わすピッチ・
(ラメータおよび有声無声切換情報を抽出して伝送また
は記憶する方式、(3)音声データを記憶する例では前
記2の方式の各ノ(ラメータと話者の分析残差波形の一
部を記憶しておき再合成する方式がある0 (1)の方式では話者の声質をよく再合成できる反面伝
送または記憶時のデータレートが高いという欠点がある
0 し)の方式では(1)の方式と反対にデータレートは低
いが話者の違いに関係なく一定の有声音源データを使用
するため声のつや等の個性的特徴が失なわれた合成音と
なる欠点がある。
(′4の方式は(1)および(ロ)の方式の中間的特徴
をもつが話者が一定でない実時間分析合成の例では適さ
ない。
をもつが話者が一定でない実時間分析合成の例では適さ
ない。
発明の目的
本発明は従来の技術の上記欠点を改善するもので、その
目的は音声の実時間伝送における情報量を極端に増大す
ることなく、話者の個性的な特徴を含んだ音声を再合成
するだめの伝送方式を提供するものである。
目的は音声の実時間伝送における情報量を極端に増大す
ることなく、話者の個性的な特徴を含んだ音声を再合成
するだめの伝送方式を提供するものである。
発明の構成
本発明は音声をディジタル信号に変換し線形予測法など
で声道、振幅、ピッチ、有声無声判定の各パラメータを
抽出するパラメータ分析部の他に分析残差波形の一部を
有声駆動音源データとして切出す回路を分析器に有し、
パラメータと有声駆動音源データを低データレートで伝
送する伝送路を有し、有声駆動音源データが伝送されて
くる以前には予め定めた波形を使用し有声駆動音源デー
タが伝送されてから以降は新しい駆動音源データを使用
して音声合成する合成器を有する音声分析合成装置であ
る0 実施例の説明 以下、本発明の実施例を詳細に説明する0第1図は本発
明による音声分析合成装置の構成を示すブロック画であ
る0第1図において、1はマイクロフォン等の収音器で
伝送する音声を収音しアナログ信号に変換して、音声分
析器2に与える。音声分析器2はアナログ信号を8に〜
10KHz程度でサンプリングしディジタル信号に変換
した後6〜20 ms程度の区間(フレームと呼ぶ)毎
に線形予測分析等によシ声道パラメータと音源ノくラメ
ータをめ、このパラメータを符号化等によシさらに帯域
圧縮し、伝送路3に送出、するO伝送路3は通常の電話
回線のように実時間で伝送される系のほか、書込可能な
メモリ素子(RAM)等のような記憶媒体であってもよ
い0圧縮ノくラメータを受信した音声合成器4では音声
分析器2で行なった帯域圧縮の逆の操作を行ない音声信
号を復元する。この復元した音声信垂をスピーカ6に与
え音声再生する。
で声道、振幅、ピッチ、有声無声判定の各パラメータを
抽出するパラメータ分析部の他に分析残差波形の一部を
有声駆動音源データとして切出す回路を分析器に有し、
パラメータと有声駆動音源データを低データレートで伝
送する伝送路を有し、有声駆動音源データが伝送されて
くる以前には予め定めた波形を使用し有声駆動音源デー
タが伝送されてから以降は新しい駆動音源データを使用
して音声合成する合成器を有する音声分析合成装置であ
る0 実施例の説明 以下、本発明の実施例を詳細に説明する0第1図は本発
明による音声分析合成装置の構成を示すブロック画であ
る0第1図において、1はマイクロフォン等の収音器で
伝送する音声を収音しアナログ信号に変換して、音声分
析器2に与える。音声分析器2はアナログ信号を8に〜
10KHz程度でサンプリングしディジタル信号に変換
した後6〜20 ms程度の区間(フレームと呼ぶ)毎
に線形予測分析等によシ声道パラメータと音源ノくラメ
ータをめ、このパラメータを符号化等によシさらに帯域
圧縮し、伝送路3に送出、するO伝送路3は通常の電話
回線のように実時間で伝送される系のほか、書込可能な
メモリ素子(RAM)等のような記憶媒体であってもよ
い0圧縮ノくラメータを受信した音声合成器4では音声
分析器2で行なった帯域圧縮の逆の操作を行ない音声信
号を復元する。この復元した音声信垂をスピーカ6に与
え音声再生する。
帯域圧縮技術として本実施例では線形予測分析法の一つ
であるPAftCOR法を用いている。
であるPAftCOR法を用いている。
PARCOR法を用いた音声分析器については後述する
。
。
第2図に示した音声信号をPARCOR分析、パラメー
タ伝送、PARCOR合成する際、伝送路の容量はパラ
メータの単位時間当りの最大データレートで定まるが、
実際の伝送では第2図において区間(→、(4)に比し
て区間(1) 9 (3) 9 (5)のような無音区
間では転送データレートは極端に低い。そこで、本発明
では区間(2)や(4)で分析して得られた残差波形の
うち定常的な母音区間の一部を区間0)や(句で伝送し
合成器で有声駆動音源として使用する。この残差波形に
はパラメータで表わされない話者の個人性が含まれてい
るので個人性豊かな音声が合成できる。有声駆動音源デ
ータは通常1ピッチ周期以下のデータ列であるが本実施
例では8ビット×31点で構成しているため248ビツ
トを無音区間に転送する必要があり、今、2400ビッ
ト/秒の伝送路を使用すれば、この残差データの伝送に
約1o○ミリ秒所要するが、通常の発声では数百ミ+7
秒程度の無音区間はよく存在するので十分伝送できる。
タ伝送、PARCOR合成する際、伝送路の容量はパラ
メータの単位時間当りの最大データレートで定まるが、
実際の伝送では第2図において区間(→、(4)に比し
て区間(1) 9 (3) 9 (5)のような無音区
間では転送データレートは極端に低い。そこで、本発明
では区間(2)や(4)で分析して得られた残差波形の
うち定常的な母音区間の一部を区間0)や(句で伝送し
合成器で有声駆動音源として使用する。この残差波形に
はパラメータで表わされない話者の個人性が含まれてい
るので個人性豊かな音声が合成できる。有声駆動音源デ
ータは通常1ピッチ周期以下のデータ列であるが本実施
例では8ビット×31点で構成しているため248ビツ
トを無音区間に転送する必要があり、今、2400ビッ
ト/秒の伝送路を使用すれば、この残差データの伝送に
約1o○ミリ秒所要するが、通常の発声では数百ミ+7
秒程度の無音区間はよく存在するので十分伝送できる。
なお有声駆動音源データは差分法等でデータ圧縮し短か
い無音区間で伝送することもできる〇一方、合成器は区
間(2)のような発声開始時点ではまだ駆動音源データ
が伝送されていないので予め定めたインノ<ルス波形等
を有声駆動音源データとして使用する0 第3図は第1図中2に相当する音声分析器の構成を示す
ブロック甲である。21は音声信号をサンプリンブレデ
ィジタル信号に変換するムD変換器でディジタル信号は
PA、ROOR分析器22、ピッチ抽出器23、有声無
声判定器24、無音区間検出器26に送られるoP、A
RCOf’1分析器22で得られた残差信号は残差切出
回路26で残差信号の一部を切出され一時蓄わ見られる
Oまた振幅決定回路27で振幅パラメータがめられる。
い無音区間で伝送することもできる〇一方、合成器は区
間(2)のような発声開始時点ではまだ駆動音源データ
が伝送されていないので予め定めたインノ<ルス波形等
を有声駆動音源データとして使用する0 第3図は第1図中2に相当する音声分析器の構成を示す
ブロック甲である。21は音声信号をサンプリンブレデ
ィジタル信号に変換するムD変換器でディジタル信号は
PA、ROOR分析器22、ピッチ抽出器23、有声無
声判定器24、無音区間検出器26に送られるoP、A
RCOf’1分析器22で得られた残差信号は残差切出
回路26で残差信号の一部を切出され一時蓄わ見られる
Oまた振幅決定回路27で振幅パラメータがめられる。
PARCOFt分析器22、ピッチ抽出器23、有声無
声判定器24、無音区間検出器26および振幅決定回路
27でめられたパラメータは符号器28で符号化され、
切換器29を経である時間区間(フレーム)を代表する
パラメータ値として伝送路3に送出される。無音区間検
出器25で無音区間が検出されると切換器29は反転し
残差切出 −回路26で切出された残差波形の一部が合
成器の有声音源データとして伝送される。
声判定器24、無音区間検出器26および振幅決定回路
27でめられたパラメータは符号器28で符号化され、
切換器29を経である時間区間(フレーム)を代表する
パラメータ値として伝送路3に送出される。無音区間検
出器25で無音区間が検出されると切換器29は反転し
残差切出 −回路26で切出された残差波形の一部が合
成器の有声音源データとして伝送される。
第4図は伝送されてくるパラメータおよび有声音源デー
タを受けて音声信号を合成するPARCOR方式音声合
成器の構成を示すブロック図であり、第1図の4に対応
する。伝送されてくるデータは選択器41で2種類に分
離され、パラメータはパラメータメモリ42に蓄わえら
れ、有声音源データは音源メモリ43に蓄わえられる。
タを受けて音声信号を合成するPARCOR方式音声合
成器の構成を示すブロック図であり、第1図の4に対応
する。伝送されてくるデータは選択器41で2種類に分
離され、パラメータはパラメータメモリ42に蓄わえら
れ、有声音源データは音源メモリ43に蓄わえられる。
電源投入直後および長時間の無音区間を検出した時は前
記の予め定めたインパルス波形等の有声音源データが音
源メモリ43に自動的にセットされ、選択器41より新
しい有声音源データがセットされるまで保持される。4
4は無声音源発生器で、有声。
記の予め定めたインパルス波形等の有声音源データが音
源メモリ43に自動的にセットされ、選択器41より新
しい有声音源データがセットされるまで保持される。4
4は無声音源発生器で、有声。
無声選択器46で音源メモリ43または無声音源発生器
44のいずれかのデータが選択され、ツク゛ラメータメ
モリ42内のノ(ラメータとともにディジタルフィルタ
46で演算され、その結果力より人変換器47でアナロ
グ信号に変換されて音声信号となシ、増幅器48で増幅
されてスピーカ6へ供給される。
44のいずれかのデータが選択され、ツク゛ラメータメ
モリ42内のノ(ラメータとともにディジタルフィルタ
46で演算され、その結果力より人変換器47でアナロ
グ信号に変換されて音声信号となシ、増幅器48で増幅
されてスピーカ6へ供給される。
発明の効果
以上のように、本発明は実時間で音声波形を分析、伝送
、合成する際に定常の有声音区間を分析して得られた残
差波形の一部を有声駆動音源データとして無音中の低デ
ータレートの区間に伝送するようにした音声分析合成装
置で、音声分析時に抽出される残差波形の一部を、)く
ラメータを伝送しない無音区間に伝送することにより、
伝送路の最大転送データ容量を増大させることなく、声
のつやや丸やかさ等といった話者特有の声質層75為な
音声を合成することができる。
、合成する際に定常の有声音区間を分析して得られた残
差波形の一部を有声駆動音源データとして無音中の低デ
ータレートの区間に伝送するようにした音声分析合成装
置で、音声分析時に抽出される残差波形の一部を、)く
ラメータを伝送しない無音区間に伝送することにより、
伝送路の最大転送データ容量を増大させることなく、声
のつやや丸やかさ等といった話者特有の声質層75為な
音声を合成することができる。
第1図は本発明による音声分析合成装置の構成を示すブ
ロック図、第2図は音声波形と伝送するデータの時間関
係を示した波形図、第3図は本発明による音声分析合成
装置の音声分析器部の構成を示すブロック図、第4図は
本発明による音声合成分析装置の音声合成器部の構成を
示すブロック図である。 1・・・・・・収音器、2・・・・・・音声分析器、3
・・・・・・伝送路、4・・・・・・音声合成器、6・
・パ・・・スピーカ、21・・・・・・AD変換器、2
2・・・・・・PAR(30R分析器、23・・・・・
・ピッチ抽出器、24・・・・・・有声無声判定器、2
5・・・・・・無声区間検出器、26・・・・・・残差
切出回路、27・・・・・・振幅決定回路、28・・・
・・・符号器、29・・・・・・切換器、41・・・・
・・選択器、42・・・・・・)・フメータメモリ、4
3・・・・・・音源メモリ、44・・・・・・無声音源
発生器、46・・・・・・ディジタルフィルタ、47・
・・・・・Dム変換器。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名68
1
ロック図、第2図は音声波形と伝送するデータの時間関
係を示した波形図、第3図は本発明による音声分析合成
装置の音声分析器部の構成を示すブロック図、第4図は
本発明による音声合成分析装置の音声合成器部の構成を
示すブロック図である。 1・・・・・・収音器、2・・・・・・音声分析器、3
・・・・・・伝送路、4・・・・・・音声合成器、6・
・パ・・・スピーカ、21・・・・・・AD変換器、2
2・・・・・・PAR(30R分析器、23・・・・・
・ピッチ抽出器、24・・・・・・有声無声判定器、2
5・・・・・・無声区間検出器、26・・・・・・残差
切出回路、27・・・・・・振幅決定回路、28・・・
・・・符号器、29・・・・・・切換器、41・・・・
・・選択器、42・・・・・・)・フメータメモリ、4
3・・・・・・音源メモリ、44・・・・・・無声音源
発生器、46・・・・・・ディジタルフィルタ、47・
・・・・・Dム変換器。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名68
1
Claims (2)
- (1)定常の有声音区間を分析して得られた残差波形の
一部を有声駆動音源データとして無音区間に伝送し音声
合成することを特徴とする音声分析合成装置。 - (2) 残差波形の一部が抽出される以前゛は予め定め
た波形を有声駆動音源デ゛−夕として音声合成する特許
請求の範囲第1項記載の音声分析合成装置0
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58108766A JPS60500A (ja) | 1983-06-16 | 1983-06-16 | 音声分析合成方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58108766A JPS60500A (ja) | 1983-06-16 | 1983-06-16 | 音声分析合成方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS60500A true JPS60500A (ja) | 1985-01-05 |
| JPH0344319B2 JPH0344319B2 (ja) | 1991-07-05 |
Family
ID=14492944
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58108766A Granted JPS60500A (ja) | 1983-06-16 | 1983-06-16 | 音声分析合成方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS60500A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS61166600A (ja) * | 1985-01-19 | 1986-07-28 | 三洋電機株式会社 | 音声合成装置 |
-
1983
- 1983-06-16 JP JP58108766A patent/JPS60500A/ja active Granted
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS61166600A (ja) * | 1985-01-19 | 1986-07-28 | 三洋電機株式会社 | 音声合成装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0344319B2 (ja) | 1991-07-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0380572B1 (en) | Generating speech from digitally stored coarticulated speech segments | |
| JP3607450B2 (ja) | オーディオ情報分類装置 | |
| JPS60500A (ja) | 音声分析合成方法 | |
| JPH10133678A (ja) | 音声再生装置 | |
| JPH0376480B2 (ja) | ||
| JPH0854895A (ja) | 再生装置 | |
| KR100359988B1 (ko) | 실시간 화속 변환 장치 | |
| JP2860991B2 (ja) | 音声蓄積再生装置 | |
| JPH0772896A (ja) | 音声の圧縮伸長装置 | |
| JPS62102294A (ja) | 音声符号化方式 | |
| JPS5912479A (ja) | 発音練習装置 | |
| JPH09146587A (ja) | 話速変換装置 | |
| KR100194659B1 (ko) | 디지탈 녹음기의 음성 녹음방법 | |
| JP3166797B2 (ja) | 音声符号化法及び音声復号化法並びに音声符復号化装置 | |
| JP2535809B2 (ja) | 線形予測型音声分析合成装置 | |
| JPS58113992A (ja) | 音声信号圧縮方式 | |
| JPH0376479B2 (ja) | ||
| JPH03160500A (ja) | 音声合成装置 | |
| JPH01261700A (ja) | 音声符号化方式 | |
| Linggard | Neural networks for speech processing: An introduction | |
| JPS61128299A (ja) | 音声処理装置 | |
| JPS5926795A (ja) | 音声装置 | |
| JPS58171095A (ja) | 雑音抑圧方式 | |
| JPS5915300A (ja) | 音声記録再生装置 | |
| JPS63262699A (ja) | 音声分析,合成装置 |