JPS60500A

JPS60500A - 音声分析合成方法

Info

Publication number: JPS60500A
Application number: JP58108766A
Authority: JP
Inventors: 平岡　省二; 謙二加賀
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1983-06-16
Filing date: 1983-06-16
Publication date: 1985-01-05
Also published as: JPH0344319B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は音声信号をディジタル化した後、分析し、分析
して得られたパラメー′夕を低データレートで伝送また
は記憶し、再び音声信号に復元する音声分析合成装置に
関するものである。−従来例の構成とその問題点通常、音声分析合成装置においては入力された音声から
分析器で声道パラメータと音源ノ（ラメータを抽出し、
各パラメータにコード化等のデータレート低減のための
処理を施し、伝送路または記憶素子へ送出し、これを合
成器で音声に再合成する。この場合の方式として従来、
音源）くラメータの違いにより、（１）分析時に抽出さ
れる分析残差波形をそのまま或いは差分等の処理でデー
タ圧縮して伝送または記憶する方式、（２り音声の大き
さを表わす振幅パラメータ、声の高さを表わすピッチ・
（ラメータおよび有声無声切換情報を抽出して伝送また
は記憶する方式、（３）音声データを記憶する例では前
記２の方式の各ノ（ラメータと話者の分析残差波形の一
部を記憶しておき再合成する方式がある０（１）の方式では話者の声質をよく再合成できる反面伝
送または記憶時のデータレートが高いという欠点がある
０し）の方式では（１）の方式と反対にデータレートは低
いが話者の違いに関係なく一定の有声音源データを使用
するため声のつや等の個性的特徴が失なわれた合成音と
なる欠点がある。

（′４の方式は（１）および（ロ）の方式の中間的特徴
をもつが話者が一定でない実時間分析合成の例では適さ
ない。

発明の目的本発明は従来の技術の上記欠点を改善するもので、その
目的は音声の実時間伝送における情報量を極端に増大す
ることなく、話者の個性的な特徴を含んだ音声を再合成
するだめの伝送方式を提供するものである。

発明の構成本発明は音声をディジタル信号に変換し線形予測法など
で声道、振幅、ピッチ、有声無声判定の各パラメータを
抽出するパラメータ分析部の他に分析残差波形の一部を
有声駆動音源データとして切出す回路を分析器に有し、
パラメータと有声駆動音源データを低データレートで伝
送する伝送路を有し、有声駆動音源データが伝送されて
くる以前には予め定めた波形を使用し有声駆動音源デー
タが伝送されてから以降は新しい駆動音源データを使用
して音声合成する合成器を有する音声分析合成装置であ
る０実施例の説明以下、本発明の実施例を詳細に説明する０第１図は本発
明による音声分析合成装置の構成を示すブロック画であ
る０第１図において、１はマイクロフォン等の収音器で
伝送する音声を収音しアナログ信号に変換して、音声分
析器２に与える。音声分析器２はアナログ信号を８に〜
１０ＫＨｚ程度でサンプリングしディジタル信号に変換
した後６〜２０　ｍｓ程度の区間（フレームと呼ぶ）毎
に線形予測分析等によシ声道パラメータと音源ノくラメ
ータをめ、このパラメータを符号化等によシさらに帯域
圧縮し、伝送路３に送出、するＯ伝送路３は通常の電話
回線のように実時間で伝送される系のほか、書込可能な
メモリ素子（ＲＡＭ）等のような記憶媒体であってもよ
い０圧縮ノくラメータを受信した音声合成器４では音声
分析器２で行なった帯域圧縮の逆の操作を行ない音声信
号を復元する。この復元した音声信垂をスピーカ６に与
え音声再生する。

帯域圧縮技術として本実施例では線形予測分析法の一つ
であるＰＡｆｔＣＯＲ法を用いている。

ＰＡＲＣＯＲ法を用いた音声分析器については後述する
。

第２図に示した音声信号をＰＡＲＣＯＲ分析、パラメー
タ伝送、ＰＡＲＣＯＲ合成する際、伝送路の容量はパラ
メータの単位時間当りの最大データレートで定まるが、
実際の伝送では第２図において区間（→、（４）に比し
て区間（１）　９　（３）　９　（５）のような無音区
間では転送データレートは極端に低い。そこで、本発明
では区間（２）や（４）で分析して得られた残差波形の
うち定常的な母音区間の一部を区間０）や（句で伝送し
合成器で有声駆動音源として使用する。この残差波形に
はパラメータで表わされない話者の個人性が含まれてい
るので個人性豊かな音声が合成できる。有声駆動音源デ
ータは通常１ピッチ周期以下のデータ列であるが本実施
例では８ビット×３１点で構成しているため２４８ビツ
トを無音区間に転送する必要があり、今、２４００ビッ
ト／秒の伝送路を使用すれば、この残差データの伝送に
約１ｏ○ミリ秒所要するが、通常の発声では数百ミ＋７
秒程度の無音区間はよく存在するので十分伝送できる。

なお有声駆動音源データは差分法等でデータ圧縮し短か
い無音区間で伝送することもできる〇一方、合成器は区
間（２）のような発声開始時点ではまだ駆動音源データ
が伝送されていないので予め定めたインノ＜ルス波形等
を有声駆動音源データとして使用する０第３図は第１図中２に相当する音声分析器の構成を示す
ブロック甲である。２１は音声信号をサンプリンブレデ
ィジタル信号に変換するムＤ変換器でディジタル信号は
ＰＡ、ＲＯＯＲ分析器２２、ピッチ抽出器２３、有声無
声判定器２４、無音区間検出器２６に送られるｏＰ、Ａ
ＲＣＯｆ’１分析器２２で得られた残差信号は残差切出
回路２６で残差信号の一部を切出され一時蓄わ見られる
Ｏまた振幅決定回路２７で振幅パラメータがめられる。

ＰＡＲＣＯＦｔ分析器２２、ピッチ抽出器２３、有声無
声判定器２４、無音区間検出器２６および振幅決定回路
２７でめられたパラメータは符号器２８で符号化され、
切換器２９を経である時間区間（フレーム）を代表する
パラメータ値として伝送路３に送出される。無音区間検
出器２５で無音区間が検出されると切換器２９は反転し
残差切出　−回路２６で切出された残差波形の一部が合
成器の有声音源データとして伝送される。

第４図は伝送されてくるパラメータおよび有声音源デー
タを受けて音声信号を合成するＰＡＲＣＯＲ方式音声合
成器の構成を示すブロック図であり、第１図の４に対応
する。伝送されてくるデータは選択器４１で２種類に分
離され、パラメータはパラメータメモリ４２に蓄わえら
れ、有声音源データは音源メモリ４３に蓄わえられる。

電源投入直後および長時間の無音区間を検出した時は前
記の予め定めたインパルス波形等の有声音源データが音
源メモリ４３に自動的にセットされ、選択器４１より新
しい有声音源データがセットされるまで保持される。４
４は無声音源発生器で、有声。

無声選択器４６で音源メモリ４３または無声音源発生器
４４のいずれかのデータが選択され、ツク゛ラメータメ
モリ４２内のノ（ラメータとともにディジタルフィルタ
４６で演算され、その結果力より人変換器４７でアナロ
グ信号に変換されて音声信号となシ、増幅器４８で増幅
されてスピーカ６へ供給される。

発明の効果以上のように、本発明は実時間で音声波形を分析、伝送
、合成する際に定常の有声音区間を分析して得られた残
差波形の一部を有声駆動音源データとして無音中の低デ
ータレートの区間に伝送するようにした音声分析合成装
置で、音声分析時に抽出される残差波形の一部を、）く
ラメータを伝送しない無音区間に伝送することにより、
伝送路の最大転送データ容量を増大させることなく、声
のつやや丸やかさ等といった話者特有の声質層７５為な
音声を合成することができる。

【図面の簡単な説明】

第１図は本発明による音声分析合成装置の構成を示すブ
ロック図、第２図は音声波形と伝送するデータの時間関
係を示した波形図、第３図は本発明による音声分析合成
装置の音声分析器部の構成を示すブロック図、第４図は
本発明による音声合成分析装置の音声合成器部の構成を
示すブロック図である。１・・・・・・収音器、２・・・・・・音声分析器、３
・・・・・・伝送路、４・・・・・・音声合成器、６・
・パ・・・スピーカ、２１・・・・・・ＡＤ変換器、２
２・・・・・・ＰＡＲ（３０Ｒ分析器、２３・・・・・
・ピッチ抽出器、２４・・・・・・有声無声判定器、２
５・・・・・・無声区間検出器、２６・・・・・・残差
切出回路、２７・・・・・・振幅決定回路、２８・・・
・・・符号器、２９・・・・・・切換器、４１・・・・
・・選択器、４２・・・・・・）・フメータメモリ、４
３・・・・・・音源メモリ、４４・・・・・・無声音源
発生器、４６・・・・・・ディジタルフィルタ、４７・
・・・・・Ｄム変換器。代理人の氏名　弁理士　中　尾　敏　男　ほか１名６８
１

Claims

【特許請求の範囲】

（１）定常の有声音区間を分析して得られた残差波形の
一部を有声駆動音源データとして無音区間に伝送し音声
合成することを特徴とする音声分析合成装置。
（２）　残差波形の一部が抽出される以前゛は予め定め
た波形を有声駆動音源デ゛−夕として音声合成する特許
請求の範囲第１項記載の音声分析合成装置０