JPH0223880B2 - - Google Patents

Info

Publication number
JPH0223880B2
JPH0223880B2 JP55145081A JP14508180A JPH0223880B2 JP H0223880 B2 JPH0223880 B2 JP H0223880B2 JP 55145081 A JP55145081 A JP 55145081A JP 14508180 A JP14508180 A JP 14508180A JP H0223880 B2 JPH0223880 B2 JP H0223880B2
Authority
JP
Japan
Prior art keywords
speech
register
signal
synthesis
speech synthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP55145081A
Other languages
English (en)
Other versions
JPS5768899A (en
Inventor
Tadashi Saito
Akihiro Asada
Gichu Oota
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP55145081A priority Critical patent/JPS5768899A/ja
Publication of JPS5768899A publication Critical patent/JPS5768899A/ja
Publication of JPH0223880B2 publication Critical patent/JPH0223880B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 この発明は、音声合成用の特徴パラメータを音
声信号から抽出し、抽出された該パラメータから
元の音声信号を合成する音声分析・合成装置に関
するものである。
近年、半導体技術の進歩と、音声処理技術の発
達により、音声合成装置が、産業用から民生用ま
での幅広い用途で用いられるようになつた。音声
合成の方式としては、ボコーダ方式やターミナル
アナログ方式などの各種の方式が開発されてきて
いるが、現在では音声合成に必要な情報量が少な
くてすむという点と、高品質の合成音が得られる
という点から、偏自己相関係数(以後PARCOR
係数と称す)を用いるPARCOR方式が主流とな
りつつある。
PARCOR方式は、音声研究分野ではよく知ら
れた方式であるからその詳しい説明は省略する
が、PARCOR方式による分析・合成システムの
従来例の概要を、第1図に示すブロツク図に従つ
て簡単に説明する。同図を参照する。
マイクロフオン1は、話者が発声した音声を電
気的な音声信号に変換する。A/D変換装置2
は、入力された音声信号を、アナログ量からデイ
ジタル量へ変換する。音声分析装置3は、音声信
号から音声を特徴づけている特徴パラメータの抽
出を行ない、さらに音声合成作用データに符号化
するものであり、実際には汎用の計算機が用いら
れている。音声合成専用ROM4は、音声合成用
データを記憶するためのROMである。音声合成
LSI5は、音声合成専用ROM4から音声合成用
のデータを読み出し、音声を合成するLSI(大規
集積回路)である。スピーカ6は音声合成LSI5
で合成された電気的な音声信号を、実際の音声に
変換する。音声合成制御回路7は、音声合成LSI
の動作を制御する回路であり、マイクロコンピユ
ータなどが用いられる。
話者が発声した音声波形は、マイクロフオン
1、A/D変換装置2によつてデイジタル量に変
換されて音声分析装置3に入力される。音声分析
装置3は、入力された音声信号を一定間隔のフレ
ーム、例えば10msecあるいは20msecのフレーム
に分割し、各フレーム内の音声信号の統計的処理
を行ない、特徴パラメータ(PARCOR方式の場
合、PARCOR係数、ピツチ周波数、音量情報、
有声音/無声音情報等である)を抽出する。音声
分析装置3では、さらに抽出した特徴パラメータ
を、音声合成LSI5のデータフオーマツトに一致
する形に符号化する。1フレームの特徴パラメー
タは、例えば48ビツトのデータに符号化される。
ただし、無音時には6ビツトのデータになる。符
号化された各フレームごとの合成用の特徴パラメ
ータは、時系列的に音声合成専用ROM4に書込
まれる。音声を合成する場合には、音声合成LSI
5が、10msecあるいは20msecのフレーム間隔ご
とに、音声合成専用ROM4から合成用データを
読出し、音声を合成する。音声合成専用ROM4
には特徴パラメータが時系列的に書込まれている
ので、音声合成LSI5によつて1フレームごとに
合成される音声は、全体としていくつかのフレー
ムの音声が継ぎ合わされたものとなり、元の音声
と同じものとなる。音声合成制御回路7は、音声
合成の開始、停止などの命令を音声合成LSI5に
伝えるためのものである。
元の音声波形から、特徴パラメータを抽出し符
号化する操作を音声分析、符号化された特徴パラ
メータから、音声信号を再構成する操作を音声合
成と呼んでいる。音声分析は、通常汎用計算機を
用いて行なわれており、音声合成を行なう前にあ
らかじめ完了している。しかし、音声分析を行な
うと、音声信号を再現するために必要なデータ量
を大幅に削減できるという利点があることから、
音声分析を行ないデータ圧縮された特徴パラメー
タだけを転送し、その特徴パラメータから音声合
成によつて音声を再現するという新しい方式のデ
イジタル電話や、磁気テープのかわりに半導体メ
モリにデータ圧縮された特徴パラメータを記録
し、再生時には音声合成によつて特徴パラメータ
から音声を再現する半導体レコーダなどにも音声
分析・音声合成システムが応用されようとしてい
る。この場合、音声信号が入力された瞬間に、実
時間で音声分析を行なつて特徴パラメータを抽出
し、同時に実時間で音声合成を行なうことが要求
される。
第2図に、実時間で音声の分析・合成を行なう
従来システムの概要をブロツク図で示す。同図で
は、入力された音声信号から音声分析装置3で抽
出された特徴パラメータは、直接音声合成LSI5
に送られ、音声が合成される。第3図に、実時間
で音声の分析を行ない、抽出された特徴パラメー
タだけを通信回線を使つて遠隔地へ伝送し、そし
て音声の合成を行なうシステムの概要を同じくブ
ロツク図で示す。同図では、抽出された特徴パラ
メータは、モデム8,9により通信回線10を通
して伝送され、音声合成LSI5に送られる。
音声の分析、合成は、音声信号をフレームに分
割して行なつているので、実時間で分析・合成を
行なう場合には、分析装置と合成装置とのフレー
ムの同期をとる必要がある。ところが、合成装置
は音声合成LSIを用いて構成されることが多く、
そのフレーム長を微調整することは一般には困難
である。また、音声の分析・合成を実時間で行な
つているので、タイミング合せのために、音声の
分析・合成を一時的に休止させることは、音質の
著しい劣化を招くという重大な欠点がある。
この発明の目的は、上記した音声分析・合成シ
ステムの実時間動作時に生じる技術的困難を克服
し、音質のの劣化がほとんどなく、また音声合成
装置と音声合成装置とのフレームの同期を容易に
行なうことが可能な音声分析・合成装置を提供す
ることにある。
この発明の要点は、音声分析装置と音声合成装
置をそれぞれ独自のフレーム周期で動作させ、音
声分析装置の出力部に2つのレジスタをもうける
ことにより音声合成装置が合成用のデータを要求
したときに、その時点での最新の分析結果を、音
声分析装置が常に出力可能となるように構成した
点にある。
第4図は、この発明の一実施例を示すブロツク
図である。同図において、音声分析装置3では、
出力部に2つのレジスタ、すなわちAレジスタ1
1とBレジスタ12を持つており、音声合成LSI
5からのデータ要求信号Cとデータ要求タイミン
グ信号Bに応じて、符号化された特徴パラメータ
を端子Aから出力する。
Aレジスタ11は、シリアル入力、パラレル出
力の例えば48ビツトのレジスタであり、音声分析
回路17からシリアルに送られてくる符号化され
た特徴パラメータを記憶する。Bレジスタ12
は、パラレル/シリアル入力シリアル出力の例え
ば48ビツトのレジスタであり、音声合成LSI5の
データ要求タイミング信号Bに応じて、符号化さ
れた48ビツトの特徴パラメータを出力バツフア1
3を通して出力する。Bレジスタ12は、巡回形
となつており、48ビツト分のデータを出力すると
Bレジスタの内容は一巡し、データは保存され
る。RSフリツプフロツプ14、インバータ15、
NORゲート16で形成される論理回路は、Aレ
ジスタ11の記憶内容を、Bレジスタ12へ転送
する信号Gを作るためのタイミング回路である。
音声分析回路17では、音声信号から抽出し、符
号化した特徴パラメータDと、1フレーム分の特
徴パラメータがAレジスタ11に格納されたこと
を示す信号Eを出力する。音声合成LSI5は、1
フレームに1回、データ要求信号Cとデータ要求
タイミング信号Bを出力し、符号化された特徴パ
ラメータをBレジスタ12からバツフア13を介
して読み込んで音声を合成し、スピーカ6から出
力する。
第5図は第4図における各部信号のタイミング
チヤートであるが、同図に示すように、データ要
求信号Cがハイレベルになつている時に、データ
要求タイミング信号Bとして48個(ただし無音の
場合には6個)のパルスが音声合成LSI5から音
声分析装置3へ送られ、48ビツトの符号化データ
がBレジスタ12から音声合成LSI5へ転送され
る。
1フレーム分の音声分析が終了し、1フレーム
分の48ビツトのデータが、Aレジスタ11に格納
されると、音声分析回路17から信号Eが出力さ
れてRSフリツプフロツプ14がセツトされる。
この時、データ要求信号Cがローレベルならば、
NORゲート16からAレジスタ11のデータを
Bレジスタ12へ転送する信号Gが出力され、
RSフリツプフロツプもリセツトされる。音声分
析装置3から音声合成LSI5へのデータの転送が
すでに始まつている場合には、データ要求信号C
がハイレベルとなつており、RSフリツプフロツ
プ14がセツトされても、転送信号Gは出力され
ない。データ要求信号Cがローレベルになつた時
に転送信号Gが出力され、Bレジスタ12に最近
の特徴パラメータがAレジスタ11から転送さ
れ、RSフリツプフロツプ14もリセツトされる。
Aレジスタ11に符号化データが確定している時
間は、データ要求信号Cよりも長くなることが保
証されている。
合成装置5のフレームが、分析装置3のフレー
ムよりも短い場合には、第6図のタイミング図に
示すように、同じデータが、音声合成用に2回用
いられることになり、結果的に同じ音声が2フレ
ーム続く。Bレジスタ12は巡回形となつている
ので、何回データを読み出しても、一巡後は常に
同じデータが出力される。ただし、無音時には、
符号化データの先頭の6ビツトがすべて0となつ
ており、音声合成LSI5はこの無音符号を検出す
ると自動的にデータ要求タイミング信号Bの出力
を停止する。したがつて6ビツト分しかBレジス
タ12から読み出されない。しかし、無音時には
すべての符号化データを0としてあるので、結果
的にデータは保存される。
逆に合成装置5のフレームが、分析装置3のフ
レームよりも長い場合には、第7図のタイミング
図に示すように、分析された符号化データの中の
いくつかのフレームのデータが、まびかれて合成
に用いられなくなる。いずれの場合においても、
音声の分析・合成は間断なく行なわれるので、分
析・合成された音声の品質はほとんど劣化しな
い。例えば分析装置と合成装置のフレームが、1
%ずれていたとしても、100フレームに1回、1
フレームの音声が2フレーム分に長くのびたり、
あるいは1フレーム分の音声が欠落するだけであ
り、音質の変化はほとんど生じない。
第4図の実施例では、Aレジスタ11に符号化
された特徴パラメータが格納されたことを示す信
号Eと、合成装置5のデータ要求信号Cとから、
Bレジスタ12への転送信号Gを作りだしている
が、Aレジスタ11からBレジスタ12への転送
は、(i)特徴パラメータの符号化を行なつている途
中であり、Aレジスタ11の内容が確定していな
い状態、(ii)音声合成装置5によつてBレジスタ1
2の内容が読み出されている状態、の2つの状態
以外であれば良く、第4図の実施例以外にも多く
の方法がある。
また、第4図の実施例では、第2図に示す音声
分析装置と音声合成装置が直接接続されているシ
ステムについて述べているが、第3図に示すよう
なシステムにおいては、音声分析装置とモデムあ
るいはモデムと音声合成装置の間のいずれか、あ
るいは双方に、第4図に示すこの発明を実施すれ
ば良い。
以上述べたように、この発明によれば、音声分
析装置と音声合成装置との間のフレーム同期をと
る必要がなくなり、音声分析・合成システム、特
にデイジタル電話等の構成が大幅に簡単になり、
コストの削減ができるという利点がある。
【図面の簡単な説明】
第1図は、音声分析・合成システムの従来例を
示すブロツク図、第2図および第3図は、それぞ
れ実時間で音声の分析・合成を行なう従来のシス
テムの概要を示すブロツク図、第4図は、この発
明の一実施例を示すブロツク図、第5図は、第4
図における各部信号のタイミングチヤート、第6
図は、音声合成装置のフレームが分析装置のフレ
ームよりも短い場合の第4図における各部信号の
タイミングチヤート、第7図は、同じく長い場合
の同様な各部信号のタイミングチヤート、であ
る。 符号説明、1……マイクロフオン、2……A/
D変換装置、3……音声分析装置、4……音声合
成専用ROM、5……音声合成LSI、6……スピ
ーカ、7……音声合成制御回路、8,9……モデ
ム、10……通信回線、11……Aレジスタ、1
2……Bレジスタ、13……出力バツフア、14
……RSフリツプフロツプ、15……インバータ、
16……NORゲート、17……音成分析回路。

Claims (1)

  1. 【特許請求の範囲】 1 音声信号をある時間間隔をもつフレームに分
    割し、前記各フレームの音声信号の特徴を表す特
    徴パラメータを該音声信号から抽出する音声分析
    装置と、前記特徴パラメータを用いて元の音声信
    号を再構成する音声合成装置とを有して成る音声
    分析・合成装置において、 (イ) 前記音声分析装置によつて抽出された特徴パ
    ラメータを記憶しておく第1のレジスタと、 (ロ) 前記第1のレジスタの出力と自分自身の出力
    とを入力とする巡回形の第2のレジスタと、 (ハ) 前記第1のレジスタに前記特徴パラメータが
    格納されており、かつ音声合成装置が前記特徴
    パラメータ要求信号を出力していない時に、前
    記第1のレジスタから第2のレジスタへの特徴
    パラメータの転送を実行させるデータ転送信号
    を出力し、音声合成装置が前記特徴パラメータ
    要求信号を出力しているとき、前記第2のレジ
    スタから音声合成装置への特徴パラメータの転
    送を実行させる制御信号を出力するタイミング
    回路と、 を具備したことを特徴とする音声分析・合成装
    置。
JP55145081A 1980-10-18 1980-10-18 Voice analyzing and synthesizing device Granted JPS5768899A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55145081A JPS5768899A (en) 1980-10-18 1980-10-18 Voice analyzing and synthesizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55145081A JPS5768899A (en) 1980-10-18 1980-10-18 Voice analyzing and synthesizing device

Publications (2)

Publication Number Publication Date
JPS5768899A JPS5768899A (en) 1982-04-27
JPH0223880B2 true JPH0223880B2 (ja) 1990-05-25

Family

ID=15376936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55145081A Granted JPS5768899A (en) 1980-10-18 1980-10-18 Voice analyzing and synthesizing device

Country Status (1)

Country Link
JP (1) JPS5768899A (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4953342A (ja) * 1972-09-27 1974-05-23
JPS5229121A (en) * 1975-08-30 1977-03-04 Toshiba Corp False motion prevention circuit when putting on and off of logical cir cuit and so on
AT353855B (de) * 1977-07-28 1979-12-10 Grundig Emv Anordnung zur exakten spurhaltung
JPS5569197A (en) * 1978-11-17 1980-05-24 Sanyo Electric Co Musical scale controller

Also Published As

Publication number Publication date
JPS5768899A (en) 1982-04-27

Similar Documents

Publication Publication Date Title
JPS623439B2 (ja)
JPH0223880B2 (ja)
JPH0235320B2 (ja)
US20070016424A1 (en) Voice synthesizing method using independent sampling frequencies and apparatus therefor
JPS6295595A (ja) 音声応答方式
JPS61122700A (ja) 合成音声発声速度制御方式
Buric et al. Digital signal processor: Speech synthesis
JPH0664477B2 (ja) 音声合成装置
KR100264389B1 (ko) 키변환 기능을 갖는 컴퓨터 음악반주기
JPS59140499A (ja) 音声合成装置
JPS5915299A (ja) 音声分析装置
JPS6040633B2 (ja) 無声破裂音源付きの音声合成装置
JPS61252598A (ja) 音声単語編集方式
JPH11327598A (ja) ヘリウム音声修復装置
JPS61103200A (ja) 音声蓄積再生装置
KR890000807B1 (ko) 음성 합성 시스템
JPS5876897A (ja) 音声合成装置
JPH0225519B2 (ja)
JPH0310960B2 (ja)
JPH0411421A (ja) パルス符号変調伝送装置
JPS63271400A (ja) 音声合成出力装置
JPS58215696A (ja) 実時間音声符号化装置
JPS5942317B2 (ja) 音声合成装置
JPS60104892U (ja) 音声入力による楽音発生装置
JPS5993498A (ja) 音声合成装置