JPH05127697A - ホルマントの線形転移区間の分割による音声の合成方法 - Google Patents

ホルマントの線形転移区間の分割による音声の合成方法

Info

Publication number
JPH05127697A
JPH05127697A JP3142257A JP14225791A JPH05127697A JP H05127697 A JPH05127697 A JP H05127697A JP 3142257 A JP3142257 A JP 3142257A JP 14225791 A JP14225791 A JP 14225791A JP H05127697 A JPH05127697 A JP H05127697A
Authority
JP
Japan
Prior art keywords
formant
voice
personal computer
segment
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3142257A
Other languages
English (en)
Inventor
Yun-Kun Lee
ヨーン ケウン リー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
Gold Star Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gold Star Co Ltd filed Critical Gold Star Co Ltd
Publication of JPH05127697A publication Critical patent/JPH05127697A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/15Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 ホルマントの変異区間を線形特性をもつ部分
に分割し各部分のホルマントの情報を貯蔵した後音声デ
ータを抽出することにより適切な音声合成を行う。 【構成】 個人用計算機1、個人用計算機インタフェイ
ス2、音声合成器3、デジタルアナログ変換器8、RO
M4、およびRAM5を有する音声システムを用い、入
力文字にしたがうホルマント周波数データを分解領域の
段階で、ROMから読取り、次いでピッチとエネルギを
調整し、次いでホルマント周波数および帯域幅を計算
し、ホルマント形状を生成させ、濾波器により濾波され
たホルマントの形状のエネルギを調整し、現在のサンプ
ル個数を増加させる過程を経て音声合成を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はホルマントの線形転移区
間の分割による音声の合成方法に関する。本発明による
方法は、特に、音声のコーディングによる方法とホルマ
ント(formant)分析による規則合成方法を用い
て音声を形成させホルマントの線形転移区間の分割によ
る音声の合成を行う場合に用いることができる。
【0002】
【従来の技術】一般的に音声の合成方法は大きく2つに
分けられるがその中の1つが音声のコーディンクによる
方法でこれは音声のすべての音素(音節又は発音節単位
も含み)については実際の音声信号をLPC(line
ar predictive)又はLSP(line
spectrum pair)方法により分析した後こ
れをデータベースに貯蔵、任意の合成が必要な際、貯蔵
中の求める係数をデータベースより抽出して当該音声信
号を合成する方法でありもう一つの方法は音声のすべて
の音声について基本フォーマント周波数及び帯域幅を抽
出して音素の接合時に発生するホルマントの変化を規則
化して任意の発音の合成が必要な際、その規則をプラグ
ラムにより具現させることによって当該音声信号を合成
する方法である。
【0003】
【発明が解決しようとする課題】しかし、上記の電子の
音声コーディングによる方法を利用すれば比較的良質の
音声が得られる反面、音声信号を短期間単位のフレイム
で分割して各各のフレイムを分析しなければならないの
でデータの量がかさむ上、さらに音声信号の特性が変化
しない区間についても不必要なデータを生じメモリ量を
増加させなければならない問題があり後者のホルマント
分折による規則合成方法はホルマントの変異を一定の規
則により処理しなければならないのでその規則を求める
のに多くの困難が伴なった。本発明はこのような問題点
を解決すべくホルマントの変異区間を線形特性をもつ部
分に分割し、各部分のホルマントの情報を貯蔵した後こ
れより音声データを抽出する方法を創案したものであ
る。
【0004】
【課題を解決するための手段】本発明においては、個人
用計算機、個人用計算機インタフェイス、音声合成装
置、デジタルアナログ変換装置、および記憶手段を具備
する音声合成システムにおいて音声を合成する方法であ
って、(a)該記憶手段に記憶されたデータベースから
1つの文字に対応するホルマント周波数の情報を読み取
る段階であって、該文字が該個人用計算機のキイボード
により入力されるもの、(b)ホルマントの形状である
ホルマント情報を線形補間法により演算する段階であっ
て、該ホルマントの形状がホルマント周波数およびホル
マント周波数帯域幅により決定されるもの、(c)特性
周波数により分類された複数の帯域濾波器によりホルマ
ント形状の濾波を行う段階であって、該濾波されたホル
マント形状が該デジタルアナログ変換装置によりアナロ
グ音声信号に変換されるデジタル音声信号であるもの、
そして、(d)増幅器により該アナログ音声信号を調整
し、適切な音響レベルを生成させ、スピーカ手段から出
力させる段階、を具備することを特徴とする音声を合成
する方法、が提供される。
【0005】
【実施例】本発明によるホルマントの線形転移区間の分
割による、音声合成方法を行う装置が図1に示される。
図1に示されるように、個人用計算機(PC)1を通ず
るキイボード1aの文字データをインタフェイスするP
Cインタフェイス2と、上記PCインタフェイス2を通
ずる文字をASCIIコードで受け入れながら音声合成
のためにシステムを制御する音声合成器3と上記ディジ
タル信号処理器3のプログラム処理中に必要なデータを
貯蔵するRAM5を上記音声合成器3のセレクタ信号を
デコードして上記ROM4及びRAM5に出力するアド
レスデータベース6と上記音声合成器3とデータベース
及びアドレスバスの間のデータを入出力するバッファ7
と上記音声合成器3により合成されたディジタル音声信
号をアナルログ信号に変換するディジタルアナログ変換
器8と上記D/A変換器8の出力信号を所定のレベルに
増幅器9で構成したものでこのように構成させた音声合
成処理ブロック図と“Ya”についてのソナグラフを示
した図2、“Ya”についてのホルマントモデリングを
示した図3、上記ROM4のデータの構成を示した図4
及び動作の流れを示す流れ図である図5、図6を参照し
ながら本発明を詳細に説明すれば次の通りである。
【0006】まづROM4上のデータベースの構成につ
いて、音声信号は線形ホルマントの転移区間によって分
割させるが例えば図2は“Ya”についてのソナグラフ
を示したものでこれを図3において同じく、3個の線形
ホルマントの転移区間(D−D3)に分割してからこれ
を図4においてと同じく各各の分割区間の始発点におい
てのホルマント周波数(Fj)と帯域幅(BWj)、そ
れから分割の長さ(Li)により構成されすべての音素
についてこのような形態でデータベースを構成し上記の
ROM4に貯蔵する。
【0007】以後PC1がキイボード1aよりハングル
文字を入力しこれをPCインタフェイス7を通じて音声
合成器3にASIIコードで入力すればその音声合成器
3は上記ROM4に貯蔵されたプログラムを遂行して当
該音声を合成するので、このように合成された音声デー
タはディジタルアナログ変換器を通じてアナログ信号に
変換された後増幅器9を通じて所定のレベルに増幅され
スピーカ(SP)に印加されるので、そのスピーカ(S
P)から入力文字に該当する音声が出力される。以下上
記音声合成器3は上記PCインタフェイスであるROM
4からその文字に該当するフォーマント情報と長さの情
報をつづけて読むのであるが、まず一番目の分割につい
ての情報を読んでみる、次いでピッチとエネルギ制御プ
ログラムと適正ピッチとエネルギを計算した後、まず合
成時点(n)においてのホルマントの周波数(Fj)と
帯域幅(BWj)を線形補間法(linearinte
rpolation)により次のように計算する。
【0008】すなわち、F(j)={F(i+1,j)
−F(i,j)}×n/L(i)、およびBW(j)=
{BW(i+1,j)−BW(i,j)}×n/L
(i)の式を用いて計算する。ここに、F(i,j)は
分割iの時点におけるホルマントの周波数、BW(i,
j)は分割iの時点におけるホルマントの帯域幅、L
(i)は分割iの長さ、nはサンプルインデックスを、
それぞれあらわす。
【0009】このように計算されたホルマント情報によ
り4個の帯域濾波器を構成し濾過信号(exitati
on signal)をその帯域濾波器を通じ順次に濾
波すれば音声信号が発生され、以後上記の音声信号にエ
ネルギを乗じたのちサンプルインデックスを増加させ
る。このような過程を反復して1つのピッチ区間におけ
る合成が完了すればその合成された信号の長さが与えら
れた分割の長さより大きいかを調べ、大きくなければ上
記のピッチのエネルギの計算段階を越えてこれまでの過
程を反復し、大きければ分割領域の合成が完了したもの
と判断して次の分割領域の合成を行い、以後現在の分割
領域が最後の分割領域であるとき、音声合成は完了す
る。
【0010】
【発明の効果】本発明によれば、コーティングによる音
声の合成方法とホルマント規則合成方法を用いて音声を
合成可能にすることによってデータベースの容量を減少
することができるのみならずホルマント分析による音声
の合成方法より良好な音声を生成することができ、分析
方法が簡単で容易に実現できる利点がある。
【図面の簡単な説明】
【図1】本発明によるホルマントの線形転移区間の分割
による音声の合成方法を行う装置を示すブロック線図で
ある。
【図2】Yaについてのソナグラフを示す図である。
【図3】Yaについてのホルマントのモデリングを示す
図である。
【図4】ROMのデータの構成を示す図である。
【図5】本発明による方法における動作の流れを示す流
れ図である。
【図6】本発明による方法における動作の流れを示す流
れ図である。
【符号の説明】
1…個人用計算機 1a…キイボード 1b…モニタ 2…個人用計算機インタフェイス 3…音声合成器 4…ROM 5…RAM 6…アドレスデコーダ 7…バッファ 8…デジタルアナログ変換器 9…増幅器 SP…スピーカ i…セグメントインデックス n…現在のサンプル

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 個人用計算機、個人用計算機インタフェ
    イス、音声合成装置、デジタルアナログ変換装置、およ
    び記憶手段を具備する音声合成システムにおいて音声を
    合成する方法であって、(a)該記憶手段に記憶された
    データベースから1つの文字に対応するホルマント周波
    数の情報を読み取る段階であって、該文字が該個人用計
    算機のキイボードにより入力されるもの、(b)ホルマ
    ントの形状であるホルマント情報を線形補間法により演
    算する段階であって、該ホルマントの形状がホルマント
    周波数およびホルマント周波数帯域幅により決定される
    もの、(c)特性周波数により分類された複数の帯域濾
    波器によりホルマント形状の濾波を行う段階であって、
    該濾波されたホルマント形状が該デジタルアナログ変換
    装置によりアナログ音声信号に変換されるデジタル音響
    信号であるもの、そして、(d)増幅器により該アナロ
    グ音声信号を調整し、適切な音響レベルを生成させ、ス
    ピーカ手段から出力させる段階、を具備することを特徴
    とする音声を合成する方法。
  2. 【請求項2】 下記の各段階、すなわち、(e)サンプ
    ルの数を増大させた後、1つのサンプルについての合成
    過程が完了したか否かを点検する段階、(f)前記の段
    階(e)において1つのサンプルについての過程が完了
    したとき、サンプルインデックスの数がセグメントの長
    さより小であるか否かを点検する段階、(g)前記の段
    階(e)において1つのサンプルにおける過程が完了し
    なかったとき、該複数の帯域濾波器によりホルマント形
    状を濾波し、サンプルの数がセグメントの長さより小で
    あるか否かを点検する段階、をさらに具備する請求項1
    記載の方法。
  3. 【請求項3】 下記の各段階、すなわち、(h)サンプ
    ルインデックスの数を0に設定した後、現在のセグメン
    トが最後のセグメントであるか否かを点検する段階、
    (i)該点検の結果、最後のセグメントでなかったとき
    は、該記憶手段に記憶されたデータベースからホルマン
    ト周波数を読み取り、他のセグメントを合成し、該点検
    の結果が前記以外であったときは、過程を終了させる段
    階、をさらに具備する請求項1記載の方法。
JP3142257A 1990-03-31 1991-04-01 ホルマントの線形転移区間の分割による音声の合成方法 Withdrawn JPH05127697A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR4442/1990 1990-03-31
KR1019900004442A KR920008259B1 (ko) 1990-03-31 1990-03-31 포만트의 선형전이구간 분할에 의한 한국어 합성방법

Publications (1)

Publication Number Publication Date
JPH05127697A true JPH05127697A (ja) 1993-05-25

Family

ID=19297584

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3142257A Withdrawn JPH05127697A (ja) 1990-03-31 1991-04-01 ホルマントの線形転移区間の分割による音声の合成方法

Country Status (4)

Country Link
US (1) US5649058A (ja)
EP (1) EP0450533A3 (ja)
JP (1) JPH05127697A (ja)
KR (1) KR920008259B1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996012271A1 (en) * 1994-10-14 1996-04-25 National Semiconductor Corporation Speech synthesis apparatus and method for synthesizing a finite set of sentences and numbers using one program
US6505152B1 (en) 1999-09-03 2003-01-07 Microsoft Corporation Method and apparatus for using formant models in speech systems
KR100830333B1 (ko) 2007-02-23 2008-05-16 매그나칩 반도체 유한회사 적응형 구간 선형 처리 장치
CN109671422B (zh) * 2019-01-09 2022-06-17 浙江工业大学 一种获取纯净语音的录音方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2134747A5 (ja) * 1971-04-19 1972-12-08 Cit Alcatel
US4128737A (en) * 1976-08-16 1978-12-05 Federal Screw Works Voice synthesizer
US4130730A (en) * 1977-09-26 1978-12-19 Federal Screw Works Voice synthesizer
US4264783A (en) * 1978-10-19 1981-04-28 Federal Screw Works Digital speech synthesizer having an analog delay line vocal tract
US4433210A (en) * 1980-06-04 1984-02-21 Federal Screw Works Integrated circuit phoneme-based speech synthesizer
FI66268C (fi) * 1980-12-16 1984-09-10 Euroka Oy Moenster och filterkoppling foer aotergivning av akustisk ljudvaeg anvaendningar av moenstret och moenstret tillaempandetalsyntetisator
NL8200726A (nl) * 1982-02-24 1983-09-16 Philips Nv Inrichting voor het genereren van de auditieve informatie van een verzameling karakters.
US4692941A (en) * 1984-04-10 1987-09-08 First Byte Real-time text-to-speech conversion system
US4829573A (en) * 1986-12-04 1989-05-09 Votrax International, Inc. Speech synthesizer
JP2595235B2 (ja) * 1987-03-18 1997-04-02 富士通株式会社 音声合成装置
JPS63285598A (ja) * 1987-05-18 1988-11-22 ケイディディ株式会社 音素接続形パラメ−タ規則合成方式

Also Published As

Publication number Publication date
US5649058A (en) 1997-07-15
KR920008259B1 (ko) 1992-09-25
EP0450533A2 (en) 1991-10-09
EP0450533A3 (en) 1992-05-20
KR910017357A (ko) 1991-11-05

Similar Documents

Publication Publication Date Title
JP3294604B2 (ja) 波形の加算重畳による音声合成のための処理装置
US6332121B1 (en) Speech synthesis method
US5864812A (en) Speech synthesizing method and apparatus for combining natural speech segments and synthesized speech segments
JPH031200A (ja) 規則型音声合成装置
US4542524A (en) Model and filter circuit for modeling an acoustic sound channel, uses of the model, and speech synthesizer applying the model
US5715363A (en) Method and apparatus for processing speech
JPS5827200A (ja) 音声認識装置
JP3841596B2 (ja) 音素データの生成方法及び音声合成装置
JPH05127697A (ja) ホルマントの線形転移区間の分割による音声の合成方法
JPH0215080B2 (ja)
JP2600384B2 (ja) 音声合成方法
JPH09319391A (ja) 音声合成方法
JP2003066983A (ja) 音声合成装置および音声合成方法、並びに、プログラム記録媒体
JPH09179576A (ja) 音声合成方法
JP2001154683A (ja) 音声合成装置とその方法及び音声合成プログラムを記録した記録媒体
JP2987089B2 (ja) 音声素片作成方法および音声合成方法とその装置
JPH0632037B2 (ja) 音声合成装置
JPH01211799A (ja) 多言語を扱う音声の規則合成装置
JPH08160991A (ja) 音声素片作成方法および音声合成方法、装置
JP2001117576A (ja) 音声合成方法
JP2004012700A (ja) 音声合成方法および装置並びに辞書生成方法および装置
JPS6136800A (ja) 可変長フレ−ム音声分析合成方式
CN120183420A (zh) 基于韵律的语音转换方法、装置、设备及介质
JPH04261590A (ja) 自動採譜装置
JPS61172200A (ja) 音声合成装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19980711