JPH0683389A

JPH0683389A - 音声合成装置と音声合成の方法

Info

Publication number: JPH0683389A
Application number: JP5149456A
Authority: JP
Inventors: Peter W Farrett; ピーター・ウィリアム・ファレット
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1992-08-03
Filing date: 1993-06-21
Publication date: 1994-03-25
Also published as: EP0582377A2; EP0582377A3; US5325462A

Abstract

(57)【要約】【目的】フォルマントがよりわかりやすくなるように
音声合成システムにおけるフォルマントの成分を改良す
る装置および方法を提供する。【構成】テキストストリングがディスクから読み出さ
れ２００、特定のフォルマントが識別され２１０、個別
のテキストストリングへパースされ、検出されてフォル
マントが見い出されるとすれば２２０、次にフォルマン
トに対応するその結果のテキストストリング・フラグメ
ントが記憶され２３０、フォルマントが後続のフォルマ
ントと等しくないと２４０、フォルマントがスワップさ
れる２５０ことにより、先行、後続および終わりの音素
の周波数値を検査して類似の音素周波数値を検出し、も
し類似でない値が検出されると、音声が結果的によりわ
かりやすくなるようにフォルマントがスワップされる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は音声合成の改良に関し、
特に、デジタルのテキストから音声への変換の改良に関
する。

【０００２】

【従来の技術】音声入力／出力（Ｉ／Ｏ）システムの分
野はこの１０年間で著しい変化を経験してきた。この変
化の最近の例は米国特許第４，９７９，２１６号に開示
されている。この特許は、特定のテキスト・ストリング
を子音と母音の音素の対応するストリングに変換するテ
キストから音声への変換システムを開示している。パラ
メータ発生器が音素をフォルマントパラメータに変換
し、フォルマント合成器がフォルマントパラメータを用
いて合成音声波形を発生させる。

【０００３】母音の異音のライブラリが記憶され、各々
の記憶された異音は４個のフォルマントに対してフォル
マントパラメータによって表示される。母音の異音ライ
ブラリは各母音の異音を音素ストリングにおける対応す
る母音の音素の先行および後続する一対以上の音素と関
連づける文脈インデックスを含む。音声を合成する場
合、母音の異音発生器は特定の母音音素を代表するフォ
ルマントパラメータを提供するために母音の異音ライブ
ラリを使用する。

【０００４】母音の異音発生器は文脈インデックスと協
働して、特定の母音音素に先行および後続する音素によ
り決定される適正な母音異音を選択する。その結果、母
音音素の合成された発音は母音音素の文脈に対応する母
音異音フォルマントパラメータを用いることにより改良
される。大きいセットの母音異音に対するフォルマント
データは、ベクトル量子化法を用いて選択されたフォル
マントパラメータのコードブックを用いて効率的に記憶
される。各母音の異音に対するフォルマントパラメータ
は部分的には、コードブック中のフォルマントパラメー
タを指示するインデックスにより規定される。

【０００５】この技術における進歩の別の最近の例は米
国特許第４，９１４，７０２号に開示されている。この
特許は、入力信号および基準音声信号から得られた複数
のフォルマント周波数を球座標変換を介して展開された
相互角度データに基づき入力音声信号を基準音声信号に
マッチさせるボコーダを開示している。

【０００６】音声合成における進歩のさらに別の例は米
国特許第４，８０２，２２３号において見られる。この
特許は低データ速度音声において有用な音声符号化技術
を開示している。発声された入力は、その基本的な音韻
学的言語単位と音節を決定するために分析される。各音
節に対するピッチトラックが所定のセットのピッチパタ
ーンの各々と比較される。実際のピッチトラックに対す
る最良のマッチを形成するピッチパターンが各音節に対
して選択される。音韻学的言語単位インデックスとピッ
チパターンインデックスとが音声合成装置に伝送され
る。この音声合成装置は、ピッチパターンを、音韻学的
言語単位インデックスの音節グループとマッチさせる。
音声合成の間、その主要なピッチが対応する音節のピッ
チパターンインデックスにより制御される、音韻学的言
語単位インデックスに対応する音が発生する。この技術
は低データ速度で、オリジナルの発声入力の主要ピッチ
に対する近似法を達成する。好適実施例においては、各
ピッチパターンは、ピッチにおける変化を何ら指示せず
零でありうる初期ピッチスロープと、最終のピッチスロ
ープと、これら２個のスロープの間の転換点とを含む。

【０００７】音声合成における進歩のさらに別の例が米
国特許第４，６８９，８１７号において見られる。この
特許は、あるキャラクタが異なる音声キャラクタで抑揚
をつけ、即ち発音される一組のキャラクタのオーディオ
情報を発生させる装置を開示している。この装置は発音
された大文字と小文字との区別をする手段を含んでい
る。大文字のキャラクタに対しては、ピッチ即ち音声キ
ャラクタが修正され、一方同じキャラクタの小文字に対
する音声パターンに関して同一性を保っている音声パタ
ーンが形成される。本装置はまた、提供されたキャラク
タから構成されるワードの文字、好ましくは最後の文字
の位置を決定し、同一性を保ちながらピッチ即ち音声キ
ャラクタが修正されている関連文字に対して音声パター
ンを形成する手段を含んでいる。

【０００８】音声合成における最近の進歩の最後の例は
米国特許第４，８９６，３５９号に開示されている。こ
の特許は、音声ソースを動作させ、かつフォルマント周
波数と、フォルマント帯域幅と、音声速度等を含む特徴
ベクトルに従って、各々の順次の短時間において音声パ
ラメータにより音声ソースの出力を処理するフィルタを
動作させることにより音声を合成する音声合成器を開示
している。各特徴ベクトル、即ち音声パラメータは２個
の目標点（ｒ／ｓｕｂ１／、ｒ／ｓｕｂ２／）と、
目標点の間の接続曲線と共に各目標点における値とによ
り規定される。音声速度は、その伸長（あるいは短縮）
の開始点（ｄ／ｓｕｂ１／）と、終了点（ｄ／ｓｕｂ
２／）と、ｄ／ｓｕｂ１／およびｄ／ｓｕｂ２／
との間の伸長比とにより音声速度の伸長あるいは短縮を
規定する音声速度曲線により規定される。各音声パラメ
ータの相対時間と絶対時間との間の比率が各々の所定の
短時間における音声速度テーブルに従って予備計算され
る。

【０００９】前述の特許あるいは従来技術の出願者のい
ずれも、音声の質と認知性とを向上させるために、音声
合成に対してフォルマントの分析や修正が適用されるモ
デルを採用することについては認識していない。

【００１０】

【発明が解決しようとする課題】従って、本発明の主要
な目的は、フォルマントをさらにわかりやすくするため
に音声合成システムにおけるフォルマント成分を向上さ
せることである。

【００１１】

【課題を解決するための手段】上記目的を達成するため
に、本発明の音声合成装置は、（ａ）情報を受け取るメ
モリ手段と、（ｂ）前記情報における少なくとも第１の
フォルマントと第２のフォルマントとを識別し、かつパ
ースする手段と、（ｃ）前記第１のフォルマントと前記
第２のフォルマントとを比較する手段と、（ｄ）前記第
１のフォルマントと前記第２のフォルマントとがマッチ
しない場合に前記第１のフォルマントと前記第２のフォ
ルマントとをスワップする手段と、（ｅ）前記情報を合
成してオーディオ情報にする手段とを備えることを特徴
とする。

【００１２】また、上記目的を達成するために、音声を
合成する方法は、（ａ）情報を受け取るステップと、
（ｂ）前記情報における少なくとも第１のフォルマント
と第２のフォルマントとを識別し、かつパースするステ
ップと、（ｃ）前記第１のフォルマントと前記第２のフ
ォルマントとを比較するステップと、（ｄ）前記第１の
フォルマントと前記第２のフォルマントとがマッチしな
い場合に前記第１のフォルマントと前記第２のフォルマ
ントとをスワップするステップと、（ｅ）前記情報を合
成してオーディオ情報にするステップとを備えることを
特徴とする。

【００１３】

【作用】上記のように構成された本発明の音声合成装置
および方法は、独立した音素の周波数から音素の開始お
よび終了周波数を変えるプロセッサのメモリにおいてプ
ロセスを動作させ、当該プロセスは、先行および後続の
終了音素周波数値を検査して類似の音素周波数値を検出
し、もし類似でない値が検出されるとすれば、本発明は
フォルマントを交換してその結果得られる音声をよりわ
かりやすくする。

【００１４】

【実施例】本発明は、ＩＢＭ社から市販されているＩＢ
Ｍパーソナルシステム／２に存在するオペレーティング
・システムに関連して実行されることが好ましい。代表
的なハードウェア環境を図１に示す。図１は、従来のマ
イクロプロセッサのような中央処理装置１０と、システ
ムバス１２を介して相互接続された多数の他の装置とを
有する本発明によるワークステーションの典型的なハー
ドウェア構成を示す。図１に示すワークステーションは
ランダムアクセスメモリ（ＲＡＭ）１４、読出し専用メ
モリ（ＲＯＭ）１６、例えばディスクユニット２０のよ
うな周辺装置をバスに接続するＩ／Ｏアダプタ１８と、
キーボード２４、マウス２６、スピーカ２８、マイクロ
フォン３２またはこれらと例えばタッチスクリーン装置
（図示せず）のような他のユーザインタフェース装置を
バスに接続するユーザインタフェースアダプタ２２と、
ワークステーションをデータ処理ネットワークに接続す
る通信アダプタ３４と、バスをディスプレイ装置３８に
接続するディスプレイアダプタ３６とを含む。ワークス
テーションにはＤＯＳまたはＯＳ／２オペレーティング
・システムと、ツールキットとして含まれる本発明を構
成するコンピュータソフトウェアとが存在する。

【００１５】発声された音声に関して、音声の韻律素の
フォルマントに対する関連性を検査するために多数の実
験が行われてきた。フォルマントは可聴音声スペクトル
における特定の周波数領域を示す。基本的な音素構成
は、より広い可聴帯域を発生させる周波数領域を「成層
する（ｌａｙｅｒ）」。音素は人間の言語のサブセット
を表現するために使用される音声の基本単位である。韻
律素は言語（文章）構造のピッチとリズムを示す。方
言、情緒のような属性は言語構造の構築ブロックであ
る。

【００１６】本発明に対する基本的作業は、基本的音声
パターンと、フォルマントおよびある周波数の影響を確
認するために文章と発声の検査を行うことを含んでい
た。適当なルールが展開されたが、これらは本発明にお
いて反映されている。詳しくは、本発明の方法とシステ
ムとは、音素の特定周波数領域を分析し、最適の互換性
フォルマント周波数に基づき新しい周波数の値を割り当
てる。

【００１７】フローチャート図２は本発明による詳細なロジックのフローチャートで
ある。処理は端子２００において開始され、そこではテ
キストストリングがディスクあるいはメモリから読み出
される。次に、制御は機能ブロック２１０まで進行し、
そこで特定のフォルマントが識別され、個別のテキスト
ストリングへパースされる。判定ブロック２２０で検出
されてフォルマントが見い出されるとすれば、次にフォ
ルマントに対応するその結果のテキストストリング・フ
ラグメントが出力ブロック２３０において記憶される。
もしフォルマントが何ら検出されないとすれば、次に制
御は入力ブロック２００へ戻り処理のために次のテキス
トストリングを取得する。次に、判断ブロック２４０に
おいて、フォルマントが後続のフォルマントと等しくな
いか否か決定するため試験が実行される。もしそうでな
いとすれば、次にフォルマントが機能ブロック２５０に
おいてスワップされ、次のストリングが出力ブロック２
００において処理される。もしフォルマントが判断ブロ
ック２４０において同じであるとすれば、制御は入力ブ
ロック２００まで進み次のテキストストリングを取得す
る。

【００１８】本発明による「Ｃ」コード

【表１】

【００１９】上記の本発明による「Ｃ」コードにおける
注釈文（注１〜注１１）の内容は次のとおりである。即
ち、（注１）は「フォルマントルールを呼び出す」を、
（注２）は「その他のフォルマントルールを呼び出す」
を、（注３）は「メインの終わり」を、（注４）は「フ
ォルマントｆ１，ｆ２，ｆ３用であるがより高いフォル
マントを含むことが出来る」を、（注５）は「音素が後
続とすればフォルマント間で周波数を変換する」を、
（注６）は「フォルマントの周波数は同じのままであ
る」を、（注７）は「フォルマントスワップの終わり」
を、（注８）は「フォルマントｆ１，ｆ２，ｆ３用であ
るがより高いフォルマントも含むことができる」を、
（注９）は「後続の音素のフォルマントの値を考慮す
る」を、（注１０）は「フォルマントの周波数は同じの
ままである」を、（注１１）は「フォルマントオーバラ
ップの終わり」をそれぞれ内容とする。

【００２０】データフロー線図図３は本発明によるデータフロー図である。文脈線図３
００は入力として一組のパーシングルール３０２と、文
字−音素発音ルール３０４を提案する。音素修正３０８
は音素のフォルマント値が現在あるいは後続のフォルマ
ントであり、修正された音素フォルマントが出力され
た、即ち割り当てられたフォルマントであると想定す
る。

【００２１】韻律素３１０はａｓｃｉｉストリング３１
２とテキスト３１４とに基づき準備された音素表示３１
６を入力として想定する。処理は、機能ブロック３１８
におけるスワップルーチンにおいて行われ、出力にはフ
ォルマント３２０が割り当てられる。スワップルーチン
の詳細線図がスワップフロー３３０において現れる。音
素表示３３２は３３４で入力ストリングを音素３３６に
パースする。音素は機能ブロック３４０においてあるフ
ォルマント値に関して検査され、その結果がファイル３
５０に書き込まれる。もしフォルマント値が後続のフォ
ルマント３４２と等しくないとすれば、スワップが機能
ブロック３４６において実行され最適値をフォルマント
３４８に割り当てる。

【００２２】ハードウェア実施例音声処理は、補助プロセッサにおいて実施する必要があ
る。このタスクに対する適当な選択は図４に示すような
コンピュータのオーディオサブシステムにおけるデジタ
ル信号プロセッサ（ＤＳＰ）である。図４は、１９９０
年９月１８日ＩＢＭにより発表され、出荷されたＭオー
ディオキャプチャ・アンド・プレイバック・アダプタに
添付の技術情報のあるものを含む。本発明はカードに付
随するオリジナルのオーディオ性能を向上させることで
ある。

【００２３】図４を参照すれば、Ｉ／Ｏバス４１０は、
オーディオサブシステムがＰＳ／２あるいはその他のＰ
Ｃコンピュータと通信できるようにするマイクロチャン
ネルあるいはＰＣＩ／Ｏバスである。Ｉ／Ｏバスを用
いて、ホストコンピュータは、指令レジスタ４２０と、
状態レジスタ４３０と、アドレス高バイトカウンタ４４
０と、アドレス低バイトカウンタ４５０と、データ高バ
イト双方向性ラッチ４６０と、データ低バイト双方向性
ラッチ４７０とを採用しているオーディオサブシステム
まで情報を通す。

【００２４】ホスト指令レジスタ４２０とホスト状態レ
ジスタ４３０とは指令を出し、かつオーディオサブシス
テムの状態をモニタするためにホストによって使用され
る。アドレスとデータのラッチはオーディオサブシステ
ムにおける８Ｋ×１６ビットの高速スタティックＲＡＭ
である共用のメモリ４８０にアクセスするためにホスト
によって使用される。共用のメモリ４８０はホスト（パ
ーソナルコンピュータ／ＰＳ／２）とデジタル信号プロ
セッサ（ＤＳＰ）４９０との間で通信するための手段で
ある。このメモリは、ホストコンピュータとＤＳＰ４９
０の双方がアクセスしうるという意味で共用である。

【００２５】制御ロジック５００の一部であるメモリア
ービタはホストとＤＳＰとが同時にメモリにアクセスす
るのを阻止する。共用メモリ４８０は、情報の一部がＤ
ＳＰ４９０を制御するために使用されるロジックである
ように分割しうる。ＤＳＰ４９０は、指令を発しかつオ
ーディオサブシステムの他の部分の状態をモニタするた
めの独自の制御レジスタ５１０と状態レジスタ５２０と
を有している。

【００２６】オーディオサブシステムは、サンプルメモ
リ５３０と称するＲＡＭの別のブロックを含んでいる。
サンプルメモリ５３０は２Ｋ×１６ビットのスタティッ
クＲＡＭであり、それをＤＳＰがプレイすべき送出サン
プル信号および記憶のためにホストコンピュータへ転送
するためにデジタル化したオーディオの送入サンプル信
号に対して使用する。デジタル／アナログ変換器（ＤＡ
Ｃ）５４０とアナログ／デジタル変換器（ＡＤＣ）５５
０とが、ホストコンピュータとオーディオサブシステム
のデジタルワールドと音声のアナログワールドとの間の
インタフェースである。ＤＡＣ５４０がサンプルメモリ
５３０からデジタルサンプルを取得し、これらのサンプ
ルをアナログ信号に変換し、これらの信号をアナログ出
力セクション５６０に提供する。アナログ出力セクショ
ン５６０は、信号を条件付けし、この信号を、スピーカ
あるいはヘッドセットを介して聞き手の耳まで伝送すべ
く出力コネクタまで送る。ＤＡＣ５４０は多重化され双
方の出力に対して連続的に作用する。

【００２７】ＡＤＣ５５０はＤＡＣ５４０の相手側であ
る。ＡＤＣ５５０はアナログ入力セクション（これは入
力コネクタ（マイクロフォン、ステレオプレーサ、ミキ
サ・・・等）からこれらの信号を受け取っている）から
アナログ信号を取得し、これらのアナログ信号をデジタ
ルサンプルに変換し、それらをサンプルメモリ５３０に
記憶する。制御ロジック５００はロジックのブロックで
あり、該ロジックのブロックは、ＤＳＰ割込みリクエス
トの後特にホストコンピュータへの割込みを行い、入力
選択スイッチを制御し、種々のラッチおよびサンプルお
よび共用メモリに対して読取り、書込みおよび使用可能
ストローブを発行する。

【００２８】オーディオサブシステムが何を実行するか
を知るには、アナログ信号がサンプリングされ、記憶さ
れる態様を検討すればよい。ホストコンピュータは、Ｉ
／Ｏバス４１０を介してＤＳＰ４９０にオーディオアダ
プタがアナログ信号をデジタル化すべきであることを知
らせる。ＤＳＰ４９０はその制御レジスタ５１０を用い
てＡＤＣ５５０を使用可能とする。ＡＤＣ５５０は到来
信号をデジタル化してサンプルをサンプルメモリ５３０
に位置させる。ＤＳＰ４９０はサンプルメモリ５３０か
らサンプルを取得し、それらを共用メモリ４８０に転送
する。次にＤＳＰ４９０はＩ／Ｏバス４１０を介してホ
ストコンピュータに、デジタル化したサンプルがホスト
コンピュータが読み出す状態にあることを知らせる。ホ
ストコンピュータはこれらサンプルをＩ／Ｏバス４１０
において取得し、それらをホストコンピュータＲＡＭあ
るいはディスクに記憶する。

【００２９】シーンの背後でその他の多くのイベントが
発生する。制御ロジック５００はホストコンピュータと
ＤＳＰ４９０とが同時に共用メモリ４８０にアクセスし
ないよう阻止する。また、制御ロジック５００はまたＤ
ＳＰ４９０とＤＡＣ５４０とが同時にサンプルメモリ５
３０にアクセスするのを阻止し、アナログ信号のサンプ
リングを制御し、その他の機能を実行する。前述のシナ
リオは連続動作の場合である。ホストコンピュータが共
用メモリ４８０からデジタルサンプルを読み出している
間ＤＡＣ５４０はサンプルメモリ５３０に新しいデータ
を入れ、ＤＳＰ４９０はデータをサンプルメモリ５３０
から共用メモリ４８０に転送する。

【００３０】デジタル化したオーディオの再生は一般的
に同様に作用する。ホストコンピュータはＤＳＰ４９０
にオーディオサブシステムがデジタル化したデータを再
生すべきであることを知らせる。本発明においては、ホ
ストコンピュータは、ＤＳＰ４９０を制御するコードと
デジタルオーディオサンプルとをそのメモリあるいはデ
ィスクから取得し、それらをＩ／Ｏバス４１０を介して
共用メモリ４８０へ転送する。ＤＳＰ４９０は、コード
の制御下でサンプルを取得し、サンプルをコードの制御
下で対数スケールの値の整数表示に変換し、それらをサ
ンプルメモリ５３０に位置させる。次にＤＳＰ４９０は
デジタル化したサンプルをオーディオ信号に変換するＤ
ＡＣ５４０を付勢させる。オーディオ再生回路がオーデ
ィオ信号を条件付けし、それらを出力コネクタに置く。
再生も連続動作である。

【００３１】連続的な記録および再生中において、ＤＡ
Ｃ５４０とＡＤＣ５５０の双方が動作している間にＤＳ
Ｐ４９０はサンプルメモリと共用メモリの間でサンプル
を前後に転送し、ホストコンピュータはサンプルをＩ／
Ｏバス４１０にわたって前後に転送する。このように、
オーディオサブシステムは異なる音声を同時に再生、記
録することができる。ホストコンピュータが、ＤＳＰ４
９０がデジタル化したデータを転送させるよりもサンプ
ルメモリ５３０に直接アクセスできないことの理由は、
ＤＳＰ４９０が該データをサンプルメモリ５３０に記憶
させる前に該データを処理しているからである。ＤＳＰ
処理の一局面は、真正のアナログ音声信号に変換するた
めにＤＡＣ５４０へ入力するため音声情報の直線整数表
示を音声情報の対数スケールの整数表示に変換すること
である。

【００３２】再生音声合成サンプルは以下のように作用
する。ホストコンピュータはＩ／Ｏバス４１０を介して
ＤＳＰ４９０に対して、音声サンプルデータのオーディ
オストリームを再生すべきことを指令する。ホストコン
ピュータは、ＤＳＰ４９０を制御し、かつメモリあるい
はディスクからオーディオ音声サンプルをアクセスしな
がら、それらを共用メモリ４８０に転送する。ＤＳＰ４
９０の方はオーディオ音声サンプルを取得し、（対数ス
ケールの）オーディオ情報の整数（即ち実数）の数表示
にこれらサンプルを変換し、それらをサンプルメモリ５
３０へ入れる。次に、ＤＳＰ４９０はＤＡＣ５４０に、
これらのデジタル化したサンプルをアナログ音声信号５
６０に変換するようリクエストする。オーディオ音声サ
ンプルの再生も連続動作である。

【００３３】フォルマントの例示前述のプロセスの例が以下の例示に提供されている。ス
トリングテキストファイルが符号化された後、パーシン
グ技術がフォルマント周波数ｆ１，ｆ２およびｆ３（並
びに必要に応じてより高いのもの）を各々の個々の音素
値に対して分離する。（フォルマント周波数に対して）
選択した記録の番号が「スワップ可能」（例えばＮ＝
２，Ｎ＝３，等）であるとすれば、どのフォルマント周
波数値が対象であるか否かによって周波数（Ｈｚ値）の
増減が割り当てられる。

【００３４】「ＢＥＦＯＲＥ」とラベルを付されたテス
トケースが入力として解釈され、存在するデータは何ら
変更されない。例えば、音素-Ｓ-に対するフォルマント
値（Ｆ１）は全体にわたり２１０Ｈｚにおいて一定であ
る。音素-Ｅ-の音素に対してはフォルマント値（Ｆ１）
は全体にわたり２４０Ｈｚにおいて一定である等々であ
る。（このことはこのテストケース全体にわたりＦ２，
Ｆ３のフォルマントに対して同様である。）このよう
に、全てのフォルマント値は安定し、個々のフォルマン
トに対して一定のままである。

【００３５】「ＡＦＴＥＲ」というラベルを付した次の
テストケースは出力として解釈される。前述の音素-Ｓ-
から-Ｖ-までを検討すると、（スワップすべき）記録の
数は２にセットされている。（残りの音素-Ｅ-と-Ｎ-と
に対しては記録の数は３とセットされている。）再び音
素-Ｓ-を参照すれば、フォルマント（Ｆ１）値はここで
音素-Ｅ-値（Ｆ１）と交換されるが、これはそれぞれ最
後と最初の２つの値に対して-Ｓ-の終わりと-Ｅ-の始ま
りにおいて起こる。（Ｆ１）-Ｓ-に対しては、オリジナ
ルの２１０Ｈｚ値が、２４０Ｈｚである-Ｅ-の最初の２
つの値とスワップされる。逆に、（Ｆ１）Ｅのオリジナ
ルの２４０Ｈｚの値は、２１０Ｈｚである-Ｓ-の最後の
２つの値とスワップされる。（残りの音素-Ｅ-と-Ｎ-と
は３に等しい記録の数にセットされる。）主要な区別
は、音素とフォルマント値に対する残りのフォルマント
が前述のアプローチに追従することである。

【００３６】

【表２】

【表３】

【００３７】

【発明の効果】本発明は、上述のように構成されている
ので、独立した音素の周波数から音素の開始および終了
周波数を変えるプロセッサのメモリにおいてプロセスを
動作させ、当該プロセスは、先行および後続の終了音素
周波数値を検査して類似の音素周波数値を検出し、もし
類似でない値が検出されるとすれば、本発明はフォルマ
ントを交換することにより、その結果得られる音声をよ
りわかりやすくするという効果を奏する。

【図面の簡単な説明】

【図１】本発明によるパーソナルコンピュータシステム
のブロック線図。

【図２】本発明によるロジックの詳細を示すフローチャ
ート。

【図３】本発明によるデータフロー線図。

【図４】本発明によるオーディオカードのブロック線
図。

Claims

【特許請求の範囲】

【請求項１】（ａ）情報を受け取るメモリ手段と、（ｂ）前記情報における少なくとも第１のフォルマント
と第２のフォルマントとを識別し、かつパースする手段
と、（ｃ）前記第１のフォルマントと前記第２のフォルマン
トとを比較する手段と、（ｄ）前記第１のフォルマントと前記第２のフォルマン
トとがマッチしない場合に前記第１のフォルマントと前
記第２のフォルマントとをスワップする手段と、（ｅ）前記情報を合成してオーディオ情報にする手段と
を備えることを特徴とする音声合成装置。
【請求項２】前記情報を処理するデジタル信号プロセ
ッサを含むことを特徴とする請求項１記載の装置。
【請求項３】オーディオ情報を受け取り、それをコン
ピュータが処理しうる情報に変換するためのアナログ／
デジタル変換手段を含むことを特徴とする請求項１記載
の装置。
【請求項４】コンピュータが処理しうる情報を受け取
り、それをアナログ情報に変換するためのデジタル／ア
ナログ変換手段を含むことを特徴とする請求項１記載の
装置。
【請求項５】前記情報を記憶する手段を含むことを特
徴とする請求項１記載の装置。
【請求項６】（ａ）情報を受け取るステップと、（ｂ）前記情報における少なくとも第１のフォルマント
と第２のフォルマントとを識別し、かつパースするステ
ップと、（ｃ）前記第１のフォルマントと前記第２のフォルマン
トとを比較するステップと、（ｄ）前記第１のフォルマントと前記第２のフォルマン
トとがマッチしない場合に前記第１のフォルマントと前
記第２のフォルマントとをスワップするステップと、（ｅ）前記情報を合成してオーディオ情報にするステッ
プとを備えることを特徴とする音声を合成する方法。
【請求項７】前記情報をデジタル信号プロセッサで処
理するステップを含むことを特徴とする請求項６記載の
方法。
【請求項８】アナログ情報をコンピュータが処理しう
る情報に変換するステップを含むことを特徴とする請求
項６記載の方法。
【請求項９】コンピュータが処理しうる情報を受け取
り、それをアナログ情報に変換するステップを含むこと
を特徴とする請求項６記載の方法。
【請求項１０】前記情報を記憶するステップを含むこ
とを特徴とする請求項６記載の方法。