JPH02299067A

JPH02299067A - リライト・メカニズムにおける変換規則実行方法、定義方法、及び適用方法

Info

Publication number: JPH02299067A
Application number: JP2103259A
Authority: JP
Inventors: Antonio Zamora; アントニオ・ザモラ
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1989-04-26
Filing date: 1990-04-20
Publication date: 1990-12-11
Also published as: EP0394628A2; US5113342A; EP0394628A3

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】Ａ、産業上の利用分野ここに開示される本発明は、概してコンピュータ方法に
関し、より詳しくは、規則を解釈して入力ストリングを
出力ストリングに変換するためのコンピュータ方法に関
する。

Ｂ、従来の技術「リライト機構（メカニズム）」は、変換またはりライ
ト規則を入力ストリングに適用して、入力ストリングを
新しいストリングに変換する処理である。この概念は表
面上は極めて簡単に見えるが、曖昧性の解釈を定義し、
終了を保証することを必要とする複雑さがある。これら
の問題は幾つかの例から認識することができる。次のリ
ライト規則を仮定する。

１）ａ＋ｘ２）ｂ＋ｙこれらの規則は、変換される入力ストリングに左側の文
字が現れるたびに、その文字は矢印の右側の文字により
置き換えられる。これらの規則はストリング’ａｂｂａ
″を簡単な置換によりＸｙｙＸ“に変換することができ
る。しかし、ａｂ”をＺ′で置き換えるもう１つの規則
３）ａｂ　　＋　　Ｚを有する場合は、次のような曖昧性がある。規則３の前
に規則１が適用される場合は、”ａｂｂａ″は’ｘＹＹ
Ｘ″に変換される。しかし、規則３が規則１よりも高い
優先順位を有する場合は、ａｂｂａ″は”ｚｙｘ”にな
る。

リライト規則システムで遭遇するもう１つの問題は、実
行されたとき一組の変換規則が終了するか否かを判定す
ることである。つまり、これらの規則は処理が終了する
ように定義されているか、ということである。次の例は
その問題を示す。

”ｙｙ”を２″に変換する規則３）ＹＹ＋ｚを定義した場合は、ストリング″ａｂｂａ″はまず規則
１及び２の適用によりストリング″ｘｙｙ×″に変換さ
れ、次にこのストリングは、その中間の２文字がｙｙ′
であるので、ＸＺＸ″に変換される。このような規則の
反復適用を再帰と呼ぶことができる。

３）ｘｙ　　　−＋　　　ａｂのような規則を定義することにより、−組の非終了規則
を作ることができる。ストリング’ａｂｂａ″は、まず
規則１及び２によりｘｙｙｘ″に変換されるが、規則３
はそれをａｂＹｘ″に変換する。規則１及び２が再び適
用されて、？１ａｂｏｘ″は再び変換されてｘｙｙｘ”
にもどる。

処理は終了することなく無限に反復する。

本発明の目的は、規則の曖昧性、優先順位及び終了（タ
ーミネーシロン）の問題を解決するりライト機構を定義
することである。本発明のもう１つの目的は、広範なア
プリケーシヨンに対して能率的な実行をもたらす規則を
構成する方法を定義することである。

Ｍ、Ｅ、　　レスク（Ｌｅｓｋ　）他によるｒＬＥＸ−
辞書的解析ルーチン生成プログラム（ＬＥＸ−ａＬｅｘ
ｉｃａｌ　Ａｎａｌｙｚｅｒ　Ｇｅｎｅｒａｔｏｒ）　
Ｊ　Ｎ　Ｃｏｍｐｕｔ、　Ｓｃｉ。

Ｔｅｃｈ、　Ｒｅｐ、、３９、Ｂｅ１ｌ　Ｌａｂｏｒａ
ｔｏｒｉｅｓ、　ＨｕｒｒａｙＨｉｌｌ、　Ｈｅｗ　Ｊ
ｅｒｓｅｙｌｌ　９７５年１０月。この論文は、あるパ
ターン突合せプログラムを記載し、このプログラムでは
、パターンは、パターンが一致したときアクシロンを実
施するプログラム・ステートメントと関連付けられる。

ＬＥＸは完全な言語ではない。ＬＥＸはホスト・コンパ
イラと共同して動作する。

Ｊ、Ａ、マナス（Ｍａｎａｓ）による「スペイン語にお
ける語の区分（Ｗｏｒｄ　Ｄｉｖｉｓｉｏｎ　ｉｎ　５
ｐａｎｉｓｈ）　Ｊ、Ｃｏａ＋ｍｕｎｉｃａｔｉｏｎｓ
　ｏｆ　ｔｈｅ　ＡＣＭ、Ｖｏｌ、３０、Ｎｏ、７、ｐ
ｐ、６１２−６１６．１９８７年７月。

この論文は、スペイン語テキストにハイフンを付けるた
めに、ＬＥＸをリライト機構として適用することについ
て記載している。

Ｂ、ブロッダ（Ｂｒｏｄｄａ　）他による「フィンラン
ド語の自動語形的解析の試み（Ａｎ　Ｅｘｐｅｒｉｍｅ
ｎｔｗｉｔｈ　Ａｕｔｏｍａｔｉｃ　Ｍｏｒｐｈｏｌｏ
ｇｉｃａｌ　Ａｎａｌｙｓｉｓ　ｏｆＦ　ｉｎｎ　１ｓ
ｈ）　Ｊ　、ヘルシンキ大学言語学部、出版番号７．１
９８１年。この論文はｒＢＥＴＡシステム」　−ス）　
Ｕング置換機能を有する有限状態オートマトンについて
記載している。このシステムは、特定の入力ストリング
に適用することができる複数の規則を解決するための待
合せ機構を有する。

これらの規則の形式は表に基づくものであり、無限ルー
プの防止策は設けられていない。

Ｊ、Ｐ、ヘイズ（Ｈａｙｅｓ）による「コンピュータの
アーキテクチュアと組織（Ｃｏｍｐｕｔｅｒ静ｃｈｉｔ
ｅｃｔｕｒｅ　ａｎｄ　Ｏｒｇａｎｉｚａｔｉｏｎ）　
Ｊ　Ｎ　ＭｃＧｒａｖ−１１ｉ１１Ｂｏｏｋ　Ｃｏ、、
Ｎｅｗ　Ｙｏｒｋ）１９７８年１ｐｐ、４−６゜コンピ
ュータ科学を始める学生のための本書は、アラン・チュ
ーリング（八ｌａｎ　ＴｕｒｉｎＨ）により１９３６年
に定義された「チューリング機械」の原理を記載してい
る。この機械は基本的には、リライト規則の適用を含む
、想像可能などのような計算にも使用できるテープに取
り付けられる状態オートマトンである。

Ｒ，Ｅ、グリーズウオールド（Ｇｒｉｓｖｏｌｄ）他に
よるｒｓＮＯＢＯＬ４プログラム言語（ＴｈｅＳＮＯＢ
ＯＬ　４　Ｐｒｏｇｒａｍｍｉｎｇ　Ｌａｎｇｕａｇｅ
）　Ｊ　）Ｐｒｅｎｔｉｃｅ−１１ａｌｌ、　Ｉｎｃ、
、　ＥｎＢｌｅｖｏｏｄ　Ｃ１１ｆｆｓ、　Ｎｅｗ　Ｊ
ｅｒｓｅｙｓ　１９７０年。５ＮＯＢＯＬ４は、リライ
ト機構に関する多くのス）　ＩＪソング合せ機能を提供
するプログラム言語である。５ＮＯＢＯＬの普遍性が能
率的突合せを排除するので、ストリングを突き合わせる
ための策略が重要である。５ＮＯＢＯＬは非常に強力な
コンピュータ言語であるが、実行が遅いために評判が良
くない。

Ｃ６発明が解決しようとする課題したがって、本発明の目的はりライト規則のための単純
化された機構を提供することである。

本発明のもう１つの目的は、リライト規則を能率的に構
成できるようにする、リライト規則のための単純化され
た機構を提供することである。

本発明のさらにもう１つの目的は、リライト規則を能率
的に解釈できるようにする、リライト規則のための単純
化された機構を提供することである。

０１課題を解決するための手段これらの目的、特徴及び利点は、本明細書に開示する発
明により果たされる。本発明は、Ｘ　（Ｙ）Ｚ＝　（Ｒ
）形式のりライト規則を定義するための手段からなる。

ただし、Ｘは左の文脈、Ｙは規則の本体、Ｚは右の文脈
、Ｒは、規則がうまく適用された場合のＹの置換値であ
る。この方法は、能率的に索引できるように規則を構成
できるようにする規則を定義する方法に制限を設ける。

特に、規則の本体は一般的な用語で定義することはでき
ないが、この制限は規則の左右の文脈には適用されない
。規則は走査されて、本体及びその文脈に一致する最初
の規則が、適用される規則になる。規則を階層に配列す
ると、どの特定の規則に対しても例外を有することが可
能になる。

本発明のための方法の部分は、１つのモデルを包含し、
このモデルでは、規則が任意の入力ストリングに適用さ
れて出力ストリングを作成し、一方、適合する任意の規
則の本体が入力ストリングでスキップされる。入力スト
リングのどの文字にも規則が適用されないときは、スト
リングを複写するための省略時（デフォルト）規則が適
用される。このことは、処理が常に終了し、かつループ
・フリーであることを保証する。

明のアプリケーションアルゴリズム・ハイフネーション：語のノ＼イフネーシ
ョンのための規則は、リライト規則として表現すること
ができる。

音声合成；テキスト−音声規則を使用して、音声合成装
置を駆動することができる。

翻訳：リライト規則を介して、ある言語の文字を別の言
語に翻訳することができる。

主要な新項目：規則は能率的な突合せのため本体により
構成される。一度規則が適用されると、再処理を防ぎ、
かつ終了を保証するために、本体に一致する部分はスキ
ップされる。規則は入力ストリングに適用されて出力ス
トリングを作成する。

規則は階層に構成することができる。適合する規則がな
い文字を複写するための省略時規則で、終了が保証され
る。

効率を向上させる新規な他の項目：本体は端末ストリン
グのみからなる。一般的記号は規則の外部でのみ使用さ
れる。さらに融通性を持たせるための状態を使用するこ
とができる。複数の通過が可能であるが、規則によって
制御され、終了（ターミネーシヨン）を保証する。他の
仔限状態システムと比較して表記は明瞭である。

Ｅ、実施例リライト規則機構は、−組の規則の適用によりあるスト
リングを別のストリングに変換する問題を扱う。この手
法から利益を得る２つのタスクは、語のハイフネーショ
ンとテキスト・トークンの音声ストリングへの変換であ
る。

これまでは、これらの問題は辞書を探索するか、専用の
コンピュータ・プログラムを書（ことにより処理されて
きた。辞書の探索は一定数の事例に対処するだけである
ので、不適当である。一方、コンピュータ・プログラム
は無限の数の事例を適用することができるが、規則を更
新するためコンピュータ・プログラミングの専門知識を
必要とする。

リライト規則機構によって、コンピュータ・プログラミ
ングの知識なしに変更することができる一組の規則を作
ることができる。しかし、大部分のリライト規則システ
ムは、チューリング機械（理論的にはどのような計算可
能な問題でも解くことができる）の力を達成するために
は非常に複雑である。たとえば、Ｗ、Ａ、ウッズ（Ｗｏ
ｏｄｓ）による「自然言語解析用の遷移ネットワーク文
法（Ｔｒａｎｓｉｔｉｏｎ　Ｎｅｔｗｏｒｋ　Ｇｒａｍ
ｍａｒｓ　ｆｏｒ　ＮａｔｕｒａｌＬａｎｇｕａｇｅ　
　Ａｎａｌｙｓｉｓ）Ｊ　　、Ｃｏｗｓ、　　ｏｆ　　
ｔｈｅ　　ＡＣＭ　　１３、Ｎｏ、、１０、ｐｐ、５９
１−８０６　（１９７０）が参照される。これらの強力
なシステムは、コンピュータ・プログラムと同じ欠点に
悩まされている。システムを永久にループさせる恐れの
ある規則を書く可能性がある。

本発明は、あるストリングを別のストリングに変換する
問題を扱うが、処理の終了を保証するという制約を招く
。さらに、規則を記述するため使用される約束は、変換
が適用されるシーケンスを指定し、コンピュータ・シス
テムで規則を能率的に実行することを可能にする。

本発明は、形式Ｘ　（Ｙ）Ｚ＝　（Ｒ）のりライト規則
を定義するための方法からなる。ただし、Ｘは左の文脈
、Ｙは規則の本体、Ｚは右の文脈、Ｒは、規則がうまく
適合した場合のＹに対する置換値である。この方法は、
能率的に索引できるように規則を構成することを可能に
するため、規則をどのように定義するか、について制約
を設ける。

特に、規則の本体は一般的な用語で定義することができ
ないが、この制約は規則の左右の文脈には適用されない
。規則は、本体及びその文脈に適合する規則が、適用さ
れる規則になるように走査される。規則を階層に配列す
ることによって、どのような特定の規則に対しても例外
を有することが可能になる。

本発明のための方法の部分は１つのモデルを包含し、こ
のモデルでは、出力ストリングを作成するため規則が任
意の入力ストリングに適用される一方、適合するどのよ
うな規則の本体も入力ストリングでスキップされる。入
力ストリングのどの文字にも規則が適用されないときは
、ストリングを複写するための省略時規制が適用される
。これによって、処理が常に終了し、ループ・フリーで
あることが保証される。

ハイフネーション規則を定義するためのりライト機構の
使用：アルゴリズム・ハイフネーションのための要件は、文字
シーケンス、文字の文脈、及び規則の構成要素が語に対
して突き合わされるとき実施される活動を定義する規則
として表現することができる。この文書はアルゴリズム
・ハイフネーション規則、及びコンピュータによるそれ
らの規則の解釈について説明している。規則表はＣＯＭ
ＭＥＮＴＳ（コメント、注釈）　、ＤＥＣＬＡＲＡＴＩ
ＯＮ（宣言）及びＲＵＬＥＳ　（、規則）を含む。ハイ
フネーション規則を含むファイルは、可変長レコードか
ら構成されなければならない。

コメントの書式：コメントは、列１においてアステリスク（＊）で始まる
行である。コメントはまた、少なくとも１つのブランク
及びアステリスクをコメントの前に置くことにより、任
意の行に書くことができる。

たとえば、＊以下の規則は重複したｍを取り除く（ｍ）ｍ＝（）　　　＊重複したｍを取り除くための規
則宣言の書式：宣言は、文字またはストリングの集合を定義するため使
用される。これらの集合の識別子は、ハイフネーション
要件を記述するための規則の数を減らすため使用するこ
とができる。すべての宣言は規則に先行しなければなら
ない。宣言の一般的書式は次の通りである。

”ＤＣＬ　　Ｓ＝　（ｃ　１、ｃ２、ｃ３．、、）ここ
で最初の５文字は”＊ＤＣＬ″であり、ｎ　Ｓ　ｎは集
合識別子、”ｃｌ″、ｎ　ｃ２　＊、′Ｔｃ３″などは
、括弧に囲まれた集合に属する文字または文字順列であ
る。

集合識別子″Ｓ″は、大文字の英字または１桁の数字で
よい。前にアポストロフィを付けた２桁の数により、追
加の集合を定義することができる（たとえば、’１３＝
（ａ　　ｂ　　ｃ））。

集合を構成する文字またはストリングは、１つのブラン
クで互いに区切られた任意の非予約文字である。単一の
大文字の英字または数字は、それらが集合識別子として
使用されていない場合に使用することができる。ストリ
ングは５の長さを超えることができず、１つの集合には
６０を超える構成要素はない。アクセント付きの文字を
表すため特別な約束が使用される。

第１パス・カード：第１パス・カードは、入力ストリングを介する最初のバ
スのために使用される初期状態を定義する。カードは任
意選択（オプシ日ナル）であり、省略された場合は、最
初のバスに対する初期状態は０である。書式は次の通り
である。

傘ＰＡＳＳＩ　　Ｉｓただし、”Ｉｓ″は、初期状態を指定する任意選択の２
桁の数である。

第２のバス・カード：第１パス・カードによって作られたストリングに対する
規則の第２の適用は、次の書式を有する第２のバス・カ
ードを含むことにより指定される。

”ＰＡＳＳ２　　ＩＳただし、Ｉｓ″は、第２のバスのための初期状態を指定
する任期選択の２桁の数である。このカードは、単一の
バスが入力ストリングを介して行なわれる場合のみ省略
される。

規則の書式：規則は、ハイフンで結合される語に対して突き合わされ
るべきパターンを表す。規則の左側はＰＡＴＴＥＲＮ　
（パターン）であり、右側はＲＥＰＬＡＣＥＭＥＮＴ　
（置換）ストリングを表す。規則は次の書式を有する。

Ｘ　（Ｙ）Ｚ＝　（Ｒ）ただし、Ｘ及びＺは、ストリングＹに対する左及び右の
Ｃ０ＮＴＥＸＴ　（文脈）をそれぞれ表す。

ストリングＹは規則の本体と呼ばれ、括弧で囲って文脈
から区切る。Ｘ及びＺは、Ｏまたはそ以上の非予約文字
または集合識別子からなるストリングである。ストリン
グＹは、適用すべき規則について１語の中で見つからな
ければならない非予約文字のみからなる。集合は規則の
本体内では使用することができない。置換ストリングＲ
は括弧で囲まれ、任意の文字を含むか、または空文字″
（）ｔ′でよい。

規則は、それらが有効である状態を指定し、現在状態の
値をリセットすることができる。状態の指定は任意選択
である。状態付きの規則は次の書式を有する。

ＦＳ　　Ｘ　（Ｙ）Ｚ＝　（Ｒ）　　ＮＳただし、ＥＳ
″は、１桁のブランクが後に続く２桁の数であり、規則
が実行される状態を指定する。これはＥＸＥＣＵＴＩＯ
Ｎ　　５ＴＡＴＥ（実行状態）と呼ばれる。置換ストリ
ングに続く１つのブランクが先行する２桁の数″ＮＳ”
は、規則の実行後に現在状態になるＮＥＷ　　５ＴＡＴ
Ｅ（新しい状態）である。実行状態を指定しない規則は
、ＥＳ＝ＯＯを割り当てられる。新しい状態を指定しな
い規則は、現在状態の値を変更しない。規則の実行は常
にＯＯの初期状態によって開始する。”ＰＡＳＳ２カー
ドを介して任意選択の第２のパスに対して異なった初期
状態を指定することができる。

状態は２通りに解釈される。現在状態が００〜９９の範
囲にある場合は、現在状態にかかわらず、ＥＳ＝００を
有する規則が実行される。しかし、現在状態が５０〜９
９の範囲にある場合は、規則がない文字を複写すること
からなる省略時規則を除いて、ＥＳ＝００を有する規則
は実行されない。

規則の文脈の部分として使用される下線文字”−”はＤ
ＥＬＩＭＩＴＥＲ（区切り記号）を表す。Ｘの最初の文
字またはＺの最後の文字とじて使用されるとき、下線文
字は語の始めまたは終りにそれぞれ適合する。下線文字
は文脈の最初または最後の文字である必要はなく、語の
内部句読文字にも適合する（ｃａｎ’ｔ、　”　”ｍｏ
ｔｈｅｒ−ｉｎ−１ａｗ　”におけるように）。下線文
字はフィールド終りに加えて、以下の文字に適合する。

ブランク−“−、＝／（）” 規則の文脈の部分として使用されるピリオド”、′は句
読点を含む任意の文字に適合するが、フィールド終りに
は適合しない。ピリオドはＧＥＮＥＲＩＣ（一般）文字
またはプレース・ホルダーとして動作する。たとえば、
　　（ａｂ）＝　（ａｂ）は、語の始めに現れるときに
（ａｂ）に一致するが１．（ａｂ）＝　（ａｂ）は、”
ａｂ″の前に１文字が置かれた場合、すなわち、′ａ″
が語の最初の文字でない場合のみ成り立つ。

規則はＹストリングの最初の文字により索引されるので
、規則はＹストリングの最初の文字によってグループ化
されなければならない。ＸＹＺパターンで表現される条
件にうまく合う最初の規則が、使用される規則である。

そうでない場合は、グループ内の次の規則が調べられる
が、これは、規則がＹストリングの最初の文字によるだ
けでなく、優先順位の減少順でも配列されねばならない
からである。語に適用可能なすべての規則が調べられる
と、または、語が規則のない文字を有するときは、その
文字は、あたかも（Ｙ）＝　（Ｙ）という規則（ここで
Ｙは問題の文字）があったかのように複写される。

入力ストリングは左から右に走査され、一方、適合する
規則について探索が行なわれる。規則のパターンがうま
く一致したときは、Ｙに対応する入力ストリングの部分
はスキップされ、出力ストリングＲが任意の先行出力ス
トリングに連結される。出力ストリングは、一致したＹ
ストリングとは異なってもよい。たとえば、（ｃｋ）＝
（ｋ−ｋ）。

規則は、入力ストリングを調べ、新しい出力ストリツプ
を発生するものと見なすことができる。

”Ｘ　（ａｂｃ）Ｚ＝　（ｊ　ｋ　ｌ）”などの規則は
、”ａｂｃ″が入力ストリングと突き合わされ、左の文
脈がＸ°“であり、右の文脈がＺ″であるときは、スト
リング″ｊｋｌ″を出力ストリングに加え、入力ストリ
ングの°“ａｂｃ″をスキップすることを意味する。つ
まり、”ａｂｃ″をｊｋｌ”で置換する。規則の本体が
置換したものと同じ、た°とえば、”（ａｂｃ）＝　（
ａｂｃ）″である場合は、これは、ストリング″ａｂｃ
″を出力ストリングに加え、入力ストリングでのそれを
スキップすることを意味する。つまり、”ａｂｃ″を複
写するだけである。

規則のＢＯＤＹ　（本体）（等号の左側における括弧内
の部分）が入力ストリングと突き合わされたときは、本
体に対応する入力文字はスキップされる。次に、規則の
置換側、すなわち右側における括弧内の文字が出力スト
リングに加えられる。

突合せは入力ストリングについてのみ実施されるので、
置換は突合せに全く影響を及ぼさない。

規則の相互作用のため、”（ａｂｃ）＝（ａｂｃ）°″
のような規則は、”ａｂｃ−ｄｅ″を得るためのハイフ
ネーションを許容しない、ということはできない。もう
１つの規則″（ｄ）＝　（−ｄ）”があれば、このこと
は起こり得る。しかし、この規則の前に”　ａｂｃ　（
ｄ）＝　（ｄ）″というもう１行を置くことにより、こ
のことを防ぐことができる。

予約文字：規則を記述するために、以下の句読文字が予約されてい
る。特殊文字を入力するため他の句読文字を予約するこ
とができる。

−・　（）＝＊” アクセント付きの文字は、付録Ａに示す約束に従って符
合化することができる。

能率、シーケンス及び相互依存：集合を定義するときは、その構成要素を出現頻度の減少
順に列挙するのが一層能率的である。この方法で、構成
要素が他のどのようなシーケンスで列挙されている場合
よりも早く一致が発見される。

一般文字を代表する点”、″は集合よりも一層能率的に
一致する。

集合内の単一文字ストリングはそれより長いストリング
の前に走査される。条件が満たされるとすぐに、パター
ン突合せは停止するので、集合の単一文字構成要素と同
じ文字で始まる任意の文字ストリングを集合に含むこと
は意味がない。たとえば、”　（ａｄ）ｘ　　（＋）”
という規則（ただし、ｘ＝（ｃ　　ｃｈ））が与えられ
たとすると、入力ストリング″ｒａｄｃ”はｒ＋ｃ　”
を発生し、一方、ストリング°”ｒａｄｃｈ”は、規則
が溝たされないので変化しない。すなわち、入力ストリ
ング中のｃ″は集合Ｘの構成要素と一致するが、続く入
力文字”ｈ”は、規則により指定された区切り記号”−
“と一致しない。

″（ａｌｇｅｂｒａ）＝（ａｌ−ｇｅｂ−ｒａ）”のよ
うなハイフネーション規則は、他のどんな規則が含まれ
るかによってＮ　”ａ　（１ｇｅｂｒａ）＝　（１−ｇ
ｅｂ−ｒａ）″として、またはａ１（ｇｅｂｒａ）＝　
（−ｇａｂ−ｒａ）″として、またはａ　Ｉｇｅ　（ｂ
　ｒ）ａ＝＝　（ｂ−ｒ）”としてさえ書かれた場合に
一層能率的になる。能率が改善された理由は、文字ｆｆ
１ｎ、？１ｇ″または”ｂ”は文字″ａ″よりも発生す
る頻度が低いことである。文字ｎ　ａ″が既に多（の規
則を有する場合は、別の文字のもとて索引される規則を
作ることが一層能率的である。何故ならば、より少ない
規則が走査され、かつそれらの規則がよりまれにしか走
査されない（索引された文字の頻度に応じて）からであ
る。

１つの構成要素で集合を定義することは有用ではない。

宣言”＊ＤＣＬ　　Ｔ＝　（ｔ）”及び規則″（ｕｌｏ
ｓｏ）Ｔ＝＝　（ｕｌｏｓ−ｏ）”は″（ｕｌｏｓ−ｏ
）ｔ＝　（ｕｌｏｓ−ｏ）”として簡単に書くことがで
きる。ときには、小さな集合を含む規則は、使用される
集合の数を減少させるため完全に列挙することができる
。集合が小さい場合は、それを拡張して非常に少ない余
分な規則にする。集合に対する参照は、規則内での文字
突合せより多くの時間を必要とする。

ハイフンは最初の文字として、または語の最初の文字の
後では決して望ましくないので、”　（ａｋｖａａｒ）
Ｖ＝　（−ａｋ−ｖａａ−ｒ）”などのハイフネーシロ
ン規則は、多分”、、（ａｋｖａａｒ）Ｖ＝　（−ａｋ
−ｖａａｒ−ｒ）”として符号化されるべきである。

プログラムは、適用される最初の規則に従ってハイフン
を付ける。これは、”例外”が常に一般規則に先立って
列挙されねばならないからである。

したがって、”ｂｒ″は語″ａ１ｇｅｂｒａ″における
場合を除いてＮ　”　ｂ−ｒ　”としてハイフンを付け
られることはない。

一般文字を含む規則（たとえば、”（ａｉｏ）。

＝（ａｔ−ｏ）″）が、特殊文字を有する規則（たとえ
ば、″（ａ　ｉ　ｏ）　、　＝　（ａ　１−ｏ）　”）
が、特殊文字を有する規則（たとえば、”（ａｉｏｉ）
＝　（ａ　ｉ−ｏ　ｉ）″）の前にくる場合は、特殊文
字を有する規則は決して一致されない。これらの例では
、最初の規則の点”、′は文字″ｔ　Ｗまたは他の任意
の文字と突き合わされ、したがって、第２の規則は決し
て一致しない。規則が集合を参照するとき、これと同じ
問題が発生する可能性がある。

語を走査するシーケンスに関連して幾つかの「副作用」
がある。語の走査は左から右に行なわれるので、規則の
本体にある文字が−たび一致すると、この文字は入力で
スキップされ、他の規則の置換部分により影響されるこ
とはあり得ない。

たとえば、ｔ　ｏｍａ　ｔ　ｏ“という語と″（ｔ　ｏｍａ　ｔ）
＝（ｔｏ−ｍａｔ）”及び”　（ｍａ　ｔ）＝　（ｍａ
　−ｔ）゛という２つのハイフネーシロン規則が与えら
れると、最初の規則のみが一致する。その理由は、一度
最初の規則におけるストリング″ｔｏｍａｔ″が突き合
わされ、”ｔＯ−ｍａｔ”により置き換えられると、走
査は入力語のＲＥＭＡＩＮＩＮＧ　　ＵＮＭＡＴＣＨＥ
Ｄ（残りの未突合せ）部分、すなわち０″から続行する
。他の規則が適用されない場合は、”　ｔｏ−ｍａｔｏ
″を与える残りの文字を複写するため省略時規則（０）
＝（０）が使用されることになる。これらの規則が”（
ｔｏ）ｍａｔ＝　（ｔｏ　−）”及び”（ｍａｔ）＝（
ｍａ−ｔ）″と書かれる場合は、両方の規則が適合する
ので、語はｔｏ−ｍａ−ｔｏ″とハイフンを付けられる
。シーケンス”ｍａｔ”が最初の規則のＢＯＤＹ　（本
体）ではなく　Ｃ０ＮＴＥＸＴ（文脈）にあるときは、
第２の規則の適用を妨げない。

規則の本体内に集合を有することはできない。

その理由は２つある。すなわち、ａ）右側における対応
する置換は明確でなければならず、またｂ）規則は実行
時の効率のため、括弧内の最初の文字に基づいて索引さ
れるからである。

別の集合の補集合（否定）である−組を有する機能はな
い。ここで生じる１つの問題は、たとえば、母音の集合
の補集合は残りのアルファベットのみではなく、コード
・ページにおける２５６文字の残りでもあるということ
である。このことは、ｍｏｔｈｅｒ−ｉｎ−１ａｗ″１
０　”　Ｋｏ　ｒｎ″などの特殊な句読点を有する語の
場合に問題を生じる恐れがある。

質問（Ｑ）及び答（Ａ）：Ｑ：規則の優先順位についての正確な定義は何か。主な
基準は語を左から右に走査することのように見える。（
ｋ）が最初に処理されるので、（ｋａｌｌｅ）は（ａ　
ｌ　ｌ　ｅ）に優先するのか。

Ａニ一度規則の本体（等号の左側の括弧内の部分が一致
すると、本体を後で適用される規則の文脈で参照するこ
とはできても、それ以上の置換に使用することはできな
い。

入力された語は左から右に文字単位で走査される。語″
５ｋａｌｌｅｎ″と規則（ｋａｌｌｅ）＝　（ｘｙｚ）
及び（ａｌ　１ｅ）＝　（ｆ）が与えられると、以下の
結果が得られる。

一″Ｓ″については規則がないので、”８″が出力され
る。

一″に″が走査されたときは、ストリング″ｋａｌ　ｌ
ｅ″が一致し、”ｘｙｚ”が出力される。

走査は次の文字（ｎ″）から続行し、この文字について
は規則がないので、出力される。

−結果は”　ｓ　ｘ　ｙ　ｚ　ｎ　”である。

”　ａ　ｌ　ｌ　ｅ　”に関する規則は、最初の規則が
”　（ｋ）ａ　ｌ　１　ｅ＝　（ｘｙｚ）に変更された
場合のみ適用できる。この場合は、結果は”ｘｙｚｆｎ
”になる。

Ｑ：規則内の状態はいつ使用するのか。

Ａ：２つの規則のアクシロンを連係する必要があるとき
、状態は有用になり得る。接頭辞”ｓｕｂ″を有する語
について終りのｉｎｇ″を′ｉｎｇｓ″に変える必要が
あるものとする（たとえばＮ　ｓｕｂｓｔｒｉｎｇ＋ｓ
ｕｂｓｔｒｆｎｇＳ）。このことを実現するための規則
は次のようになる。　　　（ｓｕｂ）＝　（ｓｕｂ）０
３０３　（ｉｎｇ）　　＝　（ｉｎｇｓ）最初の規則は
接頭辞″ｓｕｂ”を認識し、現在の状態を０３にセット
する。第２の規則は、現在の状態が０３であるときのみ
実行するので、′ｒｉｎｇ’などの語については実行し
ない。

Ｑ：２重ハイフンはどのように抑止するか。２つのハイ
フネーションｆｆ１則（ｅ　ｓ　ｉ）　＝　（ｅ　５ｉ
−）及び（ｋ）ｖ＝（−ｋ）は！’ｅｓｉ−−ｋＯｔ″
を発生する。

Ａ：置換ストリングの左にハイフンを有するハイフネー
ション規則、すなわち、規則＝（−ＸＸ）のみを有する
ことにより、ＯＲ（または）、置換ストリングの右にハ
イフンを有する規則、すなわち、規則＝（ＸＸ−）のみ
を有することにより２重ハイフンを避けることができる
。ハイフンを両側に有する規則を結合すると、２つの規
則が次々に適用されたとき２重ハイフンが生じる。

２重ハイフンを避けるもう１つの方法は、それらを除去
する第２のパスを要求することによる。

これは以下のステートメントで行なうことができる。

＊ＰＡＳＳ２　５０５０　　　（−）　−＝　（）木ＰＡＳＳ２カードは第２のバスに対する初期状ｆ！Ｊ
５０を指定する。隣接するハイフンを除去するための規
則は、現在の状態が５０であるときのみ適用される。実
行状態が指定されない（すなわち、ＥＳ＝ＯＯ）規則の
実行を防ぐため、４９よりも上位の状態を使用する必要
がある。

Ｑ：規則、たとえばハイフネーション規則はどのように
配列されるべきか。

Ａ：ハイフネーション処理は、ＲＵＬＥＳ　（規則）及
びＥＸＣＥＰＴＩＯＮＳ　（例外）の概念を使って考え
るべきである。母音を従えたＳ″の前にハイフンを付け
る基本規則”、、（Ｓ）Ｖ＝（−ｓ）’“がある場合は
、この規則の前に、ハイフネーションを抑止する例外規
則が先行する。これらの例外規則の前に、例外に対する
例外があり、以下同様である。規則に対する例外は、無
効にしようとしている規則よりもＭＵＳＴ　　ＢＥ　　
ＭＯＲＥ　　５ＰＥＣＩＦＩＣ（明確でなければならず
）　、Ｄ　Ｉ　ＦＦＥＲＥＮＴ　（異なる）置換ストリ
ングを指定しなければならない。これは、例外規則の本
体及び文脈がすべての（または同等の）要素、ＰＬＵＳ
　（さらに）幾つかの追加の制限ＡＮＤ（及び）反対の
アクシロンを含むことを意味する。これを以下の例で示
す。

規則　　　　　　　　　説明、Ｖ（ｓ）ＶＣＶ、＝（−ｓ）　　　　Ａ２ａ、規則Ａ
２に対する例外がハイフンを付ける、Ｖ（ｓ）ＶＣＶ、−＝（−ｓ）　　　　Ａ２ｂ、規則
Δ２に対する例外がハイフンを付ける、Ｖ（ｓ）ＶＣＶ、＝（ｓ）　　　　　Ａ２．規則へに
対する例外がハイフネーションを抑止する、ＶＮＶ（ｓ）Ｖ、＝（−ｓ）　　　　Δｌａ、規則酎
に対耐る例外がハイフンを付ける、ＶＮＶ（ｓ）Ｖ、＝（−ｓ）　　　　Δｉｂ、規則Ａ
１に対する例外がハイフンを付ける、ＶＭＶ（ｓ）Ｖ、＝（ｓ）　　　　　Δ１．規則Ａに
対する例外がハイフネーションを抑止する、、　（ｓ）Ｖ＝（−Ｓ）　　　　　　Ａ、基本規則が
ハイフンを付ける同じ機能を膏する規則（たとえば、上記Ａｌａ及びＡｌ
ｂ）のシーケンスは問題ではないが、（括弧内の）本体
により、さらに右及び左の文脈によりそれらをアルファ
ベット類に並べることが好ましい。

Ｑ：語の最初の文字の前のハイフンはどのように抑止す
ることができるか。たとえば、“−ｐｒｏ−ｊｅｋ−ｔ
ｉ″ Ａニ一般的な”、ｎ文字を左の文脈の一部として指定す
るハイフネーシ日ン規則を符号化することにより、先頭
のハイフンを避けることができる。

たとえば、規則”　（ｐｒｏｊ）Ｖ＝　（−ｐｒｏ−ｊ
）°“は°“、、（１）ｒｏｊ）Ｖ＝（−ｐｒｏ−ｊ）
”として指定することができる。２つの一般的文字が、
ストリング″ｐｒｏｊ″の前に少なくとも２つの文字が
あることを保証する。このことはハイフンが先頭につく
問題、ならびにハイフンが後に続く単一文字を回避する
ことになる。

デバッグ：語になぜ特定の方法でハイフンを付けるかを説明するこ
とが望ましいこともある。規則の数が大きいときは、こ
れを手動で決定するのは困難である。このため、ハイフ
ネーシヨン・プログラムは動的デバッグ機能を有するこ
とがある。デバッグ・モードでは、プログラムは、適合
した規則を示すことになる。このデバッグ・モードは、
プログラムが入力語を要求したときにストリング”ｄａ
ｔ＝１″をタイプすれば使用可能になる。

デバッグ・モードは、”ｄａｔ＝ｏ″とタイプすること
により使用禁止にされる。

例　入力語　　　　　＝＝〉　　デバッグ・モードを使
用可能にするｄｄｔ＝１入力語ｅｘｔｒｅｍａｄａｍｅｎｔｅ）ｔＡＴｅｌｌ　！、、（ｔ）ＬＶ！航冗ｉｔ　！Ｆ（ｒ）！ＨＡ″Ｔｅ１ｌ　！、、（ｍ）Ｖ！ＭＡＴＣＩＩ　！、、（ｄ）Ｖ４ＨＡ’旧１１．、（ｍ）Ｖ！）ＩＡＴｃＨ！、、（ｔ）Ｖ！ｅｘ−ｔｒｅ−ｍａ−ｄａ−ｍｅｎ−ｔｅ入力語　・・
・ｄｄｔ−０＝＝＞デバッグ・モードを使用可能にする入
力語　・・・本発明のアプリケーションの例。

一意Ｊ仁しヱヱ」二外甜」むΣｐ」す１男ノｊ１里付録
Ｂの英語音声規則を使用し、かつ入力語″ｎａｔ　ｉｏ
ｎ″が与えられると、各入力文字が調べられる。Ｉｎ”
についての規則はないので、最初のＩｎ　ｎは出力スト
リングに複写される。

ａ″についての規則は（ａｔ）または（ａＵ）を必要と
するが、これらの条件は満たされないので、ａ″は出力
ストリングに付加される。′ｔ″を調べると、入力スト
リング″ｔｉｏｎ”は規則”ｓ　（ｔ）ｉｏｎ＝　（ｔ
）”の右の文脈に一致するが、入力ストリングの左側に
はｎ　ｓ″がないので、この規則は適合しない。次に調
べられる規則は″（ｔ）ｉｏｎ＝　（ｓｈ）″であり、
この規則は適合するので、”ｓｈ”が出力ストリングに
付加される。入力ストリングの残りの文字″ｉ″、”ｏ
”及び”ｎ″は、適用される規則を持たず、出力ストリ
ングに複写される。大力スリトングが尽きると規則の解
釈は入力ストリング″ｎａｔｉＯｎ″から出力ストリン
グ”ｎａｓｈｉｏｎ”を発生させたことになる。

同様な処理により、規則”（ｐｈ）＝　（ｆ）”及び“
″（ｃ）＝　（ｋ）”を適用すると、語”ｐｈｏｎｅｔ
ｉｃ″が”ｆｏｎｅｔｉｋ″に変換される。あるいは、
規則の集合が″（ｎ）ｅ＝（−ｎ）及び″（ｉ）ｃ＝（
−ｉ）からなる場合は、語″Ｉ）ｈｏｎｅｔｉｃ″はＩ
）ｈｏ−ｎｅｔ−ｉｃ″に変換され、したがって、音声
変換機能ではなくハイラネー２１フ機能が実行される。

リライト規ｆ１１　　釈プログラムの好ましい　　例及
び擬似コード規則解釈プログラムは、第１図の概要流れ図に示すよう
に、規則表を入力ストリングに適用して、０変換された
出力ストリングを発生させる。この１１］ス）　ＩＪソ
ング、１つのパスの出力を次のパスのための入力として
使用することにより、後続のパスで同じ規則表により処
理できる。

能率向上のために、集合及び規則についてインデックス
を組み立てる。こうして、規則表は、集合インデックス
、規則インデックス、ストリングの集合、リライト規則
、及び各パスについて使用されることになる初期状態を
含む総括的な変数からなる。リライト規則の書式はＦＳ　　Ｘ　（Ｙ）Ｚ＝　（Ｒ）ＮＳである。ただしＥＳ″は実行状態、ｎＸ″は左の文脈、
Ｙ″は規則の本体、Ｚ″は右の文脈、ＩＴ　Ｒ“は置換
ストリング、”ＮＳ″は新しい状態である。

１ｎｐｕｔ　ｗｏｒｄが与えられると、複数のパスが次
のように実行される。

ｗｏｒｄｉｎ　＝　１ｎｐｕｔ　ｗｏｒｄｃａｌｌ　　
ｒｕｌｅ−ｉｎｔ（ｗｏｒｄｉｎ、ｐａｓｓｌ　　１ｎ
ｉｔｉａｌ−ｖａｌｕｅ、　　ｖｏｒｄｏｕｔ）ｉｆ　
ｐａｓｓ２１ｎｉｔｉａｌ　ｖａｌｕｅ　！＝　−１（
ｗｏｒｄｉｎ　＝ｗｏｒｄｏｕｔｃａｌｌ　ｒｕｌｅ　ｉｎｔ（ｗｏｒｄｉｎ、ｐａｓｓ
２１ｎｉｔｉａｌ　ｖａｌｕｅ、ｖｏｒｄｏｕｔ）ｉｆ
　ｐａｓｓ３１ｎｉｔｉａｊｖａｌｕｅ　！＝　−１（
ｗｏｒｄｉｎ　＝ｗｏｒｄｏｕｔｃａｌｆ　ｒｕｌｅ　ｉｎｔ（ｗｏｒｄｉｎ、ｐａｓｓ
３−ｉｎｉｔｉａｌ　ｖａｌｕｅ、ｖｏｒｄｏｕｔ）ｉ
ｆ　ｐａｓｓ４−ｉｎｉｔｉａｌ　ｖａｌｕｅ　！＝　
−１（ｗｏｒｄｉｎ　＝　ｗｏｒｄｏｕｔｃａｌｌ　ｒｕｌｅ−ｉｎｔ（ｗｏｒｄｉｎ、ｐａｓｓ
２１ｎｉｔｉａｌ　ｖａｌｕｅ、ｗｏｒｄｏｕｔ）ｏｕ
ｔｐｕｔ　ｗｏｒｄ　＝　ｖｏｒｄｏｕｔ第２図の流れ
図に示すように、規則解釈プログラム自体次のように働
く。

ｒｕｌｅ　ｉｎｔ：状態を、渡されたパラメータ値にセ−／　）する。

出力ストリングを空に初期設定する。

ｃｈａｒ　　５ｃａｎ：入力ストリングの各文字について、規則インデックスでその文字を探索する。

入力ストリングが尽きたときは、出力ストリングを返す
。

文字がインデックスされなかった場合は、それを出力ス
トリングに複写し、入力ストリングにおけるその文字を
スキップしてｃｈａｒ　５ｃａｎを続行する。

その文字についてすべての規則を順次調べる。

規則インデックスを使って適当な規則を探し出し、この
時点で、ＥＳ、ＮＳ、Ｘ１Ｙの２及びＲは現在の規則を
指す。

ａｐｐｌｙ　ｒｕｌｅ：状態り５０の場合、ＥＳ　＞　Ｏ及びＥＳ　！＝状態の場合、５ｋｉｐ−ｔ
ｈｉｓ　ｒｕｌｅ。

状態〉＝５０の場合、ＥＳ　！＝状態の場合、５ｋｉｐ　ｔｈｉｓ　ｒｕｌｅ
。

この規則が適用できることを確かめるためレングス・ス
クリーンを適用する。

入力ストリングが、規則により必要とされるよりも小さ
い場合、５ｋｉｐ　ｔｈｉｓ　ｒｕｌｅ。

Ｙが入力ストリングに一致する仕事を行なう場合、５ｋ
ｉｐ　ｔｈｉｓ　ｒｕｌｅ。

ｒｉｇｈｔ　ｃｏｎｔｅｘｔ：Ｚの各文字について、その文字が集合標識である場合（集合番号を取る。

入力ストリングが尽きた場合（空ストリングが集合である場合、ｒｉｇｈｔ　ｃｏｎｔｅｘｔの走査を続行する。

さもなければ、５ｋｉｐ　ｔｈｉｓ−ｒｕｌｅ。

複数文字及び単一文字集合構成要素を長さの減少順に検
査する。

集合構成要素が一致した場合、入力ストリングの対応部
分をスキップして、ｒ＋ｇｈｔｃｏｎｔｅｘｔの走査を
続行する。

空ストリング集合構成要素が存在する場合、ｒｉｇｈｔ
　ｃｏｎｔｅｘｔの走査を続行し、さもなげればＮ　５
ｋｉｐ　ｔｈｉｓ　ｒｕｌｅ。

さもなければ、文字が終止符”？”である場合（入力ストリングが尽きた場合、１ｅｆｔ−ｃｏｎｔｅｘ
ｔを走査する。

さもなければ、５ｋｉｐ　ｔｈｉｓ　ｒｕｌｅ。

さもなければ、文字が区切り文字”−”である場合（入力ストリングが尽きた場合、１ｅｆｔ−ｃｏｎｔｅｘ
ｔを走査する〇現在の入力文字が句読点でない場合、この規則をスキッ
プする。

入力文字をスキップしてｒｉｇｈｔ　ｃｏｎｔｅｘｔの
走査を続行する。

さもなければ、文字が一般的文字”、°“である場合（入力ストリングが尽きた場合、５ｋｉｐ　ｔｈｉｓ−ｒ
ｕｌｅ。

さもなければ、（入力ストリングが尽きた場合、５ｋｉｐ　ｔｈｉｓ＝ｒ
ｕｌｅ。

入力文字が規則文字に一致しない場合、５ｋｉｐ　ｔｈ
ｉｓ　ｒｕｌｅ。

ｌｅｆｔ　ｃｏｎｔｅｘｔ：１ｅｆｔ　ｃｏｎｔｅｘｔ走査手順はｒｉｇｈｔ　ｃｏ
ｎｔｅｘｔ手順と同じであるが、走査の方向が左から右
ではなく、右から左である。また、１ｅｆｔ−ｃｏｎｔ
ｅｘｔは）ｒｉｇｈｔ　ｃｏｎｔｅｘｔが言及されるす
べての場所でその代りとされるべきであり、処理が１ｅ
ｆｔ　ｃｏｎｔｅｘｔの走査を続行する場所でｍａｔｃ
ｈ　ｃｏｎｄｉｔｉｏｎが認識される。

ｍａｔｃｈ　　ｃｏｎｄｉｔｉｏｎ：置換ストリングを出力ストリングに連係する。

Ｙに対応する入力ストリングの部分（一致した規則の本
体）をスキップする。

状態をＮＳにセットする。

ｃｈａｒ　５ｃａｎ　を続行する。

５ｋｉｐ　ｔｈｉｓ　ｒｕｌｅ＝現在の規則をスキップする。

次の規則を取る。

別の規則が利用可能である場合（ＥＳ、ＮＳ、Ｘ、Ｙ、Ｚ及びＲをセットする。

ａｐｐｌｙ　ｒｕｌｅを続行する。

それ以上の規則が利用可能でない場合、現在の文字を出
力ストリングに複写し、入力ストリングにおけるその文字をスキップしてｃｈａ
ｒ　５ｃａｎを続行する。

付録Ａはスペイン語ハイフネーシ日ン規則を、付録Ｂは
英語テキスト−音声変換規則を、本発明に従って示す。

結果として得られる発明は、規則を能率的に構成し、解
釈することを可能にする、リライト規則のための単純化
された機構を提供する。

付録Ａスペイン語ハイフネーション規則中　ホセーＡ−マナス（ＪｏｓｅΔ、　Ｍａｎａｓ　）
、ＣｏｍｍＡＣＭ、１９８７年７月、Ｖｏ　ｌ−３０、
Ｎｏ。

＊　７により示される規則に基づく＊　　母音ネＤＣＬ　Ｖ＝（ａ　ｅ　ｉ　ｏ　ｕ　／ａ　／ｅ　／
ｉ　１０　／ｕ　：ｕ）中　　広母音及びアクセントの
ある母音：ＤＣＬ　Ａ＝（ａ　ｅ　ｏ　／ａ　／ｅ　／
ｉ　１０　／ｕ）中　　閉母音：ＤＣＬ　Ｉ＝（ｉ　ｕ　：ｕ）ネ　　前古子音：ＤＣＬ　Ｆ＝（ｂ　ｃ　ｄ　ｆ　ｇ　ｋ　ｐ　ｔ）中
　　流音＊ＤｃＬ　　Ｌ＝（！　　ｒ）：　　２重＝ｐｃＬ　Ｄ＝（ａｈ　　ＩＩ　　ｒｒ）＊母音規則、Ａ（ａ）、−（−ａ）、Ａ（ｅ）、＝（−ｅ）・Ａ　（ｏ）　、＝：　（−ｏ）、Ａ　（／ａ）　、　＝（−／ａ）、Ａ（／ｅ）　、＝（−／ｅ）、Ａ（／ｉ）　、＝Ｉニー／ｉ）、Ａ　（１０）　、　＝（−１０）、Ａ（八）、＝（−／ｕ）＊子音規則、　、　（ｂ）ＬＶ＝　（−ｂ）、　、　（ｂ）Ｖ＝　（−ｂ）、　、　（ａｈ）Ｖ＝　（−ｃｈ）、　、　（ｃ）ＬＶ＝（−ｃ）、、（ｃ）Ｖ＝（−ｃ）、、　（ｄ）ｒＶ−（−ｄ）　　＊この規則は″ｒ″規
則と共に働く。

、　、　（ｄ）　Ｖ＝　（−ｄ）、　、　（ｆ）ＬＶ＝　（−ｆ）、　、　（ｆ）Ｖ＝　（−ｆ）、　、　（ｇ）ＬＶ＝（−ｇ）、　、　（ｇ）Ｖ＝（−ｇ）、Ｉ（ｈＨ＝（ｈ）、Ａ（ｈ）Ｉ＝（ｈ）、Ｉ（ｈ）Δ＝（ｈ）、ｃ（ｈ）＝（ｈ）、　、　（ｈ）Ｖ＝　（−ｈ）、、　（ｊ）Ｖ＝（−ｊ）、、　（ｋ）ＬＶ＝（−ｋ）、、（ｋ）Ｖ＝（−ｋ）、、（１１）Ｖ＝（−１１）１（１）＝（１）、ｄ　（１）　Ｖ＝　（−，１）Ｆ（１）＝（１）、、　（１）Ｖ＝（−１）＝−（ｍ）Ｖ＝（−ｍ）、、（ｎ）Ｖ＝４−ｎ）、　、　（’ｎ）Ｖ＝（−０ｎ）、　、　（ｐ）ＬＶ＝（−ｐ）、　、　（ｐ）Ｖ＝（−ｐ）、　、　（ｑ）Ｖ＝（−ｑ）、　、　（ｒｒ）　Ｖ＝（−ｒｒ）ｒ　（ｒ）　＝（ｒ）Ｆ（ｒ）＝（ｒ）：この規則は（ｄ）ｒＶ規則と関連、
、（ｒ）Ｖ＝（−ｒ）　　　する。

、、　（ｓ）Ｖ（−ｓ）、　、　（ｔ）　ＬＶ＝　（−ｔ）、　、　（ｔ）　Ｖ＝　（−ｔ）、　、　（ｖ）Ｖ＝　（−Ｖ）、　、　（ｗ）Ｖ＝（−ｗ）、　、　（ｘ）Ｖ；（−ｘ）、、　（ｙ）Ｖ＝（−ｙ）、　、　（ｚ）　Ｖ＝（−ｚ）付録Ｂ英語テキスト−音声規則キこれらの規則は、文字の文脈を考慮することに＊より
、音声ストリングの近似を発生させる。

：ＤＣＬ　Ｅ＝（ｅ　ｉ）：ＤＣＬ　Ｄ＝（ｂ　ｃ　ｄ　ｆ　ｇ　ｈ　ｊ　ｋ　Ｉ
　ｍ　ｎ　ｐ　ｑ　’ｒ　ｓ　ｔ　ｖ　ｗｘ　　ｙ　　
ｚ）＊ＤｃＬ　５＝（ｃ　ｓ　ｘ　ｚ）：ＤＣＬ　Ｔ＝（ｄ　ｔ）：ＤＣＬ　Ｖ＝（ａ　ｅ　ｉ　ｏ　ｕ）（ａｉ）＝（ａ
）（ａｕ）　＝（ｏ）（ｂ）ｂ＝０（ｃｈ）＝（ｃｈ）（ｃ）ｋ：０ｘ（ｃ）Ｅ：０（ｃ）　１ａｌ＝（ｓｈ）（ｃ）Ｅ＝（ｓ）（ｃ）ｙ＝（ｓ）（ｃｃ）Ｅ＝（ｋｓ）（ｃ）ｃ＝０（ｃ）＝（ｋ）（ｄ）ｄ＝０（ｅａ）＝（ｅ）（ｅｅ）”（ｅｅ）（ｅｕ）＝（ｕ）（ｅｗ）＝（ｕ）：黙音の°′ｅ“の判定ｇ（ｅ）　−：０（ｅ）ｙ−＝ＯＶＣ（ｅ）−＝ＯＶＣＣ（ｅ）　−＝０　　　：　”１ａｐｓｅｌｌＶＴ
（ｅ）ｄ−＝（ｅ）　　　＊　”ｃｒｅｄｉｔｅｄ”Ｖ
Ｃ（ｅ）ｄ−＝□ ＶＣＴ（ｅ）ｄ　＝（ｅ）　　：　”ｃｏｎｄｕｃｔｅ
ｄ、”　”ａｍｅｎｄｅｄ”ＶＣＣ（ｅ）ｄ−＝ＯＶＣ（ｅ）Ｉｙ−＝ＯＶＣＣ（ｅ）ｌｙ−＝０　　：　”１ｎｖｅｒｓｅｌｙ
”ＶＳ（ｅ）ｓ−＝（ｅ）　　　”前に歯擦音がする一
ｅｓＶｇ（ｅ）ｓ−＝（ｅ）　　　：前にｇ°°が置か
れた一ｅｓｓＩ′ｐ　ａ　ｃ　ｋ　ａ　ｇ　ｅ　ｓ　”
ＶＣ（ｅ）ｓ−：０（ｆ）ｆ＝０（ｇ）ｇ二〇（ｇｈｔ）　−＝（ｔ）（ｇｈｔ）、　　”（ｔ） −（ｇｈ）＝（ｎ）（ｇｈ）−＝（ｎ）（ｈ）ｈ＝０（ｉｅ）＝（ｉ）（ｊ）ｊ＝０（ｋｎ）＝（ｎ）（ｋ）ｋ＝０（ＩＮ＝ＯＣ（ｌｅ）−二（ｅｌ）：音の反転、たとえば、”ｃｉ
ｒｃｌｅ″、”１ｄｌｅ” Ｃ（ｌｅ）ｄ−＝（ｅｌ）　　＊反転、たとえば、”５
ｔａｐ　ｌｅｄ”Ｃ（ｌｅ）ｓ−＝（ｅｌ）（ｎ＋）ｍ−０ −（＋５ｎ）＝（ｎ）（ｎ）ｎ：０（ｏｏ）＝（ｕ）（ｏｕ）＝（ｏｕ）（ｏｖ）＝（ｏｕ）（ｐ）ｐ：０（ｐｈ）＝（ｆ）（ｐｎ）＝（ｎ） −（ｐｓ）＝（Ｓ）（ｐｔ）　＝（ｔ）（ｇ）Ｊｋ）（ｒ）ｒ：０ｔ（ｒｅ）−：（ｅｒ）　　’：音の反転、たとえば、
”ｔｈｅａｔｒｅ″ｔ　（ｒｅ）ｓ−＝（ｅｒ）（ｓｈ）＝（ｓｈ）（ｓ）ｓ＝０（ｓ）ｉｏｎ＝（ｓｈ）　　：　”ｄｅｃｉｓｉｏｎ、
”　”ｐｒｏｆｅｓｓｉｏｎａｌ”ｓ　（ｔ）　ｉｏｎ
”　（ｔ）　　＊たとえば、ｑｕｅｓｔ　１ｏｎ（ｔ）
ｉｏｎ＝（ｓｈ）　　＊　　　　　　　　ｎａｔｉｏｎ
、　　ｐｒｅｍｏｎｉｔｉｏｎ（ｔ）ｔ＝０（ｖ）■＝０（ｗｈ）＝（ｗｈ）（ｗｒ）＝（ｒ）（ｖ）＝（ｕ）（ｘ）ｘ＝０（×）＝（ｋｓ）（ｙ）ｙ＝０（ｙ）＝（ｉ）（Ｚ）ｚ：０（Ｚ）＝（ｓ）ここに開示したコンピュータ方法の発明は、通常のどの
データ・プロセッサ上でも実行することができる。米国
特許第４７３１７３５号に、好適な処理システムが開示
されている。この特許の図及び明細書を、本発明を適用
できるデータ処理システムの一例として引用し、本明細
書に組み込んだ。

Ｆ１発明の効果本発明によれば、リライト規則のための単純化されたメ
カニズムが提供される。

【図面の簡単な説明】

第１図は本発明の概要を示す流れ図である。第２図は本発明の規則解釈機能を示す流れ図である。

Claims

【特許請求の範囲】

（１）入力及び出力を有するコンピュータ・システム内
で変換規則を実行するための方法であって、各入力文字
について順次、現在の入力文字をインデックスで捜し、この文字に適用
可能な規則を識別する段階と、１つまたは複数の文字のストリングを有する、規則の「
本体」として識別される規則の一部分を、現在の入力文
字から始めて入力ストリングと突合せ試行する段階と、一連のストリング、またはストリングの集合を表す識別
子を有する、規則の「右の文脈」として識別される規則
の一部分を上記突合せ「本体」の右側の入力ストリング
と突合せ試行する段階と、一連のストリング、またはス
トリングの集合を表す識別子を有する、規則の「左の文
脈」として識別される規則の一部分を上記突合せ「本体
」の左側の入力ストリングと突合せ試行する段階と、規
則のすべての部分が入力ストリングと突き合わされたと
き、突合せ規則と関連した置換ストリングを出力し、本
体に対応する入力ストリングの部分をスキップして変換
処理を続行する段階と、現在の入力文字が適用可能な規
則を持たない場合に入力文字を出力して、変換処理を続
行する段階を含む方法。
（２）各規則の本体をコンピュータに入力して、ターミ
ナル・ストリングのみから構成すること、コンピュータ
内で各規則の「本体」の照合シーケンスに基づいて規則
を組織すること、及び規則の「本体」に基づいてインデ
ックスをコンピュータに入力し、規則のコレクションに
アクセスすることから成る、リライト規則のコレクションを定義するため
の方法。
（３）入力ストリングを文字単位で走査する段階、規則
の「本体」の文字に基づいてインデックスを用いて、適
用可能となり得るリライト規則を探し出す段階、規則の文脈と「本体」とが一致した場合は、規則の「本
体」と一致する入力ストリングの部分を、対応する置換
ストリングと置き換えることにより入力ストリングを作
成し、入力の置換部分をスキップし、状態変数を規則と
関連した値に任意選択的にセットする段階を含むリライト規則を適用するための方法。