JPH0772897B2 - 機械翻訳機 - Google Patents

機械翻訳機

Info

Publication number
JPH0772897B2
JPH0772897B2 JP57232781A JP23278182A JPH0772897B2 JP H0772897 B2 JPH0772897 B2 JP H0772897B2 JP 57232781 A JP57232781 A JP 57232781A JP 23278182 A JP23278182 A JP 23278182A JP H0772897 B2 JPH0772897 B2 JP H0772897B2
Authority
JP
Japan
Prior art keywords
frame
control
grammar rule
rule
grammar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57232781A
Other languages
English (en)
Other versions
JPS59123977A (ja
Inventor
正勝 杉本
進 沢井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57232781A priority Critical patent/JPH0772897B2/ja
Publication of JPS59123977A publication Critical patent/JPS59123977A/ja
Publication of JPH0772897B2 publication Critical patent/JPH0772897B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、文法解析、言語変換および生成を行う文法規
則フレームと、次にどの文法規則フレームに飛ぶかを決
める制御フレームとを用いて機械翻訳を行う機械翻訳機
に関するものである。
〔従来技術と問題点〕
従来の機械翻訳機においては、ある語句を見て、その語
句に合った規則を適用するという動的制御を行うことが
出来ないこと、拡張性に乏しいことなどの欠点があり、
機械翻訳機は翻訳率が向上しなかった。例えば動詞「開
ける」があったら「(人間)+が+(物)+で+開け
る」,「(物)+が+(物)+で+開ける。……」等の
規則を順次適用することが困難であった。
〔発明の目的〕
本発明は、上記の考察に基づくものであって、拡張容易
であり、しかも高速性に富む機械翻訳機を提供すること
を目的としている。
〔発明の構成〕
そしてそのため、本発明の機械翻訳機は、 語句,属性および訳語よりなる組の複数個を記憶する辞
書と、 翻訳対象の文を辞書を用いて分割して得られた複数の語
句の訳語と属性を示す語句情報を、翻訳対象の文におけ
る語句の順序に従って記憶するスタックと、 処理するフレーム名を格納するフレーム名レジスタと、 制御メモリと、 制御メモリの内容で指示された処理を行う制御部と を具備する機械翻訳機であって、 制御メモリには、 プロダクション・ルールまたはプロダクション・ルール
と手続きの形式と文法規則ならびに次に実行すべきフレ
ームの名前が記述された複数の文法規則フレームが格納
されると共に、 フレーム名レジスタの内容に従って次に何れの文法規則
フレームを実行すべきかを指示する複数の第1の制御フ
レームおよびフレーム名レジスタの更新を指示する複数
の第2の制御フレームが格納される ことを特徴とするものである。
〔発明の実施例〕
以下、本発明を図面を参照しつつ説明する。
第1図は本発明の1実施例をモデル化して示すものであ
る。第1図において、1は入力媒体、2は出力媒体、3
は入力ヘツド、4は出力ヘツド、5は制御部、6は辞
書、7はスタック用レジスタ、8はフレーム名レジス
タ、9は制御メモリ、10は文法規則フレーム、11は制御
フレームをそれぞれ示している。また、Wは語句、Aは
属性、Eは訳語を示している。入力媒体1には機械翻訳
の対象となる文が記録されており、出力媒体2には機械
翻訳の結果が記録される。制御部5は、例えばマイクロ
プロセツサから構成されている。辞書6には、日本語の
語句と、その属性と、その訳語が格納されている。いま
「太郎がカギで開ける。」という文が入力されたとする
と、スタツク用レジスタ7には図示のような語句情報が
格納される。なお、#Xは文頭、X#文末、φは空集合
をそれぞれ示している。フレーム名レジスタ8は、現在
どのフレームを使用しているかを示す情報を格納するも
のである。制御メモリ9には、文法規則フレーム10と、
制御フレーム11とが格納されている。文法規則フレーム
10は、ブロダクシヨン・ルールと手続とから構成されて
いる。また、制御フレーム11は、「もし状態が……な
ら、……のフレームを使用せよ」という情報を複数個含
んでいる。スタツク用レジスタ7内の語句情報は、文法
規則フレーム10および制御フレーム11に従って処理さ
れ、そして日本語文に対応した英文が出力される。
第2図はフレームの種類およびフレーム間の関係を示す
図である。フレームには、文法規則フレームと制御フレ
ームがある。文法規則フレームには、名詞の処理フレー
ムa1と、形容詞の処理フレームa2と、副詞の処理フレー
ムa3と、動詞の処理フレームa4と、埋め込み文の処理フ
レームa5がある。なお、図では、名詞の処理フレームは
1個しか示されていないが、実際には名詞の処理フレー
ムは複数個の文法規則フレームから構成されている。形
容詞の処理フレーム、副詞の処理フレーム、動詞の処理
フレーム、埋め込み文の処理フレームについても、同様
である。
制御フレームには、何れかの文法規則フレームを実行す
べきかを指示する第1の制御フレームと、フレーム名レ
ジスタの更新を指示する第2の制御フレームb1,b2,b3,b
4がある。
先ず、名詞の処理フレームが実行され、次に形容詞の処
理フレームが実行される。形容詞が名詞的に用いられて
いるときには、名詞の処理フレームに戻る。形容詞の処
理フレームの次には副詞の処理フレームが実行され、副
詞の処理フレームの次には動詞の処理フレームが実行さ
れ、動詞の処理フレームの次には埋め込み文の処理フレ
ームが実行される。埋め込み文があった場合には、名詞
の処理フレームに戻る。埋め込み文とは、例えば「コン
ピュータの処理するデータ」というものである。
第3図は機械翻訳システムのハードウエア構成の1例を
示す図、第4図は機械翻訳機のハードウエア構成の1例
を示す図である。第3図および第4図において、12は機
械翻訳機、13はプリンタ、14は表示装置、15は磁気デイ
スク、16はI/Oコントローラ、17は主記憶装置、18は作
業用レジスタ、19はレジスタ・アドレス加減算器をそれ
ぞれ示している。機械翻訳器12は第4図は示されるよう
なハードウエア構成を有している。プリンタ13は翻訳結
果である英文を印字するものである。表示装置14は日本
文を入力したり、翻訳結果である英文を表示出力したり
するものである。デイスク15としては、辞書格納用デイ
スクや出力用デイスク、入力用デイスクなど種々のもの
が存在する。第4図に示すように、機械翻訳機12は、制
御用マイクロプロセツサ5、制御メモリ9、主記憶装置
17、作業用レジスタ18およびレジスタ・アドレス加減算
器19から構成されている。制御メモリ9にはパターン・
マツチング処理マイクロプログラムが格納されている。
パターン・マツチング処理マイクロプログラムは、先に
述べた文法規則フレームと制御フレームから構成されて
いる。主記憶装置17には、辞書用デイスクから読取られ
た各種の辞書情報が格納される。作業用レジスタ18は、
PSWレジスタやスタツク用レジスタ7、フレーム名レジ
スタ8から構成されている。レジスタ・アドレス加減算
器19は、スタツク用レジスタ7のアドレスを示すもので
あり、ポツプ・アツプするときは−1され、プツシユ・
ダウンするときは+1される。
第5図は文法規則フレームと制御フレームの概要を示す
ものである。いま、「(名詞)太郎+(助詞)が」が入
力されたと仮定する。そうすると、名詞の処理フレーム
が選択される。名詞の処理フレームによって入力文法が
例えば「(名詞)+(助詞)」かを判定し、入力文法を
「名詞句」にする。次に、フレーム中の全ての文法規則
を処理したか否かを調べ、いいえの場合にはループ・バ
ツクする。はいの場合には、終了フレームか否かを調
べ、いいえの場合にはループ・バツクし、はいの場合に
は終了とする。
フレームとは、知識表現の一手法としてMinskyにより提
案されたものであって、1つの対象(例、犬)や一連の
プログラム(例、「所有者を探す」)を一つの枠組にま
とめておくものである。本発明における文法規則は文法
規則フレームと制御フレームという2つのフレームで構
成されており、両者はいずれも知識表現FKR−0で記述
されている。プログラム(手続的な知識)だけで構築さ
れているフレームが制御フレームであるので、文法規則
フレームと制御フレームとの違いは形状から一目でわか
る。
或る言語の文法規則群をいくつかの粗いサブ・グループ
にわけた一文法規則群を文法規則フレームと言い、この
文法規則フレームを用いて解析率と翻訳率を向上させ
る。通常一つの文法規則フレーム内に、20ないし30個程
度の文法規則が入っている。それぞれの文法規則は「も
し…なら、…する。」という形式のプロダクシヨン・ル
ールの形で書かれており、文法規則フレームを用いるこ
とにより、文法規則サブグループ間の文法規則適用順序
を細かに記述することが出来る。名詞の文法規則フレー
ムの1例を下記に示す。
上記の文法規則フレームにおいて、 /*NOUN+CONJUNCTION+NOUN*/ は、 STATE(NOUN_AND_NOUN) の内容を示している。例えば (R(COND((ND X2 CN X8) ND)(PARM(X8 W31@
4 )))) と言う文法規則は次のような意味を有している。上記の
文法規則において、NDは一般名詞、X2は「(助詞)
の」、CNは接続詞、X8は「(助詞)を」を示している。
また、PARM(X8 W31@4)は、 語順3,1,4の順になること、 1と4の語の間に「X8」の属性が挿入されること、 を示す。
例えば、「GRAMMAR(文法)のBETWEEN(間)を」と言う
パターンがあった場合、このパターンは上記文法規則の
「W31@4」によって「BETWEEN(間)GRAMMAR(文法)
を」言う形に変換される。
なお、上記文法規則フレームにおいて、 (STATE(NOUN_AND_NOUN ) は当該文法規則フレームの入口を示し、 STATE(#115) は当該文法規則フレームの出口(制御フレーム)を示
す。即ち、文法規則フレームは1入口1出口を持つ。
制御フレームは上述の文法規則フレーム間の構造化を促
進するフレームであって、次にどの文法規則フレームに
飛ぶかを決める。通常、次に飛ぶべきフレームは「(ST
ATE(」文により明示されず、制御フレーム内のプログ
ラムに記述される。このような制御フレームは、フレー
ムの追加や文法規則適用順序の修正が容易になること及
び文法規則の保守性が良くなることを狙っている。下記
に典型的な制御フレームの例を示す。
PL/I言語の特徴を活用し、フレーム名レジスタ(32ビッ
ト長)の各ビットを,例えば9ビット目の場合にCODE
(9)のように、別名でそのビットの内容(‘1'Bまた
は‘0'B)で読み出せる。
STATE(NP )の制御フレームは、CODE(9)が
‘1'BでCODE(10)が‘1'Bである場合には「NOUN_AND_N
OUN」の文法規則フレームに飛び、CODE(9)が‘1'Bで
CODE(10)が‘0'Bである場合には「NOUN_OF_NOUN」の
文法規則フレームに飛び、と言うようなことを意味して
いる。
STATE(#110)の制御フレームは、副詞/形容詞のフレ
ームに飛ぶためのものであり、CODE(5)ないしCODE
(13)のうち、CODE(7)のみを‘1'Bに更新するよう
に指示し、その他を‘1'Bにすべきことを指示してい
る。文法規則フレームや制御フレームには、プログラム
(手続的な知識)が書けるようになっている。文法規則
フレーム内にプログラムが書ければ、よりきめ細やかな
構文解析ができる。下記に文法規則フレーム内に書かれ
たプログラムの例を示す。
第8図は@@ATTRLISTの構成を示す。@@ATTRLISTは第
1図のスタック用レジスタのAttribute(属性を意味す
る)並びを意味する。上述の文法規則フレームにおける
((STATE(case )…→(STATE(CASE_END)))の
次の文(第1行の文)から第3行までは手続きを表し、
第4行と第5行はプロダクション・ルールを表す。第1
行ないし第3行は、@@ATTRLISTの3ブロック目が
「C」で4ブロック目が「F」であるか、@@ATTRLIST
の5ブロック目が「R」で6ブロック目が「I」で7ブ
ロック目が「C」で8ブロック目が「F」でないか、@
@ATTRLISTの5ブロック目が「R」で6ブロック目が
「I」で7ブロック目が「P」で8ブロック目が「X」
で9ブロック目が「Q」で10ブロック目が「3」でなけ
れば、以下の変換規則を適用せよと言うことを表す。
上述の文法規則フレームにおける第6行ないし第9行は
手続きを表し、第10行と第11行はプロダクション・ルー
ルを表し、第12行は手続きを表す。
第6図は機械翻訳の全体の流れを示すものである。第6
図において、は特殊文字辞書、は熟語辞書、は単
語辞書、はパターン辞書、は付属語辞書、はかな
辞書、′は検索キーつき熟語辞書、′は検索キーつ
き単語辞書をそれぞれ示している。パターン辞書には
各種の文法規則フレームおよび制御フレームが格納され
ている。汎用機械翻訳プログラムとパターン辞書とを
組合わせることによって対象言語の機械翻訳プログラム
が作成される。検索キーつき熟語辞書′は熟語辞書
をフアイル変換することによって作成され、検索キーつ
き単語辞書′は単語辞書をフアイル変換することに
より作成される。対象言語への機械翻訳プログラムは、
特殊文字辞書.検索キーつき熟語辞書′、検索キー
つき単語辞書′、付属語辞書およびかな辞書を使
用して、一般の利用者が作成した文書を対象言語(例え
ば英語)の文に翻訳する。
第7図(イ)、(ロ)は機械翻訳機における処理の具体
例を示すものであり、第7図(イ)、(ロ)において
,……は処理の順序を示している。いま、「コンピ
ュータの利用分野は著しく拡大した。」という日本文を
英文に翻訳する場合を考える。の処理が行われると、
「コンピュータの利用分野は著しく拡大した」という文
情報が得られる。の処理が行われると、 という文情報が得られる。の処理が行われると、「<
名詞>の<名詞>は<形容詞語幹>し<動詞語幹>し
た」という文情報が得られる。の処理が行われると、
「<名詞>ノ<名詞>ハ<形容詞>〔連用〕<動詞>
〔終止・過去〕」という文情報が得られる。なお、これ
らの文情報は第1図に示されるような形式でスタツク用
レジスタ7に格納される。の処理が行われると、先ず
「抽象名詞のハ格><形容詞>〔連用〕<動詞>〔終止
・過去〕」という文情報が得られ、次いで 「APPLICATION OF COMPUTER WERE GREATLY EXPANDING」
という英文が得られる。の処理が文法規則フレームお
よび制御フレームによって行われるものである。の処
理が行われると、完全な形の英文「APPLICATION OF COM
PUTER HAVE BEEN GREATLY EXPANDING」が得られる。
〔発明の効果〕
以上の説明から明らかなように、本発明の機械翻訳機
は、従来方式に比べ高速であること、及び拡張が容易な
こと等の顕著な作用効果を奏することが出来る。また、
本発明においては文法規則フレームと制御フレームを有
しているので、文法規則を文法規則適用論理(適用成功
または失敗)と独立に開発できること、分業化により文
法規則を大量生産できること、文法規則そのものの信頼
性を高められること等の顕著な効果を奏することも出来
る。
【図面の簡単な説明】
第1図は本発明の1実施例をモデル化して示す図、第2
図はフレームの種類およびフレーム間の関係を示す図、
第3図は機械翻訳システムのハードウエア構成の1例を
示す図、第4図は機械翻訳機のハードウエア構成の1例
を示す図、第5図は文法規則フレームと制御フレームの
概要を示す図、第6図は機械翻訳の全体の流れを示す
図、第7図(イ)、(ロ)は機械翻訳機における処理の
具体例を示す図、第8図は@@ATTRLISTの構成を示す図
である。 1……入力媒体、2……出力媒体、3……入力ヘツド、
4……出力ヘッド、5……制御部、6……辞書、7……
スタツク用レジスタ、8……フレーム名レジスタ、9…
…制御メモリ、10……文法規則フレーム、11……制御フ
レーム、12……機械翻訳機、13……プリンタ、14……表
示装置、15……磁気デイスク、16……I/Oコントロー
ラ、17……主記憶装置、18……作業用レジスタ、19……
レジスタ・アドレス加減算器。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 「情報処理学会計算言語学研究会資料」 No.25 情報処理学会(昭和56−02− 06)P.25.8.1−25.8.8 長尾真 外2名「計算機マニュアルを対象とした 日英機械翻訳システムにおける英文の生 成」

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】語句,属性および訳語よりなる組の複数個
    を記憶する辞書と、 翻訳対象の文を辞書を用いて分割して得られた複数の語
    句の訳語と属性を示す語句情報を、翻訳対象の文におけ
    る語句の順序に従って記憶するスタックと、 処理するフレーム名を格納するフレーム名レジスタと、 制御メモリと、 制御メモリの内容で指示された処理を行う制御部と を具備する機械翻訳機であって、 制御メモリには、 プロダクション・ルールまたはプロダクション・ルール
    と手続きの形式の文法規則ならびに次に実行すべきフレ
    ームの名前が記述された複数の文法規則フレームが格納
    されると共に、 フレーム名レジスタの内容に従って次に何れの文法規則
    フレームを実行すべきかを指示する複数の第1の制御フ
    レームおよびフレーム名レジスタの更新を指示する複数
    の第2の制御フレームが格納される ことを特徴とする機械翻訳機。
JP57232781A 1982-12-29 1982-12-29 機械翻訳機 Expired - Lifetime JPH0772897B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57232781A JPH0772897B2 (ja) 1982-12-29 1982-12-29 機械翻訳機

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57232781A JPH0772897B2 (ja) 1982-12-29 1982-12-29 機械翻訳機

Publications (2)

Publication Number Publication Date
JPS59123977A JPS59123977A (ja) 1984-07-17
JPH0772897B2 true JPH0772897B2 (ja) 1995-08-02

Family

ID=16944635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57232781A Expired - Lifetime JPH0772897B2 (ja) 1982-12-29 1982-12-29 機械翻訳機

Country Status (1)

Country Link
JP (1) JPH0772897B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6509169B2 (en) 2000-07-14 2003-01-21 University Of West England, Bristol Detection of Helicobacter pylori

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
「情報処理学会計算言語学研究会資料」No.25情報処理学会(昭和56−02−06)P.25.8.1−25.8.8長尾真外2名「計算機マニュアルを対象とした日英機械翻訳システムにおける英文の生成」

Also Published As

Publication number Publication date
JPS59123977A (ja) 1984-07-17

Similar Documents

Publication Publication Date Title
JP4319860B2 (ja) 転移ベースの機械翻訳システムで使用される転移辞書を開発するための方法および装置
JP2005507525A (ja) 機械翻訳
JPH02308370A (ja) 機械翻訳システム
JP2002215617A (ja) 品詞タグ付けをする方法
Gezmu et al. Extended parallel corpus for Amharic-English machine translation
Graliński et al. PSI-toolkit: A natural language processing pipeline
JPH05197744A (ja) 外国語ワードプロセッサ
JPH02112068A (ja) テキスト簡略表示方式
JPH0772897B2 (ja) 機械翻訳機
US20250238593A1 (en) Computer-readable recording medium storing information processing program and information processing method
JP3236027B2 (ja) 機械翻訳装置
JP4087829B2 (ja) 結合価辞書拡張装置、方法、およびプログラム
JP2928246B2 (ja) 翻訳支援装置
Bauer et al. Universal Dependencies for Sindhi
JPH09185629A (ja) 機械翻訳方法
JPS6324458A (ja) 自然言語処理装置
JP2866437B2 (ja) 用例辞書登録方法及び装置
JP2000029878A (ja) 翻訳知識学習方法および装置、機械翻訳方法および装置
JP2000029882A (ja) 要約文作成装置
JP3313810B2 (ja) アスペクト処理装置
JP2024021023A (ja) Synapperモデルユニットを用いた自然語処理システム及び方法
JPH01126767A (ja) 辞書参照装置
JPS63136265A (ja) 機械翻訳装置
JPH0973454A (ja) 文書作成装置及び文書作成方法
JPH0581313A (ja) 辞書作成装置