JPH0256702B2 - - Google Patents
Info
- Publication number
- JPH0256702B2 JPH0256702B2 JP58056711A JP5671183A JPH0256702B2 JP H0256702 B2 JPH0256702 B2 JP H0256702B2 JP 58056711 A JP58056711 A JP 58056711A JP 5671183 A JP5671183 A JP 5671183A JP H0256702 B2 JPH0256702 B2 JP H0256702B2
- Authority
- JP
- Japan
- Prior art keywords
- syntax
- syntactic
- noun
- rules
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は、機械翻訳装置に関し、特に構文規則
を自動的に生成する手段をそなえた構文処理方式
の機械翻訳装置に関する。
を自動的に生成する手段をそなえた構文処理方式
の機械翻訳装置に関する。
構文処理方式の機械翻訳装置の動作原理は、入
力された単語列中の各単語のそれぞれに、名詞、
代名詞等の品詞を構文要素として張り付け、これ
に予め用意されている〔名詞+係助詞→名詞句〕、
〔名詞句+名詞+助動詞→文〕などの多数の構文
規則を適用して、翻訳文を得るものである。とこ
ろで、構文規則は、従来人手によつてつくられて
おり、大変な作業を必要とするため、通常、装置
にそなえられる構文規則の数は、せいぜい数百程
度に制約される。しかし、実際に文中に現われる
品詞の組み合わせの数は膨大であり、特に文が長
くなるほどそれが助長される。そのため、一般に
は限られた長さの構文規則を用い、長い単語列に
対しては部分的に可能な構文規則を適用し、得ら
れた結果の上に、さらに可能な構文規則を適用す
るというようにして、順次的に構文を単純化する
操作を積み重ね、最終的に翻訳文として認識でき
るものに還元するという方朋がとられている。
力された単語列中の各単語のそれぞれに、名詞、
代名詞等の品詞を構文要素として張り付け、これ
に予め用意されている〔名詞+係助詞→名詞句〕、
〔名詞句+名詞+助動詞→文〕などの多数の構文
規則を適用して、翻訳文を得るものである。とこ
ろで、構文規則は、従来人手によつてつくられて
おり、大変な作業を必要とするため、通常、装置
にそなえられる構文規則の数は、せいぜい数百程
度に制約される。しかし、実際に文中に現われる
品詞の組み合わせの数は膨大であり、特に文が長
くなるほどそれが助長される。そのため、一般に
は限られた長さの構文規則を用い、長い単語列に
対しては部分的に可能な構文規則を適用し、得ら
れた結果の上に、さらに可能な構文規則を適用す
るというようにして、順次的に構文を単純化する
操作を積み重ね、最終的に翻訳文として認識でき
るものに還元するという方朋がとられている。
以下に、具体例を示す。
(1) 入力単語列
これ/代名詞 は/係助詞 私/代名詞 の/格助詞
ペン/名詞 です/助動詞 (2) 構文規則 ○イ代名詞+係動詞(は)→名詞句(主格) ○ロ代名詞+格助詞(の)+名詞→名詞句 ○ハ名詞句(主格)+名詞句+助動詞(です)→
文 (3) 構文規則の適用処理 第1回 〔これ/代名詞 は/係助詞〕に構文規則○イを適用
し、 名詞句に変換する。
ペン/名詞 です/助動詞 (2) 構文規則 ○イ代名詞+係動詞(は)→名詞句(主格) ○ロ代名詞+格助詞(の)+名詞→名詞句 ○ハ名詞句(主格)+名詞句+助動詞(です)→
文 (3) 構文規則の適用処理 第1回 〔これ/代名詞 は/係助詞〕に構文規則○イを適用
し、 名詞句に変換する。
第2回
〔私/代名詞 の/格助詞 ペン/名詞 です/助動
詞〕に構文 規則○ロを適用し、名詞句に変換する。
詞〕に構文 規則○ロを適用し、名詞句に変換する。
第3回
第1回および第2回の変換により得られる〔名
詞句(主格)+名詞句+助動詞(です)〕に構文規
則○ハを適用し、文を認識する。
詞句(主格)+名詞句+助動詞(です)〕に構文規
則○ハを適用し、文を認識する。
このように(1)の入力単語列は、3回の変換処理
により文として認識されるが、もしも、 ○ニ代名詞+係助詞+代名詞+格助詞+名詞+助
動詞→文という構文規則が用意されているなら
ば、1回の変換処理で、文の正確な認識をするこ
とが可能となる。
により文として認識されるが、もしも、 ○ニ代名詞+係助詞+代名詞+格助詞+名詞+助
動詞→文という構文規則が用意されているなら
ば、1回の変換処理で、文の正確な認識をするこ
とが可能となる。
したがつて、構文処理方式の機械翻訳装置で
は、有効性の高い構文規則を揃えることが、その
処理速度と翻訳精度とを高めるうえでの重要な条
件となる。
は、有効性の高い構文規則を揃えることが、その
処理速度と翻訳精度とを高めるうえでの重要な条
件となる。
本発明の目的は、有効性の高い構文規則を自動
的に生成する手段をそなえた機械翻訳装置を実現
することにあり、そのため、既存の構文規則を特
定的に適用したときに正しい翻訳結果が得られた
回数が、予め定められた回数を超えたとき、その
構文要素の配列と変換結果との組み合わせを、新
しい構文規則として認識し、構文規則の集合に加
えるようにして、上記目的を達成するものであ
る。
的に生成する手段をそなえた機械翻訳装置を実現
することにあり、そのため、既存の構文規則を特
定的に適用したときに正しい翻訳結果が得られた
回数が、予め定められた回数を超えたとき、その
構文要素の配列と変換結果との組み合わせを、新
しい構文規則として認識し、構文規則の集合に加
えるようにして、上記目的を達成するものであ
る。
そしてそれによる本発明の構成は、構文処理方
式の機械翻訳装置において、入力文の構文要素配
列とその正答となつた変換結果と正答回数とを記
憶する手段と、機械翻訳処理が行なわれる際にそ
の処理結果にしたがつて上記記憶手段の内容を更
新し、正答回数が予め設定されている規定回数を
超えたとき、当該構文要素配列および変換結果の
組み合わせを新たな構文規則として登録する手段
とをそなえていることを特徴としている。
式の機械翻訳装置において、入力文の構文要素配
列とその正答となつた変換結果と正答回数とを記
憶する手段と、機械翻訳処理が行なわれる際にそ
の処理結果にしたがつて上記記憶手段の内容を更
新し、正答回数が予め設定されている規定回数を
超えたとき、当該構文要素配列および変換結果の
組み合わせを新たな構文規則として登録する手段
とをそなえていることを特徴としている。
以下に、本発明の詳細を実施例にしたがつて説
明する。
明する。
図は、本発明の1実施例の構成図である。図
中、1は入力構文処理バツフア、2は機械翻訳
部、3は構文規則フアル、4は初期入力構文記憶
部、5は構文規則生成部を示す。
中、1は入力構文処理バツフア、2は機械翻訳
部、3は構文規則フアル、4は初期入力構文記憶
部、5は構文規則生成部を示す。
はじめに、基本的な機械翻訳処理の機能につい
て説明する。
て説明する。
入力構文処理バツフア1には、入力文の構文要
素が順次書き込まれ、その後、機械翻訳部2によ
り構文処理される。1例として、入力文が、 機械/名詞(N) 翻訳/名詞(N) 装置/名詞(N
) であつたものとする。ここで入力構文要素配列を
N+N+Nと表わす。
素が順次書き込まれ、その後、機械翻訳部2によ
り構文処理される。1例として、入力文が、 機械/名詞(N) 翻訳/名詞(N) 装置/名詞(N
) であつたものとする。ここで入力構文要素配列を
N+N+Nと表わす。
構文規則フアイル3には、既に構文規則名詞
(N)+名詞(N)→名詞(N) が存在しているが、N+N+N→Nの構文規則は
存在していないものとする。機械翻訳部2は、こ
の構文規則をバツフア1の入力構文に適用す
る。
(N)+名詞(N)→名詞(N) が存在しているが、N+N+N→Nの構文規則は
存在していないものとする。機械翻訳部2は、こ
の構文規則をバツフア1の入力構文に適用す
る。
(1) N+N+Nの最初の2つの項N+Nに構文規
則を適用し、N+N+NをN+Nに変換する。
則を適用し、N+N+NをN+Nに変換する。
(2) (1)の結果N+Nに再び構文規則を適用し、
N+NをNに変換する。
N+NをNに変換する。
そして、ここで得られたN+N+N→Nの構文
変換すなわち〔機械+翻訳+装置→名詞〕は正答
であると判定まれたものとする。
変換すなわち〔機械+翻訳+装置→名詞〕は正答
であると判定まれたものとする。
次に、本発明にもとづく、構文規則生成処理の
機能について説明する。
機能について説明する。
初期入力構文記憶部4には、構文処理時に、構
文規則に一致しない入力構文の初期要素配列が、
バツフア1から読み込まれる。記憶部4は、入力
構文要素配列、変換結果、正答回数の3つの項目
欄によつて構成されている。
文規則に一致しない入力構文の初期要素配列が、
バツフア1から読み込まれる。記憶部4は、入力
構文要素配列、変換結果、正答回数の3つの項目
欄によつて構成されている。
構文規則生成部5は、初期入力構文記憶部4を
管理し、既存の構文規則に直接一致しない入力構
文変換例であつて、かつ出現頻度が高いものを、
新しい構文規則として、構文規則フアイル3に追
加する処理を行なう。入力構文処理バツフアに入
力された構文要素配列が、構文規則フアイル3内
の構文規則に直接一致せず、ある複数の構文規則
適用によつて正しい変換に成功したとき、その変
換結果を初期入力構文記憶部4の対応する構文要
素配列の変換結果欄に、また正答回数を、正答回
数欄で管理する。そして、正答回数iが、規定回
数Iを超えたとき、その変換例を構文規則フイア
ル3に転送し、構文規則として登録する処理を行
なう。
管理し、既存の構文規則に直接一致しない入力構
文変換例であつて、かつ出現頻度が高いものを、
新しい構文規則として、構文規則フアイル3に追
加する処理を行なう。入力構文処理バツフアに入
力された構文要素配列が、構文規則フアイル3内
の構文規則に直接一致せず、ある複数の構文規則
適用によつて正しい変換に成功したとき、その変
換結果を初期入力構文記憶部4の対応する構文要
素配列の変換結果欄に、また正答回数を、正答回
数欄で管理する。そして、正答回数iが、規定回
数Iを超えたとき、その変換例を構文規則フイア
ル3に転送し、構文規則として登録する処理を行
なう。
本例では、N+N+N→Nの変換例が構文規則
として追加される。
として追加される。
このようにして、変換例が一定回数以上累積さ
れたとき、自動的に構文規則化されることができ
る。
れたとき、自動的に構文規則化されることができ
る。
以上のように、本発明によれば、構文要素数が
かなり多くても、また構文がどのように複雑であ
つても、その変換例が安定していて出現頻度が高
ければ、自動的に構文規則化が行なわれるため
に、機械翻訳装置の性能改善結果は大きく、また
従来の構文規則作成処理理に要した作業負担は著
しく軽減される。
かなり多くても、また構文がどのように複雑であ
つても、その変換例が安定していて出現頻度が高
ければ、自動的に構文規則化が行なわれるため
に、機械翻訳装置の性能改善結果は大きく、また
従来の構文規則作成処理理に要した作業負担は著
しく軽減される。
図は、本発明の1実施例装置の構成図である。
図中、1は入力構文バツフア、2は機械翻訳
部、3は構文規則フアイル、4は初期入力構文記
憶部、5は構文規則生成部である。
部、3は構文規則フアイル、4は初期入力構文記
憶部、5は構文規則生成部である。
Claims (1)
- 1 構文処理方式の機械翻訳装置において、入力
文の構文要素配列とその正答となつた変換結果と
正答回数とを記憶する手段と、機械翻訳処理が行
なわれる際にその処理結果にしたがつて上記記憶
手段の内容を更新し、正答回数が予め設定されて
いる規定回数を超えたとき、当該構文要素配列お
よび変換結果の組み合わせを新たな構文規則とし
て登録する手段とをそなえていることを特徴とす
る機械翻訳装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58056711A JPS59183469A (ja) | 1983-03-31 | 1983-03-31 | 機械翻訳装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58056711A JPS59183469A (ja) | 1983-03-31 | 1983-03-31 | 機械翻訳装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS59183469A JPS59183469A (ja) | 1984-10-18 |
| JPH0256702B2 true JPH0256702B2 (ja) | 1990-11-30 |
Family
ID=13035059
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58056711A Granted JPS59183469A (ja) | 1983-03-31 | 1983-03-31 | 機械翻訳装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS59183469A (ja) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS61255468A (ja) * | 1985-05-08 | 1986-11-13 | Toshiba Corp | 機械翻訳処理装置 |
| JPS6231474A (ja) * | 1985-08-01 | 1987-02-10 | Toshiba Corp | 自然言語解析装置 |
| JPH083815B2 (ja) * | 1985-10-25 | 1996-01-17 | 株式会社日立製作所 | 自然言語の共起関係辞書保守方法 |
| JPS62139076A (ja) * | 1985-12-13 | 1987-06-22 | Agency Of Ind Science & Technol | 言語解析方式 |
| JP2588167B2 (ja) * | 1986-01-14 | 1997-03-05 | 株式会社東芝 | 機械翻訳装置 |
| JPH0827797B2 (ja) * | 1986-12-01 | 1996-03-21 | 松下電器産業株式会社 | 構文解析装置 |
| JPH0612537B2 (ja) * | 1987-06-12 | 1994-02-16 | 松下電器産業株式会社 | かな漢字変換装置 |
-
1983
- 1983-03-31 JP JP58056711A patent/JPS59183469A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS59183469A (ja) | 1984-10-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Tomita | An efficient context-free parsing algorithm for natural languages and its applications | |
| JPH0268662A (ja) | 機械翻訳装置 | |
| JPH02281372A (ja) | 機械翻訳装置における挿入副詞句処理方法 | |
| JPH0256702B2 (ja) | ||
| JPS58192173A (ja) | 機械翻訳装置 | |
| JP4295203B2 (ja) | 言語的構造を正規化するためのデータ処理装置 | |
| Kuno | The augmented predictive analyzer for context-free languages—its relative efficiency | |
| JPS63221475A (ja) | 構文解析方法 | |
| JPH02140871A (ja) | 日本語解析装置 | |
| JPH01126767A (ja) | 辞書参照装置 | |
| Heidorn | Natural language projects at IBM research | |
| JPH0244463A (ja) | 機械翻訳システムにおける原文入力方法 | |
| JPS63136265A (ja) | 機械翻訳装置 | |
| JPH02100176A (ja) | 翻訳方式 | |
| Sparrman | A technique for command language syntax analysis | |
| JPH01112368A (ja) | 機械翻訳装置 | |
| JPH05324711A (ja) | 自然言語自動翻訳システム | |
| JPS63198162A (ja) | 文章生成用文脈処理装置 | |
| Plátek et al. | On the Prague Group of Mathematical and Algebraic Linguistics and Its Formal Tools | |
| JPS6324458A (ja) | 自然言語処理装置 | |
| JPH03135666A (ja) | 機械翻訳方式 | |
| JPH0256691B2 (ja) | ||
| Hovy | Session 4: Machine Translation | |
| Page | forward-chaining rule-based system for interpretation and translation into equivalent | |
| JPS62245337A (ja) | プログラム言語処理方式 |