JPH0412871B2 - - Google Patents

Info

Publication number
JPH0412871B2
JPH0412871B2 JP59171754A JP17175484A JPH0412871B2 JP H0412871 B2 JPH0412871 B2 JP H0412871B2 JP 59171754 A JP59171754 A JP 59171754A JP 17175484 A JP17175484 A JP 17175484A JP H0412871 B2 JPH0412871 B2 JP H0412871B2
Authority
JP
Japan
Prior art keywords
word
relationship
words
natural language
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59171754A
Other languages
Japanese (ja)
Other versions
JPS6151270A (en
Inventor
Juji Uchida
Akinari Masuyama
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59171754A priority Critical patent/JPS6151270A/en
Publication of JPS6151270A publication Critical patent/JPS6151270A/en
Publication of JPH0412871B2 publication Critical patent/JPH0412871B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は大量の自然言語文から名詞と動詞との
間の係り受け可能な二語間関係を抽出する二語間
関係抽出方式に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a two-word relationship extraction method for extracting dependent two-word relationships between nouns and verbs from a large amount of natural language sentences.

機械翻訳例えば日英機械翻訳で用いられる実用
性のある翻訳方式には、大別して2つの方式即ち
普遍的意味表現経由方式(ピボツト方式)と言語
間対応変換方式(トランスフア方式)とがある。
これらのいづれの方式においても、その機械翻訳
において、自然言語文の二語間関係を用いること
が必要になる。従つて、機械翻訳装置において
は、自然言語文の二語間関係を予め二語間関係デ
ータベースに登録しておかなければならない。
Practical translation methods used in machine translation, for example, Japanese-English machine translation, can be roughly divided into two methods: the universal meaning expression method (pivot method) and the interlingual correspondence conversion method (transfer method).
In any of these methods, it is necessary to use the relationship between two words in a natural language sentence in the machine translation. Therefore, in a machine translation device, the relationship between two words in a natural language sentence must be registered in a two-word relationship database in advance.

〔従来の技術〕[Conventional technology]

このような二語間関係データベースは国語辞書
やシソーラスのように世の中に存在するものでは
ない一方、そこに登録されるべきデータ量は多量
になるものである。従来この種のデータベース作
成は人手に頼るか、又は自然言語文内の連語を調
べる装置に依存していた。
While such two-word relationship databases do not exist in the world like Japanese dictionaries or thesauruses, the amount of data that must be registered in them is large. Traditionally, creating this type of database has relied on humans or on devices that examine collocations in natural language sentences.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

上述のような自然言語文内の二語間関係をデー
タベースに登録するのに前者に依存する技法によ
り、必要とする大量のデータを得ることはほぼ不
可能であつた。
It has been almost impossible to obtain the required large amount of data using the technique described above that relies on the former for registering the relationships between two words in a natural language sentence in a database.

又、後者による技法では、二語間関係として抽
出されるものであつて最も重要な名詞−動詞の関
係のうち、日本語文にあつては名詞−サ変動詞の
関係を調べることはできるが、名詞−本動詞の関
係が調べられないこと、更には助詞の介在した関
係が調べ得ないという不具合がある。
Furthermore, with the latter technique, it is possible to examine the noun-sa verb relationship in Japanese sentences, which is the most important noun-verb relationship that is extracted as a two-word relationship. -There is a problem that the relationship between main verbs cannot be investigated, and furthermore, the relationship involving particles cannot be investigated.

〔問題点を解決するための手段〕[Means for solving problems]

本発明は上述した問題点を解決し得る二語間関
係抽出方式を提供するもので、その手段は自然言
語文を記憶する自然言語データベースと、該デー
タベースから読み出された自然言語文を単語に分
割する単語分割手段と、単語に分割された文につ
いて文節合成を行ない、その文節から名詞と動詞
との係り受け可能な関係を抽出する二語間関係抽
出手段と、抽出された名詞と動詞との間の係り受
け可能な関係を示す二語間関係データを記憶する
二語間関係データベースとを備えて構成したもの
である。
The present invention provides a two-word relationship extraction method capable of solving the above-mentioned problems, and the method includes a natural language database that stores natural language sentences, and a natural language sentence read from the database that is converted into words. a word division means for dividing a sentence into words; a two-word relationship extraction means for performing clause synthesis on a sentence divided into words; and a two-word relation extraction means for extracting a dependent relationship between a noun and a verb from the clause; and a two-word relationship database that stores two-word relationship data indicating a relationship that can be modified between words.

〔作用〕[Effect]

本発明方式によれば、自然言語文を単語に分割
し、単語に分割された文について文節合成を行な
い、その文節から名詞と動詞との係り受け可能な
関係を抽出するようにしているから、二語間関係
のうちの最も重要な名詞−動詞の係り受け可能な
関係を大量の自然言語文から取得して、これによ
つて名詞−動詞の係り受け可能な関係について客
観的な判断材料を提供し得る。
According to the method of the present invention, a natural language sentence is divided into words, clauses are synthesized for the sentences divided into words, and dependable relationships between nouns and verbs are extracted from the clauses. Obtain the most important noun-verb dependency relationships from a large number of natural language sentences, and use this information to objectively judge the noun-verb dependency relationships. can be provided.

〔実施例〕〔Example〕

以下、第1図乃至第3図を参照しながら本発明
の実施例を説明する。
Embodiments of the present invention will be described below with reference to FIGS. 1 to 3.

第1図は本発明の一実施例を示す。この図にお
いて、1は自然言語文データベース(以下、日本
語文について説明する。)で、2は日本語文を日
本語辞書3を参照しながら単語に分割する単語分
割装置である(この装置は既に本出願人によつて
提案済みのものである)。4は二語間関係抽出装
置であり、この装置は単語に分割された文につい
て文節合成を行ない、その文節から名詞と動詞と
の係り受け可能な関係を抽出するものである。5
は抽出された名詞と動詞との間の係り受け可能な
関係を示す二語間関係データを記憶する二語間関
係データベースである。6は二語間関係データベ
ースに検索処理を行なう検索装置である。
FIG. 1 shows an embodiment of the invention. In this figure, 1 is a natural language sentence database (Japanese sentences will be explained below), and 2 is a word dividing device that divides Japanese sentences into words while referring to a Japanese dictionary 3 (this device is already in production). proposed by the applicant). Reference numeral 4 denotes a two-word relationship extraction device, which performs phrase synthesis on sentences divided into words, and extracts dependable relationships between nouns and verbs from the phrases. 5
is a two-word relationship database that stores two-word relationship data indicating a dependent relationship between extracted nouns and verbs. Reference numeral 6 denotes a search device that performs search processing on the two-word relationship database.

第2図は、二語間関係抽出装置4の細部構成図
である。文節合成装置10と、解析装置11と、
抽出装置12とから成る。文節合成装置10は、
単語分割装置2によつて単語に分割された文内の
付属語を左の自立語に接続させる(接頭語につい
ては右の自立語に接続させる)処理で文節合成を
行なう。解析装置11は、合成された文節に文脈
自由文法(公知のもの)、 動詞句→動詞 …… 動詞句→連用文節、且つ動詞句 …… を適用してその適用がなくなるときまでの解析木
を求める処理を行なう。抽出装置12は、求めら
れた解析木から名詞と動詞との係り受け可能な関
係を示す二語間関係データを抽出出力する。
FIG. 2 is a detailed configuration diagram of the two-word relationship extraction device 4. As shown in FIG. A phrase synthesis device 10, an analysis device 11,
It consists of an extraction device 12. The phrase synthesis device 10 is
Clause synthesis is performed by connecting adjuncts in sentences divided into words by the word dividing device 2 to independent words on the left (or connecting prefixes to independent words on the right). The analysis device 11 applies a context-free grammar (known) to the synthesized phrase, verb phrase → verb...verb phrase → conjunctive clause, and verb phrase... and creates an analysis tree until the application is no longer applied. Perform the desired process. The extraction device 12 extracts and outputs two-word relationship data indicating a dependent relationship between a noun and a verb from the obtained analytic tree.

次に、上述構成の下における二語間関係抽出過
程を説明する。
Next, the process of extracting the relationship between two words under the above configuration will be explained.

説明の都合上、次の日本語文を例にとつて説明
する。
For convenience of explanation, the following Japanese sentence will be used as an example.

(例文)このLSIは10倍以上の実装密度を実現
でき、装置の小型化に寄与している。
(Example) This LSI can achieve more than 10 times the packaging density, contributing to the miniaturization of devices.

この例文が日本語文データベース1から読み出
され、単語分割装置2において、日本語辞書3を
参照しながら次のように単語分割される。
This example sentence is read from the Japanese sentence database 1, and is word-divided by the word division device 2 as follows while referring to the Japanese dictionary 3.

この|LSI|は|、|10|倍|以上|の|実装
|密度|を|実現|でき|、|装置|の|小型化
|に|寄与|し|てい|る|。
This |LSI| can |achieve|achieve |10|times|more than|times the |packaging|packaging|density|and contributes to |the miniaturization|of |devices|.

単語に分割された文が二語間関係抽出装置4に
与えられ、その文節合成装置10において付属語
を左の自立語に接続させる(接頭語については右
の自立語に接続させる)ことで文節合成を行なつ
て次のような文節を得る。
The sentence divided into words is given to the two-word relationship extraction device 4, and the clause synthesis device 10 connects the adjunct to the independent word on the left (the prefix is connected to the independent word on the right) to create a clause. Perform composition to obtain the following clause.

この|LSI|は、|10倍以上の|実装|密度を
|実現でき、|装置の|小型化に|寄与している。
| この文節合成された文が解析装置11へ入力さ
れる。解析装置11の解析は、文節合成された文
に対し、上記文脈自由文法、を文の右から左
へ適用することである。そして、これら文脈自由
文法、を適用できなくなるとき、解析装置1
0による解析処理は終了する。例えば、上記文節
合成された文において、第3図に示すように、
「寄与している。」なる動詞に文脈自由文法を適
用したとき、これを動詞句とする。この動詞句と
「小型化に」なる連用文節とに文脈自由文法を
適用したとき、これら両者は動詞句として取り扱
われて解析木が生成される。この最新に生成され
た解析木における動詞句と、上記文節合成された
文内の次の文節即ち連体文節とは、上記文脈自由
文法を適用しても文脈自由文法を適用し得ないの
で、解析装置による解析処理は終了する。
This |LSI| can achieve |a mounting density |of more than 10 times |and contributes to |the miniaturization of |devices.
| This phrase-synthesized sentence is input to the analysis device 11. | The analysis performed by the analysis device 11 is to apply the above-mentioned context-free grammar to the phrase-synthesized sentence from right to left of the sentence. When these context-free grammars cannot be applied, the analysis device 1
The analysis process using 0 ends. For example, in the clause-synthesized sentence above, as shown in Figure 3,
When context-free grammar is applied to the verb ``contribute.'', this is treated as a verb phrase. When the context-free grammar is applied to this verb phrase and the conjunctive phrase "to miniaturize," both are treated as verb phrases and a parse tree is generated. The verb phrase in this latest generated parse tree and the next clause in the clause-combined sentence, that is, the adjunctive clause, cannot be analyzed using the context-free grammar even if the context-free grammar is applied. The analysis process by the device ends.

このような解析処理により得られた解析木を構
成し、名詞と動詞との係り受け可能な関係を示す
二語間関係データを残す。上記例文では、 小型化に|寄与している。
An analysis tree obtained through such analysis processing is constructed, and two-word relationship data indicating a dependent relationship between a noun and a verb is left. In the example sentence above, it contributes to miniaturization.

を残す。この二語間関係データにおける「小型
化」が名詞であり、「寄与している」が動詞であ
る。
leave. In this two-word relationship data, "miniaturization" is a noun, and "contributing" is a verb.

このようにして得られた二語間関係データの各
データ要素は二語間関係データベース5に所定の
関連付けで読み出し可能に記憶される。上記デー
タ要素は次のように記憶される。
Each data element of the two-word relationship data thus obtained is readably stored in the two-word relationship database 5 in a predetermined association. The above data elements are stored as follows.

(子型化、寄与、に) なお、上記実施例においては、自然言語文を日
本語文について説明したが、自然言語文は他の言
語であつてもよく、その場合にも名詞と動詞との
間の二語間関係が求められる。
(Naturalization, contribution, etc.) In the above example, the natural language sentence was explained as a Japanese sentence, but the natural language sentence may be in another language, and in that case, the combination of a noun and a verb is also possible. The relationship between two words is required.

〔発明の効果〕〔Effect of the invention〕

以上説明したように本発明によれば、 二語間関係のうちの最も重要な名詞と動詞と
の係り受け可能な関係を大量の自然言語文から
処理取得し得、 従来、人の感覚で行なつていた動詞の格セツ
トを客観的に行ない得る、等の効果が得られ
る。
As explained above, according to the present invention, it is possible to process and acquire the most important two-word relationship, the relationship between a noun and a verb, which can be dependent on a large number of natural language sentences. Effects such as being able to objectively set the case of familiar verbs can be obtained.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例を示す図、第2図は
二語間関係抽出装置の詳細図、第3図は解析木の
例を示す図である。 図において、1は自然言語文データベース、2
は単語分割装置、3は日本文辞書、4は二語間関
係抽出装置、5は二語間関係データベースであ
る。
FIG. 1 is a diagram showing an embodiment of the present invention, FIG. 2 is a detailed diagram of a two-word relationship extraction device, and FIG. 3 is a diagram showing an example of an analytic tree. In the figure, 1 is a natural language sentence database, 2
3 is a word segmentation device, 3 is a Japanese sentence dictionary, 4 is a two-word relationship extraction device, and 5 is a two-word relationship database.

Claims (1)

【特許請求の範囲】[Claims] 1 自然言語文を記憶する自然言語データベース
と、該データベースから読み出された自然言語文
を単語に分割する単語分割手段と、単語に分割さ
れた文について文節合成を行ない、その文節から
名詞と動詞との係り受け可能な関係を抽出する二
語間関係抽出手段と、抽出された名詞と動詞との
間の係り受け可能な関係を示す二語間関係データ
を記憶する二語間関係データベースとを備えて構
成したことを特徴とする二語間関係抽出方式。
1. A natural language database that stores natural language sentences; a word dividing means that divides the natural language sentences read from the database into words; and a phrase synthesis unit that performs phrase synthesis on the sentences that have been divided into words, and extracts nouns and verbs from the phrases. and a two-word relationship database that stores two-word relationship data indicating a dependent relationship between the extracted noun and the verb. A method for extracting relationships between two words, which is characterized by being constructed in advance.
JP59171754A 1984-08-18 1984-08-18 Inter-language relation extracting system Granted JPS6151270A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59171754A JPS6151270A (en) 1984-08-18 1984-08-18 Inter-language relation extracting system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59171754A JPS6151270A (en) 1984-08-18 1984-08-18 Inter-language relation extracting system

Publications (2)

Publication Number Publication Date
JPS6151270A JPS6151270A (en) 1986-03-13
JPH0412871B2 true JPH0412871B2 (en) 1992-03-05

Family

ID=15929065

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59171754A Granted JPS6151270A (en) 1984-08-18 1984-08-18 Inter-language relation extracting system

Country Status (1)

Country Link
JP (1) JPS6151270A (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0612537B2 (en) * 1987-06-12 1994-02-16 松下電器産業株式会社 Kana-Kanji converter

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS584481A (en) * 1981-06-30 1983-01-11 Fujitsu Ltd Japanese word analyzing system
JPS5957373A (en) * 1982-09-27 1984-04-02 Fujitsu Ltd Index preparation system

Also Published As

Publication number Publication date
JPS6151270A (en) 1986-03-13

Similar Documents

Publication Publication Date Title
KR100453227B1 (en) Similar sentence retrieval method for translation aid
JPH02165378A (en) Machine translation system
JPH0412871B2 (en)
JP2536633B2 (en) Compound word extraction device
JPS59140582A (en) Natural language translation assisting system
KR940022311A (en) Machine Translation Device and Method
JP3258079B2 (en) Compound word dictionary registration device
JP2812511B2 (en) Keyword extraction device
JPH0157826B2 (en)
JPS63221475A (en) Parsing method
Hurskainen Information retrieval and two-directional word formation
JP2742059B2 (en) Dictionary editor for translation
JPS6170663A (en) Address translating device
Aref et al. English to Arabic machine translation: a critical review and suggestions for development
JPS63168774A (en) Subject supplementing system for mechanical translation system
JPH02156376A (en) Machine translating method
JPS61115172A (en) Machine language-translation system
JPH09281993A (en) Phonetic symbol generator
JPS62263568A (en) Word processor
JP3873653B2 (en) Dictionary creating method and apparatus, dictionary creating program, and storage medium storing dictionary creating program
JPH10105552A (en) Machine translation system
JPS61134877A (en) Unregistered word attribute estimating device
JPH0512753B2 (en)
JPH01219946A (en) Document generation supporting device
JPH02150963A (en) English-Japanese machine translation device