JPH04112366A - Natural language sentence analysis device - Google Patents

Natural language sentence analysis device

Info

Publication number
JPH04112366A
JPH04112366A JP2233647A JP23364790A JPH04112366A JP H04112366 A JPH04112366 A JP H04112366A JP 2233647 A JP2233647 A JP 2233647A JP 23364790 A JP23364790 A JP 23364790A JP H04112366 A JPH04112366 A JP H04112366A
Authority
JP
Japan
Prior art keywords
section
analysis processing
analysis
morphological analysis
natural language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2233647A
Other languages
Japanese (ja)
Inventor
Makoto Ishii
信 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2233647A priority Critical patent/JPH04112366A/en
Publication of JPH04112366A publication Critical patent/JPH04112366A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 艮夏分互 本発明は、自然言語文解析装置に関し、より詳細には1
機械翻訳装置など自然言語文を入力とするシステムの実
現において用いられる自然言語文の構文解析装置に関す
る。
[Detailed Description of the Invention] The present invention relates to a natural language sentence analysis device, and more specifically, to a natural language sentence analysis device.
The present invention relates to a natural language sentence parsing device used in realizing a system that takes natural language sentences as input, such as a machine translation device.

災來1生 従来の自然言語文解析装置では、形態素解析処理部と構
文解析処理部は別モジュールとして構成し、その後で組
み合わせて全体を構成するのが通常である。これは形態
素解析処理部は構文解析装置以外にもかな漢字変換装置
などに用いることができるため、ソフトウェアのモジュ
ール性が高く再利用性も高いためである。そのため従来
の形態素解析処理部は文節数最小法や最長一致法といっ
たいくつかの評価基準にしたがって、最も尤もらしい解
を一つ選択して出力としていた。こうした従来技術にお
いて問題となることは、形態素解析処理部における解析
の誤りに対してどう対処するかということである。例え
ば、 (、)彼が修理を行った。
In conventional natural language sentence analysis devices, the morphological analysis processing section and the syntactic analysis processing section are usually constructed as separate modules, and then combined to form the whole. This is because the morphological analysis processing unit can be used not only in a syntactic analysis device but also in a kana-kanji conversion device, etc., so the software has high modularity and high reusability. Therefore, conventional morphological analysis processing units select and output the most likely solution according to several evaluation criteria such as the minimum number of clauses method and the longest match method. The problem with such conventional techniques is how to deal with analysis errors in the morphological analysis processing section. For example, (,) he carried out the repairs.

のような文について考えると、形態素解析処理部が「行
った」を「行<」(音便形)+「た」と形態素分割して
しまうといくら性能の良い構文解析処理部によっても解
析は失敗することになる。この例の場合は形態素解析レ
ベルでは本質的に多義なのであり、「行く+た」と「行
う+た」の二つの解を出し、構文解析処理部あるいは解
析結果評両部によっていずれかが選択されるべきなので
ある。
Considering a sentence like , if the morphological analysis processing unit splits ``gone'' into morphemes ``line <'' (online form) + ``ta'', no matter how high-performance the syntactic analysis processing unit is, it will not be able to parse it. You will fail. In this example, it is essentially ambiguous at the morphological analysis level, so two solutions are produced, ``go + ta'' and ``do + ta'', and either one is selected by the syntactic analysis processing section or the analysis result evaluation section. It should be done.

以上の問題点を解決する従来技術としてパックトランク
による方法である。ハックトラック法によると、構文解
析処理部は解析失敗の際には形態素解析処理部に第2解
、すなわち次に尤もらしい解の出力を要求する。上記の
(a)の例文の場合では、構文解析処理の時点で「行く
」は「を格」をとらないので解析失敗となり、構文解析
処理部は形態素解析処理部に第2解の出力を要求する。
A conventional technique for solving the above problems is a method using a pack trunk. According to the hack track method, when the parsing process fails, the parsing unit requests the morphological analysis unit to output the second solution, that is, the next most likely solution. In the case of example sentence (a) above, at the time of syntactic analysis processing, "go" does not take a case, so the parsing fails, and the syntactic analysis processing section requests the output of the second solution from the morphological analysis processing section. do.

その結果、第2解である「行う+だ」が出力されて最終
的に正解を得ることができる。
As a result, the second answer, "Ido+da" is output, and the correct answer can finally be obtained.

しかし、バックトラック法は深さ優先の解析法であるの
で、真の正解ではない解で不正解ではないようなものが
先に見つかった場合に、正解を落としてしまう可能性が
大きい。例えば、(b)建築は昨年4月に行った。
However, since the backtrack method is a depth-first analysis method, if an answer that is not truly correct but not incorrect is found first, there is a high possibility that the correct answer will be dropped. For example, (b) The construction work was done in April last year.

のような文については「行った」を「行く+た」と分割
してしまって、「建築」が「行く」の主語となるような
おかしな解が残りがねない問題点があった。
There was a problem with sentences such as ``I went'' which was split into ``Go + ta'', leaving a strange solution where ``Architecture'' was the subject of ``Go''.

上記の問題点を解決しようとする従来技術には、例えば
、「対話翻訳の一方式についてJ、(青山昇−1石用他
、電子情報通信学会技術研究報告、NLC90−14,
1990)がある。この技術は形態素解析処理部におけ
る多義をユーザとの対話によって解消しようというもの
である。しかしこの従来技術によると例えば、 (e)私は彼がくるまで待つ。
Conventional techniques that attempt to solve the above problems include, for example, "On a Method of Dialogue Translation, J.
1990). This technology attempts to eliminate ambiguity in the morphological analysis processing unit through dialogue with the user. However, according to this prior art, for example: (e) I will wait until he comes.

のような文についてもrくる十までJ (来るまで)か
「くるま十で」 (車で)かユーザに問い合わせてくる
。形態素解析処理部におけるこの多義は構文解析処理部
における知識、すなわちr車で」とすると「待つ」の主
語が二つのなっておかしいという知識を用いれば「くる
十まで」と−意に決定できる。上記の従来技術ではこう
した場合もユーザに問い合わせることになり、無1駄な
問い合わせをすることが多くなるという問題点があった
For sentences like ``rurujuku de'' (to come) or ``kurumajude'' (by car), the user is asked. This ambiguity in the morphological analysis processing unit can be determined arbitrarily by using the knowledge in the syntactic analysis processing unit, ie, the knowledge that the subject of ``wait'' would be two if it were ``r car''. The above-mentioned conventional technology has the problem that inquiries are made to the user even in such cases, and the inquiries are often made in vain.

1−一敗 本発明は、上述のごとき実情に鑑みてなされたもので、
形態素解析処理時における多義を一つに絞らず、構文解
析処理及びその後処理である解の選択処理の時点で一つ
に絞ることにより、入力文について最も尤もらしい構文
解析結果を得るように構成した自然言語文解析装置を提
供することを目的としてなされたものである。
1-1 Loss The present invention was made in view of the above-mentioned circumstances.
The system is configured to obtain the most likely syntactic analysis result for the input sentence by not narrowing down the multiple meanings to one during the morphological analysis process, but narrowing them down to one during the syntactic analysis process and the subsequent solution selection process. The purpose was to provide a natural language sentence analysis device.

盪−一双 本発明は、上記目的を達成するために、自然言語文を入
力する入力部と、該入力部からの入力文を形態素分割す
る形態素解析処理部と、該形態素解析処理部の出力を用
いて構文解析木を構成する構文解析処理部と、該構文解
析木の適合性を計算し、入力文について最も尤もらしい
構文解析木を選択する解析結果評価部からなり、前記形
態素解析処理部は複数の解析結果を出力することを特徴
としたものである。以下、本発明の実施例に基づいて説
明する。
(ii) In order to achieve the above object, the present invention includes an input section for inputting a natural language sentence, a morphological analysis processing section for dividing the input sentence from the input section into morphemes, and an output from the morphological analysis processing section. the morphological analysis processing section comprises a parsing processing section that constructs a parsing tree using the parsing process, and an analysis result evaluation section that calculates the suitability of the parsing tree and selects the most likely parsing tree for the input sentence. It is characterized by outputting multiple analysis results. Hereinafter, the present invention will be explained based on examples.

第1図は、本発明による自然言語文解析装置の一実施例
を説明するための構成図で、図中、1は入力部、2は表
示部、3は処理部、4は辞書部。
FIG. 1 is a block diagram for explaining an embodiment of a natural language sentence analysis device according to the present invention. In the figure, 1 is an input section, 2 is a display section, 3 is a processing section, and 4 is a dictionary section.

5は形態素解析処理部、6は構文解析処理部、7は解析
結果評価部、8は語當辞書部、9は構文規則部、10は
制約部である。
5 is a morphological analysis processing section, 6 is a syntactic analysis processing section, 7 is an analysis result evaluation section, 8 is a word/dictionary section, 9 is a syntax rule section, and 10 is a constraint section.

処理部3は形態素解析処理部5、構文解析処理部6、解
析結果評価部7とからなる。また辞書部4は語常辞書部
8、構文規則部9.制約部10とからなる。語禦辞書部
の例を語党辞書D、構文規則部の例を構文規則R1制約
部の例を制約Cに示す。
The processing section 3 includes a morphological analysis processing section 5, a syntactic analysis processing section 6, and an analysis result evaluation section 7. Further, the dictionary section 4 includes a common word dictionary section 8, a syntax rule section 9. It consists of a constraint section 10. An example of a word dictionary section is shown as a word dictionary D, an example of a syntax rule section is shown as a syntax rule R1, and an example of a constraint section is shown as a constraint C.

自然言語文を入力する入力部1からの入力文を形態素解
析処理部5で形態素分割し、該形態素解析処理部5の出
力を用いて構文解析処理部6により構文解析木を構成す
る。解析結果評価部7においては、前記構文解析木の適
合性を計算し、入力文について最も尤もらしい構文解析
木を選択し、前記形態素解析処理部5は複数の解析結果
を出力する。
An input sentence from an input unit 1 that inputs a natural language sentence is divided into morphemes by a morphological analysis processing unit 5, and a syntactic analysis tree is constructed by a syntactic analysis processing unit 6 using the output of the morphological analysis processing unit 5. The analysis result evaluation unit 7 calculates the suitability of the syntactic analysis tree and selects the most likely syntactic analysis tree for the input sentence, and the morphological analysis processing unit 5 outputs a plurality of analysis results.

第2図(a)は1語堂辞書りを示すもので、語常辞書り
の各要素は、見出し語、語禦範躊名(品詞)、素性で表
現される。素性は(素性名、素性値)の形のリストであ
る。ここで素性とは諸量の持つ性質を抽出したものであ
る。nは名詞、pは助詞、■は動詞、sjは接続助詞を
各々示す。
Figure 2 (a) shows a 1-word dictionary.Each element of the common word dictionary is expressed by a headword, a word name (part of speech), and a feature. A feature is a list of the form (feature name, feature value). Here, features are extracted properties of various quantities. n indicates a noun, p indicates a particle, ■ indicates a verb, and sj indicates a conjunctive particle.

第2図(b)は、構文規則Rを示すもので、構文規則R
は公知の句構造文法の表記法を拡張したラベル付きの句
構造文法で記述されている。右辺の各要素はラベル付の
非終端記号かラベルなしの非終端記号である。R1中の
(N P ; topic)の場合、NPは非終端記号
でラベルtopicが付加されている。また右辺の非終
端記号で小文字の英字は前終端記号(諸量範11i) 
、大文字の英字は前終端記号以外の非終端記号である。
FIG. 2(b) shows the syntax rule R.
is written using a phrase structure grammar with labels, which is an extension of the notation of known phrase structure grammars. Each element on the right-hand side is a labeled or unlabeled nonterminal. In the case of (N P ; topic) in R1, NP is a non-terminal symbol and the label topic is added. Also, the lowercase alphabetic letters in the non-terminal symbols on the right side are pre-terminal symbols (various quantity range 11i)
, uppercase alphabetic characters are nonterminal symbols other than preterminal symbols.

また構文規則中のラベルは機能名を表す。ここで機能名
とは公知の語堂機能文法での用法と同様である。すなわ
ちR1の記述は諸量機能文法における以下のRIOと同
じである。
Also, the labels in the syntax rules represent function names. Here, the term "function name" is used in the same manner as in the known word hall functional grammar. That is, the description of R1 is the same as the following RIO in the function grammar.

RIOVP  −>  NP     VP↓=↑to
pic  ↓:↑ 第2図(c)は、制約Cを示すもので、制約Cの各要素
は機能名とペナルティ付きのプロダクションルールであ
る。表記法は、 (機能名:ペナルティ) 制約規則 の形式である。ここでペナルティは各制約の持つ文法的
強さを表す数値であり、その値か大きいほどその制約が
文法的に強い、すなわち例外が少ないことを意味する。
RIOVP −> NP VP↓=↑to
pic ↓:↑ Figure 2 (c) shows constraint C, and each element of constraint C is a production rule with a function name and a penalty. The notation is (Function name: Penalty) in the form of a constraint rule. Here, the penalty is a numerical value representing the grammatical strength of each constraint, and the larger the value, the stronger the constraint is grammatically, meaning that there are fewer exceptions.

各々の制約規則は機能構造中の情報、とくに素性を参照
している。ここで機能構造とは公知の諸量機能文法での
用法と同様であり、機能名を属性名、機能構造を属性値
とする再帰的なマトリクスである。第5図に機能構造の
例を示す。
Each constraint rule refers to information in the functional structure, especially features. Here, the term "functional structure" is used in the same manner as in the known functional grammar, and is a recursive matrix in which the functional name is the attribute name and the functional structure is the attribute value. FIG. 5 shows an example of the functional structure.

第3図は、本発明による自然言語文解析装置の処理部の
フローチャートである。以下、各ステップに従って順に
説明する。
FIG. 3 is a flowchart of the processing section of the natural language sentence analysis device according to the present invention. Below, each step will be explained in order.

旦■13人力部からユーザは文の入力を行なう。13 The user inputs sentences from the human resources department.

入力部はキーボード装置やあるいは音声入力装置などで
ある。入力部からの入力文が前述の(e)であったとす
る。
The input unit is a keyboard device, a voice input device, or the like. Assume that the input sentence from the input section is the above-mentioned (e).

(e)私は彼がくるまで待つ。(e) I will wait until he comes.

この文の入力を受けた形態素解析処理部は入力文を形態
素分割する。ここで形態素解析処理部の解析結果は多義
もありうるものとする。
The morphological analysis processing unit that receives the input sentence divides the input sentence into morphemes. Here, it is assumed that the analysis result of the morphological analysis processing unit may have ambiguous meanings.

こうした形態素解析処理部の構成は公知の複数解を出力
する形態素解析技術によって実現できる。例えば、文献
としては[接続コスト最小法による形態素解析の提案と
計算量の評価について」 (久光徹、新田義彦、電子情
報通信学会技術研究報告、NLC90−08、1990
)がある。
Such a configuration of the morphological analysis processing section can be realized by a known morphological analysis technique that outputs multiple solutions. For example, the literature is "Proposal of morphological analysis using minimum connection cost method and evaluation of computational complexity" (Toru Hisamitsu, Yoshihiko Nitta, Institute of Electronics, Information and Communication Engineers Technical Research Report, NLC90-08, 1990
).

例文(e)については、 (el)   (私:n)(は:p)(彼:n)(が:
P)(くる:V)(まで:5j)(待つ:V)(e2)
   (私:n)(は:p)(彼:n)(が:p)(く
るま二〇)(で:P)(待っ:v)の二つの解が出力さ
れる。ここで各形態素は(見出し語二語業範III)の
形式で表現されている。語業範鴫とは、いわゆる品詞で
あり、構文規則Rにおいては小文字の英数字で表現され
ている。
For example sentence (e), (el) (I: n) (Ha: p) (He: n) (Ga:
P) (Come: V) (Until: 5j) (Wait: V) (e2)
Two solutions are output: (I: n) (Ha: p) (He: n) (Ga: p) (Car 20) (De: P) (Wait: v). Here, each morpheme is expressed in the form (headword bilingual category III). A language category is a so-called part of speech, and in syntactic rule R, it is expressed by lowercase alphanumeric characters.

扛虻I;形態素解析列が残っているかどうが判断する。扛虻I: It is determined whether the morphological analysis sequence remains.

残っていなければ後述する5tep 4へ行く。If there are none left, go to step 4, which will be described later.

% ;前記5tep 2において、形態素解析列が残っ
ていれば、構文解析木を作成する。すなわち、次に形態
素解析処理部の出力である形態素の列に対して、構文解
析処理部は構文規則部の情報を用いて構文解析木を構成
する。ここで構文解析木は、公知の諸量機能文法での構
成素構造と同様の構造であり、第4図に示すようなラベ
ル付きの木構造である。木構造に付いているラベルは機
能名を表し、構文規則中に記述されているラベルを構文
規則の適用時に参照することにより得ることができる。
%; If a morphological analysis sequence remains in step 2, a syntactic analysis tree is created. That is, next, for the string of morphemes that is the output of the morphological analysis processing section, the syntactic analysis processing section constructs a syntactic analysis tree using the information of the syntax rule section. Here, the parse tree has a structure similar to the constituent structure in the known quantitative functional grammar, and is a labeled tree structure as shown in FIG. Labels attached to the tree structure represent function names, and can be obtained by referring to the labels described in the syntax rules when applying the syntax rules.

形態素の列から構成素構造を作成する処理については、
多くの手法が提案されていて公知であるが、ここではボ
トムアップにCKY(Cocke−Kasan+i−Y
ounger )法により構成する。
Regarding the process of creating a constituent structure from a sequence of morphemes,
Many methods have been proposed and are known, but here we will use CKY (Cocke-Kasan+i-Y) from the bottom up.
Constructed using the ``Ounger'' method.

一つの形態素列から構成素構造を作成する際に、処理す
べ、き形態素がなくなった時点で最終状態に達した構成
素構造は全て可能な解であり、これに加えて構成素構造
の作成のための入力となる形態素列が複数でありうるた
め、5tep 3の出力は一般に複数解がある。ここで
When creating a constituent structure from a single morpheme sequence, the constituent structures that reach the final state when there are no more morphemes to process are all possible solutions. Since there can be multiple morpheme sequences as input for , the output of 5tep 3 generally has multiple solutions. here.

最終状態に達したかどうかは構文規則Rを用いる場合、
文全体に対して作られた構成素構造のルートノートが非
終端記号Sであるかどうかで判断される。(el)の形
態素列から作成された構成素構造の一つ(C3)を第4
図に示す。
To determine whether the final state has been reached, use the syntax rule R:
It is determined whether the root note of the constituent structure created for the entire sentence is a non-terminal symbol S. One of the constituent structures (C3) created from the morpheme sequence of (el) is
As shown in the figure.

ジM;次に、構文解析木が残っているかどうか判断する
。残っていなければ後述する5tep 7八行く、 旦肛二;前記5tep 4において、構文解析木が残っ
ていれば機能構造を作成する。なお、以下に説明する処
理は解析結果評価部の処理の一例である。
Next, it is determined whether or not a parse tree remains. If no parse tree remains, proceed to step 5, which will be described later. Note that the process described below is an example of the process of the analysis result evaluation section.

前記5tep 3で得られた複数個の構成素構造の各々
から機能構造を作成する。この処理は公知の諸量機能文
法における構成素構造から機能構造を作成する処理にし
たがっても良いし、構成素構造でラベルのない子ノード
にっいては主要語としてエントリ部にブツシュし、ラベ
ル付きの子ノートについてはそのラベルを属性名とし、
子ノードについての機能構造を属性値とするように再帰
的に機能構造を作成しても良い。第4図に示す構成素構
造(C3)から作成された機能構造(C4)を第5図に
示す。また5tep 5では辞書部からの情報をも用い
るが、これは諸量辞書りにおける素性の部分である。
A functional structure is created from each of the plurality of component structures obtained in Step 3 above. This process may follow the process of creating a functional structure from a constituent structure in a well-known quantitative functional grammar, or if a child node in a constituent structure has no label, it is written as a main word in the entry section and labeled. For child notes, use the label as the attribute name,
The functional structure may be created recursively so that the functional structure of the child node is used as the attribute value. FIG. 5 shows a functional structure (C4) created from the component structure (C3) shown in FIG. 4. Further, in step 5, information from the dictionary section is also used, but this is the feature section in the various quantity dictionary.

社肛旦;構成素構造と機能構造は一対一で対応するので
、前記5tep 5の出力における機能構造は一般に複
数解がある。その各々の機能構造について制約部からの
情報を用いながら制約の適用を行なう。ここで各制約は
機能名(機能構造の属性名)ごとに参照できるようにな
っているので、機能構造の再帰的構造について再帰的に
適用を行なうことができる。例えば第5図に示す機能構
造(C4)については以下のようになる。文節「彼が」
に相当する機能名は5ubj機能であるので、5ubj
機能で標識されている制約を全て抽出して順に適用を行
なう。制約Cの場合はCo、C1,C2の適用を行なう
。この場合は自分の格マーカー素性の値は「が」であり
、親の機能構造は主要語が「くる・までJで、5ubj
機能は「くる」によって下位範喀化されていて、かつ5
ubj機能は親の機能構造中で唯一であるのでいずれも
満たされている。次にrenyo機能であるが標識され
ている制約がCにないので何もしない。最後にtopi
c機能であるが、自分の格マーカー素性の値は「は」で
あり、親の機能構造は主要語が「待つ」で、空の5ub
j機能を持っている。すなわち「待っ」は5ubj機能
を下位範略化しているがこの機能構造中には5ubj機
能はない。したがって満たされている。また親の機能構
造中でtopic機能は唯一である。
Since there is a one-to-one correspondence between constituent structure and functional structure, the functional structure in the output of step 5 generally has multiple solutions. Constraints are applied to each functional structure using information from the constraint section. Here, since each constraint can be referenced by function name (attribute name of the functional structure), it is possible to recursively apply the recursive structure of the functional structure. For example, the functional structure (C4) shown in FIG. 5 is as follows. Clause ``he''
The function name corresponding to is 5ubj function, so 5ubj
Extract all the constraints labeled by the function and apply them in order. In the case of constraint C, Co, C1, and C2 are applied. In this case, the value of one's case marker feature is "ga", and the parent's functional structure has a main word of "kuru/ma J, 5ubj".
Functions are subcategorized by “kuru” and 5
Since the ubj function is the only one in the parent functional structure, both are satisfied. Next is the renyo function, but since there is no labeled constraint in C, it does nothing. Finally, topi
c function, but the value of its case marker feature is "wa", the main word of the parent's functional structure is "wait", and the empty 5ub
j function. In other words, "waiting" is a subcategory of the 5ubj function, but there is no 5ubj function in this functional structure. Therefore it is fulfilled. Also, the topic function is the only one in the parent functional structure.

以上のいずれかの制約が満されていない場合、対応する
ペナルティが加算される。
If any of the above constraints are not met, the corresponding penalty will be added.

以上の5tep5 、5tep6の処理は各構成素構造
についてそれぞれ行なわれる。第6図に示すような、形
態素列(C2)対応する機能構造(C5)については制
約C2が満たされていないのでペナルティは30になる
The above processing in steps 5 and 5 is performed for each component structure. As shown in FIG. 6, for the functional structure (C5) corresponding to the morpheme sequence (C2), the penalty is 30 because the constraint C2 is not satisfied.

1肛ユ;以上のような5tep5 、5tep6で各構
成素構造について計算されたペナルティをもとに、ペナ
ルティ最小の機能構造に対応する構成素構造を選択する
。この場合は(C3)を選択してこれを構文解析装置の
出力とする。
1. Based on the penalty calculated for each constituent structure in steps 5 and 5 as described above, a constituent structure corresponding to the functional structure with the minimum penalty is selected. In this case, select (C3) and use it as the output of the parser.

このようにして、形態素解析処理時における多義を一つ
に絞らず、構文解析処理及びその後処理である解の選択
処理の時点で一つの絞ることにより、入力文について最
も尤もらしい構文解析結果を得ることができる。
In this way, the most likely syntactic analysis result for the input sentence can be obtained by narrowing down the multiple meanings to one at the time of the syntactic analysis process and the solution selection process that is the subsequent process, instead of narrowing down the multiple meanings to one during the morphological analysis process. be able to.

夏−一来 以上の説明から明らかなように、本発明によると、形態
素分割時における多義を、形態素分割時に一つに絞り込
むことをせずに、構文解析処理を行なった上で選択する
ことができる。そのため形態素解析処理部での解析失敗
のために構文解析処理部が解析失敗する可能性が高くな
るという問題点を解決することができる。また形態素解
析処理時には多義であっても構文解析処理時によって解
消できる多義である場合には、ユーザへの問い合わせや
談話解析など他の情報源からの情報をもとに多義を解消
するシステムを考える上でも無、駄を防ぐことができる
。すなわち従来のように形態素解析と構文解析を別々の
ものとして捉えず、多義についても両者を総合して考慮
することができるという効果がある。
As is clear from the above explanation, according to the present invention, multiple meanings at the time of morpheme division can be selected after performing syntactic analysis processing without narrowing down to one at the time of morpheme division. can. Therefore, it is possible to solve the problem that the syntactic analysis processing section is more likely to fail in analysis due to an analysis failure in the morphological analysis processing section. In addition, if the ambiguity is resolved during the morphological analysis process but can be resolved during the syntactic analysis process, consider a system that resolves the ambiguity based on information from other information sources such as user inquiries and discourse analysis. Even above, you can prevent waste. In other words, instead of considering morphological analysis and syntactic analysis as separate things as in the past, there is an effect that polysemy can be considered as a whole.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は、本発明による自然言語文解析装置の一実施例
を説明するための構成図、第2図は、語粂辞書、構文規
則、制約を示す図、第3図は、本発明による自然言語文
解析装置の処理部のフローチャート、第4図は、構成素
構造を示す図、第5図及び第6図は、機能構造を示す図
である。 1・・・入力部、2・・・表示部、3・・・処理部、4
・・・辞書部、5・・・形態素解析処理部、6・・構文
解析処理部、7・・解析結果評価部、8・・・諸量辞書
部、9・・・構文規則部、10・・・制約部。 第 図 (a) (b) (c)
FIG. 1 is a block diagram for explaining an embodiment of a natural language sentence analysis device according to the present invention, FIG. 2 is a diagram showing a word dictionary, syntax rules, and constraints, and FIG. 3 is a diagram for explaining an embodiment of a natural language sentence analysis device according to the present invention. FIG. 4 is a flowchart of the processing unit of the natural language sentence analysis device, FIG. 4 is a diagram showing the constituent structure, and FIGS. 5 and 6 are diagrams showing the functional structure. 1... Input section, 2... Display section, 3... Processing section, 4
... Dictionary part, 5... Morphological analysis processing part, 6... Syntactic analysis processing part, 7... Analysis result evaluation part, 8... Various quantity dictionary part, 9... Syntactic rule part, 10. ...Restriction part. Figures (a) (b) (c)

Claims (1)

【特許請求の範囲】[Claims] 1、自然言語文を入力する入力部と、該入力部からの入
力文を形態素分割する形態素解析処理部と、該形態素解
析処理部の出力を用いて構文解析木を構成する構文解析
処理部と、該構文解析木の適合性を計算し、入力文につ
いて最も尤もらしい構文解析木を選択する解析結果評価
部からなり、前記形態素解析処理部は複数の解析結果を
出力することを特徴とする自然言語文解析装置。
1. An input section that inputs a natural language sentence, a morphological analysis processing section that divides the input sentence from the input section into morphemes, and a syntax analysis processing section that constructs a parse tree using the output of the morphological analysis processing section. , an analysis result evaluation unit that calculates the suitability of the parse tree and selects the most likely parse tree for the input sentence, and the morphological analysis processing unit outputs a plurality of analysis results. Language sentence analysis device.
JP2233647A 1990-09-03 1990-09-03 Natural language sentence analysis device Pending JPH04112366A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2233647A JPH04112366A (en) 1990-09-03 1990-09-03 Natural language sentence analysis device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2233647A JPH04112366A (en) 1990-09-03 1990-09-03 Natural language sentence analysis device

Publications (1)

Publication Number Publication Date
JPH04112366A true JPH04112366A (en) 1992-04-14

Family

ID=16958322

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2233647A Pending JPH04112366A (en) 1990-09-03 1990-09-03 Natural language sentence analysis device

Country Status (1)

Country Link
JP (1) JPH04112366A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5495413A (en) * 1992-09-25 1996-02-27 Sharp Kabushiki Kaisha Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes
US5864788A (en) * 1992-09-25 1999-01-26 Sharp Kabushiki Kaisha Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5495413A (en) * 1992-09-25 1996-02-27 Sharp Kabushiki Kaisha Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes
US5864788A (en) * 1992-09-25 1999-01-26 Sharp Kabushiki Kaisha Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes

Similar Documents

Publication Publication Date Title
Silberztein Formalizing natural languages: The NooJ approach
US5848385A (en) Machine translation system using well formed substructures
US20110010163A1 (en) Method, device, computer program and computer program product for processing linguistic data in accordance with a formalized natural language
Schwind Error analysis and explanation in knowledge based language tutoring
Vasiu et al. Enhancing tokenization by embedding Romanian language specific morphology
Jha et al. Inflectional morphology analyzer for Sanskrit
Seresangtakul et al. Thai-Isarn dialect parallel corpus construction for machine translation
Wang et al. Evaluation of spoken language grammar learning in the ATIS domain
JPH04112366A (en) Natural language sentence analysis device
Al-Daoud et al. A framework to automate the parsing of Arabic language sentences.
Ehsan et al. Statistical Parser for Urdu
Cristea An incremental discourse parser architecture
Carter Lattice-based word identification in CLARE
Uchida Atlas
Galicia-Haro Using electronic texts for an annotated corpus building
JP3892227B2 (en) Machine translation system
JPS62267872A (en) Language analyzing device
JPH03296860A (en) Natural language sentence analysis device
Bhadra et al. Sanskrit analysis system (SAS)
Barker Noun modifier relationship analysis in the TANKA system
Jha Generating nominal inflectional morphology in Sanskrit
Hobbs A metalanguage for expressing grammatical restrictions in nodal spans parsing of natural-language.
Srinivas et al. Exploiting supertag representation for fast coreference resolution
Dash Morphological processing of words in bangla corpus
JPH04283865A (en) Natural language semantic processing method and semantic processing device