JPH08249331A - Document processing device - Google Patents

Document processing device

Info

Publication number
JPH08249331A
JPH08249331A JP7049805A JP4980595A JPH08249331A JP H08249331 A JPH08249331 A JP H08249331A JP 7049805 A JP7049805 A JP 7049805A JP 4980595 A JP4980595 A JP 4980595A JP H08249331 A JPH08249331 A JP H08249331A
Authority
JP
Japan
Prior art keywords
dictionary
phrase
analysis
clause
dictionary storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7049805A
Other languages
Japanese (ja)
Other versions
JP3420369B2 (en
Inventor
Shinji Tokunaga
信治 徳永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP04980595A priority Critical patent/JP3420369B2/en
Publication of JPH08249331A publication Critical patent/JPH08249331A/en
Application granted granted Critical
Publication of JP3420369B2 publication Critical patent/JP3420369B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】構文解析を行い、係り先が一意に決まらない文
節を指摘し、適切な位置への文節の移動、またはコンマ
挿入を行う。また、格パターン辞書を用いて、標準の格
要素の出現順でない文節の指摘を行い、文節の移動を行
うことが可能である。 【構成】形態素解析手段6で形態素解析、構文解析手段
7で構文解析を行い、係り先チェック手段10で係り先
が曖昧であると判断した場合に、文節移動手段9または
コンマ挿入手段11によって曖昧性を減少、解消する。
(57) [Summary] [Purpose] Performs syntactic analysis, points out clauses whose affiliation is not uniquely determined, and moves clauses to appropriate positions or inserts commas. In addition, it is possible to point out a phrase that is not in the standard case element appearance order and move the phrase by using the case pattern dictionary. [Constitution] When the morpheme analysis means 6 performs morpheme analysis and the syntactic analysis means 7 performs syntactic analysis, and when the dependent check means 10 determines that the dependent is ambiguous, the phrase moving means 9 or the comma inserting means 11 makes it ambiguous. Reduce and eliminate sex.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、日本語の校正/推敲を
行う日本語ワードプロセッサ、機械翻訳装置などに関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a Japanese word processor, a machine translation device, etc. for proofreading / revising Japanese.

【0002】[0002]

【従来の技術】従来、日本語校正/推敲を行う文書処理
装置においては、日英機械翻訳装置などでは必ず行われ
る構文解析処理を行うものは少なく、ほとんどが形態素
解析処理のみで、誤りを指摘するものがほとんどであっ
た。
2. Description of the Related Art Conventionally, there are few document processing devices that perform Japanese proofreading / reviewing that perform parsing processing that is always performed by Japanese-English machine translators, etc. Most of them are morphological analysis processing and point out errors. Most did.

【0003】例えば、特開平4-213155に開示されている
発明においては、形態素解析処理を行い、より確からし
い単語の並びが存在する場合に限って誤字候補を出力す
るというものが記されている。単語の品詞その他の情報
から表層の並びの出現確率を定義したコストテーブルを
利用して、単語辞書に登録がなかった未登録語および接
続コストが閾値よりも低い同音語がある場合、つまり文
法的により確からしい単語の並びが存在する場合に限っ
て誤字候補を出力するようにしている。
For example, the invention disclosed in Japanese Patent Laid-Open No. 4-213155 describes that morphological analysis processing is performed and typographical error candidates are output only when a more probable word sequence exists. . If there is an unregistered word that has not been registered in the word dictionary and a homonym whose connection cost is lower than the threshold value, that is, grammatically, by using the cost table that defines the appearance probability of the surface layer from the word part of speech and other information. Therefore, the typographical error candidate is output only when a certain word sequence exists.

【0004】また、特開昭62-150461、特開昭62-150462
には呼応関係を有する副詞と助動詞の組を記憶してお
き、それに該当する組み合わせの表現がない場合に、検
出/修正を行うものである。これによって、呼応関係に
ある語の用法に誤りがある可能性がある部分を検出/修
正することが可能となっている。
Further, JP-A-62-150461 and JP-A-62-150462
A pair of adverbs and auxiliary verbs having a sympathetic relationship is stored in, and detection / correction is performed when there is no corresponding combination expression. This makes it possible to detect / correct a portion that may have an error in the usage of words having a synergistic relationship.

【0005】特開昭62-209659においては、形態素解
析、構文解析を行い、制約条件の付いた文法を用いて、
その制約条件に該当する箇所を指摘することによって、
校正を支援している。
In Japanese Patent Laid-Open No. 62-209659, morphological analysis and syntactic analysis are performed, and a grammar with a constraint condition is used.
By pointing out the part corresponding to the constraint condition,
Supports proofreading.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、形態素
解析のみを行って校正/修正を行う場合においては、係
り受け関係は無視されているため、誤字の訂正は可能で
はあるが、係り受け関係が明確にならず、校正/修正が
できないことがある。
However, when the calibration / correction is performed by performing only the morphological analysis, the dependency relation is ignored, so that the typographical error can be corrected, but the dependency relation is clear. It may not be possible to calibrate / correct.

【0007】例えば次のような2つの文を例にとる。For example, the following two sentences will be taken as an example.

【0008】(1)「彼は休憩しているところを見
た。」 (2)「彼が休憩しているところを見た。」 この2つの文では「彼」「休憩している」のか「見た」
のかは曖昧にとれる。一般的に(1)の文では 「彼は(誰かが)休憩しているところを見た。」 というように「彼」が遠くの「見た」にかかるのが自然
であり、一方(2)の文では、 「(誰かが)彼が休憩しているところを見た。」 というように「彼」が近くの「休憩している」に係ると
理解するのが自然である。
(1) "He saw a rest." (2) "He saw a rest." In these two sentences, "he" and "rest"? "saw"
It can be ambiguous. Generally, in sentence (1), it is natural for "he" to look "far" in the distance, such as "he saw someone (resting) taking a break." ) Sentence, it is natural to understand that "(someone) saw him resting", such that "he" relates to a "resting" nearby.

【0009】そこで本発明では、構文解析を行うことに
より、係り受け関係を解析し、係り受け関係が曖昧であ
る場合に、曖昧性を解消する位置に文節を移動したり、
係り受けの係り文節の直後に読点やコンマを挿入するこ
とによって、係り受けの曖昧性を解消し、読みやすい日
本語文にする。
Therefore, in the present invention, by performing a syntactic analysis, the dependency relation is analyzed, and when the dependency relation is ambiguous, the clause is moved to a position where the ambiguity is resolved,
By inserting a punctuation mark or a comma immediately after the dependency phrase of the dependency, the ambiguity of the dependency is resolved and the sentence is easy to read.

【0010】例えば、文節移動による曖昧性の解消で
は、(1a)「休憩しているところを彼は見た。」とな
り、また、読点による曖昧性の解消では、(1b)「彼
は、休憩しているところを見た。」となる。
For example, in the resolution of ambiguity by moving clauses, (1a) "He saw a break.", And in resolution of ambiguity by reading points, (1b) "He took a break. I saw it doing. "

【0011】この場合に、読点やコンマについては、必
要以上にあるとかえって読みにくい文章になってしまう
ので、構文解析を行って、曖昧性がある場合のみを挿入
対象とする。
In this case, if there are more punctuation marks or commas than necessary, the sentence becomes rather difficult to read. Therefore, a syntactic analysis is performed and only ambiguity is inserted.

【0012】また、構文解析を行う場合においても、従
来の技術のように文法に制約条件を入れるという特殊な
処理を行うのではなく、1つの用言に係っているすべて
の要素を認識し、かつ辞書情報として持っている格パタ
ーンと比較する格解析を行い、語順のチェックなどを行
う。
Also, in the case of parsing, instead of performing a special process of putting a constraint condition on the grammar as in the conventional technique, all the elements related to one idiom are recognized. In addition, case analysis is performed to compare with case patterns held as dictionary information, and word order is checked.

【0013】[0013]

【課題を解決するための手段】[Means for Solving the Problems]

[請求項1の手段]日本語を入力/編集する編集手段
と、前記編集手段によって入力された日本語文を記憶す
る記憶手段と、前記日本語文を表示する表示手段と、辞
書や文法を記憶する辞書記憶手段と、前記辞書記憶手段
に記憶された辞書や文法に基づいて形態素解析を行う形
態素解析手段、構文解析を行う構文解析手段を備えた文
書処理装置において、前記構文解析手段の結果から係り
先が一意に決まらない文節の有無を判断する係り先チェ
ック手段と、前記係り先チェック手段で曖昧な文節が存
在する場合に、係り先の曖昧性を解消できる位置に該文
節を移動する文節移動手段を備える。
[Means of Claim 1] Editing means for inputting / editing Japanese, storage means for storing the Japanese sentence input by the editing means, display means for displaying the Japanese sentence, and dictionary and grammar. In a document processing device comprising a dictionary storage means, a morpheme analysis means for performing a morpheme analysis based on a dictionary or a grammar stored in the dictionary storage means, and a syntactic analysis means for syntactic analysis, Dependent destination checking means for determining the presence / absence of a clause whose destination is not uniquely determined, and when the dependent destination checking means has an ambiguous clause, moves the clause to a position where the ambiguity of the dependent party can be resolved. Means are provided.

【0014】[請求項2の手段]日本語を入力/編集す
る編集手段と、前記編集手段によって入力された日本語
文を記憶する記憶手段と、前記日本語文を表示する表示
手段と、辞書や文法を記憶する辞書記憶手段と、前記辞
書記憶手段に記憶された辞書や文法に基づいて形態素解
析を行う形態素解析手段、構文解析を行う構文解析手段
を備えた文書処理装置において、前記構文解析手段の結
果から係り先が一意に決まらない文節の有無を判断する
係り先チェック手段と、前記係り先チェック手段で曖昧
な文節が存在する場合に、係り先の曖昧性を解消できる
位置に読点またはコンマを挿入するコンマ挿入手段を備
える。
[Means for Claim 2] Editing means for inputting / editing Japanese, storage means for storing the Japanese sentence input by the editing means, display means for displaying the Japanese sentence, dictionary and grammar In a document processing device comprising a dictionary storage means for storing, a morpheme analysis means for performing a morpheme analysis based on a dictionary or a grammar stored in the dictionary storage means, and a syntax analysis means for performing a syntactic analysis. If there is an ambiguous phrase in the dependency check means that determines whether there is a phrase whose dependency is not uniquely determined from the result, and if there is an ambiguous phrase in the dependency check, place a reading mark or comma at a position where the ambiguity of the dependency can be resolved. A comma insertion means for inserting is provided.

【0015】[請求項3の手段]前記辞書記憶手段に、
文節の共起情報、用言の格パターンを格納し、前記係り
先チェック手段において、前記辞書記憶手段に格納され
た文節の共起情報を参照することによって、係り先のチ
ェックを行う。
[Means for Claim 3] In the dictionary storage means,
The co-occurrence information of the bunsetsu and the case pattern of the noun are stored, and the affiliation destination checking unit refers to the co-occurrence information of the bunsetsu stored in the dictionary storage unit to check the affiliation destination.

【0016】[請求項4の手段]前記辞書記憶手段に、
用言の格パターンを格納し、前記係り先チェック手段に
おいて、解析結果と前記辞書記憶手段に格納された格パ
ターンを照合し、前記辞書記憶手段に格納された格パタ
ーンの順序に、入力文の名詞句文節を移動させる文節移
動手段を備える。
[Means for Claim 4] In the dictionary storage means,
The case pattern of the idiom is stored, the result check unit compares the analysis result with the case pattern stored in the dictionary storage unit, and the input sentence is stored in the order of the case pattern stored in the dictionary storage unit. A phrase moving means for moving the noun phrase is provided.

【0017】[0017]

【作用】請求項1にかかる発明によれば、編集手段によ
って入力された入力文に対して、構文解析手段を行い、
その結果を係り先チェック手段で判断し、曖昧な文節が
存在する場合、その旨を表示し、係り先候補のうち、ユ
ーザがより遠くの文節に係る意味でその文を書いている
場合に、ユーザがわざわざ範囲指定や移動の操作を行う
ことなく、文節移動手段によって効率よくより遠くの受
け文節の直前へ該文節を移動することができる。
According to the first aspect of the present invention, the syntactic analysis unit is performed on the input sentence input by the editing unit,
The result is judged by the contact check means, and if there is an ambiguous phrase, that fact is displayed, and when the user writes the sentence in the meaning related to the phrase farther from the contact candidates, The bunsetsu moving means can efficiently move the bunsetsu to the position immediately before the received bunsetsu, without the user having to bother to specify the range or move the bunsetsu.

【0018】請求項2にかかる発明によれば、上記の請
求項1では文節を移動することによって、曖昧性を解消
していたが、コンマ挿入手段によって、係り文節の直後
へカーソル移動などの操作をせずに、読点やコンマを挿
入することができる。
According to the second aspect of the present invention, the ambiguity is resolved by moving the clause in the above-mentioned claim 1, but the operation such as moving the cursor immediately after the related clause is performed by the comma inserting means. You can insert punctuation marks or commas without doing.

【0019】請求項3にかかる発明によれば、文節の共
起情報、用言の格パターンを利用して、請求項1および
請求項2の係り先チェック手段において、文節の共起情
報を利用することによって、係り受けのチェックを行
い、文節の移動または読点/コンマの挿入を行い、係り
受けの曖昧性を解消する。
According to the third aspect of the invention, the co-occurrence information of the bunsetsu is used in the dependency check means of claim 1 and claim 2 by utilizing the co-occurrence information of the bunsetsu and the case pattern of the noun. By doing so, the dependency check is performed, the phrase is moved or the reading point / comma is inserted, and the ambiguity of the dependency is resolved.

【0020】請求項4にかかる発明によれば、前記辞書
記憶手段に、用言の格パターンを格納し、前記係り先チ
ェック手段において、解析結果と前記辞書記憶手段に格
納された格パターンを照合し、前記辞書記憶手段に格納
された格パターンの順序に、入力文の名詞句文節を移動
させる文節移動手段を備える。
According to the fourth aspect of the present invention, the dictionary storage means stores a case pattern of a noun, and the dependency check means compares the analysis result with the case pattern stored in the dictionary storage means. Then, the phrase movement means for moving the noun phrase clause of the input sentence is provided in the order of the case patterns stored in the dictionary storage means.

【0021】[0021]

【実施例】以下、本発明による文書処理装置の一実施例
を図面を用いて説明する。図1は、本発明における文書
処理装置の構成の一例を示した図である。1は制御手
段、2は入力/編集手段、3は表示手段、4は辞書記憶
手段、5は文法記憶手段、6は形態素解析手段、7は構
文解析手段、8は入力文字記憶手段、9は文節移動手
段、10は係り先チェック手段、11はコンマ挿入手
段、12は文節挿入手段、13は格パターン記憶手段、
14は標準語順チェック手段を示している。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of a document processing apparatus according to the present invention will be described below with reference to the drawings. FIG. 1 is a diagram showing an example of the configuration of a document processing apparatus according to the present invention. 1 is control means, 2 is input / editing means, 3 is display means, 4 is dictionary storage means, 5 is grammar storage means, 6 is morpheme analysis means, 7 is syntactic analysis means, 8 is input character storage means, and 9 is Phrase movement means, 10 is a check destination means, 11 is a comma insertion means, 12 is a phrase insertion means, 13 is a case pattern storage means,
Reference numeral 14 indicates a standard word order checking means.

【0022】制御手段1の制御により、入力手段2から
入力された入力文は、入力文字記憶手段8に格納され
る。これと同時に、表示手段にもこの内容は表示され
る。形態素解析手段6では、辞書記憶手段4の辞書や文
法記憶手段5の文法を用いて、文を文節ごとに区切る。
Under the control of the control means 1, the input sentence input from the input means 2 is stored in the input character storage means 8. At the same time, this content is displayed on the display means. The morphological analysis unit 6 uses the dictionary of the dictionary storage unit 4 and the grammar of the grammar storage unit 5 to divide a sentence into phrases.

【0023】構文解析手段7では、辞書記憶手段4の辞
書や格パターン記憶手段13の格パターンおよび文法記
憶手段5の文法を用いて、構文解析木を作成する。構文
解析木から、係り先チェック手段10により、係り先の
曖昧な文を検出し、表示手段3において、表示を行う。
また、曖昧性を解消または減少する位置へ文節移動手段
9により移動したり、コンマ挿入手段11で、読点やコ
ンマを挿入したりする。
The syntactic analysis means 7 creates a syntactic analysis tree using the dictionary of the dictionary storage means 4, the case pattern of the case pattern storage means 13 and the grammar of the grammar storage means 5. From the syntactic analysis tree, the dependent check means 10 detects an ambiguous sentence related to the dependent, and the display means 3 displays the ambiguous sentence.
Also, the phrase moving unit 9 moves to a position where the ambiguity is resolved or reduced, and the comma insertion unit 11 inserts a reading point or a comma.

【0024】さらに、構文解析木と格パターン記憶部1
3の格パターンから、標準語順チェック手段14によ
り、格要素標準の順に出現しているかどうかをチェック
し、文節移動手段9によって移動を行う。
Further, the syntax analysis tree and case pattern storage unit 1
From the case pattern No. 3, the standard word order checking unit 14 checks whether or not they appear in the order of the case element standard, and the phrase moving unit 9 moves them.

【0025】図2は、本発明の処理を示すフローチャー
トである。図9は画面表示イメージの例を示す図であ
る。まず、構成対象の文章を表示するメインウインドウ
がある。全文が表示できない場合は、スクロールなどの
機能により、全体を確認することが可能である。
FIG. 2 is a flow chart showing the processing of the present invention. FIG. 9 is a diagram showing an example of a screen display image. First, there is a main window that displays the text to be composed. If the full text cannot be displayed, it is possible to check the entire text by using a function such as scrolling.

【0026】本発明では、基本的に一文毎の処理である
ので、処理対象としている一文と、指摘内容を表示する
ウインドウを用意する。図9では、「指摘対象文を示す
ウインドウ」として示す。図9(a)、図9(b)にお
いて、下線を付した文節は、文節を移動する方がよい文
節を示し、空枠は移動すべき位置を示している。
In the present invention, since the processing is basically for each sentence, a window for displaying the sentence to be processed and the pointed out contents is prepared. In FIG. 9, it is shown as a “window showing the indication target sentence”. In FIG. 9A and FIG. 9B, the underlined clauses indicate the clauses that are better to be moved, and the blank frames indicate the positions to be moved.

【0027】また、校正操作をメニューにしたウインド
ウを「校正操作選択メニューウインドウ」として示す。
システムの指摘通りにするかどうかを選択する「●」
「○」はそれぞれ選択、非選択を示し、マウスなどで変
更/選択できるようになっている。
A window in which the calibration operation is used as a menu is shown as a "calibration operation selection menu window".
"●" to select whether to follow the system's instructions
“O” indicates selection and non-selection, respectively, which can be changed / selected with a mouse or the like.

【0028】さらに図9には図示していないが、問題と
なる理由(内容)を表示するウインドウを表示させても
よい。例えば図9(a)であれば「係り先の曖昧な文節
があります。曖昧さを軽減できる位置に該当の文節を移
動しますか?」という表示を、また図9(b)であれば
「用言に対する格助詞の順序が標準と異なります。標準
の語順に変更しますか?」と表示させる。
Although not shown in FIG. 9, a window for displaying the reason (content) of the problem may be displayed. For example, in the case of Fig. 9 (a), the display "There is an ambiguous phrase related to the person concerned. Are you sure you want to move the corresponding phrase to a position that can reduce the ambiguity?" The order of case particles for adjectives is different from the standard. Are you sure you want to change the standard word order? ”Is displayed.

【0029】図2はメインフローである。ステップS1
では、入力文一文が入力文字記憶手段8に読込まれる。
それと同時に表示手段3に表示が行われる。ステップS
2では形態素解析手段6で、辞書記憶手段4の辞書や文
法記憶手段5の文法を用いて、文節を作成する。ステッ
プS3では、形態素解析レベルで行える校正支援を行
う。例えば、表記の間違い指摘や語尾の不統一の指摘な
どを行う。
FIG. 2 is a main flow. Step S1
Then, one input sentence is read into the input character storage means 8.
At the same time, a display is made on the display means 3. Step S
In 2, the morphological analysis unit 6 creates a clause using the dictionary of the dictionary storage unit 4 and the grammar of the grammar storage unit 5. In step S3, calibration support that can be performed at the morphological analysis level is provided. For example, it points out typographical errors and points out inconsistencies in word endings.

【0030】ステップS4において、ステップS3で行
われた校正支援での指摘に基づいて、入力文が変更され
たかどうかを判断し、変更された場合は、再び形態素解
析を行うために、ステップS2に戻る。変更が行われな
かった場合にはステップS6に処理を進める。
In step S4, it is judged whether the input sentence is changed or not based on the indication in the proofreading support performed in step S3, and if it is changed, the process proceeds to step S2 to perform the morphological analysis again. Return. If no change has been made, the process proceeds to step S6.

【0031】ステップS6では、構文解析処理を行う。
構文解析処理のアルゴリズムは特に特別なものではない
が、格パターンを用いた格解析/意味解析を行う。
In step S6, a syntax analysis process is performed.
The syntax analysis algorithm is not special, but case analysis / semantic analysis using case patterns is performed.

【0032】ステップS7において、ステップS6での
結果を利用して校正支援を行う。詳細は図3、図4のフ
ロー、図5の例文を用いて説明する。なお、この図3、
図4で示す処理の順序は問題ではない。
In step S7, the calibration support is performed using the result of step S6. Details will be described with reference to the flows of FIGS. 3 and 4 and the example sentences of FIG. In addition, this FIG.
The order of the processes shown in FIG. 4 does not matter.

【0033】次に図3を用いて、係り受けに曖昧性があ
った場合の処理を示す。ステップS11において、図5
(1-3)のような文では、構文解析の結果は、図7に示すよ
うに2種類の係り受けの可能性がある。図7は依存構造
であり、受けの語の下に係りの語を並べる構造である。
図7(1-3a)は、「本を」と「昨日」が「読んだ」に、
「買った」が「本を」に係ることを示し、(1-3b)は、
「昨日」が「買った」に、「買った」が「本を」に、
「本を」が「読んだ」に係ることを示している。この構
造を同じように示したのが図6(1-3)である。係り先チ
ェック手段10を用いて、この構造から2カ所にかかる
可能性がある文節を探し、「昨日」を見つける。2カ所
以上に係る可能性がある文節があった場合にはステップ
S12へ、ない場合はメインフローへ処理が戻る。
Next, with reference to FIG. 3, the processing when there is ambiguity in the dependency is shown. In step S11, as shown in FIG.
In the sentence like (1-3), the result of the syntactic analysis may have two types of dependency as shown in FIG. FIG. 7 shows a dependency structure, in which related words are arranged below the receiving word.
In Figure 7 (1-3a), "Book" and "Yesterday" are "Read",
Indicates that "buying" is related to "book", and (1-3b)
"Yesterday" is "buy", "buy" is "book",
It indicates that "reading a book" is related to "reading". FIG. 6 (1-3) shows this structure in the same manner. Using the contact check means 10, a phrase that may be at two places is searched from this structure, and "yesterday" is found. If there is a phrase that may be related to two or more places, the process returns to step S12, and if not, the process returns to the main flow.

【0034】請求項3の実施例の場合、2つ以上ある係
り先のうち、どちらに係る可能性が高いかを、格パター
ン記憶手段13の格パターンを用いて、格解析および意
味解析を行い判断する。
In the case of the third aspect of the present invention, a case analysis and a semantic analysis are performed using the case pattern stored in the case pattern storage means 13 to determine which one of the two or more related parties is likely to be related. to decide.

【0035】図5(1-1a)では、図6(1-1a)に示すように
「ギターを」は、より遠くの「弾いている」に、図5(1
-1b)では、図6(1-1b)のように、より近くの文節「唄っ
ている」に係る。同様に、図5(1-2a)および(1-2b)の例
では、(1-2a)の例が、より遠くの文節に係っている。請
求項3ではこのステップで、係り先の曖昧な文節があ
り、かつ係り先の可能性がある文節のうち、より遠い方
に係っているとシステムが判断した場合、ステップS3
2へ、それ以外の場合はメインフローに戻る。
In FIG. 5 (1-1a), as shown in FIG. 6 (1-1a), "playing the guitar" is changed to "playing" at a farther position.
-1b), as shown in FIG. 6 (1-1b), relates to a closer phrase “singing”. Similarly, in the examples of (1-2a) and (1-2b) of FIG. 5, the example of (1-2a) relates to a farther bunsetsu. According to claim 3, in this step, if the system determines that there is an ambiguous phrase related to the related item and that the related phrase is related to a farther one, the step S3
2. If not, return to the main flow.

【0036】つまり、図5の(1-1a)および(1-2a)の文で
は、ステップS12へすすみ、図5(1-1b)および(1-2b)
の文はメインフローに戻る。また、(1-3)の例では「昨
日」が「買った」に係るのか「読んだ」に係るのか判断
できない。さらに図5(1-4)、図6の(1-4)でも「赤い」
が「会社」に係るのか「車」に係るのか判断できない
(「赤い会社」なるものがないという知識を格納してい
れば判断できる)。これらの場合も、ステップS12で
ユーザの判断にゆだねることになる。
That is, in the sentences (1-1a) and (1-2a) in FIG. 5, the process proceeds to step S12, and the sentences (1-1b) and (1-2b) in FIGS.
Statement returns to the main flow. In addition, in the example of (1-3), it cannot be determined whether "yesterday" relates to "buying" or "reading". In addition, "red" in Fig. 5 (1-4) and Fig. 6 (1-4).
It is not possible to judge whether is related to "company" or "car" (it can be judged if the knowledge that there is no "red company" is stored). In these cases as well, it is up to the user's judgment in step S12.

【0037】ステップS12では、係り先の曖昧な文節
の特徴表示(例えばカラー表示、アンダーライン表示な
ど)と、移動先の位置を表示する。図5の(1-1a)の文の
場合、図9の(1-1a)の「指摘対象文を示すウインドウ」
のような表示を行う。また、「校正操作メニューウイン
ドウ」のように、選択項目を表示する。ここで、文節移
動を行うか、読点(またはコンマ)を挿入するか、その
ままかの選択肢を表示し、ステップS13へ進む。
In step S12, the characteristic display (for example, color display, underline display, etc.) of the ambiguous phrase of the destination and the position of the destination are displayed. In the case of the sentence of (1-1a) in FIG. 5, "window showing the indicated sentence" in (1-1a) of FIG. 9
Is displayed. Also, selection items are displayed as in the “calibration operation menu window”. Here, the option of moving the phrase, inserting a reading point (or a comma), or leaving it as it is is displayed, and the process proceeds to step S13.

【0038】ステップS13では、ステップS12で表
示の選択肢からユーザが選択し、ステップS14に進
む。
In step S13, the user selects from the display options in step S12, and the process proceeds to step S14.

【0039】ステップS14では、ステップS13で文
節移動を選択した場合には、特徴表示している文節を移
動先の位置に移動する。移動先は、係り先の文節の直前
である。また、読点挿入を選択した場合は、特徴表示し
た文節の直後へ読点(またはコンマ)を挿入する。それ
ぞれの処理終了後メインフローへ戻る。
In step S14, when the phrase movement is selected in step S13, the feature-displayed phrase is moved to the destination position. The destination is just before the clause of the destination. Also, when insertion of a reading point is selected, a reading point (or a comma) is inserted immediately after the phrase displayed as a feature. After each process is completed, the process returns to the main flow.

【0040】次に、格解析を用いて語順のチェックを行
い、語順を変更する処理を説明する。ステップS21で
は、構文解析を行った結果、各用言にどんな文節がどん
な順で係っているのか解析される。これを格パターンデ
ータと比較することにより、標準的な語順であるかどう
かが判断される。例えば、図5(2-1)および(2-2)では、
用言「書いた」には「本を」と「私が」が、この順で係
っている。また、用言「見なす」には、「正解と」と
「これを」とが、この順で係っている。この用言には、
格パターンデータとして図8のようなものがある。格パ
ターンの各要素の順を標準語順とすると、両者とも異な
っている。このように標準語順と異なっている場合は、
ステップS22へ進み、異なっていない場合はメインフ
ローに戻る。
Next, the processing for checking the word order using case analysis and changing the word order will be described. In step S21, as a result of the syntactic analysis, it is analyzed what clauses are associated with which terms and in what order. By comparing this with the case pattern data, it is judged whether or not the word order is standard. For example, in FIGS. 5 (2-1) and (2-2),
The terms "written" include "book" and "me" in that order. In addition, in the verb "to regard", "correct answer" and "this" are related in this order. In this idiom,
Case pattern data is shown in FIG. If the order of each element of the case pattern is the standard word order, both are different. If it is different from the standard word order like this,
The process proceeds to step S22, and if they are not different, the process returns to the main flow.

【0041】ステップS22では、標準語順にするため
の文節移動の表示を行う。つまり、図9の(2-1)の「指
摘対象文を示すウインドウ」のように、移動する文節と
移動先を表示する。格要素が3つ以上ある場合は、ステ
ップS21〜ステップS24が繰り返される。
In step S22, the phrase movement for displaying in the standard word order is displayed. That is, the phrase to be moved and the move destination are displayed as in the “window showing the indicated object sentence” in (2-1) of FIG. If there are three or more case elements, steps S21 to S24 are repeated.

【0042】語順の変更を、格要素である文節の移動と
考えて、標準の語順で用言に最も近い格要素からチェッ
クし、入力文でその格要素と用言との間に他の格要素が
入っていると、用言の直前に移動先を設定する。繰り返
される場合は、その次に用言に近い各要素をチェック
し、先に移動し終えた用言に最も近い格要素の直前に移
動先を設定する。その後ステップS23へ進む。
Considering the change of word order as the movement of a clause that is a case element, the case element closest to the word in the standard word order is checked, and another case is inserted between the case element and the word in the input sentence. When the element is included, the destination is set just before the idiom. When it is repeated, each element next to the word is checked, and the destination is set immediately before the case element closest to the word that has finished moving first. After that, the process proceeds to step S23.

【0043】ステップS23では、ユーザは移動するか
どうかを選択する。移動を行う場合には、ステップS2
4に進み、そうでない場合はメインフローに戻る。
In step S23, the user selects whether to move. When moving, step S2
4. If not, return to the main flow.

【0044】ステップS24では、特徴表示している文
節を移動先の位置へ移動する。そしてメインフローに戻
る。
In step S24, the feature-displayed clause is moved to the destination position. Then return to the main flow.

【0045】ステップS7では、ステップS3の従来の
校正支援機能による校正の結果およびステップS6の本
発明による校正支援機能による校正の結果で、入力文字
記憶手段8の内容および表示手段3の内容が変更され
る。
In step S7, the contents of the input character storage means 8 and the contents of the display means 3 are changed depending on the result of the calibration by the conventional calibration support function of step S3 and the result of the calibration by the calibration support function of the present invention of step S6. To be done.

【0046】ステップS8で、次の文があればステップ
S1に戻り、なければ、処理を終了する。
If there is a next sentence in step S8, the process returns to step S1. If not, the process ends.

【0047】[0047]

【発明の効果】【The invention's effect】

[請求項1の効果]本発明によれば、係り先が曖昧な文
節に対して、より遠い方の係り先に係る方が、ユーザの
意図するない用である場合に、該文節を係り先の直前に
移動し、曖昧性を解消もしくは減少させた文に校正する
ことが可能であり、読み手に書き手の意図を正確に伝え
ることが可能となる。
[Effect of Claim 1] According to the present invention, when a distant affiliation is related to an ambiguous bunsetsu, the bunsetsu is related to the bunsetsu which is not intended by the user. It is possible to move to the position immediately before and correct the disambiguation or the sentence to reduce the ambiguity, and it is possible to accurately convey the intention of the writer to the reader.

【0048】[請求項2の効果]また、文節の移動の代
わりに、該文節の直後に読点かコンマを挿入することに
よって、読み手に該文節が遠方に係ることを示している
ことを暗に伝えることができ、曖昧性を軽減することが
可能となる。
[Effect of claim 2] It is also implied that a punctuation mark or a comma is inserted immediately after the bunsetsu, instead of moving the bunsetsu, to indicate to the reader that the bunsetsu is distant. It is possible to convey and reduce ambiguity.

【0049】[請求項3の効果]さらに、格解析/共起
情報を用いることによって、正確に係り受けを判断する
ことが可能となる。
[Effect of claim 3] Further, by using the case analysis / co-occurrence information, it becomes possible to accurately determine the dependency.

【0050】[請求項4の効果]日本語において、用言
の格要素の語順は比較的自由であるが、特別な効果をね
らう場合以外は標準的な語順がある程度決まっており、
読み手に伝わりやすい。よって、標準的でない語順を指
摘し、標準的な位置に移動することによって、読み手に
伝わりやすい。
[Effect of claim 4] In Japanese, the word order of the case elements of the idiom is relatively free, but the standard word order is determined to some extent except for the case of special effect.
Easy to reach the reader. Therefore, by pointing out a non-standard word order and moving to a standard position, it is easy for the reader to understand.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例に係るブロック図である。FIG. 1 is a block diagram according to an embodiment of the present invention.

【図2】本発明に関するメインフロー図である。FIG. 2 is a main flow diagram according to the present invention.

【図3】本発明の請求項1または2の処理に関するフロ
ー図である。
FIG. 3 is a flowchart relating to the processing of claim 1 or 2 of the present invention.

【図4】本発明の請求項4の処理に関するフロー図であ
る。
FIG. 4 is a flow chart relating to the processing of claim 4 of the present invention.

【図5】入力文の例を示す図である。FIG. 5 is a diagram showing an example of an input sentence.

【図6】入力文の例の係り受け構造を示す図である。FIG. 6 is a diagram showing a dependency structure of an example of an input sentence.

【図7】入力文の例の構文解析結果を示す図である。FIG. 7 is a diagram showing a result of syntax analysis of an example of an input sentence.

【図8】用言辞書の格パターンの例を示す図である。FIG. 8 is a diagram showing an example of a case pattern of a vocabulary dictionary.

【図9】本発明の一実施例の画面表示例を示す図であ
る。
FIG. 9 is a diagram showing a screen display example according to an embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 制御手段 2 入力/挿入手段 3 表示手段 4 辞書記憶手段 5 文法記憶手段 6 形態素解析手段 7 構文解析手段 8 入力文字記憶手段 9 文節移動手段 10 係り先チェック手段 11 コンマ挿入手段 12 文節挿入手段 13 格パターン記憶手段 14 標準語順チェック手段 1 control means 2 input / insertion means 3 display means 4 dictionary storage means 5 grammar storage means 6 morpheme analysis means 7 syntactic analysis means 8 input character storage means 9 phrase movement means 10 reference destination check means 11 comma insertion means 12 phrase insertion means 13 Case pattern storage means 14 Standard word order check means

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】日本語を入力/編集する編集手段と、前記
編集手段によって入力された日本語文を記憶する記憶手
段と、前記日本語文を表示する表示手段と、辞書や文法
を記憶する辞書記憶手段と、前記辞書記憶手段に記憶さ
れた辞書や文法に基づいて形態素解析を行う形態素解析
手段、構文解析を行う構文解析手段を備えた文書処理装
置において、 前記構文解析手段の結果から係り先が一意に決まらない
文節の有無を判断する係り先チェック手段と、前記係り
先チェック手段で曖昧な文節が存在する場合に、係り先
の曖昧性を解消できる位置に該文節を移動する文節移動
手段を備えることを特徴とする文書処理装置。
1. An editing unit for inputting / editing Japanese, a storage unit for storing the Japanese sentence input by the editing unit, a display unit for displaying the Japanese sentence, and a dictionary storage for storing a dictionary and grammar. Means, a morpheme analysis means for performing morpheme analysis based on the dictionary or grammar stored in the dictionary storage means, and a document processing device comprising syntactic analysis means for syntactic analysis. Dependent check means for judging the presence or absence of a clause that cannot be uniquely determined, and clause moving means for moving the clause to a position where the ambiguity of the dependent party can be resolved when there is an ambiguous clause in the dependent check means. A document processing device comprising:
【請求項2】日本語を入力/編集する編集手段と、前記
編集手段によって入力された日本語文を記憶する記憶手
段と、前記日本語文を表示する表示手段と、辞書や文法
を記憶する辞書記憶手段と、前記辞書記憶手段に記憶さ
れた辞書や文法に基づいて形態素解析を行う形態素解析
手段、構文解析を行う構文解析手段を備えた文書処理装
置において、 前記構文解析手段の結果から係り先が一意に決まらない
文節の有無を判断する係り先チェック手段と、前記係り
先チェック手段で曖昧な文節が存在する場合に、係り先
の曖昧性を解消できる位置に読点またはコンマを挿入す
るコンマ挿入手段を備えることを特徴とする文書処理装
置。
2. An editing unit for inputting / editing Japanese, a storage unit for storing the Japanese sentence input by the editing unit, a display unit for displaying the Japanese sentence, and a dictionary storage for storing a dictionary and grammar. Means, a morpheme analysis means for performing morpheme analysis based on the dictionary or grammar stored in the dictionary storage means, and a document processing device comprising syntactic analysis means for syntactic analysis. Dependent check means for determining the presence or absence of a clause that cannot be uniquely determined, and, if there is an ambiguous clause in the dependent check means, a comma insertion means for inserting a reading point or a comma at a position where the ambiguity of the dependee can be resolved. A document processing apparatus comprising:
【請求項3】前記辞書記憶手段に、文節の共起情報、用
言の格パターンを格納し、前記係り先チェック手段にお
いて、前記辞書記憶手段に格納された文節の共起情報を
参照することによって、係り先のチェックを行うことを
特徴とする請求項1または2に記載の文書処理装置。
3. The lexical co-occurrence information and the noun case pattern are stored in the dictionary storage means, and the affiliation destination checking means refers to the bunsetsu co-occurrence information stored in the dictionary storage means. The document processing apparatus according to claim 1 or 2, wherein a check is made on the person in charge.
【請求項4】前記辞書記憶手段に、用言の格パターンを
格納し、前記係り先チェック手段において、解析結果と
前記辞書記憶手段に格納された格パターンを照合し、前
記辞書記憶手段に格納された格パターンの順序に、入力
文の名詞句文節を移動させる文節移動手段を備えること
を特徴とする文書処理装置。
4. A case pattern of a noun is stored in the dictionary storage means, and the relationship check means compares the analysis result with the case pattern stored in the dictionary storage means and stores it in the dictionary storage means. A document processing apparatus comprising: a phrase moving unit that moves a noun phrase phrase of an input sentence in the order of the generated case patterns.
JP04980595A 1995-03-09 1995-03-09 Document processing apparatus and document processing method Expired - Fee Related JP3420369B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04980595A JP3420369B2 (en) 1995-03-09 1995-03-09 Document processing apparatus and document processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04980595A JP3420369B2 (en) 1995-03-09 1995-03-09 Document processing apparatus and document processing method

Publications (2)

Publication Number Publication Date
JPH08249331A true JPH08249331A (en) 1996-09-27
JP3420369B2 JP3420369B2 (en) 2003-06-23

Family

ID=12841364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04980595A Expired - Fee Related JP3420369B2 (en) 1995-03-09 1995-03-09 Document processing apparatus and document processing method

Country Status (1)

Country Link
JP (1) JP3420369B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003056451A1 (en) * 2001-12-27 2003-07-10 Communications Research Laboratory,Independent Administrative Institution Text generating method and text generator
JP2014238690A (en) * 2013-06-07 2014-12-18 コニカミノルタ株式会社 Operation support program, operation support method, and information processing apparatus
JP2019152712A (en) * 2018-03-01 2019-09-12 Kddi株式会社 Analyzer and program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003056451A1 (en) * 2001-12-27 2003-07-10 Communications Research Laboratory,Independent Administrative Institution Text generating method and text generator
JP2014238690A (en) * 2013-06-07 2014-12-18 コニカミノルタ株式会社 Operation support program, operation support method, and information processing apparatus
JP2019152712A (en) * 2018-03-01 2019-09-12 Kddi株式会社 Analyzer and program

Also Published As

Publication number Publication date
JP3420369B2 (en) 2003-06-23

Similar Documents

Publication Publication Date Title
US5678051A (en) Translating apparatus with special display mode for supplemented words
US7774193B2 (en) Proofing of word collocation errors based on a comparison with collocations in a corpus
US4962452A (en) Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence
US7788085B2 (en) Smart string replacement
US5535121A (en) System for correcting auxiliary verb sequences
US5537317A (en) System for correcting grammer based parts on speech probability
JPH0844719A (en) Dictionary access system
JPH07325828A (en) Grammar check system
US4964030A (en) Apparatus for translating sentences containing punctuation marks
Faili et al. Vafa spell-checker for detecting spelling, grammatical, and real-word errors of Persian language
JP3420369B2 (en) Document processing apparatus and document processing method
USRE35464E (en) Apparatus and method for translating sentences containing punctuation marks
Demilie et al. Automated all in one misspelling detection and correction system for Ethiopian languages
JPH0693221B2 (en) Voice input device
JPH07325825A (en) English grammar check system device
JPH05151261A (en) Tense polish supporting system
JP2818185B2 (en) Document creation support device
JP2608384B2 (en) Machine translation apparatus and method
US20100106480A1 (en) Character data processing method, computer program, and character data processing system
JPH07200592A (en) Text processor
Badino Chinese text word-segmentation considering semantic links among sentences.
JP2958811B2 (en) Japanese sentence processor
JP3253311B2 (en) Language processing apparatus and language processing method
JPH0746359B2 (en) Japanese sentence processing method
JPH06251009A (en) Text proofreading support device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080418

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees