JPH061468B2 - Japanese sentence proofreading device - Google Patents

Japanese sentence proofreading device

Info

Publication number
JPH061468B2
JPH061468B2 JP61054478A JP5447886A JPH061468B2 JP H061468 B2 JPH061468 B2 JP H061468B2 JP 61054478 A JP61054478 A JP 61054478A JP 5447886 A JP5447886 A JP 5447886A JP H061468 B2 JPH061468 B2 JP H061468B2
Authority
JP
Japan
Prior art keywords
morpheme
syntactic
character string
analysis
syntax
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61054478A
Other languages
Japanese (ja)
Other versions
JPS62209659A (en
Inventor
茂起 空閑
信夫 中村
敏幸 田中
幹雄 大崎
太朗 森下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP61054478A priority Critical patent/JPH061468B2/en
Publication of JPS62209659A publication Critical patent/JPS62209659A/en
Publication of JPH061468B2 publication Critical patent/JPH061468B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〈産業上の利用分野〉 本発明は、日本語文章の中から、特定の基準に合わない
表記、表現を抽出し、校正する日本語文章校正装置に関
するものである。
DETAILED DESCRIPTION OF THE INVENTION <Industrial field of use> The present invention relates to a Japanese sentence proofreading device for extracting and proofreading notations and expressions that do not meet specific criteria from Japanese sentences.

〈従来の技術〉 欧米では、ワードプロセッサが早くから発展したため関
連技術が進んでおり、スペルのチェック、コレクトの機
能を持った装置が実用化されている。
<Conventional Technology> In Europe and the United States, word processors have developed from an early stage, and related technologies have advanced, and devices with spell check and collect functions have been put into practical use.

欧米の言葉が単語単位に句切られて記述されるのに比
べ、日本語は句切りのない漢字仮名交り文で記述される
のが通常であり、また正書法が徹底していないため、解
析が難しく校正を自動化する装置も実用化されていな
い。
Compared to Western words that are written in units of words, Japanese is usually written in Kanji and Kana interchange without punctuation, and the orthography is not thorough. However, a device for automating calibration has not been put into practical use.

日本語の校正方法として従来用いられているのは複数の
人が対になり読み合わせをして、問題のある点を抽出す
るあるいは校正の専門的な知識を持った人が逐次原文と
照合を加える方法である。
Conventionally used as a proofreading method for Japanese, multiple people make a pair and read together to extract problematic points, or a person with specialized knowledge of proofreading sequentially adds and verifies the original sentence. Is the way.

前者に対しては漢字仮名交りの文章を解析して音声に変
換し読み合わせを機械との間で行うことのできる校正装
置が提案されている。
For the former, there has been proposed a proofreading device capable of analyzing a sentence in which kanji and kana are mixed, converting it into a voice, and performing reading together with a machine.

しかし後者は、校正の自動化あるいは校正の専門化の支
援を行う機能を必要とし、より高度の技術が要求される
ため、概念の提案があるのみで該装置を構成する手段、
校正の具体的な手段は報告されていない。
However, the latter requires the function of supporting the automation of calibration or the specialization of calibration, and requires a higher level of technology. Therefore, a means for configuring the device by only proposing a concept,
No specific means of calibration has been reported.

〈発明が解決しようとする問題点〉 校正を行うためには校正の専門的な知識が必要であり、
その習得に時間がかかっていた。また、校正の専門的知
識を有した人の数は少なく大量の文章の校正を行う場合
や、急ぐ必要のある校正の場合支障を来していた。
<Problems to be solved by the invention> To carry out calibration, specialized knowledge of calibration is required.
It took time to learn it. In addition, the number of people who have specialized knowledge of proofreading is small, and there are problems when proofreading a large amount of sentences or when urgent proofreading is required.

又、校正の知識を有した専門家の立場では、校正を正し
く行うためには細かい所にまで注意を払う必要があり、
精神的な負担を強いられていた。
Also, from the standpoint of an expert who has the knowledge of calibration, it is necessary to pay attention to the fine details in order to perform calibration correctly.
I had a mental burden.

にも拘わらず人間では見付けにくい誤りや、見落としが
ちな誤りもあり、校正の精度の面で問題があった。
Nevertheless, there were some errors that were difficult for humans to find and errors that were easily overlooked, and there was a problem in terms of calibration accuracy.

又、校正の専門的な知識を持たない一般の人がワードプ
ロセサなどを用いて文書を作成する場合、細かい間違い
の校正のために文書ファイルの読み出し、印刷、コピー
などの再処理を必要とし、文書作成作業の効率の点で問
題があった。
In addition, when an ordinary person who does not have specialized knowledge of proofreading creates a document using a word processor, etc., reprocessing such as reading, printing, and copying of the document file is necessary for proofreading small mistakes. There was a problem in the efficiency of document creation work.

欧米のスペルチェック、コレクト機能の実現方法は表記
・用語の校正を目的としており、構文的な間違い、同音
語の間違いなどを校正する校正装置は存在していなかっ
た。
The Western and American spell check and collect functions are aimed at proofreading notations and terms, and there was no proofreading device to proofread syntactic and homophone errors.

本発明は、形態素解析及び構文解析を行なうことによ
り、日本語の文章の中から校正すべき文字・記号列(以
下特別の断わりなしに文字・記号列を文字列と表わすこ
とがある。)を抽出し、提示することにより装置の使用
者の校正作業の支援を行ない、かかる問題を解決しよう
とするものである。
The present invention performs morphological analysis and syntactic analysis to identify a character / symbol string to be proofread from a Japanese sentence (hereinafter, the character / symbol string may be referred to as a character string without special notice). By extracting and presenting the information, the user of the apparatus is assisted in the calibration work, and the problem is solved.

〈問題点を解決するための手段〉 本発明は、見出しと該見出しの形態素情報を記憶した辞
書手段と、日本語の文法情報を記憶した文法手段と、構
文の生成規則及び該生成規則の制約条件を記憶した構文
規則手段と、入力された文章を記憶する記憶手段と、前
記記憶手段に記憶された文章を仮に分割する分割手段
と、前記分割手段にて分割された仮の文字列毎に、前記
辞書手段及び前記文法手段を用いて形態素解析する形態
素解析手段と、前記形態素解析手段による形態素解析に
成功した場合に、形態素情報を蓄積する蓄積手段と、前
記蓄積手段に蓄積された形態素情報について前記構文規
則手段の生成規則を適用して、構文解析木を生成する構
文解析手段と、前記構文規則手段の制約条件を参照し
て、前記構文解析手段にて生成された構文解析木の構文
的妥当性を判断し、構文的妥当性の低い構文構成要素を
校正すべき文字列として他と区別して表示する表示手段
と、前記表示手段にて他と区別して表示された文字列を
キー入力により変更するキー入力変更手段とから構成さ
れる。
<Means for Solving Problems> According to the present invention, a dictionary means that stores a headline and morpheme information of the headline, a grammar means that stores Japanese grammatical information, a syntax generation rule, and a constraint of the generation rule. For each of the temporary character strings divided by the dividing means, a syntax rule means for storing the condition, a storage means for storing the input sentence, a dividing means for temporarily dividing the sentence stored in the storage means, A morpheme analysis means for performing a morpheme analysis using the dictionary means and the grammar means, a storage means for storing morpheme information when the morpheme analysis by the morpheme analysis means is successful, and a morpheme information stored in the storage means The parsing means for applying the generation rule of the syntactic rule means to generate a syntactic parse tree and the constraint condition of the syntactic rule means, and the syntactic solution generated by the syntactic analyzing means. Display means for judging the syntactic validity of the parsing tree and displaying a syntactic component having a low syntactic validity as a character string to be proofread separately from the other, and a character displayed by the display means to distinguish from the others And a key input changing means for changing the column by key input.

〈作用〉 本発明は、入力された文章を仮に分割し、分割された仮
の文字列毎に、辞書手段及び文法手段を用いて形態素解
析し、形態素解析に成功した場合に、形態素情報を蓄積
して、蓄積された形態素情報について構文規則手段の生
成規則を適用して、構文解析木を生成し、構文規則手段
の制約条件を参照して、前記生成された構文解析木の構
文的妥当性を判断し、構文的妥当性の低い構文構成要素
を校正すべき文字列として他と区別して表示し、該文字
列をキー入力により変更することにより、文章の校正を
行うものである。
<Operation> The present invention temporarily divides an input sentence, morphologically analyzes each divided temporary character string using a dictionary means and a grammar means, and accumulates morpheme information when the morpheme analysis is successful. Then, the generation rule of the syntactic rule means is applied to the accumulated morpheme information to generate a syntactic parse tree, the syntactic validity of the generated syntactic parse tree is referred to by referring to the constraint condition of the syntactic rule means. The sentence is proofread by determining the above, displaying a syntactic component having a low syntactical validity as a character string to be proofread separately from the others, and changing the character string by key input.

〈実施例〉 以下図に基づいて本発明を詳細に説明する。第1図は本
発明に係わる日本語文章校正装置のブロック構成図であ
る。
<Example> The present invention will be described in detail with reference to the drawings. FIG. 1 is a block diagram of a Japanese sentence proofreading device according to the present invention.

図において1は日本語の文字列を入力・編集する手段で
ある。2は該入力手段により入力された日本語の文字列
を記憶する手段である。入力手段は通常キーボードが用
いられるが逐次的に入力を行なわないでもたとえばフロ
ッピーディスク、磁気テープなどのように入力した日本
語の文字列を記憶する外部記憶手段で代用することも可
能である。即ち、1が省略された構成も存在しうる。
In the figure, 1 is a means for inputting / editing a Japanese character string. Reference numeral 2 is a means for storing the Japanese character string input by the input means. Although a keyboard is usually used as the input means, an external storage means for storing the input Japanese character string, such as a floppy disk or a magnetic tape, can be used instead of the sequential input. That is, there may be a configuration in which 1 is omitted.

3は基準に合致する日本語の文字列からなる辞書を記憶
する手段である。4は日本語の文法を記憶する手段であ
る。日本語は正書法が確立されていないため、ある基準
に合致した表記、文法、表現が正しいとされる。以下正
しい表記、文法、表現と記述するときは、それが、ある
基準に合致していることを意味する。
Reference numeral 3 is a means for storing a dictionary consisting of Japanese character strings that meet the criteria. 4 is a means for storing Japanese grammar. Since the Japanese orthography has not been established, it is said that the notation, grammar and expressions that meet certain standards are correct. Hereinafter, when the correct notation, grammar, and expression are described, it means that they meet a certain standard.

5は入出力、照合、情報蓄積、表示などの制御を行なう
制御手段である。該制御手段には制御によって得られる
結果を記憶する手段を含む、6は日本語を構文解析する
手段である。7は入力された日本語、照合の途中結果、
校正すべき文字列などを表示するCRTなどの表示の手
段である。8は辞書、文法などを用い形態素解析を行な
う手段である。
Reference numeral 5 is a control means for controlling input / output, collation, information storage, display and the like. The control means includes a means for storing the result obtained by the control, and 6 is a means for parsing Japanese. 7 is the input Japanese, the result of the verification process,
It is a display means such as a CRT that displays a character string to be calibrated. Reference numeral 8 is a means for performing morphological analysis using a dictionary, grammar and the like.

第2図は入力手段により入力された文字列の列である。
この場合は「は」が余分に入力されていることを示してい
る。「は」は覇を競うなどのような覇を常用漢字の制限内
で表現した単語の「は」と係助詞の「は」の双方が存在す
る。
FIG. 2 shows a string of character strings input by the input means.
In this case, it indicates that "ha" has been input extra. "Ha" has both the word "ha" and the particle "ha" that expresses victory within the limits of common kanji, such as competing for victory.

第3図は3に記載された辞書の例である。9は入力され
た文字列と比較される見出しである。10は該見出しの
形態素情報の一つである。
FIG. 3 is an example of the dictionary described in 3. Reference numeral 9 is a headline to be compared with the input character string. Reference numeral 10 is one of the morpheme information of the headline.

第4図は4に記憶された文法情報の例である。見易くす
るために第3図で示した見出しを併せて示している。1
1は各形態素情報の接続関係を規定した情報である。例
えば、代名詞は格助詞は係助詞に接続できることを表し
ている。12は各形態素情報が文節の終了条件を満たし
うるか否かを規定した情報であり、○は文節終了の条件
を満たし、×はそれを満たさないことを示している。
FIG. 4 is an example of the grammatical information stored in 4. The heading shown in FIG. 3 is also shown for the sake of clarity. 1
Reference numeral 1 is information that defines the connection relation of each morpheme information. For example, a pronoun indicates that a case particle can be connected to a particle. Reference numeral 12 is information that defines whether each morpheme information can satisfy the phrase ending condition, and ○ indicates that the phrase ending condition is satisfied, and × indicates that it is not satisfied.

第5図は形態素情報と文法カテゴリ名の対応表である。
13は文法カテゴリ名の例である。14は13に対応し
た形態素情報である。14が空白になっている文法カテ
ゴリ名は終端子でないことを表わしている。
FIG. 5 is a correspondence table of morpheme information and grammar category names.
13 is an example of a grammar category name. Reference numeral 14 is morpheme information corresponding to 13. A grammar category name in which 14 is blank indicates that it is not a terminator.

第6図は構文規則の例である。15は構文の生成規則で
ある。16は15を適用する場合の制約条件を表わして
いる。
FIG. 6 is an example of syntax rules. Reference numeral 15 is a syntax generation rule. 16 represents a constraint condition when 15 is applied.

第7図は本発明の該略フロー図である。17は入力文字
列を5の中のスタックに蓄積する。18は蓄積された文
字記号列を漢字コードなどで仮に分割する。19は仮に
分割された各入力文字列を読み込む。20は19で読み
込まれた入力文字列を辞書及び文法を用いて形態素解析
する。その結果により、形態素解析に成功する場合と失
敗する場合に分岐する。21は形態素解析に成功した形
態素情報を蓄積する。
FIG. 7 is a schematic flow chart of the present invention. 17 stores the input character string in the stack in 5. 18 tentatively divides the accumulated character / symbol string by a kanji code or the like. Reference numeral 19 reads each provisionally divided input character string. 20 performs morphological analysis of the input character string read in 19 using a dictionary and grammar. Depending on the result, the process branches if the morphological analysis succeeds or fails. Reference numeral 21 stores morpheme information that has been successfully analyzed.

22は21で得られた形態素情報を入力として構文規則
を適用し、構文解析木を生成する。23はSENTまで成長
した構文解析木を持つ構文規則の集合に対し、16を照
合し、構文的な妥当性を決定する。24は構文的妥当性
の低い構文構成要素を校正すべき文字列として抽出し、
他と区別して表示する。25は24の情報を基に選択手
段あるいは日本語の入力・編集の手段を用いて校正を行
なう。26は照合すべき次の入力文字列を調べる。
22 receives the morpheme information obtained in 21 as an input and applies a syntax rule to generate a syntax analysis tree. 23 collates 16 against a set of syntactic rules having a parse tree grown to SENT to determine syntactic validity. 24 extracts syntactic elements having low syntactical validity as a character string to be proofread,
It is displayed separately from the others. 25 is proofreading based on the information of 24 by using a selecting means or a Japanese input / editing means. 26 examines the next input string to be matched.

27は辞書、文法のいずれかの照合に失敗した場合の処
理を行なう。27の処理は本特許の範囲外なので詳述は
しない。
Reference numeral 27 carries out a process when collation of either the dictionary or the grammar fails. The processing of 27 is outside the scope of this patent and will not be described in detail.

以下、第2図に上げた例文と第3、第4図、第5図及び
第6図に上げた辞書、文法及び構文規則を用いて実際の
処理の流れを述べる。
The actual processing flow will be described below using the example sentences shown in FIG. 2 and the dictionaries, grammars, and syntax rules shown in FIGS. 3, 4, 5, and 6.

最初に入力文字列「彼がは学校へ行く。」を5にスタック
する。次に、スタックされた文字列のコードなどを利用
して入力文字列を仮分割する。例えば平仮名から別の文
字種のコードに変わる文字列の前で分割する。
First, the input string "He goes to school" is stacked at 5. Next, the input character string is provisionally divided using the code of the stacked character strings. For example, split before a character string that changes from hiragana to a code of another character type.

これにより「彼がは学校へ行く。」は「彼がは」、「学校へ」
及び「行く。」に分割される。まず、「彼がは」の形態素の
処理を述べる。「 彼がは」が制御装置5に読み込まれ、第3、第4図の辞
書の見出しと照合される。今の場合、辞書中の「彼」の部
分が一致する。この情報を5の中にスタックし、該当見
出しの接続条件と次の入力文字列を比較する。今の場合
双方とも「が」であり、一致する。次に、第3図の「が」を
見出しとする項目の文節終了条件を第4図の12で調べ
る。12より今の場合文節終了条件を満足することが分
かり、「彼が」を正常文節として5にスタックする。
As a result, "he goes to school" means "he is" and "go to school."
And "Go." First, the processing of the morpheme of "he is ga" will be described. "Hi ga ga" is read by the control device 5 and collated with the dictionary headings in FIGS. In the present case, the part of "he" in the dictionary matches. This information is stacked in 5 and the connection condition of the corresponding heading is compared with the next input character string. In the present case, both are "ga" and they match. Next, the clause end condition of the item headed by "ga" in FIG. 3 is checked in 12 in FIG. From 12, it is found that the phrase ending condition is satisfied in the present case, and "he is" is stacked as a normal phrase at 5.

次に「彼が」と同様の手順で「は」の形態素処理を行なう。
その結果、「彼が」と「は」はまとめて一文節とし「彼がは」
とすることはできないが、「彼が」と「は」の二文節で有れ
ば形態素的な条件を満足することが導き出される。
Next, the morpheme processing of “ha” is performed in the same procedure as “he is”.
As a result, "he is" and "ha" are put together as a sentence and "he is"
However, if he has two clauses, “he is” and “ha,” it is possible to satisfy the morphological condition.

同様にして「学校へ」、「行く。」の形態素処理を行なう。Similarly, the morpheme processing of "go to school" and "go." Is performed.

以上により形態素情報「彼・・代名詞」、「が・・格助
詞」、「は・・名詞」、「学校・・名詞」、「へ・・格助
詞」、「行く。・・五段動詞終止形」が得られる。
Based on the above, the morpheme information "he ・ ・ pronoun", "ga ・ ・ case particle", "ha ・ ・ noun", "school ・ noun", "he ・ ・ case particle", "go. Form "is obtained.

次に、形態素と文法カテゴリ名との対応表(第5図)を参
照することにより、「代名詞・・N」、「格助詞・・CP」、
「名詞・・N」などを得る。
Next, by referring to the correspondence table (FIG. 5) between morphemes and grammatical category names, "pronoun ... N", "case particle ... CP",
Get "Noun ... N" etc.

次に第6図に従って構文規則「NP→N」、「NPC→NP,CP」を
文の並びの順に適用することにより、「彼が」の部分を、
NPCでまとめる。構文生成時の制約条件の参照により、
今の場合、無条件にNPCがまとめられる。
Next, by applying the syntax rules “NP → N” and “NPC → NP, CP” in the order of the sentence sequence according to FIG.
Summarize with NPC. By referring to the constraint conditions at the time of syntax generation,
In this case, NPCs are unconditionally put together.

次に問題を含む「は」、「学校」の部分へ進む。上と同様に
して「は学校」を「NP→N,N」でNPとしてまとめることがで
きる。この場合構文生成上の制約条件の参照で、「は」が
制約条件に該当する。
Next, proceed to the "ha" and "school" parts that contain the problem. In the same way as above, "ha school" can be summarized as NP by "NP → N, N". In this case, "ha" corresponds to the constraint condition when referring to the constraint condition on the syntax generation.

以上の手順を繰り返すことにより、第8図の構文解析木
を得る。
By repeating the above procedure, the syntax analysis tree of FIG. 8 is obtained.

構文木の成長に対し、制約条件を含む部分はそうでない
部分に対し、構文的な問題を含んでいる可能性が高い。
5に蓄積された構文解析の結果から構文の成長に制約の
ある文字列を抽出することが出来る。これを他と区別し
て表示することにより文章の校正を行なうことができ
る。制約条件の表現は形態素自体で表現すことができる
他に、形態素のカテゴリ名で指定する場合も有り得る。
又、制約条件から校正文字列を抽出する判断の基準は制
約条件を数値やレベル値で設定し、水準値との比較によ
り行なうこともありうる。
For the growth of the syntax tree, the part that contains the constraint condition is likely to contain the syntactic problem for the part that does not.
From the result of the syntactic analysis accumulated in 5, it is possible to extract a character string having a constraint on the syntactic growth. The text can be proofread by displaying it separately from the others. The constraint expression can be expressed by the morpheme itself, or can be specified by the category name of the morpheme.
Further, the criterion for judging the calibration character string from the constraint condition may be set by setting the constraint condition by a numerical value or a level value and comparing it with the level value.

以上の説明に出現しない分岐の処理を簡単に述べる。2
6は次に形態素あるいは構文解析を行なう文字列を選択
するモジュールである。入力文字列がなければ一連の処
理を終了する。27は形態素解析上問題のある文字列を
含んだ処理であり、本特許とは別途の方法で校正を行な
うことができる。
The processing of the branch that does not appear in the above description will be briefly described. Two
6 is a module for selecting a morpheme or a character string to be syntactically analyzed. If there is no input character string, the series of processing ends. Reference numeral 27 is a process including a character string having a problem in morphological analysis, and the proofreading can be performed by a method different from that of the present patent.

〈発明の効果〉 本発明の効果は、校正の専門的な知識が内蔵されている
ため、専門知識の習得が不要であり素人でも校正を精度
よく行なうことができるようになることである。校正の
主な作業を本装置で行なうことができるため使用者は校
正作業の従事時間を少なくすることができる。
<Effect of the Invention> The effect of the present invention is that since the expert knowledge of the calibration is built in, it is not necessary to acquire the expert knowledge, and even an amateur can perform the calibration with high accuracy. Since the main work of the calibration can be performed by this device, the user can reduce the working time of the calibration work.

また、日本語の文章の中から自動的に校正の必要のある
文字列を抽出し、校正用の辞書を用いて置き換えるべき
文字列を提示したり、区別して表示したり出来るので校
正作業者の疲労、精神的負担を軽減するのに効果があ
る。
In addition, it is possible to automatically extract a character string that needs proofreading from a Japanese sentence and present the character string to be replaced using a proofreading dictionary or display it separately so that the proofreader's Effective in reducing fatigue and mental burden.

また、たとえば片仮名の「ヘ」と平仮名の「へ」の間違いの
ような人間では見落としがちな間違いを抽出することも
出来、校正の精度の向上の上からも効果がある。また、
ワードプロセサなどの装置と組み合わせることにより、
校正によって引き起こされる印刷、コピーなどの一連の
再作業を省略することが出来、文書作成作業の効率を高
めることが期待出来る。
In addition, it is possible to extract mistakes that are often overlooked by humans, such as the mistakes of katakana “f” and hiragana “he”, which is effective in improving the accuracy of calibration. Also,
By combining with a device such as a word processor,
A series of re-work such as printing and copying caused by proofreading can be omitted, and the efficiency of document creation can be expected to be improved.

又、構文や意味的な間違いの部分も取り出すことが出
来、校正作業の効率を上げることが期待出来る。
In addition, it is possible to take out the part of the syntax and semantic errors, and it can be expected to improve the efficiency of the proofreading work.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明装置の構成ブロック図、第2図は入力手
段により入力された文字列の例を示す図、第3図は辞書
の例を示す図、第4図が文法情報の例を示す図、第5図
は校正用辞書の例を示す図、第6図は処理の概略フロー
図、第7図は校正候補の表示例を示す図、第8図は構文
規則を文の並びの順に適用した例を示す図である。 1は入力手段、2は入力文字記憶手段、3は辞書記憶手
段、4は文法記憶手段、5は制御手段、6は構文解析手
段、7は表示手段、8は形態素解析手段
FIG. 1 is a block diagram showing the configuration of the device of the present invention, FIG. 2 is a diagram showing an example of a character string input by input means, FIG. 3 is a diagram showing an example of a dictionary, and FIG. 4 is an example of grammatical information. FIG. 5, FIG. 5 is a diagram showing an example of a proofreading dictionary, FIG. 6 is a schematic flow chart of processing, FIG. 7 is a diagram showing a display example of proofreading candidates, and FIG. It is a figure which shows the example applied in order. 1 is input means, 2 is input character storage means, 3 is dictionary storage means, 4 is grammar storage means, 5 is control means, 6 is syntactic analysis means, 7 is display means, and 8 is morpheme analysis means.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 大崎 幹雄 大阪府大阪市阿倍野区長池町22番22号 シ ヤープ株式会社内 (72)発明者 森下 太朗 大阪府大阪市阿倍野区長池町22番22号 シ ヤープ株式会社内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Mikio Osaki 22-22 Nagaike-cho, Abeno-ku, Osaka-shi, Osaka Inside Sharp Corporation (72) Inventor Taro Morishita 22-22 Nagaike-cho, Abeno-ku, Osaka Within the corporation

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】見出しと該見出しの形態素情報を記憶した
辞書手段と、 日本語の文法情報を記憶した文法手段と、 構文の生成規則及び該生成規則の制約条件を記憶した構
文規則手段と、 入力された文章を記憶する記憶手段と、 前記記憶手段に記憶された文章を仮に分割する分割手段
と、 前記分割手段にて分割された仮の文字列毎に、前記辞書
手段及び前記文法手段を用いて形態素解析する形態素解
析手段と、 前記形態素解析手段による形態素解析に成功した場合
に、形態素情報を蓄積する蓄積手段と、 前記蓄積手段に蓄積された形態素情報について前記構文
規則手段の生成規則を適用して、構文解析木を生成する
構文解析手段と、 前記構文規則手段の制約条件を参照して、前記構文解析
手段にて生成された構文解析木の構文的妥当性を判断
し、構文的妥当性の低い構文構成要素を校正すべき文字
列として他と区別して表示する表示手段と、 前記表示手段にて他と区別して表示された文字列をキー
入力により変更するキー入力変更手段とを具備すること
を特徴とする日本語文章校正装置。
1. A dictionary means storing a headline and morpheme information of the headline, a grammar means storing Japanese grammatical information, a syntax rule means storing a syntax generation rule and constraint conditions of the generation rule, A storage unit that stores the input sentence, a dividing unit that temporarily divides the sentence stored in the storage unit, and the dictionary unit and the grammar unit for each temporary character string divided by the dividing unit. Morphological analysis means for using morpheme analysis, accumulation means for accumulating morpheme information when the morpheme analysis by the morpheme analysis means is successful, generation rules of the syntax rule means for the morpheme information accumulated in the accumulation means By applying it, the syntactic analysis means for generating the syntactic analysis tree and the syntactical validity of the syntactic analysis tree generated by the syntactic analysis means are determined by referring to the constraint conditions of the syntactic rule means. Display means for distinguishing and displaying a syntax component having a low syntactical validity as a character string to be proofread, and key input for changing the character string displayed separately from the other by the display means by key input. A Japanese grammar proofreading device comprising a changing means.
JP61054478A 1986-03-10 1986-03-10 Japanese sentence proofreading device Expired - Lifetime JPH061468B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61054478A JPH061468B2 (en) 1986-03-10 1986-03-10 Japanese sentence proofreading device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61054478A JPH061468B2 (en) 1986-03-10 1986-03-10 Japanese sentence proofreading device

Publications (2)

Publication Number Publication Date
JPS62209659A JPS62209659A (en) 1987-09-14
JPH061468B2 true JPH061468B2 (en) 1994-01-05

Family

ID=12971773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61054478A Expired - Lifetime JPH061468B2 (en) 1986-03-10 1986-03-10 Japanese sentence proofreading device

Country Status (1)

Country Link
JP (1) JPH061468B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0682364B2 (en) * 1987-12-14 1994-10-19 日本電信電話株式会社 Japanese sentence processing method
JPH01169569A (en) * 1987-12-24 1989-07-04 Toshiba Corp Method for elaborating sentence in document producing device

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60136867A (en) * 1983-12-26 1985-07-20 Ricoh Co Ltd Part of speech determination device
JPS60193073A (en) * 1984-03-14 1985-10-01 Ricoh Co Ltd Japanese word analyzer
JPS60193074A (en) * 1984-03-14 1985-10-01 Ricoh Co Ltd Analyzer of japanese language

Also Published As

Publication number Publication date
JPS62209659A (en) 1987-09-14

Similar Documents

Publication Publication Date Title
US5490061A (en) Improved translation system utilizing a morphological stripping process to reduce words to their root configuration to produce reduction of database size
US5774833A (en) Method for syntactic and semantic analysis of patent text and drawings
JP3220560B2 (en) Machine translation equipment
US20030149692A1 (en) Assessment methods and systems
JPS62163173A (en) Mechanical translating device
US20070011160A1 (en) Literacy automation software
JPH05120324A (en) Language processing system
JPH061468B2 (en) Japanese sentence proofreading device
JPS6190269A (en) Translation system
JP2626722B2 (en) Japanese generator
Karimi Manesh et al. A Framework for Evaluating Word Boundary Detection in Persian Tokenizers
JP2719453B2 (en) Machine translation equipment
JPS62272357A (en) System for displaying error of input sentence in mechanical translating system
JP3197110B2 (en) Natural language analyzer and machine translator
Iyyappan Online Tamil Error Correctors and Their Needs: Dr. K. Iyyappan Guest Lecturer, Department of Tamil, LN Government College, Ponneri-601204 Call: 9962660279 Email: agniiyyappan@ gmail. com
JP2794919B2 (en) Machine translation equipment
JP2915225B2 (en) Document creation device
JPS63163956A (en) Document preparation and correction supporting device
JP4092861B2 (en) Natural language pattern creation apparatus and method
JPS62209663A (en) Correcting device for japanese sentence
JPH01185766A (en) Kana/kanji conversion device
JPH0486948A (en) Method for preparing kana-added data base utilizing dictionary by fields
JPS6190268A (en) Translation system
JPH0332105B2 (en)
JPS62209662A (en) Correcting device for japanese sentence