JPH063596B2 - 日本語文章校正装置 - Google Patents

日本語文章校正装置

Info

Publication number
JPH063596B2
JPH063596B2 JP61054474A JP5447486A JPH063596B2 JP H063596 B2 JPH063596 B2 JP H063596B2 JP 61054474 A JP61054474 A JP 61054474A JP 5447486 A JP5447486 A JP 5447486A JP H063596 B2 JPH063596 B2 JP H063596B2
Authority
JP
Japan
Prior art keywords
proofreading
dictionary
notation
character string
temporary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61054474A
Other languages
English (en)
Other versions
JPS62209661A (ja
Inventor
茂起 空閑
敏幸 田中
太朗 森下
信夫 中村
幹雄 大崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP61054474A priority Critical patent/JPH063596B2/ja
Publication of JPS62209661A publication Critical patent/JPS62209661A/ja
Publication of JPH063596B2 publication Critical patent/JPH063596B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 <産業上の利用分野> 本発明は、日本語文章の中から、特定の基準に合わない
表記、表現を抽出し、校正する日本語文章校正装置に関
するものである。
<従来の技術> 欧米では、ワードプロセッサが早くから発展したため関
連技術が進んでおり、スペルのチェック、コレクトの機
能を持った装置が実用化されている。欧米の言葉が単語
単位に句切られて記述されるのに比べ、日本語は句切り
のない漢字仮名交り文で記述されるのが通常であり、ま
た正書法が徹底していないため、解析が難しく校正を自
動化する装置も実用化されていない。
日本語の校正方法として従来用いられているのは複数の
人が対になり読み合わせをして、問題のある点を抽出す
るあるいは校正の専門的な知識を持った人が知識に基づ
いて文章を逐次照合する方法である。
前者に対しては漢字仮名交りの文章を解析して音声に変
換し読み合わせを機械との間で行うことのできる校正装
置が提案されている。
しかし後者に対する装置は、校正の自動化あるいは校正
の専門化の支援を行う機能が必要でありより高度の技術
が要求されるため、概念の提案があるのみで該装置を構
成する手段、校正の具体的な手段は報告されていない。
<発明が解決しようとする問題点> 校正を行うためには校正の専門的な知識が必要であり、
その習得に時間がかかっていた。
又、校正の専門的知識を有した人の数は少なく大量の文
章の校正を行う場合や、急ぐ必要のある校正の場合支障
を来していた。
又、校正の知識を有した専門家の立場では、校正を正し
く行うためには細かい所にまで注意を払う必要があり、
精神的な負担を強いられていた。
にも拘わらず人間では見付けにくい誤りや、見落としが
ちな誤りもあり、校正の精度の面で問題があった。
又、校正の専門的な知識を持たない一般の人がワードプ
ロセサなどを用いて文書を作成するときに細かい間違い
の校正のために文書ファイルの読み出し、印刷、コピー
などの再処理を必要とし、文書作成作業の効率の点で問
題があった。
音声読み合わせによる日本語の文章校正システム以外の
具体的な提案は存在しないが、欧米のスペルチェック、
コレクト機能の実現方法は校正すべき文字・記号列のを
調査する対象の文と別の所に表示するため原文との関係
がつかみにくいという問題があった。
本発明は、日本語の文章の中から校正すべき文字・記号
列(以下特別の断わりなしに文字・記号列を文字列と表
わすことがある。)を抽出し、該文字列に置き換えるべ
き文字列を候補として原文と同一の文章中に提示すると
ともに、装置の使用者が候補の中から正しい表記を選択
出来るようにする手段を提供し、かかる問題を解決しよ
うとするものである。
<問題点を解決するための手段> 本発明は、見出しと該見出しの文法情報を記憶した辞書
手段と、前記辞書手段の見出し或いは文法情報の接続関
係を記憶した文法手段と、基準に合わない表記と該基準
に合わない表記に対応した正しい表記とを記憶する校正
用辞書手段と、文章を記憶する記憶手段と、前記記憶手
段に記憶された文章を仮の文節に分割する分割手段と、
前記分割手段にて分割された仮の文節毎に、前記辞書手
段と前記文法手段とを参照して、前記仮の文節が正常文
節であるか否か判断する第1の判断手段と、前記第1の
判断手段による正常文節でないとの判断に応答して、前
記仮の文節について、前記校正用辞書手段と前記文法手
段とを参照して、前記仮の文節が前記校正用辞書の校正
にて正常文節となるか否かを判断する第2の判断手段
と、前記第2の判断手段による正常文節であるとの判断
に応答して、前記仮の文節及び前記校正用辞書手段の前
記仮の文節の正しい表記の候補を表示する表示手段と、
前記表示手段にて表示された候補の中から所望する表記
を選択する選択手段とから構成される。
<作用> 本発明は、文章を仮の文節に分割し、分割された仮の文
節についての辞書手段及び文法手段の参照から、該仮の
文節が正常であるか否かを判断し、該仮の文節が正常で
ない、つまり、校正の必要があると判断されると、該仮
の文節について校正用辞書手段と文法手段とを参照し、
該仮の文節が校正用辞書の校正にて正常文節となると判
断されると、該仮の文節及び校正用辞書手段の該仮の文
節の正しい表記の候補を表示し、使用者に選択させるこ
とにより、文章の校正を行うものである。
<実施例> 以下図に基づいて本発明を詳細に説明する。
第1図は本発明に係わる日本語文章校正装置のブロック
構成図である。
図において1は日本語の文字列を入力手段である。2は
該入力手段により入力された日本語の文字列を記憶する
手段である。入力手段は通常キーボードが用いられるが
逐次的に入力を行なわないでもたとえばフロッピーディ
スク、磁気テープなどのように入力した日本語の文字列
を記憶する外部記憶手段で代用することも可能である。
即ち、1が省略された構成も存在しうる。
3は基準に合致する日本語の文字列からなる辞書を記憶
する手段である。4は日本語の文法を記憶する手段であ
る。日本語は正書法が確立されていないため、ある基準
に合致した表記、文法が正しいとされる。以下正しい表
記、文法と記述するときは、それが、ある基準に合致し
ていることを意味する。
5は上記2に蓄積された日本語の文字列と3に記憶され
た辞書、4に記憶された文法との比較照合を行ない、校
正の可能性のある部分を抽出したり、途中結果を記憶し
たり、表示の司令などをしたりする制御手段である。該
制御手段には制御によって得られる結果を記憶する手段
を含む。
6は5によって抽出された文字列に対応する正しい表記
の文字列などからなる校正用辞書を記憶しておく手段で
ある。7は入力された日本語、照合の途中結果、校正す
べき文字列、置き換えるべき文字列などを表示するCR
Tなどの表示の手段である。8は7によって表示された
置き換えるべき候補の中から正しい表記の候補を選択す
る手段である。
第2図は入力手段により入力された文字列の例である。
第3図は3に記憶された辞書の例である。9は入力され
た文字列と比較される見出しである。この見出しの表記
は、例えば国語審議会による現代仮名遣い、新聞社、会
社などの規定に基づいたものになっている。今の場合、
「うけとる」は「受け取る」を正しい表記の基準として
いることを示している。10は該見出しの文法情報の一
つである品詞情報である。このように辞書には見出しの
文法的な処理を行うための文法情報が含まれることもあ
る。11は該見出しが自立語であり、12は付属語であ
ることを表している。付属語の中の活用語尾は活用のあ
る自立語の語幹に接続した形で見出しとなることもあり
うる。
第4図は4に記憶された文法情報の例である。見易くす
るために第3図で示した見出しを併せて示している。1
3は10で表される見出しあるいは品詞情報の接続関係
を規定した文法情報である。例えば下一段動詞の語幹
「受け」は助動詞「る」に接続し、5段動詞の語幹「受
け取」は「ラ行の活用語尾」あるいは、はつ音の「っ」
に接続出来ることを表している。
14は各見出しが文節の終了条件を満たしうるか否かを
規定した文法であり、○は分節終了の条件を満たし、×
はそれを満たさないことを示している。
第5図は基準に合わない表記を正しい表記に置き換える
ための校正用の辞書を示している。第5図は基準に合わ
ない表記を正しい表記に置き換えるための校正用の辞書
を示している。15は基準に合わない表記であり、16
はそれに対応した正しい表記である。16は第3図の辞
書の該当見出しのポインタなどで代用することも可能で
ある。
第6図は本発明の該略フロー図である。17は入力文字
列を5の中のスタックに蓄積する。18は蓄積された文
字記号列を漢字コードなどで仮に分割する。19は仮に
分割された各入力文字列を読み込む。20は19で読み
込まれた入力文字列と辞書の見出しとを比較する。その
結果により照合に成功する場合と失敗する場合に分岐す
る。21は照合に成功した文字列に対し文法的な制約条
件をを調べる。22は辞書、文法の双方の照合に成功し
た文字列を蓄積する。23は照合すべき次の入力文字列
を調べる。24は辞書、文法のいずれかの照合に失敗し
た場合現在照合している文字列が不適当と見なし別の入
力文字列を切り出す。25は校正用辞書の見出しと24
で切り出された文字列を比較する。26は24の文法的
な適合の照合を行なう。27は校正用辞書、文法照合に
成功し置き換える文字列及び校正すべき部分を表示す
る。
28は置き換える文字列はないが校正の可能性が高い部
分として他と区別して表示する。29は本装置から提示
される置き換えるべき表記を選択あるいは別途の入力・
編集手段により校正を行なう。
第7図は本特許の特徴である校正すべき文字列及び置き
換えるべき文字列の表示の例を示す。
30は入力原文の文字列である。31はその間にはさま
れる文字列が置き換え文字列出あることを示す記号であ
り、原文と区別できれば何であっても良い。32は置き
換えるべき文字列である。
以下、第2図に上げた例文と第3、第4図に上げた辞書
と文法を用いて実際の処理の流れを述べる。最初に入力
文字列「葉書を受けとる。」を5にスタックする。次
に、スタックされた文字列のコードなどを利用して入力
文字列を仮分割する。これにより「葉書を受けとる。」
は「葉書を」と「受けとる。」に分割される(18)。
次に分割された入力文字「葉書を」が制御装置5に読み
込まれ(19)、第3、第4図の辞書の見出し(9)と
照合される(20)。今の場合、辞書中の「葉書」の部
分が一致する。この情報を5の中にスタックし、該当見
出しの接続条件(10)と次の入力文字列を比較する。
今の場合双方とも「を」であり、一致する。
次に、第3図の「を」を見出しとする項目の文節終了条
件を第4図の14で調べる(21)。14より今の場合
文節終了条件を満足することが分かり、「葉書を」を正
常文節として5にスタックする(22)。
次に、「受けとる。」の部分の処理へ進む(23)。
「葉書を」と同じように辞書と「受けとる。」を比較す
ることにより、辞書中の「受け」が一致する。「受け」
の接続条件13より導き出された「る」は後続の入力文
字列と一致しないので接続不可と決定される。また、
「受け」は第4図の14により、文節終了条件を満たす
ので、「受け」を正常文節として5にスタックする。
以上の繰り返しで「とる。」を辞書照合する。今回は辞
書照合に失敗し、24に分岐する。ここでは文節切り出
しの見直しを行ない、前回正常文節としてスタックした
「受け」を辞書照合の起点に戻す。
これにより、「受けとる。」が辞書照合の対象となる。
今回は第3、第4図の辞書の見出しではなく校正用辞書
の見出し(15)と比較する(25)。その結果「受け
と」が一致する。「葉書を」と同様に文法の照合を行な
う(26)ことにより、成功する場合と失敗する場合に
分岐する。今の例では文法条件を満足し、「受けと
る。」を校正文節としてスタックする(27)。これと
同時に「受けとる。」に対する「受け取る。」を置き換
えの候補として抽出し、第7図のように7に表示するこ
とができる。
装置が置き換えるべき表記の候補として提示した表記が
正しい場合はキーボードなどの選択手段を用い、装置の
提示する文字列「受け取」を選択することにより、「葉
書を受けとる。」を葉書を受け取る。」と校正すること
ができる(29)。
反対に原文の方が正しい場合は原文選択キーにより原文
の表記を選ぶことができる。
今の説明で出てこない分岐の説明を簡単に行なう。校正
用辞書あるいは文法の照合に失敗する分岐の場合は装置
から提示される校正の候補はないが校正の必要の高い部
分として他の部分と区別し、別途1を使って校正するこ
とができる。
<発明の効果> 本発明の効果は、校正の専門的な知識が内蔵されている
ため、専門知識の習得が不要であり素人でも校正を精度
よく行なうことができるようになることである。
校正の主な作業を本装置で行なうことができるため使用
者は校正作業の従事時間を少なくすることができる。
また、日本語の文章の中から自動的に校正の必要のある
文節を切り出し、該文節についてのみ、校正用辞書を参
照し、正しい表記の候補を表示して、使用者に選択させ
ることにより、文章の校正を行うものであり、文節とい
う小さな文字列毎に校正の必要を判断するので、処理時
間が低減されるだけでなく、使用者は正しい表記の候補
を選択することにより校正処理が行え、使用者の校正処
理にかかる負担が軽減される。また、たとえば片仮名の
「ヘ」と平仮名の「へ」の間違いのような人間では見落
としがちな間違いを抽出することも出来、校正の精度の
向上の上からも効果がある。
また、ワードプロセサなどの装置と組み合わせることに
より、校正によって引き起こされる印刷、コピーなどの
一連の再作業を省略することが出来、文書作成作業の効
率を高めることが期待できる。
また、原文の中に置き換えるべき文字列が表示されるた
め校正すべき文字列の位置、置き換え文字列そのもの同
定がやりやすく全体の文との関係を把握しやすいので校
正の作業の効率が向上する。
【図面の簡単な説明】
第1図は本発明装置の構成ブロック図、第2図は入力手
段により入力された文字列の例を示す図第3図は辞書の
例を示す図、第4図は文法情報の例を示す図、第5図は
校正用辞書の例を示す図、第6図は処理の概略フロー
図、第7図は校正候補の表示例を示す図である。 1は入力手段、2は入力文字記憶手段、3は辞書記憶手
段、4は文法記憶手段、5は制御手段、6は校正用辞書
記憶手段、7は表示手段、8は選択手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 中村 信夫 大阪府大阪市阿倍野区長池町22番22号 シ ヤープ株式会社内 (72)発明者 大崎 幹雄 大阪府大阪市阿倍野区長池町22番22号 シ ヤープ株式会社内 (56)参考文献 特開 昭59−127137(JP,A)

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】見出しと該見出しの文法情報を記憶した辞
    書手段と、 前記辞書手段の見出し或いは文法情報の接続関係を記憶
    した文法手段と、 基準に合わない表記と該基準に合わない表記に対応した
    正しい表記とを記憶する校正用辞書手段と、 文章を記憶する記憶手段と、 前記記憶手段に記憶された文章を仮の文節に分割する分
    割手段と、 前記分割手段にて分割された仮の文節毎に、前記辞書手
    段と前記文法手段とを参照して、前記仮の文節が正常文
    節であるか否か判断する第1の判断手段と、 前記第1の判断手段による正常文節でないとの判断に応
    答して、前記仮の文節について、前記校正用辞書手段と
    前記文法手段とを参照して、前記仮の文節が前記校正用
    辞書の校正にて正常文節となるか否かを判断する第2の
    判断手段と、 前記第2の判断手段による正常文節であるとの判断に応
    答して、前記仮の文節及び前記校正用辞書手段の前記仮
    の文節の正しい表記の候補を表示する表示手段と、 前記表示手段にて表示された候補の中から所望する表記
    を選択する選択手段と、 を具備することを特徴とする日本語文章校正装置。
JP61054474A 1986-03-10 1986-03-10 日本語文章校正装置 Expired - Lifetime JPH063596B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61054474A JPH063596B2 (ja) 1986-03-10 1986-03-10 日本語文章校正装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61054474A JPH063596B2 (ja) 1986-03-10 1986-03-10 日本語文章校正装置

Publications (2)

Publication Number Publication Date
JPS62209661A JPS62209661A (ja) 1987-09-14
JPH063596B2 true JPH063596B2 (ja) 1994-01-12

Family

ID=12971667

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61054474A Expired - Lifetime JPH063596B2 (ja) 1986-03-10 1986-03-10 日本語文章校正装置

Country Status (1)

Country Link
JP (1) JPH063596B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS611786A (ja) * 1985-05-24 1986-01-07 新日軽株式会社 内外二重サツシの気密装置

Also Published As

Publication number Publication date
JPS62209661A (ja) 1987-09-14

Similar Documents

Publication Publication Date Title
US6424983B1 (en) Spelling and grammar checking system
US5907821A (en) Method of computer-based automatic extraction of translation pairs of words from a bilingual text
CA2523992C (en) Automatic segmentation of texts comprising chunks without separators
US5079701A (en) System for registering new words by using linguistically comparable reference words
JPH063596B2 (ja) 日本語文章校正装置
JPH07230472A (ja) 人名誤読補正方法
JP2004265440A (ja) 未知語登録装置および方法並びに記録媒体
JPH0130173B2 (ja)
JPH0531186B2 (ja)
JPS62209663A (ja) 日本語文章校正装置
JPS63118868A (ja) 日本語文章校正装置
JP2002073656A (ja) 異表記正規化処理・異表記展開処理方法および該処理方法による文書検索方法、該処理装置および文書検索装置並びにプログラム記録媒体
JP3581237B2 (ja) 未知語登録装置および方法並びに記録媒体
JPS61208164A (ja) 日本語文章校正装置の表示方式
JPH061468B2 (ja) 日本語文章校正装置
JPS62209662A (ja) 日本語文章校正装置
JP3873299B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JPS62209664A (ja) 日本語文章校正装置
JP2575947B2 (ja) 文節切出し装置
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
JP2592995B2 (ja) 文節切出し装置
JPH04330565A (ja) 自然言語処理システム
JP3118880B2 (ja) 日本語文章処理装置
JPH02136959A (ja) 日本文訂正候補抽出装置
Kapočiūtė et al. Rule-based annotation of Lithuanian text corpora