JPH07129577A - 文書校正支援装置 - Google Patents

文書校正支援装置

Info

Publication number
JPH07129577A
JPH07129577A JP5292414A JP29241493A JPH07129577A JP H07129577 A JPH07129577 A JP H07129577A JP 5292414 A JP5292414 A JP 5292414A JP 29241493 A JP29241493 A JP 29241493A JP H07129577 A JPH07129577 A JP H07129577A
Authority
JP
Japan
Prior art keywords
compound word
notation
sentence
address
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5292414A
Other languages
English (en)
Inventor
Akio Yamashita
明男 山下
Hidetaka Mafune
英隆 真船
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP5292414A priority Critical patent/JPH07129577A/ja
Publication of JPH07129577A publication Critical patent/JPH07129577A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】処理対象としての文章中に含まれている複合語
に対する誤りの可能性を調べ、誤りの可能性が高い場合
には、その旨の注意をうながすことが可能にされた文書
校正支援装置を提供すること。 【構成】入力された文章を記憶する文章記憶手段1,前
記文章記憶手段から検出した複合語情報を記憶する複合
語記憶手段3,前記文章記憶手段に記憶された文章から
複合語を検出し、複合語の読みをキーとして複合語の表
記と前記文章記憶手段での位置とを前記複合語記憶手段
に登録する複合語検出手段2を備えたことを特徴とする
とともに,複合語の読みとその表記が登録されている複
合語辞書5を更に備えていることをも特徴とする文書校
正支援装置。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は文書校正支援装置に関
するものであり、処理対象の文章中に含まれている複合
語に対する誤りの可能性を調べ、誤りの可能性が高い場
合には、その旨の注意をうながすことが可能にされた文
書校正支援装置に関するものである。
【0002】
【従来の技術】近ごろ、ワードプロセッサなどの文章作
成装置を用いて文章の作成を行うことが一般的になって
いる。ところで、この文章作成装置では、例えば日本語
をかな漢字変換で作成する場合には、その変換誤りによ
って誤字が生じることがしばしばある。即ち、日本語で
は読みが同じで表記が異なるいわゆる同音異義語があ
り、変換の際に所望している単語とは異なる単語を誤っ
て選択してしまうことがある。 そこで、このような文
章作成装置で作成された文章中の単語の使用上の妥当性
を検査し、誤字を検出する誤り検出装置の実現が要望さ
れ、その開発の努力がなされている。従来、このような
誤り検出装置は、作成対象としての文章における形態素
解析や構文解析などを利用し、その解析結果に基づいて
未登録語や非文法的な単語を検出するという方法が取ら
れていた。しかしながら、この方法によるときには、複
数の単語が結合して形成された複合語について、形態的
な誤りを検出するのが困難であるために、複合語に含ま
れた単語の誤字検出を効果的に行うことができなかっ
た。このような不具合を改善するために、特開平2−3
09448公報[誤り検出装置]に例示されるような複
合語の誤り検出装置が開発された。ここで例示された誤
り検出装置においては、複合語の一部に同音異義語が含
まれているときに、この一部を同音異議語に置き換えて
作成された複合語を辞書検索し、辞書に存在していると
きに先の複合語を誤りとするようにされる。しかしなが
ら、この方法によるときには、検索用の辞書に登録され
ていない複合語は検出できず、また、複合語辞書の検索
回数が多くなり、操作の効率性に難があるという問題が
あった。 また、文書中に出現する表記の統一が取れて
いない単語を検出する装置としては、特開平5−143
587号公報[文書処理方法及び装置]に開示された装
置を挙げることができる。これによれば、単語の表記と
文法的な情報とを対応させて格納し同じ読みを持つ単語
を結び付ける情報を有する単語辞書を用いて文書中で同
じ読みを有し表記が異なる単語を指摘するようにされ
る。
【0003】
【発明が解決しようとする課題】前述されたように、近
年ではワードプロセッサなどの文章作成装置を用いて文
章の作成を行うことが一般的になっているが、例えば日
本語をかな漢字変換で作成するような場合には、その変
換操作の段階における誤りによって誤字が生じることが
多く、このために、このような文章作成装置で作成され
た文章中の単語の使用上の妥当性を検査し、誤字を検出
する誤り検出装置の実現が要望され、相応の開発がなさ
れている。ところで、従来のこの種の誤り検出装置は、
処理対象としての文章の形態素解析や構文解析などを利
用し、その結果から未登録語や非文法的な単語を検出す
るという方法が取られていたけれども、このような方法
によるときには、複数の単語が結合して形成された複合
語について形態的に誤りを検出するのが困難であり、複
合語に含まれた単語の誤字検出を効果的に行うことがで
きないという問題点があった。そこで、このような不具
合を改善するために、特開平2−309448公報[誤
り検出装置]に例示されている複合語の誤り検出装置が
開発されたが、この方法によるときには、前述されたよ
うに、検索用の辞書に登録されていない複合語は検出で
きず、また、複合語辞書の検索回数が多くなり、操作の
効率性に難があるという問題点があった。また、別の刊
行物である特開平5−143587号公報[文書処理方
法及び装置]には、文書中に出現する表記の統一が取れ
ていない単語を検出する装置が開示されている。そし
て、これによれば、辞書に登録された単語の表記の不統
一箇所は検出できるけれども、例えば、「昨日、機能仕
様について」といった文の「昨日」「機能」をも検出し
誤った指摘が多くなるという問題点がある。ここで、複
合語を意識して検出しようと思えば複合語を辞書に登録
することになるが、使用する辞書のサイズが膨大になる
といった問題点が生じてしまう。更に、同じ読みを持つ
単語を結び付ける情報が余分に必要であるという問題点
も発生する。
【0004】この発明は、前記した従来技術の欠点を除
去・改良するためになされたものであり、複合語を検出
し複合語辞書に登録されていない複合語の表記の不統一
を手掛かりに同音異義語の誤りの可能性を指摘し、ま
た、複合語辞書の検索回数を低減して処理の効率が更に
向上した文書校正支援装置を提供することを目的として
いる。
【0005】
【課題を解決するための手段】この発明は上記の目的を
達成するためになされたものであり、この発明に係る文
書校正支援装置は、入力された文章を記憶する文章記憶
手段1,前記文章記憶手段から検出した複合語情報を記
憶する複合語記憶手段3,前記文章記憶手段に記憶され
た文章から複合語を検出し、複合語の読みをキーとして
複合語の表記と前記文章記憶手段での格納開始位置とを
前記複合語記憶手段に登録する複合語検出手段2,前記
複合語記憶手段の中に、ある一つの読みに対して複数の
表記が存在する複合語を指摘する指摘手段4,を備えた
ことを特徴とするものである。また、この発明に係る別
の文書校正支援装置は、複合語の読みとその表記が登録
されている複合語辞書5を更に備えており、前記指摘手
段は、前記複合語記憶手段と前記複合語辞書とを照合し
て、ある同じ読みに対して異なる複合語の存否をも判断
・指摘する、ことを特徴とするものである。
【0006】
【作用】上記のように構成されたこの発明の文書校正支
援装置において、文章記憶手段1には処理対象となる日
本語文章が記憶される。これに続く複合語検出手段2に
おいては、内蔵の単語解析手段21および解析辞書22
が用いられて、文章記憶手段1に記憶された文章が対応
の単語列に分解され、その結果が解析結果記憶手段23
に記憶される。そして、前記分解された単語列につい
て、名詞が連続する部分等の所定のものが複合語として
検出され、この検出された複合語の表記;読み;文章記
憶手段1での格納開始位置等の所要の情報が、その読み
をキーとして複合語記憶手段3に登録される。そして、
指摘手段4によれば、複合語記憶手段3の中のある一つ
の読みに対して複数の複合語表記が存在する複合語を指
摘する作用がなされる。また、この発明の別の文書校正
支援装置においては、複合語の読みとその表記を少なく
とも記憶する複合語辞書5が更に備えられている。そし
て、この別の文書校正支援装置に含まれている指摘手段
4によれば、複合語記憶手段3の中に一つの読みに対し
て複数の複合語表記が存在するか否かの判断がなされ、
更に、前記の複合語記憶手段3に登録された複合語の読
みに基づいて複合語辞書5を検索し、該当の読みに従っ
て登録された複合語があれば、その検索結果を複合語記
憶手段3に反映させて、複合語の誤りの使用に関する指
摘がより効果的になるという利点が得られる。即ち、こ
の発明の装置によれば、処理対象の文章に含まれている
複合語を検出し、複合語辞書に登録されていない複合語
の表記の不統一を手掛かりにして同音異義語の誤りの可
能性を指摘することが可能にされ、また、複合語辞書の
検索回数を低減することによって装置による処理の効率
が著しく向上するという利点が得られることになる。
【0007】
【実施例】以下、この発明に係る文書校正支援装置の実
施例について、図1〜図21を適宜に参照しながら説明
する。
【0008】[第1実施例]図1は、この発明に係る文
書校正支援装置の第1実施例の構成を概略的に示すブロ
ック図である。この図1において、1は文章記憶手段、
2は複合語検出手段、21は単語解析手段、22は解析
辞書、23は解析結果記憶手段、3は複合語記憶手段、
そして、4は指摘手段である。まず、文章記憶手段1
は、処理対象となる日本語文章を記憶する。複合語検出
手段2は、文章記憶手段1に記憶された文章を単語解析
手段21および解析辞書22を用いて対応する単語の列
に分解し、その結果を解析結果記憶手段23に記憶す
る。そして、処理対象としての日本語文章を対応する単
語の列に分解したものについて、名詞が連続する部分あ
るいは複合語フラグがONの単語を複合語として検出
し、検出した複合語の表記;読み;文章記憶手段1での
格納開始位置等を、その読みをキーとして複合語記憶手
段3に登録する。複合語記憶手段3は、複合語検出手段
2により検出した複合語を、その読みをキーとして、複
合語の表記と文章記憶手段1での格納開始位置とともに
記憶する。指摘手段4は、複合語記憶手段3の中に一つ
の読みに対して複数の複合語表記が存在する複合語を指
摘する。
【0009】図2および図3は、上記第1実施例におけ
る処理の流れを説明するフローチャートである。以下、
この第1実施例における処理の流れについて、これら図
2および図3を主として参照しながら説明していく。
【0010】ここで、図4において、文章記憶手段1に
記憶された文章内容を例示する。この図4では、この発
明の第1実施例を説明するに必要な部分だけが示されて
おり、文章の該当部分は文番号101,102,10
3,104,105によって参照される。ここで、文番
号101が付された文章は[・・・の機能使用が・・
・。]として例示されており、[・・・]と[の]との
中間位置が位置1010とされ,[の]と[機能]との
中間位置が位置1011とされ,[機能]と[使用]と
の中間位置が位置1013とされ,そして、[使用]と
[が]との中間位置が位置1015とされている。他の
文番号が付された文章についても同様である。以下、こ
の図4に示された文章を処理対象として、図2および図
3をも参照しながら、図1の第1実施例の動作について
説明する。
【0011】まず、図2において、複合語検出手段2
は、図6〜図10および図11〜図15にそれぞれに示
されているような、解析結果記憶手段23および複合語
記憶手段3の内容を初期化する(S0)。次に、文章記
憶手段1より最初の1文(文番号101のもの)を取り
出して変数sentにセットする(S1)。この場合、
変数sentには文番号101の「・・・の機能使用が
・・・。」がセットされている。なお、文章のこのよう
な切り出しは、句点「。」またはピリオド「.」を手掛
かりにして、文章中で多く現れる方を用いて区切るよう
にされる。次に、変数sentの内容が空かどうかをチ
ェックし、「空」ではないことから、S3に処理を進め
る(S2)。これに次いで、単語解析手段21および解
析辞書22を用いて、現在の変数sentの内容を単語
の列に分解し、その結果を解析結果記憶手段23に記憶
する(S3)。
【0012】ここで、図5を参照しながら、解析辞書2
2の内容について例示的に説明する。ここでの解析辞書
22は、少なくとも見出し(表記);読み;品詞;複合
語フラグを含んでなるものである。この図5において、
[サ変名詞]という品詞は、名詞でもあり、また、「す
る」という活用語尾が後続する動詞でもあることを示す
ものである。単語解析手段21は、処理対象としての文
を文頭から文末まで単語単位で検索し、単語間の接続関
係や文節末条件等のチェックをする。そして、単語間の
接続関係が正しい組合せのうち、文節の数が最も少ない
ものを結果として出力する文節数最少法により文章解析
を行う。なお、互いに接続可能な単語の列の組合せの中
から最も適切なものを選ぶ方法としては、最長一致法や
文節数最少法等の任意所望のものを選択・使用すること
ができる。
【0013】変数sentの解析結果が記憶された解析
結果記憶手段23の内容を図6に示す。この解析結果記
憶手段23は、見出し(表記);読み;品詞;複合語フ
ラグ;開始位置;単語長(表記の長さ);からなるもの
である。いま、文番号101の文章が記憶されたものと
されており、単語長1の単語[の]の開始位置は101
0なる記号で表されており;単語長2の単語「機能」の
開始位置は1011なる記号で表されている。また、こ
れに続く単語長2の単語「使用」の開始位置は1013
なる記号で表されており;単語長1の単語[が]の開始
位置は1015なる記号で表されている。
【0014】複合語検出手段2は、内蔵されている解析
結果記憶手段23の内容をチェックし、名詞が連続する
部分あるいは複合語フラグがONの単語があるかどうか
を調べる(S4)。図6に示されているように、単語
「機能」および単語「使用」の部分が名詞の連続する部
分であるので、次のS5に処理を進めて「機能使用」を
複合語として検出し、この検出した複合語の読みをキー
として、複合語の表記と文章記憶手段1での格納開始位
置とを複合語記憶手段3に登録する(S5)。
【0015】ここで図11を参照すると、「機能使用」
なる複合語に関する複合語記憶手段3の内容が示されて
いる。この複合語記憶手段3は、見出し部31および表
記部32からなる。そして、見出し部31には、番地3
11;読み312;(検出した複合語の)表記数31
3;(対応する)表記部への番地314が含まれてい
る。また、表記部32は、番地321;表記322;
(同じ読みを持つ)次の表記へのアドレス(番地)32
3;(文章記憶手段1での格納開始)位置324;読み
への番地325;(辞書の)種別326が含まれてい
る。ここで見出し部31の番地311についてみると、
これはa1i(iは自然数)なる記号で表されている。
また、表記部32の番地321についてみると、これは
a2i(iは自然数)なる記号で表されている。(辞書
の)種別326には、検出した複合語の表記が単語解析
辞書22または後述の複合語辞書5に登録されていれ
ば、その種別が区分されて格納される。即ち、検出した
複合語の表記が単語解析辞書22に登録されていれば、
この(辞書の)種別326にdic1を格納し、また、
複合語辞書5に登録されていればdic2を格納するよ
うにされる。そして、いずれの辞書にも登録されていな
ければ何も格納しない。
【0016】ここでの「機能使用」なる複合語の場合、
これが最初の検出であり、この読みに対する見出し部3
1には始めは何も登録されていない。そこで、この見出
し部31の番地311における第1の番地a11の適所
に「きのうしよう」に関する所要の情報を格納する。こ
れを具体的にいえば、読み312に「きのうしよう」な
るかな文字列を格納し、表記数313に(現在のところ
1つしか検出していないので)1を格納し、表記への番
地314には表記部32における番地321の第1の番
地a21を格納する。また、ここでの「きのうしよう」
に対する表記部32にも、始めは何も登録されていな
い。そこで、この表記部32における番地321の第1
の番地a21の適所に「機能使用」に関する情報を格納
する。これを具体的にいえば、表記部32における番地
321の第1の番地a21の対応箇所については、表記
322には「機能使用」を格納し、次の表記へのアドレ
ス(番地)323には(現在のところ1つしか検出して
いないので)自分自身の番地a21を格納し、位置32
4には文章記憶手段1内での格納開始位置1011を格
納する。そして、読みへの番地325には見出し部31
の番地311における第1の番地a11を格納し、(辞
書の)種別326には何も格納しない。
【0017】次に複合語検出手段2は、処理をS5から
S6に進め、変数sentの内容に続く1文を文章記憶
手段1から抽出して変数sentにセットし、S2に処
理を戻す。S2からS6の処理を何回か繰り返して図4
の文番号102の文「・・・要求使用・・・。」が変数
sentにセットされたものとする。ここでの変数se
ntの内容は「空」でないので、S2からS3へ処理を
進める。
【0018】ここでの文番号102の文「・・・要求使
用・・・。」に対して、複合語検出手段2においては、
変数sentの内容を単語解析手段21および解析辞書
22を用いて単語の列に分解し、その結果を解析結果記
憶手段23に記憶する(S3)。この解析結果記憶手段
23の内容例は図7に示されている。これに次いで、解
析結果記憶手段23の内容をチェックし、名詞が連続す
る部分あるいは複合語フラグがONの単語があるかどう
かを調べる(S4)。前記図7において示されているよ
うに、単語「要求」+単語「使用」の部分が名詞の連続
する部分であるので、S5に処理を進めて、「要求使
用」を複合語として検出し、この検出した複合語の読み
をキーとして、複合語の表記と文章記憶手段1での格納
開始位置とを複合語記憶手段3に登録する(S5)。
【0019】図12には、「要求使用」に関する情報が
追加された複合語記憶手段3の内容が示されている。な
お、前述された図11においては、「ようきゅうしよ
う」に対して何も登録されていない。ここで改めて図1
2を参照すると、見出し部31における番地311の第
2の番地a12には「ようきゅうしよう」に関する情報
が格納される。そして、表記部32ににおける番地32
1の第2の番地a22には「要求使用」に関する情報が
格納される。
【0020】次に複合語検出手段2は処理をS5からS
6に進め、変数sentの内容に続く1文を文章記憶手
段1から抽出して変数sentにセットし、S2に処理
を戻す。いま、S2からS6の処理を何回か繰り返して
図4の文番号103の文「・・・帰納使用・・・。」が
変数sentにセットされたものとする。ここでの変数
sentの内容は「空」でないので、S2からS3へ処
理を進める。
【0021】この文番号103の文「・・・帰納使用・
・・。」に対して、複合語検出手段2においては、変数
sentの内容を単語解析手段21および解析辞書22
を用いて単語の列に分解し、その結果を解析結果記憶手
段23に記憶する(S3)。ここでの解析結果記憶手段
23の内容例は図8に示されている。そして、解析結果
記憶手段23の内容をチェックし、名詞が連続する部分
あるいは複合語フラグがONの単語があるかどうかを調
べる(S4)。前記図8に示されているように、単語
「帰納」+単語「使用」の部分が名詞の連続する部分で
あるので、S5に処理を進めて「帰納使用」を複合語と
して検出し、この検出した複合語の読みをキーとして、
複合語の表記と文章記憶手段1での格納開始位置とを複
合語記憶手段3に登録する(S5)。
【0022】図13には、「帰納使用」に関する情報が
追加された複合語記憶手段3の内容が示されている。な
お、前記された図12においては、「きのうしよう」と
いう読みと表記が(見かけ上既に)登録されている。そ
こで、前記の図12における見出し部31における表記
数313の数(=1)だけ、表記部32の(同じ読みを
持つ)次の表記へのアドレス(番地)323で連結され
た表記をたどると、前記表記部32の番地321におけ
る第1の番地a21で示される表記部に到着する。この
第1の番地a21に対応する適所には、「機能使用」に
関する表記情報が格納されている。そこで、図13に示
されているように、見出し部31における表記数313
の数を1だけ増やし(=2)、対応の表記情報「帰納使
用」を表記部32の番地321における第3の番地a2
3に格納し、これに合わせて、前記表記部32の番地3
21における第1の番地a21に対応する(同じ読みを
持つ)次の表記へのアドレス(番地)323を(図12
における)a21からa23に変更する。そして、表記
部32の番地321における第3の番地a23に対応す
る(同じ読みを持つ)次の表記へのアドレス(番地)3
23には先のa21を格納する。
【0023】次に複合語検出手段2は、処理をS5から
S6に進め、変数sentの内容に続く1文を文章記憶
手段1から抽出して変数sentにセットし、S2に処
理を戻す。いま、S2からS6の処理を何回か繰り返し
て図4の文番号104の文「・・・要求仕様・・・。」
が変数sentにセットされたものとする。ここで、変
数sentの内容は「空」ではないので、S2からS3
へ処理を進める。
【0024】この文番号104の文「・・・要求仕様・
・・。」に対して、複合語検出手段2においては、変数
sentの内容を単語解析手段21および解析辞書22
を用いて単語の列に分解し、その結果を解析結果記憶手
段23に記憶する(S3)。この解析結果記憶手段23
の内容例は図9に示されている。解析結果記憶手段23
の内容をチェックし、名詞が連続する部分あるいは複合
語フラグがONの単語があるかどうかを調べる(S
4)。前記図9において示されているように、「要求仕
様」の複合語フラグがONであるので、S5に処理を進
めて、「要求仕様」を複合語として検出し、この検出し
た複合語の読みをキーとして、複合語の表記と文章記憶
手段1での格納開始位置とを複合語記憶手段3に登録す
る(S5)。
【0025】図14には、複合語「要求仕様」に関する
情報が追加された複合語記憶手段3の内容が示されてい
る。なお、前記された図13においては、「ようきゅう
しよう」という読みと表記が(見かけ上既に)登録され
ている。そこで、前記の図13における見出し部31に
おける表記数313の数(=1)だけ、表記部32の
(同じ読みを持つ)次の表記へのアドレス(番地)32
3で連結された表記をたどると、前記表記部32の番地
321における第2の番地a22で示される表記部に到
着する。この第2の番地a22に対応する適所には、
「要求使用」に関する表記情報が格納されている。そこ
で、図14に示されているように、見出し部31の番地
311における第2の番地a12に対応する表記数31
3の数を1だけ増やし(=2)、対応の表記情報「要求
仕様」を表記部32の番地321における第4の番地a
24に格納する。そして、これに合わせて、前記表記部
32の番地321における第2の番地a22に対応する
(同じ読みを持つ)次の表記へのアドレス(番地)32
3をa24にする。なお、ここでの複合語「要求仕様」
は解析辞書22に既に登録されていたので、(辞書の)
種別326にdic1を格納して、その判別を可能にす
る。
【0026】これに次いで、複合語検出手段2において
は、処理をS5からS6に進め、変数sentの内容に
続く1文を文章記憶手段1から抽出して変数sentに
セットし、S2に処理を戻す。いま、S2からS6の処
理を何回か繰り返して図4の文番号105の文「・・・
辞書建策した。」が変数sentにセットされたものと
する。ここでの変数sentの内容は「空」ではないの
で、S2からS3へと処理を進める。
【0027】この文番号105の文「・・・辞書建策し
た。」に対して、複合語検出手段2においては、変数s
entの内容を解析手段21と解析辞書22を用いて単
語の列に分解し、その結果を解析結果記憶手段23に記
憶する(S3)。解析結果記憶手段23の内容例を図1
0に示す。解析結果記憶手段23の内容をチェックし、
名詞が連続する部分あるいは複合語フラグがONの単語
があるかどうかを調べる(S4)。この図10に示され
ているように、「辞書」「建策」の部分が名詞が連続す
る部分であるので、S5に処理を進め「辞書建策」を複
合語として検出し、検出した複合語の読みをキーとし
て、複合語の表記と文章記憶手段1での位置とを複合語
記憶手段3に登録する(S5)。
【0028】図15には、「辞書建策」に関する情報が
追加された複合語記憶手段3の内容が示されている。先
の図14においては、「辞書建策」の読みに対する見出
し部31は何も登録されていない。そこで、この見出し
部31の番地311における第3の番地a13に「じし
ょけんさく」に関する情報を格納する。また、表記部3
2に対しては、番地321における第5の番地a25に
「辞書建策」に関する情報を格納する。
【0029】次に複合語検出手段2は、処理をS5から
S6に進め、変数sentの内容に続く1文を文章記憶
手段1から抽出して変数sentにセットし、S2に処
理を戻す。ここでは、文章記憶手段1から文章が抽出で
きず、「空」が変数sentにセットされたものとす
る。sentの内容が「空」であることから、処理をS
3ではなくS7に進める。
【0030】指摘手段4は、複合語記憶手段3の内容を
調べ、読みが同じで表記が異なる複合語を指摘する。図
3は、この指摘手段4に関連する動作を表すフローチャ
ート(前記の図2におけるS7について詳細に説明する
もの)である。以下、図1,図3,図15を用いて、こ
の指摘手段4に関連する動作について説明する。
【0031】指摘手段4は、まず、変数adr1に複合
語記憶手段3の見出し部31の先頭の番地a11をセッ
トする(S201)。次に、変数adr1が0かどうか
をチェックする(S202)が、0でないのでS203
に処理を進める。S203において変数adr1(=a
11)で指定される見出し部31における表記数313
が1より大きいかどうかをチェックする。図15に示さ
れているように、変数adr1(=a11)で指定され
る見出し部31における表記数313は2であるので、
S204に処理を進める。
【0032】S204において、変数adr20と変数
adr2に変数adr1(=a11)で指定される見出
し部31における「表記への番地314」の内容をセッ
トし、S205に処理を進める。前記のセットの結果と
して、変数addr20と変数adr2にはa21がセ
ットされる。
【0033】S205においては、adr2(=a2
1)で指定される表記部32の位置324を介して表記
322を指摘する。この指摘を表示した時の例を図16
の文番号101の文「・・・機能使用が・・・。」に示
す。ここで、辞書の種別に何も格納されていなければ、
検出した複合語にシェードをかけるだけである。もし、
辞書の種別に値が格納されていれば、検出した複合語に
アンダーラインを更に引く。この場合には、辞書の種別
に何も格納されていないので、「機能使用」という複合
語にはシェードがかかるだけである。
【0034】次に、処理をS206に進め、変数adr
2をadr2で指定される表記部32の「次の表記への
アドレス323」(=a23)をセットし、S207に
処理を進める。S207において、adr20(=a2
1)とadr2(=a23)の内容が等しいかどうかを
チェックし、等しくないので処理をS205に戻す。
【0035】S205においてadr2(=a23)で
指定される表記部の位置324を介して表記322を指
摘する。この指摘を表示した時の例を図16の103に
示す。この場合、辞書の種別に何も格納されていないの
で「帰納使用」という複合語にはシェードをかけるだけ
である。
【0036】次に、処理をS206に進め、変数adr
2をadr2(=a23)で指定される表記部32の
「次の表記へのアドレス323」(=a21)をセット
し、S207に処理を進める。このS207において、
adr20(=a21)とadr2(=a21)の内容
が等しいかどうかをチェックし、等しいので処理をS2
08に進める。このS208においては、変数adr1
にその内容(a11)の次の番地(=a12)をセット
し、処理をS202に戻す。
【0037】S202においては、変数adr1が0か
どうかをチェックするが、0でないのでS203に処理
を進める。S203において変数adr1(=a12)
で指定される見出し部31の表記数313が1より大き
いかどうかをチェックする。図15に示すように、変数
adr1(=a12)で指定される見出し部31におけ
る表記数313は2であるので、S204に処理を進め
る。S204において、変数adr20と変数adr2
に対して、adr1(=a12)で指定される見出し部
31の「表記への番地314」の内容(a22)をセッ
トし、S205に処理を進める。その結果として、変数
addr20と変数adr2には、a22がセットされ
る。
【0038】S205においては、adr2(=a2
2)で指定される表記部32の位置324を介して表記
322を指摘する。この指摘を表示した時の例を図16
の102に示す。この場合、辞書の種別326には何も
格納されていないので、「要求使用」という複合語には
シェードをかけるだけである。
【0039】次に、処理をS206に進め、変数adr
2について、adr2で指定される表記部32の「次の
表記へのアドレス323」(=a24)をセットし、S
207に処理を進める。このS207において、adr
20(=a22)とadr2(=a24)の内容が等し
いかどうかをチェックし、等しくないので処理をS20
5に戻す。
【0040】S205において、adr2(=a24)
で指定される表記部32の位置324を介して表記32
2を指摘する。この指摘を表示した時の例を図16の1
04に示す。この場合には、辞書の種別326にdic
1が格納されているので、「要求仕様」という複合語に
は、シェードをかけることに加えてアンダーラインを引
く。
【0041】次に、処理をS206に進め、変数adr
2について、adr2(=a24)で指定される表記部
の「次の表記へのアドレス323」(=a22)をセッ
トし、S207に処理を進める。S207において、a
dr20(=a22)とadr2(=a22)の内容が
等しいかどうかをチェックし、等しいので処理をS20
8に進める。S208においては、変数adr1にその
内容(a11)の最後の番地(=a13)をセットし、
処理をS202に戻す。
【0042】S202において変数adr1が0かどう
かをチェックするが、0でないのでS203に処理を進
める。S203において変数adr1(=a13)で指
定される見出し部31の表記数313が1より大きいか
どうかをチェックする。図15に示すように変数adr
1(=a13)で指定される見出し部の表記数313は
1であるので、S208に処理を進める。S208にお
いて、変数adr1にその内容(a11)の次の番地
(この場合続くものがないので0)をセットし、処理を
S202に戻す。このS202において変数adr1が
0かどうかをチェックするが、0なので処理を終了す
る。
【0043】一つの読みに対して複数の表記が存在する
複合語については、他の同音異義語の複合語は、複合語
記憶手段3を調べることで容易に把握することができ
る。例えば、図16の文番号101の文「・・・の機能
使用が・・・。」における「機能使用」の他の表記は、
その位置1011から表記部32の番地a21に含まれ
ている。この番地a21という番地を開始番地として一
時的に記憶しておいて、次の他の表記へのアドレスを、
一時的に記憶した開始番地になるまでたどっていく。こ
のたどりの動作をする度に表記部32の該当する表記3
22を抽出しておけば、一つの読みに対して複数の異な
る表記を列挙することができる。この図16の文番号1
01の文に関する「機能使用」の場合には、他の表記と
して「帰納使用」が文書中にあることが認められる。ま
た、「帰納使用」の他の表記については、同様に次の異
なる表記へのアドレスをたどることにより、当初の「機
能使用」を求めることができる。このような情報を手掛
かりにして、ある所定の複合語の使用上の当否を、装置
のユーザが判定することができる。
【0044】[第2実施例]図17は、この発明に係る
文書校正支援装置の第2実施例を示すブロック図であ
る。この図17において、1は文章記憶手段,2は複合
語検出手段,21は解析手段,22は解析辞書、23は
解析結果記憶手段,3は複合語記憶手段,4は指摘手
段,5は複合語辞書である。ここで、文章記憶手段1,
複合語検出手段2,複合語記憶手段3,指摘手段4は、
前述された第1実施例のものと同じものである。
【0045】指摘手段4は、複合語記憶手段3の中に一
つの読みに対して複数の複合語表記が存在するか否かを
判断する。更に、複合語記憶手段3に登録された複合語
の読みで複合語辞書5を検索し、この読みによって登録
された複合語があれば、その検索結果を複合語記憶手段
3に反映させる。ここでの複合語辞書5は、少なくとも
複合語の読みとその表記を記憶している。
【0046】図18は、この発明における処理の流れを
説明するフローチャートである。以下、処理の流れをこ
の図18を用いて説明する。ここで、図4には、先の第
1実施例においても述べられたように、文章記憶手段1
に記憶された文章内容が示されている。この図4におい
ては、この発明の説明に必要な部分だけが示されてお
り、これらの例示的な文章部分は文番号101,10
2,103,104,105によって参照される。以
下、図4に示す文章を対象にして、図18および図3を
も参照しながら、図17の第2実施例の動作について説
明する。
【0047】図18において、複合語検出手段2のS0
からS6までの動作は、第1実施例の場合と同じである
からその説明を省略する。以下では、図4の文番号10
5の文章を処理して、「空」が変数sentにセットさ
れ、S2において処理をS3ではなくS7Aに進めた時
点からの動作を例にとって説明する。
【0048】このS7Aにおいて、指摘手段4は、図1
5に示す複合語記憶手段3の見出し部31における読み
312のそれぞれに対して、該当の読みをキーにして複
合語辞書5を検索する。もし検索結果が「空」でなけれ
ば、その結果を複合語記憶手段3に反映させる。この図
15において、見出し部31における番地311の第2
の番地a12の「ようきゅうしよう」なる読みを例にと
ると、図19に示された複合語辞書5には対応する表記
が登録されていないので、その検索結果は「空」であ
る。これに対して、「きのうしよう」および「じしょけ
んさく」という読みに対しては、前記された図19の複
合語辞書5に「機能仕様」「辞書検索」という表記が登
録されているので、この検索結果を複合語記憶手段3に
反映させることになる。
【0049】図20には、複合語辞書5の検索結果を反
映させた複合語記憶手段3の内容が例示されている。以
下、その反映のし方について具体的に説明する。前記の
反映がなされる前の複合語記憶手段3の内容は、図15
に示す通りである。ここで、「きのうしよう」という読
みを含む見出し部31の表記数313の数(=2:図1
5に示されている値)だけ、表記部32の(次の表記へ
の)アドレス(番地)323で連結された表記をたど
り、番地a23で示される表記部32の「帰納使用」に
到着する。そして、「機能仕様」に関する表記情報につ
いては、前記の番地a23で示される表記部32の次の
表記として格納する。即ち、見出し部31の番地311
における第1の番地a11に対応する表記数313を1
だけ増やして3とし、表記情報(「機能仕様」に関する
表記情報)を、次に利用可能な表記部32の番地a26
に格納し、これに応じて、番地a23に対応する次の表
記へのアドレス(番地)323をa21からa26に変
更する。そして、この番地a26に対応する次の表記へ
のアドレス(番地)323にはa21を格納することに
なる。ここでの「機能仕様」という複合語は複合語辞書
5に登録されていたので、辞書の種別326の項にはd
ic2なる情報を格納する。次に、「じしょけんさく」
という読みを含む見出し部31の番地311における第
3の番地a13に対応する表記数313の数(=1:図
15に示されている値)だけ、表記部32における(次
の表記への)アドレス(番地)323で連結された表記
をたどり、表記部32において番地a25で示される表
記「辞書建策」に到着する。ここで、他の表記である
「辞書検索」に関する表記情報については、前記の番地
a25で示される表記部の次の表記として格納する。即
ち、見出し部31の番地311における第3の番地a1
3に対応する表記数313を1だけ増やして2とし、表
記情報(「辞書検索」に関する表記情報)を次に利用可
能な表記部32の番地a27に格納し、これに応じて、
番地a25に対応する次の表記へのアドレス(番地)3
23を(図15における)a25からa27に変更す
る。そして、この番地a27に対応する次の表記へのア
ドレス(番地)323にはa25を格納することにな
る。ここでの「辞書検索」という複合語も複合語辞書5
に登録されていたので、辞書の種別326として、同様
にdic2なる情報を格納する。
【0050】指摘手段4は、処理をS7に進める。この
S7における動作は、前記第1実施例の場合と同様であ
って、その動作は先の図3に示されている通りである。
図21には、同じ読みに対して複数の表記が存在する複
合語の位置を表示した例が示されている。前記の第1実
施例に関する図16と比較して認められることは、複合
語辞書5が用いられている第2実施例の表示において、
文番号105に含まれる複合語「辞書建策」にはアンダ
ーラインが引かれていることである。
【0051】一つの読みに対して複数の表記が存在する
複合語について、他の同音異義語の複合語は、複合語記
憶手段3を調べることで容易に把握することができる。
例えば、図21の文番号101の「機能使用」の他の表
記は、その位置1011から表記部32の番地a21に
含まれる。この番地a21を開始番地として一時的に記
憶しておき、次の表記へのアドレスを一時的に記憶した
開始番地になるまでたどる。このたどりをするときに、
表記部において該当する表記を順次抽出しておけば、一
つの読みに対して複数の表記を列挙することができる。
いま、図21の文番号101の「機能使用」の場合につ
いてみれば、他の表記として「帰納使用」が対象の文書
中にあり、また、「機能仕様」が複合語辞書5にあるこ
とが認められる。この場合には、「機能仕様」以外の複
合語である「機能使用」および「帰納使用」は誤りであ
ると判定でき、前記文番号101の「機能使用」に対し
て「機能仕様」を正しい複合語の表記として提示するこ
とができる。また、文番号103の「帰納使用」の他の
表記については、同様にして次に続く表記へのアドレス
をたどることにより、「機能使用」および「機能仕様」
を求めることができる。この場合においても、「帰納使
用」が誤りであり、「機能仕様」が正しいことを提示す
ることができる。
【0052】
【発明の効果】以上詳細に説明されたように、この発明
に係る文書校正支援装置は、外部から入力・記憶された
文章から検出された複合語情報について、該当する複合
語の読みをキーにして一時的に記憶させる手段(複合語
記憶手段3)を含んでなる構成にされており、読みは同
じであるが表記を異にする複合語が的確に検出できるよ
うにされている。また、この発明に係る別の文書校正支
援装置は、複合語辞書5を更に含んだ構成にされてお
り、その指摘手段4によれば、複合語記憶手段3と複合
語辞書5とを照合して、ある所定の同じ読みに対して異
なる複合語が存在するか否かを判断・指摘する機能も果
たすようにされている。そして、この発明に係る装置
は、処理対象の文章中に含まれている複合語に対する誤
りの可能性を調べ、誤りの可能性が高い場合には、その
旨の注意をうながすことが可能にされたものであり、対
象とする文章内である所定の複合語を検出したときに
は、複合語辞書に登録されていない複合語の表記の不統
一を手掛かりに同音異義語の誤りの可能性を指摘でき
る。また、文書中の同音異義語の表記群を容易に列挙で
きる。更には、複合語辞書を用いる場合において、複合
語の検出の度に複合語辞書を検索することなく、関連の
複合語を文書中から検出した後で、その読みをキーにし
て複合語辞書を検索することから、その検索回数を着実
に減少させ、所期の効率的な処理が可能になるという効
果が奏せられる。
【図面の簡単な説明】
【図1】この発明の第1実施例に係る文書校正支援装置
の構成を説明するためのブロック図である。
【図2】上記第1実施例装置の動作を説明するためのフ
ローチャートである。
【図3】上記第1実施例装置(および後述の第2実施例
装置)の動作を部分的により詳細に説明するためのフロ
ーチャートである。
【図4】上記第1実施例装置(および後述の第2実施例
装置)の動作を説明するために用いられる文章例示図で
ある。
【図5】上記第1実施例装置(および後述の第2実施例
装置)の構成・動作を説明するために用いられる解析辞
書の内容例示図である。
【図6】上記第1実施例装置の構成・動作を説明するた
めに用いられる解析結果記憶手段の内容例示図である。
【図7】上記第1実施例装置の構成・動作を説明するた
めに用いられる解析結果記憶手段の内容例示図である。
【図8】上記第1実施例装置の構成・動作を説明するた
めに用いられる解析結果記憶手段の内容例示図である。
【図9】上記第1実施例装置の構成・動作を説明するた
めに用いられる解析結果記憶手段の内容例示図である。
【図10】上記第1実施例装置の構成・動作を説明する
ために用いられる解析結果記憶手段の内容例示図であ
る。
【図11】上記第1実施例装置の構成・動作を説明する
ために用いられる複合語記憶手段の内容例示図である。
【図12】上記第1実施例装置の構成・動作を説明する
ために用いられる複合語記憶手段の内容例示図である。
【図13】上記第1実施例装置の構成・動作を説明する
ために用いられる複合語記憶手段の内容例示図である。
【図14】上記第1実施例装置の構成・動作を説明する
ために用いられる複合語記憶手段の内容例示図である。
【図15】上記第1実施例装置の構成・動作を説明する
ために用いられる複合語記憶手段の内容例示図である。
【図16】上記第1実施例装置の動作を説明するために
用いられる表示例示図である。
【図17】この発明の第2実施例に係る文書校正支援装
置の構成を説明するためのブロック図である。
【図18】上記第2実施例装置の動作を説明するための
フローチャートである。
【図19】上記第2実施例装置の構成・動作を説明する
ために用いられる複合語辞書の内容例示図である。
【図20】上記第2実施例装置の動作を説明するために
用いられる複合語記憶手段の内容例図である。
【図21】上記第2実施例装置の動作を説明するために
用いられる表示例示図である。
【符号の説明】
1−−文章記憶手段;2−−複合語検出手段;21−−
単語解析手段;22−−解析辞書;23−−解析結果記
憶手段;3−−複合語記憶手段;4−−指摘手段;5−
−複合語辞書。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】入力された文章を記憶する文章記憶手段,
    前記文章記憶手段から検出した複合語情報を記憶する複
    合語記憶手段,前記文章記憶手段に記憶された文章から
    複合語を検出し、複合語の読みをキーとして複合語の表
    記と前記文章記憶手段での格納開始位置とを前記複合語
    記憶手段に登録する複合語検出手段,前記複合語記憶手
    段の中に、ある一つの読みに対して複数の表記が存在す
    る複合語を指摘する指摘手段,を備えたことを特徴とす
    る文書校正支援装置。
  2. 【請求項2】複合語の読みとその表記が登録されている
    複合語辞書を更に備えており、 前記指摘手段は、前記複合語記憶手段と前記複合語辞書
    とを照合して、ある同じ読みに対して異なる複合語の存
    否をも判断・指摘することを特徴とする、 請求項1に記載の文書校正支援装置。
JP5292414A 1993-10-29 1993-10-29 文書校正支援装置 Pending JPH07129577A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5292414A JPH07129577A (ja) 1993-10-29 1993-10-29 文書校正支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5292414A JPH07129577A (ja) 1993-10-29 1993-10-29 文書校正支援装置

Publications (1)

Publication Number Publication Date
JPH07129577A true JPH07129577A (ja) 1995-05-19

Family

ID=17781482

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5292414A Pending JPH07129577A (ja) 1993-10-29 1993-10-29 文書校正支援装置

Country Status (1)

Country Link
JP (1) JPH07129577A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015156336A1 (ja) * 2014-04-08 2015-10-15 幸治 松村 用語統一システム及び用語統一プログラム、並びに用語統一方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015156336A1 (ja) * 2014-04-08 2015-10-15 幸治 松村 用語統一システム及び用語統一プログラム、並びに用語統一方法

Similar Documents

Publication Publication Date Title
US6424983B1 (en) Spelling and grammar checking system
US7447627B2 (en) Compound word breaker and spell checker
JPH07325828A (ja) 文法チェックシステム
JPH07325824A (ja) 文法チェックシステム
JPH0844719A (ja) 辞書アクセスシステム
JP2003514304A (ja) スペルミス、タイプミス、および変換誤りに耐性のある、あるテキスト形式から別のテキスト形式に変換する言語入力アーキテクチャ
JP2994336B1 (ja) 文書解析装置およびその方法
JPH07129577A (ja) 文書校正支援装置
JPH07325825A (ja) 英文法チェックシステム装置
JP3420369B2 (ja) 文書処理装置、および文書処理方法
KR20010103411A (ko) 번역 효율이 향상된 언어 번역 시스템 및 방법
JP2621999B2 (ja) 文書処理装置
JPS62249269A (ja) 文書処理装置
JP3308723B2 (ja) 統語解析装置
JPH06149791A (ja) 漢字文章入力装置
JPH07200592A (ja) 文章処理装置
JPH02136959A (ja) 日本文訂正候補抽出装置
JPH0531186B2 (ja)
JP4531325B2 (ja) 機械翻訳装置および機械翻訳方法
JP2592993B2 (ja) 文節切り出し装置
JPH0793330A (ja) 文章訂正装置
JPH04280369A (ja) 機械翻訳装置
JPH09223143A (ja) 文書情報処理装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JPS63136264A (ja) 機械翻訳装置