JPH03184162A - 日本語文書校正支援装置 - Google Patents

日本語文書校正支援装置

Info

Publication number
JPH03184162A
JPH03184162A JP89324789A JP32478989A JPH03184162A JP H03184162 A JPH03184162 A JP H03184162A JP 89324789 A JP89324789 A JP 89324789A JP 32478989 A JP32478989 A JP 32478989A JP H03184162 A JPH03184162 A JP H03184162A
Authority
JP
Japan
Prior art keywords
character
change position
character type
type change
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP89324789A
Other languages
English (en)
Other versions
JP2957211B2 (ja
Inventor
Yasuyuki Numata
泰之 沼田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP1324789A priority Critical patent/JP2957211B2/ja
Publication of JPH03184162A publication Critical patent/JPH03184162A/ja
Application granted granted Critical
Publication of JP2957211B2 publication Critical patent/JP2957211B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野] 本発明は日本語ワードプロセッサやデスクトップパブリ
ッシング装置等の文書作成装置において用いられ、表記
のゆれを指摘する機能を有する日本語文書校正支援装置
に関するものである。
〔従来の技術〕
従来日本語ワードプロセッサ等の文書作成装置において
は、文書の校正支援機能の1つとして表記のゆれを指摘
する機能が用いられることがある。
ここで表記のゆれとは、同一の意味を示す語句について
日本語の表記上で認められている複数の表記の変動のこ
とをいう0例えば「取扱」、「取り扱い」、「取扱い」
等は表記が異なるにもかかわらずいずれも同じ言葉を指
している。そして−文書を長時間かけて又は複数の人が
作成すると、同一文書においても様々な表記が発生する
ことがある。しかし1つの文書中においては同一の言葉
の表記は統一されている方が好ましいとされている。
そこでこのような表記のゆれを指摘し文書の作成者に修
正を促すようにした表記のゆれの指摘機能を有する校正
支援装置が用いられる。
このような従来の校正支援装置における表記のゆれ指摘
機能は、形態素解析処理の結果を利用して実現されてい
る。即ち形態素解析用の辞書の見出しに第1表に示すよ
うなあらゆる表記のゆれが登録され、辞書中におけるそ
れらの各項目に特定の単語の派生表記である旨が記録さ
れる。
第1表 このように表記のゆれが生じる見出し語に対して単一の
標準表記が記録され、形態素を解析する際に見出し語と
一致しそれが標準表記と異なる場合には、表記のゆれで
あることを指摘するようにしている。
〔発明が解決しようとする課題〕
しかしながらこのような従来の表記のゆれを指摘し校正
を支援する装置によれば、レヘルが高くなるほど辞書が
複雑となる。そして様々な表記のゆれを辞書の見出しと
して網羅的に記録するため、辞書の容量が増大する。従
ってこのような機能を実現しようした場合にはハードウ
ェアが複雑となり、文書作成装置の価格が上昇するとい
う欠点があった。
本発明はこのような従来の文書作成装置の問題点に鑑み
てなされたものであって、テキスト情報のみに基づいて
表記のゆれを検出し指摘できるようにすることを技術的
課題とする。
〔課題を解決するための手段〕
本発明は第1図に示すように、校正すべきテキストを保
持するテキスト記憶手段lと、テキスト記憶手段より読
出された文字のmmを判別する字種判定手段2と、字種
判定手段による判定出力に基づき漢字を除く文字から漢
字への変更位置を示す字種変更位置を認識する字種変更
位置認識手段3と、字種変更位置認識手段により12識
された字種の変更位置の文字から始まる所定数の部分文
字列を記憶する字種変更位置記憶手段4と、字種変更位
置記憶手段によって記憶された原表記の部分文字列から
漢字以外の文字を削除し、所定数の文字列として字種変
更位置記憶手段に保持する縮退形獲得手段5と、字種変
更位置記憶手段に保持されている原表記とその縮退形と
に基づいて縮退形が同一で原表記が異なる対の異表記候
補を抽出する表記ゆれ情報抽出手段6とを有することを
特徴とするものである。
〔作用〕
このような特徴を有する本発明によれば、テキスト記憶
手段からテキストを順次続出してその字種を判定して漢
字以外の文字から漢字への変更位置を認識し、その文字
から始まる所定数の部分文字列を原表記として登録する
ようにしている。そしてその文字列から平仮名等の非漢
字を削除して縮退処理をし、縮退形が同一で原表記の文
字列が異なる組の異表記候補を表記ゆれ情報抽出手段に
よって抽出し表記のゆれを指摘するようにしている。
〔実施例〕
第1図は本発明の一実施例による日本語文書校正支援装
置を含む日本語ワードプロセッサの全体構成を示すブロ
ック図である。この日本語校正支援機能を有するワード
プロセッサは制御部11゜その制御プログラムを記憶す
るメモリ12.キーボード等の入力装置13.及びCR
T等の表示袋W14とプリンタ15が接続される。ここ
でメモリ15には日本語ワードプロセッサ等により入力
された日本語テキストを保持するテキスト記憶手段l及
び字種変更位置記憶手段4を構成する領域が形成される
次に本実施例の動作についてフローチャートを参照しつ
つ説明する。まず表記のゆれの指摘動作を開始すると、
ステップ21に進んでテキスト記憶手段1に保持されて
いる入力テキストを最初から1文字ずつ順次読込む。そ
してステップ22に進んで字種の判定処理を行う。この
字種の判定は与えられた文字について平仮名1玲仮名、
漢字、数字。
アルファベット等の字種の判定を行うものである。
そしてステップ23に進んでテキストの字種判定により
1文字ずつスキャンしていき、漢字以外の文字、例えば
平仮名1玲仮名、アルファベット等から漢字に変更があ
ったかどうかをチエツクする。
変更がなければステップ25において全てのテキストを
読込んだかどうかをチエツクする。テキストの読込みが
終了していなければステップ21に戻って同様の処理を
繰り返し、字種の変更があればステップ24に進んでメ
モリに字種の変更位置を記憶する。そしてステップ25
に進んで保持されているテキストの読込みを終了したか
どうかをチエツクする。読込みを終了していなければス
テップ21に戻って同様の処理を繰り返し、終了した場
合にはステップ26に進んで異表記候補の登録を行う、
異表記候補の登録はステップ24で認識された字種の変
更位置の文字から始まる所定数の部分文字列、例えば4
文字の原表記の文字列を字種変更位置記憶手段4の異表
記候補のレコードに記憶することにより行う。そして全
ての字種変更位置について原表記の登録が終了すると、
ステップ27に進んで登録された異表記候補を読出して
ステップ28に進みその異表記候補から非漢字文字を削
除する。
例えば以下の文章では下線の文字が字種変更位置の文字
であり、異表記候補として記憶される部分はその文字か
ら4文字分である。
そしてステップ29に進んで各異表記候補についての縮
退形を登録する。ここで縮退形とは原表記から漢字を除
く文字を削除した残りの漢字の2字をいう。そして上述
した文章の字種変更位置からの原表記とその縮退形の登
録を行う。ここで字種変更位置の表現は文書内の出現す
る文字の位置によって示すものとする。位置表現は文書
内の文字数だけでなく頁9行9桁等によっても表現する
ことができる。上記の文章において原表記と縮退形の一
例を以下の第2表に示す。
第2表 ここで字種変更位置に記憶された各レコード、即ち第2
表の夫々の行を便宜的に異表記候補と言う。
そしてステップ30に進んで異表記候補を先頭文字によ
ってソートする。これは同一の先頭文字を有する文字毎
に異表記候補のレコードを並び変える処理であり、これ
を行うとステップ31に進んで表記のゆれ情報の認識を
行う。表記のゆれの認識は字種変更位置記憶手段4に記
憶された異表記候補の中で、縮退形が同一であり且つ原
表記が異なる異表記候補を表記のゆれがある関係とする
。こうして表記のゆれの情報を認識する。例えば前述し
た第2表では、縮退形が同一で原表記が異なる異表記候
補がなく、表記のゆれの関係は認められない。
次に他の例を用いて表記のゆれ情報の認識について説明
する0例えば「取」を字種変更位置の文字とすると、元
のテキスト中に以下の文節が存在していたとする。
取り合う、取合うが、取り上げる、取上げる、取り扱う
、取扱うが、取り集める、取集める、取り合わせる、取
合わせる、取り合せる、取合せる、取り急ぎ、取急ぎて
、取り押さえる、取押さえる、取り押える、取押える、
取り交わす、取交わす、取り交す、取り交すが、取り決
める、取決めるこのような部分文字列があれば字種変更
位置記憶手段4の原表記のデータ及び縮退形は夫々次の
第3表で示される。
第3表(そのl) 第3表 (その2) 従ってこの原表記と縮退形に基づいて前述した条件によ
り表記のゆれの候補を以下のようにして抽出する。
第4表 ここで制御部11はステップ21.22においてテキス
ト記憶手段1に記憶されている字種を判定する字種判定
手段2の機能を達成しており、ステップ23、24にお
いて判定された字種により字種の変更位置を認識する字
種変更位置認識手段3の機能を達成している。又制御部
11はステップ27〜29において異表記候補に基づい
て縮退形を獲得する縮退形獲得手段5の機能を達成して
いる。更にステップ31において字種変更位置記憶手段
4に記憶された原表記と縮退形に基づいて表記のゆれを
抽出する表記のゆれ情報抽出手段6の機能を達成してい
る。
こうして抽出された表記のゆれ情報は表示装置14にそ
のまま表示することによって文書の作成中に修正を促す
ことができ、又あらかじめ定めた表記方法又は出現頻度
の高い表記に統一するように修正処理を行うようにして
もよい。
〔発明の効果〕
そのため本発明によれば、大容量の辞書を必要とするこ
となく又形態素の解析等を行う必要がなく、低価格のワ
ードプロセッサ等にも容易に適用することができるとい
う効果が得られる。
【図面の簡単な説明】
第1図は本発明を適用したワードプロセッサの一実施例
の構成を示すブロック図、第2図は表記のゆれを実現す
るための処理を示すフローチャートである。 1−・・・−・−テキスト記憶手段、 2・・曲−字種
判定手段、3〜・・・−字種変更位置認識手段、 4・
−・曲字種変更位置記憶手段、 5・−・−縮退形獲得
手段、 6−・・・・表記のゆれ情報抽出手段。

Claims (1)

    【特許請求の範囲】
  1. (1)校正すべきテキストを保持するテキスト記憶手段
    と、 前記テキスト記憶手段より読出された文字の種類を判別
    する字種判定手段と、 前記字種判定手段による判定出力に基づき漢字を除く文
    字から漢字への変更位置を示す字種変更位置を認識する
    字種変更位置認識手段と、 前記字種変更位置認識手段により認識された字種の変更
    位置の文字から始まる所定数の部分文字列を記憶する字
    種変更位置記憶手段と、 前記字種変更位置記憶手段によって記憶された原表記の
    部分文字列から漢字以外の文字を削除し、所定数の文字
    列として前記字種変更位置記憶手段に保持する縮退形獲
    得手段と、 前記字種変更位置記憶手段に保持されている原表記とそ
    の縮退形とに基づいて縮退形が同一で原表記が異なる対
    の異表記候補を抽出する表記ゆれ情報抽出手段とを有す
    ることを特徴とする日本語文書校正支援装置。
JP1324789A 1989-12-13 1989-12-13 日本語文書校正支援装置 Expired - Fee Related JP2957211B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1324789A JP2957211B2 (ja) 1989-12-13 1989-12-13 日本語文書校正支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1324789A JP2957211B2 (ja) 1989-12-13 1989-12-13 日本語文書校正支援装置

Publications (2)

Publication Number Publication Date
JPH03184162A true JPH03184162A (ja) 1991-08-12
JP2957211B2 JP2957211B2 (ja) 1999-10-04

Family

ID=18169697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1324789A Expired - Fee Related JP2957211B2 (ja) 1989-12-13 1989-12-13 日本語文書校正支援装置

Country Status (1)

Country Link
JP (1) JP2957211B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022175661A (ja) * 2021-05-14 2022-11-25 凸版印刷株式会社 校正支援装置、校正支援方法、及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022175661A (ja) * 2021-05-14 2022-11-25 凸版印刷株式会社 校正支援装置、校正支援方法、及びプログラム

Also Published As

Publication number Publication date
JP2957211B2 (ja) 1999-10-04

Similar Documents

Publication Publication Date Title
US5748953A (en) Document search method wherein stored documents and search queries comprise segmented text data of spaced, nonconsecutive text elements and words segmented by predetermined symbols
ES2214535T3 (es) Procedimiento y sistema portatil de indexacion de documentos utilizando la descomposicion de palabras en n-grams.
US5161245A (en) Pattern recognition system having inter-pattern spacing correction
JPS6140671A (ja) 単語分割処理方法
JPS60502175A (ja) 索引項目の発見方法
JPH03184162A (ja) 日本語文書校正支援装置
JP2000331023A (ja) 情報検索装置及び情報検索処理プログラムを記憶した記憶媒体
JP3720882B2 (ja) 情報検索方法、情報検索システム及び情報検索装置
JPS6325764A (ja) 文書作成装置
JP2819612B2 (ja) 文字変換装置
JP2000311170A (ja) テキスト情報抽出方法
JP3045886B2 (ja) 手書き入力機能付き文字処理装置
JPH0338786A (ja) 文字認識処理装置
JP2839515B2 (ja) 文字読取システム
JPH05282293A (ja) 文書作成装置
JPH04253262A (ja) フリガナ付加方式
JPH0719189B2 (ja) データ入力装置
JPH01199263A (ja) キーワード抽出装置
JPH10269231A (ja) 日英混在文書における文書検索方法
JPH0682366B2 (ja) 文字列訂正方式
JPH10177573A (ja) 文書処理方法および装置
JPH02300848A (ja) 異体字フォント検索方式
JPH02136970A (ja) 英単語検索装置
JPH11232268A (ja) 文書処理装置、ルビ割り付け方法、及び記録媒体
JPS63229563A (ja) 索引作成方式

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees