JPH0484360A - 文章検査装置 - Google Patents

文章検査装置

Info

Publication number
JPH0484360A
JPH0484360A JP2199648A JP19964890A JPH0484360A JP H0484360 A JPH0484360 A JP H0484360A JP 2199648 A JP2199648 A JP 2199648A JP 19964890 A JP19964890 A JP 19964890A JP H0484360 A JPH0484360 A JP H0484360A
Authority
JP
Japan
Prior art keywords
string
sentence
character
character string
immediately
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2199648A
Other languages
English (en)
Inventor
Yutaka Oyama
裕 大山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2199648A priority Critical patent/JPH0484360A/ja
Publication of JPH0484360A publication Critical patent/JPH0484360A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 図面参照用の符号を検査する文章検査装置に関する。
〔従来の技術〕
文章技術の向上により、一般の利用者がワードプロセッ
サなどを用いて効率よく文書を作成することが容易にな
った。最近では、かな漢字変換などによる日本語入力だ
けでなく、入力した文章を計算機によりチエツクする機
能も実現されている。
例えば、日本ソフトウェア科学会第4回大会予稿B−1
−2F日本語文章作成支援ツール「推敲J1のパーソナ
ルコンピュータでの実用化」には、「言い替えた方がよ
い語句の検索」やrKWICリストの作成コなと、多く
の文章検査機能が紹介されている。これらの機能を活用
し、日本語の文章の誤りを検出・訂正することで、文章
の品質を向上させることができる。
〔発明が解決しようとする課題〕
特許や考案(以下、まとめて特許と呼ぶ)など、図面を
伴う文章の作成時にも前述の文章検査機能は有効である
。しかしながら、前述の文章検査機能は一般的日本語文
章を処理対象としており、図面参照特有の表現や用語に
対しての検査を行うことはできない。
特許明細書作成時特有の誤りの一つに、図面参照用の符
号(一般に数字または英数記号で構成される)の付は間
違いがある。例えば、特許図面の中でrl、oOJ と
いう符号を付けられた項目(符号の名称)「制御装置」
を使用している場合には、「制御装置100」と参照さ
れる。ここで、図面の変更に伴い符号r100Jをrl
 OIJに変更した場合には、文章中の「制御装置10
0Jをすべて「制御装置101」に変更しなければなら
ない。ところが、「制御装置100」という記述は明細
書の中で複数回使用されることが多く、変更漏れのため
に「制御装置100」のまま残してしまう恐れがある。
上記誤りを最小限に抑える手段として、前述の「推敲」
における数字などの限定字種を指定した文字列献策機能
を使用し、抽出部分を人間が黙視確認する手段が考えら
れる。しかしながら、この機能を使用すると、車室ての
番号や文中の数字など、明らかに符号にならない部分も
同時に検索されてしまい、検査効率が悪いという欠点が
ある。
本発明の目的は、前述の従来技術にみられた欠点を解決
し、文章中に存在する図面参照用符号の誤りの検出を支
援する文章検査装置を提供することにある。
〔課題を解決するための手段〕
第1の発明の文章検査装置は、文章を入力する入力手段
と、入力された前記文章を記憶するための文章記憶手段
と、前記文章内の数字列とその文章中における位置を抽
出する数字列情報抽出手段と、前記数字列を記憶するた
めの数字列記憶手段と、前記文章中における前記数字列
の直前の文字列の形態を検査する直前文字列検査手段と
、前記文章中における前記数字列の直後の文字列の形態
を検査する直後文字列検査手段と、前記直前文字列検査
手段および直後文字列検査手段の検査結果をもとに前記
数字列記憶手段内の前記数字列を削除する数字列削除手
段と、前記数字列および前記文章をもとにKWICリス
トを生成するKWIC生成手段と、前記KWICリスト
を表示する表示手段を備え、前記直前文字列検査手段は
前記文章中の前記数字列の直後が図面参照用符号の名称
を構成しうる文字または文字列でないものを検出し、前
記直後文字列検査手段は前記文章中の前記数字列の直後
が図面参照用符号の直後に位置しうる文字または文字列
でないものを検出し、前記数字列削除手段は前記直前文
字列検査手段および前記直前文字列検査手段によって検
出された数字列を削除することを特徴とする突≠検妻≠
1 また、第2の発明の文章検査装置は、文章を入力する入
力手段と、入力された前記文章を記憶するための文章記
憶手段と、前記文章内の数字列とその文章中における位
置を抽出する数字列情報抽出手段と、前記数字列を記憶
するための数字列記憶手段と、前記文章中における前記
数字列の直前の文字列の形態を検査する直前文字列検査
手段と、前記文章中における前記数字列の直後の文字列
の形態を検査する直後文字列検査手段と、前記直前文字
列検査手段および直後文字列検査手段の検査結果をもと
に前記数字列記憶手段内の前記数字列を削除する第1の
数字列削除手段と、特許明細書特有の不要語を収めた不
要語辞書と、前記文章中における前記数字列の前後の文
字列が前記不要語と一致する場合に前記数字列記憶手段
内の前記数字列を削除する第2の数字列削除手段と、前
記数字列および前記文章をもとにKWICリストを生成
するKWIC生成手段と、前記KWIC!、Iストを表
示する表示手段を備え、前記直前文字列検査手段は前記
文章中の前記数字列の直前が図面参照用符号の名称を構
成しうる文字または文字列でないものを検出し、前記直
後文字列検査手段は前記文章中の前記数字列の直後が図
面参照用符号の直後に位置しうる文字または文字列でな
いものを検出し、前記数字列削除手段は前記直前文字列
検査手段および前記直前文字列検査手段によって検出さ
れた数字列を削除することを特徴とす6.p検−1ツ4
壮 〔作用〕 第1の発明の作用は以下の通りである。まず、入力され
る文章を文章記憶装置に記憶した後、文章内の数字列と
その文章中における位置を抽出する。ただし、本発明に
おいて数字列は図面参照用符号として使用できる文字列
の意味であり、100aや100−aのように、数字列
の直後に連続する英記号(句読点や括弧などの区切り記
号を除く)の結合も許すよう拡大解釈する。次に、抽出
された各数字列について文章内におけるその数字列の直
前と直後の文字列の形態を調べ、その数字列が図面内の
項目参照のための符号であるもの以外を削除する。次に
、残った数字列をキーにしたKWICリストを生成し表
示を行う。
第2の発明の作用では、第1の発明の作用の流れに加え
て、数字列を並べ換える前に、文章内におけるその数字
列の直前と直後の文字列と予め用意された特有の不要語
(「第」、「図」、「請求項」など)が一致するか否か
を調べ、一致するものを削除した後にKWICリストの
生成・表示を行う。
〔実施例〕
以下、本発明の実施例について図面を参照して説明する
第1図は第1の発明の一実施例を示すブロック図である
第1図において、1は文章を入力する入力手段であり、
2は入力された文章を記憶するための文章記憶手段であ
り、3は文章記憶手段2内の文章の中の数字列とその文
章中における位置を抽出する数字列情報抽出手段であり
、4は抽出された数字列および位置情報を記憶するため
の数字列記憶手段であり、5は数字列記憶手段4内の各
数字列に関して文章記憶手段2内の文章中における直前
の文字列の形態を検査する直前文字列検査手段であり、
6は数字列記憶手段4内の各数字列に関して文章記憶手
段2内の文章中における直後の文字列の形態を検査する
直後文字列検査手段であり、7は直前文字列検査手段5
および直後文字列検査手段6の検査結果をもとに数字列
記憶手段4内の所定の数字列を削除する数字列削除手段
であり、8は数字列記憶手段4内の数字列と文章記憶手
段2内の文章をもとにKWICリストを生成するKWI
C生成手段であり、9はKWICリストを表示する表示
手段であり、10は全体の動作を制御する制御部である
。第1図において、入力手段1はフロッピーディスク装
置や通信回線などで、などで、数字列情報抽出手段3.
直前文字列検査手段5.直後文字列検査手段6.KWI
C生成手段8.制御部10はCPUなどで実現できる。
また、第3図は入力手段から入力される日本語して同じ
符号「4」が与えられている誤りの例である。以下、第
3図の文章を例にとって本実施例の動作を説明する。
入力手段1から入力された日本語文章は文章記憶手段2
に記憶される。その後、数字列情報抽出手段3は制御部
10の制御のもとで、文章記憶手段2内の日本語文章か
ら数字列とその文章中における位置を抽出して数字列記
憶手段4に収める。
数字列抽出の手順の詳細は、前述の文献においてF字種
列の文字列検索コマンド」として紹介されているので省
略する。この時点での数字列記憶手段4の内容を第4図
に示す。第4図において、「位置」は文章先頭からの文
字数として表わされている。
次に、直前文字列検査手段5は制御部10の制御のもと
で、日本語文章(文章記憶手段2にある)中の各数字列
の直前の文字列(第4図の位置情報を用いて参照できる
)が図面で用いる符号の名称を構成しうる文字または文
字列(漢字や片仮名、平仮名など)でない場合に、その
旨を数字列削除手段7に伝える。本例では、1文字目か
らはしまる「3」(文頭)と119文字目からはじまる
「2」(直前が読点)とが符号の名称を構成てきないた
め、その旨が数字列削除手段7に送られる。
直後文字列検査手段6は、日本語文章中の各数字列の直
後の文字列が図面で用いる参照用符号の直後に位置しう
る文字または文字列(句読点や平仮名など)でないもの
を検出する。本例では、119文字目からはじまる「2
」および169文字目からはじまる「3」(直後が漢字
)が条件を満たさないため、これを数字列削除手段7に
伝える。直前文字列検査手段5および直後文字列検査手
段6の動作に関しては、単純な字種の比較で実現できる
ので、詳細な説明を省略する。
数字列削除手段7は制御部10の制御のもとで、数字列
記憶手段4内の数字列のうち直前文字列検査手段5およ
び直後文字列検査手段6で検出された数字列を削除する
。本例では、1文字目がらはじまるr3J、 119文
字目からはじまる「2」および169文字目からはじま
る「3」が削除される。この時点での数字列記憶手段4
の内容は第5図のようになる。
次に、KWIC生成手段8は制御部10の制御のもとで
、数字列記憶手段4内の数字列をもとに、第1キーを数
字列に、第2キーを日本語文章中の数字列の直前の文字
列にとってソートを行った上で、キー前後の文字列を含
めてリストとして生成する。KWIC!jストの作成方
法については、前述の文献の中に実現例が紹介されてお
り(文献の例では第1キーを漢字列に、第2キーを読み
にしてソートしている)、容易に実現できるので動作の
詳細を省略する。得られたKWICリストは表示手段9
で利用者に対して表示される。本例における表示手段9
の表示例を第6図に示す。
第6図では、「結果記憶手段」に対する符号としてr4
Jが与えられており、これが「形態素解析手段」の符号
「4」と型抜していることが見やすい形で表示される。
その結果、利用者は表示結果を見ることによって誤り部
分を容易に見つけ出しく誤りであるか否かの最終判断は
利用者に任される)、明細書の修正を行うことができる
。なお、符号1について、「請求項1」と「制御部l」
の2つが表示されている。第1の発明では、「請求項1
」が図面符号の名称でないことは利用者の判断に任され
る。
次に、第2図は第2の発明の一実施例を示すブロック図
である。
第2図において、入力手段1〜表示手段9は第1図の同
じ参照符号のものと同一であるので説明を省略する。1
1は特許明細書に特有に使用され図面で用いる符号の名
称に使用されることのない文字または文字列(不要語)
を収めた不要語辞書であり、12は数字列記憶手段4内
の数字列に関して文章記憶手段2内の日本語文章中にお
ける前記数字列の前後の文字列が不要語辞書ll内に存
在するかどうかを調べる不要語検査手段であり、13は
不要語検査手段12による検査結果をもとに数字列記7
手段4内の所定の数字列を削除する第2の数字列削除手
段である。また、10aは全体の動作を制御する制御部
である。以下、第1の3キ1例と同じ例を用いて本実施
例を説明する。
入力手段1により日本語文章が入力されてから数字列削
除手段7によって数字列記憶手段4内の所定の数字列が
削除されるまでの手順は第1の発明の一実施例の場合と
同じである。この時点での数字列記憶手段4の内容は第
5図のようになっている。ここで、不要語検査手段12
は制御部10aの制御のもとで、数字列記憶手段4内の
各数字列に関して文章記憶手段2内のこの数字列の前後
の文字列に不要語辞書ll内の不要語と一致するものが
あるか否かを調べ、その結果を第2の数字列削除手段1
3に渡す。ここで、不要語辞書11内に「第」、「請求
項」、「および」、「特許請求の範囲」などが収められ
ていたとする。不要語検査手段12は第5図に示されて
いる190文字目からはじまる符号「1」が文章記憶手
段2内では「請求項1」として表現されており、これが
不要語辞書11内の「請求項Jと一致するので、その旨
を第2の数字列削除手段13に伝える。第2の数字列削
除手段13は制御部10aの制御のもとで、不要語検査
手段12からの指示を受けて数字列記憶手段4内の符号
Ill (190文字目)の項を削除する。以下、第1
図に示した実施例の場合と同様に、KWIC生成手段8
によってKWICが生成されて表示手段9に表示される
。本実施例では第7図のような表示が得られる。
第7図では、「結果記憶手段」に対する符号として「4
」が与えられており、これが「形態素解析手段」の符号
「4」と重複していることが見やすい形で表示される。
さらに、明らかに符号の名称とは異なるものの自動排除
も行われている。
〔発明の効果〕
以上説明したように本発明を用いることにより、図面参
照用符号の不正の検出を容易にすることができるという
効果が得られる。
図に示す表示手段の表示例を示す概念図である。
1・・・・・・入力手段、2・・・・・・文章記憶手段
、3・・・・・・数字列情報抽出手段、4・・・・・・
数字列記憶手段、5・・・・・直前文字列検査手段、6
・・・・・・直後文字列検査手段、7・・・・数字列削
除手段、8・・・・・・KWIC生成手段、9・・・・
・表示手段、10.IOa・・・・・・制御部、11・
・・・・・不要語辞書、12・・・・・・不要語検査手
段、13・・・・・第2の数字列削除手段。
代理人 弁理士  内 原   晋
【図面の簡単な説明】
第1図は第1の発明の一実施例を示すプロ、り区、第2
図は第2の発明の一実施例を示すブロック図、第3図は
入力手段から入力される日本語文章例の一部分を示す図
、第4図、第5図は第1図、第2図における数字列記憶
手段の一例を示す概念図、第6図、第7図はそれぞれ第
1図、第2第1図 第3図 第2図 第4図 第5図 第6図 第7図

Claims (1)

  1. 【特許請求の範囲】 1、文章を入力する入力手段と、入力された前記文章を
    記憶するための文章記憶手段と、前記文章内の数字列と
    その文章中における位置を抽出する数字列情報抽出手段
    と、前記数字列を記憶するための数字列記憶手段と、前
    記文章中における前記数字列の直前の文字列の形態を検
    査する直前文字列検査手段と、前記文章中における前記
    数字列の直後の文字列の形態を検査する直後文字列検査
    手段と、前記直前文字列検査手段および直後文字列検査
    手段の検査結果をもとに前記数字列記憶手段内の前記数
    字列を削除する数字列削除手段と、前記数字列および前
    記文章をもとにKWICリストを生成するKWIC生成
    手段と、前記KWICリストを表示する表示手段を備え
    、前記直前文字列検査手段は前記文章中の前記数字列の
    直後が図面参照用符号の名称を構成しうる文字または文
    字列でないものを検出し、前記直後文字列検査手段は前
    記文章中の前記数字列の直後が図面参照用符号の直後に
    位置しうる文字または文字列でないものを検出し、前記
    数字列削除手段は前記直前文字列検査手段および前記直
    前文字列検査手段によって検出された数字列を削除する
    ことを特徴とする文章検査装置。 2、文章を入力する入力手段と、入力された前記文章を
    記憶するための文章記憶手段と、前記文章内の数字列と
    その文章中における位置を抽出する数字列情報抽出手段
    と、前記数字列を記憶するための数字列記憶手段と、前
    記文章中における前記数字列の直前の文字列の形態を検
    査する直前文字列検査手段と、前記文章中における前記
    数字列の直後の文字列の形態を検査する直後文字列検査
    手段と、前記直前文字列検査手段および直後文字列検査
    手段の検査結果をもとに前記数字列記憶手段内の前記数
    字列を削除する第1の数字列削除手段と、特許明細書特
    有の不要語を収めた不要語辞書と、前記文章中における
    前記数字列の前後の文字列が前記不要語と一致する場合
    に前記数字列記憶手段内の前記数字列を削除する第2の
    数字列削除手段と、前記数字列および前記文章をもとに
    KWICリストを生成するKWIC生成手段と、前記K
    WICリストを表示する表示手段を備え、前記直前文字
    列検査手段は前記文章中の前記数字列の直前が図面参照
    用符号の名称を構成しうる文字または文字列でないもの
    を検出し、前記直後文字列検査手段は前記文章中の前記
    数字列の直後が図面参照用符号の直後に位置しうる文字
    または文字列でないものを検出し、前記数字列削除手段
    は前記直前文字列検査手段および前記直前文字列検査手
    段によって検出された数字列を削除することを特徴とす
    る文章検査装置。
JP2199648A 1990-07-27 1990-07-27 文章検査装置 Pending JPH0484360A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2199648A JPH0484360A (ja) 1990-07-27 1990-07-27 文章検査装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2199648A JPH0484360A (ja) 1990-07-27 1990-07-27 文章検査装置

Publications (1)

Publication Number Publication Date
JPH0484360A true JPH0484360A (ja) 1992-03-17

Family

ID=16411342

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2199648A Pending JPH0484360A (ja) 1990-07-27 1990-07-27 文章検査装置

Country Status (1)

Country Link
JP (1) JPH0484360A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342312A (ja) * 2001-05-15 2002-11-29 Onda Techno:Kk 文書を作成するプログラム、記憶媒体、文書作成装置及び文書作成システム
WO2014171519A1 (ja) * 2013-04-17 2014-10-23 アイビーリサーチ株式会社 誤記検出装置及び記録媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63163956A (ja) * 1986-12-26 1988-07-07 Sharp Corp 文書作成・校正支援装置
JPH01205263A (ja) * 1988-02-12 1989-08-17 Toshiba Corp 文書処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63163956A (ja) * 1986-12-26 1988-07-07 Sharp Corp 文書作成・校正支援装置
JPH01205263A (ja) * 1988-02-12 1989-08-17 Toshiba Corp 文書処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342312A (ja) * 2001-05-15 2002-11-29 Onda Techno:Kk 文書を作成するプログラム、記憶媒体、文書作成装置及び文書作成システム
WO2014171519A1 (ja) * 2013-04-17 2014-10-23 アイビーリサーチ株式会社 誤記検出装置及び記録媒体

Similar Documents

Publication Publication Date Title
JPS6231467A (ja) 文章作成装置
JPH0484360A (ja) 文章検査装置
JP2621999B2 (ja) 文書処理装置
JP2776069B2 (ja) 文章検査装置
JPH04296970A (ja) 文章検査装置
JPH0531186B2 (ja)
JP2988046B2 (ja) かな漢字変換装置
JPH08263486A (ja) かな漢字変換装置及び方法
JPS60207948A (ja) カナ漢字変換処理装置
JPH05233619A (ja) 日本語文章誤り訂正方法およびその装置
JPS61175855A (ja) 仮名漢字変換装置
JPS60189573A (ja) 文字変換装置
JP3220133B2 (ja) 仮名漢字変換装置
JP2698192B2 (ja) 電子辞書における第2言語検索方法
JPH0282348A (ja) 文書校正支援装置
JPH03137768A (ja) 文書処理装置
JPH0682366B2 (ja) 文字列訂正方式
JPH02136959A (ja) 日本文訂正候補抽出装置
JPH0264859A (ja) 文章処理装置
JPH08263492A (ja) 文書作成支援方法及び装置
JPS6327916A (ja) 文書作成装置
JPH10171804A (ja) 機械翻訳装置
JPS6321226B2 (ja)
JPH034358A (ja) 共起データ作成方法
JPH01316863A (ja) 日本文誤り自動検定・訂正装置