JPH04138559A - 文書修正システム - Google Patents

文書修正システム

Info

Publication number
JPH04138559A
JPH04138559A JP2262318A JP26231890A JPH04138559A JP H04138559 A JPH04138559 A JP H04138559A JP 2262318 A JP2262318 A JP 2262318A JP 26231890 A JP26231890 A JP 26231890A JP H04138559 A JPH04138559 A JP H04138559A
Authority
JP
Japan
Prior art keywords
sentence
input
converted
document
bullet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2262318A
Other languages
English (en)
Other versions
JP2841813B2 (ja
Inventor
Hiroshi Kitahara
洋 北原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2262318A priority Critical patent/JP2841813B2/ja
Publication of JPH04138559A publication Critical patent/JPH04138559A/ja
Application granted granted Critical
Publication of JP2841813B2 publication Critical patent/JP2841813B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 日本語における文の自動修正システムに関し、計夏機を
使用して、文を、より分かりやすい文に変換する文書修
正システムを構築することを目的とし、 入力文書から一文を抽出する文抽出部と、入力された文
書中の文が箇条書きに変換できるか否かの文型を決定す
る為の文型キーワードが存在するか否かを判定する判定
部と、上記文型キーワードが存在して、箇条書きに変換
できる文型の場合、上記入力文書を箇条書きに変換する
変換部と、上記変換後の文書、又は、入力文を選択して
出力する出力部とを設けて、上記文抽出部で抽出された
一文について、上記判定部で、箇条書きに変換可能と判
定された場合、上記変換部で、該入力文を箇条書きの文
に変換して出力し、箇条書きに変換不可能と判定された
場合には、入力文をそのまま出力して文書を修正するよ
うに構成する。
[産業上の利用分野] 本発明は、日本語における文の自動修正システムに関す
る。
近年、ワードプロセッサ等の出現により、日本語文書を
効率的に処理できるシステムが出現している。
このようなシステムは、文書の作成、保存、&W集が、
その主な目的であるが、その他の機能として、文の自動
修正機能を持つものも知られている。
該文の自動修正とは、システムが文の誤りを直したり、
又は、文を分かり易(したりするものである。
一般に、文を分かり難くする要因として、本来、箇条書
きにすれば良いものを、例えば、カンマ等で区切って長
文にしてしまうことがある。
このような、長文を、分かり易い、箇条書き文に自動、
修正できるシステムがあると、分かり易い文が作成でき
る。
〔従来の技術と発明が解決しようとする課B]従来の文
の自動修正機能の多くは、単語に関するものであった0
例えば、抽象的な意味を持つ単語を見つけると、もっと
、具体的な意味の単語に置き換えるものである。この種
の技術として、特開昭63−118868号公報「日本
語文書構成装置」がある。
この「日本語文書構成装置」では、特定の単語を別の単
語に変換するテーブルを設けておき、上記の如き、抽象
な単語を認識すると、該テーブルを参照、して、・具体
的な意味を持つ単語に変換するものである。
然しながら、上記の如き、修正機構には、文に関する自
動修正機能、例えば、長文を箇条書きに変換する等の機
能は、実現されていなかった。
従って、今までは、文全体を分かり易くする為には、 l)人間が一度、文の内容を解釈し、 2)どのような文に書き直すかを考えて、3)実際に、
書き直す。
といった、人手の作業が必要であった。
本発明は上記従来の欠点に鑑み、ワードプロセッサ等で
文書を作成した場合に、該作成された文を、自動的に、
より分かりやすい文に変換する文書修正システムの一つ
を提供することを目的をするものである。
〔課題を解決するための手段〕
第1図は本発明の原理説明図であり、(a)は構成例を
示し、(bl) 、 (b2)は自動修正の例を示して
いる。
上記の問題点は下記の如(に構成された文書修正システ
ムによって解決される。
入力文書から一文を抽出する文抽出部1と。
入力された文書中の文が箇条書きに変換できるか否かの
文型を決定する為の文型キーワードが存在するか否かを
判定する判定部2と。
上記文型キーワードが存在して、箇条書きに変換できる
文型の場合、上記入力文書を箇条書きに変換する変換部
3と。
上記変換後の文書、又は、入力文を選択して出力する出
力部4とを設けて、 上記文抽出部1で抽出された一文について、上記判定部
2で、箇条書きに変換可能と判定された場合、上記変換
部3で、該入力文を箇条書きの文に変換して出力し、箇
条書きに変換不可能と判定された場合には、入力文をそ
のまま出力するように構成する。
〔作用〕
即ち、本発明によれば、ワードプロセンサ等において、
文が入力されると、該ワードプロセッサにおいて、1)
入力文書を読み込んで、−文を抽出し、2)入力された
文書中の文が箇条書きに変換できるか否かの文型を決定
する為の文型キーワード、例えば、“1)”と“2)′
とか、或いは、“第1に”と“第2に”等が存在するか
否かを判定し、3)上記文型キーワードが存在して、箇
条書きに変換できる文型の場合、上記入力文書を箇条書
きに変換して出力し、箇条書きに変換不可能と判定され
た場合には、入力文をそのまま出力するように動作する
従って、入力文の中で、箇条書きに変換可能な文は、箇
条書きの形式に自動変換されて出力され、分かり易い文
書を自動的に作成できる効果がある。
〔実施例〕
以下本発明の実施例を図面によって詳述する。
前述の第1図は、本発明の原理説明図であり、第2図は
本発明の一実施例を示した図であって、(a)は文型と
文型キーワードとの対応例を示し、(b)は入力文の分
割例を示し、(c)は分割対象部から原箇条書き文への
分割例を示し、(d)は主題文の作成例を示し、(e)
は箇条書き文の作成例を示し、(f)は「詳細型」の文
型の決定条件の例を示し、(g)は「詳細型」の文型と
挿入向の対応例を示し、(h)は処理手順の動作フロー
の例を示している。尚、全図を通して同じ符号は同じ対
象物を示している。
以下、第1図を参照しながら、第2図によって、本発明
の文書修正システムによって、入力された文を箇条書き
に自動修正する為の構成と動作を説明する。
先ず、入力された文には、例えば、項番型、副詞型、カ
ンマ型、接続助詞型の4つの文型がある。
「項番型」の文とは、第1図(bl)に示したように、
並列向の各々の句の先頭に括弧付の数字、つまり、項番
が付いているものである。
「副詞型」の文とは、例えば、「製品Xには。
第1に簡単にコピーができる。第2に持ち運びに便利で
ある。第3にデザインが優れている。という特徴がある
。」の文のように、並列向の各々の句の先頭に順序を表
す副詞(上記の例では、“第1に”など)がついている
ものである。
「カンマ型」の文とは、例えば、「この場合には、テキ
ストA、テキストB及びテキストCを読む必要がある。
」の文のように、並列向がカンマで区切られていて、そ
の最後の区切りが「及び(又は)」で区切っているもの
である。
「接続助詞型」の文とは、例えば、「ユーザの目的は、
システム理解だったり、作業実行だったり、製品評価だ
ったりする。」の文のように、並列向の後部に接続助詞
(“たり”など)が付いたものである。
本発明による文書修正システムは、第1図(a)に示す
ように、文抽出部1と1判定部2と、変換部3と、出力
部4の4つの部分から構成されている。
入力装置、及び、出力装置は、例えば、ファイル記憶装
置(DASD) 、フロッピーディスクなどの記憶装置
や端末などとする。
本発明による文書修正処理の概要は、 1)文抽出部1が入力文書から一文を抽出する。
2)判定部2が入力文の文型を決定し、変換部3で示し
た処理を実行するかどうかを決める。
3)変換部3が、上記−文を箇条書き文に変換する。
4)出力部4が、上記変換部3で変換された文。
又は、入力文を、その優、出力装置に出力する。
ものである。
上記、修正処理の具体的な処理手順を以下に説明する。
1)文抽出部1は、入力装置から入力された入力文書か
ら一文を抽出する。抽出した文を入力文と呼ぶ、若し、
全ての文に関して処理が終わり、もう文の抽出ができな
くなったら、この処理の実行を終了する。
2)判定部2では、第2図(a)に示した、それぞれの
文型を決定する為のキーワード(以下、文型キーワード
という)が、該抽出した一文中に存在するかどうかを調
べる。
例えば、文の中に、”1)”と“2)”が両方とも存在
していれば、その文型は「項番型」である。
もし、文の中に、上記(a)図に示した文型キーワード
が存在すれば、変換部3の処理を実行し、該文型キーワ
ードが存在しなければ、出力部4の実行に移る。
3)変換部3では、以下の(イ)〜(へ)の処理を順に
実行する。
(イ)入力文の分割処理:  ((h)図のステップ3
0参照) 入力文を以下の3つの部分に分割する。
箇条書きは、第1図(b2)に示したように、主題文と
箇条書き文からなるが、第2図(b)に示されているよ
うに、先行部(「製品Xには、」)と後続部(「特徴が
ある。」)は、上記主題文の元になる部分であり、分割
対象部(「l)簡単にコピーができる。2)持ち運びに
便利である。3)デザインが優れている」)は上記箇条
書き文の元になる部分である。
入力文の分割の仕方は、「カンマ」 「文型キーワード
」及びr分割キーワード」を目安に行う。
ここで、該「分割キーワード」とは、上記分割対象部と
後続部を分割する役目を持つ語句(例えば、(b)図の
例では、「という1句)である。但し、該「分割キーワ
ード」は分割対象部と後続部のどちらにも属さないもの
とする。
上記のようにした、入力文を分割した例を、第2図(b
)に示す。
(ロ)分割対象部の分割: ((h)図のステップ31
参照) 上記のようにして、入力文を先行部2分割対象部、後続
部に分割した後、更に、分割対象部を第2図(c)に示
したように、箇条書き文の元になる複数個の文(以下、
原箇条書き文という)に分割する。
(ハ)「詳細型」の文型の決定:  ((h)図のステ
ップ32参照) 分割対象部を原箇条書き文に分割した後、第2図(f)
に示した表に従って、文型をさらに細かく分類した「詳
細型」を決定する。
該(f)図に示した表において、文型3分割キーワード
、及び、原箇条書き文の条件の欄に示した「品詞」が、
該「詳細型」を決定するための条件である。表中、 “
−゛は条件がないことを示している。
例えば、第1図(bl)に示した例文の「詳細型」は、
文型キーワードが“1)′と“2)″であり、分割キー
ワードが“という”であるので、「項番−2型」である
(ニ)主題文の作成: ((h)図のステップ33参照
) 箇条書き形式における“主題文”は、第2図(d)のよ
うに、元の文の先行部と後続部、及び、その間に挿入す
る“挿入向”から作られる。
この“挿入向”は、上記(ハ)の処理で決定した「詳細
型jの文型により、第2図(g)に示した“「詳細型」
と挿入向°の対応表を参照して決定する。
例えば、上記例文の「詳細型」は上記のように、「項番
−2型」であるので、対応する挿入向は、以下の”であ
る。従って、上記の文例の場合の“主題文”は、第2図
(d)のようになる。
(ホ)箇条書き文の作成:  ((h)図のステップ3
4参照) “箇条書き文”は、第2図(e)に示したように、上記
原箇条書き文の前に、箇条書きを表す符号、例えば、“
1)”などを付けて作成する。
(へ)箇条書きの作成:((h)図のステップ35参照
) 上記(ニ)の処理で作成した“主題文”と、上記(ホ)
の処理で作成した“箇条書き文″とを合わせて変換文に
する。(第1図(b2)参照)4)出力部4において、
上記変換後の変換文、又は、入力文の出力を行う。出力
文を出力した後、次の一文について、同じ処理を行う為
に、処理1)に戻る。
上記1)〜4)の処理手順を図示すると、第2図(h)
に示した動作フローとなる。
このように、本発明による文書修正システムは、ワード
プロセッサにおいて、l)入力文書を読み込んで、−文
を抽出し、2)入力された文書中の文が箇条書きに変換
できるか否かの文型を決定する為の文型キーワード、例
えば、“1)”と“2)”とか。
或いは、“第1に”と“第2に”等が存在するか否かを
判定し、3)上記文型キーワードが存在して、箇条書き
に変換できる文型の場合、上記入力文書を箇条書きに変
換して出力し、箇条書きに変換不可能と判定された場合
には、入力文をそのまま出力するようにした所に特徴が
ある。
(発明の効果〕 以上、詳細に説明したように、本発明の文書修正システ
ムは、入力文書から一文を抽出する文抽出部と、入力さ
れた文書中の文が箇条書きに変換できるか否かの文型を
決定する為の文型キーワードが存在するか否かを判定す
る判定部と、上記文型キーワードが存在して、箇条書き
に変換できる文型の場合、上記入力文書を箇条書きに変
換する変換部と2上記変換後の文書、又は、入力文を選
択して出力する出力部とを設けて、上記文抽出部で抽出
された一文について、上記判定部で、箇条書きに変換可
能と判定された場合、上記変換部で、該入力文を箇条書
きの文に変換して出力し、箇条書きに変換不可能と判定
された場合には、入力文をそのまま出力して文書を修正
するようにしたものであるので、箇条書き文に変換でき
ることを指示する文型キーワードが認識されると、予め
、定められた手順により、自動的に、入力文を箇条書き
の形に直すことができ、日本語文をより分かり易(する
ことができる効果がある。
【図面の簡単な説明】
第1図は本発明の原理説明図。 第2図は本発明の一実施例を示した図。 である。 図面において、 1は文抽出部。 3は変換部。 30〜35は処理ステップ。 2は判定部。 4は出力部。 をそれぞれ示す。 第 図(その1) (bl) (b2) 本発明の原理説明図 第 1 図(その2) 文型と文型キーワード (a) 本発明の一実施例を示した図 第 図 (その1) 入力文の分割 第 図 (その2) 分割対象部から原箇条書き文への分割 (d) 本発明のm−実施例を示した図 第 図 (その3) 箇条書き文の作成 (e) 本発明の一実施例を示した図 第 図 (その4) 「詳細型」の決定条件 第 図 (その5) ] 「詳細型」と挿入句の対応表 第 図 (その6)

Claims (3)

    【特許請求の範囲】
  1. (1)入力文書から一文を抽出する文抽出部(1)と、 入力された文書中の文が箇条書きに変換できるか否かの
    文型を決定する為の文型キーワードが存在するか否かを
    判定する判定部(2)と、 上記文型キーワードが存在して、箇条書きに変換できる
    文型の場合、上記入力文書を箇条書きに変換する変換部
    (3)と、 上記変換後の文書、又は、入力文を選択して出力する出
    力部(4)とを設けて、 上記文抽出部(1)で抽出された一文について、上記判
    定部(2)で、箇条書きに変換可能と判定された場合、
    上記変換部(3)で、該入力文を箇条書きの文に変換し
    て出力し、箇条書きに変換不可能と判定された場合には
    、入力文をそのまま出力することを特徴とする文書修正
    システム。
  2. (2)上記箇条書きに変換できる文型として、少なくと
    も、「項番型」「副詞型」「カンマ型」「接続助詞型」
    を設定し、更に、それぞれを、複数個の「詳細型」の文
    型に分割することを特徴とする請求項1に記載の文書修
    正システム。
  3. (3)上記箇条書き文を「主題文」と「箇条書き文」と
    で構成し、 上記変換部(3)での変換方式として、該入力文を、上
    記「主題文」の元となる「先行部」と「後続部」と、上
    記「箇条書き文」の元になる「分割対象部」とに分割す
    る手段(30)と、 該「分割対象部」を上記文型キーワードに基づいて、「
    箇条書き文」の元になる複数個の「原箇条書き文」に分
    割する手段(31)と、 上記文型を、「詳細型」の文型に分割する詳細型の決定
    手段(32)と、 上記決定手段(32)で決定された文型の「詳細型」に
    対応した「挿入句」を決定しておき、上記「主題文」を
    、上記「先行部」+「挿入句」+「後続部」で作成する
    主題文の作成手段(33)と、上記分割した「原箇条書
    き文」の前に、箇条書きを表す符号を付加して箇条書き
    文を作成する手段(34)と、 上記主題文の作成手段(33)で作成された「主題文」
    と、上記箇条書き文を作成する手段(34)で作成され
    た「箇条書き文」とを合わせて変換文を作成する手段(
    35)とで構成することを特徴とする請求項1に記載の
    文書修正システム。
JP2262318A 1990-09-28 1990-09-28 文書修正システム Expired - Fee Related JP2841813B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2262318A JP2841813B2 (ja) 1990-09-28 1990-09-28 文書修正システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2262318A JP2841813B2 (ja) 1990-09-28 1990-09-28 文書修正システム

Publications (2)

Publication Number Publication Date
JPH04138559A true JPH04138559A (ja) 1992-05-13
JP2841813B2 JP2841813B2 (ja) 1998-12-24

Family

ID=17374107

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2262318A Expired - Fee Related JP2841813B2 (ja) 1990-09-28 1990-09-28 文書修正システム

Country Status (1)

Country Link
JP (1) JP2841813B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62229364A (ja) * 1986-03-29 1987-10-08 Toshiba Corp 文書レイアウト方法
JPS62245366A (ja) * 1986-04-18 1987-10-26 Toshiba Corp 文書処理装置
JPS62284460A (ja) * 1986-06-03 1987-12-10 Toshiba Corp 文書作成支援装置
JPS63118660U (ja) * 1986-08-09 1988-08-01

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62229364A (ja) * 1986-03-29 1987-10-08 Toshiba Corp 文書レイアウト方法
JPS62245366A (ja) * 1986-04-18 1987-10-26 Toshiba Corp 文書処理装置
JPS62284460A (ja) * 1986-06-03 1987-12-10 Toshiba Corp 文書作成支援装置
JPS63118660U (ja) * 1986-08-09 1988-08-01

Also Published As

Publication number Publication date
JP2841813B2 (ja) 1998-12-24

Similar Documents

Publication Publication Date Title
US5787451A (en) Method for background spell checking a word processing document
EP0447157B1 (en) Data format conversion
JP2007265458A (ja) 複数の圧縮オプションを生成する方法およびコンピュータ
KR980004126A (ko) 다국어 웹 문서 검색을 위한 질의어 변환 장치 및 방법
US20230267271A1 (en) Auto conversion system and method of manuscript format
JPH04138559A (ja) 文書修正システム
JP3470975B2 (ja) 文書入力装置のかな漢字変換方法および装置
Min et al. Typographical and Orthographical Spelling Error Correction.
Ahonen-Myka Mining all maximal frequent word sequences in a set of sentences
JPH07230468A (ja) キーワード自動抽出装置およびキーワード自動抽出方法
JP3924260B2 (ja) 節境界検出装置、機械翻訳装置及びコンピュータプログラム
JPH08190561A (ja) 文書修正装置
JP2588522B2 (ja) 機械翻訳辞書アクセス方法
JP2746666B2 (ja) 文書接続印刷処理方式
JPH036624A (ja) 複数コード系に対応する翻訳リスト出力処理方式
Thurgood et al. New Found Minority Languages in China Series
JP2718966B2 (ja) 誤り検出装置
JP3253753B2 (ja) 文書読み上げ対象テキストの整形方法および装置
JP2017208049A (ja) 言語解析装置、言語解析方法、及びプログラム
JPH08190570A (ja) 文書データの比較検証システム
JP2575947B2 (ja) 文節切出し装置
JPH06309366A (ja) キーワード抽出方式
JPH0668134A (ja) 翻訳用例ベース利用翻訳方式
JPH08147151A (ja) ソフトウェア開発方法
JPH01216474A (ja) 重複表現処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees