JPH0682363B2 - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPH0682363B2
JPH0682363B2 JP62008834A JP883487A JPH0682363B2 JP H0682363 B2 JPH0682363 B2 JP H0682363B2 JP 62008834 A JP62008834 A JP 62008834A JP 883487 A JP883487 A JP 883487A JP H0682363 B2 JPH0682363 B2 JP H0682363B2
Authority
JP
Japan
Prior art keywords
sentence
keyword
concept
candidate
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62008834A
Other languages
English (en)
Other versions
JPS63175965A (ja
Inventor
育雄 芥子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP62008834A priority Critical patent/JPH0682363B2/ja
Publication of JPS63175965A publication Critical patent/JPS63175965A/ja
Publication of JPH0682363B2 publication Critical patent/JPH0682363B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 <産業上の利用分野> 本発明は,利用者によって作成された文章や,電子メー
ル等から入力された文章を自動的に分類し,中身の概要
を表わす要約テーブルを生成することにより,効率的な
文書管理が可能な文書処理装置に関する。
<従来技術> 従来,文書処理装置である日本語ワードプロセッサや欧
米ワードプロセッサにおいては,ビジネス文書等の比較
的定型の文書を作成する場合に,過去に作成された文書
がそのまま使えたり,一部を修正するだけで新しい文書
を効率良く作成できることが往々であった。またそれが
ワードプロセッサの大きな利点でもあった。
このため所望の文章を容易に探すことができるように,
予め分類体系を設定し,その基に利用者が作成した文書
を分類し,文書の内容を象徴するような名前(文書名)
をつけて補助記憶装置上に格納していた。
<発明が解決しようとする問題点> しかし利用者が,新しく作成した文書を分類体系のどこ
かに分類するかを決めるには分類体系を全て把握してい
る必要があった。しかも複数の利用者が同じ文書処理装
置を使っている場合には,全ての利用者の判断基準が同
じでなければならなかった。従って文書をその内容によ
って画一的に分類することは非常に困難であった。
また,同じ所に分類された文書についても格納されてい
る文書の数が多くなれば同じような名前が増加し,文書
名だけでその中味を判断することができなくなってい
た。例えば,「案内」という文書名をもつ文書は,大き
く分類すると a)パーティーの案内 b)会議の案内 c)大売出しの案内 等があり,それぞれにまた個別の内容を持つ文書がいろ
いろある。
従って,多くの文書の中から利用者が真に望むものを選
択するためには,文書名と同時に文書の中味も確認する
必要があり,非常に面倒であった。
<発明の目的> 本発明は,上述の従来問題点を解決するものであり,文
書を補助記憶装置上に格納する際にその文書の内容を象
徴する概念に分類し要約テーブルを自動生成すること
で,後にその文書を検索する作業を効率的に実行可能な
新規な文書処理装置を提供することを目的とする。
<実施例> 以下,本発明に係る文書処理装置の一実施例について図
面を用いて詳細に説明を行う。
第1図は,本実施例の文書処理装置の基本構成を示す。
文書処理装置1は,キーボード2により入力された文章
を表示装置3に表示するとともに,文書を編集作成して
第1補助記憶装置4(例えばフロッピーディスク)に格
納する。
キーワード抽出手段6は,入力された文章から辞書5を
用いて複数の単語を抽出し,その抽出した単語群から上
位概念のキーワード候補を導き出す。
文章概念制御手段8は,キーワード抽出手段6により抽
出されたキーワード候補から概念・キーワード関係表7
を用いて,文章の内容を象徴する概念の候補とキーワー
ド候補の中からその概念候補に適したキーワードの組み
合わせを決定する。
キーワード解析手段10は,文章概念制御手段8で決定さ
れたキーワードの組み合わせの中から規則表9に記述さ
れた特に重要なキーワードについて,文章中でそのキー
ワードに変換された単語の前後の文章を解析して情報を
抽出する。
要約テーブル生成手段12は,フレーム蓄積部11に格納さ
れたフレームの中から文章概念制御手段8で候補となっ
た文章の概念に対応するフレームを用いてキーワード解
析手段10で抽出された情報から文章の概念が正解かどう
かをテストし,成功すれば要約テーブルを生成し第2候
補記憶装置13(例えばフロッピーディスクであり第1補
助記憶装置4と共用してもよい)に格納する。失敗すれ
ば文章概念制御手段8の次候補の文章の概念とキーワー
ドの組み合わせについて同様の処理を行う。
以下,この文書処理装置の動作について説明する。
例えば,利用者がキーボード2を用いて 「さて,1月2日にご注文賜りましたコンデンサーを宅配
便で送りました」 ……(1) と入力したとする。文書処理装置1は,入力された文章
を単語単位に分割し,キーワード抽出手段6に与える。
辞書5と概念・キーワード関係表7を結合した概念図を
第2図に示す。キーワード抽出手段6では文中の単語
「注文」,「コンデンサー」,「送り」から辞書5(10
1)を用いて,この単語群を「注文」→「発注」「要
求」,「コンデンサー」→「商品」,「送り」→「派
遣」「経過」「発送」の様に各々キーワード候補に変換
する。以上の処理によってキーワード抽出手段では「発
注,要求,商品,派遣,経過,発送」の6つのキーワー
ド候補が抽出される。
次に文章概念制御手段8では抽出された上記6つのキー
ワード候補から概念・キーワード関係表7(102)を用
いて,文章の内容を象徴する概念候補とそれに関連した
キーワードの組み合わせが決定される。ここで概念・キ
ーワード関係表102は,文章の概念と関係のあるキーワ
ードを連続したものであり,例えば,概念「採用の通
知」はキーワード「人,派遣,要求etc」と接続されて
いる。この概念・キーワード関係表によってキーワード
の包括性から文章の概念候補が決定されると同時に,多
義語等辞書101上の曖味性が解消される。以上の処理に
よって文章概念制御手段8では,文章の概念候補として
「出荷の通知」,キーワードの組み合わせとして上記6
つのキーワード候補の中から「出荷の通知」に接続され
た「発注,商品,発送」の3つのキーワードが抽出され
る。
次にキーワード解析手段10では,抽出された上記3つの
キーワードの組み合わせの内,規則表9に記述されてい
るキーワードについて,文章(1)の中でそのキーワー
ドに変換された単語の前後の文章を解析して情報を抽出
する。
即ち規則表9には,例えばキーワード「発注」について IF THEN (〔発注〕+賜りました+X+を)→(立場:業者,注
文品:X) ……(2) の様な規則が登録されてある。これは,キーワード「発
注」に変換された文章中の単語の次に「賜りました」が
続き,何文字かの後「を」が続く場合には,この文章を
書いている人の立場は業者,即ち注文を受けた側の立場
であり,「賜りました」と「を」ではさまれた文字列X
が注文品の内容を示しているという規則が存在すること
を意味し,この関係が記憶されている。
以上の処理によってキーワード解析手段10では,文章
(1)から 注文日→1月2日 立場→業者 ……(3) 注文品→コンデンサー 発送手段→宅急便 といった文脈情報が抽出される。
次に要約テーブル生成手段12が文章概念制御手段8で文
章(1)の概念候補となった「出荷の通知」に対応する
フレームを用いて(3)の情報を基に要約テーブルを生
成する。
例えば,「出荷の通知」フレームは次のような構成であ
る。
「出荷の通知」フレーム 立場:業者 注文日: 注文品: ……(4) 発送手段: 発送日: ここでフレーム中の':'の左側が属性名,右側が値を示
す。ここで予め値が入っている属性名,文章がそのフレ
ームの概念であるための制約条件を示している。また,
値が入っていない属性名((4)の例では注文日,注文
品,発送手段,発送日)はそのフレームの概念の文章が
一般に含む内容である。これらの値は,キーワード解析
手段10で抽出された文脈情報の単語情報で充填され,要
約テーブルが生成される。
生成された要約テーブルは第2補助記憶装置13上で概念
である「出荷の通知」のクラスに分類されて格納され
る。また,文章(1)が蓄積されている第1補助記憶装
置4上のアドレスも同時に格納される。
利用者が求める文書を引出す場合は,まず求める概念を
指定し,その概念に含まれる複数の要約テーブルを表示
せしめ,その中から該当する内容のものを指定すること
でそのアドレスから求める文書に適確且つ迅速にアクセ
スできる。
<発明の効果> 以上説明したように,本発明において,利用者が作成し
た文章や電子メール等から入力された文章をその内容で
自動的に分類し,中身の概要を表わす要約テーブルを附
けて格納されるため,要約テーブルの確認により利用者
が望む文書を容易に引き出すことができ,効率的な文書
管理が可能となる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図,第2図は
本発明の辞書と概念キーワード関係表を結合した概念図
である。 図中,1……文書処理装置、2……キーボード、3……表
示装置、4……第1補助記憶装置、5,101……辞書、6
……キーワード抽出手段、7,102……概念・キーワード
関係表、8……文章・概念制御手段、9……規則表、10
……キーワード解析手段、11……フレーム蓄積部、12…
…要約テーブル生成手段、13……第2補助記憶装置

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】利用者が作成した任意の文章に含まれる単
    語から解析によって前記単語の意味内容を象徴するキー
    ワード候補を抽出するキーワード抽出手段と、 文章の内容を表す概念候補及び前記キーワード候補の中
    から前記概念候補に適したキーワードの組み合わせを決
    定する文章概念制御手段と、 前記キーワードの組み合わせの中で文章の意味を表現す
    るのに重要なキーワードに対応する入力文章の中の単語
    の前後の文章を解析して前記入力文章の文脈情報を抽出
    するキーワード解析手段と、 前記文脈情報が前記概念候補の属性名と該属性名に対応
    する値とからなるフレームに適合するか否かのテストを
    行い、適合した時には前記概念候補の中から文章の概念
    を決定すると共に、前記値に前記文脈情報の単語情報を
    充填して要約テーブルを生成する要約テーブル生成手段
    と、 前記文章の概念と対応づけて前記要約テーブル及び前記
    入力文章のアドレスを格納する記憶手段と、を備えたこ
    とを特徴とする文書処理装置。
JP62008834A 1987-01-16 1987-01-16 文書処理装置 Expired - Fee Related JPH0682363B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62008834A JPH0682363B2 (ja) 1987-01-16 1987-01-16 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62008834A JPH0682363B2 (ja) 1987-01-16 1987-01-16 文書処理装置

Publications (2)

Publication Number Publication Date
JPS63175965A JPS63175965A (ja) 1988-07-20
JPH0682363B2 true JPH0682363B2 (ja) 1994-10-19

Family

ID=11703813

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62008834A Expired - Fee Related JPH0682363B2 (ja) 1987-01-16 1987-01-16 文書処理装置

Country Status (1)

Country Link
JP (1) JPH0682363B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0776971B2 (ja) * 1989-03-17 1995-08-16 工業技術院長 文書抄録作成装置
DE69132067T2 (de) * 1990-09-20 2000-11-16 Kabushiki Kaisha Nippon Conlux, Tokio/Tokyo Vorrichtung zum Verarbeiten von Münzen
JPH05101052A (ja) * 1991-10-04 1993-04-23 Fuji Xerox Co Ltd 文書作成支援装置
US5948058A (en) * 1995-10-30 1999-09-07 Nec Corporation Method and apparatus for cataloging and displaying e-mail using a classification rule preparing means and providing cataloging a piece of e-mail into multiple categories or classification types based on e-mail object information
JP5388038B2 (ja) * 2009-12-28 2014-01-15 独立行政法人情報通信研究機構 文書要約装置、文書処理装置、及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61248160A (ja) * 1985-04-26 1986-11-05 Hitachi Ltd 文書情報登録方式

Also Published As

Publication number Publication date
JPS63175965A (ja) 1988-07-20

Similar Documents

Publication Publication Date Title
CN112307185B (zh) 演示用装置
US6662152B2 (en) Information retrieval apparatus and information retrieval method
US5541838A (en) Translation machine having capability of registering idioms
JP7313069B2 (ja) 検索用資料情報記憶装置
JP2001075966A (ja) データ分析システム
JPH0682363B2 (ja) 文書処理装置
CN111681087A (zh) 信息处理方法、装置、计算机可读存储介质及电子设备
JPH0782497B2 (ja) 文書処理装置
CN111144122B (zh) 评价处理方法、装置和计算机系统及介质
CN107871254A (zh) 提供数据对象信息的方法及装置
KR102518843B1 (ko) Lda를 이용한 기업 컨텐츠 관리 시스템
CN117909560A (zh) 搜索方法、模型的训练方法、装置、设备、介质及程序产品
US12353459B2 (en) Information processing apparatus and non- transitory computer readable medium
CN115495589A (zh) 数据检索方法、装置、设备及存储介质
JP2006133933A (ja) コンピュータ処理方法
JPH09179875A (ja) 情報検索装置
KR20230071950A (ko) 과학기술과 관련된 직접 정보 뿐만 아니라 부가적인 정보도 창출하여 제시할 수 있는 과학기술 정보 검색 시스템
KR0162471B1 (ko) 문장을 이용한 일정관리장치 및 방법
JP3210842B2 (ja) 情報処理装置
JP7851525B1 (ja) 質問文に対して文書を検索して回答するプログラム、回答装置及び方法
JPH0944521A (ja) インデックス作成装置および文書検索装置
JP2008003656A (ja) 概念辞書生成装置、文書分類装置、概念辞書生成方法および文書分類方法
JP2000090110A (ja) 全文検索方法、装置、および全文検索プログラムを記録した記録媒体
KR101137056B1 (ko) 자동 상품모델 추천 로직을 이용한 상품 정보 등록 방법 및시스템
JP2002312363A (ja) 情報配信方法および情報配信装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees