JPH09218872A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPH09218872A
JPH09218872A JP8023719A JP2371996A JPH09218872A JP H09218872 A JPH09218872 A JP H09218872A JP 8023719 A JP8023719 A JP 8023719A JP 2371996 A JP2371996 A JP 2371996A JP H09218872 A JPH09218872 A JP H09218872A
Authority
JP
Japan
Prior art keywords
sentence
unit
characters
condition
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8023719A
Other languages
English (en)
Inventor
Takehiko Yoshimi
毅彦 吉見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP8023719A priority Critical patent/JPH09218872A/ja
Publication of JPH09218872A publication Critical patent/JPH09218872A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 要約文を作成する場合には、例えば「この文
を20字程度にまとめよ」など、要約文の長さに制限が
与えられることが多いが、従来の要約文作成装置では、
要約文の長さは考慮されていないので、ユーザは適当に
作成された要約文の文字数をわざわざカウントし、編集
を加えるという繁雑な作業が必要であった。 【解決手段】 各節点の文字数をカウントする文字数付
加部3、ユーザからの要約文の長さの条件を記憶する条
件記憶部4と、作成された要約結果がユーザの指定した
制約条件を満たすかどうか判断する条件判定部5を備
え、条件を満たす要約文を要約文表示部8より表示す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書を処理するワ
ードプロセッサ、コンピュータなどの文書処理装置に関
するものである。
【0002】
【従来の技術】原文を入力して、要約文を作成する手法
とし節点を削除していく手法がある。この処理の概要を
以下の例に基づいて説明する。例文として“このツール
は、アドレスを指定するための非常に便利な機能をサポ
ートする。”という原文があるとする。
【0003】この原文に対して、形態素解析処理及び構
文解析処理と呼ばれる処理が施される。形態素解析処理
とは、入力される文に対してそれを形態素に分割し、そ
の各形態素の品詞情報(候補として複数の場合もある)
を得る処理である。
【0004】形態素解析処理によって、各形態素の品詞
が得られると、構文解析処理によりそれらの形態素の係
り受けが解析され、図3に示すような形式の解析結果が
得られる。これはそれぞれの文節がどのように他の文節
と係り受けされるかを示すものであり、各節点(文節)
の深さを表すレベルが割り当てられている。
【0005】根節点(レベル1)は、原文全体を支配す
る構成要素「サポートする。」である。根節点の一つ下
のレベルである根節点の子節点(レベル2)には、根節
点に支配される二つの構成要素「ツールは、」と「機能
を」がそれぞれ割り当てられている。レベル3の節点は
「ツールは、」に支配されている「この」と、「機能
を」支配されている「指定するための」と「便利な」で
ある。葉節点(一番下のレベル)であるレベル4の節点
は「指定するための」に支配される「アドレスを」と、
「便利な」に支配される「非常に」である。
【0006】要約文は、あるレベルよりも浅いレベルの
節点に割り当てられている構成要素を抽出することによ
って、実現される。すなわち、レベル1の節点を抽出す
れば、要約文は「サポートする。」となり、レベル2で
は「ツールは、機能をサポートする。」となる。
【0007】
【発明が解決しようとする課題】上記のような処理によ
り、要約を作成する場合においては、まず適当にレベル
を設定してみて要約結果を確認し、もう少し詳しい文が
欲しい場合にはレベルを下げ、もっと簡単な(要約され
た)文にしたい場合は、レベルを上げることによって、
調整を行っていた。
【0008】しかしながら、要約を行う要求としては
「この文を20文字以内にまとめたい」など、要約文の
文字数に制限を与えることが多い。しかし、上述した従
来の要約作成処理では、要約文の文字数は全く考慮され
ていないので、要約文の長さの制限が与えられた場合
に、その制限を満たすような要約文が作成できるとは限
らないという問題があった。
【0009】
【課題を解決するための手段】本発明の請求項1におい
て、入力された原文を受け取り記憶する原文受理部と、
前記原文受理部で受け取った原文に対して形態素解析及
び構文解析を行い、原文を複数の節点に分割する文解析
部と、前記文解析部によって、分割された解析結果を記
憶する解析結果記憶部と、分割された各節点を構成する
文字数を計数して記憶する文字数付加部と、要約文に関
する文字数の条件を受け取り記憶する条件記憶部と、前
記文解析部によって分割された各文節の節点を順次削除
する節点削除部と、前記節点削除部によって一部が削除
された残りの各節点の文字数の和が前記制約条件記憶部
に記憶された制約条件を満たすかどうかを判定する条件
判定部と、前記条件判定部によって判定された制約条件
を満たす要約結果から要約文を生成する要約文生成部
と、前記要約文生成部によって生成された要約文を表示
する要約文表示部を備えたことにより上記課題を解決す
る。
【0010】また、請求項2においては、前記条件記憶
部は、要約文の最大文字数を受け取り、前記要約文生成
部は、要約結果の文字数の和が前記条件記憶部の値を越
えない最大のものを要約文として生成することにより上
記課題を解決する。
【0011】さらに、請求項3において、前記条件記憶
部は、原文の文字数における要約文の文字数の割合を受
け取り、前記要約文生成部は、原文の文字数における要
約結果の文字数の和の割合が前記条件記憶部の値を越え
ない最大のものを要約文として生成することによって上
記課題を解決する。
【0012】
【発明の実施の形態】本発明の実施の形態を以下に図面
を用いて詳細に説明する。図1は本発明における構成の
一例を示すブロック図である。1は原文受理部であり、
入力された文を受け取る。入力はユーザなどが直接キー
ボードなどを用いてもよいし、フロッピーディスクなど
の外部記憶装置に予め用意しておいて入力してもよい。
【0013】2は文解析部である。ここで、入力された
原文に対して形態素解析、構文解析が施され、構成要素
を各節点に割り当てる。3は文字数付加部である。各節
点に割り当てられた構成要素の文字数を数えてそれぞれ
にデータとして付与する。4は条件記憶部である。ここ
で、ユーザから入力される要約文に対する条件を記憶す
る。条件としては文字数や原文との比などである。5は
条件比較部であり、入力された条件と、一部構成要素が
削除された文の文字数を比較して、条件を満たすかどう
かを判断する。
【0014】6は、節点削除部である。節点である構成
要素をここで順に削除する。7は要約文生成部であり、
条件を満たし一部構成要素が削除された文の要素から要
約文を生成する。8は生成された要約文を表示する要約
文表示部である。
【0015】例をして、“入力文を20字以内にまとめ
る”という条件で要約文を作成する。原文としては前述
の例文と同様に“このツールは、アドレスを指定するた
めの非常に便利な機能をサポートする。”が入力される
とする。
【0016】図2は要約処理の流れを示すフローチャー
トである。STEP1〜STEP8はそれぞれ図1の1
〜8で行う処理に対応している。 STEP1:原文受理部1でユーザによってキーボード
等から入力された要約対象となる原文を受け取り、それ
をディスプレイなどに表示させる。図4は表示の例を示
す図である。
【0017】STEP2:文解析部2で、STEP1で
受け取った文に対して形態素・構文解析を行う。形態素
解析及び構文解析の手法については特にどのようなもの
を用いてもよい。形態素、構文解析規則の例を図5に示
す。
【0018】形態素解析、構文解析によって得られる情
報は、図3の「文節」欄、「構文範疇」欄、「親番号」
欄、「子番号」欄である。本発明においては文節=節点
として以下に説明をする。
【0019】形態素解析、構文解析結果は基本的には、
節点間の親子関係(支配関係)によって表現される。例
えば図3において、節点「この」の親節点は、識別番号
2の節点「ツールは、」である。また、節点「この」の
「子番号」欄に保持されているのは“0”である。
“0”とは子節点(あるいは親節点)が存在しないこと
を示す。親節点を持たない節点を根節点、子節点を持た
ない節点を葉節点と呼ぶ。
【0020】「深さ」欄は、根節点が深さ1、その子節
点が2、さらにその子節点が3というように、根節点か
ら葉節点に向けて、節点の深さを表す数値を保持する。
【0021】STEP3:文字数付加部3によって、S
TEP2によって得られた形態素、構文解析結果を参照
し、各節点に割り当てられている文構成要素の文字数を
数える。さらに総文字数を計数する。図6は文字数が付
与されたデータの例である。
【0022】STEP4:条件記憶部4で要約文の長さ
に関する要求(制約条件)をユーザから受け取り記憶
し、さらに条件判定部5に送る。
【0023】STEP5:条件判定部5では、検査対象
の解析結果がユーザの指定した要約文の文字数Nと各要
約結果の各節点に割り当てられている文構成要素の文字
数の和M1,…,MnとNの大小比較を行い、Mi≦Nを
満たすMiが存在すればSTEP7へ行き、存在しない
ならばSTEP6へ行く。例ではユーザの指定した制約
条件として20という数値が条件記憶部に記憶されてい
る。現在の検査対象であるSTEP4から直接送られて
きた図6のデータの総文字数は35であり、条件記憶部
に記憶されている数値20より大きいのでSTEP6へ
進む。
【0024】STEP6:節点削除部6では、解析結果
記憶部9に記憶されている処理対象のテーブルから最も
深いレベルの節点(解析結果における1行)を削除す
る。
【0025】具体的には、処理対象のデータに最も深い
レベルの節点がn個(nは自然数)存在する場合、それ
らのn個の節点のうち、r個(r=1,2,…,n)の
節点を削除して新たなデータを個別に作成、すなわち、
n個からr個をとるすべての組み合わせSTEP5での
検査対象とする。STEP6はSTEP61〜STEP
66からなる手続からなる。
【0026】STEP61において、まず、解析結果記
憶部に記憶されている節点のうち、最も深いレベルの節
点と、その数を求める。現在の処理対象は図6であり、
最も深いレベルの節点は深さ4の節点「アドレスを」
と、節点「非常に」の二つである。STEP62で、最
も深いレベルの節点の数をnとする。現在の処理対象の
場合、n=2となる。STEP63で削除する節点の数
を管理するカウンターrの値を1に初期設定する。ST
EP64で、削除処理の終了条件を判定する。現在、終
了条件1=r>n=2は満たされないので、STEP6
5へ進む。
【0027】STEP65で、処理対象のデータから最
も深いレベルの節点をr個削除する。現在、r=1であ
るので、図6のデータから、最も深いレベルの節点を一
つ削除する。節点「アドレスを」を削除すると、図7が
得られ、節点「非常に」を削除すると図8を得る。ST
EP66で、rの値を1増加させて、STEP64へ戻
る。STEP64の終了条件2=r>n=2が満たされ
ないので、STEP65へ進み、節点「アドレスを」
と、節点「非常に」の2つの節点を削除すると、図9に
示すデータを得る。STEP66で、rの値を1増加さ
せて、STEP64へ戻る。STEP64の終了条件3
=r>n=2が満たされるので、処理を終える。
【0028】STEP5にもどり、図7、図8、図9の
「総文字数」の数値と条件記憶部に記憶されている数値
20との大小比較を行うと、図7〜図9の「総文字数」
の欄の数値は順に30、32、27であるので、いづれ
のデータも条件記憶部に記憶されている数値20より大
きく、条件を満たさない。検索対象のすべてのデータが
条件を満たさない場合、「総文字数」の欄の数値が最も
小さいデータだけをSTEP6へ送り、それ以外のデー
タが棄却される。つまり、図7と図8のデータを棄却
し、図9のデータをSTEP6に送る。
【0029】STEP6で、図9のデータから最も深い
レベルの接点を削除すると、図10〜図16に示すデー
タが得られる。もう一度、STEP5に戻り、図10〜
図16の「総文字数」欄の数値と、制約条件記憶テーブ
ルに記憶されている数値との大小比較とを行うと、図1
0〜図16の「総文字数」の欄の数値は順に、25、2
0、24、18、22、17、15であるので、図1
1、図13、図15、図16が制約条件を満たす。この
ように、制約条件を満たすデータが複数ある場合には、
条件記憶部に記憶されている数値のデータあるいは、一
番近い数値のデータを選択し、STEP7へ行く。この
場合は図11を選択することになる。
【0030】STEP7:要約文生成部7では、図11
の節点を順次たどることによって、要約結果から要約文
を生成し、STEP8において、要約文表示部8で要約
文を表示する。その結果、「このツールは、便利な機能
をサポートする。」という要約文が生成、表示される。
図17は表示例を示す図である。
【0031】以上のようにして、ユーザから入力された
条件を満たす要約文が作成されることになる。上述した
例では、条件が要約文の文字数、つまり「…文字程度」
等の条件であったが、例えば「原文の1/4程度」な
ど、原文と要約文の文字数の比である場合には、条件記
憶部4において、原文の文字数をMとし、入力された比
Rとすれば、M/Rを越えない最大の整数を要約文の文
字数Nとすれば、上述した手順を用いて要約を行うこと
が可能である。
【0032】
【発明の効果】以上、詳述したように、従来では修飾語
のレベルを削除することにより要約文を作成していたの
で、文字数などの制限をつけることができなかったが、
本発明では要約文の長さに関するユーザからの要求を考
慮して要約文を作成することができる。要約文の長さに
関する要求は具体的な数値である例えば「20文字」な
どという指定や、原文の長さに対する要約文の長さの比
である例えば「原文の1/3」などという指定が可能で
あり、限られた条件内での要約文を容易に作成すること
ができる。
【図面の簡単な説明】
【図1】本発明の実施の形態におけるブロック図であ
る。
【図2】本発明の実施の形態におけるフローチャートで
ある。
【図3】形態素解析/構文解析を施した結果を示す図で
ある。
【図4】原文を入力したときの表示例を示す図である。
【図5】形態素解析/構文解析で用いる規則の例を示す
図である。
【図6】本発明の要約文作成処理を行う際のメモリの様
子を示す図である。
【図7】本発明の要約文作成処理を行う際のメモリの様
子を示す図である。
【図8】本発明の要約文作成処理を行う際のメモリの様
子を示す図である。
【図9】本発明の要約文作成処理を行う際のメモリの様
子を示す図である。
【図10】本発明の要約文作成処理を行う際のメモリの
様子を示す図である。
【図11】本発明の要約文作成処理を行う際のメモリの
様子を示す図である。
【図12】本発明の要約文作成処理を行う際のメモリの
様子を示す図である。
【図13】本発明の要約文作成処理を行う際のメモリの
様子を示す図である。
【図14】本発明の要約文作成処理を行う際のメモリの
様子を示す図である。
【図15】本発明の要約文作成処理を行う際のメモリの
様子を示す図である。
【図16】本発明の要約文作成処理を行う際のメモリの
様子を示す図である。
【図17】作成された要約文の表示例を示す図である。
【符号の説明】
1 原文受理部 2 文解析部 3 文字数付加部 4 条件記憶部 5 条件判定部 6 節点削除部 7 要約文生成部 8 要約文表示部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力された原文を受け取り記憶する原文
    受理部と、 前記原文受理部で受け取った原文に対して形態素解析及
    び構文解析を行い、原文を複数の節点に分割する文解析
    部と、 前記文解析部によって、分割された解析結果を記憶する
    解析結果記憶部と、 分割された各節点を構成する文字数を計数して記憶する
    文字数付加部と、 要約文に関する文字数の条件を受け取り記憶する条件記
    憶部と、 前記文解析部によって分割された各文節の節点を順次削
    除する節点削除部と、 前記節点削除部によって一部が削除された残りの各節点
    の文字数の和が前記制約条件記憶部に記憶された制約条
    件を満たすかどうかを判定する条件判定部と、 前記条件判定部によって判定された制約条件を満たす要
    約結果から要約文を生成する要約文生成部と、 前記要約文生成部によって生成された要約文を表示する
    要約文表示部からなる文書処理装置。
  2. 【請求項2】 前記条件記憶部は、要約文の最大文字数
    を受け取り、 前記要約文生成部は、要約結果の文字数の和が前記条件
    記憶部の値を越えない最大のものを要約文として生成す
    ることを特徴とする前記請求項1記載の文書処理装置。
  3. 【請求項3】 前記条件記憶部は、原文の文字数におけ
    る要約文の文字数の割合を受け取り、 前記要約文生成部は、原文の文字数における要約結果の
    文字数の和の割合が前記条件記憶部の値を越えない最大
    のものを要約文として生成することを特徴とする前記請
    求項1記載の文書処理装置。
JP8023719A 1996-02-09 1996-02-09 文書処理装置 Pending JPH09218872A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8023719A JPH09218872A (ja) 1996-02-09 1996-02-09 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8023719A JPH09218872A (ja) 1996-02-09 1996-02-09 文書処理装置

Publications (1)

Publication Number Publication Date
JPH09218872A true JPH09218872A (ja) 1997-08-19

Family

ID=12118145

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8023719A Pending JPH09218872A (ja) 1996-02-09 1996-02-09 文書処理装置

Country Status (1)

Country Link
JP (1) JPH09218872A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11232270A (ja) * 1998-02-13 1999-08-27 Dainippon Screen Mfg Co Ltd 可変文書作成システム、可変文書出力装置及び可変原稿作成装置
JP2015194919A (ja) * 2014-03-31 2015-11-05 大日本印刷株式会社 文書要約装置、文書要約方法、及び、プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0612447A (ja) * 1992-03-31 1994-01-21 Toshiba Corp 要約文章作成装置
JPH0736896A (ja) * 1993-07-02 1995-02-07 Xerox Corp 文書を要約する方法および装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0612447A (ja) * 1992-03-31 1994-01-21 Toshiba Corp 要約文章作成装置
JPH0736896A (ja) * 1993-07-02 1995-02-07 Xerox Corp 文書を要約する方法および装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11232270A (ja) * 1998-02-13 1999-08-27 Dainippon Screen Mfg Co Ltd 可変文書作成システム、可変文書出力装置及び可変原稿作成装置
JP2015194919A (ja) * 2014-03-31 2015-11-05 大日本印刷株式会社 文書要約装置、文書要約方法、及び、プログラム

Similar Documents

Publication Publication Date Title
JP3691844B2 (ja) 文書処理方法
JP2001075966A (ja) データ分析システム
US7684975B2 (en) Morphological analyzer, natural language processor, morphological analysis method and program
JP3383049B2 (ja) 文書検索装置
JPH08161343A (ja) 関連語辞書作成装置
JP2019021194A (ja) 情報処理システムおよび情報処理方法
JPH09218872A (ja) 文書処理装置
JP4460248B2 (ja) 翻訳支援プログラム、翻訳支援装置および翻訳支援方法
JPH09106399A (ja) 機械翻訳装置及び機械翻訳方法
JPH1145254A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2785692B2 (ja) 辞書検索表示装置
JP4074687B2 (ja) 要約文作成支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH10162011A (ja) 情報検索方法、情報検索システム、情報検索端末装置および情報検索装置
JP3744136B2 (ja) 訳語選択装置と記憶媒体
JP2002108894A (ja) 文書分類装置、文書分類方法及び該方法を実行するための記録媒体
JPH10207875A (ja) 表作成装置およびその方法
JP2000090110A (ja) 全文検索方法、装置、および全文検索プログラムを記録した記録媒体
JPH0561902A (ja) 機械翻訳システム
JP2002140356A (ja) データベース・システムおよびデータベース検索方法
JPH01214963A (ja) 辞書引き装置
JP4046221B2 (ja) 文書処理装置
JP2003173338A (ja) 辞書構築支援装置、辞書構築支援方法及び辞書構築支援プログラム
JP2002140346A (ja) テキストマイニング方法およびテキストマイニング装置並びにコンピュータ読み取り可能な記憶媒体
JPH09212520A (ja) 電子化辞書装置
JP3873299B2 (ja) 仮名漢字変換装置および仮名漢字変換方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041130

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050621