JPH11219361A - 文書閲覧装置およびそのプログラムを格納した記憶媒体 - Google Patents
文書閲覧装置およびそのプログラムを格納した記憶媒体Info
- Publication number
- JPH11219361A JPH11219361A JP10020852A JP2085298A JPH11219361A JP H11219361 A JPH11219361 A JP H11219361A JP 10020852 A JP10020852 A JP 10020852A JP 2085298 A JP2085298 A JP 2085298A JP H11219361 A JPH11219361 A JP H11219361A
- Authority
- JP
- Japan
- Prior art keywords
- document
- user
- attention
- word
- browsed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
自動作成して出力する文書閲覧装置において,閲覧文書
の要約から利用者が必要とする情報を容易に見つけ出せ
る手段と,自動作成した要約を利用者の関心に従って簡
単に変更できる手段を提供することを目的とする。 【解決手段】 利用者にとって関心のある内容を示す注
目語を元にして閲覧文書の要約を自動作成して表示する
文書要約提示手段と,文書の骨組みを示す見出しと文書
の重要箇所を示す重要度表示とを含む文書のアウトライ
ン情報を自動作成して表示する文書構造提示手段と,作
成した要約を利用者の指示に従って変更する要約変更手
段とを備え,作成した要約を要約文書表示領域に表示
し,文書のアウトライン情報を文書構造表示領域に表示
し,作成した要約を利用者が変更できる構成をもつ。
Description
れた文書を閲覧するための装置に関し,対象文書の要約
を自動作成して表示する装置に関する。特に,文書の骨
組みを示す見出しと文書の重要箇所を示す重要度表示を
含む文書のアウントライン情報および要約文書を表示す
る文書閲覧装置に関するものである。そして,表示され
た要約文書を対話形式で容易に編集できるようにしたも
のである。
合,1文書の内容を1画面に全部表示することができな
いことが多い。そのため,ワードプロセッサやDTPソ
フトウェアでは文書全体の構成を一覧できるように,文
書中の章,節等の見出しだけを抜き出して提示するアウ
トライン表示を行うようにしている。
文書全体の構成を推敲するために使用されていたのであ
るが,この機能は文書の閲覧,参照等に使用されるよう
になった。文書の全文を表示するビュー(ウィンドウ)
の左に,文書中の大見出しなどにより文書のアウトライ
ン(骨組み)を表示したガイドビューを配置するもので
ある。そして,利用者がガイド用ビューの見出し部分を
ポインティングデバイス等により指定すると,右のウィ
ンドウが連動してその見出しと対応する部分に表示が切
替わるように動作するものである。
に示された見出しを手掛かりに自分にとって関心のある
情報が書かれている部分を選択して参照できる。また,
検索文書の概要の把握を支援するために,見出しととも
に要約を提示し,また必要に応じて利用者の指定した見
出しに関連する部分の要約を詳細化する手段を備えた文
書検索装置も従来から知られている(特開平7−129
605号「文書検索装置」参照)。
方法は,利用者の関心のある内容が見出しに表現されて
いる場合には有効であるが,そうでない場合には,どの
部分を参照すべきか利用者が判断できないという問題が
ある。例えば,章,節などの見出しが,書かれている内
容を十分に表現していない場合には,ガイド用ビューに
表示された情報が役に立たないため,結果として利用者
が文書の大部分を見ざるを得ないことがある。
うに,利用者の指定した見出しに対応する部分の要約を
自動作成してガイトビューに追加する手段を備えていた
としても,要約を追加すべき部分を見つける手がかりで
ある見出しが理解不能であれば,どの部分に要約を追加
するよう指示すれば良いかを利用者が判定でない。
要とする情報を容易に得ることができ,さらに閲覧文書
の要約を利用者の関心の高い注目語に応じて簡単に再作
成することのできる文書閲覧装置および記憶媒体を提供
することを目的とする。
化された文書を入力し,要約を自動作成して出力する文
書閲覧装置において,利用者にとって関心のある内容を
示す注目語を元にして閲覧文書の要約を自動作成して表
示する要約文書提示手段と,文書の骨組みを示す見出し
と文書の重要箇所を示す重要度表示とを含む文書のアウ
ントライン情報を自動作成して表示する文書構造提示手
段と,作成した要約を利用者の指示に従って変更する要
約変更手段とを備え,作成した要約を要約文書表示領域
に表示し,文書のアウトライン情報を文書構造表示領域
に表示し,作成した要約を利用者が変更できるようにし
た。
いて,1は文書閲覧装置である。
造提示手段である。Cは要約変更手段である。
部であって,利用者が閲覧文書で閲覧したいと思ってい
る事柄を文や単語の形で入力するためのものである。
を作成するものである。3は見出し抽出部であって,閲
覧文書の構造を解析し,章・節等の論理的なまとまり
(文書要素)を認定し,その部分に付与された見出しを
抽出するものである。この処理は,文書のフォーマット
の種類によって異なり,また,本発明にとって本質的な
ものではないので,詳細な説明は省略するが,例えば,
次のように行う。SGML(Standard Generalized Mar
kup Language: ISO8879)等の文書構造のマークアップ言
語やDTP用ソフトウェア固有のフォーマット等によっ
て構造化された文書であれば,閲覧文書に付与されてい
る構造情報を本発明で利用できる形に変換すれば良い。
構造化されていない単純な文書(プレーンテキスト:pl
ain text) の場合には,書式(段下げや見出し部分の番
号付けなど)を手がかりに,見出しと章・節等のまとま
りを認定すればよい。
見出しや強調語句等から作成者注目語を,利用者が入力
した質問文および利用者が関心をもった要約文書の部分
から利用者注目語を抽出するものである。ここで,作成
者注目語とは,文書の作成者が書こうとした内容を示す
キーワードのことであり,利用者注目語とは,利用者が
閲覧文書で閲覧したいと思っている事柄を示すキーワー
ドのことである。
節等の文書要素に対して,そこに出現している利用者注
目語の数に基づいて,注目度(利用者が閲覧したいと思
っている事柄との関連度)を計算するものである。
対応する文書要素の注目度に基づいて,それぞれの見出
しに付与する重要度表示を生成するものである。重要度
表示は,利用者が要約文書を拾い読みする場合などに,
いずれの部分を読めば良いかの指標となるよう,文書の
アウトライン情報において見出しと対応付けて表示する
記号である。
作成するものである。8’は要約再作成情報獲得部であ
って,自動作成した要約文書の利用者の指示に従って変
更(再作成)するために必要な情報を獲得するものであ
る。具体的には,利用者の指示(要約文書編集要求)
を,ディスプレイ上におけるポインティングデバイスに
よる指定もしくは入力装置からのキー入力等の形で受け
付け,要約文書変更部8および文書要素注目度計算部5
へ渡す追加注目語やその他のパラメータの作成を行う。
書のアウトライン情報とを表示装置に連動して表示する
ためのものである。10は要約文書の出力部であって,
要約文書を画面表示するディスプレイ等である。
を編集するための情報を入力するものである。図1の構
成の動作を説明する。
を解析し,章・節等の文書要素を認定し,それと対応す
る見出しを抽出する。 (2) 注目語抽出部4は,質問文入力部13を介して利
用者の質問文を受け取り,利用者注目語を抽出する。ま
た,見出し抽出部3から文書の標題,章・節の見出しを
受け取り,作成者注目語を抽出する。
注目語に基づき,文書要素(閲覧文書中の章・節等)毎
に注目度を計算する。注目度は例えば,文書要素中に出
現する利用者注目語の数を1文字当たりの出現数に規格
したもの(出現密度)等である。
トライン情報に表示するそれぞれの見出しに対して,重
要度表示を作成する。重要度表示は,利用者が要約文書
を拾い読みする場合などに,いずれの部分を読めばよい
かの指標となるよう,文書のアウトライン情報において
見出しと対応付けて表示する記号であり,それぞれの見
出しに対応する文書要素の注目度に基づいて作成され
る。
書要素毎に要約を作成する。要約作成は,文書要素に付
与されている見出しから抽出した作成者注目語と,質問
文から抽出した作成者注目語と,質問文から抽出した利
用者注目語を手がかりに,それらの注目語が出現してい
る文を抜粋することで行う。
文書のアウトライン情報(重要度表示付きの見出し)と
を対応付けて表示するための処理を行い,それぞれを文
書要約ビュー・文書構造ビューとして出力部(表示装
置)10に出力する。
の2種類の要求を受け取り,表示処理部9または要約再
作成情報獲得部8’に通知する。1つは,要約文書の表
示切替え要求であり,利用者が文書構造ビューに表示し
た見出しをポインティングデバイス等により指定した時
に発生する。
生した場合には,編集情報入力部11は表示処理部9に
通知して,要約文書ビューの表示内容を指定された見出
しに対応する要約文書の部分へ切り替える。
要約文書のビューあるいは文書構造ビュー上の部分をポ
インティングデバイス等で範囲指定した場合,あるいは
それぞれのビュー上でポインティングデバイスによりメ
ニューを選択した場合,あるいは入力装置からキー入力
した場合に発生する。
情報獲得部8’に通知され,そこで処理される。要約再
作成情報獲得部8’は要約文書の編集要求を解釈し,文
書注目度計算部5および要約文書変更部8に与えられる
パラメータを作成する。文書要素注目度計算部5に与え
る。パラメータは,範囲指定された要約文書の部分ある
いはキー入力された追加の質問文から注目語抽出部4を
使って抽出した注目語を追加した利用者注目語のリスト
であり,要約文書変更部8に与えるパラメータ(再作成
情報)には,要約文書から削除すべき部分として範囲指
定された要約文書の部分等がある。
要約再作成情報獲得部8’から与えられた注目語リスト
に従って文書要素の注目度を計算し直す。その結果に基
づき,重要度表示生成部7は見出しに付与する重要度表
示を再生成する。
報獲得部8’から与えられた再作成情報をもとに要約を
再作成する。 (14),(15) 表示処理部9は,変更された要約文書と文
書のアウトライン情報(重要度表示付きの見出し)とを
対応付けて表示するための処理を行い,それぞれを要約
文書ビュー・文書構造ビューとして出力部(表示装置)
10に出力する。
の程度を判定し,その程度を示す重要度表示付きの見出
しからなる文書のアウトライン情報を文書構造ビューに
提示する。これにより利用者は,重要度を示す重要度付
きの見出しを手がかりに,要約文書を拾い読んだり,よ
り詳細化すべき部分を指定して要約を再作成させること
ができる。重要度表示という手がかりがあるので,たと
えアウントライン情報として提示された見出しが理解で
きない場合であっても,利用者は自身の関心のある部分
を素早く見つけることが可能になる。
形態を示す。図2において,1は文書閲覧装置である。
析し,章・節等の文書要素を認定し,文書構造ビューに
表示する見出しを抽出する部分である。2は文書要約部
であって,構造解析された閲覧対象文書を見出し抽出部
3から,注目語リストを注目語抽出部4から,プロセス
制御部20を介して受け取り,章・節等の文書要素毎に
注目語に関係の深い文を抜粋し,閲覧文書の要約を作成
する部分である(要約作成の方法は,図14,図16の
フローチャートを参照)。
えられた質問文あるいは文書中の見出し等から名詞を注
目語として抽出する部分である。注目語抽出部4と文書
要約部2は公知の手段を利用できるが,特に,本出願の
発明者により特許出願されている作成者注目情報と利用
者注目情報の両方を考慮して要約を作成する方法(特願
平9−00677号)によってもよい。
解析された閲覧対象文書と利用者注目語をプロセス制御
部20から受け取り,章・節等の文書要素毎に利用者注
目語の出現密度を計算する部分である。
注目度計算部5の計算結果に従って,文書構造ビューの
見出しに対応付けて表示する重要度表示を生成する部分
である。
再作成するものである。8’は要約再作成情報獲得部で
あって,利用者の要約編集要求をプロセス制御部20を
介して受け取り,要約文書変更部8で要約文書を再作成
するために必要な情報を獲得するものである。
要約文書ビュー,文書構造ビューにそれぞれ全文書,要
約文書,文書のアウトライン情報(重要度表示付きの見
出し)を表示するための処理を行う部分である。
者によって入力される閲覧文書の指定,質問文,要約文
書の編集要求等を入力するものである。10は出力部で
あって,表示データを出力するものである。
定,質問文の入力,要約文書の編集要求等の入力を行う
ものである。32は閲覧対象文書保持装置であって,閲
覧対象の文書を保持する装置である。
を表示する全文書ビュー,要約文書を表示する要約文書
ビュー,文書のアウトライン情報(重要度表示付きの見
出し)を表示する文書構造ビューにより,全文書,要約
文書,文書のアウトライン情報を表示するものである。
て,閲覧文書で閲覧しようとする事柄を質問文の形で入
力する。
書を閲覧対象文書保持装置32から入力部21を介して
取り出し,表示処理部9と出力部10を介して全文書ビ
ューを表示装置33に表示するとともに,見出し抽出部
3に与えて閲覧文章を構成する章・節等の文書要素とそ
れに付与されている見出しを抽出する。また,入力され
た質問文を注目語抽出部4に与えて利用者注目語を抽出
し,得られた利用者注目語リストと閲覧文章(文書要素
とその見出し)を文書要約部2と文章要素注目度計算部
5に与えて,閲覧文書の要約とアウトライン情報を作成
する。
に,それらに付けられている見出しから抽出した作成者
注目語とプロセス制御部20から与えられた利用者注目
語リストをマージして注目語リスト作成し,注目語に関
係の深い文を抜粋することで要約を作成する(作成者注
目語リストを用いずに要約を作成しても良い)。
リストをもとにそれぞれの文書要素の注目度を計算す
る。注目度は,章・節等の文書要素で使用されている注
目語の数を文書要素の数で割って,1文字当たりの出現
数に規格化されたもの(出現密度)である。注目度の計
算方法はこの方法に限られるものではなく,他の計算方
法でも良く,また,利用者注目語の両方を考慮して計算
しても良い。重要度表示生成部7は,文書要素の注目度
をもとに,重要度表示を作成する。重要度表示は,利用
者が要約文書を拾い読みする場合などに,いずれの部分
を読めばよいかの指標となるよう,文書のアウトライン
情報において見出しと対応づけて表示する記号である。
書とアウトライン情報を表示処理部9と出力部10を介
して表示装置33上に要約文書ビューと文書構造ビュー
を表示する。
ビューの表示により閲覧する。その時,要約文書の全体
が1画面に表示されるとは限らない。そのような時,利
用者は,文書構造ビュー上て閲覧したい部分の見出しを
ポインティングデバイスにより指定し,要約文書の表示
切替え要求を発行することができる。この時,表示処理
部9は,要約文書の表示切替え要求を受け取り,要約文
書のビューの表示内容を利用者が指定した見出しに対応
する部分へと切替える。
するよう閲覧装置に指示して,要約を変更することがで
きる。
り,それに関する内容を要約に追加したい場合には,興
味を惹いた部分を範囲指定し,要約の再作成を指示す
る。この時,要約再作成情報獲得部8’は,範囲指定さ
れた部分を切り出す。プロセス制御部20は,切り出さ
れた部分を対象に注目語抽出部4を使って注目語を取り
出し,利用者注目語のリストに追加する。要約文書変更
部8は新たな注目語リストをもとに再要約し,要約文書
を変更する。
い部分があった場合には,不要な部分を範囲指定し,要
約の再作成を指示する。この時,要約再作成情報獲得部
8’は,範囲指定された部分を認識し,要約からはずす
ように要約文書変更部8に通知する。要約文書変更部8
は,指示された部分を要約対象からはずして再要約をす
ることで,その部分を含まない要約を作成する。
である。図3において,41は記憶媒体であって,磁気
ディスク,CDROM等の記憶媒体である。
閲覧対象文書を入力するプログラムである。43は文書
要約プログラムであって,閲覧対象文書を要約するプロ
グラムである。
目語を抽出するプログラムである。45は文書要素注目
度計算プログラムであって,文書要素の注目度を計算す
るプログラムである。
約文書の見出しを生成もしくは閲覧文書に付けられてい
る見出しを獲得するプログラムである。47は重要度表
示生成プログラムであって,見出しに対応する部分の重
要度表示を生成するものである。
要約文書を変更して再作成するためのプログラムであ
る。49は要約再作成情報獲得プログラムである。
グラム44,見出し抽出プログラム46は要約文書停止
プログラムを構成する。注目語抽出プログラム44,文
書要素注目度計算プログラム45,見出し抽出プログラ
ム重要度表示生成プログラム47は文書構造提示プログ
ラムを構成する。
情報獲得プログラム49は要約変更プログラムを構成す
る。121コンピュータAである。
格納されている文書閲覧プログラム(閲覧対象文書入力
プログラム42,文書要約プログラム43,注目語抽出
プログラム44,文書要素注目度計算プログラム45,
見出し抽出プログラム46,重要度表示生成プログラム
47,要約文書変更プログラム48等)あるいは閲覧文
書をロードして保持する。
憶媒体41からロードされたプログラムを表す。124
はCPUである。
30は記憶媒体ドライバであって,記憶媒体41の内容
をコンピュータAにロードするものである。
ンピュータA(121)に接続されている記憶装置であ
り,閲覧文書を保持するものである。135は入力装置
であって,キーボード等である。
等である。141はコンピュータBであって,コンピュ
ータA(121)とオンライン接続されているものであ
る。
ンピュータB(141)に接続されているものであり,
閲覧文書を保持するものである。図3の構成の動作を説
明する。
記憶媒体41を介して,コンピュータA(121)のメ
モリ122にロードされる。利用者は,閲覧文書保持装
置A131から文書を読み出し,表示装置136に内容
を表示して閲覧する。そして,必要に応じて要約を編集
する。文書がコンピュータB(141)の閲覧文書保持
装置B142にある場合には,コンピュータB(14
1)を介して閲覧文書保持装置B(142)から文書を
オンラインで読み出し,コンピュータA(121)にロ
ードして表示装置136に内容を表示して閲覧する。
約文書の例である。閲覧文書として前述の特開平7−1
29605号を使用し,要約文書を作成したものであ
る。要約は〔〕(墨付き括弧)で囲まれた文書要素単位
に行い,文書のアウトライン情報では□で囲まれたその
ひとつの下のレベルの見出し([目的],[構成]の2
つ)までを表示している(アウトライン情報に表示した
見出しは,必須出力要素として要約文書に出力してあ
る)。また,発明の名称「文書検索装置」を,文書の標
題(再上位レベルの見出し)として扱った。
表示できる領域の大きさを示す。図5は図4の要約文書
の表示画面である。図4の実線の矩形の領域が要約文書
ビューで表示されている状態である。
って,図5の状態では注目語が「要約」であることを示
している。
線の矩形領域の表示である。要約文書ビューにおいて,
太字で強調して表示してある語は注目語(図5では「要
約」)である。
の見出しが表示されている。54は重要度表示であっ
て,見出しに対応する部分の重要度,すなわち,見出し
に対応する部分における利用者注目語の出現密度を表し
ている。
重要度(利用者注目語の出現密度)が最大であり,つい
で,「要約」,「発明が解決しようとする課題」を見出
しとする部分の重要度が高い。以下,「特許請求の範
囲」,「請求項1」,「目的」,「図面の簡単な説
明」,「発明の詳細な説明」,「従来の技術」,「発明
の効果」の順に重要度が低くなっていることを表してい
る。そして,見出しが薄くなっている部分(「産業上の
利用分野」,「作用」,「実施例」)には全く注目語が
存在しないことを表している。また,文書構造ビューに
おいて「文書検索装置」の部分が反転しているのは,
(図では斜線で表わしている(各図で同じ))この見出
しが要約文書ビューの先頭に表示されることを示してい
る。
ある。図5,図6を使って,要約文書ビューの表示の切
替えの動作を説明する。図5では「発明が解決しようと
する課題」にも多くの利用者注目語が存在することが示
されているが,これに対応する要約の部分(図4の点線
の矩形で囲った部分)は要約文書ビューに表示されてい
ない。利用者は,文書構造ビューの「発明が解決しよう
とする課題」の見出しをマウスでクリックすることで,
図6に示すように,図4の点線部分を要約文書ビューに
表示させることができる。この操作により,利用者は重
要度表示を参考に要約文書の重要そうな部分を拾い読み
することができる。
明の文書閲覧装置の画面の例である。図7〜図10を使
って,自動作成された要約の変更の仕方を説明する。
合には,要約文書ビューにおいて,詳細に内容を見たい
部分,あるいは逆に自分の関心のない部分等を印をつけ
て再要約を指示する。
明するための図である。図7では「目的」の部分の内容
が表示されていない(図7の要約文書ビューでは「・・
・」によってその部分が省略されていることが示されて
いる)。その部分を表示させるためには,利用者は次の
ように操作する。まず画面上で「目的」(文書構造ビュ
ー,要約文書ビューのいずれの上でも良い)の表示を選
択する。次にコンテキストメニュー(ポップアップメニ
ュー)を呼び出し,編集用のメニューを表示させる。編
集メニューで,“もっと詳しく”を選択すると,図7で
は「・・・」とだけなっていた部分を要約文書ビューに
表示させることができる。
再要約させた後の表示の様子を示している。図8では
「目的」の部分の全ての内容が表示されているが,これ
は,「目的」の内容が1文だけからなるためであり,こ
の部分が複数の文からなっている場合には,一部が「・
・・」として省略された要約が示されることになる。な
お,図7に示されるように,「目的」の見出しに対応す
る部分にも注目語「要約」が含まれているが,要約を作
成した単位(「要約」から「特許請求の範囲」までの
間)に,より多くの注目語が出現している文(「構成」
の後の1文)があるため,図8の要約では表示されなか
った。
説明するための図である。図9は,「目的」の欄の文章
に関係のある部分を要約に取り込むための操作を行う際
の画面の様子を示している。この場合,利用者は次のよ
うに操作する。まず,「目的」の欄の文章をドラッグし
て範囲指定してから,コンテキストメニューを呼出して
“もっと詳しく”を選択する(複数箇所を範囲指定する
場合にはこの操作を繰り返す)。次に,コンテキストメ
ニューを呼出して“再要約”を指示する。この操作によ
り,指定した範囲に含まれる単語が利用者注目語として
追加され,それに基づいて要約が再作成され,表示され
る。
の画面を示している。図10の注目語の表示領域には,
上記の操作によって15語の注目語「タイトル,一覧,
・・・,利用者」が追加されたことが示されている。要
約文書ビューには,その注目語を使って作成した要約が
表示されている。要約文書ビューの重要度表示が図7と
変わっているのは,注目語の追加によってそれぞれの文
書要素の注目度を変化したためである。
要約文書の例であって,作成した要約である。図12は
本発明の文書閲覧装置で作成した要約文書の例であっ
て,作成した要約であり,図11の要約の続きの部分で
ある。
期化のフローチャートであり,閲覧文書の受け入れ,注
目語の入力等の初期化処理のフローチャートである。図
示のステップの番号に従ってフローチャートを説明す
る。
らの質問文を受け入れる。
力されていればS4の処理を行い,入力されていなけれ
ばS5の処理を行う。 S4 質問文から利用者の注目語(利用者が関心のある
事柄を示す名詞)を抽出する。
のフローチャートを参照)。 S6 文書中の各要素(章,節等)の中に現れた利用者
注目語の数を数え,文書要素中の文字数で割って正規化
する。
ューを開く。 S8 初期化処理を終了する。 図14は本発明の要約文書作成処理のフローチャートで
ある。
始する。 S2 要約を作成していない部分があるか判定する。要
約を作成していない部分があれば,S3の処理を行い,
なければS6で要約処理を終了する。
ば,文章の標題および章,節の見出しから作成者注目語
を抽出する。 S4 利用者注目語と作成者注目語をマージし,注目語
リストを作成する。
成する。 S6 要約処理を終了する。 図15は本発明の注目語抽出の処理のフローチャートで
ある。
た領域)に形態素解析(文を単語に分解し,それらの単
語の品詞(名詞,助詞,動詞等)を認定する操作)を施
す。
る。 S4 注目語抽出処理を終了する。 図16は本発明の文書要約処理(文抜粋処理)のフロー
チャートである。
の処理を行い,空であればS6の処理を行う。
よって要約対象文書中の各文の注目情報量を求める。注
目情報量としては,最も単純には,章もしくは節におけ
るひと区切りの文において使われている注目語の数をそ
のまま評価値として用いればよい。あるいは,文で使わ
れている注目語の種類(異なり数)と延べ繰り数を別々
に記録しておいて,次のステップS4で注目情報量を比
較する際に,まず異なり数を比較し,同じである場合に
だけ延べ数を比較するようにしてもよい。また,個々の
注目語に重み等をつけて評価値を求めてもよい。
えば,見出しの文章,利用者の指定した部分の文章等)
以外から注目語情報量最大の文を選択する。例えば,章
もしくは節の各文においてS4で求めた評価値が最大の
文を選択する。
目語リストから除く。例えば,前述の5種類の注目語の
うち4種類が使用されていれば,残りの1種類のみを残
して注目語リストから除く。
ジし,もとの文書中での出現順に並べる。 S7 文抜粋処理を終了する。
更の処理のフローチャートである。 S1 処理を開始する。 S2 利用者の入力を待つ。
ンテキストメニュー表示を指定したのであればS5の処
理を行い,ドラッグで範囲したのであればS4の処理を
行う。
で,ドラッグ範囲を選択範囲として記憶する。 S5 S3でコンテキストメニュー表示を選択されたの
でコンテキストメニューを表示し,利用者の選択を待
つ。
が選択され,選択範囲が見出しでなければS8の処理を
行い,選択範囲が見出しであれば,S9の処理を行う。 S8 選択範囲(その直前にドラッグによって指定され
た範囲)を注目語抽出対象部として利用者注目語を抽出
する(注目語の抽出は図15による)。
を追加選択し,要約に追加する。 S6,S10,選択項目として,これで十分が選択され
た時,選択範囲が見出しでなければS11の処理を行
い,見出しであれば,S12の処理を行う。
る部分を必須出力部とする。
が見出しでなければ,S14の処理を行い,選択範囲が
見出しであればS15の処理を行う。 S14 選択範囲を要約対象から外す。
に含まれている部分を要約対象から外す。 S16 S6で要約再作成が選択されれば,閲覧文書の
要約を再作成をする(図14のフローチャートに従
う)。
の注目している情報を核とした要約を閲覧することがで
き,また,提示された要約の中から関心のある事柄を選
んでそれに関する内容を要約に取り入れるよう指示する
ことができるので,次々に関連の部分を閲覧していくこ
とができるようになる。
いる情報が文書のどのあたりに多く出現しているのかが
示されるので,文書構造ビューに示される見出しが理解
できない場合でも,効率良く閲覧したい情報を見つけ出
すことが可能になる。
る。
ある。
を示す図である。
る。
る。
る。
る。
る。
ある。
例を示す図である。
例を示す図である。
ートを示す図である。
トを示す図である。
を示す図である。
(文抜粋処理)のフローチャートを示す図である。
示す図である。
Claims (5)
- 【請求項1】 電子ファイル化された文書を入力し,要
約を自動作成して出力する文書閲覧装置において,利用
者に関心のある内容を示す注目語を元にして閲覧文書の
要約を自動作成して表示する要約文書提示手段と,文書
の骨組みを示す見出しと文書の重要箇所を示す重要度表
示とを含む文書のアウトライン情報を作成して表示する
文書構造提示手段と,作成した要約を利用者の指示に従
って変更する要約変更手段とを備え,閲覧文書の要約を
要約文書表示領域に表示し,閲覧文書のアウトライン情
報を文書構造表示領域に表示し,利用者からの変更要求
に応じて閲覧文書の要約を再作成することを特徴とする
文書閲覧装置。 - 【請求項2】 要約文書提示手段は利用者から与えられ
た質問文もしくは閲覧文書中の部分から注目語を求める
注目語抽出部と,閲覧対象文書を入力して該注目語の使
用されている文章の部分をもとに対象文書の要約を作成
する文書要約部と,要約された文書を変更する要約文書
変更部とを備え,文書構造提示手段は要約文書の文書の
骨組みを示す見出しを抽出する見出し抽出部と,対象文
書の文章要素において使用されている注目語の数をもと
に文章要素の注目度を計算する文書要素注目度計算部
と,文章要素の注目度に応じて文章の内容の重要度表示
を生成する重要度表示生成部とを備えることを特徴とす
る請求項1に記載の文書閲覧装置。 - 【請求項3】 注目語抽出部は閲覧文書に固有な作成者
注目語と利用者から与えられる利用者注目語の双方を含
む注目語リストを生成し,文書要約部は該注目語リスト
に基づいて要約を作成することを特徴とする請求項2に
記載の文書閲覧装置。 - 【請求項4】 要約文書変更部は,利用者が不要な部分
を要約から削除し,利用者が関心を示した部分から注目
語を抽出してその注目語に関連した文章の部分を要約に
追加することで要約を再作成することを特徴とする請求
項2もしくは3に記載の文書閲覧装置。 - 【請求項5】 電子ファイル化された文書を入力し,要
約を自動作成する文書閲覧装置のプログラムを格納した
記憶媒体において,利用者に関心のある内容を示す注目
語を元にして閲覧文書の要約を自動作成して表示する要
約文書提示プログラムと,文書の骨組みを示す見出しと
文書の重要箇所を示す重要度表示とを含む文書のアウト
ライン情報を作成して表示する文書構造提示プログラム
と,作成した要約を利用者の指示に従って変更する要約
変更プログラムとを備え,閲覧文書の要約を要約文書表
示領域に表示し,閲覧文書のアウトライン情報を文書構
造表示領域に表示し,利用者からの変更要求に応じて閲
覧文書の要約を再作成することを特徴とするプログラム
を格納した記憶媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP02085298A JP3718044B2 (ja) | 1998-02-02 | 1998-02-02 | 文書閲覧装置およびそのプログラムを格納した記憶媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP02085298A JP3718044B2 (ja) | 1998-02-02 | 1998-02-02 | 文書閲覧装置およびそのプログラムを格納した記憶媒体 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH11219361A true JPH11219361A (ja) | 1999-08-10 |
| JP3718044B2 JP3718044B2 (ja) | 2005-11-16 |
Family
ID=12038639
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP02085298A Expired - Fee Related JP3718044B2 (ja) | 1998-02-02 | 1998-02-02 | 文書閲覧装置およびそのプログラムを格納した記憶媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3718044B2 (ja) |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001175673A (ja) * | 1999-12-20 | 2001-06-29 | Sharp Corp | 電子書籍表示装置及び電子書籍表示プログラムを記憶した記憶媒体 |
| JP2003523697A (ja) * | 2000-02-19 | 2003-08-05 | ディジマーク コーポレイション | 透かしエンコーダ及びデコーダイネーブルソフトウェア及び装置 |
| JP2004272785A (ja) * | 2003-03-11 | 2004-09-30 | Nippon Hoso Kyokai <Nhk> | 質問応答装置及び質問応答プログラム |
| JP2009217802A (ja) * | 2008-03-06 | 2009-09-24 | Sharp Corp | 文書処理装置、文書処理プログラムおよび記録媒体 |
| WO2012111226A1 (ja) * | 2011-02-15 | 2012-08-23 | 日本電気株式会社 | 時系列文書要約装置、時系列文書要約方法およびコンピュータ読み取り可能な記録媒体 |
| JP2016189089A (ja) * | 2015-03-30 | 2016-11-04 | 日本電気株式会社 | 抽出装置、抽出方法とそのプログラム、及び、支援装置、表示制御装置 |
| JP2019121075A (ja) * | 2017-12-28 | 2019-07-22 | 株式会社日立ソリューションズ | 会議の音声データから要約書を作成する方法 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04281565A (ja) * | 1991-03-08 | 1992-10-07 | Toshiba Corp | 文書検索装置 |
| JPH06259424A (ja) * | 1993-03-02 | 1994-09-16 | Ricoh Co Ltd | 文書表示装置及び文書要約装置並びにディジタル複写装置 |
| JPH07129605A (ja) * | 1993-09-13 | 1995-05-19 | Toshiba Corp | 文書検索装置 |
-
1998
- 1998-02-02 JP JP02085298A patent/JP3718044B2/ja not_active Expired - Fee Related
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04281565A (ja) * | 1991-03-08 | 1992-10-07 | Toshiba Corp | 文書検索装置 |
| JPH06259424A (ja) * | 1993-03-02 | 1994-09-16 | Ricoh Co Ltd | 文書表示装置及び文書要約装置並びにディジタル複写装置 |
| JPH07129605A (ja) * | 1993-09-13 | 1995-05-19 | Toshiba Corp | 文書検索装置 |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001175673A (ja) * | 1999-12-20 | 2001-06-29 | Sharp Corp | 電子書籍表示装置及び電子書籍表示プログラムを記憶した記憶媒体 |
| JP2003523697A (ja) * | 2000-02-19 | 2003-08-05 | ディジマーク コーポレイション | 透かしエンコーダ及びデコーダイネーブルソフトウェア及び装置 |
| JP2004272785A (ja) * | 2003-03-11 | 2004-09-30 | Nippon Hoso Kyokai <Nhk> | 質問応答装置及び質問応答プログラム |
| JP2009217802A (ja) * | 2008-03-06 | 2009-09-24 | Sharp Corp | 文書処理装置、文書処理プログラムおよび記録媒体 |
| WO2012111226A1 (ja) * | 2011-02-15 | 2012-08-23 | 日本電気株式会社 | 時系列文書要約装置、時系列文書要約方法およびコンピュータ読み取り可能な記録媒体 |
| JPWO2012111226A1 (ja) * | 2011-02-15 | 2014-07-03 | 日本電気株式会社 | 時系列文書要約装置、時系列文書要約方法および時系列文書要約プログラム |
| JP2016189089A (ja) * | 2015-03-30 | 2016-11-04 | 日本電気株式会社 | 抽出装置、抽出方法とそのプログラム、及び、支援装置、表示制御装置 |
| JP2019121075A (ja) * | 2017-12-28 | 2019-07-22 | 株式会社日立ソリューションズ | 会議の音声データから要約書を作成する方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3718044B2 (ja) | 2005-11-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10706091B2 (en) | User driven computerized selection, categorization, and layout of live content components | |
| US7296230B2 (en) | Linked contents browsing support device, linked contents continuous browsing support device, and method and program therefor, and recording medium therewith | |
| US7085999B2 (en) | Information processing system, proxy server, web page display method, storage medium, and program transmission apparatus | |
| US6792475B1 (en) | System and method for facilitating the design of a website | |
| US6177933B1 (en) | Providing visual continuity when displaying related information | |
| JP4814575B2 (ja) | 小型スクリーンコンピューティング装置にコンテンツを表示するシステムと方法 | |
| KR100345945B1 (ko) | 텍스트및이미지문서를동기시켜표시하며조작하기위한방법및장치 | |
| US20040205514A1 (en) | Hyperlink preview utility and method | |
| JPH0352098B2 (ja) | ||
| US20080028292A1 (en) | Techniques to facilitate reading of a document | |
| JPH04229364A (ja) | 強調特性変更方法及びシステム | |
| JP2011216106A (ja) | 修正不可能な電子コンテンツ用の注釈を取り込みかつレンダリングするための方法および装置 | |
| JPH11259521A (ja) | 文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JPH11184865A (ja) | 文書要約装置 | |
| EP0384986A2 (en) | Method for displaying online information | |
| JP2957875B2 (ja) | 文書情報検索装置及び文書検索結果表示方法 | |
| JP3718044B2 (ja) | 文書閲覧装置およびそのプログラムを格納した記憶媒体 | |
| JP3383049B2 (ja) | 文書検索装置 | |
| JP2000099526A (ja) | 文書情報抽出装置 | |
| JP2004157965A (ja) | 検索支援装置、検索支援方法、プログラムおよび記録媒体 | |
| Kit Hoi et al. | Document visualization on small displays | |
| JP2002049644A (ja) | 情報処理装置、記憶媒体及びコンピュータプログラム | |
| JPH10228488A (ja) | 情報検索収集方法およびそのシステム | |
| JPH10340271A (ja) | 文書抄録作成装置及び文書抄録作成プログラムを記録した記憶媒体 | |
| JP2003316807A (ja) | 情報検索装置及び情報検索ソフトウェアを格納した記憶媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040309 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050830 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050901 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080909 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090909 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090909 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100909 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100909 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110909 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120909 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120909 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130909 Year of fee payment: 8 |
|
| LAPS | Cancellation because of no payment of annual fees |