JPH0418673A - テキスト情報抽出方法および装置 - Google Patents
テキスト情報抽出方法および装置Info
- Publication number
- JPH0418673A JPH0418673A JP2122411A JP12241190A JPH0418673A JP H0418673 A JPH0418673 A JP H0418673A JP 2122411 A JP2122411 A JP 2122411A JP 12241190 A JP12241190 A JP 12241190A JP H0418673 A JPH0418673 A JP H0418673A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- abstract
- document
- sentences
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
本発明は、テキスト情報抽出方法および装置に関し、さ
らに詳しくは、ある文書についてのテキスト情報をその
文書の抄・録を利用して容易に得られるようにしたテキ
スト情報抽出方法および装置に関する。
らに詳しくは、ある文書についてのテキスト情報をその
文書の抄・録を利用して容易に得られるようにしたテキ
スト情報抽出方法および装置に関する。
[従来の技術]
従来、ある文書における重要箇所とが、その重要箇所に
出現する単語のリストとがのテキスト情報を得たい場合
、人が文書を解読して重要箇所を取り出したり、その取
り出した重要箇所を1つの文書として出現単語リスト自
動抽出装置に人力して単語リストを得たりしている。
出現する単語のリストとがのテキスト情報を得たい場合
、人が文書を解読して重要箇所を取り出したり、その取
り出した重要箇所を1つの文書として出現単語リスト自
動抽出装置に人力して単語リストを得たりしている。
また、従来、抄録を読んでいて元の文書の文章を参照し
たい場合、人が文書を解読して対応部分を見つけ出して
いる。
たい場合、人が文書を解読して対応部分を見つけ出して
いる。
[発明が解決しようとする課題]
しかし、人が文書を解読して重要箇所を取り出したり、
抄録に対応する部分を見つけ出すのは非常に手間がかか
る問題点がある。
抄録に対応する部分を見つけ出すのは非常に手間がかか
る問題点がある。
そこで、本発明の目的は、ある文書における重要箇所と
か、その重要箇所に出現する単語のリストとかのテキス
ト情報を容易に得られるようにすると共に、抄録から元
の文書の文章を容易に参照できるようにするテキスト情
報抽出方法を提供することにある。また、そのテキスト
情報抽出方法を好適に実施するテキスト情報抽出装置を
提供することにある。
か、その重要箇所に出現する単語のリストとかのテキス
ト情報を容易に得られるようにすると共に、抄録から元
の文書の文章を容易に参照できるようにするテキスト情
報抽出方法を提供することにある。また、そのテキスト
情報抽出方法を好適に実施するテキスト情報抽出装置を
提供することにある。
[課題を解決するための手段]
本発明は、文書と、その文書の抄録と、前記文書中の文
章と前記抄録中の文の関係情報とを記憶する記憶ステッ
プと、前記抄録中の文のうちの少なくとも1つを選択す
る抄録文選択ステップと、その選択された抄録文に対応
する前記文書中の文章を前記関係情報を用いて前記文書
から抽出する対応文章抽出ステップと、その抽出された
対応文章についてのテキスト情報を取り出して出力する
テキスト情報出力ステップとを有するテキスト情報抽出
方法を提供する。
章と前記抄録中の文の関係情報とを記憶する記憶ステッ
プと、前記抄録中の文のうちの少なくとも1つを選択す
る抄録文選択ステップと、その選択された抄録文に対応
する前記文書中の文章を前記関係情報を用いて前記文書
から抽出する対応文章抽出ステップと、その抽出された
対応文章についてのテキスト情報を取り出して出力する
テキスト情報出力ステップとを有するテキスト情報抽出
方法を提供する。
また、本発明は、文書と、その文書の抄録と。
前記文書中の文章と前記抄録中の文の関係情報とを記憶
する記憶手段と、その記憶手段に記憶した抄録を出力す
る抄録出力手段と、その抄録出力手段により出力された
抄録中の文のうちの少なくとも1つをユーザが選択する
抄録文選択手段と、その選択された抄録文に対応する前
記文書中の文章を前記関係情報を用いて前記文書から抽
出する対応文章抽出手段と、その抽出された対応文章に
ついてのテキスト情報を取り出して出力するテキスト情
報出力手段とを具備してなるテキスト情報抽出装置を提
供する。
する記憶手段と、その記憶手段に記憶した抄録を出力す
る抄録出力手段と、その抄録出力手段により出力された
抄録中の文のうちの少なくとも1つをユーザが選択する
抄録文選択手段と、その選択された抄録文に対応する前
記文書中の文章を前記関係情報を用いて前記文書から抽
出する対応文章抽出手段と、その抽出された対応文章に
ついてのテキスト情報を取り出して出力するテキスト情
報出力手段とを具備してなるテキスト情報抽出装置を提
供する。
[作用]
本発明のテキスト情報抽出方法および装置では、ある文
書中の文とその抄録中の文(抄録文)との関係情報を記
憶しておき、抄録文をユーザが選択すると、その抄録文
に対応する元の文書の文章を前記関係情報より求め、そ
の元の文書の文章やその文章に出現する単語のリストな
どのテキスト情報を出力する。
書中の文とその抄録中の文(抄録文)との関係情報を記
憶しておき、抄録文をユーザが選択すると、その抄録文
に対応する元の文書の文章を前記関係情報より求め、そ
の元の文書の文章やその文章に出現する単語のリストな
どのテキスト情報を出力する。
そこで、ある文書の重要箇所や、その重要箇所に出現す
る単語のリストなどを抄録を利用して容易に得られるよ
うになる。
る単語のリストなどを抄録を利用して容易に得られるよ
うになる。
また、抄録文に対応する元の文書の文章を容易に参照で
きるようになる。
きるようになる。
[実施例]
以下、図に示す実施例により本発明の詳細な説明する。
なお、これにより本発明が限定されるものではない。
第11図は、本発明の第1実施例のテキスト検索・表示
システム1000のブロック図である。
システム1000のブロック図である。
図中、1は処理装置、2はデイスプレィ装置、3はキー
ボード装置、4はメモリ、6は英文テキストファイル、
7はストップワードファイル、8は接続語句ファイル、
9は辞書ファイルである。
ボード装置、4はメモリ、6は英文テキストファイル、
7はストップワードファイル、8は接続語句ファイル、
9は辞書ファイルである。
メモリ4は、文書検索プログラム401と、抄録作成プ
ログラム402と、対応範囲決定プログラム403と、
テキスト情報抽出プログラム405と、出現単語テーブ
ル406と、単語頻度テーブル407と1文得点テーブ
ル408と、抄録文テーブル409と、対応範囲テーブ
ル410と。
ログラム402と、対応範囲決定プログラム403と、
テキスト情報抽出プログラム405と、出現単語テーブ
ル406と、単語頻度テーブル407と1文得点テーブ
ル408と、抄録文テーブル409と、対応範囲テーブ
ル410と。
表示単語テーブル411と、キーワードテーブル412
とを含んでいる。
とを含んでいる。
英文テキストファイル6は、複数の英文の文書60と、
各文書毎の管理情報テーブル61とを含んでいる。この
管理情報テーブル61は、第12図に示すように、文書
の各文についての文番号とその文が属する段落の段落番
号とを対応付けたものである。
各文書毎の管理情報テーブル61とを含んでいる。この
管理情報テーブル61は、第12図に示すように、文書
の各文についての文番号とその文が属する段落の段落番
号とを対応付けたものである。
第1図は、上記テキスト検索・表示システム1000に
より英文テキストファイル6から文書を検索し、抄録を
作成し、その抄録を表示すると共に、その抄録に対応す
る元の文章を英文テキス)・ファイル6から抽出して表
示する処理のフロー図である。
より英文テキストファイル6から文書を検索し、抄録を
作成し、その抄録を表示すると共に、その抄録に対応す
る元の文章を英文テキス)・ファイル6から抽出して表
示する処理のフロー図である。
ステップ11では、英文テキストファイル6から文書を
検索する。検索方法は、テキストデータベース検索シス
テム等で公知の検索方法(例えば、検索キーを入力し、
その検索キーと予め文書に付与しておいた文書キーとを
比較して、一致した文書を取り出す方法等)を利用でき
る。
検索する。検索方法は、テキストデータベース検索シス
テム等で公知の検索方法(例えば、検索キーを入力し、
その検索キーと予め文書に付与しておいた文書キーとを
比較して、一致した文書を取り出す方法等)を利用でき
る。
ステップ12では、前記取り出した文書の各文を形態素
解析し、各文の構成単語を出現単語テーブル406に出
現順に格納する。すなわち、第13図に示すように、文
書60の各文の単語を切り出して順に出現単語テーブル
406に格納する。
解析し、各文の構成単語を出現単語テーブル406に出
現順に格納する。すなわち、第13図に示すように、文
書60の各文の単語を切り出して順に出現単語テーブル
406に格納する。
形態素解析の方法は、例えば特開昭58−40684号
公報等に開示の方法を利用できる。
公報等に開示の方法を利用できる。
ステップ13では、前記文書の抄録を作成する。
第2図は、抄録作成処理の一例である。
ます、ステップ41では、文書の文中に出現する単語と
その出現頻度を求め、第14図に示す如き単語頻度テー
ブル407に格納する。ただし、第15図に示す如きス
トップワードファイル7で指定されている単語(これを
ストップワードという)の出現頻度は求めない。なお、
スト、ツブワードファイル7におけるストップワードの
指定は、前置詞、冠詞といった品詞での指定と、 be
、 haveといった単語での指定の2つの指定方法で
行なわれ、前者で指定したときは指定方法ラベルに0”
を設定腰抜者で指定したときは指定方法ラベルに″1”
を設定し、両者を区別する。
その出現頻度を求め、第14図に示す如き単語頻度テー
ブル407に格納する。ただし、第15図に示す如きス
トップワードファイル7で指定されている単語(これを
ストップワードという)の出現頻度は求めない。なお、
スト、ツブワードファイル7におけるストップワードの
指定は、前置詞、冠詞といった品詞での指定と、 be
、 haveといった単語での指定の2つの指定方法で
行なわれ、前者で指定したときは指定方法ラベルに0”
を設定腰抜者で指定したときは指定方法ラベルに″1”
を設定し、両者を区別する。
ステップ42では、予め設定された値以上の出現頻度を
持つ単語を重要語として選ぶ。また、前記第1図のステ
ップ11で文書の検索に検索キーが用いられたときは、
その検索キーも重要語に加える。
持つ単語を重要語として選ぶ。また、前記第1図のステ
ップ11で文書の検索に検索キーが用いられたときは、
その検索キーも重要語に加える。
ステップ43では、各文における重要語数を各文におけ
る単語数で除算して各文の得点を求める。
る単語数で除算して各文の得点を求める。
求めた得点は、第16図に示す如き文得点テーブル40
8に格納する。
8に格納する。
ステップ44では、得点の高い順に文を予め設−月
定した数だけ取り出し、それらの文(これらを抄録文と
いう)を出現順に並べて抄録とする。実際には、抄録テ
ーブルを作成する。
いう)を出現順に並べて抄録とする。実際には、抄録テ
ーブルを作成する。
抄録の作成方法の他の例としては、例えば文書中の各段
落の先頭文を取り出し順に並べて抄録とする方法を用い
ることが出来る。この方法は最も簡単であるため、簡便
な抄録で足る場合に有用である。また、例えば[運用■
・人文研究のための言語データ処理入門/朝倉日本語新
講座6 pp、 24(朝倉書店刊、 1983) J
に開示の方法を利用できる。さらに、特開昭61−11
7658公報に開示の方法を利用できる。
落の先頭文を取り出し順に並べて抄録とする方法を用い
ることが出来る。この方法は最も簡単であるため、簡便
な抄録で足る場合に有用である。また、例えば[運用■
・人文研究のための言語データ処理入門/朝倉日本語新
講座6 pp、 24(朝倉書店刊、 1983) J
に開示の方法を利用できる。さらに、特開昭61−11
7658公報に開示の方法を利用できる。
第1図に戻り、ステップ45では、各抄録文に順に抄録
文番号を付し、その抄録文番号と元の文番号とを対応づ
けて、第17図に示す如き抄録文テーブル409を作成
する。
文番号を付し、その抄録文番号と元の文番号とを対応づ
けて、第17図に示す如き抄録文テーブル409を作成
する。
ステップ14では、各抄録文に対応する元の文書中の文
章の範囲を決定する。
章の範囲を決定する。
この対応範囲決定処理を第3図を参照して説明する。
ステップ91では、抄録文番号i (AI)を゛1(
A1)に初期設定する。
A1)に初期設定する。
ステップ92では、抄録文番号+(AI)に対応する元
の文番号j(B+)を第17図の抄録文テーブル409
から求める。1=1(AI)なら、j=2 (Bs)が
求まる。
の文番号j(B+)を第17図の抄録文テーブル409
から求める。1=1(AI)なら、j=2 (Bs)が
求まる。
ステップ93では、文番号j(B+)の文が属する段落
の段落番号k (Dk)を第12図の管理情報テーブル
61から求める。J 、−2(B 2)なら、k=1(
Di)が求まる。
の段落番号k (Dk)を第12図の管理情報テーブル
61から求める。J 、−2(B 2)なら、k=1(
Di)が求まる。
ステップ94では、段落番号k(Dk)の段落の最初の
文の文番号を前記管理情報テーブル61から求めて、抄
録文番号i (Aυの抄録文に対応する元の文書中の
文章の範囲の開始位置とする。
文の文番号を前記管理情報テーブル61から求めて、抄
録文番号i (Aυの抄録文に対応する元の文書中の
文章の範囲の開始位置とする。
ステップ95では、段落番号k(D、)の段落の最後の
文の文番号を前記管理情報テーブル61から求めて、抄
録文番号i (A、)の抄録文に対応する元の文書中
の文章の範囲の終了位置とする。
文の文番号を前記管理情報テーブル61から求めて、抄
録文番号i (A、)の抄録文に対応する元の文書中
の文章の範囲の終了位置とする。
ステップ96では、前記抄録文番号i (Aυの抄録
文に対応する文章の範囲を拡張する。
文に対応する文章の範囲を拡張する。
この対応範囲拡張処理を第4図を参照して説明する。
ステップ111では、前記開始位置の文が、接続語句フ
ァイル8に登録されている接続語句を含んでいるかどう
か調べる。接続語句を含んでおればステップ112に進
み、含んでいなければステップ114に進む。
ァイル8に登録されている接続語句を含んでいるかどう
か調べる。接続語句を含んでおればステップ112に進
み、含んでいなければステップ114に進む。
接続語句ファイル8には、第18図に示すように、接続
語句(接続詞やそれに準する語句)とその接続語句の性
質に応じた対応文章範囲の拡張幅とが格納されている。
語句(接続詞やそれに準する語句)とその接続語句の性
質に応じた対応文章範囲の拡張幅とが格納されている。
例えば接続語句”but”とそれに応じた拡張幅°゛−
1”とが格納されている。
1”とが格納されている。
これは接続語句“but”を含む文が開始位置の文なら
、その前の文から読む必要があることを意味している。
、その前の文から読む必要があることを意味している。
ステップ112では、拡張幅が負か調べる。負ならステ
ップ113に進み、負でないならステップ114に進む
。
ップ113に進み、負でないならステップ114に進む
。
ステップ113では、(開始位置+拡張幅)を新たな開
始位置とする。例えば開始位置の文が接続語句゛″bu
t”を含んでいたなら、開始位置が1文前に拡張される
。
始位置とする。例えば開始位置の文が接続語句゛″bu
t”を含んでいたなら、開始位置が1文前に拡張される
。
ステップ114では、前記終了位置の文が、接続語句フ
ァイル8に登録されている接続語句を含んでいるかとう
か調べる。接続語句を含んでおればステップ115に進
み、含んでいなければ対応範囲拡張処理を終了する。
ァイル8に登録されている接続語句を含んでいるかとう
か調べる。接続語句を含んでおればステップ115に進
み、含んでいなければ対応範囲拡張処理を終了する。
ステップ115では、拡張幅が正か調べる。正ならステ
ップ116に進み、正でないなら対応範囲拡張処理を終
了する。
ップ116に進み、正でないなら対応範囲拡張処理を終
了する。
ステップ116では、(終了位置+拡張幅)を新たな終
了位置とする。例えば終了位置の文が接続語句”as
follows”を含んでいたなら、終了位置が1文後
に拡張される。そして、対応範囲拡張処理を終了する。
了位置とする。例えば終了位置の文が接続語句”as
follows”を含んでいたなら、終了位置が1文後
に拡張される。そして、対応範囲拡張処理を終了する。
第3図に戻り、ステップ97では、抄録文とその対応範
囲を第19図に示す如き対応範囲テーブル410に登録
する。
囲を第19図に示す如き対応範囲テーブル410に登録
する。
ステップ98では、抄録文番号iをインクリメントする
。
。
ステップ99では、抄録文番号iが抄録文テーブル40
9の最後を過ぎたか調べる。過ぎていなければ前記ステ
ップ92に戻り、過ぎていれば対応範囲決定処理を終了
する。
9の最後を過ぎたか調べる。過ぎていなければ前記ステ
ップ92に戻り、過ぎていれば対応範囲決定処理を終了
する。
第1図に戻り、ステップ15では、抄録を表示する。表
示例を第22図に示す。
示例を第22図に示す。
ステップ16では、テキスト情報を表示することをユー
ザが選択したかチエツクする。選択したならステップ1
7に進み、選択しなければ処理を終了する。
ザが選択したかチエツクする。選択したならステップ1
7に進み、選択しなければ処理を終了する。
ステップ17では、テキスト情報を抽出し、表示する。
このテキスト情報抽出・表示処理を第5図を参照して説
明する。
明する。
ステップ151では、表示された抄録の中からテキスト
情報を得たい抄録文をユーザが選択する。
情報を得たい抄録文をユーザが選択する。
ステップ152では、選択された抄録文とその前後のい
くつかの抄録文に対応する文章の範囲を第19図の対応
範囲テーブル410から求めて、それぞれ処理範囲とす
る。
くつかの抄録文に対応する文章の範囲を第19図の対応
範囲テーブル410から求めて、それぞれ処理範囲とす
る。
ステップ153では、処理モードをユーザが選択する。
処理モードには、原文表示処理と、キーワード検索処理
と、他文書検索処理と、抄録文選択処理と、終了とがあ
り、これらのいずれかを選択すると、ステップ154〜
ステツプ157のいずれかに進むか又はテキスト情報抽
出・表示処理を終了する。
と、他文書検索処理と、抄録文選択処理と、終了とがあ
り、これらのいずれかを選択すると、ステップ154〜
ステツプ157のいずれかに進むか又はテキスト情報抽
出・表示処理を終了する。
ステップ154では、原文表示処理を行なう。
この原文表示処理を第6図を参照して説明する。
ステップ161では、抄録文と前記処理範囲の文章を対
照表示するか否かをユーザに選択させる。
照表示するか否かをユーザに選択させる。
対照表示を選択するとステップ162に進み、選択しな
ければステップ165に進む。
ければステップ165に進む。
ステップ162では、画面を左右に分割する。
ステップ163では、前記第5図のステップ151でユ
ーザが選択した抄録文を含む抄録の部分を画面の左側エ
リアに表示する。この際、ユーザが選択した抄録文が左
側エリアの中心の行に位置するように、また、輝度を強
くするなどにより他と識別可能に表示する。さらに、前
記左側エリアに表示した抄録文に対応する処理範囲の文
章を英文テキストファイル6の文書60から読み込んで
、画面の右側エリアに表示する。前記ユーザが選択した
抄録文に対応する文章中のユーザが選択した文は、表示
輝度を強くするなどにより他と識別可能に、また、ユー
ザが選択した文が右側のエリアの中心の行に位置するよ
うに表示する。このときの画面の一例を第23図に示す
。
ーザが選択した抄録文を含む抄録の部分を画面の左側エ
リアに表示する。この際、ユーザが選択した抄録文が左
側エリアの中心の行に位置するように、また、輝度を強
くするなどにより他と識別可能に表示する。さらに、前
記左側エリアに表示した抄録文に対応する処理範囲の文
章を英文テキストファイル6の文書60から読み込んで
、画面の右側エリアに表示する。前記ユーザが選択した
抄録文に対応する文章中のユーザが選択した文は、表示
輝度を強くするなどにより他と識別可能に、また、ユー
ザが選択した文が右側のエリアの中心の行に位置するよ
うに表示する。このときの画面の一例を第23図に示す
。
一方、ステップ165では、前記処理範囲の文章を英文
テキストファイル6の文書60から読み込んで、画面に
表示する。この際、ユーザが選択した抄録文に対応する
文章中の文が画面の中心の行に位置するように、また、
輝度を強くするなどにより他と識別可能に表示する。こ
のときの画面の一例を第24図に示す。
テキストファイル6の文書60から読み込んで、画面に
表示する。この際、ユーザが選択した抄録文に対応する
文章中の文が画面の中心の行に位置するように、また、
輝度を強くするなどにより他と識別可能に表示する。こ
のときの画面の一例を第24図に示す。
ステップ167では、ユーザが選択した抄録文に対応す
る文章が適正か否かをユーザが判断し、適正なら処理範
囲を変更しないと入力し、適正でないなら処理範囲を変
更すると入力する。処理範囲を変更しないと入力された
ら原文表示処理を終了する。処理範囲を変更すると入力
されたらステップ168に進む。
る文章が適正か否かをユーザが判断し、適正なら処理範
囲を変更しないと入力し、適正でないなら処理範囲を変
更すると入力する。処理範囲を変更しないと入力された
ら原文表示処理を終了する。処理範囲を変更すると入力
されたらステップ168に進む。
ステップ168では、ユーザの指示に基づいて処理範囲
の開始位置と終了位置を変更する。処理範囲の変更は、
第19図の対応範囲テーブル410の対応範囲の開始位
置と終了位置をユーザの指示に従って書き換えることに
よって行う。そして、前記ステップ161に戻る。
の開始位置と終了位置を変更する。処理範囲の変更は、
第19図の対応範囲テーブル410の対応範囲の開始位
置と終了位置をユーザの指示に従って書き換えることに
よって行う。そして、前記ステップ161に戻る。
第5図に戻り、ステップ155では、キーワード検索処
理を行なう。このキーワード検索処理を第7図を参照し
て説明する。
理を行なう。このキーワード検索処理を第7図を参照し
て説明する。
ステップ191では、キーワードを入力するための参考
とする単語リストを表示するか否かをユーザに選択させ
る。表示するならばステップ192に進み、表示しない
ならばステップ193に進む。
とする単語リストを表示するか否かをユーザに選択させ
る。表示するならばステップ192に進み、表示しない
ならばステップ193に進む。
ステップ192では、単語リストを表示する。
この単語リスト表示処理を第8図を参照して説明する。
ステップ201では、表示する単語リストの種類をユー
ザに選択させる。表示する単語リストの種類には、出現
頻度順単語リストおよびアルファベット順単語リストの
2種類がある。
ザに選択させる。表示する単語リストの種類には、出現
頻度順単語リストおよびアルファベット順単語リストの
2種類がある。
ステップ202では、前記処理範囲の文章に出現する単
語を第13図の出現単語テーブル406から得て、第2
0図の表示単語テーブル411に格納する。但し、スト
ップワードファイル7で指定されている単語は除く。ま
た、この時点では、表示単語テーブル411の各単語の
出現頻度の欄は、初期値として1″を設定しておく。
語を第13図の出現単語テーブル406から得て、第2
0図の表示単語テーブル411に格納する。但し、スト
ップワードファイル7で指定されている単語は除く。ま
た、この時点では、表示単語テーブル411の各単語の
出現頻度の欄は、初期値として1″を設定しておく。
ステップ203では、表示単語テーブル411中に重複
して出現する単語を探し、その数をカウントし、その単
語を含むレコードを一つだけ残して他を削除し、残した
レコードの出現頻度を前記カウントシた数で置き換える
。
して出現する単語を探し、その数をカウントし、その単
語を含むレコードを一つだけ残して他を削除し、残した
レコードの出現頻度を前記カウントシた数で置き換える
。
ステップ204では、前記ステップ201で出現頻度順
単語リストが指定されたか否かを調べる。
単語リストが指定されたか否かを調べる。
指定されている場合にはステップ205に進み、指定さ
れていない場合にはステップ206に進む。
れていない場合にはステップ206に進む。
ステップ205では、表示単語テーブル411を出現頻
度順にソートする。
度順にソートする。
一方、ステップ206では、表示単語テーブル411を
アルファベット順にソートする。
アルファベット順にソートする。
ステップ207では、表示単語テーブル411をリスト
化して表示する。第25 (a)図に出現頻度順単語リ
ストを例示する。また、第25(b)図にアルファベッ
ト順単語リストを例示する。
化して表示する。第25 (a)図に出現頻度順単語リ
ストを例示する。また、第25(b)図にアルファベッ
ト順単語リストを例示する。
第7図に戻り、ステップ193では、キーワードをユー
ザが入力する。この入力は、前記ステ・ツブ192で表
示された単語リスト中の単語を選択することにより入力
してもよいし、キーボード装置3から入力してもよい。
ザが入力する。この入力は、前記ステ・ツブ192で表
示された単語リスト中の単語を選択することにより入力
してもよいし、キーボード装置3から入力してもよい。
また、複数のキーワードを入力してもよい。キーワード
が複数ある場合には、処理が繰返しになるだけである。
が複数ある場合には、処理が繰返しになるだけである。
入力されたキーワードは、第21図に示す如きキーワー
ドテーブル412に格納する。
ドテーブル412に格納する。
ステップ194では、前記キーワードテーブル412に
格納したキーワードを含む文を処理範囲内の文章から抽
出する。キーワードを含む文の文番号は、第13図の出
現単語テーブル406を調ベることによって得られる。
格納したキーワードを含む文を処理範囲内の文章から抽
出する。キーワードを含む文の文番号は、第13図の出
現単語テーブル406を調ベることによって得られる。
ステップ195では、前記抽出したキーワードを含む文
を英文テキストファイル6の文書60から取り出して、
表示する。表示方法としては、第26 (a)図に示す
ように、キーワードを含む文のみを表示してもよいし、
第26 (b)図に示すように、処理範囲の文章を表示
しておき、キーワードを含む文をブリンク等により強調
してもよい。
を英文テキストファイル6の文書60から取り出して、
表示する。表示方法としては、第26 (a)図に示す
ように、キーワードを含む文のみを表示してもよいし、
第26 (b)図に示すように、処理範囲の文章を表示
しておき、キーワードを含む文をブリンク等により強調
してもよい。
ステップ196では、第5図のステップ151でユーザ
が選択した抄録文に対応する処理範囲が適正か否かをユ
ーザが判断し、適正なら処理範囲を変更しないと入力し
、適正でないなら処理範囲を変更すると入力する。処理
範囲を変更しないと人力されたらキーワード検索処理を
終了する。処理範囲を変更すると入力されたらステップ
197に進む。
が選択した抄録文に対応する処理範囲が適正か否かをユ
ーザが判断し、適正なら処理範囲を変更しないと入力し
、適正でないなら処理範囲を変更すると入力する。処理
範囲を変更しないと人力されたらキーワード検索処理を
終了する。処理範囲を変更すると入力されたらステップ
197に進む。
ステップ197では、ユーザの指示に基づいて処理範囲
の開始位置と終了位置を変更する。処理範囲を変更する
と、それにより第19図の対応範囲テーブル410の対
応範囲の開始位置と終了位置が更新される。そして、前
記ステ・ツブ194に戻る。
の開始位置と終了位置を変更する。処理範囲を変更する
と、それにより第19図の対応範囲テーブル410の対
応範囲の開始位置と終了位置が更新される。そして、前
記ステ・ツブ194に戻る。
第5図に戻り、ステップ156では、他文書検索処理を
行なう。この他文書検索処理を第9図を参照して説明す
る。
行なう。この他文書検索処理を第9図を参照して説明す
る。
ステップ251では、キーワードを入力する参考とする
ために単語リストを表示するか否かをユーザに選択させ
る。表示するのならば、ステ・ツブ252に進む。表示
しないのならば、ステ・ツブ253に進む。このステッ
プ251は、前記第7図のステップ191と同様である
。
ために単語リストを表示するか否かをユーザに選択させ
る。表示するのならば、ステ・ツブ252に進む。表示
しないのならば、ステ・ツブ253に進む。このステッ
プ251は、前記第7図のステップ191と同様である
。
ステップ252では、単語リストを表示する。
このステップ252は、前記第7図のステ・ツブ192
と同様であり、具体的には第8図の処理となる。
と同様であり、具体的には第8図の処理となる。
ステップ253では、キーワードを入力する。
このステップ253は、前記第7図のステ・ツブ193
と同様である。
と同様である。
この後、第5図に戻−7でから第1図の2、テップ11
へ移行する。そしマ:、キーワードテーブル412中の
単語を検索キーとして他の文書を検索し、更にステップ
12からステップ17の一連の処理を再帰的に行う。
へ移行する。そしマ:、キーワードテーブル412中の
単語を検索キーとして他の文書を検索し、更にステップ
12からステップ17の一連の処理を再帰的に行う。
この他文書検索処理によって、ある文書のテキスト情報
を抽出している際に、関連する他の文書を連想的に検索
できる。すなわち、ある文書中の単語や、ある文書を読
んでいて思い付いた単語を検索キーとして、他の文書を
連想的゛に検索できる。
を抽出している際に、関連する他の文書を連想的に検索
できる。すなわち、ある文書中の単語や、ある文書を読
んでいて思い付いた単語を検索キーとして、他の文書を
連想的゛に検索できる。
さて、第5図に戻り、ステップ157の抄録文選択処理
では、抄録を表示し、前記ステ・ツブ151に戻る。
では、抄録を表示し、前記ステ・ツブ151に戻る。
以上の実施例では英文テキストファイル6の管理情報テ
ーブル61に段落の情報を持っていたが、次に変形実施
例として段落の情報を持たない場合を説明する。
ーブル61に段落の情報を持っていたが、次に変形実施
例として段落の情報を持たない場合を説明する。
この変形実施例の場合、第1図のステ・ツブ14の処理
として、前記第3図のステップ91〜ステツプ99を行
なう代わりに、第10図のステ・シフ261〜ステツプ
269を行なう。
として、前記第3図のステップ91〜ステツプ99を行
なう代わりに、第10図のステ・シフ261〜ステツプ
269を行なう。
すなわち、ステップ261では、ある抄録文に対応する
元の文書60の文を基準とした相対的な値で、その抄録
文に対応する元の文書60の文章の範囲をユーザが設定
する。具体的には、ある抄録文に対応する元の文書6o
の文を” o ”とし、その文より前の文は負の値、そ
の文より後の文は正の値で文の数をカウントして、対応
範囲の相対的開始位置αと相対的終了位置βとを設定す
る。
元の文書60の文を基準とした相対的な値で、その抄録
文に対応する元の文書60の文章の範囲をユーザが設定
する。具体的には、ある抄録文に対応する元の文書6o
の文を” o ”とし、その文より前の文は負の値、そ
の文より後の文は正の値で文の数をカウントして、対応
範囲の相対的開始位置αと相対的終了位置βとを設定す
る。
この設定は、予め行なっていてもよい。
ステップ262では、抄録文番号i (Δl)を′1′
′に初期化する。
′に初期化する。
ステップ263では、抄録文番号i (Aυの抄録文
の元の文番号j (B+)を第17図の抄録文テーブル
409から求める4 ステップ264では、文番号(j+α)の文を、抄録文
番号i (A1)の抄録文の対応範囲の開始位置とす
る。
の元の文番号j (B+)を第17図の抄録文テーブル
409から求める4 ステップ264では、文番号(j+α)の文を、抄録文
番号i (A1)の抄録文の対応範囲の開始位置とす
る。
ステップ265では、文番号(j+β)の文を、抄録文
番号i (A、)の抄録文の対応範囲の終了位置とす
る。
番号i (A、)の抄録文の対応範囲の終了位置とす
る。
ステップ266では、第18図の接続語句ファイル8を
参照して対応範囲を拡張する。この処理は第3図のステ
ップ96と同様であり、具体的には第4図に示す処理と
なる。
参照して対応範囲を拡張する。この処理は第3図のステ
ップ96と同様であり、具体的には第4図に示す処理と
なる。
ステップ267では、抄録文とその対応範囲を第19図
に示す如き対応範囲テーブル410に登録する。
に示す如き対応範囲テーブル410に登録する。
ステップ268では、抄録文番号iをインクリメントす
る。
る。
ステップ269では、抄録文番号iが抄録文テーブル4
09の最後を過ぎたか調べる。過ぎていなければ前記ス
テップ263に戻り、過ぎていれば対応範囲決定処理を
終了する。
09の最後を過ぎたか調べる。過ぎていなければ前記ス
テップ263に戻り、過ぎていれば対応範囲決定処理を
終了する。
他の変形実施例としては、第1図のステップ11〜ステ
ツプ45を、ユーザが抄録を作成して入力するステップ
と、ユーザが第17図の抄録文テーブル409を作成し
て入力するステップとに置換したものが挙げられる。
ツプ45を、ユーザが抄録を作成して入力するステップ
と、ユーザが第17図の抄録文テーブル409を作成し
て入力するステップとに置換したものが挙げられる。
」1記実施例のテキスト情報抽出方法および装置によれ
ば、抄録中で分かりにくかったり、特に関心が持たれた
抄録文に関係する元の文章の一部を的確に表示したり、
出現単語リストを表示することにより、必要十分なテキ
スト情報を効率的に獲得することが出来る。
ば、抄録中で分かりにくかったり、特に関心が持たれた
抄録文に関係する元の文章の一部を的確に表示したり、
出現単語リストを表示することにより、必要十分なテキ
スト情報を効率的に獲得することが出来る。
以」二の第1実施例は抄録文に対応する元の文章を検索
して表示するシステムであったが、次に第2実施例とし
て抄録文とその翻訳文とを組み合わせて表示するシステ
ムについて説明する。
して表示するシステムであったが、次に第2実施例とし
て抄録文とその翻訳文とを組み合わせて表示するシステ
ムについて説明する。
第33図は、本発明の第2実施例のテキスト検索・表示
システム2000のブロック図である。
システム2000のブロック図である。
図中、1は処理装置、2はデイスプレィ装置、3はキー
ボード装置、4はメモリ、5は日本文テキストファイル
、6は英文テキストファイル、7はストップワードファ
イル、8は接続語句ファイル、9は辞書ファイルである
。
ボード装置、4はメモリ、5は日本文テキストファイル
、6は英文テキストファイル、7はストップワードファ
イル、8は接続語句ファイル、9は辞書ファイルである
。
メモリ4は、文書検索プログラム401と、抄録作成プ
ログラム402と、対応範囲決定プログラム403と、
自動翻訳プログラム404と、テキスト情報抽出プログ
ラム405と、出現単語テーブル406と、単語頻度テ
ーブル407と1文得点テーブル408と、抄録文テー
ブル409と。
ログラム402と、対応範囲決定プログラム403と、
自動翻訳プログラム404と、テキスト情報抽出プログ
ラム405と、出現単語テーブル406と、単語頻度テ
ーブル407と1文得点テーブル408と、抄録文テー
ブル409と。
対応範囲テーブル410と2表示単語テーブル2411
と、キーワードテーブル412とを含んでいる。
と、キーワードテーブル412とを含んでいる。
英文テキストファイル6は、複数の英文の文書60と、
各文書毎の管理情報テーブル61とを含んでいる。この
管理情報テーブル61は、第12図に示すように、文書
の各文についての文番号とその文が属する段落の段落番
号とを対応付けたものである。
各文書毎の管理情報テーブル61とを含んでいる。この
管理情報テーブル61は、第12図に示すように、文書
の各文についての文番号とその文が属する段落の段落番
号とを対応付けたものである。
第27図は、上記テキスト検索・表示システム2000
において英文テキストファイル6から文書を検索し、抄
録を作成し、その抄録を表示すると共に、その抄録を翻
訳し、抄録と対応付けて表示する処理のフロー図である
。
において英文テキストファイル6から文書を検索し、抄
録を作成し、その抄録を表示すると共に、その抄録を翻
訳し、抄録と対応付けて表示する処理のフロー図である
。
ステップ271では、英文テキストファイル6から文書
を検索する。この処理は第1図のステップ11と同様で
ある。
を検索する。この処理は第1図のステップ11と同様で
ある。
ステップ272では、前記取り出した文書の文を形態素
解析し、各文の構成単語を第13図の出現単語テーブル
406に出現順に格納する。この処理は第1図のステッ
プ12と同様である。
解析し、各文の構成単語を第13図の出現単語テーブル
406に出現順に格納する。この処理は第1図のステッ
プ12と同様である。
ステップ273では、前記文書の抄録を作成する。この
処理は第1図のステップ13と同様である。
処理は第1図のステップ13と同様である。
ステップ2745では、各抄録文に順に抄録文番号をイ
」シ、その抄録文番号と元の文番号とを対応づけて、第
17図に示す如き抄録文テーブル409を作成する。こ
の処理は第1図のステップ45と同様である。
」シ、その抄録文番号と元の文番号とを対応づけて、第
17図に示す如き抄録文テーブル409を作成する。こ
の処理は第1図のステップ45と同様である。
ステップ274では、各抄録文に対応する元の文書中の
文章の範囲を決定する。この処理は第1図のステップ1
4と同様である。
文章の範囲を決定する。この処理は第1図のステップ1
4と同様である。
ステップ275では、抄録文に対し翻訳処理を行う。翻
訳処理け、例えば特開昭58−40684号公報に開示
の翻訳方法を利用することが出来る。翻訳文は、抄録文
の元の文番号と対応付けて日本文テキストファイル5に
格納する。英文テキストファイル6の文書60のデータ
構造を第34(a)図に示し、日本文テキストファイル
5のデータ構造を第34(b)図に示す。
訳処理け、例えば特開昭58−40684号公報に開示
の翻訳方法を利用することが出来る。翻訳文は、抄録文
の元の文番号と対応付けて日本文テキストファイル5に
格納する。英文テキストファイル6の文書60のデータ
構造を第34(a)図に示し、日本文テキストファイル
5のデータ構造を第34(b)図に示す。
ステップ276では、抄録を表示する。その際、ユーザ
は、表示言語選択キーにより抄録文を表示する言語とし
て英語または日本語を選択する。英語が選択されたら、
英文テキストファイル6の文書60から抄録文になって
いる文を抽出して表示する。この英語での表示例を第3
6(a)図に示す。
は、表示言語選択キーにより抄録文を表示する言語とし
て英語または日本語を選択する。英語が選択されたら、
英文テキストファイル6の文書60から抄録文になって
いる文を抽出して表示する。この英語での表示例を第3
6(a)図に示す。
日本語が選択されたら、日本文テキストファイル5から
翻訳文を抽出して表示する。この日本語での表示例を第
36(b)図に示す。
翻訳文を抽出して表示する。この日本語での表示例を第
36(b)図に示す。
ステップ277では、抄録を読んだユーザが、テキスト
情報を表示するか否か入力する。この処理は、第1図の
ステップ16と同様である。表示するならステップ27
8に進み、表示しないなら処理を終了する。
情報を表示するか否か入力する。この処理は、第1図の
ステップ16と同様である。表示するならステップ27
8に進み、表示しないなら処理を終了する。
ステップ278では、テキスト情報を抽出し、表示する
。このテキスト情報抽出・表示処理を第28図を参照し
て説明する。
。このテキスト情報抽出・表示処理を第28図を参照し
て説明する。
ステップ301では、表示された抄録の中からテキスト
情報を得たい抄録文をユーザが選択する。
情報を得たい抄録文をユーザが選択する。
ステップ302では、選択された抄録文とその前後のい
くつかの抄録文に対応する文章の範囲を第19図の対応
範囲テーブル410から求めて、それぞれ処理範囲とす
る。
くつかの抄録文に対応する文章の範囲を第19図の対応
範囲テーブル410から求めて、それぞれ処理範囲とす
る。
ステップ303では、処理範囲の文章に翻訳処理を行な
う。翻訳文は、日本文テキストファイル5に格納する。
う。翻訳文は、日本文テキストファイル5に格納する。
また、翻訳処理で得られた英語出現単語と訳語を第35
図に示す如き表示単語テーブル2411に格納する。こ
の時点では、出現頻度の欄は初期値として1”を設定し
ておく。
図に示す如き表示単語テーブル2411に格納する。こ
の時点では、出現頻度の欄は初期値として1”を設定し
ておく。
ステップ304では、処理モードをユーザが選択する。
処理モードには、原文表示処理と、キーワード検索処理
と、他文書検索処理と、抄録文選択処理と、終了とがあ
り、これらのいずれかを選択すると、ステップ305〜
ステツプ308のいずれかに進むか又はテキスト情報抽
出・表示処理を終了する。
と、他文書検索処理と、抄録文選択処理と、終了とがあ
り、これらのいずれかを選択すると、ステップ305〜
ステツプ308のいずれかに進むか又はテキスト情報抽
出・表示処理を終了する。
ステップ305では、原文表示処理を行なう。
この原文表示処理は、第6図を参照して先述した処理と
同様である。但し、ユーザは、表示言語選択キーにより
原文を表示する言語として英語また=32 は日本語を選択することが出来る。英語が選択されたら
、英文テキストファイル6の文書60から処理範囲の文
を抽出して表示する。この場合の処理範囲の文のみの表
示例は第24図のようになる。
同様である。但し、ユーザは、表示言語選択キーにより
原文を表示する言語として英語また=32 は日本語を選択することが出来る。英語が選択されたら
、英文テキストファイル6の文書60から処理範囲の文
を抽出して表示する。この場合の処理範囲の文のみの表
示例は第24図のようになる。
また、抄録文と処理範囲の文の対照表示の例は第23図
のようになる。一方、日本語が選択されたら、日本文テ
キストファイル5から前記処理範囲に対応する翻訳文を
抽出して表示する。この場合の処理範囲に対応する翻訳
文のみの表示例を第37(a)図に示す。また、抄録文
の翻訳文と処理範囲の翻訳文の対照表示の例を第37(
b)図に示す。
のようになる。一方、日本語が選択されたら、日本文テ
キストファイル5から前記処理範囲に対応する翻訳文を
抽出して表示する。この場合の処理範囲に対応する翻訳
文のみの表示例を第37(a)図に示す。また、抄録文
の翻訳文と処理範囲の翻訳文の対照表示の例を第37(
b)図に示す。
ステップ306では、キーワード検索処理を行なう。こ
のキーワード検索処理を第29図を参照して説明する。
のキーワード検索処理を第29図を参照して説明する。
ステップ341では、テキスト情報を検索するためのキ
ーワードを設定するための参考とする単語リストを表示
するか否かをユーザに選択させる。
ーワードを設定するための参考とする単語リストを表示
するか否かをユーザに選択させる。
表示するならばステップ342に進み、表示しないなら
ばステップ343に進む。
ばステップ343に進む。
ステップ342では、単語リストを表示する。
この単語リスト表示処理を第30図を参照して説明する
。
。
ステップ3501では、表示する単語リストの種類をユ
ーザに選択させる。表示する単語リストの種類は、出現
頻度順単語リストおよびアルファベット150音順単語
リストの2種類がある。
ーザに選択させる。表示する単語リストの種類は、出現
頻度順単語リストおよびアルファベット150音順単語
リストの2種類がある。
ステップ3502では、前記第28図のステップ303
で作成した第35図の表示単語テーブル2411中で英
語出現単語と訳語の両方が一致する単語を探し、複数個
ある場合にはその数をカウントし、そのレコードを1つ
残して他を削除し、残したレコードの出現頻度の欄にカ
ウントした数を設定する。
で作成した第35図の表示単語テーブル2411中で英
語出現単語と訳語の両方が一致する単語を探し、複数個
ある場合にはその数をカウントし、そのレコードを1つ
残して他を削除し、残したレコードの出現頻度の欄にカ
ウントした数を設定する。
ステップ3503では、単語を表示する言語として英語
または日本語を表示言語選択キーによりユーザに選択さ
せる。英語が選択されたら、ステップ3504に進む。
または日本語を表示言語選択キーによりユーザに選択さ
せる。英語が選択されたら、ステップ3504に進む。
日本語が選択されたら、ステップ3508に進む。
ステップ3504では、前記ステップ3501で出現頻
度順単語リストが選択されたか否かを調ベ、選択されて
いる場合はステップ35o5に進み、選択されていない
場合はステップ3506に進む。
度順単語リストが選択されたか否かを調ベ、選択されて
いる場合はステップ35o5に進み、選択されていない
場合はステップ3506に進む。
ステップ3505では、第35図の表示単語テーブル2
411の英語出現単語を出現頻度順にソー l−する。
411の英語出現単語を出現頻度順にソー l−する。
ステップ3506では、第35図の表示単語テーブル4
11の英語出現単語をアルファベット類にソートする。
11の英語出現単語をアルファベット類にソートする。
ステップ3507では、ソートした表示単語テーブル2
411の英語出現単語を表示する。第38(a)図に英
語出現単語の出現頻度順単語リストを例示する。また、
第38(b)図に英語出現単語のアルファベット順単語
リストを例示する。
411の英語出現単語を表示する。第38(a)図に英
語出現単語の出現頻度順単語リストを例示する。また、
第38(b)図に英語出現単語のアルファベット順単語
リストを例示する。
一方、ステップ3508では、前記ステップ3501で
出現頻度順単語リストが選択されたか否かを調べ、選択
されている場合はステップ3509に進み、選択されて
いない場合はステップ3510に進む。
出現頻度順単語リストが選択されたか否かを調べ、選択
されている場合はステップ3509に進み、選択されて
いない場合はステップ3510に進む。
ステップ3509では、第35図の表示単語テーブル2
411の訳語を出現頻度順にソートする。
411の訳語を出現頻度順にソートする。
ステップ3510では、第35図の表示単語テーブル4
11の訳語を50音順にソートする。
11の訳語を50音順にソートする。
ステップ3511では、ソートした表示単語テーブル2
411の訳語を表示する。第39(a)図に訳語の出現
頻度順単語リストを例示する。また、第39(b)図に
訳語の50音順単語リストを例示する。
411の訳語を表示する。第39(a)図に訳語の出現
頻度順単語リストを例示する。また、第39(b)図に
訳語の50音順単語リストを例示する。
第29図に戻り、ステップ343では、キーワードを設
定する。このキーワード設定処理を第31図を参照して
説明する。
定する。このキーワード設定処理を第31図を参照して
説明する。
ステップ381では、ユーザがキーワードを入力する。
キーワードは、英語1日本語どちらでもよく、複数でも
よい。
よい。
ステップ382では、ユーザが入力したキーワードが英
語か否かを識別する。具体的には、キーワードがキーボ
ード装置3から入力された場合にはキーボード装置3の
人力モードから英語か否かを識別する。また、表示して
いる単語リストから選択された場合には、その単語リス
トの種類から英語か否かを識別する。キーワードが英語
の場合にはステップ383に進み、日本語の場合にはス
テップ384に進む。
語か否かを識別する。具体的には、キーワードがキーボ
ード装置3から入力された場合にはキーボード装置3の
人力モードから英語か否かを識別する。また、表示して
いる単語リストから選択された場合には、その単語リス
トの種類から英語か否かを識別する。キーワードが英語
の場合にはステップ383に進み、日本語の場合にはス
テップ384に進む。
ステップ383では、英語のキーワードをキーワードテ
ーブル412に格納する。
ーブル412に格納する。
一方、ステップ384では、日本語のキーワードと同じ
訳語を持つレコードを第35図の表示単語テーブル24
11で探す。
訳語を持つレコードを第35図の表示単語テーブル24
11で探す。
ステップ385では、日本語のキーワードと同じ訳語を
持つレコードが表示単語テーブル2411にあったかチ
エツクする。あったならばステップ386に進む。なか
ったならば、前記ステップ381に戻り、キーワードを
再入力させる。
持つレコードが表示単語テーブル2411にあったかチ
エツクする。あったならばステップ386に進む。なか
ったならば、前記ステップ381に戻り、キーワードを
再入力させる。
ステップ386では、日本語のキーワードと同じ訳語を
持つレコードの英語出現単語をキーワードテーブル41
2にキーワードとして格納する。
持つレコードの英語出現単語をキーワードテーブル41
2にキーワードとして格納する。
もし、日本語のキーワードと同じ訳語を持つレコードが
複数ある場合には、その全ての英語出現単語をキーワー
ドテーブル412にキーワードとして格納する。
複数ある場合には、その全ての英語出現単語をキーワー
ドテーブル412にキーワードとして格納する。
第29図に戻り、ステップ344では、前記キーワード
テーブル412に格納したキーワードを含む文の文番号
を処理範囲内の文章から抽出する。
テーブル412に格納したキーワードを含む文の文番号
を処理範囲内の文章から抽出する。
この処理は前記第7図のステップ194と同様である。
ステップ345では、前記抽出したキーワードを含む文
を英文テキストファイル6の文書6oから取り出して、
表示する。この処理は前記第7図のステップ195と同
様である。
を英文テキストファイル6の文書6oから取り出して、
表示する。この処理は前記第7図のステップ195と同
様である。
ステップ346では、処理範囲を変更するか否かをユー
ザに入力させ、処理範囲を変更しないと入力されたらキ
ーワード検索処理を終了する。処理範囲を変更すると入
力されたらステップ347に進む。この処理は前記第7
図のステップ196と同様である。
ザに入力させ、処理範囲を変更しないと入力されたらキ
ーワード検索処理を終了する。処理範囲を変更すると入
力されたらステップ347に進む。この処理は前記第7
図のステップ196と同様である。
ステップ347では、ユーザの指示に基づいて処理範囲
の開始位置と終了位置を変更する。処理範囲を変更する
と、それにより第19図の対応範囲テーブル410の対
応範囲の開始位置と終了位置が更新される。そして、前
記ステップ344に戻る。
の開始位置と終了位置を変更する。処理範囲を変更する
と、それにより第19図の対応範囲テーブル410の対
応範囲の開始位置と終了位置が更新される。そして、前
記ステップ344に戻る。
さて、第28図に戻り、ステップ307では、他文書検
索処理を行なう。この他文書検索処理を第32図を参照
して説明する。
索処理を行なう。この他文書検索処理を第32図を参照
して説明する。
ステップ4251では、キーワードを設定する参考とす
るために単語リストを表示するが否かをユーザに選択さ
せる。表示するのならば、ステップ4252に進む。表
示しないのならば、ステップ4253に進む。このステ
ップ4251は、前記第29図のステップ341と同様
である。
るために単語リストを表示するが否かをユーザに選択さ
せる。表示するのならば、ステップ4252に進む。表
示しないのならば、ステップ4253に進む。このステ
ップ4251は、前記第29図のステップ341と同様
である。
ステップ4252では、単語リストを表示する。
このステップ4252は、前記第29図のステップ34
2と同様であり、具体的には第30図の処理となる。
2と同様であり、具体的には第30図の処理となる。
ステップ4253では、キーワードを設定する。
このステップ4253は、前記第29図のステップ34
3と同様であり、具体的には第31図の処理となる。
3と同様であり、具体的には第31図の処理となる。
この後、第28図に戻ってから第27図のステップ27
1へ移行する。そして、キーワードテーブル412中の
単語を検索キーとして他の文書を検索し、更にステップ
272からステップ278の一連の処理を再帰的に行う
。
1へ移行する。そして、キーワードテーブル412中の
単語を検索キーとして他の文書を検索し、更にステップ
272からステップ278の一連の処理を再帰的に行う
。
第28図に戻り、ステップ308では、抄録文選択処理
を行なう。すなわち、抄録を表示し、前記ステップ30
1に戻る。
を行なう。すなわち、抄録を表示し、前記ステップ30
1に戻る。
変形実施例としては、第27図のステップ271、〜ス
テップ2745を、ユーザが抄録を作成して入力するス
テップと、ユーザが第17図の抄録文テーブル409を
作成して人力するステップとに置換したものが挙げられ
る。
テップ2745を、ユーザが抄録を作成して入力するス
テップと、ユーザが第17図の抄録文テーブル409を
作成して人力するステップとに置換したものが挙げられ
る。
他の実施例としては、英語や日本語以外の他の言語につ
いて本発明を適用したものが挙げられる。
いて本発明を適用したものが挙げられる。
[発明の効果]
本発明のテキスト情報抽出方法および装置によれば、あ
る文書における重要箇所とか、その重要箇所に出現する
単語のリストとかのテキスト情報を、抄録を利用して容
易に得られるようになる。
る文書における重要箇所とか、その重要箇所に出現する
単語のリストとかのテキスト情報を、抄録を利用して容
易に得られるようになる。
第1図は本発明の第1実施例の処理の基本フロ=40
一図、第2図は抄録作成処理のフロー図、第3図は対応
範囲決定処理のフロー図、第4図は対応範囲拡張処理の
フロー図、第5図はテキスト情報抽出・表示処理のフロ
ー図、第6図は原文表示処理のフロー図、第7図はキー
ワード検索処理のフロー図、第8図は単語リスト表示処
理のフロー図、第9図は他文書検索処理のフロー図、第
10図は対応範囲決定処理の他の例のフロー図、第11
図は本発明の第1実施例のハードウェア構成図、第12
図は情報管理テーブルの概念図、第13図は出現単語テ
ーブルの概念図、第14図は単語頻度テーブルの概念図
、第15図はストップワードファイルの概念図、第16
図は文得点テーブルの概念図、第17図は抄録文テーブ
ルの概念図、第18図は接続語句ファイルの概念図、第
19図は対応範囲テーブルの概念図、第20図は表示単
語テーブルの概念図、第21図はキーワードテーブルの
概念図、第22図、第23図、第24図、第25(a)
図、第25(b)図、第26(a)図および第26(b
)図は表示画面の例示図、第27図は本発明の第2実施
例の処理の基本フロー図、第28図はテキスト情報抽出
・表示処理のフロー図、第29図はキーワード検索処理
のフロー図、第30図は単語リスト表示処理のフロー図
、第31図はキーワード設定処理のフロー図、第32図
は他文書検索処理のフロー図、第33図は本発明の第2
実施例のハードウェア構成図、第34(a)図は英文の
文書の概念図、第34(b)図は日本文テキストファイ
ルの概念図、第35図は表示単語テーブルの概念図、第
36(a)図、第36(b)図、第37(a)図、第3
7(b)図、第38(a)図、第、98 (b)図、第
39(a)図および第39(b)図は表示画面の例示図
である。 (符号の説明) 1・・・処理装置、2・・・デイスプレィ装置、3・・
・キーボード装置、4・・・メモリ、401・・・文書
検索プログラム、402・・・抄録作成プログラム、4
03・・・対応範囲決定プログラム、404・・・自動
翻訳プログラム、405・・・テキスト情報抽出プログ
ラム、406・・・出現単語テーブル、407・・・単
語頻度テーブル、408・・・文得点テーブル、409
・・・抄録文テーブル、410・・・対応範囲テーブル
、411・・・表示単語テーブル、412・・・キーワ
ードテーブル、5・・・日本文テキストファイル、6・
・・英文テキストファイル、60・・・文書、61・・
・管理情報テーブル、7・・・ストップワードファイル
、8・・・接続語句ファイル、9・・・辞書ファイル。
範囲決定処理のフロー図、第4図は対応範囲拡張処理の
フロー図、第5図はテキスト情報抽出・表示処理のフロ
ー図、第6図は原文表示処理のフロー図、第7図はキー
ワード検索処理のフロー図、第8図は単語リスト表示処
理のフロー図、第9図は他文書検索処理のフロー図、第
10図は対応範囲決定処理の他の例のフロー図、第11
図は本発明の第1実施例のハードウェア構成図、第12
図は情報管理テーブルの概念図、第13図は出現単語テ
ーブルの概念図、第14図は単語頻度テーブルの概念図
、第15図はストップワードファイルの概念図、第16
図は文得点テーブルの概念図、第17図は抄録文テーブ
ルの概念図、第18図は接続語句ファイルの概念図、第
19図は対応範囲テーブルの概念図、第20図は表示単
語テーブルの概念図、第21図はキーワードテーブルの
概念図、第22図、第23図、第24図、第25(a)
図、第25(b)図、第26(a)図および第26(b
)図は表示画面の例示図、第27図は本発明の第2実施
例の処理の基本フロー図、第28図はテキスト情報抽出
・表示処理のフロー図、第29図はキーワード検索処理
のフロー図、第30図は単語リスト表示処理のフロー図
、第31図はキーワード設定処理のフロー図、第32図
は他文書検索処理のフロー図、第33図は本発明の第2
実施例のハードウェア構成図、第34(a)図は英文の
文書の概念図、第34(b)図は日本文テキストファイ
ルの概念図、第35図は表示単語テーブルの概念図、第
36(a)図、第36(b)図、第37(a)図、第3
7(b)図、第38(a)図、第、98 (b)図、第
39(a)図および第39(b)図は表示画面の例示図
である。 (符号の説明) 1・・・処理装置、2・・・デイスプレィ装置、3・・
・キーボード装置、4・・・メモリ、401・・・文書
検索プログラム、402・・・抄録作成プログラム、4
03・・・対応範囲決定プログラム、404・・・自動
翻訳プログラム、405・・・テキスト情報抽出プログ
ラム、406・・・出現単語テーブル、407・・・単
語頻度テーブル、408・・・文得点テーブル、409
・・・抄録文テーブル、410・・・対応範囲テーブル
、411・・・表示単語テーブル、412・・・キーワ
ードテーブル、5・・・日本文テキストファイル、6・
・・英文テキストファイル、60・・・文書、61・・
・管理情報テーブル、7・・・ストップワードファイル
、8・・・接続語句ファイル、9・・・辞書ファイル。
Claims (1)
- 【特許請求の範囲】 1、文書と、その文書の抄録と、前記文書中の文章と前
記抄録中の文の関係情報とを記憶する記憶ステップと、 前記抄録中の文のうちの少なくとも1つを 選択する抄録文選択ステップと、 その選択された抄録文に対応する前記文書 中の文章を前記関係情報を用いて前記文書から抽出する
対応文章抽出ステップと、 その抽出された対応文章についてのテキス ト情報を取り出して出力するテキスト情報出力ステップ
と を有することを特徴とするテキスト情報抽出方法。 2、記憶ステップにおいて、文書中の文と抄録文の1対
1の対応情報を記憶し、その記憶した1対1の対応情報
から抄録文に対応する文書中の文を調べてその文を含む
複数の文を対応文章の範囲として決定し、その対応文章
の範囲を関係情報として記憶する請求項1のテキスト情
報抽出方法。 3、文書の抄録を自動作成し、その抄録の自動作成の過
程で得られた情報から前記文書中の文と抄録文の関係情
報を自動作成する請求項1または請求項2のテキスト情
報抽出方法。 4、複数の文書の中から1つの文書を選択するための文
書選択情報を入力して文書を選択する文書選択ステップ
をさらに有し、 前記選択した文書の抄録を自動作成し、そ の抄録の自動作成の過程で得られた情報から前記文書中
の文と抄録文の関係情報を自動作成する請求項1または
請求項2のテキスト情報抽出方法。 5、ある文書についてのテキスト情報出力ステップ中に
、他の文書に関しての抄録文選択ステップと、対応文章
抽出ステップと、テキスト情報出力ステップとを再帰的
に実行するべく、複数の文書の中から前記他の文書を選
択する他文書選択ステップをさらに有する請求項4のテ
キスト情報抽出方法。 6、文書選択情報により選択した文書の抄録を自動作成
する際に、前記文書選択情報を利用する請求項4または
請求項5のテキスト情報抽出方法。 7、テキスト情報の種類をユーザが選択するテキスト情
報選択ステップをさらに有する請求項1から請求項6の
いずれかのテキスト情報抽出方法。 8、抄録文に対応する文書中の文を含む段落の全文を対
応文章の範囲として決定する請求項1から請求項7のい
ずれかのテキスト情報抽出方法。 9、抄録文に対応する文書中の文より所定の前方相対値
だけ前の文から所定の後方相対値だけ後の文までの全文
を対応文章の範囲として決定する請求項1から請求項7
のいずれかのテキスト情報抽出方法。 10、対応文章の最初の語句または最後の語句が所定の
語句であるときは、その所定の語句に応じて対応文章の
範囲を前後に拡張し、新たな対応文章とする対応文章拡
張ステップをさらに有する請求項1から請求項9のいず
れかのテキスト情報抽出方法。 11、対応文章をユーザに提示し、ユーザからの変更指
示入力に応じて対応文章の範囲を前後に変更し、新たな
対応文章とする対応文章変更ステップをさらに有する請
求項1から請求項10のいずれかのテキスト情報抽出方
法。 12、テキスト情報が、対応文章の範囲内の各文である
請求項1から請求項11のいずれかのテキスト情報抽出
方法。 13、テキスト情報が、対応文章の範囲内に出現する単
語のリストである請求項1から請求項11のいずれかの
テキスト情報抽出方法。 14、文書中の各段落の先頭の文を抽出して抄録とする
請求項1から請求項13のいずれかのテキスト情報抽出
方法。 15、文書と、その文書の抄録と、前記文書中の文章と
前記抄録中の文の関係情報とを記憶する記憶手段と、 その記憶手段に記憶した抄録を出力する抄 録出力手段と、 その抄録出力手段により出力された抄録中 の文のうちの少なくとも1つをユーザが選択する抄録文
選択手段と、 その選択された抄録文に対応する前記文書 中の文章を前記関係情報を用いて前記文書から抽出する
対応文章抽出手段と、 その抽出された対応文章についてのテキス ト情報を取り出して出力するテキスト情報出力手段と を具備してなることを特徴とするテキスト情報抽出装置
。 16、記憶手段が、文書中の文と抄録文の1対1の対応
情報を記憶し、その記憶した1対1の対応情報から抄録
文に対応する文書中の文を調べてその文を含む複数の文
を対応文章の範囲として決定し、その対応文章の範囲を
関係情報として記憶する請求項15のテキスト情報抽出
装置。 17、テキスト情報出力手段が、選択された抄録文とテ
キスト情報とを対照可能に同時出力する請求項15また
は請求項16のテキスト情報抽出装置。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2122411A JPH0418673A (ja) | 1990-05-11 | 1990-05-11 | テキスト情報抽出方法および装置 |
| US07/696,365 US5297027A (en) | 1990-05-11 | 1991-05-06 | Method of and apparatus for promoting the understanding of a text by using an abstract of that text |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2122411A JPH0418673A (ja) | 1990-05-11 | 1990-05-11 | テキスト情報抽出方法および装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0418673A true JPH0418673A (ja) | 1992-01-22 |
Family
ID=14835145
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2122411A Pending JPH0418673A (ja) | 1990-05-11 | 1990-05-11 | テキスト情報抽出方法および装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US5297027A (ja) |
| JP (1) | JPH0418673A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH1040267A (ja) * | 1996-07-26 | 1998-02-13 | Nec Corp | 文書要約ビューア |
| JPH10222520A (ja) * | 1997-01-31 | 1998-08-21 | Toshiba Corp | 電子化文書処理装置 |
| CN110287489A (zh) * | 2019-06-24 | 2019-09-27 | 北京大米科技有限公司 | 文本生成方法、装置、存储介质和电子设备 |
Families Citing this family (50)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5537586A (en) * | 1992-04-30 | 1996-07-16 | Individual, Inc. | Enhanced apparatus and methods for retrieving and selecting profiled textural information records from a database of defined category structures |
| EP0610760B1 (en) * | 1993-01-28 | 2003-05-02 | Kabushiki Kaisha Toshiba | Document detection system with improved document detection efficiency |
| US5638543A (en) * | 1993-06-03 | 1997-06-10 | Xerox Corporation | Method and apparatus for automatic document summarization |
| EP0633539B1 (en) * | 1993-06-30 | 2001-02-21 | Canon Kabushiki Kaisha | Document processing method and apparatus |
| JP3067966B2 (ja) * | 1993-12-06 | 2000-07-24 | 松下電器産業株式会社 | 画像部品を検索する装置及びその方法 |
| US5826241A (en) | 1994-09-16 | 1998-10-20 | First Virtual Holdings Incorporated | Computerized system for making payments and authenticating transactions over the internet |
| JP2809341B2 (ja) * | 1994-11-18 | 1998-10-08 | 松下電器産業株式会社 | 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。 |
| US5642502A (en) * | 1994-12-06 | 1997-06-24 | University Of Central Florida | Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text |
| US5918240A (en) * | 1995-06-28 | 1999-06-29 | Xerox Corporation | Automatic method of extracting summarization using feature probabilities |
| US5778397A (en) * | 1995-06-28 | 1998-07-07 | Xerox Corporation | Automatic method of generating feature probabilities for automatic extracting summarization |
| US5850476A (en) * | 1995-12-14 | 1998-12-15 | Xerox Corporation | Automatic method of identifying drop words in a document image without performing character recognition |
| US5848191A (en) * | 1995-12-14 | 1998-12-08 | Xerox Corporation | Automatic method of generating thematic summaries from a document image without performing character recognition |
| US5892842A (en) * | 1995-12-14 | 1999-04-06 | Xerox Corporation | Automatic method of identifying sentence boundaries in a document image |
| US5794233A (en) * | 1996-04-09 | 1998-08-11 | Rubinstein; Seymour I. | Browse by prompted keyword phrases |
| US5918236A (en) * | 1996-06-28 | 1999-06-29 | Oracle Corporation | Point of view gists and generic gists in a document browsing system |
| US6085201A (en) * | 1996-06-28 | 2000-07-04 | Intel Corporation | Context-sensitive template engine |
| US5884266A (en) * | 1997-04-02 | 1999-03-16 | Motorola, Inc. | Audio interface for document based information resource navigation and method therefor |
| JP3001047B2 (ja) * | 1997-04-17 | 2000-01-17 | 日本電気株式会社 | 文書要約装置 |
| US5963969A (en) * | 1997-05-08 | 1999-10-05 | William A. Tidwell | Document abstraction system and method thereof |
| US6353824B1 (en) * | 1997-11-18 | 2002-03-05 | Apple Computer, Inc. | Method for dynamic presentation of the contents topically rich capsule overviews corresponding to the plurality of documents, resolving co-referentiality in document segments |
| US6533822B2 (en) * | 1998-01-30 | 2003-03-18 | Xerox Corporation | Creating summaries along with indicators, and automatically positioned tabs |
| US7447626B2 (en) * | 1998-09-28 | 2008-11-04 | Udico Holdings | Method and apparatus for generating a language independent document abstract |
| US6104990A (en) * | 1998-09-28 | 2000-08-15 | Prompt Software, Inc. | Language independent phrase extraction |
| US6768996B1 (en) * | 1998-10-08 | 2004-07-27 | Hewlett-Packard Development Company, L.P. | System and method for retrieving an abstracted portion of a file without regard to the operating system of the current host computer |
| US6317708B1 (en) | 1999-01-07 | 2001-11-13 | Justsystem Corporation | Method for producing summaries of text document |
| US7366711B1 (en) | 1999-02-19 | 2008-04-29 | The Trustees Of Columbia University In The City Of New York | Multi-document summarization system and method |
| HK1045391A1 (zh) * | 1999-02-19 | 2002-11-22 | The Trustees Of Columbia University In The City Of New York | 多文件概要方法和系统 |
| US7162413B1 (en) * | 1999-07-09 | 2007-01-09 | International Business Machines Corporation | Rule induction for summarizing documents in a classified document collection |
| US7475334B1 (en) * | 2000-01-19 | 2009-01-06 | Alcatel-Lucent Usa Inc. | Method and system for abstracting electronic documents |
| US7499875B1 (en) | 2000-03-17 | 2009-03-03 | Ebay Inc. | Method and apparatus for facilitating online payment transactions in a network-based transaction facility using multiple payment instruments |
| WO2001071452A2 (en) * | 2000-03-17 | 2001-09-27 | Ebay, Inc. | Method and apparatus for facilitating online payment transactions in a network-based transaction facility using multiple payment instruments |
| US8706618B2 (en) | 2005-09-29 | 2014-04-22 | Ebay Inc. | Release of funds based on criteria |
| US6581057B1 (en) | 2000-05-09 | 2003-06-17 | Justsystem Corporation | Method and apparatus for rapidly producing document summaries and document browsing aids |
| US6941513B2 (en) | 2000-06-15 | 2005-09-06 | Cognisphere, Inc. | System and method for text structuring and text generation |
| JP2002283301A (ja) * | 2001-03-26 | 2002-10-03 | Makita Corp | 際切りマルノコ |
| WO2002095728A1 (en) * | 2001-05-18 | 2002-11-28 | Tae-Soo Yoon | Portable voice/letter processing apparatus |
| US6996705B2 (en) * | 2001-11-21 | 2006-02-07 | Lenovo (Singapore) Pte. Ltd. | Method and system for configuring the language of the BIOS in a computer system |
| US7587381B1 (en) * | 2002-01-25 | 2009-09-08 | Sphere Source, Inc. | Method for extracting a compact representation of the topical content of an electronic text |
| JP3624186B2 (ja) * | 2002-03-15 | 2005-03-02 | Tdk株式会社 | スイッチング電源装置用の制御回路及びこれを用いたスイッチング電源装置 |
| WO2004025490A1 (en) * | 2002-09-16 | 2004-03-25 | The Trustees Of Columbia University In The City Of New York | System and method for document collection, grouping and summarization |
| WO2004081813A1 (ja) * | 2003-03-14 | 2004-09-23 | Fujitsu Limited | 翻訳支援装置 |
| US20050106539A1 (en) * | 2003-11-17 | 2005-05-19 | International Business Machines Corporation | Self-configuring keyword derivation |
| US8868670B2 (en) * | 2004-04-27 | 2014-10-21 | Avaya Inc. | Method and apparatus for summarizing one or more text messages using indicative summaries |
| US20060136824A1 (en) * | 2004-11-12 | 2006-06-22 | Bo-In Lin | Process official and business documents in several languages for different national institutions |
| US20090228817A1 (en) * | 2008-03-10 | 2009-09-10 | Randy Adams | Systems and methods for displaying a search result |
| US20090228811A1 (en) * | 2008-03-10 | 2009-09-10 | Randy Adams | Systems and methods for processing a plurality of documents |
| JP2009277183A (ja) * | 2008-05-19 | 2009-11-26 | Hitachi Ltd | 情報識別装置及び情報識別システム |
| US8219397B2 (en) * | 2008-06-10 | 2012-07-10 | Nuance Communications, Inc. | Data processing system for autonomously building speech identification and tagging data |
| US8874529B2 (en) * | 2009-03-16 | 2014-10-28 | Bert A. Silich | User-determinable method and system for manipulating and displaying textual and graphical information |
| CN106021404B (zh) * | 2016-05-12 | 2019-09-03 | 北京北大英华科技有限公司 | 检索方法 |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4358824A (en) * | 1979-12-28 | 1982-11-09 | International Business Machines Corporation | Office correspondence storage and retrieval system |
| JPS5840684A (ja) * | 1981-09-04 | 1983-03-09 | Hitachi Ltd | 自然言語間の自動翻訳方式 |
| JPS61117658A (ja) * | 1984-11-13 | 1986-06-05 | Fujitsu Ltd | 文章抄録装置 |
| JPH0797373B2 (ja) * | 1985-08-23 | 1995-10-18 | 株式会社日立製作所 | 文書フアイリングシステム |
| JP2793590B2 (ja) * | 1988-02-24 | 1998-09-03 | キヤノン株式会社 | 情報処理方法 |
| JPH01320567A (ja) * | 1988-06-23 | 1989-12-26 | Hitachi Ltd | 文章作成装置 |
| JP2783558B2 (ja) * | 1988-09-30 | 1998-08-06 | 株式会社東芝 | 要約生成方法および要約生成装置 |
| JPH02112068A (ja) * | 1988-10-21 | 1990-04-24 | Hitachi Ltd | テキスト簡略表示方式 |
| US5099426A (en) * | 1989-01-19 | 1992-03-24 | International Business Machines Corporation | Method for use of morphological information to cross reference keywords used for information retrieval |
| US5153831A (en) * | 1990-05-29 | 1992-10-06 | Franklin Electronic Publishers, Incorporated | Electronic text |
-
1990
- 1990-05-11 JP JP2122411A patent/JPH0418673A/ja active Pending
-
1991
- 1991-05-06 US US07/696,365 patent/US5297027A/en not_active Expired - Fee Related
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH1040267A (ja) * | 1996-07-26 | 1998-02-13 | Nec Corp | 文書要約ビューア |
| JPH10222520A (ja) * | 1997-01-31 | 1998-08-21 | Toshiba Corp | 電子化文書処理装置 |
| US6742163B1 (en) | 1997-01-31 | 2004-05-25 | Kabushiki Kaisha Toshiba | Displaying multiple document abstracts in a single hyperlinked abstract, and their modified source documents |
| US7065708B2 (en) | 1997-01-31 | 2006-06-20 | Kabushiki Kaisha Toshiba | Displaying multiple ranked document abstracts in a single hyperlinked abstract, and their modified source documents |
| CN110287489A (zh) * | 2019-06-24 | 2019-09-27 | 北京大米科技有限公司 | 文本生成方法、装置、存储介质和电子设备 |
| CN110287489B (zh) * | 2019-06-24 | 2023-07-28 | 北京大米科技有限公司 | 文本生成方法、装置、存储介质和电子设备 |
Also Published As
| Publication number | Publication date |
|---|---|
| US5297027A (en) | 1994-03-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0418673A (ja) | テキスト情報抽出方法および装置 | |
| JP3691844B2 (ja) | 文書処理方法 | |
| US5794177A (en) | Method and apparatus for morphological analysis and generation of natural language text | |
| US6662152B2 (en) | Information retrieval apparatus and information retrieval method | |
| US6876998B2 (en) | Method for cross-linguistic document retrieval | |
| US5523945A (en) | Related information presentation method in document processing system | |
| JPH06309362A (ja) | 情報検索方法 | |
| US6620207B1 (en) | Method and apparatus for processing chinese teletext | |
| JPH0944523A (ja) | 関連語提示装置 | |
| JP3380034B2 (ja) | 辞書編集装置 | |
| JP3222193B2 (ja) | 情報検索装置 | |
| JPH07134720A (ja) | 文章作成システムにおける関連情報提示方法及び装置 | |
| JP2785692B2 (ja) | 辞書検索表示装置 | |
| JP3710463B2 (ja) | 翻訳支援辞書装置 | |
| JPH02253474A (ja) | テキストベース検索方法 | |
| JPH10340271A (ja) | 文書抄録作成装置及び文書抄録作成プログラムを記録した記憶媒体 | |
| JPH09305626A (ja) | 検索文書作成装置、検索文書記憶メディア、文書検索装置及び文書検索方法 | |
| JPH05181912A (ja) | 文書検索装置 | |
| JPH0969087A (ja) | 文書作成装置及び文書作成方法 | |
| JPH05257980A (ja) | 文書検索装置 | |
| JP2893239B2 (ja) | 翻訳支援辞書検索表示システム | |
| JPH04281558A (ja) | 文書検索方法および装置 | |
| JP2003263458A (ja) | テキスト分析方法及び装置 | |
| JPH0785040A (ja) | 表記不統一検出方法およびかな漢字変換方法 | |
| JPH01228058A (ja) | かな漢字変換装置 |