JP2004272831A - キーワード抽出装置、プログラム、及び記録媒体 - Google Patents

キーワード抽出装置、プログラム、及び記録媒体 Download PDF

Info

Publication number
JP2004272831A
JP2004272831A JP2003066159A JP2003066159A JP2004272831A JP 2004272831 A JP2004272831 A JP 2004272831A JP 2003066159 A JP2003066159 A JP 2003066159A JP 2003066159 A JP2003066159 A JP 2003066159A JP 2004272831 A JP2004272831 A JP 2004272831A
Authority
JP
Japan
Prior art keywords
keyword
keyword candidate
extraction
document
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003066159A
Other languages
English (en)
Inventor
Shiro Ikegami
史郎 池上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003066159A priority Critical patent/JP2004272831A/ja
Publication of JP2004272831A publication Critical patent/JP2004272831A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】電子化された文書中からキーワードを抽出するキーワード抽出装置において、文書の記述形式によらず、キーワードを抽出できるようにする。
【解決手段】キーワード抽出装置10は、電子化された文書を入力するための電子文書入力手段10aと、入力した電子文書からキーワード候補を抽出するキーワード候補抽出手段10bと、抽出したキーワード候補を評価して該キーワード候補に対してランク付けするキーワード候補評価手段10cとを有する。キーワード候補抽出手段10bは、複数の異なる文書記述形式に対応した抽出ルールファイル10b,10b,10bを有し、電子文書入力手段10aにより入力した文書の記述形式に応じて抽出ルールファイル10b,10b,10bのいずれかを選択し、選択した抽出ルールファイルの抽出ルールに基づいてキーワード候補を抽出する。
【選択図】 図2

Description

【0001】
【発明の属する技術分野】
本発明は、キーワード抽出装置、プログラム、及び記録媒体、より詳細には、電子化された文書中からキーワードを抽出するためのキーワード抽出装置、プログラム、及び記録媒体に関する。
【0002】
【従来の技術】
従来のキーワード抽出装置で対象としている文書は、特定の文書形式、特定の母国語によるものであった。しかし近年、インターネットの普及により文書データベースの多言語化が進み、複数の言語を使用する人も多くなってきている。さらにインターネット上に掲載する文書の記述形式も多様化し、HTMLの他、XML、XHTMLだけではなくプレゼンテーションや報告書などの文書形式も多く見られる。
ところが1つの母国語を対象にしたキーワード抽出では多言語には対応できずまた、文書の記述形式が異なれば1つの文書形式を利用した抽出ルールでは対応できないという問題があった。
【0003】
従来の例として、キーワード自動抽出装置において、キーワードの評価ルールを最適化しつつ、保存する方式を採用したものが開示されているが、他の言語文書、記述形式の異なる文書には対応できない(例えば、特許文献1参照)。
また、キーワード抽出方法及び装置において、単語抽出後、品詞と意味解析を用いてキーワードを抽出するようにしたものが開示されているが、やはり他の言語文書、記述形式の異なる文書には対応できない(例えば、特許文献2)。
また、キーワード抽出ルール生成方法において、非構造化文書を構造化文書へ変換する際に用いる、論理構造を表すキーワードを抽出するための抽出ルールの生成方法が開示されているが、特定構造の文書にしか対応できず、様々な文書形式には対応できない(例えば、特許文献3参照)。
【0004】
【特許文献1】
特開平7−65018号公報
【特許文献2】
特開平11−250097号公報
【特許文献3】
特開平10−21249号公報
【0005】
【発明が解決しようとする課題】
本発明は、上述のごとき実情に鑑みてなされたものであり、電子化された文書中からキーワードを抽出するキーワード抽出装置において、文書の記述形式、文書に記述されている言語の種類によらず、キーワードを抽出可能とするキーワード抽出装置、プログラム、及び記録媒体を提供すること、を目的としてなされたものである。
【0006】
【課題を解決するための手段】
請求項1の発明は、電子化された文書を入力するための電子文書入力手段と、該入力した電子文書からキーワード候補を抽出するキーワード候補抽出手段と、該抽出したキーワード候補を評価し、該評価したキーワード候補に対してランク付けするキーワード候補評価手段とを有するキーワード抽出装置において、前記キーワード候補抽出手段は、複数の異なる文書記述形式に対応した抽出ルールファイルを有し、前記電子文書入力手段により入力した文書の記述形式に応じて抽出ルールファイルを選択し、該選択した抽出ルールファイルの抽出ルールに基づいてキーワード候補を抽出することを特徴としたものである。
【0007】
請求項2の発明は、請求項1の発明において、前記キーワード候補評価手段は、複数の異なる文書記述形式に対応した評価ルールファイルを有し、前記キーワード候補抽出手段により抽出したキーワード候補の抽出ルールに従って評価ルールファイルを選択し、該選択した評価ルールファイルの評価ルールに基づいて前記キーワード候補を評価することを特徴としたものである。
【0008】
請求項3の発明は、請求項1又は2の発明において、前記電子文書入力手段は、前記キーワード候補抽出手段に入力する文書の記述形式を指定できるようにしたことを特徴としたものである。
【0009】
請求項4の発明は、電子化された文書を入力するための電子文書入力手段と、該入力した電子文書からキーワード候補を抽出するキーワード候補抽出手段と、該抽出したキーワード候補を評価し、該評価したキーワード候補に対してランク付けするキーワード候補評価手段とを有するキーワード抽出装置において、複数の異なる言語毎に前記キーワード候補抽出手段を有し、前記電子文書入力手段により入力した文書の記述言語に応じてキーワード候補抽出手段を選択し、該選択したキーワード候補抽出手段は、前記記述言語に基づいてキーワード候補を抽出することを特徴としたものである。
【0010】
請求項5の発明は、請求項4の発明において、前記キーワード候補評価手段は、複数の異なる言語に対応した評価ルールファイルを有し、前記キーワード候補抽出手段により抽出したキーワード候補の記述言語に従って評価ルールファイルを選択し、該選択した評価ルールファイルの評価ルールに基づいて前記キーワード候補を評価することを特徴としたものである。
【0011】
請求項6の発明は、請求項4又は5の発明において、前記電子文書入力手段は、前記キーワード候補抽出手段に入力する文書の記述言語を指定できるようにしたことを特徴としたものである。
【0012】
請求項7の発明は、請求項1乃至6のいずれか1の発明において、前記キーワード候補評価手段は、前記キーワード候補抽出手段により抽出したキーワード候補毎に文書中での出現頻度を計数し、該計数した出現頻度に基づいてキーワード候補にランク付けすることを特徴としたものである。
【0013】
請求項8の発明は、請求項1乃至7のいずれか1に記載のキーワード抽出装置としての機能をコンピュータに実行させるためのプログラムである。
【0014】
請求項9の発明は、請求項8に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
【0015】
【発明の実施の形態】
図1は、本発明の一実施形態であるキーワード抽出装置の構成例を示す図で、図中、10はキーワード抽出装置で、該キーワード抽出装置10は、検索結果やその他の情報を表示するための表示装置11,各種情報を入力するための入力装置12,コンピュータ装置13を有している。このコンピュータ装置13は、図示しない文書DBが接続され、表示装置11及び入力装置12と接続されている。
【0016】
図1において、表示装置11はCRTを代表例として図示しているが、このCRT以外にもLCDなどのディスプレイでもよく、入力装置12はキーボードを代表例として図示しているが、マウスや、各種記録媒体読取装置,他の機器から入力するための入力手段も含むものとする。コンピュータ装置13はプログラム等を記録するためのROMやHDD等の記憶装置、その記憶装置に記憶したプログラムを実行するためのCPU、及びその実行領域としてのRAMを主要な構成要素とし、これらの構成要素がバスにより接続されているものとする。
【0017】
ここで、コンピュータ装置13内の記憶装置には本発明のキーワード抽出装置10としての機能をプログラム化したモジュールが格納されており、このプログラムはコンピュータ装置13により動作できる環境にある。
【0018】
図2は、本発明のキーワード抽出装置10の内部構成例を説明するための図で、キーワード抽出装置10は、電子文書入力手段10a,キーワード候補抽出手段10b,キーワード候補評価手段10cを有し、10dはキーワード抽出装置10により抽出したキーワードで表示装置11に表示される。キーワード候補抽出手段10bは、textファイル用キーワード候補抽出ルールファイル10b,htmlファイル用キーワード候補抽出ルールファイル10b,xmlファイル用キーワード候補抽出ルールファイル10bを有し、キーワード候補評価手段10cは、textファイル用キーワード候補評価ルールファイル10c,htmlファイル用キーワード候補評価ルールファイル10c,xmlファイル用キーワード候補評価ルールファイル10cを有している。但し、本発明のキーワード抽出装置10に適用可能な文書形式は、上記に限定されるものでなく、電子文書の記述形式に対応するルールファイルを設定しておくことで、さまざまな文書形式に対応することができる。
【0019】
図2において、電子文書入力手段10aにはキーワード候補抽出手段10b、キーワード候補評価手段10cが接続されている。
電子文書入力手段10aは、例えば、電子文書の記述形態としてプレーンなテキストファイルを示すtext形式、HTMLファイルであることを示すhtml形式、XMLファイルであることを示すxml形式などを指定することができる。この際、文書の記述形式の指定は、キーワード抽出装置10(電子文書入力手段10a)において自動認識するようにしてもよく、また、ユーザがマニュアル入力で指定するようにしてもよい。
キーワード候補抽出手段10bは、textファイル用キーワード候補抽出ルールファイル10b、htmlファイル用キーワード候補抽出ルールファイル10b、xmlファイル用キーワード候補抽出ルールファイル10bが接続されており、電子文書入力手段10aから入力された文書形式により使用するルールファイルを選択的に切り替えることが出来る。
キーワード候補評価手段10cは、textファイル用キーワード候補評価ルールファイル10c、htmlファイル用キーワード候補評価ルールファイル10c、xmlファイル用キーワード候補評価ルールファイル10cが接続されており、電子文書入力手段10aで指定された文書形式により使用するルールファイルを選択的に切り替えることが出来る。
【0020】
以上のような構成のキーワード抽出装置10において、図3に示す電子文書14に基づいて説明する。
電子文書14の文書形式を、例えばtextとした場合、キーワード候補抽出手段10bは、text文書に応じたtextファイル用キーワード候補抽出ルールファイル10bを読込む。textファイル用キーワード候補抽出ルールファイル10bは、図4に示すような抽出ルール記述ファイル15を有し、この抽出ルール記述ファイル15にはpickupルールコマンドが書かれており、そのパラメータとして、”名詞、サ変名詞”が記述されている。
【0021】
図5は、キーワード候補抽出手段10bによる処理の一例を説明するためのフロー図である。まず、キーワード候補抽出手段10bは、電子文書入力手段10aから入力された文書を形態素解析し、各形態素に品詞付けを行う(ステップS1)。その後、図4に示したpickupルールの指定により連続した一般名詞、サ変名詞の形態素をキーワード候補として抽出する(ステップS2)。
ここで、図3に示した電子文書14において連続した一般名詞、サ変名詞を抽出すると図6に示すようなキーワード候補16が抽出され、キーワード候補抽出手段10bは、上記処理によって抽出されたキーワード候補16をキーワード候補評価手段10cに渡す。
【0022】
キーワード候補評価手段10cにおいて、指定された文書形式であるtextファイル用キーワード候補評価ルールファイル10cを読み込む。textファイル用キーワード候補評価ルールファイル10cは、図7に示すような評価ルール記述ファイル17を有し、この評価ルール記述ファイル17にはCountコマンド、Maxコマンドが記述されており、Maxコマンドのパラメータとして「3」が指定されている。
【0023】
図8は、キーワード候補評価手段10cによる処理の一例を説明するためのフロー図である。まず、キーワード候補評価手段10cは、図7に示したCountコマンドに従って、キーワード候補16に記述されたキーワード候補毎に出現回数を計算する(ステップS11)。そのキーワード候補16に対する計算結果18を図9に示す。次に、Maxコマンドに従って、キーワード候補16の中で出現回数の多いものから順に3つ選択する(ステップS12)。そして、この選択されたキーワードを指定文書のキーワードとして決定し、表示装置11に表示する。尚、上記ステップS12においてキーワード候補16から選択するキーワードの数は任意に設定することができる。
【0024】
本発明によると、文書形式に応じてキーワード抽出ルール、キーワード評価ルールを選択することによって、文書形式に対応した最適な条件で対象文書よりキーワードを抽出することができる。
【0025】
図10は、本発明のキーワード抽出装置の他の内部構成例を説明するための図で、20はキーワード抽出装置で、該キーワード抽出装置20は、電子文書入力手段20a,言語切替手段20b,キーワード候補評価手段20cを有し、20dはキーワード抽出装置20により抽出したキーワードである。言語切替手段20bは、日本語用キーワード候補抽出手段20b,英語用キーワード候補抽出手段20b,フランス語用キーワード候補抽出手段20bに接続され、キーワード候補評価手段20cは、日本語用キーワード候補評価ルールファイル20c,英語用キーワード候補評価ルールファイル20c,フランス語用キーワード候補評価ルールファイル20cを有している。但し、本発明のキーワード抽出装置20に適用可能な言語の種類は、上記に限定されるものでなく、電子文書の記述言語に対応するキーワード候補抽出手段を設定しておくことで、さまざまな言語に対応することができる。
【0026】
図10において、電子文書入力手段20aには言語切替手段20b、キーワード候補評価手段20cが接続されている。キーワード候補評価手段20cは、前記した文書形式を指定することができる。電子文書入力手段20aは、電子文書に記述されている言語として、例えば、日本語、英語、フランス語などを入力することができる。言語切替手段20bは、日本語用キーワード候補抽出手段20b、英語用キーワード候補抽出手段20b、フランス語用キーワード候補抽出手段20bが接続されており、電子文書入力手段20aから入力された言語により使用するキーワード候補抽出手段(20b,20b,20b)を選択的に切り替えることが出来る。さらに、キーワード候補評価手段20cは、日本語用キーワード候補評価ルールファイル20c、英語用キーワード候補評価ルールファイル20c、フランス語用キーワード候補評価ルールファイル20cが接続されており、電子文書入力手段20aから入力された言語により使用する評価ルールファイルを選択的に切り替えることが出来る。
【0027】
以上のような構成のキーワード抽出装置20において、図3に示した電子文書14に基づいて説明する。
電子文書14の文書形式をtextとし、言語を日本語とした場合、言語切替手段20bは、電子文書入力手段20aから入力された電子文書14を日本語用キーワード候補抽出手段20bに渡す。日本語用キーワード候補抽出手段20bは、図4に示した抽出ルール記述ファイル15に従って、キーワード候補として図6に示したキーワード候補16を抽出し、言語切替手段20bに返す。キーワード候補16を受け取った言語切替手段20bは、キーワード候補16と、指定言語が日本語であることを示す言語情報とをキーワード候補評価手段20cに入力する。キーワード候補評価手段20cは、上記言語情報に基づいて日本語用キーワード候補評価ルールファイル20cを用いてキーワード候補16を評価する。この際、日本語用キーワード候補評価ルールファイル20cにおいて、図7に示した評価ルール記述ファイル17にCountコマンドとMaxコマンドが記述されており、Maxコマンドのパラメータとして「3」が指定されている。
【0028】
図10に示すキーワード候補評価手段20cの処理フローは、図8に示した処理フローと同様であり、すなわち、キーワード候補評価手段20cは、図7に示したCountコマンドに従って、キーワード候補16に含まれる各キーワード候補の出現回数を計算する(ステップS11)。次に、Maxコマンドに従って出現回数の多いものから順に3つ選択する(ステップS12)。そして、この選択されたキーワード候補を指定文書のキーワードとして決定し、表示装置に表示する。尚、上記ステップS12においてキーワード候補16から選択するキーワードの数は任意に設定することができる。
【0029】
本発明によると、文書に記述されている言語の種類に応じてキーワード候補抽出手段、キーワード評価ルールを選択することによって、各国の言語に対応した最適な条件で対象文書よりキーワードを抽出することができる。
【0030】
以上、本発明のキーワード抽出装置における各機能を中心に各実施形態を説明してきたが、本発明は、キーワード抽出装置における各ステップを実行する方法としても説明したようにキーワード抽出方法としての形態もとることができる。また、この各機能を有するキーワード抽出装置と同様に、コンピュータにキーワード抽出装置として機能させるためのプログラムとしての形態も、また、そのプログラムを記憶した記録媒体としての形態も可能である。
【0031】
本発明によるキーワード抽出の機能を実現するためのプログラムやデータを記憶した記録媒体の実施形態について説明する。記録媒体としては、具体的には、CD―ROM(―R/―RW)、光磁気ディスク、DVD―ROM、FD、フラッシュメモリ、メモリカードや、メモリスティック及びその他各種ROMやRAM等が想定でき、これら記録媒体に上述した本発明の各実施形態のシステムとしての機能をコンピュータに実行させ、キーワード抽出の機能を実現するためのプログラムを記録して流通させることにより、当該機能の実現を容易にする。そしてコンピュータ等の情報処理装置に上記のごとくの記録媒体を装着して情報処理装置によりプログラムを読み出すか、若しくは情報処理装置が備えている記憶媒体に当該プログラムを記憶させておき、必要に応じて読み出すことにより、本発明に関わるキーワード抽出の機能を実行することができる。
【0032】
【発明の効果】
本発明によると、電子化された文書中からキーワードを抽出するキーワード抽出装置において、文書の記述形式や、文書に記述されている言語の種類によらず、キーワードを抽出することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態であるキーワード抽出装置の構成例を示す図である。
【図2】本発明のキーワード抽出装置の内部構成例を説明するための図である。
【図3】電子文書の一例を示す図である。
【図4】抽出ルール記述ファイルの一例を示す図である。
【図5】キーワード候補抽出手段による処理の一例を説明するためのフロー図である。
【図6】キーワード候補の一例を示す図である。
【図7】評価ルール記述ファイルの一例を示す図である。
【図8】キーワード候補評価手段による処理の一例を説明するためのフロー図である。
【図9】キーワード候補に対する計算結果の一例を示す図である。
【図10】本発明のキーワード抽出装置の他の内部構成例を説明するための図である。
【符号の説明】
10,20…キーワード抽出装置、10a,20a…電子文書入力手段、10b…キーワード候補抽出手段、10b…textファイル用キーワード候補抽出ルールファイル、10b…htmlファイル用キーワード候補抽出ルールファイル、10b…xmlファイル用キーワード候補抽出ルールファイル、10c,20c…キーワード候補評価手段、10c…textファイル用キーワード候補評価ルールファイル、10c…htmlファイル用キーワード候補評価ルールファイル、10c…xmlファイル用キーワード候補評価ルールファイル、10d,20d…キーワード、11…表示装置、12…入力装置、13…コンピュータ装置、14…電子文書、15…抽出ルール記述ファイル、16…キーワード候補、17…評価ルール記述ファイル、18…計算結果、20b…言語切替手段、20b…日本語用キーワード候補抽出手段、20b…英語用キーワード候補抽出手段、20b…フランス語用キーワード候補抽出手段、20c…日本語用キーワード候補評価ルールファイル、20c…英語用キーワード候補評価ルールファイル、20c…フランス語用キーワード候補評価ルールファイル。

Claims (9)

  1. 電子化された文書を入力するための電子文書入力手段と、該入力した電子文書からキーワード候補を抽出するキーワード候補抽出手段と、該抽出したキーワード候補を評価し、該評価したキーワード候補に対してランク付けするキーワード候補評価手段とを有するキーワード抽出装置において、前記キーワード候補抽出手段は、複数の異なる文書記述形式に対応した抽出ルールファイルを有し、前記電子文書入力手段により入力した文書の記述形式に応じて抽出ルールファイルを選択し、該選択した抽出ルールファイルの抽出ルールに基づいてキーワード候補を抽出することを特徴とするキーワード抽出装置。
  2. 前記キーワード候補評価手段は、複数の異なる文書記述形式に対応した評価ルールファイルを有し、前記キーワード候補抽出手段により抽出したキーワード候補の抽出ルールに従って評価ルールファイルを選択し、該選択した評価ルールファイルの評価ルールに基づいて前記キーワード候補を評価することを特徴とする請求項1に記載のキーワード抽出装置。
  3. 前記電子文書入力手段は、前記キーワード候補抽出手段に入力する文書の記述形式を指定できるようにしたことを特徴とする請求項1又は2に記載のキーワード抽出装置。
  4. 電子化された文書を入力するための電子文書入力手段と、該入力した電子文書からキーワード候補を抽出するキーワード候補抽出手段と、該抽出したキーワード候補を評価し、該評価したキーワード候補に対してランク付けするキーワード候補評価手段とを有するキーワード抽出装置において、複数の異なる言語毎に前記キーワード候補抽出手段を有し、前記電子文書入力手段により入力した文書の記述言語に応じてキーワード候補抽出手段を選択し、該選択したキーワード候補抽出手段は、前記記述言語に基づいてキーワード候補を抽出することを特徴とするキーワード抽出装置。
  5. 前記キーワード候補評価手段は、複数の異なる言語に対応した評価ルールファイルを有し、前記キーワード候補抽出手段により抽出したキーワード候補の記述言語に従って評価ルールファイルを選択し、該選択した評価ルールファイルの評価ルールに基づいて前記キーワード候補を評価することを特徴とする請求項4に記載のキーワード抽出装置。
  6. 前記電子文書入力手段は、前記キーワード候補抽出手段に入力する文書の記述言語を指定できるようにしたことを特徴とする請求項4又は5に記載のキーワード抽出装置。
  7. 前記キーワード候補評価手段は、前記キーワード候補抽出手段により抽出したキーワード候補毎に文書中での出現頻度を計数し、該計数した出現頻度に基づいてキーワード候補にランク付けすることを特徴とする請求項1乃至6のいずれか1に記載のキーワード抽出装置。
  8. 請求項1乃至7のいずれか1に記載のキーワード抽出装置としての機能をコンピュータに実行させるためのプログラム。
  9. 請求項8に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2003066159A 2003-03-12 2003-03-12 キーワード抽出装置、プログラム、及び記録媒体 Pending JP2004272831A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003066159A JP2004272831A (ja) 2003-03-12 2003-03-12 キーワード抽出装置、プログラム、及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003066159A JP2004272831A (ja) 2003-03-12 2003-03-12 キーワード抽出装置、プログラム、及び記録媒体

Publications (1)

Publication Number Publication Date
JP2004272831A true JP2004272831A (ja) 2004-09-30

Family

ID=33126955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003066159A Pending JP2004272831A (ja) 2003-03-12 2003-03-12 キーワード抽出装置、プログラム、及び記録媒体

Country Status (1)

Country Link
JP (1) JP2004272831A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006085565A1 (ja) * 2005-02-08 2006-08-17 Nippon Telegraph And Telephone Corporation 情報通信端末、情報通信システム、情報通信方法、情報通信プログラムおよびそれを記録した記録媒体
JP2014096164A (ja) * 2010-12-30 2014-05-22 Facebook Inc グラフ・データのコンポジットタームインデックス方法、コンピュータ可読媒体、およびシステム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006085565A1 (ja) * 2005-02-08 2006-08-17 Nippon Telegraph And Telephone Corporation 情報通信端末、情報通信システム、情報通信方法、情報通信プログラムおよびそれを記録した記録媒体
US8126712B2 (en) 2005-02-08 2012-02-28 Nippon Telegraph And Telephone Corporation Information communication terminal, information communication system, information communication method, and storage medium for storing an information communication program thereof for recognizing speech information
JP2014096164A (ja) * 2010-12-30 2014-05-22 Facebook Inc グラフ・データのコンポジットタームインデックス方法、コンピュータ可読媒体、およびシステム
US9576060B2 (en) 2010-12-30 2017-02-21 Facebook, Inc. Composite term index for graph data

Similar Documents

Publication Publication Date Title
JP3429184B2 (ja) テキスト構造解析装置および抄録装置、並びにプログラム記録媒体
KR100682897B1 (ko) 사전 업데이트 방법 및 그 장치
JP5161658B2 (ja) キーワード入力支援装置、キーワード入力支援方法及びプログラム
US20040098385A1 (en) Method for indentifying term importance to sample text using reference text
US8782049B2 (en) Keyword presenting device
CN101526938A (zh) 文档处理装置
US7359896B2 (en) Information retrieving system, information retrieving method, and information retrieving program
US7827029B2 (en) Systems and methods for user-interest sensitive note-taking
JP2957875B2 (ja) 文書情報検索装置及び文書検索結果表示方法
JP5056133B2 (ja) 情報抽出システム、情報抽出方法および情報抽出用プログラム
US7801723B2 (en) Systems and methods for user-interest sensitive condensation
JP5447368B2 (ja) 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム
JP2004334382A (ja) 構造化文書要約装置、プログラムおよび記録媒体
JP4401269B2 (ja) 対訳判断装置及びプログラム
JP2004272831A (ja) キーワード抽出装置、プログラム、及び記録媒体
JP3851712B2 (ja) 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4756764B2 (ja) プログラム及び情報処理装置並びに情報処理方法
JP2009271796A (ja) 文書データのノイズ除去システム
JP4138048B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4010589B2 (ja) 文書検索システムおよび同システムに適用される検索文書提示方法
JP2007011973A (ja) 情報検索装置及び情報検索プログラム
Husák Automatic retrieval of good dictionary examples
JP2000339342A (ja) 文書検索方法および文書検索装置
JP2005258910A (ja) 階層キーワード抽出装置、方法、およびプログラム
JP2003223466A (ja) 特許検索装置、特許検索装置の制御方法、制御プログラムおよび記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050627

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081002

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081007

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081201

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081224