JPH0652221A - 固有名詞の自動抽出方式 - Google Patents

固有名詞の自動抽出方式

Info

Publication number
JPH0652221A
JPH0652221A JP4115816A JP11581692A JPH0652221A JP H0652221 A JPH0652221 A JP H0652221A JP 4115816 A JP4115816 A JP 4115816A JP 11581692 A JP11581692 A JP 11581692A JP H0652221 A JPH0652221 A JP H0652221A
Authority
JP
Japan
Prior art keywords
proper noun
proper
dictionary
noun
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4115816A
Other languages
English (en)
Inventor
Yukari Saitou
由香梨 斎藤
Toshiaki Yoshino
利明 吉野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4115816A priority Critical patent/JPH0652221A/ja
Publication of JPH0652221A publication Critical patent/JPH0652221A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】本発明は自然言語処理システムの固有名詞抽出
方式に関し、固有名詞の抽出と固有名詞辞書拡張の自動
化を目的とする。 【構成】オンライン・テキスト1をアクセスして新規テ
キストを抽出するデータベース・アクセス手段2と、新
規テキストと固有名詞パターン6のマッチングをとり、
固有名詞候補を抽出する固有名詞抽出手段3と、抽出し
た固有名詞候補が既に辞書7に登録されているか否かを
判定する固有名詞判定手段4と、辞書7に未登録と判定
された固有名詞候補を辞書7に登録する固有名詞登録手
段5で構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はデータベース・システム
やエキスパート・システム等の自然言語インタフェー
ス、機械翻訳などの自然言語処理システムに関する。更
に詳しくは、自然言語のなかから固有名詞を自動的に抽
出する固有名詞の自動抽出方式に関する。
【0002】
【従来の技術】近年、エキスパート・システムやデータ
ベース・システムのような質問応答システムにおいて、
質問と応答を自然言語、すなわち、普通の文章によって
行なわせようとする技術の開発が行なわれている。
【0003】自然言語処理においての問題の一つに、固
有名詞の取り扱いがある。一般的に使用される固有名詞
は辞書に登録されてはいるが、固有名詞の種類はどんど
ん増加するものであり、そのような固有名詞は辞書に登
録されていない。その結果、自然言語処理において目的
とする処理がうまくいかなくなる場合がある。
【0004】例えば、処理対象のテキスト中に製品名と
して「OASYS Pocket(登録商標)」という
語が入っていた場合、この語は本来、固有名詞として一
語の扱いをしなければならない。しかし、辞書登録して
いない未登録語であるために、形態素解析時に“OAS
YS(登録商標)”と“Pocket”の二語に分割さ
れてしまい、その後の処理がうまくいかなくなる。例え
ば、“OASYS”を修飾語と解釈し、“OASYS”
のポケットという解釈をする可能性もある。
【0005】従来、このような固有名詞は、人手で見つ
け出し、一つ一つ辞書登録していた。一部に、自動的に
未登録語を抽出し辞書登録する技術が開発されているが
(出願番号S63-186526 )、この技術で抽出できる未登
録語は、学術用語等の特定の書体の文字に限られてお
り、一般的な固有名詞は抽出できない。
【0006】
【発明が解決しようとする課題】従来の方式では、人手
で固有名詞を辞書登録しなければならず、この作業に多
大な労力が必要であるという問題がある。
【0007】本発明は、文章中の固有名詞を自動的に抽
出し、自動的な辞書登録を可能にすることを目的とす
る。
【0008】
【課題を解決するための手段】図1は、本発明の機能ブ
ロック図である。本発明は、データベースやエキスパー
ト・システム、機械翻訳システム等から出力されるオン
ライン・テキスト1を対象とし、該オンライン・テキス
ト1から固有名詞を自動的に抽出し、辞書7に登録する
ことを前提とする。
【0009】まず、データベース・アクセス手段2は、
データベース等のシステムをアクセスし、オンライン・
テキスト1を得る。また、得られたオンライン・テキス
ト1のなかで、既に固有名詞を自動抽出登録する処理を
終えたテキストを除外し、未処理のオンライン・テキス
ト1のみを取り出す。
【0010】次に、固有名詞抽出手段3を有する。固有
名詞抽出手段3は、前記データベース・アクセス手段2
が得た未処理のオンライン・テキスト1を入力とし、固
有名詞の候補を抽出する。このとき、固有名詞パターン
6を使用する。固有名詞パターン6は、固有名詞の特徴
を捕らえたパターンであり、そのパターンとマッチする
語を固有名詞候補とするものである。固有名詞パターン
6は前もって作成しておく。
【0011】固有名詞判定手段4は、前記固有名詞抽出
手段3によって抽出された固有名詞候補について、辞書
7を検索し、未登録であるか否かを判定する。そして、
固有名詞登録手段5は、前記固有名詞判定手段4が未登
録と判定した語を辞書7に固有名詞として登録する。
【0012】
【作用】データベース・アクセス手段2がオンライン・
データベース等にアクセスし、オンライン・テキスト1
を得る。対象がオンライン・データベースである場合に
は、例えば一定時間間隔ごとにアクセスし、オンライン
・テキスト1を得る。そして、該オンライン・テキスト
1のなかで、以前にもアクセスしたことのあるテキスト
を除外し、初めてアクセスしたオンライン・テキスト1
のみを固有名詞抽出手段3に送る。対象が機械翻訳シス
テムやエキスパート・システムの場合には、システムが
出力した、あるいはユーザが入力したテキストをデータ
ベース・アクセス手段2が取り込み、固有名詞抽出手段
3に送る。
【0013】固有名詞抽出手段3は、前もって作成済の
固有名詞パターンと、データベース・アクセス手段2か
ら送られたテキストをマッチングし、マッチする部分を
固有名詞の候補として抽出して固有名詞判定手段4に送
る。
【0014】固有名詞判定手段4は、送られてきた固有
名詞候補が辞書7に登録されているか否かを判断し、未
登録の語を固有名詞登録手段5に送る。既に登録されて
いる固有名詞候補は再度登録する必要はないので捨て
る。
【0015】固有名詞登録手段5は、送られてきた語を
固有名詞として辞書7に登録する。この一連の作用をデ
ータベース・アクセス手段2がオンライン・テキスト1
を得る毎に繰り返すことにより、固有名詞が自動的に抽
出され、固有名詞を登録する辞書7が自動的に拡張され
ていくことになる。
【0016】
【実施例】以下に、本発明の実施例を説明する。システ
ム構成としては、例えば、オンライン・データベースと
通信機能によって接続することが可能なパーソナル・コ
ンピュータやワークステーション上のソフトウエアとし
て実現することができる。また、機械翻訳システムで使
用する場合には、被翻訳対象テキストに対して翻訳の前
処理として実行するソフトウエアとして実現でき、テキ
ストを入力するワークステーション上で、あるいは機械
翻訳システムの前処理ソフトウエアとして実現すること
ができる。
【0017】以下では、オンライン・データベースから
のオンライン・テキスト中の固有名詞を抽出し、辞書登
録する処理を例に実施例を説明する。図2は、一実施例
の動作フローチャートである。
【0018】まず、オンライン・データベースに接続す
る(S1)。この接続は、ユーザのコマンド入力によっ
て行なわれてもよいし、データベース・アクセス手段2
によって一定間隔毎に自動的にワークステーションにロ
グオンして、前もって指定したオンライン・データベー
スに自動的に接続してもよい。
【0019】次に、接続したデータベースから、オンラ
イン・テキスト1を取り込み、そのなかから、初めてア
クセスするテキスト、すなわち、未だ固有名詞自動抽出
登録処理を行なっていないテキストを取り出し、収集す
る(S2)。
【0020】そして、収集した未処理のテキストを対象
に固有名詞の候補を抽出する(S3)。抽出した固有名
詞候補のなかで、辞書に未登録のものを取り出す(S
4)。最後に取り出した未登録の固有名詞を辞書7に登
録する(S5)。
【0021】図3は、オンライン・データベースへの接
続(S1)および未処理データの収集(S2)の処理の
動作フローチャートである。まず、オンライン・データ
ベースに接続する(S31)。この処理は、ユーザのコ
マンド入力によって行なうか、所定の時間に、パーソナ
ル・コンピュータあるいはワークステーションが自動的
にコマンドを発生して自動的に接続する。
【0022】そして、接続したデータベースのなかの取
り出したいデータのキーを選択する(S32)。例え
ば、新製品のニュースを取り出したい場合には「新製
品」等の該当するキーを入力する。このキーは前もって
指定しておき、自動的にデータベース検索することがで
きる。
【0023】この操作により、オンライン・データベー
スは該当するデータを送り返してくる。該当するデータ
が一つもない場合(S33のYes)には何も実行せず
に処理を終了する。データがある場合には(S33のN
o、S34のYes)、該データが既にアクセス済みの
データか否か、すなわち、固有名詞の抽出登録処理を実
行済みが否かを判定する(S35)。データにはそのデ
ータを登録した日時が付けてある。そのデータの登録日
時を参照して処理済のデータの登録日時より古いものは
処理済と判定できる。
【0024】処理済みのデータの場合(Yes)は次の
データの処理(存在するか否かの判定S34と処理済み
のデータの判定S35)を行なう。未処理のデータの場
合には(S35のNo)、該データの内容を取り出して
ファイルに蓄える(S36)。そして、次のデータの処
理(S34〜S36)を該当するデータがなくなるまで
(S34のNo)行なう。該当データがなくなった時点
で、ファイルに蓄えた最新のデータの登録日時を記録す
る(S37)。この登録日時を後の処理済みデータの判
定S35に使用する。
【0025】図3の動作フローチャートに沿って最新の
データを取り出した後、固有名詞を抽出する処理を行な
う。図4は固有名詞抽出処理の動作フローチャートであ
る。
【0026】図3の処理で作成した最新データのファイ
ルにアクセスし、データがあるか否かを判定し(S4
1)、データがある場合(No)にはファイルからデー
タの一文を取り出す(S42)。そして、前もって作成
した固有名詞のパターンとマッチングし、マッチするか
否かを判定する(S43)。固有名詞のパターンおよび
マッチングについては後述する。
【0027】パターンとマッチしない場合(No)には
次のデータの処理(S41)に移る。一方、パターンと
マッチした場合(Yes)には、マッチした部分を蓄え
ておくメモリ部分にアクセスし、そこに既に蓄えてある
語のなかに同一の語があるか否かを判定する(S4
4)。今回マッチした部分が既に取り出したことのある
語である場合には(Yes)、次のデータの処理(S4
1)に移る。一方、まだ取り出したことのなり語である
場合(No)にはマッチする部分をメモリに蓄える(S
45)。ここで、このメモリの内容は、固有名詞抽出処
理(図4の動作フローチャート)を始める前にクリアし
ておく。
【0028】S45の後、次のデータの処理に移る(S
41)。以上の処理(S41〜S45)をデータがなく
なったと判定されるまで(S41のYes)繰り返す。
データがなくなった場合(S41のYes)には処理を
終了する。
【0029】図5は、固有名詞の抽出を行なうパターン
・マッチング処理(図4のS43)の動作フローチャー
トである。まず、S42で取り出した一文に対して単語
に分割する形態素解析処理を行なう(S51)。「Aは
Bを発売した。」という文であれば、A、は、B、を、
発売した、という5つの形態素に分割される。
【0030】次に、パターン・マッチング処理を行なう
(S52)。固有名詞のパターンは、例えば、ルールと
して記述できる。固有名詞のパターンとパターン・マッ
チングの実例については後述する。
【0031】パターンがルールで記述されている場合、
ルールを適用し、ルールが成り立つならばパターンとマ
ッチすると判断され、マッチした部分が固有名詞の候補
となる。ルールが成り立たない場合は固有名詞ではない
と判断する。
【0032】そして、パターンとマッチした場合には、
マッチした部分を取り出す(S53)。取り出した部分
が固有名詞の候補である。以上の処理を図4、図5の動
作フローチャートに沿って全データに対して行なうこと
により、メモリ上に固有名詞候補が蓄積される。
【0033】図6は、固有名詞判定の動作フローチャー
トである。固有名詞判定処理の対象となるのは図4の処
理でメモリ上に蓄えられた固有名詞候補である。まず、
メモリ上に固有名詞候補があるか否かを判定し(S6
1)、ある場合(NO)には固有名詞候補を一つ取り出
す(S62)。そして、固有名詞の辞書を検索し、該固
有名詞候補が登録されているか否かを判定する(S6
3)。登録されている場合(Yes)には、次の固有名
詞候補の処理に移る(S61)。
【0034】一方、登録されていない場合には(S63
のNo)、固有名詞候補にリストアップする処理(S6
4)を行なったうえで次の固有名詞候補の処理に移る
(S61)。
【0035】以上の処理(S61〜S64)を全固有名
詞候補について行なう。メモリ上の全固有名詞候補につ
いて処理を行なったならば(S61のYes)、処理を
終了する。
【0036】次に、固有名詞の辞書への登録を行なう。
図7は辞書登録の動作フローチャートである。辞書登録
すべき固有名詞は図6の処理によって固有名詞リストに
リストアップされている。そこで、この固有名詞リスト
を参照し、一つずつ登録処理を行なう。すなわち、固有
名詞リストに語があるか否か判定し(S71)、ある場
合には(No)、一つ取り出して(S72)、属性を付
加して辞書に登録する(S73)。この処理を固有名詞
リストにリストアップされたすべての語について行な
う。すべての語について処理が完了した(S71のYe
s)ら処理を終了する。
【0037】図7の動作フローチャートによって登録処
理を行なうことにより、抽出された固有名詞が自動的に
辞書登録される。これによって、固有名詞の辞書が自動
的に拡張されていくことになる。
【0038】辞書登録は他にも存在する。図8は、辞書
登録のもう一つの実施例の動作フローチャートである。
まず、図6の処理によって作成された固有名詞リストを
ディスプレイ等に表示し、ユーザに提示する(S8
1)。ここで、ユーザはこのリストを見て、辞書登録を
する語があるか否かを判定し、登録する語がない場合に
は「終了」と入力する。システムは終了と指定されたか
否かを判定し、終了と指定されていない場合には(N
o)、どの語を登録するかの選択情報をユーザに指定さ
せる。そして仕手された語を受け取り(S83)、属性
を付加して辞書に登録する(S84)。登録後、登録を
終了するか否かの判定に戻る(S82)。
【0039】登録する語がないとユーザが判断し、終了
と指定された場合には(S82のYes)処理を終了す
る。以上、図8の動作フローチャートに沿って辞書登録
することにより、ユーザが指定した語のみを固有名詞の
辞書に登録することも可能である。
【0040】図9はオンライン・テキストの例、図10
は固有名詞のパターンの例である。図9に示してあるの
は、新製品ニュースについてのデータベースであり、図
2S2の未処理データの収集処理において3件のデータ
が収集された場合である((1) 、(2) 、(3) )。
【0041】一方、固有名詞のパターンは図10に示す
ようなルールで記述することが可能である。同図では、
3種類のパターンを3つのルール((1) 、(2) 、(3))で
記述している。すなわち、(1) のパターンは、“ある未
登録語「X」の直後に「、」があり、かつ、その後に括
弧付きの未登録語「「Y」」があり、かつ、さらにその
後に「発売」という語があるならば、「X」を会社名の
固有名詞、「「Y」」を商品名の固有名詞とする”とい
うルールで記述される。
【0042】このようなルールは取り出すオンライン・
テキストの特徴に従って作成することが可能である。図
9、図10の例では、対象が新製品ニュースなので、カ
ンマや括弧付きの未登録語、発売、販売、開発といった
語をキーとして固有名詞抽出ルールを作成している。
【0043】図5のルール適用処理S52では、このよ
うなルールが収集されたオンライン・テキストに適用さ
れる。図9(1)のデータに図10のルールを適用する
と、タイトルの「富士通(登録商標)、・・・「OAS
YS 50NF」発売・・」で図10(1)のルールが
成立し、固有名詞候補X=富士通、Y=「OASYS
50NF」が抽出される。そしてこの二つの語がメモリ
上に蓄えられる。そして、次の文「富士通はこのほど・
・・「OASYS 50NF」・・開発」は図10
(3)のルールが成立し、固有名詞候補X=富士通、Y
=「OASYS 50NF」が抽出される。しかし、こ
れらの語は既にメモリ上に蓄えられている語と同じなの
で、図4のS44の処理でメモリ上への格納(S45)
は行なわれない。
【0044】次に、図9(2)のデータに図10のルー
ルが適用される。これによると、タイトルの「富士通、
『OASYS Pocket』・・・発売」で図10
(2)のルールが成立し、固有名詞候補X=富士通、Y
=『OASYS Pocket』が抽出される。ここで
メモリに蓄えられた語が参照され、富士通は既にメモリ
上に蓄えられているので、『OASYS Pocke
t』のみがメモリ上に蓄えられる。以上のような処理を
取り出された全データについて行なうことにより、固有
名詞候補が抽出される。
【0045】
【発明の効果】本発明によって、テキスト中の固有名詞
を自動的に抽出され、辞書に登録することが可能にな
る。これによって、従来必要であった手作業による固有
名詞の登録処理が自動化され、処理効率が向上する。
【図面の簡単な説明】
【図1】本発明の機能ブロック図である。
【図2】一実施例の動作フローチャートである。
【図3】一実施例のデータベース・アクセスの動作フロ
ーチャートである。
【図4】一実施例の固有名詞抽出の動作フローチャート
である。
【図5】一実施例の固有名詞抽出の詳細動作フローチャ
ートである。
【図6】一実施例の固有名詞判定の動作フローチャート
である。
【図7】一実施例の固有名詞登録の動作フローチャート
である。
【図8】固有名詞登録のもう一つの実施例の動作フロー
チャートである。
【図9】オンライン・テキストの例である。
【図10】固有名詞のパターンの説明図である。
【符号の説明】
1 オンライン・テキスト 2 データベース・アクセス手段 3 固有名詞抽出手段 4 固有名詞判定手段 5 固有名詞登録手段 6 固有名詞パターン 7 辞書

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 オンライン・データベースやエキスパー
    ト・システム、機械翻訳システム等の自然言語インタフ
    ェースにおいて、 オンライン・テキスト(1)をアクセスするデータベー
    ス・アクセス手段(2)と、 前もって作成してある固有名詞パターン(6)を参照
    し、前記データベース・アクセス手段(2)がアクセス
    して得たテキストから固有名詞候補を抽出する固有名詞
    抽出手段(3)と、 前記固有名詞抽出手段(3)が抽出した固有名詞候補が
    既に辞書(7)に登録してあるか否かを判定し、未登録
    の固有名詞候補を抽出する固有名詞判定手段(4)と、 前記固有名詞判定手段(4)が抽出した未登録の固有名
    詞候補を辞書(7)に登録する固有名詞登録手段(5)
    とを有することを特徴とする固有名詞の自動抽出方式。
  2. 【請求項2】 請求項1のデータベース・アクセス手段
    (2)は、オンライン・テキスト(1)に一定時間毎に
    アクセスすることを特徴とする固有名詞の自動抽出方
    式。
  3. 【請求項3】 請求項1の固有名詞抽出手段(3)は、
    固有名詞のパターンを利用してオンライン・テキスト
    (1)から固有名詞を抽出することを特徴とする固有名
    詞の自動抽出方式。
  4. 【請求項4】 請求項3記載の固有名詞抽出手段(3)
    が使用するパターンは、オンライン・テキスト(1)の
    特徴を利用して作成することを特徴とする固有名詞の自
    動抽出方式。
JP4115816A 1992-05-08 1992-05-08 固有名詞の自動抽出方式 Withdrawn JPH0652221A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4115816A JPH0652221A (ja) 1992-05-08 1992-05-08 固有名詞の自動抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4115816A JPH0652221A (ja) 1992-05-08 1992-05-08 固有名詞の自動抽出方式

Publications (1)

Publication Number Publication Date
JPH0652221A true JPH0652221A (ja) 1994-02-25

Family

ID=14671816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4115816A Withdrawn JPH0652221A (ja) 1992-05-08 1992-05-08 固有名詞の自動抽出方式

Country Status (1)

Country Link
JP (1) JPH0652221A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001125911A (ja) * 1999-10-27 2001-05-11 Just Syst Corp 個体名の抽出装置、抽出方法、並びに記録媒体
JP2001202381A (ja) * 2000-01-21 2001-07-27 Just Syst Corp 個体名の抽出装置、抽出方法、並びに、記録媒体
JP2001216300A (ja) * 2000-01-31 2001-08-10 Just Syst Corp 個体名の認定装置、認定方法、並びに、記録媒体
JP2002132791A (ja) * 2000-10-24 2002-05-10 Nec Corp 地名情報抽出装置、その抽出方法及び抽出プログラムを記録した記録媒体、地図情報検索装置
US6975766B2 (en) 2000-09-08 2005-12-13 Nec Corporation System, method and program for discriminating named entity
JP2006260402A (ja) * 2005-03-18 2006-09-28 Ricoh Co Ltd 情報処理装置、同義語対生成方法、同義語対生成プログラム、同義語対生成プログラムを記録した記録媒体
JP2009140049A (ja) * 2007-12-04 2009-06-25 Nippon Telegr & Teleph Corp <Ntt> 新規固有表現語彙獲得装置、その方法、プログラム及び記録媒体
JP2010128774A (ja) * 2008-11-27 2010-06-10 Nippon Telegr & Teleph Corp <Ntt> 固有表現抽出装置、その方法およびプログラム
US7761437B2 (en) 2005-06-15 2010-07-20 Panasonic Corporation Named entity extracting apparatus, method, and program
JP2011076642A (ja) * 2011-01-21 2011-04-14 Nec Corp 地名情報抽出装置、制御方法、記録媒体及び地図情報検索装置
JP2011134291A (ja) * 2009-11-30 2011-07-07 Nomura Research Institute Ltd 談話構造解析システムおよび談話構造解析プログラム
JP2014132479A (ja) * 2011-04-28 2014-07-17 Ird Corp データベース構築装置、商標侵害検知装置、データベース構築方法、およびプログラム

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001125911A (ja) * 1999-10-27 2001-05-11 Just Syst Corp 個体名の抽出装置、抽出方法、並びに記録媒体
JP2001202381A (ja) * 2000-01-21 2001-07-27 Just Syst Corp 個体名の抽出装置、抽出方法、並びに、記録媒体
JP2001216300A (ja) * 2000-01-31 2001-08-10 Just Syst Corp 個体名の認定装置、認定方法、並びに、記録媒体
US6975766B2 (en) 2000-09-08 2005-12-13 Nec Corporation System, method and program for discriminating named entity
US7240061B2 (en) 2000-10-24 2007-07-03 Nec Corporation Place name information extraction apparatus and extraction method thereof and storing medium stored extraction programs thereof and map information retrieval apparatus
JP2002132791A (ja) * 2000-10-24 2002-05-10 Nec Corp 地名情報抽出装置、その抽出方法及び抽出プログラムを記録した記録媒体、地図情報検索装置
JP2006260402A (ja) * 2005-03-18 2006-09-28 Ricoh Co Ltd 情報処理装置、同義語対生成方法、同義語対生成プログラム、同義語対生成プログラムを記録した記録媒体
US7761437B2 (en) 2005-06-15 2010-07-20 Panasonic Corporation Named entity extracting apparatus, method, and program
JP2009140049A (ja) * 2007-12-04 2009-06-25 Nippon Telegr & Teleph Corp <Ntt> 新規固有表現語彙獲得装置、その方法、プログラム及び記録媒体
JP2010128774A (ja) * 2008-11-27 2010-06-10 Nippon Telegr & Teleph Corp <Ntt> 固有表現抽出装置、その方法およびプログラム
JP2011134291A (ja) * 2009-11-30 2011-07-07 Nomura Research Institute Ltd 談話構造解析システムおよび談話構造解析プログラム
JP2011076642A (ja) * 2011-01-21 2011-04-14 Nec Corp 地名情報抽出装置、制御方法、記録媒体及び地図情報検索装置
JP2014132479A (ja) * 2011-04-28 2014-07-17 Ird Corp データベース構築装置、商標侵害検知装置、データベース構築方法、およびプログラム

Similar Documents

Publication Publication Date Title
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
JPH0778182A (ja) キーワード付与システム
JPH0567144A (ja) 前編集支援方法およびその装置
JPH0652221A (ja) 固有名詞の自動抽出方式
US20080312908A1 (en) Systems and methods for normalization of linguistic structures
US20050065947A1 (en) Thesaurus maintaining system and method
JP3612769B2 (ja) 情報検索装置および情報検索方法
JPH07182333A (ja) 日本語処理装置
KR100376931B1 (ko) 정보 검색 기술을 이용한 한영번역 데이터베이스 시스템 구축 방법
CN114547255A (zh) 基于人工智能的会话提示方法、装置、存储介质及设备
JPS61248160A (ja) 文書情報登録方式
JPH09101969A (ja) 適合フィードバックを用いた全文検索方法および装置
JPH08314950A (ja) テキストの検索方法及び装置
JP3744136B2 (ja) 訳語選択装置と記憶媒体
WO2022003967A1 (ja) 発話理解支援システム、方法、装置及びプログラム
KR20010095721A (ko) 관련어 검색 방법
JPH02253474A (ja) テキストベース検索方法
JP3210842B2 (ja) 情報処理装置
US20250139153A1 (en) Multi-modal knowledge-based conversation data generation and additional information labeling system
JPH0635971A (ja) 文書検索装置
JPH08263509A (ja) ソフトウェア利用装置
JP2006309377A (ja) 文書検索装置および文書検索方法ならびにそのプログラムと記録媒体
JP2008203997A (ja) 文書検索装置及びプログラム
JP2001337969A (ja) 知識獲得方法、文書情報構造化方法および装置と前記方法を実施するプログラムを記録した記録媒体
JPH10105578A (ja) 点数を利用した類似単語検索方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990803