JP2000311170A5 - - Google Patents

Download PDF

Info

Publication number
JP2000311170A5
JP2000311170A5 JP1999119188A JP11918899A JP2000311170A5 JP 2000311170 A5 JP2000311170 A5 JP 2000311170A5 JP 1999119188 A JP1999119188 A JP 1999119188A JP 11918899 A JP11918899 A JP 11918899A JP 2000311170 A5 JP2000311170 A5 JP 2000311170A5
Authority
JP
Japan
Prior art keywords
noun
nouns
text information
dictionary
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1999119188A
Other languages
English (en)
Other versions
JP2000311170A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP11119188A priority Critical patent/JP2000311170A/ja
Priority claimed from JP11119188A external-priority patent/JP2000311170A/ja
Publication of JP2000311170A publication Critical patent/JP2000311170A/ja
Publication of JP2000311170A5 publication Critical patent/JP2000311170A5/ja
Pending legal-status Critical Current

Links

Claims (4)

  1. テキスト文書から名詞を抽出し、抽出した名詞を複数の名詞の上位下位関係が記述された辞書中の名詞と同定するテキスト情報抽出方法であって、
    抽出された第1の名詞、同一綴りであるが上位の名詞が異なる複数の名詞の中の1つである場合に、上記第1の名詞の近傍から抽出される第2の名詞を上記辞書から検索し、上記検索された第2の名詞と上記複数の名詞の関係を用いて上記第1の名詞を上記辞書中の名詞の1つと同定することを特徴とするテキスト情報抽出方法。
  2. 請求項1記載のテキスト情報抽出方法であって、上記検索された第2の名詞の下位の名詞が上記第1の名詞であるという関係を確認することを特徴とするテキスト情報抽出方法。
  3. 請求項1記載のテキスト情報抽出方法であって、上記第2の名詞と上記第1の名詞が共通の名詞を上位の名詞として有することを確認することを特徴とするテキスト情報抽出方法。
  4. 請求項1記載のテキスト情報抽出方法であって、上記辞書に記述される名詞、上記第1の名詞、および上記第2の名詞は地名を表す名詞であることを特徴とするテキスト情報抽出方法。
JP11119188A 1999-04-27 1999-04-27 テキスト情報抽出方法 Pending JP2000311170A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11119188A JP2000311170A (ja) 1999-04-27 1999-04-27 テキスト情報抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11119188A JP2000311170A (ja) 1999-04-27 1999-04-27 テキスト情報抽出方法

Publications (2)

Publication Number Publication Date
JP2000311170A JP2000311170A (ja) 2000-11-07
JP2000311170A5 true JP2000311170A5 (ja) 2005-02-17

Family

ID=14755102

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11119188A Pending JP2000311170A (ja) 1999-04-27 1999-04-27 テキスト情報抽出方法

Country Status (1)

Country Link
JP (1) JP2000311170A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186524B (zh) * 2011-12-30 2016-04-13 高德软件有限公司 一种地名识别方法和装置
JP6304979B2 (ja) * 2013-09-06 2018-04-04 株式会社東芝 知識処理装置、方法およびプログラム
CN111144121B (zh) * 2019-12-27 2021-12-03 北大方正集团有限公司 地名识别方法、装置、电子设备及可读存储介质
CN116070630B (zh) * 2021-11-03 2026-01-09 腾讯科技(深圳)有限公司 文本地域识别方法、装置、计算机可读介质及电子设备

Similar Documents

Publication Publication Date Title
Grefenstette et al. What is a word, what is a sentence?: problems of Tokenisation
CA2373568A1 (en) Method of searching similar document, system for performing the same and program for processing the same
WO2004084099A3 (en) Corpus clustering, confidence refinement, and ranking for geographic text search and information retrieval
WO2005070019A3 (en) Contextual searching
WO2002001407A3 (de) Verfahren zur automatischen recherche
WO2003032171A3 (en) Efficient search for migration and purge candidates
EP1109390A3 (en) System and method for browsing and searching through voicemail using automatic speech recognition
WO2005010691A3 (en) Disambiguation of search phrases using interpretation clusters
SE0002368D0 (sv) Method and system for information extraction
JP2001067362A5 (ja)
JP2002245070A5 (ja)
JP3735336B2 (ja) 文書要約方法及びシステム
Heid A linguistic bootstrapping approach to the extraction of term candidates from German text
EP1492036A3 (en) Database search system
Furiassi et al. The retrieval of false anglicisms in newspaper texts
JP2812509B2 (ja) 専門用語抽出システム
Sinha Stepwise mining of multi-word expressions in Hindi
McEnery et al. A new agenda for corpus linguistics-working with all of the world's languages
WO2001077900A3 (en) Technique for extracting data from structured documents
Romaine Pidgins and creoles
JP2000311170A5 (ja)
JP2002183175A5 (ja)
JPH03105465A (ja) 複合語抽出装置
CN102262617A (zh) 一种书版小样处理方法及装置
JP3709578B2 (ja) 音声規則合成装置および音声規則合成方法