JPH02148265A - 自動索引システム - Google Patents

自動索引システム

Info

Publication number
JPH02148265A
JPH02148265A JP63301036A JP30103688A JPH02148265A JP H02148265 A JPH02148265 A JP H02148265A JP 63301036 A JP63301036 A JP 63301036A JP 30103688 A JP30103688 A JP 30103688A JP H02148265 A JPH02148265 A JP H02148265A
Authority
JP
Japan
Prior art keywords
noun
nouns
word
words
unnecessary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63301036A
Other languages
English (en)
Inventor
Akiko Mikami
三上 明子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63301036A priority Critical patent/JPH02148265A/ja
Publication of JPH02148265A publication Critical patent/JPH02148265A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野〕 本発明は、自動索引システムに関する。
[従来の技術] 従来、自動索引システムにおいては、対象の文章を形8
素解析した後1名詞をすべて取り出し、取り出された名
詞から不要語を取り除くことにより、索引語を抽出して
いた。
[解決すべき課題] 上述した従来のシステムでは、不要語以外の名詞は、す
べて索引語として抽出されるのて、対象の文章に対して
、索引語が多数抽出され、索引語間の重要性の度合を計
る情報に欠けているという問題かあった。
したかって、従来のシステムては、対象の文章の中で、
より重要である名詞のみを取り出すことか出来ないとい
う問題かあった。
本発明は上述した問題点にかんがみてなされたちのて、
より重要である名詞のみを索引語として取り出すことの
てきる自動索引システムの提供を目的とする。
[課題の解決手段コ 上記目的を達成するために本発明の自動索引システムは
、対象の文章を形態素解析して単語データを作成する形
態素解析手段と、この形態素解析手段により得られた単
語データから格助詞を伴なう名詞を取り出して名詞デー
タを作成する名詞抽出手段と、この名詞抽出手段により
得られた名詞データから不要語を取り除いて索引語を抽
出する不要語除去手段とを備えた構成としである。
[実施例] 以下、本発明の一実施例について図面を参照して説明す
る。
第1図は本発明に係る自動索引システムの一実施例の構
成図であるr 本実施例の自動索引システムては、先ず、文章lを、形
態素解析用辞書ファイル2を用いて、形態素解析部3に
おいて、単語に分割し、それぞれの単語に品詞情報を付
与して、単語データ4を作成する。
次に、格助詞取り出しルールファイル5を用いて1名詞
抽出部6において、格助詞を伴なう名詞を抽出し、名詞
データ7を作成する。ここて格助詞を伴なう名詞を抽出
することにより、文章て重要な意味を持つ名詞を取り出
すことか可能となる。
次いて、不要語辞書ファイル8を用いて、不要語除去部
9において1名詞データ7から不要語を除去する。ここ
でいう不要語とは、代名詞等の名詞をいう。
以上の作業により、索引語lOを抽出する。
[発明の効果] 以上説明したように本発明は、自動索引において、対象
の文章を形態素解析する手段と、形態素解析した結果か
ら格助詞を伴なう名詞を取り出す1段と、取り出した名
詞から不要語を取り除く手段とを有しているのて1文章
中の名詞をすべて取り出すのではなく、より重要である
名詞のみを取り出すことか出来るという効果かある。
これにより、対象文章に付与する索引語の語数が限定さ
れている場合、より重要な名詞を索引語として取り出す
ことか可能であるという効果かある。
【図面の簡単な説明】
第1図は本発明に係る自動索引システムの一実施例を示
す構成図である。 ■:文章 2:形態素解析用辞書ファイル 3:形態素解析部 4;単語データ 5:格助詞取り出しルールファイル 6:名詞抽出部 7:名詞データ 8:不要語辞書ファイル 9:不要語除去部 lO:索引語 代理人 弁理士 渡 辺 喜 平 第 図

Claims (1)

    【特許請求の範囲】
  1. 対象の文章を形態素解析して単語データを作成する形態
    素解析手段と、この形態素解析手段により得られた単語
    データから格助詞を伴なう名詞を取り出して名詞データ
    を作成する名詞抽出手段と、この名詞抽出手段により得
    られた名詞データから不要語を取り除いて索引語を抽出
    する不要語除去手段とを備えたことを特徴とする自動索
    引システム。
JP63301036A 1988-11-30 1988-11-30 自動索引システム Pending JPH02148265A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63301036A JPH02148265A (ja) 1988-11-30 1988-11-30 自動索引システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63301036A JPH02148265A (ja) 1988-11-30 1988-11-30 自動索引システム

Publications (1)

Publication Number Publication Date
JPH02148265A true JPH02148265A (ja) 1990-06-07

Family

ID=17892081

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63301036A Pending JPH02148265A (ja) 1988-11-30 1988-11-30 自動索引システム

Country Status (1)

Country Link
JP (1) JPH02148265A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0778182A (ja) * 1993-06-18 1995-03-20 Hitachi Ltd キーワード付与システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0778182A (ja) * 1993-06-18 1995-03-20 Hitachi Ltd キーワード付与システム

Similar Documents

Publication Publication Date Title
US6965857B1 (en) Method and apparatus for deriving information from written text
EP0403660A1 (en) Machine translation system
EP1078322B1 (en) System for creating a dictionary
Biba et al. Boosting text classification through stemming of composite words
Nazih et al. Ibn-ginni: An improved morphological analyzer for arabic
JPH02148265A (ja) 自動索引システム
JP2536633B2 (ja) 複合語抽出装置
Sass The verb argument browser
Hawwari et al. Building an Arabic multiword expressions repository
KR0123238B1 (ko) 어절구조 특성을 이용한 형태소 분석 시스팀 및 분석 방법
JP2812511B2 (ja) キーワード抽出装置
JP2007233446A (ja) 同義語対抽出装置及び同義語対抽出方法
Vernerová et al. To Pay or to Get Paid: Enriching a Valency Lexicon with Diatheses.
JPH0244463A (ja) 機械翻訳システムにおける原文入力方法
JP2893740B2 (ja) 機械翻訳装置
JPH02103662A (ja) 文分割方式
JPH03259376A (ja) 日本語長文分割支援装置
JPH07152778A (ja) 文書検索装置
JPS6151270A (ja) 二語間関係抽出方式
JP3020230B2 (ja) 辞書コンパクト装置および自然言語処理方法
JPS63219074A (ja) 自然言語解析装置
JPS61281367A (ja) 英語解析における名詞句決定方式
JPH0715692B2 (ja) 文脈処理装置
JPS5957373A (ja) インデツクス作成方式
JP4071657B2 (ja) テキスト処理装置