JPH02148265A - 自動索引システム - Google Patents
自動索引システムInfo
- Publication number
- JPH02148265A JPH02148265A JP63301036A JP30103688A JPH02148265A JP H02148265 A JPH02148265 A JP H02148265A JP 63301036 A JP63301036 A JP 63301036A JP 30103688 A JP30103688 A JP 30103688A JP H02148265 A JPH02148265 A JP H02148265A
- Authority
- JP
- Japan
- Prior art keywords
- noun
- nouns
- word
- words
- unnecessary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野〕
本発明は、自動索引システムに関する。
[従来の技術]
従来、自動索引システムにおいては、対象の文章を形8
素解析した後1名詞をすべて取り出し、取り出された名
詞から不要語を取り除くことにより、索引語を抽出して
いた。
素解析した後1名詞をすべて取り出し、取り出された名
詞から不要語を取り除くことにより、索引語を抽出して
いた。
[解決すべき課題]
上述した従来のシステムでは、不要語以外の名詞は、す
べて索引語として抽出されるのて、対象の文章に対して
、索引語が多数抽出され、索引語間の重要性の度合を計
る情報に欠けているという問題かあった。
べて索引語として抽出されるのて、対象の文章に対して
、索引語が多数抽出され、索引語間の重要性の度合を計
る情報に欠けているという問題かあった。
したかって、従来のシステムては、対象の文章の中で、
より重要である名詞のみを取り出すことか出来ないとい
う問題かあった。
より重要である名詞のみを取り出すことか出来ないとい
う問題かあった。
本発明は上述した問題点にかんがみてなされたちのて、
より重要である名詞のみを索引語として取り出すことの
てきる自動索引システムの提供を目的とする。
より重要である名詞のみを索引語として取り出すことの
てきる自動索引システムの提供を目的とする。
[課題の解決手段コ
上記目的を達成するために本発明の自動索引システムは
、対象の文章を形態素解析して単語データを作成する形
態素解析手段と、この形態素解析手段により得られた単
語データから格助詞を伴なう名詞を取り出して名詞デー
タを作成する名詞抽出手段と、この名詞抽出手段により
得られた名詞データから不要語を取り除いて索引語を抽
出する不要語除去手段とを備えた構成としである。
、対象の文章を形態素解析して単語データを作成する形
態素解析手段と、この形態素解析手段により得られた単
語データから格助詞を伴なう名詞を取り出して名詞デー
タを作成する名詞抽出手段と、この名詞抽出手段により
得られた名詞データから不要語を取り除いて索引語を抽
出する不要語除去手段とを備えた構成としである。
[実施例]
以下、本発明の一実施例について図面を参照して説明す
る。
る。
第1図は本発明に係る自動索引システムの一実施例の構
成図であるr 本実施例の自動索引システムては、先ず、文章lを、形
態素解析用辞書ファイル2を用いて、形態素解析部3に
おいて、単語に分割し、それぞれの単語に品詞情報を付
与して、単語データ4を作成する。
成図であるr 本実施例の自動索引システムては、先ず、文章lを、形
態素解析用辞書ファイル2を用いて、形態素解析部3に
おいて、単語に分割し、それぞれの単語に品詞情報を付
与して、単語データ4を作成する。
次に、格助詞取り出しルールファイル5を用いて1名詞
抽出部6において、格助詞を伴なう名詞を抽出し、名詞
データ7を作成する。ここて格助詞を伴なう名詞を抽出
することにより、文章て重要な意味を持つ名詞を取り出
すことか可能となる。
抽出部6において、格助詞を伴なう名詞を抽出し、名詞
データ7を作成する。ここて格助詞を伴なう名詞を抽出
することにより、文章て重要な意味を持つ名詞を取り出
すことか可能となる。
次いて、不要語辞書ファイル8を用いて、不要語除去部
9において1名詞データ7から不要語を除去する。ここ
でいう不要語とは、代名詞等の名詞をいう。
9において1名詞データ7から不要語を除去する。ここ
でいう不要語とは、代名詞等の名詞をいう。
以上の作業により、索引語lOを抽出する。
[発明の効果]
以上説明したように本発明は、自動索引において、対象
の文章を形態素解析する手段と、形態素解析した結果か
ら格助詞を伴なう名詞を取り出す1段と、取り出した名
詞から不要語を取り除く手段とを有しているのて1文章
中の名詞をすべて取り出すのではなく、より重要である
名詞のみを取り出すことか出来るという効果かある。
の文章を形態素解析する手段と、形態素解析した結果か
ら格助詞を伴なう名詞を取り出す1段と、取り出した名
詞から不要語を取り除く手段とを有しているのて1文章
中の名詞をすべて取り出すのではなく、より重要である
名詞のみを取り出すことか出来るという効果かある。
これにより、対象文章に付与する索引語の語数が限定さ
れている場合、より重要な名詞を索引語として取り出す
ことか可能であるという効果かある。
れている場合、より重要な名詞を索引語として取り出す
ことか可能であるという効果かある。
第1図は本発明に係る自動索引システムの一実施例を示
す構成図である。 ■:文章 2:形態素解析用辞書ファイル 3:形態素解析部 4;単語データ 5:格助詞取り出しルールファイル 6:名詞抽出部 7:名詞データ 8:不要語辞書ファイル 9:不要語除去部 lO:索引語 代理人 弁理士 渡 辺 喜 平 第 図
す構成図である。 ■:文章 2:形態素解析用辞書ファイル 3:形態素解析部 4;単語データ 5:格助詞取り出しルールファイル 6:名詞抽出部 7:名詞データ 8:不要語辞書ファイル 9:不要語除去部 lO:索引語 代理人 弁理士 渡 辺 喜 平 第 図
Claims (1)
- 対象の文章を形態素解析して単語データを作成する形態
素解析手段と、この形態素解析手段により得られた単語
データから格助詞を伴なう名詞を取り出して名詞データ
を作成する名詞抽出手段と、この名詞抽出手段により得
られた名詞データから不要語を取り除いて索引語を抽出
する不要語除去手段とを備えたことを特徴とする自動索
引システム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63301036A JPH02148265A (ja) | 1988-11-30 | 1988-11-30 | 自動索引システム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63301036A JPH02148265A (ja) | 1988-11-30 | 1988-11-30 | 自動索引システム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02148265A true JPH02148265A (ja) | 1990-06-07 |
Family
ID=17892081
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63301036A Pending JPH02148265A (ja) | 1988-11-30 | 1988-11-30 | 自動索引システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02148265A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0778182A (ja) * | 1993-06-18 | 1995-03-20 | Hitachi Ltd | キーワード付与システム |
-
1988
- 1988-11-30 JP JP63301036A patent/JPH02148265A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0778182A (ja) * | 1993-06-18 | 1995-03-20 | Hitachi Ltd | キーワード付与システム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6965857B1 (en) | Method and apparatus for deriving information from written text | |
| EP0403660A1 (en) | Machine translation system | |
| EP1078322B1 (en) | System for creating a dictionary | |
| Biba et al. | Boosting text classification through stemming of composite words | |
| Nazih et al. | Ibn-ginni: An improved morphological analyzer for arabic | |
| JPH02148265A (ja) | 自動索引システム | |
| JP2536633B2 (ja) | 複合語抽出装置 | |
| Sass | The verb argument browser | |
| Hawwari et al. | Building an Arabic multiword expressions repository | |
| KR0123238B1 (ko) | 어절구조 특성을 이용한 형태소 분석 시스팀 및 분석 방법 | |
| JP2812511B2 (ja) | キーワード抽出装置 | |
| JP2007233446A (ja) | 同義語対抽出装置及び同義語対抽出方法 | |
| Vernerová et al. | To Pay or to Get Paid: Enriching a Valency Lexicon with Diatheses. | |
| JPH0244463A (ja) | 機械翻訳システムにおける原文入力方法 | |
| JP2893740B2 (ja) | 機械翻訳装置 | |
| JPH02103662A (ja) | 文分割方式 | |
| JPH03259376A (ja) | 日本語長文分割支援装置 | |
| JPH07152778A (ja) | 文書検索装置 | |
| JPS6151270A (ja) | 二語間関係抽出方式 | |
| JP3020230B2 (ja) | 辞書コンパクト装置および自然言語処理方法 | |
| JPS63219074A (ja) | 自然言語解析装置 | |
| JPS61281367A (ja) | 英語解析における名詞句決定方式 | |
| JPH0715692B2 (ja) | 文脈処理装置 | |
| JPS5957373A (ja) | インデツクス作成方式 | |
| JP4071657B2 (ja) | テキスト処理装置 |