JPH1040253A - 文章中の単語の観点生成方法及び装置 - Google Patents
文章中の単語の観点生成方法及び装置Info
- Publication number
- JPH1040253A JPH1040253A JP8190987A JP19098796A JPH1040253A JP H1040253 A JPH1040253 A JP H1040253A JP 8190987 A JP8190987 A JP 8190987A JP 19098796 A JP19098796 A JP 19098796A JP H1040253 A JPH1040253 A JP H1040253A
- Authority
- JP
- Japan
- Prior art keywords
- word
- sentence
- viewpoint
- situation
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 人手を煩わすことなく、文脈に相応しい単語
の観点の取得が可能な文章中の単語の観点生成方法及び
装置を提供する。 【解決手段】 本発明は、辞書を参照して、当該辞書内
の単語の見出しとその説明文から生成された連想テーブ
ルを生成し、文章中の指定語の近傍の単語を抽出して状
況語とし、状況語のそれぞれから連想される単語の頻度
を参照して状況語から連想される連想語の出現頻度を蓄
積し、蓄積された連想語の出現頻度に基づいて観点とな
る単語を出力する。
の観点の取得が可能な文章中の単語の観点生成方法及び
装置を提供する。 【解決手段】 本発明は、辞書を参照して、当該辞書内
の単語の見出しとその説明文から生成された連想テーブ
ルを生成し、文章中の指定語の近傍の単語を抽出して状
況語とし、状況語のそれぞれから連想される単語の頻度
を参照して状況語から連想される連想語の出現頻度を蓄
積し、蓄積された連想語の出現頻度に基づいて観点とな
る単語を出力する。
Description
【0001】
【発明の属する技術分野】本発明は、文章中の単語の観
点生成方法及び装置に係り、特に、観点に基づく単語の
類似判別を行う際の文章の内容に基づいた単語の観点を
生成するための文章中の単語の観点生成方法及び装置に
関する。
点生成方法及び装置に係り、特に、観点に基づく単語の
類似判別を行う際の文章の内容に基づいた単語の観点を
生成するための文章中の単語の観点生成方法及び装置に
関する。
【0002】
【従来の技術】近年、大容量で安価な記憶媒体が出現し
たことに起因して、各種のデータベースが数多く作成・
使用されている。このようなデータベースについて、デ
ータベースを構成する個々のデータ相互間、あるいは、
外部から入力されるデータとデータベースのデータ間の
類似性を判別することにより、データを検索・分類する
ことが行われている。例えば、種々の文献に関する情報
を蓄積した文献データベースの場合、指定した文献に類
似した文献があるか否かを検索する。また、特許明細
書、その他のテキストデータの集合については、内容が
類似したものを収集、分類することも頻繁に行われてい
る。
たことに起因して、各種のデータベースが数多く作成・
使用されている。このようなデータベースについて、デ
ータベースを構成する個々のデータ相互間、あるいは、
外部から入力されるデータとデータベースのデータ間の
類似性を判別することにより、データを検索・分類する
ことが行われている。例えば、種々の文献に関する情報
を蓄積した文献データベースの場合、指定した文献に類
似した文献があるか否かを検索する。また、特許明細
書、その他のテキストデータの集合については、内容が
類似したものを収集、分類することも頻繁に行われてい
る。
【0003】データ同士の比較では、データが単語によ
って構成される場合、単語同士の比較を総合する方法が
一般的である。例えば、データ中での共通した単語の割
合に基づいてデータの類似性を判定し、分類する方法が
ある。しかし、単語同士の比較を文字列のみで行う場
合、意味が近いが異なる単語は関連性がないと判断さ
れ、データ間の類似判別に悪影響を与えるという問題が
ある。そこで、単語間の類似性を意味に基づいて判別す
る技術が利用されている。
って構成される場合、単語同士の比較を総合する方法が
一般的である。例えば、データ中での共通した単語の割
合に基づいてデータの類似性を判定し、分類する方法が
ある。しかし、単語同士の比較を文字列のみで行う場
合、意味が近いが異なる単語は関連性がないと判断さ
れ、データ間の類似判別に悪影響を与えるという問題が
ある。そこで、単語間の類似性を意味に基づいて判別す
る技術が利用されている。
【0004】一般には、類似した単語同士を予め人手で
分類し、カテゴリにまとめた類語辞書を作成し、利用す
る方法が用いられる。しかし、単語同士の類似関係は、
用いられる文脈や、状況に応じて変化するので、類似関
係が予め定められている分類時点では、その全てに対応
できないという問題がある。
分類し、カテゴリにまとめた類語辞書を作成し、利用す
る方法が用いられる。しかし、単語同士の類似関係は、
用いられる文脈や、状況に応じて変化するので、類似関
係が予め定められている分類時点では、その全てに対応
できないという問題がある。
【0005】ここで、『馬』に対して『豚』と『自動
車』のどちらが類似しているかの判別を例として説明す
る。分類辞書で『馬』に対して『豚』がカテゴリ『動
物』に含まれているが、カテゴリ『乗物』に『自動車』
は含まれるが、『馬』が含まれていない場合、動物に関
する話題『乗物』に関する話題が提示されている時は、
『豚』に対して『自動車』が類似していると判別される
べきであるが、分類辞書を利用する技術では、『豚』が
類似していると判別される。また、分類辞書で『馬』を
『自動車』と同じカテゴリに追加しても、『豚』と『自
動車』のどちらでも『馬』に類似していることになり、
判別できない。
車』のどちらが類似しているかの判別を例として説明す
る。分類辞書で『馬』に対して『豚』がカテゴリ『動
物』に含まれているが、カテゴリ『乗物』に『自動車』
は含まれるが、『馬』が含まれていない場合、動物に関
する話題『乗物』に関する話題が提示されている時は、
『豚』に対して『自動車』が類似していると判別される
べきであるが、分類辞書を利用する技術では、『豚』が
類似していると判別される。また、分類辞書で『馬』を
『自動車』と同じカテゴリに追加しても、『豚』と『自
動車』のどちらでも『馬』に類似していることになり、
判別できない。
【0006】そこで、類似判別を行う際の観点が指定さ
れた場合、観点に応じて類似判別を行う技術として、代
表的なものは、特願平4−315233に記載されてい
る技術がある。当該技術は、単語のそれぞれが、単語の
特徴を表す特徴概念とその関連性を表す重要度の対をデ
ータとして保有するデータベースを用いて、単語間の類
似性を判別する際に、状況や文脈を表す単語(以下、観
点と記す)に、対応するデータベース中のデータを参照
し、類似性判別の対象となる単語のデータが保有する特
徴概念のそれぞれについて、関連のある特徴概念が観点
のデータ中に含まれているかを判定し、類似判別の対象
となる単語のそれぞれについてデータ中の特徴概念と対
をなす重要度の値を観点のデータ中の関連する特徴概念
と対をなす重要度を使用して強調し、強調したデータ同
士の類似性を判別することにより、観点に基づいた類似
判別をできるようにしたものである。ここで、観点は、
類似判別を行う際の状況を代表する単語を利用者が入力
することを想定している。
れた場合、観点に応じて類似判別を行う技術として、代
表的なものは、特願平4−315233に記載されてい
る技術がある。当該技術は、単語のそれぞれが、単語の
特徴を表す特徴概念とその関連性を表す重要度の対をデ
ータとして保有するデータベースを用いて、単語間の類
似性を判別する際に、状況や文脈を表す単語(以下、観
点と記す)に、対応するデータベース中のデータを参照
し、類似性判別の対象となる単語のデータが保有する特
徴概念のそれぞれについて、関連のある特徴概念が観点
のデータ中に含まれているかを判定し、類似判別の対象
となる単語のそれぞれについてデータ中の特徴概念と対
をなす重要度の値を観点のデータ中の関連する特徴概念
と対をなす重要度を使用して強調し、強調したデータ同
士の類似性を判別することにより、観点に基づいた類似
判別をできるようにしたものである。ここで、観点は、
類似判別を行う際の状況を代表する単語を利用者が入力
することを想定している。
【0007】
【発明が解決しようとする課題】しかしながら、上記の
従来の技術における観点に基づく類似性判別方式では、
類似判別の観点を利用者が与えることを前提としている
ため、利用者は、文脈に相応しい単語を観点として考え
る必要がある。そのために自動化は困難であり、多数の
単語について類似性判別を行うことは困難であるという
問題がある。
従来の技術における観点に基づく類似性判別方式では、
類似判別の観点を利用者が与えることを前提としている
ため、利用者は、文脈に相応しい単語を観点として考え
る必要がある。そのために自動化は困難であり、多数の
単語について類似性判別を行うことは困難であるという
問題がある。
【0008】また、文章や会話等から状況や文脈を獲得
する研究が行われているが、それらは、高度な自然言語
処理と言語理解の技術を前提とし、理論的には可能であ
るが実現は困難である。本発明は、上記の点に鑑みなさ
れたもので、上記従来の問題点を解決し、人手を煩わす
ことなく、文脈に相応しい単語の観点の取得が可能な文
章中の単語の観点生成方法及び装置を提供することを目
的とする。
する研究が行われているが、それらは、高度な自然言語
処理と言語理解の技術を前提とし、理論的には可能であ
るが実現は困難である。本発明は、上記の点に鑑みなさ
れたもので、上記従来の問題点を解決し、人手を煩わす
ことなく、文脈に相応しい単語の観点の取得が可能な文
章中の単語の観点生成方法及び装置を提供することを目
的とする。
【0009】
【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。本発明は、文章中の任意の単
語である指定語に対する観点を生成する文章中の単語の
観点生成方法において、単語の見出しとその説明文から
生成された連想テーブルを生成し(ステップ1)、文章
中の指定語の近傍の単語を抽出して状況語とし(ステッ
プ2)、状況語のそれぞれから連想される単語の頻度を
参照して状況語から連想される連想語の出現頻度を蓄積
し(ステップ3)、蓄積された連想語の出現頻度に基づ
いて観点となる単語を出力することを特徴とする(ステ
ップ4)。
説明するための図である。本発明は、文章中の任意の単
語である指定語に対する観点を生成する文章中の単語の
観点生成方法において、単語の見出しとその説明文から
生成された連想テーブルを生成し(ステップ1)、文章
中の指定語の近傍の単語を抽出して状況語とし(ステッ
プ2)、状況語のそれぞれから連想される単語の頻度を
参照して状況語から連想される連想語の出現頻度を蓄積
し(ステップ3)、蓄積された連想語の出現頻度に基づ
いて観点となる単語を出力することを特徴とする(ステ
ップ4)。
【0010】また、本発明は、辞書の見出し語毎に説明
文中の説明語の出現頻度を求め、各説明語に対応する見
出し語と出現頻度からなる連想テーブルを生成し、文章
を構成する単語である文章構成単語を獲得し、指定語の
文章構成単語中での近傍の単語である状況語を抽出し、
状況語それぞれについて連想テーブルを参照し、該連想
テーブル中の説明語に対応する見出し語と出現頻度を取
得し、見出し語それぞれに対する数値を蓄積する観点テ
ーブルに該見出し語の出現頻度を加算し、観点テーブル
中で出現頻度の高い見出し語を観点として出力する。
文中の説明語の出現頻度を求め、各説明語に対応する見
出し語と出現頻度からなる連想テーブルを生成し、文章
を構成する単語である文章構成単語を獲得し、指定語の
文章構成単語中での近傍の単語である状況語を抽出し、
状況語それぞれについて連想テーブルを参照し、該連想
テーブル中の説明語に対応する見出し語と出現頻度を取
得し、見出し語それぞれに対する数値を蓄積する観点テ
ーブルに該見出し語の出現頻度を加算し、観点テーブル
中で出現頻度の高い見出し語を観点として出力する。
【0011】また、本発明は、文章構成単語から指定語
の状況語を抽出する際に、指定語と状況語の位置関係が
近い程、値が大きくなる単調増加関数を該状況語に付与
し、状況語のそれぞれについて連想テーブル中の等しい
説明語に対応する見出し語と、出現頻度を獲得し、観点
テーブルに見出し語の出現頻度と状況語に付与された単
調増加関数の積を加算する。
の状況語を抽出する際に、指定語と状況語の位置関係が
近い程、値が大きくなる単調増加関数を該状況語に付与
し、状況語のそれぞれについて連想テーブル中の等しい
説明語に対応する見出し語と、出現頻度を獲得し、観点
テーブルに見出し語の出現頻度と状況語に付与された単
調増加関数の積を加算する。
【0012】また、本発明は、状況語に付与する単調増
加関数として、重みを用い、観点テーブルに見出し語の
出現頻度と状況語に付与された重みの積を加算する。図
2は、本発明の原理構成図である。本発明は、文章40
中の指定語に対する観点を生成する文章中の単語観点生
成装置であって、見出し語と説明文からなる辞書10
と、辞書10の見出し語毎に説明文中の説明語の出現頻
度を求め、各該説明語に対応する見出し語と該出現頻度
からなる連想テーブル102を生成する連想テーブル生
成手段103と、文章40を構成する文章構成単語を獲
得する形態素解析手段106と、指定語の文章構成単語
中での近傍の単語である状況語を抽出する状況語決定手
段108と、状況語のそれぞれについて、連想テーブル
102中の説明語に対応する見出し語と出現頻度を獲得
し、見出し語それぞれに対応する数値を蓄積する観点テ
ーブル90に見出し語の出現頻度を加算し、観点テーブ
ル90中で出現頻度の高い見出し語を観点として出力す
る観点生成手段110とを有する。
加関数として、重みを用い、観点テーブルに見出し語の
出現頻度と状況語に付与された重みの積を加算する。図
2は、本発明の原理構成図である。本発明は、文章40
中の指定語に対する観点を生成する文章中の単語観点生
成装置であって、見出し語と説明文からなる辞書10
と、辞書10の見出し語毎に説明文中の説明語の出現頻
度を求め、各該説明語に対応する見出し語と該出現頻度
からなる連想テーブル102を生成する連想テーブル生
成手段103と、文章40を構成する文章構成単語を獲
得する形態素解析手段106と、指定語の文章構成単語
中での近傍の単語である状況語を抽出する状況語決定手
段108と、状況語のそれぞれについて、連想テーブル
102中の説明語に対応する見出し語と出現頻度を獲得
し、見出し語それぞれに対応する数値を蓄積する観点テ
ーブル90に見出し語の出現頻度を加算し、観点テーブ
ル90中で出現頻度の高い見出し語を観点として出力す
る観点生成手段110とを有する。
【0013】また、本発明は、文章中の指定語に対する
観点を生成する文章中の単語の観点生成装置であって、
見出し語と説明文からなる辞書10と、辞書10の見出
し語毎に説明文中の説明語の出現頻度を求め、各該説明
語に対応する見出し語と該出現頻度からなる連想テーブ
ル102を生成する連想テーブル生成手段103と、文
章を構成する文章構成単語を獲得する形態素解析手段1
06と、指定語の文章構成語中での近傍の単語である状
況語を抽出し、該指定語と該状況語の該文章構成単語の
位置関係が近い程、値が大きくなる単調増加関数を付与
する状況語決定手段108と、状況語のそれぞれについ
て連想テーブル102中の等しい説明語に対応する見出
し語と出現頻度を獲得し、観点テーブル90に見出し語
の出現頻度と該状況語に付与された単調増加関数の積を
加算し、該観点テーブル90で出現頻度の高い見出し語
を観点として出力する観点生成手段110を有する。
観点を生成する文章中の単語の観点生成装置であって、
見出し語と説明文からなる辞書10と、辞書10の見出
し語毎に説明文中の説明語の出現頻度を求め、各該説明
語に対応する見出し語と該出現頻度からなる連想テーブ
ル102を生成する連想テーブル生成手段103と、文
章を構成する文章構成単語を獲得する形態素解析手段1
06と、指定語の文章構成語中での近傍の単語である状
況語を抽出し、該指定語と該状況語の該文章構成単語の
位置関係が近い程、値が大きくなる単調増加関数を付与
する状況語決定手段108と、状況語のそれぞれについ
て連想テーブル102中の等しい説明語に対応する見出
し語と出現頻度を獲得し、観点テーブル90に見出し語
の出現頻度と該状況語に付与された単調増加関数の積を
加算し、該観点テーブル90で出現頻度の高い見出し語
を観点として出力する観点生成手段110を有する。
【0014】また、本発明の状況語決定手段108は、
単調増加関数として重みを付与し、観点生成手段110
は、状況語に付与された重みの積を加算する。上述のよ
うに、本発明は、単語の見出しとその説明文から生成さ
れた連想テーブルを生成し、文章中の指定語の近傍の単
語を抽出して複数の状況語とし、各々の状況語から連想
される単語の出現頻度を参照して、当該状況語から連想
される連想語の出現頻度を蓄積することにより、蓄積さ
れた出現頻度のポイントの高いものを文章中の単語の観
点として生成することが可能となる。
単調増加関数として重みを付与し、観点生成手段110
は、状況語に付与された重みの積を加算する。上述のよ
うに、本発明は、単語の見出しとその説明文から生成さ
れた連想テーブルを生成し、文章中の指定語の近傍の単
語を抽出して複数の状況語とし、各々の状況語から連想
される単語の出現頻度を参照して、当該状況語から連想
される連想語の出現頻度を蓄積することにより、蓄積さ
れた出現頻度のポイントの高いものを文章中の単語の観
点として生成することが可能となる。
【0015】さらに、本発明によれば、単語の見出しと
その説明文から生成された連想テーブルを生成し、文章
中の指定語の近傍の単語と指定語との近さの度合を抽出
して状況語とし、当該状況語の各々から連想される単語
の頻度を参照して状況語から連想される連想語の出現頻
度と状況語の重みの積を蓄積することにより、指定語に
近い単語程、観点生成に影響を及ぼす観点として取得す
ることが可能となり、指定後の位置に敏感な観点が生成
される。
その説明文から生成された連想テーブルを生成し、文章
中の指定語の近傍の単語と指定語との近さの度合を抽出
して状況語とし、当該状況語の各々から連想される単語
の頻度を参照して状況語から連想される連想語の出現頻
度と状況語の重みの積を蓄積することにより、指定語に
近い単語程、観点生成に影響を及ぼす観点として取得す
ることが可能となり、指定後の位置に敏感な観点が生成
される。
【0016】また、指定語との近さの度合として、単調
増加関数や重みを用いることにより、指定語の近傍にあ
るもの程大きな重みを付与することにより、文脈に相応
しい単語の観点を得ることが可能となる。
増加関数や重みを用いることにより、指定語の近傍にあ
るもの程大きな重みを付与することにより、文脈に相応
しい単語の観点を得ることが可能となる。
【0017】
【発明の実施の形態】図3は、本発明の第1の文章中の
単語の観点生成装置の構成を示す。同図に示す観点生成
装置100は、見出し語とその説明文からなる辞書10
と、辞書10中の個々の説明文について説明語の出現頻
度を蓄積し、個々の説明語毎に説明語と出現頻度からな
る連想テーブル102を生成する連想テーブル生成部1
03と、類似語検索対象となる単語を含む文章40から
文章中単語を取り出して文章構成単語格納部105に格
納する形態素解析部106と、文章構成単語格納部10
5に格納されている文章構成単語を参照して、類似語検
索の対象となる単語の文章40における近傍の状況語を
決定する状況語決定部108と、状況語決定部108に
より決定された状況語を格納する状況語格納部107
と、状況語格納部107に格納されている状況語のそれ
ぞれについて連想テーブル102から等しい説明語に対
する見出し語と出現頻度を取り出し、観点テーブル90
の見出し語に対応する蓄積場所に出現頻度と状況語の重
みの積を加算する観点生成部110より構成される。
単語の観点生成装置の構成を示す。同図に示す観点生成
装置100は、見出し語とその説明文からなる辞書10
と、辞書10中の個々の説明文について説明語の出現頻
度を蓄積し、個々の説明語毎に説明語と出現頻度からな
る連想テーブル102を生成する連想テーブル生成部1
03と、類似語検索対象となる単語を含む文章40から
文章中単語を取り出して文章構成単語格納部105に格
納する形態素解析部106と、文章構成単語格納部10
5に格納されている文章構成単語を参照して、類似語検
索の対象となる単語の文章40における近傍の状況語を
決定する状況語決定部108と、状況語決定部108に
より決定された状況語を格納する状況語格納部107
と、状況語格納部107に格納されている状況語のそれ
ぞれについて連想テーブル102から等しい説明語に対
する見出し語と出現頻度を取り出し、観点テーブル90
の見出し語に対応する蓄積場所に出現頻度と状況語の重
みの積を加算する観点生成部110より構成される。
【0018】上記の構成による一連の動作を説明する。
図4は、本発明の第1の文章中の単語の観点生成動作を
示すフローチャートである。 ステップ101) 連想テーブル生成部103におい
て、辞書10の見出し語毎に説明文中の説明語の出現頻
度を求める。
図4は、本発明の第1の文章中の単語の観点生成動作を
示すフローチャートである。 ステップ101) 連想テーブル生成部103におい
て、辞書10の見出し語毎に説明文中の説明語の出現頻
度を求める。
【0019】ステップ102) 連想テーブル生成部1
03は、各説明語に対応する見出し語と出現頻度からな
る連想テーブル102を生成する。 ステップ103) 形態素解析部106は、入力された
文章40を形態素解析し、当該文章40を構成する単語
である文章構成単語を獲得し、当該文章構成単語を文章
構成単語格納部105に格納する。
03は、各説明語に対応する見出し語と出現頻度からな
る連想テーブル102を生成する。 ステップ103) 形態素解析部106は、入力された
文章40を形態素解析し、当該文章40を構成する単語
である文章構成単語を獲得し、当該文章構成単語を文章
構成単語格納部105に格納する。
【0020】ステップ104) 状況語決定部108
は、文章構成単語格納部105から指定語の文章構成単
語中での近傍の単語である状況語を抽出し、当該状況語
を状況語格納部107に格納する。 ステップ105) 観点生成部110は、状況語格納部
107から状況語を読み出して、状況語それぞれについ
て連想テーブル102を参照し、該連想テーブル102
中の説明語に対応する見出し語と出現頻度を取得する。
は、文章構成単語格納部105から指定語の文章構成単
語中での近傍の単語である状況語を抽出し、当該状況語
を状況語格納部107に格納する。 ステップ105) 観点生成部110は、状況語格納部
107から状況語を読み出して、状況語それぞれについ
て連想テーブル102を参照し、該連想テーブル102
中の説明語に対応する見出し語と出現頻度を取得する。
【0021】ステップ106) 観点生成部110は、
各々の見出し語に対する数値を蓄積する観点テーブル9
0に該見出し語の出現頻度を加算する。 ステップ107) これにより、観点テーブル90中で
出現頻度の高い見出し語を観点として出力する。
各々の見出し語に対する数値を蓄積する観点テーブル9
0に該見出し語の出現頻度を加算する。 ステップ107) これにより、観点テーブル90中で
出現頻度の高い見出し語を観点として出力する。
【0022】また、本発明のもう一つの観点生成装置と
して、上記の状況語格納部107に格納する要素とし
て、各々の状況語に重みを付与し、状況語の各々につい
て連想テーブル102中の等しい説明語に対応する見出
し語と出現頻度を獲得し、観点テーブル90に見出し語
の出現頻度と状況語に付与された重みの積を加算するも
のである。
して、上記の状況語格納部107に格納する要素とし
て、各々の状況語に重みを付与し、状況語の各々につい
て連想テーブル102中の等しい説明語に対応する見出
し語と出現頻度を獲得し、観点テーブル90に見出し語
の出現頻度と状況語に付与された重みの積を加算するも
のである。
【0023】図5は、本発明の第2の文章中の単語の観
点生成装置の構成を示す。同図において、図3の同一構
成部分には、同一符号を付与する。この第2の文章中の
単語の観点生成装置の構成は、見出し語とその説明文か
らなる辞書10と、辞書10中の個々の説明文について
説明語の出現頻度を蓄積し、個々の説明語毎に説明語と
出現頻度からなる連想テーブル102を生成する連想テ
ーブル生成部103と、類似語検索対象となる単語を含
む文章40から文章中の単語を取り出して文章構成単語
格納部105に格納する形態素解析部106と、類似語
検索の対象となる単語の文章40における近傍の状況語
とその重みを文章中単語格納部105から取得して状況
語・重み格納部107に格納する状況語決定部108
と、状況語・重み格納部107に格納されている状況語
と重みのそれぞれについて連想テーブル102から等し
い説明語に対する見出し語と出現頻度を取り出し、観点
テーブル90の見出し語に対応する蓄積場所に出現頻度
と状況語の重みの積を加算する観点生成部110より構
成される。
点生成装置の構成を示す。同図において、図3の同一構
成部分には、同一符号を付与する。この第2の文章中の
単語の観点生成装置の構成は、見出し語とその説明文か
らなる辞書10と、辞書10中の個々の説明文について
説明語の出現頻度を蓄積し、個々の説明語毎に説明語と
出現頻度からなる連想テーブル102を生成する連想テ
ーブル生成部103と、類似語検索対象となる単語を含
む文章40から文章中の単語を取り出して文章構成単語
格納部105に格納する形態素解析部106と、類似語
検索の対象となる単語の文章40における近傍の状況語
とその重みを文章中単語格納部105から取得して状況
語・重み格納部107に格納する状況語決定部108
と、状況語・重み格納部107に格納されている状況語
と重みのそれぞれについて連想テーブル102から等し
い説明語に対する見出し語と出現頻度を取り出し、観点
テーブル90の見出し語に対応する蓄積場所に出現頻度
と状況語の重みの積を加算する観点生成部110より構
成される。
【0024】上記の構成による一連の動作を説明する。
図6は、本発明の第1の文章中の単語の観点生成動作を
示すフローチャートである。 ステップ201) 連想テーブル生成部103におい
て、辞書10の見出し語毎に説明文中の説明語の出現頻
度を求める。
図6は、本発明の第1の文章中の単語の観点生成動作を
示すフローチャートである。 ステップ201) 連想テーブル生成部103におい
て、辞書10の見出し語毎に説明文中の説明語の出現頻
度を求める。
【0025】ステップ202) 連想テーブル生成部1
03は、各説明語に対応する見出し語と出現頻度からな
る連想テーブル102を生成する。 ステップ203) 形態素解析部106は、入力された
文章40を形態素解析し、当該文章40を構成する単語
である文章構成単語を獲得し、当該文章構成単語を文章
構成単語格納部105に格納する。
03は、各説明語に対応する見出し語と出現頻度からな
る連想テーブル102を生成する。 ステップ203) 形態素解析部106は、入力された
文章40を形態素解析し、当該文章40を構成する単語
である文章構成単語を獲得し、当該文章構成単語を文章
構成単語格納部105に格納する。
【0026】ステップ204) 状況語決定部108
は、文章構成単語格納部105から指定語の文章構成単
語中での近傍の単語である状況語を抽出し、指定語と状
況語の位置関係が近い程、値が大きくなる単調増加関数
(重み)を該状況語に付与し、当該状況語と重みの組を
状況語・重み格納部107に格納する。
は、文章構成単語格納部105から指定語の文章構成単
語中での近傍の単語である状況語を抽出し、指定語と状
況語の位置関係が近い程、値が大きくなる単調増加関数
(重み)を該状況語に付与し、当該状況語と重みの組を
状況語・重み格納部107に格納する。
【0027】ステップ205) 観点生成部110は、
状況語・重み格納部107から状況語を読み出して、状
況語それぞれについて連想テーブル102を参照し、該
連想テーブル102中の説明語に対応する見出し語と出
現頻度を取得する。 ステップ206) 観点生成部110は、観点テーブル
90に見出し語の出現頻度と状況語に付与された重みの
積を加算する。
状況語・重み格納部107から状況語を読み出して、状
況語それぞれについて連想テーブル102を参照し、該
連想テーブル102中の説明語に対応する見出し語と出
現頻度を取得する。 ステップ206) 観点生成部110は、観点テーブル
90に見出し語の出現頻度と状況語に付与された重みの
積を加算する。
【0028】ステップ207) これにより、観点テー
ブル中で出現頻度の高い見出し語を観点として出力す
る。
ブル中で出現頻度の高い見出し語を観点として出力す
る。
【0029】
【実施例】以下、図面と共に本発明の実施例を説明す
る。 [第1の実施例]図7は、本発明の第1の実施例の観点
生成装置の構成を示す。同図中、図3と同一構成部分に
は同一符号を付与する。
る。 [第1の実施例]図7は、本発明の第1の実施例の観点
生成装置の構成を示す。同図中、図3と同一構成部分に
は同一符号を付与する。
【0030】まず、本実施例として、文章40における
指定語「前線」の観点を取得する例を説明する。連想テ
ーブル生成部103は、辞書10の『遊説』の説明文と
して、「各地を巡って演説をすること。政治家が各地を
説いて回ること。」とあるとき、説明文中の説明語と出
現頻度「各地:1」「巡る:1」「演説:1」「政治
家:1」「各地:2」「説く:1」「回る:1」「事:
1」を抽出する。そして、これらの説明語に対する見出
し語を連想テーブル102に加える。その結果、図7に
示すように、連想テーブル102で見出し語「遊説」に
対する説明語に「各地」が加えられている。つまり、見
出し語「遊説」に対する説明語「各地」の出現頻度は上
記に示すように、2であるので、図7に示すように、
「遊説」に対する出現頻度=2となり、『遊説:2』と
設定される。他の説明語についても同様に加えられる。
指定語「前線」の観点を取得する例を説明する。連想テ
ーブル生成部103は、辞書10の『遊説』の説明文と
して、「各地を巡って演説をすること。政治家が各地を
説いて回ること。」とあるとき、説明文中の説明語と出
現頻度「各地:1」「巡る:1」「演説:1」「政治
家:1」「各地:2」「説く:1」「回る:1」「事:
1」を抽出する。そして、これらの説明語に対する見出
し語を連想テーブル102に加える。その結果、図7に
示すように、連想テーブル102で見出し語「遊説」に
対する説明語に「各地」が加えられている。つまり、見
出し語「遊説」に対する説明語「各地」の出現頻度は上
記に示すように、2であるので、図7に示すように、
「遊説」に対する出現頻度=2となり、『遊説:2』と
設定される。他の説明語についても同様に加えられる。
【0031】次に、文章40として、現在、『……見込
み。梅雨のため、午前中は各地で雲行きが悪くなるが、
夕方より晴れるであろう。前線は、明日以降南下……』
が与えられているものとする。この文章40が形態素解
析部106に入力されると、形態素解析部106は、当
該文章40中の単語を抽出し、文章構成単語格納部10
5に、「見込み」「梅雨」「午前」「各地」「雲行き」
「悪い」「夕方」「晴れる」「前線」「明日」「以降」
「南下」…が格納される。
み。梅雨のため、午前中は各地で雲行きが悪くなるが、
夕方より晴れるであろう。前線は、明日以降南下……』
が与えられているものとする。この文章40が形態素解
析部106に入力されると、形態素解析部106は、当
該文章40中の単語を抽出し、文章構成単語格納部10
5に、「見込み」「梅雨」「午前」「各地」「雲行き」
「悪い」「夕方」「晴れる」「前線」「明日」「以降」
「南下」…が格納される。
【0032】さらに、状況語決定部108は、文章40
中の指定語「前線」について、文章構成単語105中の
「前線」の近傍に存在する単語を取得し、状況語とし
て、「梅雨」「午前」「各地」「雲行き」「悪い」「夕
方」「晴れる」を生成する。
中の指定語「前線」について、文章構成単語105中の
「前線」の近傍に存在する単語を取得し、状況語とし
て、「梅雨」「午前」「各地」「雲行き」「悪い」「夕
方」「晴れる」を生成する。
【0033】ここでは、文章構成単語格納部105の中
で指定語「前線」より前に現れる7つの単語を獲得して
いるが、その単語数は与えられる文章40により種々考
えられる。従って、状況語格納部107に格納されるの
は、「梅雨」「午前」「各地」「雲行き」「悪い」「夕
方」「晴れる」となる。
で指定語「前線」より前に現れる7つの単語を獲得して
いるが、その単語数は与えられる文章40により種々考
えられる。従って、状況語格納部107に格納されるの
は、「梅雨」「午前」「各地」「雲行き」「悪い」「夕
方」「晴れる」となる。
【0034】さらに、指定語を含む文や直前の文に含ま
れる単語を状況語とすることができる。また、指定語の
前後から状況語を取得することができるのは言うまでも
ない。次に、観点生成部110は、状況語格納部107
を読み込み、個々の状況語について連想テーブル102
を参照する。
れる単語を状況語とすることができる。また、指定語の
前後から状況語を取得することができるのは言うまでも
ない。次に、観点生成部110は、状況語格納部107
を読み込み、個々の状況語について連想テーブル102
を参照する。
【0035】例えば、状況語「梅雨」を参照すると、見
出し語「雨:1」「天候:1」「紫陽花:1」が得られ
る。これは、状況語「梅雨」に対して連想テーブル10
2を参照すると、見出し語「雨」は、1回しか出現して
いないためであり、状況語「雲行き」に対しては、見出
し語「雲」が1回しか出現していない。そして、参照結
果のそれぞれの見出し語に対する出現頻度を観点テーブ
ル90の等しい見出し語に対する出現頻度に加算する。
その結果、得られる観点テーブル90における出現頻度
が最も高い(=3)見出し語「天候」を観点にすること
もできるし、出現頻度の高い順序に並べられた見出し語
の集合を観点とすることができることは言うまでもな
い。
出し語「雨:1」「天候:1」「紫陽花:1」が得られ
る。これは、状況語「梅雨」に対して連想テーブル10
2を参照すると、見出し語「雨」は、1回しか出現して
いないためであり、状況語「雲行き」に対しては、見出
し語「雲」が1回しか出現していない。そして、参照結
果のそれぞれの見出し語に対する出現頻度を観点テーブ
ル90の等しい見出し語に対する出現頻度に加算する。
その結果、得られる観点テーブル90における出現頻度
が最も高い(=3)見出し語「天候」を観点にすること
もできるし、出現頻度の高い順序に並べられた見出し語
の集合を観点とすることができることは言うまでもな
い。
【0036】例えば、観点テーブル90において出現頻
度が2以上の見出し語という条件を付与することによ
り、出現頻度の高い順に、「天候」「午後」「遊説」を
出力するようにしてもよい。 [第2の実施例]図8は、本発明の第2の実施例の観点
生成装置の構成を示す。同図において、図4と同一構成
部分には、同一符号を付す。図8に示す文章40、辞書
10、及び文章構成単語格納部105に格納される内容
は、前述の第1の実施例の図5と同様である。
度が2以上の見出し語という条件を付与することによ
り、出現頻度の高い順に、「天候」「午後」「遊説」を
出力するようにしてもよい。 [第2の実施例]図8は、本発明の第2の実施例の観点
生成装置の構成を示す。同図において、図4と同一構成
部分には、同一符号を付す。図8に示す文章40、辞書
10、及び文章構成単語格納部105に格納される内容
は、前述の第1の実施例の図5と同様である。
【0037】本実施例も前述の第1の実施例と同様に、
文章40における指定語「前線」の観点を取得するもの
として説明する。まず、辞書10の説明文中から連想テ
ーブル生成部103は、単語を抽出する。例えば、辞書
10の見出し語「遊説」の説明文が、「各地を巡って演
説をすること。政治家が各地を説いて回ること。」とあ
るとき、説明文中の説明語と出現頻度は各々、「各地:
1」「巡る:1」「演説:1」「政治家:1」「各地:
2」「説く:1」「回る:1」「事:1」を抽出する。
そして、それらの説明語に対する見出し語を連想テーブ
ル102に加える。その結果、例えば、図8では、連想
テーフル102で見出し語「遊説」に対する説明語に
「各地」が加えられている。他の説明語についても同様
に加えられる。
文章40における指定語「前線」の観点を取得するもの
として説明する。まず、辞書10の説明文中から連想テ
ーブル生成部103は、単語を抽出する。例えば、辞書
10の見出し語「遊説」の説明文が、「各地を巡って演
説をすること。政治家が各地を説いて回ること。」とあ
るとき、説明文中の説明語と出現頻度は各々、「各地:
1」「巡る:1」「演説:1」「政治家:1」「各地:
2」「説く:1」「回る:1」「事:1」を抽出する。
そして、それらの説明語に対する見出し語を連想テーブ
ル102に加える。その結果、例えば、図8では、連想
テーフル102で見出し語「遊説」に対する説明語に
「各地」が加えられている。他の説明語についても同様
に加えられる。
【0038】次に、文章40として、『……見込み。梅
雨のため、午前中は各地で雲行きが悪くなるが、夕方よ
り晴れるであろう。前線は、明日以降南下……』が与え
られた時に、形態素解析部106は、文章中の単語を抽
出し、形態素解析することにより、文章構成単語とし
て、「見込み」「梅雨」「午前」「各地」「雲行き」
「悪い」「夕方」「晴れる」「前線」「明日」「以降」
「南下」…を抽出し、文章構成単語格納部105に格納
する。
雨のため、午前中は各地で雲行きが悪くなるが、夕方よ
り晴れるであろう。前線は、明日以降南下……』が与え
られた時に、形態素解析部106は、文章中の単語を抽
出し、形態素解析することにより、文章構成単語とし
て、「見込み」「梅雨」「午前」「各地」「雲行き」
「悪い」「夕方」「晴れる」「前線」「明日」「以降」
「南下」…を抽出し、文章構成単語格納部105に格納
する。
【0039】そして、状況語決定部108は、文章40
中の指定語「前線」について、文章構成単語格納部10
5中の「前線」の近傍の単語と重みを取得し、状況語と
して、「梅雨:1」「午前:2」「各地:3」「雲行
き:4」「悪い:5」「夕方:6」「晴れる:7」を生
成し、状況語・重み格納部107に格納する。ここで
は、文章構成単語格納部105に格納されている文章構
成単語中で指定語「前線」より前に現れる7つの単語を
獲得しているが、その単語数は、状況により種々考えら
れる。また、重みは、指定語と最も離れた状況語「梅
雨」の重みを“1”とし、1ずつ加算した値としている
が、指定語と近い程、値が大きくなる正の値であれば、
そのようなものでも構わない。
中の指定語「前線」について、文章構成単語格納部10
5中の「前線」の近傍の単語と重みを取得し、状況語と
して、「梅雨:1」「午前:2」「各地:3」「雲行
き:4」「悪い:5」「夕方:6」「晴れる:7」を生
成し、状況語・重み格納部107に格納する。ここで
は、文章構成単語格納部105に格納されている文章構
成単語中で指定語「前線」より前に現れる7つの単語を
獲得しているが、その単語数は、状況により種々考えら
れる。また、重みは、指定語と最も離れた状況語「梅
雨」の重みを“1”とし、1ずつ加算した値としている
が、指定語と近い程、値が大きくなる正の値であれば、
そのようなものでも構わない。
【0040】さらに、指定語を含む文や直前の文に含ま
れる単語を状況語とすることができる。また、指定語の
前後から状況語を取得することができるのは、言うまで
もない。観点生成部110は、状況語・重み格納部10
7から状況語と重みを読み込み、連想テーブル102を
参照する。例えば、連想テーブル102の状況語「梅
雨:1」を参照すると、見出し語「雨:1」「天候:
1」「紫陽花:1」が得られる。そして、参照結果のそ
れぞれの見出し語に対する出現頻度と状況語の重みの積
を観点テーブル90の見出し語に対する出現頻度に加算
する。
れる単語を状況語とすることができる。また、指定語の
前後から状況語を取得することができるのは、言うまで
もない。観点生成部110は、状況語・重み格納部10
7から状況語と重みを読み込み、連想テーブル102を
参照する。例えば、連想テーブル102の状況語「梅
雨:1」を参照すると、見出し語「雨:1」「天候:
1」「紫陽花:1」が得られる。そして、参照結果のそ
れぞれの見出し語に対する出現頻度と状況語の重みの積
を観点テーブル90の見出し語に対する出現頻度に加算
する。
【0041】例えば、状況語「各地:3」からは、観点
テーブル90の「巡業」に“3”、「集荷」に“3”、
「遊説」に“6”が加算される。ここでは、加算する値
を状況語の重みと連想テーブル102中の説明語に対応
する見出し語の出現頻度の積としたが、正の値を与える
単調増加関数であれば、どのような関数であってもよ
い。
テーブル90の「巡業」に“3”、「集荷」に“3”、
「遊説」に“6”が加算される。ここでは、加算する値
を状況語の重みと連想テーブル102中の説明語に対応
する見出し語の出現頻度の積としたが、正の値を与える
単調増加関数であれば、どのような関数であってもよ
い。
【0042】その結果、得られる観点テーブル90にお
ける値が最も高い見出し語「天候」を観点とすることも
可能であるし、出現頻度の高い順序に並べられた見出し
語の集合を観点とすることができることは言うまでもな
い。また、観点テーブル90における観点となり得る閾
値を予め設定しておき、その値以上の見出し語を観点と
することも可能である。
ける値が最も高い見出し語「天候」を観点とすることも
可能であるし、出現頻度の高い順序に並べられた見出し
語の集合を観点とすることができることは言うまでもな
い。また、観点テーブル90における観点となり得る閾
値を予め設定しておき、その値以上の見出し語を観点と
することも可能である。
【0043】例えば、図8の例において、重みが7以上
のとき、「天候」「天気」「太陽」を観点として出力す
ることができる。なお、本発明は、上記の実施例に限定
されることなく、特許請求の範囲内において、種々変更
・応用が可能である。
のとき、「天候」「天気」「太陽」を観点として出力す
ることができる。なお、本発明は、上記の実施例に限定
されることなく、特許請求の範囲内において、種々変更
・応用が可能である。
【0044】
【発明の効果】上述のように、本発明によれば、単語の
見出しとその説明文から生成された連想テーブルを生成
し、文章中の指定語の近傍の単語を抽出して状況語と
し、状況語のそれぞれから連想される単語の頻度を参照
して状況語から連想される連想語の出現頻度を蓄積する
ことにより、文章中の単語の観点を自動的に生成するこ
とができる。
見出しとその説明文から生成された連想テーブルを生成
し、文章中の指定語の近傍の単語を抽出して状況語と
し、状況語のそれぞれから連想される単語の頻度を参照
して状況語から連想される連想語の出現頻度を蓄積する
ことにより、文章中の単語の観点を自動的に生成するこ
とができる。
【0045】さらに、従来、人間にしか行うことができ
なかった観点生成を計算機で実行させることで、多数の
文章から観点を自動的に生成し、観点に基づく類似性判
別を自動的に行うことが可能となる。さらに、本発明に
よれば、単語の見出しとその説明文から生成された連想
テーブルを生成し、文章中の指定語の近傍の単語と指定
語との近さの度合を抽出して状況語とし、当該状況語の
各々から連想される単語の頻度を参照して状況語から連
想される連想語の出現頻度と状況語の重みの積を蓄積す
ることにより、指定語に近い単語程、観点生成に影響を
及ぼす観点として取得することが可能となり、指定後の
位置に敏感な観点が生成される。
なかった観点生成を計算機で実行させることで、多数の
文章から観点を自動的に生成し、観点に基づく類似性判
別を自動的に行うことが可能となる。さらに、本発明に
よれば、単語の見出しとその説明文から生成された連想
テーブルを生成し、文章中の指定語の近傍の単語と指定
語との近さの度合を抽出して状況語とし、当該状況語の
各々から連想される単語の頻度を参照して状況語から連
想される連想語の出現頻度と状況語の重みの積を蓄積す
ることにより、指定語に近い単語程、観点生成に影響を
及ぼす観点として取得することが可能となり、指定後の
位置に敏感な観点が生成される。
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の第1の文章中の単語の視点生成装置の
構成図である。
構成図である。
【図4】本発明の第1の文章中の単語の観点生成動作を
示すフローチャートである。
示すフローチャートである。
【図5】本発明の第2の文章中の単語の視点生成装置の
構成図である。
構成図である。
【図6】本発明の第2の文章中の単語の観点生成動作を
示すフローチャートである。
示すフローチャートである。
【図7】本発明の第1の実施例の視点生成装置の構成図
である。
である。
【図8】本発明の第2の実施例の観点生成装置の構成図
である。
である。
10 辞書 40 文章 90 観点テーブル 100 観点生成装置 102 連想テーブル 103 連想テーブル生成手段、連想テーブル生成部 105 文章構成単語格納部 106 形態素解析手段、形態素解析部 107 状況語格納部、状況語・重み格納部 108 状況語決定手段、状況語決定部 110 観点生成手段、観点生成部
Claims (7)
- 【請求項1】 文章中の任意の単語(以下、指定語と記
す)に対する観点を生成する文章中の単語の観点生成方
法において、 単語の見出しとその説明文から生成された連想テーブル
を生成し、 文章中の指定語の近傍の単語を抽出して状況語とし、 前記状況語のそれぞれから連想される単語の頻度を参照
して状況語から連想される連想語の出現頻度を蓄積し、 蓄積された前記連想語の出現頻度に基づいて観点となる
単語を出力することを特徴とする文章中の単語の観点生
成方法。 - 【請求項2】 辞書の見出し語毎に説明文中の説明語の
出現頻度を求め、 各前記説明語に対応する見出し語と前記出現頻度からな
る連想テーブルを生成し、 文章を構成する単語(以下、文章構成単語と記す)を獲
得し、 前記指定語の前記文章構成単語中での近傍の単語である
状況語を抽出し、 前記状況語それぞれについて前記連想テーブルを参照
し、該連想テーブル中の説明語に対応する見出し語と出
現頻度を取得し、 前記見出し語それぞれに対する数値を蓄積する観点テー
ブルに該見出し語の出現頻度を加算し、 前記観点テーブル中で出現頻度の高い見出し語を観点と
して出力する請求項1記載の文章中の単語の観点生成方
法。 - 【請求項3】 前記文章構成単語から指定語の前記状況
語を抽出する際に、 前記指定語と前記状況語の位置関係が近い程、値が大き
くなる単調増加関数を該状況語に付与し、 前記状況語のそれぞれについて前記連想テーブル中の等
しい説明語に対応する見出し語と、出現頻度を獲得し、 前記観点テーブルに前記見出し語の出現頻度と前記状況
語に付与された前記単調増加関数の積を加算する請求項
1記載の文章中の単語の観点生成方法。 - 【請求項4】 前記状況語に付与する単調増加関数とし
て、重みを用い、 前記観点テーブルに前記見出し語の出現頻度と前記状況
語に付与された前記重みの積を加算する請求項3記載の
文章中の単語の観点生成方法。 - 【請求項5】 文章中の指定語に対する観点を生成する
文章中の単語の観点生成装置であって、 見出し語と説明文からなる辞書と、 前記辞書の前記見出し語毎に前記説明文中の説明語の出
現頻度を求め、各該説明語に対応する見出し語と該出現
頻度からなる連想テーブルを生成する連想テーブル生成
手段と、 前記文章を構成する文章構成単語を獲得する形態素解析
手段と、 前記指定語の前記文章構成単語中での近傍の単語である
状況語を抽出する状況語決定手段と、 前記状況語のそれぞれについて、前記連想テーブル中の
説明語に対応する見出し語と出現頻度を獲得し、見出し
語それぞれに対応する数値を蓄積する観点テーブルに見
出し語の出現頻度を加算し、観点テーブル中で出現頻度
の高い見出し語を観点として出力する観点生成手段とを
有することを特徴とする文章中の単語の観点生成装置。 - 【請求項6】 文章中の指定語に対する観点を生成する
文章中の単語の観点生成装置であって、 見出し語と説明文からなる辞書と、 前記辞書の前記見出し語毎に前記説明文中の説明語の出
現頻度を求め、各該説明語に対応する見出し語と該出現
頻度からなる連想テーブルを生成する連想テーブル生成
手段と、 前記文章を構成する文章構成単語を獲得する形態素解析
手段と、 前記指定語の前記文章構成語中での近傍の単語である状
況語を抽出し、該指定語と該状況語の該文章構成単語の
位置関係が近い程、値が大きくなる単調増加関数を付与
する状況語決定手段と、 前記状況語のそれぞれについて前記連想テーブル中の等
しい説明語に対応する見出し語と出現頻度を獲得し、観
点テーブルに見出し語の出現頻度と該状況語に付与され
た前記単調増加関数の積を加算し、該観点テーブルで出
現頻度の高い見出し語を観点として出力する観点生成手
段を有することを特徴とする文章中の単語の観点生成装
置。 - 【請求項7】 前記状況語決定手段は、前記単調増加関
数として重みを付与し、 前記観点生成手段は、前記状況語に付与された前記重み
の積を加算する請求項6記載の文章中の単語の観点生成
装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8190987A JPH1040253A (ja) | 1996-07-19 | 1996-07-19 | 文章中の単語の観点生成方法及び装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8190987A JPH1040253A (ja) | 1996-07-19 | 1996-07-19 | 文章中の単語の観点生成方法及び装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH1040253A true JPH1040253A (ja) | 1998-02-13 |
Family
ID=16266986
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8190987A Pending JPH1040253A (ja) | 1996-07-19 | 1996-07-19 | 文章中の単語の観点生成方法及び装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH1040253A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005326922A (ja) * | 2004-05-12 | 2005-11-24 | Fujitsu Ltd | 特徴情報抽出方法、特徴情報抽出プログラム、および特徴情報抽出装置 |
| WO2006085455A1 (ja) * | 2005-02-14 | 2006-08-17 | Justsystems Corporation | 文書処理装置および文書処理方法 |
| JP2009129098A (ja) * | 2007-11-21 | 2009-06-11 | Kddi Corp | 情報検索装置およびコンピュータプログラム |
| CN114648027A (zh) * | 2022-05-23 | 2022-06-21 | 每日互动股份有限公司 | 一种文本信息的处理方法、装置、计算机设备及存储介质 |
-
1996
- 1996-07-19 JP JP8190987A patent/JPH1040253A/ja active Pending
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005326922A (ja) * | 2004-05-12 | 2005-11-24 | Fujitsu Ltd | 特徴情報抽出方法、特徴情報抽出プログラム、および特徴情報抽出装置 |
| US7715631B2 (en) | 2004-05-12 | 2010-05-11 | Fujitsu Limited | Method and apparatus for extracting feature information, and computer product |
| WO2006085455A1 (ja) * | 2005-02-14 | 2006-08-17 | Justsystems Corporation | 文書処理装置および文書処理方法 |
| JPWO2006085455A1 (ja) * | 2005-02-14 | 2008-06-26 | 株式会社ジャストシステム | 文書処理装置および文書処理方法 |
| JP2009129098A (ja) * | 2007-11-21 | 2009-06-11 | Kddi Corp | 情報検索装置およびコンピュータプログラム |
| CN114648027A (zh) * | 2022-05-23 | 2022-06-21 | 每日互动股份有限公司 | 一种文本信息的处理方法、装置、计算机设备及存储介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN113468339B (zh) | 基于知识图谱的标签提取方法、系统、电子设备及介质 | |
| KR102334255B1 (ko) | AI 기반 음성서비스의 Text Data 수집 플랫폼 구축 및 통합관리방법 | |
| CN112948544B (zh) | 一种基于深度学习与质量影响的图书检索方法 | |
| EP2862104A1 (en) | Search method and apparatus | |
| KR102334236B1 (ko) | 음성 변환 Text Data에서 의미있는 키워드 추출 방법과 활용 | |
| US9652997B2 (en) | Method and apparatus for building emotion basis lexeme information on an emotion lexicon comprising calculation of an emotion strength for each lexeme | |
| CN111079448A (zh) | 一种意图识别方法及装置 | |
| CN117171331B (zh) | 基于大型语言模型的专业领域信息交互方法、装置及设备 | |
| CN110196910B (zh) | 一种语料分类的方法及装置 | |
| KR101933953B1 (ko) | 페이지랭크와 토픽 모델링을 이용한 소프트웨어 도메인 토픽 추출 시스템 | |
| US8862586B2 (en) | Document analysis system | |
| CN103226601B (zh) | 一种图片搜索的方法和装置 | |
| JP2004219714A (ja) | 人間からの指示に基づいてそれぞれ予め定めた特定のシーンに属する対話のシーンを識別し、シーンに即した自然対話を構成する応答文を作成して、それを音声合成することにより、音声対話を行うコンピュータによる音声対話方法及び音声対話システム | |
| KR20180101955A (ko) | 문헌 스코어링 방법 및 문헌 검색 시스템 | |
| JP3921837B2 (ja) | 情報判別支援装置、情報判別支援プログラムを記録した記録媒体及び情報判別支援方法 | |
| CN113505889B (zh) | 图谱化知识库的处理方法、装置、计算机设备和存储介质 | |
| CN110019702B (zh) | 数据挖掘方法、装置和设备 | |
| JPH1049543A (ja) | 文書検索装置 | |
| CN120849683A (zh) | 一种图书馆智能搜索排序方法及系统 | |
| KR20200117542A (ko) | 링크 생성 장치 및 방법 | |
| JPH11110409A (ja) | 情報分類方法及び装置 | |
| JPH1040253A (ja) | 文章中の単語の観点生成方法及び装置 | |
| JP3693514B2 (ja) | 文書検索・分類方法および装置 | |
| CN110851560A (zh) | 信息检索方法、装置及设备 | |
| CN110610001B (zh) | 短文本完整性识别方法、装置、存储介质及计算机设备 |