JPH11328221A - データ検索方法、その装置および記録媒体 - Google Patents

データ検索方法、その装置および記録媒体

Info

Publication number
JPH11328221A
JPH11328221A JP10150679A JP15067998A JPH11328221A JP H11328221 A JPH11328221 A JP H11328221A JP 10150679 A JP10150679 A JP 10150679A JP 15067998 A JP15067998 A JP 15067998A JP H11328221 A JPH11328221 A JP H11328221A
Authority
JP
Japan
Prior art keywords
search
data
word
relevance
related word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10150679A
Other languages
English (en)
Other versions
JP3547074B2 (ja
Inventor
Masakatsu Okubo
雅且 大久保
Masayuki Sugizaki
正之 杉崎
Takashi Inoue
孝史 井上
Kazuo Tanaka
一男 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP15067998A priority Critical patent/JP3547074B2/ja
Publication of JPH11328221A publication Critical patent/JPH11328221A/ja
Application granted granted Critical
Publication of JP3547074B2 publication Critical patent/JP3547074B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 入力された検索式に含まれる検索語だけでは
なく、その関連語も含めて、検索式と検索データとの関
連度を求めて順位付けすることによって、利用者の欲す
る情報を優先して出力させることができ、操作性の向上
した情報検索方法および装置を提供することを目的とす
るものである。 【解決手段】 所定の語と、この所定の語に関連する関
連語とが対応して格納され、サーバに設けられている関
連語辞書と、検索式に含まれている検索語の関連語を、
上記関連語辞書を用いて抽出する関連語抽出手段と、上
記関連語を用いて、上記検索式と検索結果である検索デ
ータとの関連度を計算する関連度計算手段と、上記関連
度計算手段が計算した結果に基づいて、上記検索データ
を順位付けする検索データ順位付け手段とを有するもの
である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コンピュータネッ
トワークを用いたデータ検索装置およびその方法に係
り、特に、検索の結果、多数のデータが選択された場合
に、自動的に検索データを分類し、出力するデータ検索
装置および方法に関する。
【0002】
【従来の技術】データ検索とは、文書等の集合をデータ
ベース等に蓄積し、利用者が与えた検索式に関連する文
書を、そのデータベースから取り出す技術である。検索
式とは、たとえば「通信」のような1つの単語だけでは
なく、「通信AND計算機」のように、「通信」と「計
算機」との両方の単語に関連する文書の取り出しを指定
したり、「通信OR計算機」のように、「通信」と「計
算機」とのうちのいずれかの単語に関連する文書の取り
出しを指定する式である。ここで「単語に関連する文
書」とは、ある文書にキーワードとしてある単語が予め
付与されている場合、そのキーワードに対応する文書で
あり、また、ある文書中にある単語が含まれている場
合、その単語に対応する文書である。
【0003】従来、入力された検索式に従って検索し、
照合したデータを提供するデータ検索システムにおい
て、適合するデータが複数である場合、データベースに
格納されている順序で出力、表示されることが一般的で
ある。しかし、多数のデータが選択された場合、検索デ
ータの中から利用者が所望のデータを得ることが困難で
あり、利用者の作業が膨大になるという問題がある。
【0004】そこで、文献(Donna Harman,"Ranking Al
gorithms",in William B.Frakesand Ricardo Baeza-Yat
es eds. Information Retrieval, pp.363-392, Prentic
eHall, 1992)には、入力された検索式に含まれる各検索
語の使用頻度に基づいて、検索式と各検索データとの関
連度を求める方法について記載されている。
【0005】また、特開平04−252376に記載さ
れているデータベース検索装置は、ユーザ別フリーキー
ワード格納部を設け、キーワードを含有する数の多い順
に検索データを並び替え、つまり、検索データを順位付
けし、この順位付けされた検索データを表示するように
している。
【0006】
【発明が解決しようとする課題】ところで、従来の順位
付け装置または方法では、検索式に含まれる各検索語
と、検索データであるデータとの関連度とに基づいて、
検索データを順位付けしている。このため、対象となる
データが変わらなければ、同一の検索式に対する検索デ
ータの順位は、常に同じである。
【0007】しかし、実際には、利用者が検索しようと
するデータは、同じ検索語を用いた場合でも、その時々
で変化する。たとえば、「天気」という同一の検索語を
用いて検索しようとするデータは、各地の天気であった
り、台風の現在位置や進路であったり、大雪の状況や道
路の交通規制・鉄道などの運行状況であったり、夏休み
期間の天気の一覧であったり、というように、検索した
いデータは、同じ検索語を用いた場合でも、その時々で
異なる。
【0008】または、「オリンピック」という検索語を
用いて検索しようとするデータは、オリンピックの開催
中では競技結果に関するデータであったり、開催後は次
のオリンピックに関するデータであったり、というよう
に検索したいデータは、その時々で変わる。
【0009】ところが、従来のデータ検索システムでは
このような情報ニーズの変化には対応できていない。
【0010】本発明は、入力された検索式に含まれる検
索語だけではなく、その関連語も含めて、検索式と検索
データとの関連度を求めて順位付けすることによって、
利用者の欲する情報を優先して出力させることができ、
操作性の向上した情報検索方法および装置を提供するこ
とを目的とするものである。
【0011】
【課題を解決するための手段】本発明は、端末装置から
入力された検索式に基づいて、所定のサーバが、所定デ
ータを検索し、この検索されたデータを上記端末装置に
提供するデータ検索装置において、所定の語と、この所
定の語に関連する関連語とが対応して格納され、上記サ
ーバに設けられている関連語辞書と、上記検索式に含ま
れている検索語の関連語を、上記関連語辞書を用いて抽
出する関連語抽出手段と、上記関連語を用いて、上記検
索式と検索結果である検索データとの関連度を計算する
関連度計算手段と、上記関連度計算手段が計算した結果
に基づいて、上記検索データを順位付けする検索データ
順位付け手段とを有することを特徴とするデータ検索装
置である。
【0012】
【発明の実施の形態および実施例】図1は、本発明の一
実施例であるデータ検索装置DS1を示すブロック図で
ある。
【0013】データ検索装置DS1は、情報サーバに設
けられている装置であり、ネットワークを介して端末装
置から送られた検索式を受信する検索式受信部10と、
情報データベースDB1と、データ検索部20と、関連
語抽出部30と、関連語辞書Dと、関連度計算部40
と、検索データ順位付け部50と、検索データ送信部6
0とを有する装置である。
【0014】データ検索装置DS1は、端末装置から入
力された検索式に含まれる検索語の関連語を検索し、こ
の関連語を用いて、検索結果である検索データを順位付
けして端末装置に出力するものであり、また、関連語
と、検索語と関連語との関連度とを関連語辞書に格納
し、この関連語と関連度とを用いて、検索データに優先
順位を付与して端末装置に出力するものである。
【0015】関連語辞書Dは、所定の語と、この所定の
語に関連する関連語とが対応して格納され、上記サーバ
に設けられている辞書であり、過去の所定期間に行われ
た検索におけるデータを解析し、この解析されたデータ
に基づいて、予め作成された辞書である。
【0016】関連語抽出部30は、上記検索式に含まれ
ている検索語の関連語を、関連語辞書Dを用いて抽出す
る手段である。
【0017】図2は、上記実施例の動作を示すフローチ
ャートである。
【0018】まず、ネットワークを介して端末装置から
入力された検索式を検索式受信部10が受信し(S
1)、この入力された検索式に基づいて、情報データベ
ースDB1から所定データを検索する(S2)。そし
て、受信された検索式を各検索語に分解し(S3)、こ
の分解された各検索語に関する関連語を、関連語辞書D
を用いて抽出し(S4)、この抽出された関連語を用い
て、上記検索された各検索データと検索式との関連度を
求める(S5)。
【0019】そして、この求められた関連度に基づい
て、ステップS2で検索された検索データを順位付けし
(S6)、この順位付けされた検索データを端末装置に
送信する(S7)。
【0020】なお、上記フローチャートにおいて、各検
索語へ分解し、検索語の関連語を抽出した(S3、S
4)後に、検索式に基づいてデータを検索する(S2)
ようにしてもよい。
【0021】関連語辞書Dは、過去の所定期間に行われ
た検索におけるデータを解析する後述のデータ関連付け
装置70を用いて作成したものである。
【0022】図3は、上記実施例におけるデータ関連付
け装置70を示す図である。
【0023】図3(1)に示すデータ関連付け装置70
は、同一の利用者によって使用された検索語は、その使
用時間間隔が短ければ同じデータを求めるために使用さ
れた検索語であり、その使用時間間隔が長ければ別のデ
ータを求めるために使用された検索語であり、使用時間
間隔が短い程、関連の度合い(関連度)が高いという考
えに基づく装置である。また、データ関連付け装置70
は、ユーザ別検索時刻・検索式抽出部71と、検索式分
解部72と、最小時刻差計算部73と、関連度計算・集
計部74とを有する。
【0024】ユーザ別検索時刻・検索式抽出部71は、
過去の所定期間中に行われた検索におけるデータから、
検索ユーザ毎に、検索時刻と検索式とを抽出する手段で
ある。検索式分解部72は、ユーザ別検索時刻・検索式
抽出部71によって抽出された複数の検索式のうちの1
つの検索式が使用された時刻と、上記抽出された複数の
検索式のうちの別の検索式が使用された時刻との時刻差
のうちの最小値である最小時刻差を、上記検索ユーザ毎
に計算する手段である。
【0025】最小時刻差計算部73は、所定の検索ユー
ザにおける上記最小時刻差に基づいて、上記最小時刻差
に対応する上記1つの検索式と上記別の検索式との関連
度を、上記所定の検索ユーザ毎に計算し、複数の上記検
索ユーザについて計算された上記関連度を集計する手段
である。関連度計算・集計部74は、最小時刻差に基づ
いて、2つの検索語同士の関連度を求め、全ユーザにつ
いて集計するものである。
【0026】また、最小時刻差計算部73は、上記検索
式を検索語に分解し、上記分解された検索語のうちの1
つの検索語が使用された時刻と、上記分解された検索語
のうちの別の検索語が使用された時刻との時刻差のうち
の最小値である最小時刻差を、上記検索ユーザ毎に計算
する手段である。
【0027】関連度計算・集計部74は、所定の検索ユ
ーザにおける上記最小時刻差に基づいて、上記最小時刻
差に対応する上記1つの検索語と上記別の検索語との関
連度を、所定の検索ユーザ毎に計算し、複数の検索ユー
ザについて計算された上記関連度を集計する手段であ
る。
【0028】また、関連度計算は、たとえば、最小時刻
差が0秒であれば(同一検索式に2つの検索語が存在す
れば)、検索語同士の関連度を「2」とし、最小時刻差
が0〜60秒であれば、関連度を「1」とし、最小時刻
差が300秒以上であれば、関連度を「0」とし、60
〜300秒の間は、1次関数を用いて求める。
【0029】図3(2)は、相関係数検出装置80を示
すブロック図である。
【0030】相関係数検出装置80は、ある一定の時期
に、多数の利用者が同一のデータを求めた場合、その検
索に使用された検索語の使用頻度傾向は似ているという
考えに基づく装置であり、2つの検索語の使用頻度に応
じて2つの検索語の間の相関係数を求める装置である。
また、相関係数検出装置80は、時間別・ユーザ別集計
部81と、検索式分解部82と、検索語集計部83と、
相関係数計算部84とを有する装置である。
【0031】時間別・ユーザ別集計部81は、使用され
た検索式を、日毎、ユーザ毎にまとめるものであり、つ
まり、過去の所定期間中に行われた検索におけるデータ
から、所定時間毎に検索ユーザ毎に、検索式を抽出する
手段である。検索式分解部82は、検索ユーザ毎に、検
索式を検索語へ分解し、重複を除く手段である。
【0032】検索語集計部83は、日毎、検索語毎の使
用頻度を集計するものであり、つまり、所定時間毎にお
ける各検索語の使用回数を検索ユーザ毎に計算し、検索
ユーザ毎に計算された各検索語の使用回数を、全ての検
索ユーザについて集計する手段である。相関係数計算部
84は、日毎に集計された各検索語の使用頻度に基づ
き、それぞれの時系列間における2つの検索語の相関係
数を求めるものであり、集計された所定時間毎における
各検索語の使用回数に基づいて、2つの検索語相互間の
相関係数を計算する手段である。
【0033】上記実施例は、上記2つの関連度を用いて
関連語辞書Dを作成するので、データニーズを直接反映
した、タイムリーな関連語を求めることができ、一般的
な同義語ではなく、その時期に同義語的に用いられた関
連語を集約した関連語辞書Dを得ることができる。この
ように、上記実施例は、この関連語辞書Dを用いて広告
データベースDB2を検索するので、データニーズを反
映した、利用者が欲しい広告を選択することができ、宣
伝効果を上げることができる。
【0034】次に、上記実施例において、検索式と各検
索データとの関連度の求め方について説明する。
【0035】上記実施例では、入力された検索語をXと
し、データD1 、D2 、……、Dmは、検索されたデー
タであるとする。
【0036】図4は、上記実施例における関連語辞書D
の一例を示す図である。
【0037】関連語辞書Dには、各検索語毎に、それと
関連する関連語と、検索語とこの検索語と関連する関連
語との関連度とが格納されている。
【0038】図4に示す例において、検索語はXであ
り、関連語Y1 、Y2 、Y3 、……、Yn は、検索語X
と関連する関連語であり、関連度Z1 、Z2 、Z3 …、
n は、検索語Xと、関連語Y1 、Y2 、Y3 、……、
n のそれぞれとの関連度である。
【0039】次に、検索データDj と検索語Xとの関連
度SCORE(Dj ,X)を求める計算について説明す
る。ただしj=1、2、……、mである。なお、関連度
SCORE(Dj ,X)は、文書(検索データDj )と
語(検索語X)との関連度であり、一方、関連度Zは、
語と語との関連度である。
【0040】関連度SCORE(Dj ,X)は、次の式
1で示される。なお、関数f(X,Dj )は、検索デー
タDj に含まれる検索語(単語)Xの数であり、SIZ
E(Dj )は、検索データDj の大きさ(バイト数)で
あり、Zi ’は、各関連度Zi を0から1の間に正規化
した値であり、たとえば、Zi ’=Zi /(Z1 +Z2
+……+Zn )である。また、関数f(Y1 ,Dj
は、検索データDj に含まれる関連語Yの数である。
【0041】 SCORE(Dj ,X)=f(X,Dj )+f(Y1 ,Dj )+f(Y2 ,D j )+……+f(Yn ,Dj ) (式1) この式1は、各検索データに含まれている関連語の数に
応じて、検索語Xとの関連度SCORE(Dj ,X)を
求める式である。
【0042】 SCORE(Dj ,X)={f(X,Dj )+f(Y1 ,Dj )+f(Y2 , Dj )+……+f(Yn ,Dj )}/SIZE(Dj ) (式2) 式2は、検索データが大きな場合における関連度SCO
RE(Dj ,X)を求める式であり、大きな検索データ
には、出てくる関連語の数も多くなるので、データの大
きさSIZE(Dj )で正規化することによって、関連
度SCORE(Dj ,X)を求める。
【0043】 SCORE(Dj ,X)=f(X,Dj )+Z1 ・f(Y1 ,Dj )+Z2 ・ f(Y2 ,Dj )+……+Zn ・f(Yn ,Dj ) (式3) 式3は、検索語Xと各関連語Yi とが含まれる数と、関
連度Zi とを掛け合わせることによって、関連の高い関
連語Yi が多く出現する程、検索語Xとの関連度も大き
くなることを考慮した式である。
【0044】 SCORE(Dj ,X)={f(X,Dj )+Z1 ・f(Y1 ,Dj )+Z2 ・f(Y2 ,Dj )+……+Zn ・f(Yn ,Dj )}/SIZE(Dj ) (式4) 式4は、式3を、データの大きさで正規化した式であ
る。
【0045】 SCORE(Dj ,X)=f(X,Dj )+Z1 ’・f(Y1 ,Dj )+Z2 ’・f(Y2 ,Dj )+……+Zn ’・f(Yn ,Dj ) (式5) 式5は、各関連度Zi を正規化して掛け合わせた式であ
る。
【0046】 SCORE(Dj ,X)={f(X,Dj )+Z1 ’・f(Y1 ,Dj )+Z 2 ’・f(Y2 ,Dj )+……+Zn ’・f(Yn ,Dj )}/SIZE(Dj ) (式6) 式6は、式5を、データの大きさで正規化した式であ
る。
【0047】上記式1〜式6は、検索語Xと、検索語X
によって検索された検索データDjとの関連度を求める
計算式の例であるが、検索語Xと、関連語または関連度
とを用いた計算法であれば、上記式以外の式を使用する
ようにしてもよい。
【0048】上記のように計算されたデータの関連度に
基づいて、検索データをソートすることによって、関連
性の高いデータから優先順位付けされて出力される。
【0049】次に、「サッカー」という検索語を例にと
って、関連度の計算を具体的に説明する。
【0050】1997年に、サッカーのワールドカップ
・フランス大会のアジア地区予選が行われ、11月16
日にマレーシアで行われたイランチームとの試合に日本
チームが勝利し、翌年のフランス大会への出場を決め
た。
【0051】ここで、利用者が、「サッカー」という語
を用いて検索したい情報は、地区予選時には相手チーム
の情報や試合の速報結果等であり、フランス大会への出
場を決めた16日以降は、フランスでの大会に関連した
情報であると推測できる。
【0052】図5は、上記実施例において、検索語「サ
ッカー」との関連語と、これらの関連度との例を示す図
である。
【0053】図5(1)は、上記実施例において、11
月の10日〜16日の1週間における検索ログ(過去の
所定期間に行われた検索におけるデータ)に基づいて求
めた検索語「サッカー」との関連語と、検索語「サッカ
ー」と上記関連語との関連度とを示す図である。
【0054】図5(2)は、11月17日〜23日の1
週間における検索ログ(過去の所定期間に行われた検索
におけるデータ)に基づいて求めた検索語「サッカー」
との関連語と、検索語「サッカー」と上記関連語との関
連度とを示す図であり、図5(1)に示す推測と一致し
ている。
【0055】さて、上記実施例を用いて、「サッカー」
と、「サッカー」によって検索された各検索データとの
関連度を計算する。
【0056】アジア地区予選時には、「ワールドカッ
プ」、「日本代表」、「イラン」、「速報」、「マレー
シア」という語を多く含むほど、各検索データにおける
「サッカー」との関連度は高くなる。
【0057】図6は、上記実施例において、キーワード
として「サッカー」を使用して検索した場合、検索語
「サッカー」とその検索データとを示す図である。
【0058】サッカーに関連するデータには、学生サッ
カーやプロサッカーに関するもの、ルールや基本技術等
に関するもの等様々であるが、この時期には、その中で
も、特に、ワールドカップのアジア予選に関連した、チ
ーム紹介や試合の速報等のデータが上位に順位付けさ
れ、図6(1)に示すように構成され、利用者に提供さ
れる。
【0059】一方、本戦出場の決定後は、「ワールドカ
ップ」、「フランス」、「ツアー」、「チケット」、
「観戦」という語を多く含んでいるデータとの関連度が
大きくなるので、「サッカー」に関するデータの中で
も、特に、翌年の本大会のチケット情報や観戦ツアー等
のデータが上位に順位付けされ、図6(2)に示すよう
に構成され、利用者に提供される。
【0060】このように、関連語を用いてデータを順位
付けして出力するので、多くの利用者が望んでいるデー
タを常に上位に提示することができ、利用者の検索を著
しく効率化することができる。
【0061】図7は、本発明の他の実施例であるデータ
検索装置DS2を示すブロック図である。
【0062】このデータ検索装置DS2は、基本的に
は、データ検索装置DS1と同じであり、情報関連付け
部90が設けられている点が、データ検索装置DS1と
異なる点である。
【0063】データ関連づけ部90は、過去の所定期間
に行われた検索における情報データベースと、データ関
連づけ装置70とを有し、検索式が入力されるとその過
去の所定期間に行われた検索におけるデータに基づいて
関連語を作成し、関連語辞書Dを更新するものであり、
これによって、常に、データニーズを反映した関連語が
得られるようになっている。
【0064】データ検索装置DS2は、情報関連付け部
90を有するので、常に情報ニーズを反映した関連語を
得ることができる。
【0065】上記実施例によれば、従来と同様に入力さ
れた検索式を用いてデータベースから情報を選択するこ
とができるとともに、関連語辞書Dから得られる関連語
を用いて検索データを順位付けするので、利用者の意図
に沿ったデータから順に優先的に出力され、利用者が所
望の情報を得るまでの時間、負担を軽減することができ
る。
【0066】そして、多数の利用者が所定期間に使用し
た検索ログを解析して作成した関連語辞書Dを用いれ
ば、一般的な同義語ではなく、その時期に同義語的に用
いられた関連語を集約できるので、現在の情報ニーズを
反映した抽出が可能であり、多くの利用者が欲した情報
が上位に提示される。
【0067】また、上記実施例を記録媒体の発明として
把握することができる。つまり、上記実施例は、端末装
置から入力された検索式に基づいて、所定のサーバが、
所定データを検索し、この検索されたデータを上記端末
装置に提供するデータ検索装置において、所定の語と、
この所定の語に関連する関連語とが対応して格納されて
いる関連語辞書をサーバに設ける関連語辞書設置手順
と、端末装置から入力された検索式に含まれている検索
語の関連語を、上記関連語辞書を用いて抽出する関連語
抽出手順と、上記関連語を用いて、上記検索式と検索結
果である検索データとの関連度を計算する関連度計算手
順と、上記関連度計算手順で計算した結果に基づいて、
上記検索データを順位付けする検索データ順位付け手順
とをコンピュータに実行させるプログラムを記録したコ
ンピュータ読み取り可能な記録媒体の例である。この記
憶媒体の例としては、CD、FD、ハードディスク、半
導体メモリ等がある。
【0068】
【発明の効果】本発明によれば、多くの利用者が使用し
た所定期間の検索データを解析することによって得られ
た関連語辞書を設け、検索語の関連語を検索し、検索デ
ータを自動的に順位付けして出力するので、利用者が欲
する情報を優先して出力させることができ、したがっ
て、情報提供システムの操作性が極めて向上するという
効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施例であるデータ検索装置DS1
を示すブロック図である。
【図2】上記実施例の動作を示すフローチャートであ
る。
【図3】上記実施例におけるデータ関連付け装置70を
示す図である。
【図4】上記実施例における関連語辞書Dの一例を示す
図である。
【図5】上記実施例において、検索語「サッカー」との
関連語と、これらの関連度との例を示す図である。
【図6】上記実施例において、キーワードとして「サッ
カー」を使用して検索した場合、検索語「サッカー」と
その検索データとを示す図である。
【図7】本発明の他の実施例であるデータ検索装置DS
2を示すブロック図である。
【符号の説明】
DS1、DS2…データ検索装置、 DB1…情報データベース、 D…関連語辞書、 10…検索式受信部、 20…データ検索部、 30…関連語抽出部、 40…関連度計算部、 50…検索データ順位付け部、 60…検索データ送信部、 70…データ関連付け装置、 80…相関係数検出装置、 90…データ関連付け部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 田中 一男 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 端末装置から入力された検索式に基づい
    て、所定のサーバが、所定データを検索し、この検索さ
    れたデータを上記端末装置に提供するデータ検索装置に
    おいて、 所定の語と、この所定の語に関連する関連語とが対応し
    て格納され、上記サーバに設けられている関連語辞書
    と;上記検索式に含まれている検索語の関連語を、上記
    関連語辞書を用いて抽出する関連語抽出手段と;上記関
    連語を用いて、上記検索式と検索結果である検索データ
    との関連度を計算する関連度計算手段と;上記関連度計
    算手段が計算した結果に基づいて、上記検索データを順
    位付けする検索データ順位付け手段と;を有することを
    特徴とするデータ検索装置。
  2. 【請求項2】 請求項1において、 上記関連度計算手段は、 上記検索式と上記検索データとの関連度を計算する場
    合、各検索データに含まれる上記関連語の数を用いて計
    算する手段であることを特徴とするデータ検索装置。
  3. 【請求項3】 請求項2において、 上記関連語辞書は、 関連語と、上記関連語と検索語との関連度とを格納する
    辞書であり、 上記関連度計算手段は、 上記検索式と上記各検索データとの関連度を計算する場
    合、上記各検索データに含まれる上記関連語の数と上記
    関連度とを用いて計算手段であることを特徴とするデー
    タ検索装置。
  4. 【請求項4】 請求項1〜3の少なくとも1項におい
    て、 上記関連語辞書は、 過去の所定期間に行われた検索におけるデータを解析
    し、この解析されたデータに基づいて、予め作成された
    辞書であることを特徴とするデータ検索装置。
  5. 【請求項5】 端末装置から入力された検索式に基づい
    て、所定のサーバが、所定データを検索し、この検索さ
    れたデータを上記端末装置に提供するデータ検索装置に
    おいて、 所定の語と、この所定の語に関連する関連語とが対応し
    て格納されている関連語辞書を上記サーバに設ける関連
    語辞書設置段階と;上記検索式に含まれている検索語の
    関連語を、上記関連語辞書を用いて抽出する関連語抽出
    段階と;上記関連語を用いて、上記検索式と検索結果で
    ある検索データとの関連度を計算する関連度計算段階
    と;上記関連度計算段階で計算した結果に基づいて、上
    記検索データを順位付けする検索データ順位付け段階
    と;を有することを特徴とするデータ検索方法。
  6. 【請求項6】 請求項5において、 上記関連度計算段階は、 上記検索式と上記検索データとの関連度を計算する場
    合、各検索データに含まれる上記関連語の数を用いて計
    算する段階であることを特徴とするデータ検索方法。
  7. 【請求項7】 請求項6において、 上記関連語辞書は、 関連語と、上記関連語と検索語との関連度とを格納する
    辞書であり、 上記関連度計算段階は、 上記検索式と上記各検索データとの関連度を計算する場
    合、上記各検索データに含まれる上記関連語の数と上記
    関連度とを用いて計算段階であることを特徴とするデー
    タ検索方法。
  8. 【請求項8】 請求項5〜7の少なくとも1項におい
    て、 上記関連語辞書は、 過去の所定期間に行われた検索におけるデータを解析
    し、この解析されたデータに基づいて、予め作成された
    辞書であることを特徴とするデータ検索方法。
  9. 【請求項9】 端末装置から入力された検索式に基づい
    て、所定のサーバが、所定データを検索し、この検索さ
    れたデータを上記端末装置に提供するデータ検索装置に
    おいて、 所定の語と、この所定の語に関連する関連語とが対応し
    て格納されている関連語辞書をサーバに設ける関連語辞
    書設置手順と;端末装置から入力された検索式に含まれ
    ている検索語の関連語を、上記関連語辞書を用いて抽出
    する関連語抽出手順と;上記関連語を用いて、上記検索
    式と検索結果である検索データとの関連度を計算する関
    連度計算手順と;上記関連度計算手順で計算した結果に
    基づいて、上記検索データを順位付けする検索データ順
    位付け手順と;をコンピュータに実行させるプログラム
    を記録したコンピュータ読み取り可能な記録媒体。
JP15067998A 1998-05-14 1998-05-14 データ検索方法、その装置および記録媒体 Expired - Fee Related JP3547074B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15067998A JP3547074B2 (ja) 1998-05-14 1998-05-14 データ検索方法、その装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15067998A JP3547074B2 (ja) 1998-05-14 1998-05-14 データ検索方法、その装置および記録媒体

Publications (2)

Publication Number Publication Date
JPH11328221A true JPH11328221A (ja) 1999-11-30
JP3547074B2 JP3547074B2 (ja) 2004-07-28

Family

ID=15502111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15067998A Expired - Fee Related JP3547074B2 (ja) 1998-05-14 1998-05-14 データ検索方法、その装置および記録媒体

Country Status (1)

Country Link
JP (1) JP3547074B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005310094A (ja) * 2003-10-06 2005-11-04 Nippon Telegr & Teleph Corp <Ntt> キーワード拡張装置と方法およびコンテンツ検索システムならびにコンテンツ情報提供システムと方法およびグループ化条件決定装置と方法ならびにプログラム
JP2008027207A (ja) * 2006-07-21 2008-02-07 Gunma Univ 検索装置及び検索方法
JP2008134800A (ja) * 2006-11-28 2008-06-12 Ntt Docomo Inc 検索システムおよび検索方法
JP2008186432A (ja) * 2007-01-31 2008-08-14 Yahoo Japan Corp イベント検索システム、イベント検索装置、イベント検索結果出力方法およびプログラム
JP2009031931A (ja) * 2007-07-25 2009-02-12 Univ Waseda 検索語クラスタリング装置、検索語クラスタリング方法、検索語クラスタリングプログラム及び記録媒体
JP2009122807A (ja) * 2007-11-13 2009-06-04 Nomura Securities Co Ltd 連想検索システム
JP2009157643A (ja) * 2007-12-26 2009-07-16 Mizuho Information & Research Institute Inc 説明表示システム、説明表示方法及び説明表示プログラム
JP2013534673A (ja) * 2010-06-28 2013-09-05 ヤフー! インコーポレイテッド 無限ブラウズ

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH021059A (ja) * 1988-06-07 1990-01-05 Hitachi Ltd 連想検索システム
JPH03296863A (ja) * 1990-04-16 1991-12-27 Ricoh Co Ltd キーワード関係辞書管理装置
JPH0481973A (ja) * 1990-07-24 1992-03-16 Ricoh Co Ltd 文書検索装置
JPH08137898A (ja) * 1994-11-08 1996-05-31 Nippon Telegr & Teleph Corp <Ntt> 文書検索装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH021059A (ja) * 1988-06-07 1990-01-05 Hitachi Ltd 連想検索システム
JPH03296863A (ja) * 1990-04-16 1991-12-27 Ricoh Co Ltd キーワード関係辞書管理装置
JPH0481973A (ja) * 1990-07-24 1992-03-16 Ricoh Co Ltd 文書検索装置
JPH08137898A (ja) * 1994-11-08 1996-05-31 Nippon Telegr & Teleph Corp <Ntt> 文書検索装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005310094A (ja) * 2003-10-06 2005-11-04 Nippon Telegr & Teleph Corp <Ntt> キーワード拡張装置と方法およびコンテンツ検索システムならびにコンテンツ情報提供システムと方法およびグループ化条件決定装置と方法ならびにプログラム
JP2008027207A (ja) * 2006-07-21 2008-02-07 Gunma Univ 検索装置及び検索方法
JP2008134800A (ja) * 2006-11-28 2008-06-12 Ntt Docomo Inc 検索システムおよび検索方法
JP2008186432A (ja) * 2007-01-31 2008-08-14 Yahoo Japan Corp イベント検索システム、イベント検索装置、イベント検索結果出力方法およびプログラム
JP2009031931A (ja) * 2007-07-25 2009-02-12 Univ Waseda 検索語クラスタリング装置、検索語クラスタリング方法、検索語クラスタリングプログラム及び記録媒体
JP2009122807A (ja) * 2007-11-13 2009-06-04 Nomura Securities Co Ltd 連想検索システム
JP2009157643A (ja) * 2007-12-26 2009-07-16 Mizuho Information & Research Institute Inc 説明表示システム、説明表示方法及び説明表示プログラム
JP2013534673A (ja) * 2010-06-28 2013-09-05 ヤフー! インコーポレイテッド 無限ブラウズ

Also Published As

Publication number Publication date
JP3547074B2 (ja) 2004-07-28

Similar Documents

Publication Publication Date Title
US7505956B2 (en) Method for classification
KR100544514B1 (ko) 검색 쿼리 연관성 판단 방법 및 시스템
US8117177B2 (en) Apparatus and method for searching information based on character strings in documents
US6389412B1 (en) Method and system for constructing integrated metadata
US9183250B2 (en) Query disambiguation
US8001118B2 (en) Methods and apparatus for employing usage statistics in document retrieval
CN103282903B (zh) 话题提取装置及其方法
EP1555625A1 (en) Query recognizer
JP2001519952A (ja) データ要約装置
KR19990013736A (ko) 키워드 추출 시스템 및 그를 사용한 문서 검색 시스템
JPH10320419A (ja) 情報関連づけ装置およびその方法
US20100257177A1 (en) Document rating calculation system, document rating calculation method and program
CN120104814B (zh) 基于事件驱动知识图谱嵌入的游戏攻略检索方法及装置
US20080243835A1 (en) Program, method and apparatus for web page search
JP5543384B2 (ja) ローカルクエリ抽出装置、ローカルクエリ抽出プログラム、およびローカルクエリ抽出方法
JP2002073677A (ja) 閲覧者の個人嗜好情報収集装置およびこれを利用した情報閲覧支援装置
US7698330B2 (en) Search system for providing information of keyword input frequency by category and method thereof
JP2008268985A (ja) タグを付与する方法
JP3547074B2 (ja) データ検索方法、その装置および記録媒体
US20100057724A1 (en) Server device for creating list of general words to be excluded from search result
JP2003173352A (ja) 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体
US20020062341A1 (en) Interested article serving system and interested article serving method
JP2003271669A (ja) 話題抽出装置
JP2006120069A (ja) 話題文書提示方法及び装置及びプログラム
KR100525616B1 (ko) 연관 검색 쿼리 추출 방법 및 시스템

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040409

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090423

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090423

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100423

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100423

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110423

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120423

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees