JP2000215206A - ホ―ムペ―ジ検索システム - Google Patents

ホ―ムペ―ジ検索システム

Info

Publication number
JP2000215206A
JP2000215206A JP11016387A JP1638799A JP2000215206A JP 2000215206 A JP2000215206 A JP 2000215206A JP 11016387 A JP11016387 A JP 11016387A JP 1638799 A JP1638799 A JP 1638799A JP 2000215206 A JP2000215206 A JP 2000215206A
Authority
JP
Japan
Prior art keywords
search
data
homepage
keyword
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11016387A
Other languages
English (en)
Inventor
Yoshie Komatsu
良江 小松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP11016387A priority Critical patent/JP2000215206A/ja
Publication of JP2000215206A publication Critical patent/JP2000215206A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 センター側と端末側とで段階的な検索を行う
ことで、利用者がより的確に所望する情報を取得するこ
とができるホームページ検索システムを提供することで
ある。 【解決手段】 端末100よりセンター200に検索用
データを送信することで、所望するホームページをセン
ター200側で検索し、該結果を端末100へ送信する
ホームページ検索システムであって、センター200は
端末100から送られてくる第1次検索用データに関連
するホームページアドレス及びホームページ内のテキス
ト部分を検索し、該結果を端末100に第1次検索結果
として送信する第1検索手段210を、端末100はセ
ンター200に第1次検索用データを送り、それに対す
る第1次検索結果を受信し、該結果を第2次検索用デー
タを用いて絞り込み第2次検索結果を抽出する第2検索
手段120を、備えることで実現する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、インターネットに
おいてホームページを検索するための技術に関するもの
である。
【0002】
【従来の技術】近年、インターネット上には様々なホー
ムページ(情報)が公開されており、例えばパーソナル
コンピュータを使用してインターネットへアクセスする
ことで、所望する情報が入手できないことは有り得ない
という環境にある。そのため、家庭において必要とする
情報を入手する場合においても、インターネットを利用
する利用者が増加している状況にある。
【0003】このようにインターネットから情報を入手
する際には、自分の欲する情報が存在するサイト(We
bサイト/ホームページアドレス/URL(Unifo
rmResource Locator))そのものの
手がかりが無いという場合が多く、このような場合、イ
ンターネット上に公開されている“Yahoo”(ヤフ
ー株式会社)や“Lycos”(カーネギー・メロン大
学)などのサーチエンジンを利用することで、欲する情
報候補(キーワード指定による検索結果)をホームペー
ジのURLリストで入手し、それらURLを参照(アク
セス)することで、欲する情報(ホームページ)を得て
いる。
【0004】しかし、上記のように従来のインターネッ
ト上で公開されているサーチエンジンを用いたホームペ
ージ検索では、そのサーチエンジンが検索処理中におい
ても通信回線は接続されている必要(正確には、インタ
ーネット接続されている必要)があり、時間単位で課金
される一般公衆回線を利用する家庭内での利用において
は、通信料による金銭的な問題が存在している。
【0005】そのため、上記問題を解決するための技術
が開示されており、特開平10−154152号公報に
開示されている「ホームページ検索システム」などはそ
の一例である。
【0006】この特開平10−154152号公報に開
示されている「ホームページ検索システム」では、端末
(利用者側の装置)よりセンターに対して送信される検
索用コード(検索キーワードなど)の通信処理と、セン
ターより端末に対して送信される検索結果の通信処理と
を、通信回線上、独立させた構成としている。すなわ
ち、端末は検索用コードを送信してから検索結果が得ら
れるまで、通信回線上は、未接続状態でも問題とならな
い構成としている点が特徴である。
【0007】
【発明が解決しようとする課題】しかしながら、前記記
載の技術においては、なお以下のような課題を有してい
る。
【0008】特開平10−154152号公報の「ホー
ムページ検索システム」では、センターより送信される
検索結果のデータ形式が不明確であり、開示されている
内容からその検索結果のデータ形式は、 (1)URLリスト(ホームページのタイトルは付加さ
れているものとする) (2)ホームページデータそのもののリスト のいずれか一方、あるいは両者も含むものと推測され
る。
【0009】まず、検索結果のデータ形式が(1)とし
た場合には、「端末だけで(再度センターに接続しない
で)、検索結果の更なる絞り込みができない。」という
問題が存在している。
【0010】これは、上述したようにインターネット上
には、様々な情報が公開されており、欲する情報は、必
ずどこかに存在するといっても過言ではない。これを逆
に考えれば、要求しない情報も非常に多く存在すること
をも意味する。
【0011】すなわち、ホームページの検索において、
1度の検索でヒットするホームページの数は膨大となり
(逆に、ヒット数が少ない場合、サーチエンジンそのも
のが問題かもしれない)となり、検索結果から得られる
URLとそのホームページのタイトル情報だけでは、リ
ストされた最初の候補URLのホームページを参照(ア
クセス)し、ホームページの内容を確認し、その結果、
欲する情報でなかった場合には、次の候補に対して同様
の作業を行い、目的の候補が見つかるまで行うことか
ら、いくら検索処理中の通話時間を削減したとしても、
ホームページアクセスとホームページ情報の内容確認に
時間がかかり、結局のところ、通信(インターネット接
続)時間が減らないことにも成りかねない。
【0012】次に、検索結果のデータ形式が(2)とし
た場合には、「(2−1)ホームページそのもののデー
タ量が多い可能性がある、(2−2)著作権上の問題」
の2点が挙げられる。
【0013】上記(2−1)に関しては、1つのホーム
ページには、テキストデータだけでなく、画像、音声な
どの様々なデータ形式の情報が存在する。特に画像や音
声などのデータは、そのデータ量が大きく、当然のこと
ながら、そのデータをダウンロードすることは、通信
(インターネット接続)時間が大きくなってしまう。ま
た上記(2−2)に関しては、ホームページの情報に
は、その公開者が著作権を持つ情報も多々存在する。特
に、画像、映像、音声の情報は、ほとんどすべてといっ
ていいほど著作権を持っている。すなわち、ホームペー
ジデータを、少なくともそのまま、センター経由で利用
者に提供することは、著作権上問題となる考えられる。
【0014】本発明は、上記問題点を解決するためにな
されたもので、その目的とするところは、センター側で
ホームページデータのテキスト部分のみの抽出を行う第
1段目の検索を実施し、その検索結果を端末側でさらに
絞り込み検索する第2段目の検索を実施することで、利
用者が的確に所望する情報を取得することができ、その
際に検索対象となる情報量の削減や検索時間の削減を実
現するとともに、端末とセンターとが要求指示から結果
取得までの期間常に通信接続しておく必要なしに実現で
きるホームページ検索システムを提供することである。
【0015】
【課題を解決するための手段】本発明の請求項1に係る
ホームページ検索システムは、端末はセンターに対し
て、通信回線で接続され、端末よりセンターに対して、
検索用データを送信することで、所望するホームページ
をセンター側で検索し、該検索結果を前記端末へ送信す
るホームページ検索システムであって、前記センターは
ホームページ検索センターであって、前記端末との間で
データの送受信を行うとともにインターネットに接続す
るための通信手段と、前記端末から送信されてきた検索
用のデータ及び検索結果を格納する記憶手段と、前記端
末からの検索用のデータを前記通信手段を介して受信
し、前記検索用データに関連するホームページアドレス
及びホームページ内のテキスト部分を検索結果として抽
出し、該検索結果を前記記憶手段に格納するとともに、
前記端末に対して第1次検索結果として送信する第1検
索手段と、を備え、また、前記端末はホームページ検索
端末であって、前記センターとの間でデータの送受信を
行うための通信手段と、利用者が検索用に必要とするデ
ータを入力するための入力手段と、前記入力手段によっ
て入力されたデータまたは検索結果を表示するための表
示手段と、前記入力手段によって入力されたデータ及び
検索結果を格納する記憶手段と、前記入力手段にて入力
されたセンターでの第1次検索用のデータを前記通信手
段を介してセンターに送信し、該検索結果を前記通信手
段を介して第1次検索結果として受信し、前記記憶手段
に格納する制御手段と、さらに、前記記憶手段に格納さ
れたセンターからの第1次検索結果を前記入力手段にて
入力された第2次検索用のデータを用いて絞り込み第2
次検索結果を抽出する第2検索手段と、を備え、段階的
なホームページの検索を行うことを特徴とする。
【0016】本発明の請求項2に係るホームページ検索
システムは、請求項1記載のホームページ検索システム
において、前記第1検索手段は、前記端末からの検索用
データに関連するホームページアドレスを検索する関連
URL検索手段と、前記ホームページアドレスのホーム
ページ内のテキスト部分を抽出する検索結果加工手段
と、単語辞書と、前記単語辞書を用いて前記テキスト部
分を複数のキーワードデータに変換する第1キーワード
抽出手段と、を有し、前記第1キーワード抽出手段の変
換結果であるキーワードデータを第1次検索結果に含め
て出力することを特徴とする。
【0017】本発明の請求項3に係るホームページ検索
システムは、請求項1記載のホームページ検索システム
において、前記第2検出手段は、単語辞書と、前記単語
辞書を用いて前記入力手段より入力された第2次検索用
のデータを複数のキーワードデータに変換する第2キー
ワード抽出手段と、を有し、前記第1キーワード抽出手
段による第1次検索結果のキーワードデータ及び前記第
2キーワード抽出手段による出力結果をそれぞれ単語ベ
クトル化し、比較処理し、その一致度を判定することを
特徴とする。
【0018】本発明の請求項4に係るホームページ検索
システムは、請求項2記載のホームページ検索システム
において、前記第1検索手段から出力される第1次検索
結果は、少なくともホームページアドレスであるURL
文字列と、そのページのタイトルと、そのページのテキ
スト概要と、そのページテキスト概要に含まれているキ
ーワードとから構成されてなることを特徴とする。
【0019】本発明の請求項5に係るホームページ検索
システムは、請求項1記載のホームページ検索システム
において、前記第1検索手段は、前記端末からの検索用
データに関連するホームページアドレスを検索する関連
URL検索手段と、前記ホームページアドレスのホーム
ページ内のテキスト部分を抽出する検索結果加工手段
と、を有し、前記抽出されたテキストを第1次検索結果
として出力することを特徴とする。
【0020】本発明の請求項6に係るホームページ検索
システムは、請求項1記載のホームページ検索システム
において、前記第2検出手段は、単語辞書と、前記記憶
手段に格納されたセンターからの第1次検索結果のテキ
スト部分を前記単語辞書を用いて複数のキーワードデー
タに変換する第1キーワード抽出手段と、前記単語辞書
を用いて前記入力手段より入力された第2次検索用のデ
ータを複数のキーワードデータに変換する第2キーワー
ド抽出手段と、を有し、前記第1キーワード抽出手段に
よる出力結果であるキーワードデータ及び前記第2キー
ワード抽出手段による出力結果であるキーワードデータ
をそれぞれ単語ベクトル化し、比較処理し、その一致度
を判定することを特徴とする。
【0021】本発明の請求項7に係るホームページ検索
システムは、請求項5記載のホームページ検索システム
において、前記第1検索手段から出力される第1次検索
結果は、少なくともホームページアドレスであるURL
文字列と、そのページのタイトルと、そのページのテキ
スト概要とから構成されてなることを特徴とする。
【0022】本発明の請求項8に係るホームページ検索
システムは、請求項1または2または5に記載のホーム
ページ検索システムにおいて、前記第1検索手段は、前
記第1次検索が完了した時点に、前記端末より受信した
メールアドレスにセンターでの第1次検索が終了したこ
とを通知することを特徴とする。
【0023】
【発明の実施の形態】以下に、本発明におけるホームペ
ージ検索システムの実施形態に関して図面を用いて説明
する。
【0024】(第1の実施例)図1は、本発明の第1の
実施例におけるホームページ検索システムのシステム構
成を示した機能ブロック図である。
【0025】本システムは、利用者が所望とする情報を
取得するために操作する端末100と、その端末100
を通じて利用者より要求されるキーワードを基に、関連
情報が存在すると思われるサイト(ホームページアドレ
ス)等の情報を送信サービスするセンター200から構
成されている。
【0026】端末100は、検索用のキーワード等を入
力したり、操作を指示するための入力装置102と、こ
の入力装置102から入力されたデータや処理、ここで
は検索結果等の情報を表示するための表示装置101
と、入力されたデータや検索結果の格納や端末100が
動作するために必要となる制御処理のためのワーク用メ
モリとしての記憶装置103と、センター200との回
線接続の制御を行うための通信装置104と、上記表示
装置101、入力装置102、通信装置104、及び記
憶装置103の各制御をつかさどる制御手段110と、
を備え、この制御手段110は上記入力装置102から
入力された検索キーワード(第1キーa1)を、通信装
置104を制御することによりメール情報(メールアド
レス第1キーa2)としてセンター200へ送信し、セ
ンター200での処理の結果(第1検索結果a3)を受
信し、その情報(第1検索結果a4)を記憶装置103
に記憶する制御をつかさどる。
【0027】さらに本端末100の特徴であるセンター
200より受信し、記憶装置103に格納されたセンタ
ー200での処理の結果(第1検索結果a5)に対して
目的の情報を検索・抽出制御するための第2検索手段1
20を備えた構成としている。この第2検索手段120
は、端末100で使用するための各種キーワードが格納
されている単語辞書125と、入力装置102から入力
されたキーワード(第2キーa6)を上記単語辞書12
5内で検索するための第2キーワード抽出手段122
と、その検索の結果一致した単語をキーワード(第2キ
ーのキーワードa7)として、記憶装置103に格納さ
れたセンター200での処理の結果(第1検索結果a
5)に対して目的の情報を検索・抽出し、その結果(第
2検索結果a8)を記憶装置103に返す処理を行う検
索手段121とから構成されている。
【0028】ここで、入力装置102はキーボードであ
ってもよいし、マウス等のポインティングデバイスであ
ってもよいし、タブレット等を含むタッチパネル等であ
ってもよい。表示装置101はCRTであってもよい
し、LCD等の液晶表示装置であってもよいし、さらに
は入力装置101と一体化した、例えば、表示一体型の
液晶タブレットであってもよい。通信装置104は一般
の公衆回線と接続できる機能を有した装置であればよ
く、例えばインターネットに接続できるレベルのもので
あればよい。記憶装置103は半導体のメモリ素子(例
えば、フラッシュROM、EEPROM等の不揮発性メ
モリや電源でバックアップされていればRAM)であっ
てもよいし、ハードディスクや光ディスク(光磁気ディ
スク、MD、DVD等)等の補助記憶装置であってもよ
い。また、制御手段110や第2検索手段120に関し
ての実際のハードウェア構成はCPU、RAM、ROM
等から構成されたものとし、それらは専用のLSIであ
ってもよいし、組み合わせて構成されたものであっても
よい。
【0029】次にセンター200は、端末(サービス利
用者)100との接続用、及び、インタネット(メール
サーバ)300との接続用の通信装置201と、端末
(サービス利用者)より送信される検索キーワードや検
索結果の退避用やセンター200が動作するために必要
となる制御処理のためのワーク用メモリとしての記憶装
置202と、を備え、さらに本センター200の特徴で
ある上記通信装置201と記憶装置202の制御をつか
さどるともに、端末(サービス利用者)100より送信
される検索キーワードを基に、関連するサイト(ホーム
ページアドレス)を検索し、検索ヒットした関連サイト
のホームページ内のテキストデータ、もしくは、テキス
トデータの単語キーワードを抽出し、ヒットしたホーム
ページアドレス情報に付加して、要求した端末(サービ
ス利用者)100に送信するための第1検出手段210
を設けた構成となっている。
【0030】ここで本センター200は、上記端末(サ
ービス利用者)100より送信されてきた検索用のキー
ワードを通信装置201を介して受信し、その検索用の
キーワード(第1キーb1)を第1検索手段210に与
え、それにしたがって第1検索手段210は関連するサ
イト(ホームページアドレス)を検索し、検索ヒットし
た関連サイトのホームページ内のテキストデータ、もし
くは、テキストデータの単語キーワードを抽出し、ヒッ
トしたホームページアドレス情報に付加して、要求した
端末(サービス利用者)100にそれらの情報(第1検
索結果b2)送信するとともに、記憶装置202にもそ
れらの情報(第1検索結果b3)を格納する。
【0031】この第1検索手段120は、センター20
0で使用するための各種キーワードが格納されている単
語辞書216と、要求された端末100から送信されて
きたキーワードを基にそのキーワードに関連するホーム
ページの通信先固有アドレス(Webサイトアドレス/
URL:Uniform Resource Loca
tor)を検索する関連URL検索手段211と、関連
URL検索手段211がURL検索を行う際に参照する
URLデータベース215と、関連URL検索手段21
1による検索結果である情報(URLリストb4)を処
理し、その中に含まれているテキストデータb5を加工
(生成)する検索結果加工手段212と、上記単語辞書
216を用いて検索結果加工手段212で生成されたテ
キストから単語キーワードを抽出する第1キーワード抽
出手段213と、を備え、第1キーワード抽出手段21
3は抽出したテキストデータの単語キーワードにそのヒ
ットしたホームページアドレス情報を付加したデータ、
あるいはテキストデータのそのヒットしたホームページ
アドレス情報を付加したデータを検索結果の情報(第1
検索結果b2、b3)を記憶装置202に格納するとと
もに、通信装置201に与え、要求した端末100に送
信する機能を有している。
【0032】ここで、通信装置201は一般の公衆回線
と接続できる機能を有した装置であればよく、例えばイ
ンターネットに接続できるレベルのものであればよい。
記憶装置202は半導体のメモリ素子(例えば、フラッ
シュROM、EEPROM等の不揮発性メモリや電源で
バックアップされていればRAM)であってもよいし、
ハードディスクや光ディスク(光磁気ディスク、MD、
DVD等)等の補助記憶装置であってもよい。また、第
1検索手段210に関しての実際のハードウェア構成は
CPU、RAM、ROM等から構成されたものとし、そ
れらは専用のLSIであってもよいし、組み合わせて構
成されたものであってもよい。
【0033】また、端末100内の単語辞書125とセ
ンター200内の単語辞書216は同じ内容のものとす
る。
【0034】本実施例では、関連URL検索手段211
と検索結果加工手段212とを別構成としたが、これは
センター200内での処理の工程及び機能を分かりやす
くするためにしただけである。尚、前記[従来の技術]
の箇所で記載した特開平10−154152号公報「ホ
ームページ検索システム」に対比させた場合、この関連
URL検索手段211は“検索手段”に相当するもので
あるが、実際には、これら手段内での処理は、並列(同
一手段内で)処理されている。
【0035】以上、端末(サービス利用者)100は、
卓上型やハンドヘルド型(ノート型も含む)のパーソナ
ルコンピュータであってもよいし、最近普及している携
帯情報ツール(携帯情報端末、通信端末等を含む)であ
ってもよいし、あるいは業務用を含めたワークステーシ
ョン機能を備えた端末装置であってもよい。また、セン
ター200は、比較的容量の大きなデータベースが構築
できる記憶手段を備えた装置、例えば、専用の情報処理
装置であったり、汎用のワークステーションであっても
よい。
【0036】以下に、上記図1で説明したセンター20
0及び端末100のそれぞれの動作を構成している各手
段と併せて順次説明する。
【0037】(1)センター側の動作 図2は、関連URL検索手段211の動作を表したフロ
ーチャートである。
【0038】この関連URL検索手段211の動作は、
上記したように基本的には前記[従来の技術]の箇所で
記載した特開平10−154152号公報「ホームペー
ジ検索システム」の“検索手段”等と同様である。
【0039】まず、センター200が起動されると、こ
の関連URL検索手段211は通信装置201を介し
て、検索要求が発生したか否かをウオッチングし続け
(S201)、検索要求が発生したことが検知されると
次のステップ(S202)に移行する。検索要求が発生
したため、“利用者名(ID)”、“パスワード”、
“メールアドレス”、“メール送信有無情報”等の情報
を受け取る(S203)。上記受け取った情報を格納し
ておくための利用者固有のフォルダを生成する(つま
り、端末100からの1回の検索要求に必要な格納領域
を記憶装置202に確保する)(S204)。上記受け
取った“利用者名(ID)”、“パスワード”、“メー
ルアドレス”、“メール送信有無情報”等の情報を上記
確保された格納領域に各々関連づけて格納する(S20
5)。さらに“検索キーワード”、“付加情報容量上限
値(一時的に確保しておくための領域の容量サイズの上
限値)”を受け取る(S206)。上記受け取った検索
キーワードを指定キーワードとして用いてURLデータ
ベース215内を検索する(S207)。上記検索によ
って得られた該当する情報であるURLリストを検索結
果として出力する。この出力された検索結果のURLリ
ストはパラメータとして検索結果加工手段212に与え
られる(S208)。
【0040】以上が関連URL検索手段211の動作で
ある。尚、主にS202〜S205のステップは、検索
結果を利用者ごと、つまり端末100からの検索要求ご
とに管理するためものであり、これは、サービス課金管
理や検索結果を検索依頼者以外の他人から保護するため
に必要となるためである。
【0041】図3は、本検索サービスをインターネット
上で公開した場合のページデータの一表示例である。
【0042】このページデータは、利用者が所望するサ
イトに端末100を操作してアクセスした場合に端末1
00の表示装置101に表示される。尚、タイトルの文
字列に“センター用”と記述されているのは端末100
を用いてセンター200へアクセスすることを表したも
ので、実質的にはセンター200での“1次検索用”と
いう意味である。
【0043】画面上には、各種操作用ボタン及び上記図
2の箇所で説明した各種データ(利用者名(ID)、パ
スワード、メールアドレス、メール送信有無情報、検索
キーワード等)を入力するためのデータ入力欄が設けら
れている。
【0044】取得ボタン401はセンター200での検
索結果をダウンロードするためのボタンで、開始ボタン
402はセンター200での検索を開始させるボタンで
あり、どちらかのボタンを押下することで、“利用者
名”(404)、“パスワード”(405)、“メール
アドレス”(406)、“メール送信有無情報”(この
メール送信有無情報はセンターでの検索結果をメール送
信するか、取得ボタン401による要求時のダイレクト
の結果送信かを示す情報)(407)、“キーワード”
(408)の各フィールドの内容がセンターに送信され
るページとなっている。尚、途中で終了したい等の場合
には終了ボタン403を押すことで実行できる。
【0045】ここでセンター200での検索結果をメー
ル送信してもらう場合、“キーワード”(405)フィ
ールドはもちろんのこと、もし、“利用者名”(40
4)や“パスワード”(405)のフィールドが入力さ
れずに、開始ボタン402を押下した場合には、検索サ
ービスが受けられない(センター200よりエラーが発
生ことが端末100側に通知される)ことになる。ま
た、センター200での検索結果を取得ボタン401に
よる要求時にダイレクトに送信してもらう場合も、“利
用者名”(404)や“パスワード”(405)のフィ
ールド入力が必要であることについては同様である。つ
まりこれらの情報が端末100からセンター200に送
られることで上記図2の処理が実行される。
【0046】尚、上記の各種データの入力やボタン操作
等は入力装置102を用いて実行される。
【0047】また、上記図3の画面は、利用者管理に対
する実施方法の一例であり、これに限定されるものでは
なく、別の方法、例えば、図1に示した端末100には
図示していないが、IDカード(磁気カードやICカー
ドや光カード等のカード)をアクセスできる装置を設け
ておけば、利用者はそのIDカードを図示していない読
み取りアクセス装置に挿入することで、“利用者名”
(404)、“パスワード”(405)、“メールアド
レス”(406)が自動的に設定される仕組みであって
もよい。
【0048】図4は、図2の関連URL検索手段211
の出力内容(検索結果)であるURLリストの構造及び
内容を表した説明図である。
【0049】図4の(a)はURLリストの構造(構造
体)を表したもので、(b)はその構造(構造体)に実
際に格納されるデータの一例を示したものである。
【0050】ここでは、URLListに格納される件
数としては変数MAXCNT分の件数であり、このUR
LListの構造としては、URLとしてホームページ
の通信先固有アドレスの文字列(MAX256文字)
と、Titleとしてそのページのタイトル名の文字列
(MAX256文字)である。
【0051】このURLリストの構造体に格納される実
データは、URLList[0]の場合、URL=“h
ttp://www.space.xxxx”で、Ti
tle=“日本の宇宙開発について”である。また、デ
ータが格納されていない要素Noの配列のところに関し
ては、NULLデータが格納されている。尚、本例では
文字列の最大長を256としたがこれに限定されるもの
ではなく、そのサイズはセンター200の記憶装置20
2の容量に依存するものである。
【0052】上記形態で図2の関連URL検索手段21
1の出力内容(検索結果)であるURLリストが検索結
果加工手段212にパラメータとして与えられる。
【0053】図5は、検索結果加工手段212及び第1
キーワード抽出手段213の動作を表したフローチャー
トである。
【0054】これら手段は、図4の関連URL検索手段
211の出力内容(ワークエリアURLList[]で
引き渡されるものとしている)を利用者に引き渡すデー
タ(FstResult)形式に加工し、記憶装置20
2内の利用者ごとに設けられた記憶域に格納し、端末
(サービス利用者)100からの要求に応じて、もしく
は、メールにて、本データを送信するものである。
【0055】図6は、第1検索手段210の処理結果と
して利用者に引き渡す第1検索結果(FstResul
t[])の構造及び内容を表した説明図である。
【0056】まず図6についてその内容を記載する。図
6の(a)は第1検索結果の構造(構造体)を表したも
ので、(b)はその構造(構造体)に実際に格納される
データの一例を示したものである。
【0057】ここでは、FstResultに格納され
る件数としては上記図4のURLListに格納される
件数と同じ変数MAXCNT分の件数であり、このFs
tResultの構造としては、URLとしてホームペ
ージの通信先固有アドレスの文字列(MAX256文
字)と、Titleとしてそのページのタイトル名の文
字列(MAX256文字)と、Abstとしてそのペー
ジのテキストの概要(要約)の文字列(MAX256文
字)と、さらにそのページのテキストの概要(要約)に
含まれているキーワードの文字列(MAX1024文
字)である。ただし、URLとTitleに関しては上
記図4と同じものである。
【0058】この第1検索結果の構造体に格納される実
データは、FstResult[0]の場合、URL=
“http://www.space.xxxx”で、
Title=“日本の宇宙開発について”で、Abst
=“宇宙開発事業団(日本の宇宙開発の中枢的実施機
関)による宇宙開発が進められており、……”、Key
word=“日本,宇宙,開発,事業,機関,ロケッ
ト,……”ある。また、データが格納されていない要素
Noの配列のところに関しては、NULLデータが格納
されている。尚、本例では文字列の最大長を256と1
024としたがこれに限定されるものではなく、そのサ
イズはセンター200の記憶装置202の容量に依存す
るものである。
【0059】上記形態で図6の記憶装置202内の利用
者ごとに設けられた記憶域に格納し、端末(サービス利
用者)100からの要求に応じて、もしくは、メールに
て、本データを送信される。
【0060】次に、上記図4の関連URL検索手段21
1の出力内容(URLリスト:URLList[])が
どのようにして上記図6の利用者に引き渡す第1検索結
果(FstResult[])に加工されるまでを図5
のフローチャートを用いて説明する。
【0061】検索結果加工手段212に入力パラメータ
として上記図4のURLリスト(URLList[])
が与えられると、処理する上で使用するローカル変数を
初期化(i=0)する(S221)。URLLis
t[]内のメンバ変数URLの内容を参考しながら順次
検索を行う。変数URLList[i].URLにホー
ムページのアドレスが格納されているか否かをチェック
する(S222)。もし格納されていれば次のステップ
S223に進み、格納されていない場合はステップS2
28に進む。変数URLList[i].URLにホー
ムページのアドレスが格納されている場合、通信装置2
01を介して、変数URLList[i].URLに示
されるホームページをアクセスし、その内容をダウンロ
ードする(S223)。このアクセス及びダウンロード
は図1のインターネットメールアクセスb12の経路で
行われる。このダウンロードされたホームページのデー
タは、HTML形式のデータである。
【0062】例えば、図7に示したものはダウンロード
されたホームページのデータの一例である。
【0063】図7は、上記図4の要素No=1のURL
アドレスであるURList[1].URL=“htt
p://www.shuttle.xxxx”にアクセ
スした場合にダウンロードされたホームページデータで
ある。HTML形式である<html>,<head
>,<title>,</title>,<body
>,</body>,</html>に該当するデータ
が格納されている。
【0064】次に上記ダウンロードしたHTML形式の
ホームページデータからテキスト部分を抽出する(S2
24)。具体的にホームページデータのテキスト部分を
抽出する方法としては、リンク先のホームページを含め
て抽出したり、検索キーワードに一致した部分の周辺の
テキスト部分を制限文字分抽出するなど、さまざまな方
法が存在するが、最も簡単な方法は、<TITLE>タ
グの内容と、<BODY>タグのテキスト部分(内容部
分)を抽出することである。
【0065】その後、第1キーワード抽出手段213に
よって、抽出されたテキストデータを単語辞書216を
用いて、複数の単語キーワードに変換(抽出)する(S
225)。本実施例ではこのステップS225を第1キ
ーワード抽出工程と称しており、本手段で抽出されたキ
ーワード群は、後述する(端末100側で処理される)
単語ベクトル生成に利用される。例えば、この抽出され
たキーワード群は図6(b)の要素No=1の場合、K
eyword=“スペースシャトル,飛行機,日本,ミ
ッション,…”となる。
【0066】尚、第1キーワード抽出手段213の構成
及びその処理工程の内容は、先行出願している特開平8
−16611号公報「自然言語に基づくデータ検索装
置」に開示されている技術を用いることとする。そのた
め、具体的な内容の説明は省略する(尚、本ステップS
225は、特開平8−16611号公報「自然言語に基
づくデータ検索装置」の図2のS22の前半部分に相当
している)。
【0067】ステップS225の結果を含めて、上記S
223以降の処理で得られたデータをFstResul
t[i]に格納する。このFstResult[i]の
データは予め記憶装置202に割り当てられている利用
者固有の記憶領域に格納される(図1の第1検索結果b
3に相当する)。この利用者固有の記憶領域とは、上記
図2のステップS204で予め生成されて確保されてい
る利用者固有フォルダのことである。
【0068】つまり、上記図6で説明した第1検索手段
210の出力データ(第1検索結果)であるヒットした
ホームページアドレスが格納される変数URL、<TI
TLE>タグの内容が格納される変数Title、<B
ODY>タグの冒頭テキスト内容(本例では、冒頭25
6バイト)が格納される変数Abst、<TITLE>
タグ、<BODY>タグの内容を単語キーワード抽出し
た結果が格納される変数Keywordの4つのメンバ
ーで構成されたFstResult[]が格納される。
【0069】以上ステップS222からS226までの
処理をローカル変数iをインクリメントする(S22
7)ことで、図4のURLリストに登録されている件数
分順次繰り返し、実行する。
【0070】図4のURLリストに登録されている件数
分の処理が終了した場合、第1検索手段210の処理結
果である第1検索結果を要求した端末(サービス利用
者)100に対しての送信方法を判断し、その方法で結
果を返す処理を実行する。
【0071】上記図2のステップS203で受け取り、
ステップS205で記憶装置202の利用者固有フォル
ダに格納されているメールアドレス406のデータを確
認する(S228)。その結果、メールアドレスが存在
しない場合は、センター200での処理を一旦終了す
る。一方、メールアドレスが存在する場合は、センター
200での第1検索処理が終了したことをそのメールア
ドレスに通知し(S229)、さらに上記図2のステッ
プS203で受け取り、ステップS205で記憶装置2
02の利用者固有フォルダに格納されているメール送信
有無情報407を確認する(S230)。その結果、端
末(サービス利用者)100がメールによる第1検索結
果送信を要求していない場合、センター200での処理
を一旦終了する。一方、端末(サービス利用者)100
がメールによる第1検索結果の送信を要求している場
合、上記図6の第1検索結果であるFstResult
[]の内容をメールにて送信する(S231)。これら
は図1の第1検索結果b2の経路に相当する。尚、メー
ルにて第1検索結果を送信する場合、本処理フローチャ
ートでは、完了通知とデータ送信が個々に実施されてい
るように見えるが、第1検索結果データファイルが添付
された完了通知メールとして処理されてもよい。メール
の送信完了後、ステップS236に進む。
【0072】一方、上記S228やS230での判断の
結果、第1検索結果をメール送信しない場合には、検索
結果の取得要求が発生したか否かをウオッチングし続け
(S232)、検索結果の取得要求が発生したことが検
知されると次のステップ(S233)に移行する。この
検索結果の取得要求はセンター200での検索処理中
に、端末(サービス利用者)側100でのセンター20
0との回線接続を切断可能とするための機能で、検索依
頼者だけがセンター200での検索結果を取得するため
に使用されるものである。センター200は検索結果の
取得要求が発生すれば、“利用者名(ID)”と“パス
ワード”を受信する(S233)。センター200では
送信されてきた“利用者名(ID)”と“パスワード”
より、検索結果を得るべき端末(サービス利用者)10
0かをチェックする(S234)。その結果、正しい端
末(サービス利用者)100でないと判断された場合
は、何もせずそのまま終了処理を行う。一方、正しい端
末(サービス利用者)100であると判断された場合
は、該当する上記図6の第1検索結果であるFstRe
sult[]の内容を送信する(S235)。
【0073】本実施例では、第1検索結果を要求してき
た端末100に送信した場合、その後再度の同一検索結
果の利用はないものとして、検索結果(FstResu
lt[])及び利用管理情報等を、記憶装置202より
削除している(S236)。これによって、センター2
00での記憶装置202の記憶領域を有効に効果的に活
用できる。もし、記憶装置202に余裕があれば削除し
ない処理方法であってもよい。
【0074】(2)端末(サービス利用者)側の動作 図8は、制御手段110の動作を表したフローチャート
である。
【0075】まず、端末100が起動されて、センター
200との回線接続の処理が通信装置104を介して行
われる(S101)。回線が接続された場合、センター
200への検索要求のための各種パラメータを入力する
入力画面(例えば、図3の画面)が表示装置101上に
表示する(S102)。なお、センター200の検索サ
ービスがインターネット上に公開されたサービスの場合
には、利用者が所望するサイト(URL)へのインタネ
ットアクセスにより、図3に示されるような画面データ
(HTMLデータ形式)をダウンロードし、表示する。
【0076】以後、利用者より、表示された入力画面に
て、各検索のための各種パラメータを入力装置102を
用いて入力されることになり、図3に示された各フィー
ルド(404〜408)への入力、設定が行われたら、
その入力内容を各フィールド変数に格納し、表示処理す
る(S103,S104)。
【0077】その際に、処理を起動するためのボタンが
押されているか否かも判断する。まず、センター200
に検索を開始要求するための開始ボタン402が押下さ
れたか否かを判断する(S105)。押されていた場合
はステップS106に進み、押されていなかった場合は
検索結果を取得する取得ボタン401が押下されたか否
かを判断する(S111)。押されていた場合はステッ
プS112に進み、押されていなかった場合は次の何ら
かの入力操作がなされるまで待つ(つまりステップS1
03に戻る)。
【0078】ここでセンター200に検索を開始要求す
るための開始ボタン402が押下されていた場合、セン
ター200に対して検索要求のコマンドを送信し(S1
06)、上記ステップS104で入力した“利用者名
(ID)”(404)、“パスワード”(405)、
“メールアドレス”(406)、“メール送信有無情
報”(407)の各検索用のパラメータをセンター20
0に送信し(S107)、さらに、センター200での
検索のための“キーワード”(408)を送信する(図
1の第1キーa2に相当する)(S108)。尚、送信
に際しては上記各データを別々に送信してもよいし、例
えば、メールでまとめて添付した形態で送信してもよ
い。
【0079】送信後、センター200からの第1検索結
果を得る方法をメールで取得すると設定としたか否かを
判断し(S109,S110)、メールによる場合は、
無条件に終了処理(回線接続、終了処理)を行うステッ
プS115へ移行する。
【0080】この場合は、メールが着信次第その内容を
チェックし、目的の内容であればセンター200からの
第1検索結果(図1の第1検索結果a3、a4)として
依頼時に入力された“キーワード”(408)と対応付
けて記憶装置103に格納する。
【0081】尚、メールで取得しないと設定してダイレ
クトにセンター200より検索結果を受信する場合、本
処理フローチャート上では、各パラメータの入力ステッ
プへ移行するような経路を設けた(点線で記載した)
が、上記の検索開始要求の処理工程と、後述する検索結
果要求の処理工程とを独立した構成とし、終了ボタン4
03などで、途中終了(回線接続、終了処理)する経路
(パス)が設けられたものであってもよい。
【0082】一方、センター200に検索結果(第1検
索結果)を要求するための取得ボタン401が押下され
ていた場合、センター200に対して検索結果取得要求
のコマンドを送信し(S112)、さらにセンター20
0で依頼した利用者と結果要求者とが同一であるか否か
の確認のために、再度、“利用者名(ID)”(40
4)、“パスワード”(405)の内容を送信する(S
113)。その結果として、センター200より送信さ
れる第1検索結果(図1の第1検索結果a3、a4)
を、依頼時に入力された“キーワード”(408)と対
応付けて記憶装置103に格納する(S114)。尚、
本実施例では、第1検索結果の受信日をも記憶装置10
3に記憶しているものとしている。処理が完了すると、
最後に、センター200と接続を切断する(S11
5)。
【0083】尚、本実施例では、端末100がセンター
200に回線接続を開始する時点としては、上記ステッ
プS101の時点であったが、回線接続をONさせる時
点としてはこれに限定されず、例えば、ステップS10
5で開始ボタン402が押された時点や、ステップS1
11で取得ボタン401が押された時点であってもよ
い。
【0084】図9は、第2検索手段120の動作を表し
たフローチャートである。
【0085】第2検索手段120は、制御手段110が
上記図8におけるセンター200との回線接続を切断し
た後、起動されるものである。
【0086】まず、2次検索のための各種パラメータを
入力するための入力画面を表示装置101上に表示する
(S121)。
【0087】図10は、上記2次検索用の画面表示の一
表示例である。
【0088】図10の(a)は2次検索のための各種パ
ラメータを入力するための入力画面で、(b)はその入
力されたパラメータに基づいて検索された結果を表示し
た画面である。
【0089】図10(a)の2次検索のための各種パラ
メータを入力するための入力画面は、検索開始ボタン5
01と、検索キー入力フィールド502と、各第1検索
結果に対して2次検索を実施するか否かを選択するため
のチェックボックス503とから構成されている。検索
キー入力フィールド502は利用者が入力装置102を
用いて所望するキーワードを入力する。尚、この検索キ
ー入力フィールド502は図10(a)に示す通り自然
言語での入力が可能な仕様としている。また、「センタ
検索リスト」の表示領域には、既にセンター200から
結果が得られて記憶装置103に格納されている第1検
索結果が格納した日時とセンター200へ検索を依頼し
た時点でのキーワードとを表示し、各第1検索結果に対
して2次検索を実施するか否かを選択するためのチェッ
クボックス503がその先端に設けられている。
【0090】図9に示した第2検索処理のフローチャー
トにおいて、検索対象データがチェックボックス503
で選択される(S125)と、その操作に応じて検索対
象のチェックボックス503の有無表示が反転し(S1
26)、入力待ち状態に戻る。
【0091】一方、検索フィールド502に検索キーが
入力されたと判断されると(S122)、本フィールド
用の変数に入力データを格納し、その入力内容を表示す
る(S123)。
【0092】さらに、第2キーワード抽出手段122に
よって、上記検索フィールド502に入力された内容を
単語辞書125を用いて、複数の単語キーワードに変換
(抽出)する(S124)。本実施例ではこのステップ
S124を第2キーワード抽出工程と称しており、本手
段で抽出されたキーワード群は、後述する単語ベクトル
生成に利用される。
【0093】尚、本工程は検索フィールド502に検索
キーが入力された(S123)直後に実施しているが、
これは、図1(ホームページ検索システムの構成を示す
ブロック図)に対応させただけであり、実際は、開始ボ
タン501が押されたと判断(S127)された直後に
実施する工程であってもよい(検索キーを入力したから
と言って必ずしも検索開始するとは限らないため)。し
かし、図9の場合は逐次変換であり、上記開始ボタン5
01が押されたと判断(S127)された直後に実施す
るのは一括変換であり、いずれの方法でもよい。
【0094】また、第2キーワード抽出手段122の構
成及びその処理工程の内容は、上記第1キーワード抽出
手段213の記載箇所で説明したのと同様に、先行出願
している特開平8−16611号公報「自然言語に基づ
くデータ検索装置」に開示されている技術を用いること
とする。そのため、具体的な内容の説明は省略する
(尚、本ステップS124は特開平8−16611号公
報「自然言語に基づくデータ検索装置」の図2のS22
の前半部分に相当している)。
【0095】次に、開始ボタン501が押下された場合
(S127)、チェックボックス503で検索対象が設
定されているか否かを確認する(S128)。いずれの
チェックボックス503に対しても“有”を設定してい
ない場合は、元の入力画面での入力待ち状態に戻る。い
ずれかのチェックボックス503に対して“有”が設定
されている場合は、その設定されているすべて検索対象
データに対して、実際の第2次検索の処理を実行する。
つまり、図10(a)の「センタ検索リスト」の表示領
域にリストアップされている第1次の検索結果でチェッ
クボックス503がONになっているものを順次無くな
るまで、繰り返し処理を行い(S128)、その結果は
第2次検索の処理終了後に図10(b)に示した画面表
示となる。
【0096】ステップS129からS135までの処理
は、上記検索対象データの1つに対して、つまり上記セ
ンター200での第1次検索の結果であり、記憶装置1
03に格納されている検索対象のFstResul
t[]に対して第2次検索を行うための処理のシーケン
スである。
【0097】まず第2次検索用のローカル変数の初期化
(i=0)を行う(S129)。上記検索対象のFst
Result[]に対して、順次その中のURLリスト
のデータFstResult[i].URLをチェック
する(S130)。FstResult[i].URL
にデータが有る場合は、キーワード群のFstResu
lt[i].Keywordの各単語データを単語ベク
トル化する(S131)。例えば図6の要素No=0で
のFstResult[0].Keyword内の“日
本”、“宇宙”、“開発”、…等の各単語データをベク
トル量子化する。次に、利用者が第2次検索用に上記ス
テップS122〜S123で入力した検索キーに対して
も同様に構成している各単語データを単語ベクトル化す
る(S132)。例えば図10(a)の検索キー“日本
人宇宙飛行士に関する情報を知りたい”に関しては、
“日本人”、“宇宙”、“飛行士”、…等の各単語デー
タをベクトル量子化する。上記ステップS131とステ
ップS132で算出された互いのベクトルの一致度を算
術(比較)し(S133)、そのベクトル一致度がある
一定値以上の場合には、予め設定されている範囲内のホ
ームページであると判断し、FstResult[i]
の内容、つまり変数URL,Title,Abstの情
報、を順次表示する(S134)。その後、ローカル変
数iをインクリメントする(S135)ことで、Fst
Result[i].URLのURLリストに登録され
ている件数分順次繰り返し、実行する。
【0098】尚、上記ステップS130でFstRes
ult[i].URLのURLリストに登録されている
データが無くなった場合は、この検索対象の第1次検索
結果に対する処理は終了したことを意味し、上位のステ
ップS128に戻り、まだ検索対象としている第1次検
索結果が他にあるか否かをチェックする。その時点で、
まだ存在していれば同様にステップS129以降の処理
を行い、存在していなければ第2次の検索結果を図10
(b)のように画面表示し、入力待ち状態に遷移する。
【0099】また、図9の処理フローでは、FstRe
sult[i]の内容表示をステップS134で逐次行
うように記載しているが、このような逐次処理でなく、
このステップS134の時点では表示対象とするデータ
か否かのマークを付けておき(例えば、フラグエリアを
設けておきそこにマークと設定する)、実際にはステッ
プS128で“NO”と判断された時点で、マークが付
けられているデータすべてを一括して表示する方法であ
ってもよい。
【0100】尚、終了したい場合には、図10(a)の
場合は“終了”のボタンを、(b)の場合は“閉じる”
のボタンを押すことで実行される。
【0101】また、上記ステップS131とS132で
の単語データのベクトル化(ベクトル量子化)処理に関
しては、先行出願している特開平8−16611号公報
「自然言語に基づくデータ検索装置」に開示されている
技術を用いることとする。そのため、具体的な内容の説
明は省略する(尚、本処理は特開平8−16611号公
報「自然言語に基づくデータ検索装置」の図2のS22
の後半部分とS23の部分に相当している)。
【0102】以上、本実施例の構成、機能、処理を実施
することで、従来のホームページ検索システムでは得ら
れなかった ・通信時間(インターネット接続時間)のさらなる短縮
に加え、 ・端末内でのさらなる検索(絞り込み)が可能となり、 ・ホームページの情報をそのまま利用者に提供しないの
で、著作権上の問題が少なくなり、 ・自然言語(利用者が自分自信の言葉でキーワードを入
力すること)で検索が行える、 といった効果を有することができる。
【0103】(第2の実施例)図11は、本発明の第2
の実施例におけるホームページ検索システムのシステム
構成を示した機能ブロック図である。
【0104】本システムは、前記第1の実施例における
ホームページ検索システムのシステム構成をベースとし
たもので、相違点は第1の実施例ではセンター200側
にあった第1キーワード抽出手段213を端末100側
に配置替えした点である。それ以外の構成に関しては同
じものである。
【0105】端末100及びセンター200における各
手段の処理の流れを示したフローチャートにおいては、
前記第1の実施例で説明した図5での処理ステップS2
25での第1キーワード抽出の処理工程が無くなる。そ
のため、センター200での第1検索結果のデータの一
例を示した図6においては、FstResult[]の
Keywordが必要無くなる。そのかわりに、前記第
1の実施例で説明した図9で処理ステップS121を実
行する前、つまり起動直後に第1キーワード抽出手段1
23によって単語辞書125を用いてホームページのテ
キストデータからキーワードを変換(抽出)する処理を
実行工程が追加される。それに伴って、記憶装置103
に格納されているFstResult[]にKeywo
rdを追加し、そこに該当する変換(抽出)されたキー
ワードのデータを格納することとなる。
【0106】以上、本実施例の構成、機能、処理を実施
することで、従来のホームページ検索システムでは得ら
れなかった ・通信時間(インターネット接続時間)のさらなる短縮
に加え、 ・端末内でのさらなる検索(絞り込み)が可能となり、 ・ホームページの情報をそのまま利用者に提供しないの
で、著作権上の問題が少なくなり、 ・自然言語(利用者が自分自信の言葉でキーワードを入
力すること)で検索が行え、 さらに、前記第1の実施例に比べると ・端末側での処理の負荷は増加するが、反面センター側
の負荷が少なくなり、分散処理の形態が実現でき、例え
ば、ソフトウェア(プログラム)の変更を必要とした場
合などはコスト的にもメリットが得られ、 ・センター側の記憶装置におけるキーワード用の記憶領
域が必要なくなり、記憶装置のコストパフォーマンスが
アップし、 ・キーワード抽出用に使用する単語辞書が1つで済む、 といった効果を有することができる。
【0107】尚、上記第1及び第2の実施例において記
載した“第1検索…”は“第1次検索…”や“第1段目
の検索…”と解釈してもよい。同様に“第2検索…”や
“第1キーワード…”や“第2キーワード…”なども上
記と同じ意味合いで解釈してもよい。
【0108】以上、ここまで挙げた実施形態(第1及び
第2の実施例)における内容は、本発明の主旨を変えな
い限り、上記記載内容に限定されるものではない。
【0109】
【発明の効果】本発明におけるホームページ検索システ
ムでは、各請求項において以下の効果が得られる。
【0110】本発明の請求項1においては、センター側
及び端末側で段階的に検索ができるため、利用者がより
的確に所望する情報を取得することができ、さらにその
検索は自然言語(利用者が自分自信の言葉でキーワード
を入力すること)で行えるため、利用者にとって使い易
い、といった効果を有することができる。
【0111】本発明の請求項2、3、4においては、セ
ンター側での第1段目の検索でキーワードレベルにまで
かなり絞り込んでいるため、通信時間(インターネット
接続時間)のさらなる短縮に加え、端末内でのさらなる
検索(絞り込み)が可能となり、ホームページの情報を
そのまま利用者に提供しないので、著作権上の問題が少
なくなる、といった効果を有することができる。
【0112】本発明の請求項5、6、7においては、セ
ンター側での第1段目の検索でテキストレベルまで絞り
込んでいるため、通信時間(インターネット接続時間)
のさらなる短縮に加え、端末内でのさらなる検索(絞り
込み)が可能となり、ホームページの情報をそのまま利
用者に提供しないので、著作権上の問題が少なくなり、
さらに端末側での処理の負荷は増加するが、反面センタ
ー側の負荷が少なくなり、センター側の記憶装置におけ
るキーワード用の記憶領域が必要なくなり、記憶装置の
コストパフォーマンスがアップし、キーワード抽出用に
使用する単語辞書が1つで済む、といった効果を有する
ことができる。
【0113】本発明の請求項8においては、端末側が、
確実にセンターでの検索処理が終了したタイミングを得
ることが可能となるといった効果を有することができ
る。
【図面の簡単な説明】
【図1】本発明の第1の実施例におけるホームページ検
索システムのシステム構成を示した機能ブロック図であ
る。
【図2】本発明の第1の実施例における関連URL検索
手段の動作を表したフローチャートである。
【図3】本発明の第1の実施例において検索サービスを
インターネット上で公開した場合のページデータの一表
示例である。
【図4】本発明の第1の実施例における関連URL検索
手段の出力内容であるURLリストの構造及び内容を表
した説明図である。
【図5】本発明の第1の実施例における第1検索手段の
処理結果である第1検索結果を生成するための動作を表
したフローチャートである。
【図6】本発明の第1の実施例における第1検索手段の
処理結果として利用者に引き渡す第1検索結果の構造及
び内容を表した説明図である。
【図7】本発明の第1の実施例における検索結果加工手
段がホームページをアクセスしダウンロードしたデータ
の一例を示した説明図である。
【図8】本発明の第1の実施例における制御手段の動作
を表したフローチャートである。
【図9】本発明の第1の実施例における第2検索手段の
動作を表したフローチャートである。
【図10】本発明の第1の実施例における第2検索用画
面の一表示例である。
【図11】本発明の第2の実施例におけるホームページ
検索システムのシステム構成を示した機能ブロック図で
ある。
【符号の説明】
100 端末 101 端末の表示装置 102 端末の入力装置 103 端末の記憶装置 104 端末の通信装置 110 端末の制御手段 120 端末の第2検索手段 200 センター 201 センターの通信装置 202 センターの記憶装置 210 センターの第1検索手段

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 端末はセンターに対して、通信回線で接
    続され、端末よりセンターに対して、検索用データを送
    信することで、所望するホームページをセンター側で検
    索し、該検索結果を前記端末へ送信するホームページ検
    索システムであって、 前記センターはホームページ検索センターであって、 前記端末との間でデータの送受信を行うとともにインタ
    ーネットに接続するための通信手段と、 前記端末から送信されてきた検索用のデータ及び検索結
    果を格納する記憶手段と、 前記端末からの検索用のデータを前記通信手段を介して
    受信し、前記検索用データに関連するホームページアド
    レス及びホームページ内のテキスト部分を検索結果とし
    て抽出し、該検索結果を前記記憶手段に格納するととも
    に、前記端末に対して第1次検索結果として送信する第
    1検索手段と、を備え、 また、前記端末はホームページ検索端末であって、 前記センターとの間でデータの送受信を行うための通信
    手段と、 利用者が検索用に必要とするデータを入力するための入
    力手段と、 前記入力手段によって入力されたデータまたは検索結果
    を表示するための表示手段と、 前記入力手段によって入力されたデータ及び検索結果を
    格納する記憶手段と、 前記入力手段にて入力されたセンターでの第1次検索用
    のデータを前記通信手段を介してセンターに送信し、該
    検索結果を前記通信手段を介して第1次検索結果として
    受信し、前記記憶手段に格納する制御手段と、 さらに、前記記憶手段に格納されたセンターからの第1
    次検索結果を前記入力手段にて入力された第2次検索用
    のデータを用いて絞り込み第2次検索結果を抽出する第
    2検索手段と、を備え、 段階的なホームページの検索を行うことを特徴とするホ
    ームページ検索システム。
  2. 【請求項2】 前記第1検索手段は、前記端末からの検
    索用データに関連するホームページアドレスを検索する
    関連URL検索手段と、前記ホームページアドレスのホ
    ームページ内のテキスト部分を抽出する検索結果加工手
    段と、単語辞書と、前記単語辞書を用いて前記テキスト
    部分を複数のキーワードデータに変換する第1キーワー
    ド抽出手段と、を有し、 前記第1キーワード抽出手段の変換結果であるキーワー
    ドデータを第1次検索結果に含めて出力することを特徴
    とする請求項1記載のホームページ検索システム。
  3. 【請求項3】 前記第2検出手段は、単語辞書と、前記
    単語辞書を用いて前記入力手段より入力された第2次検
    索用のデータを複数のキーワードデータに変換する第2
    キーワード抽出手段と、を有し、 前記第1キーワード抽出手段による第1次検索結果のキ
    ーワードデータ及び前記第2キーワード抽出手段による
    出力結果をそれぞれ単語ベクトル化し、比較処理し、そ
    の一致度を判定することを特徴とする請求項1記載のホ
    ームページ検索システム。
  4. 【請求項4】 前記第1検索手段から出力される第1次
    検索結果は、少なくともホームページアドレスであるU
    RL文字列と、そのページのタイトルと、そのページの
    テキスト概要と、そのページテキスト概要に含まれてい
    るキーワードとから構成されてなることを特徴とする請
    求項2記載のホームページ検索システム。
  5. 【請求項5】 前記第1検索手段は、前記端末からの検
    索用データに関連するホームページアドレスを検索する
    関連URL検索手段と、前記ホームページアドレスのホ
    ームページ内のテキスト部分を抽出する検索結果加工手
    段と、を有し、 前記抽出されたテキストを第1次検索結果として出力す
    ることを特徴とする請求項1記載のホームページ検索シ
    ステム。
  6. 【請求項6】 前記第2検出手段は、単語辞書と、前記
    記憶手段に格納されたセンターからの第1次検索結果の
    テキスト部分を前記単語辞書を用いて複数のキーワード
    データに変換する第1キーワード抽出手段と、前記単語
    辞書を用いて前記入力手段より入力された第2次検索用
    のデータを複数のキーワードデータに変換する第2キー
    ワード抽出手段と、を有し、 前記第1キーワード抽出手段による出力結果であるキー
    ワードデータ及び前記第2キーワード抽出手段による出
    力結果であるキーワードデータをそれぞれ単語ベクトル
    化し、比較処理し、その一致度を判定することを特徴と
    する請求項1記載のホームページ検索システム。
  7. 【請求項7】 前記第1検索手段から出力される第1次
    検索結果は、少なくともホームページアドレスであるU
    RL文字列と、そのページのタイトルと、そのページの
    テキスト概要とから構成されてなることを特徴とする請
    求項5記載のホームページ検索システム。
  8. 【請求項8】 前記第1検索手段は、前記第1次検索が
    完了した時点に、前記端末より受信したメールアドレス
    にセンターでの第1次検索が終了したことを通知するこ
    とを特徴とする請求項1または2または5に記載のホー
    ムページ検索システム。
JP11016387A 1999-01-26 1999-01-26 ホ―ムペ―ジ検索システム Pending JP2000215206A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11016387A JP2000215206A (ja) 1999-01-26 1999-01-26 ホ―ムペ―ジ検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11016387A JP2000215206A (ja) 1999-01-26 1999-01-26 ホ―ムペ―ジ検索システム

Publications (1)

Publication Number Publication Date
JP2000215206A true JP2000215206A (ja) 2000-08-04

Family

ID=11914864

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11016387A Pending JP2000215206A (ja) 1999-01-26 1999-01-26 ホ―ムペ―ジ検索システム

Country Status (1)

Country Link
JP (1) JP2000215206A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003050799A (ja) * 2001-08-08 2003-02-21 Seiko Epson Corp データベース検索方法、データベース検索システム、検索管理用プログラム及びその記録媒体
JP2013527547A (ja) * 2010-06-01 2013-06-27 マイクロソフト コーポレーション コンテキストに基づいて選択したコンテンツ項目の提供

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10154152A (ja) * 1996-11-25 1998-06-09 Hitachi Ltd ホームページ検索システム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10154152A (ja) * 1996-11-25 1998-06-09 Hitachi Ltd ホームページ検索システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003050799A (ja) * 2001-08-08 2003-02-21 Seiko Epson Corp データベース検索方法、データベース検索システム、検索管理用プログラム及びその記録媒体
JP2013527547A (ja) * 2010-06-01 2013-06-27 マイクロソフト コーポレーション コンテキストに基づいて選択したコンテンツ項目の提供

Similar Documents

Publication Publication Date Title
US7921092B2 (en) Topic-focused search result summaries
CN100472522C (zh) 用于搜索、导航和排名个人网中的文档的方法、系统和计算机程序产品
US8732169B2 (en) Lateral search
US6711567B2 (en) Delivering non-default items in association with search results
US7672932B2 (en) Speculative search result based on a not-yet-submitted search query
US20120036153A1 (en) Mobile system, search system and search result providing method for mobile search
US20020099685A1 (en) Document retrieval system; method of document retrieval; and search server
JP2010529558A (ja) 検索エンジン結果およびリストの表示
US20030088559A1 (en) Information retrieval system and information retrieving method therefor
US20110022635A1 (en) Method and System to Formulate Queries With Minivisuals
JP2009037501A (ja) 情報検索装置、情報検索方法およびプログラム
CN100444161C (zh) 用于浏览数据通信网络的方法
JP5448192B2 (ja) 検索システム、端末、サーバ、検索方法、プログラム
JP5215920B2 (ja) 検索システムおよび方法
JP2000215206A (ja) ホ―ムペ―ジ検索システム
US20240296197A1 (en) Method for providing information, method for generating database, and program
US20090216756A1 (en) Recording medium carrying data search program, data search apparatus, and data search method
JP2002132825A (ja) 画像検索システム、画像検索方法、画像検索プログラム、画像検索プログラムを記録したコンピュータ読み取り可能な記憶媒体、および画像検索装置
CN116127004B (zh) 关键词检索方法、显示方法及相关设备
JP7806953B1 (ja) 検索システム、検索方法および検索プログラム
TWI896340B (zh) 輸入裝置與運用輸入裝置執行搜尋的方法
KR101752323B1 (ko) 요약 위주의 동적 정보에 대한 키워드 검색 시스템 및 방법, 그리고 이에 적용되는 장치
JP2004234421A (ja) 情報検索方法およびそれを用いた情報検索システム
JP2005078338A (ja) 情報処理装置、情報処理システム、情報処理方法、情報処理プログラム及び記録媒体
JPH11149480A (ja) イメージ情報管理システム、イメージ情報検索装置、イメージ情報管理プログラムを記録した媒体及びイメージ情報検索プログラムを記録した媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040608

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050106