JP2012146079A - 情報検索装置、情報検索方法、及び情報検索プログラム - Google Patents

情報検索装置、情報検索方法、及び情報検索プログラム Download PDF

Info

Publication number
JP2012146079A
JP2012146079A JP2011003242A JP2011003242A JP2012146079A JP 2012146079 A JP2012146079 A JP 2012146079A JP 2011003242 A JP2011003242 A JP 2011003242A JP 2011003242 A JP2011003242 A JP 2011003242A JP 2012146079 A JP2012146079 A JP 2012146079A
Authority
JP
Japan
Prior art keywords
search
keyword
range
corresponding word
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011003242A
Other languages
English (en)
Other versions
JP5491422B2 (ja
Inventor
Daisuke Sato
大祐 佐藤
Yoshihito Yasuda
宜仁 安田
Yoshimasa Koike
義昌 小池
Ryoji Kataoka
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011003242A priority Critical patent/JP5491422B2/ja
Publication of JP2012146079A publication Critical patent/JP2012146079A/ja
Application granted granted Critical
Publication of JP5491422B2 publication Critical patent/JP5491422B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】略語に基づく情報検索の精度を向上させる。
【解決手段】略語を含んだクエリに適合する文書を検索する情報検索装置1において、追加キーワード取得部4はクエリ入力部2からクエリとして供された略語からなるキーワード及び検索範囲に対応する対応語群を追加キーワードDB3から取得する。そして、追加キーワード取得部4は対応語の主要度に基づき前記対応語群から取得した対応語を前記クエリの追加キーワードとする。範囲検索部6は前記キーワード、前記検索範囲及び前記追加キーワードに基づき文書DB5から情報検索を行う。この検索により得られた検索結果は検索結果出力部7から出力される。
【選択図】図1

Description

本発明は入力された検索語に適合する文書を提示する情報検索技術に関する。
情報検索に供される検索キーワードが複数の表記をもつ場合がある。このとき、検索キーワードに加え、同じ意味を持つ他の表記も検索キーワードとして追加するという、いわゆる検索漏れを減らす検索技術が知られている(例えば、特許文献1、非特許文献1)。
この検索技術によれば、ユーザが入力したキーワードをそのまま含まなくとも、ユーザの要求に合致した内容の文書を提示することができる。特に、検索キーワードが略語であるときには、入力された略語での検索結果に加え、その略語の意味する語での検索結果を追加することにより、より多くの適切な検索結果を得ることができる。例えば、「BBQ」というキーワードを用いて検索を行う場合を考える。「BBQ」は「バーベキュー」の略語である。このとき、「BBQ」というキーワードでの検索に加え、「バーベキュー」というキーワードで検索した結果も提示することにより、ユーザの要求に合致した文書をより多く提示することができる。
また、指定した範囲に含まれる文書を絞り込んで検索を行う、範囲検索の技術が知られている(例えば、非特許文献2,3)。指定検索範囲には、日時などの時間範囲や、場所や地域といった地理範囲などがある。例えば、時間範囲を指定した範囲検索で、「2010年8月〜9月」と指定した場合、文書中に含まれる日時表現や、文書を収集した日付などを利用し、「2010年8月〜9月」に含まれる文書を検索することができる。通常、ユーザは検索範囲の指定に加えキーワードによる検索も行い、検索システムは、指定した検索範囲と指定したキーワードとの両方の条件を満たす文書を提示する。
特開2008−204399号公報
Akira Terada, Takenobu Tokunaga, Hozumi Tanaka ,"Automatic expansion of abbreviations by using context and character information", Information Processing and Management 40, 2004, January 2004 ,pp.31-45 戸田浩之,安田宜仁,松浦由美子,片岡良治,"地理情報と内容情報の近接性を考慮した地理情報検索",第23回人工知能学会全国大会,2009年6月 河合英紀,Adam Jatowt,田中克己,國枝和雄,山田敬嗣,"ChronoSeeker Webからの過去・未来情報のオンデマンド検索エンジン",WebDB Forum2009,2009年11月
異なる意味を持つ複数の語が、同じ略語で表記される場合がある。例えば、「ES」という語は,「エントリーシート」という語の略語であると同時に、「従業員満足度(Employee Satisfaction)」や、「エンジニアリングサービス」といった複数の語の略語でもある。
略語の意味する主要な語は、検索範囲によって異なる。例えば、時間を検索範囲にした場合を考える。ある時期においては「ES」といえば「従業員満足度」のことを示しており、ある期間においてはもっぱら「エントリーシート」の意味でつかわれているといったように、その時々に応じて異なる。地理を検索範囲とした場合、地域によって略語の意味する主要な語が異なるケースがある。
しかし、従来の方法では、略語が表す語を抽出する際に、全ての文書集合を用いて行っていた。これにより、検索ユーザが意図した意味以外の語を検索キーワードとして追加することになり、結果として検索の精度が低下するという問題点があった。
本発明は、以上の事情に鑑みなされたもので、キーワードとして略語が検索に供された際に、指定された検索範囲における適切な略語の候補を前記検索のための追加キーワードとして取得して、略語に基づく情報検索の精度を向上させることを目的とする。
そこで、本発明は、略語に基づく情報検索の際、当該略語及び指定した検索範囲に対応した対応語群から主要度に基づき抽出した対応語を追加キーワードとして当該情報検索に供することにより、当該略語に基づく検索の精度を向上させる。
本発明の情報検索装置の態様としては、略語を含んだクエリに適合する文書を検索する情報検索装置であって、前記クエリとして供された略語からなるキーワード及び検索範囲に対応する対応語群から各対応語の主要度に基づき取得した対応語を当該クエリの追加キーワードとする追加キーワード取得手段と、前記キーワード、前記検索範囲及び前記追加キーワードに基づき情報検索を行う範囲検索手段とを備える。
本発明の情報検索方法の態様としては、略語を含んだクエリに適合する文書を検索する情報検索方法であって、追加キーワード取得手段が前記クエリとして供された略語からなるキーワード及び検索範囲に対応する対応語群から各対応語の主要度に基づき取得した対応語を当該クエリの追加キーワードとするステップと、範囲検索手段が前記キーワード、前記検索範囲及び前記追加キーワードに基づき情報検索を行うステップとを有する。
前記情報検索装置及び情報検索方法において、前記追加キーワード取得手段は、前記キーワード及び検索範囲に対応する対応語群の各対応語について当該検索範囲における主要度を示す指定範囲中主要度を算出し、この主要度が閾値よりも高い対応語を前記追加キーワードとして取得するようにするとよい。この態様によれば前記指定範囲中主要度の閾値に基づき対応語が抽出されるので所望の検索精度で前記キーワードに基づく情報検索を行える。
また、前記検索範囲が複数供された場合、前記追加キーワード取得手段は、前記キーワード及び当該複数の検索範囲に対応する対応語群の各対応語の各検索範囲における主要度を示す指定範囲中主要度を掛け合わせたものを前記複数の検索範囲からなる指定範囲集合における当該対応語の主要度を示す指定範囲中主要度とし、この主要度が閾値よりも高い対応語を前記追加キーワードとして取得するようにするとよい。この態様によれば検索範囲が複数指摘された場合であっても前記キーワードに基づく情報検索を所望の検索精度で行える。
さらに、本発明の情報検索装置及び情報検索方法の他の態様としては、前記追加キーワードを取得するにあたり、略語からなるキーワードと前記略語の開示を規定する範囲と前記略語に対応する対応語とこの対応語の主要度とを予め格納したキーワードデータベースから、前記供されたキーワード及び単数または複数の検索範囲に対応する対応語群を引き出すようにするとよい。この態様によれば前記供された略語及び単数または複数の検索範囲に対応する対応語群を効率的に取得できる。
尚、本発明は上記の情報検索装置を構成する各手段としてコンピュータを機能させる情報検索プログラムの態様とすることもできる。
以上の発明によれば、キーワードとして略語が情報検索に供された際に、当該略語と共に指定された検索範囲における適切な略語の候補を前記検索の追加キーワードとして利用するので、当該略語に基づく情報検索の精度が向上する。
発明の実施形態に係る情報検索装置のブロック構成図。 発明の実施形態に係る情報検索装置の処理手順を説明したフロー図。 追加キーワード取得部による追加キーワードの取得手順を説明したフロー図。 時間的範囲のカラムを有する追加キーワードデータベースの一例。 地理的範囲のカラムを有する追加キーワードデータベースの一例。
以下、図面を参照しながら本発明の実施の形態を説明するが、本発明は下記の実施形態に限定されるものではない。
[概要]
図1に示された本実施形態の情報検索装置1は、略語からなるキーワードが情報検索に供された際、当該略語と共に指定された検索範囲に対応した対応語群から、当該検索範囲における対応語の主要度に基づき対応語を抽出する。そして、この抽出した対応語を追加キーワードとして情報検索に供する。
本実施形態において、情報検索装置1は、略語からなるキーワードと前記略語の開示を規定する範囲と前記略語に対応する対応語とこの対応語の主要度とを予め格納した追加キーワードデータベース3(以下、追加キーワードDB3)を備えている。情報検索装置1では、クエリ入力部2から供されたキーワード及び検索範囲に対応した対応語群を追加キーワードDB3から引き出して、当該対応語群の各対応語について当該検索範囲における主要度を示す指定範囲中主要度を算出する。そして、この主要度が閾値よりも高い対応語を追加キーワードとして範囲検索部6による情報検索に供する。以上のように、略語を検索キーワードとした場合に、指定された検索範囲によって当該略語の表す対応語が絞り込まれ、検索精度が向上する。
[情報検索装置1の構成]
情報検索装置1は、図1に示されたように、クエリ入力部2、追加キーワードDB3、追加キーワード取得部4、文書データベース5(以下、文書DB5)、範囲検索部6、検索結果出力部7を備える。
情報検索装置1の前記機能部及びDBはサーバ(コンピュータ)のハードウェアリソースによって実現される。すなわち、情報検索装置1はCPU、記憶装置(例えば、ハードディスク装置)、I/Oデバイス(例えば、通信デバイス)等のコンピュータに係るハードウェアリソースを備える。そして、これらのハードウェアリソースがソフトウェアリソース(OS、アプリケーション等)と協働することにより前記機能部及びDBが実装される。
クエリ入力部2はネットワークを介してユーザから受け付けたクエリを追加キーワード取得部4に供する。クエリは情報検索装置1に供される情報要求であり、略語からなるキーワードと、検索範囲とから構成される。前記検索範囲としては時間、地理、言語、ドメイン、分野等が例示される。尚、クエリ入力部2はWebインタフェースに例示されるユーザインタフェース上に備えられている。
追加キーワードDB3は、図4、図5に示したように、略語wを示すキーワードと、略語wの開示を規定する範囲tと、略語wに対応する対応語eと、対応語eの主要度cを予め格納したデータベースである。主要度cは、略語wに対する対応語eの尤もらしさを示すスコアであり、その値が高いものほど対応語としてふさわしいものとする。主要度cは例えば非特許文献1に開示された周知の“Score”の算出法によって得られる。
図4に例示された追加キーワードDBは検索範囲が時間範囲である場合のデータベースの例である。図5に例示された追加キーワードDBは検索範囲が地理範囲である場合のデータベースの例である。範囲tにおける略語wに対応する対応語eの抽出は範囲tに適合する文書集合を用いることによって行う。範囲tに適合する文書集合の取得は後述の範囲検索部6による指定検索範囲に適合する文書の特定法と同一の方法で行うことができる。
追加キーワード取得部4はクエリ入力部2によって指定された前記キーワード及び検索範囲に対応する対応語群を追加キーワードDB3から引き出し、各対応語について当該検索範囲における当該対応語の主要度を示す指定範囲中主要度を計算する。そして、この主要度が閾値よりも高い対応語を追加キーワードとして取得する。
また、追加キーワード取得部4は、クエリ入力部2によって複数の検索範囲が指定された場合、クエリ入力部2から供されたキーワード及び当該複数の検索範囲に対応する対応語群を追加キーワードDB3から引き出す。次いで、前記対応語群の各対応語について前記各検索範囲における当該対応語の主要度を示す指定範囲中主要度を計算する。次いで、この各検索範囲における指定範囲中主要度を掛け合わせたものを前記複数の検索範囲からなる指定範囲集合における前記対応語の主要度を示す指定範囲中主要度として算出する。そして、この主要度が閾値よりも高い対応語を追加キーワードとして取得する。
「単一の検索範囲が指定された場合」「複数の検索範囲が指定された場合」の追加キーワード取得部4による対応語の指定範囲中主要度の具体的な計算についてそれぞれ説明する。
(単一の検索範囲が指定された場合の指定範囲中主要度の計算)
ユーザが指定する検索範囲は、データベース中の範囲の単位と異なる場合がある。例えば、図4のデータベース例では、時間単位を1年としているが、ユーザは2008年7月から2009年12月までを指定している場合などである。このような場合に対応するため、ユーザの指定する検索範囲中における対応語の主要度である、指定範囲中主要度を計算する。
略語wに対する、指定範囲(検索範囲)sにおける対応語eの指定範囲中主要度sc(w,s,e)は、以下の式(1)によって算出できる。
Figure 2012146079
ここで、tは範囲を表し、Tは指定範囲sを含んでいる範囲tの集合を表す。指定範囲sが2008年7月から2009年12月である場合、Tは2008年と2009年である。λは、範囲tのうち指定範囲sが含まれる割合を表す。先ほどの例で考えると、tが2008年である場合、指定時間に含まれるのは7月から12月までの半年であるため、割合λは0.5となる。一方、範囲tが2009年である場合、1月から12月まで全て指定範囲が含まれるため、割合λは1となる。c(w,t,e)はキーワードwに対する、範囲tにおける対応語eの主要度を表す。そして、指定範囲中主要度scが予め設定された閾値より高い対応語eが追加キーワードとして決定される。
前記閾値は任意に設定される。すなわち、より多くのキーワードを追加してより多くの検索結果を提示したい場合には閾値は低く設定され、関係のない検索結果を減らして精度を高めたい場合には閾値は高く設定される。
(複数の検索範囲が指定された場合の指定範囲中主要度の計算)
複数の検索範囲が検索条件として指定された場合、各検索範囲で算出された指定範囲中主要度を掛け合わせることで、前記複数の検索範囲からなる指定範囲集合における対応語の指定範囲中主要度を算出する。
すなわち、n個の検索範囲が指定されたとき、それぞれの指定範囲(検索範囲)をSi(i=1,2,3,…,n)で表し、指定範囲Siの集合をSとする。略語wに対する、指定範囲集合Sにおける対応語eの指定範囲中主要度sc(w,S,e)は以下の式(2)によって算出できる。そして、この指定範囲中主要度scの値が予め設定された閾値より高い対応語eが追加キーワードとして決定される。前記閾値も前述の趣旨により任意に設定される。
Figure 2012146079
(追加キーワード取得部4による追加キーワードの取得手順)
図3を参照しながら追加キーワード取得部4による追加キーワードの取得手順S41〜S47について説明する。ここでは検索範囲として指定範囲sが指定された事例での追加キーワードの取得手順について説明する。
(S41)クエリ入力部2からキーワード(略語)と指定範囲sが入力される。
(S42)追加キーワードDB3において前記キーワード、指定範囲sを含む範囲tを有する行を検索する。
(S43)前記行が存在する場合、S44に移行する。前記行が存在しない場合、処理を終了する。
(S44)S42で取得された行から対応語eの指定範囲中主要度scを式(1)による演算によって算出する。
(S45)前記算出された指定範囲中主要度scが閾値以上である場合、S46に移行する。前記指定範囲中主要度scが閾値以上でない場合、S47に移行する。
(S46)指定範囲中主要度scが閾値以上である対応語句eを追加キーワードとして取得する。
(S47)追加キーワードDB3における前記キーワード、指定範囲sを含む範囲tを有する行中の全ての対応語eについてS44にて指定範囲中主要度scを算出する。
以上の手順により取得された追加キーワードは範囲検索部6に供される。
文書DB5は予め収集した文書を格納したデータベースである。例えば、Web上に公開されている文書をクローラ等の周知の情報収集手段によって収集した文書を記録することで構築されたデータベースである。そして、インターネット上のWebサイトのように文書の内容が逐次更新される情報源である場合、当該文書が更新されると、新たな文書が作成されたとみなされ、前記情報収集手段によって収集されて文書DBに格納される。尚、既存のWebページの検索エンジン群を文書DB5の代わりとして用いるようにしてもよい。
範囲検索部6は、前記入力されたキーワードに適合する文書、前記入力された検索範囲に適合する文書、及び追加キーワード取得部4で得られた追加キーワードに適合する文書を文書DB5から検索する。前記文書の検索には周知の検索技術が適用される。
検索結果出力部7は範囲検索部6による検索によって得られた文書を検索結果として出力する。検索結果出力部7はクエリ入力部2と同様に前記ユーザインタフェース上に備えられている。
[情報検索装置1による検索の処理手順の説明]
図2を参照しながら情報検索装置1による文書検索の手順について具体的に説明する。
S1:クエリ入力部2はユーザからクエリとして受け付けたキーワード(略語)及び検索範囲を追加キーワード取得部4に供する。
検索範囲としては例えば時間、地理、言語、ドメイン、分野などである。検索範囲が時間である場合には、検索範囲としては「2008年7月〜2009年12月」が例示される。検索範囲が地理である場合には、検索範囲としては「北東座標 緯度35度00分00秒,経度139度00分00秒 〜 南西座標 緯度34度50分00秒,経度138度50分00秒」が例示される。検索範囲が言語である場合には、「日本語」といった検索範囲クエリとしてもよい。他にもドメイン、分野などが検索範囲として例示される。
S2:追加キーワード取得部4はクエリ入力部2から供された検索範囲が追加キーワードDB3に含まれているかを判断する。
S2では具体的には図3を参照して説明した前述のステップS41〜S43が実行される。例えば、図4,図5に示された追加キーワードDB3に前記検索範囲が含まれているかを判断する。前記検索範囲が追加キーワードDB3に含まれている場合、S3に移行する。一方、前記検索範囲が追加キーワードDB3に含まれていない場合、S7に移行する。
S3:追加キーワード取得部4はクエリ入力部2から供された検索範囲に対応する範囲における対応語群を追加キーワードDB3から引き出す。
S4:追加キーワード取得部4はS3で取得した対応語群の各対応語の指定範囲中主要度を計算し、これによって算出された主要度が閾値よりも高い対応語を追加キーワードとして取得する。
S4では具体的には図3を参照して説明した前述のステップS44〜S47が実行される。クエリ入力部2から供された検索範囲が単一である場合、式(1)に基づく演算によって対応語の指定範囲中主要度が算出される。一方、クエリ入力部2から供された検索範囲が複数である場合、式(2)に基づく演算によって対応語の指定範囲中主要度が算出される。そして、指定範囲中主要度が閾値以上である対応語句が追加キーワードとして取得される。
S5:追加キーワード取得部4はS1で供されたキーワード及び検索範囲に対してS4で取得した追加キーワードを追加したクエリを範囲検索部6に供する。
S6:範囲検索部6は、S1で入力されたキーワードに適合する文書、S1で入力された検索範囲に適合する文書、及びS5で得られた追加キーワードに適合する文書を文書DB5から検索する。
S7:追加キーワード取得部4はS1で入力された検索範囲を非特許文献2,3に例示される従来技術に係る範囲検索を実行する検索エンジンに供してキーワードを取得し、これを追加キーワードとする。そして、S1で供されたキーワード及び検索範囲に対して本ステップS7で取得された追加キーワードを追加したクエリを範囲検索部6に供する。
S8:範囲検索部6は、S1で入力されたキーワードに適合する文書、S1で入力された検索範囲に適合する文書、及びS7で得られた追加キーワードに適合する文書を文書DB5から検索する。
S9:検索結果出力部7はS6またはS8での検索で取得された文書を検索結果として出力する。
[本実施形態の効果]
以上のように本実施形態の情報検索装置1によれば、略語及び検索範囲を検索クエリとした際に、検索漏れが低減する共に検索精度が向上する。また、検索クエリとして略語を指定した際に指定した範囲によって当該略語の表す対応語が絞り込まれるので、当該略語及び当該範囲に関係のない文書が除外される。
特に、本実施形態においては追加キーワードDB3が具備されているので、前記略語及び単数または複数の検索範囲に対応する対応語群を効率的に取得できる。
また、前記略語及び検索範囲に対応する対応語群の各対応語について当該検索範囲における主要度を示す指定範囲中主要度が算出され、この主要度が閾値よりも高い対応語が前記検索クエリへの追加キーワードとして取得される。このように前記指定範囲中主要度の閾値に基づき対応語が抽出されるので、前記略語に基づく情報検索を所望の検索精度で行える。
さらに、前記検索範囲が複数指定された場合、前記略語及び当該複数の検索範囲に対応する対応語群の各対応語の各検索範囲における主要度を示す指定範囲中主要度を掛け合わせたものが前記複数の検索範囲からなる指定範囲集合における当該対応語の主要度を示す指定範囲中主要度とされる。そして、この主要度が閾値よりも高い対応語が前記検索クエリへの追加キーワードとして取得される。したがって、検索範囲が複数指摘された場合であっても、前記略語に基づく情報検索を所望の検索精度で行える。
また、本実施形態においては予め収集された情報を格納した文書DB5が具備されているので、前記略語、前記検索範囲及び前記追加キーワードに適合した文書を迅速に取得することできる。
尚、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
[本発明のプログラムとしての態様]
本発明は上記の実施形態の情報検索装置1の各機能部の一部もしくは全部の機能をコンピュータのプログラムで構成し、そのプログラムをコンピュータによって実行して本発明を実現することができる。また、コンピュータで前記機能部を実現するためのプログラムをそのコンピュータが読み取り可能な記録媒体、例えば、FD(Floppy(登録商標) Disk)や、MO(Magneto−Optical disk)、ROM(Read Only Memory)、メモリカード、CD(Compact Disk)−ROM、DVD(Digital Versatile Disk)−ROM、CD−R、CD−RW、HDD、SSD、リムーバブルディスクなどに記録して、保存したり、配布したりすることが可能である。また、上記のプログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。
1…情報検索装置
3…追加キーワードDB(キーワードデータベース)
4…追加キーワード取得部(追加キーワード取得手段)
6…範囲検索部(範囲検索手段)

Claims (9)

  1. 略語を含んだクエリに適合する文書を検索する情報検索装置であって、
    前記クエリとして供された略語からなるキーワード及び検索範囲に対応する対応語群から各対応語の主要度に基づき取得した対応語を当該クエリの追加キーワードとする追加キーワード取得手段と、
    前記キーワード、前記検索範囲及び前記追加キーワードに基づき情報検索を行う範囲検索手段と
    を備えたこと
    を特徴とする情報検索装置。
  2. 前記追加キーワード取得手段は、前記キーワード及び検索範囲に対応する対応語群の各対応語について当該検索範囲における主要度を示す指定範囲中主要度を算出し、この主要度が閾値よりも高い対応語を前記追加キーワードとして取得すること
    を特徴とする請求項1に記載の情報検索装置。
  3. 前記検索範囲が複数供された場合、前記追加キーワード取得手段は、前記キーワード及び当該複数の検索範囲に対応する対応語群の各対応語の各検索範囲における主要度を示す指定範囲中主要度を掛け合わせたものを前記複数の検索範囲からなる指定範囲集合における当該対応語の主要度を示す指定範囲中主要度とし、この主要度が閾値よりも高い対応語を前記追加キーワードとして取得すること
    を特徴とする請求項2に記載の情報検索装置。
  4. 略語で示されるキーワードと前記略語の開示を規定する範囲と前記略語に対応する対応語とこの対応語の主要度とを予め格納したキーワードデータベースをさらに備え、
    前記追加キーワード取得手段は前記供されたキーワード及び単数または複数の検索範囲に基づき前記キーワードデータベースから当該キーワード及び検索範囲に対応する対応語群を引き出すこと
    を特徴とする請求項1から3のいずれか1項に記載の情報検索装置。
  5. 略語を含んだクエリに適合する文書を検索する情報検索方法であって、
    追加キーワード取得手段が前記クエリとして供された略語からなるキーワード及び検索範囲に対応する対応語群から各対応語の主要度に基づき取得した対応語を当該クエリの追加キーワードとするステップと、
    範囲検索手段が前記キーワード、前記検索範囲及び前記追加キーワードに基づき情報検索を行うステップと
    を有すること
    を特徴とする情報検索方法。
  6. 前記追加キーワードを取得するステップでは、前記キーワード及び検索範囲に対応する対応語群の各対応語について当該検索範囲における主要度を示す指定範囲中主要度を算出し、この主要度が閾値よりも高い対応語を前記追加キーワードとして取得すること
    を特徴とする請求項5に記載の情報検索方法。
  7. 前記検索範囲が複数供された場合、前記追加キーワードを取得するステップでは、前記キーワード及び当該複数の検索範囲に対応する対応語群の各対応語の各検索範囲における主要度を示す指定範囲中主要度を掛け合わせたものを前記複数の検索範囲からなる指定範囲集合における当該対応語の主要度を示す指定範囲中主要度とし、この主要度が閾値よりも高い対応語を前記追加キーワードとして取得すること
    を特徴とする請求項6に記載の情報検索方法。
  8. 前記追加キーワードを取得するステップでは、略語で示されるキーワードと前記略語の開示を規定する範囲と前記略語に対応する対応語とこの対応語の主要度とを予め格納したキーワードデータベースから、前記供されたキーワード及び単数または複数の検索範囲に対応する対応語群を引き出すこと
    を特徴とする請求項5から7のいずれか1項に記載の情報検索方法。
  9. 請求項1から4のいずれか1項に記載の情報検索装置を構成する各手段としてコンピュータを機能させることを特徴とする情報検索プログラム。
JP2011003242A 2011-01-11 2011-01-11 情報検索装置、情報検索方法、及び情報検索プログラム Expired - Fee Related JP5491422B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011003242A JP5491422B2 (ja) 2011-01-11 2011-01-11 情報検索装置、情報検索方法、及び情報検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011003242A JP5491422B2 (ja) 2011-01-11 2011-01-11 情報検索装置、情報検索方法、及び情報検索プログラム

Publications (2)

Publication Number Publication Date
JP2012146079A true JP2012146079A (ja) 2012-08-02
JP5491422B2 JP5491422B2 (ja) 2014-05-14

Family

ID=46789589

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011003242A Expired - Fee Related JP5491422B2 (ja) 2011-01-11 2011-01-11 情報検索装置、情報検索方法、及び情報検索プログラム

Country Status (1)

Country Link
JP (1) JP5491422B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016015431A1 (zh) * 2014-07-28 2016-02-04 百度在线网络技术(北京)有限公司 搜索方法、装置、设备及非易失性计算机存储介质
CN116226335A (zh) * 2023-03-15 2023-06-06 阿维塔科技(重庆)有限公司 关键字查询方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000331012A (ja) * 1999-05-19 2000-11-30 Oki Electric Ind Co Ltd 電子化文書検索方法
JP2005267468A (ja) * 2004-03-19 2005-09-29 Murata Mach Ltd 情報検索装置
JP2006323594A (ja) * 2005-05-18 2006-11-30 Ntt Docomo Inc 同義語抽出システムおよび同義語抽出方法
JP2007213005A (ja) * 2006-01-10 2007-08-23 Nissan Motor Co Ltd 認識辞書システムおよびその更新方法
JP2008204399A (ja) * 2007-02-22 2008-09-04 Nippon Telegr & Teleph Corp <Ntt> 略語抽出方法、略語抽出装置およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000331012A (ja) * 1999-05-19 2000-11-30 Oki Electric Ind Co Ltd 電子化文書検索方法
JP2005267468A (ja) * 2004-03-19 2005-09-29 Murata Mach Ltd 情報検索装置
JP2006323594A (ja) * 2005-05-18 2006-11-30 Ntt Docomo Inc 同義語抽出システムおよび同義語抽出方法
JP2007213005A (ja) * 2006-01-10 2007-08-23 Nissan Motor Co Ltd 認識辞書システムおよびその更新方法
JP2008204399A (ja) * 2007-02-22 2008-09-04 Nippon Telegr & Teleph Corp <Ntt> 略語抽出方法、略語抽出装置およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016015431A1 (zh) * 2014-07-28 2016-02-04 百度在线网络技术(北京)有限公司 搜索方法、装置、设备及非易失性计算机存储介质
CN116226335A (zh) * 2023-03-15 2023-06-06 阿维塔科技(重庆)有限公司 关键字查询方法、装置及电子设备

Also Published As

Publication number Publication date
JP5491422B2 (ja) 2014-05-14

Similar Documents

Publication Publication Date Title
KR101078864B1 (ko) 질의/문서 주제 범주 변화 분석 시스템 및 그 방법과 이를 이용한 질의 확장 기반 정보 검색 시스템 및 그 방법
US11455313B2 (en) Systems and methods for intelligent prospect identification using online resources and neural network processing to classify organizations based on published materials
US10108699B2 (en) Adaptive query suggestion
US8180785B2 (en) Method and system for searching numerical terms
US20120053927A1 (en) Identifying topically-related phrases in a browsing sequence
US20110208715A1 (en) Automatically mining intents of a group of queries
JP2009151749A (ja) ナビゲーションパス情報に基づく主題関連ウェブページのフィルタリング方法およびシステム
WO2009095355A2 (en) Systems and methods for ranking search engine results
US9971828B2 (en) Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
JP5639549B2 (ja) 情報検索装置及び方法及びプログラム
US9465875B2 (en) Searching based on an identifier of a searcher
Davison et al. Finding Relevant Website Queries.
JP2011501849A (ja) 情報マップ管理システムおよび情報マップ管理方法
JP5491422B2 (ja) 情報検索装置、情報検索方法、及び情報検索プログラム
JP5224453B2 (ja) 地理的特徴情報抽出方法およびシステム
KR100943625B1 (ko) 지역 정보와 웹사이트 정보의 통합 관리를 위한 통합데이터베이스 생성 방법 및 시스템과 그에 의해 생성된통합 데이터베이스를 이용한 검색 결과 제공 방법
JP5292336B2 (ja) 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム
Granados Buey et al. SQX-Lib: Developing a semantic query expansion system in a media group
Martins et al. Modeling temporal evidence from external collections
Nguyen et al. Resource selection for federated search on the web
Halpin et al. Relevance feedback between hypertext and semantic search
CN113590736B (zh) 索引管理方法、装置、电子设备和可读存储介质
JP5410359B2 (ja) クエリ選択装置及びプログラム
JP5346045B2 (ja) 文書検索装置、文書検索方法および文書検索プログラム
JP2005063366A (ja) 情報管理装置および情報管理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140227

R150 Certificate of patent or registration of utility model

Ref document number: 5491422

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees