JP2017173953A - 文献検索装置およびコンピュータプログラム - Google Patents
文献検索装置およびコンピュータプログラム Download PDFInfo
- Publication number
- JP2017173953A JP2017173953A JP2016056686A JP2016056686A JP2017173953A JP 2017173953 A JP2017173953 A JP 2017173953A JP 2016056686 A JP2016056686 A JP 2016056686A JP 2016056686 A JP2016056686 A JP 2016056686A JP 2017173953 A JP2017173953 A JP 2017173953A
- Authority
- JP
- Japan
- Prior art keywords
- document
- cited
- search
- target
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 ターゲット文書を特定するための文献指定データを受信する文献指定受信手段と、その文献指定受信手段が受信した文献指定データに対する引用文献および/または被引用文献を特定する引用/被引用文献特定手段と、その引用/被引用文献特定手段が特定した引用文献および/または被引用文献と、検索対象である情報文献群のそれぞれの情報文献との類似度を演算する演算手段と、その演算手段が演算した類似度の順に検索対象文書群を順位付けするソート手段とを備える。
【選択図】 図6
Description
ベクトル演算を用いた検索技術(概念検索技術)は、予め辞書作成用の文種から形態素解析などによって単語を切り出し、各単語に基本となるベクトルを付与して、辞書機能をなすベクトル群(ステムベクトル)を生成する。そのステムベクトルをもとにして、検索対象文書全体のベクトルを決定し、検索対象文書群から検索対象文書ベクトル群を生成する。その結果、検索対象文書は、各々一文書あたり一つのベクトルを持つこととなる。
検索を実行する際には、検索のために入力した文章をステムベクトルに基づいて検索文章ベクトルを生成し、その検索文章ベクトルと前記検索対象文書ベクトル群との内積を演算し、内積値の高い検索対象文書から所定件数を出力させる(図1参照)。
この技術によれば、検索対象文書群から関連度の高い文書から順に所定件数を必ず出力させることが可能となり、キーワード検索による欠点を克服できる。
特許文献1では、概念検索を連続して実行する場合、二度目以後の概念検索を「類似検索」と定義している(段落番号0096)。しかし、本願においては、通常のキーワード検索の結果や番号照会の結果などの一覧(ソート結果)から文献指定手段によって文献を指定して実行する概念検索も「類似検索」とする。
しかし、検索エンジン自体のアルゴリズムの変更には多くの時間と費用を要し、短期的な検索結果の大幅な変更は期待できない。
第一の発明は、ユーザに係る端末からユーザが検索対象とするターゲット文書である情報文献を特定するための文献指定データを受信する文献指定受信手段と、
その文献指定受信手段が受信した文献指定データに対する引用文献および/または被引用文献を特定する引用/被引用文献特定手段と、
その引用/被引用文献特定手段が特定した引用文献および/または被引用文献と、検索対象である情報文献群のそれぞれの情報文献との類似度を演算する演算手段と、
その演算手段が演算した類似度の順に検索対象文書群を順位付けするソート手段と、
そのソート手段が順位付けした結果をユーザに係る端末へ送信するソート結果送信手段と、
を備えて概念検索を実行する文献検索装置に係る。(図6参照)。
本発明に係る文献検索装置は、一般的には、クライアント・サーバシステムにおけるサーバに必要な機能を具備してなる。
「概念検索」には、「ベクトル型の概念検索」および「キーワード重み付け型の概念検索」の双方を含む。
「検索対象」となる文書群としては、特許情報文献の他、新聞記事、学術書などを用いる。演算手段が類似度を演算するために用いる「辞書作成用文書群」も同様である。 ここで「特許情報文献」とは、特許出願された公開公報、特許された特許公報、以前の特許法の下で出願公告された公告公報、実用新案登録出願に係る文献、特許出願を審査するために用いられる公開技報、技術論文などをいう。
「クライアント・サーバシステム」は、LANで接続されたもののほか、イントラネット上のクライアント・サーバシステム、クライアントコンピュータがサーバ運営者と契約してネットワーク(たとえばインターネット)にて接続された場合を含む。このクライアントコンピュータが「端末」であり、その端末の操作者が「ユーザ」となる。
「文献指定受信手段」とは、ユーザに係る端末から入力されたデータに基づいて、ターゲット文書を特定する手段である。端末のユーザは、文献を特定するための番号などを入力する場合のほか、サーバから出力された文献を選択するという入力をする場合などがある
「引用文献および/または被引用文献」における「引用文献」とは、ターゲット文書に対して特許庁審査官や審判官が審査や審判をする際に拒絶理由を構成するために用いた文献である「引用文献」のほか、ターゲット文書がPCT条約による国際出願である場合の国際調査報告にていわゆる「X判定」や「Y判定に」用いられた文献、特許庁審査官が審査の際に用いた「参考文献」、出願人が特許明細書において記載した「先行特許文献」を含むこととしてもよい。
「被引用文献」とは、ターゲット文献を引用している文献のことである。たとえば、ターゲット文献が特許文献であれば特許となっている。その特許文献をターゲット文献とした場合の被引用文献に類似する文献を抽出できたとする。そのことはすなわち、ターゲット文献である特許を侵害している可能性のある技術を発見することについて、一助となる。
本発明に係る文献検索装置のユーザは、特許庁審査官等による引用文献等を含んだ引用文献付き文書を概念検索したいとする。
そのユーザは、ユーザに係る端末からユーザが検索対象とするターゲット文書である情報文献を特定するための文献指定データを送信する。本発明に係る文献検索装置の指定受信手段は、その文献指定データを受信する。
その文献指定受信手段が受信した文献指定データに対する引用文献および/または被引用文献を、引用/被引用文献特定手段が特定し、検索対象である情報文献群のそれぞれの情報文献との類似度を演算手段が演算する。 その演算手段が演算した類似度の順に、ソート手段が検索対象文書群を順位付けする。
そのソート手段が順位付けした結果については、ソート結果送信手段がユーザに係る端末へ送信する。
また、その概念検索が実行された結果としてのソート結果は、前記の引用文献および/または被引用文献が上位に位置する結果を期待できる。
第一の発明は、以下のようにしてもよい。
すなわち、前記のソート手段によって順位付けした結果がユーザに係る端末にて出力される際に、そのソート結果において前記のターゲット文書、ターゲット文書の引用文献およびターゲット文書の被引用文献の少なくとも一つを当該ユーザが識別できる付加情報を加える付加情報追加手段を更に備えることとしてもよい(図7,8,9参照)。
「付加情報」とは、たとえば、ソート結果において他のデータと区別しやすいハイライト表示、他のデータとは異なる配色の選択、網掛け表示、所定のマーク、カーソルを当てた際に所定の音声が出力される、などである。
ユーザに係る端末では、順位付けした結果が出力される。そのソート結果の中に含まれる前記の文献指定データには、当該ユーザが識別できる付加情報を付加情報追加手段が加えている。そのため、当該ユーザは、文献指定データがソート結果の何処に出力されているのかを発見しやすい。
第一の発明は、以下のようにしてもよい。
すなわち、検索対象文書群それぞれの文書に予め付与されている文書分類を用いて検索対象文書群を限定して検索するための文書分類指定情報をユーザに係る端末から受信する文書分類指定受信手段を更に備え、
前記の演算手段は、その文書分類指定受信手段にて受信した文書分類指定情報により限定された情報文献群に対して類似度演算を実行することとしてもよい(図14参照)。
「文書分類」とは、たとえば、特許文献における国際特許分類(IPC)、Fターム、CPC、USクラス、ECLAコードなどが含まれる。
文献検索装置のユーザは、検索対象文書群に対して検索対象の文書分類を限定ための文書分類指定情報を端末から入力し、文献検索装置へ送信する。すると、文献検索装置の文書分類指定受信手段がその文書分類指定情報を受信する。 文献検索装置の演算手段は、その文書分類指定情報に基づいて演算を実行する。
文献検索装置のユーザとしては、所望する文書分類指定情報に絞った概念検索の結果を得ることができる。
第一の発明は、以下のようにしてもよい。
すなわち、前記の文献指定受信手段は、文献指定データによって指定される文書が複数である場合には、各文書それぞれの重み付けデータをも受信することとし、
前記の演算手段は、その重み付けデータに基づいて演算を実行することとしてもよい(図14参照)。
文献検索装置のユーザは、文献指定データによって指定する複数の文書に対してそれぞれ重み付けデータを端末から入力し、文献検索装置へ送信する。すると、文献検索装置の検索用文章受信手段がその重み付けデータを受信する。 文献検索装置の演算手段は、その重み付けデータに基づいて演算を実行する。
文献検索装置のユーザとしては、複数の文書にそれぞれ付した重み付けが反映された概念検索の結果を得ることができる。
第一の発明は、以下のようにしてもよい。
すなわち、前記の文献指定受信手段は、前記のターゲット文書における引用文献のうち、登録された特許文献、拒絶査定時に引用された引用文献、特許庁審査官に引用された引用文献のいずれかもしくは全てを、ユーザに係る端末から指定可能であるようにしてもよい。
ユーザは、ターゲット文書における引用文献のうち、登録された特許文献、拒絶査定時に引用された引用文献、特許庁審査官に引用された引用文献のいずれかもしくは全てを、ターゲット文献として自らに係る端末から指定し、送信することができる。
文献検索装置の文献指定受信手段は、その文献指定データを受信し、その文献指定データに基づいて概念検索を実行する。
拒絶査定時に引用された引用文献を指定する場合には、拒絶査定時の引用文献に絞る、といった意図を伴って引用文献を指定することとなる。
特許庁審査官に引用された引用文献を指定する場合には、ユーザの考えを排除するために特許庁審査官に引用された引用文献に絞る、といった意図を伴って引用文献を指定することとなる。
第一の発明は、以下のようにしてもよい。
すなわち、前記の文献指定受信手段は、前記のターゲット文書における引用文献および/または被引用文献がその文献に対する引用文献および/または被引用文献を含む場合、その引用文献および/または被引用文献をユーザに係る端末から指定可能であるようにしてもよい。
ユーザは、自らに係る端末から、ターゲット文書における引用文献および/または被引用文献がその文献に対する引用文献および/または被引用文献を含む場合、その引用文献および/または被引用文献を指定した文献指定データを送信することができる。
文献検索装置の文献指定受信手段は、その文献指定データを受信し、その文献指定データに基づいて概念検索を実行する。
ユーザとしては、引用文献および/または被引用文献がその文献に対する引用文献および/または被引用文献に類似関係のある検索が簡易に行える。
第一の発明は、以下のようにしてもよい。
すなわち、前記ターゲット文書における引用文献を第一世代の引用文献とし、前記ターゲット文書に対する、当該第一世代の引用文献における引用文献を第二世代の引用文献とする。 同様に、前記ターゲット文書に対する、第N−1世代の引用文献における引用文献を第N世代の引用文献とする。
そして、前記の文献指定受信手段においては前記ターゲット文書に対する引用文献の世代数Nを指定可能として、当該ターゲット文書に対する引用文献の世代数Nを指定された場合、 第一世代から第N世代の引用文献を、前記引用/被引用文献特定手段が特定した引用文献として、前記の演算手段が検索対象である情報文献群のそれぞれの情報文献との類似度を演算することとしてもよい。
ユーザは、世代数Nを指定すれば、ターゲット文書に対する引用文献の第一世代からN世代までの引用文献に類似関係のある検索が簡易に行える。
第一の発明は、以下のようにしてもよい。
すなわち、 前記ターゲット文書における被引用文献を第一世代の被引用文献とし、前記ターゲット文書に対する、当該第一世代の被引用文献における被引用文献を第二世代の被引用文献とする。 同様に、前記ターゲット文書に対する、第M−1世代の被引用文献における被引用文献を第M世代の被引用文献とする。
そして、前記の文献指定受信手段においては前記ターゲット文書に対する被引用文献の世代数Mを指定可能として、当該ターゲット文書に対する被引用文献の世代数Mを指定された場合、 第一世代から第M世代の被引用文献を、前記引用/被引用文献特定手段が特定した被引用文献として、前記の演算手段が検索対象である情報文献群のそれぞれの情報文献との類似度を演算することとしてもよい。
ユーザは、世代数Mを指定すれば、ターゲット文書に対する被引用文献の第一世代からM世代までの被引用文献に類似関係のある検索が簡易に行える。
第二の発明は、特許検索を実行するコンピュータへインストールされるコンピュータプログラムに係る。
そのコンピュータプログラムは ユーザに係る端末からユーザが検索対象とするターゲット文書である情報文献を特定するための文献指定データを受信する文献指定受信手順と、 その文献指定受信手順にて受信した文献指定データに対する引用文献および/または被引用文献を特定する引用/被引用文献特定手順と、 その引用/被引用文献特定手順にて特定された引用文献および/または被引用文献と、検索対象である情報文献群のそれぞれの情報文献との類似度を演算する演算手順と、 その演算手順にて演算した類似度の順に検索対象文書群を順位付けするソート手順と、 そのソート手順にて順位付けした結果をユーザに係る端末へ送信するソート結果送信手順と、をコンピュータに実行させることとしたコンピュータプログラムである。
第二の発明は、以下のようにしてもよい。
すなわち、前記のソート手順によって順位付けされた結果がユーザに係る端末にて出力される際に、そのソート結果において前記のターゲット文書、ターゲット文書の引用文献及びターゲット文書の被引用文献の少なくとも一つを当該ユーザが識別できる付加情報を加える付加情報追加手順を、コンピュータに実行させることとしてもよい。
第二の発明は、以下のようにしてもよい。
すなわち、検索対象文書群それぞれの文書に予め付与されている文書分類を用いて検索対象文書群を限定して検索するための文書分類指定情報をユーザに係る端末から受信する文書分類指定受信手順を、コンピュータに実行させることとしてもよい。そして、前記の演算手順においては、文書分類指定受信手順にて受信した文書分類指定情報により限定された情報文献群に対して類似度演算を実行する。
第二の発明は、以下のようにしてもよい。
すなわち、 前記の文献指定受信手順においては、文献指定データによって指定される文書が複数である場合には、各文書それぞれの重み付けデータをも受信することとし、 前記の演算手順においては、その重み付けデータに基づいて演算を実行することとしてもよい。
第二の発明は、以下のようにしてもよい。
すなわち、 前記の文献指定受信手順においては、前記のターゲット文書における引用文献のうち、登録された特許文献、拒絶査定時に引用された引用文献、特許庁審査官に引用された引用文献のいずれかもしくは全てを、ユーザに係る端末から指定可能であるようにしてもよい。
第二の発明は、以下のようにしてもよい。
すなわち、前記の文献指定受信手順においては、前記のターゲット文書における引用文献および/または被引用文献がその文献に対する引用文献および/または被引用文献を含む場合、その引用文献および/または被引用文献をユーザに係る端末から指定可能であるようにしてもよい。
第二の発明は、以下のようにしてもよい。
すなわち、 前記ターゲット文書における引用文献を第一世代の引用文献とし、 前記ターゲット文書に対する、当該第一世代の引用文献における引用文献を第二世代の引用文献とし、 同様に、前記ターゲット文書に対する、第N−1世代の引用文献における引用文献を第N世代の引用文献とする。そして、前記の文献指定受信手順においては前記ターゲット文書に対する引用文献の世代数Nを指定可能とする。
そして、当該ターゲット文書に対する引用文献の世代数Nを指定された場合には、前記の演算手順において、第一世代から第N世代の引用文献を、前記引用/被引用文献特定手段が特定した引用文献として、検索対象である情報文献群のそれぞれの情報文献との類似度を演算することとしてもよい。
第二の発明は、以下のようにしてもよい。
すなわち、 前記ターゲット文書における被引用文献を第一世代の被引用文献とし、 前記ターゲット文書に対する、当該第一世代の被引用文献における被引用文献を第二世代の被引用文献とし、 同様に、前記ターゲット文書に対する、第M−1世代の被引用文献における被引用文献を第M世代の被引用文献とする。そして、前記の文献指定受信手順においては前記ターゲット文書に対する被引用文献の世代数Mを指定可能とする。
そして、当該ターゲット文書に対する被引用文献の世代数Mを指定された場合には、前記の演算手順において、第一世代から第M世代の被引用文献を、前記引用/被引用文献特定手段が特定した被引用文献として、検索対象である情報文献群のそれぞれの情報文献との類似度を演算することとしてもよい。
第三の発明は、 文献検索装置へアクセスして概念検索をするためのデータを入力および送信して概念検索の結果を受信して出力させるための端末にて実行されるコンピュータプログラムに係る。
そのコンピュータプログラムは、 ユーザが検索対象とするターゲット文書である情報文献を特定するための文献指定データを入力する文献指定データ入力手順と、 その文献指定データ入力手順にて入力した文献指定データを送信するデータ送信手順と、 そのデータ送信手順にて送信した文献指定データに基づいて検索対象である情報文献群のそれぞれに対する類似度を演算した文献検索装置の類似度の順に検索対象文書群をソートされたソート結果を受信するソート結果受信手順と、 そのソート結果受信手順にて受信したソート結果を出力させる出力手順と、を実行させる。
前記の文献指定データ入力手順においては、 前記のターゲット文書が特許庁審査官等による引用文献等を含んだ引用文献付き文書である場合に、前記の引用文献等の一部または全部を指定可能とする引用文献等指定手順を含むこととしたコンピュータプログラムである。
第三の発明は、前記の出力手順において順位付けした結果がユーザに係る端末にて出力される際に、そのソート結果において前記のターゲット文書、ターゲット文書の引用文献及びターゲット文書の被引用文献の少なくとも一つを当該ユーザが識別できる付加情報を含んで出力されることとしてもよい。
第三の発明は、前記の文献指定データには、検索対象文書群それぞれの文書に予め付与されている文書分類を用いて検索対象文書群を限定して検索するための文書分類指定情報をも含むこととし、 前記のデータ送信手順においては、その文書分類指定情報をも送信することとしてもよい。
第三の発明は、以下のように形成してもよい。
すなわち、前記の文献指定データには、文献指定データによって指定される文書が複数である場合には、各文書それぞれの重み付けデータをも含むこととし、 前記のデータ送信手順においては、その重み付けデータをも送信することとしてもよい。
第三の発明は、以下のように形成してもよい。
すなわち、前記の文献指定データには、前記のターゲット文書における引用文献のうち、登録された特許文献、拒絶査定時に引用された引用文献、特許庁審査官に引用された引用文献のいずれかもしくは全てを含むこととし、 前記のデータ送信手順においては、そのような文献指定データを送信することとしてもよい。
第三の発明は、以下のように形成してもよい。
すなわち、前記の文献指定データには、前記のターゲット文書における引用文献および/または被引用文献がその文献に対する引用文献および/または被引用文献を含む場合、その引用文献および/または被引用文献をユーザに係る端末から指定する旨を含むこととし、 前記のデータ送信手順においては、そのような文献指定データを送信することとしてもよい。
第三の発明は、以下のように形成してもよい。
すなわち、前記ターゲット文書における引用文献を第一世代の引用文献とし、 前記ターゲット文書に対する、当該第一世代の引用文献における引用文献を第二世代の引用文献とし、 同様に、前記ターゲット文書に対する、第N−1世代の引用文献における引用文献を第N世代の引用文献とし、 前記の文献指定受信手段においては前記ターゲット文書に対する引用文献の世代数Nを指定可能とする。
前記のデータ送信手順においては、そのような文献指定データを送信することとしてもよい。
第三の発明は、以下のように形成してもよい。
すなわち、前記ターゲット文書における被引用文献を第一世代の被引用文献とし、 前記ターゲット文書に対する、当該第一世代の被引用文献における被引用文献を第二世代の被引用文献とし、 同様に、前記ターゲット文書に対する、第M−1世代の被引用文献における被引用文献を第M世代の被引用文献とする。
前記のデータ送信手順においては、そのような文献指定データを送信することとしてもよい。
ここで、「記録媒体」とは、それ自身では空間を占有し得ないコンピュータプログラムを担持することができる媒体であり、例えば、ハードディスク、CD−R、DVD−R、などである。
第二の発明によれば、検索エンジン自体を改良することなく、対象特許を用いた検索により、ユーザが望む文献が上位に含まれる(スコアが高くなる)ように検索結果を出力可能なコンピュータプログラムを提供することができた。
第三の発明よれば、対象特許を用いた検索において、ユーザが望む文献が上位に含まれる(スコアが高くなる)ように検索結果が出力可能な検索用端末用のコンピュータプログラムを提供することができた。
また、概念検索の手法としては「ベクトル型」を例示しているが、「キーワード重み付け型」であっても、本発明は採用可能である。また、基本言語を日本語とした概念検索について説明しているが、別の言語による概念検索においても、本願発明は実現可能である。
図3は、概念検索を連続して実行する「類似検索」を示した図である。
文献検索装置としてのサーバに接続されたクライアントPC(検索を実行するユーザに係る端末)の画面へ「検索のための文章」を入力する入力欄、および検索を実行するための「検索」というクリックボタンを、左上に示している。このクライアントPCの画面へ検索のための文章をユーザが入力して検索ボタンをクリックすることで、概念検索の結果が出力される。具体的には、特許文献である文書A,B,C,・・・というように、検索のために入力された文章との類似度が高い順にソートされ、リストが表示される。
概念検索の結果から、文書Bに対して概念的に類似する文書を検索したい、という場合には、この文書Bがターゲット文書となる。そのターゲット文書の要約書または特許請求の範囲を用いて「検索のための文章」を入力し、検索ボタンをクリックする。その検索結果として、文書Bから作成した検索のための文章と、概念的に類似度が高い順に特許文献である文書D,E,F,・・・がソートされて出力される。
後に詳述するが、そのターゲット文書における一部(たとえば要約や特許請求の範囲)を「検索のための文章」として指定すれば、概念検索を実行することができるようにして、クライアントPCの操作者であるユーザの手間を軽減している。
概念検索または類似検索の結果について、妥当なのかどうか、ということは、ユーザにとって判断が難しい。「正解」があるわけではないため、相対評価をすることができるのであれば、相対評価をして判断するというのは、合理的な判断手法のひとつであろう。しかし、この判断手法による相対評価は、複数種類の概念検索エンジンにて同じ検索条件を入力して、検索結果を出力させることとなるが、現実的に困難である。複数種類の概念検索エンジンを使える環境が現実的に少ないためである。
そのため、一種類の概念検索エンジンによる簡単な妥当性について検証することとなる。
まず、ターゲット文書を特許公報(特許123号)とする。その特許公報には、特許庁の審査官が審査の際に用いたり、拒絶理由の根拠となったりした文献が「引用文献」として記載されている。こうしたターゲット文書を「引用文献付き文書」とする。
この引用文献付き文書において、引用文献として示されている文書が、ターゲット文書の一部(この図では要約書の文章)を検索用文章(検索のための文書)として用いた概念検索の結果において、どこに表れているか(類似度が高いとして出力されるか否か)を検証するのである。
引用文献の一つ目が上位に現れておらず、引用文献の二つ目も上位ではなかったという結果である。一部のユーザは、この検索結果に対して、この文献検索装置による「類似度」が妥当ではない、と判断することがある。
なお、引用文献については、文書A,B,Cとは容易に区別できるような表示にて出力している。そのため、ユーザは、引用文献がどの辺りにランキングされているか、直観的に把握できる。
図5は、自由な検索文章によって概念検索を実行する場合を示している。
サーバから提供された検索用文章入力手段における「検索用文章作成手段」を用いて検索用文章を入力し、送信する。
サーバにおける検索用文章受信手段の検索用文章受信手段が検索用文章を受信し、検索用文章ベクトル作成手段が、予め用意されたステムベクトルを用いて検索用文章ベクトルを作成する。
作成された検索用文章ベクトルと予め別途作成された検索対象文ベクトル群とを、ベクトル演算手段が演算し、ソート手段がソートした結果をクライアントPCへ出力できるように送信する。
図6は、図3に示した類似検索や図4に示した引用文献付き文書をターゲット文書として概念検索を実行する場合を示している。
クライアントPCでは、検索用文章入力手段として用意されている文献指定手段によって、ターゲット文書を特定するための情報(文献指定データ)およびターゲット文書のどの部分を検索用文章として用いるのかを指定する情報を、サーバへ送信する。
ベクトル演算手段の演算結果を、ソート手段がソートし、クライアントPCの出力手段へ出力させる。クライアントPCのユーザは、検索用文章を作成することなく、検索結果を得ることができる。
図6を用いて説明した手順を、図7を用いて更に詳細に説明する。
ターゲット文書として、引用文献付き文書(特許123号)を選択したら、検索用文章入力手段は、クライアントPCの操作者であるユーザに対して「検索モード」を選択させる。「要約」または「請求の範囲」のボタンにポインタを合わせてクリックした場合には、ターゲット文書の要約書または特許請求の範囲を、検索用文章として入力したこととなる。
なお、ターゲット文書がユーザに係るクライアントPCにて選択された場合、サーバは、このターゲット文書に引用文献があるかどうかを判断し、引用文献がある場合にはその引用文献をクライアントPCの出力において特定する。このターゲット文書の引用文献を特定する動作を実行する手段が、「引用文献特定手段」(不図示)に相当する。また、ターゲット文書の被引用文献を特定する動作を実行する手段が、「被引用文献特定手段」(不図示)に相当する。
図7では、「審査官モード」における「手動」、「自動/要約」、「自動/請求」の三種類のうち、「手動」を選んだとして説明する。「自動」については、図8にて後述する。
この図示例では、ユーザが引用文献1(特開2011−23*4号)を選択し、検索用文章は「要約」を選んで、検索実行ボタンをクリックしたとする。
図7のソート結果では、ターゲット文書の引用文献が含まれ、その引用文献は他のソート結果に含まれる文献と識別できるように引用文献の行は背景パターン(ドット模様)が付加されている。ソート結果にターゲット文書自身が含まれる場合にも、他のソート結果に含まれる文献と識別できるようにターゲット文書の行は別の背景パターン(不図示だが、例えば、斜線模様)が付加されていてもよい。これらの付加動作を実行する手段が、「付加情報追加手段」に相当する。
図8では、審査官モードとして「自動/請求」をユーザが選択した場合を図示している。
図の右側において「文献指定手段」を図示しているが、ユーザによる操作は不要である。「自動/請求」を選択したことによって、この「文献指定手段」に示した選択が自動的になされたことを示している。
すなわち、審査官モードにて「自動」と「特許請求の範囲」が自動チェックされ、ターゲット文書としては引用文献の全て(この図示例では2件)が自動チェックされ、「要約」と「特許請求の範囲」のうちの『特許請求の範囲』が自動チェックされている。
図8においては、引用文献付き文書に対する類似検索として、クライアントPCのユーザは、審査官モードの「自動/請求」をクリックするのみで、引用文献付き文書における引用文献を上位に表示させる検索結果を得ることができる。
図9に示す文献指定手段は、図7および図8と異なり、審査官モードの「手動」を選択すると、最初にターゲット文書となっていた引用文献付き文書をも、次のターゲット文書として選択可能としている。なお、この選択可能としている画面で、ターゲット文書と引用文献とを識別可能に顕示する構成としてもよい。
この文献指定手段では、最初のターゲット文書と引用文献2とを選択し、特許請求の範囲を選択して概念検索を実行した。この場合のソート結果としては、ターゲット文書と引用文献2とが上位に表示される。
図10では、図5に示した手順(実線にて表示)と、図6に示した手順(二点破線にて表示)とを連続して実行する場合を示している。(2)に示すルートが「類似検索」と称される。
図の左上では、類似検索の結果たるソート出力から、ターゲット文書を指定している。その指定したターゲット文書が右上に示すような引用文献付き文書であれば、まず、ソート出力において「引用文献付き文書」である旨が区別して表示される。更に、右下に示したように、「審査官モード」が選択できる。換言すれば、この文献検索装置は、ターゲット文書が引用文献付き文書である場合には、その引用文献が何であり、何件の引用文献が存在するかをクライアントPCにおいて確認できるように出力することとしている。
ユーザが審査官モードの「手動」を選択すると、下中央の文献指定手段のように、検索用文章とする引用文献を指定できる欄と、要約または特許請求の範囲を指定できる欄が表示される。
なお、特許された文献とそうではない文献とを区別するための表示のほか、引用文献付き文書であるかないかを区別するための表示をすることとしてもよい。
なお、引用文献の数が所定以下の場合にのみ、ターゲット文書もが文献指定手段において指定可能となるようにしてもよい。
また、ターゲット文書に対して複数の引用文献がある場合には、引用文献を選択する画面を出力したが、引用文献が一つのみの場合には、引用文献を選択させる画面を省略することもできる。
図12では、クライアントPCにてターゲット文書が指定された場合に、文献検索装置がどのように概念検索を開始するのかをフローチャートにて示している。
ターゲット文書が引用文献付きであれば、審査官モードをユーザが選択できる。ターゲット文書に引用文献付きか否かを文献検索装置が判断してくれるので、ユーザはターゲット文書に引用文献があるかないかを判断する必要がない、というメリットがある。
なお、図12のフローチャートでは、審査官モードは「手動」のみを想定している。また、要約か特許請求の範囲か、を選択する部分については省略している。
ターゲット文書を含むとした場合には、引用文献とターゲット文書の両方を指定して検索用文章を作成して概念検索を開始することとなる。ターゲット文書を含まないとした場合には、引用文献のみで検索用文章を作成して概念検索を開始することとなる。
図13では、ユーザが審査官モードを選択した後、手動モードか自動モードかを選択する場面からを説明している。
審査官モードにおける手動モードをユーザが選択しない場合(自動モードを選択した場合)には、引用文献の全てを文献検索装置が指定する(図8参照)。なお、吹き出しにて図示しているように、ターゲット文書を含めるか否かをユーザが選択できる場面を含めてもよい。
引用文献が所定数未満である場合には、引用文献の全てを文献検索装置が指定し、概念検索を開始する。
図14は、クライアントPCに表示される文献指定手段を更に高度化した場合を示している。
画面の上には、モード表示欄があり、ここでは、「審査官モード」の「手動」をユーザが選択している旨を表示している。
図14における「重み付け指定欄」では、ターゲット文書を30%とし、引用文献2を70%と、ユーザが入力している様子を示している。この場合、ターゲット文書によって作成される検索用文章ベクトルが0.3、引用文献2によって作成される検索用文章ベクトルが0.7であるとして、ベクトル演算手段が演算することとなる。そのため、ターゲット文書よりも引用文献2に類似度が高い文献が上位にランキングされるソート出力を、ユーザは得ることができる。
なお、この重み付け指定欄をユーザが使用しない場合には、選択された文献の重みは均等に自動設定する。
「引用文献のIPCと同じとする」をユーザが選択すれば、検索対象文書群が引用文献に付されたIPCに絞られてソート出力される。
「IPCを個別指定」を選択した場合には、AからHまでの国際特許分類をユーザがひとつまたは複数選択できる。
なお、この実施形態では、IPC指定欄について説明したが、Fターム、CPC、USクラス、ECLAコードなどにて、検索対象文書群を絞って検索を実行できるようにしてもよい。
図15に示す実施形態は、ターゲット文書が複数であっても、本願に係る文献検索装置は可能である旨を示すものである。
図の左上に示すように、類似検索の結果たるソート出力から、ターゲット文書として「特許6543*1号」と「特許321号」の二文献を指定した。いずれの文献も引用文献付きであったとしているが、少なくとも一つが引用文献付きであれば「審査官モード」を選択できる。
自動指定された条件にて、2回目の概念検索が実行され、その結果はユーザに係るクライアントPCの画面へ出力されることとなる。
図16では、引用文献の関係性を、「世代」として示している。
ターゲット文書に引用文献1(特許5544*2号)と、引用文献2(特許5432*号)とが存在していたとする。また、引用文献1には引用文献(特許432*0号)が存在し、引用文献2には引用文献(特許4433*2号)が存在していたとする。
この場合、ターゲット文書からみて、引用文献1,2を世代数「1」とし、特許432*0や特許4433*2を世代数「2」と定義する。
図17では、ターゲット文書の特定とともに、前述した世代数を入力できるようにした文献指定データ入力手段を図示している。
引用世代数指定欄は、文献情報指定欄の中に備える。その引用世代数指定欄は、プルダウンメニューとなっており、0(ターゲット文書のみでよい)、1(ターゲット文書に引用文献が存在する場合にはその引用文献までも指定する)、2(ターゲット文書の引用文献の更なる引用文献までも指定する)を、ユーザは選択することができる。
図18には、引用/被引用の関係を概念的に示している。
ターゲット文書が特許6655*3号である場合、この特許6655*3号は、「先行技術」として6つの特許文献を開示している。その先行技術を「(ターゲット文書との)被引用関係」と呼び、ターゲット文書からは「前1世代」とカウントする。
また、この特許6655*3号は、2つの特許文献において、「先行技術」として開示されている。この場合に特許6655*3号を先行技術として開示している特許文献を「(ターゲット文書との)引用関係」と呼び、ターゲット文書からは「後1世代」とカウントする。
図19は、ターゲット文書の特定とともに、図18に示した「前世代」の世代数および「後世代」の世代数を、を入力できるようにした文献指定データ入力手段を図示している。
被引用世代数指定欄、および引用世代数指定欄は、文献情報指定欄の中に備える。被引用世代数指定欄および引用世代数指定欄は、プルダウンメニューとなっている。
前述してきた実施形態では、特許文献と特許文献に対する引用文献若しくは被引用文献を対象として検索を実行する構成を説明したが、引用関係がある文献であれば特許文献に限定されることはない。
例えば、論文においても、対象論文に対する引用文献や被引用文献が指定されている。また、ある団体のデータベースでは、既に、対象文献情報とその引用文献情報及び/又は被引用文献情報とが関連付いてデータベース化されている。これらのデータベースを利用し、検索対象としたりターゲット文書としたりして、本願発明を適用することも可能である。
また、論文だけでなく、標準化文書の寄書についても、対象寄書に対する引用文献や被引用文献が指定されている。仮に、現時点でこれらの情報がデータベース化されていなくとも、データベース化し、本願発明を適用することもできる。
特許文献は日本特許文献だけでなく、海外特許文献を対象としてもよい。これは、日本審査官/日本特許庁が引用した海外特許文献を含めて検索する構成の他、海外審査官/海外特許庁が引用して形成された海外の引用関係(海外引用関係)を、日本審査官/日本特許庁が引用して形成された日本の引用関係(日本引用関係)に加えることもできる。
具体的には、ターゲット文書が日本特許文献とすれば日本引用関係の引用文献を特定し、これに加え、ターゲット文書の対応する海外出願の海外引用関係の引用文献若しくはターゲット文書を含むパテントファミリー内の海外出願の海外引用関係の引用文献を特定し、特定された日本引用関係の引用文献及び/又は海外引用関係の引用文献をユーザに選択可能に表示し、選択された引用文献で検索を実行することもできる。
特許文献が外国語の場合には、その外国語の概念検索を用いて検索する。そうすることで、外国語の特許文献を用いて他の外国語の特許文献を検索することができる。また、日本語の特許文献を用いて他の日本語の特許文献を検索し(日本語の類似度を計算する)、且つ、外国語の特許文献を用いて他の外国語の特許文献を検索し(外国語の類似度を計算する)、日本語の類似度と海外の類似度を相対評価できる仕組みにしておくこともできる。その仕組みによる検索結果として、日本語の類似度による検索結果と外国語の類似度による検索結果を混合してユーザに対して表示することもできる。
前述してきた実施形態では、ターゲット文書に対して引用文献がある場合を例示として説明したが、ターゲット文書によっては引用文献がない場合もある。その場合、審査官モードは使用できないとユーザに対してその旨伝える構成の他、引用文献を用いた検索ではなく、ターゲット文書のみを用いた検索を実行する構成でもよい。
この構成の場合には、ユーザに対して、引用文献がなかったためターゲット文書のみで検索した旨を伝える機能を追加してもよい。
前述してきた実施形態では、ターゲット文書に対する複数引用文献をユーザが選択可能に表示して選択された引用文献を用いる検索(ターゲット文書を含めず検索)を実行する構成を一例として説明した。
しかし、引用文献の数が所定数以下であればターゲット文書を含めて検索を実行する構成としてもよいし、引用文献の数が所定数以下の場合にのみユーザがターゲット文書を指定して検索できる構成としてもよい。
前述してきた実施形態では、ターゲット文書に対する複数引用文献をユーザが選択可能に表示して選択された引用文献を用いる検索を実行する構成を一例として説明した。
しかし、選択可能な引用文献は登録された特許のみとする構成としてもよい。
また、選択可能な引用文献のうち登録された特許と登録されていない特許を識別して表示して選択可能とする構成としてもよい。
また、選択可能な引用文献は拒絶査定で用いられた引用文献(つまり、拒絶理由通知のみで引用された引用文献は対象外)のみとする構成としてもよい。
また、選択可能な引用文献のうち拒絶理由通知でのみ用いられた引用文献と拒絶査定で用いられた引用文献を識別して表示して選択可能とする構成としてもよい。
また、選択可能な引用文献は審査官が引用した引用文献(つまり、出願人が指定した引用文献若しくは先行技術文献は対象外)のみとする構成としてもよい。
また、選択可能な引用文献のうち審査官が引用した引用文献と審査官が引用していない引用文献を識別して表示して選択可能とする構成としてもよい。
しかし、ターゲット文書に対する引用文献(ターゲット文書に対する1階層の引用文献(子引用文献))だけでなく、図17に示したように、引用文献の引用文献(ターゲット文書に対する2階層の引用文献(孫引用文献))も含めて検索を行う、若しくは、ユーザに選択可能にして表示する構成であってもよい。
このような機能を本願発明に適用し、ターゲット文書に対するサイテーションマップを表示し、このサイテーションマップを見ながらユーザが階層を指定して前記検索を実行する構成を提供することができる。
また、階層だけでなく、サイテーションマップ上の各ノードである特許文献を選択可能としユーザが選択した特許文献を用いて検索する構成であってもよい。引用文献について説明したが、サイテーションマップであるためターゲット文書の被引用文献も同様の構成とすることができる。
Claims (10)
- ユーザに係る端末からユーザが検索対象とするターゲット文書である情報文献を特定するための文献指定データを受信する文献指定受信手段と、
その文献指定受信手段が受信した文献指定データに対する引用文献および/または被引用文献を特定する引用/被引用文献特定手段と、
その引用/被引用文献特定手段が特定した引用文献および/または被引用文献と、検索対象である情報文献群のそれぞれの情報文献との類似度を演算する演算手段と、
その演算手段が演算した類似度の順に検索対象文書群を順位付けするソート手段と、
そのソート手段が順位付けした結果をユーザに係る端末へ送信するソート結果送信手段と、
を備えて概念検索を実行する文献検索装置。 - 前記のソート手段によって順位付けした結果がユーザに係る端末にて出力される際に、そのソート結果において前記のターゲット文書、ターゲット文書の引用文献およびターゲット文書の被引用文献の少なくとも一つを当該ユーザが識別できる付加情報を加える付加情報追加手段を更に備える
請求項1に記載の文献検索装置。 - 検索対象文書群それぞれの文書に予め付与されている文書分類を用いて検索対象文書群を限定して検索するための文書分類指定情報をユーザに係る端末から受信する文書分類指定受信手段を更に備え、
前記の演算手段は、その文書分類指定受信手段にて受信した文書分類指定情報により限定された情報文献群に対して類似度演算を実行する
請求項1または請求項2のいずれかに記載の文献検索装置。 - 前記の文献指定受信手段は、文献指定データによって指定される文書が複数である場合には、各文書それぞれの重み付けデータをも受信することとし、
前記の演算手段は、その重み付けデータに基づいて演算を実行する
請求項1から請求項3のいずれかに記載の文献検索装置。 - 前記の文献指定受信手段は、前記のターゲット文書における引用文献のうち、登録された特許文献、拒絶査定時に引用された引用文献、特許庁審査官に引用された引用文献のいずれかもしくは全てを、ユーザに係る端末から指定可能であるようにした
請求項1から請求項4のいずれかに記載の文献検索装置。 - 前記の文献指定受信手段は、前記のターゲット文書における引用文献および/または被引用文献がその文献に対する引用文献および/または被引用文献を含む場合、その引用文献および/または被引用文献をユーザに係る端末から指定可能であるようにした
請求項1から請求項5のいずれかに記載の文献検索装置。 - 前記ターゲット文書における引用文献を第一世代の引用文献とし、
前記ターゲット文書に対する、当該第一世代の引用文献における引用文献を第二世代の引用文献とし、
同様に、前記ターゲット文書に対する、第N−1世代の引用文献における引用文献を第N世代の引用文献とし、
前記の文献指定受信手段においては前記ターゲット文書に対する引用文献の世代数Nを指定可能として、当該ターゲット文書に対する引用文献の世代数Nを指定された場合、
第一世代から第N世代の引用文献を、前記引用/被引用文献特定手段が特定した引用文献として、前記の演算手段が検索対象である情報文献群のそれぞれの情報文献との類似度を演算することとした
請求項1から請求項6のいずれかに記載の文献検索装置。 - 前記ターゲット文書における被引用文献を第一世代の被引用文献とし、
前記ターゲット文書に対する、当該第一世代の被引用文献における被引用文献を第二世代の被引用文献とし、
同様に、前記ターゲット文書に対する、第M−1世代の被引用文献における被引用文献を第M世代の被引用文献とし、
前記の文献指定受信手段においては前記ターゲット文書に対する被引用文献の世代数Mを指定可能として、当該ターゲット文書に対する被引用文献の世代数Mを指定された場合、
第一世代から第M世代の被引用文献を、前記引用/被引用文献特定手段が特定した被引用文献として、前記の演算手段が検索対象である情報文献群のそれぞれの情報文献との類似度を演算することとした
請求項1から請求項6のいずれかに記載の文献検索装置。 - 文献検索を実行するコンピュータへインストールされるコンピュータプログラムであって、
ユーザに係る端末からユーザが検索対象とするターゲット文書である情報文献を特定するための文献指定データを受信する文献指定受信手順と、
その文献指定受信手順にて受信した文献指定データに対する引用文献および/または被引用文献を特定する引用/被引用文献特定手順と、
その引用/被引用文献特定手順にて特定された引用文献および/または被引用文献と、検索対象である情報文献群のそれぞれの情報文献との類似度を演算する演算手順と、
その演算手順にて演算した類似度の順に検索対象文書群を順位付けするソート手順と、
そのソート手順にて順位付けした結果をユーザに係る端末へ送信するソート結果送信手順と、
をコンピュータに実行させるためのコンピュータプログラム。 - 文献検索装置へアクセスして概念検索をするためのデータを入力および送信して特許検索の結果を受信して出力させるための端末にて実行されるコンピュータプログラムであって、
ユーザが検索対象とするターゲット文書である情報文献を特定するための文献指定データを入力する文献指定データ入力手順と、
その文献指定データ入力手順にて入力した文献指定データを送信するデータ送信手順と、
そのデータ送信手順にて送信した文献指定データに基づいて検索対象である情報文献群のそれぞれに対する類似度を演算した文献検索装置の類似度の順に検索対象文書群をソートされたソート結果を受信するソート結果受信手順と、
そのソート結果受信手順にて受信したソート結果を出力させる出力手順と、
をコンピュータに実行させ、
前記の文献指定データ入力手順においては、
前記のターゲット文書が引用文献および/または被引用文献を含んだ引用文献付き文書である場合に、前記の引用文献等の一部または全部を指定可能とする引用文献等指定手順を含むこととした
コンピュータプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016056686A JP2017173953A (ja) | 2016-03-22 | 2016-03-22 | 文献検索装置およびコンピュータプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016056686A JP2017173953A (ja) | 2016-03-22 | 2016-03-22 | 文献検索装置およびコンピュータプログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2017173953A true JP2017173953A (ja) | 2017-09-28 |
Family
ID=59973074
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016056686A Pending JP2017173953A (ja) | 2016-03-22 | 2016-03-22 | 文献検索装置およびコンピュータプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2017173953A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20210032245A (ko) * | 2019-09-16 | 2021-03-24 | 김권석 | 특허 검색 애플리케이션 장치 및 특허 검색 방법 |
| US11769339B2 (en) | 2021-03-26 | 2023-09-26 | Fujitsu Limited | Computer-readable recording medium storing training data generation program, training data generation method, and training data generation apparatus |
| US12169515B2 (en) | 2019-05-24 | 2024-12-17 | Semiconductor Energy Laboratory Co., Ltd. | Document search system and document search method |
-
2016
- 2016-03-22 JP JP2016056686A patent/JP2017173953A/ja active Pending
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12169515B2 (en) | 2019-05-24 | 2024-12-17 | Semiconductor Energy Laboratory Co., Ltd. | Document search system and document search method |
| KR20210032245A (ko) * | 2019-09-16 | 2021-03-24 | 김권석 | 특허 검색 애플리케이션 장치 및 특허 검색 방법 |
| KR102437118B1 (ko) * | 2019-09-16 | 2022-08-29 | 김권석 | 특허 검색 애플리케이션 장치 및 특허 검색 방법 |
| US11769339B2 (en) | 2021-03-26 | 2023-09-26 | Fujitsu Limited | Computer-readable recording medium storing training data generation program, training data generation method, and training data generation apparatus |
| JP7622508B2 (ja) | 2021-03-26 | 2025-01-28 | 富士通株式会社 | 訓練データ生成プログラム,訓練データ生成方法および訓練データ生成装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101981075B1 (ko) | 데이터 분석 시스템, 데이터 분석 방법, 데이터 분석 프로그램, 및 기록매체 | |
| US11036723B1 (en) | Graphical user interface for recurring searches | |
| US9588955B2 (en) | Systems, methods, and software for manuscript recommendations and submissions | |
| US20090164895A1 (en) | Extracting semantic relations from query logs | |
| CN102067124A (zh) | 文档搜索系统 | |
| US20140317096A1 (en) | Methods and computer-program products for searching patent-related documents using search term variants | |
| US20120078979A1 (en) | Method for advanced patent search and analysis | |
| US10713291B2 (en) | Electronic document generation using data from disparate sources | |
| JP3577972B2 (ja) | 類似度判定方法及び文書検索装置及び文書分類装置及び文書検索プログラムを格納した記憶媒体及び文書分類プログラムを格納した記憶媒体 | |
| JPH0991314A (ja) | 情報探索装置 | |
| KR20180072167A (ko) | 유사특허 추출 시스템 및 그 방법 | |
| JP5905651B1 (ja) | 実績評価装置、実績評価装置の制御方法、および実績評価装置の制御プログラム | |
| CN106462644A (zh) | 标识来自多个结果页面标识的优选结果页面 | |
| US20250201014A1 (en) | Patent matching analysis system | |
| KR101401225B1 (ko) | 문서 분석 시스템 | |
| US11868356B2 (en) | Systems and methods to facilitate enhanced document retrieval in electronic discovery | |
| JP2017173953A (ja) | 文献検索装置およびコンピュータプログラム | |
| CN120525039B (zh) | 一种知识库管理系统及增强方法 | |
| CN111914154A (zh) | 一种智能搜索导向系统及方法 | |
| KR102020117B1 (ko) | 검색 필드 설정을 위한 시각적 ui 제공 시스템 및 방법과 이를 저장한 기록매체 | |
| Bachchhav | Information Retrieval: search process, techniques and strategies | |
| Repiso et al. | If PLoS one were really 101 different specialized journals: A proposed approach to the evaluation of multidisciplinary megajournals | |
| US9886497B2 (en) | Indexing presentation slides | |
| KR20210100389A (ko) | 유사 특허 검색 방법 | |
| US20080228725A1 (en) | Problem/function-oriented searching method for a patent database system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160401 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181120 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191120 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191210 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200126 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200512 |