JP2017173953A - 文献検索装置およびコンピュータプログラム - Google Patents

文献検索装置およびコンピュータプログラム Download PDF

Info

Publication number
JP2017173953A
JP2017173953A JP2016056686A JP2016056686A JP2017173953A JP 2017173953 A JP2017173953 A JP 2017173953A JP 2016056686 A JP2016056686 A JP 2016056686A JP 2016056686 A JP2016056686 A JP 2016056686A JP 2017173953 A JP2017173953 A JP 2017173953A
Authority
JP
Japan
Prior art keywords
document
cited
search
target
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016056686A
Other languages
English (en)
Inventor
高野 誠司
Seiji Takano
誠司 高野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2016056686A priority Critical patent/JP2017173953A/ja
Publication of JP2017173953A publication Critical patent/JP2017173953A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 検索エンジン自体を改良することなく、対象特許を用いた検索により、よりユーザが望む文献が上位に含まれる(スコアが高くなる)ように検索結果を出力可能とする。
【解決手段】 ターゲット文書を特定するための文献指定データを受信する文献指定受信手段と、その文献指定受信手段が受信した文献指定データに対する引用文献および/または被引用文献を特定する引用/被引用文献特定手段と、その引用/被引用文献特定手段が特定した引用文献および/または被引用文献と、検索対象である情報文献群のそれぞれの情報文献との類似度を演算する演算手段と、その演算手段が演算した類似度の順に検索対象文書群を順位付けするソート手段とを備える。
【選択図】 図6

Description

この発明は、技術文献、特許文献についての検索システムに対して、概念検索を応用した特許検索の技術に係る。
(概念検索技術)
ベクトル演算を用いた検索技術(概念検索技術)は、予め辞書作成用の文種から形態素解析などによって単語を切り出し、各単語に基本となるベクトルを付与して、辞書機能をなすベクトル群(ステムベクトル)を生成する。そのステムベクトルをもとにして、検索対象文書全体のベクトルを決定し、検索対象文書群から検索対象文書ベクトル群を生成する。その結果、検索対象文書は、各々一文書あたり一つのベクトルを持つこととなる。
検索を実行する際には、検索のために入力した文章をステムベクトルに基づいて検索文章ベクトルを生成し、その検索文章ベクトルと前記検索対象文書ベクトル群との内積を演算し、内積値の高い検索対象文書から所定件数を出力させる(図1参照)。
この技術によれば、検索対象文書群から関連度の高い文書から順に所定件数を必ず出力させることが可能となり、キーワード検索による欠点を克服できる。
上記のベクトル演算を用いる「ベクトル型」の他、文章を形態素解析した後、キーワードに重みづけをして文章を検索する「キーワード重み付け型」もある。すなわち、概念検索技術は、キーワード重み付け型とベクトル型とに大別される。以下、「ベクトル型の概念検索」および「キーワード重み付け型の概念検索」を総称して「概念検索」とする。
特許文献1には、更新または追加が頻繁に行われる動的な検索対象文書群であって、且つ一文書当たりの単語数が多い検索対象文書に対して概念検索を実行できる技術が開示されている(図2参照)。
特許文献1では、概念検索を連続して実行する場合、二度目以後の概念検索を「類似検索」と定義している(段落番号0096)。しかし、本願においては、通常のキーワード検索の結果や番号照会の結果などの一覧(ソート結果)から文献指定手段によって文献を指定して実行する概念検索も「類似検索」とする。
特許4497337号公報
さて、前述した概念検索や類似検索をしても、概念検索を利用するユーザが所望する文献をソート結果の上位へ抽出できるとは限らない。たとえば、特許文献に適用する場合、特許庁の審査官が拒絶理由を構成する先行文献たる「引用文献」をソート結果の上位へ抽出して欲しいと所望するユーザがいる。そうしたユーザは、「引用文献」が上位となるように概念検索をする場合があるが、前述した概念検索装置に対する操作は多くの手順を踏む必要があり、手間が掛かっていた。
所望する文献が上位に抽出できない場合の対応としては、検索用文章の内容を再考して再入力する場合の他、検索エンジン自体を改良するという手段も考えられる。
しかし、検索エンジン自体のアルゴリズムの変更には多くの時間と費用を要し、短期的な検索結果の大幅な変更は期待できない。
本願発明は、検索エンジン自体を改良することなく、対象特許を用いた検索により、ユーザが望む文献がより上位に含まれる(スコアが高くなる)ように検索結果を出力可能な技術を提供することを目的とする。
本発明は、上記した目的を達成するため、以下のような解決手段を提供する。
(第一の発明)
第一の発明は、ユーザに係る端末からユーザが検索対象とするターゲット文書である情報文献を特定するための文献指定データを受信する文献指定受信手段と、
その文献指定受信手段が受信した文献指定データに対する引用文献および/または被引用文献を特定する引用/被引用文献特定手段と、
その引用/被引用文献特定手段が特定した引用文献および/または被引用文献と、検索対象である情報文献群のそれぞれの情報文献との類似度を演算する演算手段と、
その演算手段が演算した類似度の順に検索対象文書群を順位付けするソート手段と、
そのソート手段が順位付けした結果をユーザに係る端末へ送信するソート結果送信手段と、
を備えて概念検索を実行する文献検索装置に係る。(図6参照)。
(用語説明)
本発明に係る文献検索装置は、一般的には、クライアント・サーバシステムにおけるサーバに必要な機能を具備してなる。
「概念検索」には、「ベクトル型の概念検索」および「キーワード重み付け型の概念検索」の双方を含む。
「検索対象」となる文書群としては、特許情報文献の他、新聞記事、学術書などを用いる。演算手段が類似度を演算するために用いる「辞書作成用文書群」も同様である。 ここで「特許情報文献」とは、特許出願された公開公報、特許された特許公報、以前の特許法の下で出願公告された公告公報、実用新案登録出願に係る文献、特許出願を審査するために用いられる公開技報、技術論文などをいう。
「クライアント・サーバシステム」は、LANで接続されたもののほか、イントラネット上のクライアント・サーバシステム、クライアントコンピュータがサーバ運営者と契約してネットワーク(たとえばインターネット)にて接続された場合を含む。このクライアントコンピュータが「端末」であり、その端末の操作者が「ユーザ」となる。
「文献指定データ」とは、情報文献を一義的に決定するための情報であり、出願番号、公開番号、特許番号などを用いることができる。指定する文献は、単数でも複数(図15参照)でもよい。
「文献指定受信手段」とは、ユーザに係る端末から入力されたデータに基づいて、ターゲット文書を特定する手段である。端末のユーザは、文献を特定するための番号などを入力する場合のほか、サーバから出力された文献を選択するという入力をする場合などがある
「引用文献および/または被引用文献」における「引用文献」とは、ターゲット文書に対して特許庁審査官や審判官が審査や審判をする際に拒絶理由を構成するために用いた文献である「引用文献」のほか、ターゲット文書がPCT条約による国際出願である場合の国際調査報告にていわゆる「X判定」や「Y判定に」用いられた文献、特許庁審査官が審査の際に用いた「参考文献」、出願人が特許明細書において記載した「先行特許文献」を含むこととしてもよい。
「被引用文献」とは、ターゲット文献を引用している文献のことである。たとえば、ターゲット文献が特許文献であれば特許となっている。その特許文献をターゲット文献とした場合の被引用文献に類似する文献を抽出できたとする。そのことはすなわち、ターゲット文献である特許を侵害している可能性のある技術を発見することについて、一助となる。
(作用)
本発明に係る文献検索装置のユーザは、特許庁審査官等による引用文献等を含んだ引用文献付き文書を概念検索したいとする。
そのユーザは、ユーザに係る端末からユーザが検索対象とするターゲット文書である情報文献を特定するための文献指定データを送信する。本発明に係る文献検索装置の指定受信手段は、その文献指定データを受信する。
その文献指定受信手段が受信した文献指定データに対する引用文献および/または被引用文献を、引用/被引用文献特定手段が特定し、検索対象である情報文献群のそれぞれの情報文献との類似度を演算手段が演算する。 その演算手段が演算した類似度の順に、ソート手段が検索対象文書群を順位付けする。
そのソート手段が順位付けした結果については、ソート結果送信手段がユーザに係る端末へ送信する。
本発明に係る文献検索装置のユーザとしては、引用文献および/または被引用文献を指定するだけで、特許庁の審査官等が引用文献等として抽出した引用文献等の一部または全部が自動的に指定され、概念検索の結果を得ることができる。
また、その概念検索が実行された結果としてのソート結果は、前記の引用文献および/または被引用文献が上位に位置する結果を期待できる。
(第一の発明のバリエーション1)
第一の発明は、以下のようにしてもよい。
すなわち、前記のソート手段によって順位付けした結果がユーザに係る端末にて出力される際に、そのソート結果において前記のターゲット文書、ターゲット文書の引用文献およびターゲット文書の被引用文献の少なくとも一つを当該ユーザが識別できる付加情報を加える付加情報追加手段を更に備えることとしてもよい(図7,8,9参照)。
(用語説明)
「付加情報」とは、たとえば、ソート結果において他のデータと区別しやすいハイライト表示、他のデータとは異なる配色の選択、網掛け表示、所定のマーク、カーソルを当てた際に所定の音声が出力される、などである。
(作用)
ユーザに係る端末では、順位付けした結果が出力される。そのソート結果の中に含まれる前記の文献指定データには、当該ユーザが識別できる付加情報を付加情報追加手段が加えている。そのため、当該ユーザは、文献指定データがソート結果の何処に出力されているのかを発見しやすい。
(第一の発明のバリエーション2)
第一の発明は、以下のようにしてもよい。
すなわち、検索対象文書群それぞれの文書に予め付与されている文書分類を用いて検索対象文書群を限定して検索するための文書分類指定情報をユーザに係る端末から受信する文書分類指定受信手段を更に備え、
前記の演算手段は、その文書分類指定受信手段にて受信した文書分類指定情報により限定された情報文献群に対して類似度演算を実行することとしてもよい(図14参照)。
(用語説明)
「文書分類」とは、たとえば、特許文献における国際特許分類(IPC)、Fターム、CPC、USクラス、ECLAコードなどが含まれる。
(作用)
文献検索装置のユーザは、検索対象文書群に対して検索対象の文書分類を限定ための文書分類指定情報を端末から入力し、文献検索装置へ送信する。すると、文献検索装置の文書分類指定受信手段がその文書分類指定情報を受信する。 文献検索装置の演算手段は、その文書分類指定情報に基づいて演算を実行する。
文献検索装置のユーザとしては、所望する文書分類指定情報に絞った概念検索の結果を得ることができる。
(第一の発明のバリエーション3)
第一の発明は、以下のようにしてもよい。
すなわち、前記の文献指定受信手段は、文献指定データによって指定される文書が複数である場合には、各文書それぞれの重み付けデータをも受信することとし、
前記の演算手段は、その重み付けデータに基づいて演算を実行することとしてもよい(図14参照)。
(作用)
文献検索装置のユーザは、文献指定データによって指定する複数の文書に対してそれぞれ重み付けデータを端末から入力し、文献検索装置へ送信する。すると、文献検索装置の検索用文章受信手段がその重み付けデータを受信する。 文献検索装置の演算手段は、その重み付けデータに基づいて演算を実行する。
文献検索装置のユーザとしては、複数の文書にそれぞれ付した重み付けが反映された概念検索の結果を得ることができる。
(第一の発明のバリエーション4)
第一の発明は、以下のようにしてもよい。
すなわち、前記の文献指定受信手段は、前記のターゲット文書における引用文献のうち、登録された特許文献、拒絶査定時に引用された引用文献、特許庁審査官に引用された引用文献のいずれかもしくは全てを、ユーザに係る端末から指定可能であるようにしてもよい。
(作用)
ユーザは、ターゲット文書における引用文献のうち、登録された特許文献、拒絶査定時に引用された引用文献、特許庁審査官に引用された引用文献のいずれかもしくは全てを、ターゲット文献として自らに係る端末から指定し、送信することができる。
文献検索装置の文献指定受信手段は、その文献指定データを受信し、その文献指定データに基づいて概念検索を実行する。
登録された特許文献を指定する場合には、比較的有力と考えられる引用文献に絞って指定する、といった意図を伴って引用文献を指定することとなる。
拒絶査定時に引用された引用文献を指定する場合には、拒絶査定時の引用文献に絞る、といった意図を伴って引用文献を指定することとなる。
特許庁審査官に引用された引用文献を指定する場合には、ユーザの考えを排除するために特許庁審査官に引用された引用文献に絞る、といった意図を伴って引用文献を指定することとなる。
(第一の発明のバリエーション5)
第一の発明は、以下のようにしてもよい。
すなわち、前記の文献指定受信手段は、前記のターゲット文書における引用文献および/または被引用文献がその文献に対する引用文献および/または被引用文献を含む場合、その引用文献および/または被引用文献をユーザに係る端末から指定可能であるようにしてもよい。
(作用)
ユーザは、自らに係る端末から、ターゲット文書における引用文献および/または被引用文献がその文献に対する引用文献および/または被引用文献を含む場合、その引用文献および/または被引用文献を指定した文献指定データを送信することができる。
文献検索装置の文献指定受信手段は、その文献指定データを受信し、その文献指定データに基づいて概念検索を実行する。
ユーザとしては、引用文献および/または被引用文献がその文献に対する引用文献および/または被引用文献に類似関係のある検索が簡易に行える。
(第一の発明のバリエーション6)
第一の発明は、以下のようにしてもよい。
すなわち、前記ターゲット文書における引用文献を第一世代の引用文献とし、前記ターゲット文書に対する、当該第一世代の引用文献における引用文献を第二世代の引用文献とする。 同様に、前記ターゲット文書に対する、第N−1世代の引用文献における引用文献を第N世代の引用文献とする。
そして、前記の文献指定受信手段においては前記ターゲット文書に対する引用文献の世代数Nを指定可能として、当該ターゲット文書に対する引用文献の世代数Nを指定された場合、 第一世代から第N世代の引用文献を、前記引用/被引用文献特定手段が特定した引用文献として、前記の演算手段が検索対象である情報文献群のそれぞれの情報文献との類似度を演算することとしてもよい。
(作用)
ユーザは、世代数Nを指定すれば、ターゲット文書に対する引用文献の第一世代からN世代までの引用文献に類似関係のある検索が簡易に行える。
(第一の発明のバリエーション7)
第一の発明は、以下のようにしてもよい。
すなわち、 前記ターゲット文書における被引用文献を第一世代の被引用文献とし、前記ターゲット文書に対する、当該第一世代の被引用文献における被引用文献を第二世代の被引用文献とする。 同様に、前記ターゲット文書に対する、第M−1世代の被引用文献における被引用文献を第M世代の被引用文献とする。
そして、前記の文献指定受信手段においては前記ターゲット文書に対する被引用文献の世代数Mを指定可能として、当該ターゲット文書に対する被引用文献の世代数Mを指定された場合、 第一世代から第M世代の被引用文献を、前記引用/被引用文献特定手段が特定した被引用文献として、前記の演算手段が検索対象である情報文献群のそれぞれの情報文献との類似度を演算することとしてもよい。
(作用)
ユーザは、世代数Mを指定すれば、ターゲット文書に対する被引用文献の第一世代からM世代までの被引用文献に類似関係のある検索が簡易に行える。
(第二の発明)
第二の発明は、特許検索を実行するコンピュータへインストールされるコンピュータプログラムに係る。
そのコンピュータプログラムは ユーザに係る端末からユーザが検索対象とするターゲット文書である情報文献を特定するための文献指定データを受信する文献指定受信手順と、 その文献指定受信手順にて受信した文献指定データに対する引用文献および/または被引用文献を特定する引用/被引用文献特定手順と、 その引用/被引用文献特定手順にて特定された引用文献および/または被引用文献と、検索対象である情報文献群のそれぞれの情報文献との類似度を演算する演算手順と、 その演算手順にて演算した類似度の順に検索対象文書群を順位付けするソート手順と、 そのソート手順にて順位付けした結果をユーザに係る端末へ送信するソート結果送信手順と、をコンピュータに実行させることとしたコンピュータプログラムである。
(第二の発明のバリエーション1)
第二の発明は、以下のようにしてもよい。
すなわち、前記のソート手順によって順位付けされた結果がユーザに係る端末にて出力される際に、そのソート結果において前記のターゲット文書、ターゲット文書の引用文献及びターゲット文書の被引用文献の少なくとも一つを当該ユーザが識別できる付加情報を加える付加情報追加手順を、コンピュータに実行させることとしてもよい。
(第二の発明のバリエーション2)
第二の発明は、以下のようにしてもよい。
すなわち、検索対象文書群それぞれの文書に予め付与されている文書分類を用いて検索対象文書群を限定して検索するための文書分類指定情報をユーザに係る端末から受信する文書分類指定受信手順を、コンピュータに実行させることとしてもよい。そして、前記の演算手順においては、文書分類指定受信手順にて受信した文書分類指定情報により限定された情報文献群に対して類似度演算を実行する。
(第二の発明のバリエーション3)
第二の発明は、以下のようにしてもよい。
すなわち、 前記の文献指定受信手順においては、文献指定データによって指定される文書が複数である場合には、各文書それぞれの重み付けデータをも受信することとし、 前記の演算手順においては、その重み付けデータに基づいて演算を実行することとしてもよい。
(第二の発明のバリエーション4)
第二の発明は、以下のようにしてもよい。
すなわち、 前記の文献指定受信手順においては、前記のターゲット文書における引用文献のうち、登録された特許文献、拒絶査定時に引用された引用文献、特許庁審査官に引用された引用文献のいずれかもしくは全てを、ユーザに係る端末から指定可能であるようにしてもよい。
(第二の発明のバリエーション5)
第二の発明は、以下のようにしてもよい。
すなわち、前記の文献指定受信手順においては、前記のターゲット文書における引用文献および/または被引用文献がその文献に対する引用文献および/または被引用文献を含む場合、その引用文献および/または被引用文献をユーザに係る端末から指定可能であるようにしてもよい。
(第二の発明のバリエーション6)
第二の発明は、以下のようにしてもよい。
すなわち、 前記ターゲット文書における引用文献を第一世代の引用文献とし、 前記ターゲット文書に対する、当該第一世代の引用文献における引用文献を第二世代の引用文献とし、 同様に、前記ターゲット文書に対する、第N−1世代の引用文献における引用文献を第N世代の引用文献とする。そして、前記の文献指定受信手順においては前記ターゲット文書に対する引用文献の世代数Nを指定可能とする。
そして、当該ターゲット文書に対する引用文献の世代数Nを指定された場合には、前記の演算手順において、第一世代から第N世代の引用文献を、前記引用/被引用文献特定手段が特定した引用文献として、検索対象である情報文献群のそれぞれの情報文献との類似度を演算することとしてもよい。
(第二の発明のバリエーション7)
第二の発明は、以下のようにしてもよい。
すなわち、 前記ターゲット文書における被引用文献を第一世代の被引用文献とし、 前記ターゲット文書に対する、当該第一世代の被引用文献における被引用文献を第二世代の被引用文献とし、 同様に、前記ターゲット文書に対する、第M−1世代の被引用文献における被引用文献を第M世代の被引用文献とする。そして、前記の文献指定受信手順においては前記ターゲット文書に対する被引用文献の世代数Mを指定可能とする。
そして、当該ターゲット文書に対する被引用文献の世代数Mを指定された場合には、前記の演算手順において、第一世代から第M世代の被引用文献を、前記引用/被引用文献特定手段が特定した被引用文献として、検索対象である情報文献群のそれぞれの情報文献との類似度を演算することとしてもよい。
(第三の発明)
第三の発明は、 文献検索装置へアクセスして概念検索をするためのデータを入力および送信して概念検索の結果を受信して出力させるための端末にて実行されるコンピュータプログラムに係る。
そのコンピュータプログラムは、 ユーザが検索対象とするターゲット文書である情報文献を特定するための文献指定データを入力する文献指定データ入力手順と、 その文献指定データ入力手順にて入力した文献指定データを送信するデータ送信手順と、 そのデータ送信手順にて送信した文献指定データに基づいて検索対象である情報文献群のそれぞれに対する類似度を演算した文献検索装置の類似度の順に検索対象文書群をソートされたソート結果を受信するソート結果受信手順と、 そのソート結果受信手順にて受信したソート結果を出力させる出力手順と、を実行させる。
前記の文献指定データ入力手順においては、 前記のターゲット文書が特許庁審査官等による引用文献等を含んだ引用文献付き文書である場合に、前記の引用文献等の一部または全部を指定可能とする引用文献等指定手順を含むこととしたコンピュータプログラムである。
(第三の発明のバリエーション1)
第三の発明は、前記の出力手順において順位付けした結果がユーザに係る端末にて出力される際に、そのソート結果において前記のターゲット文書、ターゲット文書の引用文献及びターゲット文書の被引用文献の少なくとも一つを当該ユーザが識別できる付加情報を含んで出力されることとしてもよい。
(第三の発明のバリエーション2)
第三の発明は、前記の文献指定データには、検索対象文書群それぞれの文書に予め付与されている文書分類を用いて検索対象文書群を限定して検索するための文書分類指定情報をも含むこととし、 前記のデータ送信手順においては、その文書分類指定情報をも送信することとしてもよい。
(第三の発明のバリエーション3)
第三の発明は、以下のように形成してもよい。
すなわち、前記の文献指定データには、文献指定データによって指定される文書が複数である場合には、各文書それぞれの重み付けデータをも含むこととし、 前記のデータ送信手順においては、その重み付けデータをも送信することとしてもよい。
(第三の発明のバリエーション4)
第三の発明は、以下のように形成してもよい。
すなわち、前記の文献指定データには、前記のターゲット文書における引用文献のうち、登録された特許文献、拒絶査定時に引用された引用文献、特許庁審査官に引用された引用文献のいずれかもしくは全てを含むこととし、 前記のデータ送信手順においては、そのような文献指定データを送信することとしてもよい。
(第三の発明のバリエーション5)
第三の発明は、以下のように形成してもよい。
すなわち、前記の文献指定データには、前記のターゲット文書における引用文献および/または被引用文献がその文献に対する引用文献および/または被引用文献を含む場合、その引用文献および/または被引用文献をユーザに係る端末から指定する旨を含むこととし、 前記のデータ送信手順においては、そのような文献指定データを送信することとしてもよい。
(第三の発明のバリエーション6)
第三の発明は、以下のように形成してもよい。
すなわち、前記ターゲット文書における引用文献を第一世代の引用文献とし、 前記ターゲット文書に対する、当該第一世代の引用文献における引用文献を第二世代の引用文献とし、 同様に、前記ターゲット文書に対する、第N−1世代の引用文献における引用文献を第N世代の引用文献とし、 前記の文献指定受信手段においては前記ターゲット文書に対する引用文献の世代数Nを指定可能とする。
前記のデータ送信手順においては、そのような文献指定データを送信することとしてもよい。
(第三の発明のバリエーション7)
第三の発明は、以下のように形成してもよい。
すなわち、前記ターゲット文書における被引用文献を第一世代の被引用文献とし、 前記ターゲット文書に対する、当該第一世代の被引用文献における被引用文献を第二世代の被引用文献とし、 同様に、前記ターゲット文書に対する、第M−1世代の被引用文献における被引用文献を第M世代の被引用文献とする。
前記のデータ送信手順においては、そのような文献指定データを送信することとしてもよい。
第二および第三の発明に係るコンピュータプログラムは、記録媒体へ格納して提供することもできる。また、通信回線を介して提供することもできる。
ここで、「記録媒体」とは、それ自身では空間を占有し得ないコンピュータプログラムを担持することができる媒体であり、例えば、ハードディスク、CD−R、DVD−R、などである。
第一の発明によれば、検索エンジン自体を改良することなく、対象特許を用いた検索により、ユーザが望む文献が上位に含まれる(スコアが高くなる)ように検索結果を出力可能な文献検索装置を提供することができた。
第二の発明によれば、検索エンジン自体を改良することなく、対象特許を用いた検索により、ユーザが望む文献が上位に含まれる(スコアが高くなる)ように検索結果を出力可能なコンピュータプログラムを提供することができた。
第三の発明よれば、対象特許を用いた検索において、ユーザが望む文献が上位に含まれる(スコアが高くなる)ように検索結果が出力可能な検索用端末用のコンピュータプログラムを提供することができた。
クライアントPC(ユーザに係る端末)およびベクトル演算型の概念検索装置について、機能ごとに説明したブロック図である。 検索用文章を作成するためのターゲット文書と、検索のための文章との関係を概念的に示した図である。 クライアントPCのユーザが概念検索を実行する場合にどのような操作をするのか、クライアントPCにどのような出力がなされるのか、を概念的に示した図である。 本願発明を用いない場合に引用文献付き文書を概念検索したら引用文献との関係がどのようになるのか、を概念的に示した図である。 自由な検索文章による概念検索を実行した場合に、クライアントPCおよびベクトル演算型の概念検索を実行する文献検索装置がどのように機能するか、を説明したブロック図である。 類似検索または文献を指定して概念検索を実行した場合に、クライアントPCおよびベクトル演算型の概念検索を実行する文献検索装置がどのように機能するか、を説明したブロック図である。 引用文献付き文書の場合に、クライアントPCのユーザが検索用文章入力手段をどのように操作するのか、クライアントPCにどのような出力がなされるのか、を概念的に示した図である。 引用文献付き文書に対して、クライアントPCのユーザが審査官モードにおける「自動」を選択した場合に、クライアントPCにどのような出力がなされるのか、を概念的に示した図である。 引用文献付き文書に対して、クライアントPCのユーザが審査官モードにおける「手動」を選択した場合に、クライアントPCにどのような出力がなされるのか、を概念的に示した図である。 概念検索を実行した後に連続して概念検索をする(類似検索をする)場合に、機能ごとに説明したブロック図である。 ソート出力を用いて概念検索を実行する場合に、クライアントPCにどのような出力がなされるのか、を概念的に示した図である。 ターゲット文書が引用文献付き文書か否かを文献検索装置が判断し、概念検索を実行するまでを示したフローチャートである。 ユーザが審査官モードを選択した場合に、手動モードの選択、引用文献の数が所定以上などの条件によって、概念検索を実行するまでを示したフローチャートである。 クライアントPCに出力される文献指定データ入力手段のバリエーションを示した概念図である。 複数のターゲット文書をユーザが選択した場合に、どのような概念検索が実行されるかを概念的に示した図である。 引用文献の関係性を、「世代」として示す図である。 クライアントPCに出力される文献指定データ入力手段において、引用世代数を指定できるバリエーションを示した概念図である。 引用/被引用の関係性を、「世代」として概念的に示した図である。 クライアントPCに出力される文献指定データ入力手段において、引用世代数および/または被引用世代数を指定できるバリエーションを示した概念図である。
本願発明を、図面に基づいて説明する。使用する図面は、図3から図19である。図面において示す出力画面などについては概念的に示した例示であり、実際の出力画面を模したものではない。
また、概念検索の手法としては「ベクトル型」を例示しているが、「キーワード重み付け型」であっても、本発明は採用可能である。また、基本言語を日本語とした概念検索について説明しているが、別の言語による概念検索においても、本願発明は実現可能である。
(図3)
図3は、概念検索を連続して実行する「類似検索」を示した図である。
文献検索装置としてのサーバに接続されたクライアントPC(検索を実行するユーザに係る端末)の画面へ「検索のための文章」を入力する入力欄、および検索を実行するための「検索」というクリックボタンを、左上に示している。このクライアントPCの画面へ検索のための文章をユーザが入力して検索ボタンをクリックすることで、概念検索の結果が出力される。具体的には、特許文献である文書A,B,C,・・・というように、検索のために入力された文章との類似度が高い順にソートされ、リストが表示される。
概念検索の結果から、文書Bに対して概念的に類似する文書を検索したい、という場合には、この文書Bがターゲット文書となる。そのターゲット文書の要約書または特許請求の範囲を用いて「検索のための文章」を入力し、検索ボタンをクリックする。その検索結果として、文書Bから作成した検索のための文章と、概念的に類似度が高い順に特許文献である文書D,E,F,・・・がソートされて出力される。
図3で示したような「類似検索」は、概念検索またはキーワード検索など他の検索手法等を実行することによって得られた文書群の中から、ターゲットとして抽出した特許文書がある場合、そのターゲットとした抽出した特許文書に類似する特許文書を検索したい、という場合に用いる。
後に詳述するが、そのターゲット文書における一部(たとえば要約や特許請求の範囲)を「検索のための文章」として指定すれば、概念検索を実行することができるようにして、クライアントPCの操作者であるユーザの手間を軽減している。
(図4)
概念検索または類似検索の結果について、妥当なのかどうか、ということは、ユーザにとって判断が難しい。「正解」があるわけではないため、相対評価をすることができるのであれば、相対評価をして判断するというのは、合理的な判断手法のひとつであろう。しかし、この判断手法による相対評価は、複数種類の概念検索エンジンにて同じ検索条件を入力して、検索結果を出力させることとなるが、現実的に困難である。複数種類の概念検索エンジンを使える環境が現実的に少ないためである。
そのため、一種類の概念検索エンジンによる簡単な妥当性について検証することとなる。
簡単な妥当性を検証のやり方として、以下のような方法が代表的である。図4を参照させながら説明する。
まず、ターゲット文書を特許公報(特許123号)とする。その特許公報には、特許庁の審査官が審査の際に用いたり、拒絶理由の根拠となったりした文献が「引用文献」として記載されている。こうしたターゲット文書を「引用文献付き文書」とする。
この引用文献付き文書において、引用文献として示されている文書が、ターゲット文書の一部(この図では要約書の文章)を検索用文章(検索のための文書)として用いた概念検索の結果において、どこに表れているか(類似度が高いとして出力されるか否か)を検証するのである。
図4では、引用文献付き文書たる特許123号には、引用文献として「特開2011−23*4号」と「特開2012−34*6号」とが存在し、検索のための文書として要約書を入力して検索を実行した。そのソート結果として、文書A、文書B、特開2012−34*6号、文書C、・・・と出力されたとする。
引用文献の一つ目が上位に現れておらず、引用文献の二つ目も上位ではなかったという結果である。一部のユーザは、この検索結果に対して、この文献検索装置による「類似度」が妥当ではない、と判断することがある。
上記の妥当性の判断には、一定の合理性があるとも言える。ターゲット文書(たとえば、未だ特許されていない文献)に対して、特許庁の審査官がどのような特許文献を拒絶理由とする可能性があるか、を知りたい場合に概念検索を実行する場面があるからである。
本実施形態では、特許庁の審査官が引用文献を導いた結論を基準として概念検索を簡易な操作で実行することができる技術を提供する。
なお、引用文献については、文書A,B,Cとは容易に区別できるような表示にて出力している。そのため、ユーザは、引用文献がどの辺りにランキングされているか、直観的に把握できる。
(図5)
図5は、自由な検索文章によって概念検索を実行する場合を示している。
サーバから提供された検索用文章入力手段における「検索用文章作成手段」を用いて検索用文章を入力し、送信する。
サーバにおける検索用文章受信手段の検索用文章受信手段が検索用文章を受信し、検索用文章ベクトル作成手段が、予め用意されたステムベクトルを用いて検索用文章ベクトルを作成する。
作成された検索用文章ベクトルと予め別途作成された検索対象文ベクトル群とを、ベクトル演算手段が演算し、ソート手段がソートした結果をクライアントPCへ出力できるように送信する。
(図6)
図6は、図3に示した類似検索や図4に示した引用文献付き文書をターゲット文書として概念検索を実行する場合を示している。
クライアントPCでは、検索用文章入力手段として用意されている文献指定手段によって、ターゲット文書を特定するための情報(文献指定データ)およびターゲット文書のどの部分を検索用文章として用いるのかを指定する情報を、サーバへ送信する。
検索用文章受信手段における文献受信手段は、前記の情報を受信したら、検索用文章ベクトル作成手段がその指定文献の文書ベクトルと、検索用文書ベクトル群とを、ベクトル演算手段へ送る。
ベクトル演算手段の演算結果を、ソート手段がソートし、クライアントPCの出力手段へ出力させる。クライアントPCのユーザは、検索用文章を作成することなく、検索結果を得ることができる。
(図7)
図6を用いて説明した手順を、図7を用いて更に詳細に説明する。
ターゲット文書として、引用文献付き文書(特許123号)を選択したら、検索用文章入力手段は、クライアントPCの操作者であるユーザに対して「検索モード」を選択させる。「要約」または「請求の範囲」のボタンにポインタを合わせてクリックした場合には、ターゲット文書の要約書または特許請求の範囲を、検索用文章として入力したこととなる。
「検索モード」において用意されている「審査官モード」とは、ターゲット文書に引用文献が存在する場合、その引用文献の一部または全部を次のターゲット文書として選択する操作を容易にするためのモードである。
なお、ターゲット文書がユーザに係るクライアントPCにて選択された場合、サーバは、このターゲット文書に引用文献があるかどうかを判断し、引用文献がある場合にはその引用文献をクライアントPCの出力において特定する。このターゲット文書の引用文献を特定する動作を実行する手段が、「引用文献特定手段」(不図示)に相当する。また、ターゲット文書の被引用文献を特定する動作を実行する手段が、「被引用文献特定手段」(不図示)に相当する。
図7では、「審査官モード」における「手動」、「自動/要約」、「自動/請求」の三種類のうち、「手動」を選んだとして説明する。「自動」については、図8にて後述する。
文献指定手段は、審査官モードである旨が表示されるとともに、検索用文章とする引用文献の選択と、その選択をした文献における「要約」を検索用文章とするか、「特許請求の範囲」を検索用文章とするか、の選択とを、ユーザに求める。すなわち、チェックボックスを表示して、そのチェックボックスに対するクリック操作による「チェック」を要求している。
この図示例では、ユーザが引用文献1(特開2011−23*4号)を選択し、検索用文章は「要約」を選んで、検索実行ボタンをクリックしたとする。
この検索を文献検索装置が実行すると、サーバ側でデータ処理がなされ、ソート結果がクライアントPCに送信される(ソート結果をクライアントPCに送信する手段をソート結果送信手段(不図示)とする)。その結果、左下に図示するようなソート結果がクライアントPCへ表示される。このソート結果では、引用文献1が満点として表示される。ただし、引用文献2が上位にソートされるとは限らない。
図7のソート結果では、ターゲット文書の引用文献が含まれ、その引用文献は他のソート結果に含まれる文献と識別できるように引用文献の行は背景パターン(ドット模様)が付加されている。ソート結果にターゲット文書自身が含まれる場合にも、他のソート結果に含まれる文献と識別できるようにターゲット文書の行は別の背景パターン(不図示だが、例えば、斜線模様)が付加されていてもよい。これらの付加動作を実行する手段が、「付加情報追加手段」に相当する。
(図8)
図8では、審査官モードとして「自動/請求」をユーザが選択した場合を図示している。
図の右側において「文献指定手段」を図示しているが、ユーザによる操作は不要である。「自動/請求」を選択したことによって、この「文献指定手段」に示した選択が自動的になされたことを示している。
すなわち、審査官モードにて「自動」と「特許請求の範囲」が自動チェックされ、ターゲット文書としては引用文献の全て(この図示例では2件)が自動チェックされ、「要約」と「特許請求の範囲」のうちの『特許請求の範囲』が自動チェックされている。
この検索を文献検索装置が実行すると、左下に図示するようなソート結果がクライアントPCへ表示される。このソート結果では、引用文献1および引用文献2が上位に表示される。
図8においては、引用文献付き文書に対する類似検索として、クライアントPCのユーザは、審査官モードの「自動/請求」をクリックするのみで、引用文献付き文書における引用文献を上位に表示させる検索結果を得ることができる。
(図9)
図9に示す文献指定手段は、図7および図8と異なり、審査官モードの「手動」を選択すると、最初にターゲット文書となっていた引用文献付き文書をも、次のターゲット文書として選択可能としている。なお、この選択可能としている画面で、ターゲット文書と引用文献とを識別可能に顕示する構成としてもよい。
この文献指定手段では、最初のターゲット文書と引用文献2とを選択し、特許請求の範囲を選択して概念検索を実行した。この場合のソート結果としては、ターゲット文書と引用文献2とが上位に表示される。
(図10)
図10では、図5に示した手順(実線にて表示)と、図6に示した手順(二点破線にて表示)とを連続して実行する場合を示している。(2)に示すルートが「類似検索」と称される。
(図11)
図の左上では、類似検索の結果たるソート出力から、ターゲット文書を指定している。その指定したターゲット文書が右上に示すような引用文献付き文書であれば、まず、ソート出力において「引用文献付き文書」である旨が区別して表示される。更に、右下に示したように、「審査官モード」が選択できる。換言すれば、この文献検索装置は、ターゲット文書が引用文献付き文書である場合には、その引用文献が何であり、何件の引用文献が存在するかをクライアントPCにおいて確認できるように出力することとしている。
ユーザが審査官モードの「手動」を選択すると、下中央の文献指定手段のように、検索用文章とする引用文献を指定できる欄と、要約または特許請求の範囲を指定できる欄が表示される。
前述したように、1回目のソート出力において、特許された特許番号と、特許番号以外の公開番号などとがユーザにとって区別しやすいように出力している。これは、審査官モードをユーザが選択する意義の高い文書を、他の文書と区別しやすいようにするためである。
なお、特許された文献とそうではない文献とを区別するための表示のほか、引用文献付き文書であるかないかを区別するための表示をすることとしてもよい。
この図11に示す検索用文章とする引用文献を指定できる欄では、最初のターゲット文書が引用文献とともに選択できることとしている(図7とは異なる)。
なお、引用文献の数が所定以下の場合にのみ、ターゲット文書もが文献指定手段において指定可能となるようにしてもよい。
また、左上では、概念検索のソート出力からの選択としたが、別の検索結果や、特許番号などの文献を特定できる情報の入力から開始することとしてもよい。ただし、ターゲット文書が引用文献付き文書でない場合には、審査官モードを選択できない。図12のフローチャートに基づいて後述する。
また、これまでの説明では、審査官モードにおいて「手動」「自動/要約」「自動/請求」を選択可能な構成としたが、概念検索結果のリストが表示されている画面で「審査官モード」という一の入力ボタン(審査官モード指定手段)を備え、前記リストにある複数特許文献のうち一又は複数の特許文献を指定した上で、この審査官モード指定手段の入力ボタンを押下することで、検索を実行する構成であってもよい。
この場合において、各特許文献に複数の引用文献がある場合には、全ての引用文献を検索対象としてもよいし、各特許文献の複数引用文献のうち主引用文献(引用で一番先に引用されている引用文献、審査情報を分析して複数引用文献を適用して拒絶理由を行う場合の最も審査対象の発明に近い引用文献等主引用文献の定義はシステムによって設定可能としてもよい)のみを検索対象としてもよい。
また、ターゲット文書に対して複数の引用文献がある場合には、引用文献を選択する画面を出力したが、引用文献が一つのみの場合には、引用文献を選択させる画面を省略することもできる。
(図12)
図12では、クライアントPCにてターゲット文書が指定された場合に、文献検索装置がどのように概念検索を開始するのかをフローチャートにて示している。
ターゲット文書が引用文献付きであれば、審査官モードをユーザが選択できる。ターゲット文書に引用文献付きか否かを文献検索装置が判断してくれるので、ユーザはターゲット文書に引用文献があるかないかを判断する必要がない、というメリットがある。
なお、図12のフローチャートでは、審査官モードは「手動」のみを想定している。また、要約か特許請求の範囲か、を選択する部分については省略している。
ユーザが審査官モードを選択した場合、ターゲット文書を含めた概念検索とするか、引用文献のみを指定するかを、ユーザは選択できる。引用文献が複数あれば、その複数の中から一部または全部を選択できる。
ターゲット文書を含むとした場合には、引用文献とターゲット文書の両方を指定して検索用文章を作成して概念検索を開始することとなる。ターゲット文書を含まないとした場合には、引用文献のみで検索用文章を作成して概念検索を開始することとなる。
(図13)
図13では、ユーザが審査官モードを選択した後、手動モードか自動モードかを選択する場面からを説明している。
審査官モードにおける手動モードをユーザが選択しない場合(自動モードを選択した場合)には、引用文献の全てを文献検索装置が指定する(図8参照)。なお、吹き出しにて図示しているように、ターゲット文書を含めるか否かをユーザが選択できる場面を含めてもよい。
手動モードをユーザが選択した場合において、引用文献が所定数(たとえば5つ)以上である場合には引用文献およびターゲット文書のいずれを検索用文章の作成対象とするかをユーザが選択可能であるように、リスト表示する。そのリストからユーザが選択した文書を、検索用文章の作成対象として、概念検索を開始するのである。
引用文献が所定数未満である場合には、引用文献の全てを文献検索装置が指定し、概念検索を開始する。
(図14)
図14は、クライアントPCに表示される文献指定手段を更に高度化した場合を示している。
画面の上には、モード表示欄があり、ここでは、「審査官モード」の「手動」をユーザが選択している旨を表示している。
文献情報指定欄では、ターゲット文書および引用文献を選択できるのみならず、そこから複数の文書を選択した場合には、選択した文献の重み付けを指定できる「重み付け指定欄」を備えている。
図14における「重み付け指定欄」では、ターゲット文書を30%とし、引用文献2を70%と、ユーザが入力している様子を示している。この場合、ターゲット文書によって作成される検索用文章ベクトルが0.3、引用文献2によって作成される検索用文章ベクトルが0.7であるとして、ベクトル演算手段が演算することとなる。そのため、ターゲット文書よりも引用文献2に類似度が高い文献が上位にランキングされるソート出力を、ユーザは得ることができる。
なお、この重み付け指定欄をユーザが使用しない場合には、選択された文献の重みは均等に自動設定する。
文献部分指定欄では、これまでの実施形態および図面に示してきた「要約」と「特許請求の範囲」に加え、「全文(書誌的事項を除く)」を選択できることとしている。換言すれば、これまでの実施形態においても、「要約」と「特許請求の範囲」に加え、「全文(書誌的事項を除く)」を選択できることとしてもよい。
文献指定手段の右側には、IPC指定欄を備えている。このIPC指定欄とは、検索対象文書群を、IPC(国際特許分類)にて絞ってしまうことを選択できる欄である。「絞らない」をユーザが選択すれば、検索対象文書群の全てを対象として概念的に類似する文書が検索対象文書群からソート出力される。
「引用文献のIPCと同じとする」をユーザが選択すれば、検索対象文書群が引用文献に付されたIPCに絞られてソート出力される。
「IPCを個別指定」を選択した場合には、AからHまでの国際特許分類をユーザがひとつまたは複数選択できる。
なお、この実施形態では、IPC指定欄について説明したが、Fターム、CPC、USクラス、ECLAコードなどにて、検索対象文書群を絞って検索を実行できるようにしてもよい。
(図15)
図15に示す実施形態は、ターゲット文書が複数であっても、本願に係る文献検索装置は可能である旨を示すものである。
図の左上に示すように、類似検索の結果たるソート出力から、ターゲット文書として「特許6543*1号」と「特許321号」の二文献を指定した。いずれの文献も引用文献付きであったとしているが、少なくとも一つが引用文献付きであれば「審査官モード」を選択できる。
この図では、右下に図示するように「自動/請求」を選択したとする。すると、文献指定手段ではユーザが操作することなく、ターゲット文書およびそのターゲット文書に含まれる引用文献の全てが自動的に指定される。図示を省略するが、ユーザに対する確認ボタンが提供されることとしてもよい。
自動指定された条件にて、2回目の概念検索が実行され、その結果はユーザに係るクライアントPCの画面へ出力されることとなる。
(図16)
図16では、引用文献の関係性を、「世代」として示している。
ターゲット文書に引用文献1(特許5544*2号)と、引用文献2(特許5432*号)とが存在していたとする。また、引用文献1には引用文献(特許432*0号)が存在し、引用文献2には引用文献(特許4433*2号)が存在していたとする。
この場合、ターゲット文書からみて、引用文献1,2を世代数「1」とし、特許432*0や特許4433*2を世代数「2」と定義する。
(図17)
図17では、ターゲット文書の特定とともに、前述した世代数を入力できるようにした文献指定データ入力手段を図示している。
引用世代数指定欄は、文献情報指定欄の中に備える。その引用世代数指定欄は、プルダウンメニューとなっており、0(ターゲット文書のみでよい)、1(ターゲット文書に引用文献が存在する場合にはその引用文献までも指定する)、2(ターゲット文書の引用文献の更なる引用文献までも指定する)を、ユーザは選択することができる。
(図18)
図18には、引用/被引用の関係を概念的に示している。
ターゲット文書が特許6655*3号である場合、この特許6655*3号は、「先行技術」として6つの特許文献を開示している。その先行技術を「(ターゲット文書との)被引用関係」と呼び、ターゲット文書からは「前1世代」とカウントする。
また、この特許6655*3号は、2つの特許文献において、「先行技術」として開示されている。この場合に特許6655*3号を先行技術として開示している特許文献を「(ターゲット文書との)引用関係」と呼び、ターゲット文書からは「後1世代」とカウントする。
(図19)
図19は、ターゲット文書の特定とともに、図18に示した「前世代」の世代数および「後世代」の世代数を、を入力できるようにした文献指定データ入力手段を図示している。
被引用世代数指定欄、および引用世代数指定欄は、文献情報指定欄の中に備える。被引用世代数指定欄および引用世代数指定欄は、プルダウンメニューとなっている。
図19に示した文献指定データ入力手段によって文献指定データが送信されたサーバ(文献検索装置)では、ターゲット文献が「先行技術」として開示されている特許文献をサーチしたり、ターゲット文献において「先行技術」として開示されている特許文献をサーチしたりする、という作業を、サーバが実行する段階が増えることとなる。
(論文、標準化文書など)
前述してきた実施形態では、特許文献と特許文献に対する引用文献若しくは被引用文献を対象として検索を実行する構成を説明したが、引用関係がある文献であれば特許文献に限定されることはない。
例えば、論文においても、対象論文に対する引用文献や被引用文献が指定されている。また、ある団体のデータベースでは、既に、対象文献情報とその引用文献情報及び/又は被引用文献情報とが関連付いてデータベース化されている。これらのデータベースを利用し、検索対象としたりターゲット文書としたりして、本願発明を適用することも可能である。
また、論文だけでなく、標準化文書の寄書についても、対象寄書に対する引用文献や被引用文献が指定されている。仮に、現時点でこれらの情報がデータベース化されていなくとも、データベース化し、本願発明を適用することもできる。
(海外特許文献など)
特許文献は日本特許文献だけでなく、海外特許文献を対象としてもよい。これは、日本審査官/日本特許庁が引用した海外特許文献を含めて検索する構成の他、海外審査官/海外特許庁が引用して形成された海外の引用関係(海外引用関係)を、日本審査官/日本特許庁が引用して形成された日本の引用関係(日本引用関係)に加えることもできる。
具体的には、ターゲット文書が日本特許文献とすれば日本引用関係の引用文献を特定し、これに加え、ターゲット文書の対応する海外出願の海外引用関係の引用文献若しくはターゲット文書を含むパテントファミリー内の海外出願の海外引用関係の引用文献を特定し、特定された日本引用関係の引用文献及び/又は海外引用関係の引用文献をユーザに選択可能に表示し、選択された引用文献で検索を実行することもできる。
(外国語の概念検索)
特許文献が外国語の場合には、その外国語の概念検索を用いて検索する。そうすることで、外国語の特許文献を用いて他の外国語の特許文献を検索することができる。また、日本語の特許文献を用いて他の日本語の特許文献を検索し(日本語の類似度を計算する)、且つ、外国語の特許文献を用いて他の外国語の特許文献を検索し(外国語の類似度を計算する)、日本語の類似度と海外の類似度を相対評価できる仕組みにしておくこともできる。その仕組みによる検索結果として、日本語の類似度による検索結果と外国語の類似度による検索結果を混合してユーザに対して表示することもできる。
(引用文献が存在しない場合の処理)
前述してきた実施形態では、ターゲット文書に対して引用文献がある場合を例示として説明したが、ターゲット文書によっては引用文献がない場合もある。その場合、審査官モードは使用できないとユーザに対してその旨伝える構成の他、引用文献を用いた検索ではなく、ターゲット文書のみを用いた検索を実行する構成でもよい。
この構成の場合には、ユーザに対して、引用文献がなかったためターゲット文書のみで検索した旨を伝える機能を追加してもよい。
(引用文献の数に対する対応)
前述してきた実施形態では、ターゲット文書に対する複数引用文献をユーザが選択可能に表示して選択された引用文献を用いる検索(ターゲット文書を含めず検索)を実行する構成を一例として説明した。
しかし、引用文献の数が所定数以下であればターゲット文書を含めて検索を実行する構成としてもよいし、引用文献の数が所定数以下の場合にのみユーザがターゲット文書を指定して検索できる構成としてもよい。
(特許/未特許の区別などによる対応など)
前述してきた実施形態では、ターゲット文書に対する複数引用文献をユーザが選択可能に表示して選択された引用文献を用いる検索を実行する構成を一例として説明した。
しかし、選択可能な引用文献は登録された特許のみとする構成としてもよい。
また、選択可能な引用文献のうち登録された特許と登録されていない特許を識別して表示して選択可能とする構成としてもよい。
また、選択可能な引用文献は拒絶査定で用いられた引用文献(つまり、拒絶理由通知のみで引用された引用文献は対象外)のみとする構成としてもよい。
また、選択可能な引用文献のうち拒絶理由通知でのみ用いられた引用文献と拒絶査定で用いられた引用文献を識別して表示して選択可能とする構成としてもよい。
また、選択可能な引用文献は審査官が引用した引用文献(つまり、出願人が指定した引用文献若しくは先行技術文献は対象外)のみとする構成としてもよい。
また、選択可能な引用文献のうち審査官が引用した引用文献と審査官が引用していない引用文献を識別して表示して選択可能とする構成としてもよい。
図11などで示した実施形態では、ターゲット文書に対する複数引用文献をユーザが選択可能に表示して選択された引用文献を用いる検索を実行する構成を一例として説明した。
しかし、ターゲット文書に対する引用文献(ターゲット文書に対する1階層の引用文献(子引用文献))だけでなく、図17に示したように、引用文献の引用文献(ターゲット文書に対する2階層の引用文献(孫引用文献))も含めて検索を行う、若しくは、ユーザに選択可能にして表示する構成であってもよい。
図17におけるプルダウンメニューで図示しているように、ユーザが選択可能であるのは、2階層に限らず、3階層以上の引用文献を用いた検索若しくは表示であってもよい。
さて、ある特許文献に対する引用関係を示すサイテーションマップを表示可能な機能を提供するシステムが既に存在する。
このような機能を本願発明に適用し、ターゲット文書に対するサイテーションマップを表示し、このサイテーションマップを見ながらユーザが階層を指定して前記検索を実行する構成を提供することができる。
また、階層だけでなく、サイテーションマップ上の各ノードである特許文献を選択可能としユーザが選択した特許文献を用いて検索する構成であってもよい。引用文献について説明したが、サイテーションマップであるためターゲット文書の被引用文献も同様の構成とすることができる。
本発明は、特許検索についての検索をユーザが自由に実行できるサービスを提供する情報サービス業、特許情報の分析サービス業などにおいて、利用可能性を有する。

Claims (10)

  1. ユーザに係る端末からユーザが検索対象とするターゲット文書である情報文献を特定するための文献指定データを受信する文献指定受信手段と、
    その文献指定受信手段が受信した文献指定データに対する引用文献および/または被引用文献を特定する引用/被引用文献特定手段と、
    その引用/被引用文献特定手段が特定した引用文献および/または被引用文献と、検索対象である情報文献群のそれぞれの情報文献との類似度を演算する演算手段と、
    その演算手段が演算した類似度の順に検索対象文書群を順位付けするソート手段と、
    そのソート手段が順位付けした結果をユーザに係る端末へ送信するソート結果送信手段と、
    を備えて概念検索を実行する文献検索装置。
  2. 前記のソート手段によって順位付けした結果がユーザに係る端末にて出力される際に、そのソート結果において前記のターゲット文書、ターゲット文書の引用文献およびターゲット文書の被引用文献の少なくとも一つを当該ユーザが識別できる付加情報を加える付加情報追加手段を更に備える
    請求項1に記載の文献検索装置。
  3. 検索対象文書群それぞれの文書に予め付与されている文書分類を用いて検索対象文書群を限定して検索するための文書分類指定情報をユーザに係る端末から受信する文書分類指定受信手段を更に備え、
    前記の演算手段は、その文書分類指定受信手段にて受信した文書分類指定情報により限定された情報文献群に対して類似度演算を実行する
    請求項1または請求項2のいずれかに記載の文献検索装置。
  4. 前記の文献指定受信手段は、文献指定データによって指定される文書が複数である場合には、各文書それぞれの重み付けデータをも受信することとし、
    前記の演算手段は、その重み付けデータに基づいて演算を実行する
    請求項1から請求項3のいずれかに記載の文献検索装置。
  5. 前記の文献指定受信手段は、前記のターゲット文書における引用文献のうち、登録された特許文献、拒絶査定時に引用された引用文献、特許庁審査官に引用された引用文献のいずれかもしくは全てを、ユーザに係る端末から指定可能であるようにした
    請求項1から請求項4のいずれかに記載の文献検索装置。
  6. 前記の文献指定受信手段は、前記のターゲット文書における引用文献および/または被引用文献がその文献に対する引用文献および/または被引用文献を含む場合、その引用文献および/または被引用文献をユーザに係る端末から指定可能であるようにした
    請求項1から請求項5のいずれかに記載の文献検索装置。
  7. 前記ターゲット文書における引用文献を第一世代の引用文献とし、
    前記ターゲット文書に対する、当該第一世代の引用文献における引用文献を第二世代の引用文献とし、
    同様に、前記ターゲット文書に対する、第N−1世代の引用文献における引用文献を第N世代の引用文献とし、
    前記の文献指定受信手段においては前記ターゲット文書に対する引用文献の世代数Nを指定可能として、当該ターゲット文書に対する引用文献の世代数Nを指定された場合、
    第一世代から第N世代の引用文献を、前記引用/被引用文献特定手段が特定した引用文献として、前記の演算手段が検索対象である情報文献群のそれぞれの情報文献との類似度を演算することとした
    請求項1から請求項6のいずれかに記載の文献検索装置。
  8. 前記ターゲット文書における被引用文献を第一世代の被引用文献とし、
    前記ターゲット文書に対する、当該第一世代の被引用文献における被引用文献を第二世代の被引用文献とし、
    同様に、前記ターゲット文書に対する、第M−1世代の被引用文献における被引用文献を第M世代の被引用文献とし、
    前記の文献指定受信手段においては前記ターゲット文書に対する被引用文献の世代数Mを指定可能として、当該ターゲット文書に対する被引用文献の世代数Mを指定された場合、
    第一世代から第M世代の被引用文献を、前記引用/被引用文献特定手段が特定した被引用文献として、前記の演算手段が検索対象である情報文献群のそれぞれの情報文献との類似度を演算することとした
    請求項1から請求項6のいずれかに記載の文献検索装置。
  9. 文献検索を実行するコンピュータへインストールされるコンピュータプログラムであって、
    ユーザに係る端末からユーザが検索対象とするターゲット文書である情報文献を特定するための文献指定データを受信する文献指定受信手順と、
    その文献指定受信手順にて受信した文献指定データに対する引用文献および/または被引用文献を特定する引用/被引用文献特定手順と、
    その引用/被引用文献特定手順にて特定された引用文献および/または被引用文献と、検索対象である情報文献群のそれぞれの情報文献との類似度を演算する演算手順と、
    その演算手順にて演算した類似度の順に検索対象文書群を順位付けするソート手順と、
    そのソート手順にて順位付けした結果をユーザに係る端末へ送信するソート結果送信手順と、
    をコンピュータに実行させるためのコンピュータプログラム。
  10. 文献検索装置へアクセスして概念検索をするためのデータを入力および送信して特許検索の結果を受信して出力させるための端末にて実行されるコンピュータプログラムであって、
    ユーザが検索対象とするターゲット文書である情報文献を特定するための文献指定データを入力する文献指定データ入力手順と、
    その文献指定データ入力手順にて入力した文献指定データを送信するデータ送信手順と、
    そのデータ送信手順にて送信した文献指定データに基づいて検索対象である情報文献群のそれぞれに対する類似度を演算した文献検索装置の類似度の順に検索対象文書群をソートされたソート結果を受信するソート結果受信手順と、
    そのソート結果受信手順にて受信したソート結果を出力させる出力手順と、
    をコンピュータに実行させ、
    前記の文献指定データ入力手順においては、
    前記のターゲット文書が引用文献および/または被引用文献を含んだ引用文献付き文書である場合に、前記の引用文献等の一部または全部を指定可能とする引用文献等指定手順を含むこととした
    コンピュータプログラム。
JP2016056686A 2016-03-22 2016-03-22 文献検索装置およびコンピュータプログラム Pending JP2017173953A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016056686A JP2017173953A (ja) 2016-03-22 2016-03-22 文献検索装置およびコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016056686A JP2017173953A (ja) 2016-03-22 2016-03-22 文献検索装置およびコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2017173953A true JP2017173953A (ja) 2017-09-28

Family

ID=59973074

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016056686A Pending JP2017173953A (ja) 2016-03-22 2016-03-22 文献検索装置およびコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2017173953A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210032245A (ko) * 2019-09-16 2021-03-24 김권석 특허 검색 애플리케이션 장치 및 특허 검색 방법
US11769339B2 (en) 2021-03-26 2023-09-26 Fujitsu Limited Computer-readable recording medium storing training data generation program, training data generation method, and training data generation apparatus
US12169515B2 (en) 2019-05-24 2024-12-17 Semiconductor Energy Laboratory Co., Ltd. Document search system and document search method

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12169515B2 (en) 2019-05-24 2024-12-17 Semiconductor Energy Laboratory Co., Ltd. Document search system and document search method
KR20210032245A (ko) * 2019-09-16 2021-03-24 김권석 특허 검색 애플리케이션 장치 및 특허 검색 방법
KR102437118B1 (ko) * 2019-09-16 2022-08-29 김권석 특허 검색 애플리케이션 장치 및 특허 검색 방법
US11769339B2 (en) 2021-03-26 2023-09-26 Fujitsu Limited Computer-readable recording medium storing training data generation program, training data generation method, and training data generation apparatus
JP7622508B2 (ja) 2021-03-26 2025-01-28 富士通株式会社 訓練データ生成プログラム,訓練データ生成方法および訓練データ生成装置

Similar Documents

Publication Publication Date Title
KR101981075B1 (ko) 데이터 분석 시스템, 데이터 분석 방법, 데이터 분석 프로그램, 및 기록매체
US11036723B1 (en) Graphical user interface for recurring searches
US9588955B2 (en) Systems, methods, and software for manuscript recommendations and submissions
US20090164895A1 (en) Extracting semantic relations from query logs
CN102067124A (zh) 文档搜索系统
US20140317096A1 (en) Methods and computer-program products for searching patent-related documents using search term variants
US20120078979A1 (en) Method for advanced patent search and analysis
US10713291B2 (en) Electronic document generation using data from disparate sources
JP3577972B2 (ja) 類似度判定方法及び文書検索装置及び文書分類装置及び文書検索プログラムを格納した記憶媒体及び文書分類プログラムを格納した記憶媒体
JPH0991314A (ja) 情報探索装置
KR20180072167A (ko) 유사특허 추출 시스템 및 그 방법
JP5905651B1 (ja) 実績評価装置、実績評価装置の制御方法、および実績評価装置の制御プログラム
CN106462644A (zh) 标识来自多个结果页面标识的优选结果页面
US20250201014A1 (en) Patent matching analysis system
KR101401225B1 (ko) 문서 분석 시스템
US11868356B2 (en) Systems and methods to facilitate enhanced document retrieval in electronic discovery
JP2017173953A (ja) 文献検索装置およびコンピュータプログラム
CN120525039B (zh) 一种知识库管理系统及增强方法
CN111914154A (zh) 一种智能搜索导向系统及方法
KR102020117B1 (ko) 검색 필드 설정을 위한 시각적 ui 제공 시스템 및 방법과 이를 저장한 기록매체
Bachchhav Information Retrieval: search process, techniques and strategies
Repiso et al. If PLoS one were really 101 different specialized journals: A proposed approach to the evaluation of multidisciplinary megajournals
US9886497B2 (en) Indexing presentation slides
KR20210100389A (ko) 유사 특허 검색 방법
US20080228725A1 (en) Problem/function-oriented searching method for a patent database system

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160401

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200512