JP2014203065A - 検索データ保護装置、情報検索システム、検索データ保護方法、及びそのプログラム - Google Patents

検索データ保護装置、情報検索システム、検索データ保護方法、及びそのプログラム Download PDF

Info

Publication number
JP2014203065A
JP2014203065A JP2013082017A JP2013082017A JP2014203065A JP 2014203065 A JP2014203065 A JP 2014203065A JP 2013082017 A JP2013082017 A JP 2013082017A JP 2013082017 A JP2013082017 A JP 2013082017A JP 2014203065 A JP2014203065 A JP 2014203065A
Authority
JP
Japan
Prior art keywords
data
index
search
protection device
position information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013082017A
Other languages
English (en)
Inventor
貢 三浦
Mitsugi Miura
貢 三浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2013082017A priority Critical patent/JP2014203065A/ja
Publication of JP2014203065A publication Critical patent/JP2014203065A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】情報検索の対象となる文書データを有効に保護することができる検索データ保護装置、情報検索システム、検索データ保護方法、及びそのプログラムを提供すること。【解決手段】外部入力された検索文字列に基づく情報検索処理を実行する情報検索システム110は、文書データ収集処理装置10が収集した文書データに基づいてインデックスデータを作成するインデックス作成部20と、このインデックスデータが内包する位置情報を予め設定された方式を用いて暗号化するインデックス暗号化部30と、この暗号化されたデータを記憶処理して管理するインデックス記憶管理部40と、を有する検索データ保護装置100を装備する。インデックス暗号化部30は、類似する位置情報でも全く異なる文字列に変換する方式により暗号化を実行する。【選択図】図1

Description

本発明は、データ保護及び情報検索の技術に係り、特に、秘匿データの検索方式に暗号化技術を取り入れた検索データ保護装置、情報検索システム、検索データ保護方法、及びそのプログラムに関する。
従来から、情報検索に際しては、複数の文書データから特定の文字列を検索する全文検索装置が利用されている。また、秘匿にすべき文書データを暗号化して管理するという技術も知られている。さらに、上記全文検索機能と暗号化技術とを組み合わせた構成により、暗号化された文書データの検索処理を行う装置も存在する。
一般に、全文検索装置では、文書データからインデックスデータ(インデックス)を作成することにより、検索の高速化を実現している。このインデックスは、その作成の仕組みを示す図2のように、通常、キー領域(キーワード領域)に配置されるキー部と、ポインタ領域に配置されるポインタ部と、から成る転置行列によって管理される。このポインタ部は、各キーワードに対応するポインタ列を有し、各ポインタ列には、各キーワードにかかる位置を示す(1,1)や(2,1)等のポインタ情報が格納される。
図2では、検索対象である文書1及び文書2に対して形態素解析技術を用いることで、文脈の解析及び単語の分解を行うと共に、文章ごとに定めた文字オフセット値(オフセット値)を文字単位で順々に付し、文字番号とオフセット値とを関連づけたポインタ情報をポインタ列にて整理することによりインデックスを作成する様子を示す。
このインデックスからは、図3に示すように完全なものではないが、元データを復元することが可能である。具体的には、ポインタ領域を探索し、文書番号単位でオフセット値に対応するポインタ情報(オフセットデータ)を図3のように元の順序に並べ、これに対応するキーワードを付与することによって復元される。
従来の全文検索装置では、たとえ文章データが暗号化されていたとしても、検索用インデックスを解析することで秘匿データが開示されてしまうという問題が生じていたため、その対策として、キーワードを暗号化するという手法が用いられるようになった。
他の情報検索に関連する技術としては、例えば、下記の技術内容(特許文献1又は2)が知られている。
特許文献1には、文書データベースから読み込んだ文書の文字列を単語毎に分割し、これら各単語の位置情報を集約すると共に転置リストにマッピングするという技術内容が開示されている。
また、特許文献2には、暗号化してサーバに登録されたインデックスデータを、外部から検索クエリが入力された際に検索し、この検索で得た結果リストを復号化して表示するという技術内容が開示されている。
特開2010−262379号公報 特開2003−150600号公報
しかしながら、図7に示すように、キーワードを暗号化するという上記手法を採用しても、通常は、元の文書を1文字又は数文字単位で別の文字等に変換する換字式の暗号化技術を利用するため、秘匿データ等の保護が脆弱になるという不都合がある。
すなわち、検索時には、検索のために入力されたキーワード(検索キー)とインデックス中のキーワード(参照キー:検索時に参照されるキーワード)とを一致させる必要があり、このため、暗号化に際しては、同じ検索キーに対して同じ参照キーを生成する必要があることから(図7の例示では、参照キーである猫が全てDFEに暗号化されている)、多量の検索キーを投入すると共に、これに対応する内部の参照キーを突き止めるという手法によれば、容易に文書の解読が実現できてしまうという不都合がある。
また、特許文献1には、情報漏洩を防止するための技術内容については何ら開示されておらず、特許文献2に開示された情報検索装置では、暗号化処理がクライアント側で実行され且つその具体的特徴については何ら開示されていないため、情報セキュリティの脆弱性の問題がある。
(発明の目的)
本発明は、上記関連技術の有する不都合を改善するものであり、特に、情報検索の対象となる文書データを有効に保護する検索データ保護装置、情報検索システム、検索データ保護方法、及びそのプログラムの提供を目的とする。
上記目的を達成するために、本発明にかかる検索データ保護装置では、外部より収集された情報検索の対象となる文章データに基づいて当該文章データが内包するキーワードごとの位置情報を含むインデックスデータを作成するインデックス作成部を有すると共に、このインデックスデータを暗号化して管理する検索データ保護装置であって、前記位置情報を予め設定された方式を用いて暗号化するインデックス暗号化部と、この前記位置情報が暗号化されたインデックスデータを、予め設けられたインデックス記憶手段に記憶処理して管理するインデックス記憶管理部と、を有するという構成を採っている。
また、本発明にかかる情報検索システムでは、情報検索の対象となる文書データを外部から収集すると共にこれを暗号化して予め設けられた文書データベースに格納する文書データ収集処理装置と、前記文書データ収集処理装置が収集した文書データに基づいて作成したインデックスデータを暗号化して管理する検索データ保護装置と、を有すると共に、外部から入力された検索文字列に基づく情報検索処理を実行する情報検索システムであって、前記インデックス記憶管理部は、前記検索文字列を前記記憶処理したインデックスデータに照らすことで検索処理を実行するインデックス検索手段をさらに有するように構成されている。
さらに、本発明にかかる検索データ保護方法では、情報検索の対象となる文章データを暗号化して管理する検索データ保護装置にあって、外部より収集された前記文章データに基づいて当該文章データが内包するキーワードごとの位置情報を含むインデックスデータを作成し、前記位置情報を予め設定された方式を用いて暗号化し、この前記位置情報が暗号化されたインデックスデータを記憶処理して管理することを特徴とする。
また、本発明にかかる検索データ保護プログラムでは、情報検索の対象となる文章データを暗号化して管理する検索データ保護装置にあって、外部より収集された前記文章データに基づいて当該文章データが内包するキーワードごとの位置情報を含むインデックスデータを作成するインデックス作成手段、前記位置情報を予め設定された方式を用いて暗号化するインデックス暗号化手段、この前記位置情報が暗号化されたインデックスデータを記憶処理して管理するインデックス記憶管理手段、として前記検索データ保護装置に予め設けられたコンピュータを機能されることを特徴とする。
本発明によれば、特に、類似のデータであっても全く異なるデータに暗号化する機能を備えたインデックス暗号化部が有効に機能するため、情報検索の対象となる文書データを有効に保護することができる検索データ保護装置、情報検索システム、検索データ保護方法、及びそのプログラムの提供が可能となる。
本発明の実施形態にかかる情報データ保護装置及び情報検索システムの機能的構成を示すブロック図である。 図1に開示した情報データ保護装置にてインデックスデータを作成する様子を例示した図である。 図1に開示した情報データ保護装置にて作成したインデックスデータから元文書を復元する様子を例示した図である。 図2に示したキー部とポインタ部とにより構成されるインデックスデータのうち、ポインタ領域を暗号化した状態を例示した図である。 図1に開示した情報データ保護装置によるインデックスデータの暗号化処理にかかる動作を示すフローチャートである。 図1に開示した情報検索システムにて新規な文書データを収集した際の動作を示すフローチャートである。 従来の方式によるインデックスデータの暗号化を例示した図である。
〔実施形態〕
本発明にかかる検索データ保護装置及び情報検索システムの実施形態を、図1乃至図6に基づいて説明する。
(基本的構成)
外部より収集された情報検索の対象となる文章データに基づいて当該文章データが内包するキーワードにかかるポインタ情報(位置情報)を含むインデックスデータを作成するインデックス作成部20を有すると共に、このインデックスデータを暗号化して管理する検索データ保護装置100は、上記ポインタ情報を予め設定された方式を用いて暗号化するインデックス暗号化部30と、このインデックス暗号化部30にてポインタ情報が暗号化されたインデックスデータを、予め設けられたインデックス記憶手段40Aに記憶処理して管理するインデックス記憶管理部40と、外部より情報検索の対象となる新規な文章データを収集した際に、インデックス記憶管理部40が記憶処理したインデックスデータを復号化するインデックス復号化部50と、を有している。
また、実施形態における情報検索システム110は、情報検索の対象となる文書データを外部から収集すると共にこの文章データの送信及び格納処理を行う文書データ収集処理装置(クローラ装置)10と、このクローラ装置10にて暗号化された文書データが格納される文書データベース60と、この文書データベース60に記憶された元文書を管理する文書データ管理装置70と、利用者側の端末(ユーザ端末)120から検索キーを受け取ると共にインデックス記憶管理部40に伝達する入力装置80と、外部入力された検索キーをもとに情報検索された結果を出力する出力装置90と、文書データ収集処理装置10が収集した文書データに基づいて当該文章データが内包するキーワードにかかるポインタ情報を含むインデックスデータを作成すると共にこれを暗号化して管理する検索データ保護装置100と、を有し、外部から入力された検索キーに基づく情報検索処理を実行するように構成されている。
(具体的構成)
文書データ収集処理装置10は、収集した文書データを暗号化すると共にこれを文書データベース60に格納処理する文書暗号化部10Aを有している。すなわち、文書データベース60に格納される文書データそのものは暗号化された状態にあるため、不正に取得されたとしても情報漏洩の危険を回避することができる。
インデックス作成部20が作成するインデックスデータ(インデックス)は、上記図2を参照して述べた通り、一般に転置行列と称されるデータ形式で作成され、図3に示すように、キー部とポインタ部とから成り立つように構成されている。
ここで、キーワードの生成の方式には、単語方式,バイグラム,又はNグラムなどの各種方式がある。本実施形態における検索データ保護装置100には、こうした何れかの方式を適宜採用することができ、これにより、キーワードの生成及びインデックスの作成を実現するように構成されている。
また、本実施形態にかかるインデックス暗号化部30は、ポインタ列全体又はその一部をまとめて暗号化するように構成されている。これにより、類似のデータも全く異なるデータに暗号化されることとなる。
ここで、ポインタ部の暗号化を例示した図4を参照すると、インデックス暗号化部30は、例えば(2,1)と(2,2)との関係のように類似するポインタ情報であっても、これらを全く異なるデータに暗号化するように構成されているため、暗号化された状態では、相互間の共通点を発見することができない。すなわち、これらは文書番号である「2」において共通し且つオフセット値である「1」と「2」とは近似するが、インデックス暗号化部30は、こうした共通点等には全く依存しない手法により暗号化を実行するように構成されている。
また、本実施形態における図4の例示では、文書1及び文書2において4箇所に記載されたキーワード「猫」を、上記図7で示したように共通の暗号にするのではなく、「猫」にかかるポインタ情報全体をまとめて暗号化するという構成を採った。これにより、類似のデータも全く異なるデータに暗号化されることとなる。
上記のようにして暗号化された状態にあっては、元文書の不正な解読ができないことから、情報漏洩を抑止することができる。また、ビット列が長く強い暗号の適用も容易に行えることから、セキュリティの強化を図ることが可能となる。
なお、本実施形態おける暗号化方式は、図4に例示した方式に限定されるものではない。すなわち、類似するポインタ情報を全く異なるデータに暗号化するという特徴点を失わない限りにおいて、各種の暗号化方式を適宜採用するようにしてもよい。
また、ポインタ部のポインタ情報は、新規な文書データ(新規文書)がクローラ装置10にて収集され検索データ保護装置100に入力された際に実行される登録処理(追加処理)や不要となった文書データの削除処理等により頻繁に書き換えられる。
ここで、新規文書をクローラ装置10が収集した際の追加処理にかかる構成を説明する。
インデックス復号化部50は、クローラ装置10が新規文書を収集した際に、インデックス記憶手段40A内のインデックスデータを読込みメモリ50Aにロードすると共に、各ポインタ情報を復号化するように構成されている。
その際、インデックス作成部20は、クローラ装置10から取得した新規文書に基づいて、部分転置行列である新規なインデックスデータ(新規データ)を作成する、という構成を採っている。
また、インデックス復号化部50は、上記の通り復号化したインデックスデータに、インデックス作成部20が作成した新規データを追加するように構成されている。
その際、検索データ保護装置100は、クローラ装置10を介して入力された新たな文書データが更に存在するか否かを判定し、これが存在する場合は、改めて上記同様に各構成部材を機能させるように構成されている。
一方で、存在しない場合は、新規データが追加されたインデックスデータの各ポインタ情報をインデックス暗号化部30にて暗号化すると共に、この暗号化されたインデックスデータを、インデックス記憶管理部40がインデックス記憶手段40Aに記憶処理する、という構成を採っている。
このようにしてポインタ部は、文書データの登録・削除により頻繁にデータが書き換えられるため、インデックス暗号化部30は、こうした書き換えのタイミングにおいても随時暗号化を実行するように構成されている。
さらに、インデックス暗号化部30は、各場面での暗号化に際して、暗号強度の調整を実現するための機能を有している。
すなわち、インデックス暗号化部30は、上記により書き換えられた文書全体を長いビット列で暗号化する長ビット列暗号化方式と、インデックスの見出し語単位での暗号化を実施する見出し語暗号化方式と、インデックスを予め決められたブロック単位(例えば、あ行で始まるインデックス単位など)で暗号化して管理するブロック暗号化方式と、の何れか一つを選択する暗号化方式選択手段30Aを有し、これにより、各方式の長所と短所とに基づく暗号強度等の調整を行うことができる。
具体的には、暗号化方式選択手段30Aが、ユーザ端末120からの指示(指令信号)又は予め設定された基準に従って、文章データ全体に対応する位置情報をまとめて暗号化する方式と、キーワードに対応する位置情報ごとに暗号化する方式と、文章データ全体に対応する位置情報を予め決められたブロックの単位(予め決められた基準に則したブロック単位)で暗号化する方式と、のうちから何れか一つを選択し、この選択した方式を用いて暗号化が実行される、という構成を採っている。
文書全体を長いビット列で暗号化する長ビット列暗号化方式によれば、暗号の強度が高くなるという長所がある。しかし、ポインタ部全体を対象とするため、暗号化・復号化に費やす時間が長くなるという短所もある。
インデックスの見出し語単位で暗号化する見出し語暗号化方式によれば、更新されたポインタのみを暗号化するため、暗号化・復号化の時間を短縮化できる反面、暗号強度は低下することとなる。
インデックスをブロック単位で暗号化するブロック暗号化方式によれば、長ビット列暗号化方式と見出し語暗号方式との中間的な暗号強度と処理時間を実現することができる。特に、このブロック暗号化方式をインデックス暗号化部30に採用すれば、上述した特定の行によるブロック分割の他にも、多種多様なブロック単位による暗号化が実現でき、このため、暗号強度と費やす時間とのバランスを考慮した更に柔軟な暗号化が可能となる。
上述した関連技術で採用していたキーワード領域を暗号化する方式では、外部データとのマッチングが必要なため、当該選択機能を情報検索装置に実装することは困難であった。しかし、本実施形態では、ポインタ領域のポインタ列全体又はその一部をまとめて暗号化するという方式を採用したため、外部データとのマッチングが不要であることから、暗号化方式選択手段30Aにて当該選択機能の実現が可能となった。
また、インデックス暗号化部30が、上記各方式の内の何れか1つを用いて上記暗号化を行うように構成してもよい。さらに、暗号化方式選択手段30Aを、ユーザ端末120からの指示(指令信号)又は予め設定された基準に従って、上記各方式の内の何れか2つを選択するように構成してもよい。
インデックス記憶管理部40は、外部から入力された検索キー(検索文字列)を前記記憶処理したインデックスデータに照らすことで情報検索を行うインデックス検索手段40Bをさらに有するように構成されている。
このインデックス検索手段40Bにかかる機能構成は、必ずしもインデックス記憶管理部40の内部に設ける必要はなく、例えば、同等の機能を有するインデックス検索装置として、情報検索システム110内に装備するように構成してもよい。
インデックス復号化部50は、インデックス記憶手段40Aに記憶されたインデックスを読み込むと共に復号化処理を実行するための読込みメモリ50Aを有している。
本実施形態におけるインデックス復号化部50は、暗号化された復号化キーを外部から入手した後、読込みメモリ50A上でのみインデックスデータを復号化するように構成されているため、これにより、安全性の向上を図ることができる。
また、上記以外の手法により、インデックス復号化部50が、動的に復号化を実行するように構成してもよい。
文書データ管理装置70は、インデックス記憶管理部40から特定のデータ領域の参照命令が来た場合に、指定領域のポインタ前後の文書データを復号又は再暗号化して送出するように構成されている。
本実施形態では、検索キーをユーザ端末120から受け取った際に入力装置80が、当該検索キーを復号化すると共にインデックス記憶管理部40に伝達するという構成を採った。しかし、基本的には、入力装置80からインデックス記憶管理部40に伝達される段階で、検索キーとインデックスのキーデータとが一致していればよいため、当該検索キーは、入力装置80ではなく、ユーザ端末120で復号化されるように構成してもよい。
(動作説明)
図1に開示した検索データ保護装置100及び情報検索システム110の動作を、図5及び図6に示すフローチャートに基づいて説明する。
まず、図5を参照して、検索データ保護装置100によるインデックスデータの作成及び暗号化処理にかかる動作を説明する。
外部より収集された文章データに基づいて当該文章データが内包するキーワードごとの位置情報を含むインデックスデータをインデックス作成部20が作成する(図5:S501)。
次いで、インデックス作成部20が作成したインデックスデータのポインタ部にあるポインタ情報(位置情報)を、インデックス暗号化部30が予め設定された方式を用いて暗号化する(図5:S502)。
続いて、インデックス暗号化部30によりポインタ情報が暗号化されたインデックスデータをインデックス記憶手段40Aに記憶処理し、これにより、その後の各処理に際して当該インデックスデータを安全に管理する(図5:S503)。
次に、ユーザ端末120から入力された検索キーをもとに検索を行うに際して情報検索システム110が参照するインデックスデータに、新規な文書データ(新規文書)にかかる情報を追加する動作内容を説明する。
クローラ装置10が新規文書を収集すると、ポインタ領域が暗号化された状態にあるインデックス記憶手段40A内のインデックスデータを、インデックス復号化部50が読込みメモリ50Aにロードする(図6:S601)。
次いで、インデックス復号化部50は、読み込んだインデックスデータの各ポインタ情報を読込みメモリ50Aにて復号化する(図6:S602)。
次に、クローラ装置10から取得した新規文書に基づいて、インデックス作成部20が、部分転置行列である新規なインデックスデータ(新規データ)を作成する(図6:S603)。
続いて、インデックス復号化部50は、上記により復号化したインデックスデータに、インデックス作成部20が作成した新規データを追加する(図6:S604)。
次いで、検索データ保護装置100は、クローラ装置10を介して入力された新たな文書データが更に存在するか否かを判定する(図6:S605)。
その際、存在する旨判定した場合は(図6:S605/はい)、改めて上記インデックス作成部20による新規データの作成から始まる一連の各工程内容(図6:S603〜S605)を実行する。
一方で、存在しない旨判定した場合は(図6:S605/いいえ)、新規データが追加されたインデックスデータの各ポインタ情報を暗号化し(図6:S606)、この暗号化されたインデックスデータを取得したインデックス記憶管理部40が、これをインデックス記憶手段40Aに記憶処理する(図6:S607)。
上記動作内容は、便宜上、図6に付した番号(S601〜S607)の順に説明したが、本実施形態にかかる情報検索システム110の動作順序は、必ずしもこれに限定されるものではない。例えば、新規データが追加されたインデックスデータを暗号化(図6:S606に相当)した後に、新たな文書データが更に存在するか否かの判定(図6:S605に相当)を行うにしてもよい。かかる場合、当該判定後に改めて復号化(図6:S602に相当)を行うと共に一連の各工程内容を実行する。
また、上記各ステップS501〜S503(図5)及び各ステップS601〜S607(図6)における各工程の実行内容をプログラム化すると共に、この一連の各制御プログラムをコンピュータによって実現するように構成してもよい。
(実施形態の効果等)
本実施形態にかかる検索データ保護装置100では、インデックスデータ中のポインタ部を暗号化するという構成を採用したため、これにより、ポインタ情報が元の単語順序に辿れなくなり、すなわち、元文書の復元ができなくなることから、当該暗号化後のデータが不正に取得された場合でも、情報漏洩を抑止することができる。
したがって、インデックス暗号化部30が有する「インデックスのポインタ部を暗号化する」という特徴的な機能によれば、不正にインデックデータが取得された場合でも、この不正取得先での元文書の解読ができないため、信頼性に優れたデータ保護を実現することが可能となる。
また、インデックス暗号化部30には、上述した通り、類似のデータであっても全く異なるデータに暗号化するという構成を採用したため、より安全性を向上することが可能となる。
さらに、本実施形態では、インデックス暗号化部30内の暗号化方式選択手段30Aが有効に機能し、利用者の指示を受けた際に、又は該装置側で自動的に、有意な暗号化方式を選択することがでる。したがって、各方式の長所や短所を勘案した暗号強度等の調整を行うことにより、状況に適した暗号化処理を実現することが可能となる。
本実施形態の検索データ保護装置100及び情報検索システム110における上記各構成要素(各モジュール)の実装上の形態としては、電子回路やコンピュータ等を採用することができる。
ここで、上記インデックス暗号化部30等の各モジュールを別々の部品として構成すると共に、情報検索にかかる装置等に適用するようにしてもよい。また、例えば、本実施形態にかかる特徴的構成であるインデックス暗号化部30と、他の構成部材であるインデックス作成部20,インデックス記憶管理部40,又はインデックス復号化部50の内のいずれか1つ又は2つと、を組み合わせた装置として構成してもよい。さらに、各モジュールを、PC等に代表される1つの装置の内部に格納する、という構成を採ってもよい。
各モジュールが有する機能を実現できるソフトウエア又はハードウェアの構成をネットワーク上に単独で又は幾つかを組み合わせた状態で点在させ、これにより、各構成を該ネットワークを介して有意に機能させるようにしてもよい。
また、各モジュールや該装置又はシステム全体を複数用意し、これらを冗長構成や負荷分散等のために有効利用することで、全体としての性能向上を図るようにしてもよい。
本実施形態にかかる検索データ保護装置100又は情報検索システム110を、他の装置等と組み合わせて大きなシステムとして構成するようにしてもよい。また、ソフトウエアの形態で実施する場合は、他のソフトウエアから呼ばれる形で構成するようにしてもよい。
暗号化又は復号化のキーの持ち方としては、該装置又はシステム内にて所持する方法の他に、動的に生成する方法,他のサーバで管理する方法,又は他のサーバから通信により入手する方法などを採用することができる。こうした盗難対策のための他の所持方法を採用すれば、さらに情報セキュリティの向上を図ることが可能となる。
なお、上述した実施形態は、検索データ保護装置、情報検索システム、検索データ保護方法、及びそのプログラムにおける好適な具体例であり、技術的に好ましい種々の限定を付している場合もある。しかし、本発明の技術範囲は、特に本発明を限定する記載がない限り、これらの態様に限定されるものではない。
以下は、上述した実施形態についての新規な技術的内容の要点をまとめたものであるが、本発明は必ずしもこれに限定されるものではない。
(付記1)
外部より収集された情報検索の対象となる文章データに基づいて当該文章データが内包するキーワードごとの位置情報を含むインデックスデータを作成するインデックス作成部を有すると共に、このインデックスデータを暗号化して管理する検索データ保護装置であって、
前記位置情報を予め設定された方式を用いて暗号化するインデックス暗号化部と、
この前記位置情報が暗号化されたインデックスデータを、予め設けられたインデックス記憶手段に記憶処理して管理するインデックス記憶管理部と、を有することを特徴とした検索データ保護装置。
(付記2)
前記付記1に記載の検索データ保護装置において、
インデックス暗号化部は、前記キーワードに対応する前記位置情報ごとに暗号化する方式を用いることを特徴とした検索データ保護装置。
(付記3)
前記付記1に記載の検索データ保護装置において、
インデックス暗号化部は、前記文章データ全体に対応する前記位置情報を予め決められたブロックの単位で暗号化する方式を用いることを特徴とした検索データ保護装置。
(付記4)
前記付記1に記載の検索データ保護装置において、
インデックス暗号化部は、前記文章データ全体に対応する前記位置情報をまとめて暗号化する方式を用いることを特徴とした検索データ保護装置。
(付記5)
前記付記1に記載の検索データ保護装置において、
前記インデックス暗号化部は、前記文章データ全体に対応する前記位置情報をまとめて暗号化する方式と、前記キーワードに対応する前記位置情報ごとに暗号化する方式と、前記文章データ全体に対応する前記位置情報を予め決められたブロックの単位で暗号化する方式と、の何れか一つの方式を、外部からの指令信号に従って選択する暗号化方式指令選択手段を有することを特徴とした検索データ保護装置。
(付記6)
前記付記1に記載の検索データ保護装置において、
前記インデックス暗号化部は、前記文章データ全体に対応する前記位置情報をまとめて暗号化する方式と、前記キーワードに対応する前記位置情報ごとに暗号化する方式と、前記文章データ全体に対応する前記位置情報を予め決められたブロックの単位で暗号化する方式と、の何れか一つの方式を、予め設けられた基準に従って選択する暗号化方式自動選択手段を有することを特徴とした検索データ保護装置。
(付記7)
前記付記1乃至6の何れか一つに記載の検索データ保護装置において、
外部より情報検索の対象となる新規な文章データを収集した際に、前記インデックス記憶管理部が記憶処理したインデックスデータを復号化するインデックス復号化部をさらに有し、
このインデックス復号化部は、前記新規な文章データに基づいて前記インデックス作成部が作成する新規インデックスデータを、前記復号化したインデックスデータに追加すると共に、この追加後のインデックスデータを前記インデックス暗号化部に送信することを特徴とした検索データ保護装置。
(付記8)
情報検索の対象となる文書データを外部から収集すると共にこれを暗号化して予め設けられた文書データベースに格納する文書データ収集処理装置と、前記文書データ収集処理装置が収集した文書データに基づいて作成したインデックスデータを暗号化して管理する検索データ保護装置と、を有すると共に、外部から入力された検索文字列に基づく情報検索処理を実行する情報検索システムであって、
前記検索データ保護装置として、前記付記1乃至7の何れか一つに記載の検索データ保護装置を装備し、
前記インデックス記憶管理部は、前記検索文字列を前記記憶処理したインデックスデータに照らすことで検索処理を実行するインデックス検索手段をさらに有することを特徴とした情報検索システム。
(付記9)
情報検索の対象となる文書データを外部から収集すると共にこれを暗号化して予め設けられた文書データベースに格納する文書データ収集処理装置と、前記文書データ収集処理装置が収集した文書データに基づいて作成したインデックスデータを暗号化して管理する検索データ保護装置と、を有すると共に、外部から入力された検索文字列に基づく情報検索処理を実行する情報検索システムであって、
前記検索データ保護装置として、前記付記1乃至7の何れか一つに記載の検索データ保護装置を装備し、
前記検索文字列を前記記憶処理したインデックスデータに照らすことで検索処理を実行するインデックス検索装置を有することを特徴とした情報検索システム。
(付記10)
情報検索の対象となる文章データを暗号化して管理する検索データ保護装置にあって、
外部より収集された前記文章データに基づいて当該文章データが内包するキーワードごとの位置情報を含むインデックスデータを作成し、
前記位置情報を予め設定された方式を用いて暗号化し、
この前記位置情報が暗号化されたインデックスデータを記憶処理して管理することを特徴とした検索データ保護方法。
(付記11)
前記付記10に記載の検索データ保護方法において、
前記暗号化に先立って、
外部からの指令信号を受信すると共にこの指令信号に従って、前記文章データ全体に対応する前記位置情報をまとめて暗号化する方式と、前記キーワードに対応する前記位置情報ごとに暗号化する方式と、前記文章データ全体に対応する前記位置情報を予め決められたブロックの単位で暗号化する方式と、の何れか一つの方式を選択することを特徴とした検索データ保護方法。
(付記12)
前記付記10又は11に記載の検索データ保護方法において、
外部より情報検索の対象となる新規な文章データを収集した際に、
前記記憶処理したインデックスデータを復号化し、
前記新規な文章データに基づいて新規インデックスデータを作成し、
この新規インデックスデータを前記復号化したインデックスデータに追加し、
この追加後のインデックスデータを前記予め設定された方式を用いて暗号化すると共に記憶処理して管理することを特徴とした検索データ保護方法。
(付記13)
情報検索の対象となる文章データを暗号化して管理する検索データ保護装置にあって、
外部より収集された前記文章データに基づいて当該文章データが内包するキーワードごとの位置情報を含むインデックスデータを作成するインデックス作成手段、
前記位置情報を予め設定された方式を用いて暗号化するインデックス暗号化手段、
この前記位置情報が暗号化されたインデックスデータを記憶処理して管理するインデックス記憶管理手段、
として前記検索データ保護装置に予め設けられたコンピュータを機能されるための検索データ保護プログラム。
(付記14)
前記付記13に記載の検索データ保護プログラムにおいて、
前記インデックス暗号化手段にて行う暗号化の方式を、前記文章データ全体に対応する前記位置情報をまとめて暗号化する方式と、前記キーワードに対応する前記位置情報ごとに暗号化する方式と、前記文章データ全体に対応する前記位置情報を予め決められたブロックの単位で暗号化する方式と、から選択する暗号化方式選択手段、
として前記コンピュータを機能されるための検索データ保護プログラム。
(付記15)
前記付記13又は14に記載の検索データ保護プログラムにおいて、
外部より情報検索の対象となる新規な文章データを収集した際に、
前記記憶処理したインデックスデータを復号化するインデックス復号化手段、
前記新規な文章データに基づいて新規インデックスデータを作成すると共に、この新規インデックスデータを前記復号化したインデックスデータに追加する新規インデックス作成追加手段、
この追加後のインデックスデータを前記予め設定された方式を用いて暗号化すると共に記憶処理して管理する新規インデックス記憶管理手段、
として前記コンピュータを機能されるための検索データ保護プログラム。
本発明は、文書データをはじめ、画像,ドキュメント,スケジュール,又は人物などの検索を行う装置等に適用可能である。
10 文書データ収集処理装置(クローラ装置)
10A 文書暗号化部
20 インデックス作成部
30 インデックス暗号化部
30A 暗号化方式選択手段
40 インデックス記憶管理部
40A インデックス記憶手段
40B インデックス検索手段
50 インデックス復号化部
50A 読込みメモリ
60 文書データベース
70 文書データ管理装置
80 入力装置
90 出力装置
100 検索データ保護装置
110 情報検索システム
120 ユーザ端末(利用者側の端末)

Claims (10)

  1. 外部より収集された情報検索の対象となる文章データに基づいて当該文章データが内包するキーワードごとの位置情報を含むインデックスデータを作成するインデックス作成部を有すると共に、このインデックスデータを暗号化して管理する検索データ保護装置であって、
    前記位置情報を予め設定された方式を用いて暗号化するインデックス暗号化部と、
    この前記位置情報が暗号化されたインデックスデータを、予め設けられたインデックス記憶手段に記憶処理して管理するインデックス記憶管理部と、を有することを特徴とした検索データ保護装置。
  2. 前記請求項1に記載の検索データ保護装置において、
    インデックス暗号化部は、前記キーワードに対応する前記位置情報ごとに暗号化する方式を用いることを特徴とした検索データ保護装置。
  3. 前記請求項1に記載の検索データ保護装置において、
    インデックス暗号化部は、前記文章データ全体に対応する前記位置情報を予め決められたブロックの単位で暗号化する方式を用いることを特徴とした検索データ保護装置。
  4. 前記請求項1に記載の検索データ保護装置において、
    前記インデックス暗号化部は、前記文章データ全体に対応する前記位置情報をまとめて暗号化する方式と、前記キーワードに対応する前記位置情報ごとに暗号化する方式と、前記文章データ全体に対応する前記位置情報を予め決められたブロックの単位で暗号化する方式と、の何れか一つの方式を、外部からの指令信号に従って選択する暗号化方式指令選択手段を有することを特徴とした検索データ保護装置。
  5. 前記請求項1乃至4の何れか一つに記載の検索データ保護装置において、
    外部より情報検索の対象となる新規な文章データを収集した際に、前記インデックス記憶管理部が記憶処理したインデックスデータを復号化するインデックス復号化部をさらに有し、
    このインデックス復号化部は、前記新規な文章データに基づいて前記インデックス作成部が作成する新規インデックスデータを、前記復号化したインデックスデータに追加すると共に、この追加後のインデックスデータを前記インデックス暗号化部に送信することを特徴とした検索データ保護装置。
  6. 情報検索の対象となる文書データを外部から収集すると共にこれを暗号化して予め設けられた文書データベースに格納する文書データ収集処理装置と、前記文書データ収集処理装置が収集した文書データに基づいて作成したインデックスデータを暗号化して管理する検索データ保護装置と、を有すると共に、外部から入力された検索文字列に基づく情報検索処理を実行する情報検索システムであって、
    前記検索データ保護装置として、前記請求項1乃至5の何れか一つに記載の検索データ保護装置を装備し、
    前記インデックス記憶管理部は、前記検索文字列を前記記憶処理したインデックスデータに照らすことで検索処理を実行するインデックス検索手段をさらに有することを特徴とした情報検索システム。
  7. 情報検索の対象となる文章データを暗号化して管理する検索データ保護装置にあって、
    外部より収集された前記文章データに基づいて当該文章データが内包するキーワードごとの位置情報を含むインデックスデータを作成し、
    前記位置情報を予め設定された方式を用いて暗号化し、
    この前記位置情報が暗号化されたインデックスデータを記憶処理して管理することを特徴とした検索データ保護方法。
  8. 前記請求項7に記載の検索データ保護方法において、
    前記暗号化に先立って、
    外部からの指令信号を受信すると共にこの指令信号に従って、前記文章データ全体に対応する前記位置情報をまとめて暗号化する方式と、前記キーワードに対応する前記位置情報ごとに暗号化する方式と、前記文章データ全体に対応する前記位置情報を予め決められたブロックの単位で暗号化する方式と、の何れか一つの方式を選択することを特徴とした検索データ保護方法。
  9. 前記請求項7又は8に記載の検索データ保護方法において、
    外部より情報検索の対象となる新規な文章データを収集した際に、
    前記記憶処理したインデックスデータを復号化し、
    前記新規な文章データに基づいて新規インデックスデータを作成し、
    この新規インデックスデータを前記復号化したインデックスデータに追加し、
    この追加後のインデックスデータを前記予め設定された方式を用いて暗号化すると共に記憶処理して管理することを特徴とした検索データ保護方法。
  10. 情報検索の対象となる文章データを暗号化して管理する検索データ保護装置にあって、
    外部より収集された前記文章データに基づいて当該文章データが内包するキーワードごとの位置情報を含むインデックスデータを作成するインデックス作成手段、
    前記位置情報を予め設定された方式を用いて暗号化するインデックス暗号化手段、
    この前記位置情報が暗号化されたインデックスデータを記憶処理して管理するインデックス記憶管理手段、
    として前記検索データ保護装置に予め設けられたコンピュータを機能されるための検索データ保護プログラム。
JP2013082017A 2013-04-10 2013-04-10 検索データ保護装置、情報検索システム、検索データ保護方法、及びそのプログラム Pending JP2014203065A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013082017A JP2014203065A (ja) 2013-04-10 2013-04-10 検索データ保護装置、情報検索システム、検索データ保護方法、及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013082017A JP2014203065A (ja) 2013-04-10 2013-04-10 検索データ保護装置、情報検索システム、検索データ保護方法、及びそのプログラム

Publications (1)

Publication Number Publication Date
JP2014203065A true JP2014203065A (ja) 2014-10-27

Family

ID=52353501

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013082017A Pending JP2014203065A (ja) 2013-04-10 2013-04-10 検索データ保護装置、情報検索システム、検索データ保護方法、及びそのプログラム

Country Status (1)

Country Link
JP (1) JP2014203065A (ja)

Similar Documents

Publication Publication Date Title
US8930691B2 (en) Dynamic symmetric searchable encryption
US8166313B2 (en) Method and apparatus for dump and log anonymization (DALA)
US9548866B2 (en) Deletion of content in digital storage systems
US5343527A (en) Hybrid encryption method and system for protecting reusable software components
CN103119594B (zh) 可检索密码处理系统
US10235539B2 (en) Server device, recording medium, and concealed search system
JP6048414B2 (ja) データベース装置と方法及びプログラム
JP5735539B2 (ja) ネットワークを介して送信されるデータの暗号化および復号化システム、装置、および方法
US8473740B2 (en) Method and system for secured management of online XML document services through structure-preserving asymmetric encryption
US8332655B2 (en) Method for order invariant correlated encrypting of data and SQL queries for maintaining data privacy and securely resolving customer defects
US11070357B2 (en) Techniques for privacy-preserving data processing across multiple computing nodes
US7930560B2 (en) Personal information management system, personal information management program, and personal information protecting method
US20240152630A1 (en) Security system and method for real-time encryption or decryption of data using key management server
CN103336929A (zh) 用于已加密文件访问的方法和系统
CN109325360B (zh) 信息管理方法与装置
US9946720B1 (en) Searching data files using a key map
US8769302B2 (en) Encrypting data and characterization data that describes valid contents of a column
JP6632780B2 (ja) データ処理装置、データ処理方法及びデータ処理プログラム
Rane et al. Multi-user multi-keyword privacy preserving ranked based search over encrypted cloud data
Senthilnathan et al. An enhancing reversible data hiding for secured data using shuffle block key encryption and histogram bit shifting in cloud environment
US20190260583A1 (en) Encryption device, search device, computer readable medium, encryption method, and search method
CN117459327A (zh) 一种云数据透明加密保护方法、系统及装置
US10769144B2 (en) Database search system, database search method, and non-transitory recording medium
CN111639349B (zh) 一种数据加密处理方法、装置和存储介质
JP2014203065A (ja) 検索データ保護装置、情報検索システム、検索データ保護方法、及びそのプログラム