JP3848209B2 - データ転送装置、データ転送方法及びプログラム - Google Patents

データ転送装置、データ転送方法及びプログラム Download PDF

Info

Publication number
JP3848209B2
JP3848209B2 JP2002149131A JP2002149131A JP3848209B2 JP 3848209 B2 JP3848209 B2 JP 3848209B2 JP 2002149131 A JP2002149131 A JP 2002149131A JP 2002149131 A JP2002149131 A JP 2002149131A JP 3848209 B2 JP3848209 B2 JP 3848209B2
Authority
JP
Japan
Prior art keywords
data
fingerprint
client
server
complete
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002149131A
Other languages
English (en)
Other versions
JP2003345708A (ja
Inventor
謙一郎 吉井
雄一 木場
康浩 木村
篤司 庄野
英昭 佐藤
俊文 關
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002149131A priority Critical patent/JP3848209B2/ja
Publication of JP2003345708A publication Critical patent/JP2003345708A/ja
Application granted granted Critical
Publication of JP3848209B2 publication Critical patent/JP3848209B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、他の装置のためにデータ転送を行うデータ転送装置、データ転送方法及びプログラムに関する。
【0002】
【従来の技術】
ネットワークを介して様々なサービスを提供するサーバと、所望のサービスをサーバに対して要求するクライアントとから構成される、クライアント・サーバ型の情報システムが広く利用されている。特に、インターネット上でHTTPプロトコルを使って通信するWebサーバとクライアントとからなるWorld Wide Webシステム(あるいは単にWebとも呼ばれる)は、大変広く利用されているクライアント・サーバ型の情報システムである。通常、サーバ上ではサーバプログラムが動作し、クライアント上ではブラウザなどの所定のツール(プログラム)が動作する。インターネット上で提供されるサービスの内容も多岐に渡っており、ネットワーク経由で文字、静止画像、動画像、音声等の情報(例えば、ホームページ、電子メール、デジタルコンテンツなど)や、プログラムなどを提供、配信あるいは転送などするサービス、また商品を販売するための電子店舗サービス、座席や部屋等の予約サービス、種々の契約の仲介サービスなど、種々のサービスが既に存在し、また次々と新たな形態のサービスが出現している。
【0003】
ところで、Webのようなクライアント・サーバ型の情報システムにおいては、提供されるサービスがどのような形態のものであろうと、基本的にはクライアント・サーバ間でデータ転送が行われることによってサービスが提供される。したがって、クライアントとサーバとの間で通信に用いるネットワークの容量(バンド幅)が、システム全体のボトルネックになりやすい。そこで、通常、ネットワークの負荷を軽減させるためにキャッシュ技術が用いられる。
【0004】
Webシステムの場合、クライアント上で動作するブラウザ等はキャッシュ機構を使用するものが多く、最近アクセスしたデータをキャッシュしている。WebではURLと呼ばれる名前で情報やサービスを指定してアクセスがなされるので、クライアント上のキャッシュは、過去にWebサーバに要求した情報やサービスの結果として返されるデータのうちでキャッシュ可能なものを、そのURLと対応させてキャッシュに記録している。この場合、キャッシュ内にあるものと同じURLの情報やサービスのリクエストがあった際に、そのキャッシュ内の応答データが古くなっていないと判断できるならば、そのデータを返すことで、Webサーバとの間の通信を無くすことができる。
【0005】
企業のオフィス内のLANあるいは研究機関におけるLANあるいは家庭内のLANなどで複数のユーザがいる場合、該LANとインターネットとの間にプロキシサーバを置き、プロキシサーバにキャッシュ機構を設けるようにすることも多い。クライアント内のキャッシュ(例えば、ブラウザのキャッシュ)は、当該クライアント・ユーザに専用のキャッシュとして動作するが、LAN上のプロキシサーバのキャッシュは、複数のクライアント・ユーザに共有のキャッシュとして動作する。そのため、後者では、過去に他人(他クライアント)がアクセスしたURLに対してアクセスする際にもキャッシュが効く。
【0006】
さて、Webにおいて、クライアントとサーバとの間は、HTTPと呼ぶプロトコルで通信が行われる。HTTPプロトコルは、クライアントからサーバへ送る「リクエストメッセージ」と、それに答えてサーバからクライアントへ応答を返す「リプライメッセージ」とが組になっている。
【0007】
リクエストメッセージは、「リクエストヘッダ」と「リクエストボディ」からなる。リクエストヘッダには、アクセスしたい情報やサービスを指定するURLやアクセスの種類を示すメソッド名、その他アクセスに必要な各種の情報が入る。リクエストボディには、サーバに送るデータを入れる。リクエストボディに入っているデータを「リクエストデータ」とも呼ぶ。
【0008】
リプライメッセージは、「リプライヘッダ」と「リプライボディ」からなる。リプライヘッダには、処理結果のステータスなどの情報が入り、リプライボディには要求された情報や要求されたサービスの処理結果などのデータが入る。リプライボディに入っているデータを「リプライデータ」とも呼ぶ。
【0009】
リクエストメッセージのメソッドとしては、サーバ上の情報を読み出す「GETメソッド」、ユーザの持つデータをサーバに書き込む「PUTメソッド」、リクエストの応じて処理した結果を送り返してもらう「POSTメソッド」が、情報やサービスのアクセスに用いられる主要なものである。その他、DELETEなどのメソッドが定義されている。
【0010】
多くの場合、GETメソッドのリクエストメッセージのリクエストボディ、PUTメソッドのリプライメッセージのリプライボディは空である。POSTメソッドのリクエストメッセージのリクエストボディには、必要に応じてサーバ側での処理に用いる情報が入り、POSTメソッドのリプライメッセージのリプライボディには、その処理の結果のデータが入る。
【0011】
GETメソッドでサーバから読み出すデータは、読み出す毎にサーバ側で生成する「動的データ」と、既にサーバ側で記憶しているデータをそのまま送り返す「静的データ」に分けることができる。これらのうち、動的データについては、同じURLでも読み出す度に内容が異なる可能性があるので、多くの場合、サーバはキャッシュ不可の指定をそのリプライメッセージのヘッダに入れて送り返す。したがって、Webのデータでキャッシュの対象になるのは、静的データの部分である。この静的データは、不特定多数のユーザが参照して構わない「共有データ」と、ユーザ認証することで特定のユーザだけがアクセスできるようにアクセス制御を行う「プライベートデータ」に分けることができる。前者の共有データは、どのようなキャッシュでもキャッシュ可能である。しかしながら、後者のプライベートデータは、プロキシサーバなどの共有キャッシュでは、キャッシュ不可である(プライベートデータは必ずサーバで認証して送り返す必要があるので)。ただし、ブラウザなどの個人専用のキャッシュの場合には、プライベートデータでもキャッシュは可能である。
【0012】
POSTメソッドは、サーバ側で処理をした結果を返すので、一般的にサーバはキャッシュ不可の指定をリプライメッセージのヘッダに入れて結果を送り返す。そのため、通常はキャッシュの対象にはならない。
【0013】
PUTメソッドは、データをサーバに送るものなので、キャッシュは何も処理をしない。
【0014】
【発明が解決しようとする課題】
従来のWebのキャッシュは、静的コンテンツをキャッシュの対象にしている。かつては、Webで公開される情報やサービスには、情報の更新頻度がそれほど高くなく、不特定多数の人に公開されているものが多かったため、静的コンテンツの割合は非常に高く、従来のキャッシュ技術でもネットワークの負荷の軽減に有効であった。
【0015】
しかしながら、WebベースのASP(Application Service Provider)のように、ユーザがWebブラウザを使って、ネットワーク経由でサーバ上の情報やサービスにアクセスするシステムが普及するにつれて、下記のように従来のキャッシュ技術では対応できないデータが増加している。
・ユーザの認証を行い、アクセスできるユーザを制限しているので、プライベートデータが多い。
・バックエンドのデータベースを参照して生成する動的データが多い。
・帳票処理や検索などPOSTメソッドを使う場合が多い。
・グループ内の情報共有のためにPUTメソッドを使う場合が多い。
この結果、キャッシュ技術のみではネットワークの負荷を軽減する手法として有効に機能しなくなってきている。
【0016】
本発明は、上記事情を考慮してなされたもので、データ転送装置間を接続するネットワークの負荷をより軽減することができるキャッシュ技術・圧縮技術を備えたデータ転送装置、データ転送方法及びプログラムを提供することを目的とする。
【0017】
【課題を解決するための手段】
本発明は、サーバ装置と、該サーバ装置がクライアント装置宛に送信するデータを中継する他のデータ転送装置との通信を中継するデータ転送装置において、サーバ装置から受信して他のデータ転送装置へ送信した第1の完全データと、該第1の完全データをもとに生成した第1のフィンガープリントと、前記第1の完全データが完全データであることを示す第1の識別情報とを対応付けて保持する保持手段と、前記サーバ装置がクライアント装置を宛先として送信した第2の完全データを受信する受信手段と、前記第1の完全データと前記第2の完全データとの差分である差分データと、該第2の完全データをもとに生成した第2のフィンガープリントと、前記差分データが差分データであることを示す第2の識別情報とを対応付けて前記保持手段に保持させるとともに、前記差分データと前記第2の識別情報とを、前記クライアント装置を宛先として送信する送信手段とを備えたことを特徴とする。
また、本発明は、サーバ装置がクライアント装置宛に送信するデータを中継する他のデータ転送装置と、前記クライアント装置との通信を中継するデータ転送装置において、他のデータ転送装置から受信してクライアント装置へ送信した第1の完全データと、該第1の完全データをもとに生成した第1のフィンガープリントと、前記第1の完全データが完全データであることを示す第1の識別情報とを対応付けて保持する保持手段と、前記クライアント装置が宛先とされた、前記第1の完全データと第2の完全データとの差分である差分データと、該差分データが差分データであることを示す第2の識別情報とを受信する受信手段と、前記第1の完全データと前記差分データとを用いて前記第2の完全データを生成し、該差分データと、該第2の完全データをもとに生成した第2のフィンガープリントと、前記第2の識別情報とを対応付けて前記保持手段に保持させるとともに、該第2の完全データを、前記クライアント装置を宛先として送信する送信手段とを備えたことを特徴とする。
【0023】
なお、装置に係る本発明は方法に係る発明としても成立し、方法に係る本発明は装置に係る発明としても成立する。
また、装置または方法に係る本発明は、コンピュータに当該発明に相当する手順を実行させるための(あるいはコンピュータを当該発明に相当する手段として機能させるための、あるいはコンピュータに当該発明に相当する機能を実現させるための)プログラムとしても成立し、該プログラムを記録したコンピュータ読取り可能な記録媒体としても成立する。
【0024】
本発明によれば、データ転送装置間でデータとその名前との対応を保持し、この対応を保持しているデータについては、データ本体を転送する代わりに対応する名前を転送することで、データ転送装置間の転送データ量を削減させることができる。例えば、GETメソッドのリプライメッセージがプライベートデータであっても、これをフィンガープリントにより圧縮してデータ転送装置間を転送することができるようになる。また、例えば、GETメソッドのリプライメッセージが動的データであっても、内容が同じデータなら、これをフィンガープリントにより圧縮してデータ転送装置間を転送することができるようになる。また、例えば、POSTメソッドであっても、結果が同じデータなら、これをフィンガープリントにより圧縮してデータ転送装置間を転送することができるようになる。
【0025】
また、本発明によれば、データに対応する名前が保持されていないために、データを転送する代わりに対応する名前を転送することができない場合であっても、保持されている参照データに対応する名前を利用して当該データを圧縮して表現した圧縮データを転送することによって、データ転送装置間の転送データ量を削減することができる。例えば、GETメソッドやPOSTメソッドのリプライデータが以前にアクセスしたデータと一部が異なる場合には、差分転送することで、データ量を削減することができる。また、例えば、PUTメソッドやPOSTメソッドのリクエストデータが以前に送ったデータと一部が異なる場合には、差分転送することでデータ量を削減することができる。
【0026】
また、本発明によれば、データ圧縮が可能な場合には、データの代わりに圧縮データを保存することにより、記憶装置(メモリやハードディスクなど)を有効利用できる。
【0027】
【発明の実施の形態】
以下、図面を参照しながら発明の実施の形態を説明する。
【0028】
以下では、WANがインターネットであり、クライアントはユーザオフィスLANに接続されたものであり、HTTPプロトコルが使用されるような場合を例にとって説明するが、本発明は、WANがインターネット以外のものでも、クライアントがオフィス以外の例えば家庭内LAN等に設置されたものでも、HTTP以外のプロトコルが使用されるものでも適用可能である。
【0029】
図49に本発明を適用するコンピュータ・ネットワーク・システムの基本的な構成例を示す。この構成例では、ASPサーバセンター2内のローカルエリアネットワーク(LAN)12とユーザオフィス4内のローカルエリアネットワーク(LAN)16との間が、インターネットや専用回線などの広域ネットワーク(WAN)14を介して接続されており、サーバ20とクライアント50とがLAN12・WAN14・LAN16を介して通信可能になっている。LAN12には1または複数のサーバが接続され、LAN16には1または複数のクライアントが接続される。
【0030】
WebベースのASPは、センター2に設置したサーバ20からWAN14を介して様々なアプリケーションプログラムによるサービスを提供し、ユーザはオフィス4に設置されたクライアント上のWebブラウザ等を使ってそれらのサービスにアクセスする。このような利用形態においては、オフィス内LAN16とセンター内LAN12とをつなぐネットワーク、特にインターネットなどのWAN14の実効的な通信容量(バンド幅)は、LAN12やLAN16よりも低く、そこが性能上のボトルネックになって通信遅延が発生し、アプリケーションの応答性能が低下するという問題が発生する。そこで、本実施形態では、例えば図1に示すように、センター内LAN12とオフィス内LAN16をつなぐWAN14の両端に、サーバ側プロキシ30及びクライアント側プロキシ40なる2つのモジュールを設置し、サーバ20とクライアント50がLAN12・プロキシ30・WAN14・プロキシ40・LAN16を介して通信するにあたって、それらプロキシ間で後述するフィンガープリント圧縮(FP圧縮)や差分圧縮を行って通信データ量を低減することで、広域ネットワークのボトルネックを解消する。さらに、それらプロキシでは、詳しくは後述するように、圧縮に必要なデータの一部を差分情報によって保持することで、必要なキャッシュ量を削減する。
【0031】
本実施形態のサーバ20、サーバ側プロキシ30、クライアント側プロキシ40、クライアント50は、いずれも、計算機上でソフトウェア(サーバ・プログラム、サーバ側プロキシ・プログラム、クライアント側プロキシ・プログラム、クライアント・プログラム)を動作させる形で実現することができる。この場合に、所望の機能を有する、OSやドライバソフト、パケット通信用ソフト、暗号ソフト等といったソフトウェア、あるいは通信インタフェース装置や外部記憶装置や入出力装置等といったハードウェアが、必要に応じて計算機に搭載あるいは接続される。また、この場合に、ユーザあるいは管理者などからの情報の入力やユーザへの情報の呈示等のために、グラフィカル・ユーザ・インタフェース(GUI)を用いると好ましい。
【0032】
サービスを利用するためにユーザが使用するクライアント50上では、その目的に応じて例えばWebブラウザ等のプログラムが動作する。ユーザは、例えば、Webブラウザからインターネットを介し情報転送あるいは注文受付等の所望のサービスを提供するサーバにリクエストメッセージを出し、リプライメッセージを受けることによって、またはこれを適宜繰り返すことによって、サービスを利用する。なお、Webブラウザ等の汎用のソフトウェアではなく、特定のサービスを利用するための専用のソフトウェアなどの他のものが用いられても構わない。また、クライアントは、汎用の計算機ではなく、例えばインターネット機能を有する携帯電話端末等でもよい。
【0033】
サーバ20上では、所定のサーバ・プログラムが動作し、クライアント50のユーザに対して、当該サーバ・サイトに固有のサービスを提供する。
【0034】
サーバ側プロキシ30は、図1のように、サーバセンター内LAN12とWAN14の両方に接続し、トランスペアレント・プロキシとして動作するように設置して実施してもよい。また、図2のようにサーバセンター内LAN12上に設置して実施してもよい。また、図3のようにサーバ側プロキシ30の機能をサーバ20に内蔵するように実施してもよい。
【0035】
同様にクライアント側プロキシ40は、図1のように、ユーザオフィス内LAN16とWAN14の両方に接続し、トランスペアレント・プロキシとして動作するように設置して実施してもよい。また、図2のようにユーザオフィス内LAN16上に設置して実施してもよい。また、図3のようにクライアント側プロキシ40の機能をクライアント50上で動作するブラウザ等に内蔵するように実施してもよい。あるいは、ブラウザ等の動作するクライアント50上に、個人用のクライアント側プロキシ40を動作させるように実施してもよい。
【0036】
なお、サーバ側プロキシ30とクライアント側プロキシ40とは、図1〜図3などのように同じ形態であってもよいし、異なる形態であってもよい。
【0037】
以下では、フィンガープリント・キャッシュ、これを利用したFP圧縮及び差分圧縮、データ管理について、それらの概要を説明する。
【0038】
なお、以下、サーバ側プロキシ30とクライアント側プロキシ40との間のデータ転送方向としていずれか一方向を例にとって説明する際には、サーバ側プロキシ30からクライアント側プロキシ40へデータを転送する場合を例にとって説明していくが、クライアント側プロキシ40からサーバ側プロキシ30へデータを転送する場合にも同様のことが可能である。
【0039】
本実施形態のサーバ側プロキシ30とクライアント側プロキシ40は、フィンガープリント・キャッシュと呼ぶキャッシュ機構を持つ。フィンガープリント・キャッシュは、フィンガープリント(FP)と呼ぶ名前によって、HTTPプロトコルでやりとりされるデータを記録・管理する。
【0040】
フィンガープリントは、図4に例示するように、HTTPプロトコルでやり取りされるデータ(図4ではコンテンツ)の内容から、あらかじめ決められた計算方法(図4ではハッシュ関数)で決定される、短い数値である。この数値は、可変長でもよいが、処理の容易さの観点では、固定長の数値の方が扱いやすい。
【0041】
フィンガープリントを計算する方法としては、良く知られているMD−5やSHA−1などのハッシュ関数を用いることができる。これらのハッシュ関数は、データに対する電子署名などに使われており、任意のデータが与えられると、MD−5の場合は128ビットの数値に、SHA−1の場合は160ビットの数値に、変換することができる。これらのハッシュ関数の特徴は、2つのデータX1、X2が与えられ、データX1とデータX2とが同じであれば、データX1に対して計算したハッシュ値とデータX2に対して計算したハッシュ値とは等しくなるが、異なる2つのデータA、Bが与えられた場合には、データAに対して計算したハッシュ値とデータBに対して計算したハッシュ値とは、非常に高い確率で異なるものになることである(原理上は、異なる2つのデータA、Bに対してそれぞれ計算したハッシュ値が同じになる場合があるが、その確率は実用上無視できるくらいに小さい)。
【0042】
図5に示すように、サーバ側プロキシ30やクライアント側プロキシ40の持つフィンガープリント・キャッシュ(260)は、過去にHTTPプロトコルでやり取りされたデータ本体(261)または後述する差分圧縮により生成されたデータ(264)を、そのやりとりされたデータから計算して求めたフィンガープリントの値(262)を名前として、記録されているデータがデータ本体かそれとも差分圧縮により生成されたデータかを示す差分圧縮データ識別子(以下、圧縮識別子と記述する)(263)とともに記録・管理する。なお、以下では、該識別子=0が“記録されているデータはデータ本体である”ことを示し、該識別子=1が“記録されているデータが差分圧縮により生成されたデータである”ことを示すものとした例で説明するが、これに限定されるものではない。
【0043】
例えば、HTTPプロトコルでサーバ側プロキシ30からクライアント側プロキシ40へデータを転送する場合に、サーバ側プロキシ30は、当該データのフィンガープリントを計算し、そのフィンガープリントに対応するデータがフィンガープリント・キャッシュに入っていてかつ圧縮識別子が0であれば、キャッシュに存在するデータは差分圧縮により生成されたデータではないが、当該データ(と同じ内容のデータ)は過去に転送したことがあるので、当該データを転送せずに、対応するフィンガープリントの値を転送する。フィンガープリントを受け取ったクライアント側プロキシ40は、当該フィンガープリントの値に対応するデータをフィンガープリント・キャッシュから取り出すことで、転送すべきデータを再現することができる。
【0044】
また例えば、上記の場合に、サーバ側プロキシ30は、計算したフィンガープリントに対応するデータがフィンガープリント・キャッシュに入っていてかつ圧縮識別子が1であれば、キャッシュに存在するデータは差分圧縮により生成されたデータであり、当該受信データ(と同じ内容のデータ)に対して過去に差分圧縮が成功し、差分情報を転送したことがあることがわかり、当該データを転送せずに、対応するフィンガープリントの値を転送する。フィンガープリントを受け取ったクライアント側プロキシ40は、当該フィンガープリントの値に対応するデータをフィンガープリント・キャッシュから取り出して差分圧縮されているデータを解凍することで、転送すべきデータを再現することができる。
【0045】
このような方式(すなわち、フィンガープリントによるデータの圧縮→フィンガープリントの転送→フィンガープリントによるデータの解凍)により、過去に送ったものと同じデータ(データ本体あるいは差分圧縮により生成されたデータ)ならばフィンガープリントの値を送るだけでよいので、ネットワークを流れるデータ量を大幅に削減することができる。
【0046】
なお、上記の場合に、計算したフィンガープリントに対応するデータがフィンガープリント・キャッシュに入っていないものについては、今回は、後述する差分圧縮により生成されたデータまたはデータ本体を転送するとともに、フィンガープリント・キャッシュへの登録を行うことによって、次回からは、FP圧縮によるフィンガープリントの転送ができるようになる。
【0047】
説明上、サーバ側プロキシ30とクライアント側プロキシ40との間でのデータ転送にあたり、フィンガープリント・キャッシュを利用してメッセージ・ボディーのデータをフィンガープリントに置き換えて転送情報量を圧縮することを、フィンガープリント圧縮(FP圧縮)と呼ぶものとする。
【0048】
続いて、差分圧縮について説明する。
【0049】
上記のFP圧縮では、データに対するフィンガープリントを用いてデータの同一性を高速に判断し、フィンガープリント・キャッシュに登録されているデータと同じデータはプロキシ間で転送せず、代わりに当該データに対するフィンガープリントを転送するようにして、ネットワークの負荷を低減させる。しかし、フィンガープリント・キャッシュに登録されているデータと異なるデータは、たとえ大部分は同じ内容であってもFP圧縮を適用できない。そこで、本実施形態では、FP圧縮できない場合であっても、フィンガープリント・キャッシュに登録されている1または複数のデータを参照データとして、参照データのフィンガープリントや、参照データに対する差分情報など転送すべきデータを復元するための情報によって、転送データを表現することによって、少ない情報量で転送データを表現し、なるべく転送データ量を減らすようにしている。すなわち、フィンガープリント・キャッシュの中のデータを辞書として使って、その中から取り出せるデータは送らないようにする。
【0050】
説明上、サーバ側プロキシ30とクライアント側プロキシ40との間でのデータ転送にあたり、フィンガープリント・キャッシュを利用してメッセージ・ボディーのデータを参照データのフィンガープリント等に置き換えて転送情報量を圧縮することを、差分圧縮と呼ぶものとする。また、この差分圧縮により生成された転送データを、差分圧縮データと呼ぶものとする。
【0051】
なお、このようなフィンガープリントを利用した差分圧縮は、転送すべきデータと参照データとの間の関係を予め取り決めておく必要がなという利点も得られる。すなわち、従来の差分転送では、予め双方で何をベースに差分を取るかを決める必要があるため、差分転送をWebシステムに実際に用いようとすると、このURLのデータはこのデータをベースに差分を取るというようなルールを、双方に登録する手段が必要であり、任意のデータに対して有効に機能させることは不可能であった。これに対して、本差分圧縮方法は、フィンガープリント・キャッシュの中にあるデータを参照データとして差分を取ることで、差分のベースを予め決めておかなくても、差分によるデータの圧縮の効果を得ることができる。
【0052】
次に、本実施形態のデータ管理方法について説明する。
【0053】
本実施形態では、サーバ側プロキシ30においてサーバ20から受信したリプライデータに対して差分圧縮が成功した場合、サーバ側プロキシ30は差分圧縮により生成された差分圧縮データをクライアント側プロキシ40に送信するとともに、自分自身のフィンガープリント・キャッシュ260には、該リプライデータから取得したフィンガープリントと該差分圧縮データとを記録・管理する。この際、記録・管理されているデータが差分圧縮データであることを示すために、圧縮識別子を1にセットする。
【0054】
クライアント側プロキシ40においては、サーバ側プロキシ30から受信したリプライデータが差分圧縮データであった場合には、差分圧縮データからサーバ側プロキシ30が受信したリプライデータを生成しクライアント50に送信するとともに、自分自身のフィンガープリント・キャッシュ260には、差分圧縮データから生成された該リプライデータに対するフィンガープリントと、サーバ側プロキシ30から受信した差分圧縮データとを記録・管理する。この際、記録・管理されているデータが差分圧縮データであることを示すために、圧縮識別子を1にセットする。
【0055】
一方、サーバ側プロキシ30においてサーバ20から受信したリプライデータが初めてのデータであり、FP圧縮及び差分圧縮の両方とも失敗した場合には、サーバ側プロキシ30はクライアント側プロキシ40に対して該リプライデータを送信するとともに、自分自身のフィンガープリント・キャッシュ260には、該リプライデータから取得したフィンガープリントと該リプライデータとを記録・管理する。この際、記録・管理されているデータが差分圧縮データではないことを示すため、圧縮識別子を0にセットする。
【0056】
クライアント側プロキシ40においては、サーバ側プロキシ30から受信したリプライデータがFP圧縮及び差分圧縮のどちらも施されていないデータであることを検知した場合には、該リプライデータをクライアント50へ送信するとともに、自分自身のフィンガープリント・キャッシュ260には、該リプライデータから取得したフィンガープリントと該リプライデータとを記録・管理する。この際、記録・管理されているデータが差分圧縮データではないことを示すため、圧縮識別子を0にセットする。
【0057】
これにより、差分圧縮が成功したデータについては、サーバ側プロキシ30及びクライアント側プロキシ40双方のフィンガープリント・キャッシュ260において、差分圧縮データのみが保存されることになる。
【0058】
ところで、WebベースのASPのような応用では、大部分は同じ内容であるが一部分だけが異なっているようなデータが多く使われる。例えば、帳票のデータなどは、多くのフィールドに同じ情報が記入されていて、一部分だけが違うようなものが多数存在する。また、例えば、Webページで日付もしくは時刻のみ異なるものや、総アクセス回数のカウンタ値のみ異なるものなどもある。このような場合には、差分圧縮データによる転送や保存は特に有効で、データ本体による転送や保存を効果的に少なくすることができる。
【0059】
なお、両プロキシ30,40間において、全メッセージをFP圧縮の適用対象としてもよいが、例えば、予め定められた条件を満たすメッセージについては、これをFP圧縮の適用対象外とする(常にFP圧縮しないで転送する)ようにしてもよい。予め定められた条件は、例えば、メッセージ・ヘッダに予め定められた情報(例えばGETメソッドを示す情報およびリクエストを示す情報)が記述されていること、転送されるデータが空(null)あるいは非常に短いサイズであることなど、種々のバリエーションが考えられる。
【0060】
また、FP圧縮の適用対象のメッセージをすべて差分圧縮の適用対象としてもよいが、FP圧縮の適用対象のメッセージのうち予め定められた条件を満たすメッセージについては、これを差分圧縮の適用対象外とするようにしてもよい(この場合、差分圧縮を適用される条件が、FP圧縮を適用される条件に対して更に他の条件を加重したものになる)。例えば、FP圧縮しないデータサイズの上限値U1よりも、差分圧縮しないデータサイズの上限値U2を大きくする(FP圧縮すべきデータサイズの下限値L1よりも、差分圧縮すべきデータサイズの下限L2を大きくする)という方法や、FP圧縮の適用対象か否かはデータサイズで判断するが、差分圧縮の適用対象か否かについては、FP圧縮の適用対象のうちHTMLやXML以外のデータを適用対象外とする(HTMLやXMLのデータに対してのみ差分圧縮を行う)という方法等、種々のバリエーションが考えられる。なお、以下では、FP圧縮の適用対象のメッセージをすべて差分圧縮の適用対象とする場合を例にとって説明する。
【0061】
本実施形態では、FP圧縮対象且つ差分圧縮対象のメッセージは、データがFP圧縮されたメッセージ(ただし、圧縮識別子が0になるものと1になるものとがある)、データが差分圧縮されたメッセージ、またはデータが圧縮されていないメッセージのいずれかとして、サーバ側プロキシ30とクライアント側プロキシ40との間を転送されることになる。
【0062】
また、FP圧縮対象であり且つ差分圧縮対象でないメッセージがある場合、該メッセージは、データがFP圧縮されたメッセージ(圧縮識別子=0になる)、またはデータが圧縮されていないメッセージのいずれかとして、サーバ側プロキシ30とクライアント側プロキシ40との間を転送されることになる。
【0063】
また、FP圧縮対象でないメッセージがある場合には、該メッセージは、データが圧縮されていないメッセージとして、サーバ側プロキシ30とクライアント側プロキシ40との間を転送されることになる。
【0064】
ここで、差分圧縮の方法について説明する。
【0065】
フィンガープリント・キャッシュを利用した差分圧縮の方法には次に例示するものなど種々の方法がある。
・フィンガープリント・キャッシュに登録されているデータのうちの1つを参照データとする。プロキシ間では、参照データに対応するフィンガープリントの値と、転送データと参照データとの差分を示す情報とを転送する。
・上記の方法において、参照データとの差分の全部または一部についても、フィンガープリント・キャッシュに登録されているデータを利用する。あるいは、フィンガープリント・キャッシュに登録されているデータ(の全体または部分)を組み合わせることによって転送データの全部または一部を表現する。例えば、フィンガープリント・キャッシュに登録されているデータのうち任意数のものを参照データとする。プロキシ間では、参照データに対応するフィンガープリントの値と、参照データのうち転送データの復元に使用する部分を示す情報と、その部分をもとにした転送データの復元方法を示す情報とを転送する。
【0066】
以下では、差分圧縮データの表現方法の一例を示す。
【0067】
図6に、転送すべきデータを表現するための3種類の指示を示す。データの代わりに転送される差分圧縮データは、これら指示の並びで構成する。
【0068】
(a)は、フィンガープリント・キャッシュ内のデータを参照するときに、参照データに番号を付けて定義する指示である。1バイト目の8n(図6の例では、n=0)は指示識別子である。この指示識別子のうちnは、そのフィンガープリントで指定されるデータをn番の参照データとして扱うことを示す。2バイト目から始まる16バイトが当該参照データに対するフィンガープリントの値を示す。この例では、80〜8Fによってそれぞれ0番の参照データから、最大15番までの参照データが扱えるようになっている。扱える参照データの最大数は、実装によって多くも少なくもできる。
【0069】
(b)は、(a)で定義された参照データの中から部分データをコピーする指示を表す。1バイト目の9n(図6の例では、n=0)は指示識別子である。この指示識別子のうちnは、(a)の指示で定義されたn番の参照データを使用することを示す。2バイト目からの4バイトは、そのn番の参照データ中のオフセット位置を、6バイト目からの4バイトでデータの長さをそれぞれ指示する。そして、それらによって、n番の参照データの中の指定オフセット位置から指定長さのデータを、この指示の並びの位置(順番)に従って(転送データの構成部分として)コピーすべきことを示す。
【0070】
(c)は、データを直接指定するための指示である。1バイト目のA0は、指示識別子である。2バイト目からの4バイトは、データの長さを示す。6バイト目以降に、その長さで指定されたバイト数のデータが続く。そして、それらによって、6バイト目以降のデータを、この指示の並びの位置(順番)に従って(転送データの構成部分として)コピーすることを示す。
【0071】
このような指示の並びで構成された差分圧縮データは、フィンガープリント・キャッシュを参照しながら、指示された順にデータをコピーして接続していくだけで解凍することができる。
【0072】
次に、上記の方法に従った差分圧縮の例を示す。
【0073】
図7に示すようなデータがフィンガープリント5E83…B6としてフィンガープリント・キャッシュに入っていたとする。
【0074】
このとき、図8のようなデータが与えられると、図7のデータを参照データとして、図9のように差分圧縮することができる。
【0075】
すなわち、図8のデータは、図7のデータと比較すると、図7のデータの『TOKYO』が『OSAKA』に変わっているだけである。そこで、図9のように、まず、0バイト目でフィンガープリント“5E83…B6”のデータを0番参照データとして定義することを指示し、17バイト目で0番参照データの0バイト目から60バイトをコピーすることを指示し、次に26バイト目で『OSAKA』の5文字をコピーすることを指示し、最後に36バイト目で0番参照データの65バイト目から51バイトをコピーすることを指示している。
【0076】
この指示の通りに解凍すれば、図8のデータを再現することができる。
【0077】
この例では、参照データを1つだけ用いたが、複数個使うことも可能である。
【0078】
次に、上記の方法に従った差分圧縮の他の例を示す。
【0079】
図10に示すようなデータがフィンガープリント82F3…38としてフィンガープリント・キャッシュに入っており、図11に示すようなデータがフィンガープリントA20D…CBとしてフィンガープリント・キャッシュに入っていたとする。このとき、図12のようなデータが与えられると、図10のデータと図11のデータを参照データとして、図13のように差分圧縮することができる。
【0080】
図13では、まず、0バイト目でフィンガープリント“82F3…38”のデータを0番参照データとして定義することを指示し、17バイト目で0番参照データの0バイト目から53バイトをコピーすることを指示し、26バイト目でフィンガープリント“A20D…CB”のデータを1番参照データとして定義することを指示し、43バイト目で1番参照データの96バイト目から55バイトをコピーすることを指示している。
【0081】
この指示の通りに解凍すれば、図12のデータを再現することができる。
【0082】
なお、上記した方法では、参照データの使用すべき部分の指示と、使用すべきデータの直接指定を行う方法(方法1)であったが、その代わりに、参照データのうち使用しない部分(直接指示データで置き換える部分)の指示と、その使用しない部分に嵌め込むデータの直接指定を行う方法(方法2)も可能である。
【0083】
また、方法1と方法2を併用することも可能である。
【0084】
次に、図14〜図18を参照しながら、サーバ側プロキシ30とクライアント側プロキシ40との間でデータ転送する際の(FP圧縮の適用対象のメッセージについての)プロキシ間メッセージ・フォーマットについて説明する。
【0085】
サーバ側プロキシ30とクライアント側プロキシ40との間でデータ転送する場合、FP圧縮の適用対象のメッセージには、データがFP圧縮されてフィンガープリントに置き換えられたメッセージ(FP圧縮時のメッセージ)と、FP圧縮されないが、差分圧縮されたデータが搭載されているメッセージ(差分圧縮時のメッセージ)と、FP圧縮も差分圧縮もされていないデータが搭載されているメッセージ(非圧縮時のメッセージ)とがある。すべてのメッセージをFP圧縮の適用対象とするのではない構成の場合には、これら3つのメッセージに加えて、FP圧縮の適用対象外のメッセージがある。
【0086】
両プロキシのうち送信側プロキシにおいて、FP圧縮時のメッセージでは、データが削除され、フィンガープリントが付加され、差分圧縮時のメッセージでは、データが削除され、参照データのフィンガープリントなど当該データを復元するための情報が付加される。非圧縮時のメッセージおよび圧縮適用対象外のメッセージでは、データは削除されない。
【0087】
両プロキシのうち受信側プロキシにおいては、上記の3種もしくは4種のメッセージを識別できる必要がある。FP圧縮時のメッセージ受信時は、フィンガープリントをデータに戻し(ただし、圧縮識別子が0である場合には、データ本体が保持されているが、圧縮識別子が1である場合には、差分圧縮により生成されたデータが保持されているので、これをもとにデータを復元する)、差分圧縮時のメッセージ受信時は、データを復元する。また、差分圧縮時または非圧縮時のメッセージ受信時は、フィンガープリント・キャッシュの登録を行う。
【0088】
図14に、メッセージ・フォーマットの一例を示す。(a)は非圧縮時のメッセージであり、(b)は差分圧縮時のメッセージであり、(c)はFP圧縮時のメッセージである。
【0089】
(a)ではメッセージ・ボディーにデータが載せられ、(b)ではメッセージ・ボディーにデータの代わりに当該データを復元するための情報が載せられ、(c)ではメッセージ・ボディーにデータの代わりにフィンガープリント(FP)が載せられる。
【0090】
また、この例では、メッセージ・ヘッダに、メッセージの種類を識別可能とする識別情報が(圧縮側のプロキシにおいて)記述され、この識別情報に基づいて(解凍側のプロキシにおいて)FP圧縮の有無を識別する(例えば、01ならば非圧縮なし、10ならば差分圧縮、11ならばFP圧縮)。なお、識別情報は、プロキシ間で使用される特別のものであってもよいし、もともと通常のHTTPメッセージ・ヘッダに存在するフィールドを利用あるいは併用したものであってもよい。
【0091】
なお、FP圧縮の適用対象外のメッセージが存在し得る構成の場合には、圧縮側(送信側)のプロキシにおいて、図14(d)に示すように、FP圧縮の適用対象外のメッセージのメッセージ・ヘッダに上記の識別情報(例えば、00とする)を含めればよい。
【0092】
また、FP圧縮の適用対象外のメッセージが存在し得る構成の場合に、解凍側(受信側)プロキシにおいて、メッセージ・ヘッダに含まれる何らかの情報によって当該メッセージがFP圧縮の適用対象外のメッセージであることを判断できるとき、あるいはメッセージ・ボディーが空(null)のときに当該メッセージがFP圧縮の適用対象外のメッセージであることを判断するようにしたときなどには、FP圧縮の適用対象外のメッセージのメッセージ・ヘッダには識別情報を含めないようにすることも可能である。
【0093】
なお、非圧縮時や差分圧縮時には、図14(a),(b)の例では、メッセージに当該データに対するフィンガープリントを含ませなかったが、メッセージ・ヘッダにフィンガープリントを含ませるようにしてもよい(あるいは、メッセージ・ボディーに当該データに対するフィンガープリントを含ませるようにしてもよい)。図15(a)〜(c)は、非圧縮時や差分圧縮時には、メッセージ・ヘッダにフィンガープリントを含ませ、FP圧縮時には、メッセージ・ボディーにフィンガープリントを含ませる場合の一例である。このようにすれば、解凍側で当該データについてフィンガープリント・キャッシュの登録を行う際に、該フィンガープリントを利用することによって、あらためて当該データからフィンガープリントを求める手間が省ける。
【0094】
なお、以上のいずれの場合においても、図16に示すように、FP圧縮時のメッセージでは、メッセージ・ヘッダにフィンガープリント(FP)を含め、メッセージ・ボディーを空(null)にしてもよい。
【0095】
なお、以上の他にも、種々のメッセージ・フォーマットが可能である。
【0096】
例えば、図17では、(a)の非圧縮時のメッセージのヘッダに非圧縮フラグを記述し且つフィンガープリントは記述せず、(b)の差分圧縮時のメッセージのヘッダに差分圧縮フラグを記述し且つフィンガープリントは記述せず、(c)のFP圧縮時のメッセージのヘッダにフィンガープリントは記述し且つボディーは空(null)にする。
【0097】
この場合には、メッセージ・ボディーが空(null)であることあるいはメッセージのヘッダにフィンガープリントが記述されていることを検出するによって、当該メッセージがFP圧縮時のメッセージであることを識別することができる。また、非圧縮時のメッセージや差分圧縮時のメッセージは、ヘッダに非圧縮フラグや差分圧縮フラグが記述されていることを検出することによって、識別することができる。
【0098】
なお、FP圧縮の適用対象外のメッセージが存在し得る構成の場合には、圧縮側(送信側)のプロキシにおいて、図18の(a),(b)に示すように((a)はデータが空(null)でない場合、(b)はデータが空(null)である場合)、FP圧縮の適用対象外のメッセージのメッセージ・ヘッダに対象外フラグを含めればよい。
【0099】
また、FP圧縮の適用対象外のメッセージが存在し得る構成の場合に、解凍側(受信側)プロキシにおいて、メッセージ・ヘッダに含まれる何らかの情報によって当該メッセージがFP圧縮の適用対象外のメッセージであることを判断できるときなどには、図18の(c),(d)に示すように((c)はデータが空(null)でない場合、(d)はデータが空(null)である場合)FP圧縮の適用対象外のメッセージのメッセージ・ヘッダには対象外フラグを含めないようにすることも可能である。
【0100】
以下では、まずサーバ側プロキシ30からクライアント側プロキシ40へリプライメッセージを転送するときにそのリプライデータをFP圧縮・解凍する場合を中心に本実施形態について詳しく説明する。
【0101】
図19に本実施形態におけるサーバ側プロキシ30の構成例を示し、図20に本実施形態におけるクライアント側プロキシ40の構成例を示す。なお、図19や図20は、サーバ側プロキシ30からクライアント側プロキシ40へデータを転送する際の構成を中心に示してある。
【0102】
図19のサーバ側プロキシ30は、サーバセンター内LAN12または広域ネットワーク14から転送メッセージを受信するための処理を行う受信部31、転送メッセージに含まれるデータに対してFP圧縮、差分圧縮を施すための処理部32、サーバセンター内LAN12または広域ネットワーク14へ転送メッセージを送信するための処理を行う送信部33、フィンガープリントとそのもととなったデータまたは差分圧縮データとを対応付けて記憶するためのフィンガープリント・キャッシュ(FPキャッシュ)34を備えている。また、処理部32は、転送メッセージに含まれるデータを圧縮対象とすべきか否かを判定するためのフィンガープリント圧縮判定部(FP圧縮判定部)321、FPキャッシュ34に対する検索や登録などを行うためのフィンガープリント・キャッシュ管理部(FPキャッシュ管理部)322、転送メッセージに含まれるデータを対応するフィンガープリントで置き換えるなどの処理を行うためのフィンガープリント圧縮処理部(FP圧縮処理部)323、転送メッセージに含まれるデータを差分圧縮データで置き換えるなどの処理を行うための差分圧縮処理部324を含む。
【0103】
図20のクライアント側プロキシ40は、ユーザオフィス内LAN16または広域ネットワーク14から転送メッセージを受信するための処理を行う受信部41、転送メッセージに含まれるデータに対してFP解凍を施すための処理部42、ユーザオフィス内LAN16または広域ネットワーク14へ転送メッセージを送信するための処理を行う送信部43、フィンガープリントとそのもととなったデータまたは差分圧縮データとを対応付けて記憶するためのフィンガープリント・キャッシュ(FPキャッシュ)44を備えている。また、処理部42は、転送メッセージに含まれるデータを圧縮対象とすべきか否か並びに転送メッセージに対するFP圧縮および差分圧縮の有無を判定するためのフィンガープリント圧縮判定部(FP圧縮判定部)421、FPキャッシュ44に対する検索や登録などを行うためのフィンガープリント・キャッシュ管理部(FPキャッシュ管理部)422、FP圧縮された転送メッセージに含まれるフィンガープリントから元のデータを解凍するなどの処理を行うためのフィンガープリント解凍処理部(FP解凍処理部)423、差分圧縮された転送メッセージに含まれる差分圧縮データから元のデータを解凍するなどの処理を行うための差分解凍処理部424を含む。
【0104】
なお、圧縮側のFP圧縮判定部321と解凍側のFP圧縮判定部421は、前述したようにメッセージが予め定められた条件を満たすか否かを調べることによって、そのメッセージに含まれるデータをFP圧縮の適用対象とするか否かを判断する(全メッセージをFP圧縮の適用対象にする場合には、圧縮側のFP圧縮判定部321及び後に示す手順例の該当部分並びに解凍側のFP圧縮判定部421の該当判断の部分及び後に示す手順例の該当部分は不要である)。また、解凍側のFP圧縮判定部421は、FP圧縮の適用対象のメッセージについて、そのデータがFP圧縮されたものか否かを判定する。以下では、FP圧縮の適用対象となるメッセージを転送する場合(FP圧縮の適用対象とすると判断された場合、または全メッセージをFP圧縮の適用対象にする場合)を中心に説明する。
【0105】
図21及び図22に、サーバ側プロキシ30からクライアント側プロキシ40へリプライメッセージを転送する際のサーバ側プロキシ30の処理手順の一例を示す。なお、図21及び図22は、1つのリプライメッセージを受けたときの処理を記述しているが、実際はサーバ側プロキシ30が受け取ったリプライメッセージ全てに対して、図21及び図22に例示する処理を行う。
【0106】
サーバ側プロキシ30は、受信部31により、サーバ20からリプライメッセージを受信する(ステップS1)。
【0107】
FP圧縮判定部321は、該リプライメッセージのリプライデータがFP圧縮対象のものであるか否か調べ、判断する(S2)。リプライデータがFP圧縮対象外のものと判断されたならば(S2)、受信したリプライメッセージを送信部33からクライアント側プロキシ40へ転送する(S13)。
【0108】
ステップS2にて該リプライメッセージのリプライデータがFP圧縮対象のものであると判断されたならば、FPキャッシュ管理部322にて、該リプライデータのフィンガープリントの値を計算し(S3)、該フィンガープリントの値をキーとしてFPキャッシュ34を検索する(S4)。
【0109】
そして、該フィンガープリントの値とこれに対応するデータ(データ本体または差分圧縮データ)との組がFPキャッシュ34に登録されていたならば(S5)、FP圧縮処理部323にて、受信したリプライメッセージを、該フィンガープリントの値を用いてFP圧縮時のフォーマットにして、送信部33から、クライアント側プロキシ40へ送信する(S6)。
【0110】
一方、ステップS4の検索の結果、該フィンガープリントの値とこれに対応するデータとの組がFPキャッシュ34に登録されていなかったならば(S5)、差分圧縮処理部324にて、差分圧縮を行い(S7)、差分圧縮に成功したか否か判定する(S8)。
【0111】
差分圧縮に成功したか否かは、例えば、差分圧縮の対象とした元のデータのデータ量r0と、差分圧縮データのデータ量r1とを比較し、r0−r1>dを満たすならば、成功したと判断する。ここで、定数dは、予め定められた0以上の整数である。
【0112】
ステップS8で差分圧縮に成功したと判断された場合、次の2つの作業を行う(1-1と1-2のいずれを先に行ってもよいし、並行して行ってもよい)。
(1−1)差分圧縮処理部324にて、受信したリプライメッセージを、(必要に応じて該フィンガープリントの値を用いて)差分圧縮時のフォーマットにして、送信部33から、クライアント側プロキシ40へ送信する(S9)。
(1−2)FPキャッシュ管理部322にて、該フィンガープリントの値と、ステップS7において生成された差分圧縮データとを対応付けて(フィンガープリントの値をキーにして)、FPキャッシュ34に登録する(S10)。この際、登録するデータは差分圧縮データであるので、圧縮識別子を1にセットする。
【0113】
なお、上記(1−2)においては全ての差分圧縮データをFPキャッシュに登録するものとしたが、(i)差分圧縮データのサイズと該差分圧縮データの元になったデータのサイズがほとんど変わらない場合は差分圧縮データではなく該差分圧縮データの元になったデータを保存する、(ii)差分圧縮データのサイズが該差分圧縮データの元になったデータのサイズに比べて非常に小さい場合は差分圧縮データは保存せず、該差分圧縮データの元になったデータも保存せず差分圧縮データ作成時に参照データとして用いたデータのFPキャッシュにおける登録を維持する、などの方法も可能である。その他にも種々のバリエーションがある。また、この点は、後で説明する他の処理手順例において差分圧縮データをFPキャッシュに登録する場合についても同様である(なお、後の説明でも、全ての差分圧縮データをFPキャッシュに登録するものとした場合を例にとって説明している)。
【0114】
一方、ステップS8で差分圧縮に失敗したと判断された場合、次の2つの作業を行う(2-1と2-2のいずれを先に行ってもよいし、並行して行ってもよい)。
(2-1)差分圧縮処理部324(あるいはFP圧縮処理部323)にて、受信したリプライメッセージを、非圧縮時のフォーマットにして、送信部33から、クライアント側プロキシ40へ送信する(S11)。
(2-2)FPキャッシュ管理部322にて、該フィンガープリントの値と、該リプライメッセージとを対応付けて(フィンガープリントの値をキーにして)、FPキャッシュ34に登録する(S12)。この際、登録するデータは差分圧縮データではないので、圧縮識別子を0にセットする。
【0115】
次に、図23〜図25に、サーバ側プロキシ30からクライアント側プロキシ40へリプライメッセージを転送する際のクライアント側プロキシ40の処理手順の一例を示す。なお、図23〜図25は、1つのリクエストメッセージを受けたときの処理を記述しているが、実際はクライアント側プロキシ40が受け取ったリクエストメッセージ全てに対して、図23〜図25に例示する処理を行う。
【0116】
クライアント側プロキシ40は、受信部41により、サーバ側プロキシ30からリプライメッセージを受信する(ステップS21)。
【0117】
FP圧縮判定部421は、該リプライメッセージのリプライデータがFP圧縮対象のものであるか否か調べ、判断する(S22)。リプライデータがFP圧縮対象外のものと判断されたならば(S22)、受信したリプライメッセージを送信部43からクライアント50へ転送する(S38)。
【0118】
ステップS22にて該リプライメッセージのリプライデータがFP圧縮対象のものであると判断されたならば、FP圧縮判定部421は、さらに、リプライデータがFP圧縮されているか否か調べ、判断する(S23)。
【0119】
ステップS23にて該リプライメッセージのリプライデータがFP圧縮されているものと判断されたならば、FPキャッシュ管理部422にて、該リプライデータのフィンガープリントの値を求め(S24)、該フィンガープリントの値をキーとしてFPキャッシュ44を検索する(S25)。
【0120】
次に、ステップS25において検索の結果得られたデータが差分圧縮データかどうか、FPキャッシュ管理部422にて該データの圧縮識別子を用いて調べ、判断する(S26)。
【0121】
ステップS26にて該データが差分圧縮データであると判断された(本例では、圧縮識別子が1)ならば、差分解凍処理部424にて、(FPキャッシュ管理部422において参照データを検索・取得した後に)差分圧縮データを解凍して元のリプライデータを復元し(S27)、該復元したリプライデータをリプライメッセージに付加し、またプロキシ間で特別の情報を使用する場合には受信リプライメッセージから該情報を削除し、該リプライメッセージを送信部43からクライアント50へ送信する(S28)。
【0122】
ステップS26にて該データが差分圧縮データではないと判断された(本例では、圧縮識別子が0)ならば、FP解凍処理部423にて、受信リプライメッセージに対して、FPキャッシュ44から検索された該フィンガープリントの値に対応するデータを付加し、プロキシ間で特別の情報を使用する場合には該情報を削除した後に、これを送信部43からクライアント50へ送信する(S29)。
【0123】
一方、ステップS23にて該リプライメッセージのリプライデータがFP圧縮されていないものと判断されたならば、FP圧縮判定部421は、さらに、該リプライデータが差分圧縮されているか否か判定する(S30)。
【0124】
ステップS30で差分圧縮されていると判断された場合、次の2つの作業を行う(1-1と1-2のいずれを先に行ってもよいし、並行して行ってもよい)。
(1−1)差分解凍処理部424にて、(FPキャッシュ管理部422により参照データを検索・取得した後に)差分圧縮データを解凍して元のリプライデータを復元し(S31)、該復元したリプライデータをリプライメッセージに付加し、またプロキシ間で特別の情報を使用する場合には受信リプライメッセージから該情報を削除し、該リプライメッセージを送信部43からクライアント50へ送信する(S32)。
(1−2)FPキャッシュ管理部422にて、該リプライデータのフィンガープリントの値を求め(S33)、該フィンガープリントの値と、差分圧縮データとを対応付けて(フィンガープリントの値をキーにして)、FPキャッシュ44に登録する(S34)。このとき、FPキャッシュ44への登録においては、リプライメッセージは差分圧縮データであるので、圧縮識別子は1にセットする。
【0125】
一方、ステップS30で差分圧縮されてないと判断された場合、次の2つの作業を行う(2-1と2-2のいずれを先に行ってもよいし、並行して行ってもよい)。
(2-1)差分解凍処理部424(あるいはFP解凍処理部423)にて、プロキシ間で特別の情報を使用する場合には受信リプライメッセージから該情報を削除した後に、これを送信部43からクライアント50へ送信する(S35)。
(2-2)FPキャッシュ管理部422にて、該リプライデータのフィンガープリントの値を求め(S36)、該フィンガープリントの値と、該リプライメッセージとを対応付けて(フィンガープリントの値をキーにして)、FPキャッシュ44に登録する(S37)。このとき、FPキャッシュ44への登録においては、リプライメッセージは差分圧縮データではないので、圧縮識別子は0にセットする。
【0126】
なお、ステップS24/S33/S36では、メッセージにフィンガープリントが記述されている場合に、該メッセージからフィンガープリントを得る方法と、メッセージにフィンガープリントが記述されてない場合に、リプライデータをもとにハッシュ関数等によってフィンガープリントの値を計算する方法とがある。なお、メッセージにフィンガープリントが記述されている場合であっても、リプライデータをもとにフィンガープリントの値を計算する方法も可能である。また、ステップS24/S33/S36は、フィンガープリントを使用する以前の他のタイミングで行って構わない。また、ステップS22、S23、S26、S30の判断の全部または一部を同時に行ってもよい。
【0127】
次に、差分圧縮を行う手順について説明する。
【0128】
図26に、差分圧縮手順の一例を示す。これは、先に説明した3種類の指定を用いる場合の手順例である。
【0129】
ここでは、差分圧縮を行うために、フィンガープリント・キャッシュに入っているデータのうち、最近アクセスしたものを順に並べた履歴表を利用するものとする。この履歴表には、必ずしもフィンガープリント・キャッシュに入っている全てのデータのフィンガープリントが記録されている必要は無い。例えば、予め定められた個数が記録されていればよい(この場合、個数は、例えば差分圧縮の参照データとして使用するに有効な個数を想定して予め決定する)。
もちろん、履歴表への記録の基準として、最近のアクセスの順以外の1又は複数の基準を用いてもよいし、最近のアクセスの順の基準に加えて他に1又は複数の基準を併用してもよい。
【0130】
なお、履歴表は、フィンガープリント・キャッシュと一体化して構成する方法もある。
【0131】
(ステップS231)
まず、作業用のコピーバッファおよび指示バッファを空にする。
【0132】
このコピーバッファにコピーされた内容をもとに、図6(a)〜(c)の指示が作成され、これが指示バッファに書き出される。最終的に、指示バッファに書き出された指示の並びが、差分圧縮データになる。
【0133】
(ステップS232)
差分圧縮の対象とするデータを文字列として扱い、その文字列上を指すポインタを用意する。まず、ポインタが当該文字列のうちの最初の文字を指すように設定する。
【0134】
以下では、ステップS241でポインタが当該文字列のうちの最後の文字に辿りついたと判断されるまで、ループ処理を実行することになる。
【0135】
(ステップS233)
履歴表に記録されているフィンガープリントに対応するデータを、新しいものから順に取り出し、その中に、差分圧縮したいデータの中のポインタの指す場所から予め定められた長さ以上マッチするデータを参照データとして取り出す。
【0136】
なお、参照データと決定方法としては、種々の方法がある。例えば、履歴表に記録されているフィンガープリントに対応するデータを最新の順に調べていき、最初に予め定めた長さ以上マッチしたデータを参照データとして取り出す方法、履歴表に記録されているフィンガープリントに対応するデータの全てを調べ、その中でマッチした長さが最も長かったデータ(ただし、予め定めた長さ以上マッチしたことを条件とする)を参照データとして取り出す方法などがある。
【0137】
(ステップS234)
参照データが見つけられたらならば、ステップS237へ移る。参照データが見つけられなかったならば、ステップS235へ移る。
【0138】
(ステップS237)
ステップS234にて参照データが見つけられた場合に、コピーバッファが空でなければ、コピーバッファ中の文字列に対応する、図6の(c)の直接指定によるコピー指示を作成し、これを指示バッファに書き出す。コピーバッファは、空にする。
なお、コピーバッファが空ならば、何もしない。
【0139】
(ステップS238)
ステップS233にて見つかった参照データに対応する図6の(a)の参照データ定義が未だ指示バッファに書き出されていなければ、指示バッファに当該参照データ定義の指示を書き出す。
【0140】
(ステップS239)
参照データからマッチした文字列のコピー指示を、図6の(b)のコピー指示として指示バッファに書き出す。
【0141】
(ステップS240)
ポインタを参照データとマッチした文字列の長さ分だけ進める。
【0142】
(ステップS235)
一方、ステップS234にて参照データが見つけられた場合に、ポインタの指す文字をコピーバッファに入れる。
【0143】
(ステップS236)
ポインタを1文字分だけ進める。
【0144】
(ステップS241)
差分圧縮の対象とするデータの最後までポインタが来ていなければ(処理していないデータ部分が残っていれば)、ステップS233へ戻る。差分圧縮の対象とするデータの最後までポインタが来ていたら(処理していないデータ部分が残っていなければ)、処理ループを抜けて、ステップS242へ移る。
【0145】
(ステップS242)
コピーバッファが空でなければ、コピーバッファ中の文字列に対応する、図6の(c)の直接指定によるコピー指示を作成し、これを指示バッファに書き出す。コピーバッファは、空にする。
なお、コピーバッファが空ならば、何もしない。
【0146】
このときの指示バッファの内容が、差分圧縮データとなる。
【0147】
なお、前述のように、実際には、このようにして差分圧縮を行った後、差分圧縮を行った結果のデータサイズが、行う前のデータサイズよりも小さくなっている(あるいは一定基準(一定の圧縮量)を超えて小さくなっている)ことを確認する。差分圧縮によってデータサイズが小さくならない(あるいは一定基準(一定の圧縮量)を超えては小さくならない)場合には、差分圧縮しない方が良いので、データはそのまま転送する。
【0148】
ところで、上記の差分圧縮の処理において、ステップS233の予め定められた長さ以上マッチする文字列を持つ最新のデータを選び出す処理が、最も時間がかかる処理であると考えられる。この処理をより高速化するために、ハッシュ表を利用することができる。履歴表に入れるデータから、その中の全ての予め定められた長さの文字列を取り出し、そのハッシュ値(例えば、全ての文字のコードを足したものなど)を計算し、ハッシュ表に登録しておく。このハッシュ表は、同じハッシュ値を持つデータがあればより最新のデータによって上書きされるようにしておく。
このハッシュ表を使って、差分圧縮したいデータの現在のポインタの位置から予め定められた長さの文字列のハッシュ値を求め、そのハッシュ値を使ってハッシュ表を引いて求めたデータが、ステップS233で選ぶべきデータの第1の候補になる。ここで、異なる文字列でも同じハッシュ値を生成する場合があるので、本当に同じかどうかは文字列を実際に比較して確認し、同じでなければ、履歴表のデータを順に見るなど方法で次の候補を探す。
【0149】
ステップS233の処理を高速化する他の方法は、行を単位として比較処理を行う方法である。図26の手順では文字を単位として比較処理をしていたが、履歴表にあるすべてのデータに対して、そのデータ内の各行のハッシュ値の列を計算しておく。差分圧縮したいデータからも、まず、各行のハッシュ値の列を計算する。以降は、図26の手順と同様であるが、比較は文字単位ではなく、行のハッシュ値を単位として行う。この方法は、行を単位としているため、文字単位よりも比較回数を減らすことができる。ただし、ハッシュ値で比較するために、異なる行でも同じハッシュ値を持つ場合があるので、最終的にはハッシュ値が同じだと判断した後に、実際に行の中も比較して本当に同じかどうかを判断するのが望ましい。
もちろん、このように行を単位として比較する構成についても、上記のハッシュ技法を組み合わせることができる。この場合、連続する複数行を組み合わせて、予め定められた長さと同じか長くなる最少の行数を単位としてハッシュ表に登録すればよい。
【0150】
次に、図27に、差分圧縮手順の他の例を示す。これは、フィンガープリント・キャッシュに登録されているデータのうちの1つを参照データとし、プロキシ間では、参照データに対応するフィンガープリントの値と、転送データと参照データとの差分を示す情報とを転送する場合の手順例である。
【0151】
ここでも、前述したような履歴表を用いるものとする。
【0152】
まず、履歴表に記録されているフィンガープリントに対応するデータのうち、所定の基準を満たす一つを、参照データとして選択する(ステップS245)。
【0153】
所定の基準は、例えば、差分圧縮の対象とするデータのうち、参照データとするデータとの間でマッチしなかった部分のデータ量が、予め定められたデータ量以下であって、かつ、参照データをそのマッチしなかった部分によって複数の塊に分断したときにおけるその分断された塊の数が、予め定められた数以下である場合に、これを参照データとして選択可能とする。
【0154】
そして、参照データとして決定する方法としては、前述のように、例えば、履歴表に記録されているフィンガープリントに対応するデータを最新の順に調べていき、最初に予め定めた長さ以上マッチしたデータを参照データとして取り出す方法、履歴表に記録されているフィンガープリントに対応するデータの全てを調べ、その中でマッチしなかったデータ量や分断数が最も少なかったデータを参照データとして取り出す方法など、種々の方法がある。
【0155】
参照データが見つけられたらならば(S246)、参照データ定義の指示(例えば図6の(a))を、指示バッファに書き出す(S247)。
【0156】
参照データのうち、マッチしなかった部分(直接指定データで置換する部分)を示す指示(例えば図6の(b)と同じフォーマットの指示で1バイト目の指示識別子を変えたもの)を、指示バッファに書き出す(S248)。
【0157】
参照データのマッチしなかった部分に嵌め込むべきデータを示す直接指定する指示(例えば図6の(c))を、指示バッファに書き出す(S249)。
【0158】
なお、置換部分が複数個所ある場合には、その分だけステップS248とステップS249を実行する。
【0159】
このときの指示バッファの内容が、差分圧縮データとなる。
【0160】
一方、参照データが見つけられたらならば(S246)、差分圧縮はしないことになる。
【0161】
なお、上記の図26や図27の説明では、履歴表をフィンガープリント・キャッシュとは別に設けるものとしたが、履歴表は、フィンガープリント・キャッシュと一体化して構成する方法もある。
【0162】
また、上記の説明では、履歴表を用いるものとしたが、履歴表を用いない方法もある。例えば、フィンガープリント・キャッシュを所定の順番で(例えば、エントリ順にあるいはランダムに)予め定められた上限数だけ調べ、それらのうちで最良のものを使用するようにする方法や、フィンガープリント・キャッシュを所定の順番で(例えば、エントリ順にあるいはランダムに)調べ、予め定められた条件を満たす参照データが初めて得られた時点で、参照データを決定してしまう方法など、種々の方法がある。
【0163】
また、履歴表またはフィンガープリント・キャッシュに、フィンガープリントに加えて、そのフィンガープリントを登録したときに元となったリプライデータを含んでいたリプライメッセージについてのURLをも保持しておき、参照データを探索する際に、まず差分圧縮対象のリプライデータを含むリプライメッセージについてのURLと同じURLを持つデータが、履歴表またはフィンガープリント・キャッシュに登録されていないかどうか調べ、登録されているならば当該URLと同じURLを持つデータを他のものよりも優先して、参照データとして使用できないかどうか調べるようにしてもよい。
【0164】
もちろん、図26や図27の他にも、種々の差分圧縮の手順が可能である。
【0165】
なお、クライアント側プロキシ40からサーバ側プロキシ30へリクエストメッセージを転送する際にはフィンガープリント・キャッシュを用いないものとする場合には、サーバ側プロキシ30は、図28に例示するように、クライアント側プロキシ40からリクエストメッセージを受信し(ステップS60)、これをサーバ20へ送信する(ステップS61)、という手順で構わない。同様に、クライアント側プロキシ40は、図29に例示するように、クライアント50からリクエストメッセージを受信し(ステップS62)、これをサーバ側プロキシ30へ送信する(ステップS63)、という手順で構わない。
【0166】
以下では、図30〜図32を参照しながら、フィンガープリント・キャッシュを利用したデータ転送についてより具体的に説明する。
【0167】
まず、図30を参照しながら、サーバ側プロキシ30からクライアント側プロキシ40へ、フィンガープリント・キャッシュ登録されていないデータであって且つ差分圧縮も成功しなかったデータを転送するとともに、該データについてフィンガープリント・キャッシュ登録する場合の動作について説明する。
【0168】
(1)クライアント50上のブラウザ等は、例えば“/A.cgi”というURLでサーバ20に、POSTメソッドのリクエストメッセージを出したとする。サーバ20へのリクエストメッセージは、まず、クライアント側プロキシ40に送られるように、ブラウザ等を設定しておく。
【0169】
(2)クライアント50からリクエストメッセージを受け取ったクライアント側プロキシ40は、そのリクエストメッセージをサーバ側プロキシ30に転送する。
【0170】
(3)リクエストメッセージを受け取ったサーバ側プロキシ30は、そのリクエストメッセージをサーバ20へ転送する。
【0171】
(4)サーバ20は、該リクエストメッセージに対する処理を行った後、サーバ側プロキシ30に、そのリプライメッセージを送り返す。
【0172】
(5)リプライメッセージを受け取ったサーバ側プロキシ30は、まず、受信リプライメッセージの持つリプライデータのフィンガープリントを計算し、そのフィンガープリント名を持ったデータがFPキャッシュ34に入っているかどうかを調べる。ここでは、入っておらず、初めてのデータ(一旦フィンガープリント・キャッシュ登録されたものがその後に削除あるいは無効化されることがある構成の場合に、一旦フィンガープリント・キャッシュ登録されたが削除あるいは無効化され、その後において初めてである場合を含む)であるので、そのデータをフィンガープリントを名前としてFPキャッシュ34に入れる(登録する)。なお、ここでは、リプライデータを差分圧縮してデータ量を減らすことができなかったものとする。このとき、FPキャッシュ34への登録においては、該データが差分圧縮データではないので、圧縮識別子は0にセットする。
【0173】
(6)サーバ側プロキシ30は、データを載せたリプライメッセージをクライアント側プロキシ40に転送する。なお、リプライデータから計算したフィンガープリントの値を、リプライヘッダ等に入れて送ると、クライアント側プロキシ40で再度フィンガープリントを計算する手間を省くことが出来る。
【0174】
(7)リプライメッセージを受け取ったクライアント側プロキシ40は、初めてのデータであるので、リプライデータをFPキャッシュ44に登録する。このとき、FPキャッシュ44への登録においては、該リプライデータが差分圧縮データではないので、圧縮識別子は0にセットする。なお、前述したように、リプライデータからフィンガープリントを計算するか、あるいはサーバ側プロキシがリプライヘッダ等に入れたフィンガープリントを取り出し、これを名前として入れる。
【0175】
(8)クライアント側プロキシ40は、(リプライヘッダ等にフィンガープリントの値などのサーバ側プロキシ30とクライアント側プロキシ40との間だけで使用される情報が存在する構成の場合には、これを削除した後に、)リプライメッセージを、クライアント50(上で動作するブラウザ等)へ送り返す。
【0176】
なお、サーバ側プロキシ30において、上記の(5)のフィンガープリント・キャッシュ登録は、(6)の動作の後に行っても構わない。また、クライアント側プロキシ40において、(7)のフィンガープリント・キャッシュ登録は、(8)の動作の後に行っても構わない。
【0177】
次に、図31を参照しながら、サーバ側プロキシ30からクライアント側プロキシ40へ、フィンガープリント・キャッシュ登録されていないデータであって且つ差分圧縮が成功したデータを転送するとともに、該データについてフィンガープリント・キャッシュ登録する場合の動作について説明する。
【0178】
(1)〜(4)は、図30を参照して説明した動作における(1)〜(4)と同様である。
【0179】
(5)リプライメッセージを受け取ったサーバ側プロキシ30は、まず、受信リプライメッセージの持つリプライデータのフィンガープリントを計算し、そのフィンガープリント名を持ったデータがFPキャッシュ34に入っているかどうかを調べる。ここでは、入っておらず、初めてのデータであることを判断する。そして、圧縮対象になるデータをFP圧縮できなかった場合には、差分圧縮処理を行い、リプライデータを差分圧縮してデータ量を減らすことができるならば、差分圧縮する。ここでは、フィンガープリントが“71F0…73E6”のデータを参照データとした場合に、リプライデータを差分圧縮してデータ量を減らすことができたものとする。リプライデータを差分圧縮データに置き換え、リプライヘッダ等に差分圧縮したことを示す情報を入れる。
【0180】
(6)サーバ側プロキシ30は、(5)において生成された差分圧縮データを同じく(5)で計算したフィンガープリントを名前としてFPキャッシュ34へ入れる(登録する)。このとき、FPキャッシュ34への登録においては、該データが差分圧縮データであるので、圧縮識別子を1にセットする。
【0181】
(7)サーバ側プロキシ30は、リプライメッセージをクライアント側プロキシ40に転送する。
【0182】
(8)クライアント側プロキシ40は、リプライヘッダ等を見て、リプライデータが差分圧縮されていることを知り、圧縮の解凍を行う。このとき、まず、圧縮されたデータ内に指定されている参照データのフィンガープリント“71F0…73E6”を取り出し、次に、該フィンガープリントに対応するデータをFPキャッシュ44から取り出して使用する。そして解凍したデータをリプライデータに入れ、リプライヘッダのコンテンツサイズなど必要なヘッダを書き換える。
【0183】
(9)また、リプライメッセージを受け取ったクライアント側プロキシ40は、初めてのデータであるので、サーバ側プロキシ30から受信した差分圧縮データをFPキャッシュ44に登録する。このとき、FPキャッシュ44への登録においては、登録するデータが差分圧縮データであるので、圧縮識別子を1にセットする。また、リプライヘッダ等にフィンガープリントの値などのサーバ側プロキシ30とクライアント側プロキシ40との間だけで使用される情報が存在する構成の場合には、これを削除する。なお、前述したように、リプライデータ(差分圧縮データから解凍して得られたデータ)からフィンガープリントを計算するか、あるいはサーバ側プロキシがリプライヘッダ等に入れたフィンガープリントを取り出し、これを名前として入れる。
【0184】
(10)クライアント側プロキシ40は、リプライメッセージを、クライアント50(上で動作するブラウザ等)へ送り返す。
【0185】
なお、上記の(5)では、圧縮対象で未登録のデータは、すべてフィンガープリント・キャッシュに登録するものとし、また、上記の(6)で参照データに用いたデータは、すべてフィンガープリント・キャッシュの登録を維持するものとしたが、参照データに唯一のデータを使用した場合であって、かつ、差分圧縮対象となったデータと、その差分圧縮に用いた参照データとが、ほとんど同じ内容(例えば、両者でマッチしないデータ量が基準以下)である場合には、(i)圧縮対象で未登録のデータはフィンガープリント・キャッシュに登録せず、参照データはフィンガープリント・キャッシュの登録を維持する、あるいは(ii)圧縮対象で未登録のデータをフィンガープリント・キャッシュに登録し、参照データはフィンガープリント・キャッシュから削除する、などの方法も可能である。また、参照データに唯一のデータを使用した場合であって、かつ、差分圧縮対象となったデータと、その差分圧縮に用いた参照データとが、ほとんど同じ内容であって、かつ、URLが同一の場合には、データが更新されたものとして、圧縮対象で未登録のデータをフィンガープリント・キャッシュに登録し、参照データはフィンガープリント・キャッシュから削除する、などの方法も可能である。その他にも種々のバリエーションがある。
【0186】
次に、図32を参照しながら、図30または図31の動作が行われてキャッシュ登録されているデータを、サーバ側プロキシ30からクライアント側プロキシ40へ転送する場合の動作について説明する。
【0187】
(1)〜(4)は、図30を参照して説明した動作における(1)〜(4)と同様である。
【0188】
(5)サーバ50からリプライメッセージを受け取ったサーバ側プロキシ40は、まず、受信リプライメッセージの持つリプライデータのフィンガープリントを計算し、そのフィンガープリント名を持ったデータがFPキャッシュ34に入っているかどうかを調べる。ここではフィンガープリント・キャッシュ登録されているので、(例えばフィンガープリントの値をリプライヘッダ等に入れ且つリプライボディを空にするなどして)リプライボディのデータをフィンガープリントで置き換える。
【0189】
(6)サーバ側プロキシ30は、リプライボディをフィンガープリントで置き換えたリプライメッセージをクライアント側プロキシ40に転送する。
【0190】
(7)リプライメッセージを受け取ったクライアント側プロキシ40は、リプライデータがフィンガープリントで置き換えられていることを検出し、(前述したように例えばリプライヘッダなどにて)指定されたフィンガープリントを使ってFPキャッシュ44から対応するデータを取り出す。
ここで、該データの圧縮識別子が0である場合には、該データは差分圧縮データではないので、これをリプライボディに入れる。一方、該データの圧縮識別子は1である場合には、該データは差分圧縮データであるので、これを解凍してもとのリプライデータを復元し、これをリプライボディに入れる。なお、図32は、前者の場合を例示している。
また、リプライヘッダ等にフィンガープリントの値などのサーバ側プロキシ30とクライアント側プロキシ40との間だけで使用される情報が存在する構成の場合には、これを削除する。
【0191】
(8)そして、クライアント側プロキシ30は、リプライメッセージを、クライアント50(上で動作するブラウザ等)へ送り返す。
【0192】
ところで、サーバ側プロキシ30およびクライアント側プロキシ40のフィンガープリント・キャッシュは、その容量に上限があるため、所定のアルゴリズムに従いガベージコレクションを行って、例えば古いデータや使いそうに無いデータを消して行くのが好ましい。
【0193】
ただし、このようにすると、サーバ側プロキシ30のFPキャッシュ34は持っていてもクライアント側プロキシ40のFPキャッシュ44では既に消されているようなデータが発生し得ることになるので、図32を参照して説明した動作における(7)で、クライアント側プロキシ40において、フィンガープリントをもとにしてFPキャッシュ44からリプライデータを置き換えるべきデータを得ようとしたが、FPキャッシュ44に該当するフィンガープリントとデータの組が存在しない場合がある。このような場合には、例えば、クライアント側プロキシ40は、サーバ側プロキシ30に対して、指定したフィンガープリントのデータを送るように依頼し、依頼されたサーバ側プロキシ30は、指定されたフィンガープリントのデータをFPキャッシュ34から取り出して送り返すような仕組みを設ければよい。
【0194】
なお、逆に、サーバ側プロキシ30のFPキャッシュ34では既に消されているがクライアント側プロキシ40のFPキャッシュ44はまだ持っているようなデータが存在する場合には、図30を参照して説明した動作における(7)や図31を参照して説明した動作における(9)で、クライアント側プロキシ40において、フィンガープリント/データをFPキャッシュ44に登録する際に、その時点で登録されていたフィンガープリント/リプライデータに対して上書きしてもよい。
【0195】
図32を参照して説明した動作における(5)で、サーバ側プロキシ30において、リプライデータのフィンガープリントを求め、該フィンガープリントがFPキャッシュ34に入っていれば、当該プライデータと同じデータが該フィンガープリントと組になってFPキャッシュ34に入っているものとみなして処理している。実用上、異なるデータから同じフィンガープリントが生成されないことを前提にすれば、この方法で十分であるが、非常に小さな確率で異なるデータのフィンガープリントが偶々同じ値になってしまった場合に生じるエラーを取り除くようにする方法もある。この場合には、リプライデータから求めたフィンガープリントがFPキャッシュ34に入っているときに、該フィンガープリントと組になってFPキャッシュ34に入っているデータと、当該プライデータとを比較して、同じか否かを判断するようにすればよい。このとき、もしフィンガープリントは同じであるが内容が異なるデータが登録されていると判断された場合の処理は、以下に例示するような方法が考えられる。
・そのフィンガープリントは以降使用しないものとする(そのフィンガープリントを与えるデータは以後キャッシュされないことになる)
・先に登録されているフィンガープリント/データを優先する(登録中のフィンガープリントと同じ値のフィンガープリントを与える他のデータは、その登録中はキャッシュされないことになる)
・現在登録対象となっているフィンガープリント/データを優先する(登録中のフィンガープリント/データは、同じ値のフィンガープリントを与える他のデータによって次々と更新されていくことになる)
ところで、これまで説明した例では、サーバ側プロキシ30からクライアント側プロキシ40へリプライデータを転送する際にフィンガープリント・キャッシュを利用するものとし、あるデータとこれに対するフィンガープリントとの組をフィンガープリント・キャッシュに登録するタイミングは、そのデータが初めてサーバ側プロキシ30からクライアント側プロキシ40へ転送されるときとしている。しかし、例えばWebベースのASPのような利用法では、データはまずユーザオフィス等で作成されてサーバに登録され、それをブラウザ等からアクセスするような場合が多いため、このような場合には、当該データを(データ本体または差分圧縮データとして)サーバに登録する時点でクライアント側プロキシおよびサーバ側プロキシのフィンガープリント・キャッシュに登録しておくと、それ以降のアクセスを高速化することができる。そこで、サーバが送信するリプライデータが、もともとはクライアントからサーバへ転送されたデータ(ただし、この転送のときはリクエストデータ)である場合には、登録タイミングを、該リプライデータとなる元のリクエストデータが初めてクライアント側プロキシ40からサーバ側プロキシ30へ転送されるときとするようにしてもよい(この場合、当該データがリプライデータとなって初めてサーバ側プロキシ30からクライアント側プロキシ40へ転送される際には、すでにフィンガープリント・キャッシュへの登録が完了していることになるので、リプライデータとしては初めての転送であっても、フィンガープリント・キャッシュを利用して、転送データ量を削減することができる)。
【0196】
さて、これまで説明した例では、サーバ側プロキシ30からクライアント側プロキシ40へリプライデータを転送するときに、該リプライデータがフィンガープリント・キャッシュに登録されているデータと同じものである場合には、該リプライデータに代えて、対応するフィンガープリントを転送し、または差分圧縮データを転送することで、ネットワークのトラフィックを軽減しているが、本発明は、クライアント側プロキシ40からサーバ側プロキシ30へリクエストデータを転送する場合についてさらに適用することが可能である。
【0197】
なお、FP圧縮を両方に適用する場合に、差分圧縮をいずれか一方についてのみ適用することも可能である。
【0198】
また、FP圧縮および差分圧縮を、クライアント側プロキシ40からサーバ側プロキシ30へリクエストデータを転送する場合についてのみ適用することも可能である。
【0199】
FP圧縮および差分圧縮をクライアント側プロキシ40からサーバ側プロキシ30へのリクエストデータ転送に適用する場合、すでに説明したリプライデータに対するサーバ側プロキシ30とクライアント側プロキシ40との役割を逆にすればよいので、FP圧縮および差分圧縮を両データ転送に適用する場合には、サーバ側プロキシ30は図19の構成に加えて、更に処理部32にフィンガープリント解凍処理部および差分解凍処理部を備え、クライアント側プロキシ40は図20の構成に加えて、更に処理部42にフィンガープリント圧縮処理部および差分圧縮処理部を備えればよい。
【0200】
なお、いずれのプロキシにおいても、フィンガープリント圧縮処理部とフィンガープリント解凍処理部とを併せて、フィンガープリント(FP)圧縮・解凍処理部としてもよい。同様に、差分圧縮処理部と差分解凍処理部とを併せて、差分圧縮・解凍処理部としてもよい。
【0201】
また、サーバ側プロキシ30やクライアント側プロキシ40は、リプライデータ転送に対するフィンガープリント・キャッシュとは独立にリクエストデータ転送に対するフィンガープリント・キャッシュを設けてもよいが、リプライデータ転送とクエストデータ転送とで同じフィンガープリント・キャッシュを共用してもよい。なお、差分圧縮の際に前述した履歴表を使用する構成の場合には、履歴表についても同様に独立して設けてもよいし、共用してもよい。
【0202】
図33に、リプライデータ転送とクエストデータ転送とで同じフィンガープリント・キャッシュを共用する場合のプロキシ(サーバ側プロキシ、クライアント側プロキシ)の構成例を示す。
【0203】
また、図34及び図35に、クライアント側プロキシ40からサーバ側プロキシ30へリクエストメッセージを転送する際のクライアント側プロキシ40の処理手順の一例を示す。図34及び図35は、図21及び図22において、転送するメッセージがリプライメッセージからリクエストメッセージになり、メッセージ送信元がサーバからクライアントになり、メッセージ送信先がクライアントからサーバになり、サーバ側プロキシ30の動作とクライアント側プロキシ40の動作とを入れ替えたものに相当する。
【0204】
また、図36〜図38に、クライアント側プロキシ40からサーバ側プロキシ30へリクエストメッセージを転送する際のサーバ側プロキシ30の処理手順の一例を示す。
【0205】
図36〜図38は、図23〜図25において、転送するメッセージがリプライメッセージからリクエストメッセージになり、メッセージ送信元がサーバからクライアントになり、メッセージ送信先がクライアントからサーバになり、サーバ側プロキシ30の動作とクライアント側プロキシ40の動作とを入れ替えたものに相当する。
【0206】
このようにリクエストデータに対してもフィンガープリントまたは差分圧縮データで置き換えられるように実施すると、例えば、同じファイルを何度もサーバにアップロードするときには、2回目以降フィンガープリントを送るだけで済むので、ネットワークのトラフィックを軽減させることができる。
【0207】
なお、本実施形態では、クライアント側プロセスからサーバ側プロキシへ転送されるリクエストメッセージや、サーバ側プロキシからクライアント側プロセスへ転送されるリプライメッセージを対象とする場合について示してきたが、あるプロキシに、リクエストメッセージを送信する装置とリプライメッセージを送信する装置との両方、あるいはリクエストメッセージおよびリプライメッセージの両方を送信する装置が接続されている場合には、もちろん、クライアント側プロセスからサーバ側プロキシへ転送されるリクエストメッセージおよびリプライメッセージならびにサーバ側プロキシからクライアント側プロセスへ転送されるリクエストメッセージおよびリプライメッセージを対象とすることや、クライアント側プロセスからサーバ側プロキシへ転送されるリクエストメッセージおよびサーバ側プロキシからクライアント側プロセスへ転送されるリクエストメッセージのみ対象とすることなども可能である。
【0208】
ところで、これまでは1つのサーバ側プロキシと1つのクライアント側プロキシとの間の1対1の通信に着目して説明してきたが、本発明の適用範囲はもちろんサーバ側プロキシとクライアント側プロキシとが1対1で通信するシステムには限定されるものではなく、サーバ側プロキシとクライアント側プロキシとが1対多で通信するシステム、サーバ側プロキシとクライアント側プロキシとが多対1で通信するシステム、あるいはサーバ側プロキシとクライアント側プロキシとが多対多で通信するシステムにも適用可能である。例えば、図39のように、複数のユーザオフィスに設置したクライアント側プロキシや、モバイルユーザが利用する個人用プロキシなどがサーバ側プロキシを共有して使用するように実施することも可能である。
【0209】
また、これまでは、1つのメッセージに含まれるデータ全体をFP圧縮する対象(フィンガープリント・キャッシュに登録する対象)にしていたが、例えば、1つのメッセージに含まれるデータが所定の単位のデータの集合で構成される場合には、1つのメッセージに含まれる一部の単位データのみFP圧縮する対象(フィンガープリント・キャッシュに登録する対象)にする構成も可能である。
【0210】
ところで、本実施形態のサーバ側プロキシあるいはクライアント側プロキシ(一方でも両方でもよい)に、プロキシの共有キャッシュ機構でキャッシュ可能とされているリプライデータについて、クライアントが出したリクエストメッセージにおいて指定されていたURLと、該リクエストメッセージに対応するリプライメッセージに含まれていたリプライデータと、該リプライデータに対応するフィンガープリントと、該リプライメッセージのリプライ・ヘッダに入れられて来たMIMEタイプなどのリクエスト・ヘッダを構成するのに必要な情報や有効期間の判定に使うためのタイムスタンプなどの情報を対応付けてキャッシュしておき(フィンガープリント・キャッシュにすべて保持してもよいし、リプライデータを除く情報(URLとフィンガープリントと他の情報)を保持する対応テーブルを別途設けてもよい)、これとフィンガープリント・キャッシュとを併用することで、プロキシサーバの共有キャッシュの動作をも行うようにすることができる。例えば、クライアント側プロキシに該キャッシュ機能を設けた場合、クライアントが送信したリクエストメッセージにて指定されているURLに対するリプライデータがキャッシュされており且つ該データが有効である場合には、該クライアント側プロキシが、URLに対応するデータをフィンガープリント・キャッシュから取得して、リプライメッセージを作成して、これをクライアントに応答することができる。
【0211】
この機能は、個々のサーバ側プロキシ30毎に、また個々のクライアント側プロキシ40毎に、設けるか否かを定めることができる。
【0212】
まず、上記機能を設けたクライアント側プロキシ40について説明する。
【0213】
図40に、この場合のクライアント側プロキシ40の構成例を示す。このクライアント側プロキシ40は、図20の構成・機能に加えて、更に過去にアクセスしたURLと、そのリプライデータのフィンガープリントとの対応を保持するURL・フィンガープリント・テーブル(URL・FPテーブル)45と、URLキャッシュ処理部427とを備えている。
【0214】
なお、URL・FPテーブル45には、URLおよびフィンガープリント以外に、そのURLでアクセスしたときにリプライヘッダに入れられて来たMIMEタイプや、有効期間の判定に使うためのタイムスタンプなどの情報も併せて記録する。また、URL・FPテーブル45には、従来の共有キャッシュがキャッシュできる場合にのみ必要な情報を記録する。
【0215】
図41に、サーバ側プロキシ30からクライアント側プロキシ40へリプライメッセージを転送する際のクライアント側プロキシ40の処理手順例を示す。
【0216】
なお、この場合の処理手順は、図23〜図25の手順の端子4および端子6およびステップS38の後に追加される以外は、図23〜図25の手順と同じであり、図41では、図23〜図25の手順の端子4および端子6およびステップS38より後の処理手順の部分を示してある。ここでは、図23〜図25で説明した手順に追加する部分を中心に説明する。
【0217】
クライアント側プロキシ40は、送信部43により、クライアント50にリプライメッセージを送信(図23〜図25のステップS28、S29、S32、S35またはS38)した後、URLキャッシュ処理部427にて、該リプライメッセージがキャッシュ対象のものであるか否か調べ、判断する(S39)。キャッシュ対象であると判断されたならば、URLキャッシュ処理部427にて、URLとフィンガープリントとリプライヘッダを構成するのに必要な情報等を対応付けて(URLをキーにして)をURL・FPテーブル45に登録する(S40)。キャッシュ対象でないと判断されたならば、何もしない。
【0218】
なお、ステップS39の判断およびステップS40のURL・FPテーブルへの登録は、ステップS23とステップS28あるいはS29、ステップS23とステップS32あるいはステップS35の間にて行うようにしても構わない。
【0219】
なお、登録時の受信リプライメッセージがキャッシュ対象のものであるか否かの判断方法は、従来の登録時の手法と同様で構わない(例えば、GETメソッドのリプライデータであって、かつ、そのヘッダにキャッシュ不可を示す情報が記述されていないものをキャッシュ対象とする等)。
【0220】
次に、図42および図43に、クライアント250から受信したリクエストメッセージをクライアント側プロキシ40からサーバ側プロキシ30へ転送する際のクライアント側プロキシ40におけるプロキシサーバの共有キャッシュの動作に関する処理手順の一例を示す。
【0221】
クライアント側プロキシ40は、受信部41により、クライアント50からリクエストメッセージを受信する(ステップS141)。
【0222】
URLキャッシュ処理部427は、リクエストメッセージに対するリプライメッセージがキャッシュ対象のものであるか否か調べ、判断する(S142)。なお、応答時のキャッシュ対象か否かの判断方法は、従来の応答時の手法と同様で構わない(例えば、受信リクエストメッセージがGETメソッドのものであるか否か)。
【0223】
リクエストデータがキャッシュ対象外のものと判断されたならば(S142)、受信したリクエストメッセージを送信部43からサーバ側プロキシ30へ転送する(S151)。
【0224】
ステップS142にて該リクエストメッセージに対するリプライメッセージがキャッシュ対象のものであると判断されたならば、URLキャッシュ処理部427は、さらに、該リクエストメッセージに指定されているURLを取り出し(S143)、そのURLをキーとしてURL・FPテーブル45を検索する(S144)。
【0225】
そのURLに対応するリプライデータのフィンガープリントがキャッシュされていなければ(S145)、受信したリクエストメッセージを送信部43からサーバ側プロキシ30へ転送する(S151)。このとき、現在保持しているデータのタイムスタンプをリクエストメッセージのIf-Modified-Sinceヘッダに記入してサーバ側プロキシ30へ転送し、サーバ側プロキシ30から現在保持しているデータが有効であるとのリプライメッセージを受け取ると、ステップS147へ行くように実施することもできる。
【0226】
また、そのURLに対応するリプライデータのフィンガープリントが登録されていても(S145)、併せて保持されている有効期間の判定のための情報に基づいてそのデータが無効になっていると判断されれば(S146)、受信したリクエストメッセージを送信部43からサーバ側プロキシ30へ転送する(S151)。
【0227】
一方、そのURLに対応するリプライデータのフィンガープリントが登録されており(S145)、かつ、併せて保持されている有効期間の判定のための情報に基づいてそのデータが有効であると判断されれば(S146)、URLキャッシュ処理部427は、URL・FPテーブル45からリプライデータを構成するのに必要な情報を得るとともに、当該URLに対応するリプライデータのフィンガープリントをキーとしてFPキャッシュ44を検索する(S147)。
【0228】
次に、FPキャッシュ管理部422は、ステップS147にて取得したデータが差分圧縮データであるかどうかを、圧縮識別子が0または1のいずれであるかをもって判断する(S148)。圧縮識別子が0であれば、差分圧縮データではないと判断され、1であれば、差分圧縮データであると判断される。
【0229】
該データが差分圧縮データであることが判明した場合(S148)、差分解凍処理部424は該データを解凍し、リプライデータを生成する(S149)。そして、該リプライデータからリプライメッセージを生成し、送信部43からクライアントへ転送する(S150)。
【0230】
一方、該データが差分圧縮データでないことが判明した場合(S148)、FP圧縮解凍部423は、該データからリプライデータを生成し、送信部43からクライアントへ転送する(S150)。
【0231】
以下では、図44(応答時)を参照しながら、共有キャッシュの動作についてより具体的に説明する。
【0232】
(1)クライアント50上のブラウザ等は、例えば“/C.html”というURLでサーバ20に、GETメソッドのリクエストメッセージを出したとする。
【0233】
(2)新しいURLでリクエストが来たときに、そのURLがURL・FPテーブル45に載っていれば、従来の共有キャッシュと同様に有効期間の判定を行い、有効と判断できれば、そのURLに対応するフィンガープリントをURL・FPテーブル45を引いて求め、それを名前とするデータをFPキャッシュ44から取り出す。そして、圧縮識別子により、該データが差分圧縮データかどうか調べる。図44の例では、圧縮識別子が1であるので差分圧縮データである。すると、差分圧縮を解凍し(図44では、差分圧縮データ内に、フィンガープリントが“71F0…73E6”であるデータへの参照情報があるため、既にキャッシュされている該データが参照され、解凍される)、これをリプライデータとする。さらに、URL・FPテーブル45からMIMEタイプ等のリプライヘッダを構成するのに必要な情報を取り出してリプライヘッダを作成する。
【0234】
(3)作成したリプライメッセージを、クライアント50(上で動作するブラウザ等)へ送り返す。
【0235】
なお、キャッシュの内容が指定した時間以降に更新されている場合にのみデータを送ることを依頼するIf-Modified-Sinceヘッダを持つリクエストメッセージの場合も、まずURL・FPテーブルを参照し更新されていないことが判断できれば、そこでリプライメッセージを作成して返し、そうでなければサーバまで再びIf-Modified-Sinceの情報を書き直して聞きに行くように実施することもできる。
【0236】
次に、キャッシュ機能を設けたサーバ側プロキシ30について説明する。
【0237】
上記ではクライアント側プロキシ40のキャッシュ機能について説明したが、サーバ側プロキシ30も同様に実施可能である。
【0238】
この場合、クライアント側プロキシ40に対するメッセージ転送元のクライアント50とメッセージ転送先のサーバ側プロキシ30が、サーバ側プロキシ30に対してはそれぞれクライアント側プロキシ40(転送元)とサーバ20(転送先)になり、キャッシュに関係する構成・手順は同様である。
【0239】
図45に、この場合のサーバ側プロキシ30の構成例を示す。このサーバ側プロキシ30は、図19の構成・機能に加えて、更に過去にアクセスしたURLと、そのリプライデータのフィンガープリントとの対応を保持するURL・フィンガープリント・テーブル(URL・FPテーブル)35と、URLキャッシュ処理部327とを備えている。
【0240】
図46に、サーバ側プロキシ30からクライアント側プロキシ40へリプライメッセージを転送する際のサーバ側プロキシ30の処理手順の一例を示す。
【0241】
なお、この場合の処理手順は、図21及び図22の手順のステップS6および端子2およびS13の後に追加される以外は、図21及び図22の手順と同じであり、図46では、図21及び図22の手順のステップS6および端子2およびS13より後の処理手順の部分を示してある。ここでは、図21及び図22で説明した手順と相違する部分を中心に説明する。
【0242】
サーバ側プロキシ30は、送信部33により、クライアント側プロキシ40にリプライメッセージを送信(図21及び図22のステップS6、S9、S11、またはS13)した後、URLキャッシュ処理部327にて、該リプライメッセージのリプライデータがキャッシュ対象のものであるか否か調べ、判断する(S14)。キャッシュ対象であると判断されたならば、URLキャッシュ処理部327にて、URLとフィンガープリントとリプライヘッダを構成するのに必要な情報等を対応付けて(URLをキーにして)をURL・FPテーブル35に登録する(S15)。キャッシュ対象でないと判断されたならば、何もしない。
【0243】
もちろん、前述と同様に、この手順も種々変形することが可能である。
【0244】
図47に、クライアント側プロキシ40から受信したリクエストメッセージをサーバ側プロキシ30からサーバ20へ転送する際のサーバ側プロキシ30におけるプロキシサーバの共有キャッシュの動作に関する処理手順の一例を示す。
【0245】
サーバ側プロキシ30は、受信部31により、クライアント側プロキシ40からリクエストメッセージを受信する(ステップS161)。
【0246】
URLキャッシュ処理部327は、リクエストメッセージに対するリプライメッセージがキャッシュ対象のものであるか否か調べ、判断する(S162)。なお、応答時のキャッシュ対象か否かの判断方法は、従来の応答時の手法と同様で構わない(例えば、受信リクエストメッセージがGETメソッドのものであるか否か)。
【0247】
リクエストデータがキャッシュ対象外のものと判断されたならば(S162)、受信したリクエストメッセージを送信部33からサーバ20へ転送する(S169)。
【0248】
ステップS162にて該リクエストメッセージに対するリプライメッセージがキャッシュ対象のものであると判断されたならば、URLキャッシュ処理部327は、さらに、該リクエストメッセージに指定されているURLを取り出し(S163)、そのURLをキーとしてURL・FPテーブル35を検索する(S164)。
【0249】
そのURLに対応するリプライデータのフィンガープリントがキャッシュされていなければ(S165)、受信したリクエストメッセージを送信部33からサーバ20へ転送する(S169)。このとき、現在保持しているデータのタイムスタンプをリクエストメッセージのIf-Modified-Sinceヘッダに記入してサーバ20へ転送し、サーバ20から現在保持しているデータが有効であるとのリプライメッセージを受け取ると、ステップS167へ行くように実施することもできる。
【0250】
また、そのURLに対応するリプライデータのフィンガープリントが登録されていても(S165)、併せて保持されている有効期間の判定のための情報に基づいてそのデータが無効になっていると判断されれば(S166)、受信したリクエストメッセージを送信部33からサーバ20へ転送する(S169)。
【0251】
一方、そのURLに対応するリプライデータのフィンガープリントが登録されており(S165)、かつ、併せて保持されている有効期間の判定のための情報に基づいてそのデータが有効であると判断されれば(S166)、URLキャッシュ処理部327は、URL・FPテーブル35からリプライデータを構成するのに必要な情報を得るとともに、当該URLに対応するリプライデータのフィンガープリントをキーとしてFPキャッシュ34を検索する(S167)。
【0252】
FPキャッシュ管理部322は、FPキャッシュ34から取得したデータから、該フィンガープリントの値を用いてリプライメッセージをFP圧縮時のフォーマットで生成し、送信部33から、クライアント側プロキシ40へ送信する(S168)。
【0253】
このように、サーバ側プロキシにもURL・FPテーブル表を持ってキャッシュの処理をする構成は、一つのサーバ側プロキシが複数のクライアント側プロキシから使われているときに有効に働く。すなわち、あるクライアント側プロキシから要求のあったキャッシュ可能なデータが既に他のクライアント側プロキシによってアクセスされている場合には、サーバ側プロキシにもキャッシュされているので、そのデータを送り返すだけで処理が完了する。
【0254】
このように、サーバ側プロキシにもURL・FPテーブル表を持ってキャッシュの処理をする構成は、一つのサーバ側プロキシが複数のクライアント側プロキシから使われているときに有効に働く。すなわち、あるクライアント側プロキシから要求のあったキャッシュ可能なデータが既に他のクライアント側プロキシによってアクセスされている場合には、サーバ側プロキシにもキャッシュされているので、そのデータを送り返すだけで処理が完了する。
【0255】
なお、以上では、URL・FPテーブル表をフィンガープリント・キャッシュとは別途に設ける場合について説明したが、URL・FPテーブル表をフィンガープリント・キャッシュと一体化して構成することも可能である。
【0256】
なお、いずれのプロキシにおいても、フィンガープリント圧縮処理部とフィンガープリント解凍処理部とを併せて、フィンガープリント(FP)圧縮・解凍処理部としてもよい。また、いずれのプロキシにおいても、差分圧縮処理部と差分解凍処理部とを併せて、差分圧縮・解凍処理部としてもよい。図48に、この場合のプロキシ(サーバ側プロキシ、クライアント側プロキシ)の構成例を示す。
【0257】
FP圧縮を該リクエストデータ転送のみに適用した場合、FP圧縮を該リプライデータ転送のみに適用した場合、FP圧縮を該リクエストデータ転送および該リプライデータ転送に適用した場合のいずれにおいても、リクエストメッセージが指定するURLに対応するリプライデータに対する共用キャッシュ機能に関する構成をクライアント側プロキシのみに設けることも、サーバ側プロキシのみに設けることも、両プロキシに設けることも可能である。
【0258】
なお、本実施形態は、コンピュータに所定の手段を実行させるための(あるいはコンピュータを所定の手段として機能させるための、あるいはコンピュータに所定の機能を実現させるための)プログラムとして実施することも、該プログラムを記録したコンピュータ読取り可能な記録媒体として実施することもできる。
【0259】
なお、この発明の実施の形態で例示した構成は一例であって、それ以外の構成を排除する趣旨のものではなく、例示した構成の一部を他のもので置き換えたり、例示した構成の一部を省いたり、例示した構成に別の機能あるいは要素を付加したり、それらを組み合わせたりすることなどによって得られる別の構成も可能である。また、例示した構成と論理的に等価な別の構成、例示した構成と論理的に等価な部分を含む別の構成、例示した構成の要部と論理的に等価な別の構成なども可能である。また、例示した構成と同一もしくは類似の目的を達成する別の構成、例示した構成と同一もしくは類似の効果を奏する別の構成なども可能である。
また、この発明の実施の形態で例示した各種構成部分についての各種バリエーションは、適宜組み合わせて実施することが可能である。
また、この発明の実施の形態は、個別装置としての発明、関連を持つ2以上の装置についての発明、システム全体としての発明、個別装置内部の構成部分についての発明、またはそれらに対応する方法の発明等、種々の観点、段階、概念またはカテゴリに係る発明を包含・内在するものである。
従って、この発明の実施の形態に開示した内容からは、例示した構成に限定されることなく発明を抽出することができるものである。
【0260】
本発明は、上述した実施の形態に限定されるものではなく、その技術的範囲において種々変形して実施することができる。
【0261】
【発明の効果】
本発明によれば、データ転送装置間でデータとその名前との対応を保持し、この対応を保持しているデータについては、データ本体を転送する代わりに対応する名前を転送することで、データ転送装置間の転送データ量を削減させることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係るネットワーク・システムの構成例を示す図
【図2】同実施形態に係るネットワーク・システムの他の構成例を示す図
【図3】同実施形態に係るネットワーク・システムのさらに他の構成例を示す図
【図4】フィンガープリントについて説明するための図
【図5】同実施形態に係るフィンガープリント・キャッシュについて説明するための図
【図6】同実施形態で使用する差分圧縮の指示方法について説明するための図
【図7】同実施形態の差分圧縮の具体例について説明するための図
【図8】同実施形態の差分圧縮の具体例について説明するための図
【図9】同実施形態の差分圧縮の具体例について説明するための図
【図10】同実施形態の差分圧縮の他の具体例について説明するための図
【図11】同実施形態の差分圧縮の他の具体例について説明するための図
【図12】同実施形態の差分圧縮の他の具体例について説明するための図
【図13】同実施形態の差分圧縮の他の具体例について説明するための図
【図14】同実施形態で使用するメッセージ・フォーマットの一例を示す図
【図15】同実施形態で使用するメッセージ・フォーマットの他の例を示す図
【図16】同実施形態で使用するメッセージ・フォーマットのさらに他の例を示す図
【図17】同実施形態で使用するメッセージ・フォーマットのさらに他の例を示す図
【図18】同実施形態で使用するメッセージ・フォーマットのさらに他の例を示す図
【図19】同実施形態に係るサーバ側プロキシの構成例を示す図
【図20】同実施形態に係るクライアント側プロキシの構成例を示す図
【図21】同実施形態に係るサーバ側プロキシの手順例を示すフローチャート
【図22】同実施形態に係るサーバ側プロキシの手順例を示すフローチャート
【図23】同実施形態に係るクライアント側プロキシの手順例を示すフローチャート
【図24】同実施形態に係るクライアント側プロキシの手順例を示すフローチャート
【図25】同実施形態に係るクライアント側プロキシの手順例を示すフローチャート
【図26】同実施形態の差分圧縮の処理手順の一例を示すフローチャート
【図27】同実施形態の差分圧縮の処理手順の他の例を示すフローチャート
【図28】同実施形態に係るサーバ側プロキシの手順例を示すフローチャート
【図29】同実施形態に係るクライアント側プロキシの手順例を示すフローチャート
【図30】同実施形態に係るプロキシ間のデータ転送について説明するための図
【図31】同実施形態に係るプロキシ間のデータ転送について説明するための図
【図32】同実施形態に係るプロキシ間のデータ転送について説明するための図
【図33】同実施形態にプロキシの他の構成例を示す図
【図34】同実施形態に係るクライアント側プロキシの他の手順例を示すフローチャート
【図35】同実施形態に係るクライアント側プロキシの他の手順例を示すフローチャート
【図36】同実施形態に係るサーバ側プロキシの他の手順例を示すフローチャート
【図37】同実施形態に係るサーバ側プロキシの他の手順例を示すフローチャート
【図38】同実施形態に係るサーバ側プロキシの他の手順例を示すフローチャート
【図39】同実施形態に係るネットワーク・システムのさらに他の構成例を示す図
【図40】同実施形態に係るクライアント側プロキシの他の構成例を示す図
【図41】同実施形態に係るクライアント側プロキシの他の手順例を示すフローチャート
【図42】同実施形態に係るクライアント側プロキシの他の手順例を示すフローチャート
【図43】同実施形態に係るクライアント側プロキシの他の手順例を示すフローチャート
【図44】同実施形態に係るクライアントとクライアント側プロキシとの間のデータ転送について説明するための図
【図45】同実施形態に係るサーバ側プロキシの他の構成例を示す図
【図46】同実施形態に係るサーバ側プロキシの他の手順例を示すフローチャート
【図47】同実施形態に係るサーバ側プロキシの他の手順例を示すフローチャート
【図48】同実施形態に係るプロキシのさらに他の構成例を示す図
【図49】従来のコンピュータ・ネットワーク・システムについて説明するための図
【符号の説明】
2…ASPサーバセンター
4…ユーザオフィス
12…ASPサーバセンター内LAN
14…WAN
16…ユーザオフィス内LAN
20…サーバ装置
30…サーバ側プロキシ装置
40…クライアント側プロキシ装置
31,41…受信部
32,42…処理部
33,43…送信部
34,44…フィンガープリント・キャッシュ
35,45…URL・FPテーブル
321,421…FP圧縮判定部
322,422…フィンガープリント・キャッシュ管理部
323…FP圧縮処理部
423…FP解凍処理部
324…差分圧縮処理部
424…差分解凍処理部
325,425…FP圧縮・解凍処理部
326,426…差分圧縮・解凍処理部
327,427…URLキャッシュ処理部
50…クライアント装置

Claims (10)

  1. サーバ装置と、該サーバ装置がクライアント装置宛に送信するデータを中継する他のデータ転送装置との通信を中継するデータ転送装置において、
    サーバ装置から受信して他のデータ転送装置へ送信した第1の完全データと該第1の完全データをもとに生成した第1のフィンガープリントと、前記第1の完全データが完全データであることを示す第1の識別情報とを対応付けて保持する保持手段と、
    前記サーバ装置がクライアント装置を宛先として送信した第2の完全データを受信する受信手段と、
    前記第1の完全データと前記第2の完全データとの差分である差分データと、該第2の完全データをもとに生成した第2のフィンガープリントと、前記差分データが差分データであることを示す第2の識別情報とを対応付けて前記保持手段に保持させるとともに、前記差分データと前記第2の識別情報とを、前記クライアント装置を宛先として送信する送信手段とを備えたことを特徴とするデータ転送装置。
  2. 前記送信手段は、
    前記第2のフィンガープリントが前記第1のフィンガープリントと一致する場合には、前記第2のフィンガープリントと、前記第2のフィンガープリントがフィンガープリントであることを示す第3の識別情報とを前記クライアント装置宛に送信し、
    前記第2のフィンガープリントが前記第1のフィンガープリントと一致しない場合には、前記差分データと、前記第2のフィンガープリントと、前記第2の識別情報とを対応付けて前記保持手段に保持させるとともに、前記差分データと前記第2の識別情報とを前記クライアント装置宛に送信することを特徴とする請求項1に記載のデータ転送装置。
  3. 前記第2のフィンガープリントが第1のフィンガープリントと一致しない場合に、前記第2の完全データから前記差分データを差し引いたデータ量の差が所定の値より大きくなるかどうかを判断する判断手段を更に備え、
    前記送信手段は、
    前記第2のフィンガープリントが前記第1のフィンガープリントと一致する場合には、前記第2のフィンガープリントと、前記第2のフィンガープリントがフィンガープリントであることを示す第3の識別情報とを前記クライアント装置宛に送信し、
    前記第2のフィンガープリントが前記第1のフィンガープリントと一致しない場合であってかつ前記判断手段が前記第2の完全データから前記差分データを差し引いたデータ量の差が所定の値より大きくなると判断した場合には、前記差分データと、前記第2のフィンガープリントと、前記第2の識別情報とを対応付けて前記保持手段に保持させるとともに、前記差分データと前記第2の識別情報とを前記クライアント装置宛に送信し、
    前記第2のフィンガープリントが前記第1のフィンガープリントと一致しない場合であってかつ前記判断手段が前記第2の完全データから前記差分データを差し引いたデータ量の差が所定の値より大きくならないと判断した場合には、前記第2の完全データと、前記第2のフィンガープリントと、前記第2の完全データが完全データであることを示す前記第1の識別情報とを対応付けて前記保持手段に保持させるとともに、前記第2の完全データと前記第1の識別情報とを前記クライアント装置宛に送信することを特徴とする請求項1に記載のデータ転送装置。
  4. サーバ装置がクライアント装置宛に送信するデータを中継する他のデータ転送装置と、前記クライアント装置との通信を中継するデータ転送装置において、
    のデータ転送装置から受信してクライアント装置へ送信した第1の完全データと、該第1の完全データをもとに生成した第1のフィンガープリントと、前記第1の完全データが完全データであることを示す第1の識別情報とを対応付けて保持する保持手段と、
    前記クライアント装置宛先とされた、前記第1の完全データと第2の完全データとの 差分である差分データと、該差分データが差分データであることを示す第2の識別情報とを受信する受信手段と、
    前記第1の完全データと前記差分データとを用いて前記第2の完全データを生成し、該差分データと、該第2の完全データをもとに生成した第2のフィンガープリントと、前記第2の識別情報とを対応付けて前記保持手段に保持させるとともに、該第2の完全データを、前記クライアント装置を宛先として送信する送信手段とを備えたことを特徴とするデータ転送装置。
  5. 前記送信手段は、
    前記受信手段が前記第1の識別情報を受信した場合は、前記第1の識別情報に付随して受信した第3の完全データを前記クライアント装置宛に送信し、
    前記受信手段が第3のフィンガープリントと前記第3のフィンガープリントがフィンガープリントであることを示す第3の識別情報とを受信した場合であってかつ、前記第3のフィンガープリントが前記第1のフィンガープリントと一致する場合には、前記第1のフィンガープリントに対応付けられた前記第1の完全データを前記クライアント装置宛に送信し、
    前記受信手段が前記第3のフィンガープリントと前記第3の識別情報とを受信した場合であってかつ、前記第3のフィンガープリントが前記第2のフィンガープリントと一致する場合には、前記第1のフィンガープリントに対応付けられた前記第1の完全データと前記第2のフィンガープリントに対応付けられた前記差分データとを用いて生成した前記第2の完全データを前記クライアント装置宛に送信することを特徴とする請求項4に記載のデータ転送装置。
  6. 前記名前は、前記データに所定のハッシュ関数を適用して得られた値であることを特徴とする請求項1ないしのいずれか1項に記載のデータ転送装置。
  7. サーバ装置と、該サーバ装置がクライアント装置宛に送信するデータを中継する他のデータ転送装置との通信を中継するデータ転送装置におけるデータ転送方法であって、
    サーバ装置から受信して他のデータ転送装置へ送信した第1の完全データと該第1の完全データをもとに生成した第1のフィンガープリントと、前記第1の完全データが完全データであることを示す第1の識別情報とを対応付けて保持手段に保持するステップと、
    前記サーバ装置がクライアント装置を宛先として送信した第2の完全データを受信するステップと、
    前記第1の完全データと前記第2の完全データとの差分である差分データと、該第2の完全データをもとに生成した第2のフィンガープリントと、前記差分データが差分データであることを示す第2の識別情報とを対応付けて前記保持手段に保持させるとともに、前記差分データと前記第2の識別情報とを、前記クライアント装置を宛先として送信するステップとを有することを特徴とするデータ転送装置。
  8. サーバ装置がクライアント装置宛に送信するデータを中継する他のデータ転送装置と、前記クライアント装置との通信を中継するデータ転送装置におけるデータ転送方法であって、
    のデータ転送装置から受信してクライアント装置へ送信した第1の完全データと第1の完全データをもとに生成した第1のフィンガープリントと、前記第1の完全データが完全データであることを示す第1の識別情報とを対応付けて保持手段に保持するステップと、
    前記クライアント装置が宛先とされた、前記第1の完全データと第2の完全データとの差分である差分データと該差分データが差分データであることを示す第2の識別情報とを受信するステップと、
    前記第1の完全データと前記差分データとを用いて前記第2の完全データを生成し、該 差分データと、該第2の完全データをもとに生成した第2のフィンガープリントと、前記第2の識別情報とを対応付けて前記保持手段に保持させるとともに、該第2の完全データを、前記クライアント装置を宛先として送信するステップとを有することを特徴とするデータ転送方法。
  9. サーバ装置と、該サーバ装置がクライアント装置宛に送信するデータを中継する他のデータ転送装置との通信を中継するデータ転送装置としてコンピュータを機能させるためのプログラムであって、
    サーバ装置から受信して他のデータ転送装置へ送信した第1の完全データと該第1の完全データをもとに生成した第1のフィンガープリントと、前記第1の完全データが完全データであることを示す第1の識別情報とを対応付けて記憶装置に保持する機能と、
    前記サーバ装置がクライアント装置を宛先として送信した第2の完全データを受信する受信機能と、
    前記第1の完全データと前記第2の完全データとの差分である差分データと、該第2の完全データをもとに生成した第2のフィンガープリントと、前記差分データが差分データであることを示す第2の識別情報とを対応付けて前記記憶装置に保持させるとともに、前記差分データと前記第2の識別情報とを、前記クライアント装置を宛先として送信する機能とをコンピュータに実現させるためのプログラム。
  10. サーバ装置がクライアント装置宛に送信するデータを中継する他のデータ転送装置と、前記クライアント装置との通信を中継するデータ転送装置としてコンピュータを機能させるためのプログラムであって、
    のデータ転送装置から受信してクライアント装置へ送信した第1の完全データと、該第1の完全データをもとに生成した第1のフィンガープリントと、前記第1の完全データが完全データであることを示す第1の識別情報とを対応付けて記憶装置に保持する機能と、
    前記クライアント装置宛先とされた、前記第1の完全データと第2の完全データとの差分である差分データと、該差分データが差分データであることを示す第2の識別情報とを受信する機能と、
    前記第1の完全データと前記差分データとを用いて前記第2の完全データを生成し、該差分データと、該第2の完全データをもとに生成した第2のフィンガープリントと、前記第2の識別情報とを対応付けて前記記憶装置に保持させるとともに、該第2の完全データを、前記クライアント装置を宛先として送信する機能とをコンピュータに実現させるためのプログラム。
JP2002149131A 2002-05-23 2002-05-23 データ転送装置、データ転送方法及びプログラム Expired - Fee Related JP3848209B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002149131A JP3848209B2 (ja) 2002-05-23 2002-05-23 データ転送装置、データ転送方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002149131A JP3848209B2 (ja) 2002-05-23 2002-05-23 データ転送装置、データ転送方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2003345708A JP2003345708A (ja) 2003-12-05
JP3848209B2 true JP3848209B2 (ja) 2006-11-22

Family

ID=29767399

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002149131A Expired - Fee Related JP3848209B2 (ja) 2002-05-23 2002-05-23 データ転送装置、データ転送方法及びプログラム

Country Status (1)

Country Link
JP (1) JP3848209B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150099425A (ko) * 2014-02-12 2015-08-31 레지피 에스.에이. 구성 관련 데이터를 검색하기 위한 네트워크 시스템

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7555531B2 (en) * 2004-04-15 2009-06-30 Microsoft Corporation Efficient algorithm and protocol for remote differential compression
US9639554B2 (en) 2004-12-17 2017-05-02 Microsoft Technology Licensing, Llc Extensible file system
US8321439B2 (en) 2004-12-17 2012-11-27 Microsoft Corporation Quick filename lookup using name hash
US8606830B2 (en) 2004-12-17 2013-12-10 Microsoft Corporation Contiguous file allocation in an extensible file system
US7873596B2 (en) 2006-05-23 2011-01-18 Microsoft Corporation Extending cluster allocations in an extensible file system
JP4587312B2 (ja) * 2005-09-16 2010-11-24 株式会社リコー 符号変換装置及び符号変換方法
JP2007226635A (ja) * 2006-02-24 2007-09-06 Victor Co Of Japan Ltd リモートデスクトップシステムのサーバ装置及びクライアント装置
JP4784909B2 (ja) * 2007-03-13 2011-10-05 日本電気株式会社 トランザクションアクセラレータ、通信システム、通信方法及びプログラム
JP4766025B2 (ja) * 2007-10-05 2011-09-07 日本電気株式会社 電子メール送受信システム
CN101494658B (zh) 2008-01-24 2013-04-17 华为技术有限公司 指纹技术的实现方法、装置及系统
JP5131915B2 (ja) * 2008-03-31 2013-01-30 国立大学法人 東京大学 パケット符号化方法および装置ならびに復号方法および装置
JP6378601B2 (ja) * 2014-10-02 2018-08-22 日本電信電話株式会社 コンテンツ解析装置、コンテンツ解析方法、及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5931904A (en) * 1996-10-11 1999-08-03 At&T Corp. Method for reducing the delay between the time a data page is requested and the time the data page is displayed
JP3313604B2 (ja) * 1997-02-25 2002-08-12 中部日本電気ソフトウェア株式会社 インターネットのホームページ管理システム
JP2002055870A (ja) * 2000-08-15 2002-02-20 Fuji Xerox Co Ltd データ提供装置、データ取得装置及びデータ処理システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150099425A (ko) * 2014-02-12 2015-08-31 레지피 에스.에이. 구성 관련 데이터를 검색하기 위한 네트워크 시스템
KR102344121B1 (ko) * 2014-02-12 2021-12-28 레지피 에스.에이. 구성 관련 데이터를 검색하기 위한 네트워크 시스템

Also Published As

Publication number Publication date
JP2003345708A (ja) 2003-12-05

Similar Documents

Publication Publication Date Title
JP3990115B2 (ja) サーバ側プロキシ装置及びプログラム
US7054912B2 (en) Data transfer scheme using caching technique for reducing network load
US8024484B2 (en) Caching signatures
US7383348B2 (en) Data transfer scheme using caching technique for reducing network load
JP3848209B2 (ja) データ転送装置、データ転送方法及びプログラム
JP4671332B2 (ja) ユーザ識別情報を変換するファイルサーバ
US20050027731A1 (en) Compression dictionaries
JP2013512514A (ja) キャッシュを利用した効率的なメディア配信のためのシステム及び方法
US20090049243A1 (en) Caching Dynamic Content
JP3984086B2 (ja) キャッシュサーバ、データ転送装置及びプログラム
JP2004310371A (ja) ファイル共有システム及び方法、ファイル共有サーバ、ファイル共有サービスのクライアント端末、ファイル共有プログラム、ファイル共有プログラムを記録した記録媒体
JP4031516B2 (ja) サーバ側プロキシ装置、クライアント側プロキシ装置、データ転送方法及びプログラム
JP3983987B2 (ja) サーバ側プロキシ装置、データ転送方法及びプログラム
JP4053269B2 (ja) データ転送装置およびデータ転送方法
US20020107986A1 (en) Methods and systems for replacing data transmission request expressions
JP3943867B2 (ja) サーバ側プロキシ、データ転送方法及びプログラム
JP3943868B2 (ja) サーバ側プロキシ、データ転送方法及びプログラム
JP4157585B2 (ja) サーバ側プロキシ装置、クライアント側プロキシ装置、データ転送方法及びプログラム
JP3913508B2 (ja) データ転送装置およびデータ転送方法
JP2003108464A (ja) データ転送装置およびデータ転送方法
JP4041157B2 (ja) クライアント側プロキシ装置、データ転送方法及びプログラム
JP3977601B2 (ja) サーバ側プロキシ装置、クライアント側プロキシ装置及びプログラム
JP3977651B2 (ja) データ転送方法、サーバ側プロキシ装置、クライアント側プロキシ装置及びプログラム
JP4300220B2 (ja) データ転送装置およびデータ転送方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060516

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060718

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060822

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060824

LAPS Cancellation because of no payment of annual fees