JP5113967B2 - インターネットファイルシステム - Google Patents

インターネットファイルシステム Download PDF

Info

Publication number
JP5113967B2
JP5113967B2 JP2001516067A JP2001516067A JP5113967B2 JP 5113967 B2 JP5113967 B2 JP 5113967B2 JP 2001516067 A JP2001516067 A JP 2001516067A JP 2001516067 A JP2001516067 A JP 2001516067A JP 5113967 B2 JP5113967 B2 JP 5113967B2
Authority
JP
Japan
Prior art keywords
file
database
directory
server
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001516067A
Other languages
English (en)
Other versions
JP2003527659A5 (ja
JP2003527659A (ja
Inventor
セドラー,エリック
ロバーツ,マイケル
Original Assignee
オラクル・インターナショナル・コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/571,696 external-priority patent/US8335775B1/en
Priority claimed from US09/571,496 external-priority patent/US6922708B1/en
Priority claimed from US09/571,036 external-priority patent/US6549916B1/en
Priority claimed from US09/571,568 external-priority patent/US7280995B1/en
Application filed by オラクル・インターナショナル・コーポレイション filed Critical オラクル・インターナショナル・コーポレイション
Publication of JP2003527659A publication Critical patent/JP2003527659A/ja
Publication of JP2003527659A5 publication Critical patent/JP2003527659A5/ja
Application granted granted Critical
Publication of JP5113967B2 publication Critical patent/JP5113967B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【優先権主張および関連出願の参照】
本願は、その全文が本明細書中に完全に述べられているかのように引用により援用される、Eric Sedlarによる「インターネットファイルシステム("Internet File System")」と題された1999年8月5日出願の先行米国仮特許出願連続番号第60/147,538号に関し、米国特許法第119条(e)によりその国内優先権を主張する。
【0002】
本願は、その全文が本明細書中に完全に述べられているかのように引用により援用される、Eric Sedlarによる「関係システム内に階層状に構成された情報にアクセスするための階層索引付け("Hierarchical Indexing for Accessing Hierarchically Organized Information in a Relational System")」と題された1999年2月18日出願の米国特許出願連続番号第09/251,757号に関連する。
【0003】
本願は、その全文が本明細書中に完全に述べられているかのように引用により援用される、Eric Sedlarによる「トランザクションをサポートするファイルシステム("File System that Supports Transactions")」と題された2000年5月15日出願の米国特許出願連続番号第09/571,496号に関連する。
【0004】
本願は、その全文が本明細書中に完全に述べられているかのように引用により援用される、Eric Sedlarによる「記憶されたクエリディレクトリ("Stored Query Directories")」と題された2000年5月15日出願の米国特許出願連続番号第09/571,060号に関連する。
【0005】
本願は、その全文が本明細書中に完全に述べられているかのように引用により援用される、Eric Sedlarによる「ファイルシステムに結合されたイベント通知システム("Event Notification System Tied to a File System")」と題された2000年5月15日出願の米国特許出願連続番号第09/571,036号に関連する。
【0006】
本願は、その全文が本明細書中に完全に述べられているかのように引用により援用される、Eric Sedlarによる「ファイルがタイプ付けされたオブジェクトファイルシステム("Object File System with Typed Files")」と題された2000年5月15日出願の米国特許出願連続番号第09/571,492号に関連する。
【0007】
本願は、その全文が本明細書中に完全に述べられているかのように引用により援用される、Eric Sedlarによる「オンザフライ・フォーマット変換("On-the-fly Format Conversion")」と題された2000年5月15日出願の米国特許出願連続番号第09/571,568号に関連する。
【0008】
本願は、その全文が本明細書中に完全に述べられているかのように引用により援用される、Eric SedlarおよびMichael J. Robertsによる「インターネットファイルシステムにおけるバージョニング("Versioning in Internet File System")」と題された2000年5月15日出願の米国特許出願連続番号第09/571,696号に関連する。
【0009】
本願は、その全文が本明細書中に完全に述べられているかのように引用により援用される、Eric Sedlarによる「データへのマルチモデルアクセス("Multi-Model Access to Data")」と題された2000年5月15日出願の米国特許出願連続番号第09/571,508号に関連する。
【0010】
【発明の分野】
本発明は一般に電子ファイルシステムに関し、特定的には、データベースシステムを用いてオペレーティングシステムファイルシステムを実現するシステムに関する。
【0011】
【発明の背景】
ヒトは情報をカテゴリに分類する傾向にあり、情報が分類されるそれらカテゴリ自体は典型的に、何らかの階層状に互いに関連付けて構成される。たとえば、個々の動物は種に属し、種は属に属し、属は科に属し、科は目に属し、目は綱に属する。
【0012】
コンピュータシステムの出現に伴ない、このような階層構成(hierarchical organization)を望むヒトの欲求を大いに反映する電子情報の記憶技術が開発されてきた。従来のオペレーティングシステムは、たとえば、階層ベースの構成原理を使用するファイルシステムを提供する。具体的には、典型的なオペレーティングシステムファイルシステム(「OSファイルシステム」)においては、ディレクトリは階層に配され、文書(ドキュメント)はそれらディレクトリに記憶される。理想的には、ディレクトリ間の階層的関係は、それらディレクトリに割当てられた意味間の何らかの直観的な関係を反映する。同様に、各ドキュメントがディレクトリに記憶される場合、そのドキュメントの内容と、そのドキュメントが記憶されるディレクトリに割当てられた意味との間の何らかの直観的関係に基づいて、記憶されると理想的である。
【0013】
図1は、(ワードプロセッサ等の)ファイルを作成して使用するソフトウェアアプリケーションがそのファイルを階層的ファイルシステム内に記憶する際に用いられる、典型的な機構を示す。図1を参照して、オペレーティングシステム104は、アプリケーション102に対してアプリケーションプログラミングインターフェイス(API)を開く(expose)。そうして開かれたAPIにより、アプリケーション102はそのオペレーティングシステムによって提供されるルーチンをコールすることができる。以後、OS APIの、OSファイルシステムを実現するルーチンに関連する部分を、OSファイルAPIと称する。アプリケーション102は、OSファイルAPIを介してファイルシステムルーチンをコールして、データを検索してディスク108に記憶する。オペレーティングシステム104の方は、ディスク108へのアクセスを制御するデバイスドライバ106に対してコールを行なって、ディスク106からファイルを検索させたりディスク106にファイルを記憶させたりする。
【0014】
OSファイルシステムルーチンは、ファイルシステムの階層的構成を実現する。たとえば、OSファイルシステムルーチンは、ファイル間の階層的関係に関する情報を維持し、アプリケーション102にファイルへのアクセスを、階層内における当該ファイルの場所に基づいて与える。
【0015】
電子情報を階層的に構成するのに対して、関係データベース(relational database)は、情報を行列からなるテーブルに記憶する。各行は独自のRowIDによって識別される。各列は記録の属性を表わし、各行は特定の記録を表わす。データベースからのデータの検索は、データベースを管理するデータベース管理システム(DBMS)にクエリを提示することによって行なわれる。
【0016】
図2は、データベースアプリケーションがデータベース内の情報にアクセスする際に用いられる典型的な機構を示す。図2を参照して、データベースアプリケーション202は、データベースサーバ204によって提供されるAPI(「データベースAPI」)を通じてデータベースサーバ204と対話する。このように開かれたAPIにより、データベースアプリケーション202は、データベースサーバ204によってサポートされたデータベース言語により構築されたクエリを用いて、データにアクセスすることができる。多くのデータベースサーバによってサポートされる言語の1つに、構造化クエリ言語(Structured Query Language, SQL)がある。データベースサーバ204は、データベースアプリケーション202に対して、すべてのデータがテーブルの行に記憶されているように見せる。しかし、データベースアプリケーション202にトランスペアレントなことに、データベースサーバ204は実際にはオペレーティングシステム104と対話して、データをファイルとしてOSファイルシステム内に記憶する。オペレーティングシステム104の方では、デバイスドライバ106に対してコールを行なって、ファイルをディスク108から検索させたりファイルをディスク108に記憶させたりする。
【0017】
各種記憶システムにはそれぞれ、利点および限界がある。階層的に構成された記憶システムは、簡単、直観的、かつ実現が容易であって、大半のアプリケーションプログラムによって使用される標準的なモデルである。しかし、残念ながら、この階層的構成の簡易性は、複雑なデータ検索オペレーションに求められるサポートを提供することができない。たとえば、特定日に作成された特定的なファイル名を有するすべてのドキュメントを検索するのに、すべてのディレクトリの内容を検査せねばならないことがあり得る。すべてのディレクトリをサーチせねばならないので、階層的構成は検索プロセスを容易にすることはできない。
【0018】
関係データベースシステムは、大量の情報を記憶したり、非常に柔軟にデータにアクセスするのに、好適である。階層的に構成されたシステムに対して、複雑なサーチ基準に合致するデータでさえも、関係データベースシステムからは容易にかつ効率的に検索することが可能である。しかし、クエリを公式化(formulate)してデータベースサーバに提示するプロセスは、ディレクトリの階層を単に通り抜けるのに比して直観的ではなく、多くのコンピュータユーザにとっての技術的快適度を越えるものである。
【0019】
現時点において、アプリケーションの開発者は、それらのアプリケーションによって作成されるデータを、オペレーティングシステムによって提供される階層的ファイルシステムを通じてアクセス可能としたいか、それともデータベースシステムによって提供されるより複雑なクエリインターフェイスを通じてアクセス可能としたいか、どちらかを選択するよう求められる。一般に、データベースシステムの複雑なサーチ能力を要求しないアプリケーションについては、オペレーティングシステムによって提供されるより一般的かつより簡単な階層的ファイルシステムを使用して、それらのデータを記憶するように設計される。この場合、アプリケーションの設計およびアプリケーションの使用がどちらも簡素化されるものの、それらデータにアクセスすることのできる柔軟性およびパワーの面で制限が課されてしまう。
【0020】
これに対し、複雑なサーチ能力が求められる場合には、アプリケーションは、データベースシステムによって提供されるクエリ機構を使用してそれらのデータにアクセスするように設計される。この場合、データにアクセスすることのできる柔軟性およびパワーは増すが、それと同時に、アプリケーションの複雑性が、設計者の観点からもユーザの観点からも増す。さらに、データベースシステムの存在も求められ、アプリケーションユーザに対して付加的な費用がかかることになる。
【0021】
以上に鑑みて、アプリケーションが比較的簡単なOSファイルAPIを使用してデータにアクセスすることができることが明らかに望ましい。また、より強力なデータベースAPIを使用して同じデータにアクセスすることができることがさらに望ましい。
【0022】
【発明の概要】
データベースに記憶されたデータにアクセスするための技術が提供される。一技術に従えば、アプリケーションはオペレーティングシステムに対して1または複数のコールを行なってファイルにアクセスする。該オペレーティングシステムは、オペレーティングシステムファイルシステムを実現するルーチンを含む。該1または複数のコールは、該オペレーティングシステムファイルシステムを実現するルーチンに対して行なわれる。該1または複数のコールに応答して、1または複数のデータベースコマンドがデータベースを管理するデータベースサーバに対して発行される。該データベースサーバはそのデータベースコマンドを実行して、データベースからデータを検索する。該データからファイルが生成されて、該アプリケーションに与えられる。
【0023】
本発明を以下に限定のためではなく例示の目的で、添付の図面を参照して説明する。図中、同一の参照符号は同一の要素を表わす。
【0024】
【好ましい実施例の詳細な説明】
同じデータの組に対して、データベースAPIおよびOSファイルシステムAPIを含む種々のインターフェイスを介してアクセスすることを可能にする、方法およびシステムが提供される。以下に、説明の目的で、本発明が完全に理解されるように多数の具体的な詳細が述べられるが、当業者には、本発明がそれらの具体的な詳細を伴なわずに実施され得ることは明らかであろう。他の例においては、本発明を不必要にあいまいにすることのないように、周知の構造および装置はブロック図により示される。
【0025】
アーキテクチャ的な概観
図3は、本発明の一実施例に従って実現されるシステム300のアーキテクチャを表わすブロック図である。図2に示すシステムと同様、システム300は、データベースAPIを提供するデータベースサーバ204を含み、このデータベースAPIを通じて、データベースアプリケーション312が、データベースサーバ204により管理されるデータにアクセスし得る。データベースAPIを通じてデータベースサーバ204により管理されるデータにアクセスするすべてのエンティティの観点から、データベースサーバ204により管理されるデータはデータベースサーバ204(たとえばSQL)によりサポートされるデータベース言語を用いて照会され得る関係テーブルにストアされる。これらのエンティティに対してトランスペアレントに、データベースサーバ204はこのデータをディスク108にストアする。一実施例によれば、データベースサーバ204は、データを直接ディスクにストア可能にすることによってオペレーティングシステム104のOSファイルシステムに伴うオーバヘッドを回避できるようにする、ディスク管理論理を実現する。したがって、データベースサーバ204は、(1)オペレーティングシステム104により提供されたOSファイルシステムをコールするか、または(2)データを直接ディスクにストアすることでオペレーティングシステム104を迂回するかのいずれかによって、データがディスクにストアされるようにし得る。
【0026】
図2のシステムとは異なって、システム300はトランスレーションエンジン308を提供し、これはオペレーティングシステム304aおよび304bから受けたI/Oコマンドを、トランスレーションエンジン308がデータベースサーバ204へ発するデータベースコマンドへ変換する。I/Oコマンドがデータのストレージを求める場合、トランスレーションエンジン308はデータベースコマンドをデータベースサーバ204へ発し、データベースサーバ204により管理される関係テーブルにデータがストアされるようにする。I/Oコマンドがデータの検索を求める場合、トランスレーションエンジン308はデータベースコマンドをデータベースサーバ204に発し、データベースサーバにより管理される関係テーブルからデータを検索する。その後トランスレーションエンジン308は、こうして検索されたデータを、I/Oコマンドを発したオペレーティングシステムに与える。
【0027】
オペレーティングシステム304aおよび304bに対しては、トランスレーションエンジン308に伝達されたデータがデータベースサーバ204により管理される関係テーブルに最終的にストアされるという事実はトランスペアレントである。これは、オペレーティングシステム304aおよび304bにトランスペアレントであるので、それらのオペレーティングシステムを含むプラットホーム上で実行されているアプリケーション302aおよび302bに対してもトランスペアレントである。
【0028】
たとえば、アプリケーション302aのユーザがアプリケーション302aにより与えられる「ファイルの保存」という選択肢を選択する場合を想定する。アプリケーション302aはOSファイルAPIを通じてコールを行ない、オペレーティングシステム304aにファイルを保存させる。オペレーティングシステム304aはトランスレーションエンジン308にI/Oコマンドを発し、ファイルをストアさせる。トランスレーションエンジン308はこれに応答して、データベースサーバ204に1つ以上のデータベースコマンドを発し、データベースサーバ204に、ファイル内に含まれるデータをデータベースサーバ204が保持する関係テーブルにストアさせる。データベースサーバ204は、このデータを直接ディスクにストアしてもよく、またはオペレーティングシステム104をコールしてオペレーティングシステム104により提供されるOSファイルシステムにデータをストアさせてもよい。データベースサーバ204がオペレーティングシステム104をコールすると、オペレーティングシステム104はこれに応答して、デバイスドライバ106にコマンドを送ることによりデータをディスク108にストアさせる。
【0029】
別の例として、アプリケーション302aのユーザがアプリケーション302aにより与えられる「ファイルのロード」という選択肢を選択する場合を想定する。アプリケーション302aはOS File APIを通じてコールを行ない、オペレーティングシステム304aにファイルをロードさせる。オペレーティングシステム304aはI/Oコマンドをトランスレーションエンジン308に発し、ファイルのロードを行なわせる。トランスレーションエンジン308は、1つ以上のデータベースコマンドをデータベースサーバ204に発し、データベースサーバ204に、検索すべきファイルを備えるデータをデータベースサーバ204が保持する関係テーブルから検索させる。データの検索中、データベースサーバ204はデータディレクトリを検索してもよく、またはオペレーティングシステム104をコールしてディスク108上のOSファイルからデータを検索させてもよい。一旦データが検索されると、この検索されたデータから所望のファイルが「構築される」。具体的には、この検索されたデータはファイルをリクエストしたアプリケーション302aにより予測されたフォーマットにされる。こうして構築されたファイルは、トランスレーションエンジン308およびオペレーティングシステム304aを通じて、アプリケーション302aまで伝達される。
【0030】
システム300には数多くの新規な特徴が組入れられる。以下のセクションでは、これらの特徴をより詳細に説明する。しかしながら、当然、特定の実施例はこれらの特徴を説明するために用いられるのであり、本発明がこれらの特定の実施例に限定されることはない。
【0031】
関係づけてストアされたデータへのOSファイルシステムアクセス
本発明のある局面によれば、システム300により、アプリケーションが従来のOSファイルAPIを通じて、データベースにストアされたデータにアクセスできるようになる。すなわち、オペレーティングシステムにより提供される標準OSファイルAPIをコールすることによりファイルをロードするように設計されている従来のアプリケーションが、関係テーブルにストアされたデータからオンザフライで構築されたファイルをロードできるようになる。さらに、関係テーブルからデータが発生するという事実は、アプリケーションに対しては完全にトランスペアレントである。
【0032】
たとえば、データベースアプリケーション312が、データベースサーバ204により保持されるデータベース中のテーブルに1行のデータを挿入するというデータベースコマンドを発すると想定する。一旦その行が挿入されると、オペレーティングシステム304aにより提供される比較的単純なOSファイルAPIを用いてデータにアクセスするようにしか設計されていないアプリケーション302aは、「ファイルを開く」というコマンドをオペレーティングシステム304aに発する。これに応答して、オペレーティングシステム304aはI/Oコマンドをトランスレーションエンジン308に発し、トランスレーションエンジン308は、1つ以上のデータベースコマンドをデータベースサーバ204に発することにより応答する。データベースサーバ204は、データベースコマンド(典型的にはデータベースクエリの形式)を実行することにより、データベースサーバ204に、データベースアプリケーション312により挿入された行を検索させる。アプリケーション302aにより予測されるファイルタイプのファイルがその行に含まれるデータから構築され、こうして構築されたファイルが、トランスレーションエンジン308およびオペレーティングシステム304aを通じて再びアプリケーション302aへ戻される。
【0033】
システム300により、従来のOSファイルシステムアクセスしかサポートしていないアプリケーションが、関係づけてストアされたデータをロードできるようになるだけでなく、従来のOSファイルシステムアクセスしかサポートしないアプリケーションによりストアされた情報に、データベースアプリケーションが従来の照会技術を用いてアクセスできるようになる。たとえば、アプリケーション302aがOSのコールを行ない、作成されたファイルを保存させるとする。その「ファイルの保存」コマンドはオペレーティングシステム304aおよびトランスレーションエンジン308を通じてデータベースサーバ204へ伝達される。データベースサーバ204は「ファイルの保存」コマンドをトランスレーションエンジン308により発せられたデータベースコマンドの形で受け、そのファイルに含まれるデータを、データベースサーバ204により管理されるデータベース中に含まれる1つ以上のテーブルの1行以上の行中にストアする。データが一旦その態様でデータベース内にストアされると、データベースアプリケーション312はデータベースサーバ204にデータベースクエリを発し、データベースからデータを検索することができる。
【0034】
データベースにおけるOSファイルシステム構成のエミュレート
上記で説明したように、オペレーティングシステム304aおよび304bのファイルシステムルーチンに対するコールは、最終的に、トランスレーションエンジン308がデータベースサーバ204に対して発するデータベースコマンドに変換される。本発明の一実施例によれば、これらの変換を行なう処理は、オペレーティングシステム304aおよび304bにより実現されたファイルシステムの特徴をデータベースサーバ204内でエミュレートすることにより単純化される。
【0035】
この構成モデルに関して、ほとんどのオペレーティングシステムは、ファイル階層構造でファイルを構成するファイルシステムを実現する。したがって、アプリケーション302aおよび302bが行なったこのOSファイルシステムのコールは、典型的には、OSファイル階層構造内のその場所という観点からあるファイルを特定するだろう。このようなコールから対応するデータベースのコールへの変換を単純化するために、関係のあるデータベースシステム内の階層ファイルシステムをエミュレートするための機構が設けられる。このような機構の1つが、1999年2月18日にエリック・セドラー(Eric Sedlar)により出願され「関係のあるシステムおいて階層的に構成された情報にアクセスするための階層的インデクシング(HIERARCHICAL INDEXING FOR ACCESSING HIERARCHICALLY ORGANIZED INFORMATION IN A RELATIONAL SYSREM)」と題された米国特許出願番号09/251,757号に詳細に記載されており、この全内容をここに引用により援用する。
【0036】
具体的には、「HIERARCHICAL INDEXING」の出願には、階層インデックスを作成、保持、および使用して、パス名に基づいて関係のあるシステム内の情報に効率的にアクセスすることにより、階層的に構成されたシステムをエミュレートするための技術が記載される。エミュレートされた階層システムに何らかの子を有する各アイテムは、そのインデックスにインデックスエントリを有する。インデックス中のインデックスエントリは、これらのインデックスエントリに関連付けられたアイテム中の階層的な関係を反映するような方法で互いにリンクされる。具体的には、2つのインデックスエントリに関連付けられたアイテム間に親子関係が存在すれば、親アイテムに関連付けられたインデックスエントリはその子アイテムに関連付けられたインデックスエントリへの直接のリンクを有する。
【0037】
結果的に、パス名中のファイル名のシーケンスに従って、そのパス名におけるアイテムに関連付けられたインデックスエントリ間の直接のリンクに沿って進むことにより、パス名の導出(resolution)が行なわれる。インデックスエントリがこの態様でリンクされるインデックスを用いることにより、それらのパス名に基づいてアイテムにアクセスする処理は著しく加速され、また、その処理中に行われるディスクアクセスの数は著しく減少する。
【0038】
階層インデックス
本発明と整合性のある階層インデックスは、パス名により特定されるように、親アイテムからそれらの子へ移動するという、階層システムのパス名に基づいたアクセス法をサポートする。一実施例によれば、本発明の原理に合う階層インデックスは、次の3つのフィールドを含むインデックスエントリを採用する。RowID、FileID、およびDir_entry_list(アレイとしてストアされる)。
【0039】
図5は、データベース内の階層ストレージシステムをエミュレートするのに用いられ得る階層インデックス510を示す。図6は、階層インデックス510がエミュレートしている特定のファイル階層構造を示す。図7は、図6に示すファイルを関係データベース内にストアするのに用いられるファイルテーブル710を示す。
【0040】
階層インデックス510はテーブルである。RowID欄はシステムにより生成されるIDを含み、データベースサーバ204がディスク上でその行の場所を突きとめ得るようにするディスクアドレスを特定する。この関係データベースシステムによると、RowIDは、ディスクドライブにストアされたデータの場所を突きとめるためにDBMSが用いる暗示的に規定されたフィールドであり得る。インデックスエントリのFileIDフィールドは、このインデックスエントリに関連付けられたファイルのFileIDをストアする。
【0041】
本発明の一実施例によれば、階層インデックス510は、子を有するアイテムに対するインデックスエントリのみストアする。したがって、エミュレートされた階層ファイルシステムという面において、階層インデックス510にインデックスエントリを有するアイテムは、他のディレクトリに対して親であるディレクトリおよび/または現在ドキュメントをストアしているディレクトリのみである。子を有さないそれらのアイテム(たとえば、図6のExample.doc、Access、Appl、App2、App3)は含まれないのが好ましい。所与のファイルに対するインデックスエントリのDir_entry_listフィールドは、あるアレイ中に、所与のファイルの子ファイルの各々に対する「アレイエントリ」をストアする。
【0042】
たとえば、インデックスエントリ512はWindows(R)ディレクトリ614に対するものである。Wordディレクトリ616およびAccessディレクトリ620はWindows(R)ディレクトリ614の子である。よって、Windows(R)ディレクトリ614に対するインデックスエントリ512のDir_entry_listフィールドは、Wordディレクトリ616に対するアレイエントリと、Accessディレクトリ620に対するアレイエントリとを含む。
【0043】
一実施例によれば、Dir_entry_listフィールドが各子に対してストアする特定の情報は、その子のファイル名およびその子のFileIDを含む。階層インデックス510にそれら自体のエントリを有する子に対して、Dir_entry_listフィールドは子のインデックスエントリのRowIDもストアする。たとえば、Wordディレクトリ616は階層インデックス510にそれ自体のエントリを有する(エントリ514)。したがって、インデックスエントリ512のDir_entry_listフィールドは、ディレクトリ616の名称(“Word”)、階層インデックス510におけるディレクトリ616に対するインデックスエントリのRowID(“Y3”)、およびディレクトリ616のFileID(“X3”)を含む。より詳細に説明するように、Dir_entry_listフィールドに含まれる情報により、パス名に基づいた情報へのアクセスがより速くより容易になる。
【0044】
階層インデックスのいくつかの主要な原理は以下のとおりである。
・所与のディレクトリに対するインデックスエントリのDir_entry_list情報はできるだけ少数のディスクブロックとしてまとめて保たれる。これは、最も頻繁に用いられるファイルシステムオペレーション(パス名の導出、ディレクトリのリスティング(listing))は、あるディレクトリが参照されると常にそのディレクトリ内の多数のエントリを見る必要が生じることになるからである。言換えれば、特定のディレクトリエントリが参照されると同じディレクトリ内の他のエントリもまた参照されることが多いので、ディレクトリエントリは参照に対して高い局所性を有するべきである。
【0045】
・階層インデックスのインデックスエントリにストアされる情報は、特定のディスクブロック中のエントリの最大数に適合するように、最小に保たれなければならない。ディレクトリエントリを、それらが含まれるディレクトリを特定するキーを反復する必要のないアレイ手段にまとめてグループ分けすると、ディレクトリ内のすべてのエントリが同じキーを共有することになる。
【0046】
・パス名の導出に要する時間は、ファイルシステム内のファイルの総数ではなく、パス内のディレクトリの数に比例すべきである。これにより、ユーザは、頻繁にアクセスされるファイルをアクセス時間の少ないファイルシステムツリーの頂上の方に保つことが可能になる。
【0047】
これらの要素はすべて、iノードおよびディレクトリのUNIX(R)システムなどの典型的なファイルシステムディレクトリ構造において存在する。ここに記載のような階層インデックスを用いることにより、それらの目的と、関係のデータベースが理解しかつ照会し得る構造とが一致し、データベースサーバが、パス名の導出に用いられたものとは別の態様でファイルのアドホックサーチを行なうことが可能になる。これを行なうためには、あるインデックスのデータベース概念を用いなければならない。すなわち、ある特定の方法(この場合、階層ツリーにおけるパス名の導出)を介したアクセスを最適化するよう設計された別の態様で別個のデータ構造に配置された下位情報(この場合ファイルデータ)の部分の複製である。
【0048】
階層インデックスの使用
ファイルのパス名に基づいてファイルにアクセスするために階層インデックス510がいかに用いられ得るかについて、ここで図8のフローチャートを参照して述べることにする。説明の目的で、ドキュメント618がそのパス名を介してアクセスされると仮定する。このファイルのパス名は/Windows(R)/Word/Example.docであり、これは以下「入力パス名」と称する。このパス名が与えられると、パス名導出処理は、この入力パス名中の第1の名称に対するインデックスエントリの場所を階層インデックス510において突きとめることにより開始する。あるファイルシステムの場合、パス名における第1の名称はルートディレクトリである。したがって、エミュレートされたファイルシステム内のファイルの場所を突きとめるためのパス名導出処理は、ルートディレクトリ610のインデックスエントリ508の場所を突きとめることにより始まる(ステップ800)。すべてのパス名導出オペレーションがルートディレクトリのインデックスエントリ508にアクセスすることにより始まるので、ルートディレクトリ610(インデックスエントリ508)に対するインデックスエントリの場所を示すデータは、あらゆるサーチの開始時においてルートディレクトリのインデックスエントリ508の場所を素早く突きとめるために、階層インデックス510外部の都合よい場所に保持され得る。
【0049】
ルートディレクトリ610に対するインデックスエントリ508の場所が一旦突きとめられると、DBMSは、入力パス名中にまだ何らかのファイル名があるかを判定する(ステップ802)。入力パス名中にもうファイルがなければ、制御はステップ820へと進み、インデックスエントリ508にストアされたFileIDが用いられてファイルテーブル710中のルートディレクトリエントリを捜す。
【0050】
この例では、ファイル名「Windows(R)」は、入力パス名においてルートディレクトリの記号「/」の後に続く。したがって、制御はステップ804へと進む。ステップ804で、次のファイル名(たとえば「Windows(R)」が入力パス名から選択される。ステップ806でDBMSはインデックスエントリ508のDir_entry_list欄を見て、選択されたファイル名に関するアレイエントリの場所を突きとめる。
【0051】
この例では、入力パス名においてルートディレクトリの後に続くファイル名は「Windows(R)」である。したがって、ステップ806は、ファイル名「Windows(R)」のアレイエントリに対するインデックスエントリ508のDir_entry_listをサーチすることを伴う。Dir_entry_listが選択されたファイル名のアレイエントリを含まなければ、制御はステップ808からステップ810へと進み、ここで入力パス名が無効であることを示すエラーが生成される。この例では、インデックスエントリ508のDir_entry_listは「Windows(R)」のアレイエントリを含んでいる。したがって、制御はステップ808からステップ822へと移る。
【0052】
インデックスエントリ508のDir_entry_list中の情報は、ルートディレクトリ610の子の1つが実際「Windows(R)」という名称のファイルであることを示す。さらに、Dir_entry_listアレイエントリはこの子についての次の情報を含む。すなわち、これはRowIDY2に一致するインデックスエントリであり、このFileIDはX2である。
【0053】
ステップ822において、入力パス名にまだ何らかのファイル名があるか否かが判定される。もうファイル名がなければ、制御はステップ822からステップ820へと移る。この例では、「Windows(R)」は最後のファイル名ではないので、制御は代わりにステップ824へ移る。
【0054】
「Windows(R)」は入力パス中の最後のファイル名ではないので、Dir_entry_listに含まれるFileID情報は、このパス導出オペレーション中には用いられない。むしろ、Windows(R)ディレクトリ614は特定されたパスの部分にすぎず、ターゲットではないので、ファイルテーブル710はこの時点では調べられない。代わりに、ステップ824で、インデックスエントリ508のDir_entry_list中に見つけられる「Windows(R)」に対するRowID(Y2)が用いられて、Windows(R)ディレクトリ614に対するインデックスエントリの場所が突きとめられる(インデックスエントリ512)。
【0055】
インデックスエントリ512のDir_entry_listを調べて、このシステムは、入力パス名中の次のファイル名をサーチする(ステップ804および806)。この例では、ファイル名「Word」が入力パス中でファイル名「Windows(R)」の後に続く。したがって、このシステムは「Word」のアレイエントリに対するインデックスエントリ512のDir_entry_listをサーチする。このようなエントリはインデックスエントリ512のDir_entry_list中に存在し、「Windows(R)」が実際「Word」という名称の子を有していることを示す(ステップ808)。ステップ822において、入力パス中にまだファイル名があると判定され、よって制御はステップ824へと進む。
【0056】
「Word」に対するアレイエントリを見つけると、このシステムは、そのアレイエントリ中の情報を読出し、Wordディレクトリ616に対するインデックスエントリが階層インデックス510中のRowIDY3で見つかるということと、Wordディレクトリ616に属する特定の情報がファイルテーブル710中の行X3で見つかるということとを決定する。ワードディレクトリ616は単に特定されたパスの部分でありターゲットではないので、ファイルテーブル710は調べられない。その代わり、このシステムはRowID(Y3)を用いてWordディレクトリ616に対するインデックスエントリ514の場所を突きとめる(ステップ824)。
【0057】
階層インデックス510のRowIDY3で、このシステムはインデックスエントリ514を見つける。ステップ804において、入力パス名から次のファイル名「Example.doc」が選択される。ステップ806において、インデックスエントリ514のDir_entry_listがサーチされて、「Example.doc」に対するアレイエントリがあることを見つけ(ステップ808)、これは「Example.doc」がWordディレクトリ616の子であることを示す。このシステムはまた、Example.docが階層インデックス510においてインデックス付けの情報を全く有さないことと、Example.docに関する特定の情報をFileIDX4を用いてファイルテーブル710中に見つけることができるということも見つける。Example.docはアクセスされるターゲットファイル(すなわち入力パス中の最後のファイル名)であるので、制御はステップ820へ移り、ここでシステムはFileIDX4を用いてファイルテーブル710中の適切な行にアクセスし、かつその行の本体欄にストアされたファイル本体(BLOB)を抽出する。こうして、Example.docファイルがアクセスされる。
【0058】
このファイルのアクセスには、階層インデックス510のみが用いられた。テーブルのスキャンは必要なかった。ブロックのサイズおよびファイル名の長さが典型的なものであれば、少なくとも600のディレクトリエントリが1つのディスクブロックに適合することになり、典型的なディレクトリは600エントリ未満を有する。つまり、所与のディレクトリ中のディレクトリエントリのリストは、典型的には単一のブロックに適合することになる。言換えれば、インデックスエントリのDir_entry_listアレイ全体を含む階層インデックス510の各インデックスエントリは、典型的には単一のブロックに適合することになり、したがって単一のI/Oオペレーションにおいて読出され得る。
【0059】
階層インデックス510中のインデックスエントリからインデックスエントリへの移動において、インデックス中のさまざまなインデックスエントリが種々の異なるディスクブロックに存在する場合、ディスクアクセスをいくらか行なう必要があるという可能性もある。しかしながら、各インデックスエントリが単一のブロックに完全に適合すれば、ディスクアクセスの数は、そのパス中のディレクトリの数以下となる。平均のインデックスエントリのサイズが単一のディスクブロックに適合しなくとも、ディレクトリごとのディスクアクセスの数は一定の項(term)となり、ファイルシステム中のファイルの総数に伴って増加することはない。
【0060】
いくつかのファイルシステムが所有する階層的特徴をエミュレートするための技術についての以上の記述は単に例示的なものである。いくつかのファイルシステムおよびプロトコルの階層的な特徴をエミュレートするために他の技術も用いられ得る。さらに、階層的特徴を所有することさえないプロトコルもあり得る。このように、本発明は、いくつかのプロトコルの階層的特徴をエミュレートするための何らかの特定の技術に限定されることはない。さらに、本発明は、本質的に階層的であるプロトコルに限定されることもない。
【0061】
データベースにおける他のOSファイルシステム特徴のエミュレート
OSファイルシステムの階層的な構成以外に、ほとんどのOSファイルシステムの別の特徴は、それらがストアするファイルについて特定のシステム情報を保持していることである。一実施例によれば、このOSファイルシステム特徴もまた、データベースシステム内でエミュレートされる。具体的には、トランスレーションエンジン308が、あるファイルの「システム」データをデータベースサーバ204により管理されるファイルテーブル(たとえばファイルテーブル710)のある行にストアさせるコマンドを発する。一実施例によれば、ファイル内容のすべてまたは大部分が、その行のある欄に大規模バイナリオブジェクト(BLOB)としてストアされる。このBLOBの欄に加えて、このファイルテーブルはさらに、OSファイルシステムで実現されるものに対応する属性値をストアするための欄を含む。このような属性値は、たとえば、ファイルの所有者または作成者、ファイルの作成日、ファイルの最終変更データ、ファイルへのハードリンク、ファイル名、ファイルサイズ、およびファイルタイプを含む。
【0062】
トランスレーションエンジン308がデータベースサーバ204に対して何らかのファイルオペレーションを行なわせるようにデータベースコマンドを発する場合、それらのデータベースコマンドは、そのオペレーションに伴うファイルに関連付けられた属性を適切に変更させるステートメントを含む。たとえば、新たに作成されたファイルに対するファイルテーブル中に新たな行を挿入することに応答して、トランスレーションエンジン308はデータベースコマンドを発し、(1)誰がそのファイルを作成しているかをユーザに示す値をその行の「所有者」欄にストアし、(2)現在の日付を示す値をその行の「作成日」欄にストアし、(3)現在の日付および時刻を示す値を「最終変更」欄にストアし、(4)BLOBのサイズを示す値を「サイズ」欄にストアする。このファイルにおける後続のオペレーションに応答して、これらの欄中の値はこれらのオペレーションにより要求されたとおり変更される。たとえば、トランスレーションエンジン308が特定の行にストアされたファイルの内容を変更するデータベースコマンドを発すると、同じオペレーションの部分として、トランスレーションエンジン308は、その特定の行の「最終変更」値を更新するデータベースコマンドを発する。さらに、この変更がファイルサイズを変えるものであれば、トランスレーションエンジン308は、その特定の行の「サイズ」値を更新するデータベースコマンドも発する。
【0063】
ほとんどのOSファイルシステムの別の特徴は、各ファイルごとにセキュリティを提供する能力である。たとえば、Windows(R)NT、VMSおよびUNIX(R)のいくつかのバージョンは、各ファイルに関してさまざまなエンティティが有する権利を示すアクセス制御リストを保持する。本発明の一実施例によれば、このOSファイルシステム特徴は、「セキュリティテーブル」を保持することによりデータベースシステム内でエミュレートされ、このセキュリティテーブルの各行は、アクセス制御リストのあるエントリと同様の内容を含む。たとえば、このセキュリティテーブル中の行がファイルを特定する値をストアするためのある欄と、許可タイプ(たとえば読出、更新、挿入、実行、変更の許可)を表わす値をストアするための別の欄と、その許可が与えられたか否かを示すフラグをストアする別の欄と、そのファイルに対する許可の所有者を表わす値をストアする所有者欄とを含む。この所有者とは、ユーザID(userid)で特定される単一のユーザでも、グループID(groupid)で特定されるグループでもよい。グループの場合は、1つ以上の追加テーブルを用いてそのグループIDをそのグループのメンバーのユーザIDにマッピングする。
【0064】
データベースサーバ204により管理されるファイルテーブルにストアされたあるファイルにアクセスするデータベースコマンドを発する前に、トランスレーションエンジン308は、アクセスを要求しているユーザが特定されたファイルに対して要求されたアクセスのタイプを実行する許可を有することを検証するデータベースコマンドを発する。このようなプリアクセスデータベースコマンドにより、セキュリティテーブルからデータが検索され、アクセスを要求しているユーザにそのアクセスの実行が許可されているか否かが判定される。このように検索されたデータが、ユーザが要求された許可を有していないと示せば、トランスレーションエンジン308は要求されたオペレーションを実行するコマンドを発しない。その代わりに、トランスレーションエンジン308は要求の発生元のオペレーティングシステムへエラーメッセージを返す。このエラーメッセージに応答して、オペレーティングシステムは、アクセスを要求したアプリケーションに、そのアプリケーションがそのオペレーティングシステムのOSファイルシステムに保持されるあるファイルに許可なしにアクセスしようと試みた場合に送るであろうものと同じOSエラーメッセージを送る。このように、エラー状況下でも、データがOSファイルシステムではなく関係データベース中にストアされるという事実は、アプリケーションにはトランスペアレントである。
【0065】
異なるオペレーティングシステムにはファイルについての異なるタイプのシステム情報がストアされる。たとえば、あるオペレーティングシステムは「アーカイブ」フラグをストアするがアイコン情報はストアしない場合もあり、また別のものはアイコン情報をストアしアーカイブフラグをストアしない場合もある。ここに記載の技術を実現するデータベースシステムにより保持されるシステムデータの特定のセットは、各実現例ごとに変化し得る。たとえば、データベース204はオペレーティングシステム304aのOSファイルシステムによりサポートされるシステムデータのすべてをストアし得るが、オペレーティングシステム304bのOSファイルシステムによりサポートされるシステムデータはいくつかしかストアし得ない。これに代えて、データベースサーバはオペレーティングシステム304aおよび304bの両者によりサポートされるシステムデータの全部をストアしてもよく、またはオペレーティングシステム304aおよび304bのいずれか1つによりサポートされるシステムデータの一部をストアしてもよい。
【0066】
図3に示すように、データベースサーバ204は多数の別々のOSファイルシステムから発生したファイルをストアする。たとえば、オペレーティングシステム304aはオペレーティングシステム304bとは異なっていてもよく、また、オペレーティングシステム304aおよび304bの両者がオペレーティングシステム104とは異なっていてもよい。OSファイルシステム304aおよび304bは対比する特徴を有し得る。たとえば、OSファイルシステム304aはファイル名に文字「/」を含むことを可能にし得るのに対し、OSファイルシステム304bは可能にし得ない。一実施例によれば、このような状況において、トランスレーションエンジン308はOSファイルシステム特有の規則を実現するよう構成される。このように、アプリケーション302aがファイル名に文字「/」を含むファイルをストアしようと試みると、トランスレーションエンジン308はデータベースサーバ204にそのオペレーションを実行させるデータベースコマンドを発する。一方、アプリケーション302bがファイル名に文字「/」を含むファイルをストアしようと試みると、トランスレーションエンジン308はエラーを生じさせる。
【0067】
これに代えて、トランスレーションエンジン308は、すべてのオペレーティングシステムに対する規則の単一のセットを実現するよう構成され得る。たとえば、トランスレーションエンジン308は、ファイル名がトランスレーションエンジン308によりサポートされる1つのオペレーティングシステムにおいてさえも無効な場合には、たとえそのファイル名がそのファイル名を特定したコマンドを発したオペレーティングシステムにおいて有効であっても、エラーを生じさせることになる、という規則を実現し得る。
【0068】
OSファイルシステムコールのデータベースクエリへの変換
OSファイルシステム特徴をデータベースシステム内でエミュレートするための機構を構築することにより、OSファイルシステムのコールが、OSファイルシステムのコールを行なっているアプリケーションにより予期される機能性を失うことなく、トランスレーションエンジン308によってデータベースクエリへ変換され得る。それらのアプリケーションによりなされたこのOSファイルシステムコールは、それらが実行されているオペレーティングシステムにより提供されるOSファイルAPIを通じて行なわれる。たとえば、「C」プログラミング言語で書かれたプログラムに対しては、あるオペレーティングシステムのOSファイルAPIのインターフェイスを特定するために「stdio.h」と題されたソースコードファイルが用いられる。このstdio.hファイルはアプリケーションに含まれるので、これらのアプリケーションはOSファイルAPIを実現するルーチンをいかに呼出すかを知ることになる。
【0069】
OSファイルAPIを実現する特定のルーチンはオペレーティングシステムごとに変化し得るが、典型的には次のオペレーションを行なうためのルーチンを含む。ファイルを開く、ファイルから読出す、ファイルへ書込む、ファイル内をシークする、ファイルをロックする、およびファイルを閉じる。一般に、これらのI/Oコマンドから関係データベースコマンドへのマッピングは、
ファイルを開く=トランザクションを開始する、パスネームを導出しファイルを含む行の場所を突きとめる
ファイルへ書込む=更新する
ファイルから読出す=選択する
ファイルをロックする=ファイルに関連付けられた行をロックする
ファイル内へシークする=カウンタを更新する
ファイルを閉じる=トランザクションを完遂させる(Windows(R)OSファイルシステムプロトコルは、ファイルデータが書込まれる直前にディレクトリエントリが完遂するよう要求する。他のプロトコルは要求しない。)
以下により詳細に説明するように、ファイルの内容を受ける前であってもファイルの名称を可視にすることを予期するファイルシステムもある。これらのファイルシステムの関連で、「ファイルを開く」I/Oコマンドは、名称を書込むためのトランザクションの開始、名称を書込むためのトランザクションの完遂、および内容を書込むためのトランザクションの開始に対応する。
【0070】
一実施例によれば、カウンタを用いてファイル内の「現在場所」が追跡される。ファイルがBLOBとしてストアされる実施例において、カウンタはBLOBの始めからオフセットの形態をとり得る。「ファイルを開く」コマンドが実行されると、カウンタが作成され、問題のBLOBの実行開始アドレスを示す値に設定される。BLOBのカウンタはこの後データがBLOBから読出されるかまたはBLOBに書込まれることに応答して増分される。シークオペレーションは、このシークオペレーションのパラメータにより指示されたBLOB内の場所を指すようにカウンタを更新させる。一実施例によれば、これらのオペレーションは、ノリ(Nori)他により1997年10月31日に出願され「LOBロケータ(LOB LOCATORS)」と題された米国特許出願番号08/962,482号に記載されるようなLOBロケータを用いることにより容易になり、この出願の全内容をここに引用により援用する。
【0071】
いくつかのオペレーティングシステムにおいて、OSのロックはファイルを閉じても続く場合がある。この特徴をエミュレートするためには、ロックファイルコマンドが、セッションロックのリクエストに変換される。この結果、「トランザクションの完遂」がこのファイルを閉じるコマンドに応答して実行される場合、そのファイルに関連付けられた行におけるロックは自動的に解除されない。このように確立されたロックは、ファイルのロックを解除するコマンドに応答して明示的に、またはロックが得られたデータベースセッションの終了に応答して自動的に、のいずれかで解除される。
【0072】
進行中のI/Oオペレーション
あるファイルが作成されると、そのファイルが作成されるディレクトリはそのファイルの存在を示すように更新される。いくつかのOSファイルシステムにおいて、新たなファイルを示すようにディレクトリを変更することは、新たなファイルが完全に生成される前に完遂される。それらのOSファイルシステム用に設計されたアプリケーションには、その特徴をうまく利用するものもある。たとえば、あるアプリケーションは第1のファイルハンドルで新たなファイルを開き、そのファイル中へのデータの書込みへと進み得る。データが書込まれている間、同じアプリケーションが第2のファイルハンドルでそのファイルを開くことができる。
【0073】
この特徴をデータベース内でエミュレートすることには特殊な問題が伴う。というのは、一般に、データベーストランザクションが完遂するまで、別のトランザクションはそのトランザクションによりなされた変更を見ることができないからである。たとえば、第1のデータベーストランザクションが第1の「開く」コマンドに応答して開始されたとする。第1のトランザクションは特定のディレクトリ中にファイルが存在することを示すようにディレクトリテーブルを更新し、その後、ファイルを含む行を挿入するようにファイルテーブルを更新する。同じアプリケーションが発した第2の「開く」コマンドに応答して第2のデータベーストランザクションが開始されると、第2のデータベーストランザクションには、ディレクトリテーブルに対する変更も、ファイルテーブル中の新たな行も、第1のトランザクションが完遂するまで見えない。
【0074】
本発明の一実施例によれば、作成進行中のファイルのディレクトリエントリを見る能力は、そのファイルに対する行をファイルテーブル中に挿入するのに用いるトランザクションとは別のトランザクションとしてディレクトリテーブルの更新を行なわせることにより、データベースシステム内でエミュレートされる。このように、第1の開くコマンドに応答して、トランスレーションエンジン308はデータベースコマンドを発し、(1)第1のトランザクションを開始させ、(2)新たなファイルの存在を示すようにディレクトリテーブルを変更し、(3)第1のトランザクションを完遂させ、(4)第2のトランザクションを開始させ、(5)このファイルのある行をファイルテーブル中に挿入し、(6)第2のトランザクションを完遂させる。ディレクトリテーブルに対する変更をファイルテーブルに対する変更とは別に完遂させることにより、第2の開くコマンドに応答して開始される第3のトランザクションは、ファイルテーブル中への挿入がまだ進行している間にディレクトリテーブル内のエントリを見ることができる。第2のトランザクションに失敗すれば、このディレクトリは内容を持たずにファイルのエントリとともに残されることになる。
【0075】
トランスレーションエンジン
本発明の一実施例によれば、トランスレーションエンジン308は2つの層で設計される。これらの層は図4に示される。図4を参照して、トランスレーションエンジン308は、プロトコルサーバ層およびDBファイルサーバ408層を含む。DBファイルサーバ408は、アプリケーションが代替的なAPI(ここではDBファイルAPIと称す)を通じて、データベースサーバ204により管理されるデータベースにストアされたデータにアクセスできるようにする。DBファイルAPIは、OSファイルAPIとデータベースAPIとの両方の局面を組合せる。具体的には、DBファイルAPIは、従来のOSファイルAPIによりサポートされたものと同様のファイルオペレーションをサポートする。
【0076】
しかしながら、OSファイルAPIとは異なり、DBファイルAPIはトランザクションのデータベースAPIの概念を組入れる。すなわち、DBファイルAPIにより、アプリケーションが、ファイルオペレーションのセットが原子単位で実行されることを特定できるようになる。トランザクションが行なわれたファイルシステムを有することの利点について、以下により詳細に述べる。
【0077】
DBファイルサーバ
DBファイルサーバ408は、DBファイルAPIコマンドをデータベースコマンドに変換するという役割を担う。DBファイルサーバ408が受けたDBファイルAPIコマンドは、トランスレーションエンジン308のプロトコルサーバ層から来るものであってもよく、または、DBファイルAPIを通じてコールを発することによりファイルオペレーションを行なうよう特に設計されたアプリケーション(たとえばアプリケーション410)から直接のものであってもよい。
【0078】
一実施例によれば、DBファイルサーバ408はオブジェクト指向である。このように、DBファイルサーバ408により供給されるルーチンがあるオブジェクトのインスタンス生成により、またそのオブジェクトに関連付けられた方法をコールすることにより呼出される。ある実現例において、DBファイルサーバ408は次の方法を含む「トランザクション」オブジェクトクラスを規定する。挿入、保存、更新、削除、完遂およびロールバック。DBファイルAPIは、外部エンティティがこのトランザクションオブジェクトクラスのインスタンス生成を行ない使用できるようにする、インターフェイスを提供する。
【0079】
具体的には、外部エンティティ(たとえばアプリケーション410またはプロトコルサーバ)がDBファイルサーバ408のコールを行ないトランザクションオブジェクトのインスタンスを生成すると、DBファイルサーバ408はデータベースサーバ204に新たなトランザクションを始めさせるデータベースコマンドを送る。この外部エンティティはこの後トランザクションオブジェクトの方法を呼出す。ある方法を呼出すことは、結果としてDBファイルサーバ408に対するコールとなる。DBファイルサーバ408はこのコールに応答して、データベースサーバ204に対応のデータベースコマンドを発する。所与のトランザクションオブジェクトの方法の呼出に応答して行なわれるデータベースオペレーションはすべて、この所与のトランザクションオブジェクトに関連付けられたデータベーストランザクションの部分として行なわれる。
【0080】
重要なことには、ある単一のトランザクションオブジェクトに対して呼出された方法は複数のファイルオペレーションを伴う場合がある。たとえば、アプリケーション410は以下のようにDBファイルサーバ408と対話し得る。アプリケーション410は、DBファイルAPIを通じてコールすることによりトランザクションオブジェクトTXO1のインスタンス生成を行なう。これに応答して、DBファイルサーバ408は、データベースサーバ204内でトランザクションTX1を開始するデータベースコマンドを発する。アプリケーション410はTXO1の更新方法を呼出し、データベースサーバ204により管理されるデータベース中にストアされたファイルF1を更新する。これに応答して、DBファイルサーバ408はデータベースサーバ204に、要求された更新をトランザクションTX1の部分として行なわせるデータベースコマンドを発する。アプリケーション410はTXO1の更新方法を呼出し、データベースサーバ204により管理されるデータベース中にストアされた第2のファイルF2を更新する。これに応答して、DBファイルサーバ408は、データベースサーバ204に、要求された更新をトランザクションTX1の部分として行なわせるデータベースコマンドを発する。この後アプリケーション410は、TXO1の完遂方法を呼出す。これに応答して、DBファイルサーバ408は、データベースサーバ204にTX1を完遂させるデータベースコマンドを発する。ファイルF2への更新に失敗した場合、TXO1のロールバック方法が呼出され、ファイルF1の更新を含む、TX1によりなされたすべての変更がロールバックされる。
【0081】
ここではトランザクションオブジェクトを用いるDBファイルサーバを参照して技術が述べられてきたが、他の実現例も可能である。たとえば、DBファイルサーバ内で、トランザクションではなくファイルを表わすのにオブジェクトを用いることもできる。このような実現例において、ファイルオブジェクトの方法を呼出すことにより、またオペレーションが実行されようとするトランザクションを特定するデータをそれへ渡すことにより、ファイルオペレーションが行なわれ得る。したがって、本発明は、オブジェクトクラスの何らかの特定のセットを実現するDBファイルサーバに限定されない。
【0082】
説明の目的で、図4に表わす実施例は、データベースAPIを通じてデータベースサーバ204と通信する処理実行外部データベースサーバ204としてDBファイルサーバ408を示す。しかしながら、代替的実施例によれば、DBファイルサーバ408の機能性はデータベースサーバ204に組込まれている。DBファイルサーバ408をデータベースサーバ204に組込むことにより、DBファイルシステムの使用中に生成される処理間通信の量が減じられる。DBファイルサーバ408をデータベースサーバ204に組込むことにより作り出されるデータベースサーバは、したがって、データベースサーバ204により管理されるデータにアクセスするための2つの代替的なAPIを、すなわちDBファイルAPIおよびデータベースAPI(SQL)を提供する。
【0083】
プロトコルサーバ
トランスレーションエンジン308のプロトコルサーバ層は、特定のプロトコルとDBファイルAPIコマンド間での変換を行なうという役割を担う。たとえば、プロトコルサーバ406aは、オペレーティングシステム304aから受けたI/Oコマンドを、それがDBファイルサーバ408に送るDBファイルAPIコマンドに変換する。プロトコルサーバ406aはまた、DBファイルサーバ408から受けたDBファイルAPIコマンドを、それがオペレーティングシステム304aに送るI/Oコマンドに変換する。
【0084】
実際には、プロトコルとオペレーティングシステムとは1対1対応になっていない。むしろ、オペレーティングシステムの多くは1より多い数のプロトコルをサポートし、またプロトコルの多くは、1より多い数のオペレーティングシステムによりサポートされる。たとえば、単一のオペレーティングシステムが1つ以上のネットワークファイルプロトコル(SMB、FTP、NFS)、Eメールプロトコル(SMTP、IMAP4)、およびウェブプロトコル(HTTP)に対して固有のサポートをもたらす場合もある。さらに、異なるオペレーティングシステムがサポートするプロトコルのセット間にはオーバーラップがよく起こる。しかしながら、例示の目的で、オペレーティングシステム304aがあるプロトコルをサポートし、オペレーティングシステム304bが別のプロトコルをサポートするという、単純化された環境が示される。
【0085】
I/O API
上述したように、I/OコマンドをDBファイルコマンドに変換するためにプロトコルサーバが用いられる。プロトコルサーバとそれらの通信相手のOSファイルシステムとの間のインターフェイスは、包括的にラベル付けされたI/O APIである。しかしながら、あるプロトコルサーバにより与えられた特定のI/O APIは、(1)プロトコルサーバの通信相手のエンティティおよび(2)プロトコルサーバがいかにそのエンティティに現れるようにするか、にともに依存する。たとえば、オペレーティングシステム304aはMicrosoft Windows(R)NTであってもよく、プロトコルサーバ406aはMicrosoft Windows(R)NTに対するデバイスドライバとして出現するよう設計されてもよい。この状況下で、プロトコルサーバ406aによってオペレーティングシステム304aに提示されたI/O APIは、Windows(R)NTにより理解されるデバイスインターフェイスのタイプとなるであろう。Windows(R)NTは、何らかのストレージ装置と通信するのと同じように、プロトコルサーバ406aと通信するとされる。プロトコルサーバ406aにストアされたファイルおよびそこから検索されたファイルが実際にはデータベースサーバ204により保持されるデータベースにストアされまたそこから検索されているという事実は、Windows(R)NTには完全にトランスペアレントである。
【0086】
トランスレーションエンジン308により用いられるいくつかのプロトコルサーバがそれらのそれぞれのオペレーティングシステムにデバイスドライバインターフェイスを提示し得るのに対し、他のプロトコルサーバは他のタイプのエンティティとして出現し得る。たとえば、オペレーティングシステム304aはMicrosoft Windows(R)NTオペレーティングシステムであってもよく、プロトコルサーバ406aはそれ自身をデバイスドライバとして提示するのに対し、オペレーティングシステム304bはMicrosoft Windows(R)95オペレーティングシステムであって、プロトコルサーバ406bがそれ自身をシステムメッセージブロック(SMB)サーバとして提示することもある。後者の場合、プロトコルサーバ406bは、典型的にはオペレーティングシステム304bとは別のマシン上で実行していることになり、オペレーティングシステム304bとプロトコルサーバ406bとの間の通信はネットワーク接続を介して起こることになる。
【0087】
上記の例において、プロトコルサーバにより扱われるI/OコマンドのソースはOSファイルシステムである。しかしながら、トランスレーションエンジン308はOSファイルシステムのコマンドとともに用いることに限定されない。むしろ、DBファイルコマンドと何らかのタイプのI/Oプロトコルとの間で変換を行なうために、プロトコルサーバが設けられ得る。OSファイルシステムにより用いられるI/Oプロトコル以外にも、プロトコルサーバがそれに対して設けられ得る他のプロトコルとしては、たとえば、ファイル転送プロトコル(FTP:File Transfer Protocol)や、電子メールシステム(POP3またはIMAP4)により用いられるプロトコルが挙げられる。
【0088】
OSファイルシステムとともに働くプロトコルサーバにより提供されるインターフェイスが特殊なOSにより指示されるのと同様、非OSファイルシステムとともに働くプロトコルサーバにより提供されるインターフェイスは、I/Oコマンドを発するであろうエンティティに基づいて変化することになる。たとえば、FTPプロトコルに従ってI/Oコマンドを受けるように構成されたプロトコルサーバは、FTPサーバのAPIを提供するであろう。同様に、HTTPプロトコル、POP3プロトコルおよびIMAP4プロトコルに従ってI/Oコマンドを受けるように構成されたプロトコルサーバは、それぞれ、HTTPサーバ、POP3サーバおよびIMAP4サーバのAPIを提供するであろう。
【0089】
OSファイルシステムと同様、非OSファイルプロトコルの各々は、そのファイルに対して保持される特定の属性を予測する。たとえば、ほとんどのOSファイルシステムが、あるファイルの最終変更日を示すデータをストアするのに対し、電子メールシステムは各Eメールメッセージに対して、そのEメールメッセージが読まれたか否かを示すデータをストアする。特定のプロトコルの各々に対するプロトコルサーバは、そのプロトコルのセマンティクスが確実にデータベースファイルシステム中でエミュレートされるために要求される論理を実現する。
【0090】
トランザクション処理されたファイルシステム
データベースシステム内で、オペレーションは一般にトランザクションの部分として行なわれる。データベースシステムは、あるトランザクションの部分であるオペレーションのすべてを単一の原子操作(atomic operation)として行なう。すなわち、オペレーションのすべてがうまく完了するか、またはオペレーションのいずれも実行されないか、のいずれかである。トランザクションの実行中、あるオペレーションが実行され得なければ、そのトランザクションの以前実行されたオペレーションがすべて取消されるか、または「ロールバックされる」。
【0091】
データベースシステムとは対照的に、OSファイルシステムはトランザクションに基づくものではない。したがって、大規模なファイルオペレーションに失敗すれば、そのオペレーションのうちその失敗以前に実行された部分は残る。不完全なファイルオペレーションを取消すことに失敗すると、ディレクトリ構造およびファイルの破損につながるおそれがある。
【0092】
本発明の一局面によれば、トランザクション処理されたファイルシステムが設けられる。上述したように、トランスレーションエンジン308はI/Oコマンドをデータベースサーバ204に送られるデータベースステートメントへとコンバートする。特定されたI/Oオペレーションを実行するためにトランスレーションエンジン308によって送られた一連のステートメントは、トランザクション開始(begin transaction)ステートメントにより先行され、トランザクション終了(close transaction)ステートメントで終わる。結果として、データベースサーバ204によるそれらのステートメントの実行中に何らかの失敗が起これば、そのトランザクションの部分としてデータベースサーバ204によりなされる変更はすべてその失敗の時点までロールバックされることになる。
【0093】
トランザクションの失敗を引起す事態は、I/Oコマンドの発生元のシステムに基づいて変化し得る。たとえば、OSファイルシステムは署名の概念をサポートすることができ、ここであるファイルのソースを特定するデジタル「署名」はそのファイルに付加される。署名されたファイルをストアするために開始されたトランザクションは、たとえば、そのストアされているファイルの署名が予測どおりの署名でない場合、失敗するおそれがある。
【0094】
オンザフライ・インテリジェントファイルのコンバート
本発明の一実施例によれば、ファイルは、関係データベースに挿入される前に処理され、それらがその関係データベースから検索されると再び処理される。図9はインバウンドおよびアウトバウンドのファイル処理を行なうのに用いられるDBファイルサーバ308の機能的構成要素を示すブロック図である。
【0095】
図9を参照して、トランスレーションエンジン308は、レンダリングユニット904およびパーシングユニット902を含む。一般に、パーシングユニット902は、ファイルのインバウンド処理を行なう役割を担い、レンダリングユニット904はファイルのアウトバウンド処理を行なう役割を担う。これらの機能的ユニットの各々について、ここでより詳細に述べることにする。
【0096】
インバウンドのファイル処理
インバウンドのファイルは、DBファイルAPIを介してDBファイルサーバ408に渡される。インバウンドのファイルを受取ると、パーシングユニット902はそのファイルのファイルタイプを特定し、その後、そのファイルタイプに基づいてそのファイルをパーシングする。パーシング処理中、パーシングユニット902はパーシングされているファイルから構造化された情報を抽出する。この構造化された情報とは、たとえば、パーシングされているファイルについての情報、またはこのファイルの論理的に別個の構成要素もしくはフィールドを表わすデータを含み得る。この構造化情報は、構造化情報の発生元のファイルととともにデータベース中にストアされる。その後、データベースサーバに対してクエリが出され、このように抽出された構造化情報が特定のサーチ条件を満たすか否かに基づいてファイルを選択かつ検索し得る。
【0097】
ある文書のパーシングを行なうためにパーシングユニット902により用いられる特定の技術、およびそれにより生成される構造化されたデータは、パーシングユニット902に渡された文書のタイプに基づいて変化することになる。したがって、何らかのパーシングオペレーションを行なう前に、パーシングユニット902はこの文書のファイルタイプを特定する。あるファイルのファイルタイプを決定するには、さまざまな要因が考慮され得る。たとえば、DOSまたはWindows(R)のオペレーティングシステムでは、あるファイルのファイルタイプは、そのファイルのファイル名中の拡張子により示されることが多い。すなわち、ファイル名が「.txt」で終わる場合、パーサユニット902はそのファイルをテキストファイルであると分類し、テキストファイル特有のパーシング技術をそのファイルに与える。同様に、ファイル名が「.doc」で終わる場合は、パーサユニット902はそのファイルをMicrosoft Word文書であると分類し、Microsoft Word特有のパーシング技術をそのファイルに与える。これに対して、Macintoshオペレーティングシステム(Macintosh Operating System)は、あるファイルに対するファイルタイプ情報をそのファイルとは別に保持される属性としてストアする。
【0098】
あるファイルのファイルタイプを決定するためにパーシングユニット902が考慮し得る他の因子として、たとえば、そのファイルが位置付けられるディレクトリが挙げられる。したがって、パーサユニット902は、WordPerfect文書として\WordPerfect\文書ディレクトリにストアされるすべてのファイルを、それらのファイルのファイル名にかかわらず、分類およびパーシングするよう構成され得る。
【0099】
これに代えて、インバウンドのファイルのファイルタイプとリクエスト元のエンティティが要求するファイルタイプとの両者が、DBファイルサーバ408に対して提供される情報によって特定されるかまたはそれを通じて推定される場合もある。たとえば、あるウェブブラウザがメッセージを送る場合、そのメッセージは典型的にはそのブラウザについての情報(たとえばブラウザのタイプ、バージョンなど)を含む。あるウェブブラウザがHTTPプロトコルサーバを通じてあるファイルをリクエストする場合、この情報はDBファイルサーバ408に伝達される。この情報に基づいて、レンダリングユニット904はそのブラウザの能力(capability)についての情報を調べ、またそれらの能力から最良のファイルタイプを推定してブラウザへ運ぶこともできる。
【0100】
上述したように、パーシングユニット902により用いられる特定のパーシング技術、およびこのように生成された構造化データのタイプは、パーシングされているファイルのタイプに基づいて変化することになる。たとえば、パーシングユニット902により生成された構造化データは、埋込メタデータ、導出(derived)メタデータおよびシステムメタデータを含み得る。埋込メタデータはファイル自体に埋込まれた情報である。導出メタデータは、ファイル内に含まれておらずそのファイルを解析することにより導出され得る情報である。システムメタデータは、ファイルの発生元のシステムにより提供されたファイルについてのデータである。
【0101】
たとえば、アプリケーション410がMicrosoft Word文書をパーシングユニット902に渡すとする。パーシングユニット902はその文書をパーシングしてそのファイル内に埋込まれているファイルについての情報を抽出する。Microsoft Word文書に埋込まれる情報としては、たとえば、文書の作者、文書が割当てられるカテゴリ、および文書についてのコメントを示すデータが挙げられる。
【0102】
Word文書についての埋込情報の場所を突きとめ抽出するのに加えて、パーサ902はその文書についての情報の導出もし得る。たとえば、パーサ902はこのWord文書をスキャンしてこの文書に含まれるページ数、段落数および語数を決定し得る。最後に、この文書が発生したシステムは、この文書のサイズ、作成日、最終変更日、およびファイルタイプを示すデータをパーシングユニット902に供給し得る。
【0103】
ある文書のファイルタイプがより構造化されるほど、この文書から構造化されたデータの特定のアイテムを抽出しやすくなる。たとえば、HTML文書は典型的には、特定のフィールド(タイトル、ヘッディング1、ヘッディング2など)の初めと終わりとを特定するデリミタまたは「タグ」を有する。これらのデリミタはパーシングユニット902により用いられ、HTML文書をパーシングすることによって、区切られたフィールドのいくつかまたはすべてに対してメタデータのアイテムをもたらし得る。同様に、XMLファイルは高度に構造化されており、XMLパーサはXML文書中に含まれるフィールドのいくつかまたはすべてに対するメタデータの別のアイテムを抽出することができるであろう。
【0104】
一旦あるファイルに対してパーシングユニット902が構造化データを生成していれば、DBファイルサーバ408はデータベースサーバ204にデータベースコマンドを発し、そのファイルをファイルテーブル(たとえばファイルテーブル710)のある行に挿入させる。一実施例によれば、このように発せられたデータベースコマンドはこのファイルをその行のある欄におけるBLOBとしてストアし、そのファイルについて生成された構造化データのさまざまなアイテムを同じ行の他の欄にストアする。
【0105】
これに代えて、あるファイルに対する構造化データアイテムのいくつかまたはすべてをファイルテーブルの外部にストアすることもできる。このような状況下で、あるファイルに関連付けられた構造化データをストアする行は、そのファイルを特定するデータを典型的に含むことになる。たとえば、Word文書がファイルテーブルの行R20にストアされ、そのWord文書に対するシステムメタデータ(たとえば作成日、変更日など)がシステム属性テーブルの行R34にストアされると想定する。このような状況において、ファイルテーブルのR20およびシステム属性テーブルのR34の両者が典型的にはWord文書に対する固有の識別子をストアするFileID欄を含むことになる。それから、クエリにより、ファイルテーブル中の行とシステム属性テーブル中の行とをFileID値に基づいて結合する結合ステートメントを発することで、そのファイルとそのファイルについてのシステムメタデータとの両方を検索することができる。ファイル「クラス」に関連付けられたテーブル中のファイル属性をストアするための技術について以下により詳細に説明する。
【0106】
アウトバウンドのファイル処理
アウトバウンドのファイルは、データベースサーバ204に送られたデータベースコマンドに応答して検索される情報に基づいてレンダリングユニット904により構築される。一旦構築されると、アウトバウンドのファイルはDBファイルAPIを通じてそれをリクエストしたエンティティへと運ばれる。
【0107】
重要なことには、レンダリングユニット904により生じたアウトバウンドファイルのファイルタイプ(ターゲットファイルタイプ)は、必ずしもそのアウトバウンドファイルを構築するのに用いられたデータを生じたファイルと同じファイルタイプ(ソースファイルタイプ)でなくてもよい。たとえば、レンダリングユニット904はもともとデータベース内にWordファイルとしてストアされていたデータに基づいてテキストファイルを構築し得る。
【0108】
さらに、アウトバウンドファイルを要求するエンティティは、そのアウトバウンドファイルが構築されるもとのファイルを生じたエンティティとは全く別のプロトコルを用いて全く別のプラットフォーム上にあってもよい。たとえば、プロトコルサーバ406bがIMAP4サーバインターフェイスを実現し、プロトコルサーバ406aがHTTPサーバインターフェイスを実現する場合を想定する。これらの状況下で、Eメールアプリケーションから発生するEメール文書はプロトコルサーバ406bを通じてデータベース内にストアされ、プロトコルサーバ406aを通じてWebブラウザによりデータベースから検索され得る。この筋書きでは、パーシングユニット902がこのEメールのファイルタイプ(たとえばRFC822)に関連付けられたパーシング技術を呼出し、レンダリングユニットがデータベースから検索されたEメールデータからHTML文書を構築するレンダリングルーチンを呼出すであろう。
【0109】
パーサおよびレンダラの登録
上述したように、あるファイルに施されるパーシング技術はそのファイルのタイプにより指示される。同様に、あるファイルに施されるレンダリング技術はそのファイルのソースタイプとそのファイルのターゲットタイプとの両者により指示される。すべてのコンピュータプラットホームにわたって存在するファイルタイプの数は莫大である。したがって、すべての公知のファイルタイプを扱うパーシングユニット902を築くのも、ファイルタイプからファイルタイプへのすべての可能なコンバートを扱うレンダリングユニット904を築くのも実用的でない。
【0110】
本発明の一実施例によれば、ファイルタイプの急増により引き起こされる問題は、タイプ特有のパーシングモジュールをパーシングユニット902に登録可能にすることにより、またタイプ特有のレンダリングモジュールをレンダリングユニット904に登録可能にすることにより、対処される。タイプ特有のパーシングモジュールとは、ある特定のファイルタイプに対してパーシング技術を実現するモジュールのことである。たとえば、Word文書は、Word文書パーシングモジュールを用いてパーシングされるのに対し、POP3のEメール文書はPOP3 Eメールパーシングモジュールを用いてパーシングされる。
【0111】
タイプ特有のパーシングモジュールと同様、タイプ特有のレンダリングモジュールとは、1つ以上のソースファイルタイプに関連付けられたデータを1つ以上のターゲットファイルタイプにコンバートするための技術を実現するモジュールのことである。たとえば、タイプ特有のレンダリングモジュールは、Word文書をテキスト文書にコンバートするために設けられ得る。
【0112】
ソースファイルタイプとターゲットファイルタイプとが同じであってもコンバートが必要となる場合もある。たとえば、パーシングされデータベース内に挿入されると、XML文書の内容は単一のBLOBには保持されず、多数のテーブルの多数の欄にわたって広がり得る。その場合は、たとえそのデータがもはやXMLファイルとしてストアされていなくとも、XMLがそのデータのソースファイルタイプである。タイプ特有のレンダリングモジュールは、そのデータからXML文書を構築するために設けられ得る。
【0113】
パーシングユニット902がインバウンドのファイルを受けると、パーシングユニット902はそのファイルのファイルタイプを決定し、タイプ特有のパーシングモジュールがそのファイルタイプに対して登録されているか否かを判定する。タイプ特有のパーシングモジュールがそのファイルタイプに登録されていれば、パーシングユニット902はそのタイプ特有のパーシングモジュールにより与えられたパーシングルーチンをコールする。それらのパーシングルーチンはインバウンドファイルをパーシングしてメタデータを生成し、このメタデータはこの後そのファイルとともにデータベース内にストアされる。タイプ特有のパーシングモジュールがそのファイルタイプに対して登録されていなければ、パーシングユニット902はエラーを生じるか、あるいは汎用のパーシング技術をそのファイルに施し得る。この汎用のパーシング技術にはファイルの内容についての知識が何もないので、そのファイルに対して生成できる有用なメタデータに関してこの汎用のパーシング技術が制限されることになる。
【0114】
レンダリングユニット904がファイルリクエストを受けると、レンダリングユニット904はデータベースコマンドを発し、そのファイルに関連付けられるデータを検索する。そのデータは、ファイルのソースファイルタイプを示すメタデータを含む。レンダリングユニット904はこの後、タイプ特有のレンダリングモジュールがそのソースファイルタイプに対して登録されているか否かを判定する。タイプ特有のレンダリングモジュールがそのソースファイルタイプに対して登録されていれば、そのタイプ特有のレンダリングモジュールにより与えられたレンダリングルーチンを呼出してファイルを構築し、こうして構築されたファイルを、そのファイルをリクエストしているエンティティへ与える。
【0115】
タイプ特有のレンダリングモジュールによってどのターゲットファイルタイプを選択すべきかを決定するためにさまざまな因子が用いられ得る。ファイルをリクエストしているエンティティが、それが要求するファイルのタイプを明示的に示す場合もある。たとえばテキスト編集者はテキストファイルのみ扱うことができる。テキスト編集者はソースファイルタイプがWord文書であるファイルをリクエストできる。このリクエストに応答して、Word特有のレンダリングモジュールが呼出され、これが、要求されたターゲットファイルタイプに基づいて、このWord文書をテキストファイルにコンバートする。このテキストファイルはその後テキスト編集者へ運ばれる。
【0116】
他には、ファイルをリクエストしているエンティティが多数のファイルタイプをサポートし得る場合もある。一実施例によれば、タイプ特有のレンダリングモジュールは、(1)リクエスト元のエンティティとタイプ特有のレンダリングモジュールとの両者によりサポートされるファイルタイプのセットを特定し、(2)そのセットにおいて最良のターゲットファイルタイプを選択する、という論理を組込む。この最良のターゲットファイルの選択には、問題のファイル特有の特徴を含む、さまざまな因子を考慮に入れることができる。
【0117】
たとえば、(1)DBファイルサーバ408があるファイルに対するリクエストを受け、(2)そのファイルのソースファイルタイプがそのファイルは「BMP」イメージであると示し、(3)このリクエストが「GIF」、「TIF」および「JPG」イメージをサポートするエンティティにより開始されており、(4)BMPソースタイプ特有のレンダリングモジュールが「GIF」、「JPG」および「PCX」のターゲットファイルタイプをサポートする、と仮定する。このような状況下で、BMPソースタイプ特有のレンダリングモジュールは、「GIF」および「JPG」の両者が可能性のあるターゲットファイルタイプであると決定する。これら2つの可能性のあるターゲットファイルタイプから選択するために、BMPソースタイプ特有のレンダリングモジュールは、そのファイルについての情報(その解像度および色の深みを含む)を考慮に入れ得る。この情報に基づいて、BMPソースタイプ特有のレンダリングモジュールはJPGが最良のターゲットファイルタイプであると決定でき、このBMPファイルをJPGファイルにコンバートするよう進むことができる。その結果生じるJPGファイルはこの後、リクエスト元のエンティティに運ばれる。
【0118】
一実施例によれば、タイプ特有のパーシングおよびレンダリングモジュールは、データベーステーブルにモジュールの能力を示す情報をストアすることにより登録される。たとえば、タイプ特有のレンダリングモジュールに対するエントリは、ソースファイルタイプがXMLでありリクエスト元のエンティティがWindows(R)に基づいたWebブラウザである場合に用いるべきであることを示し得る。タイプ特有のパーシングモジュールに対するエントリは、ソースファイルタイプが.GIFイメージである場合にそれを用いるべきであるということを示し得る。
【0119】
DBファイルサーバ408がDBファイルAPIを通じてあるファイルに関係するコマンドを受けると、DBファイルサーバ408は発生時のファイルタイプと、そのコマンドを発したエンティティのアイデンティティとを決定する。DBファイルサーバ408はこの後データベースサーバ204にデータベースコマンドを発し、これによってデータベースサーバ204に、登録されたモジュールのテーブルをスキャンさせ、現状で用いるのに適切なモジュールを選択させる。インバウンドのファイルの場合、適切なパーシングモジュールが呼出され、データベースに挿入される前にファイルをパーシングする。アウトバウンドのファイルの場合、適切なレンダリングモジュールが呼出され、データベースから検索されたデータからアウトバウンドのファイルを構築する。
【0120】
本発明のある実施例によれば、DBファイルシステムにより、オブジェクト指向技術を用いてファイルのクラスを規定することが可能になり、ここで各ファイルタイプは1つのファイルクラスに属し、ファイルクラスは他のファイルクラスからの属性を継承することができる。このようなシステムにおいて、あるファイルのファイルクラスはそのファイルに対する適切なパーサおよびレンダラを決定するのに用いられる因子となり得る。ファイルクラスの使用については以下により詳細に述べることにする。
【0121】
ストアドクエリディレクトリ
上記で説明したように、階層ディレクトリ構造は、各行が1つのファイルに対応するファイルテーブル710を用いて、データベースシステムにおいて実現され得る。特定されたファイルに関連付けられた行の場所をファイルのパス名に基づいて効率的に突きとめるために階層インデックス510が採用され得る。
【0122】
図5および図7に示す実施例において、各ディレクトリの子ファイルが明示的に列挙される。特に、各ディレクトリの子ファイルはそのディレクトリに関連付けられるインデックスエントリのDir_entry_listにおいて列挙される。たとえば、インデックスエントリ512はWindows(R)ディレクトリ614に対応し、インデックスエントリ512のDir_entry_listは「Word」および「Access」をWindows(R)ディレクトリ614の子ファイルとして明示的に列挙する。
【0123】
本発明の一局面によれば、いくつかまたはすべてのディレクトリの子ファイルが、明示的に列挙されるのではなく、ストアドクエリのサーチ結果に基づいて動的に決定される、ファイルシステムが提供される。このようなディレクトリはここではストアドクエリディレクトリと称す。
【0124】
たとえば、ファイルシステムのユーザが拡張子.docを有するすべてのファイルを単一のディレクトリにグループ分けしたいとする。従来のファイルシステムでは、ユーザはディレクトリを作成し、拡張子.docを有するすべてのファイルをサーチし、その後このサーチで見つかったファイルを新たに作成したディレクトリへ移動させるか、新たに作成したディレクトリとサーチで見つけたファイルとの間にハードリンクを作成するか、のいずれかを行なう。残念ながら、この新たに作成されたディレクトリの内容はサーチが行なわれた時点でのシステムの状態を正確に反映しているにすぎない。仮に、.doc拡張子を有さない名称に変えたとしても、フィールドはディレクトリ内に残ることになる。さらに、新規ディレクトリが確立された後に他のディレクトリ内に作成された.doc拡張子を有するファイルは、この新規ディレクトリには含まれない。
【0125】
新規ディレクトリのメンバーシップを統計的に規定するのではなく、このディレクトリのメンバーシップはストアドクエリにより規定され得る。拡張子.docを有するファイルを選択するストアドクエリは以下のように現われ得る。
【0126】
Q1:
SELECT* from files_table
但し、
files_table.Extension = “doc”
図7を参照して、テーブル710に対して実行されると、クエリQ1は、Example.doc」と題された2つの文書に対する行である、行R4および行R12を選択する。
【0127】
本発明の一実施例によれば、クエリQ1などのクエリを階層インデックス510におけるディレクトリエントリにリンクするための機構が設けられる。階層インデックス510の横断中、そのようなリンクを含むディレクトリエントリに遭遇すると、このリンクにより特定されるクエリが実行される。このクエリにより選択された各ファイルは、ちょうどそのファイルがディレクトリエントリをストアするデータベーステーブル中の明示的なエントリであったかのように、ディレクトリエントリに関連付けられるディレクトリの子として扱われる。
【0128】
たとえば、ユーザがWord616の子であるディレクトリ「Documents」の作成を望み、このドキュメントディレクトリが拡張子.docを有するすべてのファイルを含むことを望むとする。本発明の一実施例によれば、このユーザは、このディレクトリに属することになるファイルに対する選択条件を特定する、クエリを設計する。この例では、ユーザはクエリQ1を生成し得る。このクエリはこの後データベースシステム内にストアされる。
【0129】
他のタイプのディレクトリと同様、Documentディレクトリに対する行がファイルテーブル710に加えられ、このDocumentディレクトリに対するインデックスエントリが階層インデックス510に加えられる。さらに、Wordディレクトリに対するインデックスエントリのDir_Entry_listは、新規なDocumentディレクトリがWordディレクトリの子であることを示すように更新される。Dir_Entry_listにおける子を明示的にリストするのではなく、このDocumentディレクトリに対する新規ディレクトリエントリは、ストアドクエリに対するリンクを含む。
【0130】
図10および図11はそれぞれ、Documentsディレクトリに対して適切なエントリが作成された後の階層インデックス510とファイルテーブル710との状態を示す。図10を参照して、Documentsディレクトリに対してインデックスエントリ1004が作成されている。Documentsディレクトリの子はストアドクエリの結果セットに基づいて動的に決定されるので、インデックスエントリ1004のDir_entry_listフィールドはヌル(null)である。子ファイルを静的に列挙する代わりに、インデックスエントリ1004は、Documentsディレクトリの子ファイルを決定するために実行されることになっているストアドクエリ1002へのリンクを含む。
【0131】
Documentsディレクトリに対するインデックスエントリ1004の作成に加えて、Wordディレクトリに対する既存のインデックスエントリ514は、DocumentsがWordディレクトリの子であることを示すように更新される。具体的には、インデックスエントリ514にDir_entry_listアレイエントリが加えられ、名称「Documents」、Documentsディレクトリに対するインデックスエントリのRowID(すなわちY7)、およびDocumentsディレクトリのFileID(すなわちX13)を特定する。
【0132】
図示した実施例では、階層インデックス510に2つの欄が加えられている。具体的には、ストアドクエリディレクトリ(SQD:Stored Query Directory)欄は、ディレクトリエントリがストアドクエリディレクトリに対するものであるかを示すフラグを含む。ストアドクエリディレクトリに対するディレクトリエントリにおいて、クエリポインタ(QP:Query Pointer)欄に、ディレクトリに関連付けられるストアドクエリへのリンクが記憶される。ストアドクエリディレクトリ以外のディレクトリに対するディレクトリエントリにおいては、QP欄はヌルである。
【0133】
リンクの性質は各実現例ごとに変化し得る。たとえば、ある実現例によれば、このリンクは、ストアドクエリがストアされているストレージ場所に対するポインタであり得る。別の実現例によれば、このリンクは、単に、ストアドクエリテーブル中のストアドクエリを調べるのに用いられ得る固有のストアドクエリ識別子であり得る。本発明は、何らかの特定のタイプのリンクに限定されることはない。
【0134】
図11を参照して、ここには、Documentsディレクトリに対する行(R13)を含むように更新されたファイルテーブル710が図示される。一実施例によれば、従来のディレクトリに対して保持されたものと同じメタデータがDocumentsディレクトリに対してもまた保持される。たとえば、行R13は、作成日、最終変更日などを含み得る。
【0135】
図12はファイル階層構造のブロック図である。図12に示す階層構造は図6のものと同じであるが、Documentsディレクトリ1202が加えられている。何らかのアプリケーションがDocumentsディレクトリ1202の内容の表示をリクエストすると、データベースはそのDocumentsディレクトリ1202に関連付けられたクエリを実行する。クエリは、このクエリを満足するファイルを選択する。このクエリの結果はその後、Documentsディレクトリ1202の内容としてアプリケーションに提示される。図12に示された時点では、ファイルシステムはDocumentsディレクトリ1202に関連付けられたクエリを満足するファイルを2つしか含まない。これら2つのファイルはともにExample.docと題されている。したがって、これら2つのExample.docファイル618および622はDocumentsディレクトリ1202の子として示される。
【0136】
OSファイルシステムの多くにおいて、同じディレクトリは同じ名称の2つの異なるファイルをストアできない。したがって、Documentsディレクトリ1202内にExample.docと題された2つのファイルがに存在すると、OSファイルシステムの規則が破られるおそれがある。この問題に対処するためにさまざまな技術が用いられ得る。たとえば、DBファイルシステムは各ファイル名に文字を付加して固有のファイル名を作ることができる。したがって、Example.doc618はExample.doc1として提示され得るのに対し、Example.doc622はExample.doc2として提示される。特定の情報を伝えない文字を付加するのではなく、意味を伝えるように付加文字を選択してもよい。たとえば、付加する文字により、そのファイルが静的に位置づけられるディレクトリへのパスを示してもよい。すなわち、Example.doc618はExample.doc_Windows(R)_Wordと表わすことができ、一方、Example.doc622はExample.doc_VMS_App4と表わされる。これに代えて、単にストアドクエリディレクトリにOSファイルシステムの規則を破らせることも可能である。
【0137】
図10に示す実施例では、所与のディレクトリの子ファイルはすべて静的に規定されるか、またはすべてストアドクエリにより規定されるかのいずれかである。しかしながら、本発明の一実施例によれば、ディレクトリはいくつかの静的に規定された子ファイルと、ストアドクエリにより規定されたいくつかの子ファイルとを有し得る。たとえば、ヌルのDir_entry_listを有するのではなく、インデックスエントリ1004は、1つ以上の子ファイルを静的に特定するDir_entry_listを有し得る。したがって、アプリケーションがデータベースシステムにDocumentsディレクトリの子を特定するように要請すると、データベースサーバは静的に規定された子ファイルとストアドクエリ1002を満足する子ファイルとの集合をリストすることになる。
【0138】
重要なことには、あるディレクトリの子ファイルを特定するストアドクエリが他のディレクトリおよび文書を選択してもよい。そのような他のディレクトリのいくつかまたはすべては、それら自体がストアドクエリディレクトリであり得る。ある状況下では、ある特定のディレクトリのストアドクエリがその特定のディレクトリ自体を選択し、そのディレクトリを自身の子にするという場合もある。
【0139】
ストアドクエリディレクトリの子ファイルはオンザフライで決定されるので、子ファイルのリスティングは常にデータベースの現状を反映するものとなろう。たとえば、「Documents」ストアドクエリディレクトリが上述のとおり作成されたとする。拡張子.docを有する新規ファイルが作成されるたびに、そのファイルは自動的にDocumentsディレクトリの子になる。同様に、あるファイルの拡張子が.docから.txtに変わると、そのファイルは自動的にDocumentsディレクトリの子としての資格をなくすことになる。
【0140】
一実施例によれば、ストアドクエリディレクトリに関連付けられたクエリは、ディレクトリの子ファイルとなる特定のデータベース記録を選択し得る。たとえば、「Employees(従業員)」と題されたディレクトリは、データベース内のEmployeesテーブルからすべての行を選択するストアドクエリにリンクされ得る。あるアプリケーションが仮想従業員ファイルのうちの1つの検索をリクエストすると、レンダラは対応の従業員記録からのデータを用いて、リクエストを出しているアプリケーションが予期するファイルタイプのファイルを生成する。
【0141】
ストアされたクエリ文書
ストアドクエリをディレクトリの子ファイルを特定するのに用いることができるのと同様に、ストアドクエリはまた、文書の内容を特定するのに用いることもできる。図7および図11を参照して、これらの図はBody(本体)欄を有するファイルテーブル710を示している。ディレクトリに対し、Body欄はヌルである。文書に対し、Body欄は文書を含むBLOBを含む。ストアドクエリによって内容が特定されるファイルに対して、Body欄はストアドクエリに対するリンクを含んでいてもよい。アプリケーションがストアされたクエリ文書の検索を要求すると、ストアされたクエリ文書に関連付けられる行にリンクされたストアドクエリが実行される。文書の内容はそこで、クエリの結果のセットに基づいて構成される。ある実施例によれば、クエリ結果から文書を構成するプロセスは上述のようにレンダラによって行なわれる。
【0142】
ストアドクエリの結果によってその内容が完全に決められる文書に対するサポートをもたらすことに加えて、サポートはまた、ある部分はクエリの結果によって決められるが他の部分はそうではない文書に対してもたらされてもよい。たとえば、文書ディレクトリにおける行のBody欄はBLOBを含んでいてもよく、その際、別の欄はストアドクエリへのリンクを含む。その行に関連付けられるファイルに対するリクエストを受取った際、クエリは実行されてもよく、クエリの結果はファイルをレンダリングする際にBLOBと組合されてもよい。
【0143】
複数レベルのストアドクエリディレクトリ
上述のように、ストアドクエリはディレクトリの子ファイルを動的に選択するのに用いられてもよい。ディレクトリの子ファイルはすべて、ファイル階層構造における同じレベル(すなわち、ストアドクエリと関連付けられるディレクトリの真下のレベル)に属する。ある実施例によれば、あるディレクトリに関連付けられるストアドクエリはディレクトリの下の複数のレベルを規定し得る。複数のレベルを規定するクエリに関連付けられるディレクトリはここで、複数レベルのストアドクエリディレクトリと称するものとする。
【0144】
たとえば、複数レベルのストアドクエリディレクトリは、従業員テーブルにおけるすべての従業員記録を選択し、これらの従業員記録を部門および地域ごとにグループ分けするクエリと関連付けられていてもよい。これらの条件のもとで、各グループ分けキー(部門および地域)および従業員記録に対して別個の階層レベルを設けてもよい。具体的には、このようなクエリの結果はファイル階層構造における3つの異なるレベルとして表わされてもよい。ディレクトリの子ファイルは第1のグループ分け基準によって定められる。この例においては、第1のグループ分け基準は「部門」(department)である。よって、ディレクトリの子ファイルは、さまざまな部門の値、すなわち「Dept1」、「Dept2」および「Dept3」であってもよい。これらの子ファイルはそれら自体がディレクトリとして表わされる。
【0145】
部門ディレクトリの子ファイルは第2のグループ分け基準によって定められることになる。この例においては、第2のグループ分け基準は「地域」(region)である。したがって、各部門ディレクトリは「North」、「South」、「East」、「West」などの地域値の各々に対する子ファイルを有することとなる。地域ファイルもまたディレクトリとして表わされる。最後に、各地域ディレクトリの子ファイルは、地域ディレクトリに関連付けられるある特定の部門/地域の組合せに対応するファイルとなる。たとえば、\Dept1\Eastディレクトリの子はEast地域におけるDepartment1における従業員であることとなる。
【0146】
ストアドクエリディレクトリの子ファイルに対する
ファイルオペレーションの取扱い
上記のように、ストアドクエリディレクトリの子ファイルは、従来のディレクトリの子ファイルと同様の態様でアプリケーションに対して示される。しかしながら、従来のディレクトリの子ファイルに対して行なわれ得るあるファイルオペレーションは、ストアドクエリディレクトリの子ファイルに対して行なわれると特殊な問題点を生じることとなる。
【0147】
たとえば、ユーザがストアドクエリディレクトリの子ファイルを別のディレクトリに移動すべきであることを特定する入力をしたと仮定する。子ファイルはディレクトリに関連付けられるストアドクエリにおいて特定される基準を満たしているという事実によってストアドクエリディレクトリに属しているため、このオペレーションは問題を生じる。ファイルがその基準をもはや満たさなくなるような態様でファイルを変更するのでなければ、そのファイルはストアドクエリディレクトリの子ファイルとしての資格を有し続けることになる。
【0148】
あるファイルをストアドクエリディレクトリに移動する試みがなされる際に同様の問題が生じる。そのファイルが既にストアドクエリディレクトリの子ではないのであれば、そのファイルはストアドクエリディレクトリに関連付けられるストアドクエリを満たさない。ストアドクエリにより特定される基準をファイルが満たすようにする態様でそのファイルを変更するのでなければ、そのファイルはストアドクエリディレクトリの子とされるべきではない。
【0149】
これらの問題点を解決するのにさまざまなアプローチをとることができる。たとえば、ファイルをストアドクエリディレクトリの中へまたはその中から移動することを試みるオペレーションに応答してエラーを出すようにDBファイルシステムを構成してもよい。代わりに、DBファイルシステムはこのような試みに応答して、問題のファイル(またはファイルとして表わされているデータベース記録)を削除してもよい。
【0150】
さらに別のアプローチでは、ストアドクエリディレクトリの中へ移動されたファイルはこれらがディレクトリに関連付けられるストアドクエリの基準を満たすように自動的に変更されてもよい。たとえば、ストアドクエリディレクトリに関連付けられるストアドクエリが既婚のすべての従業員を選択しているものと仮定する。ある従業員記録に対応するファイルがそのストアドクエリディレクトリに移動されると、その従業員記録の「既婚」フィールドが更新され、その従業員が既婚であることを示す。
【0151】
同様に、ストアドクエリディレクトリの外へ移動されたファイルはこれらがディレクトリに関連付けられるストアドクエリの基準をもはや満たさないように自動的に変更されてもよい。たとえば、「既婚の従業員」のストアドクエリディレクトリにおけるファイルがそのディレクトリの外へ移動された場合、対応する従業員記録の「既婚」フィールドが更新されその従業員が既婚ではないことを示すようにする。
【0152】
ストアドクエリの基準を満たさないファイルを対応のストアドクエリディレクトリの中へ移動する試みがなされた場合、別のアプローチとしては、ストアドクエリディレクトリのインデックスエントリを更新してそのファイルをストアドクエリディレクトリの子として統計的に確立することが挙げられる。こうした状況のもとでは、ストアドクエリディレクトリは、ストアドクエリを満たしていることから子ファイルであるいくつかの子ファイルと、ストアドクエリディレクトリに手動で移動されたために子ファイルとなった他の子ファイルとを有することとなる。
【0153】
プログラム的に規定されたファイル
ストアドクエリディレクトリおよびストアされたクエリ文書はプログラム的に規定されたファイルの例である。プログラム的に規定されたファイルとは、ファイルシステムに対してファイルとして表わされたエンティティ(たとえば文書またはディレクトリ)であるが、その内容および/または子ファイルがコードを実行することによって定められるものである。ファイルの内容を定めるために実行されるコードとは、ストアされたクエリファイルの場合のようにストアされたデータベースクエリを含んでいてもよく、および/または他のコードを含んでいてもよい。一実施例によれば、プログラム的に規定されるファイルに関連付けられるコードは以下のルーチンを実現する。
【0154】
Figure 0005113967
resolve_filenameルーチンは、「filename」の名を有しかつプログラム的に規定されたファイルの子であるファイルのファイルハンドル(file handle)を戻す。list_directoryルーチンは、プログラム的に規定されたファイルのすべての子ファイルのリストを戻す。fetchルーチンは、プログラム的に規定されたファイルの内容を検索する。putルーチンは、プログラム的に規定されたファイルの中へデータを挿入する。deleteルーチンは、プログラム的に規定されたファイルを削除する。
【0155】
一実施例によれば、「resolve_pathname(path):file_handle」ルーチンも提供される。resolve_pathnameルーチンはパスを受け、パスにおける各ファイル名(filename)に対してresolve_filename機能を反復的にコールする。
【0156】
一実施例によれば、DBファイルシステムは、従来のファイル(すなわち、プログラム的に規定されていないファイル)に対する、上に列挙したルーチンを実現するオブジェクトクラスをもたらす。説明の目的で、そのオブジェクトクラスはここで「ディレクトリクラス」と称することにする。プログラム的に規定されたファイルを実現するため、ディレクトリクラスのサブクラスが確立される。そのサブクラスはディレクトリクラスのルーチンを継承するが、これらのルーチンの実現をプログラマがオーバーライドすることを可能にする。サブクラスによりもたらされる実現は、プログラム的に規定されたファイルにかかわるファイルオペレーションに応答してDBファイルシステムによって行なわれるオペレーションを決める。
【0157】
ファイルシステム内でのイベント通知
この発明の一局面によれば、あるファイルシステムイベントの発生の際にユーザが先を見越して(proactively)通知されるファイルシステムが提供される。これらは先を見越して通知されるため、関心のあるイベントが起こったことを示す条件を検出するため繰返されるポーリングのオーバーヘッドを引起さずにすむ。ファイルシステムイベントの発生の際に通知を受けるという能力は、たとえば、ユーザにとってある特定のファイルシステムイベントが重要な意味を有している場合などに非常に有用である。
【0158】
たとえば、ある文書の複数のコピーが異なる場所において維持され(「キャッシュされ」)、その文書に対してより効率のよいアクセスをもたらすようにすることは一般的である。こうした条件のもとで、そのコピーのうちの1つが更新された場合、残りのコピーは古くなってしまう(すなわち、これらのコピーはもはやその文書の現在の状態を反映していない)。以下説明するイベント通知手法を用いて、1つのコピーが更新された際に、他のコピーが存在するサイトではその更新について先を見越して通知を受けることができる。これらのサイトにおけるプロセスまたはユーザはそこで、その状況下で適当である何らかの処置をとることができる。キャッシュの場合、適当な処置とはたとえば、文書のキャッシュされたバージョンを更新されたバージョンで置き換えることであるかもしれない。
【0159】
別の例としては、ある特定のユーザがある会社の技術文書のすべてをそれらが出版される前に見直す責任がある場合がある。その会社のテクニカルライタは、すべての技術文書をそのユーザによる見直しのための準備が整った際に「見直し準備完了」ディレクトリの中へ記憶するように指示を受けているかもしれない。事前対応型の(proactive)通知システムがなければ、技術文書を「見直し準備完了」ディレクトリに単に記憶するだけでは新しい文書の見直しの準備ができたことをユーザに気づかせることにはならない。むしろ、テクニカルライタがそのユーザにその文書が見直されるための準備が整ったことを知らせるか、またはユーザが「見直し準備完了」ディレクトリを定期的にチェックするなどの何らかの追加の作業が必要となる。これに対し、ここに説明するイベント通知手法を実現するファイルシステムでは、技術文書を「見直し準備完了」ディレクトリの中へ入れるという行為により、新しい技術文書が見直しされる準備が整ったことをユーザに通知するためのユーザに対するメッセージの生成を引起すことができる。
【0160】
この発明の一実施例によれば、ファイルシステムイベントに対して先を見越してメッセージを生成するためのルールを定義付けてもよい。このようなイベントには、たとえば、ある特定のディレクトリにおけるファイルの記憶または作成、ある特定のディレクトリにおけるファイルの削除、ある特定のディレクトリからのファイルの移動、ある特定のファイルの変更または削除およびある特定のディレクトリへファイルをリンクすることなどが含まれる。これらのファイルシステムオペレーションは単に代表として表わすものである。事前対応型の通知ルールが作成され得る特定のオペレーションは実現例ごとに異なり得る。この発明はどんなある特定のセットのファイルシステムオペレーションに対してイベント通知サポートをもたらすことにも限定されない。
【0161】
一実施例によれば、event_idがファイルシステムイベントに割当てられる。そこで、あるevent_idおよび1以上の加入者の組を特定する通知ルールが作成されてもよい。あるルールがファイルシステムに一旦登録されると、ルールのevent_idによって識別されるファイルシステムイベントの発生に応答して、そのルールにおいて識別される消費者の組に自動的にメッセージが送られる。
【0162】
たとえば、あるユーザはいつファイルがある特定のディレクトリに追加されるかを知ることについて関心を登録するかもしれない。この関心を記録するため、データベースサーバは、(1)「登録ルール」テーブルの中に行を挿入し、(2)ディレクトリに関連付けられるフラグを設定して、少なくとも1つのルールがそのディレクトリに対して登録されたことを示す。登録されたルールのテーブルに挿入される行はエンティティを識別しそのエンティティが関心を持っているイベントを示す。行はまた、そのエンティティと通信するのに用いるべきプロトコルなどの追加の情報を含んでいてもよい。あるルールがディレクトリに当てはまることを示すフラグは、ディレクトリに関連付けられるファイルのテーブルの行において、またはディレクトリに関連付けられる階層インデックスエントリにおいて、またはその両方において記憶されてもよい。
【0163】
ファイルをディレクトリに挿入する際、データベースサーバはディレクトリと関連付けられるフラグを検査してそのディレクトリに対して何らかのルールが登録されているかどうかを判定する。そのディレクトリに対してルールが登録されている場合、登録されたルールのテーブルをサーチしてそのディレクトリに当てはまる特定のルールを見出す。登録されたルールがディレクトリに対して行なわれている特定のオペレーションに当てはまるルールを含んでいる場合、これらのルールに識別される関心を持っているエンティティにメッセージが送られる。エンティティに対してメッセージを送るのに用いられるプロトコルはエンティティごとに異なり得る。たとえば、あるエンティティに対しては、メッセージはCORBAを介して送られてもよく、その一方、他のエンティティに対しては、メッセージはHTTPを介するHTMLページの形で送られてもよい。
【0164】
一実施例によれば、通知機構は、その内容のすべてがここに引用により援用される、1997年10月31日にチャンドラ(Chandra)他によって提出された「データベースシステムにおけるメッセージ待ち行列のための装置および方法」(APPARATUS AND METHOD FOR MESSAGE QUEUING IN A DATABASE SYSTEM)と題された米国特許出願第08/961,597号に記載される待ち行列機構のような待ち行列機構を用いて、上述のように、データベース実現型ファイルシステムとともに実現される。
【0165】
そのような実施例の1つによれば、データベースサーバの外部で実行されるイベントサーバがデータベースサーバによって管理される待ち行列に対して加入者として登録される。イベントサーバが加入する待ち行列はここでファイルイベント待ち行列と称することとする。ある特定のファイルシステムイベントに関心があるエンティティはその関心をイベントサーバに登録する。イベントサーバはデータベースAPIを介してデータベースサーバと通信し、関心を持っているエンティティと、それらのエンティティがサポートするプロトコルを介して通信する。
【0166】
データベースサーバがファイルシステムに関連するオペレーションを行なう際、データベースサーバファイルイベント待ち行列の中に、オペレーションに関連付けられるevent_idを示すメッセージを入れる。待ち行列機構は、イベントサーバがファイルイベント待ち行列の中に関心を登録したことを判定し、イベントサーバにメッセージを送信する。イベントサーバは関心を持っているエンティティのリストをサーチしていずれかのエンティティがそのメッセージにおいて識別されるイベントに関心を登録していないかどうかを判定する。イベントサーバは次に、そのイベントに関心を登録したすべてのエンティティに対してファイルシステムイベントの発生を示すメッセージを送信する。
【0167】
関心を持っているエンティティへメッセージを転送するのにイベントサーバを用いる実施例において、イベントサーバはある特定の最大数のユーザをサポートするように構成されてもよい。関心を持っているユーザの数が最大数を超えた場合、追加のイベントサーバを開始して追加のユーザに対してサービスをもたらす。単一のイベントサーバのケースと同様に、複数イベントサーバのシステムにおける各イベントサーバはファイルイベント待ち行列への加入者として登録される。
【0168】
代替の実施例によれば、ファイルシステムイベントに関心を持っているエンティティはファイルイベント待ち行列への加入者として直接登録される。登録情報の一部として、エンティティはそれらが関心を持っているファイルシステムイベントのevent_idを示す。待ち行列機構がファイルイベント待ち行列の中にメッセージを入れる際、待ち行列機構はすべての待ち行列加入者に自動的にメッセージを送るわけではない。むしろ、待ち行列機構は登録情報を検査してどのエンティティがそのメッセージに関連付けられる特定のイベントに関心を登録しているかを判定し、それらのエンティティのみに選択的にメッセージを送る。データベースAPIをサポートとしていないエンティティの場合、登録情報にはこれらのエンティティがサポートするプロトコルについての情報が含まれる。待ち行列機構はこれらのエンティティに対し、それらの登録情報にリストされているプロトコルを用いてファイルイベントメッセージを送信する。
【0169】
ファイルシステムイベント通知はさまざまなコンテキストにおいて適用され得る。たとえば、時には第1のマシンに第2のマシンに存在するファイルのキャッシュを記憶することが望ましいことがある。そのようなファイルキャッシュを実現する現在利用可能な機構の1つはMicrosoft Windows(R)オペレーティングシステムにより提供される「ブリーフケース」機能である。ブリーフケース機能により、ユーザがあるマシン上で特殊なフォルダ(「ブリーフケース」)を作成し、そのブリーフケースの中へ他のマシン上に記憶されているファイルをコピーすることが可能となる。各々のブリーフケースは「更新」オプションを有しており、これが選択されると、ブリーフケース内のファイルのコピーと元の場所にあるファイルのコピーとをファイルシステムに比較させる。もしファイルが同じ変更日を有していない場合、ファイルシステムはユーザがその2つのコピーを同期化するのを可能にする(典型的に、より新しいコピーをより古いコピーに上書きすることによって)。
【0170】
ブリーフケース機構とは異なり、ファイルシステムイベント通知機構は、ファイルキャッシュを先を見越して更新することを可能にし、これによってファイルキャッシュが常に、元の場所にあるファイルの現在の状態を反映するようにする。たとえば、ファイルキャッシュを管理するプロセスは、キャッシュに含まれているファイルの元のコピーに対する更新について関心を登録してもよい。これにより、元のファイルのいずれかが更新された際にはプロセスは自動的にこれを知らされることとなり、即刻これに応答して更新されたファイルをファイルキャッシュの中へコピーすることができる。同様に、ファイルシステムイベント通知機構を用いて、第1のマシン上に第2のマシン上に存在する1つ以上のディレクトリをミラー化してもよい。ファイルシステムイベント通知機構をこのような態様で用いるため、ミラー化された(mirrored)ディレクトリを維持するためのプロセスは最初にディレクトリおよびその中に含まれるすべてのファイルのコピーを作り、次に、ディレクトリおよびディレクトリに含まれるファイルに対して加えられた変更についてその関心を登録する。変更がディレクトリに加えられたことを知らされると、プロセスはディレクトリのコピーに対し対応する変更を加える。同様に、ミラー化されたディレクトリ内のファイルのいずれかに対する変更を知らされた際には、プロセスはファイルのコピーに対して対応する変更を加える。
【0171】
たとえば、ミラー化されたディレクトリからミラー化されていないディレクトリへファイルが移動された場合、プロセスはミラー化されたディレクトリからファイルのコピーを削除し、そのファイルについての関心の登録を解除する。したがって、プロセスはファイルが更新された際も引続き通知されるということはない。同様に、ミラー化されていないディレクトリからミラー化されているディレクトリへファイルが移動された場合、プロセスはディレクトリが変わったことを知らされることとなる。そのメッセージに応答して、プロセスは新しいファイルを識別し、ミラー化されたディレクトリ内に新しいファイルのコピーを作り、その新しいファイルについてその関心を登録する。
【0172】
ファイルシステムにおけるバージョン管理
職場においては、大勢の人が長期間にわたってともに作業することになる大型の仕事を「プロジェクト」と称する。プロジェクトに取組んでいる際、社員は典型的に多数の文書を作成し、その各々は何らかの態様でそのプロジェクトに関係がある。
【0173】
同様に、コンピュータシステム内では、ユーザはしばしば、すべてがあるプロジェクトに関係のある多数の電子文書を作成する。たとえば世界中の多数のサイトに位置しているプログラマがそれぞれ、同じコンピュータプログラムの異なる部分に取組んでいるかもしれない。そのコンピュータプログラムに対して彼らが生成する電子文書は典型的にソースコードファイルを含むが、単一のプロジェクトに属する。すなわち、この議論の文脈では、プロジェクトとは関連するファイルの集まりのことである。
【0174】
典型的に、プロジェクトのファイルは特定のフォルダの中へ整理されることとなる。たとえば、図13は、プロジェクト「Big Project」に関連するファイルがどのようにさまざまなフォルダに整理されているかの一例を示している。図13を参照して、Big Projectと題されたフォルダ1302は、そのプロジェクトに関連するすべてのファイル(ディレクトリおよび文書)を保持するように作成されたものである。Big Project1302のすぐ下の子ファイルはフォルダsource code1304およびフォルダdocs1306である。source code1304は、ロサンゼルスに位置するプログラマのsource code1316およびsource code1318を記憶するためのLA code1312と、サンフランシスコに位置するプログラマのsource code1320を記憶するためのSF code1314との2つのディレクトリを含む。docs1306は、specs1308およびuser manual1310の2つのフォルダを含む。specs1308はspecs1322およびspecs1324を含む。user manual1310はUM1326を含む。
【0175】
しばしば、あるプロジェクト内のファイルは同じプロジェクト内の他のファイルへの参照(reference)(たとえばHTMLリンク)を含んでいるであろう。これらの参照は典型的に、他の文書をその文書の完全なパス名を用いて識別している。したがって、文書がディレクトリ階層構造におけるある場所から別の場所へ移動された場合、あるいはその文書の名称が変更された場合、その文書へのすべての参照が無効となってしまう。
【0176】
文書間参照の存在により、ファイルの新しいバージョンは典型的に、それらが置換するより古いバージョンと同じ名前で同じ場所に記憶される。従来のファイルシステムでは、このプロセスによってファイルのより古いバージョンは上書きされ、これを回復するのが不可能になる。残念ながら、ファイルのより古いバージョンを回復することが望ましい場合は多々ある。たとえば、より新しいバージョンから重大な情報がうっかり削除されてしまったかもしれない。もしより古いバージョンを回復することが不可能であれば、ユーザはその失われた資料を再現するのに、それも再現できるのであればの話であるが、かなりのリソースを費やさなければならないかもしれない。さらに、多くの場合、ファイルに対する変更履歴を復元することが可能であったり、ある特定の変更がいつ加えられたものであるかを判断することが可能であったり、またはある時点で何が変更されたかを判断することが可能であることは望ましい。
【0177】
この発明の一局面によれば、ファイルの新しいバージョンがより古いバージョンを上書きすることなく、より古いバージョンと同じ名称を用いてディレクトリ階層構造における同じ場所に保存されるバージョニング(versioning)機構が提供される。より古いバージョンを上書きするのではなく、より古いバージョンは保持され、ユーザは選択的にファイルのより古いバージョンを検索することができる。さらに、より古いバージョンはディレクトリ階層構造におけるそれらの元の場所において保持される。以下により詳細に説明するように、ファイルシステムがディレクトリ階層構造内の同じ場所において同じファイルの複数のバージョンを同じ名称で保持することを可能にする新規のディレクトリバージョニング手法が提供される。
【0178】
新しいバージョンの作成によって元のバージョンの名称または場所が変更されないため、ファイルの最初のバージョンに対するどんな参照も、ファイルのより新しいバージョンが作成された場合でもファイルの最初のバージョンを示し続けることとなる。したがって、文書内に含まれるファイル間参照は、参照された文書のより新しいバージョンが作成されたとしても、引続き参照された文書の正しいバージョンを指す。バージョニングプロセスにおいてファイル間参照が有効なままである(すなわち、引続き、参照されたファイルの正しいバージョンを参照する)という事実は、ファイル検索の効率にかなり有益な影響がある。具体的には、参照されたファイルの適切なバージョンを探すためにルックアップオペレーションを行なうことを必要とするのではなく、参照されたファイルは他のファイル内に含まれるそれらへの参照をたどることによって直接検索することができる。
【0179】
同様に、ある特定の時点におけるディレクトリの内容を判定するプロセスにルックアップオペレーションが関与する必要がない。ディレクトリはそれら自体がバージョン付け(versioned)されているため、ディレクトリのある特定のバージョンを選択することは単にディレクトリのメンバを選択することになる。ディレクトリの選択されたバージョンは、ディレクトリのそのバージョンに属する正しいファイルへの、よってファイルの正しいバージョンへの、直接リンクを含むことになる。
【0180】
また、バージョンごとにファイルの名称が変わる場合でも同じファイルのバージョン間の関係を追跡するための手法が提供される。以下により詳細に説明するように、ファイルの名称に加えて、各ファイルの各バージョンに対してFileIDおよびバージョンナンバが維持される。2つのファイルが同じFileIDを有している場合、それらは異なる名称を有していたとしても同じファイルの異なるバージョンである。
【0181】
この発明の一局面によれば、ユーザが見たいと思うプロジェクトの「ビュー」(view)をユーザが選択することを可能にする機構が提供される。プロジェクトのビューはある特定の時点において存在していた状態でのプロジェクトのファイルを表わす。たとえば、ユーザに提示されるデフォルトビューはすべてのファイルの最新のバージョンを表わしてもよい。別のビューでは、1日前の時点で最新であったファイルのバージョンを表わしているかもしれない。別のビューでは、一週間前の時点で最新であったファイルのバージョンを表わしていてもよい。
【0182】
一実施例によれば、あるプロジェクトにおける各ファイルとともにバージョンナンバを記憶することによってバージョン追跡機構が提供される。たとえば、ファイルテーブル710などの、ファイルテーブルを用いるデータベースシステムにおいて実現されるファイルシステムにおいて、あるファイルに関連付けられる行の1つの欄はそのファイルに対するバージョンナンバを記憶してもよい。ファイルが作成されるたびに、ファイルに対する行がファイルテーブル710の中に挿入され、予め定められた最初のバージョンナンバ(たとえば1)がその行のバージョン欄に記憶される。
【0183】
ファイルが更新されると、ファイルの前のバージョンは上書きされない。その代わり、ファイルの新しいバージョンのために新しい行がファイルテーブルに挿入される。新しいバージョンのための行には元の行と同じFileID、NameおよびCreation Dateが含まれるが、より高いバージョンナンバ(たとえば2)、新しいModification Dateおよび場合によっては異なるファイルサイズなどが含まれる。さらに、ファイルの内容を記憶するBLOBは更新を反映することとなるが、元のエントリのBLOBは変わらない。
【0184】
一実施例によれば、ファイルとそのファイルが存在するディレクトリとがともにあるプロジェクトに属している場合、ファイルへの変更によってディレクトリの新しいバージョンが実効的に作成される。これにより、ディレクトリにおけるファイルの更新により、ファイルの新しいバージョンのためのファイルテーブルの行が作成されるだけでなく、ディレクトリの新しいバージョンのためのファイルテーブルの行も作成されることとなる。階層インデックスを用いる一実施例において、ディレクトリの新しいバージョンに対するインデックスエントリもまた階層インデックスに追加されることとなる。
【0185】
もしあるディレクトリと親ディレクトリとがともに同じプロジェクトに属しているなら、ディレクトリの新しいバージョンの作成によって親ディレクトリの新しいバージョンが実効的に作成される。これにより、ディレクトリの親ディレクトリに対するファイルテーブルおよび階層インデックスにも新しい行が追加される。このプロセスは続けられ、あるプロジェクトに属しかつファイル階層構造において更新されたファイルの上に存在するすべてのディレクトリに対して新しいバージョンが作られることとなる。
【0186】
バージョニング機構がプロジェクトに属するファイルの更新にどのように応答するかを示すため、図13に示されるすべてのファイルがバージョン1であると仮定し、かつcode1320に対して更新が行なわれたと仮定する。図14に示されるように、バージョニング機構はcode1320の元のバージョンを削除することなく新しいバージョンのcode1320′を作成することによって更新に応答する。code1320はSF codeディレクトリ1314に属し、そのため元のバージョンを削除することなく新しいバージョンのSF codeディレクトリ1314′が作成される。SF codeディレクトリ1314はsource codeディレクトリ1304に属するため新しいバージョンのsource codeディレクトリ1304′が元のバージョンを削除することなく作成される。最後に、source codeディレクトリ1304はbig projectディレクトリ1302に属するため、新しいバージョンのbig project1302′が元のバージョンを削除することなく作成される。
【0187】
図14に示されるように、親ファイルの新しいバージョンが子ファイルの新しいバージョンに応答して作成される際、親ファイルの新しいバージョンは更新されたファイルの元のバージョンではなく、更新されたファイルの新しいバージョンが子であることを除いて、引続き更新前に有していたのと同じ子を有する。たとえば、新しいバージョンのcode1320′は新しいバージョンのSF code1314′の子である。新しいバージョンのSF code1314′は、新しいバージョンのsource code1304′の子である。しかしながら、元のsource code1304の変わらない子ファイル(たとえばLA code1312)は引続き新しいバージョンのsource code1304′の子ファイルであり続ける。同様に、新しいバージョンのsource code1304′は新しいバージョンのbig project1302′の子であるが、元のbig projectの変わらない子ファイル(たとえばdocs1306)はbig project1302の新しいバージョンの子ファイルであり続ける。
【0188】
ファイルシステムが階層インデックスを用いて実現される実施例では、ディレクトリの新しいバージョンに対して作成されたインデックスエントリは、更新された子ファイルに対するアレイエントリが子ファイルの新しいバージョンに対するアレイエントリで置換されることを除いて、ディレクトリの前のバージョンに対するインデックスエントリと同じDir_entry_listを含むことになる。更新された子ファイルが子ディレクトリであった場合、新しいディレクトリに対するDir_entry_listアレイエントリは、子ディレクトリの新しいバージョンに対するインデックスエントリの、階層インデックス内の、RowIDを含むこととなる。
【0189】
あるプロジェクトに属するファイルがそのプロジェクトにおける1つのディレクトリからそのプロジェクトにおける別のディレクトリに移動された場合、ファイルそのものは変更されていないため、ファイルの新しいバージョンは作成されない。しかしながら、ファイルが移動された元のディレクトリおよびファイルが入れられたディレクトリはともに変更されている。このため、これらのディレクトリおよび同じプロジェクトにあるこれらのディレクトリのすべての先祖ディレクトリに対して新しいバージョンが作成される。図15は、LA code1312からSF code1314へ移動される図13のcode1318に応答して作られることになる新しいディレクトリを示す。具体的には、新しいバージョンのLA code1312′およびSF code1314′が作成されることになる。新しいバージョンのLA code1312′はその子としてcode1318を有さない。むしろ、code1318は新しいバージョンのSF code1314′の子となる。新しいsource codeディレクトリ1304′が作成され、新しいバージョンのLA code1312′およびSF code1314′にリンクされる。新しいbig projectディレクトリ1302′が作成され、新しいsource code1304′および元のdocsディレクトリ1306にリンクされる。
【0190】
上述のバージョニング手法を用いて、あるプロジェクト(たとえばbig project1302)に対して変更が加えられる度にそのプロジェクトのルートディレクトリの新しいバージョンが作成される。ルートプロジェクトディレクトリの各バージョンから派生するリンクはある特定の時点においてそのプロジェクトに属していたすべてのファイルを互いにリンクし、このようにリンクされたファイルのバージョンはそのある特定の時点において存在していたバージョンである。たとえば、図14を参照して、big project1302から派生するリンクはcode1320に対する更新の前に存在していた状態でのプロジェクトを反映している。big project1302′から派生するリンクは、code1320に対する更新の直後に存在していた状態でのプロジェクトを反映する。同様に、図15において、big project1302から派生するリンクは、code1318をLA code1312からSF code1314へ移動する前に存在していた状態でのプロジェクトを反映する。big project1302′から派生するリンクは、code1318をLA code1312からSF code1314へ移動した直後に存在していた状態でのプロジェクトを反映する。
【0191】
タグ付け
残念なことに、上述のバージョニング手法により、特にプロジェクトのより上位のレベルにおけるディレクトリの、ファイルバージョンの大幅な急増が起きる。状況によっては、このような急増は必要ではなく望ましくもないかもしれない。したがって、この発明の一実施例によれば、ファイルのバージョンに「タグ付けする」ための機構が提供される。ファイルのバージョンのタグ付けによりファイルのそのバージョンを保持すべきであることを示す。すなわち、より新しいバージョンが作成される際にファイルのより古いバージョンを常に保持するのではなく、ファイルのより古いバージョンはタグ付けされている場合にのみ保持される。そうでなければ、これらはより新しいバージョンが作成される際に置換される(上書きされる)。
【0192】
図13を参照して、code1320がタグ付けされていないものと仮定する。code1320が更新された場合、codeの新しいバージョンは単にcodeの古いバージョンで置換される。code1320がタグ付けされている場合にのみ、図14に示されるように、code1320、SF code1314、source code1304およびbig project1302の別個の新しいバージョンが作られることとなる。
【0193】
多くの場合、タグはあるプロジェクト内のすべてのファイルに対して同時に適用されることになる。たとえば、あるソフトウェアプログラムのある特定のバージョンがリリースされた場合、プログラムのリリースされたバージョンを作成するのに用いられたすべてのソースコードはその時点でタグ付けされてもよい。これにより、ソースコードファイルへのその後の改訂にかかわらず、リリースされたバージョンに関連付けられる正確に同じソースコードの組が後に参照するために利用可能となる。
【0194】
タグが常に全体としてのプロジェクトに適用される実施例において、単一のタグがルートプロジェクトディレクトリに対して維持されてもよい。タグ付けされているルートプロジェクトディレクトリのバージョンを用いてあるファイルの場所を確認する場合、そのファイルに対するいかなる変更もそのファイルの新しいバージョンを作成することにつながり、その一方でそのファイルの元のバージョンが保持される。逆に、タグ付けされていないルートプロジェクトディレクトリのバージョンを用いてファイルの場所が確認される場合、そのファイルに対するいかなる変更も単にファイルの前のバージョンを上書きすることになる。
【0195】
別の実施例によれば、タグをファイルに適用することはファイル階層構造においてそのファイルより下にあるすべてのファイルにタグを実効的に適用する。たとえば、タグがLA code1312に適用されるものと仮定する。code1318がLA code1312から外へ移動される場合、LA code1312の新しいバージョンが作成される。code1318が更新される場合、code1318およびLA code1312の双方の新しいバージョンが作成される。このような実施例において、すべてのタグ付きファイルを通してファイル階層構造をトラバースすることによってファイルの場所が確認される場合、そのファイルに対するどんな変更によってもファイルの新しいバージョンが作成されることになる。階層構造におけるタグ付けされたいずれのファイルもトラバースすることなくファイルの場所が確認される場合、そのファイルに対するどんな変更もそのファイルの前のバージョンを上書きすることとなる。
【0196】
パージカウント
タグ付けの代わりにまたはタグ付けに加えて用いることができるバージョンの急増を低減するための別の手法には、パージカウントを維持することが含まれる。パージカウントは、いずれかの所与のファイルに対して保持されることとなるバージョンの最大数を示す。既にバージョンの数がパージカウントに達しているファイルに対して新しいバージョンが作成される場合、そのファイルの新しいバージョンはそのファイルの保持される最も古いバージョンを上書きする。パージカウントはファイルごとのシステム、プロジェクトごとのベースまたはファイルごとのベースで実現されてもよい。ファイルごとのシステムのベースで実現される場合、単一のパージカウントがファイルシステムにおいて維持されるすべてのファイルに適用される。プロジェクトごとのベースでは、所与のプロジェクトにおけるすべてのファイルは同じパージカウントを有するが、異なるプロジェクトは異なるパージカウントを有し得る。ファイルごとのベースでは、各ファイルに対して異なるパージカウントが特定され得る。
【0197】
タグ付けと組合せて用いられる場合、パージカウント機構はさまざまな態様で実現され得る。一実施例によれば、タグ付けされたファイルは、ファイルの新しいバージョンを作成することによってパージカウントを超えることになるかどうかを判定する目的では無視され、タグ付けされたファイルはパージカウント機構によっては削除されることは決してない。たとえば、あるファイルに対するパージカウントが5であり、すなわちそのファイルの5つのバージョンが存在すると仮定し、かつこれらの5つのバージョンのうちの1つにタグ付けがされていると仮定する。そのファイルに対して更新がなされると、パージカウント機構は、現在そのファイルの既存のタグなしバージョンは4つしかないと判断し、よって、既存のバージョンのいずれをも削除することなくファイルの別のバージョンを作成する。同じファイルが再び更新された場合は、パージカウント機構は、ファイルの既存のタグなしバージョンは5つであると判定し、よって、新しいバージョンを作成することに応答してファイルの最も古いタグなしバージョンを削除する。
【0198】
プロジェクト間リンク
各リンクはソースファイル(そのリンクが拡張される元のファイル)およびターゲットファイル(そのリンクが指し示すファイル)を有する。ファイル階層構造において、リンクのソースファイルはしばしばディレクトリであり、リンクのターゲットファイルはディレクトリ内のファイルである。しかしながら、リンクのすべてがディレクトリとその子との間のものであるわけではない。たとえばHTMLファイルは、グラフィック画像および他のHTMLファイルへのハイパーリンクを含み得る。階層インデックスを用いて実現されるファイルシステムでは、これらのハイパーリンクはディレクトリ−文書間リンクと同様の態様で扱うことができる。
【0199】
ファイルシステムのビューにより、ファイルシステムにおける各プロジェクトがある特定の時点においてどのように存在していたかが示される。しかしながら、あるビューにおける1つのプロジェクトに関連付けられるその時点は、同じビューにおける別のプロジェクトに関連付けられる時点とは異なるかもしれない。このことにより、リンクのソースファイルがリンクのターゲットファイルとは異なるプロジェクトに属する場合に問題が生じる。たとえば、ビューが、ファイルF1を含むプロジェクトP1に対する時間T1とファイルF2を含むプロジェクトP2に対する後の時間T2とを特定すると仮定する。さらに、ファイルF2がファイルF1へのリンクを有すると仮定する。F2のT2バージョンに含まれるリンクはP1のT2バージョンへ行くのであり、P1のT1バージョンに行くのではない。しかしながら、そのビューはP1に対するT1を特定するため、そのビューを介してP1におけるいずれのファイルに対して行なわれるどんなオペレーションに対してもP1のT1バージョンが用いられるべきである。
【0200】
この発明の一実施例によれば、各リンクに対して「プロジェクト間境界」フラグが維持される。リンクのプロジェクト間境界フラグは、そのリンクのソースファイルおよびターゲットファイルが同じプロジェクトにあるかどうかを示す。階層インデックス510などの階層インデックスを用いるファイルシステムにおいて、プロジェクト間境界フラグはたとえば、インデックスエントリのDir_entry_listの各アレイエントリに記憶されてもよい。
【0201】
ファイル階層構造のトラバース(traversal)において、すべてのリンクのプロジェクト間境界フラグはそのリンクをたどる前に検査される。あるリンクのプロジェクト間境界フラグが設定されている場合、ソース側ファイルが属しているプロジェクトの要求されるバージョン時間はターゲット側ファイルが属しているプロジェクトの要求されるバージョン時間と比較される。所望のバージョン時間が同じである場合、そのリンクはトラバースされる。所望のバージョン時間が同じではない場合、ターゲット側ファイルが属しているプロジェクトの要求されるバージョン時間に対応するターゲットファイルのバージョンを探してサーチが行われる。
【0202】
たとえば、F2とF1との間のリンクのプロジェクト間境界フラグが設定されることとなる。これにより、P2の要求されるバージョン時間とP1の要求されるバージョン時間とが比較される。P2の要求されるバージョン時間はT2であり、これはP1の要求されるバージョン時間であるT1と同じではない。したがって、P1はリンクをたどることによってその場所を確認することはできないであろう。その代わり、時間T1に対応するP1のバージョンの場所を確認するためにサーチが行われることとなる。
【0203】
代替の実施例によれば、プロジェクト間境界フラグは全く維持されない。代わりに、リンクに遭遇するたびに、ソースファイルの要求されるバージョン時間がターゲットファイルの要求されるバージョン時間と比較される。ソースファイルとターゲットファイルとが同じプロジェクトにある場合、または同じ要求されるバージョン時間を有する異なるプロジェクトにある場合、そのリンクをたどる。そうでなければ、ターゲットファイルの正しいバージョンを探してサーチが行なわれる。
【0204】
オブジェクト指向ファイルシステム
近年、オブジェクト指向プログラミングが標準のプログラミング規範となっている。オブジェクト指向プログラミングでは、世界はオブジェクトの観点からモデル化される。オブジェクトとは、記録を操る手続きおよび機能と組合される記録である。あるオブジェクトクラスにおけるすべてのオブジェクトは同じフィールド(「属性」)を有し、同じ手続きおよび機能(「方法」)により操られる。オブジェクトはそれが属するオブジェクトクラスの「インスタンス」であるといわれる。
【0205】
ときおり、アプリケーションは、類似であるが同一ではないオブジェクトクラスの使用を必要とすることがある。たとえば、イルカと犬との両方をモデル化するのに用いられるオブジェクトクラスには鼻、口、長さおよび年齢の属性が含まれるかもしれない。しかしながら、犬オブジェクトクラスは毛色属性を必要とする一方、イルカオブジェクトクラスはひれの大きさの属性を必要とするかもしれない。
【0206】
あるアプリケーションが複数の類似の属性を必要とする状況におけるプログラミングを容易にするため、オブジェクト指向プログラミングでは「継承」をサポートする。継承がなければ、プログラマは犬オブジェクトクラスに対して1つのコードのセットを書き、イルカオブジェクトクラスに対して第2のコードのセットを書かなければならなくなる。双方のオブジェクトクラスに共通した属性および方法を実現するコードは双方のオブジェクトクラスに重複して現われることとなる。このような態様でコードが重複しているのは、特に、共通の属性および方法の数が独特の属性の数よりはるかに多い場合に非常に効率が悪い。さらに、オブジェクトクラス間のコード重複によりコードを改訂するプロセスが複雑になる。これは、その属性を有するすべてのオブジェクトクラス間で整合性を維持するために、共通の属性に対して加えられた変更はコードにおける複数の位置において複製されなければならないためである。
【0207】
継承により、オブジェクトクラス間に階層構造を確立することが可能となる。所与のオブジェクトクラスの属性および方法は、自動的に階層構造における所与のオブジェクトクラスに基づいたオブジェクトクラスの属性および方法となる。たとえば、「動物」オブジェクトクラスは関連付けられた方法とともに、鼻、口、長さおよび年齢属性を有するものとして定義付けられ得る。これらの属性および方法をイルカおよび犬オブジェクトクラスに追加するため、プログラマはイルカおよび犬オブジェクトクラスが動物オブジェクトクラスを「継承する」のを特定することができる。このような状況の下で、イルカおよび犬オブジェクトクラスは動物オブジェクトクラスの「サブクラス」であるといえ、動物オブジェクトクラスは犬およびイルカオブジェクトクラスの「親」クラスであるといわれる。
【0208】
この発明の一局面によれば、ファイルシステムに対して、継承を含むオブジェクト指向規範を適用するための機構が提供される。具体的には、ファイルシステムにおける各ファイルはあるクラスに属する。ファイルシステムのクラスは、とりわけ、ファイルシステムがそのファイルについて記憶している情報のタイプを定める。一実施例によれば、ベースクラスが設けられる。ファイルシステムのユーザはそこで他のクラスを登録してもよく、これはベースクラスまたはいずれかの前に登録したクラスのサブクラスとして定義付けられてもよい。
【0209】
新しいファイルクラスがファイルシステムに登録される際、ファイルシステムは新しいタイプのファイルおよび新しいタイプのファイルシステムとの対話をサポートするよう実効的に拡張される。たとえば、ほとんどの電子メールアプリケーションは電子メール文書が「優先度」プロパティを有していることを期待する。ファイルシステムが優先度プロパティのための記憶をもたらしていない場合、電子メールアプリケーションはそのファイルシステムに記憶される電子メール文書に対して正しく動作しないかもしれない。同様に、あるオペレーティングシステムは、あるタイプのシステム情報がファイルとともに記憶されていることを期待するかもしれない。ファイルシステムがその情報を記憶していない場合、オペレーティングシステムは問題に遭遇し得る。ある特定のタイプのシステムまたはプロトコル(たとえば、特定のオペレーティングシステム、FTP、HTPP、IMAP4など)をサポートするのに必要とされるすべての属性を含むクラスを登録することによって、そのシステムまたはプロトコルとの正確かつ透過的な対話が可能となる。
【0210】
クラスを登録するために、そのクラスについての情報がもたらされ、これはそのクラスの親クラスを識別し親クラスが有していない属性でそのクラスが有しているどんな属性をも記述するデータを含む。その情報はまた、そのクラスのインスタンスに対して動作する特定の方法を特定してもよい。
【0211】
ユーザがファイルクラスを登録することを可能にし、ファイルクラス間での継承をサポートし、ファイルが属するクラスに基づいてファイルについての情報を記憶するオブジェクト指向ファイルシステムは、ファイルシステムそのものが実現されるコンテキストに応じてさまざまな態様で実現され得る。一実施例によれば、オブジェクト指向ファイルシステムは上述のようにデータベース実現型ファイルシステムのコンテキストにおいて提供される。オブジェクト指向ファイルシステムのさまざまな局面をデータベース実現型の実施例に関連して説明するが、ここで説明するオブジェクト指向ファイルシステム手法はそのような実施例に限定されるものではない。
【0212】
オブジェクト指向ファイルシステムのデータベース実現
一実施例によれば、データベース実現型ファイルシステムはベースクラスを設けており、そのベースクラスのサブクラスをファイルシステムに登録することが可能である。図16を参照して、ファイルクラスの例示的なセットが示される。ベースクラスは「Files」と題され、名称、作成日および変更日を含むすべてのファイルに一般的に共通である属性を含む。同様に、Filesクラスの方法には、すべてのファイルに対して行われ得るオペレーションのための方法が含まれる。
【0213】
一実施例によれば、Filesクラスの属性は、データベース実現型ファイルシステムがともに用いられることになるオペレーティングシステムによって維持されるすべての属性の合併である。たとえば、図3に示されるようにサーバ204によって維持されるデータベースにおいてファイルシステムが実現されていると仮定する。そのファイルシステムに記憶されるファイルはオペレーティングシステム304aおよびオペレーティングシステム304bから生じたものであるが、これらのオペレーティングシステムは必ずしも同じファイル属性のセットをサポートするわけではない。このため、データベースサーバ204によって実現されるファイルシステムのFilesクラスの属性のセットは2つのオペレーティングシステム304aおよび304bによってサポートされる属性のセットの合併となる。
【0214】
代替の実施例によれば、Filesクラスの属性はデータベース実現型ファイルシステムがともに用いられるオペレーティングシステムによって維持されるすべての属性の交差である。そのような実施例においては、Filesクラスのサブクラスを各オペレーティングシステムに対して登録することができる。所与のオペレーティングシステムに対して登録されたサブクラスは、ベースのFilesクラスに既に含まれていない所与のオペレーティングシステムによってサポートされる属性のすべてを追加することによってベースのFilesクラスを拡張することとなる。
【0215】
図16に例示される実施例では、「Document」クラスおよび「Folder」クラスの、Filesの2つのサブクラスが登録されている。DocumentクラスはFilesクラスの属性および方法のすべてを継承し、かつ文書ファイルに特有の属性を追加する。例示される実施例では、Documentクラスは属性「サイズ」を追加する。
【0216】
Folderクラスは、Filesクラスの属性および方法のすべてを継承し、フォルダファイル(すなわち、他のファイルを含むことが可能である、ディレクトリなどのファイル)に特有である属性および方法を追加する。例示される実施例では、Folderクラスは新しい属性「max_children」および新しい方法「dir_list」を導入している。max_children属性はたとえば、所与のフォルダ内に含まれ得る子ファイルの最大数を示していてもよい。dir_list方法はたとえば、所与のフォルダの子ファイルのすべてのリストを提供するようにしてもよい。
【0217】
図16に例示されるクラス階層構造では、Documentクラスは、e-mailおよびTextの2つの登録されたサブクラスを有する。これらのサブクラスは両方ともDocumentクラスの属性および方法のすべてを継承する。さらに、e-mailクラスは、Read_flag、優先度および送信者の3つの追加のプロパティを含む。Textクラスは1つの追加の属性であるCR_Flagと追加の方法Typeとを有する。CR_Flagは、テキスト文書が「復帰」(carriage return)記号を含むかどうかを示すフラグであってもよい。Type方法は、コンピュータモニタなどの入出力デバイスへテキスト文書を出力する。
【0218】
ファイルクラスおよびファイル形式
ファイルの内部構造はファイルの「形式」と称される。典型的に、ファイルの形式はファイルを作成するアプリケーションにより決められる。たとえば、あるワードプロセッサにより作成された文書は別のワードプロセッサによって作成された別の文書と同じ意味内容を有していても、全く異なる形式を有しているかもしれない。いくつかのファイルシステムでは、文書形式とファイル名拡張子との間にマッピングが維持されている。たとえば、.docで終わるファイル名を有するすべてのファイルはある特定のワードプロセッサにより作成されたファイルであると推定され、よって、そのワードプロセッサによって強いられる内部構造を有するものと推定される。他のファイルシステムでは、文書の形式についての情報はその文書に関連付けられる別個のメタファイルにおいて維持される。
【0219】
ファイル形式とは対照的に、ここに説明するファイルクラス機構は文書の内部構造に関連しない。むしろ、ファイルのファイルクラスはファイルシステムがそのファイルに対してどんな情報を維持するか、かつファイルシステムがファイルにどんなオペレーションを行なえるかを決める。たとえば、多数のワードプロセッサによって作成された文書はすべてDocumentクラスのインスタンスであり得る。このため、ファイルシステムは文書の内部構造が完全に異なっていても、文書について同じ属性情報を維持し、文書に対して同じオペレーションを行なうことを可能にする。
【0220】
クラステーブル
一実施例によれば、オブジェクト指向ファイルシステムは、ファイルの各クラスに対して関係テーブルが作成される関係データベースシステムにおいて実現される。図17は、図16に例示されるクラスに対して作成され得るテーブルの一例である。具体的には、Filesテーブル1702、documentテーブル1704、E-mailテーブル1706、Textテーブル1708およびFolderテーブル1708はそれぞれ、Filesクラス、Documentクラス、E-mailクラス、TextクラスおよびFolderクラスに対応する。
【0221】
一実施例によれば、所与のクラスに対するクラステーブルは、(1)その所与のクラスに属するファイルおよび(2)その所与のクラスのいずれかの子孫(descendant)クラスに属するファイルのための行を含む。たとえば、例示されるシステムにおいて、Filesクラスはベースクラスである。したがって、ファイルシステムにおけるすべてのファイルはFilesクラスまたはその子孫クラスのメンバとなる。したがって、Filesテーブルはファイルシステムにおけるすべてのファイルに対する行を含むこととなる。一方、E-mailクラスおよびTextクラスはDocumentクラスの子孫であるが、FilesクラスおよびFolderクラスはそうではない。したがって、Documentテーブル1704は、クラスDocument、E-mailまたはTextのすべてのファイルに対する行を含むが、クラスFilesまたはFolderのものであるファイルに対する行は含まない。
【0222】
各クラスに対するテーブルは、そのクラスにより導入された属性に対する値を記憶する欄を含む。たとえば、DocumentクラスはFilesクラスの属性を継承し、これらの属性にサイズ属性を追加する。したがって、Documentテーブルには、サイズ属性に対するサイズ値を記憶するための欄が含まれる。同様に、E-mailクラスはDocumentクラスの属性を継承し、read_flag、優先度および送信者属性を導入する。したがって、E-mailテーブル1706には、read_flag値、優先度値および送信者値を記憶するための欄が含まれる。
【0223】
図17に示されるファイルシステムにおいて5つのファイルが記憶されている。File1と名づけられたファイルはFilesテーブル1702におけるRowID X1に記憶される。File1のFileIDはF1である。File1のクラスはFileクラスであり、これは行X1のClass欄に記憶される値によって示されるとおりである。File1はFilesクラスのインスタンスであるため、Filesテーブル1704はFile1に対する情報を含む唯一のクラステーブルである。したがって、File1に対して記憶される唯一の属性値はFilesクラスに関連付けられる属性に対する値である。
【0224】
File2と名付けられたファイルはFilesテーブル1702におけるRowID X2に記憶される。File2のFileIDはF2である。File2のクラスはDocumentクラスであり、これは行X2のClass欄に記憶される値によって示されるとおりである。File2はDocumentクラスのインスタンスであるため、Filesテーブル1702およびDocumentテーブル1704はFile2に対する情報を含む。すなわち、File2に対して記憶される属性値は、Filesクラスから継承された属性を含む、Documentクラスと関連付けられる属性に対する値である。
【0225】
File3と名付けられるファイルはFilesテーブル1702におけるRowID X3に記憶される。File3のFileIDはF3である。File3のクラスはE-mailクラスであり、これは行X3のClass欄に記憶される値によって示されるとおりである。File3はE-mailクラスのインスタンスであるため、Filesテーブル1702、Documentテーブル1704およびE-mailテーブル1706はすべてFile3に対する情報を含む。すなわち、File3に対して記憶される属性値は、DocumentクラスおよびFilesクラスから継承された属性を含む、E-mailクラスに関連付けられる属性に対する値である。
【0226】
File4と名付けられたファイルはFilesテーブル1702におけるRowID X4に記憶される。File4のFileIDはF4である。File4のクラスはTextクラスであり、これは行X4のClass欄に記憶される値によって示されるとおりである。File4はTextクラスのインスタンスであるため、Filesテーブル1702、Document1704およびTextテーブル1708はFile4に対する情報を含む。すなわち、File4に対して記憶される属性値は、DocumentクラスおよびFilesクラスから継承された属性を含む、Textクラスに関連付けられる属性に対する値である。
【0227】
File5と名付けられたファイルはFilesテーブル1702におけるRowID X5に記憶される。File5のFileIDはF5である。File5のクラスはFolderクラスであり、これは行X5のClass欄に記憶される値によって示されるとおりである。File5はFolderクラスのインスタンスであるため、Filesテーブル1702およびFolderテーブル1708はFile5に対する情報を含む。すなわち、File5に対して記憶される属性値は、Filesクラスから継承される属性を含む、Folderクラスに関連付けられる属性に対する値である。
【0228】
この発明の一実施例によれば、クラステーブル内のファイルは上に図5および図8に関連して説明したように階層インデックスをトラバースすることによってアクセスされる。階層インデックスのトラバースにより(パス名導出において行われるように)、ターゲットファイルに対応するFilesテーブル1702内の行のRowIDが生成される。その行から、Filesクラス属性に対する属性値が検索される。しかしながら、他のクラスに属するファイルに関しては、追加の属性は他のクラステーブルから検索されなければならないかもしれない。たとえば、File3に対し、作成日および変更日はFilesテーブル1702の行X3から検索され得る。しかしながら、File3のサイズを検索するには、Documentテーブル1704の行Y2にアクセスしなければならない。File3に対する優先度情報を検索するには、E-mailテーブル1706の行Q1にアクセスしなければならない。
【0229】
あるファイルに属するさまざまな属性値の検索を容易にするため、これらの属性を含む行は互いにリンクされる。例示される実施例では、リンクは「Derived RowID」とラベル付けされた欄に記憶される。ある特定のクラスに対するテーブルにおけるある特定のファイルに対する行のDerived RowID欄において記憶される値は、そのある特定のクラスのサブクラスに対するテーブルに存在するそのある特定のファイルに対する行を指し示す。たとえば、File3に対するFilesテーブル行X3のDerived RowID欄は値Y2を含む。Y2はDocumentテーブル1704におけるFile3に対する行のRowIDである。同様に、Document行Y2のDerived RowID欄は値Q1を含む。Q1はE-mailテーブル1706におけるFile3に対する行のRowIDである。
【0230】
例示される実施例では、ある特定のファイルに対する行間のリンクは片方向であり、親クラスに対するテーブルにおける行からサブクラスのテーブルにおける行へ行く。これらの片方向リンクにより、ベーステーブル(すなわちファイルテーブル)における行から始まるサーチが容易となるが、これはほとんどの条件下で当てはまる。しかしながら、サーチの開始点が別のテーブルの行である場合、親クラステーブルにおける関連のある行はリンクによってその場所を確認することができない。これらの関連のある行を探すため、関心のあるファイルのFileIDに基づいてこれらのテーブルのサーチが行なわれてもよい。
【0231】
たとえば、ユーザがDocumentテーブル1704の行Y2を検索し、File3に対する他の属性値のすべてを検索することを望んだと仮定する。E-mailに特有の属性値を含む行は、行Y2のDerived RowID欄におけるポインタをたどることによって見つけられるかも知れず、これはE-mailテーブル1706における行Q1を指し示す。しかしながら、残りの属性を探すためには、Filesテーブル1702をFileID F3に基づいてサーチする。このようなサーチにより行X3が見出されることとなり、これはFile3の残りの属性値を含む。
【0232】
代替の実施例によれば、関連のある行間のリンクは、すべての関連のある行がFileIDルックアップなしでその場所を確認することが可能となる態様で実現されてもよい。たとえば、各クラステーブルはまた、親クラステーブルにおける関連のある行のRowIDを含むParent RowID欄を有していてもよい。したがって、Documentテーブル1704の行Y2に対するParent RowID欄はFilesテーブル1702における行X3を指し示すこととなる。代わりに、片方向リンクの連鎖における最後の行が、Filesテーブルにおける関連のある行へ戻るポインタを含んでいてもよい。さらに別の選択肢としては、各クラステーブルに対して、Filesテーブルにおける関連のある行へ戻るポインタを含む欄を設けることを含む。したがって、Textテーブル1708の行R1およびDocumentテーブル1704の行Y3はともに、Filesテーブル1702の行X4へ戻るポインタを含むことになる。
【0233】
サブクラス登録
上に述べたように、新しいクラスを登録することによってファイルシステムのクラス階層構造を拡張するための機構が提供される。一般的に、クラス登録プロセスにおいて提供される情報は、新しいクラスの親クラスを識別するデータと新しいクラスによって追加される属性を記述するデータとを含む。任意に、データはまた、新しいクラスのインスタンスに対して行なうことができる新しい方法を識別するのに用いられるデータを含んでいてもよい。
【0234】
登録情報は数多くの手法のうちのいずれを用いてファイルシステムに提供されてもよい。たとえば、ユーザに、登録されたクラスのすべてを表わすアイコンを含むグラフィックユーザインターフェイスを提示してもよく、ユーザはユーザインターフェイスによって表わされるコントロールを操作して、(1)クラスのうちの1つを新しいクラスの親として選択し、(2)新しいクラスに名を付け、(3)新しいクラスに対して追加の属性を定義付け、(4)新しいクラスに対して行われ得る新しい方法を定義付けてもよい。代わりに、ユーザはファイルシステムに対して、新しいクラスに対する登録情報を含むファイルを与えてもよい。ファイルシステムはそのファイルをパーシングして情報を識別し抽出し、その情報に基づいて新しいクラスに対するクラスファイルを作る。
【0235】
この発明の一実施例によれば、クラス登録情報がExtensible Markup Language(XML)ファイルの形でファイルシステムにもたらされる。XML形式はwww.oasis-open.org/cover/xml.htm1#contentsおよびそこにリストされるサイトにおいて詳細に説明される。一般的に、XML言語は、フィールドを指名しフィールドの始まりおよび終わりをマークするタグとこれらのフィールドに対する値とを含む。たとえば「Folder」ファイルクラスに対する登録情報を含むXML文書は以下の情報を含んでいるかもしれない。
【0236】
Figure 0005113967
このファイルクラス登録文書を受取ったことに応答して、ファイルシステムは、新しいクラスFolderに対するテーブルを作成する。このようにして作成された新しいテーブルは、登録情報において定義付けられる属性の各々に対する欄を含む。この例においては、max_children属性のみが定義付けられている。max_children属性に対して特定されるデータタイプは「整数」である。したがって、Folderテーブルは、整数値を保持するmax_children欄とともに作成される。属性の名称およびタイプに加えて、各属性に対してさまざまな他の情報がもたらされてもよい。たとえば、登録情報は、属性値に対する範囲または最大長さを示していてもよく、その欄にインデックスをつけるべきであるかまたはその欄が一意性または参照制約を受けるべきであるかを示していてもよい。
【0237】
登録情報はまた、新しいクラスファイルによってサポートされるどんな方法についての情報も含む。一実施例によれば、新しい方法はこれらの方法に関連付けられるルーチンを含むファイルを識別することによって特定される。一実施例によれば、各ファイルクラスに関連付けられるルーチンはJAVA(R)クラスにおいて実現される。第1のファイルクラスが第2のファイルクラスのサブクラスである場合、第1のファイルクラスに関連付けられる方法を実現するJAVA(R)クラスは第2のファイルクラスの方法を実現するJAVA(R)クラスのサブクラスである。
【0238】
上に挙げたXMLの例では、登録情報のdbi_classnameフィールドがFolderファイルクラスに対するJAVA(R)クラスファイルを特定する。具体的には、登録情報はdbi_classnameフィールドに対してファイル名「my_folder_methods」をもたらし、my_folder_methods JAVA(R)クラスがFolderクラスの継承されていない方法に対するルーチンを実現することを示す。FolderクラスはFilesクラスのサブクラスであるため、my_folder_methodsクラスはFilesクラスに対する方法を実現するJAVA(R)クラスのサブクラスとなる。したがって、my_folder_methodsクラスはFiles方法を継承することとなる。
【0239】
親ファイルクラスによってサポートされていない新しい方法を定義付けることに加え、子ファイルクラスに対するルーチンは親クラスにおいて定義付けられる方法の実現をオーバーライドできる。たとえば、図16に示されるFilesクラスは「記憶」方法を提供する。Folderクラスはその記憶方法を継承する。しかしながら、Filesクラスに対してもたらされる記憶方法の実現は、フォルダを記憶するのに必要とされる実現ではないかもしれない。したがって、Folderクラスは記憶方法のそれ自身の実現をもたらしてもよく、これによりFilesクラスによってもたらされる実現をオーバーライドする。
【0240】
ファイルのクラスの判定
ファイルシステムがファイルに対してオペレーションを行なうように求められた際、ファイルシステムはそのファイルが属するファイルのある特定のクラスに対する要求されたオペレーションを実現するルーチンを呼出す。上述のように、その同じオペレーションは、たとえばサブクラスがその親クラスによってもたらされた実現をオーバーライドした際には異なるファイルクラスに対して異なった態様で実現され得る。すなわち、正しいオペレーションが行なわれることを確実にするため、ファイルシステムはまず、オペレーションが行なわれるべきファイルのクラスを識別しなければならない。
【0241】
ファイルシステムにおいて既に記憶されているファイルに対しては、ファイルのクラスを識別するタスクは些細なことかもしれない。たとえば、図17に示される実施例では、Filesテーブル1702は、どの所与の行に対しても、その行と関連付けられるファイルのクラスを示すデータを記憶するClass欄を含む。したがって、File3に対して「移動」オペレーションを行なうことのリクエストを受取った場合、行X3のClass欄を検査してFile3がE-mailのタイプのものであることを判定する。これにより、「移動」のE-mailの実現が実行されるべきである。「移動」のE-mail実現は、E-mailファイルクラスがその継承した「移動」方法の実現をオーバーライドする場合にはE-mailファイルクラスに対してもたらされる実現となる。そうでなければ、「移動」のE-mail実現はE-mailクラスによって継承された実現である。
【0242】
ファイルのクラスを識別するタスクは、ファイルが既にファイルシステムに記憶されていない場合にはより困難であり得る。たとえば、ファイルシステムがファイルシステムに既に存在していないファイルを記憶することを求められた際、ファイルシステムはファイルテーブルを検査することによってクラス判定を行なうことができない。このような条件下では、ファイルのタイプを識別するのにさまざまな手法を用いてもよい。一実施例によれば、ファイルのタイプはファイルオペレーションリクエストにおいて明白にもたらされ得る。たとえば、オペレーティングシステムのコマンド行を介して発行されたコマンドに応答してリクエストがなされた場合、コマンド行引き数(command-line arguments)のうちの1つを用いてファイルのファイルタイプを示してもよい。たとえば、コマンドは「move a:\mydocs\file2c:\yourdocs/class=document」と入力されてもよい。
【0243】
ファイルのクラスを判定するための別の手法には、ファイルの名称に含まれる情報に基づいてクラスを判定することが含まれる。たとえば、ある拡張子(たとえばdoc.wpd.pwpなど)を有するすべてのファイルはある特定のファイルクラス(たとえばDocument)のメンバとしてすべて扱われてもよい。したがって、ファイルシステムがこれらのファイルに対してオペレーションを行なうことを求められると、そのある特定のファイルクラスに関連付けられる方法実現が用いられる。
【0244】
ファイルのクラスを判定するためのさらに別の手法には、ファイルシステム階層構造内のファイルの場所に基づいてクラスを判定することが含まれる。たとえば、ある特定のディレクトリまたはディレクトリのセット内で作成されるすべてのファイルは、ファイルがどのように名付けられているかにかかわらずある特定のファイルクラスに属するものと推定され得る。これらおよび他の手法をさまざまな態様で組合せてもよい。たとえば、ある特定の拡張子を有するファイルは、そのファイルが第2のクラスと関連付けられるディレクトリに記憶されているのでなければ、第1のクラスのメンバとして扱われ得る。ファイルが第2のクラスに関連付けられるディレクトリに記憶されている場合、ファイルが別のファイルクラスのメンバであることをファイルオペレーションリクエストが明示的に識別しているのでなければ、ファイルは第2のクラスのメンバとして扱われる。
【0245】
ハードウェアの外観
図18はこの発明の実施例が実現され得るコンピュータシステム1800を示すブロック図である。コンピュータシステム1800は、バス1802または情報を通信するための他の通信機構と、バス1802に結合され情報を処理するためのプロセッサ1804とを含む。コンピュータシステム1800はまた、ランダムアクセスメモリ(RAM)または他の動的記憶装置などのメインメモリ1806を含み、これはバス1802に結合され情報と、プロセッサ1804によって実行されるべき命令とを記憶する。メインメモリ1806はまた、プロセッサ1804によって実行されるべき命令の実行の間に一時変数または他の中間情報を記憶するのに用いられてもよい。コンピュータシステム1800はさらに、バス1802に結合されプロセッサ1804のための静的情報および命令を記憶するための読取専用メモリ(ROM)1808または他の静的記憶装置を含む。磁気ディスクまたは光ディスクなどのストレージデバイス1810が設けられ、バス1802に結合されて情報および命令を記憶する。
【0246】
コンピュータシステム1800は、コンピュータユーザに情報を表示するための、陰極線管(CRT)などのディスプレイ1812にバス1802を介して結合されてもよい。英数字キーおよび他のキーを含む入力デバイス1814は、バス1802に結合されプロセッサ1804へ情報およびコマンド選択を通信する。別のタイプのユーザ入力デバイスは、マウス、トラックボールまたはカーソル方向キーなどのカーソル制御1816であり、これはプロセッサ1804へ方向情報およびコマンド選択を通信し、ディスプレイ1812上でのカーソル移動を制御する。この入力デバイスは典型的に、第1の軸(たとえばx)および第2の軸(たとえばy)の2軸での2つの自由度を有し、これはデバイスが平面における位置を特定することを可能にする。
【0247】
この発明は、ここに説明される手法を実現するためのコンピュータシステム1800の使用に関する。この発明の一実施例によれば、これらの手法は、プロセッサ1804がメインメモリ1806に含まれる1つ以上の命令の1つ以上のシーケンスを実行することに応答してコンピュータシステム1800によって実現される。このような命令は、ストレージデバイス1810などの別のコンピュータ可読媒体からメインメモリ1806に読込まれてもよい。メインメモリ1806に含まれる命令のシーケンスの実行により、プロセッサ1804がここに説明するプロセスステップを行なうこととなる。代替の実施例では、この発明を実現するのに布線回路をソフトウェア命令の代わりに、またはソフトウェア命令と組合せて用いてもよい。このように、この発明の実施例はハードウェア回路およびソフトウェアのいずれの特定の組合せにも限定されるものではない。
【0248】
ここで用いられる用語「コンピュータ可読媒体」は、実行のためにプロセッサ1804に命令を提供することにかかわるすべての媒体を指していう。このような媒体は数多くの形態をとることができ、これには不揮発性媒体、揮発性媒体および伝送媒体が含まれるがこれらに限定されるものではない。不揮発性媒体はたとえば、ストレージデバイス1810などの光ディスクまたは磁気ディスクを含む。揮発性媒体には、メインメモリ1806などの動的メモリが含まれる。伝送媒体には、バス1802をなす配線を含む、同軸ケーブル、銅線および光ファイバが含まれる。伝送媒体にはまた、電波および赤外線データ通信において生成されるもののような、音波または光波の形態をとっていてもよい。
【0249】
一般的な形態のコンピュータ可読媒体には、たとえば、フロッピー(R)ディスク、フレキシブルディスク、ハードディスク、磁気テープまたは他の磁気媒体すべて、CD−ROM、他の光学媒体すべて、穿孔カード、紙テープ、孔のパターンを有する他の物理媒体すべて、RAM、PROMおよびEPROM、FLASH-EPROM他のメモリチップすべてまたはカートリッジ、以下に説明するような搬送波またはコンピュータが読むことができる他の媒体すべてが含まれる。
【0250】
さまざまな形態のコンピュータ可読媒体が、実行のためにプロセッサ1804に1つ以上の命令の1つ以上のシーケンスを与えることに関係し得る。たとえば、命令は初めに、遠隔地のコンピュータの磁気ディスクに担持されているかもしれない。遠隔地のコンピュータはその動的メモリに命令をロードして、命令をモデムを用いて電話回線を介して送信することができる。コンピュータシステム1800が有するモデムが電話回線上のデータを受信し、赤外線送信機を用いてそのデータを赤外線信号に変換することができる。赤外線検出器は赤外線信号に載ったデータを受信し、適切な回路はそのデータをバス1802上に出力することができる。バス1802はデータをメインメモリ1806に運び、そこからプロセッサ1804が命令を取出し実行する。メインメモリ1806によって受信された命令は、任意にプロセッサ1804による実行の前または後のいずれかにおいてストレージデバイス1810に記憶されてもよい。
【0251】
コンピュータシステム1800はまた、バス1802に結合される通信インターフェイス1818を含む。通信インターフェイス1818は、ローカルネットワーク1822に接続されるネットワークリンク1820に結合される双方向データ通信を提供する。たとえば、通信インターフェイス1818は、対応するタイプの電話回線に対するデータ通信接続をもたらすモデムまたはサービス総合デジタルネットワーク(ISDN)カードであってもよい。別の例としては、通信インターフェイス1818は、互換性のあるLANへのデータ通信接続をもたらすためのローカルエリアネットワーク(LAN)カードであってもよい。無線リンクもまた実現され得る。このような実現例のいずれにおいても、通信インターフェイス1818は、さまざまなタイプの情報を表わすデジタルデータストリームを担持する電気信号、電磁信号または光信号を送受信する。
【0252】
ネットワークリンク1820は典型的に、1つ以上のネットワークを介して他のデータデバイスに対するデータ通信を提供する。たとえば、ネットワークリンク1820は、ローカルネットワーク1822を介して、ホストコンピュータ1824に対してまたはインターネットサービスプロバイダ(ISP)1826によって操作されるデータ機器に対して接続をもたらし得る。そのISP1826は、現在一般的に「インターネット」1828と称されるワールドワイドパケットデータ通信ネットワークを介するデータ通信サービスを提供する。ローカルネットワーク1822およびインターネット1828はともに、デジタルデータストリームを担持する電気信号、電磁信号または光信号を用いる。さまざまなネットワークを介する信号と、デジタルデータをコンピュータシステム1800と授受するネットワークリンク1820上のおよび通信インターフェイス1818を介する信号とは、情報を運ぶ搬送波の例示的な形態である。
【0253】
コンピュータシステム1800は、ネットワーク、ネットワークリンク1820および通信インターフェイス1818を介して、プログラムコードを含む、メッセージを送信しデータを受信することができる。インターネットの例では、サーバ1830がインターネット1828、ISP1826、ローカルネットワーク1822および通信インターフェイス1818を介してアプリケーションプログラムに対する要求されたコードを送信するかもしれない。この発明によれば、ダウンロードされたそのようなアプリケーションの1つがここに説明される手法を実現する。
【0254】
受信されたコードは、受信されるとともにプロセッサ1804によって実行されてもよく、および/または後に実行するためにストレージデバイス1810または他の不揮発性ストレージに記憶されてもよい。このような態様で、コンピュータシステム1800は搬送波の形態であるアプリケーションコードを得てもよい。
【0255】
前述の明細書において、この発明をその特定の実施例に関連して説明した。しかしながら、この発明のより広い精神および範囲から逸脱することなくこれにさまざまな変更および修正を加えてもよいことが明らかになるであろう。明細書および図面はしたがって、例示的な意味でみなすべきであり、限定的な意味でみなすものではない。
【図面の簡単な説明】
【図1】 従来のアプリケーションにおいて、オペレーティングシステムによって提供されるファイルシステムを通じてデータが記憶される様子を示すブロック図である。
【図2】 従来のデータベースアプリケーションにおいて、データベースシステムによって提供されるデータベースAPIを通じてデータが記憶される様子を示すブロック図である。
【図3】 データベースAPIおよびOSファイルシステムAPIを含む種々のインターフェイスを通じて同じデータの組にアクセス可能な、システムを示すブロック図である。
【図4】 トランスレーションエンジン308をより詳細に示すブロック図である。
【図5】 階層インデックスを示すブロック図である。
【図6】 階層インデックスによってエミュレートすることのできるファイル階層構造を示すブロック図である。
【図7】 本発明に一実施例に従った、関係データベース内にファイルを記憶するのに使用することのできるファイルテーブルを示すブロック図である。
【図8】 階層インデックスを使用してパス名を導出するステップを示すフローチャートである。
【図9】 データベースファイルサーバをより詳細に示すブロック図である。
【図10】 ストアドクエリディレクトリのためのエントリを含む階層インデックスのブロック図である。
【図11】 ストアドクエリディレクトリのための行を含むファイルテーブルのブロック図である。
【図12】 ストアドクエリディレクトリを含むファイル階層構造を示すブロック図である。
【図13】 ファイル階層構造を示すブロック図である。
【図14】 図13に示すファイル階層構造が、ここに説明するバージョニング技術の一実施例に従って、ドキュメントの更新に応答して更新される様子を示す、ブロック図である。
【図15】 図13に示すファイル階層構造が、ここに説明するバージョニング技術の一実施例に従って、ドキュメントがあるフォルダから別のフォルダへと移動するのに応答して更新される様子を示す、ブロック図である。
【図16】 本発明の一実施例に従ったファイルクラスのクラス階層構造を示すブロック図である。
【図17】 本発明の一実施例に従った、図16のファイルクラス階層構造を実現するデータベース実現型ファイルシステムにおいて使用される、関係テーブルを示すブロック図である。
【図18】 本発明の実施例がそれにおいて実現され得る、コンピュータシステムを示すブロック図である。

Claims (14)

  1. データベースに記憶されたデータにアクセスする方法であって、
    該方法は、プロトコルサーバが、オペレーティングシステムの1つ以上のルーチンからの、1つ以上のI/Oコマンドを受取るステップを含み、前記プロトコルサーバは、前記オペレーティングシステムで動作するよう構成されており、
    前記1つ以上のルーチンは、アプリケーションから前記オペレーティングシステムへの、ファイルへアクセスするための1つ以上のコールに応答して、1つ以上のI/Oコマンドを生成しており、
    該方法は、
    前記プロトコルサーバが、前記1つ以上のI/Oコマンドを1つ以上のDBファイルシステムコマンドに変換するステップと、
    DBファイルサーバが、前記1つ以上のDBファイルシステムコマンドに応答して、1つ以上の第1のデータベースコマンドを、生成するとともに前記データベースを管理するデータベースサーバに対して発行するステップとを含み、
    前記データベースサーバは、前記1つ以上の第1のデータベースコマンドを実行して前記データベースから第1のデータを検索し、前第1のデータから生成されたファイルを第1のアプリケーションに提供し、該方法はさらに、
    第2のアプリケーションに対してDBファイルAPIを提供するステップと、
    前記DBファイルサーバが、前記DBファイルAPIを介して、前記第2のアプリケーションからの1つ以上の第2のDBファイルシステムコマンドを直接受取るステップとを含み、
    前記1つ以上の第2のDBファイルシステムコマンドに応答して、1つ以上の第2のデータベースコマンドが、生成されるとともに前記データベースサーバに対して発行され、
    前記データベースサーバは、前記1つ以上の第2のデータベースコマンドを実行して前記データベースから第2のデータを検索し、前記第2のデータから生成されたファイルを前記第2のアプリケーションに提供する、方法。
  2. 前記ファイルアプリケーションに提供する処理は、前記オペレーティングシステムにおける1つ以上のルーチンによって実行される、請求項1に記載の方法。
  3. 前記DBファイルサーバが、前記DBファイルAPIを介して、複数のファイルオペレーションを行なうためのコールを受取るステップを含み、前記複数のファイルオペレーションは、少なくとも、前記データベースに記憶された第1のファイルに対する第1のファイルオペレーションと、前記データベースに記憶された第2のファイルに対する第2のファイルオペレーションとを含み、該方法はさらに、
    前記DBファイルサーバが、前記複数のファイルオペレーションを、次のステップを行なうことによって、単一のトランザクションとして行なうステップを含み、該次のステップは、
    もし前記複数のファイルオペレーションのうちすべてのファイルオペレーションが失敗なく完了すれば、前記複数のファイルオペレーションによってなされたすべての変化を永久のものとするステップと、
    もし前記複数のファイルオペレーションのうち何らかのファイルオペレーションが失敗すれば、前記複数のファイルオペレーションのすべてによってなされたすべての変化を無効にするステップとを含む、請求項に記載の方法。
  4. 前記複数のファイルオペレーションは、前記データベースに記憶された単一のファイルに対する複数の書込オペレーションを含む、請求項に記載の方法。
  5. 前記複数のファイルオペレーションを行なうステップは、前記データベースサーバに対して1つ以上のデータベースステートメントを発行するステップを含み、前記データベースサーバは前記1つ以上のデータベースステートメントを実行して前記複数のファイルオペレーションを行なう、請求項に記載の方法。
  6. 前記複数の書込オペレーションは、前記単一のファイルを前記データベースに記憶するためにネットワーク接続にわたって転送することに相当する、請求項に記載の方法。
  7. 前記プロトコルサーバは、デバイスドライバインターフェイスとして機能する、請求項1〜のいずれか1項に記載の方法。
  8. データベースに記憶されたデータにアクセスするための命令を記憶した1つ以上のコンピュータ読取可能媒体であって、該命令は、1つ以上のプロセッサによって実行されると、以下のステップを生じさせ、
    該以下のステップは、プロトコルサーバが、オペレーティングシステムの1つ以上のルーチンからの、1つ以上のI/Oコマンドを受取るステップを含み、前記プロトコルサーバは、前記オペレーティングシステムで動作するよう構成されており、
    前記1つ以上のルーチンは、アプリケーションから前記オペレーティングシステムへの、ファイルへアクセスするための1つ以上のコールに応答して、1つ以上のI/Oコマンドを生成しており、
    該以下のステップは、
    前記プロトコルサーバが、前記1つ以上のI/Oコマンドを1つ以上のDBファイルシステムコマンドに変換するステップと、
    DBファイルサーバが、前記1つ以上のDBファイルシステムコマンドに応答して、1つ以上の第1のデータベースコマンドを、生成するとともに前記データベースを管理するデータベースサーバに対して発行するステップとを含み、
    前記データベースサーバは、前記1つ以上の第1のデータベースコマンドを実行して前記データベースから第1のデータを検索し、前第1のデータから生成されたファイルを第1のアプリケーションに提供し、該以下のステップはさらに、
    第2のアプリケーションに対してDBファイルAPIを提供するステップと、
    前記DBファイルサーバが、前記DBファイルAPIを介して、前記第2のアプリケーションからの1つ以上の第2のDBファイルシステムコマンドを直接受取るステップとを含み、
    前記1つ以上の第2のDBファイルシステムコマンドに応答して、1つ以上の第2のデータベースコマンドが、生成されるとともに前記データベースサーバに対して発行され、
    前記データベースサーバは、前記1つ以上の第2のデータベースコマンドを実行して前記データベースから第2のデータを検索し、前記第2のデータから生成されたファイルを前記第2のアプリケーションに提供する、コンピュータ読取可能媒体。
  9. 前記ファイルアプリケーションに提供する処理は、前記オペレーティングシステムにおける1つ以上のルーチンによって実行される、請求項に記載のコンピュータ読取可能媒体。
  10. 前記DBファイルサーバが、前記DBファイルAPIを介して、複数のファイルオペレーションを行なうためのコールを受取るステップを含み、前記複数のファイルオペレーションは、少なくとも、前記データベースに記憶された第1のファイルに対する第1のファイルオペレーションと、前記データベースに記憶された第2のファイルに対する第2のファイルオペレーションとを含み、該以下のステップはさらに、
    前記DBファイルサーバが、前記複数のファイルオペレーションを、次のステップを行なうことによって、単一のトランザクションとして行なうステップを含み、該次のステップは、
    もし前記複数のファイルオペレーションのうちすべてのファイルオペレーションが失敗なく完了すれば、前記複数のファイルオペレーションによってなされたすべての変化を永久のものとするステップと、
    もし前記複数のファイルオペレーションのうち何らかのファイルオペレーションが失敗すれば、前記複数のファイルオペレーションのすべてによってなされたすべての変化を無効にするステップとを含む、請求項に記載のコンピュータ読取可能媒体。
  11. 前記複数のファイルオペレーションは、前記データベースに記憶された単一のファイルに対する複数の書込オペレーションを含む、請求項10に記載のコンピュータ読取可能媒体。
  12. 前記複数のファイルオペレーションを行なうステップは、前記データベースサーバに対して1つ以上のデータベースステートメントを発行するステップを含み、前記データベースサーバは前記1つ以上のデータベースステートメントを実行して前記複数のファイルオペレーションを行なう、請求項10に記載のコンピュータ読取可能媒体。
  13. 前記複数の書込オペレーションは、前記単一のファイルを前記データベースに記憶するためにネットワーク接続にわたって転送することに相当する、請求項11に記載のコンピュータ読取可能媒体。
  14. 前記プロトコルサーバは、デバイスドライバインターフェイスとして機能する、請求項13のいずれか1項に記載のコンピュータ読取可能媒体。
JP2001516067A 1999-08-05 2000-07-26 インターネットファイルシステム Expired - Lifetime JP5113967B2 (ja)

Applications Claiming Priority (17)

Application Number Priority Date Filing Date Title
US14753899P 1999-08-05 1999-08-05
US60/147,538 1999-08-05
US57149200A 2000-05-15 2000-05-15
US09/571,696 US8335775B1 (en) 1999-08-05 2000-05-15 Versioning in internet file system
US09/571,508 US7418435B1 (en) 1999-08-05 2000-05-15 Multi-model access to data
US09/571,060 US7620620B1 (en) 1999-08-05 2000-05-15 Basing directory contents on a query that is associated with a file identifier
US09/571,492 2000-05-15
US09/571,060 2000-05-15
US09/571,496 US6922708B1 (en) 1999-02-18 2000-05-15 File system that supports transactions
US09/571,696 2000-05-15
US09/571,036 US6549916B1 (en) 1999-08-05 2000-05-15 Event notification system tied to a file system
US09/571,568 2000-05-15
US09/571,496 2000-05-15
US09/571,036 2000-05-15
US09/571,508 2000-05-15
US09/571,568 US7280995B1 (en) 1999-08-05 2000-05-15 On-the-fly format conversion
PCT/US2000/020386 WO2001011486A2 (en) 1999-08-05 2000-07-26 Internet file system

Publications (3)

Publication Number Publication Date
JP2003527659A JP2003527659A (ja) 2003-09-16
JP2003527659A5 JP2003527659A5 (ja) 2007-09-13
JP5113967B2 true JP5113967B2 (ja) 2013-01-09

Family

ID=27574958

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001516067A Expired - Lifetime JP5113967B2 (ja) 1999-08-05 2000-07-26 インターネットファイルシステム

Country Status (5)

Country Link
EP (1) EP1330727A2 (ja)
JP (1) JP5113967B2 (ja)
AU (6) AU774090B2 (ja)
CA (1) CA2379930C (ja)
WO (1) WO2001011486A2 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0107078D0 (en) * 2001-03-21 2001-05-09 Nokia Oyj Management and distribution of electronic media
US7200627B2 (en) 2001-03-21 2007-04-03 Nokia Corporation Method and apparatus for generating a directory structure
US7320141B2 (en) * 2001-03-21 2008-01-15 International Business Machines Corporation Method and system for server support for pluggable authorization systems
WO2002082312A2 (en) * 2001-04-06 2002-10-17 International Business Machines Corporation A method for standardized file-based access to databases, enterprise java beans and content management systems
WO2005079404A2 (en) * 2004-02-18 2005-09-01 Clark Yennie Time-addressed database management system
US20050203903A1 (en) * 2004-03-10 2005-09-15 Rajan Rajeev B. System and method for locking and isolation in a storage platform
US7143120B2 (en) * 2004-05-03 2006-11-28 Microsoft Corporation Systems and methods for automated maintenance and repair of database and file systems
US7644239B2 (en) 2004-05-03 2010-01-05 Microsoft Corporation Non-volatile memory cache performance improvement
US7366740B2 (en) * 2004-05-03 2008-04-29 Microsoft Corporation Systems and methods for automatic maintenance and repair of enitites in a data model
US7707498B2 (en) 2004-09-30 2010-04-27 Microsoft Corporation Specific type content manager in an electronic document
US7490197B2 (en) 2004-10-21 2009-02-10 Microsoft Corporation Using external memory devices to improve system performance
US8606830B2 (en) 2004-12-17 2013-12-10 Microsoft Corporation Contiguous file allocation in an extensible file system
US8321439B2 (en) 2004-12-17 2012-11-27 Microsoft Corporation Quick filename lookup using name hash
US9639554B2 (en) 2004-12-17 2017-05-02 Microsoft Technology Licensing, Llc Extensible file system
US7873596B2 (en) 2006-05-23 2011-01-18 Microsoft Corporation Extending cluster allocations in an extensible file system
US7730394B2 (en) 2005-01-06 2010-06-01 Microsoft Corporation Data binding in a word-processing application
US7945590B2 (en) 2005-01-06 2011-05-17 Microsoft Corporation Programmability for binding data
US7617234B2 (en) 2005-01-06 2009-11-10 Microsoft Corporation XML schema for binding data
US7752224B2 (en) 2005-02-25 2010-07-06 Microsoft Corporation Programmability for XML data store for documents
US7668873B2 (en) * 2005-02-25 2010-02-23 Microsoft Corporation Data store for software application documents
US7953696B2 (en) 2005-09-09 2011-05-31 Microsoft Corporation Real-time synchronization of XML data between applications
US8914557B2 (en) 2005-12-16 2014-12-16 Microsoft Corporation Optimizing write and wear performance for a memory
JP5309607B2 (ja) * 2008-02-26 2013-10-09 日本電気株式会社 タグ情報に基づく情報分類表示システム
US9032151B2 (en) 2008-09-15 2015-05-12 Microsoft Technology Licensing, Llc Method and system for ensuring reliability of cache data and metadata subsequent to a reboot
US7953774B2 (en) 2008-09-19 2011-05-31 Microsoft Corporation Aggregation of write traffic to a data store
JP2011008443A (ja) * 2009-06-24 2011-01-13 Mitsubishi Electric Corp データベース定義生成装置及びデータベース設計装置及びデータベース構築システム及びコンピュータプログラム及びデータベース定義生成方法
US8516137B2 (en) 2009-11-16 2013-08-20 Microsoft Corporation Managing virtual hard drives as blobs
WO2012111129A1 (ja) * 2011-02-17 2012-08-23 三菱電機株式会社 データベース接続装置
CN107729504A (zh) * 2017-10-23 2018-02-23 武汉楚鼎信息技术有限公司 一种处理大数据对象的方法及系统

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0229232A2 (en) * 1985-12-31 1987-07-22 Tektronix, Inc. File management system
US5150473A (en) * 1990-01-16 1992-09-22 Dantz Development Corporation Data storage format for addressable or sequential memory media
CA2067633C (en) * 1991-07-24 1996-10-01 Eric Jonathan Bauer Method and apparatus for accessing a computer-based file system
JPH0765032A (ja) * 1993-08-27 1995-03-10 Toshiba Corp データベース言語変換機能を持つ情報処理システム
US5513351A (en) * 1994-07-28 1996-04-30 International Business Machines Corporation Protecting a system during system maintenance by usage of temporary filenames in an alias table
US5737736A (en) * 1994-07-29 1998-04-07 Oracle Corporation Method and apparatus for storing objects using a c-structure and a bind descriptor
JPH08137728A (ja) * 1994-09-14 1996-05-31 Toshiba Corp 携帯ファイルシステム及びファイルデータ処理方法
US5581755A (en) * 1995-01-31 1996-12-03 Unisys Corporation Method for maintaining a history of system data and processes for an enterprise
US5649158A (en) * 1995-02-23 1997-07-15 International Business Machines Corporation Method for incrementally archiving primary storage to archive storage by utilizing both a partition archive status array and a partition map
US5675802A (en) * 1995-03-31 1997-10-07 Pure Atria Corporation Version control system for geographically distributed software development
JPH08314787A (ja) * 1995-05-12 1996-11-29 Nec Corp ファイルロケーション管理方式
US5870757A (en) * 1995-09-11 1999-02-09 Sun Microsystems, Inc. Single transaction technique for a journaling file system of a computer operating system
US5706510A (en) * 1996-03-15 1998-01-06 Hewlett-Packard Company Zymbolic history management system
WO1997046956A1 (en) * 1996-06-07 1997-12-11 At & T Corp. Internet file system
US5920867A (en) * 1996-12-06 1999-07-06 International Business Machines Corporation Data management system having data management configuration
US5903897A (en) * 1996-12-18 1999-05-11 Alcatel Usa Sourcing, L.P. Software documentation release control system
US5937406A (en) * 1997-01-31 1999-08-10 Informix Software, Inc. File system interface to a database
US6216140B1 (en) * 1997-09-17 2001-04-10 Hewlett-Packard Company Methodology for the efficient management of hierarchically organized information
US6505212B2 (en) * 1998-02-04 2003-01-07 Interwoven Inc System and method for website development
US6321219B1 (en) * 1998-08-14 2001-11-20 Microsoft Corporation Dynamic symbolic links for computer file systems

Also Published As

Publication number Publication date
AU2004203243B2 (en) 2008-03-20
AU2004203240B2 (en) 2008-04-03
AU774090B2 (en) 2004-06-17
CA2379930C (en) 2012-12-18
CA2379930A1 (en) 2001-02-15
AU2004203242A1 (en) 2004-09-02
EP1330727A2 (en) 2003-07-30
WO2001011486A3 (en) 2003-04-17
AU2004203249B2 (en) 2008-04-03
AU2004203241A1 (en) 2004-09-02
AU6495400A (en) 2001-03-05
WO2001011486A2 (en) 2001-02-15
AU2004203249A1 (en) 2004-09-02
AU2004203240A1 (en) 2004-09-02
JP2003527659A (ja) 2003-09-16
AU2004203243A1 (en) 2004-09-02
AU2004203241B2 (en) 2008-04-10
AU2004203242B2 (en) 2008-05-01

Similar Documents

Publication Publication Date Title
JP5113967B2 (ja) インターネットファイルシステム
US6549916B1 (en) Event notification system tied to a file system
US7502782B2 (en) Database-managed file system
US8065320B2 (en) Multi-model access to data
US7280995B1 (en) On-the-fly format conversion
JP4583377B2 (ja) ハードウェア/ソフトウェアインターフェースシステムにより管理可能な情報のユニットに対する関係および階層の同期サービスを実現するシステムおよび方法
CA2522309C (en) Retaining hierarchical information in mapping between xml documents and relational data
EP1559036B1 (en) Techniques for managing multiple hierarchies of data from a single interface
JP2007521533A (ja) アプリケーションプログラムをアイテムベースのストレージプラットフォームとインターフェースするためのシステムおよび方法
JP2007521532A (ja) アイテムベースのストレージプラットフォームにおけるデータモデリングのためのシステムおよび方法
JP4580390B2 (ja) ハードウェア/ソフトウェアインターフェイスシステムによって管理可能な情報単位の拡張および継承のためのシステムおよび方法
EP1898321B1 (en) Internet file system
JP2007521537A (ja) データの編成、検索、および共有のためのストレージプラットフォーム
CN1716247B (zh) 对可由硬件/软件接口系统进行信息管理的单元的对等同步化提供冲突处理的系统和方法
CA2646776C (en) Internet file system
CA2650251C (en) Internet file system
HK1112088A (en) Internet file system
HK1112296A (en) Internet file system

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20050913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070725

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100720

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101012

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110214

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110222

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20110428

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121015

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151019

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5113967

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term