JPH09297768A - 文書データベース管理装置及び文書データベース検索方法 - Google Patents
文書データベース管理装置及び文書データベース検索方法Info
- Publication number
- JPH09297768A JPH09297768A JP8112301A JP11230196A JPH09297768A JP H09297768 A JPH09297768 A JP H09297768A JP 8112301 A JP8112301 A JP 8112301A JP 11230196 A JP11230196 A JP 11230196A JP H09297768 A JPH09297768 A JP H09297768A
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- type
- document type
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/83—Querying
- G06F16/835—Query processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99932—Access augmentation or optimizing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99934—Query formulation, input preparation, or translation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【課題】 構造化文書の検索時間を短縮するとともに、
検索結果の適合率の向上を図る。 【解決手段】 文書型データベース1と文書データベー
ス2とが設けられている。検索式入力手段3は、要素型
と要素型間の関係とを検索条件に含む検索式3aを入力
する。適応文書型検索手段4は、検索式3aと文書型デ
ータベース1内の複数の文書型1aとを照合し、検索式
3aを満たす文書を生成し得る文書型を検出する。検索
対象文書型指定手段5内の適応文書型表示手段5aは、
適応文書型検索手段4で検出された文書型のリストをC
RT等の表示装置の画面上に表示する。文書型入力手段
5bは、キーボードなどの操作により指定された文書型
を、検索対象文書型として入力する。文書検索手段6
は、検索対象文書型指定手段5から受け取った検索対象
文書型に従って作成された文書のみを検索対象として、
検索式3aの条件を満たした文書を検出する。
検索結果の適合率の向上を図る。 【解決手段】 文書型データベース1と文書データベー
ス2とが設けられている。検索式入力手段3は、要素型
と要素型間の関係とを検索条件に含む検索式3aを入力
する。適応文書型検索手段4は、検索式3aと文書型デ
ータベース1内の複数の文書型1aとを照合し、検索式
3aを満たす文書を生成し得る文書型を検出する。検索
対象文書型指定手段5内の適応文書型表示手段5aは、
適応文書型検索手段4で検出された文書型のリストをC
RT等の表示装置の画面上に表示する。文書型入力手段
5bは、キーボードなどの操作により指定された文書型
を、検索対象文書型として入力する。文書検索手段6
は、検索対象文書型指定手段5から受け取った検索対象
文書型に従って作成された文書のみを検索対象として、
検索式3aの条件を満たした文書を検出する。
Description
【0001】
【発明の属する技術分野】本発明は構造化文書を格納し
ている文書データベースの検索機能を有する文書データ
ベース管理装置及び構造化文書を格納している文書デー
タベースの検索を行う文書データベース検索方法に関
し、特に異なる文書型に従って作成された複数の構造化
文書を管理する文書データベース管理装置及び異なる文
書型に従って作成された複数の構造化文書の検索を行う
文書データベース検索方法に関する。
ている文書データベースの検索機能を有する文書データ
ベース管理装置及び構造化文書を格納している文書デー
タベースの検索を行う文書データベース検索方法に関
し、特に異なる文書型に従って作成された複数の構造化
文書を管理する文書データベース管理装置及び異なる文
書型に従って作成された複数の構造化文書の検索を行う
文書データベース検索方法に関する。
【0002】
【従来の技術】章、節、図などの論理的な構造を持つ文
書を構造化文書と呼ぶ。文書の構造を統一しておくこと
により、文書の共有や文書構造の操作が容易となる。こ
の構造化文書の内容は論理構造と呼ばれ、章、節、図等
を構成要素とした木構造で表現される。
書を構造化文書と呼ぶ。文書の構造を統一しておくこと
により、文書の共有や文書構造の操作が容易となる。こ
の構造化文書の内容は論理構造と呼ばれ、章、節、図等
を構成要素とした木構造で表現される。
【0003】図12は構造化文書の論理構造を示す図で
ある。この図では、最上位(ルート)に「記事」という
名前の要素型の要素31があり、その子として要素型が
「節」の2つの要素32,33がある。要素型が「節」
の要素32には、要素型が「見出し」の要素34、要素
型が「段落」の要素35、要素型が「節」の要素36の
子がある。一方、要素型が「節」の要素33には、要素
型が「見出し」の要素37、要素型が「段落」の2つの
要素38,39の子がある。さらに、要素型が「節」の
要素36には、要素型が「見出し」の要素40、要素型
が「段落」の2つの要素41,42の子がある。
ある。この図では、最上位(ルート)に「記事」という
名前の要素型の要素31があり、その子として要素型が
「節」の2つの要素32,33がある。要素型が「節」
の要素32には、要素型が「見出し」の要素34、要素
型が「段落」の要素35、要素型が「節」の要素36の
子がある。一方、要素型が「節」の要素33には、要素
型が「見出し」の要素37、要素型が「段落」の2つの
要素38,39の子がある。さらに、要素型が「節」の
要素36には、要素型が「見出し」の要素40、要素型
が「段落」の2つの要素41,42の子がある。
【0004】このような論理構造は自由に作成されるわ
けではなく、文書型と呼ばれる構文規則に沿って作成さ
れる。所定の構造規則に従っていることにより、その文
書変換が容易になる等の利点がある。なお、以下の説明
で文書と言った場合には、全て構造化文書である。
けではなく、文書型と呼ばれる構文規則に沿って作成さ
れる。所定の構造規則に従っていることにより、その文
書変換が容易になる等の利点がある。なお、以下の説明
で文書と言った場合には、全て構造化文書である。
【0005】図13は図12の論理構造が適応している
構文規則を示す図である。図では矩形のノードは要素の
型(要素型)を定義したものであり、そのノードのラベ
ルは要素型の名前を示している。なお、同一の名前を示
すノードの実体は同一のものである。
構文規則を示す図である。図では矩形のノードは要素の
型(要素型)を定義したものであり、そのノードのラベ
ルは要素型の名前を示している。なお、同一の名前を示
すノードの実体は同一のものである。
【0006】楕円で示したノードは、要素のつながりを
定義するものである。このノードを構築子と呼ぶ。構築
子には「SEQ」、「REP」、「OPT」、及び「C
HO」がある。「SEQ」は、そのノードのインスタン
スがその順に生成されることを示す。ここで「インスタ
ンス」とは、この文書型に基づき生成される文書の要素
を示す。「REP」は、それにつながるノードのインン
スタンスが1回以上繰り返し生成されることを示す。
「OPT」は、それにつながるノードのインスタンスが
出現しなくてもよいことを示す。「CHO」は、それに
つながるノードのインスタンスが生成されることを示
す。
定義するものである。このノードを構築子と呼ぶ。構築
子には「SEQ」、「REP」、「OPT」、及び「C
HO」がある。「SEQ」は、そのノードのインスタン
スがその順に生成されることを示す。ここで「インスタ
ンス」とは、この文書型に基づき生成される文書の要素
を示す。「REP」は、それにつながるノードのインン
スタンスが1回以上繰り返し生成されることを示す。
「OPT」は、それにつながるノードのインスタンスが
出現しなくてもよいことを示す。「CHO」は、それに
つながるノードのインスタンスが生成されることを示
す。
【0007】この図では、「記事」の要素型を定義した
ノード51がルートノードである。ノード51には、
「REP」の構築子を示すノード52がつながってい
る。ノード52には、「節」の要素型を定義したノード
53がつながっている。ノード53には、「SEQ」の
構築子を示すノード54がつながっている。ノード54
には、「見出し」の要素型を定義したノード55、「O
PT」の構築子を示す2つのノード56,59がつなが
っている。ノード56,59のそれぞれには、「RE
P」の構築子を示すノード57,60がつながってい
る。さらに、ノード57には、「節」の要素型を定義し
たノード58がつながっており、ノード60には、「段
落」の要素型を定義したノード61がつながっている。
ノード51がルートノードである。ノード51には、
「REP」の構築子を示すノード52がつながってい
る。ノード52には、「節」の要素型を定義したノード
53がつながっている。ノード53には、「SEQ」の
構築子を示すノード54がつながっている。ノード54
には、「見出し」の要素型を定義したノード55、「O
PT」の構築子を示す2つのノード56,59がつなが
っている。ノード56,59のそれぞれには、「RE
P」の構築子を示すノード57,60がつながってい
る。さらに、ノード57には、「節」の要素型を定義し
たノード58がつながっており、ノード60には、「段
落」の要素型を定義したノード61がつながっている。
【0008】図13では「節」の要素型を定義したノー
ドが2つ存在するが、これは前述したように実体は同じ
ものであり、この要素型が再帰的に定義されていること
を示すものである。
ドが2つ存在するが、これは前述したように実体は同じ
ものであり、この要素型が再帰的に定義されていること
を示すものである。
【0009】構造化文書を管理対象とする文書データベ
ース管理装置には、異なる文書型から作成された文書が
多数格納されている。そして、文書データベースからユ
ーザが必要とする文書を検索するために、文書データベ
ース管理装置には、検索の指令を記述するための問い合
わせ言語が用意されている。この問い合わせ言語には、
テキスト形式で記述されるものと、グラフィカルユーザ
インターフェースを用いてグラフィカルに記述されるも
のとがある。
ース管理装置には、異なる文書型から作成された文書が
多数格納されている。そして、文書データベースからユ
ーザが必要とする文書を検索するために、文書データベ
ース管理装置には、検索の指令を記述するための問い合
わせ言語が用意されている。この問い合わせ言語には、
テキスト形式で記述されるものと、グラフィカルユーザ
インターフェースを用いてグラフィカルに記述されるも
のとがある。
【0010】図14はグラフィカルに表現された検索式
の例である。この検索式では、各ノードは構造化文書の
要素に対応し、そのノード内の文字列は要素型の名前を
示している。ノードの傍らに示された文字列は、そのノ
ードで示された要素が持つテキスト内に含まれるべき文
字列を示している。また、各ノードはアークで接続され
ている。実線で示されたアークは、両端のノードに対応
する要素が親子の関係にあることを示している。破線で
示されたアークは、両端のノードに対応する要素が祖孫
の関係(先祖と子孫の関係)にあることを示している。
の例である。この検索式では、各ノードは構造化文書の
要素に対応し、そのノード内の文字列は要素型の名前を
示している。ノードの傍らに示された文字列は、そのノ
ードで示された要素が持つテキスト内に含まれるべき文
字列を示している。また、各ノードはアークで接続され
ている。実線で示されたアークは、両端のノードに対応
する要素が親子の関係にあることを示している。破線で
示されたアークは、両端のノードに対応する要素が祖孫
の関係(先祖と子孫の関係)にあることを示している。
【0011】この検索式では、ひとつのノードから複数
のアークが出ている場合、全ての条件を満たすものが検
索結果となる。つまり、連言として指定されたこととな
る。この図の例では、要素型が「節」のノード71がル
ートノードである。そして、ノード71の子として要素
型が「見出し」のノード72が存在し、そのノード72
は”文書”という文字列を含んでいる。また、ノード7
1の子孫として要素型が「段落」のノード73が存在
し、そのノード73は”データベース”という文字列を
含んでいる。この内容を簡単に説明すると、「”文書”
という文字列を含む見出しを子に、”データベース”と
いう文字列を含む段落を子孫にもつ章」の検索を指定し
ていることになる。
のアークが出ている場合、全ての条件を満たすものが検
索結果となる。つまり、連言として指定されたこととな
る。この図の例では、要素型が「節」のノード71がル
ートノードである。そして、ノード71の子として要素
型が「見出し」のノード72が存在し、そのノード72
は”文書”という文字列を含んでいる。また、ノード7
1の子孫として要素型が「段落」のノード73が存在
し、そのノード73は”データベース”という文字列を
含んでいる。この内容を簡単に説明すると、「”文書”
という文字列を含む見出しを子に、”データベース”と
いう文字列を含む段落を子孫にもつ章」の検索を指定し
ていることになる。
【0012】このような検索式により、構造化文書を対
象とした検索を行うことができる。なお、検索式に、文
書の作成者、作成日時、あるいはセキュリティーレベル
等を条件として指定することもできる。
象とした検索を行うことができる。なお、検索式に、文
書の作成者、作成日時、あるいはセキュリティーレベル
等を条件として指定することもできる。
【0013】構造化文書を対象とした検索を行う場合
に、データベースの管理方式の違いによって、検索指令
の検索対象となる文書が異なる。構造化文書を管理対象
とするデータベース管理方式には、文書型ごとにスキー
マを定める方式(以下、第1の従来例とよぶ)と、任意
の構造を表現する唯一のスキーマを定める方式(以下、
第2の従来例とよぶ)とがある。
に、データベースの管理方式の違いによって、検索指令
の検索対象となる文書が異なる。構造化文書を管理対象
とするデータベース管理方式には、文書型ごとにスキー
マを定める方式(以下、第1の従来例とよぶ)と、任意
の構造を表現する唯一のスキーマを定める方式(以下、
第2の従来例とよぶ)とがある。
【0014】第1の従来例は、関係データベース管理シ
ステムやオブジェクト指向データベース管理システムの
ような汎用的なデータベース管理システムでは一般的な
方式である。この方式で管理されたデータベース内の文
書を検索する場合には、検索対象となる文書型を指定す
る。つまり、指定された文書型のスキーマから作成され
た文書が、検索の対象となる。
ステムやオブジェクト指向データベース管理システムの
ような汎用的なデータベース管理システムでは一般的な
方式である。この方式で管理されたデータベース内の文
書を検索する場合には、検索対象となる文書型を指定す
る。つまり、指定された文書型のスキーマから作成され
た文書が、検索の対象となる。
【0015】第2の従来例は、例えば、特開平7−44
579号公報の「論理構造文書検索方式」に開示された
方式である。この方式では、スキーマが1つであるた
め、1度の検索指令で、データベース中の全ての文書は
検索対象なる。従って、データベース中の文書群の文書
型が2つ以上ある場合でも、それらの文書群を同時に検
索することができる。
579号公報の「論理構造文書検索方式」に開示された
方式である。この方式では、スキーマが1つであるた
め、1度の検索指令で、データベース中の全ての文書は
検索対象なる。従って、データベース中の文書群の文書
型が2つ以上ある場合でも、それらの文書群を同時に検
索することができる。
【0016】
【発明が解決しようとする課題】ところで、文書型は時
間の経過とともに変化することが多い。文書型設計時
と、実際に文書型に沿った文書の作成時との間に時間的
な隔たりがあると、往々にして文書に対する要求も変化
し、それに応じて文書型も改変されるからである。この
ように、少しずつ変化した文書型は、用途は同じでも構
造制約は異なる。
間の経過とともに変化することが多い。文書型設計時
と、実際に文書型に沿った文書の作成時との間に時間的
な隔たりがあると、往々にして文書に対する要求も変化
し、それに応じて文書型も改変されるからである。この
ように、少しずつ変化した文書型は、用途は同じでも構
造制約は異なる。
【0017】例えば、文書型の設計時には、要求に応え
るような文書構造になっているかどうかの検査を行い、
要素を満たしていないときには修正を施すというステッ
プを繰り返す。そのため、文書型の定義は頻繁に変更さ
れ、その過程において、同じ用途の文書型が多数生成さ
れる。
るような文書構造になっているかどうかの検査を行い、
要素を満たしていないときには修正を施すというステッ
プを繰り返す。そのため、文書型の定義は頻繁に変更さ
れ、その過程において、同じ用途の文書型が多数生成さ
れる。
【0018】また、文書型の設計には、その文書型を運
用する組織の要求が強く反映されるため、同一用途の文
書に対して、各組織が固有の文書型を設計することがあ
る。これらの文書型は、基本となった構造制約が同じで
あるため、互いに似通った文書型となる場合が多い。そ
して、似通った各文書型に従って作成された複数の文書
が組織間で交換されることにより、同一のデータベース
にそれらの文書が混在した状態で格納されることがあ
る。
用する組織の要求が強く反映されるため、同一用途の文
書に対して、各組織が固有の文書型を設計することがあ
る。これらの文書型は、基本となった構造制約が同じで
あるため、互いに似通った文書型となる場合が多い。そ
して、似通った各文書型に従って作成された複数の文書
が組織間で交換されることにより、同一のデータベース
にそれらの文書が混在した状態で格納されることがあ
る。
【0019】例えば、図13に示した文書型を複数の部
署で使用していたが、ある部署が自己の業務内容に適応
させるために「参考文献」という要素を追加した場合、
次のような文書型が作成される。
署で使用していたが、ある部署が自己の業務内容に適応
させるために「参考文献」という要素を追加した場合、
次のような文書型が作成される。
【0020】図15は、図13に示した文書型に参考文
献を加えた文書型を示す図である。この図におけるノー
ド81、84、86、88〜95は、図13のノード5
1〜61に対応している。そして、この例では、要素型
が「記事」のノード81と構築子が「REP」のノード
84との間に、「本文」の要素型を示すノード82が挿
入されている。また、ノード81の子として要素型が
「参考文献」のノード83が新たに追加されている。さ
らに、ノード83には、構築子が「REP」のノード8
5を介して要素型が「文献」のノード87がつながって
いる。ここで、「本文」は「節」をまとめる要素であ
り、「参考文献」は「文献」のリストを保持する要素で
ある。
献を加えた文書型を示す図である。この図におけるノー
ド81、84、86、88〜95は、図13のノード5
1〜61に対応している。そして、この例では、要素型
が「記事」のノード81と構築子が「REP」のノード
84との間に、「本文」の要素型を示すノード82が挿
入されている。また、ノード81の子として要素型が
「参考文献」のノード83が新たに追加されている。さ
らに、ノード83には、構築子が「REP」のノード8
5を介して要素型が「文献」のノード87がつながって
いる。ここで、「本文」は「節」をまとめる要素であ
り、「参考文献」は「文献」のリストを保持する要素で
ある。
【0021】この図15に示す文書型は、図13の文書
型と異なる構造規則を持っているが、使用目的は同じで
ある。そして、図15の文書型を作成した部署ではこの
文書型に従って文書を作成し、他の部署では図13の文
書型に従って文書を作成することにより、異なる文書型
から作成された用途が同じ複数の文書が、同一のデータ
ベース内に混在する結果となる。
型と異なる構造規則を持っているが、使用目的は同じで
ある。そして、図15の文書型を作成した部署ではこの
文書型に従って文書を作成し、他の部署では図13の文
書型に従って文書を作成することにより、異なる文書型
から作成された用途が同じ複数の文書が、同一のデータ
ベース内に混在する結果となる。
【0022】以上のようにして、用途が同一であるが異
なる構造定義を有する複数の文書型が、データベース中
に同時に存在する事態が発生する。特に、大規模なデー
タベースを長期間運用する場合には、このような状況を
避けることはできない。これらの文書型に従って作成さ
れた文書は、もともとは用途が同じである。そのため、
これらの文書の全てを対象に検索を行う必要に迫られる
ことがある。
なる構造定義を有する複数の文書型が、データベース中
に同時に存在する事態が発生する。特に、大規模なデー
タベースを長期間運用する場合には、このような状況を
避けることはできない。これらの文書型に従って作成さ
れた文書は、もともとは用途が同じである。そのため、
これらの文書の全てを対象に検索を行う必要に迫られる
ことがある。
【0023】しかし、従来の文書データベース管理装置
において、互いに異なる複数の文書型から作成された文
書が混在したデータベース対して検索を行うと、以下の
ような問題が生じていた。
において、互いに異なる複数の文書型から作成された文
書が混在したデータベース対して検索を行うと、以下の
ような問題が生じていた。
【0024】第1の従来例では、検索式の作成にあた
り、文書型を指定する必要がある。このため、検索対象
となる文書が複数の文書型から生成されたものであると
きには、それぞれの文書型について検索式の作成と実行
を行う必要があり、ユーザの負担となっている。例え
ば、図14の検索式の条件を満たす文書は、図13の文
書型と図15の文書型とのいずれの文書型からも作成可
能である。そのため、双方の文書型を用いて作成された
文書を検索対象として検索する必要がある。この際、検
索を行う前に一々文書型を指定しなければならない。こ
のような同じ用途の文書型が多数存在した場合、ユーザ
にかかる負荷は過大なものとなる。
り、文書型を指定する必要がある。このため、検索対象
となる文書が複数の文書型から生成されたものであると
きには、それぞれの文書型について検索式の作成と実行
を行う必要があり、ユーザの負担となっている。例え
ば、図14の検索式の条件を満たす文書は、図13の文
書型と図15の文書型とのいずれの文書型からも作成可
能である。そのため、双方の文書型を用いて作成された
文書を検索対象として検索する必要がある。この際、検
索を行う前に一々文書型を指定しなければならない。こ
のような同じ用途の文書型が多数存在した場合、ユーザ
にかかる負荷は過大なものとなる。
【0025】第2の従来例では、文書型の多寡に関わら
ず、探索範囲はデータベース中のすべての文書である。
そのため、ある特定の文書型に従って作成された文書の
みを検索するのがユーザの意図である場合においても、
すべての文書が検索対象とされ、目的としていない文書
型から作成された文書まで検出されてしまう。その結
果、適合率(検索結果の文書数に対する所望の文書数の
比)が悪化することになり、ユーザは検索結果から所望
の文書を探すという余分な手間が発生する。
ず、探索範囲はデータベース中のすべての文書である。
そのため、ある特定の文書型に従って作成された文書の
みを検索するのがユーザの意図である場合においても、
すべての文書が検索対象とされ、目的としていない文書
型から作成された文書まで検出されてしまう。その結
果、適合率(検索結果の文書数に対する所望の文書数の
比)が悪化することになり、ユーザは検索結果から所望
の文書を探すという余分な手間が発生する。
【0026】また、第2の従来例では、ある特定の文書
型に従って作られる文書しか持ち得ない要素が検索式に
含まれている場合であっても、全ての文書が検索の対象
となる。
型に従って作られる文書しか持ち得ない要素が検索式に
含まれている場合であっても、全ての文書が検索の対象
となる。
【0027】例えば、図13の文書型から作成された文
書と、図15の文書型とから作成された文書とが混在し
ているデータベースに、「本文」の要素型を用いた検索
式で検索を行う場合である。
書と、図15の文書型とから作成された文書とが混在し
ているデータベースに、「本文」の要素型を用いた検索
式で検索を行う場合である。
【0028】図16は「本文」を要素として含む検索式
の例を示す図である。この検索式は「本文」のノード1
01がルートノードであり、そのノード101に節のノ
ード102が接続されている。そして、ノード102〜
104の構成は、図14の検索式の各ノード71〜73
と同じである。この検索式は、図13の文書型にない要
素「本文」に関する条件を指定しているので、図13の
文書型に従って作成された文書はこの条件を満足し得な
い。
の例を示す図である。この検索式は「本文」のノード1
01がルートノードであり、そのノード101に節のノ
ード102が接続されている。そして、ノード102〜
104の構成は、図14の検索式の各ノード71〜73
と同じである。この検索式は、図13の文書型にない要
素「本文」に関する条件を指定しているので、図13の
文書型に従って作成された文書はこの条件を満足し得な
い。
【0029】ところが、第2の従来例では、図16の検
索式が指定された場合、図13の文書型に従って作成さ
れた文書は条件を満たし得ないにも拘わらず、すべての
文書が検索対処となる。この結果、応答時間をいたずら
に遅延させることになる。
索式が指定された場合、図13の文書型に従って作成さ
れた文書は条件を満たし得ないにも拘わらず、すべての
文書が検索対処となる。この結果、応答時間をいたずら
に遅延させることになる。
【0030】本発明はこのような点に鑑みてなされたも
のであり、構造化文書の検索時間を短縮するとともに、
検索結果の適合率の向上を図った文書データベース管理
装置を提供することを目的とする。
のであり、構造化文書の検索時間を短縮するとともに、
検索結果の適合率の向上を図った文書データベース管理
装置を提供することを目的とする。
【0031】
【課題を解決するための手段】本発明では上記課題を解
決するために、構造化文書の構成要素と構成要素間の関
係とを規定する複数の文書型が文書型データベースに格
納されており、前記複数の文書型のいずれかに従って作
成された構造化文書を格納する文書データベースを管理
する文書データベース管理装置において、構造化文書の
構成要素と構成要素間の関係との指定を検索条件に含む
検索式を入力する検索式入力手段と、前記検索式と前記
複数の文書型とを照合し、前記検索式の検索条件を満た
した文書構造を生成し得る適応文書型を検出する適応文
書型検出手段と、前記適応文書型に従って作成された構
造化文書を検索対象として、前記検索式を満たした構造
化文書を検索する文書検索手段と、を有することを特徴
とする文書データベース管理装置が提供される。
決するために、構造化文書の構成要素と構成要素間の関
係とを規定する複数の文書型が文書型データベースに格
納されており、前記複数の文書型のいずれかに従って作
成された構造化文書を格納する文書データベースを管理
する文書データベース管理装置において、構造化文書の
構成要素と構成要素間の関係との指定を検索条件に含む
検索式を入力する検索式入力手段と、前記検索式と前記
複数の文書型とを照合し、前記検索式の検索条件を満た
した文書構造を生成し得る適応文書型を検出する適応文
書型検出手段と、前記適応文書型に従って作成された構
造化文書を検索対象として、前記検索式を満たした構造
化文書を検索する文書検索手段と、を有することを特徴
とする文書データベース管理装置が提供される。
【0032】このような文書データベース管理装置によ
れば、ユーザが検索式入力手段を用いて検索式を入力す
ると、適応文書型検出手段により、文書型データベース
の中から検索式を満たす文書を生成し得る適応文書型が
検出される。すると、文書検索手段により、適応文書型
に従って作成された構造化文書を検索対象として、前記
検索式を満たした構造化文書が検索される。これによ
り、検索式の条件を満たした文書構造を生成し得ない文
書型の構造化文書は検索の対象から除外され、検索時間
が短縮される。
れば、ユーザが検索式入力手段を用いて検索式を入力す
ると、適応文書型検出手段により、文書型データベース
の中から検索式を満たす文書を生成し得る適応文書型が
検出される。すると、文書検索手段により、適応文書型
に従って作成された構造化文書を検索対象として、前記
検索式を満たした構造化文書が検索される。これによ
り、検索式の条件を満たした文書構造を生成し得ない文
書型の構造化文書は検索の対象から除外され、検索時間
が短縮される。
【0033】また、構造化文書の構成要素と構成要素間
の関係とを規定する複数の文書型が文書型データベース
に格納されており、前記複数の文書型のいずれかに従っ
て作成された構造化文書を格納する文書データベースを
管理している文書データベース管理装置の文書データベ
ース検索方法において、構造化文書の構成要素と構成要
素間の関係とを指定した検索式が入力されると、前記検
索式と前記複数の文書型とを照合することにより、前記
検索式を満たした文書構造を生成し得る適応文書型を検
出し、前記適応文書型に従って作成された構造化文書を
検索対象として、前記検索式を満たした構造化文書を検
索する、ことを特徴とする文書データベース検索方法が
提供される。
の関係とを規定する複数の文書型が文書型データベース
に格納されており、前記複数の文書型のいずれかに従っ
て作成された構造化文書を格納する文書データベースを
管理している文書データベース管理装置の文書データベ
ース検索方法において、構造化文書の構成要素と構成要
素間の関係とを指定した検索式が入力されると、前記検
索式と前記複数の文書型とを照合することにより、前記
検索式を満たした文書構造を生成し得る適応文書型を検
出し、前記適応文書型に従って作成された構造化文書を
検索対象として、前記検索式を満たした構造化文書を検
索する、ことを特徴とする文書データベース検索方法が
提供される。
【0034】このような文書データベース検索方法によ
れば、検索式が入力されると、適応文書型に従って作成
された構造化文書のみを検索対象として検索が行われる
ため、検索式の条件を満たした文書構造を生成し得ない
文書型の構造化文書は検索の対象から除外され、検索時
間が短縮される。
れば、検索式が入力されると、適応文書型に従って作成
された構造化文書のみを検索対象として検索が行われる
ため、検索式の条件を満たした文書構造を生成し得ない
文書型の構造化文書は検索の対象から除外され、検索時
間が短縮される。
【0035】
【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて説明する。図1は本発明の原理図である。本
発明の文書データベース管理装置には、文書型データベ
ース1と文書データベース2とが設けられている。文書
データベース1には、構造化文書の構造を定義する複数
の文書型1aが格納されている。文書型1aは、例えば
要素型を示すノードと構築子を示すノードとからなる有
効グラフで表現される。文書データベース2には、複数
の文書型1aのいずれかに従って作成された複数の文書
2aが格納されている。この複数の文書2aは、構造化
文書であり木構造で表すことができる。
に基づいて説明する。図1は本発明の原理図である。本
発明の文書データベース管理装置には、文書型データベ
ース1と文書データベース2とが設けられている。文書
データベース1には、構造化文書の構造を定義する複数
の文書型1aが格納されている。文書型1aは、例えば
要素型を示すノードと構築子を示すノードとからなる有
効グラフで表現される。文書データベース2には、複数
の文書型1aのいずれかに従って作成された複数の文書
2aが格納されている。この複数の文書2aは、構造化
文書であり木構造で表すことができる。
【0036】検索式入力手段3は、ユーザが必要とする
文書を検索するために、その文書が満たしている条件を
検索式3aで表現し、その検索式3aを入力する。この
検索式3aには、文書の要素の要素型、要素の接続関
係、及び要素内のテキストに含まれるべき文字列等の指
定が含まれる。
文書を検索するために、その文書が満たしている条件を
検索式3aで表現し、その検索式3aを入力する。この
検索式3aには、文書の要素の要素型、要素の接続関
係、及び要素内のテキストに含まれるべき文字列等の指
定が含まれる。
【0037】適応文書型検索手段4は、検索式3aが入
力されると、検索式3aと文書型データベース1内の文
書型1aとを照合し、検索式3aを満たす文書を生成し
得る文書型を検出する。そして、適応文書型検索手段4
は検出した文書型を、検索対象文書型指定手段5と文書
検索手段6とに渡す。
力されると、検索式3aと文書型データベース1内の文
書型1aとを照合し、検索式3aを満たす文書を生成し
得る文書型を検出する。そして、適応文書型検索手段4
は検出した文書型を、検索対象文書型指定手段5と文書
検索手段6とに渡す。
【0038】検索対象文書型指定手段5は、適応文書型
表示手段5aと文書型入力手段5bとを有している。適
応文書型表示手段5aは、適応文書型検索手段4で検出
された文書型のリストをCRT等の表示装置の画面上に
表示する。文書型入力手段5bは、ユーザのキーボード
やマウスの操作により指定された文書型を、検索対象文
書型として入力する。即ち、ユーザは、画面表示された
文書型の中から目的の文書を明らかに生成し得ない文書
型を除外して、文書型を指定する。指定された検索対象
文書型は、文書検索手段6に渡される。
表示手段5aと文書型入力手段5bとを有している。適
応文書型表示手段5aは、適応文書型検索手段4で検出
された文書型のリストをCRT等の表示装置の画面上に
表示する。文書型入力手段5bは、ユーザのキーボード
やマウスの操作により指定された文書型を、検索対象文
書型として入力する。即ち、ユーザは、画面表示された
文書型の中から目的の文書を明らかに生成し得ない文書
型を除外して、文書型を指定する。指定された検索対象
文書型は、文書検索手段6に渡される。
【0039】文書検索手段6は、検索対象文書型指定手
段5から受け取った検索対象文書型に従って作成された
文書のみを検索対象として、文書データベース2内の複
数の文書2aの中から、検索式3aの条件を満たした文
書を検出する。検出された文書は、検出文書表示手段7
によって表示装置の画面に表示される。
段5から受け取った検索対象文書型に従って作成された
文書のみを検索対象として、文書データベース2内の複
数の文書2aの中から、検索式3aの条件を満たした文
書を検出する。検出された文書は、検出文書表示手段7
によって表示装置の画面に表示される。
【0040】このようにして、ユーザが検索式を作成し
検索指令を出力すると、文書型データベース1から検索
式3aを満たす文書を生成し得る文書型が検出される。
そして、ユーザは、検出された文書型の中から必要と認
める文書型のみを検索対象として指定することができ
る。そのため、実際に検索対象となる文書の数を絞り込
むことができ、検索結果に含まれる、ユーザが本当に必
要としている文書の割合を高めることができる。つま
り、適合率の向上が図れる。しかも、実際に検索が行わ
れるのは、ユーザに指定された文書型の文書のみである
ため、検索時間も短縮される。
検索指令を出力すると、文書型データベース1から検索
式3aを満たす文書を生成し得る文書型が検出される。
そして、ユーザは、検出された文書型の中から必要と認
める文書型のみを検索対象として指定することができ
る。そのため、実際に検索対象となる文書の数を絞り込
むことができ、検索結果に含まれる、ユーザが本当に必
要としている文書の割合を高めることができる。つま
り、適合率の向上が図れる。しかも、実際に検索が行わ
れるのは、ユーザに指定された文書型の文書のみである
ため、検索時間も短縮される。
【0041】その上、ユーザは、単一の検索式で、複数
の文書型に従って作成された文書を同時に検索対象とす
ることができるため、検索指令にかかる手間は少ない。
また、検索対象文書型指定手段5により検索対象の文書
型を指定する際には、適応文書型として検出された文書
型の中から選択すればよいため、検索対象とすべきか否
かの判断は、従来に比べ容易である。
の文書型に従って作成された文書を同時に検索対象とす
ることができるため、検索指令にかかる手間は少ない。
また、検索対象文書型指定手段5により検索対象の文書
型を指定する際には、適応文書型として検出された文書
型の中から選択すればよいため、検索対象とすべきか否
かの判断は、従来に比べ容易である。
【0042】なお、適応文書型検索手段4で検出された
文書型を、そのまま検索対象文書型とすることもでき
る。この場合、検索対象文書型指定手段5は不要であ
る。次に、本発明を実施するための文書データベース管
理装置の例を説明する。なお、以下の例では、文書型の
検索をさらに効率よく行うために、各文書型の対応表を
作成し、その対応表を用いて検索式と文書型の照合を行
っている。
文書型を、そのまま検索対象文書型とすることもでき
る。この場合、検索対象文書型指定手段5は不要であ
る。次に、本発明を実施するための文書データベース管
理装置の例を説明する。なお、以下の例では、文書型の
検索をさらに効率よく行うために、各文書型の対応表を
作成し、その対応表を用いて検索式と文書型の照合を行
っている。
【0043】図2は本発明を実施するための文書データ
ベース管理装置の概略構成を示すブロック図である。こ
の文書データベース管理装置は、ユーザインタフェース
として、検索式ユーザインタフェース(検索式UI)1
1と文書型ユーザインタフェース(文書型UI)12を
有している。検索を実行するための処理機能としては、
検索制御部13、文書型管理部14、照合部16及び検
索式評価部18が設けられている。また、各種データを
格納する機能として、文書型データベース(文書型D
B)15、対応表データベース(対応表DB)17、及
び文書データベース(文書DB)19が設けられてい
る。さらに、対応表を作成するための対応表生成部20
が設けられている。
ベース管理装置の概略構成を示すブロック図である。こ
の文書データベース管理装置は、ユーザインタフェース
として、検索式ユーザインタフェース(検索式UI)1
1と文書型ユーザインタフェース(文書型UI)12を
有している。検索を実行するための処理機能としては、
検索制御部13、文書型管理部14、照合部16及び検
索式評価部18が設けられている。また、各種データを
格納する機能として、文書型データベース(文書型D
B)15、対応表データベース(対応表DB)17、及
び文書データベース(文書DB)19が設けられてい
る。さらに、対応表を作成するための対応表生成部20
が設けられている。
【0044】検索式UI11は、ユーザが検索式を作成
し、実行指令を出力するための操作環境を提供してい
る。この例では、グラフィカルユーザインターフェース
で記述した検索式を入力できるものとする。この検索式
UI11が、図1に示す検索式入力手段3と検出文書表
示手段7との機能を有している。
し、実行指令を出力するための操作環境を提供してい
る。この例では、グラフィカルユーザインターフェース
で記述した検索式を入力できるものとする。この検索式
UI11が、図1に示す検索式入力手段3と検出文書表
示手段7との機能を有している。
【0045】文書型UI12は、検索式の条件を満たし
た文書を生成し得る文書型のリストを画面表示し、その
なかから任意の文書型を検索対象として指定するための
入力環境を提供している。この文書型UI12が、図1
に示す検索対象文書型指定手段5の機能を有している。
た文書を生成し得る文書型のリストを画面表示し、その
なかから任意の文書型を検索対象として指定するための
入力環境を提供している。この文書型UI12が、図1
に示す検索対象文書型指定手段5の機能を有している。
【0046】検索制御部13は、検索式UI11から入
力された検索式を実行する。具体的には、検索式の実行
指令が入力されると、文書型管理部14から文書型DB
15に格納されている文書型を受け取る。そして、各文
書型と検索式とを照合部16に渡し、その戻り値とし
て、検索式を満たす文書を生成し得る文書型のリストを
受け取る。そのリストを検索式UI11を介して文書型
UI12に渡し、ユーザが選択した文書型のリストを受
け取る。そして、文書型UI12から受け取った文書型
のリストと検索式とを検索式評価部18に渡し、戻り値
として、検索結果を取得し検索式UI11に渡す。
力された検索式を実行する。具体的には、検索式の実行
指令が入力されると、文書型管理部14から文書型DB
15に格納されている文書型を受け取る。そして、各文
書型と検索式とを照合部16に渡し、その戻り値とし
て、検索式を満たす文書を生成し得る文書型のリストを
受け取る。そのリストを検索式UI11を介して文書型
UI12に渡し、ユーザが選択した文書型のリストを受
け取る。そして、文書型UI12から受け取った文書型
のリストと検索式とを検索式評価部18に渡し、戻り値
として、検索結果を取得し検索式UI11に渡す。
【0047】文書型管理部14は、文書型の文書型DB
15への格納、及び検索を行う。そして、検索制御部1
3の要求に応じて、文書型DB15に格納された文書型
を検索制御部13に渡す。照合部16は、検索制御部1
3から検索式を受け取ると、対応表DB17内の対応表
を用いて検索式と文書型の照合を行い、検索式の条件を
満たす文書を生成し得るか否かを判定する。そして、照
合部16は、検索式の条件を満たす文書を生成し得ると
判断した文書型のリストを、検索制御部13に渡す。検
索式評価部18は、検索制御部13から検索式と検索対
象文書型のリストを受け取ると、指定された文書型に沿
って作成された文書のみを検索対象として、検索式を満
たす文書の検索を実行する。
15への格納、及び検索を行う。そして、検索制御部1
3の要求に応じて、文書型DB15に格納された文書型
を検索制御部13に渡す。照合部16は、検索制御部1
3から検索式を受け取ると、対応表DB17内の対応表
を用いて検索式と文書型の照合を行い、検索式の条件を
満たす文書を生成し得るか否かを判定する。そして、照
合部16は、検索式の条件を満たす文書を生成し得ると
判断した文書型のリストを、検索制御部13に渡す。検
索式評価部18は、検索制御部13から検索式と検索対
象文書型のリストを受け取ると、指定された文書型に沿
って作成された文書のみを検索対象として、検索式を満
たす文書の検索を実行する。
【0048】ここで、検索制御部13が図1に示す適応
文書型検索手段4と文書検索手段6との機能を管理して
おり、実際に文書型の照合を行うのは照合部16であ
り、文書の検索を行うのは検索式評価部18である。
文書型検索手段4と文書検索手段6との機能を管理して
おり、実際に文書型の照合を行うのは照合部16であ
り、文書の検索を行うのは検索式評価部18である。
【0049】文書型DB15には、複数の文書型が格納
されている。これらの文書型には、比較的似通ったもの
も多数存在する。対応表DB17には、文書型DB15
に格納されている文書型のそれぞれに対応した対応表が
格納されている。対応表は、文書型の各要素(出発要
素)、出発要素の子として出現し得る要素の集合(隣接
要素集合)、及び出発要素の子孫として出現し得る要素
の集合(到達可能要素集合)を組として格納している。
文書DB19には、文書型DB15に格納されている文
書型のいずれかに従って作成された文書が格納されてい
る。
されている。これらの文書型には、比較的似通ったもの
も多数存在する。対応表DB17には、文書型DB15
に格納されている文書型のそれぞれに対応した対応表が
格納されている。対応表は、文書型の各要素(出発要
素)、出発要素の子として出現し得る要素の集合(隣接
要素集合)、及び出発要素の子孫として出現し得る要素
の集合(到達可能要素集合)を組として格納している。
文書DB19には、文書型DB15に格納されている文
書型のいずれかに従って作成された文書が格納されてい
る。
【0050】対応表生成部20は、文書型DB15に新
たな文書型が格納された際に、その文書型を解析し、対
応表を作成する。そして、作成した対応表を対応表DB
17に随時格納する。
たな文書型が格納された際に、その文書型を解析し、対
応表を作成する。そして、作成した対応表を対応表DB
17に随時格納する。
【0051】図3は図13の文書型から作成された対応
表を示す図である。対応表には出発要素、隣接要素、及
び到達可能要素の登録項目がある。この例では、出発要
素が「記事」の場合、隣接要素は「節」であり、到達可
能要素は「節」、「見出し」、及び「段落」である。出
発要素が「節」の場合、隣接要素は「見出し」、「段
落」、及び「節」であり、到達可能要素は「節」、「見
出し」、及び「段落」である。出発要素が「見出し」あ
るいは「段落」の場合には、隣接要素と到達可能要素と
は、空集合(図中「φ」で表す)である。つまり、「見
出し」と「段落」とには、子あるいは子孫が共に存在し
得ないことを示している。以下、出発要素、隣接要素、
及び到達可能要素の組を「エントリ」と呼ぶ。
表を示す図である。対応表には出発要素、隣接要素、及
び到達可能要素の登録項目がある。この例では、出発要
素が「記事」の場合、隣接要素は「節」であり、到達可
能要素は「節」、「見出し」、及び「段落」である。出
発要素が「節」の場合、隣接要素は「見出し」、「段
落」、及び「節」であり、到達可能要素は「節」、「見
出し」、及び「段落」である。出発要素が「見出し」あ
るいは「段落」の場合には、隣接要素と到達可能要素と
は、空集合(図中「φ」で表す)である。つまり、「見
出し」と「段落」とには、子あるいは子孫が共に存在し
得ないことを示している。以下、出発要素、隣接要素、
及び到達可能要素の組を「エントリ」と呼ぶ。
【0052】以上のような構成の文書データベース管理
装置において、検索式が入力された場合に検索が開始さ
れる。この例では、検索条件として、文書の要素、要素
の持つテキスト、及び要素間の関係を指定する。要素間
の関係には、親子関係、祖孫関係(先祖と子孫)を指定
することができる。兄弟関係のような、出現順序に関す
る条件は用いない。また、検索条件は連言的である。即
ち、要素間の関係に基づく条件を複数指定した場合に
は、全ての条件を満たすものが検索結果となる。
装置において、検索式が入力された場合に検索が開始さ
れる。この例では、検索条件として、文書の要素、要素
の持つテキスト、及び要素間の関係を指定する。要素間
の関係には、親子関係、祖孫関係(先祖と子孫)を指定
することができる。兄弟関係のような、出現順序に関す
る条件は用いない。また、検索条件は連言的である。即
ち、要素間の関係に基づく条件を複数指定した場合に
は、全ての条件を満たすものが検索結果となる。
【0053】以下に、検索の処理手順を説明する。図4
は検索処理全体のフローチャートである。 〔S1〕ユーザが検索式UI11を用いて検索式を入力
すると、その検索式が検索式UI11によって検索制御
部13に渡される。 〔S2〕文書型の選択処理を行う。具体的には、検索制
御部13が文書型選択処理ルーチンを呼び出し、その戻
り値を取得する。この処理により、検索式の条件を満た
す文書を生成し得る文書型のリストが作成される。この
処理の詳細は後述する。 〔S3〕文書型の選択処理によって作成された文書型の
リストを表示装置の画面に表示する。これは、照合部1
6から文書型のリストを受け取った検索制御部13が、
そのリストを検索式UI11を介して文書型UI12に
送り、文書型UI12が表示装置に表示する。 〔S4〕ユーザは、表示装置に提示された文書型の中か
ら、検索対象とする文書型を1つ以上指定する。この選
択の操作は、文書型UI12を用いて行う。 〔S5〕指定された文書型に従って作成された文書を検
索対象として、検索式で示された条件を満たす文書を検
索する。これは、検索制御部13を介して検索式と指定
された文書型のリストとを受け取った検索式評価部18
が行う。 〔S6〕検索式評価部18が検索を実行した結果が検索
式UI11に渡され、検索式UI11は、検出された文
書のリストを表示装置の画面に表示する。
は検索処理全体のフローチャートである。 〔S1〕ユーザが検索式UI11を用いて検索式を入力
すると、その検索式が検索式UI11によって検索制御
部13に渡される。 〔S2〕文書型の選択処理を行う。具体的には、検索制
御部13が文書型選択処理ルーチンを呼び出し、その戻
り値を取得する。この処理により、検索式の条件を満た
す文書を生成し得る文書型のリストが作成される。この
処理の詳細は後述する。 〔S3〕文書型の選択処理によって作成された文書型の
リストを表示装置の画面に表示する。これは、照合部1
6から文書型のリストを受け取った検索制御部13が、
そのリストを検索式UI11を介して文書型UI12に
送り、文書型UI12が表示装置に表示する。 〔S4〕ユーザは、表示装置に提示された文書型の中か
ら、検索対象とする文書型を1つ以上指定する。この選
択の操作は、文書型UI12を用いて行う。 〔S5〕指定された文書型に従って作成された文書を検
索対象として、検索式で示された条件を満たす文書を検
索する。これは、検索制御部13を介して検索式と指定
された文書型のリストとを受け取った検索式評価部18
が行う。 〔S6〕検索式評価部18が検索を実行した結果が検索
式UI11に渡され、検索式UI11は、検出された文
書のリストを表示装置の画面に表示する。
【0054】以上が全体の処理の流れである。次に、文
書型の選択処理ルーチンの詳細を説明する。図5は文書
型選択処理のフローチャートである。これは、図4に示
すフローチャートのステップS2において、検索制御部
13により実行される。 〔S11〕文書型管理部14から全ての文書型を取得す
る。取得した文書型はキューとして保持する。 〔S12〕キューに要素があるか否か、即ち、取得した
文書型の中で、ノードの照合処理を行っていない文書型
が存在するか否かを判断する。この場合、キューが空で
あれば全ての照合処置が終了したことを意味する。未処
理の文書型があればステップS13に進み、全ての文書
型について照合処理が済んでいれば、検索対象と判断さ
れた文書型の集合を戻り値として、制御を図4のステッ
プS2に戻す。 〔S13〕ステップS12で未処理の文書型があると判
断された場合には、キューの先頭要素を取り出し、その
文書型を選択する。 〔S14〕検索式のルートを選択する。 〔S15〕ノードの照合処理を実行する。具体的には、
検索式のルートと選択した文書型とを照合部16に入力
し、「真」か「偽」のいずれかの戻り値を得る。その詳
細は後述する。 〔S16〕選択されている文書型の、検索対象としての
妥当性を判断する。つまり、ノードの照合の結果、戻り
値が「真」であればその文書型は検索対象として妥当で
あると判断し、ステップS17に進む。一方、戻り値が
「偽」であればその文書型は検索対象として妥当でない
と判断し、ステップS12に進む。 〔S17〕文書型が検索対象として妥当である場合に
は、その文書型を検索対象としてリストアップし、ステ
ップS12に進む。
書型の選択処理ルーチンの詳細を説明する。図5は文書
型選択処理のフローチャートである。これは、図4に示
すフローチャートのステップS2において、検索制御部
13により実行される。 〔S11〕文書型管理部14から全ての文書型を取得す
る。取得した文書型はキューとして保持する。 〔S12〕キューに要素があるか否か、即ち、取得した
文書型の中で、ノードの照合処理を行っていない文書型
が存在するか否かを判断する。この場合、キューが空で
あれば全ての照合処置が終了したことを意味する。未処
理の文書型があればステップS13に進み、全ての文書
型について照合処理が済んでいれば、検索対象と判断さ
れた文書型の集合を戻り値として、制御を図4のステッ
プS2に戻す。 〔S13〕ステップS12で未処理の文書型があると判
断された場合には、キューの先頭要素を取り出し、その
文書型を選択する。 〔S14〕検索式のルートを選択する。 〔S15〕ノードの照合処理を実行する。具体的には、
検索式のルートと選択した文書型とを照合部16に入力
し、「真」か「偽」のいずれかの戻り値を得る。その詳
細は後述する。 〔S16〕選択されている文書型の、検索対象としての
妥当性を判断する。つまり、ノードの照合の結果、戻り
値が「真」であればその文書型は検索対象として妥当で
あると判断し、ステップS17に進む。一方、戻り値が
「偽」であればその文書型は検索対象として妥当でない
と判断し、ステップS12に進む。 〔S17〕文書型が検索対象として妥当である場合に
は、その文書型を検索対象としてリストアップし、ステ
ップS12に進む。
【0055】このような処理により、全ての文書型の中
から、検索対象としての妥当なものが抽出される。図6
はノードの照合処理のフローチャートである。これは、
照合部16が実行する処理である。この処理は、図5に
示すフローチャートのステップS15で呼び出された
際、及び、この照合処理のフローチャート内のステップ
S30で呼び出された際に実行される。この処理の入力
は検索式のノードである。出力(戻り値)は、選択され
ている文書型が、入力された検索式のノードの下位構造
が条件を満たすかどうかを示す真理値である。フローチ
ャートのステップS15で呼び出された際には、検索式
のルートノードが入力されている。また、この処理は、
対応表DB内に格納された対応表を参照して行れる。 〔S21〕選択されている文書型から作成された対応表
内のデータを走査し、入力されたノードを出発要素型と
するエントリを求める。同時に、検索式において、入力
ノードに隣接する全てのノードをキューに格納する。こ
こで、入力ノードに隣接するノードとは、検索式におい
て、入力ノードの子あるいは子孫の関係で接続されてい
るノードを指す。 〔S22〕キューが空か否かを判断することによって、
未処理の隣接ノードがあるかどうかを検査する。即ち、
キューが空でなければ、未処理の隣接ノードが存在して
いることを示す。 〔S23〕キューが空であれば、全ての隣接ノードに対
する照合が済んでいるため戻り値を「真」とし、制御を
戻す。この際、制御が戻る先は、このノード照合処理の
呼び出し元である。即ち、現在行われている処理を呼び
出したのが図5に示すステップS15であれば、ステッ
プS15の処理が終了したこととなり、次のステップS
16に処理が進む。この処理を呼び出したのが後述する
ステップS30の処理であれば、ステップS30の処理
が終了したこととなり、次のステップS31に処理が進
む。 〔S24〕キューが空でなければ、未処理のノードが存
在するため、キューの先頭のノードを選択する。 〔S25〕選択したノードが入力されたノードの子とし
て指定されているか否かを判断する。入力されたノード
の子として指定されていれば、ステップS26に進む。
ノードの子として指定されていなければ、選択したノー
ドは入力されたノードの子孫として指定されていると判
断し、ステップS28に進む。 〔S26〕選択したノードが、エントリの隣接要素型集
合に含まれるか否かを判断する。隣接要素型集合に含ま
れていればステップS30に進み、隣接要素型集合に含
まれていなければステップS27に進む。 〔S27〕選択したノードが隣接要素型集合に含まれて
いない場合、戻り値を「偽」として、このノード照合処
理の呼び出し元に制御を戻す。 〔S28〕選択したノードが、エントリの到達可能要素
型集合に含まれるか否かを判断する。到達可能要素型集
合に含まれていればステップS30に進み、隣接要素型
集合に含まれていなければステップS29に進む。 〔S29〕選択したノードが到達可能要素型集合に含ま
れていない場合、戻り値を「偽」として、このノード照
合処理の呼び出し元に制御を戻す。 〔S30〕ステップS26、あるいはステップS28に
おいてエントリに含まれると判断された場合には、ステ
ップS24で選択したノードを入力ノードとして、ノー
ドの照合処理を行う。この処理では、ステップS24で
選択したノードより下位の構造の照合結果が全て「真」
と判断されていれば、戻り値が「真」となり、下位の構
造の照合の際に1つでも「偽」の結果が出れば、戻り値
が「偽」となる。 〔S31〕ステップS30での照合処理が妥当か否かを
判断する。即ち、ステップS30からの戻り値が「真」
であれば妥当と判断し、「偽」であれば妥当ではないと
判断する。妥当と判断した場合にはステップS22に進
み、妥当ではないと判断した場合にはステップS32に
進む。 〔S32〕戻り値が「偽」として、ノード照合処理の呼
び出し元に制御を戻す。
から、検索対象としての妥当なものが抽出される。図6
はノードの照合処理のフローチャートである。これは、
照合部16が実行する処理である。この処理は、図5に
示すフローチャートのステップS15で呼び出された
際、及び、この照合処理のフローチャート内のステップ
S30で呼び出された際に実行される。この処理の入力
は検索式のノードである。出力(戻り値)は、選択され
ている文書型が、入力された検索式のノードの下位構造
が条件を満たすかどうかを示す真理値である。フローチ
ャートのステップS15で呼び出された際には、検索式
のルートノードが入力されている。また、この処理は、
対応表DB内に格納された対応表を参照して行れる。 〔S21〕選択されている文書型から作成された対応表
内のデータを走査し、入力されたノードを出発要素型と
するエントリを求める。同時に、検索式において、入力
ノードに隣接する全てのノードをキューに格納する。こ
こで、入力ノードに隣接するノードとは、検索式におい
て、入力ノードの子あるいは子孫の関係で接続されてい
るノードを指す。 〔S22〕キューが空か否かを判断することによって、
未処理の隣接ノードがあるかどうかを検査する。即ち、
キューが空でなければ、未処理の隣接ノードが存在して
いることを示す。 〔S23〕キューが空であれば、全ての隣接ノードに対
する照合が済んでいるため戻り値を「真」とし、制御を
戻す。この際、制御が戻る先は、このノード照合処理の
呼び出し元である。即ち、現在行われている処理を呼び
出したのが図5に示すステップS15であれば、ステッ
プS15の処理が終了したこととなり、次のステップS
16に処理が進む。この処理を呼び出したのが後述する
ステップS30の処理であれば、ステップS30の処理
が終了したこととなり、次のステップS31に処理が進
む。 〔S24〕キューが空でなければ、未処理のノードが存
在するため、キューの先頭のノードを選択する。 〔S25〕選択したノードが入力されたノードの子とし
て指定されているか否かを判断する。入力されたノード
の子として指定されていれば、ステップS26に進む。
ノードの子として指定されていなければ、選択したノー
ドは入力されたノードの子孫として指定されていると判
断し、ステップS28に進む。 〔S26〕選択したノードが、エントリの隣接要素型集
合に含まれるか否かを判断する。隣接要素型集合に含ま
れていればステップS30に進み、隣接要素型集合に含
まれていなければステップS27に進む。 〔S27〕選択したノードが隣接要素型集合に含まれて
いない場合、戻り値を「偽」として、このノード照合処
理の呼び出し元に制御を戻す。 〔S28〕選択したノードが、エントリの到達可能要素
型集合に含まれるか否かを判断する。到達可能要素型集
合に含まれていればステップS30に進み、隣接要素型
集合に含まれていなければステップS29に進む。 〔S29〕選択したノードが到達可能要素型集合に含ま
れていない場合、戻り値を「偽」として、このノード照
合処理の呼び出し元に制御を戻す。 〔S30〕ステップS26、あるいはステップS28に
おいてエントリに含まれると判断された場合には、ステ
ップS24で選択したノードを入力ノードとして、ノー
ドの照合処理を行う。この処理では、ステップS24で
選択したノードより下位の構造の照合結果が全て「真」
と判断されていれば、戻り値が「真」となり、下位の構
造の照合の際に1つでも「偽」の結果が出れば、戻り値
が「偽」となる。 〔S31〕ステップS30での照合処理が妥当か否かを
判断する。即ち、ステップS30からの戻り値が「真」
であれば妥当と判断し、「偽」であれば妥当ではないと
判断する。妥当と判断した場合にはステップS22に進
み、妥当ではないと判断した場合にはステップS32に
進む。 〔S32〕戻り値が「偽」として、ノード照合処理の呼
び出し元に制御を戻す。
【0056】このような処理を行い、制御が図5に示す
フローチャートのステップS15に戻った時に、戻り値
が「真」であれば、各ノードの照合が全て「真」で戻っ
たことになり、選択されている文書型が、検索式を満た
す文書を生成し得ることを意味する。
フローチャートのステップS15に戻った時に、戻り値
が「真」であれば、各ノードの照合が全て「真」で戻っ
たことになり、選択されている文書型が、検索式を満た
す文書を生成し得ることを意味する。
【0057】ここで、具体的な検索例について説明す
る。例えば、次のような有向グラフの検索式の検索条件
が指定されたものとする。図7は有向グラフで表現され
た検索式を示す図である。この検索式は、図14に示し
た検索式を有向グラフで表したものである。この図のノ
ード8〜10は、図14のノード61〜63にそれぞれ
対応している。この検索式では、検索条件として各ノー
ドに「タイプ」、「接続関係」、及び「テキスト」が設
定されている。「タイプ」は、そのノードの要素型の名
前を示している。「接続関係」はアークで接続された上
位のノードに対して子であるか、あるいは子孫であるか
を示している。「テキスト」には、そのノードが示す要
素が持つテキスト内に含まれるべき文字列を示してい
る。なお、図において、設定されていない条件を「ni
l」で表している。
る。例えば、次のような有向グラフの検索式の検索条件
が指定されたものとする。図7は有向グラフで表現され
た検索式を示す図である。この検索式は、図14に示し
た検索式を有向グラフで表したものである。この図のノ
ード8〜10は、図14のノード61〜63にそれぞれ
対応している。この検索式では、検索条件として各ノー
ドに「タイプ」、「接続関係」、及び「テキスト」が設
定されている。「タイプ」は、そのノードの要素型の名
前を示している。「接続関係」はアークで接続された上
位のノードに対して子であるか、あるいは子孫であるか
を示している。「テキスト」には、そのノードが示す要
素が持つテキスト内に含まれるべき文字列を示してい
る。なお、図において、設定されていない条件を「ni
l」で表している。
【0058】このような検索式による検索指令が出力さ
れ、図5のステップS13により図13に示す文書型が
選択された場合、図3に示した対応表が参照される。そ
して、この文書型の「節」は、子として「見出し」、
「段落」、あるいは「節」を持つことができ、子孫とし
て「見出し」、「段落」、あるいは「節」を持つことが
できることが分かる。図7の検索式では、「節」の子と
して「見出し」が出現し、「節」の子孫として「段落」
が出現することを要求している。従って、図7の検索式
と図3の対応表とを照合した結果は、妥当と判断され
る。
れ、図5のステップS13により図13に示す文書型が
選択された場合、図3に示した対応表が参照される。そ
して、この文書型の「節」は、子として「見出し」、
「段落」、あるいは「節」を持つことができ、子孫とし
て「見出し」、「段落」、あるいは「節」を持つことが
できることが分かる。図7の検索式では、「節」の子と
して「見出し」が出現し、「節」の子孫として「段落」
が出現することを要求している。従って、図7の検索式
と図3の対応表とを照合した結果は、妥当と判断され
る。
【0059】一方、図16に示した検索式による検索指
令が出力され、図5のステップS13により図13に示
す文書型が選択された場合、検索式のルートノードの要
素型が「本文」であるが、図3に示した対応表の出発要
素には「本文」がない。そのため照合した結果は、妥当
ではないと判断される。従って、図13の文書型に従っ
て作成された文書が検索の対象となることはない。
令が出力され、図5のステップS13により図13に示
す文書型が選択された場合、検索式のルートノードの要
素型が「本文」であるが、図3に示した対応表の出発要
素には「本文」がない。そのため照合した結果は、妥当
ではないと判断される。従って、図13の文書型に従っ
て作成された文書が検索の対象となることはない。
【0060】以上のように、実際に文書の検索を行う前
に、検索式が要求している構造と文書型とを比較し、検
索式に適合する構造の文書を生成し得る文書型を検出
し、その文書型から作成された文書のみを検索対象とし
たことにより、検索時間を大幅に短縮できる。
に、検索式が要求している構造と文書型とを比較し、検
索式に適合する構造の文書を生成し得る文書型を検出
し、その文書型から作成された文書のみを検索対象とし
たことにより、検索時間を大幅に短縮できる。
【0061】また、文書型の照合により妥当と判断され
た文書のうち、ユーザが指定した文書のみを検索対象と
することができるため、明らかに不要であるとユーザが
判断した文書型を、検索対象から除外することができ
る。そのため、検索式を満たした文書であっても、ユー
ザが指定していない文書型から作成された文書は検出さ
れず、適合率が向上する。
た文書のうち、ユーザが指定した文書のみを検索対象と
することができるため、明らかに不要であるとユーザが
判断した文書型を、検索対象から除外することができ
る。そのため、検索式を満たした文書であっても、ユー
ザが指定していない文書型から作成された文書は検出さ
れず、適合率が向上する。
【0062】次に、対応表の作成処理について説明す
る。対応表の作成処理は、文書型DB15に新たな文書
型が格納された場合に、文書型の構造を示すデータを入
力として対応表生成部20によって実行される。なお、
文書型DB15内の文書型は、有向グラフで表現されて
いるものとする。
る。対応表の作成処理は、文書型DB15に新たな文書
型が格納された場合に、文書型の構造を示すデータを入
力として対応表生成部20によって実行される。なお、
文書型DB15内の文書型は、有向グラフで表現されて
いるものとする。
【0063】図8は図13の文書型を表す有向グラフで
ある。有向グラフには、要素型を定義したノード(図
中、矩形のノード)と構築子を定義したノード(楕円の
ノード)とがある。これらのノードはアーク(図中の矢
印)で接続されている。
ある。有向グラフには、要素型を定義したノード(図
中、矩形のノード)と構築子を定義したノード(楕円の
ノード)とがある。これらのノードはアーク(図中の矢
印)で接続されている。
【0064】この図では、名前が「記事」の要素型を定
義したノード21がルートノードである。ノード21に
は、「REP」の構築子を示すノード22がアークでつ
ながっている。ノード22には、名前が「節」の要素型
を定義したノード23がつながっている。ノード23に
は、「SEQ」の構築子を示すノード24がつながって
いる。ノード24には、名前が「見出し」の要素型を定
義したノード27、「OPT」の構築子を示す2つのノ
ード25,28がつながっている。ノード25,28の
それぞれには、「REP」の構築子を示すノード26,
29がつながっている。ノード26には、ノード23が
つながっている。ノード29は、名前が「段落」の要素
型を定義したノード30がつながっている。
義したノード21がルートノードである。ノード21に
は、「REP」の構築子を示すノード22がアークでつ
ながっている。ノード22には、名前が「節」の要素型
を定義したノード23がつながっている。ノード23に
は、「SEQ」の構築子を示すノード24がつながって
いる。ノード24には、名前が「見出し」の要素型を定
義したノード27、「OPT」の構築子を示す2つのノ
ード25,28がつながっている。ノード25,28の
それぞれには、「REP」の構築子を示すノード26,
29がつながっている。ノード26には、ノード23が
つながっている。ノード29は、名前が「段落」の要素
型を定義したノード30がつながっている。
【0065】このような有向グラフで表現された文書型
に基づき、対応表が作成される。図9は対応表の作成処
理のフローチャートである。この処理は対応表生成部2
0によって行われる。この処理の入力は、新たに作成さ
れた文書型である。なお、文書型は、要素型と構築子と
をノードで表した有向グラフとして文書型DB15に格
納される。なお、以下の説明においてノードと言った場
合には、要素型を示すノードと構築子を示すノードとが
ある。 〔S41〕入力された文書型のルートノードを選択す
る。 〔S42〕ルートノードから到達可能な要素型の集合を
求める。これにより、入力された文書型に含まれるルー
トノード以外の全ての要素型の集合が求められる。この
処理の詳細は後述する。 〔S43〕変数Sに、ステップS42の処理の戻り値に
ルートノードを加えた集合を保持させる。これにより、
入力された文書型に含まれる要素型が全て変数Sに含ま
れることになる。 〔S44〕変数Sが空か否かを判断する。つまり、変数
Sが空であれば、出発要素として設定された全ての要素
型に対して所定の処理を行ったこととなる。変数Sにノ
ードがあればステップS45に進み、変数Sが空であれ
ば対応表の作成処理を終了する。 〔S45〕未処理のノードが存在するため、変数Sから
ノードを1つ取り出し、それを選択する。なお、変数S
には要素型を表すノードしか含まれないため、選択され
るノードは要素型を表すノードのみである。 〔S46〕選択したノードと隣接する要素型の集合を求
める。この処理の詳細は後述する。 〔S47〕選択したノードから到達可能な要素型の集合
を求める。この処理は、ステップS42で行われる処理
と同じ処理である。 〔S48〕選択中のノードが表す要素型を「出発要
素」、ステップS46の処理により得られた隣接する要
素型の集合を「隣接要素」、及びステップS47の処理
により得られた到達可能な要素型の集合を「到達可能要
素」の3つを組として対応表DBのエントリとして登録
する。その後、ステップS44に進む。
に基づき、対応表が作成される。図9は対応表の作成処
理のフローチャートである。この処理は対応表生成部2
0によって行われる。この処理の入力は、新たに作成さ
れた文書型である。なお、文書型は、要素型と構築子と
をノードで表した有向グラフとして文書型DB15に格
納される。なお、以下の説明においてノードと言った場
合には、要素型を示すノードと構築子を示すノードとが
ある。 〔S41〕入力された文書型のルートノードを選択す
る。 〔S42〕ルートノードから到達可能な要素型の集合を
求める。これにより、入力された文書型に含まれるルー
トノード以外の全ての要素型の集合が求められる。この
処理の詳細は後述する。 〔S43〕変数Sに、ステップS42の処理の戻り値に
ルートノードを加えた集合を保持させる。これにより、
入力された文書型に含まれる要素型が全て変数Sに含ま
れることになる。 〔S44〕変数Sが空か否かを判断する。つまり、変数
Sが空であれば、出発要素として設定された全ての要素
型に対して所定の処理を行ったこととなる。変数Sにノ
ードがあればステップS45に進み、変数Sが空であれ
ば対応表の作成処理を終了する。 〔S45〕未処理のノードが存在するため、変数Sから
ノードを1つ取り出し、それを選択する。なお、変数S
には要素型を表すノードしか含まれないため、選択され
るノードは要素型を表すノードのみである。 〔S46〕選択したノードと隣接する要素型の集合を求
める。この処理の詳細は後述する。 〔S47〕選択したノードから到達可能な要素型の集合
を求める。この処理は、ステップS42で行われる処理
と同じ処理である。 〔S48〕選択中のノードが表す要素型を「出発要
素」、ステップS46の処理により得られた隣接する要
素型の集合を「隣接要素」、及びステップS47の処理
により得られた到達可能な要素型の集合を「到達可能要
素」の3つを組として対応表DBのエントリとして登録
する。その後、ステップS44に進む。
【0066】以上が、対応表作成の全体の処理である。
次に、隣接する要素型の集合を求める処理と、到達可能
な要素型の集合を求める処理の詳細を説明する。図10
は隣接要素型の集合を求める処理のフローチャートであ
る。この処理は、図9のステップS46から呼ばれるこ
とにより、対応表生成部20で実行される。この処理の
入力は要素型のノードであり、出力は入力された要素型
と隣接する要素型の集合である。 〔S51〕要素型の集合を保持するための変数S1 の初
期値を空集合とする。 〔S52〕要素型のキューを保持するための変数Q1 の
初期値として、入力ノードに隣接するノード全てをキュ
ーの列に加える。このときのノードには、要素型を表す
ノードと構築子を表すノードとの双方が含まれる。な
お、このフローチャート及び図11に示すフローチャー
トにおいて「隣接するノード」といった場合には、文書
型を表す有向グラフ上で1つのアークで直接接続されて
いるノードを指す。 〔S53〕変数Q1 の長さ(キューの列に含まれるノー
ドの数)が0か否かを判断する。変数Q1 の長さが0で
あればステップS54に進み、変数Q1 の長さが0でな
ければステップS55に進む。 〔S54〕変数Q1 の長さが0であれば、入力された要
素型に隣接する全ての要素型が変数S1 に含まれている
こととなるため、このときの変数S1 の値を戻り値と
し、呼び出し元へ制御を戻す。 〔S55〕変数Q1 の長さが1以上であれば、変数Q1
の先頭のノードを取り出す。 〔S56〕取り出したノードが要素型か否かを判断し、
要素型であればステップS57に進み、要素型でなけれ
ば(構築子であれば)ステップS58に進む。 〔S57〕取り出したノードが要素型であれば変数S1
にその要素型を加え、ステップS53に進む。 〔S58〕取り出したノードが要素型でなけば、取り出
したノードに隣接するノード全てを変数Q1 の末尾に追
加し、ステップS53に進む。
次に、隣接する要素型の集合を求める処理と、到達可能
な要素型の集合を求める処理の詳細を説明する。図10
は隣接要素型の集合を求める処理のフローチャートであ
る。この処理は、図9のステップS46から呼ばれるこ
とにより、対応表生成部20で実行される。この処理の
入力は要素型のノードであり、出力は入力された要素型
と隣接する要素型の集合である。 〔S51〕要素型の集合を保持するための変数S1 の初
期値を空集合とする。 〔S52〕要素型のキューを保持するための変数Q1 の
初期値として、入力ノードに隣接するノード全てをキュ
ーの列に加える。このときのノードには、要素型を表す
ノードと構築子を表すノードとの双方が含まれる。な
お、このフローチャート及び図11に示すフローチャー
トにおいて「隣接するノード」といった場合には、文書
型を表す有向グラフ上で1つのアークで直接接続されて
いるノードを指す。 〔S53〕変数Q1 の長さ(キューの列に含まれるノー
ドの数)が0か否かを判断する。変数Q1 の長さが0で
あればステップS54に進み、変数Q1 の長さが0でな
ければステップS55に進む。 〔S54〕変数Q1 の長さが0であれば、入力された要
素型に隣接する全ての要素型が変数S1 に含まれている
こととなるため、このときの変数S1 の値を戻り値と
し、呼び出し元へ制御を戻す。 〔S55〕変数Q1 の長さが1以上であれば、変数Q1
の先頭のノードを取り出す。 〔S56〕取り出したノードが要素型か否かを判断し、
要素型であればステップS57に進み、要素型でなけれ
ば(構築子であれば)ステップS58に進む。 〔S57〕取り出したノードが要素型であれば変数S1
にその要素型を加え、ステップS53に進む。 〔S58〕取り出したノードが要素型でなけば、取り出
したノードに隣接するノード全てを変数Q1 の末尾に追
加し、ステップS53に進む。
【0067】以上のようにして、隣接要素型の集合が得
られる。つまり、入力された要素型のノードに対して、
構築子を示すノードの存在を無視すれば隣接の関係にな
る要素型の集合が求められる。
られる。つまり、入力された要素型のノードに対して、
構築子を示すノードの存在を無視すれば隣接の関係にな
る要素型の集合が求められる。
【0068】図11は到達可能な要素型の集合を求める
処理のフローチャートである。この処理は、図9のステ
ップS42、またはステップS47から呼ばれることに
より、対応表生成部20で実行される。この処理の入力
は要素型であり、出力は入力された要素型から到達可能
な要素型の集合である。 〔S61〕要素型の集合を保持するための変数S2 の初
期値を空集合とする。 〔S62〕要素型のキューを保持するための変数Q2 の
初期値として、入力ノードに隣接するノードの全てをキ
ューの列に加える。このときのノードには、要素型を表
すノードと構築子を表すノードとの双方が含まれる。 〔S63〕変数Q2 の長さが0か否かを判断する。変数
Q2 の長さが0であればステップS64に進み、変数Q
2 の長さが0でなければステップS65に進む。 〔S64〕変数Q2 の長さが0であれば、入力された要
素型から到達可能な全ての要素型が変数S2 に含まれて
いることとなるため、このときの変数S2 の値を戻り値
とし、呼び出し元へ制御を戻す。 〔S65〕変数Q2 の長さが1以上であれば、変数Q2
の先頭のノードを取り出す。 〔S66〕取り出したノードがS2 に含まれているか否
かを判断する。取り出したノードがS2 に含まれていな
ければステップS67に進む。取り出したノードがS2
に含まれていれば、そのノードは到達可能であると既に
判断されており、重複して判断を行う必要はないため、
ステップS63に進む。 〔S67〕取り出したノードがS2 に含まれていなけれ
ば、そのノードが要素型か否かを判断し、要素型であれ
ばステップS68に進み、要素型でなけばステップS6
9に進む。 〔S68〕取り出したノードが要素型であれば変数S2
にその要素型を加える。 〔S69〕取り出したノードが要素型でなければ、取り
出したノードに隣接するノード全てを変数Q2 の末尾に
追加し、ステップS63に進む。
処理のフローチャートである。この処理は、図9のステ
ップS42、またはステップS47から呼ばれることに
より、対応表生成部20で実行される。この処理の入力
は要素型であり、出力は入力された要素型から到達可能
な要素型の集合である。 〔S61〕要素型の集合を保持するための変数S2 の初
期値を空集合とする。 〔S62〕要素型のキューを保持するための変数Q2 の
初期値として、入力ノードに隣接するノードの全てをキ
ューの列に加える。このときのノードには、要素型を表
すノードと構築子を表すノードとの双方が含まれる。 〔S63〕変数Q2 の長さが0か否かを判断する。変数
Q2 の長さが0であればステップS64に進み、変数Q
2 の長さが0でなければステップS65に進む。 〔S64〕変数Q2 の長さが0であれば、入力された要
素型から到達可能な全ての要素型が変数S2 に含まれて
いることとなるため、このときの変数S2 の値を戻り値
とし、呼び出し元へ制御を戻す。 〔S65〕変数Q2 の長さが1以上であれば、変数Q2
の先頭のノードを取り出す。 〔S66〕取り出したノードがS2 に含まれているか否
かを判断する。取り出したノードがS2 に含まれていな
ければステップS67に進む。取り出したノードがS2
に含まれていれば、そのノードは到達可能であると既に
判断されており、重複して判断を行う必要はないため、
ステップS63に進む。 〔S67〕取り出したノードがS2 に含まれていなけれ
ば、そのノードが要素型か否かを判断し、要素型であれ
ばステップS68に進み、要素型でなけばステップS6
9に進む。 〔S68〕取り出したノードが要素型であれば変数S2
にその要素型を加える。 〔S69〕取り出したノードが要素型でなければ、取り
出したノードに隣接するノード全てを変数Q2 の末尾に
追加し、ステップS63に進む。
【0069】以上のようにして、到達可能要素型の集合
が得られる。つまり、入力された要素型のノードから、
アークの矢印の方向のノードに順に移動した場合に、到
達することのできる要素型の集合が求められる。
が得られる。つまり、入力された要素型のノードから、
アークの矢印の方向のノードに順に移動した場合に、到
達することのできる要素型の集合が求められる。
【0070】このようにして、新たな文書型が作成され
た際には、直ぐに対応表が作成される。文書の検索の際
には、この対応表を用いて文書型の照合を行うため、照
合の度に文書型の構造を解析する必要がなく、文書型の
照合に要する時間が短縮される。
た際には、直ぐに対応表が作成される。文書の検索の際
には、この対応表を用いて文書型の照合を行うため、照
合の度に文書型の構造を解析する必要がなく、文書型の
照合に要する時間が短縮される。
【0071】
【発明の効果】以上説明したように本発明の文書データ
ベース管理装置では、適応文書型検出手段により、検索
式と文書型とを照合し、検索式に適応した文書構造を生
成し得る文書型の構造化文書のみを対象として検索を行
うようにしたため、単一の検索式で複数の文書型の構造
化文書を検索することができるとともに、指定された条
件を満たす構造化文書を生成し得ない文書型は検索対象
外となり、不要な検索処理を行われず、計算時間が短縮
される。
ベース管理装置では、適応文書型検出手段により、検索
式と文書型とを照合し、検索式に適応した文書構造を生
成し得る文書型の構造化文書のみを対象として検索を行
うようにしたため、単一の検索式で複数の文書型の構造
化文書を検索することができるとともに、指定された条
件を満たす構造化文書を生成し得ない文書型は検索対象
外となり、不要な検索処理を行われず、計算時間が短縮
される。
【0072】また、検索対象文書型指定手段により、検
索式に適応した文書構造を生成し得る文書型の中から、
ユーザが任意の文書型を指定し、ユーザが指定した文書
型の構造化文書のみを対象として検索を行うようにした
ため、明らかにユーザの要求する構造化文書を生成し得
ない文書型の文書を検索の対象から除外することがで
き、適合率を向上させることができる。
索式に適応した文書構造を生成し得る文書型の中から、
ユーザが任意の文書型を指定し、ユーザが指定した文書
型の構造化文書のみを対象として検索を行うようにした
ため、明らかにユーザの要求する構造化文書を生成し得
ない文書型の文書を検索の対象から除外することがで
き、適合率を向上させることができる。
【0073】また、本発明の文書データベース検索方法
では、検索式と文書型とを照合し、検索式に適応した文
書構造を生成し得る文書型の文書のみを対象として検索
を行うようにしたため、単一の検索式で複数の文書型の
文書を検索することができるとともに、指定された条件
を満たす文書を生成し得ない文書型は処理対象外とな
り、不要な検索処理を行われず、計算時間が短縮され
る。
では、検索式と文書型とを照合し、検索式に適応した文
書構造を生成し得る文書型の文書のみを対象として検索
を行うようにしたため、単一の検索式で複数の文書型の
文書を検索することができるとともに、指定された条件
を満たす文書を生成し得ない文書型は処理対象外とな
り、不要な検索処理を行われず、計算時間が短縮され
る。
【図1】本発明の原理図である。
【図2】本発明を実施するための文書データベース管理
装置の概略構成を示すブロック図である。
装置の概略構成を示すブロック図である。
【図3】図13の文書型から作成された対応表を示す図
である。
である。
【図4】検索処理全体のフローチャートである。
【図5】文書型選択処理のフローチャートである。
【図6】ノードの照合処理のフローチャートである。
【図7】有向グラフで表現された検索式を示す図であ
る。
る。
【図8】図13の文書型を表す有向グラフである。
【図9】対応表の作成処理のフローチャートである。
【図10】隣接要素型の集合を求める処理のフローチャ
ートである。
ートである。
【図11】到達可能な要素型の集合を求める処理のフロ
ーチャートである。
ーチャートである。
【図12】構造化文書の論理構造を示す図である。
【図13】図12の論理構造が適応している構文規則を
示す図である。
示す図である。
【図14】グラフィカルに表現された検索式の例であ
る。
る。
【図15】図13に示した文書型に参考文献を加えた文
書型を示す図である。
書型を示す図である。
【図16】「本文」を要素として含む検索式の例を示す
図である。
図である。
1 文書型データベース 2 文書データベース 3 検索式入力手段 4 適応文書型検索手段 5 検索対象文書型指定手段 6 文書検索手段 7 検出文書表示手段 11 検索式UI 12 文書型UI 13 検索制御部 14 文書型管理部 15 文書型DB 16 照合部 17 対応表DB 18 検索式評価部 19 文書DB 20 対応表生成部
Claims (4)
- 【請求項1】 構造化文書の構成要素と構成要素間の関
係とを規定する複数の文書型が文書型データベースに格
納されており、前記複数の文書型のいずれかに従って作
成された構造化文書を格納する文書データベースを管理
する文書データベース管理装置において、 構造化文書の構成要素と構成要素間の関係との指定を検
索条件に含む検索式を入力する検索式入力手段と、 前記検索式と前記複数の文書型とを照合し、前記検索式
の検索条件を満たした文書構造を生成し得る適応文書型
を検出する適応文書型検出手段と、 前記適応文書型に従って作成された構造化文書を検索対
象として、前記検索式を満たした構造化文書を検索する
文書検索手段と、 を有することを特徴とする文書データベース管理装置。 - 【請求項2】 前記適応文書型のリストを表示装置に表
示する適応文書型表示手段と、前記表示装置に表示され
た前記適応文書型の中から、任意の文書型を検索対象文
書型として入力する文書型入力手段と、を有する検索対
象文書型指定手段をさらに有し、 前記文書検索手段は、前記検索対象文書型に従って作成
された構造化文書を検索対象として、前記検索式を満た
した構造化文書を検索する、 ことを特徴とする請求項1記載の文書データベース管理
装置。 - 【請求項3】 新規の文書型が作成された際に、前記新
規の文書型を解析し、前記文書型に含まれる各要素の子
あるいは子孫として出現可能な要素の対応表を作成する
対応表作成手段と、 前記対応表作成手段が作成した前記対応表を格納する対
応表記憶手段と、 をさらに有し、 前記検索式入力手段は、論理構造の要素間の親子関係あ
るいは祖孫関係の指定を検索条件に含む検索式を入力
し、 前記適応文書型検出手段は、照合すべき文書型から作成
された前記対応表を参照することにより、前記検索式に
適応した文書構造を生成し得る適応文書型を検出する、 ことを特徴とする請求項1記載の文書データベース管理
装置。 - 【請求項4】 構造化文書の構成要素と構成要素間の関
係とを規定する複数の文書型が文書型データベースに格
納されており、前記複数の文書型のいずれかに従って作
成された構造化文書を格納する文書データベースの検索
を行う文書データベース検索方法において、 構造化文書の構成要素と構成要素間の関係とを指定した
検索式が入力されると、前記検索式と前記複数の文書型
とを照合することにより、前記検索式を満たした文書構
造を生成し得る適応文書型を検出し、 前記適応文書型に従って作成された構造化文書を検索対
象として、前記検索式を満たした構造化文書を検索す
る、 ことを特徴とする文書データベース検索方法。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8112301A JPH09297768A (ja) | 1996-05-07 | 1996-05-07 | 文書データベース管理装置及び文書データベース検索方法 |
| US08/851,892 US5875441A (en) | 1996-05-07 | 1997-05-06 | Document database management system and document database retrieving method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8112301A JPH09297768A (ja) | 1996-05-07 | 1996-05-07 | 文書データベース管理装置及び文書データベース検索方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH09297768A true JPH09297768A (ja) | 1997-11-18 |
Family
ID=14583262
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8112301A Pending JPH09297768A (ja) | 1996-05-07 | 1996-05-07 | 文書データベース管理装置及び文書データベース検索方法 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US5875441A (ja) |
| JP (1) | JPH09297768A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007193500A (ja) * | 2006-01-18 | 2007-08-02 | Mitsubishi Electric Corp | 文書または図面作成支援装置 |
Families Citing this family (55)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6108676A (en) * | 1996-10-28 | 2000-08-22 | Fuji Xerox Co., Ltd. | Document processing apparatus, document type determining method, and hierarchical regular expression determining method |
| JP3828290B2 (ja) * | 1998-07-24 | 2006-10-04 | 富士通株式会社 | ドキュメント管理装置およびコンピュータをドキュメント管理装置として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
| US6263332B1 (en) * | 1998-08-14 | 2001-07-17 | Vignette Corporation | System and method for query processing of structured documents |
| US7281203B2 (en) * | 1998-09-29 | 2007-10-09 | Netscape Communications Corporation | Selecting a DTD for transforming malformed layout expressions into wellformed ones |
| CA2361398A1 (en) * | 1999-02-03 | 2000-08-10 | Quark, Inc. | System and process for creating a structured tag representation of a document |
| US6377956B1 (en) * | 1999-02-22 | 2002-04-23 | Siemens Corporate Research, Inc. | Automatically configuring product manual by binding document objects in logical structure to proper versions of component documents in a document database |
| US6834276B1 (en) * | 1999-02-25 | 2004-12-21 | Integrated Data Control, Inc. | Database system and method for data acquisition and perusal |
| US6775665B1 (en) * | 1999-09-30 | 2004-08-10 | Ricoh Co., Ltd. | System for treating saved queries as searchable documents in a document management system |
| JP3754253B2 (ja) * | 1999-11-19 | 2006-03-08 | 株式会社東芝 | 構造化文書検索方法、構造化文書検索装置及び構造化文書検索システム |
| US6778983B1 (en) | 2000-04-28 | 2004-08-17 | International Business Machines Corporation | Apparatus and method for accessing HTML files using an SQL query |
| US6920609B1 (en) * | 2000-08-24 | 2005-07-19 | Yahoo! Inc. | Systems and methods for identifying and extracting data from HTML pages |
| US7239408B1 (en) * | 2000-11-10 | 2007-07-03 | Hewlett-Packard Development Company, L.P. | Print processing system and method with document advisor service |
| US8117313B2 (en) * | 2001-03-19 | 2012-02-14 | International Business Machines Corporation | System and method for adaptive formatting of image information for efficient delivery and presentation |
| US6968783B2 (en) * | 2001-04-11 | 2005-11-29 | Orell Fussli Sicherheitsdrucl Ag | Method for printing security documents using sheets with identifiers |
| US6856992B2 (en) * | 2001-05-15 | 2005-02-15 | Metatomix, Inc. | Methods and apparatus for real-time business visibility using persistent schema-less data storage |
| US7058637B2 (en) * | 2001-05-15 | 2006-06-06 | Metatomix, Inc. | Methods and apparatus for enterprise application integration |
| US6925457B2 (en) * | 2001-07-27 | 2005-08-02 | Metatomix, Inc. | Methods and apparatus for querying a relational data store using schema-less queries |
| US7890517B2 (en) * | 2001-05-15 | 2011-02-15 | Metatomix, Inc. | Appliance for enterprise information integration and enterprise resource interoperability platform and methods |
| US6725217B2 (en) | 2001-06-20 | 2004-04-20 | International Business Machines Corporation | Method and system for knowledge repository exploration and visualization |
| US7028024B1 (en) | 2001-07-20 | 2006-04-11 | Vignette Corporation | Information retrieval from a collection of information objects tagged with hierarchical keywords |
| NL1018634C2 (nl) * | 2001-07-25 | 2003-01-28 | Oce Tech Bv | Werkwijze voor het vervaardigen van documenten, afdrukinrichting aangepast om deze werkwijze uit te voeren en een computer programma element omvattend een programma code voor het uitvoeren van de werkwijze. |
| EP1283477A1 (en) * | 2001-08-07 | 2003-02-12 | Sap Ag | Method and computer system for identifying objects for archiving |
| US7565377B2 (en) * | 2001-12-05 | 2009-07-21 | Robert Michael Watson | Artificially intelligent fulfillment system |
| EP1588286A2 (en) * | 2002-10-07 | 2005-10-26 | Metatomix, Inc. | Methods and apparatus for identifying related nodes in a directed graph having named arcs |
| US7603371B1 (en) | 2002-12-17 | 2009-10-13 | Vignette Corporation | Object based system and method for managing information |
| US20040236724A1 (en) * | 2003-05-19 | 2004-11-25 | Shu-Yao Chien | Searching element-based document descriptions in a database |
| US20040243627A1 (en) * | 2003-05-28 | 2004-12-02 | Integrated Data Control, Inc. | Chat stream information capturing and indexing system |
| US20040243536A1 (en) * | 2003-05-28 | 2004-12-02 | Integrated Data Control, Inc. | Information capturing, indexing, and authentication system |
| US7729990B2 (en) * | 2003-05-28 | 2010-06-01 | Stephen Michael Marceau | Check image access system |
| US20040243494A1 (en) * | 2003-05-28 | 2004-12-02 | Integrated Data Control, Inc. | Financial transaction information capturing and indexing system |
| EP1690210A2 (en) | 2003-07-07 | 2006-08-16 | Metatomix, Inc. | Surveillance, monitoring and real-time events platform |
| US7665063B1 (en) | 2004-05-26 | 2010-02-16 | Pegasystems, Inc. | Integration of declarative rule-based processing with procedural programming |
| US20060085391A1 (en) * | 2004-09-24 | 2006-04-20 | Microsoft Corporation | Automatic query suggestions |
| US8335704B2 (en) | 2005-01-28 | 2012-12-18 | Pegasystems Inc. | Methods and apparatus for work management and routing |
| US8082259B2 (en) * | 2005-03-16 | 2011-12-20 | Sony Corporation | Information processing apparatus for extracting objects |
| US20090132232A1 (en) * | 2006-03-30 | 2009-05-21 | Pegasystems Inc. | Methods and apparatus for implementing multilingual software applications |
| US8924335B1 (en) | 2006-03-30 | 2014-12-30 | Pegasystems Inc. | Rule-based user interface conformance methods |
| US9876749B2 (en) * | 2006-12-18 | 2018-01-23 | Cisco Technology, Inc. | Dynamic location-specific distribution lists |
| US8250525B2 (en) | 2007-03-02 | 2012-08-21 | Pegasystems Inc. | Proactive performance management for multi-user enterprise software systems |
| US8290967B2 (en) | 2007-04-19 | 2012-10-16 | Barnesandnoble.Com Llc | Indexing and search query processing |
| US8819066B2 (en) * | 2007-12-21 | 2014-08-26 | International Business Machines Corporation | Employing organizational context within a collaborative tagging system |
| US7711622B2 (en) | 2008-03-05 | 2010-05-04 | Stephen M Marceau | Financial statement and transaction image delivery and access system |
| US8538941B2 (en) * | 2008-07-31 | 2013-09-17 | Adobe Systems Incorporated | Visual information search tool |
| US10481878B2 (en) * | 2008-10-09 | 2019-11-19 | Objectstore, Inc. | User interface apparatus and methods |
| US8843435B1 (en) | 2009-03-12 | 2014-09-23 | Pegasystems Inc. | Techniques for dynamic data processing |
| US8468492B1 (en) | 2009-03-30 | 2013-06-18 | Pegasystems, Inc. | System and method for creation and modification of software applications |
| US9367523B2 (en) | 2009-09-25 | 2016-06-14 | Adobe Systems Incorporated | System and method for using design features to search for page layout designs |
| US8880487B1 (en) | 2011-02-18 | 2014-11-04 | Pegasystems Inc. | Systems and methods for distributed rules processing |
| US9195936B1 (en) | 2011-12-30 | 2015-11-24 | Pegasystems Inc. | System and method for updating or modifying an application without manual coding |
| US9087053B2 (en) * | 2012-10-12 | 2015-07-21 | Hyland Software, Inc. | Computer-implemented document manager application enabler system and method |
| US10469396B2 (en) | 2014-10-10 | 2019-11-05 | Pegasystems, Inc. | Event processing with enhanced throughput |
| US10698599B2 (en) | 2016-06-03 | 2020-06-30 | Pegasystems, Inc. | Connecting graphical shapes using gestures |
| US10698647B2 (en) | 2016-07-11 | 2020-06-30 | Pegasystems Inc. | Selective sharing for collaborative application usage |
| US11048488B2 (en) | 2018-08-14 | 2021-06-29 | Pegasystems, Inc. | Software code optimizer and method |
| US11567945B1 (en) | 2020-08-27 | 2023-01-31 | Pegasystems Inc. | Customized digital content generation systems and methods |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA2048039A1 (en) * | 1991-07-19 | 1993-01-20 | Steven Derose | Data processing system and method for generating a representation for and random access rendering of electronic documents |
| JPH0713966A (ja) * | 1993-04-12 | 1995-01-17 | Xerox Corp | 文書の編集方法 |
| JPH0744579A (ja) * | 1993-05-25 | 1995-02-14 | Ricoh Co Ltd | 論理構造文書検索方式 |
| JPH07319918A (ja) * | 1994-05-24 | 1995-12-08 | Fuji Xerox Co Ltd | 文書検索対象指示装置 |
| JPH07319917A (ja) * | 1994-05-24 | 1995-12-08 | Fuji Xerox Co Ltd | 文書データべース管理装置および文書データべースシステム |
| US5745745A (en) * | 1994-06-29 | 1998-04-28 | Hitachi, Ltd. | Text search method and apparatus for structured documents |
| JPH0830620A (ja) * | 1994-07-19 | 1996-02-02 | Fuji Xerox Co Ltd | 構造検索装置 |
| JP3724847B2 (ja) * | 1995-06-05 | 2005-12-07 | 株式会社日立製作所 | 構造化文書差分抽出方法および装置 |
-
1996
- 1996-05-07 JP JP8112301A patent/JPH09297768A/ja active Pending
-
1997
- 1997-05-06 US US08/851,892 patent/US5875441A/en not_active Expired - Lifetime
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007193500A (ja) * | 2006-01-18 | 2007-08-02 | Mitsubishi Electric Corp | 文書または図面作成支援装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| US5875441A (en) | 1999-02-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH09297768A (ja) | 文書データベース管理装置及び文書データベース検索方法 | |
| US6327593B1 (en) | Automated system and method for capturing and managing user knowledge within a search system | |
| US7015911B2 (en) | Computer-implemented system and method for report generation | |
| CN100561480C (zh) | 结构化文档管理系统和管理在所述系统中的索引的方法 | |
| US7197510B2 (en) | Method, system and program for generating structure pattern candidates | |
| US6704739B2 (en) | Tagging data assets | |
| US5752021A (en) | Document database management apparatus capable of conversion between retrieval formulae for different schemata | |
| US8626756B1 (en) | Tagging data assets | |
| US20100145902A1 (en) | Methods and systems to train models to extract and integrate information from data sources | |
| US20050210000A1 (en) | Semantic web portal graphic interface | |
| US20080154866A1 (en) | System and method for creating dynamic folder hierarchies | |
| US20120221571A1 (en) | Efficient presentation of comupter object names based on attribute clustering | |
| US20040221229A1 (en) | Data structures related to documents, and querying such data structures | |
| JPH11110415A (ja) | 情報検索方法,情報検索システムおよび一組の文書から情報を検索するための命令を記録したコンピュータ読み取り可能な記録媒体 | |
| JPH11110413A (ja) | データベース検索結果を生成するための方法および装置 | |
| US20070016605A1 (en) | Mechanism for computing structural summaries of XML document collections in a database system | |
| US20060053106A1 (en) | Use of generated SQL for evaluation of decision point rules in a workflow system | |
| US9378301B2 (en) | Apparatus, method, and computer program product for searching structured document | |
| Karp et al. | The Grasper-CL graph management system | |
| US7499931B2 (en) | Method and apparatus for approximate projection of XML documents | |
| CN100565508C (zh) | 结构化文档管理设备、搜索设备、存储和搜索方法 | |
| JP3612914B2 (ja) | 構造化文書検索装置及び構造化文書検索方法 | |
| CN113011146A (zh) | 信息处理装置、存储介质及信息处理方法 | |
| JP3168829B2 (ja) | 検索式作成支援システム | |
| JP3457487B2 (ja) | 知識ファイリング装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040105 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040316 |