JPH03180942A - 文書データベース用マスタファイル作成装置 - Google Patents

文書データベース用マスタファイル作成装置

Info

Publication number
JPH03180942A
JPH03180942A JP1318814A JP31881489A JPH03180942A JP H03180942 A JPH03180942 A JP H03180942A JP 1318814 A JP1318814 A JP 1318814A JP 31881489 A JP31881489 A JP 31881489A JP H03180942 A JPH03180942 A JP H03180942A
Authority
JP
Japan
Prior art keywords
document
master file
file
length
fixed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1318814A
Other languages
English (en)
Inventor
Seiichi Takao
高尾 誠一
Masaru Murakami
優 村上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1318814A priority Critical patent/JPH03180942A/ja
Publication of JPH03180942A publication Critical patent/JPH03180942A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、判例等の如き大量の文書データを扱う文書デ
ータベース用のマスタファイルを作成する装置に関する
〔従来の技術〕
従来、文書データベース用のマスタファイルの作成は、
そのマスタファイルを通して文書データベースに登録し
ようとする文書の項目数(エントリ項目の数)および項
目データ長が決まった段階で、その項目数と項目データ
長を考慮した専用のデータエントリプログラムを作成し
、このプログラムを用いて利用者が各項目の内容をキー
入力することによりマスタファイルに反映可能な形式の
固定長レコードからなるエントリデータを作成し、その
内容をマスタファイルに反映する方式となっていた。
〔発明が解決しようとする課題〕
上述した従来の方式は、項目数や項目データ長が決定し
ている場合には有効なものであったが、項目数や項目デ
ータ長が定まらない場合には専用のデータエントリプロ
グラムを作成することができない為、マスタファイルの
作成にかかる作業を一切進めることができないという問
題点があった。
また、この種のデータエントリプログラムは比較的短い
固定的内容のエントリを目的とする為に長大な文章の入
力には不向きであり、利用者の作業効率が悪いという問
題点もあった。
本発明はこのような従来の問題点を解決したもので、そ
の目的は、項目数や項目データ長が定まっていない場合
でも適用可能であり、然も長大な文章の入力が容易に行
える文書データベース用マスタファイル作成装置を提供
することにある。
〔課題を解決するための手段〕
本発明は上記の目的を達成するために、所定の形式を有
する固定長レコードの集まりである文書データベース用
マスタファイルを作成する装置において、ワードプロセ
ッサで作成された任意の項目数および項目データ長を有
する文書を入力し、その文書中の各項目の内容を前記文
書データベース用マスタファイルの形式に合致し且つそ
の項目データ長に応した数の固定長レコードに変換した
テンポラリファイルを生成する第1の処理手段と、この
第1の処理手段で生威されたテンポラリファイルの内容
を文書デークヘース用マスタファイルに反映する第2の
処理手段とを備えている。
[作用] 本発明の文書データベース用マスタファイル作成装置に
おいては、利用者がワードプロセンサを使用して作成し
た任意の項目数および項目データ長を有する文書を入力
すると、第1の処理手段が、その入力された文書中の各
項目の内容を前記文書データベース用マスタファイルの
形式に合致し且つその項目データ長に応した数の固定長
レコードに変換したテンポラリファイルを生威し、次い
で第2の処理手段が、第1の処理手段で生成されたテン
ポラリファイルの内容を文書データヘース用マスタファ
イルに反映する。
[実施例] 次に、本発明の実施例について図面を参照して詳細に説
明する。
第1図を参照すると、本発明の一実施例は、ワードプロ
セッサ1.フロッピィディスク制御装置2、フロッピィ
ディスク媒体3.フロッピィディスク制御装置4.処理
装置5.旧マスタファイル6、新マスタファイル7、磁
気ディスク媒体8゜キーボード9 磁気テープ制御語W
10.11および磁気ディスク制御装置12で槽底され
、処理装置5内には第1の処理手段51と第2の処理手
段52とが設けられている。
ワードプロセッサ1は一般の汎用ワードプロセッサであ
り、文書データベース用マスタファイルである新マスタ
ファイル7に登録すべき文書はこのワードプロセッサ1
を使って利用者により作成され、作成された文書はフロ
ッピィディスク制御装置2を介してフロッピィディスク
媒体3に一旦格納される。ここで、作成された各文書は
、各文書毎に付与されたユニークなキーであるプライマ
ルキーと、文書内の項目を表すタグと、その項目の内容
であるデータ(項目データ)から槽底されている。項目
数及び項目データの長さは任意(不定)である。
旧マスタファイル6は既に作成されている文書データヘ
ース用マスタファイルであって、その中の可変レコード
群はブライマルキーで昇順にソートされており、また磁
気ディスク媒体8上に作成されたテンポラリファイル8
1−0〜81−1は処理過程で一時的に使用されるファ
イルである。
何れも新マスタファイル7と同一形式の固定長レコード
から槽底されている。各固定長レコードには、所定長ま
での項目データの内容が格納されると共に、ブライマル
キーおよびタグが付与され、更に1文書内に同一のタグ
が存在した場合の順序を表すタグ順序キーと、項目デー
タを複数のレコードに分割した場合の順序を表すデータ
順序キーとが付与される。
処理装置5の第1の処理手段51は、ワードプロセッサ
で作成されフロッピィディスク媒体3に格納された文書
をフロッピィディスク制御装置4を介しで入力し、この
文書中の各項目の内容を新マスタファイル7の形式に合
致し且つその項目データ長に応じた数の固定長レコード
に変換し、更に全ての固定長レコードをプライマルキー
でソートした固定長レコード群を磁気ディスク制御装置
12を介してテンポラリファイル81−oに出力する機
能を有する。
他方、第2の処理手段52は、第1の処理手段51で生
成されたテンポラリファイル81−oの内容を旧マスタ
ファイル6に反映することδこより新マスタファイル7
を作成するもので、テンポラリファイル81−0の内容
を新たな文書として旧マスタファイル6に加えることに
より新マスタファイル7を作成する新規処理部521と
、テンポラリファイル81−0の内容を旧マスタファイ
ル6に存在する同一プライマルキーを持つ文書の一部と
して追加することにより新マスタファイル7を作成する
追加処理部522と、テンポラリファイル81−0の内
容を旧マスタファイル6に存在する同一プライマルキー
を持つ文書の一部と入れ換えることにより新マスタファ
イル7を作成する修正処理部523とを有している。な
お、新規処理部521.追加処理部522.修正処理部
523はキーボード9からの指定により何れかが選択さ
れる。
磁気ディスク媒体8は処理過程で必要となる複数のテン
ポラリファイル81−O〜81−lと追加項目管理ファ
イル82を保持するものである。
ここで、追加項目管理ファイル82は追加処理部522
および修正処理部523によって使用されるファイルで
あり、文書のプライマルキーと、文書が数回にわたって
エントリされた場合の順序を表すエントリ番号とlエン
トリ内の文書に存在したタグの集合を含むレコードから
構成されるIsAMファイルである。
次に、上述のように構成された本実施例の動作を具体例
を交えて説明する。
利用者は、新マスタファイル7を作成する場合、今回登
録しようとする文書について、各文書毎に必要なタグと
項目データとをワードプロセンサ1の画面を見ながらキ
ー入力していき、全ての文書の作成を終了すると、作成
した各文書をフロッピィディスク制御装置2によってフ
ロッピィディスク媒体3に格納する。
第2図はフロンビイディスク媒体3に格納された内容の
一例を示しており、同図(a)はフロッピィディスク媒
体3に複数のフロッピィ内文書が格納されている様子を
、同図(b)は1つのフロッピィ内文書中に複数の文書
(登録対象文書)が格納されている様子を、そして同図
(C)がlっの文書の内容例を示している。同図(C)
に示すように、ワードプロセッサ1を使用して作成され
た個々の文書は、010.020.・・・、070の如
き文書内の項目を表すタグと、そのタグの後ろに記述さ
れた項目データ(1)、 (2)、  ・・・、(8)
とから構成されている。各項目データの長さは任意(不
定)である。ここで、先頭のタグ010に対応する項目
データ(1)は当該文書に付与されたユニークなプライ
マルキーであり、図示の例では5OOOIになっている
。他のタグ020.・・・、070に対応する項目デー
タ(2)・・・、(8)は当該文書中の他の項目であり
、例えば判例データヘースを例にすれば、判決日1判決
要旨2判決主文等が該当する。なお、タグ030が二つ
存在するのは、同一の項目が二つ存在しているからであ
る。
文書の作成が終了すると、次に利用者はフロッピィディ
スク媒体3をフロッピィディスク制御装置4にセットし
、キーボード9から処理の種別を指定して処理装置5を
起動する。
処理袋W5は起動されると、先ず第1の処理手段51を
動作させ、その動作が終了すると指定された種別に応じ
て、新規処理ならば第2の処理手段52の新規処理部5
21を、追加処理ならば追加処理部522を、修正処理
ならば修正処理部523を動作させる。
第1の処理手段51は動作を開始すると、フロッピィデ
ィスク制御装置4を介してフロッピィディスク媒体3に
格納された文書を1文書ずつ読み出し、各文書中の各項
目の内容を新マスタファイル7の形式に合致し且つその
項目データ長番こ応した数の固定長レコードに変換した
テンポラリファイル81−0を磁気ディスク媒体8上に
作成する。
そして、テンポラリファイル81−0中の固定長■0 レコードをブライマルキーで昇順にソートする。
第3図は第1の処理手段51によって生成されたテンポ
ラリファイル81−oの一部を示し、第2図(C)のプ
ライマルキー=SOOO1を持つ文書に対応している。
同図に示すように、フロッピィディスク媒体3に格納さ
れた文書は複数の固定長レコードRに変換され、各固定
長レコードRは、タグ、ブライマルキー、タグ順序キー
、データ順序キー、項目データで構成されている。ここ
で、タグ010〜030,060,07(11項目デー
タ(])〜(4)、 (7)、 (8)は1つの固定長
レコードRに納まるサイズであ3ったことから各々1つ
の固定長レコードRに収納されており、タグ040 0
50の項目データ(5)、 (6)は長文であった為に
それぞれm個、n個の固定長レコードRに分割して格納
されている。そして、その順序がデータ順序キーで指示
されている。また、同一のタグ030について2つの項
目データ(3)、 (4)が存在していた為にその順序
がタグ順序キーで示されている。
さて、第1の処理手段51による上述した処理1 が終了すると、今回の処理の種別に応して、新規処理部
521.追加処理部522.修正処理部523の何れか
が起動される。以下、各種別毎にその動作を説明する。
先ず、新規処理の場合は新規処理部521が動作し、第
4図の動作説明図に示すように、テンポラリファイル8
1−0および旧マスタファイル6の先頭からそれぞれ1
文書にかかる固定長レコード群を読み込み、ブライマル
キーの小さい方の固定長レコード群を新マスタファイル
7に出力する。
そして、テンポラリファイル81−0の固定長レコード
群を新マスタファイル7に出力した場合にはテンポラリ
ファイル81−0から次の1文書にかかる固定長レコー
ド群を読み込んで上述と同様の処理を行い、旧マスタフ
ァイル6の固定長レコード群を新マスタファイル7に出
力した場合には旧マスタファイル6から次の1文書にか
かる固定長レコード群を読み込んで上述と同様の処理を
行う。以上の処理は、テンポラリファイル81−0また
は旧マスタファイル6の何れかの固定長レコ2 一ド群が無くなるまで続け、一方のファイルの全ての固
定長レコード群を全て新マスタファイル7に出力すると
他方のファイルの残りの固定長レコード群を新マスタフ
ァイル7に出力し、処理を終了する。以上で、テンポラ
リファイル81−0の内容を新たな文書として旧マスタ
ファイル6に加えた新マスタファイル7が生成されたこ
とになる。
次に、追加処理の場合は追加処理部522が動作する。
追加処理部522は第5図の動作説明図に示すように、
先ずテンポラリファイル81−0の先頭から1文書にか
かる固定長レコード群を読み込み、その中に存在するタ
グの集合を生成する。
次にその文書にかかるプライマルキーで追加項目管理フ
ァイル82を検索する。そして、追加項目管理ファイル
82にそのプライマルキーと同一のプライマルキーを持
つレコードが無ければそのプライマルキーとエントリ番
号r1」と今回生成したタグの集合とを含むレコードを
生成して追加項目管理ファイル82に追加する。また、
レコードの検索が成功した場合には検索されたレコード
中3 の最大のエントリ番号にrIJを加えたエントリ番号と
そのブライマルキーと今回求めたタグの集合とを含むレ
コードを生成して追加項目管理ファイル82に追加する
。例えば、今までの文書のエントリ回数が1であってプ
ライマルキーー5OO01に関する文書の内容として例
えば第3図に示す内容のものが旧マスタファイル6に格
納されている場合、今回の追加処理は最初の追加処理と
なるので追加項目管理ファイル82には該当するレコー
ドは存在せず、このため新たにタグ080090とそれ
に対応する項目データとを含む文書を追加する場合には
、第6図に示すように、プライマルキー=SOOO1,
エントリ番号「1」。
タグの集合(080,090)を含むレコードが追加項
目管理ファイル82に格納されることになる。
追加処理部522は追加項目管理ファイル82へのレコ
ードの格納を終えると、テンポラリファイル81−0か
ら今回読み込んだ文書のプライマルキーと等しいプライ
マルキーを持つ旧マスクフ4 アイル6の文書までの固定長レコード群を新マスタファ
イル7に出力し、次いで今回テンポラリファイル81−
0から読み込んだ追加文書の固定長レコード群を新マス
タファイル7に出力する。
追加処理部522は以上と同様な処理をテンポラリファ
イル81−〇が空になるまで繰り返し、その後に、旧マ
スタファイル6に固定長レコード群が残っていれば、そ
れを新マスタファイル7に全て出力する。これによって
、テンポラリファイル81−0の内容を旧マスタファイ
ル6に存在する同一ブライマルキーを持つ文書の一部と
して追加した新マスタファイル7が作成されたことにな
る。
次に、修正処理の場合は修正処理部523が動作する。
修正処理部523は第7図の動作説明図に示すように、
先ずテンポラリファイル81−0の先頭から1文書にか
かる固定長レコード群を読み込み、そのプライマルキー
と等しいプライマルキーの旧マスタファイル6の文書の
直前の文書までの固定長レコード群を新マスタファイル
7に出5 力する。次にそのプライマルキーと等しいプライマルキ
ーの旧マスタファイル6の文書にかかる固定長レコード
群を読み込み、そのプライマルキーで追加項目管理ファ
イル82を検索して得た1つ以上のエントリ番号とタグ
の集合とに基づいて、上記読み込んだ固定長レコード群
をエントリ番号毎に振り分けて必要な個数分のテンポラ
リファイル81−1〜81−1に出力する。次いで、テ
ンポラリファイル81−0から読み込んだ上記文書にか
かる固定長レコード群のタグとプライマルキーで追加項
目管理ファイル82を検索し、修正対象となるエントリ
番号を得る。そして、テンポラリファイル81−1〜8
1−1のうち、そのエントリ番号に対応する旧マスタフ
ァイル6の固定長レコード群を格納しているテンポラリ
ファイル81−jを除いた残りのテンポラリファイルに
格納されている固定長レコード群を新マスタファイル7
に出力し、その後に今回テンポラリファイル81−0か
ら読み込んだ修正文書にかかる固定長レコード群を新マ
スタファイル7に出力する。
6 修正処理部523は以上と同様な処理をテンポラリファ
イル81−0が空になるまで繰り返し、その後に、旧マ
スタファイル6に固定長レコード群が残っていれば、そ
れを新マスタファイル7に全て出力する。これによって
、テンポラリファイル81−0の内容を旧マスタファイ
ル6に存在する同一ブライマルキーを持つ文書の一部と
入れ換えた新マスタファイル7が作成されたことになる
[発明の効果] 以上説明したように、本発明では、−船釣なワードプロ
セッサを使用して作成された任意の項目数2項目データ
長の文書に基づいて文書データベース用マスタファイル
の作成が行われるので、項目数や項目データ長を定める
ことが困難で従って専用のデータエントリプログラムを
作成することができない状況下でも、利用者はマスタフ
ァイルの作成作業を進めることが可能となる。また、ワ
ードプロセッサは本来長文の作成が容易な為、判例デー
タベース等の如き大量文書データベース用のマスタファ
イルを効率良く作成することができ7
【図面の簡単な説明】
第1図は本発明の一実施例の構成図、 第2図はフロッピィディスク媒体3の内容例を示す図、 第3図はテンポラリファイル81−0の内容例を示す図
、 第4図は新規処理部521の動作説明図、第5図は追加
処理部522の動作説明図、第6図は追加項目管理ファ
イル82の内容例を示す図および、 第7図は修正処理部523の動作説明図である。 図において、 1・・・ワードプロセッサ 2.4・・・フロッピィディスク制御装置3・・・フロ
ッピィディスク媒体 5・・・処理装置 6・・・旧マスタファイル 7・・・新マスタファイル 8・・・磁気ディスク媒体 8 8 ・・・キーボード 0211・・・磁気テープ制御装置 2・・・磁気ディスク制御装置 1・・・第1の処理手段 2・・・第2の処理手段 521・・・新規処理部 522・・・追加処理部 523・・・修正処理部 1−0〜81−l・・・テンポラリファイル2・・・追
加項目管理ファイル

Claims (1)

  1. 【特許請求の範囲】  所定の形式を有する固定長レコードの集まりである文
    書データベース用マスタファイルを作成する装置におい
    て、 ワードプロセッサで作成された任意の項目数および項目
    データ長を有する文書を入力し、該文書中の各項目の内
    容を前記文書データベース用マスタファイルの形式に合
    致し且つその項目データ長に応じた数の固定長レコード
    に変換したテンポラリファイルを生成する第1の処理手
    段と、 該第1の処理手段で生成されたテンポラリファイルの内
    容を文書データベース用マスタファイルに反映する第2
    の処理手段とを具備したことを特徴とする文書データベ
    ース用マスタファイル作成装置。
JP1318814A 1989-12-11 1989-12-11 文書データベース用マスタファイル作成装置 Pending JPH03180942A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1318814A JPH03180942A (ja) 1989-12-11 1989-12-11 文書データベース用マスタファイル作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1318814A JPH03180942A (ja) 1989-12-11 1989-12-11 文書データベース用マスタファイル作成装置

Publications (1)

Publication Number Publication Date
JPH03180942A true JPH03180942A (ja) 1991-08-06

Family

ID=18103244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1318814A Pending JPH03180942A (ja) 1989-12-11 1989-12-11 文書データベース用マスタファイル作成装置

Country Status (1)

Country Link
JP (1) JPH03180942A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06231177A (ja) * 1993-02-03 1994-08-19 Nec Corp データベース検索方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06231177A (ja) * 1993-02-03 1994-08-19 Nec Corp データベース検索方式

Similar Documents

Publication Publication Date Title
JP3691844B2 (ja) 文書処理方法
JPH08305616A (ja) データ管理システム
US20060080361A1 (en) Document information processing apparatus, document information processing method, and document information processing program
JPH03180942A (ja) 文書データベース用マスタファイル作成装置
JP2000090093A (ja) 全文検索方法及び全文検索システム並びに全文検索プログラムを記録した記録媒体
JP2000003366A (ja) 文書登録方法と文書検索方法及びその実施装置並びにその処理プログラムを記録した媒体
JPH07296009A (ja) データベース統合検索装置
JPH06195379A (ja) 事例ベース及びその入力・蓄積装置
JP3210842B2 (ja) 情報処理装置
JP2000347907A (ja) データファイル自動変換装置
JPH08115340A (ja) 文書検索装置およびそれに用いるインデックスファイルの作成装置
JP2605402B2 (ja) 辞書システムにおけるデータ導出方式
JP2788849B2 (ja) 連番記述によるグルーピング方法
JP3047400B2 (ja) データ処理装置
JPH04330565A (ja) 自然言語処理システム
JPH02116972A (ja) プログラムデータベースの検索方式
JPH0668160A (ja) 情報検索方式
JPH08297571A (ja) ソフトウェア管理方法及び装置
JPH05165619A (ja) 標準名付与システム
JPH05197591A (ja) テストデータの作成方法
JPH0659950A (ja) データベースシステム
JPS5850044A (ja) インデクス・レコ−ドの検索処理方式
JPH0793143A (ja) データ定義仕様書生成方式
JPH06139058A (ja) プログラム改造仕様書作成システム
JPS63282821A (ja) コ−ド文字列変換装置