JP2000293414A - 異種データソース統合方法 - Google Patents

異種データソース統合方法

Info

Publication number
JP2000293414A
JP2000293414A JP11099727A JP9972799A JP2000293414A JP 2000293414 A JP2000293414 A JP 2000293414A JP 11099727 A JP11099727 A JP 11099727A JP 9972799 A JP9972799 A JP 9972799A JP 2000293414 A JP2000293414 A JP 2000293414A
Authority
JP
Japan
Prior art keywords
data
data output
output
processing
combining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11099727A
Other languages
English (en)
Inventor
Hideyuki Maki
牧  秀行
Toyohisa Morita
豊久 森田
Hiroshi Tsuji
洋 辻
Yukiyasu Ito
幸康 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP11099727A priority Critical patent/JP2000293414A/ja
Publication of JP2000293414A publication Critical patent/JP2000293414A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】異なるデータソースから得られるデータを組み
合わせて利用する場合、リレーショナルデータベースで
はSQLを用いて異なるテーブルのデータを組み合わせ
ることができるが、複雑な組合せを記述するのは容易で
はない。本発明は、簡単な操作により異種のデータソー
スから得られるデータに対する種々の演算、データの組
合せが可能なデータ統合方法を提供する。 【解決手段】本発明は複数のデータ出力処理と、1つの
データ結合処理を有する。データ出力処理はデータソー
スからデータを入力し、定められた演算、加工を加え、
その結果を出力する。データ結合処理は複数のデータ出
力処理から出力されたデータを結合し、その結果を出力
する。また、結合の対象となるデータ出力処理をデータ
出力処理の集合の中から使用者が指定するための設定処
理を有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データ分析技術、
およびデータ分析に利用されるデータの管理、加工技術
に関する。
【0002】
【従来の技術】従来、データの管理技術としてはデータ
ベースシステム、特に、リレーショナルデータベースが
よく知られている。リレーショナルデータベースでは行
と列からなるテーブル形式でデータを表現する。また、
リレーショナルデータベースはジョイン問い合わせ機能
を持ち、複数のテーブルを連結した結果を取り出すこと
ができる。リレーショナルデータベースのジョイン問い
合わせ機能については、文献「An Intoroduction to Da
tabase Systems/ 5th edition」(C. J. Date著、Addis
on-Wesley Publishing Company、1990)の149ページか
ら153ページ「6.3JOIN QUERIES」の節に記述がある。
【0003】ジョイン問い合わせでは、複数のテーブル
に対するジョイン演算を行い、その結果を問い合わせに
対する結果として出力する。ジョイン演算は、異なるテ
ーブルの行を連結して新たな1つの行とする。この連結
操作を全ての行の組合せについて行い、これによって得
られる行の集合に対して、行、列の選択操作を行った結
果がジョイン演算の結果となる。
【0004】ユーザがデータベースに対してジョイン問
い合わせを行なうには、データベース操作言語であるS
QLを用いる。ユーザはSQLに定義されている「sele
ct」文を用い、ジョインの対象となるテーブルの名前、
選択すべき列の名前、および選択すべき行の条件を指定
する。
【0005】
【発明が解決しようとする課題】種々のデータ利用、デ
ータ分析の場面では、異なるデータソースから得られる
データに対して演算、加工を行い、これらを組み合わせ
て利用したい場合がよくある。多くの場合、データはデ
ータベースなどのシステムを用いて管理されている。リ
レーショナルデータベースは異なるテーブルのデータを
組み合わせる機能として、ジョイン演算機能を持ってお
り、使用者は、リレーショナルデータベースの標準的な
操作言語であるSQLを用いてジョイン演算機能を利用
することができる。また、SQLには四則演算、数値の
合計、平均の算出などの基本的な演算、関数が用意され
ている。これらの演算機能により、データに演算、加工
を行い、それらを組み合わせて新たなデータを作成する
ことができる。しかし、データの複雑な演算、組合せを
行おうとした場合、その操作をSQLで記述するのは容
易ではなく、使用者にはデータベースシステムとSQL
に関する知識が要求される。
【0006】例えば、ある工業製品の生産計画データに
ついて、第1のテーブルには製品1つ1つの加工時刻と
加工に使用した設備名称が格納され、第2のテーブルに
は1つ1つの設備の運転履歴が格納されているとする。
設備の運転履歴とは、運転開始、終了、故障発生、復帰
などの時刻の記録である。これらのテーブルを元に、そ
れぞれの製品が加工された時の設備の運転状況を知りた
いとする。すなわち、第1のテーブルと第2のテーブル
を元に、それぞれの製品の加工時点において、用いられ
た設備が運転開始、または故障復帰から何時間経過して
いたかを調べたい。そのためには、それぞれの製品につ
いて、その加工時刻を起点に設備運転履歴を遡り、もっ
とも近い運転開始時刻または故障復帰時刻を見つけ出
し、加工時刻との差を計算する。この操作を記述するに
はSQLに関する相当の知識が必要となり、容易ではな
い。SQLによるデータ操作は集合演算を基本としてお
り、他の手続き型プログラミング言語でよく行なわれる
ような、1つ1つのデータに単独に演算を加えるという
記述に向いていないからである。
【0007】また、テーブル中の行を時刻順に並べ、時
系列演算(移動平均算出など)のようなデータの並び順
に依存する演算を行うことはSQLでは容易ではない。
リレーショナルデータベースにはデータの順序という概
念がなく、データは集合として扱われるからである。こ
のような、SQLで容易に記述できない演算を行うに
は、データベースからデータを取り出し、外部のプログ
ラムを用いる方が良いかも知れない。しかし、外部のプ
ログラムによって得たデータを単独で用いるのではな
く、さらに組み合わせて用いたい場合、データベースの
ジョイン演算に相当するデータ連結機能を用意するか、
外部プログラムで得たデータをデータベースに戻し、デ
ータベース上でジョインを行う必要があり、外部プログ
ラムとデータベースの間、または外部プログラム間で煩
雑なデータの転送を行わなければならない。
【0008】本発明の目的は、上記のようなデータベー
スと外部プログラム間のデータ転送機能または外部プロ
グラム同士のデータ転送、データ連結機能を用意し、簡
単な操作により異種のデータソースから得られるデータ
に対する種々の演算、データの組合せが可能なデータ統
合方法を提供することである。
【0009】
【課題を解決するための手段】本発明の目的を達成する
ために、本発明においてはデータ統合方法をデータ出力
処理とデータ結合処理に分離し、データの選択と入力処
理をデータ結合処理に持たせた。本発明は複数のデータ
出力処理と、1つのデータ結合処理を有する。データ出
力処理はデータソースからデータを入力し、定められた
演算、加工を加え、その結果を出力する。データ結合処
理は複数のデータ出力処理から出力されたデータを入力
し、それらを結合し、その結果を出力する。複数あるデ
ータ出力処理のうち、どれによって出力されたデータを
データ結合処理の入力とするかを選択する処理と、選択
したデータ出力処理から出力されたデータを入力する処
理がデータ結合処理に含まれる。
【0010】データ出力処理とデータ結合処理が分離さ
れていることにより、特定のデータ出力処理の内容を、
データ結合処理、および他のデータ出力処理を変更する
ことなく変更することが可能である。また、データ結合
処理、および他のデータ出力処理を変更することなく新
たなデータ出力処理を追加することが可能である。これ
により、複雑なデータ演算処理等を追加することが容易
になる。また、データ出力処理を選択し、そのデータを
入力する処理をデータ結合処理に含むことにより、デー
タ出力処理を変更することなく結合の対象となるデータ
を変更し、データ結合を行うことが可能である。
【0011】本発明は、また、データ結合処理において
結合の対象となるデータ出力処理をデータ出力処理の集
合の中から使用者が指定するための設定処理を有する。
使用者はこの設定処理において結合の対象となるデータ
出力処理を指定するほか、データ結合の方法の詳細など
の設定も行う。
【0012】本発明は、また、使用者の操作によりデー
タ出力処理の集合に新たなデータ出力処理を追加した
り、データ出力処理の集合からデータ出力処理を削除す
るための操作処理を有する。
【0013】
【発明の実施の形態】本発明の実施形態の第1の例を説
明する。図1に本実施例における処理間の関係を示す。
データ出力処理101は複数存在し、それぞれ、単数、
または複数のデータソース103からデータを入力し、
行と列からなる表形式のデータ104を出力する。デー
タ結合処理102は複数のデータ出力処理101におい
て出力された表形式のデータを入力し、これらを結合
し、1つの表形式のデータ105として出力する。デー
タ結合処理102における結合の対象となるデータ出力
処理101の指定、結合の方法などは結合設定処理10
6によって指示される。使用者は、一括型ユーザインタ
ーフェース107、または対話型ユーザインターフェー
ス108を介して結合設定処理106における指示内容
を操作することができる。
【0014】本実施例は計算機を用いて実施される。図
2に本実施例を実施する計算機の構成を示す。計算機
は、処理装置201、メモリ202、二次記憶203、
入力装置204、出力装置205、通信装置206から
なる。入力装置204、出力装置205は使用者が計算
に対して入出力を行うための装置である。また通信装置
206は通信路207を介して接続された外部装置20
8と情報の送受信を行うための装置である。
【0015】本発明を実施するプログラムは二次記憶2
03に格納され、メモリ202に読み出されて実行され
る。また、本発明を実施するプログラムは、フロッピー
(登録商標)デイスクや光デイスクのような計算機で読
取り可能な記憶媒体に格納され、プログラムの実行時に
メモリ202に読み出される。
【0016】図3にデータソースの例を示す。データソ
ースは、計算機のメモリ上、または二次記憶上に存在す
る。または、計算機の外部に存在し、通信路を介して計
算機と接続されている。ここには工業製品の製造過程に
関する情報を格納した3つの表形式のデータテーブルを
示してある。「製品検査情報」テーブル301は工業製
品に関する各種測定、検査の結果を格納している。それ
ぞれの行は1つの製品と1対1に対応している。「製品
ID」は、製品の1つ1つに付けられた識別名、「膜
厚」、「寸法」は製品特性の測定値、「製品検査」は製
品の最終的な合否判定結果である。「製造履歴情報」テ
ーブル302は製品が通過してきた各種工程の記録を格
納している。それぞれの行は1つの製品と1対1に対応
している。「工程A着工」、「工程A終了」は、それぞ
れの製品が工程Aに投入された時刻、工程Aを終了した
時刻である。「工程A装置」は、それぞれの製品が、工
程Aに関する複数の装置のうちどの装置を通過したかを
記録している。「装置管理情報」テーブル303は装置
についての操業記録を格納している。それぞれの行は1
つの出来事と1対1に対応している。「装置ID」は、
装置の1つ1つに付けられた識別名、「イベント」、
「日付時刻」はそれぞれ、出来事の内容と、その出来事
が発生した日時である。
【0017】次に、データ出力処理101の例を説明す
る。図1のデータ出力処理101ではデータソースから
特定の行を選び出し、出力している。どの行を選ぶか
は、あらかじめ固定されているか、または、外部から指
示される。この例では、製品IDが「A」から始まる製
品のデータを選んでいる。行を選び出しているだけなの
で、入力データと出力データの列の構成は同一である。
この処理のフローチャートを図4に示す。ここでは、製
品IDが「A」から始まる行を選ぶことがあらかじめ固
定されている場合を説明する。
【0018】まず、処理401において、データの入力
元となるデータソースへ接続する。そして、読み込むべ
きデータがデータソースにあるかどうかを調べる(40
2)。ここで、データがあれば処理403へ進む。処理
403では、データを1行読み込む。処理404では、
読み込んだデータの製品IDの先頭が「A」であるかど
うかを調べ、先頭が「A」であれば処理405へ、そう
でなければ処理406へ進む。処理405では、このデ
ータをメモリ上、または二次記憶上に保存し、処理40
2へ戻る。処理406では、このデータを破棄し、処理
402へ戻る。処理402において、読み込むべきデー
タがデータソースにない場合は処理407へ進む。処理
407では、データ結合処理からデータの要求があるま
で待機し、要求があれば処理408へ進む。処理408
では、処理405において保存したデータをデータ結合
処理へ出力し、その後、処理を終了する。
【0019】データ出力処理の別の例を図5に示す。図
5では、異なるテーブルに格納されているデータの間で
演算を行い、その結果を出力している。演算の内容、演
算対象のデータは、あらかじめ固定されているか、また
は、外部から指示される。ここでは、演算の内容、演算
対象のデータがあらかじめ固定されている場合を説明す
る。出力テーブルは演算結果を格納するための、入力テ
ーブルには無い列を持っている。また、「製造履歴情
報」テーブルの各行は製品と1対1に対応し、「装置管
理情報」テーブルの各行は装置の操業記録上のイベント
と1対1に対応しているというように、行の構成が異な
るテーブルの間で演算を行なっている。ここでは、各製
品の工程A着工時刻と、その製品の製造に用いられた装
置の操業記録を比較し、装置の運転開始から何時間後に
各製品が装置に投入されたかを算出し、これを「工程A
経過時間」として出力テーブルに格納している。出力テ
ーブルの各行は製品と1対1に対応している。例えば、
製品IDが「A001」である製品に関しては、製造履歴情
報テーブルから、装置「EQ-A1」に時刻「12:50」に投入
されたことがわかる(501)。一方、装置管理情報テ
ーブルから、装置「EQ-A1」は時刻「9:20」に運転を開
始したことがわかる(502)。この2つの時刻に演算
を施し、装置「EQ-A1」が運転を開始してから製品「A00
1」が投入されるまでの経過時間「3:30」を得る(50
3)。
【0020】この処理のフローチャートを図6に示す。
ここでは、演算対象のデータ、および行があらかじめ固
定されている場合を説明する。まず、処理601で、デ
ータの入力元となる2つのデータソースへ接続する。そ
して、第1のデータソースに関して、読み込むべきデー
タがデータソースにあるかどうかを調べる(602)こ
こで、データがあれば処理603へ進む。処理603で
は、第1のデータソースからデータを1行読み込む。処
理604では、処理603で読み込んだデータに記され
たのと同じ装置IDを持つデータを第2のデータソース
から読み込む。処理605では、処理604において第
2のデータソースにデータが見つかったかどうかを調
べ、見つかった場合は処理606へ、そうでない場合は
処理608へ進む。処理606では、処理603におい
て第1のデータソースから読み込んだデータの着工時刻
情報と、処理604において第2のデータソースから読
み込んだデータの日付情報を比較し、着工時刻と、着工
の直前のイベントの時刻の差を算出し、これを経過時間
とする。処理607では、処理606で算出した経過時
間を含んだデータをメモリ上、または二次記憶上に保存
し、処理602へ戻る。処理608では、処理603に
おいて第1のデータソースから読み込んだデータを破棄
し、処理602へ戻る。処理602おいて、読み込むべ
きデータが第1のデータソースにない場合は、処理60
9へ進む。処理609では、データ結合処理からデータ
の要求があるまで待機し、要求があれば処理610へ進
む。処理610では、処理607において保存したデー
タをデータ結合処理へ出力し、その後、処理を終了す
る。
【0021】次に、データ結合処理の例を説明する。図
1のデータ結合処理102では複数のデータ出力処理か
ら出力された表形式のデータを入力し、これらの行を連
結し、1つの表形式のデータとして出力する。データ出
力処理とデータ結合処理の間のデータの受渡しは、計算
機のメモリ上で行うか、または、ファイルを介して行う
か、または通信路を介して行う。従来のリレーショナル
データベースにおけるジョイン演算、ジョイン問い合わ
せでは、結合の対象となるデータはデータベースに格納
されたテーブル、ビュー、スナップショットだが、本実
施例のデータ結合処理においては、メモリ経由、または
ファイル経由、または通信路経由でデータ出力処理から
データ結合処理へ入力できさえすれば良く、どこに格納
されているかを問わない。
【0022】前述のデータ出力処理の説明の通り、デー
タ出力処理ではそれぞれ独自のデータ処理を行う。デー
タ結合処理では、これらのデータ出力処理の中から、必
要なものを選択し、データを受け取る。入力データの、
どの行とどの行を連結するかは「連結キー」にしたがっ
て決定される。連係キーはデータ結合処理に入力された
表形式のデータの1つ1つについて任意に指定された単
数または複数の列である。データ結合処理では、連結キ
ーの値が同一である行同士を連結する。図1の例では
「製品ID」が連結キーである。すなわち、2つの入力
テーブルの中で、同一の製品IDを持つ行を連結してい
る。例えば、製品IDが「A001」である2つの行が連結
され、1つの行として出力テーブル105に格納されて
いる。この場合、同一の製品IDを持つ行が1つの入力
テーブル中に複数存在してはならない。そのような場合
はエラーとして、該当する製品IDを持つ行について連
結を行わないか、または、どの行の連結をも行わない。
【0023】出力テーブルの列の構成は、2つの入力テ
ーブルの列の合併になる。また、製品ID「A004」のよ
うに、2つの入力テーブルの一方にしか現れないレコー
ドについては、2通りの連結方法が考えられる。第1の
方法は、一方にしか現れないレコードは出力テーブルに
含めないというものである。つまり、全ての入力テーブ
ルに共通して現れるものだけを出力するというもので、
この方法を「共通型」と呼ぶことにする。第2の方法
は、一方にしか現れないレコードも出力テーブルに含め
るが、入力に現れない列は空白とするというものであ
る。この方法を「合併型」と呼ぶことにする。特に、合
併型の結合は従来のリレーショナルデータベースのジョ
イン演算には無い結合方法である。図1の例は「合併
型」で、製品ID「A004」については第1の入力テーブ
ルには現れず、「膜厚」、「寸法」、「製品検査」など
の情報が欠落しており、そのため、出力テーブルではこ
れらの列は空白となっている。
【0024】データ結合処理102のフローチャートを
図7に示す。まず、処理701において、データ結合の
対象となるデータ出力処理を選択する。選択されたデー
タ出力処理の数を N とする。処理702において、選
択したデータ出力処理へ接続する。処理703におい
て、各データ出力処理について、指定されている連結キ
ーでデータをソートし、データの読み取り位置をデータ
の先頭に設定する。処理704では、結合結果を格納す
るデータ領域を取り、その内容を空に初期設定し、それ
を現在の結合結果とする。処理705では、カウンタ i
の値を 1 に初期設定する。
【0025】処理706では、カウンタ i の値と選択
したデータ出力処理の数 N を比較し、 i の方が大きい
場合は全ての処理を終了し、そうでない場合は処理70
7へ進む。処理707では、 i 番目のデータ出力処理
からデータを1行取り出し、このデータ出力処理のデー
タ読み取り位置を1行分進める。処理708では、処理
707においてデータが取り出せたかどうかを判定し、
データが取り出せた場合は処理709へ進み、取り出せ
なかった場合は処理719へ進む。処理709では、処
理707で取り出したデータの連結キーの値を保持して
おく。処理710では、カウンタ j の値を i+1 に初期
設定する。
【0026】処理711では、カウンタ j の値と選択
したデータ出力処理の数 N を比較し、 j の方が大きい
場合は処理718へ進み、そうでない場合は処理712
へ進む。処理712では、 j 番目のデータ出力処理の
現在の読み取り位置を起点とし、処理709で保持して
おいた連結キーと同じ値を持つ行を検索する。処理71
3では、処理712の検索においてデータが見つかった
かどうかを判定し、見つかった場合は処理716へ進
み、見つからなかった場合は処理714へ進む。処理7
14では、結合方法として合併型が指定されているかど
うかを判定し、合併型が指定されている場合は処理71
5へ進み、そうでない場合は全ての処理を終了する。処
理715では、 j 番目のデータ出力処理におけるデー
タの列数と同じ数の空白列を持つ行を現在の結合結果に
結合し、その結果を改めて現在の結合結果とする。処理
716では、処理712で検索された行を現在の結合結
果に結合し、その結果を改めて現在の結合結果とする。
処理717では、カウンタ jの値を 1 だけ増やし、処
理711へ戻る。
【0027】処理718では、現在の結合結果を出力
し、処理704へ戻る。処理719では、結合方法とし
て合併型が指定されているかどうかを判定し、合併型が
指定されている場合は処理720へ進み、そうでない場
合は全ての処理を終了する。処理720では、 i 番目
のデータ出力処理におけるデータの列数と同じ数の空白
列を持つ行を現在の結合結果に結合し、その結果を改め
て現在の結合結果とする。処理721ではカウンタ i
の値を 1 だけ増やし、処理706へ戻る。
【0028】図1には複数のデータ出力処理101が存
在するが、その中でデータ結合処理102における結合
の対象となるデータ出力処理の指定や、連結キーなどの
指定は結合設定処理106によってデータ結合処理10
2へ指示される。結合設定処理106は、データ結合処
理102からの問い合わせに対して、これらの指示を伝
達する。データ結合処理102は、結合設定処理106
に対して問い合わせることにより、これらの指示を受け
取る。結合設定処理106からはデータ結合処理の識別
名、結合の対象となるデータ出力処理の指定、データ結
合の際に用いられる連結キーと連結方法(合併型、共通
型のどちらか)がデータ結合処理102へ指示される。
データ結合処理の識別名は、外部のシステムやプログラ
ムがデータ結合処理の出力結果を参照する際に用いられ
る。図1には3つのデータ出力処理が存在するが、この
うち、2つだけがデータ結合処理とつながっている。ど
のデータ出力処理を用いるかは、結合設定処理106か
らの指示にしたがって決定される。結合設定処理106
からの指示に含まれていないデータ出力処理は、存在し
ていても使用されない。
【0029】結合設定処理106からデータ結合処理1
02へ指示されるこれらの内容を、使用者は「一括
型」、「対話型」といった、種々のユーザインターフェ
ースを介して操作することができる。図1における結合
設定処理106と設定ファイル107の組合せが一括型
のユーザインターフェースの例である。これは、文字に
よって記述された設定ファイルを用いる方法である。使
用者はデータ結合処理の識別名、結合の対象となるデー
タ出力処理の指定、データ結合の際に用いられる連結キ
ーと連結方法をあらかじめ設定ファイル107内に記述
しておき、これを結合設定処理106へ渡す。結合設定
処理106では設定ファイル107の内容を読み込み、
それにしたがってデータ結合処理102へ指示を出す。
【0030】対話型ユーザインターフェース108の例
を図8から図11に示す。これは、前述の一括型ユーザ
インターフェースにおける設定ファイル107の内容を
使用者が対話的に入力し、結合設定処理106へ渡すた
めのインターフェースである。図8から図11は順に計
算機の画面上に表示され、使用者は計算機の入力装置を
介して操作を行なう。
【0031】図8には、現在データ結合の対象となって
いるデータ出力処理の名前801と、データ結合の対象
となっている列名802、また、データ結合対象の候補
だが、まだ用いられてはいないデータ出力処理の名前8
03を表示している。使用者は、候補となっているデー
タ出力処理の中から、データ結合に加えたいものがある
場合、該当するデータ出力処理の名前を画面上で選択す
る。図8では、「DATA-B」を選択している。そして、追
加ボタン804を押す。これにより画面表示は図9へ遷
移する。
【0032】図9には、図8と同様のデータ結合の対象
となっている列名901と、図8において使用者が選択
したデータ出力処理の候補(DATA-B)が持つ列名902
を表示している。ここで、使用者はデータ結合の対象と
なっている列名901と、選択したデータ出力処理の候
補の列名902のそれぞれについて、連結キーを指定す
る。図9では、ともに「製品ID」を指定している。そ
して、決定ボタン903を押す。これにより画面は図1
0へ遷移する。
【0033】図10は図8と同様の画面だが、図8、図
9においてデータ出力処理「DATA-B」をデータ結合の対
象に追加した結果が反映され、データ結合の対象となっ
ているデータ出力処理の名前1001と、データ結合の
対象となっている列名1002にデータ出力処理「DATA
-B」の分が追加され、候補のデータ出力処理の名前10
03からは「DATA-B」の名前がなくなっている。データ
結合の追加処理が全て終了し、この結果を保存したい場
合は、使用者は保存ボタン1004を押す。これにより
画面は図11へ遷移する。
【0034】図11はデータ結合処理の識別名を入力す
る画面である。使用者は任意の名前を入力することがで
きる。図11の例では、「DJ1」という名前が入力され
ている。識別名の入力後、使用者が保存ボタン1101
を押すことにより、これまでのデータ結合の追加処理の
結果と識別名が確定し、保存される。
【0035】本発明の実施形態の第2の例を説明する。
本実施例は、第1の実施例にデータ出力処理を追加、削
除する処理を追加したものである。図12に本実施例の
構成を示す。データ出力処理1201は、データ出力プ
ログラム1202を計算機上で実行することによって実
現される。単数または複数のデータ出力プログラム12
02は候補集合1203として保存されている。候補集
合1203は計算機のメモリ上、または二次記憶上に保
存されている。これらのデータ出力プログラム1202
は必要に応じて起動処理1204によって起動される。
それぞれのデータ出力プログラム1202が入力するデ
ータソースの指定などの動作設定は動作設定処理120
5によって起動処理1204へ指示され、データ出力プ
ログラム1202の起動時に反映される。使用者は操作
処理1206において、新たなデータ出力プログラムを
候補集合1203へ追加したり、データ出力プログラム
を候補集合1203から削除することができる。
【0036】図13に動作設定処理1205によって起
動処理1204へ指示される内容を示す。動作設定内容
1301には、データ出力プログラム名と、そのプログ
ラムに関するデータソースの指定、動作パラメータの指
定が含まれる。データソースを指定する形式は、すべて
のデータ出力プログラムについてほぼ同じであるが、デ
ータソースの数はデータ出力プログラムによって異な
る。なお、特殊な場合として、データソースからデータ
を入力しないデータ出力プログラム(内部でデータを生
成するデータ出力プログラム)もあり得る。図13の例
では、「データ検索」という名前のデータ出力プログラ
ムに関して、データソースとして「製品検査情報」を指
定している。また、動作パラメータとして「検索キー」
と「出力列」が指定されている。まず、検索キーとして
「製品ID="A*"」が指定されている。これは、入力さ
れたデータの中から、「A」から始まる製品IDを持つ
行を検索することを意味している。したがって、出力結
果1303には、入力データである製品検査情報130
2の中で「A001」、「A002」、「A003」といった「A」
から始まる製品IDを持つ行だけが含まれている。ま
た、出力列としては「製品ID」、「膜厚」、「寸
法」、「製品検査」が指定されている。これは、入力デ
ータである製品検査情報1302の中で出力結果130
3に含まれる列を指定している。
【0037】起動処理1204は、動作設定処理120
5からの指示を読み込み、指定されているプログラム名
にしたがって該当するデータ出力プログラムを候補集合
1203の中から探し出す。そして、該当するデータ出
力プログラムのコピーを作成し、動作設定処理1205
から指示されたデータソース名、動作パラメータをデー
タ出力プログラムのコピーに付加して、プログラムを起
動する。こうして起動されたプログラムがデータ出力処
理を行う。このように、起動処理1204ではデータ出
力プログラムのコピーを作成し、それを起動するので、
同一のデータ出力プログラムのコピーを複数作成し、そ
れぞれに異なるデータソース名、動作パラメータを付加
し、別のデータ出力処理として同時に動作させることも
可能である。
【0038】起動処理1204の処理のフローチャート
を図14に示す。まず、処理1401において動作設定
を動作設定処理1205から読み込む。処理1402で
は、読み込んだ動作設定にしたがって、次に起動すべき
プログラムの指定があるかどうかを調べる。起動すべき
プログラムの指定がある場合は処理1403へ進む。処
理1403では、指定されたプログラムを候補集合12
03から探す。処理1404では、指定されたプログラ
ムが見つかったかどうかを調べ、見つかれば処理140
5へ進み、見つからなければこのプログラムの処理を終
わり、処理1402へ進む。処理1405では、指定さ
れたプログラムのコピーを作成する。処理1406で
は、このコピーに、指定された動作設定を付与する。処
理1407では、このコピーを起動し、このプログラム
の処理を終わり、処理1402へ戻る。処理1402で
は、次に起動すべきプログラムの指定がない場合は全て
の処理を終了する。
【0039】図15に操作処理1206を示す。使用者
は操作処理1206によって候補集合1203に新たな
データ出力プログラムを追加したり、候補集合1203
の中のデータ出力プログラムを削除することができる。
操作処理では表示画面1501、入力装置1502、プ
ログラム入力手段1503を用いる。これらは計算機の
入力装置、表示装置を利用する。表示画面1501上に
は候補集合1203に現在含まれているデータ出力プロ
グラム名1504を表示している。使用者は新たなデー
タ出力プログラム1505をプログラム入力手段150
3を介して外部から入力し、入力装置上1502の追加
ボタン1506を押すことにより、新たなデータ出力プ
ログラムを候補集合1203に追加することができる。
また、使用者は画面上に表示されているデータ出力プロ
グラム名の中から任意のものを指定し、入力装置上の削
除ボタン1507を押すことにより、該当するデータ出
力プログラムを候補集合1203から削除することがで
きる。
【0040】本発明の実施形態の第3の例を説明する。
これは、第1の実施例を利用したデータ分析方法であ
る。図16に本実施例の構成を示す。図16中の「デー
タ統合」部1602が第1の実施例に該当する。分析対
象データ1601はデータ統合部1602において加工
される。データ統合部1602の中にはデータ出力、デ
ータ加工等を行なう複数のデータ出力処理が存在する。
これらのデータ出力処理から出力されたデータはデータ
結合処理によって連結され、データ統合部から出力され
る。このデータはデータ分析部1603で分析され、分
析結果1604を得る。データ統合部1602内のデー
タ出力処理には、入力されたデータをそのままの形で出
力するもの1605と、入力されたデータを加工して得
られる二次データを出力するもの1606がある。
【0041】入力データの例を図17に、入力されたデ
ータを加工して得られる二次データの例を図18に示
す。図17に示したデータは工業製品の検査データであ
る。図18に示したデータは、図17の「寸法」データ
について時系列変化の特徴検出を行った結果である。製
品ID「A002」と「A003」の間で寸法値が 10.0 から 2
2.4 へ突発的に上昇したのを検出し、製品ID「A003」
の製品について「突発上昇」というラベルを付与した。
その後、製品ID「A004」と「A005」については寸法値
が徐々に低下しているので、「低下」というラベルを付
与した。時系列変化検出の結果得られた「突発上昇」
「低下」などの情報が二次データである。
【0042】図19に、図17に示した元のデータと図
18に示した二次データの結合結果を示す。図19に示
した結合データを分析した結果の例を図20に示す。こ
れは、製品検査が「FAIL」となった製品の特徴を分析
し、その特徴を if-then ルール形式で表現したもので
ある。第1のルールは「寸法が安定ではない時に FAIL
となる傾向がある」ことを意味している。また、第2の
ルールは「膜厚が小さく、かつ寸法が低下している時に
FAIL となる傾向がある」ことを意味している。特に、
第2のルールは、元データに含まれている「膜厚」の情
報と二次データである「寸法の時系列変化」の情報の組
合せであり、データ結合は、このような元データと二次
データの組合せを分析対象とすることを可能にする。
【0043】
【発明の効果】本発明では、結合の対象となる元のデー
タを出力するデータ出力処理と、これらのデータの結合
を行うデータ結合処理を分離し、データ結合処理におい
て、結合対象となるデータ出力処理の選択を行うように
している。また、データ出力処理の追加、削除が行える
ようにしている。また、データ出力処理とデータ結合処
理の間のデータの受渡しをメモリ経由、またはファイル
経由、または通信路経由で行い、データがどこに格納さ
れているかが問題とならないようにしている。これらに
より、簡単な操作で異種のデータソースから得られるデ
ータに対する種々の演算、データの組合せが可能とな
る。また、これを利用して、元データと二次データを組
み合わせてデータ分析にかけるなどの柔軟で幅広いデー
タ利用方法が可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態の構成図である。
【図2】本発明を実施する計算機の形態である。
【図3】データソースの例である。
【図4】データ出力処理の例のフローチャートである。
【図5】データ出力処理の別の例を示す図である。
【図6】データ出力処理の別の例のフローチャートであ
る。
【図7】データ結合処理の例のフローチャートである。
【図8】結合設定処理の対話型ユーザインターフェース
の第1の説明図である。
【図9】結合設定処理の対話型ユーザインターフェース
の第2の説明図である。
【図10】結合設定処理の対話型ユーザインターフェー
スの第3の説明図である。
【図11】結合設定処理の対話型ユーザインターフェー
スの第4の説明図である。
【図12】本発明の第2の実施形態の構成図である。
【図13】動作設定処理からの指示の内容である。
【図14】起動処理のフローチャートである。
【図15】操作処理の説明図である。
【図16】本発明の第5の実施形態の構成図である。
【図17】入力データの例である。
【図18】二次データの例である。
【図19】元データと二次データの結合結果である。
【図20】分析結果である。
【符号の説明】
101…データ出力処理、 102…データ
結合処理、103…データソースからのデータ、104
…データ出力処理の出力データ、105…データ結合処
理の出力データ、106…結合設定処理、107…一括
型ユーザインターフェース、108…対話型ユーザイン
ターフェース、201…計算機の処理装置、
202…計算機のメモリ、203…計算機の二次記憶、
204…計算機の入力装置、205…計算機
の出力装置、 206…計算機の通信装置、2
07…通信路、 208…外部装
置、1201…データ出力処理、1202…データ出力
プログラム、1203…候補集合、 1204…起
動処理、1205…動作設定処理、1206…操作処
理、 1601…分析対象データ、1602…デー
タ統合部、 1603…データ分析部、1604…分析
結果、1605…入力データをそのまま出力するデータ
出力処理、1606…二次データを出力するデータ出力
処理。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 辻 洋 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内 (72)発明者 伊藤 幸康 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウェア事業部内 Fターム(参考) 5B075 PP13 QR01 QT06 5B082 BA13 GA02 GA03 GC03 GC04

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】処理装置を用いて異種データソースを統合
    する方法において、 表形式のデータを処理して出力する複数のデータ出力処
    理を保持し、 入力装置からの指示に基づいて前記データ出力処理を選
    択し、 前記選択されたデータ出力処理から出力された複数の表
    形式データを入力し、 前記複数の表形式データを結合して1つの表形式のデー
    タとして出力することを特徴とする異種データソース統
    合方法。
  2. 【請求項2】処理装置を用いて異種データソースを統合
    する方法において、 複数のデータ出力処理からなるデータ出力処理の集合を
    保持し、 前記データ出力処理の集合の中から所望の少なくとも一
    つのデータ出力処理を指定するための情報を設定し、 前記指定した情報に基づいて前記データ出力処理を選択
    することを特徴とする異種データソース統合方法。
  3. 【請求項3】前記入力装置からの指示により、前記集合
    に新たなデータ出力処理の追加、あるいは前記集合の中
    からデータ出力処理の削除を行うことを特徴とする請求
    項2記載の異種データソース統合方法。
  4. 【請求項4】前記データ出力処理においてデータをファ
    イルに出力し、 前記データの結合の際に、前記ファイルからデータを読
    み込み、 前記読み込んだデータを結合し、 前記結合の結果を出力することを特徴とする請求項1記
    載の異種データソース統合方法。
  5. 【請求項5】前記データ出力処理においてデータをデー
    タベースのテーブルに保存し、 前記データの結合の際に、前記テーブルを前記データベ
    ースの機能を利用して結合し、 前記結合の結果を前記データベースから読み出して出力
    することを特徴とする請求項1記載の異種データソース
    統合方法。
  6. 【請求項6】処理装置を用いたデータ分析方法におい
    て、 収集されたデータを出力する元データ出力処理と、前記
    収集されたデータを加工して得られるデータを出力する
    二次データ出力処理を保持し、 前記元データ前記二次データとを結合し、 前記結合されたデータを分析することを特徴とする異種
    データソース分析方法。
  7. 【請求項7】処理装置を用いて異種データソースを統合
    する方法を実行するためのプログラムを記憶した計算機
    で読取り可能な記憶媒体であって、前記方法は、 表形式のデータを処理して出力する複数のデータ出力処
    理を保持し、 入力装置からの指示に基づいて前記データ出力処理を選
    択し、 前記選択されたデータ出力処理から出力された複数の表
    形式データを入力し、 前記複数の表形式データを結合して1つの表形式のデー
    タとして出力することを特徴とする記憶媒体。
  8. 【請求項8】異種データソースを統合するシステムにお
    いて、 表形式のデータを処理して出力する複数のデータ出力処
    理を保持する手段、 入力装置からの指示に基づいて前記データ出力処理を選
    択する手段、 前記選択されたデータ出力処理から出力された複数の表
    形式データを入力し、前記複数の表形式データを結合し
    て1つの表形式のデータとして出力する手段を有するこ
    とを特徴とする異種データソース統合システム。
  9. 【請求項9】異種データソースを統合するシステムにお
    いて、 複数のデータ出力処理からなるデータ出力処理の集合を
    保持する手段、 前記データ出力処理の集合の中から所望の少なくとも一
    つのデータ出力処理を指定するための情報を設定する手
    段、 前記指定した情報に基づいて前記データ出力処理を選択
    する手段を有することを特徴とする異種データソース統
    合システム。
JP11099727A 1999-04-07 1999-04-07 異種データソース統合方法 Pending JP2000293414A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11099727A JP2000293414A (ja) 1999-04-07 1999-04-07 異種データソース統合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11099727A JP2000293414A (ja) 1999-04-07 1999-04-07 異種データソース統合方法

Publications (1)

Publication Number Publication Date
JP2000293414A true JP2000293414A (ja) 2000-10-20

Family

ID=14255113

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11099727A Pending JP2000293414A (ja) 1999-04-07 1999-04-07 異種データソース統合方法

Country Status (1)

Country Link
JP (1) JP2000293414A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003167916A (ja) * 2001-11-29 2003-06-13 Casio Comput Co Ltd ファイル処理装置及びプログラム
JP2007179249A (ja) * 2005-12-27 2007-07-12 Kenwood Corp 情報検索装置及びプログラム
WO2010093033A1 (ja) * 2009-02-16 2010-08-19 リプレックス株式会社 情報同期装置
WO2018016001A1 (ja) * 2016-07-19 2018-01-25 株式会社日立製作所 データモデリングシステム、データモデリング方法
JP2018180645A (ja) * 2017-04-04 2018-11-15 富士通株式会社 データ処理プログラム、データ処理方法およびデータ処理装置
KR20190009705A (ko) * 2017-07-19 2019-01-29 누보 피그노네 테크놀로지 에스알엘 데이터베이스 검색 시스템 및 방법
JP2019016173A (ja) * 2017-07-07 2019-01-31 株式会社日立製作所 データ処理方法、データ処理装置、及びデータ処理プログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003167916A (ja) * 2001-11-29 2003-06-13 Casio Comput Co Ltd ファイル処理装置及びプログラム
JP2007179249A (ja) * 2005-12-27 2007-07-12 Kenwood Corp 情報検索装置及びプログラム
WO2010093033A1 (ja) * 2009-02-16 2010-08-19 リプレックス株式会社 情報同期装置
WO2018016001A1 (ja) * 2016-07-19 2018-01-25 株式会社日立製作所 データモデリングシステム、データモデリング方法
JP2018180645A (ja) * 2017-04-04 2018-11-15 富士通株式会社 データ処理プログラム、データ処理方法およびデータ処理装置
JP2019016173A (ja) * 2017-07-07 2019-01-31 株式会社日立製作所 データ処理方法、データ処理装置、及びデータ処理プログラム
KR20190009705A (ko) * 2017-07-19 2019-01-29 누보 피그노네 테크놀로지 에스알엘 데이터베이스 검색 시스템 및 방법
JP2019040598A (ja) * 2017-07-19 2019-03-14 ヌオーヴォ・ピニォーネ・テクノロジー・ソチエタ・レスポンサビリタ・リミタータNuovo Pignone Tecnologie S.R.L. データベース検索システムおよび方法
JP7141270B2 (ja) 2017-07-19 2022-09-22 ヌオーヴォ・ピニォーネ・テクノロジー・ソチエタ・レスポンサビリタ・リミタータ データベース検索システムおよび方法
KR102602483B1 (ko) * 2017-07-19 2023-11-14 누보 피그노네 테크놀로지 에스알엘 데이터베이스 검색 시스템 및 방법

Similar Documents

Publication Publication Date Title
US12164568B2 (en) Tool to build and store a data model and queries for a graph database
US6434554B1 (en) Method for querying a database in which a query statement is issued to a database management system for which data types can be defined
JP3773426B2 (ja) データマイニングにおける前処理方法及び前処理システム
US6915308B1 (en) Method and apparatus for information mining and filtering
USRE48030E1 (en) Computer-implemented system and method for tagged and rectangular data processing
US8086592B2 (en) Apparatus and method for associating unstructured text with structured data
US9703831B2 (en) Contextual display of saved search queries
CN111143370B (zh) 用于分析多个数据表之间关系的方法、设备和计算机可读存储介质
US10031938B2 (en) Determining Boolean logic and operator precedence of query conditions
US20040030706A1 (en) Spatial data portal
US20020178184A1 (en) Software system for biological storytelling
CN101971165A (zh) 数据关系的图形表示
CN102810094A (zh) 报表生成方法及装置
US20160275140A1 (en) Database browsing system and method
JPH0228725A (ja) エキスパートシステムにおける問題認識方式
JPH04237374A (ja) データベース・システム及び分析方法
KR20060015527A (ko) 데이터베이스 장치, 데이터베이스 검색 장치 및 검색 방법
KR20160117965A (ko) NoSQL 모델 생성 방법 및 그 장치
KR20060067812A (ko) 복합 데이터 액세스
JP2000293414A (ja) 異種データソース統合方法
JP2001325276A (ja) 情報処理システム、情報処理方法、コンピュータプログラム、記憶媒体及びプログラム伝送装置
JP2842487B2 (ja) データ編集方式
US8204895B2 (en) Apparatus and method for receiving a report
JP2001265760A (ja) 文書履歴管理装置および文書履歴管理方法
EP1659503B1 (en) A database track history