JP2004110182A - データ変換装置およびデータ変換方法およびデータ変換プログラム - Google Patents

データ変換装置およびデータ変換方法およびデータ変換プログラム Download PDF

Info

Publication number
JP2004110182A
JP2004110182A JP2002268954A JP2002268954A JP2004110182A JP 2004110182 A JP2004110182 A JP 2004110182A JP 2002268954 A JP2002268954 A JP 2002268954A JP 2002268954 A JP2002268954 A JP 2002268954A JP 2004110182 A JP2004110182 A JP 2004110182A
Authority
JP
Japan
Prior art keywords
data
conversion
domain
library
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002268954A
Other languages
English (en)
Inventor
Minoru Furusawa
古澤 実
Nobukazu Tanaka
田中 伸和
Koichi Komatsu
駒津 公一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002268954A priority Critical patent/JP2004110182A/ja
Publication of JP2004110182A publication Critical patent/JP2004110182A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】既存システムでの利用データを、標準化または所望のデータフォーマットに変換処理できるようにする。
【解決手段】ドメイン名、データフォーマット定義、有効値の範囲などのドメイン定義を集めたドメインライブラリ手段11と、あるドメインから別のドメインへのデータ変換をする場合での変換処理の内容を登録することにより、ライブラリ化したデータ変換ライブラリを保持するためのものであり、抽出元と抽出先のドメインの変換パターンと、そのパターンの変換処理を登録したデータ変換ライブラリ12と、データ抽出元からデータ抽出先に対してどの項目名のものはどの項目名に変換するという変換関係を定義してなる項目変換マップ13とを用い、これらライブラリ及びマップという3種類のデータ抽出設計仕様をもとに、データ抽出元とデータ抽出先の項目名のパターンから、データ抽出設計仕様に従ったデータ変換処理を実行するデータ変換手段14とから構成することを特徴とする。
【選択図】  図1

Description

【0001】
【発明の属する技術分野】
本発明は、複数種の既存システムでの利用データを、標準化または所望のデータフォーマットに変換処理できるようにしたデータ変換装置およびデータ変換方法およびデータ変換プログラムに関するものである。
【0002】
【従来の技術】
近年、データウエアハウス(data warehouse;DWH)なる概念が重要視されるようになってきている。データウエアハウスは、データの倉庫という意味であり、企業戦略の立案や意思決定などに役立てるため、組織内の各種データを1カ所に集約する仕組みのことである。
【0003】
すなわち、企業活動を眺めてみると、例えば、製造メーカでは、物を製造する製造部門、製品を販売する販売部門、製造した物をユーザに届ける物流部門などがあるが、それぞれで管理に用いるための情報はこれらの各部門ごとに独自に蓄積して部門内で利用する形態をとっていた。
【0004】
しかし、近年においてはこれら製造、物流、販売など部門ごとに電子データ化して蓄積していた各種データを集めて、それを基に相関分析を行うことで、企業活動に有効活用しようという動きが盛んになってきている。そこで、各部門で蓄積されているデータを集めることになるが、ここで集められるのは集計分析後のデータではなく、例えば、売上伝票のような大量の生データである。そして生データを活用することで、たとえば「ある商品の購入者がほかにどのような商品を欲しがるか」といったようなユーザの消費動向や消費傾向、需要予測などに有効な詳細な情報分析が可能になる。
【0005】
このように、データウエアハウス(DWH)情報共有のシステムは、経営戦略を練る上で極めて重要な役割を果たすことが期待されるシステムであり、従って、このシステムを導入しようとする企業においては、このDWH情報共有システムに、当該企業の各部門の持つ管理用の各種サブシステムのデータを取り込んで統括的に利用するようにしたいという要求が生じることは必然的な成り行きである。
【0006】
しかしながら、異なる複数のサブシステムのデータを統括的に利用するようにするには、様々な壁が立ちはだかる。例えば、コードの不統一性、数値における桁数の不統一性、付与名称の不統一性、日付時刻情報の不統一性、等といった問題である。これは格差部システムを構築したベンダーが異なるからであり、サブシステムは全体の統合的な環境を想定して構築するといったようなことを念頭に置いてシステムを開発することはないからである。
【0007】
従って、サブシステムが例えば、在庫管理や生産管理のシステムであれば、在庫管理システムは物流部門が、そして、生産管理システムは生産部門が構築して運用しているとすれば、両システムではコードの中に製品コードがあったり、工場コードがあったりするが、それらは互いに異なった体系を採用していることもあり、また、製造部門では発売中の商品ばかりでなく、試作品や開発品を手掛けている場合もあって、その場合には試作品や開発品の製品も管理する必要があることから、そのための特別のコードが用いられていることもあるといった状況に対し、物流部門では販売中の製品について主として扱うことから、上記特別なコードはないといった具合に、部署によって内容が大きく異なることがある。
【0008】
ベンダーが異なれば仕様は異なるので、利用するコード体系が統一的にならないわけである。また、コードが最初は6桁で十分と思って構築したとして、その後にその桁数では間に合わなくなったり、統合システムでは統合管理するには桁数が少な過ぎるといったことも多々ある。
【0009】
こうした様々な差違を吸収して統合システムではデータを有益に活用できるようにする必要があるが、その変換はシステム個別に対応させねばならないから、簡単にはいかない。
【0010】
例えば、受け渡しデータの項目の並び順と、項目の長さをあらかじめ取り決める必要をなくした項目データ受け渡し装置が知られているが、これは、複数の項目の名称にそれぞれ対応して複数の項目データが書かれた帳票を入力側の帳票とした場合に、複数の項目コードと複数の項目名称をそれぞれ対応させて登録している辞書を用意し、前記帳票の項目データにフィールド番号と項目デ−タ長とを割り当て、前記入力側の帳票と前記辞書から項目名称をキーとして、この項目名称に対応するフィールド番号と項目コードと項目データ長とを読み出して、テーブル上に書き込むようにし、このテーブルから項目コードと項目データ長を読み出し、前記帳票から対応する項目データを読み出し、項目コードと項目データ長と項目データを組み合わせて出力することで、送り手側で、項目デ−タ長と項目の順序を自由に設定することができるようにするという程度の技術である(例えば、特許文献1参照)。
【0011】
しかし、これば、処理ユニット間で項目データを受け渡す場合に、受け渡しデータについて項目データの並び順を取り決めておかねばならないという問題を解消する目的で受け渡しデータの項目の並び順と、項目の長さをあらかじめ取り決める必要をなくした技術であり、それぞれ独自の異なるデータ仕様となっている各種サブシステムのデータを取り込んで統括的に利用できるようにするための変換技術にはほど遠い。
【0012】
【特許文献1】
特開平05−6381号公報(段落番号[0008]〜[0023]段落および図1、図2、図4、図5、図6)
【0013】
【発明が解決しようとする課題】
データウエアハウス(DWH)情報共有のシステムは、経営戦略を練る上で極めて重要な役割を果たすことが期待されるシステムであり、従って、このシステムを導入しようとする企業においては、このDWH情報共有システムに、当該企業の各部門の持つ管理用の各種サブシステムのデータを取り込んで統括的に利用するようにしたいという要求がある。
【0014】
しかしながら、異なる複数のサブシステムのデータを統括的に利用するようにするには、様々な障壁がある。
【0015】
すなわち、各部署内で独自に運用しているデータ管理システム(サブシステム)は、その導入の成り立ちが、自部署での業務を支援するという点にあり、そのため、自部署での業務支援を念頭において構築したローカル色が強いデータ管理のシステムとなっている。
【0016】
そのため、データの形式をみてみると他部署の管理システムとの互換性を考慮したものとなっていることは稀であり、従って、他のシステムで各部署のサブシステムのデータを吸い上げて利用しようとした場合、データを変換して自己のシステムに適合するようにしなければならない。これは容易ではなく、従来は、各サブシステム毎に変換先の形式に合わせるようにした変換処理ソフトウエアを用意してサブシステム個別に変換処理する必要があった。
【0017】
しかし、個別にこのような変換処理ソフトウエアを用意することは、その開発に要する時間や工数などを考えると時間的にも、また経済的にも負担が重いものとなるから、大規模な組織では、各部署のデータを取り込んで活用しようとした場合、その実現は極めて困難なものとなる。
【0018】
そこで、この発明の目的とするところは、各部署でデータ管理のためのために構築されて利用されている管理システムのデータを標準形式など所望の形式のデータに変換できるようにしたデータ変換システムおよびデータ変換方法およびデータ変換プログラムを提供することにある。
【0019】
【課題を解決するための手段】
上記目的を達成するため、本発明は次のように構成する。すなわち、データ管理する既存システムで扱うデータであってその既存システムでの仕様に基づくドメイン名、データフォーマット定義、有効値の範囲などのドメイン定義に従ったデータを抽出元のデータとし、この抽出元のデータを、別のドメイン定義に従ったデータに変換するための変換装置として、
あるドメインから別のあるドメインへのデータ変換をする場合での変換処理の内容を定めたデータ変換ライブラリであって、抽出元‐抽出先間のドメインの変換パターンと、そのパターンでの変換処理内容を登録したデータ変換ライブラリを保持するデータ変換ライブラリ保持手段と、
データ抽出元からデータ抽出先に対して変換対象となる項目の変換関係を定義した項目変換マップを保持する項目変換マップ保持手段と、
これら保持手段の保持するデータ変換ライブラリおよび項目変換マップを参照し、これらデータ変換ライブラリおよび項目変換マップで規定される変換関係および変換処理内容に従って前記データ抽出元のデータをデータ変換処理することによりデータ抽出元のデータをデータ抽出先の仕様に合わせるべくデータ変換するデータ変換処理手段とを備えて構成する。
【0020】
このような構成の本システムは、データ変換ライブラリ保持手段と項目変換マップ保持手段とを備えており、データ変換ライブラリ保持手段には、あるドメインから別のあるドメインへのデータ変換をする場合での変換処理の内容を定めたデータ変換ライブラリであって、抽出元‐抽出先のドメイン間のドメイン変換パターンと、そのパターンの変換処理内容を登録したデータ変換ライブラリを保持させ、項目変換マップ保持手段には、データ抽出元からデータ抽出先に対して、どの項目名(項目名)のものはどの項目名(項目名)に変換するといった変換対象となる項目の変換関係を定義した項目変換マップを保持させてあり、データ変換処理手段は、これら保持手段の保持するデータ変換ライブラリおよび項目変換マップを参照し、これらデータ変換ライブラリおよび項目変換マップで規定される変換関係および変換処理内容に従って前記データ抽出元のデータを、データ変換処理する。そして、このデータ変換処理することによってデータ抽出元のデータをデータ抽出先の仕様に合うよう変換することができる。
【0021】
故に、この発明によれば、例えば、各部署でデータ管理のために構築されて利用されている管理システムのデータと云ったローカルシステム(サブシステム)のデータを統合して利用したい場合などように、統合先の形式である標準形式など所望の形式のデータに変換できるようになるデータ変換システムおよびデータ変換方法およびデータ変換プログラムを提供することができる。
【0022】
しかも、本発明によれば、データ抽出先のデータをデータ抽出先の仕様に合うよう変換するに当たって、データ変換ライブラリと項目変換マップを用意すれば良く、手軽にデータ変換できる仕組みを提供できる。
【0023】
また、本発明は、データ管理する既存システムで扱うデータであってその既存システムでの仕様に基づくドメイン名、データフォーマット定義、有効値の範囲などのドメイン定義に従ったデータを抽出元のデータとし、この抽出元のデータを、別のドメイン定義に従ったデータに変換するための変換装置として、
前記仕様別のドメイン名およびドメイン定義を集めたドメインライブラリを保持するドメインライブラリ保持手段と、
あるドメインから別のあるドメインへのデータ変換をする場合での変換処理の内容を定めたデータ変換ライブラリであって、抽出元‐抽出先間のドメインの変換パターンと、そのパターンでの変換処理内容を登録したデータ変換ライブラリを保持するデータ変換ライブラリ保持手段と、
データ抽出元からデータ抽出先に対して変換対象となる項目の変換関係を定義した項目変換マップを保持する項目変換マップ保持手段と、
前記データ抽出元のデータを取り込み、区分してドメインライブラリ保持手段の保持するドメインライブラリと照合してこのライブラリの登録情報に該当するか否かをチェックすると共に、該当する場合には前記データ変換ライブラリ保持手段の保持するデータ変換ライブラリおよび項目変換マップ保持手段保持する項目変換マップを参照し、これらデータ変換ライブラリおよび項目変換マップで規定される変換関係および変換処理内容に従って前記データ抽出元のデータをデータ変換処理することによりデータ抽出元のデータをデータ抽出先の仕様に合わせるべくデータ変換するデータ変換処理手段とを備えたことを特徴とする。
【0024】
このような構成の本システムは、ドメインライブラリ保持手段とデータ変換ライブラリ保持手段と項目変換マップ保持手段とを備えており、ドメインライブラリ保持手段には、前記仕様別のドメイン名およびドメイン定義を集めたドメインライブラリを保持させ、データ変換ライブラリ保持手段には、あるドメインから別のあるドメインへのデータ変換をする場合での変換処理の内容を定めたデータ変換ライブラリであって、抽出元‐抽出先のドメイン間のドメイン変換パターンと、そのパターンの変換処理内容を登録したデータ変換ライブラリを保持させ、項目変換マップ保持手段には、データ抽出元からデータ抽出先に対して、どの項目名(項目名)のものはどの項目名(項目名)に変換するといった変換対象となる項目の変換関係を定義した項目変換マップを保持させてあり、データ変換処理手段は、前記データ抽出元のデータを取り込み、区分して前記ドメインライブラリと照合し、前記区分したデータがこのライブラリの登録情報に該当するか否かをチェックして該当する場合には前記区分したデータに対して、前記データ変換ライブラリおよび項目変換マップを参照し、これらデータ変換ライブラリおよび項目変換マップで規定される変換関係および変換処理内容に従ってデータ変換処理する。このデータ変換処理の結果、データ抽出元のデータはデータ抽出先の仕様に合うよう変換される。
【0025】
故に、この発明によれば、例えば、各部署でデータ管理のために構築されて利用されている管理システムのデータと云ったローカルシステム(サブシステム)のデータを統合して利用したい場合などように、統合先の形式である標準形式など所望の形式のデータに変換できるようになるデータ変換システムおよびデータ変換方法およびデータ変換プログラムを提供することができる。
【0026】
しかも、本発明によれば、データ抽出先のデータをデータ抽出先の仕様に合うよう変換するに当たって、データ変換ライブラリと項目変換マップを用意すれば良く、手軽にデータ変換できる仕組みを提供できる。
【0027】
【発明の実施の形態】
本発明は、電子データを管理する複数の既存システムから電子データを抽出し、その抽出データを所望のデータ形式に容易に変換することができるようにして、データウエアハウスへの適用を行い易くしたデータ変換技術を提供するもので、ドメイン名、データフォーマット定義、有効値の範囲などのドメイン定義を集めたドメインライブラリと、あるドメインから別のドメインへのデータ変換をする場合での変換処理の内容を登録することにより、ライブラリ化したデータ変換ライブラリを保持するためのものであり、抽出元と抽出先のドメインの変換パターンと、そのパターンの変換処理を登録したデータ変換ライブラリと、データ抽出元からデータ抽出先に対してどの項目名のものはどの項目名に変換するという変換関係を定義してなる項目変換マップとを用い、これらライブラリ及びマップという3種類のデータ抽出設計仕様をもとに、データ抽出元とデータ抽出先の項目名のパターンから、データ抽出設計仕様に従った最適なデータ変換処理を選択して実行することを特徴とするもので、以下、本発明の実施の形態について図面を参照して説明する。
【0028】
<システムの構成例>
本システムの一例としての機能構成図を図1に示す。
【0029】
図1において、SUB1,〜SUBnはそれぞれサブシステムであって、既存のデータ管理システムであり、例えば、在庫管理システムであったり、生産管理システムであったり、データベースシステムであったりするなど、データ統合したい対象としての電子データを持つ任意のシステムである。これら既存のサブシステムSUB1,〜SUBnは、それを導入した部署での業務支援の目的で構築してあるシステムであるので、それぞれが異なるベンダーにより、独自に開発されているなど、導入部署での業務範囲に密着するローカル色の強いシステムであり、項目や形式などを含め、データの構成に対しては、全体を意識しての体系的な共通性は意識していないシステムとなっている。従って、まちまちのデータ体系を持っている。
【0030】
10は本発明の情報共有システムであって、前記既存のサブシステムSUB1,〜SUBnのデータを取り込んで統合化処理し、活用するための統合化データベースシステムである。
【0031】
この情報共有システム10は、コンピュータシステムにより実現されるものであって、ドメインライブラリ保持部11、データ変換ライブラリ保持部12、項目変換マップ保持部13、データ抽出処理部14、データウエアハウス15からなる。
【0032】
情報共有システム10の構成要素であるドメインライブラリ保持部11およびデータ変換ライブラリ保持部12および項目変換マップ保持部13は情報共有システム10の有する記憶装置上に保持されて用意される。
【0033】
これらのうち、ドメインライブラリ保持部11は、ドメイン名、データフォーマット定義、有効値の範囲などのドメイン定義を集めたライブライリを保持するためのものであって、ライブラリはサブシステム別に区別して用意する。ここで、ドメイン(domain)とは、分野や範囲を示すものであって、データの持つ各項目に関する「データ定義」、「有効値の範囲・集合の仕様」を定義したものであり、“ドメイン名”、“ドメイン定義”、“フォーマット定義”、“有効値の範囲”からなる。
【0034】
ドメインライブラリの構築は、後述するドメインの洗い出しの処理により抽出元のデータについて洗い出して得たドメインを蓄積し、これに不足する定義や有効値範囲などをユーザ(またはプログラマオペレータ等)が記入することにより、完成させる。“ドメイン名”、“ドメイン定義”、“フォーマット定義”、“有効値の範囲”等の情報は対象のサブシステムSUB1,〜SUBnそれぞれの仕様書やマニュアルなどからも得ることができ、これらを元に構築することもできる。
【0035】
上記データ変換ライブラリ保持部12は、あるドメイン名のドメインから別のあるドメイン名のドメインへのデータ変換をする場合での変換処理の内容をライブラリ化したデータ変換ライブラリを保持するためのものであり、抽出元と抽出先のドメインの変換パターンと、そのパターンの変換処理を登録したものである。このデータ変換ライブラリを構築するに必要な基礎となる情報は、前記ドメインライブラリの情報を参照したり、あるいは、前記ドメインライブラリや、対象のサブシステムSUB1,〜SUBnそれぞれの仕様書やマニュアル、本発明の情報共有システム10において統合化のための標準仕様として用意するドメインに関する情報などから得ることができ、これらを元に構築する。
【0036】
前記項目変換マップ保持部13は、“ドメイン名”を含めたデータ抽出元とデータ抽出先の使用する項目名を定義し、データ抽出元からデータ抽出先へどの項目名のものがどの項目名に変換されるのかを示した情報である項目マッピング情報を定義したもの(マップ)を保持したものである。図2に項目名の定義例を示す。この例は、“製品コード”という“項目(=製品)+ドメイン名(=コード)”からなる項目名を持つものは“試作製品コード”(項目(=試作製品)+ドメイン名(=コード))からなる項目名のものと“量産製品コード”(項目(=量産製品)+ドメイン名(=コード))からなる項目名のものに対応し、“時間”という“項目(=時間)+ドメイン名(=時間)”からなる項目名を持つものは“登録年月日”(項目(=登録年月日)+ドメイン名(=年月日))からなる項目名のものと“受注日時”(項目(=受注日時)+ドメイン名(=日時))からなる項目名のものに対応するということを示したものである。
【0037】
項目変換マップを構築するに必要な基礎となる情報は、前記ドメインライブラリの情報を参照するか、あるいは前記ドメインライブラリや、対象のサブシステムSUB1,〜SUBnそれぞれの仕様書やマニュアル、本発明の情報共有システム10において統合化のための標準仕様として用意するドメインに関する情報などから得ることができ、これらを元にマップを構築する。
【0038】
また、データ抽出処理部14は抽出元のデータからドメイン洗い出し処理やライブラリ構築をしたり、また、抽出元のデータについて統合化用に標準形式に適合するようにデータ変換処理をするといった各種処理を実行するためデータ処理エンジンであって、データ変換処理については、ドメインライブラリ保持部11、データ変換ライブラリ保持部12、項目変換マップ保持部13によって与えられるドメインライブラリ、データ変換ライブラリおよび項目変換マップの3種のデータ抽出設計仕様を基に、抽出元と抽出先の項目名のパターンから、最適なデータ変換処理を選択してデータ変換処理を実行するように構成している。このようなデータ抽出処理部14として機能は、例えばコンピュータプログラムにより実現され、このプログラムを情報共有システム10を構成しているコンピュータシステムのプロセッサに実行させることでデータ処理エンジンとしての役割を果たせるようにしている
また、前記データウエアハウス(DWH)15は、統合して得たデータをデータベース化して保持するためのもので、データ抽出処理部14が抽出元データについてデータ変換して出力した標準化形式のデータを保持する装置であり、このデータを企業戦略の立案や意思決定などに役立てるため、組織内の各種データを1カ所に集約して統合してなるデータベースあるいは分析システムである。20は前記情報共有システム10に接続されたパソコンなどによるインテリジェント端末である。
【0039】
なお、データ抽出処理部14による前記データ変換処理は、サブシステムテムSUB1〜SUBnから取り込んだデータに対しての(1)入力時のフォーマットと値チェック、(2)フォーマット変換、(3)値変換、そして、(4)変換済みデータに対する出力時のフォーマットと値チェックの4種からなり、(1)および(4)でのチェックで例外となったデータは、エラーデータとしてインテリジェント端末20に出力してオペレータに知らせると共に、変換処理を終了するようにする。
【0040】
また、データ変換ライブラリもドメインライブラリと同様に、ドメインの変換パターンの階層構造を持ち、親子関係を持つドメインのうち、子ドメインの変換パターンは、親ドメインの変換パターンの(1)〜(4)の処理を継承するようにしてある(図8(a)参照)。具体的には例えば、図8(b)の如きであり、親ドメインの変換パターンが「製品コード:CHAR(7)、製品分類コード:CHAR(2)、工場コード:CHAR(4)、部署コード:CHAR(4)」(但し、この例の場合、“CHAR”はキャラクタを意味し、()内の数字は桁数を示す)であれば、子ドメインでは親ドメインである“コード:CHAR(x)”のデータフォーマット定義を継承するものとする。
【0041】
<システムの動作例>
このような構成の本システムは、統合化対象となったデータ、例えば、サブシステムSUB1〜SUBnに蓄積されている管理データを統合化対象とした場合には、これらサブシステムSUB1〜SUBnに蓄積されている管理データを情報共有システム10での標準化形式にデータ変換することになるが、そのためには、情報共有システム10は、まずはじめに、これらサブシステムSUB1〜SUBnからデータを取り込む。そして、データ抽出処理部14では、このサブシステムテムSUB1〜SUBnから取り込んだデータに対して、サブシステム別にそれぞれ次の処理を行う。
【0042】
すなわち、上記(1)の処理である入力時のフォーマットと値チェックをする。どのようなデータ形式でどのような値のデータとなっているかを調べるためである。
【0043】
ここではまず項目のドメイン洗い出しを行う。データ抽出元のデータ定義は既存システム固有の定義がなされており、統合システムで用いるドメインの形式には定義はされていないため、抽出元のデータ項目が統合システムではどのドメインに属するかを調べるために、洗い出す必要があるためである(分析)。
【0044】
項目の洗い出しには2つの方式を段階的に使用する。第1段階では、項目名からドメインを洗い出すようにし(図3の例)(A方式の適用)、第2段階ではその項目のデータをいくつかサンプルとして抽出してその抽出したデータを元にどのようなドメインかを導き出すようにする(図4の例)(B方式の適用)のである。
【0045】
名称から洗い出す方式は次のようにして行う。
【0046】
・(A方式) これは項目名称から洗い出す方式であるが、これは文章解析の手法を用いる。具体的には、形態素解析などを用いて、項目名称を単語に分解する。そして、項目の末尾の単語から順にグループ化して、ドメインを洗い出す。
【0047】
図3に示すように、例えば、サブシステムテムSUB1から取り込んだデータが項目として“試作製品コード”(試作品として付与した製品コード),“工場コード”(製造工場コード),“製品カナ名”(その製品のカタカナ表記による名称),“更新日付”(更新した日付),“購入時単価”(購入時点での単価で時間情報を含む形式),“出荷時単価”(出荷時単価で時間情報を含む形式)と云うような内容と形式を持つフォーマットで記録されているデータであったとする。
【0048】
サブシステムテムSUB1でのその記録フォーマットはサブシステムSUB1の仕様としてそのサブシステムSUB1用の仕様書またはマニュアルに定義されているので、その情報を基に、“試作製品コード”,“工場コード”,“製品カナ名”,“更新日付”,“購入時単価”,“出荷時単価”の各項目要素に区切り、そして、これを形態素解析などにより、単語や数値列に分解する。
【0049】
その結果、“試作製品コード”は、“試作|製品|コード”の形式、すなわち、“試作”、“製品”、“コード”に分解され、“試作”、“製品”、“コード”に分けられることが判明する。但し、“|”は区切りマークを示している。
【0050】
同様に“工場コード” は“工場”と “コード”に分解されて “工場|コード”であることが判明し、“製品カナ名”は“製品”と“カナ”と “名”に分解されて“製品|カナ|名”であることが判明し、“更新日付”は、“更新”と“日付”とに分解されて“更新|日付” であることが判明し、“購入時単価”は、“購入”と“時”と“単価”とに分解されて“購入|時|単価”であることが判明し、“出荷時単価”は、 “出荷”と“時”と“単価”とに分解されて“出荷|時|単価” であることが判明する。
【0051】
このことから、“試作|製品|コード”と “工場|コード” からはドメインとして“コード”が、“製品|カナ|名”からはドメインとして“名”が、“更新|日付”,“購入|時|単価”,“出荷|時|単価”からはドメインとして“日付”と“単価”が抽出されることになり、これによって、サブシステムテムSUB1用としては“コード”、“名”、“日付” 、“単価”の4種類のドメインが抽出されることとなる。
【0052】
・(B方式) 上述したA方式での処理の実施後に、B方式を実施する。すなわち、一例として“日付”や“単価”のデータ形式を考えてみると、これらは“日付”の場合では「西暦年・月・日」の形態、「西暦下二桁年・月・日」の形態、「日・月・西暦年」の形態、「日・月(英名)・西暦年号」の形態、「元号年・月・日」の形態等様々なものがあり、また、“単価”であれば、その「桁数」、「円通貨」表示の形態、「ドル通貨」表示の形態、「ユーロ通貨」表示の形態と云ったようにこれもまた様々である。
【0053】
このようなまちまちの形式となる部分の形態を、特定するといった処理であり、B方式での処理においては、ドメインについてのサンプルデータを抽出し、この抽出したデータについて共通のデータ定義がされているか否かを確認し、データ定義が異なる場合は、より具体化されたドメインに分けて細分化すると云った処理を行う。
【0054】
たとえば、“日付”というドメインを考えてみる。
“日付” として例えば、 ‘20010512’, ‘200010101’,… , ‘20010513’というようなサンプルデータが抽出されたとすると、これは西暦年号月日の形式と推測できるから、この場合、ドメインを「“日付(YYYYMMDD)”の形態を持つ」と認定し、 そのドメインについては「“日付(YYYYMMDD)”型を持つドメイン」としてドメインライブラリ保持部11に登録する。また、“日付” として 100040, 1000842, 100041,… というようなデータが抽出されたとすると、これは「データベースの“DATE型” の形態を持つものに該当する」と推測できるから、この場合、当該“日付”ドメインを「“日付(DATE)型” を持つドメイン」 として認定し、サブシステムテムSUB1 における「“日付”は“日付(DATE)型”のドメイン」としてドメインライブラリ保持部11に登録する。図4に示す如きである。
【0055】
このようにして、サブシステムテムSUB1用として洗い出したドメインは、サブシステムテムSUB1用としてドメインライブラリ保持部11に登録し、サブシステムテムSUBn用として洗い出したドメインは、サブシステムテムSUBn用としてドメインライブラリ保持部11に登録するが、それに当たって、項目は項目名の末尾にドメイン名をつけてドメインライブラリの項目名とし、このドメインライブラリの項目名それぞれについて内容を定義する。図5の如きである。
【0056】
“試作製品” という項目名の項目ならば、ドメイン名“コード”を付けて“試作製品コード”、 “製品” という項目名の項目ならば、ドメイン名“コード”を付けて“製品コード”、“更新日付” という項目名の項目ならば、ドメイン名“日付”を付けるが“日付”という言葉が重複するので、この場合は“更新日付”とする。そしてこれらにそれぞれ定義情報を付すようにする。
【0057】
“製品コード”が7桁構成で“XXYYY99”が該当するとすれば、“製品コード… XXYYY99(7桁)”、“更新日付”が8桁構成で“YYYYMMDD”が該当するとすれば、“更新日付…YYYYMMDD(8桁)”、…といった具合である。このような処理をデータ抽出処理部14は自動的に行い、サブシステムテムSUB1用はサブシステムテムSUB1用ドメインライブラリとして、また、サブシステムテムSUBn用はサブシステムテムSUBn用ドメインライブラリとして、それぞれドメインライブラリ保持部11に登録していく。
【0058】
このようにして、データ抽出処理部14は、統合対象となったサブシステムテムそれぞれについて、上述のような処理を行い、ドメイン等を抽出すると共に、洗い出したドメインは、対象がサブシステムテムSUB2であればSUB2用として、対象がSUBnであればSUBn用としてドメインライブラリ保持部11に登録し、また、項目は項目名の末尾にドメイン名をつけてドメインライブラリの項目名とし、ユーザまたはプログラマあるいはオペレータはそれぞれに内容を定義し、登録することにより、SUB2用ならばSUB2用の、SUBn用ならばSUBn用のドメインライブラリを構築する。
【0059】
ここで、ドメインとは、上述したように、項目に関するデータ定義、有効値の範囲・集合の仕様を定義したものであり、ドメイン名、ドメイン定義、フォーマット定義、有効値の範囲からなる。
【0060】
ドメインの名称としては、上述のサブシステムSUB1に対する例では“コード”,“名”,“数値” ,“時間”が該当する。そして、次に、ドメイン名“コード”という名称のドメインとは「特定の長さを持つテキストの集合」という定義を持つものであり、“コード”には“製品コード”,“製品分類コード”,“工場コード”,“部署コード”があり、 “製品コード”は「XXYYY99(7桁)」の形態を持ち、“製品分類コード”は「XX(2桁)」の形態を持ち、“工場コード”は「XXXX(4桁)」の形態を持ち、“部署コード”は「9999(4桁)」の形態を持ち、また、ドメイン名“名”というドメインは、「特定の長さ以内の自由テキスト」という定義を持つものであり、これには“和名”,“英名”,“カナ名”があり、“和名”は「任意の全角文字(15桁以内)」の形態を持ち、 “英名”は「任意の半角英数字(30桁以内)」の形態を持ち、また、 “カナ名”とは「任意の半角カナ文字(30桁以内)」を持ち、ドメイン名“数値”というドメインとは「小数点第二位までの値」という定義を持つものであり、これには“単価”があり、この“単価”は「999999.99(8桁) 」の形態を持ち、ドメイン名称“時間”というドメインとは「時間を表す特定の長さのテキスト」という定義を持つもので、これには“年月日”があり、この“年月日”は、「YYYYMMDD」の形態を持ち、“日時”は「YYYYMMDDHHMMSS」の形態を持ち、といったことが定義されている(図5のドメインライブラリの定義例参照)。自動認識できない定義情報や、仕様書等から見て誤っているものについては、ユーザやプログラマあるいはオペレータがインテリジェント端末20を用いて当該インテリジェント端末20の持つ編集機能を利用して修正したり、削除したり、加入したりして手直しする。
【0061】
こうして構築されたのが、ドメインライブラリであり、この、ドメインライブラリを保持しているものがドメインライブラリ保持部11である。
【0062】
項目変換マップは図6の如きものである。すなわち、項目変換マップはドメイン名称を含めたデータ抽出元とデータ抽出先の項目名称を定義し、抽出元から抽出先へどのように項目を変換するかを定めた情報である“抽出元から抽出先への項目マッピング情報”を定義したものであるが、これは、例えば、データ抽出元がサブシステムSUB1でこのサブシステムSUB1ではデータが“試作製品コード”,“工場コード”,“製品カナ名”,“更新日時”,“購入時単価”,“出荷時単価”とからなり、統合化データベースシステムである情報共有システム10では、“製品コード”,“製品分類コード”,“工場名”,“製品和名”,“更新年月日”,“購入時単価”, “出荷時単価”とを用いて構成するようにするものであるとして、変換元と変換先では、項目名が一致しないものもあることから、何を何に変換するかを定義するようにしたものである。
【0063】
例えば、図6はその一例を示しているが、ここでは、SUB1でのデータにおける “試作製品コード” は、情報共有システム10では、“製品コード” と “製品分類コード” とに変換し、SUB1でのデータにおける “工場コード”は、情報共有システム10では、“工場名”に変換し、SUB1でのデータにおける“製品カナ名” は、情報共有システム10では、“製品和名”に変換し、SUB1でのデータにおける“更新日時”は、情報共有システム10では、“更新年月日”に変換し、SUB1でのデータにおける“購入時単価”は、情報共有システム10では、“購入時単価”に変換し、SUB1でのデータにおける“出荷時単価”は、情報共有システム10では、“出荷時単価”に変換すると云うことを示すマップ情報となっていることを示したものであり、この場合、SUB1から情報共有システム10への変換専用のマップ情報としてある。
【0064】
ユーザまたはプログラマあるいはオペレータはこのようなマップ情報を、適用するシステム対応に予め作成して用意しておく。用意されたこのようなマップ情報を保持しているものが項目変換マップ保持部13である。
【0065】
データ変換ライブラリは図7に示す如きのもので、項目名何の項目を項目名何の項目に変換するかという“変換パターン”、そして、その変換パターンでの処理はどのようにするかと云った“変換処理”の内容を定義したものである。
【0066】
図7の例では、“変換パターン” には“数値→単価”(数値から単価への変換)、“テキスト→年月日”(テキストから年月日への変換)、“コード→名”(コードから名への変換)、“製品コード→製品分類コード”(製品コードから製品分類コードへの変換)があり、“数値→単価”では、「0〜1,000,000以内の値を小数2桁で桁上げして結果を返す。範囲外の値はエラー処理実行。」という内容の変換処理を行うと定義してあり、 “テキスト→年月日”では「フォーマットをYYYYMMDDに変換。日付に一致しないテキストはエラー処理実行。」という内容の変換処理を行うと定義してあり、“コード→名”では「コードマスタを参照し、コードと一致するコード名称を返す。一致しないコードはエラー処理実行。」という内容の変換処理を行うと定義してあり、“製品コード→製品分類コード”では「開始1桁目から2桁を置換する。」という内容の変換処理を行うと定義してある例である。
ユーザまたはプログラマまたはオペレータは、インテリジェント端末20を操作して、このような“変換パターン”と “変換処理”内容を定義してなるデータ変換ライブラリを、データ変換に適用するシステム対応に予め作成して用意しておく。そして、このようなデータ変換ライブラリをデータ変換ライブラリ保持部12に保持させておく。
【0067】
次に、データ抽出処理部14は統合化対象のデータについて、上記(2)の処理であるフォーマット変換を実施する。
【0068】
フォーマット変換は、ドメインライブラリと、項目変換マップとを用いて行う。抽出元のデータ(SUB1,〜SUBnの持つデータ)をドメインライブラリを用いてチェックし、抽出元のデータについてドメインとそれに付随する数値などのデータに区分する。そして、区分したドメイン部分を、まずはじめに項目変換マップに従って変換する。例えば、抽出元のデータにおけるドメイン名“試作品コード”なるドメインは“製品コード”と“製品分類コード”に、“工場コード”は“工場名”に、“製品カナ名”は“製品和名”に、“更新日時”は“更新年月日”に、“購入時単価”は“購入時単価”に、“出荷時単価”は“出荷時単価”にというように、対応するものについてマップに従い変換する処理をする。
【0069】
このとき、この変換処理に合わせてデータ抽出処理部14は上記(3)の値変換の処理も実施する。
【0070】
この値変換の処理は、まず、データ変換ライブラリを基にデータ抽出処理を行う。その手順は、[S1]項目変換マップ上における抽出元から抽出先への変換対象となる項目名から、ドメイン名を取り出す、[S2]データ変換ライブラリから、取り出したドメイン名の組み合わせパターンを検索し、一致するデータ変換処理を選択する、[S3]変換処理が選択されない場合は、エラー処理を実行して、終了する、[S4]選択したデータ変換処理を実行する、の4つの処理で、[S1]〜[S4]の処理を項目変換マップの各項目変換に適用する。
【0071】
[S3]でエラーとなったデータ抽出処理は、新たに変換処理を作成して、データ変換ライブラリに登録する。
【0072】
[S1]〜[S4]のチェックで例外となったデータについては、エラーデータとして出力し、変換処理を終了する。
【0073】
データ変換ライブラリもドメインライブラリと同様に、ドメインの変換パターンの階層構造を持ち、親子関係の持つ子ドメインの変換パターンは、親ドメインの変換パターンの[S1]〜[S4]の処理を継承する。
【0074】
親子関係のある処理として具体的に例をあげると、図8(a)に示す如きである。この例は、図7のデータ変換ライブラリにおける“変換パターン”「数値→単価」への変換の例であり、変換処理の内容としては「0〜1,000,000以内の値を小数2桁で桁上げして結果を返す。範囲外の値はエラー処理を実行する。」というものである。
【0075】
この場合においては、親変換処理として数値(テキスト)を数値に変換する処理をし、子変換処理として数値(テキスト)を単価に変換するというものである。この場合、第1段階としてテキスト型チェックを行い、第2段階としてテキスト型から数値型に変換し、第3段階として小数点2桁で桁上げし、第4段階でチェックするが、子変換処理があるので、第4段階での処理はなしにして子変換処理に移る。子変換処理では第1段階から第3段階までの処理を承継し、第4段階で数値が“0”以上“1000000”以下の値であるかをチェックしている。
【0076】
なお、エラーの発生した項目については、ユーザまたはプログラマまたはオペレータが、インテリジェント端末20を操作して、人的に対処するようにする。
【0077】
以上の処理を概略的にフローチャートで示すと図9の如きとなる。また、図9のフローチャートにおける処理“取り込みデータのフォーマット、値とのチェック”から“値等の変換処理”までの処理手順内容の一例を図10に示しておく。
【0078】
これはデータ抽出処理部14での処理であるが、図9における処理である“取り込みデータのフォーマット、値とのチェック”の処理においては、図10に示す如く、まず、取り込みデータの区分(解析)を行い、次に区分(解析)したデータとドメインライブライリの登録ドメインと、ドメインの定義内容を比較照合して、前記区分したデータがライブライリ内容に該当するか否かをチェックし、該当しない場合はエラー処理に移行するが、該当する場合には前記区分したデータと項目変換マップとの比較照合を行い、該当するか否かをチェックする。そして、該当しない場合はエラー処理に移行するが、該当する場合には前記区分したデータについてそのドメイン名を項目変換マップに従い、該当ドメイン名に変更する処理を更にデータ変更ライブライリの内容に従い値等をデータ変更処理する。
【0079】
以上、詳述したような処理をデータ抽出処理部14はフォーマット変換と合わせて行うことで、あるサブシステムのデータを統合データベースシステムでの標準データ形式に変換することができる。
【0080】
以上、本実施例のシステムは、既存システムで扱うデータであってその既存システムでの仕様に基づくドメイン名、データフォーマット定義、有効値の範囲などのドメイン定義に従ったデータを抽出元のデータとし、この抽出元のデータを、別のドメイン定義に従ったデータに変換するための技術として、
前記仕様別のドメイン定義を集めたドメインライブラリと、あるドメインから別のあるドメインへのデータ変換をする場合での変換処理の内容を持つデータ変換ライブラリであって、抽出元と抽出先のドメインの変換パターンと、そのパターンの変換処理を登録したデータ変換ライブラリと、データ抽出元からデータ抽出先に対してどの項目名(項目名称)のものはどの項目名(項目名称)に変換するといった変換対象項目の変換関係を定義した項目変換マップとを用い、これらライブラリ及びマップという3種類のデータ抽出設計仕様をもとに、データ抽出元のデータを、データ抽出先の仕様に合うようにデータ変換処理するようにしたものである。
【0081】
本発明は、既存システムで扱うデータであってその既存システムでの仕様に基づくドメイン名、データフォーマット定義、有効値の範囲などのドメイン定義に従ったデータを抽出元のデータとし、この抽出元のデータを、別のドメイン定義に従ったデータに変換するにあたり、
前記仕様別のドメイン定義を集めたドメインライブラリと、このドメインライブラリの情報を参照して作成され、あるドメインから別のあるドメインへのデータ変換をする場合での変換処理の内容を持つデータ変換ライブラリであって、抽出元と抽出先のドメインの変換パターンと、そのパターンの変換処理を登録したデータ変換ライブラリと、前記ドメインライブラリの情報を参照して作成され、データ抽出元からデータ抽出先に対してどの項目名(項目名称)のものはどの項目名(項目名)に変換するといった変換対象項目の変換関係を定義した項目変換マップとを用意する。そして、データ抽出元のデータを分解し、これらライブラリ及びマップを用い、データ抽出先の仕様に合うようにデータ変換処理する。
【0082】
分解したデータは、ドメインライブラリに従い、チェックして該当するものについて、データ変換ライブラリを基にデータ抽出処理を行う。その手順は、(1)項目変換マップに定義されたデータ抽出元からデータ抽出先への変換関係にある項目名から、データ抽出元でのデータのドメイン名のデータ抽出先での変換すべきドメイン名を取り出し、(2)この取り出したドメイン名の変換の組み合わせパターンをデータ変換ライブラリから検索してデータ変換の処理法を得て、(4)その得た処理法に従ったデータ変換処理を実行することでデータ抽出元のデータのドメイン名と値をデータ抽出先のドメイン名と値に変換して出力し、(3)前記データ変換の処理法が見つからなかった場合には、エラーとするようにした。また、当該エラーに対してはエラーとなったドメイン名の変換の組み合わせパターンを作成してデータ変換ライブラリに登録し、また、エラーとなったデータ変換の処理法を新たに作成してデータ変換ライブラリに登録する。これにより、次回からはエラーとならずに変換処理を行うことができるようになる。
【0083】
故に、この実施例によれば、例えば、各部署でデータ管理のために構築されて利用されている管理システムのデータと云ったローカルシステム(サブシステム)のデータを統合して利用したい場合などように、統合先の形式である標準形式など所望の形式のデータに変換できるようになる。
【0084】
しかも、データ抽出先のデータをデータ抽出先の仕様に合うよう変換するに当たって、ドメインライブラリとデータ変換ライブラリと項目変換マップを用意すれば良く、個別に変換処理プログラムを作成する必要はないから、汎用性が高く、安価で手軽にデータ変換できる仕組みを提供できる。
【0085】
なお、本発明は上述した実施形態に示す例に限定されるものではなく、種々変形して実施可能である。
【0086】
また、本発明において、上記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得るものである。例えば、実施形態に示される全構成要件から幾つかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題の少なくとも1つが解決でき、発明の効果の欄で述べられている効果の少なくとも1つが得られる場合には、当該実施形態での構成要件が一部削除された構成についても発明として成立し得るものである。また、本発明の手順は、コンピュータにより実行させるプログラムとして提供し、利用する形態も含まれるものである。
【0087】
【発明の効果】
以上、詳述したように、本発明によれば、抽出元データと抽出先データのドメインを定義することにより、システム全体で統一されていて、一貫性があり、正確で明解かつ理解しやすいデータに標準化できる変換システムが提供できる。また、変換処理を部品化することにより、再利用が可能となり、開発工数の削減効果も期待できる。
【図面の簡単な説明】
【図1】本発明システムの構成例を説明するための機能構成ブロック図である。
【図2】本発明システムを説明するための図であって、項目名の定義例を説明するための図である。
【図3】本発明システムを説明するための図であって、項目名からドメインを洗い出す例を説明するための図である。
【図4】本発明システムを説明するための図であって、項目名からドメインを洗い出す例を説明するための図である。
【図5】本発明システムで用いるドメインライブラリの定義例を説明するための図である。
【図6】本発明システムで用いる項目変換マップの定義例を説明するための図である。
【図7】本発明システムで用いるデータ変換ライブラリの定義例を説明するための図である。
【図8】本発明システムを説明するための図であって、親子関係のある処理の一例を説明するための図である。
【図9】本発明システムを説明するための図であって、本発明システムにおけるデータ抽出処理部の一例としての処理手順を説明するための図である。
【図10】本発明システムを説明するための図であって、本発明システムにおけるデータ抽出処理部の一例としての処理手順を説明するための図である。
【符号の説明】
10…情報共有システム
11…ドメインライブラリ保持部
12…データ変換ライブラリ保持部
13…項目変換マップ保持部
14…データ抽出処理部
15…データウエアハウス。
SUB1,〜SUBn…サブシステム(在庫管理システム、生産管理システム、データベースシステム等の既存のデータ管理システム)

Claims (8)

  1. データ管理する既存システムで扱うデータであってその既存システムでの仕様に基づくドメイン名、データフォーマット定義、有効値の範囲などのドメイン定義に従ったデータを抽出元のデータとし、この抽出元のデータを、別のドメイン定義に従ったデータに変換するための変換装置として、
    あるドメインから別のあるドメインへのデータ変換をする場合での変換処理の内容を定めたデータ変換ライブラリであって、抽出元‐抽出先間のドメインの変換パターンと、そのパターンでの変換処理内容を登録したデータ変換ライブラリを保持するデータ変換ライブラリ保持手段と、
    データ抽出元からデータ抽出先に対して変換対象となる項目の変換関係を定義した項目変換マップを保持する項目変換マップ保持手段と、
    これら保持手段の保持するデータ変換ライブラリおよび項目変換マップを参照し、これらデータ変換ライブラリおよび項目変換マップで規定される変換関係および変換処理内容に従って前記データ抽出元のデータをデータ変換処理することによりデータ抽出元のデータをデータ抽出先の仕様に合わせるべくデータ変換するデータ変換処理手段と
    を備えたことを特徴とするデータ変換装置。
  2. 前記データ変換処理手段は、前記データ変換ライブラリまたは、前記項目変換マップに、該当する変換関係または変換処理内容が存在しないときはエラー処理することを特徴とする請求項1記載のデータ変換装置。
  3. データ管理する既存システムで扱うデータであってその既存システムでの仕様に基づくドメイン名、データフォーマット定義、有効値の範囲などのドメイン定義に従ったデータを抽出元のデータとし、この抽出元のデータを、別のドメイン定義に従ったデータに変換するための変換装置として、
    前記仕様別のドメイン名およびドメイン定義を集めたドメインライブラリを保持するドメインライブラリ保持手段と、
    あるドメインから別のあるドメインへのデータ変換をする場合での変換処理の内容を定めたデータ変換ライブラリであって、抽出元‐抽出先間のドメインの変換パターンと、そのパターンでの変換処理内容を登録したデータ変換ライブラリを保持するデータ変換ライブラリ保持手段と、
    データ抽出元からデータ抽出先に対して変換対象となる項目の変換関係を定義した項目変換マップを保持する項目変換マップ保持手段と、
    前記データ抽出元のデータを取り込み、区分してドメインライブラリ保持手段の保持するドメインライブラリと照合してこのライブラリの登録情報に該当するか否かをチェックすると共に、該当する場合には前記データ変換ライブラリ保持手段の保持するデータ変換ライブラリおよび項目変換マップ保持手段保持する項目変換マップを参照し、これらデータ変換ライブラリおよび項目変換マップで規定される変換関係および変換処理内容に従って前記データ抽出元のデータをデータ変換処理することによりデータ抽出元のデータをデータ抽出先の仕様に合わせるべくデータ変換するデータ変換処理手段と
    を備えたことを特徴とするデータ変換装置。
  4. 前記データ変換処理手段は、前記ドメインライブラリまたは、前記データ変換ライブラリまたは、前記項目変換マップに、該当する変換関係または変換処理内容が存在しないときはエラー処理することを特徴とする請求項2記載のデータ変換装置。
  5. データ管理する既存システムで扱うデータであってその既存システムでの仕様に基づくドメイン名、データフォーマット定義、有効値の範囲などのドメイン定義に従ったデータを抽出元のデータとし、この抽出元のデータを、別のドメイン定義に従ったデータに変換するための変換方法として、
    あるドメインから別のあるドメインへのデータ変換をする場合での変換処理の内容を定めたデータ変換ライブラリであって、抽出元‐抽出先間のドメインの変換パターンと、そのパターンでの変換処理内容を登録したデータ変換ライブラリと、データ抽出元からデータ抽出先に対して変換対象となる項目の変換関係を定義した項目変換マップとを参照可能に記憶手段に保持させ、前記データ抽出元のデータを取り込むと共に、この取り込んだデータに対し、前記データ変換ライブライリおよび項目変換マップを参照して、これらにて規定される変換関係および変換処理内容に従い、データ変換処理することによりデータ抽出先の仕様に合うデータとして変換して出力することを特徴とするデータ変換方法。
  6. データ管理する既存システムで扱うデータであってその既存システムでの仕様に基づくドメイン名、データフォーマット定義、有効値の範囲などのドメイン定義に従ったデータを抽出元のデータとし、この抽出元のデータを、別のドメイン定義に従ったデータに変換するための変換方法として、
    前記仕様別のドメイン名およびドメイン定義を集めたドメインライブラリと、あるドメインから別のあるドメインへのデータ変換をする場合での変換処理の内容を定めたデータ変換ライブラリであって、抽出元‐抽出先間のドメインの変換パターンと、そのパターンでの変換処理内容を登録したデータ変換ライブラリと、データ抽出元からデータ抽出先に対して変換対象となる項目の変換関係を定義した項目変換マップとを用意して、これらは参照可能に記憶手段に保持させ、
    前記データ抽出元のデータを取り込むと共に、この取り込んだデータは区分して前記ドメインライブラリと照合し、前記区分したデータがこのライブラリの登録情報に該当するか否かをチェックし、その結果、該当する場合には前記区分したデータを前記データ変換ライブラリおよび項目変換マップを参照し、これらデータ変換ライブラリおよび項目変換マップで規定される変換関係および変換処理内容に従ってデータ変換処理して出力することによりデータ抽出元のデータをデータ抽出先の仕様に合わせたデータとして得ることができるようにしたことを特徴とするデータ変換方法。
  7. データ管理する既存システムで扱うデータであってその既存システムでの仕様に基づくドメイン名、データフォーマット定義、有効値の範囲などのドメイン定義に従ったデータを抽出元のデータとし、この抽出元のデータを、別のドメイン定義に従ったデータに変換するための変換処理プログラムであって、
    前記データ抽出元のデータを取り込む第1の手順と、
    あるドメインから別のあるドメインへのデータ変換をする場合での変換処理の内容を定めたデータ変換ライブラリであって、抽出元と抽出先のドメインの変換パターンと、そのパターンの変換処理を登録したデータ変換ライブラリと、データ抽出元からデータ抽出先に対して変換対象となる項目の変換関係を定義した項目変換マップとを用い、前記取り込まれたデータ抽出元のデータを、これらライブラリおよびマップにて規定される変換関係および変換処理法に従ってデータ変換処理することにより前記別のあるドメイン定義に従ったデータに変換したデータとして出力する第2の手順と
    からなることを特徴とするデータ変換プログラム。
  8. データ管理する既存システムで扱うデータであってその既存システムでの仕様に基づくドメイン名、データフォーマット定義、有効値の範囲などのドメイン定義に従ったデータを抽出元のデータとし、この抽出元のデータを、別のドメイン定義に従ったデータに変換するための変換プログラムとして、
    前記仕様別のドメイン名およびドメイン定義を集めたドメインライブラリと、あるドメインから別のあるドメインへのデータ変換をする場合での変換処理の内容を定めたデータ変換ライブラリであって、抽出元‐抽出先間のドメインの変換パターンと、そのパターンでの変換処理内容を登録したデータ変換ライブラリと、
    データ抽出元からデータ抽出先に対して変換対象となる項目の変換関係を定義した項目変換マップとを備え、
    また、前記データ抽出元のデータを取り込むステップと、
    この取り込んだ前記データ抽出元のデータを区分して前記ドメインライブラリと照合し、前記区分したデータがこのライブラリの登録情報に該当するか否かをチェックするステップと、
    このチェックにより該当する場合には前記区分したデータを前記データ変換ライブラリおよび項目変換マップを参照し、これらデータ変換ライブラリおよび項目変換マップで規定される変換関係および変換処理内容に従ってデータ変換処理するステップと、
    このデータ変換処理したデータを出力するするステップと
    を備えることを特徴とするデータ変換プログラム。
JP2002268954A 2002-09-13 2002-09-13 データ変換装置およびデータ変換方法およびデータ変換プログラム Pending JP2004110182A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002268954A JP2004110182A (ja) 2002-09-13 2002-09-13 データ変換装置およびデータ変換方法およびデータ変換プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002268954A JP2004110182A (ja) 2002-09-13 2002-09-13 データ変換装置およびデータ変換方法およびデータ変換プログラム

Publications (1)

Publication Number Publication Date
JP2004110182A true JP2004110182A (ja) 2004-04-08

Family

ID=32267027

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002268954A Pending JP2004110182A (ja) 2002-09-13 2002-09-13 データ変換装置およびデータ変換方法およびデータ変換プログラム

Country Status (1)

Country Link
JP (1) JP2004110182A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010212301A (ja) * 2009-03-06 2010-09-24 Canon Inc 情報処理システム、情報処理方法およびプログラム
US8060472B2 (en) 2009-03-10 2011-11-15 Canon Kabushiki Kaisha Information processing system, information processing method, and computer-readable storage medium
JP2013505502A (ja) * 2009-09-16 2013-02-14 アビニシオ テクノロジー エルエルシー データセット要素のマッピング
JP2020091670A (ja) * 2018-12-06 2020-06-11 株式会社日立製作所 連携システムおよび連携方法
JP2023533453A (ja) * 2020-07-09 2023-08-03 ノースロップ グラマン システムズ コーポレーション データ抽出のためのマルチステージデータスニッファ
JP2023154267A (ja) * 2022-04-06 2023-10-19 東芝テック株式会社 データ処理装置及びプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010212301A (ja) * 2009-03-06 2010-09-24 Canon Inc 情報処理システム、情報処理方法およびプログラム
US8065270B2 (en) 2009-03-06 2011-11-22 Canon Kabushiki Kaisha Information processing system, information processing method, and memory medium
US8060472B2 (en) 2009-03-10 2011-11-15 Canon Kabushiki Kaisha Information processing system, information processing method, and computer-readable storage medium
JP2013505502A (ja) * 2009-09-16 2013-02-14 アビニシオ テクノロジー エルエルシー データセット要素のマッピング
JP2020091670A (ja) * 2018-12-06 2020-06-11 株式会社日立製作所 連携システムおよび連携方法
JP7016790B2 (ja) 2018-12-06 2022-02-07 株式会社日立製作所 連携システムおよび連携方法
JP2023533453A (ja) * 2020-07-09 2023-08-03 ノースロップ グラマン システムズ コーポレーション データ抽出のためのマルチステージデータスニッファ
JP7607060B2 (ja) 2020-07-09 2024-12-26 ノースロップ グラマン システムズ コーポレーション データ抽出のためのマルチステージデータスニッファ
JP2023154267A (ja) * 2022-04-06 2023-10-19 東芝テック株式会社 データ処理装置及びプログラム

Similar Documents

Publication Publication Date Title
US7925658B2 (en) Methods and apparatus for mapping a hierarchical data structure to a flat data structure for use in generating a report
AU780565B2 (en) Method and apparatus for selecting aggregate levels and cross product levels for a data warehouse
US6834287B1 (en) Classification engine for managing attribute-based data
US20120054147A1 (en) System and method for extract, transform, and load workflow generation
US8433673B2 (en) System and method for supporting data warehouse metadata extension using an extender
US7783637B2 (en) Label system-translation of text and multi-language support at runtime and design
Rusu et al. A methodology for building XML data warehouses
EP1990740A1 (en) Schema matching for data migration
US8010905B2 (en) Open model ingestion for master data management
EP3171282A1 (en) Data retrieval apparatus, program and recording medium
US20050183002A1 (en) Data and metadata linking form mechanism and method
US20060218160A1 (en) Change control management of XML documents
MXPA01008947A (es) Especificacion para convertidor de codigo abap (programacion avanzada de aplicacion de negocios).
WO2005055001A2 (en) Method for assisting in automated conversion of data and associated metadata
US8407235B2 (en) Exposing and using metadata and meta-metadata
US20140136472A1 (en) Methodology supported business intelligence (BI) software and system
KR100538547B1 (ko) 복수의소스능력을가진데이터검색방법및장치
KR20050061597A (ko) 버저닝된 데이터베이스에 대한 리포트를 생성하기 위한시스템 및 방법
CN112579629A (zh) 一种帮助电子元器件企业的采购员准确找到产品的方法
JP4562749B2 (ja) 文書の圧縮格納方法及び装置
JP2004110182A (ja) データ変換装置およびデータ変換方法およびデータ変換プログラム
AU2018223056A1 (en) Data deduplication and data merging
US20030055838A1 (en) Data storing method and data storing structure
EP1374090A2 (en) Computer method and device for transporting data
Uematsu et al. Design for data structures: data unification and federation with Wikibase