JP2000305824A - データベース処理装置、及びデータベース処理プログラムが記憶された記憶媒体 - Google Patents
データベース処理装置、及びデータベース処理プログラムが記憶された記憶媒体Info
- Publication number
- JP2000305824A JP2000305824A JP11117619A JP11761999A JP2000305824A JP 2000305824 A JP2000305824 A JP 2000305824A JP 11117619 A JP11117619 A JP 11117619A JP 11761999 A JP11761999 A JP 11761999A JP 2000305824 A JP2000305824 A JP 2000305824A
- Authority
- JP
- Japan
- Prior art keywords
- item
- item name
- attribute
- unit
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 データベースを作成する際、取得項目に対す
る項目属性を簡易に自動設定をすることができるように
する。 【解決手段】 予め蓄積した経験的知識やルールに基づ
いて、項目名(項目ラベル)と項目属性や、単位表記と
単位等を対応付けたヒューリスティクスが、データベー
ス処理装置1のヒューリスティクステーブル格納部16
3に予め記憶してある。CPU111は、ユーザからデ
ータベース処理に必要な項目名を取得し、この取得項目
名を所定の方法で解釈する。そして、解釈された項目名
と同一名の、ヒューリスティクステーブルに記憶されて
いる項目ラベルを検索して、項目ラベルに対応する項目
属性を、作成すべきデータベースの適切な項目属性とし
て自動設定する。
る項目属性を簡易に自動設定をすることができるように
する。 【解決手段】 予め蓄積した経験的知識やルールに基づ
いて、項目名(項目ラベル)と項目属性や、単位表記と
単位等を対応付けたヒューリスティクスが、データベー
ス処理装置1のヒューリスティクステーブル格納部16
3に予め記憶してある。CPU111は、ユーザからデ
ータベース処理に必要な項目名を取得し、この取得項目
名を所定の方法で解釈する。そして、解釈された項目名
と同一名の、ヒューリスティクステーブルに記憶されて
いる項目ラベルを検索して、項目ラベルに対応する項目
属性を、作成すべきデータベースの適切な項目属性とし
て自動設定する。
Description
【0001】
【発明の属する技術分野】本発明は、データベース処理
装置、及びデータベース処理プログラムが記憶された記
憶媒体に係り、詳細には、データベースの、項目属性を
自動設定するデータベース処理装置、及び項目属性自動
設定プログラムが記憶された記憶媒体に関する。
装置、及びデータベース処理プログラムが記憶された記
憶媒体に係り、詳細には、データベースの、項目属性を
自動設定するデータベース処理装置、及び項目属性自動
設定プログラムが記憶された記憶媒体に関する。
【0002】
【従来の技術】近年、コンピュータ及びソフトウエアに
より、多種多様かつ大量のデータの蓄積、加工、若しく
は演算等の処理を可能とする、データベース処理装置が
普及している。ところで、データベースの作成・管理に
おいては、フィールド項目のデータ型やデータの範囲制
限等のフィールド項目属性の定義が必要である。
より、多種多様かつ大量のデータの蓄積、加工、若しく
は演算等の処理を可能とする、データベース処理装置が
普及している。ところで、データベースの作成・管理に
おいては、フィールド項目のデータ型やデータの範囲制
限等のフィールド項目属性の定義が必要である。
【0003】
【発明が解決しようとする課題】しかし、従来のデータ
ベース管理システムで、フィールド項目属性を設定する
には、すべてのフィールド項目属性を手入力により設定
するのが一般的であった。また、典型的なデータベース
のテンプレートを利用してフィールド項目属性を設定す
る方法も提供されているが、テンプレートにないフィー
ルド項目が付け加わる場合も多くあり、このようなフィ
ールド項目に対しても手入力による設定が必要であっ
た。
ベース管理システムで、フィールド項目属性を設定する
には、すべてのフィールド項目属性を手入力により設定
するのが一般的であった。また、典型的なデータベース
のテンプレートを利用してフィールド項目属性を設定す
る方法も提供されているが、テンプレートにないフィー
ルド項目が付け加わる場合も多くあり、このようなフィ
ールド項目に対しても手入力による設定が必要であっ
た。
【0004】そこで、本発明は、データベースの基本設
計時において、取得項目名の意味を解釈して、その項目
の属性を自動的に設定することができる、データベース
処理装置、及び項目属性自動設定プログラムが記憶され
た記憶媒体を提供することを目的とする。
計時において、取得項目名の意味を解釈して、その項目
の属性を自動的に設定することができる、データベース
処理装置、及び項目属性自動設定プログラムが記憶され
た記憶媒体を提供することを目的とする。
【0005】
【課題を解決するための手段】請求項1に記載の発明
は、各項目名に対して予め設定された項目属性の範囲で
データの入力が行われるデータベース処理装置であっ
て、入力される項目名を取得する項目名取得手段と、こ
の項目名取得手段により取得された項目名の内容を判断
し、判断した項目名の内容から、項目名が入力された項
目に対する項目属性の候補を、経験的知識やルールに基
づいて自動決定する決定手段とを具備することを特徴と
するデータベース処理装置により、前記目的を達成す
る。
は、各項目名に対して予め設定された項目属性の範囲で
データの入力が行われるデータベース処理装置であっ
て、入力される項目名を取得する項目名取得手段と、こ
の項目名取得手段により取得された項目名の内容を判断
し、判断した項目名の内容から、項目名が入力された項
目に対する項目属性の候補を、経験的知識やルールに基
づいて自動決定する決定手段とを具備することを特徴と
するデータベース処理装置により、前記目的を達成す
る。
【0006】請求項2に記載の発明は、項目名と、その
項目名の内容から予め経験的知識やルールに基づいて決
められた項目属性を対応付けて記憶した項目属性記憶手
段を備え、前記決定手段は、前記項目名取得手段で取得
した項目名と同一の項目名が前記記憶手段に存在するか
否かを判断し、存在する場合には対応する項目属性を候
補として自動決定することを特徴とする請求項1に記載
のデータベース処理装置により、前記目的を達成する。
項目名の内容から予め経験的知識やルールに基づいて決
められた項目属性を対応付けて記憶した項目属性記憶手
段を備え、前記決定手段は、前記項目名取得手段で取得
した項目名と同一の項目名が前記記憶手段に存在するか
否かを判断し、存在する場合には対応する項目属性を候
補として自動決定することを特徴とする請求項1に記載
のデータベース処理装置により、前記目的を達成する。
【0007】請求項3に記載の発明は、類義語辞書を記
憶した類義語辞書記憶手段を備え、前記決定手段は、前
記項目名取得手段で取得した項目名の類義語を前記類義
語辞書から求め、この類義語を項目名として項目属性の
候補を決定することを特徴とする請求項2に記載のデー
タベース処理装置により、前記目的を達成する。請求項
4に記載の発明は、前記決定手段は、前記項目名取得手
段で取得した項目名が多義語であり、項目属性を一義に
決定できない場合には、他の項目名及び当該データベー
スのタイトルの少なくとも1つを参酌して項目属性の候
補を決定することを特徴とする請求項1又は請求項2に
記載のデータベース処理装置により前記目的を達成す
る。
憶した類義語辞書記憶手段を備え、前記決定手段は、前
記項目名取得手段で取得した項目名の類義語を前記類義
語辞書から求め、この類義語を項目名として項目属性の
候補を決定することを特徴とする請求項2に記載のデー
タベース処理装置により、前記目的を達成する。請求項
4に記載の発明は、前記決定手段は、前記項目名取得手
段で取得した項目名が多義語であり、項目属性を一義に
決定できない場合には、他の項目名及び当該データベー
スのタイトルの少なくとも1つを参酌して項目属性の候
補を決定することを特徴とする請求項1又は請求項2に
記載のデータベース処理装置により前記目的を達成す
る。
【0008】請求項5に記載の発明は、前記決定手段
が、前記項目名取得手段で取得した項目名が複数単語に
よる合成語を含んでいるかを判断し、合成語を含んでい
る場合には、合成語の各構成単語毎の項目属性から、前
記取得した項目名に対する項目属性の候補を決定するこ
とを特徴とする請求項1又は請求項2に記載のデータベ
ース処理装置により前記目的を達成する。
が、前記項目名取得手段で取得した項目名が複数単語に
よる合成語を含んでいるかを判断し、合成語を含んでい
る場合には、合成語の各構成単語毎の項目属性から、前
記取得した項目名に対する項目属性の候補を決定するこ
とを特徴とする請求項1又は請求項2に記載のデータベ
ース処理装置により前記目的を達成する。
【0009】請求項6に記載の発明は、前記決定手段
が、前記項目名取得手段で取得した項目名に単位語が含
まれているか否かを判断し、含まれている場合には、当
該単位を優先して項目属性の候補を決定し、他の属性に
ついては、単位語を除いた部分から候補を決定すること
を特徴とする請求項1又は請求項2に記載のデータベー
ス処理装置により前記目的を達成する。
が、前記項目名取得手段で取得した項目名に単位語が含
まれているか否かを判断し、含まれている場合には、当
該単位を優先して項目属性の候補を決定し、他の属性に
ついては、単位語を除いた部分から候補を決定すること
を特徴とする請求項1又は請求項2に記載のデータベー
ス処理装置により前記目的を達成する。
【0010】請求項7に記載の発明は、各項目名に対し
て予め設定された項目属性の範囲でデータの入力が行わ
れるデータベース処理機能をコンピュータに実現させる
ためのデータベース処理プログラムが格納された記録媒
体であって、入力される項目名を取得する項目名取得機
能と、この項目名取得手段により取得された項目名の内
容を判断し、判断した項目名の内容から、項目名が入力
された項目に対する項目属性の候補を、経験的知識やル
ールに基づいて自動決定する決定機能と、をコンピュー
タに実現させるためのデータベース処理プログラムが格
納された記録媒体により、前記目的を達成する。
て予め設定された項目属性の範囲でデータの入力が行わ
れるデータベース処理機能をコンピュータに実現させる
ためのデータベース処理プログラムが格納された記録媒
体であって、入力される項目名を取得する項目名取得機
能と、この項目名取得手段により取得された項目名の内
容を判断し、判断した項目名の内容から、項目名が入力
された項目に対する項目属性の候補を、経験的知識やル
ールに基づいて自動決定する決定機能と、をコンピュー
タに実現させるためのデータベース処理プログラムが格
納された記録媒体により、前記目的を達成する。
【0011】
【発明の実施の形態】以下、項目属性自動設定可能なデ
ータベース処理装置、及び項目属性自動設定プログラム
が記憶された記憶媒体の、好適な実施の形態について、
図1から図26を参照して詳細に説明する。
ータベース処理装置、及び項目属性自動設定プログラム
が記憶された記憶媒体の、好適な実施の形態について、
図1から図26を参照して詳細に説明する。
【0012】(1)実施形態の概要 ヒューリスティクス(蓄積した経験的知識やルール)に
基づいて、項目ラベルと項目属性や、単位表記と単位等
を対応付けたヒューリスティックステーブルが、データ
ベース処理装置1のヒューリスティクステーブル格納部
163に予め記憶してある。CPU111は、ユーザか
らデータベース処理に必要な項目名を取得し、その意味
や内容を所定の方法で解釈する。そして、解釈された項
目名と同一名の、ヒューリスティクステーブルに記憶さ
れている項目ラベルを検索して、項目ラベルに対応する
項目属性を、作成すべきデータベースの適切な項目属性
として自動設定する。
基づいて、項目ラベルと項目属性や、単位表記と単位等
を対応付けたヒューリスティックステーブルが、データ
ベース処理装置1のヒューリスティクステーブル格納部
163に予め記憶してある。CPU111は、ユーザか
らデータベース処理に必要な項目名を取得し、その意味
や内容を所定の方法で解釈する。そして、解釈された項
目名と同一名の、ヒューリスティクステーブルに記憶さ
れている項目ラベルを検索して、項目ラベルに対応する
項目属性を、作成すべきデータベースの適切な項目属性
として自動設定する。
【0013】ここで、CPU111による取得項目名の
前記所定の方法には、取得項目名を字句通り解釈した
り、類義語辞書162の利用し類義語の範囲で解釈した
り、若しくは、取得項目名を構文解析して解釈する方法
等がある。例えば、解釈の結果、取得項目名の類義語が
類義語テーブルHT4の項目ラベルに多数存在する場合
は、設定すべき項目属性が一意的に決定できず項目属性
が自動設定できない。
前記所定の方法には、取得項目名を字句通り解釈した
り、類義語辞書162の利用し類義語の範囲で解釈した
り、若しくは、取得項目名を構文解析して解釈する方法
等がある。例えば、解釈の結果、取得項目名の類義語が
類義語テーブルHT4の項目ラベルに多数存在する場合
は、設定すべき項目属性が一意的に決定できず項目属性
が自動設定できない。
【0014】そこで、CPU111は、類義語辞書から
取得項目名の単語の類義語を複数抽出し、その複数の類
義語の中から、他の取得項目名や取得タイトル名も考慮
して、作成すべきデータベースに適する類義語を選択
し、この選択された類義語を項目ラベルとするヒューリ
スティクステーブルに基づいて、項目属性の自動設定を
行う。
取得項目名の単語の類義語を複数抽出し、その複数の類
義語の中から、他の取得項目名や取得タイトル名も考慮
して、作成すべきデータベースに適する類義語を選択
し、この選択された類義語を項目ラベルとするヒューリ
スティクステーブルに基づいて、項目属性の自動設定を
行う。
【0015】このように、データベース処理装置1によ
れば、取得項目名と同一の項目名がヒューリスティクス
テーブルに存在しない場合や、取得項目名と同一の項目
名が存在したとしても、そのままでは項目属性が一意的
に決定できない場合等に、CPU111が取得項目名を
適宜解釈し、予め、任意の項目名と項目属性とが対応付
けられて記憶されているヒューリスティクステーブルを
利用して、項目属性を自動設定することができる。ま
た、データベース処理装置1によれば、取得項目名を適
宜解釈したとしても、既存のヒューリスティクステーブ
ルを利用して、項目属性を自動設定できないときは、自
動設定できなかった項目属性を、取得項目とともにヒュ
ーリスティクスとして記憶させることができる。その結
果、ヒューリスティクステーブルを進化(学習)させる
ことができ、項目属性の簡易な自動設定が、より促進さ
れる。
れば、取得項目名と同一の項目名がヒューリスティクス
テーブルに存在しない場合や、取得項目名と同一の項目
名が存在したとしても、そのままでは項目属性が一意的
に決定できない場合等に、CPU111が取得項目名を
適宜解釈し、予め、任意の項目名と項目属性とが対応付
けられて記憶されているヒューリスティクステーブルを
利用して、項目属性を自動設定することができる。ま
た、データベース処理装置1によれば、取得項目名を適
宜解釈したとしても、既存のヒューリスティクステーブ
ルを利用して、項目属性を自動設定できないときは、自
動設定できなかった項目属性を、取得項目とともにヒュ
ーリスティクスとして記憶させることができる。その結
果、ヒューリスティクステーブルを進化(学習)させる
ことができ、項目属性の簡易な自動設定が、より促進さ
れる。
【0016】(2)実施形態の詳細 まず、データベース処理装置1の基本構成について、図
1から図17を参照して説明する。
1から図17を参照して説明する。
【0017】図1は、データベース処理装置1の好適な
実施形態であり、項目属性自動設定プログラムを記憶し
た記憶媒体の第1の実施形態の該プログラムが読み取ら
れているコンピュータの構成を表したブロック図であ
る。図1に示すように、データベース処理装置(コンピ
ュータ)1は、装置全体を制御するための制御部11を
備えている。この制御部11には、データバス等のバス
ライン21を介して、入力装置としてのキーボード12
やマウス13、表示装置14、印刷装置15、記憶装置
16、記憶媒体駆動装置17、通信制御装置18、入出
力I/F19、及び文字認識装置20が接続されてい
る。
実施形態であり、項目属性自動設定プログラムを記憶し
た記憶媒体の第1の実施形態の該プログラムが読み取ら
れているコンピュータの構成を表したブロック図であ
る。図1に示すように、データベース処理装置(コンピ
ュータ)1は、装置全体を制御するための制御部11を
備えている。この制御部11には、データバス等のバス
ライン21を介して、入力装置としてのキーボード12
やマウス13、表示装置14、印刷装置15、記憶装置
16、記憶媒体駆動装置17、通信制御装置18、入出
力I/F19、及び文字認識装置20が接続されてい
る。
【0018】制御部11は、CPU111、ROM11
2、及びRAM113を備えている。ROM112は、
CPU111がデータベース処理の際に、各種制御や演
算を行うための各種プログラムやデータが予め格納され
たリードオンリーメモリである。
2、及びRAM113を備えている。ROM112は、
CPU111がデータベース処理の際に、各種制御や演
算を行うための各種プログラムやデータが予め格納され
たリードオンリーメモリである。
【0019】RAM113は、CPU111にワーキン
グメモリ(作業用エリア)として利用されるランダムア
クセスメモリである。このRAM113には、本実施形
態によるヒューリスティクステーブルに基づき項目属性
を自動設定するためのエリアとして、ヒューリスティク
ステーブルを一時記憶するためのエリアであるヒューリ
スティクステーブル格納エリア1131と、作成中のデ
ータベースを一時記憶するためのエリアであるデータベ
ース格納エリア1132と、後述の設定ダイアログを一
時記憶するためのエリアである設定ダイアログ格納エリ
ア1133と、その他の目的のための作業エリア113
4とが確保されるようになっている。
グメモリ(作業用エリア)として利用されるランダムア
クセスメモリである。このRAM113には、本実施形
態によるヒューリスティクステーブルに基づき項目属性
を自動設定するためのエリアとして、ヒューリスティク
ステーブルを一時記憶するためのエリアであるヒューリ
スティクステーブル格納エリア1131と、作成中のデ
ータベースを一時記憶するためのエリアであるデータベ
ース格納エリア1132と、後述の設定ダイアログを一
時記憶するためのエリアである設定ダイアログ格納エリ
ア1133と、その他の目的のための作業エリア113
4とが確保されるようになっている。
【0020】キーボード12は、かな文字や英文字を入
力するためのキーやテンキー、各種機能を実行するため
の機能キー、カーソルキー、等の各種キーが配置されて
いる。マウス13は、ポインティングデバイスであり、
表示装置14に表示されたキーやアイコン等をクリック
することで、対応する機能の指定を行う入力装置であ
る。なお、マウス13によるクリック操作は、キーボー
ド12のカーソルキーを移動してエンタキーを押す操作
により行ってもよい。
力するためのキーやテンキー、各種機能を実行するため
の機能キー、カーソルキー、等の各種キーが配置されて
いる。マウス13は、ポインティングデバイスであり、
表示装置14に表示されたキーやアイコン等をクリック
することで、対応する機能の指定を行う入力装置であ
る。なお、マウス13によるクリック操作は、キーボー
ド12のカーソルキーを移動してエンタキーを押す操作
により行ってもよい。
【0021】表示装置14は、例えばCRTや液晶ディ
スプレイ等が利用される。この表示装置14には、デー
タベースの表や、ヒューリスティクステーブルをユーザ
が設定する際の設定ダイアログ等が表示されるようにな
っている。印刷装置15は、表示装置14に表示された
文書や、記憶装置16の文書データベース164に格納
された文書等の印刷を行うためのものである。この印刷
装置15としては、レーザプリンタ、ドットプリンタ、
インクジェットプリンタ、ページプリンタ、感熱式プリ
ンタ、熱転写式プリンタ、等の各種印刷装置が利用され
る。
スプレイ等が利用される。この表示装置14には、デー
タベースの表や、ヒューリスティクステーブルをユーザ
が設定する際の設定ダイアログ等が表示されるようにな
っている。印刷装置15は、表示装置14に表示された
文書や、記憶装置16の文書データベース164に格納
された文書等の印刷を行うためのものである。この印刷
装置15としては、レーザプリンタ、ドットプリンタ、
インクジェットプリンタ、ページプリンタ、感熱式プリ
ンタ、熱転写式プリンタ、等の各種印刷装置が利用され
る。
【0022】記憶装置16は、読み書き可能な記憶媒体
と、その記憶媒体に対してプログラムやデータ等の各種
情報を読み書きするための駆動装置で構成されている。
この記憶装置16に利用される記憶媒体としては、主と
してハードディスクが利用されるが、後述の記憶媒体駆
動装置17で利用される各種記憶媒体のうちの読み書き
可能な記憶媒体を利用するようにしてもよい。記憶装置
16は、仮名漢字変換辞書161、類義語辞書162、
ヒューリスティクステーブル格納部163、プログラム
格納部164、データベース格納部165、設定ダイア
ログ格納部166、図示しないその他の格納部(例え
ば、この記憶装置16内に格納されているプログラムや
データ等をバックアップするための格納部)等を有して
いる。
と、その記憶媒体に対してプログラムやデータ等の各種
情報を読み書きするための駆動装置で構成されている。
この記憶装置16に利用される記憶媒体としては、主と
してハードディスクが利用されるが、後述の記憶媒体駆
動装置17で利用される各種記憶媒体のうちの読み書き
可能な記憶媒体を利用するようにしてもよい。記憶装置
16は、仮名漢字変換辞書161、類義語辞書162、
ヒューリスティクステーブル格納部163、プログラム
格納部164、データベース格納部165、設定ダイア
ログ格納部166、図示しないその他の格納部(例え
ば、この記憶装置16内に格納されているプログラムや
データ等をバックアップするための格納部)等を有して
いる。
【0023】プログラム格納部164には、本実施形態
におけるデータベース処理プログラム、類義語辞書によ
り取得項目名を適切な項目ラベルに解釈するプログラ
ム、構文解析により取得項目名を適切な項目ラベルに解
釈するプログラム等の各種プログラムの他、仮名漢字変
換辞書161を利用して入力された仮名文字列を漢字混
り文に変換する仮名漢字変換プログラム等の各種プログ
ラムが格納されている。
におけるデータベース処理プログラム、類義語辞書によ
り取得項目名を適切な項目ラベルに解釈するプログラ
ム、構文解析により取得項目名を適切な項目ラベルに解
釈するプログラム等の各種プログラムの他、仮名漢字変
換辞書161を利用して入力された仮名文字列を漢字混
り文に変換する仮名漢字変換プログラム等の各種プログ
ラムが格納されている。
【0024】データベース格納部165には、仮名漢字
変換プログラムにより作成されたデータベースの表や、
他の装置で作成されて記憶媒体駆動装置17や通信制御
装置18から読み込まれたデータベースが格納される。
このデータベース格納部165に格納される、データベ
ース項目や属性の入力形式は特に限定されるものではな
く、テキスト形式、HTML(Hyper Text Markup Lang
uage)形式、JIS形式等の各種形式のデータベースの
格納が可能である。
変換プログラムにより作成されたデータベースの表や、
他の装置で作成されて記憶媒体駆動装置17や通信制御
装置18から読み込まれたデータベースが格納される。
このデータベース格納部165に格納される、データベ
ース項目や属性の入力形式は特に限定されるものではな
く、テキスト形式、HTML(Hyper Text Markup Lang
uage)形式、JIS形式等の各種形式のデータベースの
格納が可能である。
【0025】設定ダイアログ格納部166には、設定ダ
イアログ(図4、6、8、10、12、14、及び1
7)を表示装置14に表示するための画像データ等が格
納されている。この設定ダイアログには、ユーザがキー
ボード12から項目ラベルと項目属性を入力することが
できる空欄が設けられている。
イアログ(図4、6、8、10、12、14、及び1
7)を表示装置14に表示するための画像データ等が格
納されている。この設定ダイアログには、ユーザがキー
ボード12から項目ラベルと項目属性を入力することが
できる空欄が設けられている。
【0026】記憶媒体駆動装置17は、CPU111が
外部の記憶媒体からコンピュータプログラムや文書を含
むデータ等を読み込むための駆動装置である。記憶媒体
に記憶されているコンピュータプログラム等には、本実
施形態のデータベース処理装置により実行される各種処
理のためのプログラム、及び、そこで利用される辞書、
データ等も含まれる。
外部の記憶媒体からコンピュータプログラムや文書を含
むデータ等を読み込むための駆動装置である。記憶媒体
に記憶されているコンピュータプログラム等には、本実
施形態のデータベース処理装置により実行される各種処
理のためのプログラム、及び、そこで利用される辞書、
データ等も含まれる。
【0027】ここで、記憶媒体とは、コンピュータプロ
グラムやデータ等が記憶される記憶媒体をいい、具体的
には、フロッピーディスク、ハードディスク、磁気テー
プ等の磁気記憶媒体、メモリチップやICカード等の半
導体記憶媒体、CD−ROMやMO、PD(相変化書換
型光ディスク)等の光学的に情報が読み取られる記憶媒
体、紙カードや紙テープ等の用紙(及び、用紙に相当す
る機能を持った媒体)を用いた記憶媒体、及びその他各
種方法でコンピュータプログラム等が記憶される記憶媒
体が含まれる。本実施形態のデータベース処理装置にお
いて利用される記憶媒体としては、主として、CD−R
OMやフロッピーディスクが利用される。記憶媒体駆動
装置17は、これらの各種記憶媒体からコンピュータプ
ログラムを読み込む他に、フロッピーディスクのような
書き込み可能な記憶媒体に対してRAM113や記憶装
置16に格納されているデータ等を書き込むことが可能
である。
グラムやデータ等が記憶される記憶媒体をいい、具体的
には、フロッピーディスク、ハードディスク、磁気テー
プ等の磁気記憶媒体、メモリチップやICカード等の半
導体記憶媒体、CD−ROMやMO、PD(相変化書換
型光ディスク)等の光学的に情報が読み取られる記憶媒
体、紙カードや紙テープ等の用紙(及び、用紙に相当す
る機能を持った媒体)を用いた記憶媒体、及びその他各
種方法でコンピュータプログラム等が記憶される記憶媒
体が含まれる。本実施形態のデータベース処理装置にお
いて利用される記憶媒体としては、主として、CD−R
OMやフロッピーディスクが利用される。記憶媒体駆動
装置17は、これらの各種記憶媒体からコンピュータプ
ログラムを読み込む他に、フロッピーディスクのような
書き込み可能な記憶媒体に対してRAM113や記憶装
置16に格納されているデータ等を書き込むことが可能
である。
【0028】本実施形態のデータベース処理装置1で
は、制御部11のCPU111が、記憶媒体駆動装置1
7にセットされた外部の記憶媒体からコンピュータプロ
グラムを読み込んで、記憶装置16の各部に格納(イン
ストール)する。そして、本実施形態による各種処理を
実行する場合、記憶装置16から該当プログラムをRA
M113に読み込み、実行するようになっている。
は、制御部11のCPU111が、記憶媒体駆動装置1
7にセットされた外部の記憶媒体からコンピュータプロ
グラムを読み込んで、記憶装置16の各部に格納(イン
ストール)する。そして、本実施形態による各種処理を
実行する場合、記憶装置16から該当プログラムをRA
M113に読み込み、実行するようになっている。
【0029】但し、記憶装置16からではなく、記憶媒
体駆動装置17により外部の記憶媒体から直接RAM1
13に読み込んで実行することも可能である。また、デ
ータベース処理装置によっては、本実施形態の項目属性
自動設定プログラム等を予めROM112に記憶してお
き、これをCPU111が実行するようにしてもよい。
体駆動装置17により外部の記憶媒体から直接RAM1
13に読み込んで実行することも可能である。また、デ
ータベース処理装置によっては、本実施形態の項目属性
自動設定プログラム等を予めROM112に記憶してお
き、これをCPU111が実行するようにしてもよい。
【0030】通信制御装置18は、他のパーソナルコン
ピュータやワードプロセッサ等との間でテキスト形式や
HTML形式等の各種形式の文書やビットマップデータ
等の各種データの送受信を行うことができるようになっ
ている。入出力I/F19は、音声や音楽等の出力を行
うスピーカ等の各種機器を接続するためのインターフェ
ースである。文字認識装置20は、用紙等に記載された
文字をテキスト形式やHTML等の各種形式で認識する
装置であり、イメージスキャナや文字認識プログラム等
で構成されている。なお、図示しない音声マイクから文
章を入力し、音声をテキスト形式に変換することによ
り、文字認識をするようにしてもよい。
ピュータやワードプロセッサ等との間でテキスト形式や
HTML形式等の各種形式の文書やビットマップデータ
等の各種データの送受信を行うことができるようになっ
ている。入出力I/F19は、音声や音楽等の出力を行
うスピーカ等の各種機器を接続するためのインターフェ
ースである。文字認識装置20は、用紙等に記載された
文字をテキスト形式やHTML等の各種形式で認識する
装置であり、イメージスキャナや文字認識プログラム等
で構成されている。なお、図示しない音声マイクから文
章を入力し、音声をテキスト形式に変換することによ
り、文字認識をするようにしてもよい。
【0031】本実施形態では、キーボード12の入力操
作により作成したデータベース(RAM113の所定格
納エリアに格納)の他、外部で作成して所定の記憶媒体
に格納した文書で記憶媒体駆動装置17から読み込んだ
文書、予め文書データベースに格納されているデータベ
ース、通信制御装置18からダウンロードしたデータベ
ース、及び文字認識装置20で文字認識したデータベー
ス、等の各種データベースを対象文書として取得するこ
とが可能である。
作により作成したデータベース(RAM113の所定格
納エリアに格納)の他、外部で作成して所定の記憶媒体
に格納した文書で記憶媒体駆動装置17から読み込んだ
文書、予め文書データベースに格納されているデータベ
ース、通信制御装置18からダウンロードしたデータベ
ース、及び文字認識装置20で文字認識したデータベー
ス、等の各種データベースを対象文書として取得するこ
とが可能である。
【0032】次に、予めデータベース処理装置1の記憶
装置16のヒューリスティクステーブル格納部163に
保存されているヒューリスティクステーブルと、それぞ
れのヒューリスティクステーブルに対応する手動入力の
ための設定ダイアログの例を図3から図17を参照して
説明する。
装置16のヒューリスティクステーブル格納部163に
保存されているヒューリスティクステーブルと、それぞ
れのヒューリスティクステーブルに対応する手動入力の
ための設定ダイアログの例を図3から図17を参照して
説明する。
【0033】CPU111は、予めすべてのヒューリス
ティクステーブルをヒューリスティクステーブル格納部
163から呼び出してヒューリスティクス格納エリア1
131に一時記憶させておくが、必要に応じてヒューリ
スティクステーブル格納部163からヒューリスティク
ステーブル格納エリア1131に呼び出して利用しても
よい。また、記憶媒体駆動装置17を用いてCD−RO
M等の記憶媒体からヒューリスティクステーブル格納エ
リア1131へ、インストールするようにしてもよい。
また、通信制御装置18を介してダウンロードするよう
にしてもよい。
ティクステーブルをヒューリスティクステーブル格納部
163から呼び出してヒューリスティクス格納エリア1
131に一時記憶させておくが、必要に応じてヒューリ
スティクステーブル格納部163からヒューリスティク
ステーブル格納エリア1131に呼び出して利用しても
よい。また、記憶媒体駆動装置17を用いてCD−RO
M等の記憶媒体からヒューリスティクステーブル格納エ
リア1131へ、インストールするようにしてもよい。
また、通信制御装置18を介してダウンロードするよう
にしてもよい。
【0034】図2は、表示装置14に表示されるデータ
ベース表2である。このデータベース表2は、項目名が
取得されるm行×n列のマス目が備わっており(m、n
は自然数)、例えば、最上段のA、B、C、D、Eの部
分に項目名がユーザにより入力される。また、データベ
ースのタイトル(データベース名)が取得されるデータ
ベース名入力欄22も備わっている。なお、このデータ
ベース表2はデータベース処理装置1の電源投入後、初
期画面として、表示装置14の画面に表示される。
ベース表2である。このデータベース表2は、項目名が
取得されるm行×n列のマス目が備わっており(m、n
は自然数)、例えば、最上段のA、B、C、D、Eの部
分に項目名がユーザにより入力される。また、データベ
ースのタイトル(データベース名)が取得されるデータ
ベース名入力欄22も備わっている。なお、このデータ
ベース表2はデータベース処理装置1の電源投入後、初
期画面として、表示装置14の画面に表示される。
【0035】図3は、項目ラベルとその項目ラベルに対
応する項目属性とを、経験的知識やルール等に基づいて
対応付けることにより、表にしたヒューリスティクステ
ーブルの概念図である。(以下、図3のヒューリスティ
クステーブルを「項目ラベル−属性テーブルHT1」と
する。) 図3に示されるように、項目ラベル−属性テーブルHT
1には、項目ラベルとして「年齢」、「身長」、「価
格」等が最左の欄に、それぞれの項目ラベルに対応する
項目属性として、行方向に「フィールド型」、「次
元」、「デフォルトの単位」(デフォルト;初期設定)
及び「値の範囲」が対応表としてまとめられている。
応する項目属性とを、経験的知識やルール等に基づいて
対応付けることにより、表にしたヒューリスティクステ
ーブルの概念図である。(以下、図3のヒューリスティ
クステーブルを「項目ラベル−属性テーブルHT1」と
する。) 図3に示されるように、項目ラベル−属性テーブルHT
1には、項目ラベルとして「年齢」、「身長」、「価
格」等が最左の欄に、それぞれの項目ラベルに対応する
項目属性として、行方向に「フィールド型」、「次
元」、「デフォルトの単位」(デフォルト;初期設定)
及び「値の範囲」が対応表としてまとめられている。
【0036】また、項目ラベル−属性テーブルHT1の
最右欄に「多義語」というチェック欄が設けられてい
る。項目ラベルが多義語の場合は項目属性が一意的に決
まらないので、多義語の個々について経験的知識やルー
ル等に基づいて対応付けられている項目属性は、項目ラ
ベル−属性テーブルHT1では空欄として設定する。そ
して、この「多義語」の欄に、例えば「○」をチェック
印として付しておく。なお、多義語についての項目属性
は、後述する多義語−属性判定テーブルHT6(図1
3)に、多義語の個々の意味に対応付けてまとめられて
いる。
最右欄に「多義語」というチェック欄が設けられてい
る。項目ラベルが多義語の場合は項目属性が一意的に決
まらないので、多義語の個々について経験的知識やルー
ル等に基づいて対応付けられている項目属性は、項目ラ
ベル−属性テーブルHT1では空欄として設定する。そ
して、この「多義語」の欄に、例えば「○」をチェック
印として付しておく。なお、多義語についての項目属性
は、後述する多義語−属性判定テーブルHT6(図1
3)に、多義語の個々の意味に対応付けてまとめられて
いる。
【0037】例えば、項目ラベルが「年齢」の場合に着
目すると、項目属性は経験則から以下のように設定され
ている。「年齢」は整数しかあり得ないので、フィール
ド型は整数型の数値が設定されている。また、「年齢」
には次元はないので、次元の属性は、(なし)と設定さ
れている。また、「年齢」のデフォルト(初期値)の単
位は(なし)とするか、「歳」等と設定されている。ま
た、人間の寿命を鑑みれば、「年齢」の項目属性である
「値の範囲」は最小値を0に設定し、最大値を150に
設定すれば十分であるので、0〜150が設定されてい
る。また、「年齢」は多義語ではないので「多義語」の
欄には、「○」が付されていない。
目すると、項目属性は経験則から以下のように設定され
ている。「年齢」は整数しかあり得ないので、フィール
ド型は整数型の数値が設定されている。また、「年齢」
には次元はないので、次元の属性は、(なし)と設定さ
れている。また、「年齢」のデフォルト(初期値)の単
位は(なし)とするか、「歳」等と設定されている。ま
た、人間の寿命を鑑みれば、「年齢」の項目属性である
「値の範囲」は最小値を0に設定し、最大値を150に
設定すれば十分であるので、0〜150が設定されてい
る。また、「年齢」は多義語ではないので「多義語」の
欄には、「○」が付されていない。
【0038】図4は、項目ラベル−属性テーブルHT1
(図3)の各欄についてユーザの新規入力により項目ラ
ベルと項目属性の対応関係を取得する場合や、既存の項
目ラベル−属性テーブルHT1を訂正する場合に用いる
設定ダイアログD1である。この設定ダイアログは、ユ
ーザ入力により、キーボード12を介して、空欄の項目
欄に、項目属性と、項目名とが入力される。(なお、以
下、本実施形態において、項目欄に、ある語句をユーザ
が手入力する場合は、上述したような設定ダイアログに
対する操作に準じて行われるものとし、この操作を以下
「ユーザ入力」とする。
(図3)の各欄についてユーザの新規入力により項目ラ
ベルと項目属性の対応関係を取得する場合や、既存の項
目ラベル−属性テーブルHT1を訂正する場合に用いる
設定ダイアログD1である。この設定ダイアログは、ユ
ーザ入力により、キーボード12を介して、空欄の項目
欄に、項目属性と、項目名とが入力される。(なお、以
下、本実施形態において、項目欄に、ある語句をユーザ
が手入力する場合は、上述したような設定ダイアログに
対する操作に準じて行われるものとし、この操作を以下
「ユーザ入力」とする。
【0039】CPU111は、この項目属性の設定結果
を取得し、ヒューリスティクステーブル格納エリア11
31にある、項目ラベル−属性テーブルHT1(図1)
の空欄行に、取得項目名と対応付けて、項目属性を一時
記憶させると同時に、ヒューリスティクステーブル格納
部163にも項目属性を記憶させる。設定ダイアログD
2からD7についても同様であるので、以下の設定ダイ
アログD2からD7についての、この説明は省略す
る。、
を取得し、ヒューリスティクステーブル格納エリア11
31にある、項目ラベル−属性テーブルHT1(図1)
の空欄行に、取得項目名と対応付けて、項目属性を一時
記憶させると同時に、ヒューリスティクステーブル格納
部163にも項目属性を記憶させる。設定ダイアログD
2からD7についても同様であるので、以下の設定ダイ
アログD2からD7についての、この説明は省略す
る。、
【0040】図5は、「単位表記」と「単位」の対応を
表にしたヒューリスティクステーブルの概念図である。
(以下、このヒューリスティクステーブルを「単位表記
−単位テーブルHT2」とする。) 一般に、データベース処理装置1に入力され取り扱われ
るデータは単位を付して表現するものが多い。しかし、
単位の表記方法はデータベース処理の目的やユーザのデ
ータベース作成の趣旨の相違から、一意的に決まらない
場合がある。
表にしたヒューリスティクステーブルの概念図である。
(以下、このヒューリスティクステーブルを「単位表記
−単位テーブルHT2」とする。) 一般に、データベース処理装置1に入力され取り扱われ
るデータは単位を付して表現するものが多い。しかし、
単位の表記方法はデータベース処理の目的やユーザのデ
ータベース作成の趣旨の相違から、一意的に決まらない
場合がある。
【0041】例えば、図5に示される「円」という項目
属性の単位の表記法は、「yen」、「円」若しくは「エ
ン」等が経験上使われている。そこで、図5に示すよう
な経験的に考えられる「単位表記」と「単位」の対応を
決定する単位表記−単位テーブルHT2を、ヒューリス
ティクス格納部163に予め蓄積しておく。なお、この
単位表記−単位テーブルHT2や後述する単位−次元−
基本単位テーブルHT3は、単位用語辞典やJIS用語
集等を用いて作成してもよい。
属性の単位の表記法は、「yen」、「円」若しくは「エ
ン」等が経験上使われている。そこで、図5に示すよう
な経験的に考えられる「単位表記」と「単位」の対応を
決定する単位表記−単位テーブルHT2を、ヒューリス
ティクス格納部163に予め蓄積しておく。なお、この
単位表記−単位テーブルHT2や後述する単位−次元−
基本単位テーブルHT3は、単位用語辞典やJIS用語
集等を用いて作成してもよい。
【0042】図6は、単位表記−単位テーブルHT2
(図5)の各欄についてユーザの新規入力により単位表
記と単位の対応関係を取得する場合や、既存の単位表記
−単位テーブルHT2を訂正する場合に用いる設定ダイ
アログD2である。
(図5)の各欄についてユーザの新規入力により単位表
記と単位の対応関係を取得する場合や、既存の単位表記
−単位テーブルHT2を訂正する場合に用いる設定ダイ
アログD2である。
【0043】図7は、「単位」と、「次元」と、「基本
単位」との対応をまとめたヒューリスティクステーブル
の概念図である。(以下、このヒューリスティクステー
ブルを「単位−次元−基本単位テーブルHT3」と定義
する。) 単位には、「次元」と「基本単位」という概念がある。
「次元」とは、一般に、ある物理量を「長さ」(L)、
「質量」(M)、「時間」(T)の基本量で表すための
ものである。ただし、本実施形態では「金額」等も広義
の次元としてみなして取り扱うこととする。
単位」との対応をまとめたヒューリスティクステーブル
の概念図である。(以下、このヒューリスティクステー
ブルを「単位−次元−基本単位テーブルHT3」と定義
する。) 単位には、「次元」と「基本単位」という概念がある。
「次元」とは、一般に、ある物理量を「長さ」(L)、
「質量」(M)、「時間」(T)の基本量で表すための
ものである。ただし、本実施形態では「金額」等も広義
の次元としてみなして取り扱うこととする。
【0044】「基本単位」とは、例えば、「長さ」につ
いては「メートル」、「質量」については「キログラ
ム」、「時間」については「秒」が基本単位である。そ
こで、項目属性として、「単位」が項目名に対応して存
在するとき、その「単位」の次元と、基本単位との関係
を経験的知識やルールに基づいて対応付けた単位−次元
−基本単位テーブルHT3をヒューリスティクステーブ
ル格納部163に予め蓄積しておく。
いては「メートル」、「質量」については「キログラ
ム」、「時間」については「秒」が基本単位である。そ
こで、項目属性として、「単位」が項目名に対応して存
在するとき、その「単位」の次元と、基本単位との関係
を経験的知識やルールに基づいて対応付けた単位−次元
−基本単位テーブルHT3をヒューリスティクステーブ
ル格納部163に予め蓄積しておく。
【0045】図8は、単位−次元−基本単位テーブルH
T3(図7)の各欄についてユーザの新規入力により、
単位と次元と基本単位の対応関係を取得する場合や、既
存のヒューリスティクスを訂正する場合に用いる設定ダ
イアログD3である。
T3(図7)の各欄についてユーザの新規入力により、
単位と次元と基本単位の対応関係を取得する場合や、既
存のヒューリスティクスを訂正する場合に用いる設定ダ
イアログD3である。
【0046】図9は、ある項目名に類義語が存在するか
否かを判定するためのヒューリスティクステーブルであ
る。(以下、このヒューリスティクスを「類義語辞書テ
ーブルHT4」とする。) 取得項目名に類義語がある場合は、取得項目名を類義語
まで広げて解釈しなければ既存のヒューリスティクステ
ーブルの項目ラベルと取得項目名とが一致せず、既存の
ヒューリスティクステーブルを利用できないときがあ
る。また、同様に、取得項目名に類義語がある場合は、
取得項目名を類義語まで広げて解釈しなければ、既存の
ヒューリスティクスの項目ラベルとが一致したとしても
対応する属性が複数存在してしまい一意的に項目属性を
決定できないときがある。従って、類義語辞書テーブル
HT4を利用して、取得項目名の類義語の有無の判定を
する必要がある。
否かを判定するためのヒューリスティクステーブルであ
る。(以下、このヒューリスティクスを「類義語辞書テ
ーブルHT4」とする。) 取得項目名に類義語がある場合は、取得項目名を類義語
まで広げて解釈しなければ既存のヒューリスティクステ
ーブルの項目ラベルと取得項目名とが一致せず、既存の
ヒューリスティクステーブルを利用できないときがあ
る。また、同様に、取得項目名に類義語がある場合は、
取得項目名を類義語まで広げて解釈しなければ、既存の
ヒューリスティクスの項目ラベルとが一致したとしても
対応する属性が複数存在してしまい一意的に項目属性を
決定できないときがある。従って、類義語辞書テーブル
HT4を利用して、取得項目名の類義語の有無の判定を
する必要がある。
【0047】そこで、図9に示される「類義語辞書テー
ブル」(以下、類義語辞書テーブルHT4とする。)を
ヒューリスティクス格納部163に予め蓄積させてお
く。なお、この類義語辞書テーブルHT4の作成時には
類義語辞書162が利用される。
ブル」(以下、類義語辞書テーブルHT4とする。)を
ヒューリスティクス格納部163に予め蓄積させてお
く。なお、この類義語辞書テーブルHT4の作成時には
類義語辞書162が利用される。
【0048】この類義語辞書162には、例えば「角川
類語新辞典」(角川書店発刊)のCD−ROMが使用さ
れており、記憶媒体駆動装置17により記憶装置16の
類義語辞書162にインストールされている。このよう
な類義語辞書はシソーラスとも呼ばれ、多数の同義語、
類義語などを意味により体系的に分類・整理した類語・
関連語が搭載されている。
類語新辞典」(角川書店発刊)のCD−ROMが使用さ
れており、記憶媒体駆動装置17により記憶装置16の
類義語辞書162にインストールされている。このよう
な類義語辞書はシソーラスとも呼ばれ、多数の同義語、
類義語などを意味により体系的に分類・整理した類語・
関連語が搭載されている。
【0049】図10は、類義語辞書テーブルHT4(図
9)の各欄についてユーザの新規入力により、項目ラベ
ルと類義語の対応関係を取得する場合や、既存の類義語
辞書テーブルHT4を訂正する場合に用いる設定ダイア
ログD4である。
9)の各欄についてユーザの新規入力により、項目ラベ
ルと類義語の対応関係を取得する場合や、既存の類義語
辞書テーブルHT4を訂正する場合に用いる設定ダイア
ログD4である。
【0050】図11は、取得項目名を表示装置14に表
示したり、印刷装置15からプリントアウトするとき
の、表示形式のヒューリスティクステーブルの概念図で
ある。図11で示されるように、項目ラベルが「年月
日」という文字列を含む場合は、「yyyymmdd」
の形式や「yyyy年mm月dd日」の形式を、対応付
けてヒューリスティクステーブルとして、ヒューリステ
ィクス格納部163に予め蓄積しておく。(以下、この
ヒューリスティクスを「表示形式テーブルHT5」とす
る。) 図12は、表示形式テーブルHT5(図11)の各欄に
ついてユーザの新規入力により、項目ラベルと類義語の
対応関係を取得する場合や、既存の表示形式テーブルH
T5を訂正する場合に用いる設定ダイアログD5であ
る。
示したり、印刷装置15からプリントアウトするとき
の、表示形式のヒューリスティクステーブルの概念図で
ある。図11で示されるように、項目ラベルが「年月
日」という文字列を含む場合は、「yyyymmdd」
の形式や「yyyy年mm月dd日」の形式を、対応付
けてヒューリスティクステーブルとして、ヒューリステ
ィクス格納部163に予め蓄積しておく。(以下、この
ヒューリスティクスを「表示形式テーブルHT5」とす
る。) 図12は、表示形式テーブルHT5(図11)の各欄に
ついてユーザの新規入力により、項目ラベルと類義語の
対応関係を取得する場合や、既存の表示形式テーブルH
T5を訂正する場合に用いる設定ダイアログD5であ
る。
【0051】図13は、ある項目ラベルの多義語が存在
する場合に、その項目ラベルと関連する項目ラベルを列
挙した「関連ラベル群」、「フィールド型」、「次
元」、及び「値の範囲」を、表にまとめたヒューリステ
ィクステーブルの概念図である。(以下、このヒューリ
スティクステーブルを、「多義語−属性判定テーブルH
T6」と定義する。)
する場合に、その項目ラベルと関連する項目ラベルを列
挙した「関連ラベル群」、「フィールド型」、「次
元」、及び「値の範囲」を、表にまとめたヒューリステ
ィクステーブルの概念図である。(以下、このヒューリ
スティクステーブルを、「多義語−属性判定テーブルH
T6」と定義する。)
【0052】例えば、多義語−属性判定テーブルHT6
(図13)に示すように「ランク」という多義語の項目
ラベルに着目すると、「ランク」には、経験上、「職務
の階級」の意味と「順位」の意味というように複数の意
味が存在する。「職務の階級」の意味としての「ラン
ク」の項目属性と、「順位」の意味としての「ランク」
の項目属性とは、全く異なるので、多義語に関しては、
それぞれの関連ラベル項目と項目ラベルとを対応付けて
多義語−属性判定テーブルHT6として、ヒューリステ
ィクス格納部163に予め蓄積しておく。
(図13)に示すように「ランク」という多義語の項目
ラベルに着目すると、「ランク」には、経験上、「職務
の階級」の意味と「順位」の意味というように複数の意
味が存在する。「職務の階級」の意味としての「ラン
ク」の項目属性と、「順位」の意味としての「ランク」
の項目属性とは、全く異なるので、多義語に関しては、
それぞれの関連ラベル項目と項目ラベルとを対応付けて
多義語−属性判定テーブルHT6として、ヒューリステ
ィクス格納部163に予め蓄積しておく。
【0053】図14は、多義語−属性判定テーブルHT
6(図13)の各欄についてユーザが新規に入力する場
合や、既存のヒューリスティクスを訂正する場合に用い
る設定ダイアログD6である。図15は、多義語−属性
判定テーブルHT6(図13)の「フィールド型」の欄
の属性についてユーザが任意に選択する場合に用いる設
定ダイアログD6’である。
6(図13)の各欄についてユーザが新規に入力する場
合や、既存のヒューリスティクスを訂正する場合に用い
る設定ダイアログD6である。図15は、多義語−属性
判定テーブルHT6(図13)の「フィールド型」の欄
の属性についてユーザが任意に選択する場合に用いる設
定ダイアログD6’である。
【0054】図16は、項目ラベルにある修飾語が冠さ
れている場合に、「項目ラベル」と「修飾語」と「フィ
ールド型」とを対応付けて、まとめたヒューリスティク
ステーブルである。(以下、このヒューリスティクステ
ーブルを、「修飾語−フィールド型判定テーブルHT
7」とする。)
れている場合に、「項目ラベル」と「修飾語」と「フィ
ールド型」とを対応付けて、まとめたヒューリスティク
ステーブルである。(以下、このヒューリスティクステ
ーブルを、「修飾語−フィールド型判定テーブルHT
7」とする。)
【0055】図17は、修飾語−フィールド型判定テー
ブルHT7(図16)の各欄についてユーザの新規入力
により項目ラベルとその修飾語とフィールド型の対応関
係を取得する場合や、既存の修飾語−フィールド型判定
テーブルHT7を訂正する場合に用いる設定ダイアログ
D7である。
ブルHT7(図16)の各欄についてユーザの新規入力
により項目ラベルとその修飾語とフィールド型の対応関
係を取得する場合や、既存の修飾語−フィールド型判定
テーブルHT7を訂正する場合に用いる設定ダイアログ
D7である。
【0056】次に、以上の基本構成を備える、データベ
ース処理装置1による、項目属性自動設定処理の基本動
作について、図18から図22を参照して説明する。図
18(ステップ1〜11)と図19(ステップ12〜2
0)は、データベース処理装置1による項目属性自動設
定処理のメインルーチンのフローチャートである。ま
ず、CPU111は、データベース処理装置1に電源が
供給された後、記憶装置16のプログラム格納部164
にあるデータベース処理プログラムを立ち上げる。そし
て、CPU111は、ユーザからデータベース新規作成
の選択の指示を受け、データベース処理装置1による処
理を開始する(ステップ1;Y)。この選択の指示は、
ユーザがマウス13により表示装置14に表示される所
定のアイコンが選択され行われる。
ース処理装置1による、項目属性自動設定処理の基本動
作について、図18から図22を参照して説明する。図
18(ステップ1〜11)と図19(ステップ12〜2
0)は、データベース処理装置1による項目属性自動設
定処理のメインルーチンのフローチャートである。ま
ず、CPU111は、データベース処理装置1に電源が
供給された後、記憶装置16のプログラム格納部164
にあるデータベース処理プログラムを立ち上げる。そし
て、CPU111は、ユーザからデータベース新規作成
の選択の指示を受け、データベース処理装置1による処
理を開始する(ステップ1;Y)。この選択の指示は、
ユーザがマウス13により表示装置14に表示される所
定のアイコンが選択され行われる。
【0057】次に、CPU111は、データベース新規
作成の前に、RAM113の各エリアに格納されている
すべてのデータをクリアする(ステップ2)。そして、
CPU111は、ユーザからの必要な項目名取得のため
に、データベース格納部165に保存されている、デー
タベース表2(図2)(以下、「データベース2」とす
る。)とデータベースのタイトル欄22とを、データベ
ース格納エリア1132に保存すると共に、表示装置1
4に表示する(ステップ3)。
作成の前に、RAM113の各エリアに格納されている
すべてのデータをクリアする(ステップ2)。そして、
CPU111は、ユーザからの必要な項目名取得のため
に、データベース格納部165に保存されている、デー
タベース表2(図2)(以下、「データベース2」とす
る。)とデータベースのタイトル欄22とを、データベ
ース格納エリア1132に保存すると共に、表示装置1
4に表示する(ステップ3)。
【0058】CPU111はユーザ入力によりデータベ
ースのタイトルをデータベース名欄22に取得すると、
この取得タイトルを、データベース格納エリア1132
に保存すると共に、データベース名欄22に表示する
(ステップ4)。この際、ユーザは、データベース名欄
22に、データベース名を、ユーザがキーボード12か
ら仮名漢字変換辞書161を使って入力する。また、こ
のデータベース名は、データベース完成後、データベー
ス格納部165等に記憶させるときのファイル名として
利用される。
ースのタイトルをデータベース名欄22に取得すると、
この取得タイトルを、データベース格納エリア1132
に保存すると共に、データベース名欄22に表示する
(ステップ4)。この際、ユーザは、データベース名欄
22に、データベース名を、ユーザがキーボード12か
ら仮名漢字変換辞書161を使って入力する。また、こ
のデータベース名は、データベース完成後、データベー
ス格納部165等に記憶させるときのファイル名として
利用される。
【0059】次に、ユーザ入力により図2のデータベー
スの表2の所望の位置の項目欄21内、例えば最上段の
項目欄A、B、C、D、Eに必要な項目名が取得される
と、CPU111は、この取得項目名を、所望の位置に
表示するとともに、データベース格納エリア1132に
一時記憶させる(ステップ5)。以降、CPU111は
取得項目名に対応する、ヒューリスティクステーブルの
項目ラベルを索引として、ヒューリスティクステーブル
を調べ、その項目ラベルに対応付けられている項目属性
を自動設定する。なお、項目属性の自動設定は、CPU
111が項目名をユーザ入力により取得後、ユーザから
の「属性設定」というメニューの選択指示を受け、項目
属性が自動設定されるようにしてもよい。
スの表2の所望の位置の項目欄21内、例えば最上段の
項目欄A、B、C、D、Eに必要な項目名が取得される
と、CPU111は、この取得項目名を、所望の位置に
表示するとともに、データベース格納エリア1132に
一時記憶させる(ステップ5)。以降、CPU111は
取得項目名に対応する、ヒューリスティクステーブルの
項目ラベルを索引として、ヒューリスティクステーブル
を調べ、その項目ラベルに対応付けられている項目属性
を自動設定する。なお、項目属性の自動設定は、CPU
111が項目名をユーザ入力により取得後、ユーザから
の「属性設定」というメニューの選択指示を受け、項目
属性が自動設定されるようにしてもよい。
【0060】以下、この項目属性の自動設定のための処
理について説明する。CPU111は、データベース格
納エリア1132に、上述のようにデータベースのタイ
トルと項目名を取得・保存後(ステップ4、ステップ
5)、単位表記−単位テーブルHT2(図5)を参照し
て、取得項目名に単位情報が含まれるかどうかを判断す
る(ステップ6)。
理について説明する。CPU111は、データベース格
納エリア1132に、上述のようにデータベースのタイ
トルと項目名を取得・保存後(ステップ4、ステップ
5)、単位表記−単位テーブルHT2(図5)を参照し
て、取得項目名に単位情報が含まれるかどうかを判断す
る(ステップ6)。
【0061】すなわち、単位表記−単位テーブルHT2
には、単位の国際規格等のルールに基づいて単位表記と
単位とが対応付けられており、CPU111は、取得項
目名に、単位表記−単位テーブルHT2にある単位表記
のいずれかが含まれているかどうかを調べる(ステップ
6)。CPU111は、取得項目に単位表記が含まれて
いる場合(ステップ6;Y)、この単位表記から単位に
ついての項目属性を判定するための、サブルーチン1の
処理(ステップ7)を行なった後、取得項目名と同一名
の項目ラベルが項目ラベル−属性テーブルHT1(図
3)にあるかどうかを判断する(ステップ8)。
には、単位の国際規格等のルールに基づいて単位表記と
単位とが対応付けられており、CPU111は、取得項
目名に、単位表記−単位テーブルHT2にある単位表記
のいずれかが含まれているかどうかを調べる(ステップ
6)。CPU111は、取得項目に単位表記が含まれて
いる場合(ステップ6;Y)、この単位表記から単位に
ついての項目属性を判定するための、サブルーチン1の
処理(ステップ7)を行なった後、取得項目名と同一名
の項目ラベルが項目ラベル−属性テーブルHT1(図
3)にあるかどうかを判断する(ステップ8)。
【0062】一方、取得項目名に単位情報が含まれてい
ない場合(ステップ6;N)も、CPU111は、取得
項目名と同一名の項目ラベルが項目ラベル−属性テーブ
ルHT1(図3)にあるかどうかを判断する(ステップ
8)。すなわち、ステップ8において、CPU111は
ヒューリスティクステーブル格納エリア1131に記憶
されている項目ラベル−属性テーブルHT1を参照し
て、データベース格納エリア1132に既に格納されて
いる取得項目名と、同一の項目ラベルが存在するかどう
かを判断する。
ない場合(ステップ6;N)も、CPU111は、取得
項目名と同一名の項目ラベルが項目ラベル−属性テーブ
ルHT1(図3)にあるかどうかを判断する(ステップ
8)。すなわち、ステップ8において、CPU111は
ヒューリスティクステーブル格納エリア1131に記憶
されている項目ラベル−属性テーブルHT1を参照し
て、データベース格納エリア1132に既に格納されて
いる取得項目名と、同一の項目ラベルが存在するかどう
かを判断する。
【0063】そして、取得項目名と同一の項目ラベルが
存在しない場合(ステップ8;N)、CPU111は、
意味レベルで取得項目名を解釈して、取得項目名の項目
属性を判定するサブルーチン2の処理(ステップ9)を
行う。一方、取得項目名と同一名の項目ラベルがあれば
(ステップ8;Y)、CPU111は、文字レベルで
(字句通りに)取得項目名を解釈して、取得項目名の項
目属性を判定するサブルーチン3の処理(ステップ1
0)を行う。
存在しない場合(ステップ8;N)、CPU111は、
意味レベルで取得項目名を解釈して、取得項目名の項目
属性を判定するサブルーチン2の処理(ステップ9)を
行う。一方、取得項目名と同一名の項目ラベルがあれば
(ステップ8;Y)、CPU111は、文字レベルで
(字句通りに)取得項目名を解釈して、取得項目名の項
目属性を判定するサブルーチン3の処理(ステップ1
0)を行う。
【0064】サブルーチン1から3の処理により、CP
U111は、ユーザのデータベース作成の趣旨に沿い、
かつ蓄積されている既存のヒューリスティクステーブル
をできる限り利用できるように、取得項目名を、必要に
応じてデータベース名も考慮して解釈し、取得項目名に
対応する項目ラベルを索引として利用して項目属性を自
動設定する。そして、この項目属性の自動設定の結果
が、表示装置14に表示される(ステップ11)。
U111は、ユーザのデータベース作成の趣旨に沿い、
かつ蓄積されている既存のヒューリスティクステーブル
をできる限り利用できるように、取得項目名を、必要に
応じてデータベース名も考慮して解釈し、取得項目名に
対応する項目ラベルを索引として利用して項目属性を自
動設定する。そして、この項目属性の自動設定の結果
が、表示装置14に表示される(ステップ11)。
【0065】その後、CPU111は、このように決定
された項目属性のうち、表示装置14に表示したり、印
刷装置15から印刷したりするときの表示形式を決定す
るために、項目属性の表示形式が複数あるものがあるか
否かを判断する(ステップ12)。(以下、ステップ1
2からステップ20は、図19を参照)
された項目属性のうち、表示装置14に表示したり、印
刷装置15から印刷したりするときの表示形式を決定す
るために、項目属性の表示形式が複数あるものがあるか
否かを判断する(ステップ12)。(以下、ステップ1
2からステップ20は、図19を参照)
【0066】この際、CPU111は、ヒューリスティ
クステーブル格納部163に格納されている、表示形式
テーブルHT5(図11)をヒューリスティクス格納エ
リア1131に呼び出し、既にデータベース格納エリア
に格納されている取得項目名に、表示形式テーブルHT
5の最左欄の項目ラベル、例えば、「年月日」という文
字列が含まれるかどうかを判断する。そして、CPU1
11は取得項目名に「年月日」という文字列が含まれて
いると判断した場合は、この取得項目名の項目属性につ
いて表示形式が複数あると判定する(ステップ13;
Y)。
クステーブル格納部163に格納されている、表示形式
テーブルHT5(図11)をヒューリスティクス格納エ
リア1131に呼び出し、既にデータベース格納エリア
に格納されている取得項目名に、表示形式テーブルHT
5の最左欄の項目ラベル、例えば、「年月日」という文
字列が含まれるかどうかを判断する。そして、CPU1
11は取得項目名に「年月日」という文字列が含まれて
いると判断した場合は、この取得項目名の項目属性につ
いて表示形式が複数あると判定する(ステップ13;
Y)。
【0067】次に、CPU111は、表示装置14に、
取得項目名のフィールド属性項目の一つに表示形式が複
数ある旨と、その複数の表示形式、例えば、入力データ
yyyymmddに対して「yyyymmdd」形式
と、「yyyy年mm月dd日」形式等がある旨を、表
示装置14に表示し、ユーザの選択を促す(ステップ1
4)。ユーザによる表示形式の選択が表示装置14の画
面上でマウス13によるクリックにより行われた後、C
PU111は選択された表示形式をデータベース格納エ
リア1132に格納する(ステップ15)。
取得項目名のフィールド属性項目の一つに表示形式が複
数ある旨と、その複数の表示形式、例えば、入力データ
yyyymmddに対して「yyyymmdd」形式
と、「yyyy年mm月dd日」形式等がある旨を、表
示装置14に表示し、ユーザの選択を促す(ステップ1
4)。ユーザによる表示形式の選択が表示装置14の画
面上でマウス13によるクリックにより行われた後、C
PU111は選択された表示形式をデータベース格納エ
リア1132に格納する(ステップ15)。
【0068】なお、ユーザからの指定がなければ、表示
形式はデフォルト(初期設定)のままとしてもよいし、
最近利用した表示形式を優先してもよい。また、利用頻
度の多い表示形式を優先してもよい。
形式はデフォルト(初期設定)のままとしてもよいし、
最近利用した表示形式を優先してもよい。また、利用頻
度の多い表示形式を優先してもよい。
【0069】次に、以上で決定された項目属性が適切か
どうかのユーザによる判断結果を取得するために、CP
U111は「項目属性は適切に決定されたか?」という
問いと、「はい」、「いいえ」の文字を、アイコンとし
て表示装置14に表示させる(ステップ16)。ユーザ
が当該項目属性が適切に決定されたと判断した場合は
(ステップ17;Y)、CPU111は、表示装置14
の画面上でのユーザのマウス13による、「はい」のア
イコンのクリックにより、ユーザから項目属性は適切に
決定された旨の指示を取得する。
どうかのユーザによる判断結果を取得するために、CP
U111は「項目属性は適切に決定されたか?」という
問いと、「はい」、「いいえ」の文字を、アイコンとし
て表示装置14に表示させる(ステップ16)。ユーザ
が当該項目属性が適切に決定されたと判断した場合は
(ステップ17;Y)、CPU111は、表示装置14
の画面上でのユーザのマウス13による、「はい」のア
イコンのクリックにより、ユーザから項目属性は適切に
決定された旨の指示を取得する。
【0070】このユーザからの指示により、CPU11
1は、ユーザの自動設定の項目属性結果が適切である旨
の判断結果を得る(ステップ17;Y)。
1は、ユーザの自動設定の項目属性結果が適切である旨
の判断結果を得る(ステップ17;Y)。
【0071】一方、ユーザによる表示装置14の画面上
でユーザのマウス13による、「いいえ」のアイコンの
クリックにより、ユーザから項目属性の結果が適切でな
い旨の判断が取得されたときは(ステップ17;N)、
以下のような処理が行われる。
でユーザのマウス13による、「いいえ」のアイコンの
クリックにより、ユーザから項目属性の結果が適切でな
い旨の判断が取得されたときは(ステップ17;N)、
以下のような処理が行われる。
【0072】まず、ユーザが適切でないと判断した項目
属性は、ユーザによりその項目属性が表示されているマ
ス目部がクリックされる。このクリックの指示を受けた
CPU111は、表示装置14の画面上に、適切でない
項目属性を含む設定ダイアログを呼び出して表示する。
その後、CPU111は、ユーザ入力により、設定ダイ
アログで修正すべき項目の修正の指示を受ける(ステッ
プ18)。このような修正後、CPU111は、ユーザ
の設定ダイアログの「設定」のアイコンのマウス13に
よるクリックの指示を受け、修正された項目属性を、取
得項目名とともに対応付けて、図3で示される項目ラベ
ル−属性テーブルHT1に追加・記憶されるようにヒュ
ーリスティクス格納部163に保存する(ステップ1
9)。
属性は、ユーザによりその項目属性が表示されているマ
ス目部がクリックされる。このクリックの指示を受けた
CPU111は、表示装置14の画面上に、適切でない
項目属性を含む設定ダイアログを呼び出して表示する。
その後、CPU111は、ユーザ入力により、設定ダイ
アログで修正すべき項目の修正の指示を受ける(ステッ
プ18)。このような修正後、CPU111は、ユーザ
の設定ダイアログの「設定」のアイコンのマウス13に
よるクリックの指示を受け、修正された項目属性を、取
得項目名とともに対応付けて、図3で示される項目ラベ
ル−属性テーブルHT1に追加・記憶されるようにヒュ
ーリスティクス格納部163に保存する(ステップ1
9)。
【0073】以上の図18及び19に示されるメインル
ーチンの処理により、ユーザにより入力され、CPU1
11が取得した項目名に対する項目属性や表示形式が自
動設定される。また、自動設定することができなかった
取得項目名に対する項目属性は、新たにヒューリスティ
クステーブルに追加・記憶されることになるので、以降
は自動設定されるようになる。
ーチンの処理により、ユーザにより入力され、CPU1
11が取得した項目名に対する項目属性や表示形式が自
動設定される。また、自動設定することができなかった
取得項目名に対する項目属性は、新たにヒューリスティ
クステーブルに追加・記憶されることになるので、以降
は自動設定されるようになる。
【0074】なお、設定された項目属性は、データベー
ス2に、ユーザ入力により項目名に対して各データが取
得されるとき、表示装置14には表示されるようにして
もよい。あるいは、ユーザからの項目属性設定の指示を
受け表示されるようにしてもよい。このとき、ユーザが
ある取得項目をキーボード12で範囲指定をしてから、
タスクバーにある「項目属性設定」の文字をマウス13
でクリックすることで、設定ダイアログD1等の形式で
表示される。ユーザは、この設定ダイアログD1等の表
示を見ながら、項目属性を更に変更することも可能であ
り、CPU111は、ユーザからの変更指示を受け、項
目属性を設定し直すことができる。
ス2に、ユーザ入力により項目名に対して各データが取
得されるとき、表示装置14には表示されるようにして
もよい。あるいは、ユーザからの項目属性設定の指示を
受け表示されるようにしてもよい。このとき、ユーザが
ある取得項目をキーボード12で範囲指定をしてから、
タスクバーにある「項目属性設定」の文字をマウス13
でクリックすることで、設定ダイアログD1等の形式で
表示される。ユーザは、この設定ダイアログD1等の表
示を見ながら、項目属性を更に変更することも可能であ
り、CPU111は、ユーザからの変更指示を受け、項
目属性を設定し直すことができる。
【0075】次に、サブルーチン1(図18のステップ
7)による処理について、図20を参照して説明する。
サブルーチン1は、メインルーチン(図18)のステッ
プ6で、CPU111が取得項目名に単位情報を含むと
判断した場合に、この単位情報に基づいて、単位の項目
属性を設定するためのフローチャートである。
7)による処理について、図20を参照して説明する。
サブルーチン1は、メインルーチン(図18)のステッ
プ6で、CPU111が取得項目名に単位情報を含むと
判断した場合に、この単位情報に基づいて、単位の項目
属性を設定するためのフローチャートである。
【0076】まず、CPU111は、データベース格納
エリア1132に記憶されている取得項目名が単位情報
(単位表記)を含む場合は(図18のステップ6;
Y)、単位情報を抽出し、抽出された単位情報をデータ
ベース格納エリア1132に保存されている項目属性の
「単位」の欄に記憶させる(ステップ101)。これに
より、CPU111は、以降の処理による項目属性の自
動設定によりいずれの単位が項目属性として決定された
場合であってもその単位は無視して、この抽出された単
位情報による単位の項目属性を優先適用する。
エリア1132に記憶されている取得項目名が単位情報
(単位表記)を含む場合は(図18のステップ6;
Y)、単位情報を抽出し、抽出された単位情報をデータ
ベース格納エリア1132に保存されている項目属性の
「単位」の欄に記憶させる(ステップ101)。これに
より、CPU111は、以降の処理による項目属性の自
動設定によりいずれの単位が項目属性として決定された
場合であってもその単位は無視して、この抽出された単
位情報による単位の項目属性を優先適用する。
【0077】次に、CPU111は、この抽出された単
位情報が「次元」で表される単位かどうかを判断する
(ステップ102)。すなわち、CPU111は、ヒュ
ーリスティクステーブル格納部163に格納されてい
る、単位−次元−基本単位テーブルHT3(図7)をヒ
ューリスティクス格納エリア1131に呼び出す。そし
て、既にデータベース格納エリア1132に格納されて
いる単位情報と、単位−次元−基本単位テーブルHT3
の最左欄の「単位」の各項目名を照合する。そして、こ
の単位情報と一致する「単位」が存在すれば(ステップ
102;Y)、CPU111は、その「単位」に対応す
る「次元」を、単位−次元−基本単位テーブルHT3か
ら抽出し、データベース格納エリア1132に記憶させ
る。
位情報が「次元」で表される単位かどうかを判断する
(ステップ102)。すなわち、CPU111は、ヒュ
ーリスティクステーブル格納部163に格納されてい
る、単位−次元−基本単位テーブルHT3(図7)をヒ
ューリスティクス格納エリア1131に呼び出す。そし
て、既にデータベース格納エリア1132に格納されて
いる単位情報と、単位−次元−基本単位テーブルHT3
の最左欄の「単位」の各項目名を照合する。そして、こ
の単位情報と一致する「単位」が存在すれば(ステップ
102;Y)、CPU111は、その「単位」に対応す
る「次元」を、単位−次元−基本単位テーブルHT3か
ら抽出し、データベース格納エリア1132に記憶させ
る。
【0078】これにより、CPU111は、以降の処理
による項目属性の自動設定によりいずれの次元が項目属
性として決定された場合であってもその次元は無視し
て、この抽出された次元による単位の項目属性を優先適
用する。
による項目属性の自動設定によりいずれの次元が項目属
性として決定された場合であってもその次元は無視し
て、この抽出された次元による単位の項目属性を優先適
用する。
【0079】一方、データベース格納エリア1132に
格納されている単位情報に対応する「単位」が、単位−
次元−基本単位テーブルHT3(図7)に存在しない場
合、その単位には「次元」が存在しないと判断できるの
で(ステップ102;N)、CPU111は、項目属性
の次元に対して、「次元なし」として取り扱うことを決
定し、データベース格納エリア1132のデータベース
の「次元」の欄に「なし」と記憶させる(ステップ10
5)。
格納されている単位情報に対応する「単位」が、単位−
次元−基本単位テーブルHT3(図7)に存在しない場
合、その単位には「次元」が存在しないと判断できるの
で(ステップ102;N)、CPU111は、項目属性
の次元に対して、「次元なし」として取り扱うことを決
定し、データベース格納エリア1132のデータベース
の「次元」の欄に「なし」と記憶させる(ステップ10
5)。
【0080】CPU111は、項目属性の「次元」をデ
ータベース格納エリア1132に格納後(ステップ10
4)、又は単位情報に対して、項目属性の「次元」がな
いことの決定後(ステップ105)、取得項目名から単
位情報を除いた単語を取得項目名とみなして、取得項目
名を解釈し(ステップ106)、図18のメインルーチ
ンのステップ8へリターンする。
ータベース格納エリア1132に格納後(ステップ10
4)、又は単位情報に対して、項目属性の「次元」がな
いことの決定後(ステップ105)、取得項目名から単
位情報を除いた単語を取得項目名とみなして、取得項目
名を解釈し(ステップ106)、図18のメインルーチ
ンのステップ8へリターンする。
【0081】このようにサブルーチン1による処理によ
り、取得項目が単位情報(単位表記)を含む場合には、
CPU111は、単位情報を抽出し、項目属性の「単
位」に利用できるように、単位情報をデータベース格納
エリア1132に記憶させる。また、単位情報に対応す
る「次元」が存在する場合には、項目属性の「次元」に
利用できるように、その「次元」をデータベース格納エ
リア1132に記憶させる。このようにして、取得項目
名に対する「単位」と「次元」の項目属性がユーザの意
図に基づき最適に自動設定される。
り、取得項目が単位情報(単位表記)を含む場合には、
CPU111は、単位情報を抽出し、項目属性の「単
位」に利用できるように、単位情報をデータベース格納
エリア1132に記憶させる。また、単位情報に対応す
る「次元」が存在する場合には、項目属性の「次元」に
利用できるように、その「次元」をデータベース格納エ
リア1132に記憶させる。このようにして、取得項目
名に対する「単位」と「次元」の項目属性がユーザの意
図に基づき最適に自動設定される。
【0082】次に、サブルーチン2(図18のステップ
9)の処理について、図21を参照して説明する。サブ
ルーチン2では、ヒューリスティクステーブルに取得項
目名と同一の項目ラベルがない場合に(図18のメイン
ルーチンのステップ8;N)、CPU111が意味レベ
ルで取得項目名を所定の方法で解釈し、既存のヒューリ
スティクステーブルにある項目ラベルを索引としてヒュ
ーリスティクステーブルを参照し、、意味レベルで、取
得項目名を解釈してこの項目ラベルに対応付けられてい
る項目属性を決定する。
9)の処理について、図21を参照して説明する。サブ
ルーチン2では、ヒューリスティクステーブルに取得項
目名と同一の項目ラベルがない場合に(図18のメイン
ルーチンのステップ8;N)、CPU111が意味レベ
ルで取得項目名を所定の方法で解釈し、既存のヒューリ
スティクステーブルにある項目ラベルを索引としてヒュ
ーリスティクステーブルを参照し、、意味レベルで、取
得項目名を解釈してこの項目ラベルに対応付けられてい
る項目属性を決定する。
【0083】まず、CPU111は、取得項目名につい
て以下のように構文解析1により取得項目名が2個以上
の単語からなるかを判断する(S201)。なお、この
構文解析1と、以下の構文解析2は、仮名漢字変換や機
械翻訳等に一般的に適用される公知の方法に基づいて行
われる。
て以下のように構文解析1により取得項目名が2個以上
の単語からなるかを判断する(S201)。なお、この
構文解析1と、以下の構文解析2は、仮名漢字変換や機
械翻訳等に一般的に適用される公知の方法に基づいて行
われる。
【0084】次に、CPU111は構文解析1により取
得項目名は、2個以上の単語(合成語等)からなると判
断した場合は(ステップ202;Y)、さらに、取得項
目名の単語間の関係を構文解析2により解析する(S2
02)。この構文解析2により、どの単語が主格で、ど
の単語が従属格か(その修飾語はどれか)を解析し、主
格の単語を取得項目名とみなし、その主格の単語と同一
の項目ラベルを索引とする項目ラベル−属性テーブルH
T1とHT7を参照し(ステップ205)、項目属性を
決定する(ステップ206)。
得項目名は、2個以上の単語(合成語等)からなると判
断した場合は(ステップ202;Y)、さらに、取得項
目名の単語間の関係を構文解析2により解析する(S2
02)。この構文解析2により、どの単語が主格で、ど
の単語が従属格か(その修飾語はどれか)を解析し、主
格の単語を取得項目名とみなし、その主格の単語と同一
の項目ラベルを索引とする項目ラベル−属性テーブルH
T1とHT7を参照し(ステップ205)、項目属性を
決定する(ステップ206)。
【0085】この場合は、CPU111は、原則とし
て、図3の項目ラベル−属性テーブルHT1に基づい
て、主格の単語の項目属性を、取得項目名の項目属性と
して決定する。しかし、修飾語−フィールド型判定テー
ブルHT7(図16)の項目ラベルの欄に、この主格の
単語が存在し、かつ取得項目名の中の修飾語がHT7の
修飾語欄にある場合は、前記原則として決定された主格
の単語の項目属性を一部変更する。例えば、取得項目名
が「平均年齢」の場合の主格は「年齢」であり、このフ
ィールド型は、項目ラベル−属性テーブルHT1によれ
ば、「数値(整数型)」であるが、修飾語−フィールド
型判定テーブルHT7により、CPU111は、フィー
ルド型を「数値(実数型)」に変更する。
て、図3の項目ラベル−属性テーブルHT1に基づい
て、主格の単語の項目属性を、取得項目名の項目属性と
して決定する。しかし、修飾語−フィールド型判定テー
ブルHT7(図16)の項目ラベルの欄に、この主格の
単語が存在し、かつ取得項目名の中の修飾語がHT7の
修飾語欄にある場合は、前記原則として決定された主格
の単語の項目属性を一部変更する。例えば、取得項目名
が「平均年齢」の場合の主格は「年齢」であり、このフ
ィールド型は、項目ラベル−属性テーブルHT1によれ
ば、「数値(整数型)」であるが、修飾語−フィールド
型判定テーブルHT7により、CPU111は、フィー
ルド型を「数値(実数型)」に変更する。
【0086】次に、CPU111は、取得項目名に対す
る項目属性が一つに決定された場合は(ステップ21
1;N)決定・選択された項目属性をデータベース格納
エリア1132に記憶させ、メインルーチンにリターン
する。一方、CPU111は、取得項目名に対する項目
属性が複数決定された場合は(ステップ211;Y)、
その複数の項目属性の候補を表示装置14に表示しユー
ザに選択させる(ステップ212)。この複数の項目属
性の候補の表示装置14への表示は、項目属性候補で各
欄が埋まった設定ダイアログD1(図4)を複数個、画
面上に開いて行われ、ユーザは選択すべき項目属性を表
示する設定ダイアログD1の「設定」のアイコンをクリ
ックすることで、最適項目属性を選択する。
る項目属性が一つに決定された場合は(ステップ21
1;N)決定・選択された項目属性をデータベース格納
エリア1132に記憶させ、メインルーチンにリターン
する。一方、CPU111は、取得項目名に対する項目
属性が複数決定された場合は(ステップ211;Y)、
その複数の項目属性の候補を表示装置14に表示しユー
ザに選択させる(ステップ212)。この複数の項目属
性の候補の表示装置14への表示は、項目属性候補で各
欄が埋まった設定ダイアログD1(図4)を複数個、画
面上に開いて行われ、ユーザは選択すべき項目属性を表
示する設定ダイアログD1の「設定」のアイコンをクリ
ックすることで、最適項目属性を選択する。
【0087】CPU111は、このようにしてユーザの
選択により決定された項目属性をデータベース格納エリ
ア1132に記憶させ、メインルーチン(図18)にリ
ターンする。一方、CPU111は、構文解析により取
得項目名は一つの単語からなると判断した場合は(ステ
ップ202;N)、取得項目名が類義語辞書テーブルH
T4にあるかどうかを判断する(ステップ207)。C
PU111は、取得項目名が類義語辞書テーブルHT4
にあると判断した場合は(ステップ207;Y)、その
類義語辞書テーブルHT4からすべての類義語を作業エ
リア1134に抽出する(ステップ208)。
選択により決定された項目属性をデータベース格納エリ
ア1132に記憶させ、メインルーチン(図18)にリ
ターンする。一方、CPU111は、構文解析により取
得項目名は一つの単語からなると判断した場合は(ステ
ップ202;N)、取得項目名が類義語辞書テーブルH
T4にあるかどうかを判断する(ステップ207)。C
PU111は、取得項目名が類義語辞書テーブルHT4
にあると判断した場合は(ステップ207;Y)、その
類義語辞書テーブルHT4からすべての類義語を作業エ
リア1134に抽出する(ステップ208)。
【0088】そして、CPU111は、多義語−属性判
定テーブルHT6(図13)や、既に取得・記憶されて
いるデータベース名を考慮することにより、これらの抽
出された類義語の中から、取得項目名に関しユーザの意
図に沿った類義語を選択する。CPU111は、選択さ
れた類義語を項目ラベルとする、項目ラベル−属性テー
ブルHT1(図3)に基づいて項目属性を決定する(ス
テップ209)。このときの項目属性決定については、
後述の(6)取得項目名が「ランク」の場合の中で説明
する。
定テーブルHT6(図13)や、既に取得・記憶されて
いるデータベース名を考慮することにより、これらの抽
出された類義語の中から、取得項目名に関しユーザの意
図に沿った類義語を選択する。CPU111は、選択さ
れた類義語を項目ラベルとする、項目ラベル−属性テー
ブルHT1(図3)に基づいて項目属性を決定する(ス
テップ209)。このときの項目属性決定については、
後述の(6)取得項目名が「ランク」の場合の中で説明
する。
【0089】なお、これらの方法においても適切な項目
属性が複数有り、決定できなかった場合は(ステップ2
11;Y)、CPU111は、表示装置14に、項目属
性の候補を表示し、ユーザに選択させる(ステップ21
2)。この場合は、項目属性の候補が、設定ダイアログ
D1の欄に埋まった形で、表示装置14の画面上に複数
表示され、ユーザが、設定ダイアログD1の「設定」の
アイコンをマウス13でクリックすることで最適項目属
性を選択する。
属性が複数有り、決定できなかった場合は(ステップ2
11;Y)、CPU111は、表示装置14に、項目属
性の候補を表示し、ユーザに選択させる(ステップ21
2)。この場合は、項目属性の候補が、設定ダイアログ
D1の欄に埋まった形で、表示装置14の画面上に複数
表示され、ユーザが、設定ダイアログD1の「設定」の
アイコンをマウス13でクリックすることで最適項目属
性を選択する。
【0090】以上のサブルーチン2の処理により、取得
項目名と、ヒューリスティクステーブルに予め設定され
ている項目ラベルと、が一致していない場合でも、構文
解析を行うか、又は取得項目名の類義語を利用すること
で、項目属性の自動設定が行われる。
項目名と、ヒューリスティクステーブルに予め設定され
ている項目ラベルと、が一致していない場合でも、構文
解析を行うか、又は取得項目名の類義語を利用すること
で、項目属性の自動設定が行われる。
【0091】次に、サブルーチン3(図18のステップ
10)について、図22を参照して説明する。サブルー
チン3では、メインルーチン(図18)のステップ8
で、取得項目と同一の項目ラベルがヒューリスティクス
テーブルにある場合、その取得項目から既存のヒューリ
スティクステーブルを参照して、文字レベルで(字句通
りに)取得項目名を解釈してこの項目ラベルに対応付け
られている項目属性を決定する。
10)について、図22を参照して説明する。サブルー
チン3では、メインルーチン(図18)のステップ8
で、取得項目と同一の項目ラベルがヒューリスティクス
テーブルにある場合、その取得項目から既存のヒューリ
スティクステーブルを参照して、文字レベルで(字句通
りに)取得項目名を解釈してこの項目ラベルに対応付け
られている項目属性を決定する。
【0092】まず、CPU111は、以下により、取得
項目名が多義語かどうかを判断する(ステップ30
1)。CPU111は、項目ラベル−属性テーブルHT
1(図3)の「多義語」欄に「○」印が存在しているの
で、取得項目名が多義語であると判断した場合は(ステ
ップ301;Y)、多義語−属性判定テーブルHT6を
参照して、同じデータベース2の他の取得項目名やデー
タベース名を鑑みて、関連ラベル群との類似度から最適
な項目属性を決定する(ステップ302)。この際の決
定方法については、後述する(6)取得項目名が「ラン
ク」の場合で詳述する。一方、CPU111は、項目ラ
ベル−属性テーブルHT1(図3)の「多義語」欄に
「○」印が存在していないので、取得項目名は多義語で
はないと判断した場合は(ステップ301;N)、項目
ラベル−属性テーブルHT1を参照して項目属性を一意
的に決定し(ステップ303)、メインルーチン(図1
8)へリターンする。
項目名が多義語かどうかを判断する(ステップ30
1)。CPU111は、項目ラベル−属性テーブルHT
1(図3)の「多義語」欄に「○」印が存在しているの
で、取得項目名が多義語であると判断した場合は(ステ
ップ301;Y)、多義語−属性判定テーブルHT6を
参照して、同じデータベース2の他の取得項目名やデー
タベース名を鑑みて、関連ラベル群との類似度から最適
な項目属性を決定する(ステップ302)。この際の決
定方法については、後述する(6)取得項目名が「ラン
ク」の場合で詳述する。一方、CPU111は、項目ラ
ベル−属性テーブルHT1(図3)の「多義語」欄に
「○」印が存在していないので、取得項目名は多義語で
はないと判断した場合は(ステップ301;N)、項目
ラベル−属性テーブルHT1を参照して項目属性を一意
的に決定し(ステップ303)、メインルーチン(図1
8)へリターンする。
【0093】以上、サブルーチン1から3までの説明を
終わる。サブルーチン1から3のルーチンがいずれか終
了後は、メインルーチンのステップ12に戻る。このス
テップ12以降の処理は、前述したので、その説明は省
略する。
終わる。サブルーチン1から3のルーチンがいずれか終
了後は、メインルーチンのステップ12に戻る。このス
テップ12以降の処理は、前述したので、その説明は省
略する。
【0094】次に取得項目名の例を挙げて、データベー
ス処理装置1による、項目属性自動設定の実施形態につ
いて説明する。なお、各例について、図18のメインル
ーチンの、ステップ1からステップ5の処理と、ステッ
プ12からステップ22の処理についての説明は上記の
説明と重複するので省略する。
ス処理装置1による、項目属性自動設定の実施形態につ
いて説明する。なお、各例について、図18のメインル
ーチンの、ステップ1からステップ5の処理と、ステッ
プ12からステップ22の処理についての説明は上記の
説明と重複するので省略する。
【0095】(1)取得項目名が「年齢」の場合;CP
U111は、データベース名と項目名「年齢」を取得後
(ステップ4、ステップ5)、単位表記−単位テーブル
HT2(図5)を用いて、取得項目名「年齢」に単位情
報が含まれるかどうかを判断する(ステップ6)。この
場合は、CPU111は、「年齢」に単位表記−単位テ
ーブルHT2に存在する単位表記を含まないと判定する
ことにより、取得項目名「年齢」に単位情報が含まれて
いないと判断する(ステップ6;N)。
U111は、データベース名と項目名「年齢」を取得後
(ステップ4、ステップ5)、単位表記−単位テーブル
HT2(図5)を用いて、取得項目名「年齢」に単位情
報が含まれるかどうかを判断する(ステップ6)。この
場合は、CPU111は、「年齢」に単位表記−単位テ
ーブルHT2に存在する単位表記を含まないと判定する
ことにより、取得項目名「年齢」に単位情報が含まれて
いないと判断する(ステップ6;N)。
【0096】次に、CPU111は、項目ラベル−属性
テーブルHT1(図3)の最左欄の項目ラベルを参照し
て、取得項目名「年齢」と同一の項目ラベル「年齢」が
存在すると判断する(ステップ8;Y)。さらに、CP
U111は、項目ラベル−属性テーブルHT1により、
「多義語」欄に「○」が存在しないために、取得項目名
「年齢」が多義語ではないと判定する(ステップ30
1;N)。
テーブルHT1(図3)の最左欄の項目ラベルを参照し
て、取得項目名「年齢」と同一の項目ラベル「年齢」が
存在すると判断する(ステップ8;Y)。さらに、CP
U111は、項目ラベル−属性テーブルHT1により、
「多義語」欄に「○」が存在しないために、取得項目名
「年齢」が多義語ではないと判定する(ステップ30
1;N)。
【0097】そして、CPU111は、項目ラベル−属
性テーブルHT1を参照して、フィールド型として数値
(整数型)を、次元として(なし)を、デフォルトの単
位として(なし)を、取得可能な値の範囲として0から
150を、データベース格納エリア1132に記憶させ
ることにより、項目属性の自動設定を行い(ステップ3
03)、メインルーチン(図18)へリターンする。
性テーブルHT1を参照して、フィールド型として数値
(整数型)を、次元として(なし)を、デフォルトの単
位として(なし)を、取得可能な値の範囲として0から
150を、データベース格納エリア1132に記憶させ
ることにより、項目属性の自動設定を行い(ステップ3
03)、メインルーチン(図18)へリターンする。
【0098】(2)取得項目名が「年齢(歳)」の場
合;CPU111は、必要なデータベースのタイトルと
項目名「年齢(歳)」を取得後(ステップ4、ステップ
5)、単位表記−単位テーブルHT2(図5)を用い
て、取得項目名「年齢(歳)」に単位情報が含まれるか
どうかを判断する(ステップ6)。
合;CPU111は、必要なデータベースのタイトルと
項目名「年齢(歳)」を取得後(ステップ4、ステップ
5)、単位表記−単位テーブルHT2(図5)を用い
て、取得項目名「年齢(歳)」に単位情報が含まれるか
どうかを判断する(ステップ6)。
【0099】CPU111は、取得項目名「年齢
(歳)」の「(歳)」が単位表記−単位テーブルHT2
に存在することを確認後、取得項目名「年齢(歳)」に
単位情報が含まれていると判断する(ステップ6;
Y)。
(歳)」の「(歳)」が単位表記−単位テーブルHT2
に存在することを確認後、取得項目名「年齢(歳)」に
単位情報が含まれていると判断する(ステップ6;
Y)。
【0100】次に、CPU111は、取得項目名「年齢
(歳)」から単位情報「(歳)」を抽出し、データベー
ス格納エリア1132に記憶させる(ステップ10
1)。そして、この単位情報「(歳)」を、CPU11
1は、項目属性中「年齢」の単位の属性として、優先適
用する。
(歳)」から単位情報「(歳)」を抽出し、データベー
ス格納エリア1132に記憶させる(ステップ10
1)。そして、この単位情報「(歳)」を、CPU11
1は、項目属性中「年齢」の単位の属性として、優先適
用する。
【0101】次に、CPU111は、この抽出された単
位情報「(歳)」が次元で表される単位かどうかを、単
位−次元−基本単位テーブルHT3(図7)の最左欄の
「単位」の各項目を照合して判定する(ステップ10
2)。CPU111は、この単位−次元−基本単位テー
ブルHT3(図7)の最左欄の「単位」の各項目に、
「歳」がないことを確認し、単位情報「(歳)」が次元
で表される単位でないと判定する(ステップ102;
N)。そして、CPU111は、単位情報「(歳)」に
は次元がないと判定し、取得項目名「年齢(歳)」から
単位情報「(歳)」を除いた単語「年齢」を取得項目名
と解釈し(ステップ106)、メインルーチン(図1
8)へリターンする。
位情報「(歳)」が次元で表される単位かどうかを、単
位−次元−基本単位テーブルHT3(図7)の最左欄の
「単位」の各項目を照合して判定する(ステップ10
2)。CPU111は、この単位−次元−基本単位テー
ブルHT3(図7)の最左欄の「単位」の各項目に、
「歳」がないことを確認し、単位情報「(歳)」が次元
で表される単位でないと判定する(ステップ102;
N)。そして、CPU111は、単位情報「(歳)」に
は次元がないと判定し、取得項目名「年齢(歳)」から
単位情報「(歳)」を除いた単語「年齢」を取得項目名
と解釈し(ステップ106)、メインルーチン(図1
8)へリターンする。
【0102】次に、CPU111は、項目ラベル−属性
テーブルHT1(図3)の最左欄の項目ラベルに、取得
項目名「年齢」と同一名の項目ラベル「年齢」が存在す
ると判断する(ステップ8;Y)。さらに、CPU11
1は、項目ラベル−属性テーブルHT1を参照して、項
目ラベルの「年齢」に対応する「多義語」の欄に「○」
が存在しないので、取得項目名「年齢」が多義語ではな
いと判断する(ステップ301;N)。そして、CPU
111は、さらに項目ラベル−属性テーブルHT1を参
照して、フィールド型として数値(整数型)を、次元と
して(なし)を、デフォルトの単位として(なし)を、
取得可能な値の範囲として0から150を、データベー
ス格納エリア1132に記憶させて、項目属性の自動設
定を行う(ステップ303)。
テーブルHT1(図3)の最左欄の項目ラベルに、取得
項目名「年齢」と同一名の項目ラベル「年齢」が存在す
ると判断する(ステップ8;Y)。さらに、CPU11
1は、項目ラベル−属性テーブルHT1を参照して、項
目ラベルの「年齢」に対応する「多義語」の欄に「○」
が存在しないので、取得項目名「年齢」が多義語ではな
いと判断する(ステップ301;N)。そして、CPU
111は、さらに項目ラベル−属性テーブルHT1を参
照して、フィールド型として数値(整数型)を、次元と
して(なし)を、デフォルトの単位として(なし)を、
取得可能な値の範囲として0から150を、データベー
ス格納エリア1132に記憶させて、項目属性の自動設
定を行う(ステップ303)。
【0103】(3)取得項目名が「身長」の場合;CP
U111は、データベース名と項目名「身長」を取得後
(ステップ4、ステップ5)、単位表記−単位テーブル
HT2(図5)を用いて、取得項目名「身長」に単位情
報が含まれるかどうかを判断する(ステップ6)。この
場合は、CPU111は、「年齢」に単位表記−単位テ
ーブルHT2にある単位表記が存在しないことを確認
後、取得項目名「年齢」に単位情報が含まれていないと
判断する(ステップ6;N)。
U111は、データベース名と項目名「身長」を取得後
(ステップ4、ステップ5)、単位表記−単位テーブル
HT2(図5)を用いて、取得項目名「身長」に単位情
報が含まれるかどうかを判断する(ステップ6)。この
場合は、CPU111は、「年齢」に単位表記−単位テ
ーブルHT2にある単位表記が存在しないことを確認
後、取得項目名「年齢」に単位情報が含まれていないと
判断する(ステップ6;N)。
【0104】次に、CPU111は、項目ラベル−属性
テーブルHT1(図3)の最左欄の項目ラベルを参照し
て、取得項目名「身長」と同一の項目ラベル「身長」が
存在すると判定する(ステップ8;Y)。さらに、CP
U111は、項目ラベル−属性テーブルHT1を参照し
て、項目ラベルの「身長」に対応する「多義語」の欄に
「○」が存在しないので、取得項目名「身長」が、多義
語ではないと判断する(ステップ301;N)。そし
て、CPU111は、さらに項目ラベル−属性テーブル
HT1を参照して、フィールド型として数値(実数型)
を、次元として長さを、デフォルトの単位としてセンチ
メートルを、取得値の範囲に30.0〜250.0を、
データベース格納エリア1132に記憶させて、項目属
性の自動設定を行う(ステップ303)。
テーブルHT1(図3)の最左欄の項目ラベルを参照し
て、取得項目名「身長」と同一の項目ラベル「身長」が
存在すると判定する(ステップ8;Y)。さらに、CP
U111は、項目ラベル−属性テーブルHT1を参照し
て、項目ラベルの「身長」に対応する「多義語」の欄に
「○」が存在しないので、取得項目名「身長」が、多義
語ではないと判断する(ステップ301;N)。そし
て、CPU111は、さらに項目ラベル−属性テーブル
HT1を参照して、フィールド型として数値(実数型)
を、次元として長さを、デフォルトの単位としてセンチ
メートルを、取得値の範囲に30.0〜250.0を、
データベース格納エリア1132に記憶させて、項目属
性の自動設定を行う(ステップ303)。
【0105】(4)取得項目名が「身長(cm)」の場
合;CPU111は、データベース名と項目名「身長
(cm)」を取得後(ステップ4、ステップ5)、「単
位表記−単位テーブル」(図5)を用いて、取得項目名
「身長(cm)」に単位情報が含まれるかどうかを判断
する(ステップ6)。この場合は、CPU111は、取
得項目名「身長(cm)」の「(cm)」が「単位表記
−単位テーブル」に存在すると判定し、取得項目名「身
長(cm)」に単位情報が含まれていると判断する(ス
テップ6;Y)。
合;CPU111は、データベース名と項目名「身長
(cm)」を取得後(ステップ4、ステップ5)、「単
位表記−単位テーブル」(図5)を用いて、取得項目名
「身長(cm)」に単位情報が含まれるかどうかを判断
する(ステップ6)。この場合は、CPU111は、取
得項目名「身長(cm)」の「(cm)」が「単位表記
−単位テーブル」に存在すると判定し、取得項目名「身
長(cm)」に単位情報が含まれていると判断する(ス
テップ6;Y)。
【0106】次に、CPU111は、取得項目名「身長
(cm)」から単位情報「(cm)」を「センチメート
ル」と読み替えた後、若しくは「(cm)」のまま、デ
ータベース格納エリア1132に記憶させる。そして、
CPU111は、この記憶された単位情報「センチメー
トル」が次元で表される単位かどうかを、単位−次元−
基本単位テーブルHT3(図7)の最左欄の「単位」の
各項目ラベルを照合して判定する(ステップ102)。
CPU111は、この「単位−次元−基本単位テーブ
ル」の最左欄の「単位」の各項目に、「センチメート
ル」があると判定し、単位情報「センチメートル」が
「長さ」という次元で表される単位であると判定する
(ステップ102;Y)。
(cm)」から単位情報「(cm)」を「センチメート
ル」と読み替えた後、若しくは「(cm)」のまま、デ
ータベース格納エリア1132に記憶させる。そして、
CPU111は、この記憶された単位情報「センチメー
トル」が次元で表される単位かどうかを、単位−次元−
基本単位テーブルHT3(図7)の最左欄の「単位」の
各項目ラベルを照合して判定する(ステップ102)。
CPU111は、この「単位−次元−基本単位テーブ
ル」の最左欄の「単位」の各項目に、「センチメート
ル」があると判定し、単位情報「センチメートル」が
「長さ」という次元で表される単位であると判定する
(ステップ102;Y)。
【0107】次に、CPU111は、単位情報「(c
m)」について、次元「長さ」と、単位「センチメート
ル」を項目属性として利用することを決定する(ステッ
プ103)。取得項目「身長(cm)」の項目属性とし
て、次元「長さ」と、単位「センチメートル」を優先適
用するようにするために、データベース格納エリア11
32に記憶させる。そして、取得項目名「身長(c
m)」から単位情報「(cm)」を除いた単語「身長」
を取得項目名と解釈し(ステップ106)、メインルー
チンへリターンする。
m)」について、次元「長さ」と、単位「センチメート
ル」を項目属性として利用することを決定する(ステッ
プ103)。取得項目「身長(cm)」の項目属性とし
て、次元「長さ」と、単位「センチメートル」を優先適
用するようにするために、データベース格納エリア11
32に記憶させる。そして、取得項目名「身長(c
m)」から単位情報「(cm)」を除いた単語「身長」
を取得項目名と解釈し(ステップ106)、メインルー
チンへリターンする。
【0108】次に、CPU111は、項目ラベル−属性
テーブルHT1(図3)の最左欄の項目ラベルを参照し
て、取得項目名「身長」と同一の項目ラベル「身長」が
存在すると判断する(ステップ8;Y)。さらに、CP
U111は、項目ラベル−属性テーブルHT1を参照し
て、項目ラベルの「身長」に対応する「多義語」の欄に
「○」が存在しないので、取得項目名「身長」が、多義
語ではないと判断し(ステップ301;N)、上述の
(3)取得項目名が「身長」の場合と同様にして、項目
属性の自動設定を行う(ステップ303)。
テーブルHT1(図3)の最左欄の項目ラベルを参照し
て、取得項目名「身長」と同一の項目ラベル「身長」が
存在すると判断する(ステップ8;Y)。さらに、CP
U111は、項目ラベル−属性テーブルHT1を参照し
て、項目ラベルの「身長」に対応する「多義語」の欄に
「○」が存在しないので、取得項目名「身長」が、多義
語ではないと判断し(ステップ301;N)、上述の
(3)取得項目名が「身長」の場合と同様にして、項目
属性の自動設定を行う(ステップ303)。
【0109】(5)取得項目名が「身長(m)」の場
合;この場合は、前記した(4)の取得項目名が「身長
(cm)」の場合と同様にして項目属性が自動設定され
る(ステップ310)。ただし、「身長」は、人間の身
長ならば、図3の項目ラベル−属性テーブルHT1のよ
うに、「センチメートル」を単位としている。
合;この場合は、前記した(4)の取得項目名が「身長
(cm)」の場合と同様にして項目属性が自動設定され
る(ステップ310)。ただし、「身長」は、人間の身
長ならば、図3の項目ラベル−属性テーブルHT1のよ
うに、「センチメートル」を単位としている。
【0110】そこで、CPU111は、単位−次元−基
本単位テーブルHT3(図7)の「基本単位との関係」
の欄にある”1センチメートル=0.01メートル”の
ルールに基づき、項目ラベル−属性テーブルHT1(図
3)の「センチメートル」を単位とした「値の範囲」で
ある30.0〜250.0の範囲を換算するために、こ
の範囲に0.01を掛けて、取得可能な「値の範囲」と
して0.3〜2.5を設定する。
本単位テーブルHT3(図7)の「基本単位との関係」
の欄にある”1センチメートル=0.01メートル”の
ルールに基づき、項目ラベル−属性テーブルHT1(図
3)の「センチメートル」を単位とした「値の範囲」で
ある30.0〜250.0の範囲を換算するために、こ
の範囲に0.01を掛けて、取得可能な「値の範囲」と
して0.3〜2.5を設定する。
【0111】(6)取得項目名が「ランク」の場合;C
PU111は、必要なデータベースのタイトルと項目名
「ランク」を取得後(ステップ4、ステップ5)、単位
表記−単位テーブルHT2(図5)を用いて、取得項目
名「ランク」に単位情報が含まれるかどうかを判断する
(ステップ6)。この場合は、CPU111は、「ラン
ク」に単位表記−単位テーブルHT2にある単位表記が
存在しないことを確認後、取得項目名「ランク」に単位
情報が含まれていないと判断する(ステップ6;N)。
PU111は、必要なデータベースのタイトルと項目名
「ランク」を取得後(ステップ4、ステップ5)、単位
表記−単位テーブルHT2(図5)を用いて、取得項目
名「ランク」に単位情報が含まれるかどうかを判断する
(ステップ6)。この場合は、CPU111は、「ラン
ク」に単位表記−単位テーブルHT2にある単位表記が
存在しないことを確認後、取得項目名「ランク」に単位
情報が含まれていないと判断する(ステップ6;N)。
【0112】次に、CPU111は、項目ラベル−属性
テーブルHT1を参照して、項目ラベルの「ランク」に
対応する「多義語」の欄に「○」が存在するので、取得
項目名「ランク」が、多義語であると判断する(ステッ
プ301;Y)。次に、CPU111は、多義語−属性
判定テーブルHT6(図13)を参照して、取得項目名
「ランク」の項目属性を以下のように決定する(ステッ
プ302)。
テーブルHT1を参照して、項目ラベルの「ランク」に
対応する「多義語」の欄に「○」が存在するので、取得
項目名「ランク」が、多義語であると判断する(ステッ
プ301;Y)。次に、CPU111は、多義語−属性
判定テーブルHT6(図13)を参照して、取得項目名
「ランク」の項目属性を以下のように決定する(ステッ
プ302)。
【0113】この多義語−属性判定テーブルHT6に
は、「関連ラベル群」という項目を設けられており、
「ランク」の「関連ラベル群」として、「地位ラベル
群」と「順位ラベル群」とが備わっている。「地位ラベ
ル群」には、「ランク」が地位を表している場合に他の
項目ラベルに出現する項目ラベル群(例えば、「所属」
等)が与えられており、「順位ラベル群」には「ラン
ク」が「順位」を表している場合に他の項目ラベルに出
現する項目ラベル群(例えば、「数」等)が与えられて
いる。
は、「関連ラベル群」という項目を設けられており、
「ランク」の「関連ラベル群」として、「地位ラベル
群」と「順位ラベル群」とが備わっている。「地位ラベ
ル群」には、「ランク」が地位を表している場合に他の
項目ラベルに出現する項目ラベル群(例えば、「所属」
等)が与えられており、「順位ラベル群」には「ラン
ク」が「順位」を表している場合に他の項目ラベルに出
現する項目ラベル群(例えば、「数」等)が与えられて
いる。
【0114】CPU111は、ユーザから項目名を取得
した、データベース2における、「ランク」以外の他の
取得項目名のセットと、「地位ラベル群」にある項目ラ
ベルのセット、及び「順位ラベル群」にある項目ラベル
のセットとの、類似度をそれぞれ計算して、類似度の高
い方を適切な項目属性のセットとして選択する。
した、データベース2における、「ランク」以外の他の
取得項目名のセットと、「地位ラベル群」にある項目ラ
ベルのセット、及び「順位ラベル群」にある項目ラベル
のセットとの、類似度をそれぞれ計算して、類似度の高
い方を適切な項目属性のセットとして選択する。
【0115】例えば、「ランク」以外の他の取得項目名
のセットが、「所属」、「教員名」、及び「教員コー
ド」である場合は、CPU111は、多義語−属性判定
テーブルHT6の2種類の「ランク」の関連ラベル群の
セットとの間の類似度を計算する。このときの二つの単
語群の間の類似度については、「2つの単語群に共通す
る単語数をカウントして、その単語数を類似度とす
る。」というアルゴリズムにより計算することができ
る。例えば、取得項目名から取得した単語群を単語群A
とし、ヒューリスティクテーブル内の単語群を単語Bと
する。
のセットが、「所属」、「教員名」、及び「教員コー
ド」である場合は、CPU111は、多義語−属性判定
テーブルHT6の2種類の「ランク」の関連ラベル群の
セットとの間の類似度を計算する。このときの二つの単
語群の間の類似度については、「2つの単語群に共通す
る単語数をカウントして、その単語数を類似度とす
る。」というアルゴリズムにより計算することができ
る。例えば、取得項目名から取得した単語群を単語群A
とし、ヒューリスティクテーブル内の単語群を単語Bと
する。
【0116】そして、単語群Aが、「所属」、「教
員」、「名」、及び「コード」からなり、単語群Bが、
「コード」、「部門」、及び「所属」からなる場合を想
定する。このとき、2つの群に共通する単語は、「所
属」と「コード」の2つであるので、単語群Aと単語群
Bとの間の類似度は2と計算される。このようにして得
られる計算結果から、多義語−属性判定テーブルHT6
にある、最上行の「ランク」がユーザが意図する意味の
「ランク」であると判定する。そして、多義語−属性判
定テーブルHT6から、「ランク」の項目属性として、
フィールド型には「文字列型」を、次元には「(な
し)」を、値の範囲には「(地位を示す語群)」を自動
設定する。
員」、「名」、及び「コード」からなり、単語群Bが、
「コード」、「部門」、及び「所属」からなる場合を想
定する。このとき、2つの群に共通する単語は、「所
属」と「コード」の2つであるので、単語群Aと単語群
Bとの間の類似度は2と計算される。このようにして得
られる計算結果から、多義語−属性判定テーブルHT6
にある、最上行の「ランク」がユーザが意図する意味の
「ランク」であると判定する。そして、多義語−属性判
定テーブルHT6から、「ランク」の項目属性として、
フィールド型には「文字列型」を、次元には「(な
し)」を、値の範囲には「(地位を示す語群)」を自動
設定する。
【0117】なお、さらにデータベース名を前記セット
に含めて類似度を計算してもよい。また、上述の類似度
の計算の際に、閾値を設定してもよい。計算された類似
度の最大値が閾値に達しない場合には、その旨をダイア
ログなどでユーザに表示し、ユーザに選択してもらうよ
うにしてもよい。
に含めて類似度を計算してもよい。また、上述の類似度
の計算の際に、閾値を設定してもよい。計算された類似
度の最大値が閾値に達しない場合には、その旨をダイア
ログなどでユーザに表示し、ユーザに選択してもらうよ
うにしてもよい。
【0118】また、項目属性の複数の候補が挙がり、一
つに選択できない場合は、CPU111は、ダイアログ
に、その候補を表示し、ユーザに選択してもらい、その
選択指示を取得する。例えば、項目ラベル「ランク」の
例では、図15の設定ダイアログD6’に示されるよう
な、「文字列型」と「数値型」の2候補が表示装置14
に表示される。そして、ユーザが「文字列型」若しくは
「数値型」の文字表示の直左の○部をマウス13でクリ
ックすることにより、CPU111はユーザの選択指示
を取得する。なお、このユーザの選択指示による項目ラ
ベルと項目属性は、関連ラベル群等とともに対応付け
て、多義語−属性判定テーブルHT6(図13)の一項
目としてヒューリスティクステーブル格納部163に記
憶させておく。
つに選択できない場合は、CPU111は、ダイアログ
に、その候補を表示し、ユーザに選択してもらい、その
選択指示を取得する。例えば、項目ラベル「ランク」の
例では、図15の設定ダイアログD6’に示されるよう
な、「文字列型」と「数値型」の2候補が表示装置14
に表示される。そして、ユーザが「文字列型」若しくは
「数値型」の文字表示の直左の○部をマウス13でクリ
ックすることにより、CPU111はユーザの選択指示
を取得する。なお、このユーザの選択指示による項目ラ
ベルと項目属性は、関連ラベル群等とともに対応付け
て、多義語−属性判定テーブルHT6(図13)の一項
目としてヒューリスティクステーブル格納部163に記
憶させておく。
【0119】(8)取得項目名が「1月」の場合;この
場合の処理を、図25の「商品の月別売り上げ台数」の
データベースを作成する場合において、取得項目名が
「1月」であるときを例にして説明する。CPU111
は、データベースのタイトル「商品の月別売り上げ台
数」と項目名「1月」を取得後(ステップ4、ステップ
5)、単位表記−単位テーブルHT2(図5)を用い
て、取得項目名「1月」に単位情報が含まれていないと
判断する(ステップ6;N)。
場合の処理を、図25の「商品の月別売り上げ台数」の
データベースを作成する場合において、取得項目名が
「1月」であるときを例にして説明する。CPU111
は、データベースのタイトル「商品の月別売り上げ台
数」と項目名「1月」を取得後(ステップ4、ステップ
5)、単位表記−単位テーブルHT2(図5)を用い
て、取得項目名「1月」に単位情報が含まれていないと
判断する(ステップ6;N)。
【0120】次に、CPU111は、項目ラベル−属性
テーブルHT1を用いて、取得項目名「1月」と同一の
項目ラベルが、項目ラベル−属性テーブルHT1に存在
しないと判断する(ステップ8;N)。さらに、CPU
111は、取得項目名「1月」について、サブルーチン
2の処理(図21)により、以下のように意味レベルの
判断により項目属性を決定する。
テーブルHT1を用いて、取得項目名「1月」と同一の
項目ラベルが、項目ラベル−属性テーブルHT1に存在
しないと判断する(ステップ8;N)。さらに、CPU
111は、取得項目名「1月」について、サブルーチン
2の処理(図21)により、以下のように意味レベルの
判断により項目属性を決定する。
【0121】まず、CPU111は、取得項目名「1
月」について、構文解析1を行い(ステップ201)、
取得項目名「1月」は、2個以上の単語ではないと判断
する(ステップ202;N)。次に、CPU111は、
図9の類義語辞書テーブルHT4を用いて、取得項目名
「1月」の類義語「正月」が、類義語辞書にあると判断
する(ステップ207;Y)。そして、CPU111
は、多義語−属性判定テーブルHT6(図13)を用い
て(ステップ208)、取得項目名「1月」の項目属性
が決定できないと判定する(ステップ209;N)。さ
らに、CPU111は、取得データベース名「商品の月
別売り上げ台数」から、取得項目名「1月」を、「商品
の1月の売り上げ台数」と解釈する。
月」について、構文解析1を行い(ステップ201)、
取得項目名「1月」は、2個以上の単語ではないと判断
する(ステップ202;N)。次に、CPU111は、
図9の類義語辞書テーブルHT4を用いて、取得項目名
「1月」の類義語「正月」が、類義語辞書にあると判断
する(ステップ207;Y)。そして、CPU111
は、多義語−属性判定テーブルHT6(図13)を用い
て(ステップ208)、取得項目名「1月」の項目属性
が決定できないと判定する(ステップ209;N)。さ
らに、CPU111は、取得データベース名「商品の月
別売り上げ台数」から、取得項目名「1月」を、「商品
の1月の売り上げ台数」と解釈する。
【0122】このように、取得項目名の意味が、取得項
目名のみでは一意的に決まらない場合は、項目名を従属
格にデータベース名を主格にするか、又はデータベース
名を従属格に項目名を主格に、取得項目名を読み替え
る。そして、CPU111は、この読み替えられた取得
項目名「商品の1月の売り上げ台数」の構文解析2を行
い、「台数」を主格の単語として判断する(ステップ2
03)。さらに、項目ラベル−属性テーブルHT1(図
3)を参照して、項目ラベルに「台数」を見つけ、「台
数」の項目属性として、フィールド型には「数値(整数
型)を、次元には「(なし)」を、デフォルトの単位に
は「台」を、値の範囲には、例えば「0〜10000」
を自動設定する(ステップ204、ステップ205;
Y、ステップ206)。
目名のみでは一意的に決まらない場合は、項目名を従属
格にデータベース名を主格にするか、又はデータベース
名を従属格に項目名を主格に、取得項目名を読み替え
る。そして、CPU111は、この読み替えられた取得
項目名「商品の1月の売り上げ台数」の構文解析2を行
い、「台数」を主格の単語として判断する(ステップ2
03)。さらに、項目ラベル−属性テーブルHT1(図
3)を参照して、項目ラベルに「台数」を見つけ、「台
数」の項目属性として、フィールド型には「数値(整数
型)を、次元には「(なし)」を、デフォルトの単位に
は「台」を、値の範囲には、例えば「0〜10000」
を自動設定する(ステップ204、ステップ205;
Y、ステップ206)。
【0123】(9)取得項目名が「チームの平均年齢」
である場合;CPU111は、取得項目名「チームの平
均年齢」に単位情報が含まれていないと判断した後(ス
テップ6;N)、項目ラベル−属性テーブルHT1(図
3)の項目ラベルに「チームの平均年齢」が存在しない
と判断する(ステップ8;N)。さらに、CPU111
は、取得項目名「チームの平均年齢」について、サブル
ーチン2の処理(図21)により、以下のように意味レ
ベルの判断により項目属性を決定する。
である場合;CPU111は、取得項目名「チームの平
均年齢」に単位情報が含まれていないと判断した後(ス
テップ6;N)、項目ラベル−属性テーブルHT1(図
3)の項目ラベルに「チームの平均年齢」が存在しない
と判断する(ステップ8;N)。さらに、CPU111
は、取得項目名「チームの平均年齢」について、サブル
ーチン2の処理(図21)により、以下のように意味レ
ベルの判断により項目属性を決定する。
【0124】CPU111は、構文解析1により(ステ
ップ201)、取得項目名「チームの平均年齢」が2以
上の単語からなることを判断した後(ステップ202;
Y)、構文解析2により(ステップ203)、取得項目
名「チームの平均年齢」を、「チームの」と「平均」と
「年齢」に分け、「年齢」を主格と判断し、「チーム
の」と「平均」を「年齢」に係る従属格(修飾語)と判
断する。そして、取得項目名「チームの平均年齢」を、
「年齢」と読み替えて、前述した(1)取得項目名が
「年齢」の場合の処理と同様にして、項目ラベル−属性
テーブルHT1(図3)を利用して項目属性を設定する
(ステップ206)。
ップ201)、取得項目名「チームの平均年齢」が2以
上の単語からなることを判断した後(ステップ202;
Y)、構文解析2により(ステップ203)、取得項目
名「チームの平均年齢」を、「チームの」と「平均」と
「年齢」に分け、「年齢」を主格と判断し、「チーム
の」と「平均」を「年齢」に係る従属格(修飾語)と判
断する。そして、取得項目名「チームの平均年齢」を、
「年齢」と読み替えて、前述した(1)取得項目名が
「年齢」の場合の処理と同様にして、項目ラベル−属性
テーブルHT1(図3)を利用して項目属性を設定する
(ステップ206)。
【0125】しかし、「年齢」のフィールド型は数値
(整数型)であるが、「年齢」の「平均」をとった場合
は、整数ではなく、小数部分が発生する場合もある。こ
のように従属格(修飾語)によっては、主格の項目属性
のうち、フィールド型を変更すべき場合がある。
(整数型)であるが、「年齢」の「平均」をとった場合
は、整数ではなく、小数部分が発生する場合もある。こ
のように従属格(修飾語)によっては、主格の項目属性
のうち、フィールド型を変更すべき場合がある。
【0126】そこで、CPU111は、「整数値の平均
をとると実数値となる」という文章型ヒューリスティク
スを予めヒューリスティクステーブル格納部163に蓄
積しておくか、図16の修飾語−フィールド型判定テー
ブルHT7を参照して、「年齢」は整数型の数値である
が、この場合は、「平均」が「年齢」に係わってくると
判断して、項目属性の「フィールド型」に既に設定され
ている整数型を実数型に変更して自動設定する。
をとると実数値となる」という文章型ヒューリスティク
スを予めヒューリスティクステーブル格納部163に蓄
積しておくか、図16の修飾語−フィールド型判定テー
ブルHT7を参照して、「年齢」は整数型の数値である
が、この場合は、「平均」が「年齢」に係わってくると
判断して、項目属性の「フィールド型」に既に設定され
ている整数型を実数型に変更して自動設定する。
【0127】以上のデータベース処理装置1の動作によ
り、取得項目名と、その取得項目名に対応する適切な項
目属性の設定が、データベース格納エリア1132に記
憶されることにより終了する。その後、ユーザにより取
得項目名に対応する必要な数値データや文字列データ等
が、キーボード12や文字認識装置20から、データベ
ースの表2の項目欄21に一つ一つ入力され、データベ
ース処理装置1は、その取得したデータとともに表形式
型データベースを完成させる。CPU111は、完成後
のデータベースを、ユーザの指示によりデータベース格
納部165に格納する。
り、取得項目名と、その取得項目名に対応する適切な項
目属性の設定が、データベース格納エリア1132に記
憶されることにより終了する。その後、ユーザにより取
得項目名に対応する必要な数値データや文字列データ等
が、キーボード12や文字認識装置20から、データベ
ースの表2の項目欄21に一つ一つ入力され、データベ
ース処理装置1は、その取得したデータとともに表形式
型データベースを完成させる。CPU111は、完成後
のデータベースを、ユーザの指示によりデータベース格
納部165に格納する。
【0128】以上、図11に示されるメインルーチン
と、図12から図14に示されるサブルーチンによる実
施形態により、以下の効果を奏するデータベース処理装
置1を提供することができる。
と、図12から図14に示されるサブルーチンによる実
施形態により、以下の効果を奏するデータベース処理装
置1を提供することができる。
【0129】ユーザの入力によりデータベースの項目名
が取得された後、その取得項目名と同一名の項目ラベル
を含むヒューリスティクステーブルが存在しなくても、
その取得項目名を類義語レベルまで適宜解釈すること
で、予め蓄積されているヒューリスティクステーブルを
参照し、項目属性を自動設定することができる。
が取得された後、その取得項目名と同一名の項目ラベル
を含むヒューリスティクステーブルが存在しなくても、
その取得項目名を類義語レベルまで適宜解釈すること
で、予め蓄積されているヒューリスティクステーブルを
参照し、項目属性を自動設定することができる。
【0130】また、蓄積した経験的知識やルールに基づ
いて対応付けられた項目ラベルと項目属性の関係をヒュ
ーリスティクスのテーブルの形で説明したが、項目ラベ
ルと項目属性との対応が文字列形式で、記憶装置16に
予め記憶されているようにしてもよい。
いて対応付けられた項目ラベルと項目属性の関係をヒュ
ーリスティクスのテーブルの形で説明したが、項目ラベ
ルと項目属性との対応が文字列形式で、記憶装置16に
予め記憶されているようにしてもよい。
【0131】また、ユーザの入力によりデータベースの
項目名が取得された後、その取得項目名と同一名の項目
ラベルを含むヒューリスティクステーブルが存在してい
ても、取得項目名が多義語等の場合は、複数の利用すべ
き既存のヒューリスティクスが存在してしまう。この様
な場合であっても、CPU111がその取得項目名を適
宜解釈して、ユーザの意図する項目属性を自動設定する
ことができる。
項目名が取得された後、その取得項目名と同一名の項目
ラベルを含むヒューリスティクステーブルが存在してい
ても、取得項目名が多義語等の場合は、複数の利用すべ
き既存のヒューリスティクスが存在してしまう。この様
な場合であっても、CPU111がその取得項目名を適
宜解釈して、ユーザの意図する項目属性を自動設定する
ことができる。
【0132】また、新規に取得した項目名を適宜解釈し
ても、既存のヒューリスティクステーブルが利用できな
かった場合は、ユーザの手動入力により項目属性を決定
する。そして、取得項目名と項目属性を対応付けたヒュ
ーリスティクスを新たに作成かつ保存することにより、
データベース処理装置1に学習させる。その結果、デー
タベース処理装置1の項目属性の自動設定能力を、より
向上させることができる。
ても、既存のヒューリスティクステーブルが利用できな
かった場合は、ユーザの手動入力により項目属性を決定
する。そして、取得項目名と項目属性を対応付けたヒュ
ーリスティクスを新たに作成かつ保存することにより、
データベース処理装置1に学習させる。その結果、デー
タベース処理装置1の項目属性の自動設定能力を、より
向上させることができる。
【0133】なお、項目には、フィールド項目とレコー
ド項目とがあり、表形式のデータベースでは、フィール
ド項目は縦の列の項目に該当し、レコード項目は横の行
の項目に該当する。そして、一般に、データベース処理
装置では、縦の列と横の行を総入れ替え可能なダイシン
グ機能を備えており、実質的には、フィールド項目とレ
コード項目とは等価である。よって、上述の項目や項目
属性の説明には、レコード項目とレコード項目属性は、
フィールド項目と項目属性の例を適用することができ
る。
ド項目とがあり、表形式のデータベースでは、フィール
ド項目は縦の列の項目に該当し、レコード項目は横の行
の項目に該当する。そして、一般に、データベース処理
装置では、縦の列と横の行を総入れ替え可能なダイシン
グ機能を備えており、実質的には、フィールド項目とレ
コード項目とは等価である。よって、上述の項目や項目
属性の説明には、レコード項目とレコード項目属性は、
フィールド項目と項目属性の例を適用することができ
る。
【0134】従って、項目属性がレコードに対して与え
られている場合は、内部的にレコードとフィールドとを
入れ替える(ダイシング)ことにより、内部的にはフィ
ールドに対する処理とすることができる。このことによ
り、上記実施形態はレコード属性の自動設定にも適用す
ることができる。
られている場合は、内部的にレコードとフィールドとを
入れ替える(ダイシング)ことにより、内部的にはフィ
ールドに対する処理とすることができる。このことによ
り、上記実施形態はレコード属性の自動設定にも適用す
ることができる。
【0135】例えば、図26に示されるように、ある会
社の売上高と社員数の変遷のデータベースを作成する場
合を考える。この場合は、売上高(億円)と社員数
(人)がレコードの項目であり、1983年、1984
年若しくは1985年がフィールドの項目である。よっ
て、データベース処理装置1により、レコード項目をフ
ィールド項目とみなして、項目属性の自動設定を可能と
することができる。
社の売上高と社員数の変遷のデータベースを作成する場
合を考える。この場合は、売上高(億円)と社員数
(人)がレコードの項目であり、1983年、1984
年若しくは1985年がフィールドの項目である。よっ
て、データベース処理装置1により、レコード項目をフ
ィールド項目とみなして、項目属性の自動設定を可能と
することができる。
【0136】また、項目属性の設定のタイミングは、下
記のどちらでも可能である。データベースを作成する際
に、ユーザが項目名を入力すると、項目属性が自動的に
設定されるようにする。若しくは、ユーザが項目名を入
力後、例えば、「項目属性設定」というメニューをユー
ザが選択することにより設定されるようにする。
記のどちらでも可能である。データベースを作成する際
に、ユーザが項目名を入力すると、項目属性が自動的に
設定されるようにする。若しくは、ユーザが項目名を入
力後、例えば、「項目属性設定」というメニューをユー
ザが選択することにより設定されるようにする。
【発明の効果】本発明によれば、表形式のデータベース
を作成する際、取得項目に対する項目属性を簡易に自動
設定をすることができる。
を作成する際、取得項目に対する項目属性を簡易に自動
設定をすることができる。
【0137】
【図1】本発明に係るデータベース処理装置1の基本構
成を表すブロック図である。
成を表すブロック図である。
【図2】表形式データベースの項目名やデータベース名
を入力する前の概念図である。
を入力する前の概念図である。
【図3】項目ラベルと項目属性とを対応付けたヒューリ
スティクステーブルの例である。
スティクステーブルの例である。
【図4】ヒューリスティクステーブル作成のための設定
ダイアログの例である。
ダイアログの例である。
【図5】単位表記と単位とを対応付けたヒューリスティ
クステーブルの例である。
クステーブルの例である。
【図6】ヒューリスティクステーブル作成のための設定
ダイアログの例である。
ダイアログの例である。
【図7】単位と次元と基本単位とを対応付けたヒューリ
スティクステーブルの例である。
スティクステーブルの例である。
【図8】ヒューリスティクステーブル作成のための設定
ダイアログの例である。
ダイアログの例である。
【図9】項目ラベルと類義語を対応付けたヒューリステ
ィクステーブルの例である。
ィクステーブルの例である。
【図10】ヒューリスティクステーブル作成のための設
定ダイアログの例である。
定ダイアログの例である。
【図11】項目ラベルと表示形式を対応付けたヒューリ
スティクステーブルの例である。
スティクステーブルの例である。
【図12】ヒューリスティクステーブル作成のための設
定ダイアログの例である。
定ダイアログの例である。
【図13】項目ラベルと関連ラベル群や項目属性を対応
付けたヒューリスティクステーブルの例である。
付けたヒューリスティクステーブルの例である。
【図14】ヒューリスティクステーブル作成のための設
定ダイアログの例である。
定ダイアログの例である。
【図15】ヒューリスティクステーブル作成のための設
定ダイアログの例である。
定ダイアログの例である。
【図16】項目ラベルと修飾語とフィールド型を対応付
けたヒューリスティクステーブルの例である。
けたヒューリスティクステーブルの例である。
【図17】ヒューリスティクステーブル作成のための設
定ダイアログの例である。
定ダイアログの例である。
【図18】実施形態におけるデータベース処理のメイン
フローである。
フローである。
【図19】実施形態におけるデータベース処理のメイン
フローである。
フローである。
【図20】実施形態におけるデータベース処理のメイン
フローの中のサブルーチン1による処理のフローであ
る。
フローの中のサブルーチン1による処理のフローであ
る。
【図21】実施形態におけるデータベース処理のメイン
フローの中のサブルーチン2による処理のフローであ
る。
フローの中のサブルーチン2による処理のフローであ
る。
【図22】実施形態におけるデータベース処理のメイン
フローの中のサブルーチン3による処理のフローであ
る。
フローの中のサブルーチン3による処理のフローであ
る。
【図23】実施形態におけるデータベース処理により完
成されたデータベースの例である。
成されたデータベースの例である。
【図24】実施形態におけるデータベース処理により完
成されたデータベースの例である。
成されたデータベースの例である。
【図25】実施形態におけるデータベース処理により完
成されたデータベースの例である。
成されたデータベースの例である。
【図26】実施形態におけるデータベース処理により完
成されたデータベースの例である。
成されたデータベースの例である。
11 制御部 12 キーボード 13 マウス 14 表示装置 15 印刷装置 16 記憶装置 17 記憶媒体駆動装置 18 通信制御装置 19 入出力I/F 20 文字認識装置 111 CPU 112 ROM 113 RAM 161 仮名漢字変換辞書 162 類義語辞書 163 ヒューリスティクステーブル格納部 164 プログラム格納部 165 データベース格納部 166 設定ダイアログ格納部 1131 ヒューリスティクステーブル格納エリア 1132 データベース格納エリア 1133 設定ダイアログ格納エリア
───────────────────────────────────────────────────── フロントページの続き (72)発明者 土居功志 徳島県徳島市沖浜東3丁目46番地 株式会 社ジャストシステム内 (72)発明者 三ツ矢浩之 徳島県徳島市沖浜東3丁目46番地 株式会 社ジャストシステム内 Fターム(参考) 5B082 BA09 GA07
Claims (7)
- 【請求項1】 各項目名に対して予め設定された項目属
性の範囲でデータの入力が行われるデータベース処理装
置であって、 入力される項目名を取得する項目名取得手段と、 この項目名取得手段により取得された項目名の内容を判
断し、判断した項目名の内容から、項目名が入力された
項目に対する項目属性の候補を、経験的知識やルールに
基づいて自動決定する決定手段と、を具備することを特
徴とするデータベース処理装置。 - 【請求項2】 項目名と、その項目名の内容から予め経
験的知識やルールに基づいて決められた項目属性を対応
付けて記憶した項目属性記憶手段を備え、 前記決定手段は、前記項目名取得手段で取得した項目名
と同一の項目名が前記記憶手段に存在するか否かを判断
し、存在する場合には対応する項目属性を候補として自
動決定することを特徴とする請求項1に記載のデータベ
ース処理装置。 - 【請求項3】 類義語辞書を記憶した類義語辞書記憶手
段を備え、 前記決定手段は、前記項目名取得手段で取得した項目名
の類義語を前記類義語辞書から求め、この類義語を項目
名として項目属性の候補を決定することを特徴とする請
求項2に記載のデータベース処理装置。 - 【請求項4】 前記決定手段は、前記項目名取得手段で
取得した項目名が多義語であり、項目属性を一義に決定
できない場合には、他の項目名及び当該データベースの
タイトルの少なくとも1つを参酌して項目属性の候補を
決定することを特徴とする請求項1又は請求項2に記載
のデータベース処理装置。 - 【請求項5】 前記決定手段は、前記項目名取得手段で
取得した項目名が複数単語による合成語を含んでいるか
判断し、合成語を含んでいる場合には、合成語の各構成
単語毎の項目属性から、前記取得した項目名に対する項
目属性の候補を決定することを特徴とする請求項1又は
請求項2に記載のデータベース処理装置。 - 【請求項6】 前記決定手段は、前記項目名取得手段で
取得した項目名に単位語が含まれているか否かを判断
し、含まれている場合には、当該単位を優先して項目属
性の候補を決定し、 他の属性については、単位語を除いた部分から候補を決
定することを特徴とする請求項1又は請求項2に記載の
データベース処理装置。 - 【請求項7】 各項目名に対して予め設定された項目属
性の範囲でデータの入力が行われるデータベース処理機
能をコンピュータに実現させるためのデータベース処理
プログラムが格納された記録媒体であって、 入力される項目名を取得する項目名取得機能と、 この項目名取得手段により取得された項目名の内容を判
断し、判断した項目名の内容から、項目名が入力された
項目に対する項目属性の候補を、経験的知識やルールに
基づいて自動決定する決定機能と、をコンピュータに実
現させるためのデータベース処理プログラムが記憶され
た記憶媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11117619A JP2000305824A (ja) | 1999-04-26 | 1999-04-26 | データベース処理装置、及びデータベース処理プログラムが記憶された記憶媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11117619A JP2000305824A (ja) | 1999-04-26 | 1999-04-26 | データベース処理装置、及びデータベース処理プログラムが記憶された記憶媒体 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2000305824A true JP2000305824A (ja) | 2000-11-02 |
Family
ID=14716246
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11117619A Pending JP2000305824A (ja) | 1999-04-26 | 1999-04-26 | データベース処理装置、及びデータベース処理プログラムが記憶された記憶媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2000305824A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006059213A (ja) * | 2004-08-23 | 2006-03-02 | Mitsubishi Electric Corp | 設備情報管理システム |
| JP2007257153A (ja) * | 2006-03-22 | 2007-10-04 | Ntt Data Corp | 文書データ読み上げ装置およびそのコンピュータプログラム |
| WO2017134801A1 (ja) * | 2016-02-04 | 2017-08-10 | 富士通株式会社 | 項目名対応付け処理方法、項目名対応付け処理プログラム及び情報処理装置 |
-
1999
- 1999-04-26 JP JP11117619A patent/JP2000305824A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006059213A (ja) * | 2004-08-23 | 2006-03-02 | Mitsubishi Electric Corp | 設備情報管理システム |
| JP2007257153A (ja) * | 2006-03-22 | 2007-10-04 | Ntt Data Corp | 文書データ読み上げ装置およびそのコンピュータプログラム |
| WO2017134801A1 (ja) * | 2016-02-04 | 2017-08-10 | 富士通株式会社 | 項目名対応付け処理方法、項目名対応付け処理プログラム及び情報処理装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2862626B2 (ja) | 電子辞書及び情報検索方法 | |
| CN104077346A (zh) | 文档制作支援装置、方法及程序 | |
| US12175183B2 (en) | Device dependent rendering of PDF content including multiple articles and a table of contents | |
| US12248747B2 (en) | Device dependent rendering of PDF content | |
| Toselli et al. | Transcribing a 17th-century botanical manuscript: Longitudinal evaluation of document layout detection and interactive transcription | |
| JP4021525B2 (ja) | 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 | |
| JPH1145289A (ja) | 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 | |
| JPH1153394A (ja) | 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 | |
| JP4005672B2 (ja) | 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 | |
| JP5550959B2 (ja) | 文書処理システム、及びプログラム | |
| JP2000305824A (ja) | データベース処理装置、及びデータベース処理プログラムが記憶された記憶媒体 | |
| JPH1145278A (ja) | 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 | |
| JP2000194725A (ja) | 類似グル―プ抽出装置、及び類似グル―プ抽出プログラムが記憶された記憶媒体 | |
| JP3122417B2 (ja) | 情報表示方法及び情報処理装置 | |
| Lambert et al. | Microsoft Excel Step by Step (Office 2021 and Microsoft 365) | |
| JP2000353163A (ja) | データベース処理装置、及びデータベース処理のためのプログラムが記憶された記憶媒体 | |
| Contributors | LaTeX | |
| Aluthman | Technology-Based Platforms in the Translation Workflow: An Investigation of the Use of CAT Tools among Saudi Professional Translators | |
| JP2000322439A (ja) | 情報検索装置、及び情報検索プログラムが記憶された記憶媒体 | |
| JPH1153395A (ja) | 文書処理装置、文書処理プログラムが記憶された記憶媒体および文書処理方法 | |
| JP2016207036A (ja) | 支援装置、支援方法及び支援プログラム | |
| JPH11184949A (ja) | 帳票処理装置及び記憶媒体 | |
| JPH1145240A (ja) | 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 | |
| Dibbari et al. | The impact of Microsoft Word on office technology and managements | |
| CN114860963A (zh) | 数据标注方法、装置、计算机设备以及存储介质 |