JPH02244380A - データベースシステム - Google Patents

データベースシステム

Info

Publication number
JPH02244380A
JPH02244380A JP1066931A JP6693189A JPH02244380A JP H02244380 A JPH02244380 A JP H02244380A JP 1066931 A JP1066931 A JP 1066931A JP 6693189 A JP6693189 A JP 6693189A JP H02244380 A JPH02244380 A JP H02244380A
Authority
JP
Japan
Prior art keywords
data
input
normalized
abc
normalization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1066931A
Other languages
English (en)
Inventor
Emiko Itou
伊藤 栄美子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1066931A priority Critical patent/JPH02244380A/ja
Publication of JPH02244380A publication Critical patent/JPH02244380A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、大量のデータを記憶して検索するデータベー
スシステムに関し、41に入力テールO費記自由度の向
上ならびにユーザインターフェースの改善に関する。
(従来の技術) データベースシステムは、大量のデータを記憶し、記憶
されているデータの中から検索条件に該当するデータを
取出すことができるシステムである。記憶できるデータ
形式はシステムによって異なるが、基本的なデータ形式
は文字(文字列)形と数値形とでア)、それらに加えて
日付は形、あるいは金額形など、システム固有のデータ
形式が存在する場合もある。
検索は、検索情報として与えられたデータと、記憶され
ているデータとの比較(マツチング)によって行われる
。例えば1文字形データによって検索を行う場合には、
検索情報として入力された文字列と、記憶されている文
字列とを比較する。
文字列は空白文字の有無ならびに全角/牛角文字の違い
も含めて比較されるので、登録時に入力された文字列と
完全に同じ表記でデータを入力しないと一致と見なされ
ない。
(発明が解決しようとする課題) 上述した従来のデータベースシステムにおいて、キーワ
ード検索などの文字列による検索を行う友めには、登録
したときと完全に同じ表記のデータを検索情報として与
えなければならない。しかし、一般的にユーザが入力す
るデータの表記には一貫性がなく、データを登録し九と
自と検索情報を入力するときとでは、空白文字の有無、
あるいは全角/牛角文字の入力などにばらつきがでる場
合が多い。例えば、キーワードの登a時に半角文字でr
AHOJと入力していても、これを全角文字の(”AB
OJであるとして入力し、検索しようとすることなどの
WAbが頻繁に起こる。q#に、マルチェーザで使用し
ている場合には、登録した人と検索する人とが異なるの
が普通なので、個人差も加わってこのようなデータ表記
のばらつきが大きくなると云う欠点がある。
本発明の目的は、検索可能なデータベースにおいて、利
用者の個人差などによる入力データの費記のばらつきを
補正し、正規化することによって上記欠点を除去し、ば
らつきを小さくできるように構成したデータベースシス
テムヲ提供することにある。
(課題を解決するための手段) 本発BAKよるデータベースシステムハ、主に登録およ
び検索のためにデータを入力および表示するための入出
力部と、大食のデータを記憶するデータ記憶部と、上記
入出力部から入力される検索情報から上記記憶部内のデ
ータを検索するための検索処理部とで構成され次データ
ベースシステムに対して、利用者の個人差などによる入
力データの表記のばらつきを補正するためにデータを正
規化する正規化部と、正規化した正規化データを記憶す
るための正規化データ記憶部とを付加して構成したもの
である。
(実 施fl) 次に1本発明について図面を参照して説明する。
第1図は、本発明によるデータベースシステムの一実施
例を示すブロック図である。
第1図において、データベースシステムは、データの入
出力全行57tめの入出力部lと、データの正規化を行
うための正規化部2と、入出力部lから入力されたデー
タを記憶するためのデータ記憶部3と、正規化!IS2
により正規化されたデータを記憶するための正規化デー
タ記憶部4と、検索情報として入力されたデータとデー
タ記憶部3tたは正規化データ記憶部4のデータと全比
較することによって検索を実行するための検索処理部5
と、データの登録・削除・修正などを行うためのデータ
操作部6と、動作を制御するための制御部7とから構成
される。
データの登録時には、入出力部lに入力されたデータを
従来システムと同様にしてデータ記憶部3に転送する。
しかし、正規化を必要とするデータフィールドに対する
入力の場合には、入力されたtまの形式のデータをデー
タ記憶部3に転送するのと同時に、正規化部2により正
規化されたデータを正規化データ記憶部4にも転送する
正規化を必要とするデータを検索情報として検索する場
合、入出力部lから入力されたデータを正規化部2によ
り正規化して検索処理部5に転送し、入出力部1のデー
タと正規化データ記憶部4のデータとを比較する。正規
化を必要としないデータを検索情報とする場合には、従
来通りに入出力部4の入力データを1そのiま検索処理
部5に転送して、入出力部1のデータとデータ記憶部3
のデータとを比較する。
ま危、検索結果などを表示する場合には、データ記憶部
3のデータを入出力部lに転送して出力することt原則
とする。
本実施例で導入し九新しいデータ形式である正規化文字
形データについて具体的に説明する。
92図は、正規化文字形データの論理フォーマツ)?示
す説明図である。正規化文字形データは、入力され次ま
まの外部形式データ11と、正規化データ12との組合
せで費現される。従って、あるフィールドのデータ形式
として正規化文字形を指定すると、外部形式データ11
がデータ記憶部3に記憶され、正規化データ12が正規
化データ記憶部4に記憶される。本実施例の正規化部2
では、ごく単純に文字列から空白文字を除去し、全角文
字を半角文字に変換することにより文字形データを正規
化している。
従って、「ABOABOJと入力して奄、あるいは「A
no  ABOJと入力しても、正規化データ12はr
ABo人BOJとなる。
正規化文字形データを検索情報として検索を行う場合、
入出力部lから入力され次データを正規化部2で正規化
し九データと、正規化データ記憶!a4に記憶されてい
る正規化データ12とを検索処理部5に転送して比較す
る。例えばrABOABOJが検索情報として入力され
ると、正規化部2で「λBOABOJという形式に正規
化して検索処理部5に転送し、正規化データ記憶部4の
データと比較する。従って、登録時の興起がI”ABO
ABOJであっても。
あるいは「ABOABOJであっても、rABOABO
Jという検索情報によって選択されることになる。
しかし、正規化されたデータではなく、入力されたit
のデータを検索情報として検索し良い場合もある。例え
ば、「ABOABOJとい5表記に意味があp、それを
正規化したrhm。
ABOJを検索したいのではな−というような場合であ
る。
このような時には、入出力部lに入力されたデータを、
そのtt検索処理部5に転送して、このデータをデータ
記憶部3の外部形式データ11と比軟する。
本実施例では文字列の空白文字の除去、ならびに全角文
字から牛角文字への変換による正規化の例を記述したが
、正規化は大文字と小文字の変換や1日付は形データの
表記などにも応用できること紘言うまでもない。
(発明の効果) 以上説明したように本発明は、データを正規化して正規
化データとして記憶し、さらに検索情報として入力し次
データも同5FcfE規化することによ)、入力データ
の表記のばらつきを吸収して、ユーザが要求するデータ
をよ〕確率高く提供できるようにし、操作性を向上させ
ることができるという効果がある。
さらに、正規化などの処理はデータの登録や検索のため
の入力時に行われ、検索時には従来通りの単純なマツチ
ング処理を行うだけであるので、速度性能にもほとんど
影響しないと云う効果がある。
表画面の(資)率な説明 第1図は、本発明におけるデータベースシステムの一実
7MfIlt−示すブロック図である。
第2図は正規化文字形データの論理フォーマット例倉示
す説明図である。
l・・・入出力部    2・・・正規化部3・・・デ
ータ記憶部 4・・・正規化データ記憶部  5・・・検索処理部6
・・・データ操作部   7・・・制御部11・・・外
部形式データ 12・・・正規化データ

Claims (1)

    【特許請求の範囲】
  1. 主に登録および検索のためにデータを入力および表示す
    るための入出力部と、大量のデータを記憶するためのデ
    ータ記憶部と、前記入出力部から入力される検索情報か
    ら前記記憶部内のデータを検索するための検索処理部と
    によつて構成されるデータベースシステムにおいて、利
    用者の個人差などによる入力データの表記のばらつきを
    補正する目的でデータを正規化するための正規化部と、
    前記正規化により得られた正規化データを記憶するため
    の正規化データ記憶部とを具備して構成したことを特徴
    とするデータベースシステム。
JP1066931A 1989-03-17 1989-03-17 データベースシステム Pending JPH02244380A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1066931A JPH02244380A (ja) 1989-03-17 1989-03-17 データベースシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1066931A JPH02244380A (ja) 1989-03-17 1989-03-17 データベースシステム

Publications (1)

Publication Number Publication Date
JPH02244380A true JPH02244380A (ja) 1990-09-28

Family

ID=13330231

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1066931A Pending JPH02244380A (ja) 1989-03-17 1989-03-17 データベースシステム

Country Status (1)

Country Link
JP (1) JPH02244380A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05233710A (ja) * 1992-02-24 1993-09-10 Nec Corp 文字列照合方法
JPH08287080A (ja) * 1995-04-11 1996-11-01 Fuji Xerox Co Ltd 関連語辞書作成装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05233710A (ja) * 1992-02-24 1993-09-10 Nec Corp 文字列照合方法
JPH08287080A (ja) * 1995-04-11 1996-11-01 Fuji Xerox Co Ltd 関連語辞書作成装置

Similar Documents

Publication Publication Date Title
US5729730A (en) Method and apparatus for improved information storage and retrieval system
US7328211B2 (en) System and methods for improved linguistic pattern matching
JP4160548B2 (ja) 文書要約作成システム、方法、及びプログラム
KR20010088892A (ko) 한자입력장치 및 방법
JPH0252292B2 (ja)
JPH02244380A (ja) データベースシステム
US7130470B1 (en) System and method of context-based sorting of character strings for use in data base applications
JPH05250416A (ja) データベースの登録・検索装置
JP7762371B1 (ja) データ処理方法、データ処理システム、及びデータ処理用プログラム
JP2621999B2 (ja) 文書処理装置
JPH01307865A (ja) 文字列検索方式
JPH0664572B2 (ja) 辞書作成装置
JPH03177972A (ja) データベースシステム
JPH0353378A (ja) 同音異字および異字同音の姓を検索する氏名検索方式
JP3036005B2 (ja) かな漢字変換装置
JP3431618B2 (ja) データ検索装置および検索方法
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPS60138668A (ja) 情報端末処理制御装置
JP2000348055A (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JPH07129565A (ja) 情報処理装置
JPH0721173A (ja) 文書処理装置
Khan et al. Design and Development of a Bangla SQL System for DBMS
JPH03276257A (ja) 検索専用キーを備えた電子フアイリング装置
JPH08278980A (ja) データ処理装置
JPH04120656A (ja) 文書処理装置