JPH02206828A - 分類計数装置 - Google Patents

分類計数装置

Info

Publication number
JPH02206828A
JPH02206828A JP1025855A JP2585589A JPH02206828A JP H02206828 A JPH02206828 A JP H02206828A JP 1025855 A JP1025855 A JP 1025855A JP 2585589 A JP2585589 A JP 2585589A JP H02206828 A JPH02206828 A JP H02206828A
Authority
JP
Japan
Prior art keywords
data
boundary
classification
indicator
counting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1025855A
Other languages
English (en)
Other versions
JPH0713810B2 (ja
Inventor
Haruo Hayamizu
速水 治夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP1025855A priority Critical patent/JPH0713810B2/ja
Publication of JPH02206828A publication Critical patent/JPH02206828A/ja
Publication of JPH0713810B2 publication Critical patent/JPH0713810B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、多数のデータを任意間隔の値の範囲に分類し
、各分類に含まれるデータ数を計数する分類計数装置に
圓する。
(従来の技術) この種の分類計数装置は、例えばデータベース等のデー
タ群を操作するデータ処理の分野に使用される。第3図
はこの種の分類計数装置が使用される他の装置との接続
構成を示す図である。同図に示す分類計数装置1は、本
体装置6がら指令された分類条件に基づいて、例えばデ
ータベース等のデータ群を格納している2次記憶装d5
がらのデータを分類計数し、この分類集計した結果を本
体装置6に供給するようになっている。
第4図はこのような分類計数処理を行う従来の分類計数
装置の構成を示すブロック図である。同図に示す分類計
数装置は、上述したような2次記憶装置5から読み出し
たデータ群を入力バッファ11に格納し、この入力バッ
ファ11に格納されたデータ群の中からキー抽出回路1
2によって分類の基準となるフィールドを抽出し、整列
回路13に入力可能なデータ属性に変換している。整列
回路13はこのように変換されたデータ群を整列して、
1データずつラッチ14および比較回路15に供給する
。比較回路15は整列回路13から1つずつラッチ14
に保持されたデータ、すなわち1つ前のデータと整列回
路13から出力される次のデータとを比較し、この比較
の結果、キーが同じものを計数回路16によって計数し
、この分類計数した結果を出力バッフ?17に一時的に
格納している。
更に具体的に、第5図(a )に示すデータ例を使用し
て説明する。この例は、氏名、年齢、性別、年収等から
なる職員データベースであり、このデータベースを年齢
と年収の組合せで分類し、各分類のデータ数を求めるも
のである。
第4図の分類計数装置は、このようなデータベースを前
記2次記憶装置から読み出し、入力バッフ711に格納
する。キー抽出回路12は、入力バッファ11に格納さ
れたデータから分類のキーとなるフィールドである年齢
および収入を抽出し、整列回路13の入力となる属性(
符号無しの2進数)で表現した年齢−および年収′に変
換し、元のデータとのリンク情報等の制御情報を付加し
て第5図(b)に示す形式にする。ここで、データ属性
を変換するのは、整列回路13の構成を容易にするため
に当業者においてよく知られている技術である(すなわ
ち、整列対象データを単なるビット列として整列した結
果が元のデータの定義に基づく整列結果と等価になる)
キー抽出回路12において、第5図(b)に示す形式に
変換されたデータは整列回路13に入力され、昇順に整
列化される。整列回路13において、すべてのデータの
整列処理が終了すると、整列化されたデータは整列回路
13から順次出力され、1データずつラッチ14に一時
的に保持されるとともに、比較回路15において比較さ
れる。
すなわち、ラッチ14に一時的に保持された1データは
、比較回路15において次の1データと比較され、同一
であれば、次のデータを破棄し、この破棄したデータ数
を計数回路16で計数する。
また、同一でない場合には、ラッチ14に保持されてい
るデータに対して計数値、すなわち破棄したデータ数に
1を加算した値を付加して出力バッフ717に格納する
ずなわち、整列回路13において整列化されたデータに
おいてはキーが同一なものは連続しているため、このよ
うな操作でキーの重複数が得られるのである。整列回路
13からの出力が終了し、ラッチ14に保持されている
最後のデータを出力バッフ717に格納すると、全デー
タの分類と各分類に属していたデータ数、すなわち各キ
ーの重複数が求められるのである。
このような分類処理において、分類の対象となるフィー
ルドからキーを抽出する場合に、フィールドの全桁また
は2進数表示の場合には全ビットを対象とすれば、フィ
ールドの値そのものによる分類となり、またフィールド
の値の一定の範囲を分類したい場合には、フィールドの
下位桁を切り捨てて、上位桁のみでキーを作成すれば、
切り捨てた桁に応じて一定の値の範囲による分類が可能
となる。例えば、10進数で2桁切り捨てれば100毎
の幅による分類が可能となる。
(発明が解決しようとする課題) 上述した従来の分類計数装置では、一定の値の間隔での
分類計数、すなわち等間隔での分類計数しか行うことが
できないという問題があるとともに、また任意の値の間
隔での分類集計、例えば対象データの属性が10進数の
場合には50毎の間隔での分類計数を行うことができな
いという問題がある。
本発明は、上記に鑑みてなされたもので、その目的とす
るところは、多数のデータを任意の非等間隔の値の縫囲
で分類し、各分類に属するデータ数を計数する分類計数
装置を提供することにある。
[発明の構成] (課題を解決するための手段) 上記目的を達成するため、本発明の分類計数装置は、多
数のデータを任意間隔の値の範囲に分類し、各分類に含
まれるデータ数を計数する分類計数装置であって、前記
データを任意間隔の値の範囲で分類するための境界値を
設定する境界値設定手段と、前記データの各々に対して
第1の表示子を付加し、前記境界値に対して第2の表示
子を付加する表示子付加手段と、該表示子付加手段で第
1および第2の表示子をそれぞれ付加された前記データ
および境界値を同一の列に整列する整列手段と、該整列
手段で整列された前記データおよび境界値からなるデー
タ列において前記境界値を表すデータで区切られた分類
対象データの数を計数する計数手段とを有することを要
旨とする。
(作用) 本発明の分類計数装置では、データの各々および境界値
にそれぞれ第1および第2の表示子を付加し、これらを
同一のデータ列に整列し、このデータ列において境界値
を表すデータで区切られた分類対象データの数を計数し
ている。
(実施例) 以下、図面を用いて本発明の詳細な説明プる。
第1図は本発明の一実施例に係わる分類計数装置の構成
を示すブロック図である。同図に示す分類計数装置は、
前述した第4図の分類計数装置においてキー抽出回路1
2および比較回路150代わりにそれぞれキー抽出・境
界表示付加回路22および境界検出回路23を設けると
ともに、境界値バッファ21を追加した点が異なるのみ
であり、その他の同じ構成要素には同じ符号が付されて
いる。なお、境界値バッファ21はデータを任意間隔の
値の範囲で分類するための境界値を格納するバッファで
あり、キー抽出・境界表示子付加回路22は入力バッフ
ァ11に格納されたデータ群の中から分類のキーとなる
フィールドを抽出するとともに、抽出したデータに対し
て原データであることを示す表示子「OJを付加し、ま
た境界値バッファ21からの境界値データに対しては境
界データであることを示で一表示子「1」を付加する回
路であり、また境界検出回路23は整列回路13で整列
されたデータ列の中から前記表示子「1」を付加された
境界値データを検出する回路である。
なお、第1図に示す分類計数装置も例えば第3図のよう
に2次記憶装@5および本体装置6に接続され、本体装
置6から指令された分類条件に基づいて2次記憶装置5
に記憶されているデータを抽出分類し、この分類したデ
ータを計数し、この分類計数した結果を本体装置6に供
給するようになっている。
以下、第2図に示すデータ例を参照して作用を説明する
。このデータ例は、第5図(a )に示したように、氏
名、年齢、性別、年収等からなる職員データベースであ
り、このデータベースを年齢および年収の組合せで分類
し、各分類データの数を求めるものである。
本実施例では、任意の値の間隔で分類するために、分類
しようとする分類の境界値をすべて指定し、この分類の
境界値を前記境界値バッファ21に格納する。分類の境
界値は第2図(a )の形式により分類の基準となるフ
ィールドと同一属性の境界値の組、すなわち年齢と年収
が指定される。
この境界値として、例えば4つの境界値、すなわち境界
値1〜4を指定した場合、対象とするデータ群は以下の
ように分類され、各分類のデータ数が計数されることに
なる。
(1)キーの値が境界値1以下のもの、(2)キーの値
が境界値1を越え、境界値2以下のもの、 (3)キーの値が境界値2を越え、境界値3以下のもの
、 (4)キーの値が境界値3を越え、境界値4以下のもの
、 (5)キーの値が境界値4を越えるもの。
本実施例の分類計数装置は、前記境界値1〜4が指定さ
れ、これらの境界値を境界値バッファ21に格納すると
、分類対象データベースを前記2次記憶装置から読み出
して入力バッファ11に格納する。キー抽出・境界表示
子付加回路22は入力バッフ711に格納されたデータ
群から分類のキーとなるフィールドである年齢と年収を
抽出し、整列回路13の入力となる属性(符号無しの2
)句数)で表示した年齢′と年収′に変換し、これらの
各々の後ろに原データであることを表示する境界表示子
「0」を付加するとともに、更に原データとのリンク情
報等の制御情報を付加して、第2図(b)に示す形式に
変換する。
また、キー抽出・境界表示子付加回路22は、境界値バ
ッファ21に格納されている第2図(a )に示す分類
境界値の年齢および年収の各々の後ろに境界データであ
ることを表示する境界表示子「1」を付加して、第2図
(b)に示す形式に変換する。そして、キー抽出・境界
表示子付加回路22は、第2図(b)に示す形式に変換
されたデータおよび境界値データを整列回路13に供給
する。
整列回路13は、第2図(b )に示す形式に変換され
たデータおよび境界値データを昇順に整列化し、この整
列化したデータを順次1データずつ出力する。整列回路
13から出力されたデータは1データずつラッチ14に
一時保持され、その境界表示子が境界検出回路23によ
って判定される。
境界表示子がrOJであれば、原データであるので、境
界検出回路23はそのデータを破棄し、計数回路16に
対して計数信号を供給し、カウントアツプさせる。すな
わち、境界表示子「0」の原データを検出する毎に計数
回路16はカウントアツプし、境界表示子「0」のデー
タを計数するのである。また、境界表示子が「1」であ
る場合には、境界値データであるので、計数回路16で
計数せずに、この境界値データにこれまで計数回路16
で計数した計数値を付加し、第2図(C)に示す計数の
データとして出力バッフ717に格納する。なお、各フ
ィールド対応に原データに対しては境界表示子「0」か
が付加され、境界値データに対しては境界表示子「1」
が付加され、境界値データはキー値が同一のデータの中
で最大値となっているので、境界値データは各分類のデ
ータの中で整列回路13から最後に出力される。
このような処理を分類境界値1から4まで繰り返し行い
、分類境界値4までの計数が終了した後、分類境界Wi
4を越えるデータは最後のデータまでのデータ数を計数
し、最後のデータに計数値を付加して出力バッフ717
に格納する。
このような処理を行うことにより、上述した(1)〜(
5)に示した分類に対するデータ数の計数値が第2図(
C)に示す形式で出力バッファ17から得られるのであ
る。ここで、(1)〜(4)の分類に対する年齢および
年収にはそれぞれ境界値1〜4の値が入り、(5)の分
類に対する年齢および年収には原データの最大値が入る
上記実施例では、境界値データに対する境界表示子とし
て「1」を付加して、分速。境界値を各範囲のデータ値
の最大として分類する例について説明したが、境界値を
各範囲のデータ値の最小値として分類する場合には、境
界表示子の値を上述と反対に原データに対しては境界表
示子「1」を付加し、境界値データに対しては境界表示
子rOJを付加すればよい。また、対象フィールドの数
、境界値の数はいずれも本実施例に限定されるものでな
い。更に、°本実施例における整列回路の構成は本質的
なものでなく、どのような整列回路の周辺に本発明の構
成要素を組み合わせても有効である。
[発明の効果] 以上説明したように、本発明によれば、データの各々お
よび境界値にそれぞれ第1および第2の表示子を付加し
、これらを同一のデータ列に整列し、このデータ列にお
いて境界値を表すデータで区切られた分類対象データの
数を計数しているので、境界値を任意の非等間隔な値に
設定することができ、これにより任意の非等間隔な値の
範囲にデータを分類し、計数することができる。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる分類計数装置の構成
を示すブロック図、第2図は第1図の分類計数装置を説
明するために使用されるデータ例を示す図、第3図は分
類計数装置と他の装置との接続例を示すブロック図、第
4図は従来の分類計数装置の構成を示すブロック図、第
5図は第4図に示す従来の分類計数装置を説明するため
のデータ例を示1図である。 11・・・入力バッフ? 13・・・整列回路 14・・・ラッチ 16・・・計数回路 21・・・境界値バッフ? 22・・・キー抽出・境界表示子付加回路23・・・境
界検出回路

Claims (1)

    【特許請求の範囲】
  1. 多数のデータを任意間隔の値の範囲に分類し、各分類に
    含まれるデータ数を計数する分類計数装置であって、前
    記データを任意間隔の値の範囲で分類するための境界値
    を設定する境界値設定手段と、前記データの各々に対し
    て第1の表示子を付加し、前記境界値に対して第2の表
    示子を付加する表示子付加手段と、該表示子付加手段で
    第1および第2の表示子をそれぞれ付加された前記デー
    タおよび境界値を同一の列に整列する整列手段と、該整
    列手段で整列された前記データおよび境界値からなるデ
    ータ列において前記境界値を表すデータで区切られた分
    類対象データの数を計数する計数手段とを有することを
    特徴とする分類計数装置。
JP1025855A 1989-02-06 1989-02-06 分類計数装置 Expired - Fee Related JPH0713810B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1025855A JPH0713810B2 (ja) 1989-02-06 1989-02-06 分類計数装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1025855A JPH0713810B2 (ja) 1989-02-06 1989-02-06 分類計数装置

Publications (2)

Publication Number Publication Date
JPH02206828A true JPH02206828A (ja) 1990-08-16
JPH0713810B2 JPH0713810B2 (ja) 1995-02-15

Family

ID=12177439

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1025855A Expired - Fee Related JPH0713810B2 (ja) 1989-02-06 1989-02-06 分類計数装置

Country Status (1)

Country Link
JP (1) JPH0713810B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102184214B (zh) * 2011-05-04 2013-07-31 东南大学 一种数据分组快速查找定位法

Also Published As

Publication number Publication date
JPH0713810B2 (ja) 1995-02-15

Similar Documents

Publication Publication Date Title
JP2003044267A (ja) データソート方法、データソート装置およびデータソートプログラム
JP2790466B2 (ja) 文字列検索方法及び装置
Estabrook A mathematical model in graph theory for biological classification
US6189006B1 (en) Full-text index producing device for producing a full-text index and full-text data base retrieving device having the full-text index
CN111737694B (zh) 一种基于行为树的恶意软件同源性分析方法
CA2006230C (en) Method and apparatus for validating character strings
CN112104518A (zh) 一种比特数据特征挖掘方法、系统、设备及可读介质
CN111400448A (zh) 对象的关联关系分析方法及装置
CN114398891B (zh) 基于日志关键词生成kpi曲线并标记波段特征的方法
US6442561B1 (en) Method of constructing binary decision trees with reduced memory access
JPH087669B2 (ja) 符号化方法、符号化装置、及び復号化装置
JPH069054B2 (ja) 文書自動分類装置
US6760737B2 (en) Spatial median filter
JPH05225238A (ja) データベース検索システム
JPH02206828A (ja) 分類計数装置
JPH04326164A (ja) データベース検索システム
CN105843971A (zh) 一种基于rlid3的增量集成学习的数据分类方法
JP3534471B2 (ja) マージソート方法及びマージソート装置
CN115186763B (zh) 一种针对工业安全设备Json类型Syslog的预处理方法
CN115639530A (zh) 辐射源合批方法、装置及存储介质
CN114462390A (zh) 一种实体标签预测方法、装置、设备及存储介质
JPH02158871A (ja) 文書分類装置
US6779162B2 (en) Method of analyzing and filtering timing runs using common timing characteristics
JPS59121436A (ja) デ−タ群のソ−ト方法
CN113139106B (zh) 一种保密检查的事件审核方法和装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees