JPH11175705A - データファイリング装置 - Google Patents

データファイリング装置

Info

Publication number
JPH11175705A
JPH11175705A JP9348053A JP34805397A JPH11175705A JP H11175705 A JPH11175705 A JP H11175705A JP 9348053 A JP9348053 A JP 9348053A JP 34805397 A JP34805397 A JP 34805397A JP H11175705 A JPH11175705 A JP H11175705A
Authority
JP
Japan
Prior art keywords
classification
data
image data
image
identification mark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9348053A
Other languages
English (en)
Inventor
Satoru Murakami
哲 村上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP9348053A priority Critical patent/JPH11175705A/ja
Publication of JPH11175705A publication Critical patent/JPH11175705A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】 【課題】 特定のフォーマットに限定されず、原稿の画
像データに基づいて分類可能としたデータファイリング
装置を提供することである。 【解決手段】 カラースキャナー11で読み取った画像
をデータを第1記憶装置12に記憶する。キーボード1
3から入力した分類条件に基づいて、画像データ抽出手
段14が、画像データから分類項目に関する画像データ
を抽出する。画像データを文字認識部17で文字データ
に変換し、その数字部分を数字抽出部18で抽出する。
この数字を、データ集計部19で集計して、それを第2
記憶装置の記憶領域16a,16b,16cに分類記憶
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、原稿からデジタル
画像データを取り込み、分類識別マークの部分のの画像
データを分類するデータファイリング装置に関するもの
である。
【0002】
【従来の技術】従来では一枚の原稿の中のデータを分類
する場合、スキャナーで原稿をすべて読み取り、ホスト
コンピューターの画面上で人手により領域を指定して分
類する。あるいは、予め決められたフォーマットの指定
された場所に識別データを記入して、この識別データに
基づいてデータを分類する方法が一般的である。
【0003】ところが、上記分類方法では、人手が必要
とされ、作業効率が悪かった。これを改善するものとし
て、特開平4−77981号公報には、帳票の識別コー
ドとその帳票におけるドロップアウトカラーの対応付け
により、帳票のドロップアウトカラーに応じて光源の色
を切換え、ドロップアウトカラーで書かれた帳票の領域
枠を自動的に削除する装置が開示されている。この装置
では、ドロップアウトカラーに基づいて帳票を人手によ
り分類する必要がなく、自動的に帳票を識別処理でき
る。
【0004】
【発明が解決しようとする課題】しかし、この分類装置
では、ドロップアウトカラーの処理がなされている原稿
に対してのみ有効であり、特定のフォーマットに限定さ
れてしまう。例えば、原稿にマーキングした色等に基づ
いて分類する場合などに対応できず、汎用性がない。し
たがって、特定のフォーマットに限定されず、原稿に記
入されているさまざまのデータに着目して分類するに
は、結局人手に頼らざるを得なかった。
【0005】本発明の目的は、特定のフォーマットに限
定されず、原稿の画像データに基づいて分類可能とした
データファイリング装置を提供することである。
【0006】
【課題を解決するための手段】請求項1の発明は、分類
抽出部分を識別するための分類識別マークを設けた原稿
を走査して、その画像をデジタル画像データとして取り
込むための画像入力手段と、前記分類識別マークと分類
項目とを対応づける分類条件を入力する条件入力手段
と、入力された分類項目に対応する分類識別マークを、
取り込んだ画像データの中から識別し、該分類識別マー
クの示す分類抽出部分の画像データを抽出する画像デー
タ抽出手段と、抽出された前記画像データを分類記憶す
る分類記憶手段と、を具備することを特徴とするデータ
ファイリング装置である。
【0007】請求項2の発明は、分類抽出部分を識別す
るための分類識別マークを設けた原稿を走査して、その
画像をデジタル画像データとして取り込むための画像入
力手段と、前記分類識別マークと分類項目とを対応づけ
る分類条件を入力する条件入力手段と、入力された分類
項目に対応する分類識別マークを、取り込んだ画像デー
タの中から識別し、該分類識別マークの示す分類抽出部
分の画像データを抽出する画像データ抽出手段と、抽出
された前記画像データを加工処理するデータ処理手段
と、加工処理されたデータを分類記憶する分類記憶手段
と、を具備することを特徴とするデータファイリング装
置である。
【0008】請求項3の発明は、請求項2記載のデータ
ファイリング装置であって、前記データ処理手段は、前
記画像データ抽出手段で抽出された画像データを文字認
識を行って文字データに変換する文字認識部からなり、
前記分類記憶手段は、前記文字データを記憶することを
特徴とする。
【0009】請求項4の発明は、請求項2記載のデータ
ファイリング装置であって、前記データ処理手段は、前
記画像データ抽出手段で抽出された画像データを文字認
識を行って文字データに変換する文字認識部と、前記文
字データのうち数字のみを抽出する数字抽出部と、予め
設定された演算条件に基づき、抽出された前記数字を演
算する演算部と、からなり、前記分類記憶手段は、演算
された結果を記憶することを特徴とする。
【0010】請求項5の発明は、請求項2記載のデータ
ファイリング装置であって、前記データ処理手段は、前
記画像データ抽出手段で抽出された画像データを文字認
識を行って文字データに変換する文字認識部と、前記文
字データのうち数字のみを抽出する数字抽出部と、抽出
された数字の演算条件を入力する演算条件入力部と、前
記演算条件に基づき、抽出された前記数字を演算処理す
る演算部と、からなり、前記分類記憶手段は、演算され
た結果を記憶することを特徴とする。
【0011】請求項6の発明は、請求項1ないし5のい
ずれかに記載のデータファイリング装置であって、前記
分類識別マークは、前記分類抽出部分を囲む各種の線で
あり、前記画像抽出手段は、分類項目に対応する種類の
線で囲まれた部分の画像データを抽出することを特徴と
する。ここで、線の種類とは、例えば、線の色、形状
(破線、一点鎖線、二重線等)又は太さ等をいう。
【0012】請求項7の発明は、請求項1ないし5のい
ずれかに記載のデータファイリング装置であって、前記
分類識別マークは、前記分類抽出部分に引いた各種の下
線であり、前記画像抽出手段は、分類項目に対応する種
類の下線が引かれた部分の画像データを抽出することを
特徴とする。ここで、下線の種類とは、線の色、形状
(破線、一点鎖線、二重線等)又は太さ等をいう。
【0013】請求項8の発明は、請求項1ないし5のい
ずれかに記載のデータファイリング装置であって、前記
分類識別マークは、前記分類抽出部分の各種の色であ
り、前記画像抽出手段は、分類項目に対応する種類の色
の部分の画像データを抽出することを特徴とする。ここ
で、分類抽出部分の色とは、原稿の文字等の色や背景の
色等をいう。
【0014】請求項9の発明は、請求項1ないし5のい
ずれかに記載のデータファイリング装置であって、前記
分類識別マークは、前記分類抽出部分を囲む線で描かれ
た各種の形状であり、前記画像抽出手段は、分類項目に
対応する種類の形状で囲まれた部分の画像データを抽出
することを特徴とする。
【0015】請求項10の発明は、請求項1ないし5の
いずれかに記載のデータファイリング装置であって、前
記分類識別マークは、前記分類抽出部分の行の先頭また
は後尾に描いた各種のマークであり、前記画像抽出手段
は、分類項目に対応する種類のマークのある行の画像デ
ータを抽出することを特徴とする。マークの種類は、形
状(丸、三角、星印し等)又は色、これらの組み合わせ
である。
【0016】請求項11の発明は、請求項3ないし5の
いずれかに記載のデータファイリング装置であって、前
記分類識別マークは、前記分類抽出部分の各種の文字で
あり、前記画像抽出手段は、前記分類項目に対応する種
類の文字の部分の画像データを抽出することを特徴とす
る。
【0017】請求項12の発明は、請求項1ないし5の
いずれかに記載のデータファイリング装置であって、前
記分類識別マークは、前記分類抽出部分を構成するドロ
ップアウトカラーであり、前記画像入力手段は、前記ド
ロップアウトカラーと同色の光源を有し、ドロップアウ
トカラー以外の画像を読み取ることことを特徴とする。
【0018】請求項13の発明は、請求項1ないし5の
いずれかに記載のデータファイリング装置であって、前
記画像抽出手段は、前記分類識別マークがない部分の画
像データも抽出することを特徴とする。
【0019】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を参照しながら説明する。
【0020】〔第1実施形態〕図1は、本発明に係るデ
ータファイリング装置の第1実施形態を示すブロック図
である。このデータファイリング装置は、複数の見積書
を見積項目毎にマーキングして分類し、文字変換を行い
各項目の合計金額を集計する装置である。
【0021】このファイリング装置に読み取らせる原稿
は、予めカラーペンにより、ファイリングしたい部分
(分類部分)を、分類項目毎に色を変えてマーキングし
てある。このマーキング箇所がデータ分類するうえでの
分類識別マークとなる。図1に示すファイリング装置
は、マーキングした原稿を読み取り、カラーデジタル画
像データに変換する画像入力手段であるカラースキャナ
11、カラースキャナ11で読み取った画像データを記
憶する第1記憶装置(半導体メモリ又はハードディス
ク)12、分類識別マークであるマーキングの色を分類
項目に関連付けた分類条件を入力する条件入力手段であ
るキーボード13、分類項目に対応したマーキングの色
を識別し、該マーキングの示す分類部分の画像データを
抽出する画像データ抽出手段14と、この画像データを
加工処理するデータ処理手段15と、処理されたデータ
を所定の記憶領域16a〜16cに分類記憶する第2記
憶装置16とからなる構成である。データ処理手段15
は、画像データ抽出手段14で抽出された画像データを
文字認識を行って文字データに変換する文字認識部17
と、前記文字データのうち数字のみを抽出する数字抽出
部18と、これら数字の合計を集計するデータ集計部1
9とから構成されている。
【0022】次に、このデータファイリング装置の動作
手順を説明する。図2は、第1実施形態のデータファイ
リング装置の動作を示すフローチャートであり、図3及
び図4は、分類動作の過程の説明図である。
【0023】ステップS1において、分類すべきデータ
箇所はマーキングで囲まれた部分と設定されているの
で、キーボード13より、マーキングの色と分類項目を
図3(a)のように関連付けて入力する。このとき、分
類して記憶する第2記憶装置16の記憶領域16a〜1
6cも指定しておく。ステップS2において、分類項目
毎に原稿(見積書A,B)のデータを、図3(b)に示
すように、図3(a)で指定した色のペンで囲む。ステ
ップS3において、見積書A,Bをカラースキャナー1
1によってデジタル画像データとして読み取り、この画
像データをすべて一旦第1記憶装置12に記憶する。
【0024】ステップS4において、まず、第1記憶装
置12に記憶された画像データのうち、図3(a)に指
定された赤色のペンで囲まれた部分、すなわち分類項目
である部品代を分類する。第1記憶装置12に記憶され
ている画像データからマーキングの色である「赤」を抽
出し、その位置を検出する。そして、赤のマーキングで
囲まれている画像データ31,36を抽出する。
【0025】ステップS5において、図4(a)のよう
に抽出された画像データ31,36を、文字認識部17
により文字変換すると、図4(b)に示すように、数字
41,46となる。この場合、文字認識部17によって
変換されたデータは、すべて数字であるので、数字抽出
部18により、文字データの中から数字を抽出する必要
はない。ステップS6において、図4(b)に示すよう
に、変換された数字41,46の合計を集計する。そし
て、数字41,46と、その合計51を第2記憶装置1
6の記憶領域16aに記憶する。
【0026】ステップS7において、この読み取った原
稿に関して分類が終了したか否かを確認する。終了して
いないので、ステップS4に戻る。ステップS4におい
て、青色のペンで囲まれた部分32,35の画像データ
を抽出し、一連の処理を行い(ステップS5〜S6)、
数字42,45と合計52を第2記憶装置16の記憶領
域16bに記憶する。同様に、黄色のペンで囲まれた部
分33,34の画像データを抽出し、一連の処理を行い
(ステップS5〜S6)、数字43,44と合計53を
第2記憶装置16の記憶領域16cに記憶する。以上の
処理によって、図4(b)に示すように、見積書A,B
が項目毎に集計され、第2記憶装置16の記憶領域16
a〜16cに記憶される。図3(a)に指定された全項
目の処理が終わると、ステップS7からステップS3に
戻り、カラースキャナー11によって、新たな原稿を読
み取り、同様の処理を行う。
【0027】さて、本実施形態では、マーキングした箇
所には、数字のみであったため、数字抽出部18におい
て、文字データの中から数字のみを抽出する必要はなか
ったが、数字と文字が混在している場合には、数字抽出
部18で数字を抽出してから演算処理を行う。また、合
計処理に限らず、他の演算処理もあらかじめ設定してお
けば、処理が可能である。また、ペンで囲まれたデータ
31〜36を分類抽出したが、これだけでなく、あらか
じめ、キーボード13により分類条件を入力しておくこ
とにより、ペンに囲まれていないデータ37,38を抽
出することも可能である。
【0028】また、図5に示すように、原稿にカラーペ
ンにより分類抽出部分に下線を引いても、同様の効果が
実現できる。この時、下線の形状(破線、波線、二重線
等)でも分類可能とすることにより、モノクロスキャナ
ーを使っても同様の効果を得ることができる。図5で
は、実線部分61,66、破線部分62,64、一点鎖
線63,64のように、下線を引く。これに基づいて、
各データを読み取り分類する。また、原稿の分類抽出部
分を様々の線形状(破線、波線、二重線等)で囲んで
も、同様の効果を得ることができる。
【0029】また、図6に示すように、原稿の分類抽出
部分を蛍光マーカーの様なもので塗りつぶし、分類抽出
部分の背景の色を分類項目毎に変えてもよい。例えば、
赤71,76、青72,74、黄73,75のように塗
り、この部分のデータを同じ色毎に分類する。あるい
は、図7に示すように、原稿の分類抽出部分を囲む線が
描く形状(丸、四角、三角等)あるいは線の太さによ
り、同様の効果が実現できる。丸81,86、四角8
2,84、三角83,85のようにマーキングして、こ
の部分のデータを同じ形状毎に分類する。また、図8に
示すように、脚注を赤字で書いてある文章の脚注のみを
抜き出す等、予め多色の文字で印刷された原稿を文字の
色毎に分類することもできる。赤字91,96、青字9
2,94、黄字93,95として、この部分のデータを
同じ色毎に分類する。また、スキャナーにドロップアウ
トカラー用の光源が備えられており、原稿の分類識別マ
ークはドロップアウトカラーとする。こうしてドロップ
アウトカラーと同色の光源で原稿を読み取ることによ
り、ドロップアウトした以外のデータを抽出し分類する
ことができる。
【0030】第1実施形態では、マーキングの色と分類
項目の関連付けをキーボードより入力する例について示
したが、取り込んだ画像を表示装置(ディスプレイ)に
表示し、表示装置上で取り込んだ画像のマーキング部を
マウスやキーボード等で選択して、その色に対応する分
類項目をキーボードから入力することもできる。
【0031】第1実施形態では、読み込んだ画像データ
を分類抽出してから文字変換する例を示したが、文字変
換してから分類することも可能である。この場合は、画
像データから分類識別マーク(例えば、マーキングの
色)を抽出して、抽出すべき画像データ領域を設定して
おく。そして、すべての画像データを文字変換してか
ら、抽出すべき画像データ領域にある文字データを抽出
し分類する。
【0032】〔第2実施形態〕第1実施形態では、合計
等の演算処理をあらかじめ設定しておく装置を説明した
が、演算条件を入力することによって、場合に応じて様
々な演算を可能とすることもできる。例えば、図3に示
した分類条件によって、マーキングの色分類項目毎に平
均値を演算させる場合が考えられる。図9は、本発明に
係るデータファイリング装置の第2実施形態を示すブロ
ック図である。図10は、第2実施形態のデータファイ
リング装置の動作を示すフローチャートである。
【0033】この実施形態は、図1のデータファイリン
グ装置のデータ処理手段15に演算条件入力部20を備
えた構成である。したがって、図10のステップS11
において、図3(a)の分類条件をキーボード13より
入力するとともに、演算条件設定部20に平均値計算を
させる演算条件(平均値計算式)も入力する(図11
(a))。つぎに、図10に示すステップS12〜S1
7の流れに沿って処理が行われる。ここで、ステップS
12〜S17は、ほぼ図2のステップS2〜S7フロー
と同じであるので、説明は省略する。但し、ステップS
16では、ステップS6と異なり、演算部21で合計で
はなく平均値が求められる。
【0034】演算結果を図11(b)に示す。すなわ
ち、赤でマーキングされた部品代の平均値、青でマーキ
ングされた金型費の平均値、黄でマーキングされた加工
費の平均値が算出され、第2記憶装置の記憶領域16a
〜16cに分類記憶される。このように演算条件を設定
することにより、平均値や偏差値等、任意の演算をする
こともできる。
【0035】〔第3実施形態〕図12は、本発明に係る
データファイリング装置の第3実施形態を示すブロック
図である。このデータファイリング装置は、データ処理
手段14に文字認識部17のみが存在する。本実施形態
は、画像データを文字データに変換し、その文字データ
自体を分類するもので、例えば、名簿など行単位で書か
れた原稿に対して行毎にマーキングし、行単位で分類す
るものである。
【0036】次に、このデータファイリング装置の動作
手順を説明する。図12は、第1実施形態のデータファ
イリング装置の動作を示すフローチャートであり、図1
3は、分類動作の過程の説明図である。
【0037】このデータファイリング装置は、3年1組
と3年2組の名簿に基づいて、A,B,Cの各班に分類
された名簿を作成するものである。ステップS21にお
いて、キーボード23より、マーキングの色と分類項目
を図3(a)のように関連付けて入力する。このとき、
分類して記憶する第2記憶装置の領域16a〜16cも
指定しておく。ここで、赤はA班、青はB班、黄色はC
班である。ステップS22において、分類項目毎に原稿
(名簿A、B)の各行の先頭に、図14(b)の原稿の
ように、図14(a)で指定した色のペンで円形のマー
クを付ける。ステップS23において、名簿A,Bをカ
ラースキャナー11によってデジタル画像データとして
読み取り、この画像データをすべて一旦第1記憶装置1
2に記憶する。
【0038】ステップS24において、まず、第1記憶
装置12に記憶された画像データのうち、図14(a)
に指定された赤色の円形マーク、すなわち分類項目であ
るA班に該当する者を分類する。第1記憶装置12に記
憶されている画像データからマーキングの色である
「赤」を識別し、その行位置を検出する。そして、赤の
円形マークの付いている行101,105の画像データ
を抽出する。
【0039】ステップS25において、抽出された画像
データを、文字認識部17により文字変換すると、文字
111,115となる。ステップS26において、分類
した結果を図14(c)に示すように、抽出した文字デ
ータを第2記憶装置の記憶領域16aに記憶していく。
この結果、A班の記憶領域16aには、文字(名前)1
11,115が集計されることになる。
【0040】ステップS27において、この読み取った
原稿に関して分類が終了したか否かを確認する。終了し
ていないので、ステップS24に戻る。ステップS24
において、青色の円形マークが付いている行102,1
06の画像データを抽出し、一連の処理を行い(ステッ
プS25〜S26)、文字112,116を第2記憶装
置の記憶領域16bに記憶する。同様に、黄色の円形マ
ークが付いている行103,104の画像データを抽出
し、一連の処理を行い(ステップS25〜S26)、文
字113,114を第2記憶手段の記憶領域16cに記
憶する。以上の処理によって、図14(c)に示すよう
に、名簿A,Bの名前がA班、B班、C班に分類集計さ
れ、第2記憶手段の記憶領域16a〜16cに記憶され
る。図14(a)に指定された分類条件の全項目の処理
が終わると、ステップS27からステップS23に戻
り、カラースキャナー11によって、新たな原稿を読み
取り、同様の処理を行う。
【0041】このデータファイリング装置は、色でなく
マーキングの形状(丸、四角等)で分類することによ
り、モノクロスキャナーでも同様の効果が得られる。
【0042】また、例えば出張報告書などの文章の書か
れた原稿に対して分類項目毎に文章の先頭と後尾にマー
キングし、その間の文章を抽出し分類することもでき
る。図15に示すように、出張報告書から目的地、日
程、業務内容を分類抽出する実施例を示す。図15
(a)のように、分類項目(目的地、日程、業務内容)
毎に設定された色(赤、青、黄)で、各文章の先頭と後
尾に図15(b)のような円形マークを付ける。赤マー
ク間の文章121、青マーク間の文章122、黄マーク
間の文章123とする。この各マーク間の文章の画像デ
ータを画像データ抽出手段16で抽出し、それを文字認
識部17で文字データに変換する。そして図15(c)
のように、文字データ131,132,133を分類項
目毎の第2記憶装置の記憶領域16a〜16cに記憶集
計する。。複数の出張報告書を同様の手順で分類抽出す
ることにより、目的地等の統計を作ることができる。こ
の時、マーキングの形状(丸、四角等)で分類すること
によりモノクロスキャナーでも同様の効果が得られる。
【0043】また、一般的に文章の見出し等は他の文章
の文字と異なるフォントを使ったり、他の文章より大き
い文字を使っている場合が多く、文章の要点や専門用語
に太字や斜体等の装飾を施している文章が多く見られ
る。この時、文字のフォント、大きさ、装飾あるいはこ
れらの組み合わせで分類抽出することにより、文章の見
出しのみを抜き出して目次を作ったり、要点の語句を抜
き出して解説を作ったりすることに利用できる。
【0044】図16に斜体の語句を抜き出す実施例を示
す。図16(a)の斜体文字を抽出する条件で、予め要
点語句が斜体で書かれた図16(b)のような文章14
1〜145を画像データ抽出手段16で抽出し、それを
文字認識部17で文字データ151〜155に変換す
る。これを、図16(c)のように、抽出して第2記憶
装置16に記憶する。こうして、指定した分類条件で分
類抽出して、要点語句のみ抜き出すことができる。
【0045】〔第4実施形態〕さらに、例えば会社のロ
ゴのような図形を業種毎にマーキングして分類抽出しフ
ァイリングする場合や、集合写真の特定の人物をマーキ
ングして分類抽出しファイリングする場合など、文字変
換せずに画像データそのものを分類記憶することも可能
である。図17は、本発明に係るデータファイリング装
置の第4実施形態を示すブロック図である。第1〜第3
実施形態にあるデータ処理手段15は必要としない。
【0046】
【発明の効果】本発明によれば、条件入力手段により、
前記分類識別マークと分類項目とを対応づける分類条件
を入力し、画像データ抽出手段により、入力された分類
項目に対応する分類識別マークを、取り込んだ画像デー
タの中から識別し、該分類識別マークの示す分類抽出部
分の画像データを抽出し、その画像データに基づいて必
要なデータを分類記憶するので、あらゆるフォーマット
の原稿のデータを分類ファイリングできる。また、複数
のデータが記載された一枚の原稿においてデータを分類
する場合に、予め分類条件を設定しておけば、コンピュ
ーターの知識のない者でも、データの整理・分類が可能
である。
【0047】特に、請求項1〜5の発明によれば、画像
データ、文字データ、演算データをそれぞれ分類整理が
でき、読み取った画像データを加工処理して、所望のデ
ータを分類できる。特に、抽出された数字の演算条件を
入力する演算条件入力部を有しているので、得られた数
字を操作者の所望の演算処理を行ってファイリングがか
のうであり、汎用性が高い。
【0048】また、請求項6〜12によれば、原稿に記
入する分類識別マークを各種設定して、その部分の画像
データを抽出できるので、フォーマットに縛られること
がなく、汎用性が高い。特に、請求項12は、ドロップ
アウトカラーを用いて、ドロップアウトカラーの部分を
読み取らず、それ以外の部分を読み取って分類する。
【0049】また、請求項13の発明によれば、前記分
類識別マークがない部分の画像データを抽出することが
できるので、分類識別マークがない部分も、識別でき、
例えば、分類項目が多い場合に、有効である。
【図面の簡単な説明】
【図1】本発明に係るデータファイリング装置の第1実
施形態を示すブロック図である。
【図2】第1実施形態のデータファイリング装置の動作
を示すフローチャートである。
【図3】第1実施形態の分類動作の過程の説明図であ
る。
【図4】図3に続く分類動作の過程の説明図である。
【図5】分類抽出部分に下線を引いた原稿を示す説明図
である。
【図6】分類抽出部分を蛍光マーカーで塗りつぶした原
稿を示す説明図である。
【図7】分類抽出部分を囲む線が描く形状を各種設けた
原稿を示す説明図である。
【図8】分類抽出部分の文字の色を各種設けた原稿を示
す説明図である。
【図9】本発明に係るデータファイリング装置の第2実
施形態を示すブロック図である。
【図10】第2実施形態のデータファイリング装置の動
作を示すフローチャートである。
【図11】第2実施形態の分類動作の過程の説明図であ
る。
【図12】本発明に係るデータファイリング装置の第3
実施形態を示すブロック図である。
【図13】第3実施形態のデータファイリング装置の動
作を示すフローチャートである。
【図14】第3実施形態の分類動作の過程の説明図であ
る。
【図15】第3実施形態の他の分類動作の過程の説明図
である。
【図16】第3実施形態の更に他の分類動作の過程の説
明図である。
【図17】本発明に係るデータファイリング装置の第4
実施形態を示すブロック図である。
【符号の説明】
11 カラースキャナー 12 第1記憶装置 13 キーボード 14 画像データ抽出手段 15 データ処理手段 16 第2記憶装置 16a,16b,16c 第2記憶手段の記憶領域 17 文字認識部 18 数字抽出部 19 データ集計部

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 分類抽出部分を識別するための分類識別
    マークを設けた原稿を走査して、その画像をデジタル画
    像データとして取り込むための画像入力手段と、 前記分類識別マークと分類項目とを対応づける分類条件
    を入力する条件入力手段と、 入力された分類項目に対応する分類識別マークを、取り
    込んだ画像データの中から識別し、該分類識別マークの
    示す分類抽出部分の画像データを抽出する画像データ抽
    出手段と、 抽出された前記画像データを分類記憶する分類記憶手段
    と、 を具備することを特徴とするデータファイリング装置。
  2. 【請求項2】 分類抽出部分を識別するための分類識別
    マークを設けた原稿を走査して、その画像をデジタル画
    像データとして取り込むための画像入力手段と、 前記分類識別マークと分類項目とを対応づける分類条件
    を入力する条件入力手段と、 入力された分類項目に対応する分類識別マークを、取り
    込んだ画像データの中から識別し、該分類識別マークの
    示す分類抽出部分の画像データを抽出する画像データ抽
    出手段と、 抽出された前記画像データを加工処理するデータ処理手
    段と、 加工処理されたデータを分類記憶する分類記憶手段と、 を具備することを特徴とするデータファイリング装置。
  3. 【請求項3】 前記データ処理手段は、前記画像データ
    抽出手段で抽出された画像データを文字認識を行って文
    字データに変換する文字認識部からなり、 前記分類記憶手段は、前記文字データを記憶することを
    特徴とする請求項2記載のデータファイリング装置。
  4. 【請求項4】 前記データ処理手段は、 前記画像データ抽出手段で抽出された画像データを文字
    認識を行って文字データに変換する文字認識部と、 前記文字データのうち数字のみを抽出する数字抽出部
    と、 予め設定された演算条件に基づき、抽出された前記数字
    を演算する演算部と、からなり、 前記分類記憶手段は、演算された結果を記憶することを
    特徴とする請求項2記載のデータファイリング装置。
  5. 【請求項5】 前記データ処理手段は、 前記画像データ抽出手段で抽出された画像データを文字
    認識を行って文字データに変換する文字認識部と、 前記文字データのうち数字のみを抽出する数字抽出部
    と、 抽出された数字の演算条件を入力する演算条件入力部
    と、 前記演算条件に基づき、抽出された前記数字を演算処理
    する演算部と、 とからなり、 前記分類記憶手段は、演算された結果を記憶することを
    特徴とする請求項2記載のデータファイリング装置。
  6. 【請求項6】 前記分類識別マークは、前記分類抽出部
    分を囲む各種の線であり、 前記画像抽出手段は、分類項目に対応する種類の線で囲
    まれた部分の画像データを抽出することを特徴とする請
    求項1ないし5のいずれかに記載のデータファイリング
    装置。
  7. 【請求項7】 前記分類識別マークは、前記分類抽出部
    分に引いた各種の下線であり、 前記画像抽出手段は、分類項目に対応する種類の下線が
    引かれた部分の画像データを抽出することを特徴とする
    請求項1ないし5のいずれかに記載のデータファイリン
    グ装置。
  8. 【請求項8】 前記分類識別マークは、前記分類抽出部
    分の各種の色であり、 前記画像抽出手段は、分類項目に対応する種類の色の部
    分の画像データを抽出することを特徴とする請求項1な
    いし5のいずれかに記載のデータファイリング装置。
  9. 【請求項9】 前記分類識別マークは、前記分類抽出部
    分を囲む線で描かれた各種の形状であり、 前記画像抽出手段は、分類項目に対応する種類の形状で
    囲まれた部分の画像データを抽出することを特徴とする
    請求項1ないし5のいずれかに記載のデータファイリン
    グ装置。
  10. 【請求項10】 前記分類識別マークは、前記分類抽出
    部分の行の先頭または後尾に描いた各種のマークであ
    り、 前記画像抽出手段は、分類項目に対応する種類のマーク
    のある行の画像データを抽出することを特徴とする請求
    項1ないし5のいずれかに記載のデータファイリング装
    置。
  11. 【請求項11】 前記分類識別マークは、前記分類抽出
    部分の各種の文字であり、 前記画像抽出手段は、前記分類項目に対応する種類の文
    字の部分の画像データを抽出することを特徴とする請求
    項3ないし5のいずれかに記載のデータファイリング装
    置。
  12. 【請求項12】 前記分類識別マークは、前記分類抽出
    部分を構成するドロップアウトカラーであり、 前記画像入力手段は、前記ドロップアウトカラーと同色
    の光源を有し、ドロップアウトカラー以外の画像を読み
    取ることことを特徴とする請求項1ないし5のいずれか
    に記載のデータファイリング装置。
  13. 【請求項13】 前記画像抽出手段は、前記分類識別マ
    ークがない部分の画像データを抽出することを特徴とす
    る請求項1ないし5のいずれかに記載のデータファイリ
    ング装置。
JP9348053A 1997-12-17 1997-12-17 データファイリング装置 Pending JPH11175705A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9348053A JPH11175705A (ja) 1997-12-17 1997-12-17 データファイリング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9348053A JPH11175705A (ja) 1997-12-17 1997-12-17 データファイリング装置

Publications (1)

Publication Number Publication Date
JPH11175705A true JPH11175705A (ja) 1999-07-02

Family

ID=18394432

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9348053A Pending JPH11175705A (ja) 1997-12-17 1997-12-17 データファイリング装置

Country Status (1)

Country Link
JP (1) JPH11175705A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008191703A (ja) * 2007-01-31 2008-08-21 Ricoh Co Ltd 記号化装置、データ検索装置、画像処理装置、データ検索システム、画像処理システム、記号化方法、データ検索方法、画像処理方法、及びプログラム
US7916946B2 (en) 2006-07-26 2011-03-29 Canon Kabushiki Kaisha Image processing apparatus for identifying and classifying an object in an image, method of controlling same, and computer-readable storage medium storing a computer program for controlling same
JP2016081426A (ja) * 2014-10-21 2016-05-16 コニカミノルタ株式会社 文書処理装置、その制御方法、およびプログラム
JP2020099031A (ja) * 2018-12-19 2020-06-25 京セラドキュメントソリューションズ株式会社 情報処理装置、及び情報処理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7916946B2 (en) 2006-07-26 2011-03-29 Canon Kabushiki Kaisha Image processing apparatus for identifying and classifying an object in an image, method of controlling same, and computer-readable storage medium storing a computer program for controlling same
JP2008191703A (ja) * 2007-01-31 2008-08-21 Ricoh Co Ltd 記号化装置、データ検索装置、画像処理装置、データ検索システム、画像処理システム、記号化方法、データ検索方法、画像処理方法、及びプログラム
JP2016081426A (ja) * 2014-10-21 2016-05-16 コニカミノルタ株式会社 文書処理装置、その制御方法、およびプログラム
JP2020099031A (ja) * 2018-12-19 2020-06-25 京セラドキュメントソリューションズ株式会社 情報処理装置、及び情報処理方法

Similar Documents

Publication Publication Date Title
US20040139391A1 (en) Integration of handwritten annotations into an electronic original
US7035463B1 (en) Document image processor, method for extracting document title, and method for imparting document tag information
CN101276412A (zh) 信息处理装置、信息处理系统和信息处理方法
CN110363102A (zh) 一种pdf文件的对象识别处理方法及装置
JP2006092027A (ja) 文字認識装置、文字認識方法および文字認識プログラム
CN101558425A (zh) 图像处理设备、图像处理方法和计算机程序
US20200311410A1 (en) Method of meta-data extraction from semi-structured documents
JPH03161891A (ja) 表形式文書読取装置
CN113177995A (zh) Cad图纸的文本重组方法和计算机可读存储介质
CN109726369A (zh) 一种基于标准文献的智能模板化题录技术实现方法
JPH11175705A (ja) データファイリング装置
CN120068810A (zh) 多模态文档结构化处理方法、装置、设备及介质
JPH10162098A (ja) 文書電子化装置及び文書電子化方法
JP5159588B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
CN112446273B (zh) 信息处理装置以及计算机程序产品
EP1852809A1 (en) Character string symbol generating device, character string symbol generating method, and storage medium storing character string symbol program
JPH1021043A (ja) アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー
JPH0384681A (ja) 名刺情報の入力処理方法
JP7758705B2 (ja) 文字認識方法、文字認識システム及びプログラム
JP2007128160A (ja) 情報処理装置
US5655027A (en) Continuous extraction and processing of document fields
JPH0584549B2 (ja)
CN117636362A (zh) 一种多模态信息标注的方法、装置、设备和存储介质
JP3949092B2 (ja) デジタル文書取得システム、文書読取装置およびデジタル文書取得装置
CN106815581A (zh) 一种文档录入方法、系统及电子设备