JPH0554120A - 文書分離方式 - Google Patents
文書分離方式Info
- Publication number
- JPH0554120A JPH0554120A JP3218260A JP21826091A JPH0554120A JP H0554120 A JPH0554120 A JP H0554120A JP 3218260 A JP3218260 A JP 3218260A JP 21826091 A JP21826091 A JP 21826091A JP H0554120 A JPH0554120 A JP H0554120A
- Authority
- JP
- Japan
- Prior art keywords
- document
- image data
- classification mark
- input
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】文書を自動登録する場合、限られた種類の記号
で、分類可能な文書数に関する制限を解消する。 【構成】文書分類マークを付加した文書画像データを入
力する場合に、スキャナ1により入力した文書画像デー
タから、分類マーク抽出手段2により文書分類マークを
抽出し、抽出した文書分類マークの位置関係識別3およ
び種類識別4を行ない、識別結果をインデクス生成手段
5によりインデクスデータに変換し、文書画像データを
インデクスデータとともに、文書ファイル7に格納す
る。 【効果】分類マークの形状を複雑化することなく、多数
の文書を分類することが可能となり、分類マークの表現
能力を拡張することができる。
で、分類可能な文書数に関する制限を解消する。 【構成】文書分類マークを付加した文書画像データを入
力する場合に、スキャナ1により入力した文書画像デー
タから、分類マーク抽出手段2により文書分類マークを
抽出し、抽出した文書分類マークの位置関係識別3およ
び種類識別4を行ない、識別結果をインデクス生成手段
5によりインデクスデータに変換し、文書画像データを
インデクスデータとともに、文書ファイル7に格納す
る。 【効果】分類マークの形状を複雑化することなく、多数
の文書を分類することが可能となり、分類マークの表現
能力を拡張することができる。
Description
【0001】
【産業上の利用分野】本発明は文書分離方式に係わり、
特に、複数種類ある記号を組み合わせる文書分離方式に
関する。
特に、複数種類ある記号を組み合わせる文書分離方式に
関する。
【0002】
【従来の技術】近年、大容量光ディスクを利用した文書
画像ファイルシステム(電子ファイル)が新しい文書管理
の手段として、広く利用されつつある。光ディスクはデ
ータの記憶容量が大きく、画像データ等の多量のデータ
の記録が可能となるため、帳票,設計図,契約書等の文
書画像情報を多量に蓄積する手段として利用することが
できる。
画像ファイルシステム(電子ファイル)が新しい文書管理
の手段として、広く利用されつつある。光ディスクはデ
ータの記憶容量が大きく、画像データ等の多量のデータ
の記録が可能となるため、帳票,設計図,契約書等の文
書画像情報を多量に蓄積する手段として利用することが
できる。
【0003】文書画像ファイルシステムを利用して、文
書画像データを登録する場合、各文書画像データごと
に、文書名,分類名,キーワード等の属性を設定するこ
とが望ましい。従って、複数ページで構成される、多数
の文書画像データを登録する場合、文書ごとに文書画像
データを分離し、分離した文書画像データに文書名(イ
ンデクス)を付加する必要がある。従来、操作者が、ス
キャナから入力した文書画像データを文書単位に分離
し、文書画像データに対応したインデクスを入力するこ
とにより、文書入力作業を行なっていた。この場合、操
作者は、ディスプレイを利用して、文書画像データを入
力する毎に、文書の切れ目を目視確認し、文書ごとに、
ディスプレイに表示された文書画像データなどを参照し
ながら、インデクスをキーボード入力しなければならな
かった。この文書入力作業を自動化する方法として、文
書分離用シート(セパレータシート)を文書画像データ
間に挿入し、セパレータシートの所定領域に付加された
マークを図形認識することにより、文書を分離し、イン
デクスを生成する方法がある。セパレータシートに付加
するマークは、一般文書に出現する確率が小さいマーク
や、カラーバーなどがある。
書画像データを登録する場合、各文書画像データごと
に、文書名,分類名,キーワード等の属性を設定するこ
とが望ましい。従って、複数ページで構成される、多数
の文書画像データを登録する場合、文書ごとに文書画像
データを分離し、分離した文書画像データに文書名(イ
ンデクス)を付加する必要がある。従来、操作者が、ス
キャナから入力した文書画像データを文書単位に分離
し、文書画像データに対応したインデクスを入力するこ
とにより、文書入力作業を行なっていた。この場合、操
作者は、ディスプレイを利用して、文書画像データを入
力する毎に、文書の切れ目を目視確認し、文書ごとに、
ディスプレイに表示された文書画像データなどを参照し
ながら、インデクスをキーボード入力しなければならな
かった。この文書入力作業を自動化する方法として、文
書分離用シート(セパレータシート)を文書画像データ
間に挿入し、セパレータシートの所定領域に付加された
マークを図形認識することにより、文書を分離し、イン
デクスを生成する方法がある。セパレータシートに付加
するマークは、一般文書に出現する確率が小さいマーク
や、カラーバーなどがある。
【0004】一般文書に出現する確率が小さいマークを
付加したセパレータシートを利用するシステムには、特
願平2−94011号明細書がある。
付加したセパレータシートを利用するシステムには、特
願平2−94011号明細書がある。
【0005】
【発明が解決しようとする課題】ところが、一般文書に
出現する確率が小さいマークを付加したセパレータシー
トを利用した場合、一つのマークで多数の文書を分類す
るため、マークの形状を複雑にする必要があり、認識精
度の点で問題があった。
出現する確率が小さいマークを付加したセパレータシー
トを利用した場合、一つのマークで多数の文書を分類す
るため、マークの形状を複雑にする必要があり、認識精
度の点で問題があった。
【0006】また、カラーバーを利用した場合には、シ
ステムで認識可能な色情報数だけ分類が可能だが、カラ
ースキャナなどを利用したシステムで、分類に利用可能
な色情報は高々八色程度である。このため、分類可能な
文書数の点で、問題があった。
ステムで認識可能な色情報数だけ分類が可能だが、カラ
ースキャナなどを利用したシステムで、分類に利用可能
な色情報は高々八色程度である。このため、分類可能な
文書数の点で、問題があった。
【0007】
【課題を解決するための手段】この問題を解決するため
に、スキャナ入力された文書画像データから、分類マー
ク抽出手段により、分類マークを抽出し、抽出した分類
マークの種類を識別する手段と、分類マークの位置を識
別する手段により、分類マークの種類に関する情報に加
え、分類マークが付加された位置の情報を識別し、分類
マークの種類および位置の情報を利用して、文書画像デ
ータを分類するようにした。
に、スキャナ入力された文書画像データから、分類マー
ク抽出手段により、分類マークを抽出し、抽出した分類
マークの種類を識別する手段と、分類マークの位置を識
別する手段により、分類マークの種類に関する情報に加
え、分類マークが付加された位置の情報を識別し、分類
マークの種類および位置の情報を利用して、文書画像デ
ータを分類するようにした。
【0008】
【作用】上記の方法によれば、分類マークの形状を複雑
することなく、多数の文書を分類することが可能とな
る。例えば、複数のカラーバーを並べることにより、分
類マークの表現能力を拡張する。これにより、カラーバ
ーが一つの時には、八通りのインデクスしか表現できな
いが、三つ程度の時でも、256通りの表現が可能とな
る。
することなく、多数の文書を分類することが可能とな
る。例えば、複数のカラーバーを並べることにより、分
類マークの表現能力を拡張する。これにより、カラーバ
ーが一つの時には、八通りのインデクスしか表現できな
いが、三つ程度の時でも、256通りの表現が可能とな
る。
【0009】
【実施例】以下、図面を参照して、本発明の実施例を詳
細に説明する。
細に説明する。
【0010】図1は、本発明である文書分離方式の処理
フローの一例を示すブロック図である。図中の1は、ス
キャナであり、文書画像をドットデータとして入力す
る。この時、スキャナ1には、文書画像を連続的に入力
する自動給紙装置が付加されていてもよい。2は、分類
マーク抽出処理であり、スキャナ1で入力された文書画
像データから、分類マークが付加された位置を検出し、
分類マークを抽出する。3は、マーク位置関係識別処理
であり、文書画像データの複数位置に付加された分類マ
ークの位置関係を識別する。4は、マーク種類識別処理
であり、文書画像データの複数位置に付加された各分類
マークの種類を識別する。5は、インデクス生成処理で
あり、マーク位置関係識別処理3およびマーク種類識別
処理4により識別した分類マークを、インデクス生成辞
書6を利用して、文書分類用のインデクスデータに変換
する。7は、文書ファイルであり、インデクス生成処理
5で生成したインデクスデータおよび文書画像データを
格納する。この時、分類マークが不要であれば、文書画
像に付加された分類マークを消去した後、文書ファイル
5に格納する。なお、文書画像データを格納する場合、
文書画像データを圧縮符号に変換し、文書ファイル5に
格納してもよい。
フローの一例を示すブロック図である。図中の1は、ス
キャナであり、文書画像をドットデータとして入力す
る。この時、スキャナ1には、文書画像を連続的に入力
する自動給紙装置が付加されていてもよい。2は、分類
マーク抽出処理であり、スキャナ1で入力された文書画
像データから、分類マークが付加された位置を検出し、
分類マークを抽出する。3は、マーク位置関係識別処理
であり、文書画像データの複数位置に付加された分類マ
ークの位置関係を識別する。4は、マーク種類識別処理
であり、文書画像データの複数位置に付加された各分類
マークの種類を識別する。5は、インデクス生成処理で
あり、マーク位置関係識別処理3およびマーク種類識別
処理4により識別した分類マークを、インデクス生成辞
書6を利用して、文書分類用のインデクスデータに変換
する。7は、文書ファイルであり、インデクス生成処理
5で生成したインデクスデータおよび文書画像データを
格納する。この時、分類マークが不要であれば、文書画
像に付加された分類マークを消去した後、文書ファイル
5に格納する。なお、文書画像データを格納する場合、
文書画像データを圧縮符号に変換し、文書ファイル5に
格納してもよい。
【0011】(実施例1)図2に、本発明を実現する装
置の構成例を示す。ここに示す構成例は、分類マークと
して、カラーコードを利用した場合のものである。図中
の11は、キーボードであり、作成されたインデクスの
修正などコードデータの入力に利用する。12はCPU
(Central Processing Unit)であり、システム全体を制
御する。
置の構成例を示す。ここに示す構成例は、分類マークと
して、カラーコードを利用した場合のものである。図中
の11は、キーボードであり、作成されたインデクスの
修正などコードデータの入力に利用する。12はCPU
(Central Processing Unit)であり、システム全体を制
御する。
【0012】13は、カラースキャナであり、文書画像
データをドットデータとして入力し、14は、スキャナ
コントローラであり、スキャナ13を制御する。15
は、ディスプレイであり、入力した文書画像データの目
視確認や、インデクスの確認,修正に利用し、16は、
ディスプレイ15を制御するディスプレイコントローラ
である。17は、カラーコード識別部であり、スキャナ
13により入力された文書画像データのカラーコードを
認識し、インデクスデータに変換する。18は、メモリ
であり、文書画像データなどのドットデータやインデク
スデータなどのコードデータを格納する。19は、ファ
イルであり、文書ごとに、インデクスデータや文書画像
データを格納し、20は、ファイル19を制御するファ
イルコントローラである。
データをドットデータとして入力し、14は、スキャナ
コントローラであり、スキャナ13を制御する。15
は、ディスプレイであり、入力した文書画像データの目
視確認や、インデクスの確認,修正に利用し、16は、
ディスプレイ15を制御するディスプレイコントローラ
である。17は、カラーコード識別部であり、スキャナ
13により入力された文書画像データのカラーコードを
認識し、インデクスデータに変換する。18は、メモリ
であり、文書画像データなどのドットデータやインデク
スデータなどのコードデータを格納する。19は、ファ
イルであり、文書ごとに、インデクスデータや文書画像
データを格納し、20は、ファイル19を制御するファ
イルコントローラである。
【0013】分類マークとして、カラーコードを利用し
た場合の処理フローを図3に示す。図中の31は、スキ
ャナであり、文書画像データを入力する。ここでは、分
類マークとして、カラーコードを利用しているため、ス
キャナは、カラースキャナを用いる。32は、カラーコ
ード抽出処理であり、入力した文書画像データからカラ
ーコードが付加された領域を認識して抽出する。33
は、コード位置識別処理であり、カラーコードの付加さ
れたフィールドの位置関係を識別する。34は、コード
色識別処理であり、カラーコードの各フィールドに付加
された色を識別する。35は、インデクス生成処理であ
り、インデクス生成辞書36を利用して、コード位置識
別処理33およびコード色識別処理34の結果、識別さ
れたカラーコードを文書分類用のインデクスデータに変
換する。37は、文書ファイルであり、インデクスデー
タとともに、文書画像データを格納する。
た場合の処理フローを図3に示す。図中の31は、スキ
ャナであり、文書画像データを入力する。ここでは、分
類マークとして、カラーコードを利用しているため、ス
キャナは、カラースキャナを用いる。32は、カラーコ
ード抽出処理であり、入力した文書画像データからカラ
ーコードが付加された領域を認識して抽出する。33
は、コード位置識別処理であり、カラーコードの付加さ
れたフィールドの位置関係を識別する。34は、コード
色識別処理であり、カラーコードの各フィールドに付加
された色を識別する。35は、インデクス生成処理であ
り、インデクス生成辞書36を利用して、コード位置識
別処理33およびコード色識別処理34の結果、識別さ
れたカラーコードを文書分類用のインデクスデータに変
換する。37は、文書ファイルであり、インデクスデー
タとともに、文書画像データを格納する。
【0014】次に、図4により、入力された文書画像デ
ータを識別する処理フローについて説明する。ステップ
100では、入力対象である文書画像データが、1文書
当たり1ページ(1ページ/1件)で構成されている
か、複数ページ(複数ページ/1件)で構成されている
かを判別し、1ページ/1件の場合には、ステップ102
〜116の処理を行ない、複数ページ/1件の場合に
は、ステップ120〜136の処理を行なう。
ータを識別する処理フローについて説明する。ステップ
100では、入力対象である文書画像データが、1文書
当たり1ページ(1ページ/1件)で構成されている
か、複数ページ(複数ページ/1件)で構成されている
かを判別し、1ページ/1件の場合には、ステップ102
〜116の処理を行ない、複数ページ/1件の場合に
は、ステップ120〜136の処理を行なう。
【0015】初めに、1ページ/1件の場合について説
明する。1ページ/1件で入力する時の処理概要を、図
5に示す。41は入力対象の文書画像データであり、各
文書画像データには、カラーコード42が付加されてい
るものとする。この例では、カラーコードは41−1〜
3の三種類が付加されている。従って、この例で、カラ
ーコード識別した結果、入力した文書画像データは、4
3−1〜3の三種類に分類される。1ページ/1件の場
合の処理の流れを、図4のステップ102〜116に示
す。
明する。1ページ/1件で入力する時の処理概要を、図
5に示す。41は入力対象の文書画像データであり、各
文書画像データには、カラーコード42が付加されてい
るものとする。この例では、カラーコードは41−1〜
3の三種類が付加されている。従って、この例で、カラ
ーコード識別した結果、入力した文書画像データは、4
3−1〜3の三種類に分類される。1ページ/1件の場
合の処理の流れを、図4のステップ102〜116に示
す。
【0016】ステップ102では、スキャナにより、画
像入力する。ステップ104では、入力した画像の所定
個所にカラーコードが付加されているか否かを判別し、
カラーコードが付加されている場合には、ステップ11
0〜112の処理を行ない、付加されていない場合に
は、ステップ106〜108の処理を行なう。ステップ
110では、スキャナ入力された画像をディスプレイに
表示し、ステップ102で、目視により、表示された画
像を確認し、キーボードにより、分類コードを入力す
る。ステップ106では、付加されたカラーコードを識
別する。カラーコード識別処理に関する処理の一例を図
8に示す。
像入力する。ステップ104では、入力した画像の所定
個所にカラーコードが付加されているか否かを判別し、
カラーコードが付加されている場合には、ステップ11
0〜112の処理を行ない、付加されていない場合に
は、ステップ106〜108の処理を行なう。ステップ
110では、スキャナ入力された画像をディスプレイに
表示し、ステップ102で、目視により、表示された画
像を確認し、キーボードにより、分類コードを入力す
る。ステップ106では、付加されたカラーコードを識
別する。カラーコード識別処理に関する処理の一例を図
8に示す。
【0017】図8中の52は、入力した文書画像データ
であり、カラーコード51が付加されているものとす
る。ここでは、画像メモリは、R(赤),G(緑),B
(青)の各一プレーンずつで構成されているものとし、
入力された色情報は、黒,赤,緑,青,黄,マゼンダ,
シアン,白の八種類のいずれかに分類される。各色と、
画像メモリの三プレーンとの関係は54に示す通りであ
る。また、カラーコードの各フィールド51−1〜4に
使用されている色も上記の八色のいずれかである。
であり、カラーコード51が付加されているものとす
る。ここでは、画像メモリは、R(赤),G(緑),B
(青)の各一プレーンずつで構成されているものとし、
入力された色情報は、黒,赤,緑,青,黄,マゼンダ,
シアン,白の八種類のいずれかに分類される。各色と、
画像メモリの三プレーンとの関係は54に示す通りであ
る。また、カラーコードの各フィールド51−1〜4に
使用されている色も上記の八色のいずれかである。
【0018】また、カラーコード識別処理に関する詳細
な処理の流れを図7に示す。ステップ150では、画像
ポインタPを初期化する。具体的には、入力された文書
画像データが格納されているメモリの先頭アドレスを画
像ポインタPに設定する。ステップ152では、カラー
コードのカウンタiを0に初期化し、ステップ154で
は、色フラグを0に初期化する。ステップ156では、
画像ポインタPの内容が、白画素であるか否かを識別
し、白画素である場合には、ステップ158〜162の
処理を行ない、白画素でない場合には、ステップ164
〜168の処理を行なう。ステップ164では、色フラ
グが1にセットされているかどうかチェックし、色フラ
グが1にセットされている場合には、ステップ178
で、カラーコード識別不能として処理する。ステップ1
64で、色フラグが0にクリアされている場合には、ス
テップ166で、認識した色を表す変数COLORに、
画像ポインタPの内容を入力する。ステップ168で
は、色フラグに1をセットする。
な処理の流れを図7に示す。ステップ150では、画像
ポインタPを初期化する。具体的には、入力された文書
画像データが格納されているメモリの先頭アドレスを画
像ポインタPに設定する。ステップ152では、カラー
コードのカウンタiを0に初期化し、ステップ154で
は、色フラグを0に初期化する。ステップ156では、
画像ポインタPの内容が、白画素であるか否かを識別
し、白画素である場合には、ステップ158〜162の
処理を行ない、白画素でない場合には、ステップ164
〜168の処理を行なう。ステップ164では、色フラ
グが1にセットされているかどうかチェックし、色フラ
グが1にセットされている場合には、ステップ178
で、カラーコード識別不能として処理する。ステップ1
64で、色フラグが0にクリアされている場合には、ス
テップ166で、認識した色を表す変数COLORに、
画像ポインタPの内容を入力する。ステップ168で
は、色フラグに1をセットする。
【0019】ステップ156で、画像ポインタPの内容
が、白画素である場合には、ステップ158で、色フラ
グが1にセットされているかどうかチェックし、色フラ
グが1にセットされている時には、ステップ160で、
変数COLORをフィールドiのカラーコードとして設
定する。ステップ162では、カラーコードのカウンタ
iを1だけ増加する。ステップ158で、色フラグが0
にクリアされている場合には、ステップ170以降の処
理を行なう。ステップ170で、カラーコード識別領域
にある全てのフィールドの認識が終了したか否かをチェ
ックし、終了していない場合には、画像ポインタPを更
新し、ステップ156〜170の処理を繰り返す。ステ
ップ170で、カラーコード識別領域にある全てのフィ
ールドの認識が終了した場合には、ステップ172で、
カラーコードのカウンタiの値が、カラーコードを構成
するフィールド数に等しいかどうかをチェックする。i
が、フィールド数に等しい場合には、ステップ174
で、カラーコードを分類コードに変換してリターンし、
等しくない場合には、ステップ178で、カラーコード
識別不能として処理して、リターンする。カラーコード
を分類コードに変換する場合、インデクス生成辞書を利
用する。
が、白画素である場合には、ステップ158で、色フラ
グが1にセットされているかどうかチェックし、色フラ
グが1にセットされている時には、ステップ160で、
変数COLORをフィールドiのカラーコードとして設
定する。ステップ162では、カラーコードのカウンタ
iを1だけ増加する。ステップ158で、色フラグが0
にクリアされている場合には、ステップ170以降の処
理を行なう。ステップ170で、カラーコード識別領域
にある全てのフィールドの認識が終了したか否かをチェ
ックし、終了していない場合には、画像ポインタPを更
新し、ステップ156〜170の処理を繰り返す。ステ
ップ170で、カラーコード識別領域にある全てのフィ
ールドの認識が終了した場合には、ステップ172で、
カラーコードのカウンタiの値が、カラーコードを構成
するフィールド数に等しいかどうかをチェックする。i
が、フィールド数に等しい場合には、ステップ174
で、カラーコードを分類コードに変換してリターンし、
等しくない場合には、ステップ178で、カラーコード
識別不能として処理して、リターンする。カラーコード
を分類コードに変換する場合、インデクス生成辞書を利
用する。
【0020】このインデクス生成辞書について、図9を
利用して説明する。図中の56は、入力した文書画像デ
ータであり、カラーコード57が付加されている。カラ
ーコード57は、四つのフィールド57−1〜4で構成
され、各フィールドには、黒,赤,緑,青,黄,マゼン
ダ,シアンの七色のうちいずれかが付加されている。5
8はインデクス生成辞書であり、項目58−1〜4は、
カラーコードの各フィールド57−1〜4に対応する。
項目58−1〜4には、黒,赤,緑,青,黄,マゼン
ダ,シアンの七種類のうちいずれかの色が設定されてい
る。58−5は、分類コードであり、項目58−1〜4
の全ての色が決定されると、一つの分類コードが決ま
る。各フィールドに付加できる色をn色、フィールドの
個数をmとした時、インデクス生成辞書に設定される分
類コードは、nのm乗となる。例えば、図9のように、
七色で、四フィールド存在する場合には、最大2401
通りの分類コードが設定できる。
利用して説明する。図中の56は、入力した文書画像デ
ータであり、カラーコード57が付加されている。カラ
ーコード57は、四つのフィールド57−1〜4で構成
され、各フィールドには、黒,赤,緑,青,黄,マゼン
ダ,シアンの七色のうちいずれかが付加されている。5
8はインデクス生成辞書であり、項目58−1〜4は、
カラーコードの各フィールド57−1〜4に対応する。
項目58−1〜4には、黒,赤,緑,青,黄,マゼン
ダ,シアンの七種類のうちいずれかの色が設定されてい
る。58−5は、分類コードであり、項目58−1〜4
の全ての色が決定されると、一つの分類コードが決ま
る。各フィールドに付加できる色をn色、フィールドの
個数をmとした時、インデクス生成辞書に設定される分
類コードは、nのm乗となる。例えば、図9のように、
七色で、四フィールド存在する場合には、最大2401
通りの分類コードが設定できる。
【0021】図8中の52は、入力した文書画像データ
であり、カラーコード51が付加されているものとす
る。ここでは、画像メモリ53は、R(赤)53−3,
G(緑)53−2,B(青)53−1の各一プレーンず
つで構成されているものとし、入力された色情報は、
黒,赤,緑,青,黄,マゼンダ,シアン,白の八種類の
いずれかに分類される。各色と、画像メモリの三プレー
ンとの関係は54に示す通りである。また、カラーコー
ドの各フィールド51−1〜4に使用されている色も上
記の八色のいずれかである。
であり、カラーコード51が付加されているものとす
る。ここでは、画像メモリ53は、R(赤)53−3,
G(緑)53−2,B(青)53−1の各一プレーンず
つで構成されているものとし、入力された色情報は、
黒,赤,緑,青,黄,マゼンダ,シアン,白の八種類の
いずれかに分類される。各色と、画像メモリの三プレー
ンとの関係は54に示す通りである。また、カラーコー
ドの各フィールド51−1〜4に使用されている色も上
記の八色のいずれかである。
【0022】ステップ108で、カラーコードの識別が
可能かどうかをチェックする。カラーコードの識別が可
能である場合には、カラーコード識別により生成した分
類コードを文書画像データに付加する。識別不可能な場
合には、ステップ110〜112の処理を行ない、スキ
ャナ入力された画像をディスプレイに表示し、目視によ
り、表示された画像を確認し、キーボードにより、分類
コードを入力する。ステップ114では、カラーコード
を変換して得られた、または、キーボードにより入力し
た分類コードを利用して、入力された文書画像データを
文書ごとに分類する。ステップ116では、入力対象で
ある全ての画像入力が終了したかどうかチェックし、入
力が終了した場合には、リターンし、入力が終了してい
ない場合には、ステップ102〜116の処理を繰り返
す。
可能かどうかをチェックする。カラーコードの識別が可
能である場合には、カラーコード識別により生成した分
類コードを文書画像データに付加する。識別不可能な場
合には、ステップ110〜112の処理を行ない、スキ
ャナ入力された画像をディスプレイに表示し、目視によ
り、表示された画像を確認し、キーボードにより、分類
コードを入力する。ステップ114では、カラーコード
を変換して得られた、または、キーボードにより入力し
た分類コードを利用して、入力された文書画像データを
文書ごとに分類する。ステップ116では、入力対象で
ある全ての画像入力が終了したかどうかチェックし、入
力が終了した場合には、リターンし、入力が終了してい
ない場合には、ステップ102〜116の処理を繰り返
す。
【0023】初めに、複数ページ/1件の場合について
説明する。複数ページ/1件で入力する時の処理概要を
図6に示す。46は入力対象の文書画像データであり、
各文書画像データの先頭ページには、カラーコード47
が付加されているものとする。この例では、三種類の文
書が入力され、各文書の先頭ページには、それぞれ、三
種類のカラーコード41−1〜3が付加されている。し
たがって、この例で、カラーコード識別した結果、入力
した文書画像データは、47−1〜3の三種類の文書に
分類される。複数ページ/1件の場合の処理の流れを、
図4のステップ120〜136に示す。
説明する。複数ページ/1件で入力する時の処理概要を
図6に示す。46は入力対象の文書画像データであり、
各文書画像データの先頭ページには、カラーコード47
が付加されているものとする。この例では、三種類の文
書が入力され、各文書の先頭ページには、それぞれ、三
種類のカラーコード41−1〜3が付加されている。し
たがって、この例で、カラーコード識別した結果、入力
した文書画像データは、47−1〜3の三種類の文書に
分類される。複数ページ/1件の場合の処理の流れを、
図4のステップ120〜136に示す。
【0024】ステップ100で、複数ページ/1件の場
合には、ステップ120で、スキャナにより画像入力
し、ステップ122では、入力した画像の所定個所にカ
ラーコードが付加されているか否かを判別し、カラーコ
ードが付加されていない場合には、ステップ134の処
理を行ない、付加されている場合には、ステップ124
〜132の処理を行なう。カラーコードが付加されてい
ない場合には、ステップ134で、入力した画像を前入
力文書と同じ文書に分類する。カラーコードが付加され
ている場合には、ステップ124では、付加されたカラ
ーコードを識別する。このカラーコード識別処理の内容
は、ステップ106と同様な処理である。ステップ12
6で、カラーコードの識別が可能かどうかをチェックす
る。カラーコードの識別が可能である場合には、カラー
コード識別により生成した分類コードを文書画像データ
に付加する。識別不可能な場合には、ステップ128〜
130の処理を行なう。ステップ128では、スキャナ入
力された画像をディスプレイに表示し、ステップ130
では、目視により、表示された画像を確認し、キーボー
ドにより、分類コードを入力する。ステップ132で
は、ステップ114と同様に、分類コードを利用して、
入力された文書画像データを文書ごとに分類する。ステ
ップ136では、入力対象である全ての画像入力が終了
したかどうかをチェックし、入力が終了した場合には、
リターンし、入力が終了していない場合には、ステップ
120〜136の処理を繰り返す。
合には、ステップ120で、スキャナにより画像入力
し、ステップ122では、入力した画像の所定個所にカ
ラーコードが付加されているか否かを判別し、カラーコ
ードが付加されていない場合には、ステップ134の処
理を行ない、付加されている場合には、ステップ124
〜132の処理を行なう。カラーコードが付加されてい
ない場合には、ステップ134で、入力した画像を前入
力文書と同じ文書に分類する。カラーコードが付加され
ている場合には、ステップ124では、付加されたカラ
ーコードを識別する。このカラーコード識別処理の内容
は、ステップ106と同様な処理である。ステップ12
6で、カラーコードの識別が可能かどうかをチェックす
る。カラーコードの識別が可能である場合には、カラー
コード識別により生成した分類コードを文書画像データ
に付加する。識別不可能な場合には、ステップ128〜
130の処理を行なう。ステップ128では、スキャナ入
力された画像をディスプレイに表示し、ステップ130
では、目視により、表示された画像を確認し、キーボー
ドにより、分類コードを入力する。ステップ132で
は、ステップ114と同様に、分類コードを利用して、
入力された文書画像データを文書ごとに分類する。ステ
ップ136では、入力対象である全ての画像入力が終了
したかどうかをチェックし、入力が終了した場合には、
リターンし、入力が終了していない場合には、ステップ
120〜136の処理を繰り返す。
【0025】以上の処理により、入力した文書画像デー
タが、一ページ/1件の文書でも、複数ページ/1件の
文書でも、効率的に分類することができる。
タが、一ページ/1件の文書でも、複数ページ/1件の
文書でも、効率的に分類することができる。
【0026】なお、上記の処理では、入力する文書画像
データ自体に分類マークを付加していたが、分類マーク
を付加したセパレータシートを、入力対象である複数文
書の文書間に挿入した場合にも、文書間を識別するとと
もに、分類マークをインデクス情報に変換することによ
り、同様な処理が可能である。また、このセパレータシ
ートは、文書分類処理を実行しているワークステーショ
ンと同一のワークステーションで作成することも可能で
ある。
データ自体に分類マークを付加していたが、分類マーク
を付加したセパレータシートを、入力対象である複数文
書の文書間に挿入した場合にも、文書間を識別するとと
もに、分類マークをインデクス情報に変換することによ
り、同様な処理が可能である。また、このセパレータシ
ートは、文書分類処理を実行しているワークステーショ
ンと同一のワークステーションで作成することも可能で
ある。
【0027】(実施例2)実施例1では、分類マークと
して、カラーコードを利用した場合について説明した。
して、カラーコードを利用した場合について説明した。
【0028】ここでは、二値画像を入力するスキャナを
利用して、文書を分類する場合を考える。ここで利用す
る分類マークは、一般文書に出現する確率が小さい記号
を複数組み合わせる。この分類マークを利用した文書分
離方式について、図10を利用して説明する。
利用して、文書を分類する場合を考える。ここで利用す
る分類マークは、一般文書に出現する確率が小さい記号
を複数組み合わせる。この分類マークを利用した文書分
離方式について、図10を利用して説明する。
【0029】図中の61は、入力対象の文書画像データ
であり、文書分類マーク62−1および62−2が付加
されている。ここで、付加する分類マークは、バーコー
ドのような一般文書に出現する確率が小さいものを組合
わせてもよいし、記入位置,形状をある程度規定した手
書き図形でもよい。入力する文書画像データは、カラー
コードを利用した場合と同様、一ページ/1件でもよい
し、複数ページ/1件でもよい。図10の例は、一ペー
ジ/1件の文書を入力する場合であり、全ての文書画像
データに分類マークが付加されている。
であり、文書分類マーク62−1および62−2が付加
されている。ここで、付加する分類マークは、バーコー
ドのような一般文書に出現する確率が小さいものを組合
わせてもよいし、記入位置,形状をある程度規定した手
書き図形でもよい。入力する文書画像データは、カラー
コードを利用した場合と同様、一ページ/1件でもよい
し、複数ページ/1件でもよい。図10の例は、一ペー
ジ/1件の文書を入力する場合であり、全ての文書画像
データに分類マークが付加されている。
【0030】このように、カラー情報を扱えないスキャ
ナが接続されている場合でも、文書分類が可能である。
ナが接続されている場合でも、文書分類が可能である。
【0031】(実施例3)本文書分離方式を階層化され
た文書管理に適用した場合について、図11を利用して
説明する。この例は、大分類マークにより、格納するフ
ァイルを分類し、さらに、小分類マークにより、各ファ
イルにおける文書画像データの格納位置を管理する。図
中の66は、入力した文書画像データであり、大分類マ
ーク67−1および小分類マーク67−2が付加されて
いる。この文書画像データ66は、スキャナで画像入力
されると、まず、大分類マーク67−1により、ファイ
ル68−1〜3のいずれのファイルに格納するかが決定
される。次に、小分類マーク67−2により、文書画像
データをファイルのどの位置に格納するかが決定され
る。各ファイルの内部は、例えば、「文書名」,「作成
者」「作成日」といった項目69−1〜3で構成され、
小分類マークにより、「文書名」,「作成者」「作成
日」の少なくとも、いずれか一項目が決定される。
た文書管理に適用した場合について、図11を利用して
説明する。この例は、大分類マークにより、格納するフ
ァイルを分類し、さらに、小分類マークにより、各ファ
イルにおける文書画像データの格納位置を管理する。図
中の66は、入力した文書画像データであり、大分類マ
ーク67−1および小分類マーク67−2が付加されて
いる。この文書画像データ66は、スキャナで画像入力
されると、まず、大分類マーク67−1により、ファイ
ル68−1〜3のいずれのファイルに格納するかが決定
される。次に、小分類マーク67−2により、文書画像
データをファイルのどの位置に格納するかが決定され
る。各ファイルの内部は、例えば、「文書名」,「作成
者」「作成日」といった項目69−1〜3で構成され、
小分類マークにより、「文書名」,「作成者」「作成
日」の少なくとも、いずれか一項目が決定される。
【0032】上記のように、複数の分類マークを利用す
ることにより、階層化された文書分類も容易にできる。
ることにより、階層化された文書分類も容易にできる。
【0033】
【発明の効果】本発明によれば、分類マークの種類に関
する情報と、位置に関する情報を利用すれば、分類マー
クの形状を複雑化することなく、多数の文書を分類する
ことが可能となる。例えば、複数のカラーバーを並べる
ことにより、分類マークの表現能力を拡張する。これに
より、カラーバーが一つの時には、八通りのインデクス
しか表現できないが、三つ程度の時でも、256通りの
表現が可能となる。
する情報と、位置に関する情報を利用すれば、分類マー
クの形状を複雑化することなく、多数の文書を分類する
ことが可能となる。例えば、複数のカラーバーを並べる
ことにより、分類マークの表現能力を拡張する。これに
より、カラーバーが一つの時には、八通りのインデクス
しか表現できないが、三つ程度の時でも、256通りの
表現が可能となる。
【図1】本発明の文書分離方式の一実施例を示す処理の
フローチャート。
フローチャート。
【図2】本発明を実現する装置のブロック図。
【図3】カラーコードを利用した文書分離方式の一実施
例を示す処理のフローチャート。
例を示す処理のフローチャート。
【図4】画像識別処理のフローチャート。
【図5】一ページ/1文書の識別処理を示す説明図。
【図6】複数ページ/1文書の識別処理を示す説明図。
【図7】カラーコード識別処理の一例を示すフローチャ
ート。
ート。
【図8】カラーコード識別処理の一例を示す説明図。
【図9】インデクス生成辞書の構成の説明図。
【図10】分類記号を組合わせた分類マークを利用した
文書分類処理の一例を示す説明図。
文書分類処理の一例を示す説明図。
【図11】文書分離方式を階層化した文書管理に適用し
た例の説明図。
た例の説明図。
1…スキャナ、2…分類マーク抽出処理、3…マーク位
置関係識別処理、4…マーク種類識別処理、5…インデ
クス生成処理、6…インデクス生成辞書、7…文書ファ
イル。
置関係識別処理、4…マーク種類識別処理、5…インデ
クス生成処理、6…インデクス生成辞書、7…文書ファ
イル。
Claims (9)
- 【請求項1】画像データを入力するスキャナなどの画像
入力手段と、前記画像データから文書分類マークを抽出
する分類マーク抽出手段と、前記文書分類マークの種類
および位置関係からインデクスデータを生成するインデ
クス生成手段と、光ディスクファイルなどの画像データ
格納手段とを備え、前記文書分類マークを付加した文書
画像データを入力する場合に、前記画像入力手段により
前記文書画像データから、前記分類マーク抽出手段によ
り前記文書分類マークを抽出し、抽出した前記文書分類
マークの種類および位置関係を識別し、識別結果を前記
インデクス生成手段によりインデクスデータに変換し、
前記文書画像データを前記インデクスデータとともに、
画像格納手段に格納することを特徴とする文書分離方
式。 - 【請求項2】カラースキャナなど多値画像データを入力
できる画像入力手段と、多値画像データから文書分類マ
ークを識別する分類マーク識別手段と、光ディスクファ
イルなど画像データ格納手段とを備え、余白が存在する
領域に複数の色で構成された文書分類マークを付加した
文書画像データを前記多値画像入力手段により入力し、
前記分類マーク識別手段により、入力した前記多値画像
データから前記文書分類マークを識別し、識別した前記
文書分類マークの種類によって、入力した前記多値画像
データを複数の項目に分類し、多値画像データを分類し
た項目ごとに画像格納手段に格納することを特徴とする
文書分離方式。 - 【請求項3】請求項1または2において、前記分類マー
ク抽出手段で抽出した前記文書分類マークの位置を検出
し、検出した前記文書分類マークを消去する分類マーク
消去手段を備え、入力した文書画像データの文書分類マ
ークのインデクスデータを生成した後、分類マーク消去
手段により、入力した前記文書画像データから前記文書
分類マークを消去し、前記文書画像データを分類した項
目ごとに画像格納手段に格納する文書分離方式。 - 【請求項4】請求項2において、前記画像入力手段上
に、指定した領域を前記多値画像データとして画像入力
する領域指定手段を備え、複数の色で構成された前記文
書分類マークを付加した前記文書画像データを入力する
場合、前記領域指定手段を利用して、前記文書分類マー
クが付加された領域を指定することにより、前記多値画
像データとして画像入力し、入力した前記多値画像デー
タを識別することによりインデクスデータを生成する文
書分離方式。 - 【請求項5】請求項2において、前記画像入力手段上
に、前記多値画像データとして画像入力する領域を指定
する領域指定手段を備え、前記領域指定手段で指定され
た領域を領域1とし、前記領域1以外の領域を領域2と
した場合、前記領域指定手段により、前記文書分類マー
クが付加された領域を前記領域1として指定し、前記領
域1を前記多値画像データとして画像入力し、前記領域
1に存在する前記多値画像データで構成された前記文書
分類マークを識別することにより、インデクスデータを
生成し、前記インデクスデータを生成した後、前記領域
1の前記多値画像データを二値画像データに変換し、前
記二値画像データとして画像入力した前記領域2の画像
データと合成する文書分離方式。 - 【請求項6】請求項1または2において、前記画像入力
手段,前記分類マーク抽出手段,前記インデクス生成手
段,前記画像格納手段を備え、複数の文書を一括入力す
る時、前記文書分類マークを付加したシートをセパレー
タシートを使用して文書間を識別する場合、前記画像入
力手段により入力した前記文書画像データから、前記分
類マーク抽出手段により文書分類マークを抽出し、抽出
した前記文書分類マークの種類および位置関係を識別す
ることにより、入力した画像データがセパレータシート
であるか一般文書であるか判定するとともに、識別結果
をインデクス生成手段によりインデクスデータに変換
し、前記文書画像データを前記インデクスデータととも
に、画像格納手段に格納する文書分離方式。 - 【請求項7】請求項6において、複数の文書を一括入力
する時、文書間を識別する方法として、前記文書分類マ
ークを付加したシートをセパレータシートを使用する場
合、前記セパレータシートをワークステーションで作成
する文書分離方式。 - 【請求項8】記号群中に存在する他の記号と区別可能
な、複数個の記号で構成される記号群において、記号の
種類および位置関係を利用して、記号を複数組み合わせ
ることにより、表現能力を拡張したことを特徴とする文
書分類マーク。 - 【請求項9】階層的に構成された文書管理システムにお
いて、付加された文書分類マークの位置および種類によ
り分類可能な文書画像データを登録する場合、前記文書
分類マークが付加された位置により、文書管理の階層を
決定し、前記文書画像データの各位置に付加された前記
文書分類マークの種類により、各階層における管理用イ
ンデクスデータを生成することを特徴とする文書管理シ
ステム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3218260A JPH0554120A (ja) | 1991-08-29 | 1991-08-29 | 文書分離方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3218260A JPH0554120A (ja) | 1991-08-29 | 1991-08-29 | 文書分離方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0554120A true JPH0554120A (ja) | 1993-03-05 |
Family
ID=16717090
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3218260A Pending JPH0554120A (ja) | 1991-08-29 | 1991-08-29 | 文書分離方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0554120A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100813956B1 (ko) * | 2003-09-24 | 2008-03-14 | 삼성전자주식회사 | 단일 스캔 작업을 구성하는 일군의 문서들을 식별하기위한 스캔 장치 및 그 방법 및 문서의 귀접힘을 검출하기위한 장치 및 그 방법 |
| US7916946B2 (en) | 2006-07-26 | 2011-03-29 | Canon Kabushiki Kaisha | Image processing apparatus for identifying and classifying an object in an image, method of controlling same, and computer-readable storage medium storing a computer program for controlling same |
-
1991
- 1991-08-29 JP JP3218260A patent/JPH0554120A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100813956B1 (ko) * | 2003-09-24 | 2008-03-14 | 삼성전자주식회사 | 단일 스캔 작업을 구성하는 일군의 문서들을 식별하기위한 스캔 장치 및 그 방법 및 문서의 귀접힘을 검출하기위한 장치 및 그 방법 |
| US7688475B2 (en) | 2003-09-24 | 2010-03-30 | Samsung Electronics Co., Ltd. | Scanning apparatus and method of identifying group of papers constituting single scan job and apparatus and method of detecting dog-ears of papers |
| US7916946B2 (en) | 2006-07-26 | 2011-03-29 | Canon Kabushiki Kaisha | Image processing apparatus for identifying and classifying an object in an image, method of controlling same, and computer-readable storage medium storing a computer program for controlling same |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0654746B1 (en) | Form identification and processing system | |
| US7593961B2 (en) | Information processing apparatus for retrieving image data similar to an entered image | |
| US7681121B2 (en) | Image processing apparatus, control method therefor, and program | |
| US8824798B2 (en) | Information processing device, computer readable medium storing information processing program, and information processing method | |
| JP2005018678A (ja) | 帳票データ入力処理装置、帳票データ入力処理方法及びプログラム | |
| US20040213458A1 (en) | Image processing method and system | |
| JPH11161681A (ja) | 検索結果を表示するための装置および方法、並びに、検索結果を出力するために一連の命令を記録したコンピュータ読み取り可能な記録媒体 | |
| WO2001071649A1 (en) | Method and system for searching form features for form identification | |
| WO2000052645A1 (en) | Document image processor, method for extracting document title, and method for imparting document tag information | |
| US20120250048A1 (en) | Image processing apparatus and image processing method | |
| US20060010115A1 (en) | Image processing system and image processing method | |
| US5887088A (en) | Inputting device and inputting method for information processing system | |
| JP4854491B2 (ja) | 画像処理装置及びその制御方法 | |
| JP4227432B2 (ja) | 画像処理方法 | |
| JP4338189B2 (ja) | 画像処理システム及び画像処理方法 | |
| CN109726369A (zh) | 一种基于标准文献的智能模板化题录技术实现方法 | |
| CN118227773A (zh) | 一种基于多模态大模型的问答方法及装置 | |
| EP1202213B1 (en) | Document format identification apparatus and method | |
| JP3319203B2 (ja) | 文書ファイリング方法及び装置 | |
| JPH0554120A (ja) | 文書分離方式 | |
| JP2001034763A (ja) | 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法 | |
| JP4310176B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
| JP2006134042A (ja) | 画像処理システム | |
| JP2006134079A (ja) | 画像処理装置及びプログラム | |
| JP2005208872A (ja) | 画像処理システム |