JPH1125214A - 画像識別装置 - Google Patents
画像識別装置Info
- Publication number
- JPH1125214A JPH1125214A JP9177463A JP17746397A JPH1125214A JP H1125214 A JPH1125214 A JP H1125214A JP 9177463 A JP9177463 A JP 9177463A JP 17746397 A JP17746397 A JP 17746397A JP H1125214 A JPH1125214 A JP H1125214A
- Authority
- JP
- Japan
- Prior art keywords
- image
- unit
- format
- ruled line
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000001514 detection method Methods 0.000 claims description 44
- 238000000034 method Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 11
- 238000003909 pattern recognition Methods 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 206010027146 Melanoderma Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】
【課題】 入力された画像データに対して正確にフォー
マットの特定を行なうことのできる画像識別装置の提
供。 【解決手段】 画像識別装置10は、制御部16により画像
メモリ部12、フォーマット選択部13, 14、およびフォー
マット記憶部15の動作をそれぞれ制御し、画像入力部11
から供給される画像情報を画像メモリ部12に一時的に記
憶させ、フォーマット記憶部15から供給されるフォーマ
ットの候補とフォーマット選択部13,14とを照合させて
フォーマットを選択する。
マットの特定を行なうことのできる画像識別装置の提
供。 【解決手段】 画像識別装置10は、制御部16により画像
メモリ部12、フォーマット選択部13, 14、およびフォー
マット記憶部15の動作をそれぞれ制御し、画像入力部11
から供給される画像情報を画像メモリ部12に一時的に記
憶させ、フォーマット記憶部15から供給されるフォーマ
ットの候補とフォーマット選択部13,14とを照合させて
フォーマットを選択する。
Description
【0001】
【発明の属する技術分野】本発明は、濃淡で表された画
像情報を画像入力手段を介して読み込み、該画像情報に
含まれる画像の特徴を検出し、得られた画像の特徴に対
応するフォーマットを識別する画像識別装置に関し、特
に、多種多様な画像データの混在している、たとえば帳
票等を光学的に読み込んで画像識別する画像識別装置に
用いて好適なものである。
像情報を画像入力手段を介して読み込み、該画像情報に
含まれる画像の特徴を検出し、得られた画像の特徴に対
応するフォーマットを識別する画像識別装置に関し、特
に、多種多様な画像データの混在している、たとえば帳
票等を光学的に読み込んで画像識別する画像識別装置に
用いて好適なものである。
【0002】
【従来の技術】多種多様な印刷物を光学的に読み取りコ
ードに変換しコンピュータの扱いやすい形態で文書を保
存する画像処理システムに、たとえばファイリング装置
がある。ファイリング装置は、ファイリングにおいて画
像データの保存および入出力を効率的に行なうため入力
された画像データの種類、すなわち文字、写真等の図
形、罫線等に応じて分類処理を行なう。
ードに変換しコンピュータの扱いやすい形態で文書を保
存する画像処理システムに、たとえばファイリング装置
がある。ファイリング装置は、ファイリングにおいて画
像データの保存および入出力を効率的に行なうため入力
された画像データの種類、すなわち文字、写真等の図
形、罫線等に応じて分類処理を行なう。
【0003】このファイリング装置は、画像入力装置
(たとえばイメージスキャナ等)を介してたとえば紙に
印刷されたドットによる濃淡情報を画像情報として装置
内に取り込むように構成されている。一般に、ファイリ
ング装置では上述した分類処理のため画像入力時に入力
画像の種類を識別可能にする様々な分類方法が用いられ
てきている。分類方法としては、第一に予めオペレータ
が入力画像の種類を分類してその種類を指定した上で画
像入力する方法、第二に画像の種類を判別するたとえば
バッチ票等のシートを付加して画像入力する方法、第三
に分類用のIDが貼付された画像入力シートを画像入力す
る方法等がある。
(たとえばイメージスキャナ等)を介してたとえば紙に
印刷されたドットによる濃淡情報を画像情報として装置
内に取り込むように構成されている。一般に、ファイリ
ング装置では上述した分類処理のため画像入力時に入力
画像の種類を識別可能にする様々な分類方法が用いられ
てきている。分類方法としては、第一に予めオペレータ
が入力画像の種類を分類してその種類を指定した上で画
像入力する方法、第二に画像の種類を判別するたとえば
バッチ票等のシートを付加して画像入力する方法、第三
に分類用のIDが貼付された画像入力シートを画像入力す
る方法等がある。
【0004】ところで、第一の画像入力方法を適用した
ファイリング装置は、分類方法をオペレータに予めすべ
て記憶させ分類方法の変更もオペレータに対処してもら
わなければならないので、オペレータを専任とすること
が多くオペレータの負担が大きい。第二の画像入力方法
を用いたファイリング装置は、まずバッチ票等の付加に
よって画像データを増加させてしまう。また、バッチ票
等の作成が手間のかかる作業のため種類の異なるシート
が混在する場合ファイリング装置は効率的な装置になら
ない。第三の画像入力方法を使用したファイリング装置
も、手間なIDの付加の他、不特定なID未定義のシートの
入力には適さない。また、たとえばID未定義のシートの
画像入力を可能にするためにはID領域が確保されなけれ
ばならない。しかしながら、シートのフォーマットには
ID領域確保に伴うフォーマットの変更が許されない場合
もある。このような場合、このファイリング装置は適さ
ない。
ファイリング装置は、分類方法をオペレータに予めすべ
て記憶させ分類方法の変更もオペレータに対処してもら
わなければならないので、オペレータを専任とすること
が多くオペレータの負担が大きい。第二の画像入力方法
を用いたファイリング装置は、まずバッチ票等の付加に
よって画像データを増加させてしまう。また、バッチ票
等の作成が手間のかかる作業のため種類の異なるシート
が混在する場合ファイリング装置は効率的な装置になら
ない。第三の画像入力方法を使用したファイリング装置
も、手間なIDの付加の他、不特定なID未定義のシートの
入力には適さない。また、たとえばID未定義のシートの
画像入力を可能にするためにはID領域が確保されなけれ
ばならない。しかしながら、シートのフォーマットには
ID領域確保に伴うフォーマットの変更が許されない場合
もある。このような場合、このファイリング装置は適さ
ない。
【0005】このような事情から最近のファイリング装
置は、フォーマットの大きな要素を成す罫線に注目し分
類においてこの罫線の特徴を抽出し、予めこの装置に分
類かつ登録されていた複数の罫線の特徴と抽出した罫線
の特徴とを照合することによりフォーマットを特定する
分類方法を用いている。
置は、フォーマットの大きな要素を成す罫線に注目し分
類においてこの罫線の特徴を抽出し、予めこの装置に分
類かつ登録されていた複数の罫線の特徴と抽出した罫線
の特徴とを照合することによりフォーマットを特定する
分類方法を用いている。
【0006】
【発明が解決しようとする課題】ところで、罫線の特徴
を用いたファイリング装置の画像入力部に使用されるイ
メージスキャナ等には、人間の目よりも低い解像度の装
置を使用することが多い。このため、画像入力に用いる
シートの罫線の太さ、線の色および線の濃度によって再
現時の画像データの罫線は、入力元のシートの罫線に比
べて完全には再現できない場合が生じる。したがって、
ファイリング装置は、罫線の特徴をあいまいに捉えるこ
とになる。一方、事務、会計、および為替等の業務で使
用されているシート、すなわち帳票は、罫線の特徴の似
ているものが実際、多い。罫線の特徴は非常に似ている
が異なるフォーマットのシートが画像入力されると、フ
ァイリング装置は正確な罫線の分類ができず、フォーマ
ットの特定が困難になってしまう虞れがある。
を用いたファイリング装置の画像入力部に使用されるイ
メージスキャナ等には、人間の目よりも低い解像度の装
置を使用することが多い。このため、画像入力に用いる
シートの罫線の太さ、線の色および線の濃度によって再
現時の画像データの罫線は、入力元のシートの罫線に比
べて完全には再現できない場合が生じる。したがって、
ファイリング装置は、罫線の特徴をあいまいに捉えるこ
とになる。一方、事務、会計、および為替等の業務で使
用されているシート、すなわち帳票は、罫線の特徴の似
ているものが実際、多い。罫線の特徴は非常に似ている
が異なるフォーマットのシートが画像入力されると、フ
ァイリング装置は正確な罫線の分類ができず、フォーマ
ットの特定が困難になってしまう虞れがある。
【0007】また、ファイリング装置には、帳票の種類
が数千種から数万種の帳票を分類しなければならない装
置もあって、このようなファイリング装置ではこの不正
確な罫線の特徴に基づく分類によってフォーマットを特
定するまでの所要時間が予定した所要時間よりかなり長
くかかり、かつフォーマットの特定の正確さも欠くこと
が懸念されている。
が数千種から数万種の帳票を分類しなければならない装
置もあって、このようなファイリング装置ではこの不正
確な罫線の特徴に基づく分類によってフォーマットを特
定するまでの所要時間が予定した所要時間よりかなり長
くかかり、かつフォーマットの特定の正確さも欠くこと
が懸念されている。
【0008】本発明はこのような従来技術の欠点を解消
し、入力された画像データに対して正確にフォーマット
の特定を行なうことのできる画像識別装置を提供するこ
とを目的とする。
し、入力された画像データに対して正確にフォーマット
の特定を行なうことのできる画像識別装置を提供するこ
とを目的とする。
【0009】
【課題を解決するための手段】本発明は上述の課題を解
決するために、濃淡で表された画像情報を画像入力手段
を介して読み込み、この画像情報に含まれる画像の特徴
を検出し、得られた画像の特徴に対応するフォーマット
を識別する画像識別装置において、この装置は、この画
像入力手段から供給される画像情報を一時的に記憶する
画像情報記憶手段と、この画像情報から検出される第1
の画像の特徴を含むフォーマットの候補を選択する第1
のフォーマット選択手段と、この第1のフォーマット選
択手段から供給されるフォーマットの候補とこの画像情
報に含まれる第2の画像の特徴に関する検出結果とを照
合してフォーマットを選択する第2のフォーマット選択
手段と、この第1のフォーマット選択手段に供給される
複数のフォーマットの候補を記憶するフォーマット記憶
手段と、画像情報記憶手段、第1および第2のフォーマ
ット選択手段、およびフォーマット記憶手段の動作を制
御する制御手段とを有することを特徴とする。
決するために、濃淡で表された画像情報を画像入力手段
を介して読み込み、この画像情報に含まれる画像の特徴
を検出し、得られた画像の特徴に対応するフォーマット
を識別する画像識別装置において、この装置は、この画
像入力手段から供給される画像情報を一時的に記憶する
画像情報記憶手段と、この画像情報から検出される第1
の画像の特徴を含むフォーマットの候補を選択する第1
のフォーマット選択手段と、この第1のフォーマット選
択手段から供給されるフォーマットの候補とこの画像情
報に含まれる第2の画像の特徴に関する検出結果とを照
合してフォーマットを選択する第2のフォーマット選択
手段と、この第1のフォーマット選択手段に供給される
複数のフォーマットの候補を記憶するフォーマット記憶
手段と、画像情報記憶手段、第1および第2のフォーマ
ット選択手段、およびフォーマット記憶手段の動作を制
御する制御手段とを有することを特徴とする。
【0010】ここで、第1の画像の特徴には、罫線、文
字認識、字体、字種、画像のサイズ、画像の背景色、地
紋、図形パターンの少なくとも一項目を選び、第2の画
像の特徴には、この第1の画像の特徴で選んだ項目と異
なる、少なくとも一項目あるいは複数の組み合わせた項
目を選ぶことが望ましい。
字認識、字体、字種、画像のサイズ、画像の背景色、地
紋、図形パターンの少なくとも一項目を選び、第2の画
像の特徴には、この第1の画像の特徴で選んだ項目と異
なる、少なくとも一項目あるいは複数の組み合わせた項
目を選ぶことが望ましい。
【0011】また、第1の画像の特徴として画像のサイ
ズ、画像の背景色、および/または地紋が選択された際
には、画像入力手段を記録媒体の色および色の分布を検
出する色検出手段として用いるとよい。
ズ、画像の背景色、および/または地紋が選択された際
には、画像入力手段を記録媒体の色および色の分布を検
出する色検出手段として用いるとよい。
【0012】画像識別装置は、制御手段により画像情報
記憶手段、第1および第2のフォーマット選択手段、お
よびフォーマット記憶手段の動作をそれぞれ制御し、画
像入力手段から供給される画像情報を画像情報記憶手段
に一時的に記憶させ、フォーマット記憶手段から供給さ
れるフォーマットの候補と第1のフォーマット選択手段
および第2のフォーマット選択手段での検出結果とを照
合させてフォーマット選択を行なうことにより、従来よ
りも識別能力を高めることができるので、画像の特徴の
似たシートが入力されても該当するフォーマットの候補
を的確に選択する装置になる。
記憶手段、第1および第2のフォーマット選択手段、お
よびフォーマット記憶手段の動作をそれぞれ制御し、画
像入力手段から供給される画像情報を画像情報記憶手段
に一時的に記憶させ、フォーマット記憶手段から供給さ
れるフォーマットの候補と第1のフォーマット選択手段
および第2のフォーマット選択手段での検出結果とを照
合させてフォーマット選択を行なうことにより、従来よ
りも識別能力を高めることができるので、画像の特徴の
似たシートが入力されても該当するフォーマットの候補
を的確に選択する装置になる。
【0013】
【発明の実施の形態】次に添付図面を参照して本発明に
よる画像識別装置の一実施例を詳細に説明する。
よる画像識別装置の一実施例を詳細に説明する。
【0014】本実施例は、ファイリング装置の一部に適
用された画像識別装置の構成および動作について図1〜
図8を参照しながら説明する。画像識別装置は、たとえ
ば紙に印刷された濃淡情報を光学的に読み取ってコンピ
ュータ等の扱いやすくなった画像情報を画像の特徴に応
じて分類する装置である。
用された画像識別装置の構成および動作について図1〜
図8を参照しながら説明する。画像識別装置は、たとえ
ば紙に印刷された濃淡情報を光学的に読み取ってコンピ
ュータ等の扱いやすくなった画像情報を画像の特徴に応
じて分類する装置である。
【0015】図1は画像識別装置10の基本的なブロック
構成を示している。この画像識別装置10は、画像入力部
11、画像メモリ部12、フォーマット選択部13、14、フォ
ーマット記憶部15および制御部16で構成されている。
構成を示している。この画像識別装置10は、画像入力部
11、画像メモリ部12、フォーマット選択部13、14、フォ
ーマット記憶部15および制御部16で構成されている。
【0016】画像入力部11には、光を発光する光源およ
び光源の発光光をたとえば紙等の記録媒体に集光させこ
の記録媒体からの反射光を受光する光学系と、受光光量
を基に多値の電気信号に変換する光電変換部とを有する
スキャナがある(光学系と光電変換部は図示せず)。こ
の実施例では帳票・シート等を入力対象として用い記載
されている濃淡情報がコード変換されたときこの情報を
画像データとしている。
び光源の発光光をたとえば紙等の記録媒体に集光させこ
の記録媒体からの反射光を受光する光学系と、受光光量
を基に多値の電気信号に変換する光電変換部とを有する
スキャナがある(光学系と光電変換部は図示せず)。こ
の実施例では帳票・シート等を入力対象として用い記載
されている濃淡情報がコード変換されたときこの情報を
画像データとしている。
【0017】画像メモリ部12は、画像として取り込んだ
画像入力部11から供給される画像データを一時的に記憶
する機能を持つメモリである。
画像入力部11から供給される画像データを一時的に記憶
する機能を持つメモリである。
【0018】フォーマット選択部13、14は、それぞれ第
1のフォーマット選択手段と第2のフォーマット選択手
段に相当している。フォーマット選択部13は、検出され
る第1の画像の特徴を含むフォーマットの候補を選択す
る機能を持っている。このためフォーマット選択部13
は、第1の画像の特徴を検出する画像特徴検出部13a
と、画像特徴検出部13a からのデータを基にデータ処理
を行なう画像の特徴データ処理部13b と、画像の特徴デ
ータ処理部13b からの処理結果を一時格納するメモリ部
13c と、メモリ部13c および後述するフォーマット記憶
部15からそれぞれ供給される画像の特徴とを照合する画
像の特徴照合部13d とを有している。
1のフォーマット選択手段と第2のフォーマット選択手
段に相当している。フォーマット選択部13は、検出され
る第1の画像の特徴を含むフォーマットの候補を選択す
る機能を持っている。このためフォーマット選択部13
は、第1の画像の特徴を検出する画像特徴検出部13a
と、画像特徴検出部13a からのデータを基にデータ処理
を行なう画像の特徴データ処理部13b と、画像の特徴デ
ータ処理部13b からの処理結果を一時格納するメモリ部
13c と、メモリ部13c および後述するフォーマット記憶
部15からそれぞれ供給される画像の特徴とを照合する画
像の特徴照合部13d とを有している。
【0019】フォーマット選択部14もフォーマット選択
部13と同様に画像特徴検出部14a 、画像の特徴データ処
理部14b 、メモリ部14c 、および画像の特徴照合部14d
を有している。ここで、画像の特徴にはたとえば罫線、
文字認識、字体、字種、画像のサイズ、画像の背景色、
地紋、図形パターン等の項目が挙げられる。これらの項
目の中からユーザの選んだ項目に応じて検出・データ処
理の手順が採られることは言うまでもない。フォーマッ
ト選択部14は選択されたフォーマットを出力端子17を介
して図示しないファイリング装置内のフォーマット確定
メモリに出力する。
部13と同様に画像特徴検出部14a 、画像の特徴データ処
理部14b 、メモリ部14c 、および画像の特徴照合部14d
を有している。ここで、画像の特徴にはたとえば罫線、
文字認識、字体、字種、画像のサイズ、画像の背景色、
地紋、図形パターン等の項目が挙げられる。これらの項
目の中からユーザの選んだ項目に応じて検出・データ処
理の手順が採られることは言うまでもない。フォーマッ
ト選択部14は選択されたフォーマットを出力端子17を介
して図示しないファイリング装置内のフォーマット確定
メモリに出力する。
【0020】フォーマット記憶部15は、画像の分類の対
象となる画像データから予め各項目について検出した情
報を標準フォーマットとして、たとえば図2に示すよう
な15個のフォーマットを記憶させておくメモリである。
たとえば文字を標準フォーマットの一つに用いる場合
は、画像の特徴を示す文字領域の位置・サイズ・記載内
容等の情報も一緒に登録されている。
象となる画像データから予め各項目について検出した情
報を標準フォーマットとして、たとえば図2に示すよう
な15個のフォーマットを記憶させておくメモリである。
たとえば文字を標準フォーマットの一つに用いる場合
は、画像の特徴を示す文字領域の位置・サイズ・記載内
容等の情報も一緒に登録されている。
【0021】制御部16は、外部からの操作に応じて画像
入力部11、画像メモリ部12、フォーマット選択部13、1
4、およびフォーマット記憶部15の動作タイミングや異
常時の動作等を制御している。
入力部11、画像メモリ部12、フォーマット選択部13、1
4、およびフォーマット記憶部15の動作タイミングや異
常時の動作等を制御している。
【0022】より具体的な例として帳票の識別分類例を
挙げながら本発明の画像識別装置10を説明する。この説
明に際しては図1のブロック図、図2のフォーマット候
補の説明図、図3の入力される帳票の例、および図4〜
図8の具体的な画像識別装置のブロック図を用いてい
る。
挙げながら本発明の画像識別装置10を説明する。この説
明に際しては図1のブロック図、図2のフォーマット候
補の説明図、図3の入力される帳票の例、および図4〜
図8の具体的な画像識別装置のブロック図を用いてい
る。
【0023】先ず、第1の具体例として画像識別装置10
には第1の画像の特徴に罫線、第2の画像の特徴に文字
認識を用いて照合する場合がある。この場合、フォーマ
ット選択部13は罫線特徴検出部131a、罫線分析部131b、
メモリ部131c、および罫線特徴照合部131dを有し、フォ
ーマット選択部14は文字検出部141a、文字認識部141b、
メモリ部141c、および文字特徴照合部141dを有してい
る。
には第1の画像の特徴に罫線、第2の画像の特徴に文字
認識を用いて照合する場合がある。この場合、フォーマ
ット選択部13は罫線特徴検出部131a、罫線分析部131b、
メモリ部131c、および罫線特徴照合部131dを有し、フォ
ーマット選択部14は文字検出部141a、文字認識部141b、
メモリ部141c、および文字特徴照合部141dを有してい
る。
【0024】罫線特徴検出部131aは、画像メモリ部12か
ら供給される画像データ中にある連続した黒点をヒスト
グラムに基づいて検出する。罫線分布部131bは、罫線特
徴検出部131aからのデータに基づいて罫線分布を分析
し、たとえばこの分布をパターン化する。メモリ部131c
は、罫線分布部131bの分析結果を格納する。罫線特徴照
合部131dは、制御部16の制御によりフォーマット記憶部
15とメモリ部131cからそれぞれ供給されるデータの照合
を行なう(パターンマッチング)。
ら供給される画像データ中にある連続した黒点をヒスト
グラムに基づいて検出する。罫線分布部131bは、罫線特
徴検出部131aからのデータに基づいて罫線分布を分析
し、たとえばこの分布をパターン化する。メモリ部131c
は、罫線分布部131bの分析結果を格納する。罫線特徴照
合部131dは、制御部16の制御によりフォーマット記憶部
15とメモリ部131cからそれぞれ供給されるデータの照合
を行なう(パターンマッチング)。
【0025】また、文字検出部141aは、たとえば予め設
定されたサンプリング領域を文字の領域とし、この領域
毎に画像メモリ部12から供給される画像データ(の黒
点)をサンプリングする。文字認識部141bは、このサン
プリングされたデータから帳票に記されていた文字およ
び記号の記載位置に対応させながら検出内容の認識処理
を行なう。メモリ部141cは文字認識部141bの検出位置に
対応して得られた認識結果を格納する。文字特徴照合部
141dは制御部16の制御により罫線特徴照合部131dとメモ
リ部131cからそれぞれ供給されるデータとを照合してフ
ォーマットを選択する。
定されたサンプリング領域を文字の領域とし、この領域
毎に画像メモリ部12から供給される画像データ(の黒
点)をサンプリングする。文字認識部141bは、このサン
プリングされたデータから帳票に記されていた文字およ
び記号の記載位置に対応させながら検出内容の認識処理
を行なう。メモリ部141cは文字認識部141bの検出位置に
対応して得られた認識結果を格納する。文字特徴照合部
141dは制御部16の制御により罫線特徴照合部131dとメモ
リ部131cからそれぞれ供給されるデータとを照合してフ
ォーマットを選択する。
【0026】ここで、図3の帳票35が画像識別装置10の
画像入力部11に入力されると、画像入力部11を介して変
換された画像データが画像メモリ部12に出力される。画
像メモリ部12は、制御部16の制御により画像データをフ
ォーマット選択部13、14に供給する。フォーマット選択
部13の罫線特徴検出部131aは供給される画像データに含
まれている罫線の検出を行なって罫線分布部131bに検出
データを送る。罫線分布部131bでは検出データを基に罫
線の始点・終点位置、罫線の長さ、罫線の太さ、罫線の
線種等が分析され、パターン化される。分析されたデー
タは一旦メモリ部131cに格納される。制御部16はメモリ
部131cをタイミング制御してデータを罫線特徴照合部13
1dに出力する。
画像入力部11に入力されると、画像入力部11を介して変
換された画像データが画像メモリ部12に出力される。画
像メモリ部12は、制御部16の制御により画像データをフ
ォーマット選択部13、14に供給する。フォーマット選択
部13の罫線特徴検出部131aは供給される画像データに含
まれている罫線の検出を行なって罫線分布部131bに検出
データを送る。罫線分布部131bでは検出データを基に罫
線の始点・終点位置、罫線の長さ、罫線の太さ、罫線の
線種等が分析され、パターン化される。分析されたデー
タは一旦メモリ部131cに格納される。制御部16はメモリ
部131cをタイミング制御してデータを罫線特徴照合部13
1dに出力する。
【0027】また、フォーマット記憶部15には、予め分
類対象となる一帳票の標準画像に関して得られた複数の
画像の特徴がパターン化されて登録されている(図2を
参照)。たとえば罫線の分類特徴を登録する際には、帳
票毎に帳票に含まれる文字や図等の可変要素を取り除く
ため縦/横の2方向にそれぞれ走査して得られた罫線パ
ターンを記憶させている。ここで、図2に示した帳票パ
ターン20〜34は、罫線パターンだけでなく、この他予め
帳票の標準画像で得られた複数の画像の特徴を合成して
表わしている。フォーマット記憶部15は制御部16の制御
に応じて帳票パターン20〜34を罫線特徴照合部131dに順
次供給する。
類対象となる一帳票の標準画像に関して得られた複数の
画像の特徴がパターン化されて登録されている(図2を
参照)。たとえば罫線の分類特徴を登録する際には、帳
票毎に帳票に含まれる文字や図等の可変要素を取り除く
ため縦/横の2方向にそれぞれ走査して得られた罫線パ
ターンを記憶させている。ここで、図2に示した帳票パ
ターン20〜34は、罫線パターンだけでなく、この他予め
帳票の標準画像で得られた複数の画像の特徴を合成して
表わしている。フォーマット記憶部15は制御部16の制御
に応じて帳票パターン20〜34を罫線特徴照合部131dに順
次供給する。
【0028】罫線特徴照合部131dはメモリ部131cからの
データにマッチングする帳票パターンの照合を行なう。
照合の結果、罫線特徴照合部131dはマッチングした6つ
の帳票パターン20,23,26,28,31,32 だけをフォーマット
選択部14の文字特徴照合部141dに供給する。
データにマッチングする帳票パターンの照合を行なう。
照合の結果、罫線特徴照合部131dはマッチングした6つ
の帳票パターン20,23,26,28,31,32 だけをフォーマット
選択部14の文字特徴照合部141dに供給する。
【0029】このように入力された帳票フォーマットは
罫線だけで確定できないので、フォーマット選択部14で
さらに帳票フォーマットの選択処理を行なう。文字検出
部141a、文字認識部141bおよびメモリ部141cは、制御部
16の制御によって罫線特徴検出部131a、罫線分析部131b
およびメモリ部131cと同時並行処理される。文字検出部
141aは、図3の帳票35から特徴となる5文字を検出す
る。文字認識部141bは検出された5文字に認識処理を施
すことによって文字記載位置とともに内容を示す“〇〇
依頼書”を得る。これらのデータがメモリ部141cに格納
される。文字特徴照合部141dは、メモリ部141cに格納さ
れているデータと罫線特徴照合部131dから供給される6
つの帳票パターン20,23,26,28,31,32 との照合を行な
う。この照合処理によって帳票35は、文字記載位置およ
び記載内容“__依頼書”の一致から、図2の帳票パタ
ーン20が帳票フォーマットとして選択される。文字特徴
照合部141dは、分類されたフォーマットを最も確からし
いものとして出力端子17を介して出力する。
罫線だけで確定できないので、フォーマット選択部14で
さらに帳票フォーマットの選択処理を行なう。文字検出
部141a、文字認識部141bおよびメモリ部141cは、制御部
16の制御によって罫線特徴検出部131a、罫線分析部131b
およびメモリ部131cと同時並行処理される。文字検出部
141aは、図3の帳票35から特徴となる5文字を検出す
る。文字認識部141bは検出された5文字に認識処理を施
すことによって文字記載位置とともに内容を示す“〇〇
依頼書”を得る。これらのデータがメモリ部141cに格納
される。文字特徴照合部141dは、メモリ部141cに格納さ
れているデータと罫線特徴照合部131dから供給される6
つの帳票パターン20,23,26,28,31,32 との照合を行な
う。この照合処理によって帳票35は、文字記載位置およ
び記載内容“__依頼書”の一致から、図2の帳票パタ
ーン20が帳票フォーマットとして選択される。文字特徴
照合部141dは、分類されたフォーマットを最も確からし
いものとして出力端子17を介して出力する。
【0030】これにより、画像識別装置10はフォーマッ
ト分類の誤りを減少させ、帳票の種類を増加させても処
理時間を短縮化でき、装置の識別処理能力を向上させる
ことができる。
ト分類の誤りを減少させ、帳票の種類を増加させても処
理時間を短縮化でき、装置の識別処理能力を向上させる
ことができる。
【0031】次に第2の具体例として画像識別装置10に
は第1の画像の特徴に罫線、第2の画像の特徴に文字認
識を用いて照合する場合がある。この場合、フォーマッ
ト選択部13は第1の具体例と同じ構成の罫線特徴検出部
131a、罫線分析部131b、メモリ部131c、および罫線特徴
照合部131dを有し、フォーマット選択部14は文字検出部
141a、字体認識部142b、メモリ部141c、および字体特徴
照合部142dを有している。
は第1の画像の特徴に罫線、第2の画像の特徴に文字認
識を用いて照合する場合がある。この場合、フォーマッ
ト選択部13は第1の具体例と同じ構成の罫線特徴検出部
131a、罫線分析部131b、メモリ部131c、および罫線特徴
照合部131dを有し、フォーマット選択部14は文字検出部
141a、字体認識部142b、メモリ部141c、および字体特徴
照合部142dを有している。
【0032】字体認識部142bは、文字検出部141aでサン
プリングされたデータから帳票に記されていた文字およ
び記号の記載位置に対応させながら検出された文字等の
字体認識処理を行なう。メモリ部141cは字体認識部142b
の検出位置に対応して得られた認識結果を格納する。字
体特徴照合部142dは制御部16の制御により罫線特徴照合
部131dとメモリ部131cからそれぞれ供給されるデータの
照合を行なう。
プリングされたデータから帳票に記されていた文字およ
び記号の記載位置に対応させながら検出された文字等の
字体認識処理を行なう。メモリ部141cは字体認識部142b
の検出位置に対応して得られた認識結果を格納する。字
体特徴照合部142dは制御部16の制御により罫線特徴照合
部131dとメモリ部131cからそれぞれ供給されるデータの
照合を行なう。
【0033】ここで、たとえば図3の帳票36が画像識別
装置10の画像入力部11に入力されると、画像入力部11を
介して変換された画像データが画像メモリ部12に出力さ
れる。画像メモリ部12は、制御部16の制御により画像デ
ータをフォーマット選択部13、14に供給する。
装置10の画像入力部11に入力されると、画像入力部11を
介して変換された画像データが画像メモリ部12に出力さ
れる。画像メモリ部12は、制御部16の制御により画像デ
ータをフォーマット選択部13、14に供給する。
【0034】フォーマット選択部13の罫線特徴照合部13
1dはメモリ部131cからのデータにマッチングする帳票パ
ターンの照合を行なう。照合の結果、罫線特徴照合部13
1dはマッチングした5つの帳票パターン21,24,27,29,33
だけをフォーマット選択部14の字体特徴照合部142dに供
給する。このように入力された帳票フォーマットはこの
場合も罫線だけで確定できないので、フォーマット選択
部14でさらに帳票フォーマットの選択処理を行なう。文
字検出部141a、字体認識部142bおよびメモリ部141cは、
制御部16の制御によって罫線特徴検出部131a、罫線分析
部131bおよびメモリ部131cと同時並行処理される。文字
検出部141aは、図3の帳票36から特徴となる文字を検出
する。字体認識部142bは検出された文字の字体認識を行
なうことによって文字記載位置とともに文字の字体をと
して“ゴシック体”を得る。これらのデータがメモリ部
141cに格納される。字体特徴照合部142dは、メモリ部14
1cに格納されているデータと罫線特徴照合部131dから供
給される5つの帳票パターン21,24,27,29,33との照合を
行なう。この照合処理によって帳票36は、文字記載位置
および記載内容(字体:ゴシック体)の一致から、図2
の帳票パターン24が帳票フォーマットとして選択され
る。字体特徴照合部142dは、分類されたフォーマットを
最も確からしいものとして出力端子17を介して出力す
る。
1dはメモリ部131cからのデータにマッチングする帳票パ
ターンの照合を行なう。照合の結果、罫線特徴照合部13
1dはマッチングした5つの帳票パターン21,24,27,29,33
だけをフォーマット選択部14の字体特徴照合部142dに供
給する。このように入力された帳票フォーマットはこの
場合も罫線だけで確定できないので、フォーマット選択
部14でさらに帳票フォーマットの選択処理を行なう。文
字検出部141a、字体認識部142bおよびメモリ部141cは、
制御部16の制御によって罫線特徴検出部131a、罫線分析
部131bおよびメモリ部131cと同時並行処理される。文字
検出部141aは、図3の帳票36から特徴となる文字を検出
する。字体認識部142bは検出された文字の字体認識を行
なうことによって文字記載位置とともに文字の字体をと
して“ゴシック体”を得る。これらのデータがメモリ部
141cに格納される。字体特徴照合部142dは、メモリ部14
1cに格納されているデータと罫線特徴照合部131dから供
給される5つの帳票パターン21,24,27,29,33との照合を
行なう。この照合処理によって帳票36は、文字記載位置
および記載内容(字体:ゴシック体)の一致から、図2
の帳票パターン24が帳票フォーマットとして選択され
る。字体特徴照合部142dは、分類されたフォーマットを
最も確からしいものとして出力端子17を介して出力す
る。
【0035】これにより、画像識別装置10はフォーマッ
ト分類の誤りを減少させ、帳票の種類を増加させても処
理時間を短縮化でき、装置の識別処理能力を向上させる
ことができる。
ト分類の誤りを減少させ、帳票の種類を増加させても処
理時間を短縮化でき、装置の識別処理能力を向上させる
ことができる。
【0036】次に第3の具体例として画像識別装置10に
は第1の画像の特徴に罫線、第2の画像の特徴に字種認
識を用いて照合する場合がある。この場合、フォーマッ
ト選択部13は第1の具体例と同じ構成の罫線特徴検出部
131a、罫線分析部131b、メモリ部131c、および罫線特徴
照合部131dを有し、フォーマット選択部14は文字検出部
141a、字種認識部143b、メモリ部141c、および字種特徴
照合部143dを有している。
は第1の画像の特徴に罫線、第2の画像の特徴に字種認
識を用いて照合する場合がある。この場合、フォーマッ
ト選択部13は第1の具体例と同じ構成の罫線特徴検出部
131a、罫線分析部131b、メモリ部131c、および罫線特徴
照合部131dを有し、フォーマット選択部14は文字検出部
141a、字種認識部143b、メモリ部141c、および字種特徴
照合部143dを有している。
【0037】字種認識部142bは、文字検出部141aでサン
プリングされたデータから帳票に記されていた文字およ
び記号の記載位置に対応させながら検出された文字・記
号等の字種認識処理を行なう。メモリ部141cは字種認識
部143bの検出位置に対応して得られた認識結果を格納す
る。字種特徴照合部143dは制御部16の制御により罫線特
徴照合部131dとメモリ部131cからそれぞれ供給されるデ
ータの照合を行なう。
プリングされたデータから帳票に記されていた文字およ
び記号の記載位置に対応させながら検出された文字・記
号等の字種認識処理を行なう。メモリ部141cは字種認識
部143bの検出位置に対応して得られた認識結果を格納す
る。字種特徴照合部143dは制御部16の制御により罫線特
徴照合部131dとメモリ部131cからそれぞれ供給されるデ
ータの照合を行なう。
【0038】ここで、たとえば図3の帳票37が画像識別
装置10の画像入力部11に入力されると、画像入力部11を
介して変換された画像データが画像メモリ部12に出力さ
れる。画像メモリ部12は、制御部16の制御により画像デ
ータをフォーマット選択部13、14に供給する。
装置10の画像入力部11に入力されると、画像入力部11を
介して変換された画像データが画像メモリ部12に出力さ
れる。画像メモリ部12は、制御部16の制御により画像デ
ータをフォーマット選択部13、14に供給する。
【0039】フォーマット選択部13の罫線特徴照合部13
1dはメモリ部131cからのデータにマッチングする帳票パ
ターンの照合を行なう。照合の結果、罫線特徴照合部13
1dはマッチングした6つの帳票パターン20,23,26,28,3
1,32 だけをフォーマット選択部14の字種特徴照合部143
dに供給する。このように入力された帳票フォーマット
はこの場合も罫線だけで確定できないので、フォーマッ
ト選択部14でさらに帳票フォーマットの選択処理を行な
う。文字検出部141a、字種認識部143bおよびメモリ部14
1cは、制御部16の制御によって罫線特徴検出部131a、罫
線分析部131bおよびメモリ部131cと同時並行処理され
る。文字検出部141aは、図3の帳票37から特徴となる文
字を検出する。字種認識部143bは検出された文字“0123
456 ”の字種認識を行なうことによって文字記載位置と
ともに字種内容として数字を得る。これらのデータがメ
モリ部141cに格納される。字種特徴照合部143dは、メモ
リ部141cに格納されているデータと罫線特徴照合部131d
から供給される6つの帳票パターン20,23,26,28,31,32
との照合を行なう。この照合処理によって帳票37は、文
字記載位置および記載内容(字種:数字)の一致から、
図2の帳票パターン26が帳票フォーマットとして選択さ
れる。字種特徴照合部143dは、分類されたフォーマット
を最も確からしいものとして出力端子17を介して出力す
る。
1dはメモリ部131cからのデータにマッチングする帳票パ
ターンの照合を行なう。照合の結果、罫線特徴照合部13
1dはマッチングした6つの帳票パターン20,23,26,28,3
1,32 だけをフォーマット選択部14の字種特徴照合部143
dに供給する。このように入力された帳票フォーマット
はこの場合も罫線だけで確定できないので、フォーマッ
ト選択部14でさらに帳票フォーマットの選択処理を行な
う。文字検出部141a、字種認識部143bおよびメモリ部14
1cは、制御部16の制御によって罫線特徴検出部131a、罫
線分析部131bおよびメモリ部131cと同時並行処理され
る。文字検出部141aは、図3の帳票37から特徴となる文
字を検出する。字種認識部143bは検出された文字“0123
456 ”の字種認識を行なうことによって文字記載位置と
ともに字種内容として数字を得る。これらのデータがメ
モリ部141cに格納される。字種特徴照合部143dは、メモ
リ部141cに格納されているデータと罫線特徴照合部131d
から供給される6つの帳票パターン20,23,26,28,31,32
との照合を行なう。この照合処理によって帳票37は、文
字記載位置および記載内容(字種:数字)の一致から、
図2の帳票パターン26が帳票フォーマットとして選択さ
れる。字種特徴照合部143dは、分類されたフォーマット
を最も確からしいものとして出力端子17を介して出力す
る。
【0040】これにより、画像識別装置10はフォーマッ
ト分類の誤りを減少させ、帳票の種類を増加させても処
理時間を短縮化でき、装置の識別処理能力を向上させる
ことができる。
ト分類の誤りを減少させ、帳票の種類を増加させても処
理時間を短縮化でき、装置の識別処理能力を向上させる
ことができる。
【0041】次に第4の具体例として画像識別装置10に
は第1の画像の特徴に罫線、第2の画像の特徴に黒点を
用いて照合する場合がある。この場合、フォーマット選
択部13は第1の具体例と同じ構成の罫線特徴検出部131
a、罫線分析部131b、メモリ部131c、および罫線特徴照
合部131dを有し、フォーマット選択部14は黒点検出部14
4a、黒点カウント部144b、メモリ部141c、および黒点特
徴照合部144dを有している。
は第1の画像の特徴に罫線、第2の画像の特徴に黒点を
用いて照合する場合がある。この場合、フォーマット選
択部13は第1の具体例と同じ構成の罫線特徴検出部131
a、罫線分析部131b、メモリ部131c、および罫線特徴照
合部131dを有し、フォーマット選択部14は黒点検出部14
4a、黒点カウント部144b、メモリ部141c、および黒点特
徴照合部144dを有している。
【0042】黒点検出部144aは、たとえば予め設定され
た検出領域を黒点の検出領域とし、この検出領域毎に画
像メモリ部12から供給される画像データ(の黒点)をサ
ンプリングする。黒点カウント部144bはこのサンプリン
グされたデータから帳票に記されていた文字および記号
等のデータを取り除き、黒点の領域位置に対応させなが
ら検出された黒点数をカウントする。メモリ部141cは黒
点カウント部144bの検出位置に対応して得られたカウン
ト結果を格納する。黒点特徴照合部144dは制御部16の制
御により罫線特徴照合部131dとメモリ部131cからそれぞ
れ供給されるデータの照合を行なう。
た検出領域を黒点の検出領域とし、この検出領域毎に画
像メモリ部12から供給される画像データ(の黒点)をサ
ンプリングする。黒点カウント部144bはこのサンプリン
グされたデータから帳票に記されていた文字および記号
等のデータを取り除き、黒点の領域位置に対応させなが
ら検出された黒点数をカウントする。メモリ部141cは黒
点カウント部144bの検出位置に対応して得られたカウン
ト結果を格納する。黒点特徴照合部144dは制御部16の制
御により罫線特徴照合部131dとメモリ部131cからそれぞ
れ供給されるデータの照合を行なう。
【0043】ここで、図3の帳票38が画像識別装置10の
画像入力部11に入力されると、画像入力部11を介して変
換された画像データが画像メモリ部12に出力される。画
像メモリ部12は、制御部16の制御により画像データをフ
ォーマット選択部13、14に供給する。
画像入力部11に入力されると、画像入力部11を介して変
換された画像データが画像メモリ部12に出力される。画
像メモリ部12は、制御部16の制御により画像データをフ
ォーマット選択部13、14に供給する。
【0044】フォーマット選択部13の罫線特徴照合部13
1dはメモリ部131cからのデータにマッチングする帳票パ
ターン20,23,26,28,31,32 の照合を行なう。照合の結
果、罫線特徴照合部131dはマッチングした6つの帳票パ
ターン20,23,26,28,31,32 だけをフォーマット選択部14
の黒体特徴照合部144dに供給する。このように入力され
た帳票フォーマットはこの場合も罫線だけで確定できな
いので、フォーマット選択部14でさらに帳票フォーマッ
トの選択処理を行なう。黒点検出部144a、黒点カウント
部144bおよびメモリ部141cは、制御部16の制御によって
罫線特徴検出部131a、罫線分析部131bおよびメモリ部13
1cと同時並行処理される。黒点検出部144aは、図3の帳
票38から特徴となる黒点の検出をサンプリング領域毎に
行なう。黒点カウント部144bは黒点検出部144aで検出さ
れた黒点をカウントすることによって黒点領域38a でカ
ウント値“1050”を得る。これらのデータがメモリ部14
1cに格納される。黒点特徴照合部144dは、メモリ部141c
に格納されているデータと罫線特徴照合部131dから供給
される6つの帳票パターン20,23,26,28,31,32 との照合
を行なう。この照合処理によって黒点特徴照合部144dは
帳票38で黒点検出領域の位置およびカウント値“1050”
がカウントされたことから、図2の1000個以上の黒点を
有する帳票パターン31を帳票フォーマットとして選択す
る。黒点特徴照合部144dは、分類されたフォーマットを
最も確からしいものとして出力端子17を介して出力す
る。
1dはメモリ部131cからのデータにマッチングする帳票パ
ターン20,23,26,28,31,32 の照合を行なう。照合の結
果、罫線特徴照合部131dはマッチングした6つの帳票パ
ターン20,23,26,28,31,32 だけをフォーマット選択部14
の黒体特徴照合部144dに供給する。このように入力され
た帳票フォーマットはこの場合も罫線だけで確定できな
いので、フォーマット選択部14でさらに帳票フォーマッ
トの選択処理を行なう。黒点検出部144a、黒点カウント
部144bおよびメモリ部141cは、制御部16の制御によって
罫線特徴検出部131a、罫線分析部131bおよびメモリ部13
1cと同時並行処理される。黒点検出部144aは、図3の帳
票38から特徴となる黒点の検出をサンプリング領域毎に
行なう。黒点カウント部144bは黒点検出部144aで検出さ
れた黒点をカウントすることによって黒点領域38a でカ
ウント値“1050”を得る。これらのデータがメモリ部14
1cに格納される。黒点特徴照合部144dは、メモリ部141c
に格納されているデータと罫線特徴照合部131dから供給
される6つの帳票パターン20,23,26,28,31,32 との照合
を行なう。この照合処理によって黒点特徴照合部144dは
帳票38で黒点検出領域の位置およびカウント値“1050”
がカウントされたことから、図2の1000個以上の黒点を
有する帳票パターン31を帳票フォーマットとして選択す
る。黒点特徴照合部144dは、分類されたフォーマットを
最も確からしいものとして出力端子17を介して出力す
る。
【0045】これにより、画像識別装置10はフォーマッ
ト分類の誤りを減少させ、帳票の種類を増加させても処
理時間を短縮化でき、装置の識別処理能力を向上させる
ことができる。
ト分類の誤りを減少させ、帳票の種類を増加させても処
理時間を短縮化でき、装置の識別処理能力を向上させる
ことができる。
【0046】最後に第5の具体例として画像識別装置10
には第1の画像の特徴に罫線、第2の画像の特徴に図形
パターンを用いて照合する場合がある。この場合、フォ
ーマット選択部13は罫線特徴検出部131a、罫線分析部13
1b、メモリ部131c、および罫線特徴照合部131dを有し、
フォーマット選択部14は黒点検出部144a、図形パターン
認識部145b、メモリ部141c、および図形パターン特徴照
合部145dを有している。
には第1の画像の特徴に罫線、第2の画像の特徴に図形
パターンを用いて照合する場合がある。この場合、フォ
ーマット選択部13は罫線特徴検出部131a、罫線分析部13
1b、メモリ部131c、および罫線特徴照合部131dを有し、
フォーマット選択部14は黒点検出部144a、図形パターン
認識部145b、メモリ部141c、および図形パターン特徴照
合部145dを有している。
【0047】黒点検出部144aは、第4の具体例で説明し
たようにたとえば予め設定された検出領域を黒点の検出
領域とし、この検出領域毎に画像メモリ部12から供給さ
れる画像データ(の黒点)をサンプリングする。図形パ
ターン認識部145bはこのサンプリングされたデータから
帳票に記されていた文字および記号等のデータを取り除
き、黒点の領域位置に対応させながら検出された黒点を
基に図形パターンの認識処理を行なう。メモリ部141cは
図形パターン認識部145bの検出位置に対応して得られた
パターン認識結果を格納する。図形パターン特徴照合部
145dは制御部16の制御により罫線特徴照合部131dとメモ
リ部131cからそれぞれ供給されるデータの照合を行な
う。
たようにたとえば予め設定された検出領域を黒点の検出
領域とし、この検出領域毎に画像メモリ部12から供給さ
れる画像データ(の黒点)をサンプリングする。図形パ
ターン認識部145bはこのサンプリングされたデータから
帳票に記されていた文字および記号等のデータを取り除
き、黒点の領域位置に対応させながら検出された黒点を
基に図形パターンの認識処理を行なう。メモリ部141cは
図形パターン認識部145bの検出位置に対応して得られた
パターン認識結果を格納する。図形パターン特徴照合部
145dは制御部16の制御により罫線特徴照合部131dとメモ
リ部131cからそれぞれ供給されるデータの照合を行な
う。
【0048】ここで、図3の帳票39が画像識別装置10の
画像入力部11に入力されると、画像入力部11を介して変
換された画像データが画像メモリ部12に出力される。画
像メモリ部12は、制御部16の制御により画像データをフ
ォーマット選択部13、14に供給する。
画像入力部11に入力されると、画像入力部11を介して変
換された画像データが画像メモリ部12に出力される。画
像メモリ部12は、制御部16の制御により画像データをフ
ォーマット選択部13、14に供給する。
【0049】フォーマット選択部13の罫線特徴照合部13
1dはメモリ部131cからのデータにマッチングする帳票パ
ターンの照合を行なう。照合の結果、罫線特徴照合部13
1dはマッチングした4つの帳票パターン22,25,30,34 だ
けをフォーマット選択部14の図形パターン特徴照合部14
5dに供給する。このように入力された帳票フォーマット
はこの場合も罫線だけで確定できないので、フォーマッ
ト選択部14でさらに帳票フォーマットの選択処理を行な
う。黒点検出部144a、図形パターン認識部145bおよびメ
モリ部141cは、制御部16の制御によって罫線特徴検出部
131a、罫線分析部131bおよびメモリ部131cと同時並行処
理される。黒点検出部144aは、図3の帳票39から特徴と
なる黒点の検出を領域毎に行なう。図形パターン認識部
145bでは黒点検出部144aで検出された黒点を基にパター
ン認識することによって黒点領域39a 内にその領域に記
載された図形が得られる。これらのデータがメモリ部14
1cに格納される。図形パターン特徴照合部145dは、メモ
リ部141cに格納されているデータと罫線特徴照合部131d
から供給される4つの帳票パターン22,25,30,34 との照
合を行なう。この照合処理によって帳票39は、黒点領域
の位置および記載内容(パターン図形)の一致から、図
2の帳票パターン34が帳票フォーマットとして選択され
る。図形パターン特徴照合部145dは、分類されたフォー
マットを最も確からしいものとして出力端子17を介して
出力する。
1dはメモリ部131cからのデータにマッチングする帳票パ
ターンの照合を行なう。照合の結果、罫線特徴照合部13
1dはマッチングした4つの帳票パターン22,25,30,34 だ
けをフォーマット選択部14の図形パターン特徴照合部14
5dに供給する。このように入力された帳票フォーマット
はこの場合も罫線だけで確定できないので、フォーマッ
ト選択部14でさらに帳票フォーマットの選択処理を行な
う。黒点検出部144a、図形パターン認識部145bおよびメ
モリ部141cは、制御部16の制御によって罫線特徴検出部
131a、罫線分析部131bおよびメモリ部131cと同時並行処
理される。黒点検出部144aは、図3の帳票39から特徴と
なる黒点の検出を領域毎に行なう。図形パターン認識部
145bでは黒点検出部144aで検出された黒点を基にパター
ン認識することによって黒点領域39a 内にその領域に記
載された図形が得られる。これらのデータがメモリ部14
1cに格納される。図形パターン特徴照合部145dは、メモ
リ部141cに格納されているデータと罫線特徴照合部131d
から供給される4つの帳票パターン22,25,30,34 との照
合を行なう。この照合処理によって帳票39は、黒点領域
の位置および記載内容(パターン図形)の一致から、図
2の帳票パターン34が帳票フォーマットとして選択され
る。図形パターン特徴照合部145dは、分類されたフォー
マットを最も確からしいものとして出力端子17を介して
出力する。
【0050】これにより、画像識別装置10はフォーマッ
ト分類の誤りを減少させ、帳票の種類を増加させても処
理時間を短縮化でき、装置の識別処理能力を向上させる
ことができる。
ト分類の誤りを減少させ、帳票の種類を増加させても処
理時間を短縮化でき、装置の識別処理能力を向上させる
ことができる。
【0051】また、この画像識別装置10の変形例として
たとえば帳票のサイズ/色(すなわち背景色)/地紋の
識別を行なう構成を簡単に説明する。この画像識別装置
10には画像入力部11に色を含めて検出可能なカラーイメ
ージスキャナを用いる。特に、色/地紋の識別にはフォ
ーマット選択部13、14で行なう色検出を画像入力部11で
行なう。フォーマット選択部13、14のいずれか一方に設
けた色認識部は、画像メモリ部12が出力する画像データ
から罫線・文字を抽出処理し、画像データから抽出した
罫線・文字の除去されたデータを基にこのデータ内で最
も広く分布する色を帳票の色とする認識処理を行なう。
また、フォーマット選択部13、14のいずれか他方に設け
た地紋認識部は、たとえば単位面積あたりに分布する黒
点量を設定したある閾値で判定して地紋の有無の認識処
理を行なう。さらに、地紋認識部からの出力を基にパタ
ーン認識も行なって、フォーマット記憶部15に格納され
たパターンと照合させることにより、確度の高いフォー
マットの特定を可能にし、かつ特定可能なシートの種類
を増加させることが可能になる。
たとえば帳票のサイズ/色(すなわち背景色)/地紋の
識別を行なう構成を簡単に説明する。この画像識別装置
10には画像入力部11に色を含めて検出可能なカラーイメ
ージスキャナを用いる。特に、色/地紋の識別にはフォ
ーマット選択部13、14で行なう色検出を画像入力部11で
行なう。フォーマット選択部13、14のいずれか一方に設
けた色認識部は、画像メモリ部12が出力する画像データ
から罫線・文字を抽出処理し、画像データから抽出した
罫線・文字の除去されたデータを基にこのデータ内で最
も広く分布する色を帳票の色とする認識処理を行なう。
また、フォーマット選択部13、14のいずれか他方に設け
た地紋認識部は、たとえば単位面積あたりに分布する黒
点量を設定したある閾値で判定して地紋の有無の認識処
理を行なう。さらに、地紋認識部からの出力を基にパタ
ーン認識も行なって、フォーマット記憶部15に格納され
たパターンと照合させることにより、確度の高いフォー
マットの特定を可能にし、かつ特定可能なシートの種類
を増加させることが可能になる。
【0052】帳票のサイズを分類する場合、画像入力部
11は、たとえば黒領域(帳票のない領域)と白領域(帳
票)の境界を検出する。得られたデータを基にフォーマ
ット選択部13、14のいずれか一方では帳票サイズの算出
処理を行なう。この帳票サイズもフォーマットを照合す
るための一要素として用いることもできる。
11は、たとえば黒領域(帳票のない領域)と白領域(帳
票)の境界を検出する。得られたデータを基にフォーマ
ット選択部13、14のいずれか一方では帳票サイズの算出
処理を行なう。この帳票サイズもフォーマットを照合す
るための一要素として用いることもできる。
【0053】この変形例によれば、帳票に限定されず、
帳票以外でファイル管理が要求される書類を簡単に分類
してファイリングさせることが可能になる。
帳票以外でファイル管理が要求される書類を簡単に分類
してファイリングさせることが可能になる。
【0054】なお、本実施例の具体例では、一方の画像
の特徴として罫線を用いさらに罫線以外のもう一つの画
像の特徴で帳票を識別し分類してきたが、罫線以外の画
像の特徴を複数組合せても帳票フォーマットを特定させ
ることができる。また、本実施例では、画像の特徴の照
合をカスケード的に行なってきたが、前述した実施例に
限定されるものでなく、各画像の特徴の検出および認識
処理を並列に行なわせ、得られたこれらの認識結果に最
も合致するフォーマットの候補をフォーマット記憶部15
から選択するような構成にしてもよい。本発明は、本発
明の概念を用いた装置、たとえばファクシミリ装置(FA
X )にも適用できることは言うまでもなく、データ受信
の結果(フォーマット、文字データおよび数値データ)
をそのまま外部記憶装置に保存させることができる。
の特徴として罫線を用いさらに罫線以外のもう一つの画
像の特徴で帳票を識別し分類してきたが、罫線以外の画
像の特徴を複数組合せても帳票フォーマットを特定させ
ることができる。また、本実施例では、画像の特徴の照
合をカスケード的に行なってきたが、前述した実施例に
限定されるものでなく、各画像の特徴の検出および認識
処理を並列に行なわせ、得られたこれらの認識結果に最
も合致するフォーマットの候補をフォーマット記憶部15
から選択するような構成にしてもよい。本発明は、本発
明の概念を用いた装置、たとえばファクシミリ装置(FA
X )にも適用できることは言うまでもなく、データ受信
の結果(フォーマット、文字データおよび数値データ)
をそのまま外部記憶装置に保存させることができる。
【0055】このように構成にすることにより、画像識
別装置10は、入力画像が有するフォーマットの識別能力
および識別の所要時間短縮を従来の能力よりも向上させ
ることができるので、たとえば大量の書類等の事務処理
に要する人件費を大幅に節約させることができる。
別装置10は、入力画像が有するフォーマットの識別能力
および識別の所要時間短縮を従来の能力よりも向上させ
ることができるので、たとえば大量の書類等の事務処理
に要する人件費を大幅に節約させることができる。
【0056】
【発明の効果】このように本発明の画像識別装置よれ
ば、制御手段により画像情報記憶手段、第1および第2
のフォーマット選択手段、およびフォーマット記憶手段
の動作をそれぞれ制御し、画像入力手段から供給される
画像情報を画像情報記憶手段に一時的に記憶させ、フォ
ーマット記憶手段から供給されるフォーマットの候補と
第1のフォーマット選択手段および第2のフォーマット
選択手段での検出結果とを照合させ、入力画像が有する
フォーマットの識別能力および識別の所要時間短縮を従
来の能力よりも向上させて、画像の特徴の似たシートが
入力されても該当するフォーマットの候補を的確に選択
することができることにより、たとえば大量の書類等の
事務処理に要する人件費を大幅に節約させることができ
る。
ば、制御手段により画像情報記憶手段、第1および第2
のフォーマット選択手段、およびフォーマット記憶手段
の動作をそれぞれ制御し、画像入力手段から供給される
画像情報を画像情報記憶手段に一時的に記憶させ、フォ
ーマット記憶手段から供給されるフォーマットの候補と
第1のフォーマット選択手段および第2のフォーマット
選択手段での検出結果とを照合させ、入力画像が有する
フォーマットの識別能力および識別の所要時間短縮を従
来の能力よりも向上させて、画像の特徴の似たシートが
入力されても該当するフォーマットの候補を的確に選択
することができることにより、たとえば大量の書類等の
事務処理に要する人件費を大幅に節約させることができ
る。
【図1】本発明に係る画像識別装置の一実施例の構成を
示すブロック図である。
示すブロック図である。
【図2】図1に示したファイル記憶部に登録されている
フォーマットの候補の例を表す説明図である。
フォーマットの候補の例を表す説明図である。
【図3】図1に示した画像識別装置の画像入力部が読み
取る帳票の例を表す説明図である。
取る帳票の例を表す説明図である。
【図4】図1に示した画像識別装置の第1の具体例を示
すブロック図である。
すブロック図である。
【図5】同画像識別装置の第2の具体例を示すブロック
図である。
図である。
【図6】同画像識別装置の第3の具体例を示すブロック
図である。
図である。
【図7】同画像識別装置の第4の具体例を示すブロック
図である。
図である。
【図8】同画像識別装置の第5の具体例を示すブロック
図である。
図である。
10 画像識別装置 11 画像入力部 12 画像メモリ部 13,14 フォーマット選択部 15 フォーマット記憶部 16 制御部
Claims (3)
- 【請求項1】 濃淡で表された画像情報を画像入力手段
を介して読み込み、該画像情報に含まれる画像の特徴を
検出し、得られた画像の特徴に対応するフォーマットを
識別する画像識別装置において、該装置は、 該画像入力手段から供給される画像情報を一時的に記憶
する画像情報記憶手段と、 該画像情報から検出される第1の画像の特徴を含むフォ
ーマットの候補を選択する第1のフォーマット選択手段
と、 該第1のフォーマット選択手段から供給されるフォーマ
ットの候補と該画像情報に含まれる第2の画像の特徴に
関する検出結果とを照合してフォーマットを選択する第
2のフォーマット選択手段と、 該第1のフォーマット選択手段に供給される複数のフォ
ーマットの候補を記憶するフォーマット記憶手段と、 該画像情報記憶手段、該第1および該第2のフォーマッ
ト選択手段、および該フォーマット記憶手段の動作を制
御する制御手段とを有することを特徴とする画像識別装
置。 - 【請求項2】 請求項1に記載の画像識別装置におい
て、前記第1の画像の特徴には、罫線、文字認識、字
体、字種、画像のサイズ、画像の背景色、地紋、図形パ
ターンのうちの少なくとも一項目を選び、 前記第2の画像の特徴には、該第1の画像の特徴で選ん
だ項目と異なる、少なくとも一項目あるいは複数の組み
合わせた項目を選ぶことを特徴とする画像識別装置。 - 【請求項3】 請求項1または2に記載の画像識別装置
において、前記第1の画像の特徴として画像のサイズ、
画像の背景色、および/または地紋が選択された際に
は、前記画像入力手段を記録媒体の色および色の分布を
検出する色検出手段として用いることを特徴とする画像
識別装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9177463A JPH1125214A (ja) | 1997-07-02 | 1997-07-02 | 画像識別装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9177463A JPH1125214A (ja) | 1997-07-02 | 1997-07-02 | 画像識別装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH1125214A true JPH1125214A (ja) | 1999-01-29 |
Family
ID=16031380
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9177463A Withdrawn JPH1125214A (ja) | 1997-07-02 | 1997-07-02 | 画像識別装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH1125214A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7508986B2 (en) | 2003-11-28 | 2009-03-24 | Canon Kabushiki Kaisha | Document recognition device, document recognition method and program, and storage medium |
| JP2017090974A (ja) * | 2015-11-02 | 2017-05-25 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
-
1997
- 1997-07-02 JP JP9177463A patent/JPH1125214A/ja not_active Withdrawn
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7508986B2 (en) | 2003-11-28 | 2009-03-24 | Canon Kabushiki Kaisha | Document recognition device, document recognition method and program, and storage medium |
| JP2017090974A (ja) * | 2015-11-02 | 2017-05-25 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7295694B2 (en) | MICR-based optical character recognition system and method | |
| JP2575539B2 (ja) | 書類上の金額フィールドの位置特定方法および識別方法 | |
| EP0472313B1 (en) | Image processing method and apparatus therefor | |
| JPH03504423A (ja) | 光学式文字認識のための書類認識及び自動索引付与 | |
| AU658839B2 (en) | Character recognition methods and apparatus for locating and extracting predetermined data from a document | |
| US20010043742A1 (en) | Communication document detector | |
| EP1202213B1 (en) | Document format identification apparatus and method | |
| JP2003305927A (ja) | プリンタ検査装置 | |
| JP2003087562A (ja) | 画像処理装置および画像処理方法 | |
| US20130272610A1 (en) | Image Processing Apparatus that Groups Objects Within Image | |
| JP3435374B2 (ja) | 文字読取装置および文字認識方法 | |
| JPH1125214A (ja) | 画像識別装置 | |
| JP4356908B2 (ja) | 財務諸表自動入力装置 | |
| JP3648050B2 (ja) | 帳票画像分類方法、帳票画像登録方法および帳票画像分類装置 | |
| US6049637A (en) | System and method for automated data capture of sequential form numbers at a collator/press assembly machine using an optical reader which does not capture an image of the form number | |
| CN1452098A (zh) | 文档分类系统及其实现程序 | |
| JPH07152856A (ja) | 光学的文字読取装置 | |
| JP2006252575A (ja) | 財務諸表自動入力装置及び財務諸表自動入力方法 | |
| JP2003316802A (ja) | イメージ管理システム、イメージ管理方法及びイメージ管理プログラム | |
| JP3412441B2 (ja) | 画像処理装置 | |
| JPS5949671A (ja) | 光学的文字読取装置 | |
| JPH0737034A (ja) | 光学式文字読み取り装置 | |
| JPH06111057A (ja) | 光学的文字読取装置 | |
| JPH07334610A (ja) | 光学的文字読取装置 | |
| JP3160458B2 (ja) | 文字読取装置及び文字読取方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20040907 |