JPH11224307A - 文書認識装置及びその方法 - Google Patents

文書認識装置及びその方法

Info

Publication number
JPH11224307A
JPH11224307A JP10024886A JP2488698A JPH11224307A JP H11224307 A JPH11224307 A JP H11224307A JP 10024886 A JP10024886 A JP 10024886A JP 2488698 A JP2488698 A JP 2488698A JP H11224307 A JPH11224307 A JP H11224307A
Authority
JP
Japan
Prior art keywords
character recognition
area
document
item
color information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10024886A
Other languages
English (en)
Inventor
Kazuyuki Saito
和之 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP10024886A priority Critical patent/JPH11224307A/ja
Publication of JPH11224307A publication Critical patent/JPH11224307A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】画像読取時の位置ずれやフォーマットの変形等
に左右されずに、正確に文書フォーマットを認識するこ
とを可能とする。 【解決手段】領域識別処理(S202)は、S201で
入力した画像を色情報に基づいて複数の領域に分割す
る。項目一致度測定処理(S203)及びフォーマット
判別処理(S204)により、複数の項目変換テーブル
の色情報の組み合わせと、上記領域識別処理によって得
られた各領域の色情報の組み合わせとに基づいて当該画
像の文書フォーマットが判別される。項目情報変換処理
(S205)は、判別された文書フォーマットと領域識
別処理によって得られた各領域の色情報に基づいて各領
域に項目を設定し、文字認識処理(S206)は、設定
された項目に従って文字認識処理を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文字認識装置に関
し、特に帳票等の所定のフォーマットを有する文書に対
して文字認識をおこなう文字認識装置及びその方法に関
するものである。
【0002】
【従来の技術】従来の文字認識装置において、帳票等の
罫線に囲まれた画像を読み取って文字認識を行うものが
ある。この種の装置においては、読取対象の文書のもつ
フォーマットを1つのフォーマットに限定し、当該文書
の特定の場所(即ち、特定の項目)のみを認識させるよ
うにすることが行われている。
【0003】また、文字領域の座標の異なるフォーマッ
トに対応させるために、罫線を抽出し、罫線に囲まれた
場所を認識させるようにするものも提案されている。
【0004】
【発明が解決しようとする課題】しかしながら、上述の
ように文書の特定の場所について文字認識を行う技術で
は、複数種類のフォーマットに対応出来なかったり、ス
キャナ等でイメージを読み取る際に読取対象の項目の位
置が、所定の位置以外にずれないようにする等の手間が
必要となる。
【0005】また、罫線を抽出して文字認識位置を特定
する技術では、複雑な表等の罫線を有する文書を処理す
る場合において、そのフォーマットが予めわかっていて
も、傾斜、かすれ、位置のずれ、大きさの違い等の要因
があると罫線の抽出ができなくなったり、テキスト等を
誤って罫線としてしまうこと等があり、正確な文字認識
が困難となるといった問題があった。
【0006】本発明は上記の問題に鑑みてなされたもの
であり、文書フォーマットの相違に柔軟に対応できる文
字認識装置及びその方法を提供することを目的とする。
【0007】また、本発明は、画像読取時の位置ずれや
フォーマットの変形等に左右されずに、正確に文書フォ
ーマットを認識することが可能な文書認識装置及びその
方法を提供することを目的とする。
【0008】
【課題を解決するための手段】上記の目的を達成するた
めの本発明の一態様による文字認識装置は、例えば次の
ような構成を備える。すなわち、画像を色情報に基づい
て複数の領域に分割する領域分割手段と、前記領域分割
手段によって得られた各領域の色情報の組み合わせに基
づいて当該画像の文書フォーマットを判別する判別手段
と、前記判別手段で判別された文書フォーマットと、前
記領域分割手段によって得られた各領域の色情報に基づ
いて各領域にデータ属性を設定する設定手段と、前記設
定手段によって設定されたデータ属性に従って文字認識
処理をおこなう文字認識手段とを備える。
【0009】また、上記の目的を達成するための本発明
の他の態様である文字認識方法は、例えば次のような工
程を備える。すなわち、画像を色情報に基づいて複数の
領域に分割する領域分割工程と、前記領域分割工程によ
って得られた各領域の色情報の組み合わせに基づいて当
該画像の文書フォーマットを判別する判別工程と、前記
判別工程で判別された文書フォーマットと、前記領域分
割工程によって得られた各領域の色情報に基づいて各領
域にデータ属性を設定する設定工程と、前記設定工程に
よって設定されたデータ属性に従って文字認識処理をお
こなう文字認識工程とを備える。
【0010】
【発明の実施の形態】以下、添付の図面を参照して本発
明の好適な一実施形態を説明する。
【0011】[第1の実施形態]図1は本実施形態の文
字認識装置の構成を表すブロック図である。図1におい
て、101は画像原稿に光を照射し、その反射光を読み
取り電気信号に変換するスキャナ、102はスキャナ1
01で得られた電気信号を2値のデジタル電気信号に変
換し他の装置構成要素に伝送するためのスキャナインタ
フェース回路である。103はディスプレイのウィンド
ウ上で所望とする座標を入力するためのポインティング
デバイス(本例ではマウス)、104はポインティング
デバイス103からの信号を受け、それを他の装置構成
要素に伝送するためのインターフェース回路である。1
05は装置全体の制御及び項目識別処理等を実行するた
めのCPU、106はCPU105が実行する制御プロ
グラム、各種処理プログラムやフォントデータなどを格
納しているROM、107はCPU105による文書画
像の展開処理や項目識別処理のための作業領域などとし
て用いられるRAMである。
【0012】また、108は入力イメージ等を表示する
ためのディスプレイ、109はディスプレイインターフ
ェース回路である。ディスプレイ108には、RAM1
07の所定アドレスエリアであるVRAM領域に格納さ
れているイメージが表示される。110は、登録された
データが格納されるハードディスク等の外部記憶装置
で、111はそのインタフェースである。なお、外部記
憶装置110には項目変換データベース110aが格納
される。項目変換データベース110aについては後述
する。そして112は各装置構成要素を接続するバスで
ある。なお、CPU105が実行する制御プログラムを
外部記憶装置110に格納しておき、必要に応じてRA
M107にロードし、これをCPU105が実行するよ
うに構成してもよい。
【0013】次に第1の実施形態における処理の流れに
ついて図2のフローチャート、図3、図4、図5、図6
及び図7を参照して以下に説明する。図2は第1の実施
形態による文字認識装置の動作手順を説明するフローチ
ャートである。図3は、第1の実施形態のブロック領域
データの構造例を示す図である。また、図4は、第1の
実施形態の項目変換データベース110aにおける住所
録用項目変換テーブル例を示す図である。図5は、第1
の実施形態の項目変換データベース110aにおける運
送伝票用項目変換テーブル例を示す図である。図6は、
本実施形態の文字認識装置で読取を行う住所録文書の例
を示す図である。また、図7は、本実施形態の文字認識
装置で読取を行う運送伝票文書の例を示す図である。
【0014】まず、ステップS201で認識しようとす
る文書(図6)をスキャナで読み込み、nビットのカラ
ー画像データに変換する。得られた入力画像データに対
してステップS202で領域識別処理を行う。領域識別
処理では、読み取った画像のバックグラウンドのカラー
毎にブロック領域を抽出し、その色情報並びにレイアウ
ト情報を、図3のようなブロックデータとして記憶す
る。
【0015】第1の実施形態では、図3に示す例のよう
に、色情報として「色」、レイアウト情報として「座
標」「属性」「組方向」がブロックデータとして、領域
識別処理によって記憶される。
【0016】次に項目一致度測定処理(ステップS20
3)、フォーマット判別処理(ステップS204)、項
目情報変換処理(ステップS205)によって各ブロッ
ク領域の色情報を項目変換データベースに従って項目情
報に変換する。本実施形態の場合、項目変換データベー
スには、あらかじめ項目情報として2種類のテーブルが
用意してある。1つは「住所録」用の項目変換テーブル
(図4)、もう一つは「運送伝票」用の項目変換テーブ
ル(図5)である。
【0017】例えば、認識しようとする文書が図6の文
書であった場合、ブロック602では、色情報がカラー
Dである。よって、住所録用項目変換テーブル(図4)
を用いた場合、ブロック602の項目は「住所」とな
る。同様に、運送伝票用項目変換テーブル(図5)を用
いた場合は、ブロック602の項目は「依頼主住所」と
なる。
【0018】さて、本実施形態では、読み取った文書に
応じて、複数種類の(本例では2つ)項目変換テーブル
から最適なテーブルを自動的に選択するために、項目情
報変換処理(ステップS205)を行うに先立って、項
目種別一致度測定処理(ステップS203)、およびフ
ォーマット判別処理(ステップS204)を実行する。
項目種別一致度測定処理では、読み取った画像データに
含まれるバックグランドのカラーと複数種類のテーブル
の各々に登録されているカラーとの一致度(項目種別一
致度)を求め、フォーマット判別処理ではもっとも良く
一致するテーブルを選択し、当該文書のフォーマットを
判別する。
【0019】項目種別一致度測定処理について、図4〜
図6を参照してより具体的に説明する。図6に示される
文書に関して、領域識別処理により得られた各領域の色
情報と住所録用項目変換テーブル(図4)を比較して、
変換テーブル中に項目の設定された色へのヒットの率を
算出し、これを住所録用項目変換テーブルに対する項目
種別一致度とする。ただし未設定の項目に関して、文書
中の各領域の色情報がヒットしていなければ、これらの
項目も「一致した」ものとする。同様にして、領域識別
処理により得られた各領域の色情報と運送伝票用項目変
換テーブル(図5)とから、運送伝票用項目変換テーブ
ルに対する項目種別一致度も算出する。
【0020】本実施形態の場合、図6の文書フォーマッ
トを読み取ると、カラーA、B、C、D、E、F、Gが
使用されており、カラーH、I、Jは使用されていない
ので、住所録用項目変換テーブル(図4)に対する項目
種別一致度は100%と出力される。また、運送伝票用
項目変換テーブル(図5)に関しては、カラーCは項目
が未設定にも関わらずブロック606に存在し、カラー
H、I、Jは項目が設定されているにも関わらずブロッ
クに存在しない。即ち、10項目中4項目(カラーC、
H、I、J)において不一致となっており、項目種別一
致度は60%と出力される。
【0021】なお、本実施形態では項目変換データベー
スのカラーが重複している例を示しているが、重複がな
い場合はさらに簡便に項目種別一致度を測定出来る事は
言うまでもない。例えば、ある第1のフォーマットはカ
ラーA〜Eを用い、別の第2のフォーマットがカラーF
〜Jを用いるのであれば、読み取った文書がカラーA〜
Eの何れかを含むか否かで第1のフォーマットか第2の
フォーマットかを判別することができる。
【0022】次にフォーマット判別処理(ステップS2
04)において、上記一致度を比較することによって、
入力文書のフォーマットを判別する。上記例の場合、項
目種別一致度測定によって、住所録用項目変換テーブル
(図4)に対する項目種別一致度(100%)のほうが
運送伝票用項目変換テーブル(図5)に対する項目種別
一致度(60%)よりも大きいので、入力文書のフォー
マットは「住所録」であると判別される。この結果、住
所録用項目変換テーブルが採用されて、ブロックデータ
に最終的な項目番号のデータがセットされる。
【0023】ちなみに、図7の文書フォーマットでは、
カラーA、B、D、E、F、G、I、Jが使用されてお
り、カラーCが使用されていないので、運送伝票用項目
変換テーブル(図5)に100%一致する。一方、住所
録用項目変換テーブル(図4)に対しては、カラーC、
H、I、Jにおいて不一致となり、項目種別一致度は6
0%となる。従って、図7の文書の場合、入力文書のフ
ォーマットは運送伝票であると判定される。
【0024】以上のようにして文書フォーマットが決定
されると、ステップS205において、決定された文書
フォーマットに対応する変換テーブル(図6の文書では
住所録用項目変換テーブル)を用いて、各ブロック領域
の項目を設定する。最後に、文字認識処理(ステップS
206)は、ブロックデータの認識順序の順番に、各ブ
ロック領域内の文字を認識する。なお、本実施形態では
項目番号をブロックデータの認識順序として用いること
で認識順序の設定も同時に実行している。すなわち、項
目番号の順番で各ブロックデータ内の文字が認識され
る。
【0025】以上説明したように、第1の実施形態によ
れば、文書のバックグランドカラーに基づいて、文書フ
ォーマットを自動的に判別することができる。
【0026】なお、フォーマットの形状が異なる文書に
おいても項目情報が同じであれば、同じ種類のフォーマ
ットとして文字認識処理が可能である。例えば、図6と
図8の文書は、同じ「住所録」というフォーマットの種
類であるにも関わらず、形状が異なるため、従来は異な
るフォーマットとして判別され、別のフォーマットとし
て扱う必要があった。
【0027】しかしながら、上記実施形態によれば、と
もに項目種別一致度が住所録用項目変換テーブル(図
4)において最大となるので、「住所録」という同一の
文書フォーマットであると判別される。
【0028】従って、例えば、図6のブロック603と
図8のブロック703は、レイアウト情報の座標は異な
るが共に色情報がカラーBであるので、項目変換データ
ベース(図4)により項目「氏名」に変換され、項目種
別一致度の計算の際には同一の項目と判断されることに
なる。
【0029】以上の様に境目種別一致度を測定すること
により、各項目の大きさや配置状態が異なっていても、
同じ種類の文書フォーマットとして文字認識を行うこと
が可能である。
【0030】[第2の実施形態]フォーマット判別処理
において、項目種別一致度とともに項目の形状、位置等
を判別基準として用いることで、入力文書のフォーマッ
トの種別を判別するとともに文書画像の入力時の文書方
向の正誤を判別することも可能である。第2の実施形態
では、第1の実施形態の機能に加えて、入力文書の方向
を判別する機能を有する文字認識装置を説明する。
【0031】例えば、図6と図9の文書は、同一のフォ
ーマットであるが図9の方は入力時に180度回転され
た状態になった例である。このとき、図6及び図9の項
目種別一致度はともに「住所録」用の項目変換データベ
ース(図4)において最大となるので、「住所録」とい
う同一のフォーマットの種類であると判別される。
【0032】しかしながら、あらかじめ文書方向の判別
基準として、「項目「住所」は横長であり、フォーマッ
ト全体の中心より上にある」という判別基準を設定して
おくことにより、図9の方は入力時に180度回転され
た状態であると判別することが可能である。すなわち、
カラーA〜Gのバックグランドカラーを有する領域の中
心を求め、カラーDの領域が当該中心より上にあるか下
にあるかによって、当該文書の上下方向を判別すること
ができる。
【0033】[第3の実施形態]第2の実施形態におい
て、文書方向の判定を行う構成を説明したが、入力文書
のフォーマットの種別を判別するとともに文書画像の入
力時の文書方向の誤りを判別した際に、誤り方向別にオ
ペレータに報知することも可能である。図10は第3の
実施形態による文書認識装置の動作手順を説明するフロ
ーチャートである。なお、ステップS1001〜ステッ
プS1004の処理は、第1の実施形態(図2)のステ
ップS201〜S204と同じである。
【0034】文書方向判定処理(ステップS1005)
では、フォーマット判別処理で判別された文書フォーマ
ットについて予め定められている方向判別基準に基づい
て、当該画像の方向を判定する。そして、文書方向が正
規の方向でない場合は、ステップS1006からステッ
プS1007へ進み、文書方向が誤っている旨をユーザ
に報知する。以下、ステップS1008及びS109の
処理は、図2のステップS205及びS206と同じで
あるので説明を省略する。
【0035】例えば、第2の実施形態と同様に、住所録
の文書フォーマットに関して、あらかじめ判別基準とし
て「項目「住所」は横長であり、中心より上にある」を
設定しておく。図9の文書はステップS1004までの
処理によって「住所録」に該当するフォーマットと判定
される。そして、文書方向判定処理(ステップS100
5)において、住所録の文書フォーマットに予め設定さ
れている上記判別基準と比較されることにより、入力時
に180度回転された状態になったか否かが判定され
る。180度回転された状態であると判別された場合
は、ステップS1006からステップS1007へ進
み、オペレータに誤りであることを表示する。なお、ス
テップS1005において文書方向に誤りが無ければ、
ステップS1006からステップS1008へ進む。
【0036】ステップS1007における表示の一例と
して、もし誤りがあった場合は、誤りに応じて文書の各
項目以外の場所(図9の例では領域908)の色を変化
させて表示することがあげられる。例えば、領域908
の表示色を、時計まわりに90度回転された誤りならば
カラーX、180度回転された誤りならばカラーY、2
70度回転された誤りならばカラーZとするならば、図
9に示した誤りの場合は、領域908の場所をカラーY
で表示し、オペレータに報知することが可能となる。
【0037】なお、90度及び270度回転を判定する
には次にようにすればよい。すなわち、例えばカラーD
を有する領域(項目、「住所」)が縦長になっている場
合に当該文書画像が90度もしくは270度回転してい
ると判定し、更にそのカラーDを有する領域の中心位置
が当該フォーマットの中心位置より右側にある場合に9
0度、左側にある場合に270度の回転であると判定す
る。
【0038】[第4の実施形態]入力文書のフォーマッ
トの種別を判別するとともに文書画像の入力時の文書方
向の誤りを判別した際に、文書画像を正しい方向に回転
させることも可能である。図11は第4の実施形態によ
る文書認識装置の動作手順を説明するフローチャートで
ある。なお、ステップS1101〜ステップS1104
の処理は、第1の実施形態(図2)のステップS201
〜S204と同じである。
【0039】文書方向判定処理(ステップS1105)
では、フォーマット判別処理で判別された文書フォーマ
ットについて予め定められている方向判別基準に基づい
て、当該画像の方向を判定する。そして、文書方向が正
規の方向でない場合は、回転が必要であるとしてステッ
プS1106からステップS1107へ進み、文書画像
回転処理を実行する。ステップS1105で文書方向が
正規の方向であればステップS1106からステップS
1108へ直接進む。以下、ステップS1108及びS
1109の処理は、図2のステップS205及びS20
6と同じであるので説明を省略する。
【0040】例えば、ステップS1101〜S1104
の処理によって、図9に示した文書は「住所録」に該当
するフォーマットであると判定される。文書方向判定処
理(ステップS1105)では、判定された文書フォー
マット、すなわち住所録の文書フォーマットに対してあ
らかじめ設定されている、「項目「住所」は横長であ
り、中心より上にある」という判別基準と比較し、文書
方向を判定する。この結果、図9に示した文書は、入力
時に180度回転された状態になったと判別され、この
判別結果に従って文書画像を180度回転し(ステップ
S1106、S1107)正しい文書方向にした後で、
項目情報変換処理及び文字認識処理を行う(ステップS
1108、S1109)。なお、第3の実施形態で説明
したように90度、270度回転していることを検出し
て、これに応じて文書方向を回転するように構成するこ
とも可能である。
【0041】[第5の実施形態]第5の実施形態では、
文書方向が誤っていると判定された場合、文書フォーマ
ットの全体を回転している。第5の実施形態では、文書
方向が誤っていると判定された場合、文書フォーマット
中の項目画像毎に回転を行って、各項目画像を正しい方
向に向けさせる。図12は第5の実施形態による文書認
識装置の動作手順を説明するフローチャートである。な
お、ステップS1201〜ステップS1204の処理
は、第1の実施形態(図2)のステップS201〜S2
04と同じである。
【0042】文書方向判定処理(ステップS1205)
では、フォーマット判別処理で判別された文書フォーマ
ットについて予め定められている方向判別基準に基づい
て、当該画像の方向を判定する。そして、文書方向が正
規の方向でない場合は、回転が必要であるとしてステッ
プS1206からステップS1207へ進み、項目画像
回転処理を実行する。項目画像回転処理では、各項目、
すなわち各領域を単位として画像の回転が行われる。一
方、ステップS1205で文書方向が正規の方向であれ
ばステップS1206からステップS1208へ直接進
む。以下、ステップS1208及びS1209の処理
は、図2のステップS205及びS206と同じである
ので説明を省略する。
【0043】例えば、ステップS1201〜S1204
の処理によって、図9に示した文書は「住所録」に該当
するフォーマットであると判定されるが、第2の実施形
態と同様に、予め設定された、「項目「住所」は横長で
あり、中心より上にある」という判別基準により、入力
時に180度回転された状態になったと判別され、項目
画像単位の回転処理が行われる(ステップS1205〜
S1207)。そして、ステップS1208、S120
9で、項目情報変換処理、文字認識処理が行われる。9
0度、270度の回転に対応させることももちろん可能
である。
【0044】ステップS1207では項目画像単位の回
転処理が行われるので、文字認識対象となる項目画像の
みを回転させることができる。例えば、文字認識後の結
果として文字データのみが必要であり、レイアウト情報
が不要であるならば、文字データの存在する項目画像に
ついてのみ回転処理を実行するようにできる。このた
め、回転処理の負荷を軽減できる。そして、ステップS
1209で回転後の画像について文字認識処理を行なう
ことにより、正しい文字認識結果を得ることが可能とな
る。
【0045】以上説明した様に、上記各実施形態によれ
ば、色情報を項目情報に変換してフォーマット判別を行
うよう構成したので、 帳票等の文書の文字認識処理が正確になる、 文字領域の座標の異なりや罫線等の形状の異なりのあ
るフォーマットの文書の文字認識処理が可能になる、 スキャナ等でイメージを読み取る際の項目のずれに対
して正確に文書フォーマットを判別できる、 文書画像の入力時の文書方向の誤りの訂正が可能にな
る、 文書の読取時において文書の方向等を気にしなくて済
むので、操作性が向上する、 処理全体の時間の短縮等がはかれるといった効果が得
られる。
【0046】なお、本発明は、複数の機器(例えばホス
トコンピュータ,インタフェイス機器,リーダ,プリン
タなど)から構成されるシステムに適用しても、一つの
機器からなる装置(例えば、複写機,ファクシミリ装置
など)に適用してもよい。
【0047】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0048】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0049】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
【0050】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0051】さらに、記憶媒体から読出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0052】
【発明の効果】以上説明したように、本発明によれば、
画像読取時の位置ずれやフォーマットの変形等に左右さ
れずに、正確に文書フォーマットを認識することが可能
となり、操作性が向上する。
【0053】
【図面の簡単な説明】
【図1】本実施形態の文字認識装置の構成を表すブロッ
ク図である。
【図2】第1の実施形態による文字認識装置の動作手順
を説明するフローチャートである。
【図3】第1の実施形態のブロック領域データの構造例
を示す図である。
【図4】第1の実施形態の項目変換データベースにおけ
る住所録用項目変換テーブル例を示す図である。
【図5】第1の実施形態の項目変換データベースにおけ
る運送伝票用項目変換テーブル例を示す図である。
【図6】本実施形態の文字認識装置で読取を行う住所録
文書の例を示す図である。
【図7】本実施形態の文字認識装置で読取を行う運送伝
票文書の例を示す図である。
【図8】図6と同じ文書フォーマットに属し、図6とは
形状が異なるフォーマット例を示す図である。
【図9】図6の文書が入力時に180度回転された状態
を示す図である。
【図10】第3の実施形態による文書認識装置の動作手
順を説明するフローチャートである。
【図11】第4の実施形態による文書認識装置の動作手
順を説明するフローチャートである。
【図12】第5の実施形態による文書認識装置の動作手
順を説明するフローチャートである。

Claims (23)

    【特許請求の範囲】
  1. 【請求項1】 画像を色情報に基づいて複数の領域に分
    割する領域分割手段と、 前記領域分割手段によって得られた各領域の色情報の組
    み合わせに基づいて当該画像の文書フォーマットを判別
    する判別手段と、 前記判別手段で判別された文書フォーマットと、前記領
    域分割手段によって得られた各領域の色情報に基づいて
    各領域にデータ属性を設定する設定手段と、 前記設定手段によって設定されたデータ属性に従って文
    字認識処理をおこなう文字認識手段とを備えることを特
    徴とする文字認識装置。
  2. 【請求項2】 前記データ属性は処理順序を含み、 前記文字認識手段は、前記データ属性で示される処理順
    序に従って各領域に対する文字認識処理を実行すること
    を特徴とする請求項1に記載の文字認識装置。
  3. 【請求項3】 前記データ属性は各領域のデータ項目を
    表すことを特徴とする請求項1に記載の文字認識装置。
  4. 【請求項4】 複数種類の文書フォーマット毎に色情報
    とデータ属性とを対応させた複数種類の変換テーブルを
    有し、 前記判別手段は、前記領域分割手段によって得られた各
    領域の色情報の組み合わせと、前記複数種類の変換テー
    ブルのそれぞれに登録された色情報の組み合わせとの一
    致度を求め、該一致度が最も高い変換テーブルの対応す
    る文書フォーマットをもって判別結果とすることを特徴
    とする請求項1に記載の文字認識装置。
  5. 【請求項5】 前記設定手段は、前記判別手段で判別さ
    れた文書フォーマットに対応する変換テーブルを参照し
    て、前記領域分割手段によって得られた各領域の色情報
    に基づいて各領域にデータ属性を設定することを特徴と
    する請求項4に記載の文字認識装置。
  6. 【請求項6】 前記判別手段によって判別された文書フ
    ォーマットと、前記領域分割手段によって得られた領域
    の位置とに基づいて、入力文書の方向を判定する判定手
    段を更に備えることを特徴とする請求項1に記載の文字
    認識装置。
  7. 【請求項7】 前記判別手段により判別された入力文書
    の方向が正規の方向でない場合、その旨ををオペレータ
    に報知する報知手段を更に備えることを特徴とする請求
    項6に記載の文字認識装置。
  8. 【請求項8】 前記報知手段は、前記判別手段により判
    別された入力文書の方向が正規の方向でない場合、該判
    別された方向がどの誤り方向に分類に属するかをオペレ
    ータに知らせることを特徴とする請求項7に記載の文字
    認識装置。
  9. 【請求項9】 前記判定手段によって画像の入力時の方
    向が誤りであると判定された場合に、該画像を正しい方
    向に回転させる回転手段を更に備えることを特徴とする
    請求項6に記載の文字認識装置。
  10. 【請求項10】 前記回転手段は、前記画像の各領域毎
    に回転を行うことを特徴とする請求項9に記載の文字認
    識装置。
  11. 【請求項11】 前記回転手段において回転すべき領域
    のデータ属性を指定する指定手段を更に備えることを特
    徴とする請求項10に記載の文字認識装置。
  12. 【請求項12】 画像を色情報に基づいて複数の領域に
    分割する領域分割工程と、 前記領域分割工程によって得られた各領域の色情報の組
    み合わせに基づいて当該画像の文書フォーマットを判別
    する判別工程と、 前記判別工程で判別された文書フォーマットと、前記領
    域分割工程によって得られた各領域の色情報に基づいて
    各領域にデータ属性を設定する設定工程と、 前記設定工程によって設定されたデータ属性に従って文
    字認識処理をおこなう文字認識工程とを備えることを特
    徴とする文字認識方法。
  13. 【請求項13】 前記データ属性は処理順序を含み、 前記文字認識工程は、前記データ属性で示される処理順
    序に従って各領域に対する文字認識処理を実行すること
    を特徴とする請求項12に記載の文字認識方法。
  14. 【請求項14】 前記データ属性は各領域のデータ項目
    を表すことを特徴とする請求項12に記載の文字認識方
    法。
  15. 【請求項15】 複数種類の文書フォーマット毎に色情
    報とデータ属性とを対応させた複数種類の変換テーブル
    を有し、 前記判別工程は、前記領域分割工程によって得られた各
    領域の色情報の組み合わせと、前記複数種類の変換テー
    ブルのそれぞれに登録された色情報の組み合わせとの一
    致度を求め、該一致度が最も高い変換テーブルの対応す
    る文書フォーマットをもって判別結果とすることを特徴
    とする請求項12に記載の文字認識方法。
  16. 【請求項16】 前記設定工程は、前記判別工程で判別
    された文書フォーマットに対応する変換テーブルを参照
    して、前記領域分割工程によって得られた各領域の色情
    報に基づいて各領域にデータ属性を設定することを特徴
    とする請求項15に記載の文字認識方法。
  17. 【請求項17】 前記判別工程によって判別された文書
    フォーマットと、前記領域分割工程によって得られた領
    域の位置とに基づいて、入力文書の方向を判定する判定
    工程を更に備えることを特徴とする請求項12に記載の
    文字認識方法。
  18. 【請求項18】 前記判別工程により判別された入力文
    書の方向が正規の方向でない場合、その旨ををオペレー
    タに報知する報知工程を更に備えることを特徴とする請
    求項17に記載の文字認識方法。
  19. 【請求項19】 前記報知工程は、前記判別工程により
    判別された入力文書の方向が正規の方向でない場合、該
    判別された方向がどの誤り方向に分類に属するかをオペ
    レータに知らせることを特徴とする請求項18に記載の
    文字認識方法。
  20. 【請求項20】 前記判定工程によって画像の入力時の
    方向が誤りであると判定された場合に、該画像を正しい
    方向に回転させる回転工程を更に備えることを特徴とす
    る請求項17に記載の文字認識方法。
  21. 【請求項21】 前記回転工程は、前記画像の各領域毎
    に回転を行うことを特徴とする請求項20に記載の文字
    認識方法。
  22. 【請求項22】 前記回転工程において回転すべき領域
    のデータ属性を指定する指定工程を更に備えることを特
    徴とする請求項21に記載の文字認識方法。
  23. 【請求項23】 文字認識のための制御プログラムを格
    納するコンピュータ可読メモリであって、該制御プログ
    ラムが、 画像を色情報に基づいて複数の領域に分割する領域分割
    工程のコードと、 前記領域分割工程によって得られた各領域の色情報の組
    み合わせに基づいて当該画像の文書フォーマットを判別
    する判別工程のコードと、 前記判別工程で判別された文書フォーマットと、前記領
    域分割工程によって得られた各領域の色情報に基づいて
    各領域にデータ属性を設定する設定工程のコードと、 前記設定工程によって設定されたデータ属性に従って文
    字認識処理をおこなう文字認識工程のコードとを備える
    ことを特徴とするコンピュータ可読メモリ。
JP10024886A 1998-02-05 1998-02-05 文書認識装置及びその方法 Withdrawn JPH11224307A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10024886A JPH11224307A (ja) 1998-02-05 1998-02-05 文書認識装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10024886A JPH11224307A (ja) 1998-02-05 1998-02-05 文書認識装置及びその方法

Publications (1)

Publication Number Publication Date
JPH11224307A true JPH11224307A (ja) 1999-08-17

Family

ID=12150682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10024886A Withdrawn JPH11224307A (ja) 1998-02-05 1998-02-05 文書認識装置及びその方法

Country Status (1)

Country Link
JP (1) JPH11224307A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021022285A (ja) * 2019-07-30 2021-02-18 グローリー株式会社 媒体判別装置、媒体判別システム及び媒体判別方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021022285A (ja) * 2019-07-30 2021-02-18 グローリー株式会社 媒体判別装置、媒体判別システム及び媒体判別方法

Similar Documents

Publication Publication Date Title
US5748809A (en) Active area identification on a machine readable form using form landmarks
JP2003308480A (ja) オンライン手書き文字パターン認識編集装置及び方法並びに当該方法を実現するコンピュータ実行可能なプログラム
US6320983B1 (en) Method and apparatus for character recognition, and computer-readable recording medium with a program making a computer execute the method recorded therein
JP2835178B2 (ja) 文書読取装置
US20030118211A1 (en) Watermark information extraction apparatus and method of controlling thereof
JP3733310B2 (ja) 文書書式識別装置および識別方法
JPH06103411A (ja) 文書読取装置
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JPH11224307A (ja) 文書認識装置及びその方法
US6330360B1 (en) Image processing apparatus and method
JP3946043B2 (ja) 帳票識別装置及び識別方法
JP4221960B2 (ja) 帳票識別装置及びその識別方法
JP2002170079A (ja) 文書書式識別装置および識別方法
JP3412998B2 (ja) 画像処理装置及びその方法
JP2000339407A (ja) 画像処理装置及び画像処理方法及びコンピュータ読み取り可能な記憶媒体
JPWO2001026024A1 (ja) 帳票識別装置及び識別方法
JP3932201B2 (ja) 帳票種識別装置および記録媒体
JP4418823B2 (ja) 帳票識別装置及びその識別方法
JPH07334611A (ja) 非認識文字の表示方法
JPH11224308A (ja) 文字認識装置及びその方法
JPH11250179A (ja) 文字認識装置および文字認識方法
JPH10124610A (ja) 光学式文字読取装置
JPS61198376A (ja) 光学的文字読取装置
JPH10289288A (ja) 画像処理方法及び装置
JPH0459669B2 (ja)

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050405