JPH1166231A - 文字認識装置及びその文字認識方法 - Google Patents

文字認識装置及びその文字認識方法

Info

Publication number
JPH1166231A
JPH1166231A JP9227503A JP22750397A JPH1166231A JP H1166231 A JPH1166231 A JP H1166231A JP 9227503 A JP9227503 A JP 9227503A JP 22750397 A JP22750397 A JP 22750397A JP H1166231 A JPH1166231 A JP H1166231A
Authority
JP
Japan
Prior art keywords
character
image
character recognition
information
lines
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9227503A
Other languages
English (en)
Inventor
Kentaro Sekine
健太郎 関根
Yoichi Shirakawa
洋一 白川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP9227503A priority Critical patent/JPH1166231A/ja
Publication of JPH1166231A publication Critical patent/JPH1166231A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 繁雑な操作を行なうことなく、原稿を複数の
領域に分割して入力された画像から自動的に精度の高い
文字認識処理を可能とする。 【解決手段】 画像入力部10によって、原稿を各領域
に含まれる文字が少なくとも1文字以上が重複して存在
するように複数の領域に分割し、各領域毎に入力された
画像を格納する画像記憶部20、格納された画像に対し
レイアウト解析処理を行ない、レイアウト情報を抽出す
るレイアウト解析部30、レイアウト情報を格納するレ
イアウト情報記憶部40、画像とレイアウト情報とに基
づいて、文字認識情報を得る文字認識部50、文字認識
情報を格納する文字情報記憶部60、レイアウト情報を
基に分割された各領域の画像中の互いに相対応する行を
検出する結合行検出部70、相対応する行に含まれる互
いに重複する文字を検出して文字認識情報の結合位置を
検出する結合文字検出部80、結合行検出部及び結合文
字検出部によって得られた対応結果をもとに文字認識情
報を結合する文字結合部90、文字結合部によって得ら
れた結果を出力する出力部100を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、原稿を画像として
入力し、その画像に対してレイアウト解析及び文字認識
を行なう文字認識装置に関し、特に複数の領域に分割さ
れた原稿の文字認識を簡単かつ高精度に行なうことを可
能とする文字認識装置及びその文字認識方法に関する。
【0002】
【従来の技術】従来、文字認識装置においては、スキャ
ナ等の画像入力装置から印刷文書を読み込み、読み込ん
だ文書画像の中の文字の領域を解析により抽出し、抽出
した文字に対して文字認識を行なって文字コードを取得
する方式が提案されている。
【0003】このような従来技術の一例は、特開昭64
−15889号公報に記載されている。この公報に記載
された方式は、文字の領域を解析する際に、一意に定ま
る上下または左右の切り出し方向を交互に規定しなが
ら、例えば、段落、行、文字の順に、大局的領域から局
小的領域に切り出しを行なう。切り出された領域につい
ては、その大きさや並び等の位置関係の属性から、予め
定めた基本要素に分類した後、これらの要素の構造化を
行ない、配置関係を階層構造として抽出するものであ
る。
【0004】この様な文字認識装置では、画像入力装置
としてスキャナ等の機器が使用されるが、その最大有効
読み取りサイズは有限であるため、これより大きなサイ
ズの原稿を読み込むには、原稿を複数回に分けて入力
し、これらを結合して原稿全体を再生する必要があるこ
のような目的のために、複数回に分けて入力した画像を
結合する技術が提案されており、その一例が特開平1−
229559号公報に記載されている。
【0005】この特開平1−229559号公報に開示
された装置は、画像入力装置の最大有効読み取りサイズ
より大きな原稿を複数の領域に分割して入力し、それら
複数の画像を結合する装置であり、画像を複数の領域に
分割して入力する画像入力手段と、分割されたそれぞれ
の画像を記憶する記憶手段と、予め原稿に付与された分
割指示マークの位置情報を画像中から検出するマーク位
置情報検出手段と、マーク位置情報に基づいて分割して
記憶された画像を1つに結合する結合手段から構成され
ている。
【0006】読み取りを行なう原稿には、予め画像入力
装置の最大有効読み取りサイズより小さな領域毎に、分
割位置を特定するための分割指示マークを付与してお
き、それぞれの画像中に少なくとも複数個の分割指示マ
ークを含むように画像を読み込む。そして、マーク位置
情報検出手段により、各画像の分割指示マークを検出
し、位置情報を基に対応するマークが一致するように画
像を1つに結合するものである。
【0007】さらに、同様の従来の技術の一例が、特開
平2−236688号公報に記載されている。この公報
に開示された装置も、画像入力装置の最大有効読み取り
サイズより大きな原稿を複数の領域に分割して入力し、
それら複数の画像を結合する装置である。その構成は、
画像を複数の領域に分割して入力する手段と、結合位置
合わせを行なう手段と、特定領域の画像処理を行なう手
段から成っている。
【0008】この装置では、分割して読み込んだ画像に
対して黒画素の膨張処理を施し、連結位置を変更しなが
らそれぞれの画像を重ね合せを行なう。重なり領域にお
いては、重ね合せた画像の差が最も少なくなるところを
連結位置として決定し、画像を結合する。このとき、膨
張した黒画素に対して縮退処理を施している。
【0009】
【発明が解決しようとする課題】上述した画像入力装置
から原稿を画像として入力し、その画像に対してレイア
ウト解析処理及び文字認識処理を行ない、認識結果とし
て文字コードを出力する文字認識装置においては、スキ
ャナ等の画像入力装置の最大有効読み取りサイズより大
きなサイズの原稿を読み込むには、複数回に分けて入力
し、これらを結合して原稿全体を再生する必要がある
が、原稿と同一の認識結果を得るためには、分割して入
力した画像に対する複数の認識結果を、別途手作業によ
って結合する作業が必要になるという問題点がある。そ
の理由は、これらの文字認識装置では、1つの入力画像
に対して1つの認識結果が出力されるため、複数の画像
に対しては複数の認識結果が出力されるからである。
【0010】また、上記の問題点を回避するために、複
数の領域に分割して入力された原稿の画像を文字認識を
開始する前に結合し、結合した画像に対して文字認識処
理を行なう装置が提案されているが、それらの装置で
は、分割して入力した画像の結合位置を示すための分割
指示マークを予め原稿に付与する必要があるため、分割
指示マークを付与できない原稿については画像の結合を
行なうことができないという問題点がある。その理由
は、対象とする原稿に対して必ずしも分割指示マークを
付与することが可能ではないからである。
【0011】さらに、複数の領域に分割して入力された
原稿の画像を文字認識を開始する前に結合し画像を結合
する従来の装置では、文字認識において認識結果に誤り
が発生しやすくなるという問題点もある。その理由は、
入力画像に画像入力装置の光学的ひずみやずれの特性が
原因で伸びや縮みが生じるため、画像の結合部分に不連
続部分が生じるからである。従来のマークを付与する方
法及びマークを付加しない方法の何れにおいても、これ
らのずれを自動的に吸収する方法は確立されていない。
【0012】本発明の目的は、繁雑な操作を行なうこと
なく、原稿を複数の領域に分割して入力された画像から
自動的に精度の高い文字認識処理を可能とする文字認識
装置及びその文字認識方法を提供することにある。
【0013】
【課題を解決するための手段】上記目的を達成する本発
明の文字認識装置は、原稿を量子化された画像として入
力する画像入力手段によって、前記原稿を各領域に含ま
れる文字が少なくとも1文字以上が重複して存在するよ
うに複数の領域に分割し、各領域毎に入力された画像を
格納する画像記憶手段と、前記画像記憶手段に格納され
た画像に対し、レイアウト解析処理を行ない、少なくと
も文書の行、文字の領域属性や領域の座標情報を含むレ
イアウト情報を抽出するレイアウト解析手段と、レイア
ウト解析によって得られたレイアウト情報を格納するレ
イアウト情報記憶手段と、前記画像記憶手段に格納され
ている画像と前記レイアウト情報記憶手段に格納されて
いるレイアウト情報とに基づいて、画像内の文字に対応
する文字コードや、候補文字の文字コード、文字の座標
を含む文字認識情報を得る文字認識手段と、前記文字認
識手段によって得られた文字認識情報を格納する文字情
報記憶手段と、前記レイアウト情報記憶手段に格納され
たレイアウト情報をもとに、分割された各領域の画像中
の含まれる行のうちで、互いに相対応する行を検出する
結合行検出手段と、前記結合行検出手段によって得られ
た対応結果と前記文字情報記憶手段に格納された文字認
識情報をもとに、相対応する行に含まれる文字のうち
で、互いに重複する文字を検出して前記複数の領域に対
応する複数の前記文字認識情報の結合位置を検出する結
合文字検出手段と、前記結合行検出手段及び結合文字検
出手段によって得られた対応結果をもとに、前記文字情
報記憶手段に格納された文字認識情報を結合する文字結
合手段と、文字結合部によって得られた結果を出力する
出力手段を備えることを特徴とする。
【0014】本発明の文字認識装置においては、分割部
分において少なくとも1文字以上の文字が重複して存在
するように分割して画像が入力される。レイアウト解析
手段では、複数の画像に対して、図表分離、表解析、段
組分離、下線分離、行分離、文字分離処理等のレイアウ
ト解析を施し、領域の属性や、座標情報等のレイアウト
情報を抽出し、抽出したレイアウト情報をレイアウト情
報記憶手段へ格納する。文字認識手段では、画像記憶手
段に格納されている複数の画像と、レイアウト情報記憶
手段に格納されている対応する複数のレイアウト情報を
もとに、文字認識処理を行ない、得られた文字コードや
候補文字の文字コード、文字座標等の文字認識情報は文
字情報記憶手段へ格納する。結合行検出手段では、レイ
アウト情報記憶手段に格納されている複数のレイアウト
情報をもとに、画像の分割部分でそれぞれの画像ごとに
行単位の座標比較を行ない、相対応する行を検出する。
結合文字検出手段では、結合行検出手段により得られた
結果と、文字情報記憶手段に格納されている文字認識情
報をもとに、相対応する行に含まれる文字について、そ
の文字コードを比較することにより対応する重複文字を
検出する。文字結合手段では、結合行検出手段及び結合
文字検出手段により得られた結果をもとに、それぞれの
認識結果である行や文字を結合し、その得られた結果を
認識結果として出力手段より出力する。
【0015】請求項2の文字認識装置によれば、前記結
合行検出手段は、前記レイアウト情報記憶手段に格納さ
れた複数の画像に対応するレイアウト情報をともに、前
記画像の分割部分において画像毎に行単位の座標比較を
行なうことにより、互いに相対応する行を検出すること
を特徴とする。
【0016】請求項3の文字認識装置によれば、前記結
合文字検出手段は、前記結合行検出手段によって検出さ
れた互いに相対応する行に含まれる文字の文字コードの
比較を行なうことにより、重複する文字の検出を行なう
ことを特徴とする。
【0017】請求項4の文字認識装置によれば、前記結
合行検出手段は、前記レイアウト情報記憶手段に格納さ
れた複数の画像に対応するレイアウト情報をともに、前
記画像の分割部分において画像毎に行単位の座標比較を
行なうことにより、互いに相対応する行を検出し、前記
結合文字検出手段は、前記結合行検出手段によって検出
された互いに相対応する行に含まれる文字の文字コード
の比較を行なうことにより、互いに相対応する行に含ま
れる文字の文字コードが少なくとも部分的に一致する場
合に、前記複数の領域に対応する複数の前記文字認識情
報の結合位置として検出することを特徴とする。
【0018】請求項5の本発明の文字認識方法は、原稿
を各領域に含まれる文字が少なくとも1文字以上が重複
して存在するように複数の領域に分割し、前記各領域毎
に画像を入力するステップと、入力された前記画像に対
し、レイアウト解析処理を行ない、少なくとも文書の
行、文字の領域属性や領域の座標情報を含むレイアウト
情報を抽出するステップと、入力された画像とレイアウ
ト解析によって得られたレイアウト情報とに基づいて、
画像内の文字に対応する文字コードや、候補文字の文字
コード、文字の座標を含む文字認識情報を得るステップ
と、前記レイアウト情報をもとに、分割された各領域の
画像中の含まれる行のうちで、互いに相対応する行を検
出するステップと、検出された互いに相対応する行と、
前記文字認識情報を基に、相対応する行に含まれる文字
のうちで、互いに重複する文字を検出して前記複数の領
域に対応する複数の前記文字認識情報の結合位置を検出
するステップと、検出された互いに相対応する行と前記
文字認識情報の結合位置を基に、前記文字認識情報を結
合するステップを備えることを特徴とする。
【0019】請求項6の文字認識方法によれば、前記相
対応する行の検出ステップでは、前記複数の画像に対応
するレイアウト情報をともに、前記画像の分割部分にお
いて画像毎に行単位の座標比較を行なうことにより、互
いに相対応する行を検出し、前記結合位置の検出ステッ
プでは、検出された互いに相対応する行に含まれる文字
の文字コードの比較を行なうことにより、互いに相対応
する行に含まれる文字の文字コードが少なくとも部分的
に一致する場合に、前記複数の領域に対応する複数の前
記文字認識情報の結合位置として検出することを特徴と
する。
【0020】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して詳細に説明する。図1に本発明の実施
の形態による文字認識装置の構成を示す。図1におい
て、本実施の形態による文字認識装置は、画像入力部1
0、画像記憶部20、レイアウト解析部30、レイアウ
ト情報記憶部40、文字認識部50、文字情報記憶部6
0、結合行検出部70、結合文字検出部80、文字結合
部90、出力部100を備えて構成される。
【0021】画像入力部10は、文字認識対象である原
稿を量子化された画像として入力する部分であり、スキ
ャナ等の機器が利用される。画像記憶部20は、画像入
力部10から入力された原稿の画像を格納する部分であ
る。
【0022】レイアウト解析部30は、画像記憶部20
に格納された画像に対し、図表分離、表解析、段組分
離、下線分離、行分離、文字分離等のレイアウト解析を
施し、文書の図表、段落、行、文字等の領域属性や、領
域の座標情報等のレイアウト情報を抽出する部分であ
る。レイアウト情報記憶部40は、レイアウト解析部3
0によって抽出されたレイアウト情報を格納する部分で
ある。
【0023】文字認識部50は、画像記憶部20に格納
されている画像情報と、レイアウト情報記憶部40に格
納されているレイアウト情報に基づいて、画像内の文字
に対応する文字コードや、候補文字の文字コード、文字
の座標等の文字認識情報を取得する。文字情報記憶部6
0は、文字認識部50により得られた文字認識情報を格
納する部分である。
【0024】結合行検出部70は、レイアウト情報記憶
部40に格納されているレイアウト情報に基づいて、分
割された複数の画像に含まれる行のうちで、互いに相対
応する行を検出する部分である。
【0025】結合文字検出部80は、結合行検出部70
により得られた複数画像に対する行の対応結果と文字情
報記憶部60に格納されている文字認識情報を基に、相
対応する行に含まれる文字から、互いに対応する重複文
字を検出する部分である。
【0026】文字結合部90は、結合行検出部70によ
り得られた対応結果と、結合文字検出部80により得ら
れた対応結果をもとに、文字情報記憶部6に格納された
文字を結合することにより、原稿全体の文字認識情報を
取得する部分である。出力部100は、文字結合部90
により得られた結果を出力する部分である。
【0027】次に、上記のように構成される実施の形態
の動作について図1及び図2のフローチャートを参照し
て詳細に説明する。
【0028】画像入力部10では、画像入力部10の最
大有効読み取りサイズより大きなサイズの原稿を読み込
む場合、原稿を複数の領域に分割してその画像を読み込
むことになるが、その際、少なくとも分割領域の分割部
分において文字が少なくとも1文字以上重複して存在す
るように分割して入力する。このように、もともと原稿
中に含まれる文字が重複するように読み込むため、分割
指示マーク等を付与する作業が必要ない。画像入力部1
0から入力された複数の分割領域の画像はそれぞれ画像
記憶部20へ格納される。
【0029】レイアウト解析部30では、画像記憶部2
0に格納されている分割領域に対応する複数の画像に対
して、図表分離、表解析、段組分離、下線分離、行分
離、文字分離処理等のレイアウト解析を施し、文書の図
表、段落、行、文字等の領域属性や、領域の座標情報等
のレイアウト情報を抽出する。ここでは、原稿を構成す
る行と文字の座標が抽出できればよい。これらのレイア
ウト情報の抽出については、前述した従来の技術を適用
できる。抽出されたレイアウト情報は、レイアウト情報
記憶部40へ格納される。
【0030】文字認識部50では、画像記憶部20に格
納されている複数の画像と、レイアウト情報記憶部40
に格納されている対応する複数のレイアウト情報をもと
に、文字認識処理を行なう。この文字認識処理について
は、前述した従来の技術を適用できる。文字認識処理に
より得られた文字コードや、候補文字の文字コード、文
字の座標等の文字認識情報は、文字情報記憶部60へ格
納する。
【0031】結合行検出部70では、レイアウト情報記
憶部40に格納されている複数に分割された領域のレイ
アウト情報をもとに、画像の分割部分でそれぞれの画像
ごとに行単位の座標比較を行ない、互いに対応する行を
検出する。
【0032】図2によると、まず、それぞれの分割され
た画像に対して、レイアウト情報を参照して分割部分に
行が存在するかを検出する(ステップ201)。分割部
分に行が存在する場合には、各行のレイアウト情報に含
まれる座標情報から行間隔等の相対位置関係を検証し、
相対応する行の結合位置の候補を求める(ステップ20
2)。結合行検出部70による結合行の検出処理では、
座標や行間院等の相対位置関係を比較することにより、
入力画像に伸び縮みの変動があっても、対応関係を求め
ることができる。
【0033】分割部分に行が存在しない場合には、文字
結合を行なわず、結果を出力する(ステップ207)。
【0034】結合文字検出部80では、結合行検出部7
により得られた結果と、文字情報記憶部60に格納され
ている文字認識情報をもとに、相対応する行に含まれる
文字について、互いに対応する重複文字を検証する。
【0035】図2によると、まず、相対応する行が存在
するかを検出する(ステップ203)。相対応する行が
存在しない場合には、その行の文字結合を行なわず、結
果を出力する(ステップ207)。
【0036】相対応する行が存在する場合には、互いに
相対応する行に重複文字が存在するかを調べ、文字の結
合位置の候補を求める(ステップ204)。画像入力時
に1文字以上が重複するように入力されているため、相
対応する行には重複する文字コードの並びが存在する。
その文字コードを比較することにより文字単位の結合位
置はの検出を行なう。文字の結合位置は、文字列の一致
により検証するが、認識結果に誤りがあり、部分的に文
字列が一致していない場合等も、一つの候補として結合
位置を検出する。
【0037】次に、その文字の結合位置が妥当かどうか
を調べる(ステップ205)。認識結果に誤りが多い
等、結合位置が妥当でないと判断した場合には、検出条
件を変更し、結合行から再検出を行ない、最適位置を求
める。文字の結合位置が妥当な場合は、相対応する行を
結合する(ステップ206)。
【0038】そして、結合対象となる全ての行について
同様の操作を繰り返す(ステップ208)。これらの結
合は、結合行検出部70により得られた対応結果と、結
合文字検出部80により得られた対応結果をもとに、文
字結合部90で行なう。出力部100では、文字結合部
により得られた結果を認識結果として出力する。
【0039】
【実施例】本発明の第1の実施例について図3を参照し
て詳細に説明する。図3は本発明の文字認識装置による
原稿読み取りと文字認識及び文字結合処理の動作例を示
す概念図である。
【0040】認識対象となる元の原稿301のサイズ
が、画像入力部10の最大有効読み取りサイズよりも大
きいため、原稿301を、左右2つの領域に分割するこ
とにより、図3に示すように、原稿左側の領域に対応す
る画像302及び原稿右側に対応する画像303を入力
する。この時、少なくても分割部分で1文字以上の文字
が重複するように入力する。
【0041】例えば、図3では、原稿301の1行目に
「あいうえおかきくけこ」と書かれているが、これを2
つに分割し、画像302では左側の「あいうえおか」が
含まれるように、画像303では右側の「おかきくけ
こ」が含まれるようにして、それぞれの画像で「おか」
の部分が重複するように入力したものである。
【0042】これらの画像に対して、それぞれレイアウ
ト解析部30おいて抽出されたレイアウト情報がレイア
ウト情報記憶部40に、文字認識部50において認識さ
れた文字認識情報結果が文字情報記憶部60に格納され
る。
【0043】図3の304及び305は、それぞれ画像
302、303に対するレイアウト情報と文字認識情報
の概念を示す。例えば、304は原稿の左側部分であ
り、破線で示された部分がレイアウト情報を示し、行の
領域とその座標を示す。ここでは、文字認識情報とし
て、1行目の文字コードが「あいうえおか」と認識さ
れ、文字の座標も得られている。同様に2行目及び3行
目の文字コードが、それぞれ「さしす」及び「たちつて
とな」であったことを示している。
【0044】また、305は原稿の右側部分を示し、同
様に含まれる行の領域や座標及び文字コード及び座標等
の情報が得られる。
【0045】図3の306及び307は、304及び3
05からレイアウト情報と文字認識情報のみを抽出し
て、結合行検出部70において、行単位の結合位置を検
出する処理を行なうことを示している。
【0046】これは、分割された画像のレイアウト情報
から、相対応する行を検出することである。たとえば、
図3の306及び307においては、2行目の「さし
す」と「せそ」については、分割部分に近い位置に文字
が存在しないため結合する必要がなく、1行目の「あい
うえおか」と「おかきくけこ」及び3行目の「たちつて
とな」と「となにぬねの」では、分割部分に近い位置に
文字が存在するので結合の対象となることがわかる。
【0047】結合対象の行は、例えば、行の座標から得
られる位置や、行間隔の相対関係を、左右の画像で比較
して、一致する行を相対応する行と決定する。次に、結
合行検出部70において得られた行の対応結果に基づい
て、結合文字検出部80において文字単位の結合位置、
つまり対応する重複文字を検出する。
【0048】例えば、図3の308においては、1行目
と3行目が結合対象であり、文字コードの比較の結果、
1行目では「おか」が、3行目では「とな」が重複して
いるため結合対象となることがわかる。
【0049】ここでは、必ずしも重複する文字が一致し
なくてもよい。文字認識では少しの文字の傾きや変形に
よって異なった認識結果がえられることがあるが、この
場合でも、一致とみなす評価関数において、文字コード
や座標によって重みを設けることにより、もっともらし
い文字を対応するとみなすことができる。
【0050】また、もっともらしさが低い場合には、検
出条件を変更して、結合行検出部70の処理からやり直
すこともできる。最終的に、結合行検出部70において
得られた行の対応結果と、結合文字検出部80において
得られた文字の対応結果に基づいて、文字結合部90に
おいて文字を結合して、原稿301の認識処理の結果3
09が得られる。
【0051】本発明の第2の実施例について図4を参照
して詳細に説明する。図4を参照すると、401が元の
原稿であり、画像入力部10の最大読み取りサイズより
も原稿401が大きいため、原稿401を横方向に、画
像402及び画像403の2つの画像に分割して入力し
たものである。
【0052】この時、少なくても分割部分で行が1行以
上重複するように入力する。例えば、図4に示すよう
に、画像401の3、4行目での、「さしすせそ」と
「たちつてと」の2行が重複するように入力する。
【0053】そして、これらの画像に対してレイアウト
解析処理、文字認識処理を行ない、その結果をそれぞれ
のレイアウト情報記憶部40及び文字情報記憶部60に
格納し、図4の404及び405を得る。ここで、図4
の406及び407において破線で示された部分がレイ
アウト情報と文字認識情報であり、1行目に対しては文
字コード「あいうえお」と「さしすせそ」が得られ、そ
の行単位及び文字単位の座標情報が得られる。
【0054】結合行検出部70において、行単位の結合
位置を検出する。例えば、図4の406及び407にお
いては、それぞれ分割部分に行が存在するので、結合対
象であることがわかる。さらに、結合行検出部70にお
いて得られた結果から、結合文字検出部80において、
文字単位での結合位置、すなわち対応する重複文字を検
出する。図4の408においては、文字コードの比較の
結果、3、4行目が結合対象であることがわかる。そし
て、結合文字検出部80において得られた結果から、文
字結合部90において文字の結合処理が行われて、原稿
401の認識結果として結果409が取得される。
【0055】なお、本発明は上述した実施の形態及び実
施例に限定されるものではなく、その技術思想の範囲内
において様々に変形して実施することができる。実施例
では、原稿を左右又は上下に2分割して画像入力した例
を示したが、上下左右に2分割以上に分割した場合で
も、本発明を適用できるのは言うまでもない。
【0056】
【発明の効果】以上説明したように本発明の文字分割装
置によれば、画像入力装置の最大有効読み取りサイズ以
下の複数の領域に分割して画像を入力し、それぞれの画
像に対して文字認識処理を実行し、自動的に認識結果を
1つに結合するため、画像入力手段の最大有効読み取り
サイズに依存せずに、様々な大きさの原稿に対する文字
認識処理を簡単な操作で実現することができる。
【0057】また、複数の画像を結合する制御が不要な
ため、画像の結合によって生じる認識結果の誤りを軽減
することができることである。その理由は、画像を1つ
に結合してから文字認識処理を行なうのではなく、文字
認識処理した複数の認識結果を1つに結合するためであ
る。
【図面の簡単な説明】
【図1】 本発明の実施の形態による文字認識装置の構
成を示すブロック図である。
【図2】 本発明の実施の形態による文字認識装置の動
作を示すフローチャートである。
【図3】 本発明の文字認識装置によって文字認識処理
を行なった第1の実施例を示す図である。
【図4】 本発明の文字認識装置によって文字認識処理
を行なった第2の実施例を示す図である。
【符号の説明】
10 画像入力部 20 画像記憶部 30 レイアウト解析部 40 レイアウト情報記憶部 50 文字認識部 60 文字情報記憶部 70 結合行検出部 80 結合文字検出部 90 文字結合部 100 出力部 301、401 原稿 302、303、402、403 分割入力画像 304、305、404、405 認識結果 306、307、406、407 レイアウト情報と文
字認識情報 308、408 結合結果 309、409 出力結果

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 原稿を量子化された画像として入力する
    画像入力手段によって、前記原稿を各領域に含まれる文
    字が少なくとも1文字以上が重複して存在するように複
    数の領域に分割し、各領域毎に入力された画像を格納す
    る画像記憶手段と、 前記画像記憶手段に格納された画像に対し、レイアウト
    解析処理を行ない、少なくとも文書の行、文字の領域属
    性や領域の座標情報を含むレイアウト情報を抽出するレ
    イアウト解析手段と、 レイアウト解析によって得られたレイアウト情報を格納
    するレイアウト情報記憶手段と、 前記画像記憶手段に格納されている画像と前記レイアウ
    ト情報記憶手段に格納されているレイアウト情報とに基
    づいて、画像内の文字に対応する文字コードや、候補文
    字の文字コード、文字の座標を含む文字認識情報を得る
    文字認識手段と、 前記文字認識手段によって得られた前記文字認識情報を
    格納する文字情報記憶手段と、 前記レイアウト情報記憶手段に格納されたレイアウト情
    報をもとに、分割された各領域の画像中の含まれる行の
    うちで、互いに相対応する行を検出する結合行検出手段
    と、 前記結合行検出手段によって得られた対応結果と前記文
    字情報記憶手段に格納された文字認識情報をもとに、相
    対応する行に含まれる文字のうちで、互いに重複する文
    字を検出して前記複数の領域に対応する複数の前記文字
    認識情報の結合位置を検出する結合文字検出手段と、 前記結合行検出手段及び結合文字検出手段によって得ら
    れた対応結果をもとに、前記文字情報記憶手段に格納さ
    れた前記文字認識情報を結合する文字結合手段と、 前記文字結合手段によって得られた結果を出力する出力
    手段とを備えることを特徴とする文字認識装置。
  2. 【請求項2】 前記結合行検出手段は、前記レイアウト
    情報記憶手段に格納された複数の画像に対応するレイア
    ウト情報をともに、前記画像の分割部分において画像毎
    に行単位の座標比較を行なうことにより、互いに相対応
    する行を検出することを特徴とする請求項1に記載の文
    字認識装置。
  3. 【請求項3】 前記結合文字検出手段は、前記結合行検
    出手段によって検出された互いに相対応する行に含まれ
    る文字の文字コードの比較を行なうことにより、重複す
    る文字の検出を行なうことを特徴とする請求項1に記載
    の文字認識装置。
  4. 【請求項4】 前記結合行検出手段は、前記レイアウト
    情報記憶手段に格納された複数の画像に対応するレイア
    ウト情報をともに、前記画像の分割部分において画像毎
    に行単位の座標比較を行なうことにより、互いに相対応
    する行を検出し、 前記結合文字検出手段は、前記結合行検出手段によって
    検出された互いに相対応する行に含まれる文字の文字コ
    ードの比較を行なうことにより、互いに相対応する行に
    含まれる文字の文字コードが少なくとも部分的に一致す
    る場合に、前記複数の領域に対応する複数の前記文字認
    識情報の結合位置として検出することを特徴とする請求
    項1に記載の文字認識装置。
  5. 【請求項5】 原稿を各領域に含まれる文字が少なくと
    も1文字以上が重複して存在するように複数の領域に分
    割し、前記各領域毎に画像を入力するステップと、 入力された前記画像に対し、レイアウト解析処理を行な
    い、少なくとも文書の行、文字の領域属性や領域の座標
    情報を含むレイアウト情報を抽出するステップと、 入力された画像とレイアウト解析によって得られたレイ
    アウト情報とに基づいて、画像内の文字に対応する文字
    コードや、候補文字の文字コード、文字の座標を含む文
    字認識情報を得るステップと、 前記レイアウト情報をもとに、分割された各領域の画像
    中の含まれる行のうちで、互いに相対応する行を検出す
    るステップと、 検出された互いに相対応する行と、前記文字認識情報を
    基に、相対応する行に含まれる文字のうちで、互いに重
    複する文字を検出して前記複数の領域に対応する複数の
    前記文字認識情報の結合位置を検出するステップと、 検出された互いに相対応する行と前記文字認識情報の結
    合位置を基に、前記文字認識情報を結合するステップと
    を備えることを特徴とする文字認識方法。
  6. 【請求項6】 前記相対応する行の検出ステップでは、
    前記複数の画像に対応するレイアウト情報をともに、前
    記画像の分割部分において画像毎に行単位の座標比較を
    行なうことにより、互いに相対応する行を検出し、 前記結合位置の検出ステップでは、検出された互いに相
    対応する行に含まれる文字の文字コードの比較を行なう
    ことにより、互いに相対応する行に含まれる文字の文字
    コードが少なくとも部分的に一致する場合に、前記複数
    の領域に対応する複数の前記文字認識情報の結合位置と
    して検出することを特徴とする請求項5に記載の文字認
    識方法。
JP9227503A 1997-08-08 1997-08-08 文字認識装置及びその文字認識方法 Pending JPH1166231A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9227503A JPH1166231A (ja) 1997-08-08 1997-08-08 文字認識装置及びその文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9227503A JPH1166231A (ja) 1997-08-08 1997-08-08 文字認識装置及びその文字認識方法

Publications (1)

Publication Number Publication Date
JPH1166231A true JPH1166231A (ja) 1999-03-09

Family

ID=16861923

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9227503A Pending JPH1166231A (ja) 1997-08-08 1997-08-08 文字認識装置及びその文字認識方法

Country Status (1)

Country Link
JP (1) JPH1166231A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024762A (ja) * 2000-06-30 2002-01-25 Toshiba Corp 文書認識装置及びその方法
JP2009089178A (ja) * 2007-10-01 2009-04-23 Canon Inc 情報処理装置及びその制御法方法、情報処理システム、プログラム
US7528986B2 (en) * 2004-04-15 2009-05-05 Fuji Xerox Co., Ltd. Image forming apparatus, image forming method, program therefor, and storage medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024762A (ja) * 2000-06-30 2002-01-25 Toshiba Corp 文書認識装置及びその方法
US7528986B2 (en) * 2004-04-15 2009-05-05 Fuji Xerox Co., Ltd. Image forming apparatus, image forming method, program therefor, and storage medium
JP2009089178A (ja) * 2007-10-01 2009-04-23 Canon Inc 情報処理装置及びその制御法方法、情報処理システム、プログラム

Similar Documents

Publication Publication Date Title
JP4928310B2 (ja) ナンバープレート認識装置、その制御方法、コンピュータプログラム
JP3962891B2 (ja) 文書画像処理装置、文書画像処理方法、及び記憶媒体
US20070237394A1 (en) Image processor for character recognition
JP2835178B2 (ja) 文書読取装置
JPH0721320A (ja) 自動スクリプト決定装置
KR20090109047A (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
JP4982587B2 (ja) データエントリシステムおよびデータエントリ方法
JPH1166231A (ja) 文字認識装置及びその文字認識方法
KR20020081405A (ko) 입력 이미지 프로세싱 방법 및 장치 및 컴퓨터 프로그램제품
JPH08329187A (ja) 文書読取装置
US20070047815A1 (en) Image recognition apparatus, image recognition method, and image recognition program
JPH07230525A (ja) 罫線認識方法及び表処理方法
CN112966678A (zh) 一种文本检测方法及系统
JPH0728935A (ja) 文書画像処理装置
JP4221960B2 (ja) 帳票識別装置及びその識別方法
JP3299066B2 (ja) パターン検査装置及び方法
JPH0388086A (ja) 文書読取装置
JP2577821B2 (ja) 図面入力装置
JPH02138674A (ja) 文書処理方法及び装置
JP2004280530A (ja) 帳票処理システム及び帳票処理方法
JP2007011529A (ja) Ocr処理における文字認識位置の決定方法
JP2005050216A (ja) 回答検査システム,調査票発行装置,回答検査装置,調査票発行方法,および回答検査方法
JPH11250179A (ja) 文字認識装置および文字認識方法
JP4789065B2 (ja) 画像処理装置および画像処理プログラム
JPH01292586A (ja) 文字認識支援装置