JPH1166231A

JPH1166231A - 文字認識装置及びその文字認識方法

Info

Publication number: JPH1166231A
Application number: JP9227503A
Authority: JP
Inventors: Kentaro Sekine; 健太郎関根; Yoichi Shirakawa; 洋一白川
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1997-08-08
Filing date: 1997-08-08
Publication date: 1999-03-09

Abstract

(57)【要約】【課題】繁雑な操作を行なうことなく、原稿を複数の
領域に分割して入力された画像から自動的に精度の高い
文字認識処理を可能とする。【解決手段】画像入力部１０によって、原稿を各領域
に含まれる文字が少なくとも１文字以上が重複して存在
するように複数の領域に分割し、各領域毎に入力された
画像を格納する画像記憶部２０、格納された画像に対し
レイアウト解析処理を行ない、レイアウト情報を抽出す
るレイアウト解析部３０、レイアウト情報を格納するレ
イアウト情報記憶部４０、画像とレイアウト情報とに基
づいて、文字認識情報を得る文字認識部５０、文字認識
情報を格納する文字情報記憶部６０、レイアウト情報を
基に分割された各領域の画像中の互いに相対応する行を
検出する結合行検出部７０、相対応する行に含まれる互
いに重複する文字を検出して文字認識情報の結合位置を
検出する結合文字検出部８０、結合行検出部及び結合文
字検出部によって得られた対応結果をもとに文字認識情
報を結合する文字結合部９０、文字結合部によって得ら
れた結果を出力する出力部１００を備える。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、原稿を画像として
入力し、その画像に対してレイアウト解析及び文字認識
を行なう文字認識装置に関し、特に複数の領域に分割さ
れた原稿の文字認識を簡単かつ高精度に行なうことを可
能とする文字認識装置及びその文字認識方法に関する。

【０００２】

【従来の技術】従来、文字認識装置においては、スキャ
ナ等の画像入力装置から印刷文書を読み込み、読み込ん
だ文書画像の中の文字の領域を解析により抽出し、抽出
した文字に対して文字認識を行なって文字コードを取得
する方式が提案されている。

【０００３】このような従来技術の一例は、特開昭６４
−１５８８９号公報に記載されている。この公報に記載
された方式は、文字の領域を解析する際に、一意に定ま
る上下または左右の切り出し方向を交互に規定しなが
ら、例えば、段落、行、文字の順に、大局的領域から局
小的領域に切り出しを行なう。切り出された領域につい
ては、その大きさや並び等の位置関係の属性から、予め
定めた基本要素に分類した後、これらの要素の構造化を
行ない、配置関係を階層構造として抽出するものであ
る。

【０００４】この様な文字認識装置では、画像入力装置
としてスキャナ等の機器が使用されるが、その最大有効
読み取りサイズは有限であるため、これより大きなサイ
ズの原稿を読み込むには、原稿を複数回に分けて入力
し、これらを結合して原稿全体を再生する必要があるこ
のような目的のために、複数回に分けて入力した画像を
結合する技術が提案されており、その一例が特開平１−
２２９５５９号公報に記載されている。

【０００５】この特開平１−２２９５５９号公報に開示
された装置は、画像入力装置の最大有効読み取りサイズ
より大きな原稿を複数の領域に分割して入力し、それら
複数の画像を結合する装置であり、画像を複数の領域に
分割して入力する画像入力手段と、分割されたそれぞれ
の画像を記憶する記憶手段と、予め原稿に付与された分
割指示マークの位置情報を画像中から検出するマーク位
置情報検出手段と、マーク位置情報に基づいて分割して
記憶された画像を１つに結合する結合手段から構成され
ている。

【０００６】読み取りを行なう原稿には、予め画像入力
装置の最大有効読み取りサイズより小さな領域毎に、分
割位置を特定するための分割指示マークを付与してお
き、それぞれの画像中に少なくとも複数個の分割指示マ
ークを含むように画像を読み込む。そして、マーク位置
情報検出手段により、各画像の分割指示マークを検出
し、位置情報を基に対応するマークが一致するように画
像を１つに結合するものである。

【０００７】さらに、同様の従来の技術の一例が、特開
平２−２３６６８８号公報に記載されている。この公報
に開示された装置も、画像入力装置の最大有効読み取り
サイズより大きな原稿を複数の領域に分割して入力し、
それら複数の画像を結合する装置である。その構成は、
画像を複数の領域に分割して入力する手段と、結合位置
合わせを行なう手段と、特定領域の画像処理を行なう手
段から成っている。

【０００８】この装置では、分割して読み込んだ画像に
対して黒画素の膨張処理を施し、連結位置を変更しなが
らそれぞれの画像を重ね合せを行なう。重なり領域にお
いては、重ね合せた画像の差が最も少なくなるところを
連結位置として決定し、画像を結合する。このとき、膨
張した黒画素に対して縮退処理を施している。

【０００９】

【発明が解決しようとする課題】上述した画像入力装置
から原稿を画像として入力し、その画像に対してレイア
ウト解析処理及び文字認識処理を行ない、認識結果とし
て文字コードを出力する文字認識装置においては、スキ
ャナ等の画像入力装置の最大有効読み取りサイズより大
きなサイズの原稿を読み込むには、複数回に分けて入力
し、これらを結合して原稿全体を再生する必要がある
が、原稿と同一の認識結果を得るためには、分割して入
力した画像に対する複数の認識結果を、別途手作業によ
って結合する作業が必要になるという問題点がある。そ
の理由は、これらの文字認識装置では、１つの入力画像
に対して１つの認識結果が出力されるため、複数の画像
に対しては複数の認識結果が出力されるからである。

【００１０】また、上記の問題点を回避するために、複
数の領域に分割して入力された原稿の画像を文字認識を
開始する前に結合し、結合した画像に対して文字認識処
理を行なう装置が提案されているが、それらの装置で
は、分割して入力した画像の結合位置を示すための分割
指示マークを予め原稿に付与する必要があるため、分割
指示マークを付与できない原稿については画像の結合を
行なうことができないという問題点がある。その理由
は、対象とする原稿に対して必ずしも分割指示マークを
付与することが可能ではないからである。

【００１１】さらに、複数の領域に分割して入力された
原稿の画像を文字認識を開始する前に結合し画像を結合
する従来の装置では、文字認識において認識結果に誤り
が発生しやすくなるという問題点もある。その理由は、
入力画像に画像入力装置の光学的ひずみやずれの特性が
原因で伸びや縮みが生じるため、画像の結合部分に不連
続部分が生じるからである。従来のマークを付与する方
法及びマークを付加しない方法の何れにおいても、これ
らのずれを自動的に吸収する方法は確立されていない。

【００１２】本発明の目的は、繁雑な操作を行なうこと
なく、原稿を複数の領域に分割して入力された画像から
自動的に精度の高い文字認識処理を可能とする文字認識
装置及びその文字認識方法を提供することにある。

【００１３】

【課題を解決するための手段】上記目的を達成する本発
明の文字認識装置は、原稿を量子化された画像として入
力する画像入力手段によって、前記原稿を各領域に含ま
れる文字が少なくとも１文字以上が重複して存在するよ
うに複数の領域に分割し、各領域毎に入力された画像を
格納する画像記憶手段と、前記画像記憶手段に格納され
た画像に対し、レイアウト解析処理を行ない、少なくと
も文書の行、文字の領域属性や領域の座標情報を含むレ
イアウト情報を抽出するレイアウト解析手段と、レイア
ウト解析によって得られたレイアウト情報を格納するレ
イアウト情報記憶手段と、前記画像記憶手段に格納され
ている画像と前記レイアウト情報記憶手段に格納されて
いるレイアウト情報とに基づいて、画像内の文字に対応
する文字コードや、候補文字の文字コード、文字の座標
を含む文字認識情報を得る文字認識手段と、前記文字認
識手段によって得られた文字認識情報を格納する文字情
報記憶手段と、前記レイアウト情報記憶手段に格納され
たレイアウト情報をもとに、分割された各領域の画像中
の含まれる行のうちで、互いに相対応する行を検出する
結合行検出手段と、前記結合行検出手段によって得られ
た対応結果と前記文字情報記憶手段に格納された文字認
識情報をもとに、相対応する行に含まれる文字のうち
で、互いに重複する文字を検出して前記複数の領域に対
応する複数の前記文字認識情報の結合位置を検出する結
合文字検出手段と、前記結合行検出手段及び結合文字検
出手段によって得られた対応結果をもとに、前記文字情
報記憶手段に格納された文字認識情報を結合する文字結
合手段と、文字結合部によって得られた結果を出力する
出力手段を備えることを特徴とする。

【００１４】本発明の文字認識装置においては、分割部
分において少なくとも１文字以上の文字が重複して存在
するように分割して画像が入力される。レイアウト解析
手段では、複数の画像に対して、図表分離、表解析、段
組分離、下線分離、行分離、文字分離処理等のレイアウ
ト解析を施し、領域の属性や、座標情報等のレイアウト
情報を抽出し、抽出したレイアウト情報をレイアウト情
報記憶手段へ格納する。文字認識手段では、画像記憶手
段に格納されている複数の画像と、レイアウト情報記憶
手段に格納されている対応する複数のレイアウト情報を
もとに、文字認識処理を行ない、得られた文字コードや
候補文字の文字コード、文字座標等の文字認識情報は文
字情報記憶手段へ格納する。結合行検出手段では、レイ
アウト情報記憶手段に格納されている複数のレイアウト
情報をもとに、画像の分割部分でそれぞれの画像ごとに
行単位の座標比較を行ない、相対応する行を検出する。
結合文字検出手段では、結合行検出手段により得られた
結果と、文字情報記憶手段に格納されている文字認識情
報をもとに、相対応する行に含まれる文字について、そ
の文字コードを比較することにより対応する重複文字を
検出する。文字結合手段では、結合行検出手段及び結合
文字検出手段により得られた結果をもとに、それぞれの
認識結果である行や文字を結合し、その得られた結果を
認識結果として出力手段より出力する。

【００１５】請求項２の文字認識装置によれば、前記結
合行検出手段は、前記レイアウト情報記憶手段に格納さ
れた複数の画像に対応するレイアウト情報をともに、前
記画像の分割部分において画像毎に行単位の座標比較を
行なうことにより、互いに相対応する行を検出すること
を特徴とする。

【００１６】請求項３の文字認識装置によれば、前記結
合文字検出手段は、前記結合行検出手段によって検出さ
れた互いに相対応する行に含まれる文字の文字コードの
比較を行なうことにより、重複する文字の検出を行なう
ことを特徴とする。

【００１７】請求項４の文字認識装置によれば、前記結
合行検出手段は、前記レイアウト情報記憶手段に格納さ
れた複数の画像に対応するレイアウト情報をともに、前
記画像の分割部分において画像毎に行単位の座標比較を
行なうことにより、互いに相対応する行を検出し、前記
結合文字検出手段は、前記結合行検出手段によって検出
された互いに相対応する行に含まれる文字の文字コード
の比較を行なうことにより、互いに相対応する行に含ま
れる文字の文字コードが少なくとも部分的に一致する場
合に、前記複数の領域に対応する複数の前記文字認識情
報の結合位置として検出することを特徴とする。

【００１８】請求項５の本発明の文字認識方法は、原稿
を各領域に含まれる文字が少なくとも１文字以上が重複
して存在するように複数の領域に分割し、前記各領域毎
に画像を入力するステップと、入力された前記画像に対
し、レイアウト解析処理を行ない、少なくとも文書の
行、文字の領域属性や領域の座標情報を含むレイアウト
情報を抽出するステップと、入力された画像とレイアウ
ト解析によって得られたレイアウト情報とに基づいて、
画像内の文字に対応する文字コードや、候補文字の文字
コード、文字の座標を含む文字認識情報を得るステップ
と、前記レイアウト情報をもとに、分割された各領域の
画像中の含まれる行のうちで、互いに相対応する行を検
出するステップと、検出された互いに相対応する行と、
前記文字認識情報を基に、相対応する行に含まれる文字
のうちで、互いに重複する文字を検出して前記複数の領
域に対応する複数の前記文字認識情報の結合位置を検出
するステップと、検出された互いに相対応する行と前記
文字認識情報の結合位置を基に、前記文字認識情報を結
合するステップを備えることを特徴とする。

【００１９】請求項６の文字認識方法によれば、前記相
対応する行の検出ステップでは、前記複数の画像に対応
するレイアウト情報をともに、前記画像の分割部分にお
いて画像毎に行単位の座標比較を行なうことにより、互
いに相対応する行を検出し、前記結合位置の検出ステッ
プでは、検出された互いに相対応する行に含まれる文字
の文字コードの比較を行なうことにより、互いに相対応
する行に含まれる文字の文字コードが少なくとも部分的
に一致する場合に、前記複数の領域に対応する複数の前
記文字認識情報の結合位置として検出することを特徴と
する。

【００２０】

【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して詳細に説明する。図１に本発明の実施
の形態による文字認識装置の構成を示す。図１におい
て、本実施の形態による文字認識装置は、画像入力部１
０、画像記憶部２０、レイアウト解析部３０、レイアウ
ト情報記憶部４０、文字認識部５０、文字情報記憶部６
０、結合行検出部７０、結合文字検出部８０、文字結合
部９０、出力部１００を備えて構成される。

【００２１】画像入力部１０は、文字認識対象である原
稿を量子化された画像として入力する部分であり、スキ
ャナ等の機器が利用される。画像記憶部２０は、画像入
力部１０から入力された原稿の画像を格納する部分であ
る。

【００２２】レイアウト解析部３０は、画像記憶部２０
に格納された画像に対し、図表分離、表解析、段組分
離、下線分離、行分離、文字分離等のレイアウト解析を
施し、文書の図表、段落、行、文字等の領域属性や、領
域の座標情報等のレイアウト情報を抽出する部分であ
る。レイアウト情報記憶部４０は、レイアウト解析部３
０によって抽出されたレイアウト情報を格納する部分で
ある。

【００２３】文字認識部５０は、画像記憶部２０に格納
されている画像情報と、レイアウト情報記憶部４０に格
納されているレイアウト情報に基づいて、画像内の文字
に対応する文字コードや、候補文字の文字コード、文字
の座標等の文字認識情報を取得する。文字情報記憶部６
０は、文字認識部５０により得られた文字認識情報を格
納する部分である。

【００２４】結合行検出部７０は、レイアウト情報記憶
部４０に格納されているレイアウト情報に基づいて、分
割された複数の画像に含まれる行のうちで、互いに相対
応する行を検出する部分である。

【００２５】結合文字検出部８０は、結合行検出部７０
により得られた複数画像に対する行の対応結果と文字情
報記憶部６０に格納されている文字認識情報を基に、相
対応する行に含まれる文字から、互いに対応する重複文
字を検出する部分である。

【００２６】文字結合部９０は、結合行検出部７０によ
り得られた対応結果と、結合文字検出部８０により得ら
れた対応結果をもとに、文字情報記憶部６に格納された
文字を結合することにより、原稿全体の文字認識情報を
取得する部分である。出力部１００は、文字結合部９０
により得られた結果を出力する部分である。

【００２７】次に、上記のように構成される実施の形態
の動作について図１及び図２のフローチャートを参照し
て詳細に説明する。

【００２８】画像入力部１０では、画像入力部１０の最
大有効読み取りサイズより大きなサイズの原稿を読み込
む場合、原稿を複数の領域に分割してその画像を読み込
むことになるが、その際、少なくとも分割領域の分割部
分において文字が少なくとも１文字以上重複して存在す
るように分割して入力する。このように、もともと原稿
中に含まれる文字が重複するように読み込むため、分割
指示マーク等を付与する作業が必要ない。画像入力部１
０から入力された複数の分割領域の画像はそれぞれ画像
記憶部２０へ格納される。

【００２９】レイアウト解析部３０では、画像記憶部２
０に格納されている分割領域に対応する複数の画像に対
して、図表分離、表解析、段組分離、下線分離、行分
離、文字分離処理等のレイアウト解析を施し、文書の図
表、段落、行、文字等の領域属性や、領域の座標情報等
のレイアウト情報を抽出する。ここでは、原稿を構成す
る行と文字の座標が抽出できればよい。これらのレイア
ウト情報の抽出については、前述した従来の技術を適用
できる。抽出されたレイアウト情報は、レイアウト情報
記憶部４０へ格納される。

【００３０】文字認識部５０では、画像記憶部２０に格
納されている複数の画像と、レイアウト情報記憶部４０
に格納されている対応する複数のレイアウト情報をもと
に、文字認識処理を行なう。この文字認識処理について
は、前述した従来の技術を適用できる。文字認識処理に
より得られた文字コードや、候補文字の文字コード、文
字の座標等の文字認識情報は、文字情報記憶部６０へ格
納する。

【００３１】結合行検出部７０では、レイアウト情報記
憶部４０に格納されている複数に分割された領域のレイ
アウト情報をもとに、画像の分割部分でそれぞれの画像
ごとに行単位の座標比較を行ない、互いに対応する行を
検出する。

【００３２】図２によると、まず、それぞれの分割され
た画像に対して、レイアウト情報を参照して分割部分に
行が存在するかを検出する（ステップ２０１）。分割部
分に行が存在する場合には、各行のレイアウト情報に含
まれる座標情報から行間隔等の相対位置関係を検証し、
相対応する行の結合位置の候補を求める（ステップ２０
２）。結合行検出部７０による結合行の検出処理では、
座標や行間院等の相対位置関係を比較することにより、
入力画像に伸び縮みの変動があっても、対応関係を求め
ることができる。

【００３３】分割部分に行が存在しない場合には、文字
結合を行なわず、結果を出力する（ステップ２０７）。

【００３４】結合文字検出部８０では、結合行検出部７
により得られた結果と、文字情報記憶部６０に格納され
ている文字認識情報をもとに、相対応する行に含まれる
文字について、互いに対応する重複文字を検証する。

【００３５】図２によると、まず、相対応する行が存在
するかを検出する（ステップ２０３）。相対応する行が
存在しない場合には、その行の文字結合を行なわず、結
果を出力する（ステップ２０７）。

【００３６】相対応する行が存在する場合には、互いに
相対応する行に重複文字が存在するかを調べ、文字の結
合位置の候補を求める（ステップ２０４）。画像入力時
に１文字以上が重複するように入力されているため、相
対応する行には重複する文字コードの並びが存在する。
その文字コードを比較することにより文字単位の結合位
置はの検出を行なう。文字の結合位置は、文字列の一致
により検証するが、認識結果に誤りがあり、部分的に文
字列が一致していない場合等も、一つの候補として結合
位置を検出する。

【００３７】次に、その文字の結合位置が妥当かどうか
を調べる（ステップ２０５）。認識結果に誤りが多い
等、結合位置が妥当でないと判断した場合には、検出条
件を変更し、結合行から再検出を行ない、最適位置を求
める。文字の結合位置が妥当な場合は、相対応する行を
結合する（ステップ２０６）。

【００３８】そして、結合対象となる全ての行について
同様の操作を繰り返す（ステップ２０８）。これらの結
合は、結合行検出部７０により得られた対応結果と、結
合文字検出部８０により得られた対応結果をもとに、文
字結合部９０で行なう。出力部１００では、文字結合部
により得られた結果を認識結果として出力する。

【００３９】

【実施例】本発明の第１の実施例について図３を参照し
て詳細に説明する。図３は本発明の文字認識装置による
原稿読み取りと文字認識及び文字結合処理の動作例を示
す概念図である。

【００４０】認識対象となる元の原稿３０１のサイズ
が、画像入力部１０の最大有効読み取りサイズよりも大
きいため、原稿３０１を、左右２つの領域に分割するこ
とにより、図３に示すように、原稿左側の領域に対応す
る画像３０２及び原稿右側に対応する画像３０３を入力
する。この時、少なくても分割部分で１文字以上の文字
が重複するように入力する。

【００４１】例えば、図３では、原稿３０１の１行目に
「あいうえおかきくけこ」と書かれているが、これを２
つに分割し、画像３０２では左側の「あいうえおか」が
含まれるように、画像３０３では右側の「おかきくけ
こ」が含まれるようにして、それぞれの画像で「おか」
の部分が重複するように入力したものである。

【００４２】これらの画像に対して、それぞれレイアウ
ト解析部３０おいて抽出されたレイアウト情報がレイア
ウト情報記憶部４０に、文字認識部５０において認識さ
れた文字認識情報結果が文字情報記憶部６０に格納され
る。

【００４３】図３の３０４及び３０５は、それぞれ画像
３０２、３０３に対するレイアウト情報と文字認識情報
の概念を示す。例えば、３０４は原稿の左側部分であ
り、破線で示された部分がレイアウト情報を示し、行の
領域とその座標を示す。ここでは、文字認識情報とし
て、１行目の文字コードが「あいうえおか」と認識さ
れ、文字の座標も得られている。同様に２行目及び３行
目の文字コードが、それぞれ「さしす」及び「たちつて
とな」であったことを示している。

【００４４】また、３０５は原稿の右側部分を示し、同
様に含まれる行の領域や座標及び文字コード及び座標等
の情報が得られる。

【００４５】図３の３０６及び３０７は、３０４及び３
０５からレイアウト情報と文字認識情報のみを抽出し
て、結合行検出部７０において、行単位の結合位置を検
出する処理を行なうことを示している。

【００４６】これは、分割された画像のレイアウト情報
から、相対応する行を検出することである。たとえば、
図３の３０６及び３０７においては、２行目の「さし
す」と「せそ」については、分割部分に近い位置に文字
が存在しないため結合する必要がなく、１行目の「あい
うえおか」と「おかきくけこ」及び３行目の「たちつて
とな」と「となにぬねの」では、分割部分に近い位置に
文字が存在するので結合の対象となることがわかる。

【００４７】結合対象の行は、例えば、行の座標から得
られる位置や、行間隔の相対関係を、左右の画像で比較
して、一致する行を相対応する行と決定する。次に、結
合行検出部７０において得られた行の対応結果に基づい
て、結合文字検出部８０において文字単位の結合位置、
つまり対応する重複文字を検出する。

【００４８】例えば、図３の３０８においては、１行目
と３行目が結合対象であり、文字コードの比較の結果、
１行目では「おか」が、３行目では「とな」が重複して
いるため結合対象となることがわかる。

【００４９】ここでは、必ずしも重複する文字が一致し
なくてもよい。文字認識では少しの文字の傾きや変形に
よって異なった認識結果がえられることがあるが、この
場合でも、一致とみなす評価関数において、文字コード
や座標によって重みを設けることにより、もっともらし
い文字を対応するとみなすことができる。

【００５０】また、もっともらしさが低い場合には、検
出条件を変更して、結合行検出部７０の処理からやり直
すこともできる。最終的に、結合行検出部７０において
得られた行の対応結果と、結合文字検出部８０において
得られた文字の対応結果に基づいて、文字結合部９０に
おいて文字を結合して、原稿３０１の認識処理の結果３
０９が得られる。

【００５１】本発明の第２の実施例について図４を参照
して詳細に説明する。図４を参照すると、４０１が元の
原稿であり、画像入力部１０の最大読み取りサイズより
も原稿４０１が大きいため、原稿４０１を横方向に、画
像４０２及び画像４０３の２つの画像に分割して入力し
たものである。

【００５２】この時、少なくても分割部分で行が１行以
上重複するように入力する。例えば、図４に示すよう
に、画像４０１の３、４行目での、「さしすせそ」と
「たちつてと」の２行が重複するように入力する。

【００５３】そして、これらの画像に対してレイアウト
解析処理、文字認識処理を行ない、その結果をそれぞれ
のレイアウト情報記憶部４０及び文字情報記憶部６０に
格納し、図４の４０４及び４０５を得る。ここで、図４
の４０６及び４０７において破線で示された部分がレイ
アウト情報と文字認識情報であり、１行目に対しては文
字コード「あいうえお」と「さしすせそ」が得られ、そ
の行単位及び文字単位の座標情報が得られる。

【００５４】結合行検出部７０において、行単位の結合
位置を検出する。例えば、図４の４０６及び４０７にお
いては、それぞれ分割部分に行が存在するので、結合対
象であることがわかる。さらに、結合行検出部７０にお
いて得られた結果から、結合文字検出部８０において、
文字単位での結合位置、すなわち対応する重複文字を検
出する。図４の４０８においては、文字コードの比較の
結果、３、４行目が結合対象であることがわかる。そし
て、結合文字検出部８０において得られた結果から、文
字結合部９０において文字の結合処理が行われて、原稿
４０１の認識結果として結果４０９が取得される。

【００５５】なお、本発明は上述した実施の形態及び実
施例に限定されるものではなく、その技術思想の範囲内
において様々に変形して実施することができる。実施例
では、原稿を左右又は上下に２分割して画像入力した例
を示したが、上下左右に２分割以上に分割した場合で
も、本発明を適用できるのは言うまでもない。

【００５６】

【発明の効果】以上説明したように本発明の文字分割装
置によれば、画像入力装置の最大有効読み取りサイズ以
下の複数の領域に分割して画像を入力し、それぞれの画
像に対して文字認識処理を実行し、自動的に認識結果を
１つに結合するため、画像入力手段の最大有効読み取り
サイズに依存せずに、様々な大きさの原稿に対する文字
認識処理を簡単な操作で実現することができる。

【００５７】また、複数の画像を結合する制御が不要な
ため、画像の結合によって生じる認識結果の誤りを軽減
することができることである。その理由は、画像を１つ
に結合してから文字認識処理を行なうのではなく、文字
認識処理した複数の認識結果を１つに結合するためであ
る。

【図面の簡単な説明】

【図１】本発明の実施の形態による文字認識装置の構
成を示すブロック図である。

【図２】本発明の実施の形態による文字認識装置の動
作を示すフローチャートである。

【図３】本発明の文字認識装置によって文字認識処理
を行なった第１の実施例を示す図である。

【図４】本発明の文字認識装置によって文字認識処理
を行なった第２の実施例を示す図である。

【符号の説明】

１０画像入力部２０画像記憶部３０レイアウト解析部４０レイアウト情報記憶部５０文字認識部６０文字情報記憶部７０結合行検出部８０結合文字検出部９０文字結合部１００出力部３０１、４０１原稿３０２、３０３、４０２、４０３分割入力画像３０４、３０５、４０４、４０５認識結果３０６、３０７、４０６、４０７レイアウト情報と文
字認識情報３０８、４０８結合結果３０９、４０９出力結果

Claims

【特許請求の範囲】

【請求項１】原稿を量子化された画像として入力する
画像入力手段によって、前記原稿を各領域に含まれる文
字が少なくとも１文字以上が重複して存在するように複
数の領域に分割し、各領域毎に入力された画像を格納す
る画像記憶手段と、前記画像記憶手段に格納された画像に対し、レイアウト
解析処理を行ない、少なくとも文書の行、文字の領域属
性や領域の座標情報を含むレイアウト情報を抽出するレ
イアウト解析手段と、レイアウト解析によって得られたレイアウト情報を格納
するレイアウト情報記憶手段と、前記画像記憶手段に格納されている画像と前記レイアウ
ト情報記憶手段に格納されているレイアウト情報とに基
づいて、画像内の文字に対応する文字コードや、候補文
字の文字コード、文字の座標を含む文字認識情報を得る
文字認識手段と、前記文字認識手段によって得られた前記文字認識情報を
格納する文字情報記憶手段と、前記レイアウト情報記憶手段に格納されたレイアウト情
報をもとに、分割された各領域の画像中の含まれる行の
うちで、互いに相対応する行を検出する結合行検出手段
と、前記結合行検出手段によって得られた対応結果と前記文
字情報記憶手段に格納された文字認識情報をもとに、相
対応する行に含まれる文字のうちで、互いに重複する文
字を検出して前記複数の領域に対応する複数の前記文字
認識情報の結合位置を検出する結合文字検出手段と、前記結合行検出手段及び結合文字検出手段によって得ら
れた対応結果をもとに、前記文字情報記憶手段に格納さ
れた前記文字認識情報を結合する文字結合手段と、前記文字結合手段によって得られた結果を出力する出力
手段とを備えることを特徴とする文字認識装置。
【請求項２】前記結合行検出手段は、前記レイアウト
情報記憶手段に格納された複数の画像に対応するレイア
ウト情報をともに、前記画像の分割部分において画像毎
に行単位の座標比較を行なうことにより、互いに相対応
する行を検出することを特徴とする請求項１に記載の文
字認識装置。
【請求項３】前記結合文字検出手段は、前記結合行検
出手段によって検出された互いに相対応する行に含まれ
る文字の文字コードの比較を行なうことにより、重複す
る文字の検出を行なうことを特徴とする請求項１に記載
の文字認識装置。
【請求項４】前記結合行検出手段は、前記レイアウト
情報記憶手段に格納された複数の画像に対応するレイア
ウト情報をともに、前記画像の分割部分において画像毎
に行単位の座標比較を行なうことにより、互いに相対応
する行を検出し、前記結合文字検出手段は、前記結合行検出手段によって
検出された互いに相対応する行に含まれる文字の文字コ
ードの比較を行なうことにより、互いに相対応する行に
含まれる文字の文字コードが少なくとも部分的に一致す
る場合に、前記複数の領域に対応する複数の前記文字認
識情報の結合位置として検出することを特徴とする請求
項１に記載の文字認識装置。
【請求項５】原稿を各領域に含まれる文字が少なくと
も１文字以上が重複して存在するように複数の領域に分
割し、前記各領域毎に画像を入力するステップと、入力された前記画像に対し、レイアウト解析処理を行な
い、少なくとも文書の行、文字の領域属性や領域の座標
情報を含むレイアウト情報を抽出するステップと、入力された画像とレイアウト解析によって得られたレイ
アウト情報とに基づいて、画像内の文字に対応する文字
コードや、候補文字の文字コード、文字の座標を含む文
字認識情報を得るステップと、前記レイアウト情報をもとに、分割された各領域の画像
中の含まれる行のうちで、互いに相対応する行を検出す
るステップと、検出された互いに相対応する行と、前記文字認識情報を
基に、相対応する行に含まれる文字のうちで、互いに重
複する文字を検出して前記複数の領域に対応する複数の
前記文字認識情報の結合位置を検出するステップと、検出された互いに相対応する行と前記文字認識情報の結
合位置を基に、前記文字認識情報を結合するステップと
を備えることを特徴とする文字認識方法。
【請求項６】前記相対応する行の検出ステップでは、
前記複数の画像に対応するレイアウト情報をともに、前
記画像の分割部分において画像毎に行単位の座標比較を
行なうことにより、互いに相対応する行を検出し、前記結合位置の検出ステップでは、検出された互いに相
対応する行に含まれる文字の文字コードの比較を行なう
ことにより、互いに相対応する行に含まれる文字の文字
コードが少なくとも部分的に一致する場合に、前記複数
の領域に対応する複数の前記文字認識情報の結合位置と
して検出することを特徴とする請求項５に記載の文字認
識方法。