JPH01130293A - 文書画像解析方式 - Google Patents
文書画像解析方式Info
- Publication number
- JPH01130293A JPH01130293A JP62290207A JP29020787A JPH01130293A JP H01130293 A JPH01130293 A JP H01130293A JP 62290207 A JP62290207 A JP 62290207A JP 29020787 A JP29020787 A JP 29020787A JP H01130293 A JPH01130293 A JP H01130293A
- Authority
- JP
- Japan
- Prior art keywords
- block
- blocks
- area
- character
- document image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003703 image analysis method Methods 0.000 claims description 13
- 238000013500 data storage Methods 0.000 abstract description 24
- 239000000284 extract Substances 0.000 abstract description 9
- 238000000605 extraction Methods 0.000 abstract description 8
- 238000000034 method Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 15
- 238000007689 inspection Methods 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 5
- 239000011295 pitch Substances 0.000 description 5
- 239000000470 constituent Substances 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 238000002910 structure generation Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000012916 structural analysis Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007373 indentation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Landscapes
- Character Input (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本願発明は、文書画像を文字行・文字等のその構成要素
に分割し、所望の領域を自動抽出する文書画像解析方式
に係わり、特に、文書画像を文字行・文字等の要素に分
解し、文章の流れを含む所望の領域を自動抽出するのに
適した文書画像解析方式、に係わる。・ 1 (従来の技術及びその問題点) 多量の既存文書−画像′の効率的な蓄積・検索や画像伝
送を行ったり、また、一般書籍を自動的に読み取るため
には、固着書式を持つ帳票の予め定められた特定の文字
イメージ列のみの文字読取りを行うだけでなく、多種多
様の文書画像を解析し、文字゛領域や図表領域の分離、
更には所望の領域を自動抽出することが必要となる。
に分割し、所望の領域を自動抽出する文書画像解析方式
に係わり、特に、文書画像を文字行・文字等の要素に分
解し、文章の流れを含む所望の領域を自動抽出するのに
適した文書画像解析方式、に係わる。・ 1 (従来の技術及びその問題点) 多量の既存文書−画像′の効率的な蓄積・検索や画像伝
送を行ったり、また、一般書籍を自動的に読み取るため
には、固着書式を持つ帳票の予め定められた特定の文字
イメージ列のみの文字読取りを行うだけでなく、多種多
様の文書画像を解析し、文字゛領域や図表領域の分離、
更には所望の領域を自動抽出することが必要となる。
従来、このような文書画像の構造解析方式として、本願
発明者と同一人による「スプリット検出法に基づく頁画
像の構造解析J l子通信学会技術研究報告パターン
認識と学習PRL85−17.1985−6゜63ペー
ジ〜70ページ)なる技術論文に記載されているように
、垂直又は水平方向の射影情報交互に抽出しながら大局
的領域から局所的領域に分解した後、文書の構成要素を
決める方式がある。ここで、上記方式は、書籍の本文等
の文字読取りを前提として行われたものである。そのた
め、一般文書に見られる段組の存在や特定な文書領域の
文字読取りを前提とした場合には、文書画像を構成する
配置関係が得られていないから、文書画像の要素及び要
素間の配置関係を求めることが必要となる。
発明者と同一人による「スプリット検出法に基づく頁画
像の構造解析J l子通信学会技術研究報告パターン
認識と学習PRL85−17.1985−6゜63ペー
ジ〜70ページ)なる技術論文に記載されているように
、垂直又は水平方向の射影情報交互に抽出しながら大局
的領域から局所的領域に分解した後、文書の構成要素を
決める方式がある。ここで、上記方式は、書籍の本文等
の文字読取りを前提として行われたものである。そのた
め、一般文書に見られる段組の存在や特定な文書領域の
文字読取りを前提とした場合には、文書画像を構成する
配置関係が得られていないから、文書画像の要素及び要
素間の配置関係を求めることが必要となる。
一方、文書画像の所定の領域を抽出する方式として、例
えば、特願昭41−281377号「画像理解方式」に
示されたように、文書画f象を複数個の矩形領域の集合
として定義された文法に従って抽出すべき領域を求める
方式が知られている。しかしながら、矩形領域の位置・
サイズを絶対又は相対座標をベースにすべて定義するこ
とは、労力を必要とし、また、書籍等の文書画像の文章
を読み取るという場合には、座標による矩形領域の定義
は、行数の変化や図等の混在により実用上困難となる。
えば、特願昭41−281377号「画像理解方式」に
示されたように、文書画f象を複数個の矩形領域の集合
として定義された文法に従って抽出すべき領域を求める
方式が知られている。しかしながら、矩形領域の位置・
サイズを絶対又は相対座標をベースにすべて定義するこ
とは、労力を必要とし、また、書籍等の文書画像の文章
を読み取るという場合には、座標による矩形領域の定義
は、行数の変化や図等の混在により実用上困難となる。
そこで、本願発明の目的は、従来の上記問題点を解決す
るために、1つないし複数個の要素領域(以下、ブロッ
クと呼ぶ)間の関係として、包含関係及び上下又は左右
の配置間1系に従って、文書画像の構造を階層構造とし
て自動生成し、相対内置、置関係により所定の領域を抽
出する文書画像解析方式を提供することにある。
るために、1つないし複数個の要素領域(以下、ブロッ
クと呼ぶ)間の関係として、包含関係及び上下又は左右
の配置間1系に従って、文書画像の構造を階層構造とし
て自動生成し、相対内置、置関係により所定の領域を抽
出する文書画像解析方式を提供することにある。
本願発明の他の目的は、種々な文書画像のブロック間の
関係を自動生成することによって、文章領域の読み取る
べき順序や文書の構造を容易に検出できる文書画像解析
方式を提供することにある。
関係を自動生成することによって、文章領域の読み取る
べき順序や文書の構造を容易に検出できる文書画像解析
方式を提供することにある。
本願発明の他の目的は、目的に応じて定められる特定な
領域の抽出を容易に行える文書画像解析方式を提供する
ことにある。
領域の抽出を容易に行える文書画像解析方式を提供する
ことにある。
本願発明の他の目的は、文字行内の所定の位置に存在、
する空白ブロックも含めて、文字行の形状を抽出し、文
章領域の論理的配置構造を生成する文書画像解析方式を
提供することにある。
する空白ブロックも含めて、文字行の形状を抽出し、文
章領域の論理的配置構造を生成する文書画像解析方式を
提供することにある。
(問題点を解決するための手段)
前述の問題点を解決するために本願の第1の発明が提供
する文書画像解析方式は、文書画像を文!行、文字等の
要素領域に分解する手段と1.1つ各は複数個の要素領
域をブロックとして構造化する際、各ブロックの包含関
係及び上下又は左右の配置関係に従って、ブロック属性
及びブロック間の配置構造を階層的に決定し、記憶する
文8構造生成手段と、ブロックの属性及びブロック間の
階層的な配置構造から、文書画像内の抽出すべき領域又
はそれを構成する1つ若しくは複数個のブロックを探索
する領域探索手段とを有してなる。
する文書画像解析方式は、文書画像を文!行、文字等の
要素領域に分解する手段と1.1つ各は複数個の要素領
域をブロックとして構造化する際、各ブロックの包含関
係及び上下又は左右の配置関係に従って、ブロック属性
及びブロック間の配置構造を階層的に決定し、記憶する
文8構造生成手段と、ブロックの属性及びブロック間の
階層的な配置構造から、文書画像内の抽出すべき領域又
はそれを構成する1つ若しくは複数個のブロックを探索
する領域探索手段とを有してなる。
また、前述の問題点を解決するために本願の第2の発明
が提供する文書画像解析方式は、文書画像を文字行、文
字等の要素領域に分解する手段と、1つ又は複数個の要
素領域をブロックとして構造化する際、各ブロックの包
含関係及び上下又は左右の配置関係に従って、ブロック
の属性及びブロック間の配置構造を階層的に決定し、記
憶する文書m造生成手段と、文字行ブロック内の所定の
位置・大きさを持つ空白を空白ブロックとして抽出する
手段と、文書構造生成手段によって生成された複数個の
文字行を含むブロックから空白ブロックを基にして各文
字行ブロックの形状を調べ、文書画像に於ける配置構造
を更新する文書構造更新手段と、前記階層的な配置構造
から文書画像内の抽出すべき領域又はそれを構成する1
つ若しくは複数個のブロックを探索する領域探索手段と
を有してなる。
が提供する文書画像解析方式は、文書画像を文字行、文
字等の要素領域に分解する手段と、1つ又は複数個の要
素領域をブロックとして構造化する際、各ブロックの包
含関係及び上下又は左右の配置関係に従って、ブロック
の属性及びブロック間の配置構造を階層的に決定し、記
憶する文書m造生成手段と、文字行ブロック内の所定の
位置・大きさを持つ空白を空白ブロックとして抽出する
手段と、文書構造生成手段によって生成された複数個の
文字行を含むブロックから空白ブロックを基にして各文
字行ブロックの形状を調べ、文書画像に於ける配置構造
を更新する文書構造更新手段と、前記階層的な配置構造
から文書画像内の抽出すべき領域又はそれを構成する1
つ若しくは複数個のブロックを探索する領域探索手段と
を有してなる。
(実施例)
以下本願発明の実施例について図面を参照しながら説明
する。
する。
第1図及び第2図は、それぞれI書さ及び横書きで記載
された文書画像の構成を説明するために用いた一例であ
る。
された文書画像の構成を説明するために用いた一例であ
る。
図中、黒丸は文字を示し、斜線で示した矩形領域(図中
F、)を図、表、写真などの要素とする。
F、)を図、表、写真などの要素とする。
従来の文書画像の領域分割方式あるいは行抽出方式など
を用いると、第1図及び第2図の記号St(第1図では
i=1・・・7.第2図ではi=1・・・15)で示し
た文字行領域あるいは第1図の記号F1で示し図/表/
写真などの領域(以下゛、画素記述領域と呼ぶ)が抽出
できる。
を用いると、第1図及び第2図の記号St(第1図では
i=1・・・7.第2図ではi=1・・・15)で示し
た文字行領域あるいは第1図の記号F1で示し図/表/
写真などの領域(以下゛、画素記述領域と呼ぶ)が抽出
できる。
次に、文章情報の流れに着目すると、通常第1図で示す
縦書きの場合、縦書きである文字行は右から左へと文章
情報が流れ、文字行内の各文字は上から下へと文字情報
が流れる。即ち、第1図の各文字行の配置関係は、左右
関係があり、各文字行内の各文字の配置は、上下関係と
なる。また、画素記述領域F+は文字行Ss 、S6.
Stの上にあるなどの配置関係が存在する。そこで、第
1図の図中Ti (i=1.2)で示したブロック、即
ち、文章領域を検出すると、左右間係を持つ文字行から
成る2つの文章領域TrとT2が左右関係に有り更に画
素記述領域lマ、と文・章領域T2とは上下関係である
ことが容易にかわる。そこで、上述した包含関係及び上
下又は左右の配置関係を抽出することによって、例えば
、文章領域T1からT2へと順次、文字行内の文字を抽
出し、文字コードに変換しなり、あるいは、画素記述領
域F1の下にある文章領域のみを抽出することなどが容
易に可能となる。
縦書きの場合、縦書きである文字行は右から左へと文章
情報が流れ、文字行内の各文字は上から下へと文字情報
が流れる。即ち、第1図の各文字行の配置関係は、左右
関係があり、各文字行内の各文字の配置は、上下関係と
なる。また、画素記述領域F+は文字行Ss 、S6.
Stの上にあるなどの配置関係が存在する。そこで、第
1図の図中Ti (i=1.2)で示したブロック、即
ち、文章領域を検出すると、左右間係を持つ文字行から
成る2つの文章領域TrとT2が左右関係に有り更に画
素記述領域lマ、と文・章領域T2とは上下関係である
ことが容易にかわる。そこで、上述した包含関係及び上
下又は左右の配置関係を抽出することによって、例えば
、文章領域T1からT2へと順次、文字行内の文字を抽
出し、文字コードに変換しなり、あるいは、画素記述領
域F1の下にある文章領域のみを抽出することなどが容
易に可能となる。
同様に゛、第2図で示すような横書きの場合、通常、横
書きである文字行内の各文字は、左から右へと情報が流
れ、横書きの各文字行から成る文章領域は、上から下へ
と情報が流れる0例えば、図中の各文字行S+(i=1
・・・15)において、文字行S1から文字行S5及び
文字行S6から文字行S 10及び文字行S++から文
字行S+sはそれぞれ、上下関係を持つ文字行から文章
領tJAT+ 、 ’rs 。
書きである文字行内の各文字は、左から右へと情報が流
れ、横書きの各文字行から成る文章領域は、上から下へ
と情報が流れる0例えば、図中の各文字行S+(i=1
・・・15)において、文字行S1から文字行S5及び
文字行S6から文字行S 10及び文字行S++から文
字行S+sはそれぞれ、上下関係を持つ文字行から文章
領tJAT+ 、 ’rs 。
T6から形成されている。また、二段組に類似する構造
として、文章領域T s 、 T aが存在し、情報の
流れとして左右関係を持つ文章領域T5゜T6により文
章領域T4が形成されていると見ることができる。
として、文章領域T s 、 T aが存在し、情報の
流れとして左右関係を持つ文章領域T5゜T6により文
章領域T4が形成されていると見ることができる。
また、第1図で示すように、文章領域T1内で、文字ピ
ッチが異なる性質の文字行が存在した場合、更に、上下
関係を保持する文字行から構成された文章領域T、を文
章領域とT3に分解しても、それぞれ上下関係が成立す
ることになる。
ッチが異なる性質の文字行が存在した場合、更に、上下
関係を保持する文字行から構成された文章領域T、を文
章領域とT3に分解しても、それぞれ上下関係が成立す
ることになる。
以上説明したように、文章画像の構成要素の配置関係及
び文章情報を流れを表現する場合、各要素間の関係を上
下関係と左右関係(I書きの場合、右左関係、横書きの
場合、左右関係)を階層的に検出し生成することによっ
て可能となることがわかる。
び文章情報を流れを表現する場合、各要素間の関係を上
下関係と左右関係(I書きの場合、右左関係、横書きの
場合、左右関係)を階層的に検出し生成することによっ
て可能となることがわかる。
第3図(a>、(b)、(c)は、ブロック間の上下及
び左右関係を交互に規定しながら階層的に領域分割を行
う方式の一例である。
び左右関係を交互に規定しながら階層的に領域分割を行
う方式の一例である。
上記領域分割を実現する方法として、同一出願人による
「スプリット検出法に基づく頁画像の構造解析」に記載
されている。そこで、本説明では、詳細は省略し、第3
図(a)、(bl、(c)により、上記領域分割は、各
ブロックが上下又は左右の配置関係を保持しつつ階層的
に紙面の構成要素に分解する一方法であることを示す。
「スプリット検出法に基づく頁画像の構造解析」に記載
されている。そこで、本説明では、詳細は省略し、第3
図(a)、(bl、(c)により、上記領域分割は、各
ブロックが上下又は左右の配置関係を保持しつつ階層的
に紙面の構成要素に分解する一方法であることを示す。
尚、上記方式は、黒素の値(黒又は白の2値)を水平、
垂直に射影し、その画素計数値を示す分布(投影分布)
を用いているが、本発明はこれに限定されるものではな
く、黒白の変化点の計数値や予め輪かくトレースで求ま
る矩形情報を水平、垂直に射影して重なりを持つ領域情
報を用いても良い。
垂直に射影し、その画素計数値を示す分布(投影分布)
を用いているが、本発明はこれに限定されるものではな
く、黒白の変化点の計数値や予め輪かくトレースで求ま
る矩形情報を水平、垂直に射影して重なりを持つ領域情
報を用いても良い。
第3図(a)において領域分割対象となる文書画像の領
域Pには、黒丸で示した文字及び矩形ど゛斜線で基すよ
うな画素記述領域を含んでおり、2第1図で示した縦書
き文書画像と類似した構造を持っている。
域Pには、黒丸で示した文字及び矩形ど゛斜線で基すよ
うな画素記述領域を含んでおり、2第1図で示した縦書
き文書画像と類似した構造を持っている。
第2図で使用される記号Rt (L、、)(L、、=
1.2,3.・・・、i=1.2,3.・・・)は、投
影分布(図中斜線で示した図形)を用いた階層的領域分
割過程で得られるブロックを示しており、上記記号し、
、は、分割レベルを示すものとする。また、分割レベル
L、、は、階層深さを表わすと共に、投影情報を求める
際の方向をも表わしている。即ち、水平方向の投影情報
により分割された複数個の領域の分割レベルし、、は奇
数値を持ち、垂直方向の投影情報により分割された複数
個の領域の分割レベルし、、は偶数値を持つことになる
。更に、水平方向(垂直方向)の投影分布により分割さ
れた複数個の領域がそれぞれ上下関係(左右関係)が保
存されることは明らかである。
1.2,3.・・・、i=1.2,3.・・・)は、投
影分布(図中斜線で示した図形)を用いた階層的領域分
割過程で得られるブロックを示しており、上記記号し、
、は、分割レベルを示すものとする。また、分割レベル
L、、は、階層深さを表わすと共に、投影情報を求める
際の方向をも表わしている。即ち、水平方向の投影情報
により分割された複数個の領域の分割レベルし、、は奇
数値を持ち、垂直方向の投影情報により分割された複数
個の領域の分割レベルし、、は偶数値を持つことになる
。更に、水平方向(垂直方向)の投影分布により分割さ
れた複数個の領域がそれぞれ上下関係(左右関係)が保
存されることは明らかである。
最初に、解析対象領域Pに対して、水平投影分布H1が
適用され、領域R1(1)が得られる。
適用され、領域R1(1)が得られる。
次にブロックR,(1)に垂直投影分布■窃が適用され
、ブロックRt (2) 、・・・R1(2)が得ら
れる。ここで、分割レベル2を持つ5個の領域は、順次
、左右関係を満足していることは明らかである。また、
ブロックR,(1)と1つないし複数個のブロックR1
(2)・・・R5(2)は包含関係を満たずことも明ら
かである。尚、5個のブロックをどのように分割するか
は、各ブロックの特徴及び各ブロック間の特徴量(空白
値や相関比)をその親ブロックR1(1)の特徴(例え
ば識別子)と5個のブロックR,(2)・・・、R5(
2)の特徴に応じて場合分けを行い、検査することによ
って決定される。第3図(a)の場合では、5つのブロ
ックに分割され、ブロックR,(2)には識別〒として
未確定、R2(2)ないしR9(2)には文字行候補と
いう識別子が付加され、記憶される。領域分割は、Af
&型探木探索技法いられているために、次に分割すべき
ブロックとしてブロックR,(2)が取り出され、同様
な処理が繰り返される。ブロックRs(2)に対しては
水平投影分布を適用すると、複数個の文字候補領域が得
られるため、この時点でブロックR51)の分割が停止
し、複数個の文字候補領域も含めて記憶される。同様に
、ブロックRa(2)、Ri(2)、R2(2)が順次
、水平投影分布を適用され、ブロックRs<2)の場合
と同様な処理が行われる0次に、ブロックR+(2)に
対して、第3図(b)で示したように、水平投影分布H
2が適用され、2つのブロックR,(3)、Rt(3)
が得られ、前述と同様な処理が行われる。
、ブロックRt (2) 、・・・R1(2)が得ら
れる。ここで、分割レベル2を持つ5個の領域は、順次
、左右関係を満足していることは明らかである。また、
ブロックR,(1)と1つないし複数個のブロックR1
(2)・・・R5(2)は包含関係を満たずことも明ら
かである。尚、5個のブロックをどのように分割するか
は、各ブロックの特徴及び各ブロック間の特徴量(空白
値や相関比)をその親ブロックR1(1)の特徴(例え
ば識別子)と5個のブロックR,(2)・・・、R5(
2)の特徴に応じて場合分けを行い、検査することによ
って決定される。第3図(a)の場合では、5つのブロ
ックに分割され、ブロックR,(2)には識別〒として
未確定、R2(2)ないしR9(2)には文字行候補と
いう識別子が付加され、記憶される。領域分割は、Af
&型探木探索技法いられているために、次に分割すべき
ブロックとしてブロックR,(2)が取り出され、同様
な処理が繰り返される。ブロックRs(2)に対しては
水平投影分布を適用すると、複数個の文字候補領域が得
られるため、この時点でブロックR51)の分割が停止
し、複数個の文字候補領域も含めて記憶される。同様に
、ブロックRa(2)、Ri(2)、R2(2)が順次
、水平投影分布を適用され、ブロックRs<2)の場合
と同様な処理が行われる0次に、ブロックR+(2)に
対して、第3図(b)で示したように、水平投影分布H
2が適用され、2つのブロックR,(3)、Rt(3)
が得られ、前述と同様な処理が行われる。
第3図(b)の場合には、ブロックR+ (3)とR
t(3)は未確定という識別子が付加され、記憶される
。この時、ブロックR1(3)とブロックR2(3)は
上下関係が成立し、その親ブロックはR1(2)である
0次に、ブロックR2(3)に対して、第3図(c)で
示すように、垂直投影分布V4が適用され、3つの文字
行候補ブロックR1<4>、R2(4)、R3(4)が
得られる。
t(3)は未確定という識別子が付加され、記憶される
。この時、ブロックR1(3)とブロックR2(3)は
上下関係が成立し、その親ブロックはR1(2)である
0次に、ブロックR2(3)に対して、第3図(c)で
示すように、垂直投影分布V4が適用され、3つの文字
行候補ブロックR1<4>、R2(4)、R3(4)が
得られる。
ま′た、ブロックR1(3)に対して、領域R2(3)
と同様に垂直射影分布を適用すると、1つのみであるた
め、これ以上分割ができず、また、そのブロックサイズ
などから図・表・写真等の画素表現ブロックという識別
子が与えられる。
と同様に垂直射影分布を適用すると、1つのみであるた
め、これ以上分割ができず、また、そのブロックサイズ
などから図・表・写真等の画素表現ブロックという識別
子が与えられる。
以上の如く操作を繰り返し、縦型探索が終了すると、第
4図で示した領域情報の木m造が生成されることになる
。
4図で示した領域情報の木m造が生成されることになる
。
尚、第4図で示した領域分割結果は、第3図(a)で示
した文書画像に対応して生成されたものであるが、第3
図(a)は第1図と類似した構造を持っているため、以
後述べる第4図の説明は、第1図に対応して行うことと
する。
した文書画像に対応して生成されたものであるが、第3
図(a)は第1図と類似した構造を持っているため、以
後述べる第4図の説明は、第1図に対応して行うことと
する。
第4図において、図中サークルで領域情報を表わし1.
記号S、は文字行、記号F、は画素表現領域(但し、添
字iは第1図との対応をとるために付加したものである
)を示すとし、黒丸は、文字領域情報を示する。また、
記号が付加されていないサークルは仮想ブロックを表わ
すとする。
記号S、は文字行、記号F、は画素表現領域(但し、添
字iは第1図との対応をとるために付加したものである
)を示すとし、黒丸は、文字領域情報を示する。また、
記号が付加されていないサークルは仮想ブロックを表わ
すとする。
更に、図中り、、は分割レベルを表わし、分割レベルが
奇数の時、各領域間に上・下関像が成立し、分割レベル
が偶数の時、各ブロック間に左右関係が成立する。ここ
で、第4図における本構造による階層表現において、分
割レベルiと分割レベルi+1 (i=1.2・・・)
の関係は包含関係が成立し、同一分割レベル内の各領域
は左右間係(図中ゆで示す)又は上下関係(図中8で示
す)が成立している。
奇数の時、各領域間に上・下関像が成立し、分割レベル
が偶数の時、各ブロック間に左右関係が成立する。ここ
で、第4図における本構造による階層表現において、分
割レベルiと分割レベルi+1 (i=1.2・・・)
の関係は包含関係が成立し、同一分割レベル内の各領域
は左右間係(図中ゆで示す)又は上下関係(図中8で示
す)が成立している。
次に、第4図で述べたブロック情報の属性値の一例につ
いて第5図を用いて説明する。第5図で示した分類名は
、解析対象、文字、線分、文字行、画素表現の各ブロッ
ク及び仮想ブロックである。
いて第5図を用いて説明する。第5図で示した分類名は
、解析対象、文字、線分、文字行、画素表現の各ブロッ
ク及び仮想ブロックである。
尚、仮想ブロックのうち、後述する構造化の過程で節、
文章などの分類名が付加される仮想ブロックが存在する
ことになる。
文章などの分類名が付加される仮想ブロックが存在する
ことになる。
位置・大きさは、ブロックの位置サイズを表わす、ブロ
ック間距離は、同一分割レベルで隣接するブロック間の
空白サイズを示す、子ブロック数は、自身の子ブロック
の数とする。尚、文字ブロックについては、例えば、本
願発明者と同一人による「分散最小基準に基づく適応型
文字分離方式」(電子通信学会論文誌D’ 85/8V
OL−J68−D、 NO,8,ヘージ1497〜15
04)に示されているような方法を用いて得られている
とする。また、文字行ブロック内の各文字を分離する場
合、空白文字が存在すれば、それも子ブロック数が0の
文字として収り扱うこととする。
ック間距離は、同一分割レベルで隣接するブロック間の
空白サイズを示す、子ブロック数は、自身の子ブロック
の数とする。尚、文字ブロックについては、例えば、本
願発明者と同一人による「分散最小基準に基づく適応型
文字分離方式」(電子通信学会論文誌D’ 85/8V
OL−J68−D、 NO,8,ヘージ1497〜15
04)に示されているような方法を用いて得られている
とする。また、文字行ブロック内の各文字を分離する場
合、空白文字が存在すれば、それも子ブロック数が0の
文字として収り扱うこととする。
子ブロック間配置属性は、自分の背下にある複数個の子
ブロックの配置関係を表わされる上下関係又は左右関係
(縦書きの時右−左関係、横書きの時定→右関係)を持
つ、子ブロック分類名群は、そのブロックに含まれる1
つないし複数個の分類名(線1文字行2文字1文章)と
その個数が格納される。尚、分類名1子ブロック間配置
属性、子ブロック分類名群などは、後述される構造化に
おいて更新・セットされる。また、子ブロック分類名群
には、文字行や文章の分類名は、縦書き、横書きに別け
て記憶されているものとする。
ブロックの配置関係を表わされる上下関係又は左右関係
(縦書きの時右−左関係、横書きの時定→右関係)を持
つ、子ブロック分類名群は、そのブロックに含まれる1
つないし複数個の分類名(線1文字行2文字1文章)と
その個数が格納される。尚、分類名1子ブロック間配置
属性、子ブロック分類名群などは、後述される構造化に
おいて更新・セットされる。また、子ブロック分類名群
には、文字行や文章の分類名は、縦書き、横書きに別け
て記憶されているものとする。
第6図は、第4図で示した領域分割結果から文書構造を
自動生成した一例を示している。第6図で示す文書構造
の記述生成は、第5図で示したブロック間の分類名を構
造化条件として用いた一例であり、文字行の集まりとし
た新たに文章という分類名を持つブロック(図中T、で
示す)が生成されることになる。
自動生成した一例を示している。第6図で示す文書構造
の記述生成は、第5図で示したブロック間の分類名を構
造化条件として用いた一例であり、文字行の集まりとし
た新たに文章という分類名を持つブロック(図中T、で
示す)が生成されることになる。
尚、構造化条件は、第4図の場合では、縦書きである。
縦書き・横書き情報は、予め与えても良いし、また、従
来技術を用いて自動決定しても良い、また、複数個のブ
ロックが構造化され、唯一の親10ツクとなる時には1
.新たなプロ・yりを生成する必要はない。
来技術を用いて自動決定しても良い、また、複数個のブ
ロックが構造化され、唯一の親10ツクとなる時には1
.新たなプロ・yりを生成する必要はない。
最初に、領域情報の探索として最も分割レベルの大きい
ブロック(文字行、線1文字行を形成しない文字1画素
表現の分類名を持つ0例えば、第4図の図中、ブロック
R1(4)、R2(4)。
ブロック(文字行、線1文字行を形成しない文字1画素
表現の分類名を持つ0例えば、第4図の図中、ブロック
R1(4)、R2(4)。
Rs’(4))とそれらの親ブロック(第4図の図中R
2(3)のみ)が取り出される0次に、構造化条件のう
ち、縦書き・横書きの情報及び分割レベルL 11 I
Iが検査される0分割レベルL、9が奇数の時、同−親
ブロックを持つ複数個のブロックを上下関係が成立する
順序で第5図で示した上下関係のポインタを用いて連結
することによって並べられる。一方、分割レベルL I
I IIが偶数の時には、文章の流れから見ると、横書
きでは右左間係(第6図で図中φで示す)が成立し、縦
書きでは、左右関係が成立する。そこで、前述した同−
親ブロックR2(3)を持つ複数個のブロック(第4図
の図中R+ (4)、R2(4>、R3(4))を、
左右関係が成立する順序で第5図で示した左右関係のポ
インタを用いて連結することによって並べられる(第6
図の図中R3(4)ゆR2(4)ゆR,(4))。
2(3)のみ)が取り出される0次に、構造化条件のう
ち、縦書き・横書きの情報及び分割レベルL 11 I
Iが検査される0分割レベルL、9が奇数の時、同−親
ブロックを持つ複数個のブロックを上下関係が成立する
順序で第5図で示した上下関係のポインタを用いて連結
することによって並べられる。一方、分割レベルL I
I IIが偶数の時には、文章の流れから見ると、横書
きでは右左間係(第6図で図中φで示す)が成立し、縦
書きでは、左右関係が成立する。そこで、前述した同−
親ブロックR2(3)を持つ複数個のブロック(第4図
の図中R+ (4)、R2(4>、R3(4))を、
左右関係が成立する順序で第5図で示した左右関係のポ
インタを用いて連結することによって並べられる(第6
図の図中R3(4)ゆR2(4)ゆR,(4))。
次に新たなブロックの生成又は親ブロックの属性が付加
される。第4図の例では、3つのブロックがRt (
4)、R2(4)、Rs (4)がすべて文字行とい
う分類名(図中S+ 、i=5.6゜7)を持っている
ため、その親ブロックR2(3)がそのまま文章として
の分類名(図中′r2)が付加される。ここで、分割レ
ベルL、1.子ブロック数、子ブロック間配置属性等の
ブロック情報のセット・更新が行われる。ここで、第4
図の場合では、分割レベル4の構造化が終了する。
される。第4図の例では、3つのブロックがRt (
4)、R2(4)、Rs (4)がすべて文字行とい
う分類名(図中S+ 、i=5.6゜7)を持っている
ため、その親ブロックR2(3)がそのまま文章として
の分類名(図中′r2)が付加される。ここで、分割レ
ベルL、1.子ブロック数、子ブロック間配置属性等の
ブロック情報のセット・更新が行われる。ここで、第4
図の場合では、分割レベル4の構造化が終了する。
次に、分割レベル3のブロック(第6図の図中ブロック
R,(3)、R2(3))とその親ブロックR+(2)
が取り出される。尚、分割レベル3の領域は、第6図の
図中黒丸で示す文字領域が存在するが、それらの親ブロ
ックの分類名は、文字行であるため、取り出されないと
する。
R,(3)、R2(3))とその親ブロックR+(2)
が取り出される。尚、分割レベル3の領域は、第6図の
図中黒丸で示す文字領域が存在するが、それらの親ブロ
ックの分類名は、文字行であるため、取り出されないと
する。
同様に分割レベル3の2つのブロックR+ (3)と
R2(3)に前述した構造化条件が検査される。
R2(3)に前述した構造化条件が検査される。
この場合、ブロックR1(3)(分類名として画素表現
が既に付加されている)とR2(3)(分類名として文
章)とが上下関係ポインターが付けられ、分類名として
仮想ブロック(第6図の図中記号M、)が付加される0
次に、子ブロック分類名群に、文章(記号T)1画素表
現(記号F)が、子ブロック間配置属性として、上下関
係等のブロック情報が更新・セットされる。
が既に付加されている)とR2(3)(分類名として文
章)とが上下関係ポインターが付けられ、分類名として
仮想ブロック(第6図の図中記号M、)が付加される0
次に、子ブロック分類名群に、文章(記号T)1画素表
現(記号F)が、子ブロック間配置属性として、上下関
係等のブロック情報が更新・セットされる。
ここで、分割レベル3の構造化が終了する。
次に分割レベル2のブロック(第6図ではR1(2)、
R2(2)、R3(2)、R4(2)。
R2(2)、R3(2)、R4(2)。
R,<2>)とその親ブロックR+(1)が取り出され
る。同様に、前述した構造化条件が検査され前に、Rs
(2)ないしR1(2)の順序で左右関係ポインタが付
けられる0次に、それらの分類名(この場合、4つの文
字行St 、 S2 、 Ss 。
る。同様に、前述した構造化条件が検査され前に、Rs
(2)ないしR1(2)の順序で左右関係ポインタが付
けられる0次に、それらの分類名(この場合、4つの文
字行St 、 S2 、 Ss 。
S、と文章と画素表現ブロックを上下関係に含む仮想ブ
ロックM+>が順次調べられる。
ロックM+>が順次調べられる。
この場合、4つの文字行が文章として構造化でき、更に
、それらの親ブロックR,(1)は、4つの文字行以外
に仮想ブロックM、を含んでいるため、新たな領域とし
て第6図図中矩形で示す分類名文章(T1)としてブロ
ックを生成する。次に、文字行ブロックS、と仮想ブロ
ックM1どの左右関係ポインタを切り離しく即ち、文字
行ブロックS、の左右関係ポインタをNULLとする。
、それらの親ブロックR,(1)は、4つの文字行以外
に仮想ブロックM、を含んでいるため、新たな領域とし
て第6図図中矩形で示す分類名文章(T1)としてブロ
ックを生成する。次に、文字行ブロックS、と仮想ブロ
ックM1どの左右関係ポインタを切り離しく即ち、文字
行ブロックS、の左右関係ポインタをNULLとする。
)、文章ブロックT+の左右関係ポインタに仮想ブロッ
クM1を示すアドレスを入れる。
クM1を示すアドレスを入れる。
更に4つの文字行ブロックSt 、32 、S、。
S4に於ける第5図で示した新領域ポインタに新たに生
成された文章ブロックT、を示すアドレスが記憶される
と共に、文章ブロック′r1に於ける第5図で示す子領
域ポインタには、先頭の子領域として文章ブロックS+
を示すアドレスが記憶される。次に、文章ブロックTI
の属性である分割レベル、をその子ブロックである4つ
の文字行31゜S2・・・S4と同一の分割レベル2と
して、セットし、更に、前述したような他の属性値もセ
ットされる0次に、新たに生成された文章ブロックT1
から順次左右関係となるブロック(この場合、文章ブロ
ックT1と仮想ブロックM+ )を取り出し、同様に前
述した構造化条件を調べる。この場合、ブロックR1(
1)に対して、仮想ブロック(図中M2)を表わす分類
名が与えられる。尚、仮想ブロックM2の第5図で示し
た子ブロック分類名群には、仮想ブロックMl (尚
、仮想ブロックの場合には、その仮想ブロックに含まれ
る分類名、第6図の場合には、画素表現F1と文章T、
)と文章ブロックT+の和、即ち2つの文章Tと画表表
現F)が格納される。
成された文章ブロックT、を示すアドレスが記憶される
と共に、文章ブロック′r1に於ける第5図で示す子領
域ポインタには、先頭の子領域として文章ブロックS+
を示すアドレスが記憶される。次に、文章ブロックTI
の属性である分割レベル、をその子ブロックである4つ
の文字行31゜S2・・・S4と同一の分割レベル2と
して、セットし、更に、前述したような他の属性値もセ
ットされる0次に、新たに生成された文章ブロックT1
から順次左右関係となるブロック(この場合、文章ブロ
ックT1と仮想ブロックM+ )を取り出し、同様に前
述した構造化条件を調べる。この場合、ブロックR1(
1)に対して、仮想ブロック(図中M2)を表わす分類
名が与えられる。尚、仮想ブロックM2の第5図で示し
た子ブロック分類名群には、仮想ブロックMl (尚
、仮想ブロックの場合には、その仮想ブロックに含まれ
る分類名、第6図の場合には、画素表現F1と文章T、
)と文章ブロックT+の和、即ち2つの文章Tと画表表
現F)が格納される。
以下、同様な操作を行うことにより、第6図で示す文書
構造が生成され、各ブロックには、第5図で示す各属性
値が決定される。
構造が生成され、各ブロックには、第5図で示す各属性
値が決定される。
そこで、第6図で示した文書構造の自動生成結果(第1
図の文書画像に対応する)を用いて、本発明の第1項に
記載された領域抽出法について説明する。第1項に記載
された領域抽出手段は、第6図で示したような木′ui
造を探索することにより所望の1つないし複数個のブロ
ックを所定の順序で抽出する。具体的な例として、下記
に示す2つの場合について説明する。最初に、第1図で
示した如く、書籍等見られる文章ブロックT1と文章ブ
ロックT2で示されたテキスト領域を文章として順次読
む場合を考える。
図の文書画像に対応する)を用いて、本発明の第1項に
記載された領域抽出法について説明する。第1項に記載
された領域抽出手段は、第6図で示したような木′ui
造を探索することにより所望の1つないし複数個のブロ
ックを所定の順序で抽出する。具体的な例として、下記
に示す2つの場合について説明する。最初に、第1図で
示した如く、書籍等見られる文章ブロックT1と文章ブ
ロックT2で示されたテキスト領域を文章として順次読
む場合を考える。
上記のような場合では、まず領域抽出手段は、第6図で
示した各ブロックの属性として、分類名、ブロック内分
類名群を順次ポインターを使って縦型探索を行うことに
より、第6図で示した文字行ブロックS、、32.33
、S4.S、、S、。
示した各ブロックの属性として、分類名、ブロック内分
類名群を順次ポインターを使って縦型探索を行うことに
より、第6図で示した文字行ブロックS、、32.33
、S4.S、、S、。
S7を文章を読゛み収るべき順序で容易に抽出すること
ができる。
ができる。
ここで、各ブロックにはブロック内分類名群が記載され
ているので、各ブロックに所望の文字行ブロックが含ま
れていなければ、このブロックの縦型探索を中止するこ
とができ、効率的に得られる。尚、所望の文字行ブロッ
ク(S、、S2・・・S7)の各文字イメージあるいは
従来技術を用いた文字認識も上記領域抽出手段によって
得られた結果から容易に求まることは言うまでもない。
ているので、各ブロックに所望の文字行ブロックが含ま
れていなければ、このブロックの縦型探索を中止するこ
とができ、効率的に得られる。尚、所望の文字行ブロッ
ク(S、、S2・・・S7)の各文字イメージあるいは
従来技術を用いた文字認識も上記領域抽出手段によって
得られた結果から容易に求まることは言うまでもない。
次に、第1図で示した如く、画素表現ブロックFlの下
にある3つの文章ブロックT2で示された領域のみを読
み取る場合を考える。
にある3つの文章ブロックT2で示された領域のみを読
み取る場合を考える。
この場合、領域抽出手段は、第6図で示した木構造で表
現された各ブロックを縦型探索を行いながら、各ブロッ
クの属性を調べるのは前述した文書画像のテキスト領域
の読み取りを行う場合と同様であるが、唯一の相違点は
最初に、キーとなる画素表現ブロックF1を探索する点
のみである。
現された各ブロックを縦型探索を行いながら、各ブロッ
クの属性を調べるのは前述した文書画像のテキスト領域
の読み取りを行う場合と同様であるが、唯一の相違点は
最初に、キーとなる画素表現ブロックF1を探索する点
のみである。
即ち、第6図で示した本構造に対して縦型探索を行うと
、まず文章ブロックT、が見つかる。文章ブロックT1
の中には、画素表現ブロックはないので、文章ブロック
TIの背方の探索が中止され、次に仮想ブロックM1が
調べられる。仮想ブロックM1のブロック内分類名群に
は、画素表現ブロックが存在するので、更に探索を行な
うことによって画素表現ブロックF+が検出される。こ
のようにして画素ブロックFIの下方にある文字行ブロ
ックSs 、S6.Stを抽出し、文字を読み取るのは
容易にできる。また例えば、画素表現F、の右側にあり
、隣接する文字行ブロックS4のみを抽出することも容
易にできる。
、まず文章ブロックT、が見つかる。文章ブロックT1
の中には、画素表現ブロックはないので、文章ブロック
TIの背方の探索が中止され、次に仮想ブロックM1が
調べられる。仮想ブロックM1のブロック内分類名群に
は、画素表現ブロックが存在するので、更に探索を行な
うことによって画素表現ブロックF+が検出される。こ
のようにして画素ブロックFIの下方にある文字行ブロ
ックSs 、S6.Stを抽出し、文字を読み取るのは
容易にできる。また例えば、画素表現F、の右側にあり
、隣接する文字行ブロックS4のみを抽出することも容
易にできる。
尚、第1図では、画素表現ブロックF +が1個のみで
あったが、複数個あるような場合には、キーとなるブロ
ック群を探索する時、領域のおおよその位置大きさを与
え、各ブロックの属性値としての位置、大きさとの検査
を含めてキーとなるブロック群を見つけることができる
ことは言うまでもない。
あったが、複数個あるような場合には、キーとなるブロ
ック群を探索する時、領域のおおよその位置大きさを与
え、各ブロックの属性値としての位置、大きさとの検査
を含めてキーとなるブロック群を見つけることができる
ことは言うまでもない。
第7図は、第2図で示した横書きの文書画像に対して領
域分割を行った結果を示す一例である。
域分割を行った結果を示す一例である。
尚、第7図で示す領域分割結果は、第4図で示した如く
、前述した同一出願人による「スプリット検出法に基づ
く頁画像の構造解析」に記載されているような従来技術
を用いて実現できる。また、図中、文字領域については
省略する。
、前述した同一出願人による「スプリット検出法に基づ
く頁画像の構造解析」に記載されているような従来技術
を用いて実現できる。また、図中、文字領域については
省略する。
第8図は、第7図の領域分割結果に対して文書構造の記
述生成を行った一例である。第8図で示す文書構造の自
動生成は、構造条件として第5図で示したブロック間の
分類名、ブロック間距離及び文字ピッチ推定値′を用い
た一例である。第8図の場合にも、第6図の場合と同様
な処理で実現でき、、第8図の場合には、第2図で示し
た文章ブロックT1が上記構造化条件から2つの文章ブ
ロックT2.T3に分解できる点が異なる。また、第8
図で示す仮想ブロックM、は、ブロック内分類名群とし
て2つのfJ書き文章を示す分類名、ブロック間配置属
性として左右関係を示し情報が記憶されている。尚、第
8図の場合、文字行ブロック文章ブロック等の左右の配
置関係は、横書きであるため、左→右への関、係で得ら
れ−る。
述生成を行った一例である。第8図で示す文書構造の自
動生成は、構造条件として第5図で示したブロック間の
分類名、ブロック間距離及び文字ピッチ推定値′を用い
た一例である。第8図の場合にも、第6図の場合と同様
な処理で実現でき、、第8図の場合には、第2図で示し
た文章ブロックT1が上記構造化条件から2つの文章ブ
ロックT2.T3に分解できる点が異なる。また、第8
図で示す仮想ブロックM、は、ブロック内分類名群とし
て2つのfJ書き文章を示す分類名、ブロック間配置属
性として左右関係を示し情報が記憶されている。尚、第
8図の場合、文字行ブロック文章ブロック等の左右の配
置関係は、横書きであるため、左→右への関、係で得ら
れ−る。
ここで第8図で示す本構造針探索することによって所望
の領域を抽出できることを示す0例えば、第2図で示す
文章ブロックT、とT6内の各文字を所定の順序で抽出
し、従来の文字認識を用いて文字コード列に変換する場
合を述べる。最初に、文章領域T s 、 T bから
成る2段組のブロック(図中仮想ブロックM”1)を探
索する。例えば、ブロックX及びy(ブロックX及びy
の条件として、その子ブロック配置属性が上下関係にあ
る)が左右関係Xφyを含むブロック(Xφy)を探索
すると、ブロック(Xφy)として第8図の仮想ブロッ
クM1が検出される。
の領域を抽出できることを示す0例えば、第2図で示す
文章ブロックT、とT6内の各文字を所定の順序で抽出
し、従来の文字認識を用いて文字コード列に変換する場
合を述べる。最初に、文章領域T s 、 T bから
成る2段組のブロック(図中仮想ブロックM”1)を探
索する。例えば、ブロックX及びy(ブロックX及びy
の条件として、その子ブロック配置属性が上下関係にあ
る)が左右関係Xφyを含むブロック(Xφy)を探索
すると、ブロック(Xφy)として第8図の仮想ブロッ
クM1が検出される。
次に、仮想ブロックM1から順次縦型探索をして、文字
行ブロックS6・・・srsを取り出し、それぞれの文
字行ブロックS6・・・315に各文字ブロックを順次
取りだして文字認識を行えば良い。
行ブロックS6・・・srsを取り出し、それぞれの文
字行ブロックS6・・・315に各文字ブロックを順次
取りだして文字認識を行えば良い。
尚、上述した2段組を意味するプロ・yりを探索する際
、ブロックX及びブロックYの条件としてその子ブロッ
ク配置属性のみを用いたが、属性として第5図で示す位
置、サイズ等も使用できる場合には、それを用いても良
い。
、ブロックX及びブロックYの条件としてその子ブロッ
ク配置属性のみを用いたが、属性として第5図で示す位
置、サイズ等も使用できる場合には、それを用いても良
い。
また、第8図の文章ブロックT1内の2つの文字行St
、Ssを探索することも例えば−2&(x<)y)(但
し、x、yは前述した条件とし、2は、文章ブロックと
する)を満たすブロック2を探索すると、第8図の文章
ブロック2が検出される。
、Ssを探索することも例えば−2&(x<)y)(但
し、x、yは前述した条件とし、2は、文章ブロックと
する)を満たすブロック2を探索すると、第8図の文章
ブロック2が検出される。
今、文字行ブロックS−、Ss即ち、第2図で示した2
段組の上方にある2つの文字行ブロックを見つけるので
あるから、例えば、z18z2 (但し、ブロックZl
、Z2はブロックZに含まれる文字行であり、z2は最
も下にあるブロックとする)を満たすブロックZ、、
z2を求めれば良い。
段組の上方にある2つの文字行ブロックを見つけるので
あるから、例えば、z18z2 (但し、ブロックZl
、Z2はブロックZに含まれる文字行であり、z2は最
も下にあるブロックとする)を満たすブロックZ、、
z2を求めれば良い。
尚、以上の説明で述べたように、第8図で示したような
本構造を探索し、所望のブロックを抽出する場合、予め
抽出すべき領域等をブロックの属性及び相対的配置関係
に従って言語として定義して置き、これに従って本構造
を探索するようにしても良いし、前述したように処理手
順をプログラムして置き、これに従って木構造を探索し
ても良い。
本構造を探索し、所望のブロックを抽出する場合、予め
抽出すべき領域等をブロックの属性及び相対的配置関係
に従って言語として定義して置き、これに従って本構造
を探索するようにしても良いし、前述したように処理手
順をプログラムして置き、これに従って木構造を探索し
ても良い。
以上、述べた如く、本願の第1の発明の文書画像解析方
式により抽出すべき領域は、第8図で示す本構造で表現
された入力文書画像のブロック群を探索することによっ
て求めることができる。尚、探索方法は、縦型探索とし
て説明したが横型探索を用いて行っても良い。
式により抽出すべき領域は、第8図で示す本構造で表現
された入力文書画像のブロック群を探索することによっ
て求めることができる。尚、探索方法は、縦型探索とし
て説明したが横型探索を用いて行っても良い。
第9図、第10図、第11図は本願の第1の発明の文書
画像解析方式を説明するための図である。第9図は、横
書き文書画像の一例である。第9図において、図中斜線
で示す矩形及び丸領域はそれぞれ図や表等の画素表現領
域1文字領域である。解析対象領域Pに対して、第3図
で述べた領域分割方式を適用すると、図中81 (但し
、i=1.・・・6)及びFで示す文字行ブロック及び
画素ブロックが得られる。ここで、Slは図の注釈やキ
ャプション等の文字を含む文字行とし、S2・・・S6
は通常の文章領域とする。文字行ブロック内の各文字は
、例えば、前述した文字分離方式によって一文字毎に切
り出され、図中点線で示したように分けられる。
画像解析方式を説明するための図である。第9図は、横
書き文書画像の一例である。第9図において、図中斜線
で示す矩形及び丸領域はそれぞれ図や表等の画素表現領
域1文字領域である。解析対象領域Pに対して、第3図
で述べた領域分割方式を適用すると、図中81 (但し
、i=1.・・・6)及びFで示す文字行ブロック及び
画素ブロックが得られる。ここで、Slは図の注釈やキ
ャプション等の文字を含む文字行とし、S2・・・S6
は通常の文章領域とする。文字行ブロック内の各文字は
、例えば、前述した文字分離方式によって一文字毎に切
り出され、図中点線で示したように分けられる。
ここで、図中C1よ+ CI+6. C241C311
C%3゜C6+で示す空白領域を始端及び終端の文字ブ
ロック位置と文字行ブロックの始端及び終端位置との比
較により求め、空白ブロックとする0次に、第8図で示
したようにして、第9図の文書構造の自動生成を行うと
、第10図で示すようになる。尚、第10図は、構造化
条件として、第5図で示したブロック間の分類名、ブロ
ック間距離及び文字ピッチ推定値を用いた一例である。
C%3゜C6+で示す空白領域を始端及び終端の文字ブ
ロック位置と文字行ブロックの始端及び終端位置との比
較により求め、空白ブロックとする0次に、第8図で示
したようにして、第9図の文書構造の自動生成を行うと
、第10図で示すようになる。尚、第10図は、構造化
条件として、第5図で示したブロック間の分類名、ブロ
ック間距離及び文字ピッチ推定値を用いた一例である。
ここで、文章は、通常、節、段下げなどを用いてパラグ
ラフなどの論理構造がとられ、この単位で文章領域を分
割して置くことは、文書イメージの文字コード列の変換
や所望の文書領域を抽出する際に有効である。
ラフなどの論理構造がとられ、この単位で文章領域を分
割して置くことは、文書イメージの文字コード列の変換
や所望の文書領域を抽出する際に有効である。
また、見出し、キャプションや章題なとは、文字行の始
端や終端あるいはその両方に空白ブロックが存在するこ
とが特徴の1つである。
端や終端あるいはその両方に空白ブロックが存在するこ
とが特徴の1つである。
そこで、文章ブロック1゛内の各文字行32゜S31・
・・S6に於ける空白ブロックCta、C31・C53
,C61に従って、文章ブロックTを分解すると、第1
1図に示す如く、文字行32.文字行S、。
・・S6に於ける空白ブロックCta、C31・C53
,C61に従って、文章ブロックTを分解すると、第1
1図に示す如く、文字行32.文字行S、。
S、、S、、から成るパラグラフブロックU1文字行S
6の3つのブロックから構成される。
6の3つのブロックから構成される。
また、文字行S、は文章ブロックTの上方にあり、また
画表ブロックFの下方にあり、両端に2つの空白ブロッ
クC11lC16があるため、画素ブロックFのキャン
プジョンを示す文字行ブロックであることがわかる。
画表ブロックFの下方にあり、両端に2つの空白ブロッ
クC11lC16があるため、画素ブロックFのキャン
プジョンを示す文字行ブロックであることがわかる。
以上のようにして、特に文章ブロック内の文字行の性質
や複数個の文字行ブロックの統合、更には、文字行ブロ
ック自身の論理的性質を抽出して置くことによって、前
述して抽出すべき領域を第11図で示すような木構造を
用いて探索する場合、容易となる。
や複数個の文字行ブロックの統合、更には、文字行ブロ
ック自身の論理的性質を抽出して置くことによって、前
述して抽出すべき領域を第11図で示すような木構造を
用いて探索する場合、容易となる。
第12図は本願の第1の発明の一実施例を示す論理ブロ
ック図である。
ック図である。
図において、1は文書画像を量子化された画像情報とし
て記憶する文書画像メモリである。2は領域分割部であ
る。領域分割部2は、文書画像メモリ1の文書画像に対
して第3図で説明したように、上下関係及び左右関係の
配置関係を保持しながら大局的領域から局小的領域へ領
域分割を行う機能を有しており、第4図あるいは第5図
で示したような領域分割過程で得られるブロック情報は
順次構造化データ記憶部4に格納する。ここで、領域分
割部2から出力されるブロック情報のうち、文字行ブロ
ックの子領域となる文字ブロックについては、文字分離
部15において1文字単位の領域情報に変換され、構造
化データ記憶部に格納される。
て記憶する文書画像メモリである。2は領域分割部であ
る。領域分割部2は、文書画像メモリ1の文書画像に対
して第3図で説明したように、上下関係及び左右関係の
配置関係を保持しながら大局的領域から局小的領域へ領
域分割を行う機能を有しており、第4図あるいは第5図
で示したような領域分割過程で得られるブロック情報は
順次構造化データ記憶部4に格納する。ここで、領域分
割部2から出力されるブロック情報のうち、文字行ブロ
ックの子領域となる文字ブロックについては、文字分離
部15において1文字単位の領域情報に変換され、構造
化データ記憶部に格納される。
また、領域分割部2は、領域分割結果から文書画像が縦
書きか横町きかを判定し、その結果を縦・横情報記憶部
3に記憶する。
書きか横町きかを判定し、その結果を縦・横情報記憶部
3に記憶する。
尚、!造化データ記憶部4に格納された各ブロック情報
のポインタ関連(親領域ポインタ、子領域ポインタ、上
下関係ポインタ、左右関係ポインタなど)の値は、各ブ
ロックの構造化データ記憶部4内での相対位置によって
表現されるとする。
のポインタ関連(親領域ポインタ、子領域ポインタ、上
下関係ポインタ、左右関係ポインタなど)の値は、各ブ
ロックの構造化データ記憶部4内での相対位置によって
表現されるとする。
更に、各ブロックには構造化データ記憶部4内の自分自
身の相対位置もブロックの属性値として相対位置ポイン
タに記憶されているとする。
身の相対位置もブロックの属性値として相対位置ポイン
タに記憶されているとする。
また、相対位置カウンタ11には領域分割部2から構造
化データ記憶部4に格納された最後のブロックの次の相
対位置が初期値として記憶されているとし、相対位置カ
ウンタ11はその値が読み出された時、各ブロック情報
単位でカウントアツプされるものとする。
化データ記憶部4に格納された最後のブロックの次の相
対位置が初期値として記憶されているとし、相対位置カ
ウンタ11はその値が読み出された時、各ブロック情報
単位でカウントアツプされるものとする。
次に、ブロック情報制御部4は第6図で示したように分
割レベルが最大となる構造化対象となる複数個のブロッ
ク及びそれらの親ブロック(分割レベルが1つ少ないブ
ロック)をペアーとじて構造化データ記憶部4から取り
出すと同時に、前述した分割レベル及び縦・横情報記憶
部3のMl書き/横書き情報を用いて、各ブロックの上
下関係及び左右関係ポインタに、そのブロックに連結す
るブロックの相対位置を記憶する。更に、それらの親ブ
ロックの子領域ポインタには、最初に親ブロックから探
索されるブロックの相対位置を記憶し、親ブロック及び
複数個の構造化対象ブロックを対象データ記憶部6に格
納する。
割レベルが最大となる構造化対象となる複数個のブロッ
ク及びそれらの親ブロック(分割レベルが1つ少ないブ
ロック)をペアーとじて構造化データ記憶部4から取り
出すと同時に、前述した分割レベル及び縦・横情報記憶
部3のMl書き/横書き情報を用いて、各ブロックの上
下関係及び左右関係ポインタに、そのブロックに連結す
るブロックの相対位置を記憶する。更に、それらの親ブ
ロックの子領域ポインタには、最初に親ブロックから探
索されるブロックの相対位置を記憶し、親ブロック及び
複数個の構造化対象ブロックを対象データ記憶部6に格
納する。
次に、ブロック情報制御部5は、対象データ記憶部6か
ら親ブロック及び複数個の構造化対象ブロックを読み出
し、構造化検査部8に転送する。
ら親ブロック及び複数個の構造化対象ブロックを読み出
し、構造化検査部8に転送する。
構造化検査部8は、第6図及び第8図で説明したように
、複数個の構造化対象ブロックの属性値に於ける構造化
条件を記憶した条件記憶部7の内容に従って、複数個の
構造化対象ブロックの属性値を順次検査する。上記検査
を順次行なった時、新たなブロックを生成する必要が生
じた場合、前述した親ブロック及び複数個の構造化対象
ブロックをブロック生成部9に転送する。ブロック生成
部9では、複数個の構造化対象ブロックのうち、構造化
されるべき複数個にブロックの属性に従って新たなブロ
ックを生成し、第6図及び第8図を用いて説明したよう
に、新たなブロックの子領域ポインタに、構造化される
べき先頭のプロ・ツクの相対位置を記憶し、構造化され
るべき複数個のブロックの親領域ポインタには、新たに
生成されたブロックの相対位置を記憶する0次に、構造
化されるべき複数個のブロックと未検査となっているブ
ロックとの上下又は左右関係のポインタの切り離し処理
が行われる。
、複数個の構造化対象ブロックの属性値に於ける構造化
条件を記憶した条件記憶部7の内容に従って、複数個の
構造化対象ブロックの属性値を順次検査する。上記検査
を順次行なった時、新たなブロックを生成する必要が生
じた場合、前述した親ブロック及び複数個の構造化対象
ブロックをブロック生成部9に転送する。ブロック生成
部9では、複数個の構造化対象ブロックのうち、構造化
されるべき複数個にブロックの属性に従って新たなブロ
ックを生成し、第6図及び第8図を用いて説明したよう
に、新たなブロックの子領域ポインタに、構造化される
べき先頭のプロ・ツクの相対位置を記憶し、構造化され
るべき複数個のブロックの親領域ポインタには、新たに
生成されたブロックの相対位置を記憶する0次に、構造
化されるべき複数個のブロックと未検査となっているブ
ロックとの上下又は左右関係のポインタの切り離し処理
が行われる。
尚、新たに生成されたブロックの相対位置ポインタには
相対位置カウンタ11の値が読み出され、セットされて
いるものとする。
相対位置カウンタ11の値が読み出され、セットされて
いるものとする。
また、新たに生成されたブロックの親領域ポインタには
、その構造化されるべき複数個のブロックに於ける親ブ
ロックの相対位置が記憶される。
、その構造化されるべき複数個のブロックに於ける親ブ
ロックの相対位置が記憶される。
次に、ブロック生成部9によって、複数個の構造化対象
ブロックのうち、前述したようにして構造化された複数
個のブロックが、構造化データ記憶部4の所定の相対位
置に書き込まれ、新たに生成されたプロ′ツク及び複数
個の構造化対象となる未検査ブロックとその親ブロック
が再度構造化検査部8へ送られ、前述した処理が繰り返
される6次に、構造化検査部8で141次検査される複
数個の構造化対象ブロックに対して新たなブロックを生
成する必要がない場合、複数個の構造化されるべきブロ
ック及びその親ブロックを属性決定部10へ転送する。
ブロックのうち、前述したようにして構造化された複数
個のブロックが、構造化データ記憶部4の所定の相対位
置に書き込まれ、新たに生成されたプロ′ツク及び複数
個の構造化対象となる未検査ブロックとその親ブロック
が再度構造化検査部8へ送られ、前述した処理が繰り返
される6次に、構造化検査部8で141次検査される複
数個の構造化対象ブロックに対して新たなブロックを生
成する必要がない場合、複数個の構造化されるべきブロ
ック及びその親ブロックを属性決定部10へ転送する。
属性決定部10では、親ブロックの属性値を第6図で説
明したようにして決定し、構造化データ記憶部4の所定
の相対位置に親ブロック及び複数個の構造化ブロックを
書き込む。
明したようにして決定し、構造化データ記憶部4の所定
の相対位置に親ブロック及び複数個の構造化ブロックを
書き込む。
次に、ブロック情報制御部5は、前述したようにして、
構造化を行った分割レベルを持つ親ブロックと複数個の
′!y4造化対象ブロックのベアーが対象データ記憶部
6に残っていれば、それらのベアーを順次、構造化検査
部8へ転送する。
構造化を行った分割レベルを持つ親ブロックと複数個の
′!y4造化対象ブロックのベアーが対象データ記憶部
6に残っていれば、それらのベアーを順次、構造化検査
部8へ転送する。
一方、対象データ記憶部6が空であれば、次に分割レベ
ルを12減らし、構造化対象となるブロック及びその親
ブロックのベアーを構造化データ記憶部4から取り出し
、以下、分割レベル1のブロックが構造化対象として取
り出されるまで同様な動作が行われる。その結果、構造
化データ記憶部4に、文書画像メモリ1仲格納された文
書の構造が木構造として、自動生成されることになる。
ルを12減らし、構造化対象となるブロック及びその親
ブロックのベアーを構造化データ記憶部4から取り出し
、以下、分割レベル1のブロックが構造化対象として取
り出されるまで同様な動作が行われる。その結果、構造
化データ記憶部4に、文書画像メモリ1仲格納された文
書の構造が木構造として、自動生成されることになる。
以上説明した文書構造生成部20(図中点線で示す)に
よって、領域分割部2、及び文字分離15に置いて得ら
れた文書画像の本構造として分割された結果を再度ボト
ムアップ的に見直され、文書の構造が構造化データ記憶
部4に格納されることになる。
よって、領域分割部2、及び文字分離15に置いて得ら
れた文書画像の本構造として分割された結果を再度ボト
ムアップ的に見直され、文書の構造が構造化データ記憶
部4に格納されることになる。
次に、第6図及び第8図で示したように、領域探索部1
3は、予め抽出すべき1つないし複数個のブロックの属
性及び配置関係に関する条件を記憶した領域定義記憶部
から読み出し、前記条件に従って、構造化データ記憶部
4に格納された文書画像内のブロック間の配a!構造を
示す木構造を探索し、抽出すべき1つないし複数個のブ
ロックを所定の順序で抽出結果記憶部14に格納する。
3は、予め抽出すべき1つないし複数個のブロックの属
性及び配置関係に関する条件を記憶した領域定義記憶部
から読み出し、前記条件に従って、構造化データ記憶部
4に格納された文書画像内のブロック間の配a!構造を
示す木構造を探索し、抽出すべき1つないし複数個のブ
ロックを所定の順序で抽出結果記憶部14に格納する。
第13図は本願の第2の発明の一実施例を示す論理ブロ
ック図である。図において、文書画像メモリ1、領域分
割部2、文字分離部15は、第12図に説明した機能を
持つ。空白ブロック検査部21は、領域分割部2及び文
字分離部15を介した得られるブロック情報に於いて、
その背方の複数個の子ブロック情報(例えば、文字行ブ
ロックに対する複数個の文字ブロック)のうち、始端と
なる子ブロックの位置及び終端となる子ブロックの位置
を選択し、それらの位置及びその親となるブロック情報
の始端・終端位置の差を算出し、ブロック情報の始端及
び終端の空白サイズを求める。空白サイズを予め定めた
閾値あるいは文字ピッチなどの文字サイズと比較するこ
とにより、空白ブロックを検出する。
ック図である。図において、文書画像メモリ1、領域分
割部2、文字分離部15は、第12図に説明した機能を
持つ。空白ブロック検査部21は、領域分割部2及び文
字分離部15を介した得られるブロック情報に於いて、
その背方の複数個の子ブロック情報(例えば、文字行ブ
ロックに対する複数個の文字ブロック)のうち、始端と
なる子ブロックの位置及び終端となる子ブロックの位置
を選択し、それらの位置及びその親となるブロック情報
の始端・終端位置の差を算出し、ブロック情報の始端及
び終端の空白サイズを求める。空白サイズを予め定めた
閾値あるいは文字ピッチなどの文字サイズと比較するこ
とにより、空白ブロックを検出する。
尚、空白ブロックが検出された場合、それも1つのブロ
ック情報として加えられると共に、空白ブロックが検出
された親ブロックの属性値として、空白ブロックの存在
位置(始端又は終端)及び空白ブロックの位置・大きさ
が記憶されるとする。
ック情報として加えられると共に、空白ブロックが検出
された親ブロックの属性値として、空白ブロックの存在
位置(始端又は終端)及び空白ブロックの位置・大きさ
が記憶されるとする。
そこで、構造化データ記憶部4は第12図で示した機能
と同等であるが、空白ブロック情報も含めて記憶される
点が異なる。
と同等であるが、空白ブロック情報も含めて記憶される
点が異なる。
縦・横情報記憶部2に記憶された縦書き横書き情報を読
み出し、文書構造生成部20によって、第6図、第8図
から第10図で示したような文書の配置構造を生成する
機能は、第12図で示した場合と同等である。
み出し、文書構造生成部20によって、第6図、第8図
から第10図で示したような文書の配置構造を生成する
機能は、第12図で示した場合と同等である。
文書ブロック検査部22は、第11図で説明したように
、文書ブロック情報とその子ブロックとなる複数個の文
字行ブロック情報を順次構造化データ記憶部4から取り
出し、文字行ブロックの属性として記憶されている空白
ブロックの存在位置、大きさを文章ブロックを構成する
文字行ブロックすべてについて順次検査し、パラグラフ
ブロックを構成する複数個の文字行ブロックを検出する
。
、文書ブロック情報とその子ブロックとなる複数個の文
字行ブロック情報を順次構造化データ記憶部4から取り
出し、文字行ブロックの属性として記憶されている空白
ブロックの存在位置、大きさを文章ブロックを構成する
文字行ブロックすべてについて順次検査し、パラグラフ
ブロックを構成する複数個の文字行ブロックを検出する
。
パラグラフブロックを構成する複数個の文字行ブロック
が文章ブロック検査部に於いて検出されると、ブロック
更新部23に於いて、パラグラフブロックを生成し、そ
の属性値をそれを構成する複数個の文字行ブロック情報
に従って生成する。また、パラグラフブロックの親領域
ポインタには、その文書ブロックの相対位置が記憶され
、また、パラグラフブロックの複数個の文字行ブロック
の親領域ポインタには、新たに生成されたパラグラフブ
ロックの相対位置となる第12図に示した文書lflA
m生成部20内の相対位置カウンターの内容が読み出さ
れてセットされる。
が文章ブロック検査部に於いて検出されると、ブロック
更新部23に於いて、パラグラフブロックを生成し、そ
の属性値をそれを構成する複数個の文字行ブロック情報
に従って生成する。また、パラグラフブロックの親領域
ポインタには、その文書ブロックの相対位置が記憶され
、また、パラグラフブロックの複数個の文字行ブロック
の親領域ポインタには、新たに生成されたパラグラフブ
ロックの相対位置となる第12図に示した文書lflA
m生成部20内の相対位置カウンターの内容が読み出さ
れてセットされる。
尚、パラグラフブロックの子領域ポインタはそれを構成
する先頭の文字行ブロックの相対位置が記憶され、パラ
グラフを構成する複数個の文字行ブロックの始端及び終
端ブロックの上下又は左右関係ポインタの切り離し、及
びパラグラフブロックの上下又は左右関係ポインタとそ
れに隣接する文字行ブロック又はパラグラフブロックの
上下又は左右関係ポインタでの接続も行われる。
する先頭の文字行ブロックの相対位置が記憶され、パラ
グラフを構成する複数個の文字行ブロックの始端及び終
端ブロックの上下又は左右関係ポインタの切り離し、及
びパラグラフブロックの上下又は左右関係ポインタとそ
れに隣接する文字行ブロック又はパラグラフブロックの
上下又は左右関係ポインタでの接続も行われる。
次に、1つの文書ブロックとそれを構成する複数個の文
字行ブロックに対して、文章ブロック検査部22及びブ
ロック部20において、パラグラフブロックの検出・生
成が行われると、ブロック更新部23によって、それら
のデータが構造化データ記憶部4の所定の相対位置に書
き込まれる。
字行ブロックに対して、文章ブロック検査部22及びブ
ロック部20において、パラグラフブロックの検出・生
成が行われると、ブロック更新部23によって、それら
のデータが構造化データ記憶部4の所定の相対位置に書
き込まれる。
以上の操作を構造化データ記憶部4に格納されたすべて
の文書ブロックとそれを構成する複数個の文字行プロ、
ツタについて行われることによって、文章ブロックは、
それを構成するパラグラフブロック単位に構造化される
。
の文書ブロックとそれを構成する複数個の文字行プロ、
ツタについて行われることによって、文章ブロックは、
それを構成するパラグラフブロック単位に構造化される
。
尚、ここで、パラグラフを構成しなかった文字行ブロッ
クの属性値として空白ブロック情報も含まれており、文
字行の性質を表わす文字ピッチと共に利用できることは
言うまでもない。
クの属性値として空白ブロック情報も含まれており、文
字行の性質を表わす文字ピッチと共に利用できることは
言うまでもない。
領域定義記憶部12.領域探索部13.抽出結果記憶部
14については第12図で説明した第1項記載の本願発
明と同等である。
14については第12図で説明した第1項記載の本願発
明と同等である。
(発明の効果)
以上に説明したように、本願発明の文書画像解析方式に
よれば、ブロックの包含関係及び上下又は左右の相対位
置関係に従って、種々な文書画像を構成する要素及び要
素間の配置構造が階層的に自動生成され、同時に文章情
報の流れやパラグラフ等の論理的構造も得られる。そこ
でこの配置構造から様々な目的に応じて定められる領域
を探索することによって、安定にしかも容易に1つない
し複数個の領域の抽出を行うことかできる。
よれば、ブロックの包含関係及び上下又は左右の相対位
置関係に従って、種々な文書画像を構成する要素及び要
素間の配置構造が階層的に自動生成され、同時に文章情
報の流れやパラグラフ等の論理的構造も得られる。そこ
でこの配置構造から様々な目的に応じて定められる領域
を探索することによって、安定にしかも容易に1つない
し複数個の領域の抽出を行うことかできる。
第1図及び第2図はそれぞれ縦書き及び横書きで記載さ
れた文書画像の構成を示す図である。第3図は上下及び
左右関係の分割方向を交互に規定しながら階層的に領域
分割を行う文書領域分割方式の一例を示す図である。 第4図及び第7図は、それぞれ、第1図及び第2図の文
書画像の領域分割結果の一例を示す図である。 第5図はブロック情報の一例を示す図である。 第6図及び第8図は、第4図及び第7図でそれぞれ示し
た領域分割結果から本願の第1の発明によって文書構造
を自動生成した例を示す図である。 第9図は文書画像の一例を示す図である。 第10図及び第11図は第9図の文書画像に対して適用
する場合における本願の第2の発明の文書画像解析方式
を説明する図である。 第12図は本願の第1の発明の一実施例を示す論理ブロ
ック図である。 第13図は本願の第2の発明の一実施例を示す論理ブロ
ック図で′ある。 図において、1は文書画像メモリ、2は領域分割部、3
は縦・横1報記憶部、4は構造化データ記憶部、5はブ
ロック情報制御部、6は対象データ記憶部、7は条件記
憶部、8は構造化検査部、9はブロック生成部、10は
属性決定部、11は相対位置カウンター、12は領域定
義記憶部、13は領域探索部、14は抽出結果記憶部、
15は文字分離部、20は文書構造生成部、21は空白
ブロック検査部、22は文章ブロック検査部、23はブ
ロック更新部である。
れた文書画像の構成を示す図である。第3図は上下及び
左右関係の分割方向を交互に規定しながら階層的に領域
分割を行う文書領域分割方式の一例を示す図である。 第4図及び第7図は、それぞれ、第1図及び第2図の文
書画像の領域分割結果の一例を示す図である。 第5図はブロック情報の一例を示す図である。 第6図及び第8図は、第4図及び第7図でそれぞれ示し
た領域分割結果から本願の第1の発明によって文書構造
を自動生成した例を示す図である。 第9図は文書画像の一例を示す図である。 第10図及び第11図は第9図の文書画像に対して適用
する場合における本願の第2の発明の文書画像解析方式
を説明する図である。 第12図は本願の第1の発明の一実施例を示す論理ブロ
ック図である。 第13図は本願の第2の発明の一実施例を示す論理ブロ
ック図で′ある。 図において、1は文書画像メモリ、2は領域分割部、3
は縦・横1報記憶部、4は構造化データ記憶部、5はブ
ロック情報制御部、6は対象データ記憶部、7は条件記
憶部、8は構造化検査部、9はブロック生成部、10は
属性決定部、11は相対位置カウンター、12は領域定
義記憶部、13は領域探索部、14は抽出結果記憶部、
15は文字分離部、20は文書構造生成部、21は空白
ブロック検査部、22は文章ブロック検査部、23はブ
ロック更新部である。
Claims (2)
- (1)文書画像を文字行、文字等の要素領域に分解する
手段と、1つ又は複数個の前記要素領域をブロックとし
て構造化する際、各ブロックの包含関係及び上下又は左
右の配置関係に従って、前記ブロックの属性及びブロッ
ク間の配置構造を階層的に決定し、記憶する文書構造生
成手段と、前記ブロックの属性及びブロック間の階層的
な配置構造から、前記文書画像内の抽出すべき領域又は
前記抽出すべき領域を構成する1つ若しくは複数個のブ
ロックを探索する領域探索手段とを有することを特徴と
する文書画像解析方式。 - (2)文書画像を文字行、文字等の要素領域に分解する
手段と、1つ又は複数個の前記要素領域をブロックとし
て構造化する際、各ブロックの包含関係及び上下又は左
右の配置関係に従って、前記ブロックの属性及びブロッ
ク間の配置構造を階層的に決定し、記憶する文書構造生
成手段と、文字行ブロック内の所定の位置・大きさを持
つ空白を空白ブロックとして抽出する手段と、前記文書
構造生成手段によって生成された複数個の文字行を含む
ブロックから前記空白ブロックを基にして各文字行ブロ
ックの形状を調べ、前記文書画像に於ける配置構造を更
新する文書構造更新手段と、前記階層的な配置構造から
前記文書画像内の抽出すべき領域又は前記抽出すべき領
域を構成する1つ若しくは複数個のブロックを探索する
領域探索手段とを有することを特徴とする文書画像解析
方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62290207A JPH01130293A (ja) | 1987-11-16 | 1987-11-16 | 文書画像解析方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62290207A JPH01130293A (ja) | 1987-11-16 | 1987-11-16 | 文書画像解析方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH01130293A true JPH01130293A (ja) | 1989-05-23 |
Family
ID=17753136
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP62290207A Pending JPH01130293A (ja) | 1987-11-16 | 1987-11-16 | 文書画像解析方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH01130293A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0344788A (ja) * | 1989-07-13 | 1991-02-26 | Fuji Facom Corp | 文書画像の領域抽出方法 |
| JPH0668300A (ja) * | 1991-12-18 | 1994-03-11 | Internatl Business Mach Corp <Ibm> | 文書画像のレイアウトモデルを作成する方法及び装置 |
| JPH0896075A (ja) * | 1994-09-28 | 1996-04-12 | Nec Corp | 文書画像認識装置 |
| JP2025120568A (ja) * | 2024-02-05 | 2025-08-18 | 福島印刷株式会社 | 文書画像解析システム及びプログラム |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60183689A (ja) * | 1984-03-02 | 1985-09-19 | Nec Corp | 文字読取制御装置 |
| JPS60183688A (ja) * | 1984-03-02 | 1985-09-19 | Nec Corp | 光学文字読取方式 |
-
1987
- 1987-11-16 JP JP62290207A patent/JPH01130293A/ja active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60183689A (ja) * | 1984-03-02 | 1985-09-19 | Nec Corp | 文字読取制御装置 |
| JPS60183688A (ja) * | 1984-03-02 | 1985-09-19 | Nec Corp | 光学文字読取方式 |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0344788A (ja) * | 1989-07-13 | 1991-02-26 | Fuji Facom Corp | 文書画像の領域抽出方法 |
| JPH0668300A (ja) * | 1991-12-18 | 1994-03-11 | Internatl Business Mach Corp <Ibm> | 文書画像のレイアウトモデルを作成する方法及び装置 |
| JPH0896075A (ja) * | 1994-09-28 | 1996-04-12 | Nec Corp | 文書画像認識装置 |
| JP2025120568A (ja) * | 2024-02-05 | 2025-08-18 | 福島印刷株式会社 | 文書画像解析システム及びプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10360294B2 (en) | Methods and systems for efficient and accurate text extraction from unstructured documents | |
| KR101363808B1 (ko) | 문서 콘텐츠의 순서화 | |
| JP2816241B2 (ja) | 画像情報検索装置 | |
| CN111274239B (zh) | 试卷结构化处理方法、装置和设备 | |
| US7046847B2 (en) | Document processing method, system and medium | |
| JPH10162003A (ja) | Htmlファイル生成方法及びその装置及びレイアウトデータ生成方法及びその装置及びコンピュータ実行可能な処理プログラム | |
| JP2007095102A (ja) | 文書処理装置および文書処理方法 | |
| CN110688825A (zh) | 一种版式文档中的含线表格信息提取方法 | |
| JP5446877B2 (ja) | 目次構造特定装置 | |
| JPH0821057B2 (ja) | 文書画像解析方式 | |
| CN110866084A (zh) | 家谱人物的数据处理方法及装置、电子设备 | |
| JPH01130293A (ja) | 文書画像解析方式 | |
| JP2015005100A (ja) | 情報処理装置、テンプレート生成方法、およびプログラム | |
| JPH08320914A (ja) | 表認識方法および装置 | |
| CN113139547B (zh) | 文本识别方法、装置、电子设备及存储介质 | |
| CN117133012B (zh) | 一种建筑图纸中子图框的检测方法和电子设备 | |
| JPH08255160A (ja) | レイアウト装置および表示装置 | |
| CN118410869A (zh) | 基于大语言模型的视障人群文档视觉问答指令生成方法和装置 | |
| CN114997138B (zh) | 一种化学品说明书解析方法、装置、设备及可读存储介质 | |
| Randriamasy et al. | Automatic benchmarking scheme for page segmentation | |
| JP2701350B2 (ja) | 文書読取装置 | |
| CN119948479A (zh) | 确定可显示内容的元素的属性并将它们添加到可访问性树 | |
| CN117312572A (zh) | 一种医科知识图谱构建方法及系统 | |
| CN117610549A (zh) | 文档处理、内容生成方法、装置及电子设备 | |
| JPH0743718B2 (ja) | マルチメディア文書構造化方式 |