JPH05342408A - 文書画像ファイリング装置 - Google Patents

文書画像ファイリング装置

Info

Publication number
JPH05342408A
JPH05342408A JP3098013A JP9801391A JPH05342408A JP H05342408 A JPH05342408 A JP H05342408A JP 3098013 A JP3098013 A JP 3098013A JP 9801391 A JP9801391 A JP 9801391A JP H05342408 A JPH05342408 A JP H05342408A
Authority
JP
Japan
Prior art keywords
area
image
character
graphic
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3098013A
Other languages
English (en)
Inventor
Katsuhiko Itonori
勝彦 糸乗
Noboru Shimizu
昇 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP3098013A priority Critical patent/JPH05342408A/ja
Publication of JPH05342408A publication Critical patent/JPH05342408A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 入力した文書画像を各属性に従った領域(文
章・写真・図形)ごとに、本来の属性を与えるようにフ
ァイリングすることのできる文書画像ファイリング装置
を提供すること。 【構成】 文書を読み取る文書画像入力装置1と、その
文書画像入力装置1により読み取った文書画像から文字
領域、写真領域、および図形領域を分離する領域分離装
置3と、その領域分離装置3で分離された文字領域の画
像に対して文字認識を行う文字認識装置42と、図形領
域の画像に対してベクトル図形化し、清書処理を行う図
形領域清書装置62と、分離した前記各領域に対して文
字は文字コードとして、図形はベクトル図形データとし
て、写真領域は画像データとしてファイリングするファ
イリング手段43,53,63とを備えている。

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】この発明は、文字・写真・図形の
混在する文書画像のファイリング装置に関する。 【0002】 【従来の技術】従来の文書画像のファイリング装置にお
いて、文書画像からいくつかの属性(文章、写真、ある
いは図形など)に従った領域を自動的に抽出し、再配置
するシステムが提案されている。たとえば、入力した画
像の各領域を対話処理により抽出し、各領域毎にファイ
リング装置に蓄積し、利用時にはその目的に合わせて、
文書のレイアウトを編集することのできるデータベース
編集装置がある(信学技法,PRL84−101,p.
65〜p.72)。 【0003】 【発明が解決しようとする課題】しかし、これらの従来
のシステムは入力した画像の配置を変更するだけであ
り、各領域が画像として表現されていたので、本来文字
が持つ属性(フォント、文字サイズ等)や図形が持つ属
性(線幅、線種等)などを変更・活用することができ
ず、そのため、ファイル検索後の利用方法が、画像とし
ての非常に限れた形でしかできないという問題があっ
た。また、各領域をすべて画像として扱っているため
に、検索内容の表示は画像入力時の解像度に依存してし
まい、細かい字や図形を奇麗に再現することができなか
った。本発明は、前記問題点を解決するためになされた
もので、入力した文書画像を各属性に従った領域(文章
・写真・図形)ごとに、本来の属性を与えるようにファ
イリングすることのできる文書画像ファイリング装置を
提供することを目的とするものである。 【0004】 【課題を解決するための手段】本発明の文書画像ファイ
リング装置は、前記目的を達成するために、文書を読み
取る文書画像入力手段(1)と、その文書画像入力手段
により読み取った文書画像から文字領域、写真領域、お
よび図形領域を分離する領域分離手段(3)と、その領
域分離手段(3)で分離された文字領域の画像に対して
文字認識を行う文字認識手段(42)と、図形領域の画
像に対してベクトル図形化し、清書処理を行う図形領域
清書手段(62)と、分離した前記各領域に対して文字
は文字コードとして、図形はベクトル図形データとし
て、写真領域は画像データとしてファイリングするファ
イリング手段(43,53,63)とを備えたことを特
徴とする。 【0005】 【作用】文書画像入力手段から入力されたディジタル画
像を、領域分離手段(3)で、文字領域、写真領域およ
び図形領域に分離する。分離された文字領域画像は、文
字認識手段(42)において文字認識を行い、その認識
結果はファイリング手段(43)により文字コードとし
てファイリングされる。上記分離された写真領域画像
は、必要に応じて情報圧縮などの処理を施した後、ファ
イリング手段(53)により、従来と同じように画像デ
ータとしてファイリングされる。さらに、分離された図
形領域画像は、図形領域清書手段(62)により直線近
似され整形処理された後に、図形データとしてファイリ
ングされる。これらのファイリングをすることにより、
文字領域はコードとして記録され、文書編集装置などに
より文書として自由な編集をすることができる。また、
図形は図形データとして記録されるのでCADなどの図
形データとして高度な編集をすることができるようにな
る。 【0006】 【実施例】図1は、本発明の一実施例の文書画像ファイ
リング装置を示したもので、この装置は、文書画像を入
力するための画像入力装置1、入力した画像を記憶する
画像メモリ2、上記画像から文字領域・写真領域・図形
領域を分離するための領域分離装置3、その領域分離装
置3で分離した文字領域、写真領域、図形領域をそれぞ
れ記憶する文字領域画像メモリ41,写真領域画像メモ
リ51、図面領域画像メモリ61を備えている。さら
に、この文書画像ファイリング装置は、文字領域画像メ
モリ41中の文字領域画像の文字を認識する文字認識装
置42、写真領域画像メモリ51の中の写真領域画像を
情報圧縮する写真領域圧縮装置52、図形領域画像メモ
リ61中の図形領域画像を直線近似し清書を行う図形領
域清書装置62を備えている。上記で処理された結果を
ファイリングするために、文章ファイル装置43、写真
ファイル装置53、図形ファイル装置63が接続されて
いる。 【0007】画像入力装置1では、文字・写真・図形が
混在している文書画像をディジタルデータとして入力
し、画像メモリ2に記憶する。図2は、文書画像の一例
を示すものである。図2で見られるように、文書画像2
1は文字領域411、写真領域511、図形領域611
を混在して持っている。しかし、画像として入力しただ
けでは、前述のように本来文字が持つ属性(フォント、
文字サイズ等)や図形が持つ属性(線幅、線種等)を変
更・活用することができない。そのため、ファイル検索
後の利用方法が、画像としての非常に限れた形でしかで
きなかった。本実施例では、ファイル検索後の利用価値
を広げるために、この後の処理では文書画像21に含ま
れる各領域に対して本来の属性を与えるような処理を行
い、さらにその属性を持たせたままで、各領域別々にフ
ァイル装置に蓄積するようにしている。 【0008】画像メモリ2中の文書画像21は、領域分
離装置3により文字領域411、写真領域511、およ
び図形領域611に分割される。図3(a),(b),
(c)は、文書画像21から分離した、文字領域、写真
領域、図形領域を示している。図4は、図形領域を分離
するための領域分離装置3の一例を示すものである。図
4に示すように、この領域分離装置3は、多値で入力さ
れた文字線画像、写真画像の混在する画像に対して2値
化を行う2値化回路31と、2値化された画像に対して
孤立点除去を行う孤立点除去回路32と、孤立点除去を
行った画像に対して輪郭を抽出する輪郭抽出回路33
と、2値画像と輪郭画像をM×N画素のブロックで扱
い、M×N画素内に存在する2値の黒画素の数と輪郭抽
出された画素との比により中間調領域を識別する写真領
域判定回路34と、輪郭抽出された画像をチェーン符号
化するチェーン符号化回路35と、チェーン符号化され
た各々の黒画素連の方向の変化を計数する方向変化計数
回路36と、その計数された方向の変化とその黒画素連
結画像の画素数の関係から文字と図形を判定する文字領
域図形領域判定回路37と、各領域判定回路34,37
の判定結果により、入力画像を各領域に振り分けるため
の切替回路38を有している。 【0009】孤立点除去回路32および輪郭検出回路3
3の入力部には、3ラインずつ並列に順次入力画像を取
り込むためのラインメモリ391,392が設けられ、
また写真領域判定回路34の入力部には、5ラインずつ
並列に順次画像を取り込むためのラインメモリ393が
設けられている。多値の入力画像データは2値化回路3
1により2値化されて、孤立点除去回路32により、画
像データ中の孤立した画素の除去を行う。例えば、一つ
の着目画素に隣接する8個の画素を見て着目画素が孤立
した画素か否かを判定し、孤立画素であればそれを除去
する。そのためにラインメモリ91を設けて3ライン分
のデータを参照している。輪郭検出回路33は、3ライ
ン分のデータを参照することにより、輪郭抽出を行うこ
とができる。すなわち、輪郭抽出部33は、原画像と、
その原画像を1画素分、右にシフトした画像との論理積
をとり、その処理結果の画像と原画像を1画素分、左に
シフトした画像との論理積をとり、同じように上,下に
1画素分シフトした画像との論理積をとると、4方向に
1画素分収縮した画像ができあがり、この画像と原画像
との排他的論理和をとることによって、輪郭抽出をす
る。写真領域判定回路34は、写真領域(中間調領域)
と文字線画像の特性の相違に着目して領域の判定を行
う。すなわち、写真領域は画像を2値化したものと輪郭
抽出した後のものとで画素数におおきな差異があるのに
対し、文字線画像はその差異が少ない。従って、2値画
像の画素数と輪郭抽出後の画素数との比を調べ、しきい
値よりも大きい場合に写真領域と判定する。 【0010】チェーン符号化回路35は、輪郭抽出回路
33によって輪郭抽出された画像に対して、ラスター走
査を行い、黒画素を見つけ、その画素の8近傍を走査
し、黒画素があったならば、チェーン符号化を行い、そ
の画素を白画素に置き換え、次々とこの処理を8近傍に
黒画素がなくなるまで、くり返す。また、8近傍に複数
の黒画素が存在した場合は、注目した画素以外の黒画素
の位置情報をスタックする。メインの黒画素追跡が終了
した時点でスタックされた画素の位置情報を取り出し、
同様にチェーン符号化をくり返す。このスタックされて
いた画素情報から追跡して抽出したチェーン符号はメイ
ンのチェーン符号とつながっているので、子チェーン符
号とする。スタックにある画素情報を全て取り出した時
点で、最初に行っていたラスター走査を続ける。これに
よって、画像全てのチェーン符号化が行われる。 【0011】方向変化計数回路36は、チェーン符号化
された各々の黒画素連(1本のメインのチェーン符号と
それにつながっている子チェーン符号の組)の方向の変
化を計数する。すなわち、方向変化計数回路36では、
チェーン符号化回路部35によって生成された一連のチ
ェーン符号(メインのチェーン符号とその子チェーン符
号の組)に連結している原画像の黒画素を計数する。一
連のチェーン符号に連結する黒画素を計数することは、
孤立画像の面積を計数していることになる。また、複数
の輪郭を持つ、つまり、一連のチェーン符号が複数組で
一つの孤立画像を形成している場合は、その複数組のチ
ェーン符号を新たに一連のチェーン符号として、方向変
化計数回路36で処理している一連のチェーン符号と対
応がとれるようにする。具体的には、そのようなチェー
ン符号番号を文字領域図形領域判定回路37へ知らせる
ようにする。 【0012】文字領域図形領域判定部37では、“文字
は比較的小さく、複雑で輪郭の方向変化が煩雑であり、
図形は比較的大きく、簡単で輪郭の方向変化が少ない”
ことを利用して、各々のチェーン符号の方向の変化回数
とその黒連結画像の画素数(面積)の関係、たとえば次
式のような比をとり、あるしきい値で、文字と図形を分
離する。 (チェーン符号の方向の変化回数)/(面積) 上記領域分離装置3で分割された文字領域411、写真
領域511および図形領域611は、それぞれ文字領域
画像メモリ41、写真領域画像メモリ51、および図形
領域画像メモリ61に記憶される 【0013】上記文字領域画像メモリ41の文字領域4
11は、文字認識装置42により認識され、認識結果を
文字コードとして出力する。この認識結果は文章のデー
タとして文章ファイル装置43に記録される。この文字
認識装置は、公知の技術によって構成してもよいが、本
出願人の出願した特願平1−314301号の発明「文
字認識装置」(発明者大住淳一)、あるいは特願平1−
318827号の発明「文字認識装置」(発明者倉持
勉)などにより構成すれば、好適である。ここでは、前
者の文字認識装置を用いた例について概略の説明をす
る。図5は本発明による文字認識装置の基本的構成を示
すブロック図である。この文字認識装置は、ストローク
方向抽出部421と、方向ストロークパターン形成部4
22と、パターンぼかし部423と、相関処理部424
と、方向パターン格納部425−1、425−2、・・
・425−nと、パターン辞書格納部426とから構成
される。図5において、ストローク方向抽出部421で
は、入力文字から切り出されたパターンから文字ストロ
ークを抽出する。方向ストロークパターン形成部422
では、前記ストローク方向抽出部1で抽出された各方向
のストロークの内、方向ストロークごとに分ける。パタ
ーンぼかし部423では、各同一方向ストロークを集め
て形成されたパターンを縮小する。相関処理部424で
は、パターンぼかし部423で形成されたぼかしパター
ンと予めパターン辞書格納部426に格納されているパ
ターンとの相関を求める処理を行う。方向パターン格納
部425−1ないし425−nは、それぞれ同一方向の
ストロークパターンが格納されている。 【0014】図6はストローク方向説明図、図7はスト
ローク方向判定例説明図である。図6において、ストロ
ーク方向が8方向の例が示されている。たとえば、図3
図示のごときパターンについて、各画素がどの方向のパ
ターンに属しているかの判定方法を説明する。図7示の
各正方形が一つの画素を形成し、図中の黒画素がどの方
向ストロークに属するかを判定する。すなわち、注目し
ている画素を基にして、図7に示すように、前後左右お
よび斜め方向の各方向にそれぞれ画素を順次走査し、黒
画素をカウントして行き、走査した画素が白画素になっ
たら、その方向の走査を止める。このような走査を各方
向について行い、終了したら、黒画素のカウント数が最
も大きい方向を、その着目画素のストローク方向である
と判定する。図7に示す例では、図6のストローク方向
7と一致する方向のストロークが最も長い。したがっ
て、注目画素は、方向7のストロークに属する。同様に
他の画素全てに対してストローク方向の判定を行う。 【0015】図8は方向パターンの抽出例説明図であ
る。図8において、たとえば、「漢」の文字の8方向の
ストロークパターンを抽出した例で、便宜上縮小してあ
る。また、図8に示す番号(1)ないし(8)は、図6
のような方向性を示す番号1ないし8と対応している。
ぼかし処理は、2値画像である各方向ストロークパター
ンを縮小し濃淡のある画像に変換する。ここでは以下の
ような処理を用いることにする。方向ストロークパター
ンの大きさがN×N画素として、ぼかし後のパターンの
大きさをM×Mとする。NはMの画素の整数a倍とす
る。すなわち、a×a画素の原画を1画素に投影するこ
とになる。この際、方向ストロークパターンの各画素の
内、背景である白画素を−1、パターンを形成する黒画
素を+1とし、 個の画素を加算する。したがって、ぼ
かし変換後の1画素は−aから+の間の値を持つことに
なる。ここで得られた各方向のぼかしパターンと辞書と
して持っている各文字方向のぼかしパターンとの間で各
方向ごとに相関をとる。相関はぼかした方向パターンの
各画素を要素とするM次元ベクトル同志の内積をそれぞ
れのベクトルのノルムで除したものになる。式で書く
と、 Si =(Ii ,Di )/‖Ii ‖・‖Di ‖ となる。Sが相関値、Iが入力パターン、Dが辞書パタ
ーンを、添字iはストロークの方向を示す。8方向の場
合、各文字に対して8個の相関値が得られるので、8個
の相関値の2乗和を各文字に対する類似の度合いとす
る。辞書として持っている全文字中で、最も類似の度合
いの高いものを認識結果とする。 【0016】写真領域画像メモリ51中の写真領域51
1は、写真領域圧縮装置52により情報圧縮され、画像
データとして写真ファイル装置に記録される。上記写真
領域圧縮装置は、従来の任意の情報圧縮手法を用いて実
現することができる。さらに、上記図形領域メモリ61
中の図形領域611は、図形領域清書装置62により、
線図形に対して直線近似をおこない、直線近似の際に生
じる端点や交差点のずれを直し、線図形全体を清書す
る。清書する様子を図9に示す。すなわち、図9(a)
のような線図形画像に対して、直線近似をすることによ
り、図9(b)のような結果を得ることができる。この
結果に対して、整形処理を施し端点や交点のずれを直す
ことで、図9(c)のような結果を得ることができる。
上記の図形領域清書装置の直線近似の機能は、例えば、
本出願人の先に出願した特願 − 号(FX2432
2)の発明「画像データベクトル変換装置」に記載の方
法を用いることにより、また整形処理は同じく本出願人
の先に出願した特願− 号(FX25527)の発明
「ベクトルデータ整形方式」に記載の方法を用いること
で実現することができる。 【0017】図10は上記「画像データベクトル変換装
置」および「ベクトルデータ整形方式」を用いた図形領
域清書装置の構成例を示すものである。この図形領域清
書装置は、走査を主体とする単純な処理により、画像デ
ータをベクトルデータに変換できるものであり、図10
に示すように、図形領域画像メモリ61に格納された2
値画像を直交する方向(ここではX軸方向およびY軸方
向)に走査して所定の処理を行う。X軸方向の走査と処
理は、X軸方向走査部621、連続黒画素計数部62
2、黒画素重心抽出部623、重心連結部624により
行い、Y軸方向の走査と処理は、Y軸方向走査部62
5、連続黒画素計数部626、黒画素重心抽出部62
7、重心連結部628により行う。各処理の結果は、ベ
クトル整形部629により整形される。Y軸方向とX軸
方向の処理とは走査方向が異なるだけで実質的には同じ
ものであり、ここではY軸方向を例にとり説明する。図
11は、2値画像をベクトル変換するために行う走査を
説明する図である。Y軸方向走査部625の走査は、画
素単位に行うのではなく、幾つかの画素を飛び越して行
う。その飛び越し幅である走査線間幅Sは、任意の幅に
決めることができる。連続黒画素計数部624は、走査
をしつつ黒画素が幾つ連続しているかを計数する。その
計数結果に基づき、黒画素重心抽出部627は連続した
黒画素の重心を抽出する。重心連結部627は、黒画素
重心抽出部627の抽出した黒画素重心同士を連結し
て、ベクトルを形成する。一定の距離を予め定めておい
て、黒画素重心間の距離がその一定の距離より小であれ
ば、両者を連結してベクトルを形成する。しかし、上記
一定の距離より大であれば連結しない。ベクトル整形部
627は、ベクトル間を結合したり、接触させたり、誤
ベクトルの削除等を行い、ベクトルの整形を行う。 【0018】上記の領域分離装置を用いて例えば、図1
1に示すような構成のファイリング装置を構成すること
ができる。画像入力装置1により入力された文書画像
は、上記のように領域分離装置3により各領域に分離
後、文字認識装置42、写真領域圧縮装置52、図形領
域清書装置62により処理された結果をそれぞれ文書フ
ァイル装置43、写真ファイル装置53、図形ファイル
装置63に記録する。記録する際に、各ファイルに対し
適当なキーワードを付与しておく。また、1ページの完
全な文章として利用するために、文書から分離した各フ
ァイルの関係も同時に記録する。あるテーマについて文
章を作成したとき、適当なキーワードで検索装置10を
用いて、適当な文章を文章ファイル装置42から検索す
る。検索した結果は文章として編集することができるの
で、文章編集装置7に用いて自由に編集し利用すること
が可能である。また、あるテーマについて書いている文
章に対して表や図形を付加したい場合、適当なキーワー
ドで検索装置10を用いて図形ファイル装置62から適
当な図形あるいは表を検索し、検索した結果は図形とし
て編集することが可能なので、図形編集装置8により形
を変えて利用することができる。また、文章ファイル、
写真ファイル、図形ファイル間の関係を調べて1ページ
の文章を検索するように検索装置10に指示することに
より、1ページの文章を検索でき、文章編集装置7、図
形編集装置8により検索した文章を編集し、再利用する
ことが可能となる。このような文書編集装置7、図形編
集装置8、検索装置10は同一の処理装置で実現するこ
とも可能である。 【0019】以上のように、本発明をも用いることで、
ファイリングした結果を有効に活用できる装置を構成す
ることができる。ここで説明した実施例では、文字領
域、写真領域、および図形領域に分割しているのみであ
るが、文字領域に対する文字認識の結果から、文字の大
きさを抽出することにより、タイトルを抽出できる。す
なわち、文字のおおきさより大きな文字領域をタイトル
部分であるとすることができる。また、このタイトルと
して抽出された部分の文字認識結果をキーワードとし
て、文字領域、写真領域、図形領域をファイルに記録す
ることにより、ファイリングしようとしている画像から
自動的にキーワードを抽出することがてきる。 【0020】 【発明の効果】本発明は、文書ファイリング装置におい
て、画像をファイリングする前に領域分割を行う。すな
わち、入力画像に対し文字領域、写真領域、および図形
領域に分割を施す。そして、文字領域は、文字コードと
して、図形領域は直線近似を行うようにした。従来の画
像ファイリング装置では、文字や図形も画像データとし
てファイリングされていたので、検索した結果を見るの
が主であり、画像としての利用価値しかなかった。しか
し、本発明によれば文字領域は文書として編集が可能と
なり、また図形領域は図形として編集が可能となった。
これにより、過去にファイリングした内容を自由に手直
しして利用することができるようになった。また、検索
した文章を再度出力する際、文字は文字フォントで、図
形は直線を描画するコマンドによって描画されるので、
奇麗な出力を得ることができる。
【図面の簡単な説明】 【図1】 入力画像に対し領域を分離し、所定の形式に
変換する本発明の一実施例を示す図である。 【図2】 文書画像の一例を示す図である。 【図3】 領域分離の結果を示した図である。 【図4】 領域分離装置の構成を示す図である。 【図5】 文字認識装置の構成を示す図である。 【図6】 ストローク方向を説明するための図である。 【図7】 ストローク方向の判定を説明するための図で
ある。 【図8】 方向パターンの抽出例を説明するための図で
ある。 【図9】 線図形整形処理の過程を説明するための図で
ある。 【図10】 図形領域清書装置の構成を示す図である。 【図11】 装置の構成例を示す図である。 【符号の説明】 1…画像入力装置、 2…画像メモリ 3…領域分離装
置 41…文字領域画像メモリ 42…文字認識装置 43
…文章ファイル装置 51…写真領域画像メモリ 52…写真領域圧縮装置
53…写真ファイル装置 61…図形領域画像メモリ
62…図形領域清書装置 63…図形ファイル装置 2
1…文書画像 411…文字領域 511…写真領域
611…図形領域

Claims (1)

  1. 【特許請求の範囲】 文書を読み取る文書画像入力手段装置と、 読み取った文書画像から文字領域、写真領域、図形領域
    を分離する領域分離手段と、 前記領域分離手段で分離された文字領域の画像に対して
    文字認識を行う文字認識手段と、 図形領域の画像に対してベクトル図形化し、清書処理を
    行う図形領域清書手段と、 分離した上記各領域に対して、文字は文字コードとし
    て、図形はベクトル図形データとして、写真領域は画像
    データとしてファイリングするファイリング手段とを備
    えたことを特徴とした文書画像ファイリング装置。
JP3098013A 1991-04-04 1991-04-04 文書画像ファイリング装置 Pending JPH05342408A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3098013A JPH05342408A (ja) 1991-04-04 1991-04-04 文書画像ファイリング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3098013A JPH05342408A (ja) 1991-04-04 1991-04-04 文書画像ファイリング装置

Publications (1)

Publication Number Publication Date
JPH05342408A true JPH05342408A (ja) 1993-12-24

Family

ID=14207929

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3098013A Pending JPH05342408A (ja) 1991-04-04 1991-04-04 文書画像ファイリング装置

Country Status (1)

Country Link
JP (1) JPH05342408A (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7340092B2 (en) 2001-12-21 2008-03-04 Minolta Co., Ltd. Image processing device, image processing method, program for executing image processing, and computer readable recording medium on which the program is stored
US7545992B2 (en) 2004-07-07 2009-06-09 Canon Kabushiki Kaisha Image processing system and image processing method
US7596271B2 (en) 2004-07-07 2009-09-29 Canon Kabushiki Kaisha Image processing system and image processing method
US7640269B2 (en) 2004-07-07 2009-12-29 Canon Kabushiki Kaisha Image processing system and image processing method
US7860266B2 (en) 2004-07-07 2010-12-28 Canon Kabushiki Kaisha Image processing system and image processing method
US8199967B2 (en) 2007-06-14 2012-06-12 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
US8339619B2 (en) 2003-11-14 2012-12-25 Canon Kabushiki Kaisha System and image processing method and apparatus for re-using and re-editing images
US8587817B2 (en) 2011-03-28 2013-11-19 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and computer readable medium storing program
US8634094B2 (en) 2011-03-28 2014-01-21 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and non-transitory computer readable medium storing program
US8810827B2 (en) 2007-12-14 2014-08-19 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
US8867050B2 (en) 2011-07-12 2014-10-21 Fuji Xerox Co., Ltd. Image processing apparatus, non-transitory computer readable medium storing program and image processing method for restoring a single table from a plurality of pages
US9244892B2 (en) 2010-01-15 2016-01-26 Fuji Xerox Co., Ltd. Information display apparatus and computer readable medium
CN112733658A (zh) * 2020-12-31 2021-04-30 北京华宇信息技术有限公司 电子文档归档方法及其装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01129358A (ja) * 1987-11-16 1989-05-22 Canon Inc 表数値演算装置
JPH02138674A (ja) * 1988-08-24 1990-05-28 Hitachi Ltd 文書処理方法及び装置
JPH02159690A (ja) * 1988-12-14 1990-06-19 Fuji Xerox Co Ltd 文字/図形領域判定装置
JPH02126242U (ja) * 1989-03-24 1990-10-17
JPH02267678A (ja) * 1989-04-07 1990-11-01 Fuji Xerox Co Ltd 画像領域識別装置
JPH02288972A (ja) * 1988-09-22 1990-11-28 Univ Harvard タスク管理
JPH0314184A (ja) * 1989-06-13 1991-01-22 Fuji Xerox Co Ltd 文書画像再配置ファイリング装置
JPH0363882A (ja) * 1989-08-02 1991-03-19 Fuji Xerox Co Ltd 画像処理装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01129358A (ja) * 1987-11-16 1989-05-22 Canon Inc 表数値演算装置
JPH02138674A (ja) * 1988-08-24 1990-05-28 Hitachi Ltd 文書処理方法及び装置
JPH02288972A (ja) * 1988-09-22 1990-11-28 Univ Harvard タスク管理
JPH02159690A (ja) * 1988-12-14 1990-06-19 Fuji Xerox Co Ltd 文字/図形領域判定装置
JPH02126242U (ja) * 1989-03-24 1990-10-17
JPH02267678A (ja) * 1989-04-07 1990-11-01 Fuji Xerox Co Ltd 画像領域識別装置
JPH0314184A (ja) * 1989-06-13 1991-01-22 Fuji Xerox Co Ltd 文書画像再配置ファイリング装置
JPH0363882A (ja) * 1989-08-02 1991-03-19 Fuji Xerox Co Ltd 画像処理装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7340092B2 (en) 2001-12-21 2008-03-04 Minolta Co., Ltd. Image processing device, image processing method, program for executing image processing, and computer readable recording medium on which the program is stored
US8339619B2 (en) 2003-11-14 2012-12-25 Canon Kabushiki Kaisha System and image processing method and apparatus for re-using and re-editing images
US7640269B2 (en) 2004-07-07 2009-12-29 Canon Kabushiki Kaisha Image processing system and image processing method
US7596271B2 (en) 2004-07-07 2009-09-29 Canon Kabushiki Kaisha Image processing system and image processing method
US7860266B2 (en) 2004-07-07 2010-12-28 Canon Kabushiki Kaisha Image processing system and image processing method
US7545992B2 (en) 2004-07-07 2009-06-09 Canon Kabushiki Kaisha Image processing system and image processing method
US8199967B2 (en) 2007-06-14 2012-06-12 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
US8810827B2 (en) 2007-12-14 2014-08-19 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
US9244892B2 (en) 2010-01-15 2016-01-26 Fuji Xerox Co., Ltd. Information display apparatus and computer readable medium
US8587817B2 (en) 2011-03-28 2013-11-19 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and computer readable medium storing program
US8634094B2 (en) 2011-03-28 2014-01-21 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and non-transitory computer readable medium storing program
US8867050B2 (en) 2011-07-12 2014-10-21 Fuji Xerox Co., Ltd. Image processing apparatus, non-transitory computer readable medium storing program and image processing method for restoring a single table from a plurality of pages
CN112733658A (zh) * 2020-12-31 2021-04-30 北京华宇信息技术有限公司 电子文档归档方法及其装置
CN112733658B (zh) * 2020-12-31 2022-11-25 北京华宇信息技术有限公司 电子文档归档方法及其装置

Similar Documents

Publication Publication Date Title
JP2940936B2 (ja) 表領域識別方法
KR101617681B1 (ko) 히스토그램들을 갖는 다중 층 연결 요소들을 사용하는 텍스트 검출
CN111814722A (zh) 一种图像中的表格识别方法、装置、电子设备及存储介质
Shafait et al. Document image dewarping contest
JPH05342408A (ja) 文書画像ファイリング装置
JP2002024836A (ja) ディジタルイメージから表題を抽出する方法
JPH10143604A (ja) パタン抽出装置
JP2890482B2 (ja) 文書画像再配置ファイリング装置
CN112580594A (zh) 文档识别方法、装置、计算机设备和存储介质
KR930002349B1 (ko) 압축영상의 문자열 분리방법
Normand et al. A background based adaptive page segmentation algorithm
JPS62131382A (ja) 2値画像のベクトル変換方式
JPH03126181A (ja) 文書画像の領域分割方法
JPS58197581A (ja) 文字図形認識方法とその装置
JP2789622B2 (ja) 文字/図形領域判定装置
JPH05159062A (ja) 文書認識装置
JPH03268181A (ja) 文書読み取り装置
JP3140079B2 (ja) 罫線認識方法及び表処理方法
Chazalon et al. Improving document matching performance by local descriptor filtering
JP2674286B2 (ja) 特徴抽出方式
JPH022189B2 (ja)
JP3199033B2 (ja) 光学式文字読取方法、及び光学式文字読取装置
JP3031565B2 (ja) 表領域判定方法
CN120496105A (zh) 一种基于全景分割的报纸图像版面分析方法
JPS6238752B2 (ja)