JPH0944594A - 文書画像の領域分割方法および段組種類判別方法 - Google Patents
文書画像の領域分割方法および段組種類判別方法Info
- Publication number
- JPH0944594A JPH0944594A JP7194399A JP19439995A JPH0944594A JP H0944594 A JPH0944594 A JP H0944594A JP 7194399 A JP7194399 A JP 7194399A JP 19439995 A JP19439995 A JP 19439995A JP H0944594 A JPH0944594 A JP H0944594A
- Authority
- JP
- Japan
- Prior art keywords
- column
- document image
- area
- dividing
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
Abstract
な場合はそれを利用し、段組が変則的な場合でも対応で
きる。 【解決手段】 入力された文書画像(101)の傾きを
補正(102)した後、圧縮画像を生成する(10
3)。小領域を抽出し(104)、行方向において小領
域を文字列候補などに分類する(106)。文字列候補
小領域から、長い白ランの連結成分を用いて段分割空白
部を抽出する(107)。入力文書の段組の種類(1
段、複数段、自由段)を判定し(108)、その種類に
従って空白部を取捨選択して(109)、小領域を統合
して(110)、文章領域を抽出する。
Description
割方法および段組種類判別方法に関する。
く分けて2つの方法がある。その一つは、文字などの小
さな要素を統合してまとまりのある文章領域(段など)
を得る方法である(特願平3−128340号)。
する空白部を検出し、これにより画像を分割する方法で
ある。例えば、特開平1−183783号公報に記載さ
れた文書画像処理装置では、文字列の先頭位置の周辺分
布から段のエッジを求め、同一段に所属する文字列に同
じ属性(所属段番号)を与えて、同一属性を持つ上下に
近接する文字列を統合することによって画像から文字領
域を分割抽出している。また、同5−166001号公
報に記載された文字認識装置では、水平垂直方向の周辺
分布によって領域分割点を決定している。
状にとらわれないため、明確な段組がなくても領域分割
が可能であるが、統合パラメータによって性能が左右さ
れるため、明確な段があっても分割ができなかったり、
文字間が広い場合には過剰に分割してしまうという問題
があった。
白部の一部が検出できないと全体的に分割できない場合
があり、また傾いていたり、段組が不規則な場合や文章
領域の形状が矩形でない場合にも領域分割ができないと
いう問題があった。
うとき、段組が明確な場合はそれを利用し、段組が変則
的な場合でも対応できる文書画像の領域分割方法および
段組種類判別方法を提供することにある。
に、請求項1記載の発明では、文書画像の領域分割方法
において、該文書画像から文字列を含む、複数の小領域
を抽出し、該複数の小領域から空白部または罫線を検出
し、該検出された空白部または罫線を基に、1段組、複
数段組、自由段組を含む段組種類を判別し、該段組種類
に応じて該空白部を用いて前記小領域を統合し、前記文
書画像を所定の領域に分割することを特徴としている。
段組種類は、前記空白部または罫線の本数、位置を基に
判別することを特徴としている。
る方向に前記小領域を分割する空白部または罫線を検出
し、該空白部または罫線によって画像を文字列と平行に
分割し、該分割された各画像部分毎に段組数または種類
を求め、該結果を統合して画像全体の段組種類を決定す
ることを特徴としている。
応じて、前記検出された空白部を取捨選択することを特
徴としている。
出する方法は、長い白ランの連結成分を空白部として検
出する方法と、文字要素の射影ヒストグラムから空白部
を検出する方法とを併用することを特徴としている。
応じて、前記小領域の統合条件を変更することを特徴と
している。
傾きが所定の閾値以上であるとき、前記段組種類を自由
段組とすることを特徴としている。
は、予め指定された段組種類を含むことを特徴としてい
る。
種類判別方法において、該文書画像から文字列を含む、
複数の小領域を抽出し、該複数の小領域から空白部また
は罫線を検出し、該空白部または罫線の本数、位置を基
に、1段組、複数段組、自由段組を含む、文書画像の段
組種類を判別することを特徴としている。
的に説明する。 〈実施例1〉図1は、本発明の実施例1の構成を示す。
図において、101はスキャナなどの画像入力手段、1
02は画像の傾き補正手段、103は入力画像の圧縮画
像を生成する手段、104は圧縮画像から黒画素連結成
分(小領域)を抽出する手段、105は行方向の検出手
段、106は小領域の分類手段、107は段分割空白部
候補の抽出手段、108は抽出した段分割空白部候補か
ら段組種類を判別する手段、109は決定された段組種
類に従って段分割空白部候補を取捨選択する手段、11
0は段分割線(段分割空白部および実線の段分割線)を
利用して小領域を統合して大きなまとまりのある文章領
域(段など)を得る手段、111はパラメータや処理途
中の各種データなどを記憶するデータ記憶部、112は
各手段を制御する制御部、113はデータ通信路であ
る。なお、102から110および112は、一つのプ
ロセッサ上でソフトウェアで実現することができる。
ある。まず、画像入力手段101を用いて文書画像を入
力する(ステップ201)。次いで、傾き補正手段10
2によって、入力画像の傾きの補正を行う(ステップ2
02)。この補正方法としては、例えば特開平5−35
914号公報に記載されている方法を用いる。入力画像
に傾きがないことが予め分かってる場合には、この傾き
の補正処理は必要がないし、傾き補正手段102を設け
なくてもよい。
(ステップ203)。例えば入力画像が400DPI程
度の解像度の場合には1/8に縦横圧縮する(つまり、
8×8画素の中に一つでも黒画素があれば圧縮後の画素
は黒とする)ことにより、通常、近接した文字は融合す
るが、行間や領域間は融合しない状態が得られる。圧縮
した画像の黒画素連結成分は、文字や文字の融合した文
字列、または線分や表、図(あるいは図の一部)などで
ある。小領域抽出手段104は、この連結成分を小領域
として抽出する(ステップ204)。
向を検出する(ステップ205)。行方向検出の方法と
しては、例えば特開平5−314309号公報に記載さ
れた方法を用いる。行方向が予め指定されている場合に
は検出する必要はない。従って、その場合は行方向検出
手段105を設けなくてもよい。ただし、その場合は行
方向指定手段が必要となる。また、必ずしもこの時点で
行方向を求める必要はなく、圧縮画像の生成前やその直
後などに求めてもよい。しかし、次の処理である小領域
分類では行方向を必要とするので、これより早い時点で
判明していなければならない。
6は、文字列方向を水平方向として座標軸をとって、小
領域を文字列候補や図、フィールドセパレータ(実線)
などに分類する(ステップ206)。分類する際に小領
域の高さや黒画素密度などを利用する。文字間距離によ
っては圧縮による画素の融合度合いが異なるため、文字
列候補の小領域が1文字で構成されていることもある。
明する。段分割空白部候補検出手段107は、文字列候
補小領域から段分割空白部候補を抽出する(ステップ2
07)。この詳細を、図3〜図13および図22を用い
て説明する。図3は、段分割空白部候補を抽出する処理
フローチャートである。まず、画像を水平方向(文字行
方向)に幾つかの帯に分割する。そのためには水平の分
割線を抽出する(ステップ301)。例えば、図4に示
すような小領域(つまり、文字列として分類されたも
の)の配置があったとして、水平方向に長い白ランの連
結成分を求める。この結果は図5に示すようになる。図
5の501、502は、この長い白ランの連結成分を示
す(図示していないが、他の行間部分にも501と同様
に長い白ランが得られる)。この長い白ラン連結成分の
内、充分な高さを持つ(つまり、所定の閾値より大き
い)ものを抽出する。これが水平方向の分割空白部であ
る。図5の例では連結成分501は高さが所定の閾値よ
り小さく、連結成分502は所定の閾値よりも大きい。
この高さの閾値は予め定めた固定値でもよいし、長い白
ラン連結成分の内、最も高さが高いもの(図5では50
2)の高さに対する比率でもよい。あるいは、文字列相
当の小領域の平均高さに連動するようにしてもよい。
フィールドセパレータが存在する場合には、これも水平
分割空白部と同様に扱う。
は空白部によって全体が幾つかの水平帯領域に分割され
る(ステップ302)。図6の例では、全体が水平分割
空白部601によって帯領域602と帯領域603に分
割されている。以下、各帯領域毎に段分割空白部候補を
抽出する。また、帯領域毎に段数の判別を行う(ステッ
プ303、304)。
理フローチャートである。まず、図5で説明したと同様
にして垂直方向に長い白ランを生成し(ステップ70
1)、これの連結成分を求める(ステップ702)。こ
れを図8を用いて説明する。帯領域801において、長
い白ラン802、803が生成され、その連結成分が求
められる。連結成分の内、幅の広いものだけが抽出され
る。幅が充分に広いか否かは所定の閾値で決定してもよ
いし、検出した長白ラン連結成分の内、最も幅の広いも
のに対する比率で決めてもよい。また、文字列相当の小
領域の分離度によって幅の閾値を変動させてもよい。
すもので、画像圧縮によって文字同志がどの程度融合す
るかによって文字間距離が広いか狭いかを判断するもの
である。つまり、文字列相当の小領域が横に長いものが
多ければ、文字間の融合が多いということになり、分離
度は低く、文字間は狭いと判断できる。このような場合
は長白ランが現われにくいので、幅の狭い長白ラン連結
成分であっても抽出する。逆に、横長の小領域が少なけ
れば文字間の分離度が高く、長白ランが現われやすい。
このときには幅の広い長白ラン連結成分のみを抽出す
る。
成分から段数を一時的に求める(ステップ703)。図
9で説明すると、抽出した長白ラン連結成分は901、
902である。これらが段数幾つのときの分割位置にあ
るかを検出する。すなわち、段数が2(つまり、文章領
域が2つ)なら903の位置で示す位置(あるいはその
周辺)に当該連結成分がなくてはならない。また、段数
が3なら904の位置に、段数が4なら905に示す位
置に同様にして当該連結成分が存在するはずである。
ム数いくつの分割位置にあるかを調べる。その処理フロ
ーチャートを図10に示す。まず全てのフラグをOFF
にする(ステップ1001)。次に処理対象となる未チ
ェックの長白ラン連結成分を選ぶ。なければ処理を終了
する(ステップ1002、1003)。次に当該連結成
分が帯領域において左から1/2の地点付近にあれば1
/2地点フラグをONにして次の連結成分の処理に進む
(ステップ1004、1005)。
点付近にあるかを調べ、当該地点付近にあればフラグを
ONにしていく(ステップ1006〜1013)。どの
場所にも相当しない場合は、イレギュラーフラグをON
にする(ステップ1014)。このとき、長白ラン連結
成分だけでなく実線のフィールドセパレータも使用して
フラグをセットする方法も採ることができる。そのとき
はステップ1002および1003において垂直実線セ
パレータも処理対象とする。
(および実線のフィールドセパレータ)が帯領域のどの
位置にあるかが判明する。次に当該帯領域の段数をこの
位置フラグから求める。図12の処理フローチャートを
用いて説明する(図10と図12を合わせて図7のステ
ップ703に相当する)。
ば段数は2である(ステップ1201、1202)。1
/3地点フラグと2/3地点フラグのみがONになって
いれば段数は3である(ステップ1203、120
4)。また1/2地点フラグと共に1/4地点フラグと
3/4地点フラグのみがONになっていれば段数は4と
なる(ステップ1205、1206)。上記以外の場合
は、前述した分離度(文字相当小領域の横長のものの割
合または絶対数で判定)で判別する(ステップ120
7)。分離度が高く文字間距離が広いと予想される場合
には、文書はワープロで作成されたようなものであるこ
とが多いことから、段数を1とする(ステップ120
8)。それ以外の場合は段数を不定とする(ステップ1
209)。この段数判別処理は他の方法を採ることもで
きる。例えば、イレギュラーフラグがONになっていた
場合は必ず段数を不定とするなどである。
検出されたら、連結成分の内、段分割空白部の候補とな
るものを選択する(ステップ704)。段数不定の場合
または段数1の場合は、段分割空白部候補の数を0とす
る。それ以外の場合(つまり段数2〜4)は、段数検出
に使用した幅広連結成分を全て段分割空白部候補とす
る。なお、連結成分には幅があるので、分割空白部はそ
の中心線の位置とするか、連結成分を構成するランの
内、最も長いランの位置にする方が、ステップ210で
の小領域統合時の処理が容易になる。上記したようにし
て、ステップ701から704で、長い白ランを利用し
た段分割空白部候補の抽出処理が行われる。
ヒストグラムを利用した段分割空白部候補抽出処理を説
明する。まず、ある程度の幅(クラス)毎に小領域の個
数を求めた周辺分布ヒストグラムを作成する(ステップ
705)。図11は、小領域の周辺分布ヒストグラム1
101を示す。次に行頭部を検出する(ステップ70
6)。これは、ヒストグラム1101において1つ隣の
クラスより閾値以上に頻度の高いクラスを検出すること
によって行われる。図11で、1102、1103が行
頭部に該当する。ここで閾値は固定値でもよいし、帯領
域の小領域の個数や該ヒストグラムの全頻度で正規化し
てもよい。また、頻度分布は図11のように、明確に谷
間が形成されるとは限らないないので、1つ隣のクラス
ではなく、2つ隣のクラスと比較してもよい。検出した
頻度差異の大きい地点(1102、1103)の左のク
ラスが、連続して閾値以上の個数だけ頻度が低ければ、
当該地点が空白部候補となる(ステップ706)。
104、1105と2クラス連続して頻度が低い。11
03の左隣も同様に1106、1107と頻度が低い。
従って、空白部の候補は1105−1104と1107
−1106となる。
段数を判別する(ステップ708)。まず、図10と同
様にして分割位置フラグをセットする。ただし、ここで
はイレギュラーフラグを使用しない。各フラグがセット
されたら段数の判定を行う。図13は、図7のステップ
708の詳細フローチャートである。
Nになっていれば段数を4とする(ステップ1301、
1302)。このとき、ステップ703と異なるのは、
1/3フラグや2/3フラグがONになっていてもよい
ことである。
ば段数を3とする(ステップ1303、1304)。1
/2フラグがONになっていれば段数を2とする(ステ
ップ1305、1306)。上記した何れにも該当しな
い場合は、空白部候補の本数が閾値以上あれば段数を不
定とし、そうでない場合は段数を1とする(ステップ1
307、1308、1309)。
で、ステップ704と同様にして分割空白部候補の選択
を行う。ステップ708の段数検出で使用した空白部候
補の内、検出された段数の分割位置付近に存在する空白
部候補だけを段分割空白部候補とする(ステップ70
9)。段数が不定であったり、1である場合には段分割
空白部候補は抽出しない(ステップ709で抽出しない
ので、ステップ704では抽出している可能性があ
る)。
段数の整合性をチェックして該帯領域の段数を決定する
(ステップ710)。段数の決定は図22に示すような
決定ルールに従う。段数が決定されたら、段数に整合す
る段分割空白部候補だけを残す(ステップ711)。例
えば、ステップ703でコラム数3と判定されてそれに
整合するように残っていた空白部候補は、ステップ71
0での段数整合チェックの結果、段数不定と判定された
場合には除去される。ステップ703で段数2、ステッ
プ708で段数4と判定された場合には、図22に示す
ように段数4と判定されるから、長ランから求めた空白
部候補も周辺分布から求めた空白部候補も共に採用され
る。以上によって、ステップ207で段分割空白部候補
領域の抽出処理が行われる。
は、段組の種類を判別する(ステップ208)。これ
は、各帯領域毎に求めた段組数により1段組、複数段
組、自由段組の3種類に入力文書を分類するものであ
る。図14を例にして説明する。1401〜1403は
帯領域であり、1404〜1406は抽出した段分割空
白部候補である。ここで組数は1401が1、1402
が3、1403が2となる。図15に従って、文書全体
の段組種類を決定する。
ップ1501)。この量Hは、帯領域の高さの合計でも
よい。後者の方が、帯領域間に罫線や図表などがあって
隙間が生じる場合に、以降で求める各種帯領域高さの合
計との比率が正しく求められなくなることを防止するこ
とができる。次に段数2〜4と判断された帯領域(これ
を複数段帯領域と呼ぶ)の高さの合計(Total
1)と、段数不定とされた不定段帯領域の高さの合計
(Total 2)を求める(ステップ1502、15
03)。
していく。まず、Total 1/Hが閾値1より大き
ければ、当該入力文書は複数段組であると決定する(ス
テップ1504、1505)。そうでなければ、Tot
al 1/Hが閾値2(<閾値1)より大きいとき、当
該入力文書は自由段組であると決定する(ステップ15
06、1507)。そうでなければ、(Total 1
+Total 2)/Hは閾値3より大きいとき当該入
力文書は自由段組であると決定する(ステップ150
8、1509)。以上の条件に該当しなければ、当該入
力文書は1段組であると決定する(ステップ151
0)。
段分割空白部候補の取捨選択を行う(ステップ20
9)。これはステップ208で決定された文書段組種類
に従うもので、1段組であった場合は段分割空白部候補
は除去する。複数段組および自由段組であった場合に
は、段分割空白部候補をそのまま段分割空白部として利
用する。
部を活用して文字列相当の小領域を統合してまとまりの
ある文章領域(段またはその一部などに相当)を抽出す
る(ステップ210)。小領域の統合方法については、
行方向に近接した領域を行(またはその一部に相当)に
統合し、さらに行方向とは垂直な方向に行(またはその
一部に相当)を統合して領域を形成する方法を用いる
(例えば特願平3−128340号に記載の方法な
ど)。
のフィールドセパレータ(分割線)と同様に、ステップ
209で求めた段分割空白部を使用する。分割線および
分割空白部を超えて小領域を統合しないようにする。ま
たは、段分割空白部近傍では統合条件を厳しくし、より
近接したものだけを統合するようにする。また、段組種
類によってこの統合パラメータを変動させる。すなわ
ち、1段組の場合は遠く離れていても統合するように
し、自由段組の場合は近いものだけを統合するようにす
る。複数段組においては、1段組と同様に離れたもので
も分割線および段分割空白部を超えない限り統合するよ
うにするか、または段幅相当の距離までは分割線および
段分割空白部を超えない限り統合するようにする。
示す。また、図17は実施例2の処理フローチャートで
ある。本実施例は、実施例1の傾き補正手段102を傾
き検出手段1602に置き換えたもので、他の構成は実
施例1と同様である。ステップ1702において、画像
の傾きを検出し、傾き角度が閾値より大きいとき、空白
部の検出が困難であるので、ステップ1708以下の空
白部検出を行わずに(ステップ1707)、段組の種類
を自由段組として処理(ステップ1712)する。その
他は実施例1と同様であるので、説明を省略する。な
お、1602〜1610および1612は1つのプロセ
ッサ上でソフトウェアで実現することができる。
示し、図19はその処理フローチャートである。本実施
例では、実施例1の構成にさらに、段組種類指示手段1
814を付加して構成したものである。段組種類指示手
段1814によって指示された段組種類が1段組であっ
た場合には、ステップ1909以下の段分割空白部検出
処理および段種類判別処理を行わない(ステップ190
8)。
れた段組種類が非1段組であった場合には、ステップ1
910において、図15のように判別を行うときに、1
段組に判定されるところを自由段組と判定する。その他
は実施例1と同様である。なお、1802〜1810お
よび1812は1つのプロセッサ上でソフトウェアで実
現することができる。
示し、図21はその処理フローチャートである。実施例
4は、実施例1の構成から段分割空白部分別手段109
と小領域統合手段110を取り除いて構成され、文書画
像の段組種類を判別する実施例である。従って、実施例
4では、ステップ2108において、段組種類が判別さ
れると、処理が終了する。その他は実施例1と同様であ
る。なお、2002〜2008および2010は1つの
プロセッサ上でソフトウェアで実現することができる。
発明によれば、段組としての整合性の高い段分割線だけ
を利用して領域分割を行うので、高精度の領域分割処理
を行うことができる。
別を精度よくでき、高精度の領域分割処理を行うことが
できる。
分によって段組数が異なる場合でも精度よく段組種類を
求めることができるので、高精度の領域分割処理を行う
ことができる。
い領域分割空白部を使用せずにすむので、高精度の領域
分割処理を行うことができる。
分割空白部を検出することができるので、高精度の領域
分割処理を行うことができる。
応じた処理を採ることによって、1段組が誤って分離さ
れにくくなり、複数段組の場合は領域の未分割が少なく
なるなど、高精度の領域分割処理を行うことができる。
傾いていて空白部の検出に支障がある場合でも、ある程
度の領域分割処理能力を確保することができる。
絞り込むことにより、より高精度に段組種類の判別を可
能とし、高精度の領域分割処理を行うことができる。
組種類を求めることができる。
ある。
る。
割された図である。
ある。
出する図である。
明する図である。
の一部である。
の一部である。
である。
である。
Claims (9)
- 【請求項1】 文書画像の領域分割方法において、該文
書画像から文字列を含む、複数の小領域を抽出し、該複
数の小領域から空白部または罫線を検出し、該検出され
た空白部または罫線を基に、1段組、複数段組、自由段
組を含む段組種類を判別し、該段組種類に応じて該空白
部を用いて前記小領域を統合し、前記文書画像を所定の
領域に分割することを特徴とする文書画像の領域分割方
法。 - 【請求項2】 前記文書画像の段組種類は、前記空白部
または罫線の本数、位置を基に判別することを特徴とす
る請求項1記載の文書画像の領域分割方法。 - 【請求項3】 文字列と平行する方向に前記小領域を分
割する空白部または罫線を検出し、該空白部または罫線
によって画像を文字列と平行に分割し、該分割された各
画像部分毎に段組数または種類を求め、該結果を統合し
て画像全体の段組種類を決定することを特徴とする請求
項1記載の文書画像の領域分割方法。 - 【請求項4】 前記段組種類に応じて、前記検出された
空白部を取捨選択することを特徴とする請求項1記載の
文書画像の領域分割方法。 - 【請求項5】 前記空白部を検出する方法は、長い白ラ
ンの連結成分を空白部として検出する方法と、文字要素
の射影ヒストグラムから空白部を検出する方法とを併用
することを特徴とする請求項1記載の文書画像の領域分
割方法。 - 【請求項6】 前記段組種類に応じて、前記小領域の統
合条件を変更することを特徴とする請求項1記載の文書
画像の領域分割方法。 - 【請求項7】 前記文書画像の傾きが所定の閾値以上で
あるとき、前記段組種類を自由段組とすることを特徴と
する請求項1記載の文書画像の領域分割方法。 - 【請求項8】 前記段組種類は、予め指定された段組種
類を含むことを特徴とする請求項1記載の文書画像の領
域分割方法。 - 【請求項9】 文書画像の段組種類判別方法において、
該文書画像から文字列を含む、複数の小領域を抽出し、
該複数の小領域から空白部または罫線を検出し、該空白
部または罫線の本数、位置を基に、1段組、複数段組、
自由段組を含む、文書画像の段組種類を判別することを
特徴とする文書画像の段組種類判別方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP19439995A JP3607753B2 (ja) | 1995-07-31 | 1995-07-31 | 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP19439995A JP3607753B2 (ja) | 1995-07-31 | 1995-07-31 | 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置 |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004163074A Division JP2004246929A (ja) | 2004-06-01 | 2004-06-01 | 文書画像の領域分割方法および装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0944594A true JPH0944594A (ja) | 1997-02-14 |
| JP3607753B2 JP3607753B2 (ja) | 2005-01-05 |
Family
ID=16323958
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP19439995A Expired - Lifetime JP3607753B2 (ja) | 1995-07-31 | 1995-07-31 | 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3607753B2 (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008305099A (ja) * | 2007-06-06 | 2008-12-18 | Sharp Corp | 画像処理方法、画像処理装置、画像形成装置、コンピュータプログラム、及び記録媒体 |
| JP2013196369A (ja) * | 2012-03-19 | 2013-09-30 | Pfu Ltd | 画像処理装置、文字認識方法及びコンピュータプログラム |
| JP2017175600A (ja) * | 2016-03-18 | 2017-09-28 | 株式会社リコー | 画像処理装置、画像処理方法及びプログラム |
| JP2019016350A (ja) * | 2017-06-30 | 2019-01-31 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 電子文書における強調テキストの識別 |
| CN110020983A (zh) * | 2018-01-10 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 图像处理方法和装置 |
| CN111695553A (zh) * | 2020-06-05 | 2020-09-22 | 北京百度网讯科技有限公司 | 表格识别方法、装置、设备和介质 |
-
1995
- 1995-07-31 JP JP19439995A patent/JP3607753B2/ja not_active Expired - Lifetime
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008305099A (ja) * | 2007-06-06 | 2008-12-18 | Sharp Corp | 画像処理方法、画像処理装置、画像形成装置、コンピュータプログラム、及び記録媒体 |
| JP2013196369A (ja) * | 2012-03-19 | 2013-09-30 | Pfu Ltd | 画像処理装置、文字認識方法及びコンピュータプログラム |
| JP2017175600A (ja) * | 2016-03-18 | 2017-09-28 | 株式会社リコー | 画像処理装置、画像処理方法及びプログラム |
| JP2019016350A (ja) * | 2017-06-30 | 2019-01-31 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 電子文書における強調テキストの識別 |
| CN110020983A (zh) * | 2018-01-10 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 图像处理方法和装置 |
| CN110020983B (zh) * | 2018-01-10 | 2023-09-22 | 北京京东尚科信息技术有限公司 | 图像处理方法和装置 |
| CN111695553A (zh) * | 2020-06-05 | 2020-09-22 | 北京百度网讯科技有限公司 | 表格识别方法、装置、设备和介质 |
| CN111695553B (zh) * | 2020-06-05 | 2023-09-08 | 北京百度网讯科技有限公司 | 表格识别方法、装置、设备和介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3607753B2 (ja) | 2005-01-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3253356B2 (ja) | 文書画像の領域識別方法 | |
| US6212299B1 (en) | Method and apparatus for recognizing a character | |
| JP3359095B2 (ja) | 画像処理方法及び装置 | |
| JP3278471B2 (ja) | 領域分割方法 | |
| CN1099800C (zh) | 图像处理方法和设备 | |
| JP2002288589A (ja) | 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| US8452095B2 (en) | Image processing for post-processing rate of character rectangle extraction and character recognition accuracy | |
| EP1073002B1 (en) | Character extracting method | |
| JPH0944594A (ja) | 文書画像の領域分割方法および段組種類判別方法 | |
| JPH1031716A (ja) | 文字行抽出方法および装置 | |
| JP3187895B2 (ja) | 文字領域抽出方法 | |
| JPH0410087A (ja) | 基本ライン抽出方法 | |
| JP4228592B2 (ja) | 文字認識装置 | |
| JP2021005234A (ja) | 帳票認識装置、帳票認識方法、及び帳票認識システム | |
| JP2004246929A (ja) | 文書画像の領域分割方法および装置 | |
| JP4244692B2 (ja) | 文字認識装置及び文字認識プログラム | |
| JP2872768B2 (ja) | 文字切出し装置 | |
| JPH06180771A (ja) | 英文字認識装置 | |
| Okun et al. | Robust text detection from binarized document images | |
| JP2009272714A (ja) | 画像処理装置、画像処理方法、プログラム及びプログラムを記録した記録媒体 | |
| JP2728086B2 (ja) | 文字切り出し方法 | |
| EP0446630A2 (en) | Method and apparatus for segmenting characters in an amount field on a financial document | |
| JP2917394B2 (ja) | 文字認識装置及び文字切り出し方法 | |
| JPH0816719A (ja) | 文字切り出し方法とこれを用いた文字認識方法及び装置 | |
| JP3712825B2 (ja) | 画像処理方法、装置および記録媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040420 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040520 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20040609 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040706 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040903 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041005 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041008 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071015 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081015 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081015 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091015 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101015 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111015 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121015 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131015 Year of fee payment: 9 |
|
| EXPY | Cancellation because of completion of term |