JPS63308689A - 文字の傾き角度検出修正方式 - Google Patents
文字の傾き角度検出修正方式Info
- Publication number
- JPS63308689A JPS63308689A JP62144299A JP14429987A JPS63308689A JP S63308689 A JPS63308689 A JP S63308689A JP 62144299 A JP62144299 A JP 62144299A JP 14429987 A JP14429987 A JP 14429987A JP S63308689 A JPS63308689 A JP S63308689A
- Authority
- JP
- Japan
- Prior art keywords
- character
- characters
- inclination angle
- inclination
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概 要〕
文字の周囲に環状領域を設定し、該領域に文字があるか
否か調べて逐次、文字を検出し、抽出された文字列内の
、小領域文字及び分離らしき文字を除いた2つの文字の
枠の中心座標を結んだ線分゛の傾きを検出し、該傾きだ
け文字を回転させて文字を正立させ、文字認識率を向上
させる。
否か調べて逐次、文字を検出し、抽出された文字列内の
、小領域文字及び分離らしき文字を除いた2つの文字の
枠の中心座標を結んだ線分゛の傾きを検出し、該傾きだ
け文字を回転させて文字を正立させ、文字認識率を向上
させる。
本発明は、図面などに斜めに記入された文字群の文字の
傾き角度を検出し修正する方式に関する。
傾き角度を検出し修正する方式に関する。
測量図面や機械の構造図面などを計算機に入力するには
通常、ドラムスキャナやファクシミリ装置などが使用さ
れる。これらの図面には形状を表わす線の他に、距離、
寸法、部品等を表わす数字、記号、アルフナベットなど
(以下単に文字という)が記入されているのが普通であ
り、従って計算機への入力に当っては文字認識が必要で
ある。
通常、ドラムスキャナやファクシミリ装置などが使用さ
れる。これらの図面には形状を表わす線の他に、距離、
寸法、部品等を表わす数字、記号、アルフナベットなど
(以下単に文字という)が記入されているのが普通であ
り、従って計算機への入力に当っては文字認識が必要で
ある。
文字群は縦、横方向(図面読取り装置の主走査方向が横
又はX方向、副走査方向が縦又はY方向)に記入されて
いるとは限らず、斜め方向に記入されている例も多い。
又はX方向、副走査方向が縦又はY方向)に記入されて
いるとは限らず、斜め方向に記入されている例も多い。
例えば測量図面で、測量対象の土地が不等辺四角形をな
していると、その各辺および、1つの対角線、該対角線
へ頂角から下した垂線に沿って長さを記入するのが普通
で、この場合、対角線及び垂線に沿って記入した数字は
斜めになる。
していると、その各辺および、1つの対角線、該対角線
へ頂角から下した垂線に沿って長さを記入するのが普通
で、この場合、対角線及び垂線に沿って記入した数字は
斜めになる。
従来の図面読取り装置では、縦、横方向に記入された文
字群を認識対象とし、斜め方向に記入された文字群は認
識対象とせず、従って別個に人手による入力が必要であ
る。
字群を認識対象とし、斜め方向に記入された文字群は認
識対象とせず、従って別個に人手による入力が必要であ
る。
この点を改善する方式を本発明者は開発し、「文字列抽
出方式」 (特願昭61−142519)などとして出
願している。この概要を第3図で説明すると、同図(a
)は図面10に斜めに記入された文字列本例ではABC
DEFを示す。か\る図面を図面読取り装置で読取ると
、例えば背景部の画素は0、文字部の画素は1の2値デ
ータの多数となり、メモリに格納される。このメモリを
読出して線分検出、文字検出などを行なうが、文字は、
その画素が一定の大きさの区画内にあり、他との連結を
持たず独立して存在する、という論理で検出できる。
出方式」 (特願昭61−142519)などとして出
願している。この概要を第3図で説明すると、同図(a
)は図面10に斜めに記入された文字列本例ではABC
DEFを示す。か\る図面を図面読取り装置で読取ると
、例えば背景部の画素は0、文字部の画素は1の2値デ
ータの多数となり、メモリに格納される。このメモリを
読出して線分検出、文字検出などを行なうが、文字は、
その画素が一定の大きさの区画内にあり、他との連結を
持たず独立して存在する、という論理で検出できる。
文字が見つかったら第3図(blに示すように、該文字
(本例ではA)を囲む枠12を設定し、この枠12の外
周に幅αの角環状領域14を設定する。
(本例ではA)を囲む枠12を設定し、この枠12の外
周に幅αの角環状領域14を設定する。
そしてこの領域14に文字の一部が存在するか否か(1
があるか否か)をチェックする。本例では存在しており
、そこでこの文字(本例ではB)を囲む一定の大きさの
枠16を同図fc)のように設定する。枠12.16の
縦辺、横辺は前記縁(Y)、横(X)方向に合わせる。
があるか否か)をチェックする。本例では存在しており
、そこでこの文字(本例ではB)を囲む一定の大きさの
枠16を同図fc)のように設定する。枠12.16の
縦辺、横辺は前記縁(Y)、横(X)方向に合わせる。
第3図(C1では枠12と16が接しているが、これは
離れていることもある。
離れていることもある。
こうして2文字が見付かったら、第3図(d+の如く、
その枠12.16の中心点12a、16aを求め、これ
らを結ぶ線分18を発生し、該線分18と横線とのなす
角θを求める。この角θが求まると、文字列はこの角θ
をなす直線上にあることが予想されるからその方向で文
字検出を行ない、やがて文字列の最初から最後の文字ま
でを検出することができる。
その枠12.16の中心点12a、16aを求め、これ
らを結ぶ線分18を発生し、該線分18と横線とのなす
角θを求める。この角θが求まると、文字列はこの角θ
をなす直線上にあることが予想されるからその方向で文
字検出を行ない、やがて文字列の最初から最後の文字ま
でを検出することができる。
文字群は彎曲して画かれていることもあるが、角θの方
向に余裕βをとってθ±βとし、この方向で第3図(b
)の方法を繰り返し通用して行くと、彎曲配列の文字群
も容易に検出することができる。
向に余裕βをとってθ±βとし、この方向で第3図(b
)の方法を繰り返し通用して行くと、彎曲配列の文字群
も容易に検出することができる。
この先行発明により、図面に斜めに書込まれた文字群の
検出、その傾斜角の検出、が可能になるが、第3図(b
) (0)で明らかなように枠12,16゜・・・・・
・の縦、横辺から見ると文字は傾斜している。
検出、その傾斜角の検出、が可能になるが、第3図(b
) (0)で明らかなように枠12,16゜・・・・・
・の縦、横辺から見ると文字は傾斜している。
文字認識は、正立状態の文字パターンと認識対象の文字
パターンとのマツチングをとるという方法で行なうから
、認識対象の文字パターンが第3図(bl (C1の如
く傾いているとマツチングがとれない、または誤認識子
る恐れがある。
パターンとのマツチングをとるという方法で行なうから
、認識対象の文字パターンが第3図(bl (C1の如
く傾いているとマツチングがとれない、または誤認識子
る恐れがある。
また文字にはドツト「・」や分離文字「=」などの記号
もあり、これらも1文字として扱って傾斜角θを求める
と、これらは上下にずれ易い、周囲に設定する枠が普通
の文字の周囲に設定する枠に比べて異常(過小、形が異
なる)、ひいてはその中心位置が異常、などにより大き
な誤差を生じ □ることがある。
もあり、これらも1文字として扱って傾斜角θを求める
と、これらは上下にずれ易い、周囲に設定する枠が普通
の文字の周囲に設定する枠に比べて異常(過小、形が異
なる)、ひいてはその中心位置が異常、などにより大き
な誤差を生じ □ることがある。
本発明はか−る点を改善し、正しい傾斜角が求まるよう
にし、また文字の傾きを補正して認識率の向上を図ろう
とするものである。
にし、また文字の傾きを補正して認識率の向上を図ろう
とするものである。
第1図に示すように本発明では、原画読取部20、文字
検出手段22、文字列抽出手段24、文字列傾き抽出手
段26、および文字回転手段28、の構成とする。
検出手段22、文字列抽出手段24、文字列傾き抽出手
段26、および文字回転手段28、の構成とする。
本発明の文字列傾き抽出手段26では、原画読取部20
で読取った図面の画素データ群から、文字検出手段22
で文字相当の大きさく閾値内の大きさ)の孤立領域を抽
出したものに対し、第3図(b)で説明した手法を通用
して次の文字を見付ける。
で読取った図面の画素データ群から、文字検出手段22
で文字相当の大きさく閾値内の大きさ)の孤立領域を抽
出したものに対し、第3図(b)で説明した手法を通用
して次の文字を見付ける。
即ち枠12を設定し、その周囲に幅αの環状領域を設定
し、文字らしきものがあるか(lがあるか)調べる。あ
れば、文字検出手段22が、それは孤立領域を形成する
か否か調べ、形成すれば処理を文字列抽出手段24に渡
す。これらの文字列伸出手段24および文字検出手段2
2は同様処理を繰り返して次々に文字を検出して行くが
、文字21固目からは文字列傾き抽出手段26によりお
よその傾斜角θを求めさせておくと、次の文字有り/無
しを探索するのが容易、迅速になる。
し、文字らしきものがあるか(lがあるか)調べる。あ
れば、文字検出手段22が、それは孤立領域を形成する
か否か調べ、形成すれば処理を文字列抽出手段24に渡
す。これらの文字列伸出手段24および文字検出手段2
2は同様処理を繰り返して次々に文字を検出して行くが
、文字21固目からは文字列傾き抽出手段26によりお
よその傾斜角θを求めさせておくと、次の文字有り/無
しを探索するのが容易、迅速になる。
文字にはドツト「・」や分離文字「−」があり、前者に
対してはそれを包含する枠12が非常に小さく、後者に
対してはそれを包含する枠12が横に細長い。このよう
なものは文字列傾き抽出で用いる文字とはしない、そし
て文字列傾きには、なるべく多くの文字を採用する(直
線上にあれば、始端と終端の文字を採用する)ようにす
る。これにより、正しい傾斜角θを求めることができる
。
対してはそれを包含する枠12が非常に小さく、後者に
対してはそれを包含する枠12が横に細長い。このよう
なものは文字列傾き抽出で用いる文字とはしない、そし
て文字列傾きには、なるべく多くの文字を採用する(直
線上にあれば、始端と終端の文字を採用する)ようにす
る。これにより、正しい傾斜角θを求めることができる
。
文字回転手段では、枠12.16内の文字を、傾斜角θ
だけ縦、横線側へ回転して、文字を正立させる。これは
、メモリから文字を読出し、再びメモリに書込み、この
際既知の図形回転処理を施すことにより、容易に行なえ
る。
だけ縦、横線側へ回転して、文字を正立させる。これは
、メモリから文字を読出し、再びメモリに書込み、この
際既知の図形回転処理を施すことにより、容易に行なえ
る。
第2図(alは文字列がABC−DEである例を示す、
このような場合はドツト「・」は、文字列傾き抽出で用
いる文字とはせず、他の2文字本例では文字列の始端文
字Aと終端文字Bの各枠12゜32の中心点を結ぶ線分
lを求め、この線分lと水平線Hとのなす角θを求める
0文字画素の座標のXm1n 、 Xagax + Y
min 、 Ymaxにあるマージンγを+、−シて枠
12.16.・・・・・・を設定すると、ドツト「・」
の枠30は小さい(最小)、これによって当該文字はド
ツトであることが分るが、これはXn+in #Xma
x 、 Yn+in #Ymaxという条件からも判定
できる。
このような場合はドツト「・」は、文字列傾き抽出で用
いる文字とはせず、他の2文字本例では文字列の始端文
字Aと終端文字Bの各枠12゜32の中心点を結ぶ線分
lを求め、この線分lと水平線Hとのなす角θを求める
0文字画素の座標のXm1n 、 Xagax + Y
min 、 Ymaxにあるマージンγを+、−シて枠
12.16.・・・・・・を設定すると、ドツト「・」
の枠30は小さい(最小)、これによって当該文字はド
ツトであることが分るが、これはXn+in #Xma
x 、 Yn+in #Ymaxという条件からも判定
できる。
文字列の例としてはA、B=DEなどもある。
この場合の「、」及び「=」も傾き抽出用の文字としな
い。分離文字「=」は細長い、従って枠(12等)の縦
辺又は横辺が閾値以下、などという条件で除く。
い。分離文字「=」は細長い、従って枠(12等)の縦
辺又は横辺が閾値以下、などという条件で除く。
第2図(blは、文字回転手段28による文字の回転要
領を示す。傾斜線に沿って書かれていると文字は図示b
1の如(傾いているから、これを傾斜角θだけ回転して
文字を図示b2の如(正立させる。
領を示す。傾斜線に沿って書かれていると文字は図示b
1の如(傾いているから、これを傾斜角θだけ回転して
文字を図示b2の如(正立させる。
文字列の傾斜角検出に採用しない文字としては、記入位
置が変り易い及び又は正常位置にない文字がその対象で
、従ってダッシユ「′」、度「゛」なども除外対象であ
る。
置が変り易い及び又は正常位置にない文字がその対象で
、従ってダッシユ「′」、度「゛」なども除外対象であ
る。
以上説明したように本発明では、文字群からドツトなど
の普通の文字からみて小さく、位置が変り易い又は異常
である文字を除いて、複数の文字の各領域の中心を結ぶ
線分の傾斜角θを求めるので、傾斜角計測が正確であり
、また該傾斜角だけ文字を回転させて文字認識に供する
ので、誤認識を回避でき、傾斜して記入された文字群の
自動入力も可能であるなどの利点が得られる。
の普通の文字からみて小さく、位置が変り易い又は異常
である文字を除いて、複数の文字の各領域の中心を結ぶ
線分の傾斜角θを求めるので、傾斜角計測が正確であり
、また該傾斜角だけ文字を回転させて文字認識に供する
ので、誤認識を回避でき、傾斜して記入された文字群の
自動入力も可能であるなどの利点が得られる。
第1図は本発明の原理ブロック図、
第2図は本発明の詳細な説明する図、
第3図は既出願の方式の説明図である。
Claims (1)
- 【特許請求の範囲】 文字が記入された図面を読取る原画読取部(20)と、 読取った図面の画素データ群から閾値内の大きさの孤立
領域として文字部を検出し、該孤立領域内の文字を含む
枠(12)を設定し、該枠(12)の周囲に所定幅の環
状領域(14)を設定して該環状領域内に文字があるか
否か調べ、あればその文字に対して同様処理を繰り返し
て文字列を抽出する手段(22、24)と、 文字列中の、ドット及び分離文字などの大きさ及び又は
位置が異常な文字を除く、複数文字の枠の中心を結ぶ線
分を発生して該線分の傾斜角(θ)を求める文字列傾き
抽出手段(26)と、 該傾斜角だけ枠内の文字を回転させる文字回転手段(2
8)を有することを特徴とする文字の傾き角度検出修正
方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62144299A JPS63308689A (ja) | 1987-06-10 | 1987-06-10 | 文字の傾き角度検出修正方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62144299A JPS63308689A (ja) | 1987-06-10 | 1987-06-10 | 文字の傾き角度検出修正方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS63308689A true JPS63308689A (ja) | 1988-12-16 |
Family
ID=15358839
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP62144299A Pending JPS63308689A (ja) | 1987-06-10 | 1987-06-10 | 文字の傾き角度検出修正方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS63308689A (ja) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003162686A (ja) * | 2001-11-26 | 2003-06-06 | Fujitsu Frontech Ltd | 媒体読み取り装置、搬送媒体の読み取り方法 |
| WO2004107257A1 (ja) * | 2003-05-30 | 2004-12-09 | Fujitsu Limited | 帳票処理プログラム、方法及び装置 |
| JP2011175523A (ja) * | 2010-02-25 | 2011-09-08 | Nippon Syst Wear Kk | 計器読み取り装置、方法、プログラム、および該ソフトウェアを格納したコンピュータ可読媒体 |
| JP5950317B1 (ja) * | 2016-02-25 | 2016-07-13 | 有限会社Ics Sakabe | コード認識システム、コード認識方法、コード認識プログラム、及び荷物仕分システム |
| CN110110697A (zh) * | 2019-05-17 | 2019-08-09 | 山东省计算中心(国家超级计算济南中心) | 基于方向矫正的多指纹分割提取方法、系统、设备及介质 |
-
1987
- 1987-06-10 JP JP62144299A patent/JPS63308689A/ja active Pending
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003162686A (ja) * | 2001-11-26 | 2003-06-06 | Fujitsu Frontech Ltd | 媒体読み取り装置、搬送媒体の読み取り方法 |
| WO2004107257A1 (ja) * | 2003-05-30 | 2004-12-09 | Fujitsu Limited | 帳票処理プログラム、方法及び装置 |
| US7551778B2 (en) | 2003-05-30 | 2009-06-23 | Pfu Limited | Business form processing program, method, and device |
| JP2011175523A (ja) * | 2010-02-25 | 2011-09-08 | Nippon Syst Wear Kk | 計器読み取り装置、方法、プログラム、および該ソフトウェアを格納したコンピュータ可読媒体 |
| JP5950317B1 (ja) * | 2016-02-25 | 2016-07-13 | 有限会社Ics Sakabe | コード認識システム、コード認識方法、コード認識プログラム、及び荷物仕分システム |
| CN110110697A (zh) * | 2019-05-17 | 2019-08-09 | 山东省计算中心(国家超级计算济南中心) | 基于方向矫正的多指纹分割提取方法、系统、设备及介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3343864B2 (ja) | 語体の分離方法 | |
| US5410611A (en) | Method for identifying word bounding boxes in text | |
| JP3108979B2 (ja) | 画像処理方法および画像処理装置 | |
| US5815595A (en) | Method and apparatus for identifying text fields and checkboxes in digitized images | |
| JPH0757051A (ja) | パターン認識装置 | |
| JPH0519753B2 (ja) | ||
| CN101676930A (zh) | 一种识别扫描图像中表格单元的方法及装置 | |
| US4891750A (en) | Optical character recognition by forming and detecting matrices of geo features | |
| JP3936436B2 (ja) | 表認識方法 | |
| JPH02306386A (ja) | 文字認識装置 | |
| JPS63308689A (ja) | 文字の傾き角度検出修正方式 | |
| JP2000113106A (ja) | 文書画像処理装置 | |
| US11710331B2 (en) | Systems and methods for separating ligature characters in digitized document images | |
| JPH07220081A (ja) | 画像認識装置の図形の切出し方法 | |
| JPH09237318A (ja) | イメージスキャナ入力文字画像データの傾き補正方法 | |
| EP0601730A1 (en) | Image processing method for correcting character slant | |
| JPH09288714A (ja) | 表認識方法および装置 | |
| JPS6057264B2 (ja) | 2値パタ−ンの拡大方式 | |
| JP3019897B2 (ja) | 行切出し方法 | |
| Manikandan et al. | An enhanced algorithm for Character Segmentation in document image processing | |
| JPH07182459A (ja) | 表構造抽出装置 | |
| JPH117493A (ja) | 文字認識処理装置 | |
| JP2586117B2 (ja) | 文字認識装置 | |
| JP3564987B2 (ja) | 光学式文字読取装置 | |
| JPH0128990B2 (ja) |