JPS63308689A

JPS63308689A - 文字の傾き角度検出修正方式

Info

Publication number: JPS63308689A
Application number: JP62144299A
Authority: JP
Inventors: Michiko Iwasaki; 岩崎　美知子; Yasukazu Ito; 伊藤　能一; Masashige Yamamoto; 山本　正成
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1987-06-10
Filing date: 1987-06-10
Publication date: 1988-12-16

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔概　要〕文字の周囲に環状領域を設定し、該領域に文字があるか
否か調べて逐次、文字を検出し、抽出された文字列内の
、小領域文字及び分離らしき文字を除いた２つの文字の
枠の中心座標を結んだ線分゛の傾きを検出し、該傾きだ
け文字を回転させて文字を正立させ、文字認識率を向上
させる。

〔産業上の利用分野〕

本発明は、図面などに斜めに記入された文字群の文字の
傾き角度を検出し修正する方式に関する。

測量図面や機械の構造図面などを計算機に入力するには
通常、ドラムスキャナやファクシミリ装置などが使用さ
れる。これらの図面には形状を表わす線の他に、距離、
寸法、部品等を表わす数字、記号、アルフナベットなど
（以下単に文字という）が記入されているのが普通であ
り、従って計算機への入力に当っては文字認識が必要で
ある。

文字群は縦、横方向（図面読取り装置の主走査方向が横
又はＸ方向、副走査方向が縦又はＹ方向）に記入されて
いるとは限らず、斜め方向に記入されている例も多い。

例えば測量図面で、測量対象の土地が不等辺四角形をな
していると、その各辺および、１つの対角線、該対角線
へ頂角から下した垂線に沿って長さを記入するのが普通
で、この場合、対角線及び垂線に沿って記入した数字は
斜めになる。

従来の図面読取り装置では、縦、横方向に記入された文
字群を認識対象とし、斜め方向に記入された文字群は認
識対象とせず、従って別個に人手による入力が必要であ
る。

〔従来の技術〕

この点を改善する方式を本発明者は開発し、「文字列抽
出方式」　（特願昭６１−１４２５１９）などとして出
願している。この概要を第３図で説明すると、同図（ａ
）は図面１０に斜めに記入された文字列本例ではＡＢＣ
ＤＥＦを示す。か＼る図面を図面読取り装置で読取ると
、例えば背景部の画素は０、文字部の画素は１の２値デ
ータの多数となり、メモリに格納される。このメモリを
読出して線分検出、文字検出などを行なうが、文字は、
その画素が一定の大きさの区画内にあり、他との連結を
持たず独立して存在する、という論理で検出できる。

文字が見つかったら第３図（ｂｌに示すように、該文字
（本例ではＡ）を囲む枠１２を設定し、この枠１２の外
周に幅αの角環状領域１４を設定する。

そしてこの領域１４に文字の一部が存在するか否か（１
があるか否か）をチェックする。本例では存在しており
、そこでこの文字（本例ではＢ）を囲む一定の大きさの
枠１６を同図ｆｃ）のように設定する。枠１２．１６の
縦辺、横辺は前記縁（Ｙ）、横（Ｘ）方向に合わせる。

第３図（Ｃ１では枠１２と１６が接しているが、これは
離れていることもある。

こうして２文字が見付かったら、第３図（ｄ＋の如く、
その枠１２．１６の中心点１２ａ、１６ａを求め、これ
らを結ぶ線分１８を発生し、該線分１８と横線とのなす
角θを求める。この角θが求まると、文字列はこの角θ
をなす直線上にあることが予想されるからその方向で文
字検出を行ない、やがて文字列の最初から最後の文字ま
でを検出することができる。

文字群は彎曲して画かれていることもあるが、角θの方
向に余裕βをとってθ±βとし、この方向で第３図（ｂ
）の方法を繰り返し通用して行くと、彎曲配列の文字群
も容易に検出することができる。

〔発明が解決しようとする問題点〕

この先行発明により、図面に斜めに書込まれた文字群の
検出、その傾斜角の検出、が可能になるが、第３図（ｂ
）　（０）で明らかなように枠１２，１６゜・・・・・
・の縦、横辺から見ると文字は傾斜している。

文字認識は、正立状態の文字パターンと認識対象の文字
パターンとのマツチングをとるという方法で行なうから
、認識対象の文字パターンが第３図（ｂｌ　（Ｃ１の如
く傾いているとマツチングがとれない、または誤認識子
る恐れがある。

また文字にはドツト「・」や分離文字「＝」などの記号
もあり、これらも１文字として扱って傾斜角θを求める
と、これらは上下にずれ易い、周囲に設定する枠が普通
の文字の周囲に設定する枠に比べて異常（過小、形が異
なる）、ひいてはその中心位置が異常、などにより大き
な誤差を生じ　　□ることがある。

本発明はか−る点を改善し、正しい傾斜角が求まるよう
にし、また文字の傾きを補正して認識率の向上を図ろう
とするものである。

〔問題点を解決するための手段〕

第１図に示すように本発明では、原画読取部２０、文字
検出手段２２、文字列抽出手段２４、文字列傾き抽出手
段２６、および文字回転手段２８、の構成とする。

〔作用〕

本発明の文字列傾き抽出手段２６では、原画読取部２０
で読取った図面の画素データ群から、文字検出手段２２
で文字相当の大きさく閾値内の大きさ）の孤立領域を抽
出したものに対し、第３図（ｂ）で説明した手法を通用
して次の文字を見付ける。

即ち枠１２を設定し、その周囲に幅αの環状領域を設定
し、文字らしきものがあるか（ｌがあるか）調べる。あ
れば、文字検出手段２２が、それは孤立領域を形成する
か否か調べ、形成すれば処理を文字列抽出手段２４に渡
す。これらの文字列伸出手段２４および文字検出手段２
２は同様処理を繰り返して次々に文字を検出して行くが
、文字２１固目からは文字列傾き抽出手段２６によりお
よその傾斜角θを求めさせておくと、次の文字有り／無
しを探索するのが容易、迅速になる。

文字にはドツト「・」や分離文字「−」があり、前者に
対してはそれを包含する枠１２が非常に小さく、後者に
対してはそれを包含する枠１２が横に細長い。このよう
なものは文字列傾き抽出で用いる文字とはしない、そし
て文字列傾きには、なるべく多くの文字を採用する（直
線上にあれば、始端と終端の文字を採用する）ようにす
る。これにより、正しい傾斜角θを求めることができる
。

文字回転手段では、枠１２．１６内の文字を、傾斜角θ
だけ縦、横線側へ回転して、文字を正立させる。これは
、メモリから文字を読出し、再びメモリに書込み、この
際既知の図形回転処理を施すことにより、容易に行なえ
る。

〔実施例〕

第２図（ａｌは文字列がＡＢＣ−ＤＥである例を示す、
このような場合はドツト「・」は、文字列傾き抽出で用
いる文字とはせず、他の２文字本例では文字列の始端文
字Ａと終端文字Ｂの各枠１２゜３２の中心点を結ぶ線分
ｌを求め、この線分ｌと水平線Ｈとのなす角θを求める
０文字画素の座標のＸｍ１ｎ　、　Ｘａｇａｘ　＋　Ｙ
ｍｉｎ　、　Ｙｍａｘにあるマージンγを＋、−シて枠
１２．１６．・・・・・・を設定すると、ドツト「・」
の枠３０は小さい（最小）、これによって当該文字はド
ツトであることが分るが、これはＸｎ＋ｉｎ　＃Ｘｍａ
ｘ　、　Ｙｎ＋ｉｎ　＃Ｙｍａｘという条件からも判定
できる。

文字列の例としてはＡ、Ｂ＝ＤＥなどもある。

この場合の「、」及び「＝」も傾き抽出用の文字としな
い。分離文字「＝」は細長い、従って枠（１２等）の縦
辺又は横辺が閾値以下、などという条件で除く。

第２図（ｂｌは、文字回転手段２８による文字の回転要
領を示す。傾斜線に沿って書かれていると文字は図示ｂ
１の如（傾いているから、これを傾斜角θだけ回転して
文字を図示ｂ２の如（正立させる。

文字列の傾斜角検出に採用しない文字としては、記入位
置が変り易い及び又は正常位置にない文字がその対象で
、従ってダッシユ「′」、度「゛」なども除外対象であ
る。

〔発明の効果〕

以上説明したように本発明では、文字群からドツトなど
の普通の文字からみて小さく、位置が変り易い又は異常
である文字を除いて、複数の文字の各領域の中心を結ぶ
線分の傾斜角θを求めるので、傾斜角計測が正確であり
、また該傾斜角だけ文字を回転させて文字認識に供する
ので、誤認識を回避でき、傾斜して記入された文字群の
自動入力も可能であるなどの利点が得られる。

【図面の簡単な説明】

第１図は本発明の原理ブロック図、第２図は本発明の詳細な説明する図、第３図は既出願の方式の説明図である。

Claims

【特許請求の範囲】文字が記入された図面を読取る原画読取部（２０）と、読取った図面の画素データ群から閾値内の大きさの孤立
領域として文字部を検出し、該孤立領域内の文字を含む
枠（１２）を設定し、該枠（１２）の周囲に所定幅の環
状領域（１４）を設定して該環状領域内に文字があるか
否か調べ、あればその文字に対して同様処理を繰り返し
て文字列を抽出する手段（２２、２４）と、文字列中の、ドット及び分離文字などの大きさ及び又は
位置が異常な文字を除く、複数文字の枠の中心を結ぶ線
分を発生して該線分の傾斜角（θ）を求める文字列傾き
抽出手段（２６）と、該傾斜角だけ枠内の文字を回転させる文字回転手段（２
８）を有することを特徴とする文字の傾き角度検出修正
方式。