JPH0434794B2

JPH0434794B2 -

Info

Publication number: JPH0434794B2
Application number: JP59185398A
Authority: JP
Inventors: Atsushi Yugawa
Original assignee: Tokyo Shibaura Electric Co Ltd
Current assignee: Toshiba Corp
Priority date: 1984-09-06
Filing date: 1984-09-06
Publication date: 1992-06-09
Also published as: JPS6165378A

Description

【発明の詳細な説明】

〔発明の技術分野〕本発明は電子計算機による文字、図形認識方法
及び装置に関する。〔発明の技術的背景とその問題点〕現在、文字、図形等（以下、文字図形と記す）
を電子計算機で認識処理する場合、その入力画面
はある決められた桝目の中に書かれたパターンの
みが対象である。従つて、「＝」と「−」は、既
に桝目の中にかかれた線の本数によつて結果が判
別できる。しかし一般の図面中に任意に書かれた
文字図形等は、位置が定まらないために「＝」と
「−」は他の情報がない限り区別するのが困難で
ある。すなわち、「＝」は「−」が２本並んでい
るだけかもしれない。現在アルフアベツトの中に
もある複数の要素で構成される文字（例えば
「−」と「０」が各々１要素でそれらの要素が集
まつて「０」になる文字等）を認識する手法は一
部の大学で研究されている程度でまだ実用化の域
に達していない。従来の技術でこれを実現しよう
とすると位置関係の多様性、記憶容量、処理速度
の面から認識コストが高くなる。すなわち「０」
を認識するのみでも既存の文字図形認識装置を機
能アツプしないと実現できない。また、文字の抽
出を文字例として抽出して、その情報を利用して
各要素の統合をするのは、前記方法よりまた一段
と認識コストが高くなるという問題がある。〔発明の目的〕本発明は上記問題点に鑑みてなされたもので、
図面中の任意の位置に書かれた多要素から構成さ
れている文字図形（以下、分離文字図形と記す）
を、既存の文字図形認識装置を利用して、低コス
トで認識可能な文字図形認識方法及び装置を提供
することを目的とする。〔発明の概要〕一般に分離文字図形等を分析すると、それらは
極めて簡単な既存の文字図形等の要素によつて構
成されている。これらの要素は、その要素毎に抽
出され、認識される。本発明ではその認識結果の要素からその要素１
つだけで文字図形となる要素（例「Ａ」，「Ｂ」，
「Ｃ」etc）と、他の要素と組み合わせて異なる文
字図形となる要素（例「−」，「１」，「０」etc）
を区別する。そして、前者は単独文字図形として
最終認識し、後者に対しては認識結果と、組合せ
要素の位置関係を検知して分離文字図形として最
終確認する。すなわち、本発明は、文字図形の画像を二値化
した画像データとして入力し、この画像データを
予め画像パターンを記憶した辞書と照合して所定
の文字図形を判定する文字図形認識方法におい
て、前記画像データの任意の位置の所定の小領域
内の孤立した文字図形（以下、第１の要素と記
す）位置情報を付加して抽出し、前記第１の要素
を既存の文字図形認識手段により認識し、その認
識された第１の要素が複数要素の組合せで成る１
つの文字図形（以下、第２の要素と記す）を構成
するような所定の要素（例えば「−」，「１」，
「０」，…等以下、所定第１の要素と記す）である
か否かを判断し、所定第１の要素と判断されなか
つた第１の要素は単独文字図形として最終認識し
出力する。所定第１の要素であると判断された第
１の要素は、それらの位置関係が検出され前記所
定第１の要素の位置関係を予め記憶した分離文字
図形認識辞書と照合して第２の要素を検知し、分
離文字図形として最終認識し出力することによつ
て図面中の分離文字図形を高速で認識できるよう
にした文字図形認識方法及び装置である。〔発明の実施例〕本発明の文字図形認識方法及び装置を実施例を
用いて以下に説明する。第３図は本発明のハード
ウエアの主要構成を示す一実施例である。同図に
おいて、１１はCCDスキヤナー等の図面（画像
データ）入力部、１２は二値化された画像データ
を記憶する画像用メモリ、１３はAMD2903等の
画像処理プロセツサ、１４は任意画面の切出しを
制御するアドレスコントロールハードウエア、１
５は共有メモリ、１６は既存の文字図形認識装
置、１７は分離文字図形認識装置で本発明の特徴
部をなす部分である。第１図は本発明の機能構成を示すブロツク図
で、画像データ入力手段２１は入力画像を図面入
力部１１とアドレスコントロールハードウエア１
４により二値化した画像データに変換するもの
で、例えばA3サイズの図面の入力画像を約８百
万（2000×4000）画素の二値化した画像データに
変換する。これらの画像データは画像メモリ２等
の画像データ記憶手段２２に蓄えられる。入力画
像は文字図形に限らず線分、その他の要素が含ま
れており、その中から文字図形の候補となる孤立
図形の画像データを画像処理プロセツサ１３及び
コントロールハードウエア１４による小領域連結
画像データ抽出手段２３により抽出する。これは
入力画像の任意の位置の所定の小領域内で孤立し
て他の図形と連結していない文字図形の画像デー
タを第１の要素として抽出する。すなわち、第４
図のような入力画像の場合、〜に示す小規模
孤立図形の画像データを第１の要素として抽出
し、に示した線分は抽出しない。また、このと
き同時に各第１の要素の位置情報が付加して抽出
される。抽出された第１の要素は既存の文字図形
認識手段２４により認識される。その認識された
第１の要素が分離文字図形選択手段２５により複
数の組合せで新たな１つの第２の要素を構成する
所定第１の要素であるか否かを判別する。所定第
１の要素として判別されなかつた第１の要素は、
文字図形認識手段２４で単独文字図形として認識
され、認識結果出力手段２８へ送出される。ま
た、所定第１の要素として判別されたものは位置
関係検出手段２６によりそれぞれの要素に付加さ
れている位置情報から２次元的位置関係を検出す
る。例えば“「０」ならば「０」の要素の上に
「−」の要素がある。または「−」の要素の下に
「０」の要素がある。”と云う位置関係を検出しそ
の情報をそれぞれの要素に付加する。その後、分
離文字図形認識辞書照合手段２７により第２の要
素との照合が行われる。ここで辞書とは複数の所
定第１の要素の組合せパターンとその文字図形と
の対応表である。すなわち、同じ「０」でも
「−」が左寄りのもの（「^-0」）との右寄りのもの
“「0^-）等、何種類かの可能性が存在するので、こ
のような場合は単に“「０」の上に「−」がある”
と云うパターン部を照合の対象として「０」と認
識する。このようにして所定第１の要素の組合せ
パターンから第２の要素と照合し、第２の要素と
して照合がとれた場合には、この第２の要素の文
字データを分離文字図形として最終認識し、認識
結果出力手段２８へ送出される。また、分離文字
図形認識辞書照合手段２７で第２の要素として照
合されなかつた所定第１の要素は各々単独文字図
形として認識され、認識結果出力手段２８へ送出
される。以下、分離文字図形認識の方法について具体例
を用いて説明する。入力画像として第５図ａに示
す〜の画像があるとすると、分離文字図形選
択手段２５には各要素データとして第１表に示す
ようにアスキーコード等による認識結果と位置情
報が入力される。この位置情報は各画像のＸ，Ｙ
軸に添つた外接四角形（ウインド）の対角点
（X_L，Y_L），（X_H，Y_Hの絶対座標が付加されてい
る。この位置情報はウインドサイズと呼ばれる。

【表】分離文字図形選択手段２５には複数の組合せで
１つの第２の要素を構成する所定第１の要素（例
えば０，−，１等）を判別する機能を有し、位置
関係検出手段２６、分離文字図形認識辞書照合手
段２７を介して第２表に示すように入力画像，
は単独文字図形として認識し、入力画像，
，は３つの要素の組合せで１つの第２の要素
を構成すると認識する。

【表】入力画像が所定第１の要素であると判断された
とき、その所定第１の要素を単独文字図形として
認識するか分離文字図形として認識すべきかの判
断は第２図に示す手順によつて行なう。先づ、手
順３１により入力された要素のウインドの周囲を
所定の値△だけ拡大する。次に手順３２によりウ
インドの重なるものと重ならないものを区別し、
手順３３によりウインドの重ならないものは単独
文字図形である判断して最終認識とする。

【表】ウインドの重なつた所定第１の要素は手順３４
により全て抽出してそれぞれの要素のウインドの
中心座標を求め、手順３５により各要素を縦・横
の方向に並べかえ、手順３６により縦・横に並び
かえられた各要素の中心座標の並びパターンと辞
書とを照合して新たに１つの第２の要素として認
識する。第５図ｂに示したウインド４１〜４５は
手順３１により拡大されたウインドの様子を示し
たもので、ウインド４１，４２は他のいずれのウ
インドにも重ならないので単独文字図形「０」，
「１」として認識される。ウインド４３，４４，
４５はすべて重なつているのでそれらの要素の
縦・横の並びパターンが辞書と照合されて「％」
と認識される。

〔発明の効果〕

本発明によれば図面等の任意の位置の多要素で
構成された分離文字図形を高速で認識することが
可能となり、必要に応じて既存の文字図形認識装
置に分離文字図形認識手段を付加することが可能
なので独立性の良い認識システムを構築すること
が可能となり、認識コストの安価な文字図形認識
方法及び装置を提供することができる。

【図面の簡単な説明】

第１図は本発明の図形文字認識装置の機能ブロ
ツク構成図、第２図は本発明の機能を説明するた
めの流れ図、第３図は本発明のハードウエアの一
実施例を示した主要構成図、第４図は小規模孤立
図形の抽出を説明するための入力画像の一例を示
した図、第５図は本発明による分離文字図形認識
装置の判断機能を説明するための入力画像とその
ウインドサイズの一例を示した図である。１１…図面入力部、１２…画像用メモリ、１３
…画像処理プロセツサ、１４…コントロールハー
ドウエア、１５…共有メモリ、１６…既存の文字
図形認識装置、１７…分離文字図形認識装置、２
１…画像データ入力手段、２２…画像データ記憶
手段、２３…小領域連結画像データ抽出手段、２
４…文字認識手段、２５…分離文字図形認識手
段、２６…位置関係検出手段、２７…分離文字図
形認識辞書照合手段、２８…認識結果出力手段。

Claims

【特許請求の範囲】１文字図形の画像を二値化した画像データとを
予め画像パターンを記憶した辞書と照合して所定
の文字図形を判定する文字図形認識方法におい
て、前記画像データの任意の位置の所定の小領域
内の孤立した文字図形をその位置情報と共に認識
し、認識した文字図形の中から複数の組合せで分
離文字図形を構成する所定の要素（例えば「−」，
「１」，「０」…，等）を選択し、所定の要素とし
て選択されなかつた文字図形は単独文字図形とし
て最終認識し、選択された所定の要素はその位置
関係を検出し、予め所定の要素の位置関係が記憶
されている分離文字図形認識辞書と照合して、照
合のとれた所定の要素の組合せは分離文字図形と
して、照合のとれなかつた所定の要素は単独文字
図形として最終認識し、それぞれ最終認識結果を
出力することを特徴とした文字図形認識方法。２文字図形の画像を二値化した画像データとし
て入力する画像データ入力手段と、この画像デー
タを予め画像パターンを記憶した辞書と照合して
所定の文字図形を判定する文字図形認識手段を備
えた装置において、前記画像データの任意の位置
の所定の小領域内の孤立した文字図形を第１の要
素として位置情報を付加して抽出する小領域連結
画像データ抽出手段と、前記第１の要素を認識す
る既存の文字図形認識手段と、前記文字図形認識
手段により認識された前記第１の要素の中から複
数の組合せから成る第２の要素を構成する所定第
１の要素（例えば「−」，「１」，「０」，…，等）
を選択する分離文字図形選択手段と、前記分離文
字図形選択手段で選択された前記所定第１の要素
の位置関係を検出する位置関係検出手段と、前記
所定第１の要素の位置関係を予め記憶した分離文
字図形認識辞書と照合して最終認識として出力す
る分離文字図形認識辞書照合手段を備え、分離文
字図形選択手段により選択されなかつた第１の要
素及び分離文字図形認識辞書照合手段で照合され
なかつた所定第１の要素を単独文字図形として認
識し、分離文字図形認識辞書照合手段で照合され
た第２の要素を分離文字図形として認識し、出力
することを特徴とした文字図形認識装置。