JPH0434794B2 - - Google Patents

Info

Publication number
JPH0434794B2
JPH0434794B2 JP59185398A JP18539884A JPH0434794B2 JP H0434794 B2 JPH0434794 B2 JP H0434794B2 JP 59185398 A JP59185398 A JP 59185398A JP 18539884 A JP18539884 A JP 18539884A JP H0434794 B2 JPH0434794 B2 JP H0434794B2
Authority
JP
Japan
Prior art keywords
character
predetermined
recognition
image data
separated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP59185398A
Other languages
English (en)
Other versions
JPS6165378A (ja
Inventor
Atsushi Yugawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP59185398A priority Critical patent/JPS6165378A/ja
Publication of JPS6165378A publication Critical patent/JPS6165378A/ja
Publication of JPH0434794B2 publication Critical patent/JPH0434794B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
〔発明の技術分野〕 本発明は電子計算機による文字、図形認識方法
及び装置に関する。 〔発明の技術的背景とその問題点〕 現在、文字、図形等(以下、文字図形と記す)
を電子計算機で認識処理する場合、その入力画面
はある決められた桝目の中に書かれたパターンの
みが対象である。従つて、「=」と「−」は、既
に桝目の中にかかれた線の本数によつて結果が判
別できる。しかし一般の図面中に任意に書かれた
文字図形等は、位置が定まらないために「=」と
「−」は他の情報がない限り区別するのが困難で
ある。すなわち、「=」は「−」が2本並んでい
るだけかもしれない。現在アルフアベツトの中に
もある複数の要素で構成される文字(例えば
「−」と「0」が各々1要素でそれらの要素が集
まつて「0」になる文字等)を認識する手法は一
部の大学で研究されている程度でまだ実用化の域
に達していない。従来の技術でこれを実現しよう
とすると位置関係の多様性、記憶容量、処理速度
の面から認識コストが高くなる。すなわち「0」
を認識するのみでも既存の文字図形認識装置を機
能アツプしないと実現できない。また、文字の抽
出を文字例として抽出して、その情報を利用して
各要素の統合をするのは、前記方法よりまた一段
と認識コストが高くなるという問題がある。 〔発明の目的〕 本発明は上記問題点に鑑みてなされたもので、
図面中の任意の位置に書かれた多要素から構成さ
れている文字図形(以下、分離文字図形と記す)
を、既存の文字図形認識装置を利用して、低コス
トで認識可能な文字図形認識方法及び装置を提供
することを目的とする。 〔発明の概要〕 一般に分離文字図形等を分析すると、それらは
極めて簡単な既存の文字図形等の要素によつて構
成されている。これらの要素は、その要素毎に抽
出され、認識される。 本発明ではその認識結果の要素からその要素1
つだけで文字図形となる要素(例「A」,「B」,
「C」etc)と、他の要素と組み合わせて異なる文
字図形となる要素(例「−」,「1」,「0」etc)
を区別する。そして、前者は単独文字図形として
最終認識し、後者に対しては認識結果と、組合せ
要素の位置関係を検知して分離文字図形として最
終確認する。 すなわち、本発明は、文字図形の画像を二値化
した画像データとして入力し、この画像データを
予め画像パターンを記憶した辞書と照合して所定
の文字図形を判定する文字図形認識方法におい
て、前記画像データの任意の位置の所定の小領域
内の孤立した文字図形(以下、第1の要素と記
す)位置情報を付加して抽出し、前記第1の要素
を既存の文字図形認識手段により認識し、その認
識された第1の要素が複数要素の組合せで成る1
つの文字図形(以下、第2の要素と記す)を構成
するような所定の要素(例えば「−」,「1」,
「0」,…等以下、所定第1の要素と記す)である
か否かを判断し、所定第1の要素と判断されなか
つた第1の要素は単独文字図形として最終認識し
出力する。所定第1の要素であると判断された第
1の要素は、それらの位置関係が検出され前記所
定第1の要素の位置関係を予め記憶した分離文字
図形認識辞書と照合して第2の要素を検知し、分
離文字図形として最終認識し出力することによつ
て図面中の分離文字図形を高速で認識できるよう
にした文字図形認識方法及び装置である。 〔発明の実施例〕 本発明の文字図形認識方法及び装置を実施例を
用いて以下に説明する。第3図は本発明のハード
ウエアの主要構成を示す一実施例である。同図に
おいて、11はCCDスキヤナー等の図面(画像
データ)入力部、12は二値化された画像データ
を記憶する画像用メモリ、13はAMD2903等の
画像処理プロセツサ、14は任意画面の切出しを
制御するアドレスコントロールハードウエア、1
5は共有メモリ、16は既存の文字図形認識装
置、17は分離文字図形認識装置で本発明の特徴
部をなす部分である。 第1図は本発明の機能構成を示すブロツク図
で、画像データ入力手段21は入力画像を図面入
力部11とアドレスコントロールハードウエア1
4により二値化した画像データに変換するもの
で、例えばA3サイズの図面の入力画像を約8百
万(2000×4000)画素の二値化した画像データに
変換する。これらの画像データは画像メモリ2等
の画像データ記憶手段22に蓄えられる。入力画
像は文字図形に限らず線分、その他の要素が含ま
れており、その中から文字図形の候補となる孤立
図形の画像データを画像処理プロセツサ13及び
コントロールハードウエア14による小領域連結
画像データ抽出手段23により抽出する。これは
入力画像の任意の位置の所定の小領域内で孤立し
て他の図形と連結していない文字図形の画像デー
タを第1の要素として抽出する。すなわち、第4
図のような入力画像の場合、〜に示す小規模
孤立図形の画像データを第1の要素として抽出
し、に示した線分は抽出しない。また、このと
き同時に各第1の要素の位置情報が付加して抽出
される。抽出された第1の要素は既存の文字図形
認識手段24により認識される。その認識された
第1の要素が分離文字図形選択手段25により複
数の組合せで新たな1つの第2の要素を構成する
所定第1の要素であるか否かを判別する。所定第
1の要素として判別されなかつた第1の要素は、
文字図形認識手段24で単独文字図形として認識
され、認識結果出力手段28へ送出される。ま
た、所定第1の要素として判別されたものは位置
関係検出手段26によりそれぞれの要素に付加さ
れている位置情報から2次元的位置関係を検出す
る。例えば“「0」ならば「0」の要素の上に
「−」の要素がある。または「−」の要素の下に
「0」の要素がある。”と云う位置関係を検出しそ
の情報をそれぞれの要素に付加する。その後、分
離文字図形認識辞書照合手段27により第2の要
素との照合が行われる。ここで辞書とは複数の所
定第1の要素の組合せパターンとその文字図形と
の対応表である。すなわち、同じ「0」でも
「−」が左寄りのもの(「-0」)との右寄りのもの
“「0-)等、何種類かの可能性が存在するので、こ
のような場合は単に“「0」の上に「−」がある”
と云うパターン部を照合の対象として「0」と認
識する。このようにして所定第1の要素の組合せ
パターンから第2の要素と照合し、第2の要素と
して照合がとれた場合には、この第2の要素の文
字データを分離文字図形として最終認識し、認識
結果出力手段28へ送出される。また、分離文字
図形認識辞書照合手段27で第2の要素として照
合されなかつた所定第1の要素は各々単独文字図
形として認識され、認識結果出力手段28へ送出
される。 以下、分離文字図形認識の方法について具体例
を用いて説明する。入力画像として第5図aに示
す〜の画像があるとすると、分離文字図形選
択手段25には各要素データとして第1表に示す
ようにアスキーコード等による認識結果と位置情
報が入力される。この位置情報は各画像のX,Y
軸に添つた外接四角形(ウインド)の対角点
(XL,YL),(XH,YHの絶対座標が付加されてい
る。この位置情報はウインドサイズと呼ばれる。
【表】 分離文字図形選択手段25には複数の組合せで
1つの第2の要素を構成する所定第1の要素(例
えば0,−,1等)を判別する機能を有し、位置
関係検出手段26、分離文字図形認識辞書照合手
段27を介して第2表に示すように入力画像,
は単独文字図形として認識し、入力画像,
,は3つの要素の組合せで1つの第2の要素
を構成すると認識する。
【表】 入力画像が所定第1の要素であると判断された
とき、その所定第1の要素を単独文字図形として
認識するか分離文字図形として認識すべきかの判
断は第2図に示す手順によつて行なう。先づ、手
順31により入力された要素のウインドの周囲を
所定の値△だけ拡大する。次に手順32によりウ
インドの重なるものと重ならないものを区別し、
手順33によりウインドの重ならないものは単独
文字図形である判断して最終認識とする。
【表】 ウインドの重なつた所定第1の要素は手順34
により全て抽出してそれぞれの要素のウインドの
中心座標を求め、手順35により各要素を縦・横
の方向に並べかえ、手順36により縦・横に並び
かえられた各要素の中心座標の並びパターンと辞
書とを照合して新たに1つの第2の要素として認
識する。第5図bに示したウインド41〜45は
手順31により拡大されたウインドの様子を示し
たもので、ウインド41,42は他のいずれのウ
インドにも重ならないので単独文字図形「0」,
「1」として認識される。ウインド43,44,
45はすべて重なつているのでそれらの要素の
縦・横の並びパターンが辞書と照合されて「%」
と認識される。
〔発明の効果〕
本発明によれば図面等の任意の位置の多要素で
構成された分離文字図形を高速で認識することが
可能となり、必要に応じて既存の文字図形認識装
置に分離文字図形認識手段を付加することが可能
なので独立性の良い認識システムを構築すること
が可能となり、認識コストの安価な文字図形認識
方法及び装置を提供することができる。
【図面の簡単な説明】
第1図は本発明の図形文字認識装置の機能ブロ
ツク構成図、第2図は本発明の機能を説明するた
めの流れ図、第3図は本発明のハードウエアの一
実施例を示した主要構成図、第4図は小規模孤立
図形の抽出を説明するための入力画像の一例を示
した図、第5図は本発明による分離文字図形認識
装置の判断機能を説明するための入力画像とその
ウインドサイズの一例を示した図である。 11…図面入力部、12…画像用メモリ、13
…画像処理プロセツサ、14…コントロールハー
ドウエア、15…共有メモリ、16…既存の文字
図形認識装置、17…分離文字図形認識装置、2
1…画像データ入力手段、22…画像データ記憶
手段、23…小領域連結画像データ抽出手段、2
4…文字認識手段、25…分離文字図形認識手
段、26…位置関係検出手段、27…分離文字図
形認識辞書照合手段、28…認識結果出力手段。

Claims (1)

  1. 【特許請求の範囲】 1 文字図形の画像を二値化した画像データとを
    予め画像パターンを記憶した辞書と照合して所定
    の文字図形を判定する文字図形認識方法におい
    て、前記画像データの任意の位置の所定の小領域
    内の孤立した文字図形をその位置情報と共に認識
    し、認識した文字図形の中から複数の組合せで分
    離文字図形を構成する所定の要素(例えば「−」,
    「1」,「0」…,等)を選択し、所定の要素とし
    て選択されなかつた文字図形は単独文字図形とし
    て最終認識し、選択された所定の要素はその位置
    関係を検出し、予め所定の要素の位置関係が記憶
    されている分離文字図形認識辞書と照合して、照
    合のとれた所定の要素の組合せは分離文字図形と
    して、照合のとれなかつた所定の要素は単独文字
    図形として最終認識し、それぞれ最終認識結果を
    出力することを特徴とした文字図形認識方法。 2 文字図形の画像を二値化した画像データとし
    て入力する画像データ入力手段と、この画像デー
    タを予め画像パターンを記憶した辞書と照合して
    所定の文字図形を判定する文字図形認識手段を備
    えた装置において、前記画像データの任意の位置
    の所定の小領域内の孤立した文字図形を第1の要
    素として位置情報を付加して抽出する小領域連結
    画像データ抽出手段と、前記第1の要素を認識す
    る既存の文字図形認識手段と、前記文字図形認識
    手段により認識された前記第1の要素の中から複
    数の組合せから成る第2の要素を構成する所定第
    1の要素(例えば「−」,「1」,「0」,…,等)
    を選択する分離文字図形選択手段と、前記分離文
    字図形選択手段で選択された前記所定第1の要素
    の位置関係を検出する位置関係検出手段と、前記
    所定第1の要素の位置関係を予め記憶した分離文
    字図形認識辞書と照合して最終認識として出力す
    る分離文字図形認識辞書照合手段を備え、分離文
    字図形選択手段により選択されなかつた第1の要
    素及び分離文字図形認識辞書照合手段で照合され
    なかつた所定第1の要素を単独文字図形として認
    識し、分離文字図形認識辞書照合手段で照合され
    た第2の要素を分離文字図形として認識し、出力
    することを特徴とした文字図形認識装置。
JP59185398A 1984-09-06 1984-09-06 文字図形認識方法及び装置 Granted JPS6165378A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59185398A JPS6165378A (ja) 1984-09-06 1984-09-06 文字図形認識方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59185398A JPS6165378A (ja) 1984-09-06 1984-09-06 文字図形認識方法及び装置

Publications (2)

Publication Number Publication Date
JPS6165378A JPS6165378A (ja) 1986-04-03
JPH0434794B2 true JPH0434794B2 (ja) 1992-06-09

Family

ID=16170099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59185398A Granted JPS6165378A (ja) 1984-09-06 1984-09-06 文字図形認識方法及び装置

Country Status (1)

Country Link
JP (1) JPS6165378A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0747333B2 (ja) * 1988-05-30 1995-05-24 財団法人工業技術研究院 枠字処理方法
JPH03291781A (ja) * 1990-04-09 1991-12-20 Glory Ltd 文字認識装置
JP4998953B2 (ja) * 2008-01-21 2012-08-15 シャープ株式会社 文字認識装置、文字認識方法、文字認識プログラムおよびコンピュータ読取り可能な記録媒体

Also Published As

Publication number Publication date
JPS6165378A (ja) 1986-04-03

Similar Documents

Publication Publication Date Title
US5799115A (en) Image filing apparatus and method
JPH0721310A (ja) 文書認識装置
KR20200045447A (ko) 문자 인식을 위한 영상 전처리 장치 및 방법
JPH0434794B2 (ja)
JP3792759B2 (ja) 文字認識方法とその装置
JPH03142691A (ja) 表形式文書認識方式
JPH07160810A (ja) 文字認識装置
JPH0449148B2 (ja)
KR100309679B1 (ko) 문자열추출방법
Eldin et al. Arabic character recognition: a survey
JPH0589190A (ja) 図面情報のチエツク方式
JP3009237B2 (ja) 特徴抽出方法
JP2507949B2 (ja) 文字/図形領域判定装置
JPH0586585B2 (ja)
JPH07168911A (ja) 文書認識装置
JPH06119491A (ja) 帳票理解システム
JPH06309503A (ja) 英文字認識装置
JP2600703B2 (ja) 部分細線照合装置
JPH04177483A (ja) パターンマッチング方式
JPH0420506B2 (ja)
JPS58114180A (ja) 円形状抽出認識方式
JPH0833924B2 (ja) 図面読取方法
JPH0247786B2 (ja)
JPH0696277A (ja) 英文字認識装置
JPH0821058B2 (ja) 列領域抽出方式