JPS5822779B2 - 文字パタ−ンの分類方式 - Google Patents

文字パタ−ンの分類方式

Info

Publication number
JPS5822779B2
JPS5822779B2 JP52100855A JP10085577A JPS5822779B2 JP S5822779 B2 JPS5822779 B2 JP S5822779B2 JP 52100855 A JP52100855 A JP 52100855A JP 10085577 A JP10085577 A JP 10085577A JP S5822779 B2 JPS5822779 B2 JP S5822779B2
Authority
JP
Japan
Prior art keywords
character
classification
character pattern
area
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP52100855A
Other languages
English (en)
Other versions
JPS5434638A (en
Inventor
増田功
梅田三千雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP52100855A priority Critical patent/JPS5822779B2/ja
Publication of JPS5434638A publication Critical patent/JPS5434638A/ja
Publication of JPS5822779B2 publication Critical patent/JPS5822779B2/ja
Expired legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は文字パターンの分類方式、特に光電変換によっ
て得られた印刷漢字パターンにおいて。
フォントの違いによる字形の変化に対処するため、文字
パターンをその外接領域で規格化し、パターンのもつい
くつかの特徴によって分類を行なうようにした文字パタ
ーンの分類方式に関するものである。
従来、漢字を含めた文字パターンの分類方式としては、
単一フォントの字形を対象とし、外接矩形領域で切り出
した文字パターンの周囲の情報による分類、文字パター
ンの複雑さの情報による分類などが知られている。
このうち、前者の方式による分類では、文字枠から内側
に一定幅の領域をとシ出し、そこに含まれる文字線の情
報や文字を太めたときのその情報の変化などが用いられ
ている。
しかし、一定幅の領域に含まれる文字線の情報による分
類では、フォントの異なる印刷漢字パターンにおいて生
じる字形の変化、たとえば文字線の伸縮による影響をう
けやすいという欠点があり、また、文字を太めたときの
文字枠部分の情報の変化による分類では、安定な白領域
情報の抽出は可能であるが、処理が複雑になり、必要と
するメモリ量も増大するという問題点がある。
一方、後者の方式つまり文字パターンにおける縦および
横方向の文字の拡がシ量と文字線の長さの和から定義さ
れる複雑さの指数による分類では、処理が一様でなくか
つ複雑なものとなること、印刷漢字パターンに存在する
「セリフ」や「ウロコ」などの本質的には漢字の認識に
関係ない部分のパターンの変形の影響をうけやすいとい
う欠点がある。
本発明はこれらの問題点を解決するため、印刷漢字パタ
ーンのもつ大まかな複雑さの情報と外郭形状の大まかな
情報とを用いて文字パターンを分類するようにしたもの
で、簡単な処理でかつ必要メモリ量の少ない分類方式を
提供することを目的としたものである。
以下、図面によシ本発明の内容を詳細に説明する。
第1図は本発明による文字パターン分類方式の一実施例
のブロック図を示す。
図において、1は入力文字パターンであり、これを走査
・光電変換器2によって走査し、文字パターン1の濃淡
に比例した信号を得る。
この光電変換された信号は2値化回路3において基準値
と比較して、白領域はIT Ojj黒領域は°1″の2
値の量子化文字パターンに変換される。
4は文字パターンの外接枠検出回路で、第2図Aおよび
Bにその動作例を示す。
すなわち、第2図Aに示すように2値化された文字パタ
ーンの枠11よシ中心方向に触手12をのばし、最初に
文字部分に出合ったところでその辺の枠どり13を行な
う。
他の辺についても同様の処理を行ない、第2図Bに示す
ような文字パターンの外接枠14を検出する。
検出された外接枠内の文字パターンの情報は記憶装置(
メモリ)5に記憶される。
記憶装置5に記憶された文字パターンは次の2つの形式
で分類される。
1つは粗いメツシュパターン作成装置6で特徴を抽出し
、この特徴を分類装置7によって分類するもので、その
動作例を第3図に示す。
第3図Aは外接枠14で切り出された文字パターンで、
この文字パターン領域を同図Bに示すように、粗いメツ
シュパターン作成装置6で粗い矩形のメツシュ領域15
−1 、15−2.・・・・・・。
15−nに分割し、各メツシュ領域に存在する文字部の
面積を計数し、これを文字全体の面積で規格化し、分類
のための特徴を作成する。
同図Cはこのようにして抽出した特徴テーブルの一例で
あり、規格化して求めた値を一定倍し、整数で示したも
のである。
分類装置7は、このようにして作成した特徴テーブルを
もとに、すでにたくわえておいた各文字の特徴テーブル
とのマツチングをとり、文字パターンの分類を行なう。
もう1つは粗い周辺パターン作成装置8で文字外郭の特
徴を求め、それをもとに分類装置9で分類するもので、
その動作例を第4図に示す。
第4図Aは外接枠14で切り出された文字パターンで、
この文字パターン領域を同図BおよびCに示すように、
粗い周辺パターン作成装置8でまずその外接枠を粗く分
割する。
第4図Bは横方向の外接枠を粗く分割したもの、同図C
は縦方向の外接枠を粗く分割したものである。
次に、分割された外接枠の各部分16−1,16−2.
・・・・・・、16−nよシ反対側の文字枠方向に文字
部に出合うまでの白領域の面積(図で斜線をほどこした
面積)を計数し、これを文字パターン領域全体の面積で
規格化して分類のための特徴を作成する。
同図りはこのようにして、4つの外接枠について求めた
特徴テーブルの一例である。
この特徴テーブルをもとに、分類装置9ではすでにだく
わえておいた各文字の特徴テーブルとマツチングをとり
、文字パターンを分類する。
第5図に分類装置7,9による文字パターンの分類結果
の一例を示す。
すなわち、未知入力文字ハ/)−ン「水」に対して、粗
いメツシュパターンによる分類の結果、マツチングにお
ける整合度の順に、「水」、「氷」、「木」、「永」、
「本」が分類される。
同様に、粗い周辺パターンによる分類によって、「水」
、「木」、「氷」、「本」。
「永」が選び出される。
分類装置10は、これら2つの方法で分類された複数個
のカテゴリから、その和集合を選び出し、文字パターン
の大分類を行なうものである。
なお、実施例では分類装置7,9.10をそれぞれ分け
て示したが、これらの一部あるいは全部を1つの分類装
置で置き換えることも可能である。
以上説明したように、本発明による文字パターンの分類
方式においては、文字パターン全体の大まかな複雑さの
情報と文字パター7の外郭形状の大まかな情報とを並用
して文字パターンを分類するため、文字形状の変形、特
にマルチフォント印刷漢字のようにフォントが異なるこ
とによって文字パターンの形状に差を生じる′ようなパ
ターンに対して効率のよい分類が行なえるという利点が
ある。
また、2つの分類形式において作成される特徴は、その
個数、性質などを同じにすることができるため、分類装
置を共通にすることもできる。
さらに、入力文字パターンによっては、分類装置によっ
て選び出された整合度の大きな共通カテゴリを求めるこ
とにより、文字パターンの識別も可能である。
【図面の簡単な説明】
第1図は本発明による文字パターン分類方式の一実施例
を示す図、第2図は第1図の外接枠検出回路の動作を説
明する図、第3図は第1図の粗いメツシュパターンによ
る分類について説明するための図、第4図は第1図の粗
い周辺パターンによる分類について説明するための図、
第5図は本発明による文字パターンの分類結果の一例を
示した図である。 1・・・・・・入力文字パターン、2・・・・・・走査
・光電変換器、3・・・・・・2値化回路、4・・・・
・・外接枠検出回路、5・・・・・・記憶装置、6・・
・・・・粗いメツシュパターン作成装置、7・・・・・
・分類装置、8・・・・・・粗い周辺パターン作成装置
、9・・・・・・分類装置、10・・・・・・分類装置

Claims (1)

  1. 【特許請求の範囲】 12値化された文字パターンに対して文字の外接矩形領
    域で枠とりする第1手段と、該第1手段、′によって得
    られた文字領域を粗いメツシュの矩形領域に分割し、そ
    の各領域に存在する文字部分の面積を計数し、この情報
    をもとにして文字パターンを分類する第2手段と、前記
    第1手段によって得られた文字領域の外接枠を粗く分割
    し、この分。 割された各部分から反対側の文字枠方向に文字部分に出
    合うまでの白領域の面積を計数し、この情報をもとにし
    て文字パターンを分類する第3手段と、前記第2および
    第3手段によって得られた分類結果を組み合せ、未知入
    力文字パターンを分類、する第4手段とを具備すること
    を特徴とする文字パターンの分類方式。
JP52100855A 1977-08-23 1977-08-23 文字パタ−ンの分類方式 Expired JPS5822779B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP52100855A JPS5822779B2 (ja) 1977-08-23 1977-08-23 文字パタ−ンの分類方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP52100855A JPS5822779B2 (ja) 1977-08-23 1977-08-23 文字パタ−ンの分類方式

Publications (2)

Publication Number Publication Date
JPS5434638A JPS5434638A (en) 1979-03-14
JPS5822779B2 true JPS5822779B2 (ja) 1983-05-11

Family

ID=14284914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP52100855A Expired JPS5822779B2 (ja) 1977-08-23 1977-08-23 文字パタ−ンの分類方式

Country Status (1)

Country Link
JP (1) JPS5822779B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4415880A (en) * 1980-01-28 1983-11-15 Texas Instruments Incorporated Character recognition method and apparatus

Also Published As

Publication number Publication date
JPS5434638A (en) 1979-03-14

Similar Documents

Publication Publication Date Title
EP1052593A2 (en) Form search apparatus and method
US7170647B2 (en) Document processing apparatus and method
JP2002024836A (ja) ディジタルイメージから表題を抽出する方法
JPS5837779A (ja) 文書処理装置
JPH05225378A (ja) 文書画像の領域分割システム
JPH0452510B2 (ja)
JPS5822779B2 (ja) 文字パタ−ンの分類方式
JPS5822780B2 (ja) 文字パタ−ンの階層的識別処理方式
JPS61296481A (ja) 文書読取装置
JPH0548510B2 (ja)
JPS6227887A (ja) 文字種分離方式
KR940004476A (ko) 화상대조방법
JPS6238752B2 (ja)
JP2789622B2 (ja) 文字/図形領域判定装置
JPS5822781B2 (ja) 文字パタ−ンの認識処理方式
JP2671533B2 (ja) 文字列認識方法及びその装置
JP3127413B2 (ja) 文字認識装置
JPS6038755B2 (ja) 特徴抽出方式
JPS6334682A (ja) 文字認識装置
JP2797523B2 (ja) 図面続取装置
JPS59106084A (ja) 文字読取り装置
JPS59149569A (ja) 光学的文字読取装置
JPS62125485A (ja) 文字認識方式
JPH02166583A (ja) 文字認識装置
JPH03160582A (ja) 文書画像データに於ける罫線と文字の分離方法