JPS63247882A - 文字の特徴抽出装置 - Google Patents

文字の特徴抽出装置

Info

Publication number
JPS63247882A
JPS63247882A JP62081181A JP8118187A JPS63247882A JP S63247882 A JPS63247882 A JP S63247882A JP 62081181 A JP62081181 A JP 62081181A JP 8118187 A JP8118187 A JP 8118187A JP S63247882 A JPS63247882 A JP S63247882A
Authority
JP
Japan
Prior art keywords
skeleton
vertical
horizontal
run
run length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62081181A
Other languages
English (en)
Inventor
Keiji Nagamine
永峰 啓二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP62081181A priority Critical patent/JPS63247882A/ja
Publication of JPS63247882A publication Critical patent/JPS63247882A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 C産業上の利用分野] この発明は、文字認識装置のおいて、文字の大局的特徴
を抽出する装置に関するものである。
[従来の技術] 従来から市販の産業用画像処理装置においても、その機
能として文字認識機能を有すると記載されているものが
数機種存在する(例えばオートメーション第29巻第1
号P34〜35 (1984))。しかし、その殆どが
装置の記憶させた標準2値パターンとテレビカメラ等か
ら入力された2値文字パターンとの単純な比較を行い、
パターンの一致度を調べる方法を採っている。
[発明の解決しようとする問題点] 従来から行われているこの様な標準パターンとの単純な
パターンマツチング法を用いると、認識対象となる文字
群に大きさや形状の異なる複数の文字フォントが含まれ
ている場合には、1つの文字に対して含まれているフォ
ントの数だけ標準パターンと記憶しておく必要があり、
標準パターンを記憶するメモリの量が膨大になるばかり
でなく、入力された文字と最もよく一致する標準パター
ンを抽出するためのパターンマツチングの回数も増大し
、認識速度も遅くなるという問題点があった。
[問題点を解決するための手段] この発明に係る文字の特徴抽出装置は、1文字ごとに分
離された白黒2値の文字パターンを縦方向にラスタ走査
し、各走査ごとの最も長いランの長さを計測し、記憶す
る縦ラン測長手段と、縦ラン測長手段により得られた各
走査ごとのランの長さ情報を基に縦方向ランの縦しきい
値を決める縦しきい値決定手段と、縦しきい値と前記縦
ラン測長手段により得られた各走査ごとのランの長さ情
報を比較し縦しきい値より長いランの存在領域を縦骨格
として抽出する縦骨格抽出手段と、縦骨格抽出手段によ
り得られた縦骨格が走査線1本分の時はその走査線位置
を縦骨格位置とし、縦骨格が複数の走査線に渡るときは
前記縦骨格の中心位置を縦骨格位置として用い、縦骨格
位置を左・中央・右の3段階に量子化した縦量子化骨格
を抽出する縦骨格量子化手段とを有する。更に、横方向
のラスタ走査に関して同様な機能を有する横ラン測長手
段、横しきい値決定手段、横骨格抽出手段及び横骨格量
子化手段を有している。
[作用] この発明においては、文字パターンを縦方向と横方向に
それぞれラスタ走査し、各々の方向の長いランの存在す
る領域を文字の骨格として抽出し、この骨格を縦方向を
左・中央・右の3箇所の何れかに割付け、横方向を上・
中央・下の3箇所の何れかに割付け、文字パターンが計
6箇所の内のどの位置の骨格成分を持つかで、文字の特
徴を抽出するようにしたものである。このように、文字
パターンの縦方向と横方向の長い線素を抽出し、その線
素を抽出し、その線素の存在位置を量子化して表現して
いるので、大きさや形状の異なる複数のフォントの、文
字が混在して入力されても、これらの文字を正規化する
ことが出来る。
[実施例コ 以下、この発明の一実施例を図について説明する。第1
図(A)において、(1)はマイクロプロセッサ、(2
)はマイクロプロセッサ(1)を使用して文字の特徴を
抽出するための処理プログラムメモリ、(3)は1文字
毎に分離された文字の2値画像情報を記憶する文字パタ
ーンメモリ、(4)は処理結果として抽出される文字の
特徴を記憶する骨格メモリである。
第1図(B)は同図(A)の回路を機能的に図示したブ
ロック図で、(5A)は縦ラン測長手段、(6A)は縦
しきい鎖状手段、(7A)は縦骨格抽出手段、(8A)
は縦骨格量子化手段である。また、(5B)は横ラン測
長手段、(6B)は横しきい鎖状手段、(7B)は横骨
格抽出手段、(8B)は横骨格量子化手段である。
これ等の(5A)〜(8A)及び(5B)〜(8B)は
、第1図(A)のプログラムメモリ(2)のプログラム
に従って演算動作するマイクロプロセッサ(1)によっ
て構成される。
次に、マイクロプロセッサ(1)の演算動作を第2図の
フローチャートと第3図の文字パターンとを用いて説明
する。処理のスタート時にはまず骨格メモリ(4)の内
容をOクリアーしておく。このようにしておいて、まず
縦方向ラスタ走査のシーケンスに従って文字パターンメ
モリ(3)から画像情報を読みだし、各走査線毎にラン
の長さを計測し、1本の走査線上に複数個のランが存在
する場合には最も長いランの長さをその走査線上のラン
の長さとして用い、各走査線毎の最長のランの長さを集
めた縦ランテーブルを作成する。
第3図の数字の6の文字パターンの例では縦方向の走査
線の1番目から13番目まで順に各走査線上の最長ラン
の長さは 3.12.14,3,2,2,2,2,2,2゜2.8
.6  と得られる。例えば走査線番号4上には長さが
2のラン、3のラン及び2のランの3本のランが存在し
ており、その中で最も長い3のランを走査線4の長さと
している。次に、このようにして得られた縦ランテーブ
ルのデータから最小値を検出し、「最小値+3」を縦方
向の骨格を見つけるための縦しきい値とする。第3図の
例では縦ランテーブルの最小値は2であるから縦しきい
値を「5」とし、「5」以上のランの長さを持つ走査線
を文字の骨格とする。第3図の例では縦しきい値を「5
」とすると、骨格として走査線2番、3番と12番及び
13番が抽出される。走査線2番と3番及び12番と1
3番は各々連続しており、縦方向には2本の骨格がある
とみることが出来る。従って、骨格位置は 縦骨格1 (2+3)/2→2.5 縦骨格2 (12+13)/2→12.5と得られる。
また、第3図では縦方向ラスタ走査の中心位置は 縦方向中心(1+13)/2→7 であるから、縦骨格1及び2が文字パターンの左端、中
央、右端のいずれに最も近いかを調べると、縦骨格1は
左端に最も近く、縦骨格2は右端に最も近い。従って、
骨格メモリ(4)のblt Oと2に1がセットされる
同様にして、横方向ラスタ走査のシーケンスに従って文
字パターンメモリ(3)から画像情報を読みだし、各走
査線毎にランの長さを計測し、1本の走査線上に複数個
のランが存在する場合には最も長いランの長さをその走
査線上のランの長さとして用い、各走査線毎の最長のラ
ンの長さを集めた横ランテーブルを作成する。
第3図の例では横方向の走査線の1番目から19番目ま
で順に各走査線上の最長ランの長さは4.6.2.2.
2,2,8,10.4,3.3゜2.2,2.2.2,
8.6  と得られる。このようにして得られた横ラン
テーブルのデータから最小値を検出し、「最小値+3」
を横方向の骨格を見つけるための横しきい値とする。
第3図の例では横ランテーブルの最小値は2であるから
横しきいを「5」とし、「5」以上のランの長さを持つ
走査線を文字の骨格とする。第3図の例では横しきい値
を「5」とすると、骨格として走査線2番、8番、9番
、18番、19番が抽出される。横方向では、走査線の
2番は単独で存在するが、8番と9番及び18番と19
番は各々連続しており、横方向には3本の骨格が存在す
るとみることが出来る。従って、骨格位置は横骨格12 横骨格2  (8+9) /2   → 8.5横骨格
3  (18+19)/2−18.5と得られる。また
、第3図では横方向ラスタ走査の中心位置は 横方向中心 (1+19)/2−10 であるから、横骨格1から3が文字パターンの上端、中
央、下端のいずれに最も近いかを調べると、横骨格1は
上端に最も近く、横骨格2は中央に最も近く、横骨格3
は下端に最も近い。従って、骨格メモリ(4)のblt
3と4と5に1がそれぞれセットそれる。
以上説明した処理により、縦方向及び横方向の長い線素
を文字パターンの骨格として抽出し、この骨格位置を縦
方向及び横方向ともに3つの位置に正規化して文字の特
徴として抽出することが出来る。
なお、上記実施例では縦・横方向のランテーブルを作成
した後ランテーブル内の最小値を捜しているが、ランテ
ーブルを作成しながら各走査毎に現在の走査線のランの
長さと前回の走査時のランの長さとを比較して最小値を
求めるようにしてもよい。
また、上記実施例では縦・横しきい値の決定に際して「
最小値+3」を使用したが、このしきい値の決め方は文
字の幅と高さを基に決めるようにしてもよい。例えば、 縦しきい値−文字の高さ/3; 横しきい値−文字の幅 /3; としてもよい。
また、上記実施例では骨格位置を正規かする基準として
、字パターンの左端・右端・上端・下端を用いているが
、例えば各々1走査線分ずつ内側を基準としてもちいて
もよい。
更に、上記実施例の文字の特徴抽出を高速に行うために
、本ソフトウェアをハードウェア化することも可能であ
る。
[発明の効果] 以上のようにこの発明によれば、白黒2値画像として入
力された文字パターンからその文字が持つ骨格を特徴と
して抽出するように構成したので、簡単な特徴の抽出方
法により入力された文字を大まかに素早く分類できる効
果がある。
【図面の簡単な説明】
第1図(A)(B)この発明の一実施例による文字の特
徴抽出装置のハード構成を示すブロック図及びその機能
を図示したブロック図、第2図は第1図(A)の回路上
で実行されるソフトウェアのフローチャート、第3図は
文字パターン例を示した説明図、第4図は処理結果とし
て抽出される文字の特徴を示した説明図である。 図において、(1)マイクロプロセッサ、(2)はプロ
グラムメモリ、(3)は文字パターンメモリ、(4)は
骨格メモリである。(5A)は縦ラン測長手段、(6A
)は縦しきい鎖状手段、(7A)は縦骨格抽出手段、(
8A)は縦骨格量子化手段、(5B)は横ラン測長手段
、(6B)は横しきい鎖状手段、(7B)は横骨格抽出
手段、(8B)は横骨格量子化手段である。 なお、図中同一符号は同−又は相当部を示す。 代理人 弁理士 佐々木 宗 治 舛う―シ・@*a*う一トう一ト11Φ拳争・番◆・う
−シ→−F(ア)C)111@舎拳會・・・・う−トう
一トう一ト・φ・・Φ・・−Cて)八        
                         
ム1                       
        ト!?S1 手続補正書(自発) 1.事件の表示 特願昭62−081181号 2、発明の名称 文字の特徴抽出装置 3、補正をする者 事件との関係 特許出願人 住 所    東京都千代田区丸の内二丁目2番3号名
 称 (801)三菱電機株式会社 代表者 志岐守哉 4、代理人 住 所    東京都港区虎ノ門五丁目8番6号アミタ
ビル 5、補正の対象 特許請求の範囲(補正) 「1文字ごとに分離された白黒2値の文字パターンを縦
方向にラスタ走査し、各走査ごとの最も長いランの長さ
を計測し、記憶する縦ラン測長手段該縦ラン測長手段に
より得られた各走査ごとの縦方向ランの長さ情報を基に
縦方向ランの縦しきい値を決める縦しきい値決定手段と
;前記績しきい値と前記縦ラン測長手段により得られた
各走査ごとのランの長さ情報を比較し、前記績しきい値
より長いランの存在領域を縦骨格として抽出する縦骨格
抽出手段と;該縦骨格抽出手段により得られた縦骨格が
走査線1本分の時はその走査線位置を縦骨格位置とし、
縦骨格が複数の走査線に渡るときは前記縦骨格の中心位
置を縦骨格位置として用い、前記縦骨格位置を左・中央
・右の3段階に量子化した縦量子化骨格を抽出する縦骨
格量子化手段と; 前記文字パターンを横方向にラスタ走査し、各走査ごと
の最も長いランの長さを計測し、記憶する横ラン測長手
段と;該横ラン測長手段により得られた各走査ごとのラ
ンの長さ情報を基に横方向ランの横しきい値決定手段と
;前記様しきい値と前記横ラン測長手段により得られた
各走査ごとのランの長さ情報を比較し、前記様しきい値
より長いランの存在領域を横骨格として抽出する横骨格
抽出手段と;該横骨格抽出手段により得られた横骨格が
走査線1本分の時はその走査線位置を骨格位置とし、横
骨格が複数の走査線に渡るときは前記横骨格の中心位置
を横骨格位置として用い、前記横骨格位置を上・中央・
下の3段階に量子化した横量子化骨格を抽出する横骨格
量子化手段と;を有し、 前記縦量子化骨格と横量子化骨格とを前記文字パターン
の特徴として抽出することを特徴とする文字の特徴抽出
装置。」

Claims (1)

  1. 【特許請求の範囲】 1文字ごとに分離された白黒2値の文字パターンを縦方
    向にラスタ走査し、各走査ごとの最も長いランの長さを
    計測し、記憶する縦ラン測長手段;該縦ラン測長手段に
    より得られた各走査ごとの縦方向ランの長さ情報を基に
    縦方向ランの縦しきい値を決める縦しきい値決定手段と
    ;前記縦しきい値と前記縦ラン測長手段により得られた
    各走査ごとのランの長さ情報を比較し、前記縦しきい値
    より長いランの存在領域を縦骨格として抽出する縦骨格
    抽出手段と;該縦骨格抽出手段により得られた縦骨格が
    走査線1本分の時はその走査線位置を縦骨格位置とし、
    縦骨格が複数の走査線に渡るときは前記縦骨格の中心位
    置を縦骨格位置として用い、前記縦骨格位置を左・中央
    ・右の3段階に量子化した縦量子化骨格を抽出する縦骨
    格量子化手段と; 前記文字パターンを横方向にラスタ走査し、各走査ごと
    の最も長いランの長さを計測し、記憶する横ラン測長手
    段と;該横ラン測長手段により得られた各走査ごとのラ
    ンの長さ情報を基に横方向ランの横しきい値決定手段と
    ;前記横しきい値と前記横ラン測長手段により得られた
    各走査ごとのランの長さ情報を比較し、前記横しきい値
    より長いランの存在領域を横骨格として抽出する横骨格
    抽出手段と;該横骨格抽出手段により得られた横骨格が
    走査線1本分の時はその走査線位置を骨格位置とし、横
    骨格が複数の走査線に渡るときは前記横骨格の中心位置
    を横骨格位置として用い、前記横骨格位置を上・中央・
    下の3段階に量子化した横量子化骨格を抽出する横骨格
    量子化手段と;を有し、 前記縦量子化骨格と横量子化骨格とを前記文字パターン
    の特徴として抽出することを特徴とする特徴とする文字
    の特徴抽出装置。
JP62081181A 1987-04-03 1987-04-03 文字の特徴抽出装置 Pending JPS63247882A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62081181A JPS63247882A (ja) 1987-04-03 1987-04-03 文字の特徴抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62081181A JPS63247882A (ja) 1987-04-03 1987-04-03 文字の特徴抽出装置

Publications (1)

Publication Number Publication Date
JPS63247882A true JPS63247882A (ja) 1988-10-14

Family

ID=13739300

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62081181A Pending JPS63247882A (ja) 1987-04-03 1987-04-03 文字の特徴抽出装置

Country Status (1)

Country Link
JP (1) JPS63247882A (ja)

Similar Documents

Publication Publication Date Title
JP2940936B2 (ja) 表領域識別方法
JP3338537B2 (ja) 画像傾き検出装置
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
US8077976B2 (en) Image search apparatus and image search method
KR930002349B1 (ko) 압축영상의 문자열 분리방법
JPS63247882A (ja) 文字の特徴抽出装置
JP2675303B2 (ja) 文字認識方法
KR880000876A (ko) 패턴 인식 방식
JPH06187489A (ja) 文字認識装置
JPH07160810A (ja) 文字認識装置
Okun et al. Robust text detection from binarized document images
JPH0797390B2 (ja) 文字認識装置
JPH03126188A (ja) 文字認識装置
JPH0628520A (ja) 文字認識装置
JPH0324682A (ja) 文字特徴抽出方法
JPS60230282A (ja) 文字認識装置
JPH03213053A (ja) 原稿傾き検出装置
JPS6327752B2 (ja)
KR940011699B1 (ko) 2진 영상의 윤곽선 추출방법
JPS63131287A (ja) 文字認識方式
JPH03160582A (ja) 文書画像データに於ける罫線と文字の分離方法
JPH0264781A (ja) 表領域抽出方式
JPH0795335B2 (ja) 領域分割方法
JPH06150062A (ja) 文字認識装置
JPH0822510A (ja) 文書認識装置