JPH02214992A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH02214992A
JPH02214992A JP1036804A JP3680489A JPH02214992A JP H02214992 A JPH02214992 A JP H02214992A JP 1036804 A JP1036804 A JP 1036804A JP 3680489 A JP3680489 A JP 3680489A JP H02214992 A JPH02214992 A JP H02214992A
Authority
JP
Japan
Prior art keywords
character
pixels
direction code
pixel
character pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1036804A
Other languages
English (en)
Inventor
Tamotsu Maeda
保 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP1036804A priority Critical patent/JPH02214992A/ja
Publication of JPH02214992A publication Critical patent/JPH02214992A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞、雑誌等の活字、ドツト文字および手書
き文字を読み取り、入力された文字パターンをJISコ
ード等のコード情報に変換する文字認識装置に関するも
のである。
従来の技術 近年、文字認識装置が簡便な文字入力装置として利用さ
れるようになってきた。従来の文字認識装置は、たとえ
ば矩形状に切り出された認識対象文字パターンを、MX
Nのメツシュ状に分割し、文字パターンの4辺から向か
い合った辺の向きに走査するききに、文字部分に出会う
までの背景部分の面積を計数し、これを全体の面積で正
規化し、これを特徴量としていた(梅田、有野;”粗い
ペリフェラルパターンによるマルチフォント印刷漢字の
分類”、電子通信学会技術研究報告、PRL78−4)
発明が解決しようとする課題 しかしながら上記の従来の技術では、文字パターンの周
辺部分の形状を背景部分の面積で表現していたために、
線幅の変動によって背景部分の面積も変動し、書体や字
体によって背景部分の面積が変化する、即ちマルチフォ
ンI・対応の文字認識装置にとって適した特徴量でない
、という問題点を有していた。たとえば、文字パターン
「木」のゴチック体と明朝体の例をそれぞれ、第4図、
第5図に示すが、これらの文字パターンを4×4に分割
したときの背景部分の面積はそれぞれ、第8図に示すよ
うに異なってしまい、背景部分の面積、即ち特徴量が書
体の違いに対して互いに異なる文字と認識してしまって
いた。
課題を解決するための手段 本発明は、上記課題を解決するため、入力された画像か
ら矩形で切り出された認識対象文字パターンを、上記矩
形の辺から向かい合う辺に向かって走査し、背景部分か
ら文字部分に変化する境界画素を検出し、次に文字部分
から背景部分に変化する境界画素を検出したときに、当
該国境界画素の中心に位置する画素を求め、当該画素に
おいて所定の複数の方向に連続して存在する黒画素の数
を計数し、当該黒画素の数が最大である方向の方向コー
ドを特徴量として認識を行なうものである。
作用 本発明は上記した構成により、文字パターンの特徴を方
向コートによって表現し、この方向コートによって文字
を識別する。
実施例 第1図は本発明の一実施例における文字認識装置の機能
ブロック図を示すものである。第1図において1は画像
データを読み取るスキャナ等て構成された画像入力部、
2は画像入力部1で読み取られた画像を切り出す文字切
り出し部、3は文字切り出し部2て切り出された各文字
の各々における文字パターンから文字部分の中心座標を
計算する中心画素計算部、4は中心画素計算部3で求め
た画素を基準に方向コードを検出する方向コート抽出部
、5は方向コード抽出部4て抽出された方向コードに対
応する文字コートを検索する文字認識部、6は方向コー
トの組み合わ七と対応する文字コートとを対に記憶した
辞書、7は表示部である。
第2図は本実施例の文字認識装置の構成を示すブロック
図ある。ここで21は文字パターンを読み取るスキャナ
で読み取った文字パターンをヒツトデータにして出力す
る。22はRAMでスキャナ21からのビットデータを
記憶する文字パターン領域23、この文字パターン領域
23内の文字パターンを解析して得られる方向コート領
域24、及び方向コード領域24に記憶された方向コー
トから決定される文字コード領域25を有している。
26はROMで方向コードとこれに対応する文字コード
を記憶した辞書、及び第3図(a)、第3図(b)に示
すフローチャートに従った制御プログラムを記憶したプ
ログラム記憶領域28を有する。29はプログラム記憶
領域28に記憶された制御プログラムに従って処理を行
う処理回路である。30はデータを入力するキーボード
であり、6は文字コード領域25に記憶された文字コー
ドに対応する文字を表示する表示部である。
以上のように構成された本実施例の文字認識装置につい
て、第3図のフローチャートに従って説明する。
まず、ステップS1において認識対象文字パターンをサ
ブ文字パターンに分割する。ステップS2ではiに1を
代入してステップS3に移行する。
ステップS3では文字パターン領域23に記憶された文
字パターンの画素((W/2N) X i 、 0)か
ら下に向かって走査する。ステップS4では文字パター
ンの画素値がOから1へ変化する境界点が存在するかど
うかを判別し、存在すれば更に走査を進め、ステップs
5で次に1からOに変化する境界点があるかどうかを調
べる。ステップS4とステップS5で境界点が存在する
場合はステップs6で中心画素を計算し、ステップS7
に進む。ステップs7では中心画素において連続する黒
画素数を4方向について計数し、ステップs8て黒画素
数が最大である方向の方向コードを方向コート領域に格
納する。ステップs4古ステップs5で境界点が存在し
ないと判別された場合はステップs15において境界点
が存在しないことを示すコードを特徴間として格納して
ステップs9に移行する。ステップs9ては画素((W
/2N)xi、H)から上に向かって走査する。そして
ステップsloとステップsllにおいて境界点が存在
するかどうかを判別し存在ずれはステップs12で中心
画素を計算し、ステップs13において中心画素から連
続黒画素数を4方向について計数し、ステップs14に
おいて黒画素数が最大である方向の方向コートを特徴間
として方向コード領域25に格納する。
ステップslOとステップs11で境界点が存在しない
場合はステップs17において境界点が存在しないこと
を示すコードを格納する。そしてステップs18でiが
4より小さいが否かを判別し小さい場合はステップs1
6においてiをインクリメントしてステップS3に戻る
が1が4以上のときはステップs19に移行してiにO
を代入する。ステップs20では画素(0,(W/2M
)xi)から右に向かって走査する。ステップS21七
ステツプs22て境界点が存在するかどうかを判別し境
界点が存在する場合はステップs23て中心座標を求め
、ステップs24で中心画素から連続する黒画素の数を
計数する。ステップS25では黒画素数が最大である方
向の方向コードを特徴間として方向コード領域に24に
格納する。
ステップs21とステップs22で境界点が存在しない
場合はステップs33において変化画素が存在しないこ
とを示すコードを特徴間として方向コード領域24に格
納する。次にステップs26において画素(W、(W/
2M)x i )から左に向かって走査し、ステップs
27とステップ828で境界点が存在するかどうか判別
しステップS30、ステップS31、或はステップs3
4と移行してステップs32において】が4より小さい
かとうかを判別する。小さくない場合はステップs35
でjに1を加えてステップs20に戻るが4である場合
は処理を終了する。
認識例題文字「木」を例に、以下ぞの動作を説明する。
まず、画像入力部1で、認識対象文字パターンを含む画
像を2値画像として入力して文字パターン領域23に記
憶する。
次に、文字切り出し部2で、入力され文字パターン領域
23に記憶された画像から認識対象文字パターンを切り
出す。入力した文字パターンの文字部分、背景部分の画
素値はそれぞれ1、Oである。また、文字部分、背景部
分を構成する画素をそれぞれ黒画素、白画素とよぶ。認
識例題文字パターン「木」を第4図、第5図に示す。
次に、中心画素計算部3で、認識対象文字パターンの文
字部分の中心画素を計算する。文字パターンに外接する
矩形の高さ、幅をそれぞれH,Wとするとき、HXWを
それぞれM、%N個に等分割し、MXN個に分割された
文字パターンの各ブロックをサブ文字パターンとよぶこ
とにする。ここて、等分割したのは説明を簡潔にするた
めであって、本発明の本質ではない。文字パターンに外
接する矩形の上辺から下辺に向かって走査するが、この
とき走査は、上辺上に存在する全ての画素から開始する
のではな(、画素((W/2N)xi、0)から開始す
る。ここて、1==1,2.  ・・、Nてあり、除数
部分は小数第1位を四捨五入、整数化される。上記走査
によって、白画素から黒画素に変化する境界点、次に黒
画素から白画素に変化する境界点を検出し、当該側境界
点の中心に位置する中心画素を計算する。
次に、方向コート抽出部4て、中心画素計算部3で求め
た当該中心画素において第6図に示した4方向に走査し
て、白画素に出会うまでの黒画素数をd4数し、黒画素
数が最大である方向の方向コードを特徴間とする。境界
点が存在しない場合には、このことを示すコード、たと
えば01を特徴間とする。同様にして下辺から上辺、左
辺から右辺、右辺から左辺について、合計2x (M十
N)個の特徴間を抽出する。第4図、第5図の文字パタ
ーンはH=W= 24であるから、ザブ文字パターンの
高さと幅は共に6である。この場合、中心には画素が存
在しないため、ザブ文字パターンが左上を原点(1,1
>とする直交座標系上にあるとき、文字パターンに外接
する矩形の上辺から下辺に向かって走査する場合、画素
(3,1)、画素(9,1)、画素(15,1)、画素
く21゜1)のそれぞれから文字部分にぶつかるまで下
方向に向かって走査する。画素(3,1,)の場合、中
心画素は(3,7)であり、当該中心画素において4方
向に連続する黒画素の数を求めると、方向コード1の黒
画素の数が24であり最も大きいので、最大の黒画素の
数をもつ方向コート、即ち1を特徴量とする。第4図及
び第5図の認識例題文字パターン「木」をM=4、N=
4−に分割した場合、抽出されるゴチック体と明朝体の
特徴量として方向コート記憶領域24内のデータは全く
等しくなり、第7図に示すようになり、本方式がマルチ
フォント文字認識に有効である。
最後に、文字認識部5て、抽出された認識対♀文字パタ
ーンの特徴量と辞書6に格納された特徴量を照合して、
候補文字を決定し、結果を表示部7に表示する。
以上のように本実施例によれば、文字パターンの背景部
分の特徴を方向コートによって表現したことにより、書
体毎の線幅変動に依存しないで、精度良く識別すること
ができる。
発明の効果 本発明は文字パターンの背景部分の特徴を方向コードに
よって表現したことにより、文字の書体にかかわらず、
精度良く文字を識別することのできる文字認識装置を実
現することができる。
【図面の簡単な説明】
第1図は本発明の一実施例における文字認識装置の機能
ブロック図、第2図は本実施例の構成を示すブロック図
、第3図(a)、第3図(b)は本実施例における制御
手順を示すフローチャート、第4図はゴチック体の認識
例題文字パターン図、第5図は明朝体の認識例題文字パ
ターン図、第6図は方向と方向コートとの対応図、第7
図は本実施例によって抽出された方向コート領域内の1
1内成図、第8図は従来の文字認識装置によって抽出さ
れた明朝体の文字の特徴量とゴチック体の文字の特徴量
との対応図である。 1・・・画像入力部 2・・・文字切り出し部 3・・・中心画素計算部 4・・・方向コード抽出部 5・・・文字認識部 6・・・辞書 7・・・表示部 代理人の氏名 弁理士 粟野重孝 ほか1名涯 第 図 月月 綿体 丁゛テ、1)つイ本

Claims (1)

  1. 【特許請求の範囲】 入力された画像から認識対象文字パターンを矩形に切り
    出す文字切り出し部と、 前記文字切り出し部で切り出された矩形の辺から向かい
    合う辺に向かって走査したときに、認識対象文字パター
    ンの背景部分から文字部分に変化する画素、及び文字部
    分から背景部分に変化する境界となる文字上の画素を検
    出する検出手段と、前記検出手段によって検出された2
    つの両境界画素の中心に位置する画素を計算する中心画
    素計算手段と、 前記中心画素計算手段によって計算された中心画素から
    所定の複数の方向の各々に連続して存在する文字上の画
    素の数を計数し、当該黒画素の数が最大である方向の方
    向コードを抽出する方向コード抽出部と、 前記方向コード抽出部によって抽出された方向コードと
    辞書に格納されている方向コードを照合することにより
    、認識候補文字を決定する文字認識部と、 を有することを特徴とする文字認識装置。
JP1036804A 1989-02-16 1989-02-16 文字認識装置 Pending JPH02214992A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1036804A JPH02214992A (ja) 1989-02-16 1989-02-16 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1036804A JPH02214992A (ja) 1989-02-16 1989-02-16 文字認識装置

Publications (1)

Publication Number Publication Date
JPH02214992A true JPH02214992A (ja) 1990-08-27

Family

ID=12479972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1036804A Pending JPH02214992A (ja) 1989-02-16 1989-02-16 文字認識装置

Country Status (1)

Country Link
JP (1) JPH02214992A (ja)

Similar Documents

Publication Publication Date Title
EP0854434B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
EP1265189B1 (en) Pattern extraction apparatus and method
US7519226B2 (en) Form search apparatus and method
KR900007009B1 (ko) 문자인식장치
Lehal et al. Feature extraction and classification for OCR of Gurmukhi script
CN111461131A (zh) 身份证号码信息识别方法、装置、设备及存储介质
Bushofa et al. Segmentation of Arabic characters using their contour information
JPS62224870A (ja) 文書画像処理方法
JPH02214992A (ja) 文字認識装置
JPH02187884A (ja) 文字認識装置
JP2917427B2 (ja) 図面読取装置
JPH02116987A (ja) 文字認識装置
JPH02249085A (ja) 文字認識装置
JP3095470B2 (ja) 文字認識装置
JPS63269267A (ja) 文字認識方法
KR100317653B1 (ko) 대용량인쇄체문자인식을위한특징추출방법
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPS63271588A (ja) 文字認識装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JPS63221495A (ja) 文字認識装置
JP3662967B2 (ja) 文字ループ候補抽出装置及び文字補完装置
JPH0576671B2 (ja)
JPH0656625B2 (ja) 特徴抽出方式
JP3127413B2 (ja) 文字認識装置
JPS63225883A (ja) 文字認識装置