JPS5897784A - 文字識別装置 - Google Patents

文字識別装置

Info

Publication number
JPS5897784A
JPS5897784A JP56196341A JP19634181A JPS5897784A JP S5897784 A JPS5897784 A JP S5897784A JP 56196341 A JP56196341 A JP 56196341A JP 19634181 A JP19634181 A JP 19634181A JP S5897784 A JPS5897784 A JP S5897784A
Authority
JP
Japan
Prior art keywords
circuit
character
dimensional code
code string
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56196341A
Other languages
English (en)
Other versions
JPH0252312B2 (ja
Inventor
Yoshihisa Tanabe
田辺 吉久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Tokyo Shibaura Electric Co Ltd filed Critical Toshiba Corp
Priority to JP56196341A priority Critical patent/JPS5897784A/ja
Publication of JPS5897784A publication Critical patent/JPS5897784A/ja
Publication of JPH0252312B2 publication Critical patent/JPH0252312B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • G06V30/1823Extraction of features or characteristics of the image by coding the contour of the pattern using vector-coding
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、光学的文字読取装置等の文字識別装置に関す
るものである。
一光学的文字読取方式に於いては、一般的に、文字パタ
ーンを細めるなり、中心線を求めるなどして、これらを
線図形に変換したパターンを8方向コードなどのコード
列で、又は文字パターンから部分特徴を抽出し、特徴コ
ード列で表現し、事前にコード化され九標準パターンと
のマツチングをとったり、順序論理回路を通すなどして
、文字を認識する方式が用いられている。
特に、類似度を用いた文字識別方式においては、文字パ
ターンを正規化して、大きさをそろえた徒、情報圧縮し
たパターンを作り、これと辞書内に保持される標準パタ
ーンとの類似度を計算し答を出している。
又、この方法は、メモリなどの発達によって辞書の作成
が容易である特長を有する。
ところで、文字を表わす特徴としては、文字を構成して
いる要素、つま毒り「黒い」部分の全部管用いないもの
がある。
例えば、文字の細緻(文字パターンの輪郭)は比較的よ
く文字の特徴を示すものとして知られており、近年多く
の識別方法に用いられている。
しかし、この縁縁情報を用いた特徴抽出による文字の識
別は、情報の処理は簡単であるが、情報量が多くなる為
、多大な労力を要することも知られている。     
        一本発明は、上記事情に基づきなされ
たもので、類似度方式の有する辞書作成の容易さと、高
精度さ、そして、特徴(原始シバターン抽出方式の有す
る取り扱いがしやすいという利点を生かした文字識別装
置を提供することを目的とする。
以下、図面を参照して、本発明の一実施例を祥述する。
第1図は、本発明の一実施例である。
ここで、文字の縁縁を追跡することによシ得られた情報
を変換し、各方向の1次元コードス) IJングを得る
手段は、第1図(1)に示されるように、方向コード化
回路4、分類回路5、ゲート6、特徴点抽出回路7、光
電変換回路8、同期信号発生回路9、領域信号発生回路
10からなるものである。
方向コード化回路4は、分類回路5に接続され、8又は
16方向に分類されたコードを2進(8方向なら3ビツ
ト、16方向なら4ピツト)のデー分類回路5は、ゲー
ト6に接続され、特徴点が検出された信号を8又は16
に分類するものである。
ゲート6は、特徴点検出回路7と領域信号発生回路10
に接続され、特徴点検出回路7がら受けた信号を、領域
信号発生回路10の信号に同期して出力するものである
特徴点検出回路7は、光電変換回路8に接続され、この
回路から送られて来る信号が縁縁の部分特徴を検出する
ものである。
光電変換回路8は、同期信号回路9に接続され、文字パ
ターンをCODなどで、ブロック毎にデジタル信号に変
換するものである。
同期信号発生回路9は、領域信号発生回路1oに接続さ
れ、光電変換回路8が文字上を走査するための信号を発
生するものである。
領域信号発生回路10は、同期信号発生(ロ)路9に接
続され、この信号を受け、ブロック毎にデータを区切る
為の信号を発生するものである。
次に、1次元コードストリングを圧縮又は伸長し、一定
長とする手段は、第1図(2)に示されるように、 シフトレジスタ11、シフトレジスタ12、コンパ1ノ
ー夕13、カウンタ14、ゲート15からなるものであ
る。
シフトレジスタ11は、方向コード化回路4に接続され
、これより得られた2進データを、シフトクロック(図
示せず)に同期して取込み、ラッチし、シフトするもの
である。
シフトレジスタ12は、シフトレジスタ11に接続され
、これより得られた信号を取り込み、ラッチし、シフト
するものである。
コンパ1/−夕13は、シフトレジスタ11とシフトレ
ジスタ12に接続され、これらの出力信号の比較を行な
うものである。
カウンタ14は、コンパ1/−夕13に接続され、コン
パ1/−夕13の出力をカウントし、1次元コードスト
リングの長さの決定を行なうものである。
ゲート15は、コンパレータ13、シフトレジスタ12
に接続され、コンパレータ13の出力信号によってシフ
トレジスタ12の出力を、バッファ17へ送るものであ
る。
次に、各種文字が有する1次元コードストリングの標準
パターンを記憶している手段と、該手段より得られる標
準パターンの1次元コードストリングと一定長に変換さ
れた1次元コードストリングを比較し、識別する手段は
、第1[9(3)に示されるように、 CP U 16、バッファ17、メモリ18、バス19
からなるものである。
c p U16ti、ハス19を介してバッファ17、
メモリ18などの制御を行なうものである。
バッファ17は、ゲート15に接続され、シフトレジス
タからの出力を一時保持するものである。
メモリ18は、事前に標準パターンのコードストリング
が記憶されていて、CPU16からの指令によシ、これ
らを出力するものである。
以上が、本発明の一実施例の構成である。
次に図面を参照して動作の説明をする。
例えば、第2図に示されるように、「2」と言う文字を
識別する場合、 ■ 文字パターンは、同期信号発生回路9の信号に同期
して走査されるCCUなどによって、デジタル信号に変
換される。
■ 所定の始点■を基準にして、第3図(a)の如く8
方向に線繊を検出し、これを順次ブロック毎に追跡して
いく6まず、8方向であるから、線繊の向きは真上、斜
右上、右、斜右下、真下、斜左下、左、斜左上に分類さ
れるが、ここでは、これらに順に、1,2.3.4.5
.6.7゜8と番号を付けておくことにする。又、これ
ら各方向を2進3ビツトで表現すると、例えば、roo
oJrOoljroloJrollJrlooJrlO
IJrllOJrlllJの如くなる。
次に、第2図に示される文字「2」について、方向コー
ドと2進3ビツトで線繊の向きを考えると、始点の縁縁
方向を3の向き(つまシ、2進でroloJ)とすると
、次は3(010)、次rよ4(011)、次は[ol
l、次#′15(100)と言う具合になシ、結果は、
このコードストリングをfSとすると、fs=3344
5666655433355777777111112
22287677222であり、コードストリングの長
さをtとすると、t=40となる。
■ コードストリングを正規化するには、圧縮そして伸
長の二つの場合があるが、ここで圧縮について考えてみ
ると、コードストリング中での縁縁方向は、文字を分割
するブロックが十分小さい場合、連続することに着目し
て、これら連続するコードを一つのコードとすれば良い
■ 方向コード化回路4から送られてきた2進データは
、シフトクロックに同期して、シフトレジスタ11にラ
ッチされる。
■ このシフトレジ予、夕11にラッチ、シフトされ出
力されたデータは、再びカスケード接続されているシフ
トレジスタ12に入力され、シフトされる。
■ データが2進3ビツトでシフトレジスタ11゜12
0ビツト数が3ビツトであると、シフトレジスタ11の
出力とカスケード接続されたシフトレジスタ12の出力
は、必らず3ビツト異なるものとなる。
例えば、fS=33445666−−−が順に77トさ
れてくる場合、先頭の「3・3」1         
          −に注目し、これを2進で表わす
と「010・010」となる。
しかし、3ビツトのシフトレジスタがカスケード接続さ
れているので、先に入ったコードピットの先頭が下の段
のシフトレジスタ12から出力されると同時に後から入
った3ビット遅れのコードピットの先頭が上の段のシス
トレジスタ11から出力される。結果として、・2つの
シフトレジスタからの出力は、0と011と1.0とO
と々る。
■ これら出力(0と0,1と1、OとO)はコンパレ
ータの入力に加えられるが、これらの比較を行なっても
コンパレータの出力は「0」である。
■ カウンタ14は、コンパレータ13の出力をカウン
トし、コードストリングの長さtを決定す−るが、この
場合は出力がないのでカウントしない。
■ コンパレータ13の出力がない場合は、ゲートの出
力もないので、バッファ17へのデータ出力もない。
以上によって、方向コードが二つ連続して「33」とな
っている場合は、正規化によって「3」とされる、以下
同様にしてfs全全体この操作がくシ返され、又、カウ
ンタ14によってこの長さも所定のものとされる。その
結果の出力をf、とすると、f、=345665433
577711122876722となシ、t=24とな
る。
又、方向コードが異なる場合、例えば「2・6」では、
これらは2進では「010・101」となり、コンパレ
ータへの各入力は、0と1.1と0.0と1で異なるも
の゛であるので、コンパレータ13は出力を出し、カウ
ンタはカウントを更新し、バッファ17へのデータの出
力も行なわれる。
なお、以上では、コードの全ビットが異なる場合を想定
したが、1ビツトのみ、又2ビツトのみ異なる場合は適
当な論理演算を行なえば、同様にして処理することがで
きる。
又、コードストリングを伸長する場合には、これらスト
リングを左詰めとして、カウンタによって所定の長さと
するために、不足コード分として意味付されたコードを
付は加えれば良い。
■ 正規化されたコードストリングは、バッファ17に
保持される。このバッファ17は英、数、カナ記号の場
合、128ワ一ド程度のもので十分である。
■ これらコードストリングからなる文字を識別するに
は、CPU16からの制御によって、一般に辞書と呼ば
れている標準的な文字のパターンコードストリングが記
憶されているメモリ(他の記憶媒体から転送されたコー
ドストリングのデータが保持されている場合もめる)か
ら、コードストリングを読み出す。当然のことながらこ
れは一つとは限らない。
■ CPU16は、これら読み出されたコードストリン
グと入力データから正規化されたコードストリングを比
較し、最も確からしいものを答として選択する。
これは、例えば、CPU16が有する各レジスタ(図示
せず)にこれらコードストリングのデータ、そして標準
パターンのコードストリングのデータを格納し、論理演
算をするなり、加算してフラグ管みるなとして、判定す
れば良い。
又、CPU16の機能を使用して、二つのシフトレジス
タ、カウンタ、ゲートの部分を省略しテ、CIPU16
にバッファ17を介して直接正規化されたコードストリ
ングを転送し、ソフト的に処理しても良い。
■ 識別結果は、”CPU16の制御によって外部へ出
力される。
以上が本発明の実施例の動作である。
本発明による効果は、以下の如くである。
類似度法が有する辞書作成の自動化を用いることができ
るので、高精度の辞書を短期間で作成することが可能で
ある。
マツチングすべきパターンが文字線縁(周辺)情報だけ
テ、シかも情報量が圧縮(例えば、コード長40のもの
が24へ)されている上、取扱いが簡単である。このた
め、パターン処理時間を短かくすることができ、又必要
とするメモリが少なくなるので、ハード量が減少する。
以上のように、本発明は文字の線繊を識別情報に用い、
類似度を計算し、文字を識別することによシ、装置の簡
素化を図ることを特徴とするものである。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
文字の線繊を追跡する時の手順を示す平面図、第3図は
線繊の具体的分類を示す平面図。 1・・・原始特徴抽出回路  2・・・正規化回路3・
・・辞書及び類似度識別回路 4・・・方向コード化回路  5・・・分類回路6・・
・ゲート      7・・・特徴点抽出回路8・・・
光電変換回路   9・・・同期信号発生回路10・・
・領域信号発生回路 11・・・シフ)L/レジスタ2
・・・シフトレジスタ  13・・・コンパレータ14
・・・カウンタ     15・・・ゲート16・・・
CP U       17・・・バッファ18・・・
メモリ19・・・パス 代理人 弁理士  則  近  憲  佑(他1名)

Claims (1)

  1. 【特許請求の範囲】 文字の細緻を追跡することによりその文字の縁縁特徴を
    方向コードの1次元コードストリングに変換する手段と
    、 該手段より得られた1次元コードストリングを圧縮又は
    伸長し、一定長とする手段と、各種文字が有する1次元
    コードストリングの標準パターンを記憶している手段と
    、 該手段より得られる標準パターンの1次元コードストリ
    ングと前記一定長とする手段よシ得られる1次元コード
    ストリングを比較し識別する手段、とからなることを特
    徴とする文字識別装置。
JP56196341A 1981-12-08 1981-12-08 文字識別装置 Granted JPS5897784A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56196341A JPS5897784A (ja) 1981-12-08 1981-12-08 文字識別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56196341A JPS5897784A (ja) 1981-12-08 1981-12-08 文字識別装置

Publications (2)

Publication Number Publication Date
JPS5897784A true JPS5897784A (ja) 1983-06-10
JPH0252312B2 JPH0252312B2 (ja) 1990-11-13

Family

ID=16356216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56196341A Granted JPS5897784A (ja) 1981-12-08 1981-12-08 文字識別装置

Country Status (1)

Country Link
JP (1) JPS5897784A (ja)

Also Published As

Publication number Publication date
JPH0252312B2 (ja) 1990-11-13

Similar Documents

Publication Publication Date Title
EP0355748B1 (en) A pattern recognition apparatus and method for doing the same
EP0621542B1 (en) Method and apparatus for automatic language determination of a script-type document
US3755780A (en) Method for recognizing characters
US4277775A (en) Character recognition system
US3942169A (en) Pattern recognition system
US5689584A (en) Method of and apparatus for pattern recognition and method of creating pattern recognition dictionary
JPS5897784A (ja) 文字識別装置
KR20190051261A (ko) 오디오 핑거프린트 매칭 시스템
JPH0458073B2 (ja)
JPS6043556B2 (ja) 文字読取装置
JPS5811662B2 (ja) 文字図形認識方式
JPH0259504B2 (ja)
JPH04256194A (ja) 文字認識処理方式
JP2973898B2 (ja) 文字認識方法及び装置
JPS5960690A (ja) 2値化装置
JPS59197969A (ja) 光学的文字読取装置
JPS60110091A (ja) 文字認識方式
JPH0375890A (ja) 文字認識装置
JPS59103483A (ja) 2値判別方式
JPS5824974A (ja) 簡易図形認識回路
JPH0218689A (ja) 文字認識装置および文字認識方法
JPS60153579A (ja) 文字認識用辞書作成方式
JPS5935469B2 (ja) 複数の文字セツトの読取りに適した文字認識方式
JPS57147779A (en) Optical character reader
JPS62169289A (ja) 光学文字読取装置