JPH03214283A - シストリックアレイによる変換表作成回路 - Google Patents

シストリックアレイによる変換表作成回路

Info

Publication number
JPH03214283A
JPH03214283A JP2008421A JP842190A JPH03214283A JP H03214283 A JPH03214283 A JP H03214283A JP 2008421 A JP2008421 A JP 2008421A JP 842190 A JP842190 A JP 842190A JP H03214283 A JPH03214283 A JP H03214283A
Authority
JP
Japan
Prior art keywords
data
cell
histogram
column
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008421A
Other languages
English (en)
Inventor
Masayuki Kimura
木村 正行
Hirotomo Aso
阿曽 弘具
Shinichiro Omachi
真一郎 大町
Yutaka Katsuyama
裕 勝山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008421A priority Critical patent/JPH03214283A/ja
Priority to CA002034617A priority patent/CA2034617C/en
Priority to EP91100646A priority patent/EP0447751B1/en
Priority to DE69131304T priority patent/DE69131304T2/de
Priority to US07/644,360 priority patent/US5436982A/en
Publication of JPH03214283A publication Critical patent/JPH03214283A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概   要〕 切り出した1文字のパターンをシストリックアレイ構造
によって正規化のための変換表を作成するシストリック
アレイにおける変換表作成回路に関し、 切り出した文字データを正規化するためのヒストグラム
情報をパイプライン処理でかつ並列に行いパターン認識
を高速化するシストリノルアレイによる変換表作成回路
を提供することを目的とし、N個のセルを直列接続した
直列回路をN列設け、第m列目の入力側からm番目のセ
ルは、入力データをシフトして出力するとともに、前記
入力データと第m−1列目のm−1列目のセルよりプ川
わる幅データとカウントデータとから幅データトカウン
トデータとを更新してm+1列目の入力側からm+1番
目のセルに出力するヒストグラム計算セルであり、該ヒ
ストグラム計算セル以外のセルはシフトレシスタである
ように構成する。
〔産業上の利用分野〕
本発明はパターン認識装置に係り、更に詳しくは切り出
した1文字のパターンをシストリツクアレイ構造によっ
て正規化のための変換表を作成するシストリックアレイ
における変換表作成回路に関する。
(従 来 の 技 術〕 コンピュータシステムの発展により、画像データを取り
込むとともに、取り込んだ画像データから文字を切り出
し、読み取った書類の文章のそれぞれの文字を認識する
読み取り装置が実用化している。この読み取り装置はた
とえばイメージスキャナ等によって読み取ったドットデ
ータをあらかじめ定められた領域単位で分割し、その分
割内での文字とあらかじめ定められた文字とを比較し、
1番似にかよった文字を結果として出力してい“る。
このあらかじめ定められたデータは一般的には辞書メモ
リに格納されており、たとえば各規定の文字を特徴化し
たデータとして記憶されている。そして認識すべき文字
が入力した時、同様にその入力した文字を特徴化し、前
述の辞書メモリに格納されているあらかじめ定められた
特徴データとの距離を求めている。この求めた距離から
最も小さい文字を認識結果として出力している。
前述のようなシステムにおいでは、切り出した1個の文
字を認識する場合、それらの文字があらかじめ決められ
た大きさとなっていると認識率が向上する。このため従
来においては切り出した文字単位で樅横方向にあらかじ
め決められた高さと、幅にしている。すなわち正規化し
ている。
この正規化の方式は種々あるが、その1方式として切り
出した文字の縦方向と横方向に対してヒストグラムを求
め、得られたヒストグラムから文字を拡大や縮小して正
規化する方式がある。
このような方式によって認識すべき文字が一定の大きさ
になるので、認識率が向上する。
[発明が解決しようとする課題] 前述し,たヒストグラムを求める場合、従来においては
、切り出した領域をドット単位で読み出し、例えばそれ
以前に読み出した左右や上下のドノトが黒であるか白で
あるか等のフラグから次のドッI・への情報を求めて順
次処理している。このような従来の方式はドット単位で
処理してヒストグラムを求めているので、その処理に多
くの時間を必要とする問題を有していた。すなわち、認
識処理を行う時間が大となる問題を有していた。
本発明は切り出した文字データを正規化するためのヒス
トグラム情報をパイプライン処理でかつ並列に行いパタ
ーン認識を高速化するシストリノルアレイによる変換表
作成回路を提供することを目的とする。
〔課題を解決するための手段〕
第1図は本発明の原理ブロック図である。
N個のセルH(1.1)〜H(N,1)・・・H(1,
N)〜H(N,N)を直列接続した直列回路をN列設け
ている。
そのセルのうち第m列目の入力側からm番目のセルはヒ
ストグラム計算セルであり、残りのセルはシフトレジス
タである。
ヒストグラム計算セルは入力データをシフトして次のセ
ルへ出力するとともに、このデータと隣の列の1つ前の
セルから加わる幅データとカウントデータとから幅デー
タとカウントデータとを更新して反対隣の列の1つ後の
セルに加える。
また、例えばヒストグラム計算セルは横方向のフラグレ
ジスタ、縦方向の幅レジスタやカウンタを有する。
[作  用] N個のドット(1ドット行)がN個の列に対応するドノ
ト位置単位で加わり順次シフトする。
ヒストグラム計算セルは1ドット行に対して斜め方向に
設けられているので、例えばシストリックアレイの下方
向(列の下方向)から1ドット行が加わった時には、第
1列目の入力側から1番目のヒストグラム計算セルが縦
方向と横方向のヒストグラム計算を行う。そして順次シ
ストリックアレイ中をデータがシフトするたびに次の行
と次の列(斜め右上方向にヒストグラム計算セルが設け
られている)のヒストグラム計算を行う。これを順次繰
り返すことにより、右上最終のヒストグラム計算セルか
ら順次カウント値や幅の結果が出力される。また各ヒス
トグラム計算セル内のレジスタやカウンタにしても対向
する方向のカウント値や幅データが残る。
シストリックアレイ中を1文字のデータが通過する時に
同時に縦方向や横方向のヒストグラムを高速に求めるこ
とができる。
[実  施  例] 以下図面を用いて本発明を詳細に説明する。
第2図は本発明の実施例のシステム構成図である。
イメージスキャナ等によって読み取られた情報は画像デ
ータとして画像メモリ10に格納される。
この画像メモリ10はイメージスキャナで読み取る1頁
分の記憶容量を有しており、読み取った情報のそれぞれ
各ドットを白あるいは黒の2{I!すなわち0.1のデ
ータとして記憶する。
画像メモリ10に格納された画像データはノイズ除去モ
ジュール11に加わり、読み取り時に発生した雑音を除
去する。例えば、このノイズ除去モジュール11によっ
て除去されるノイズは文字情報等に無関係な雑音例えば
3×3のマスクで中心を黒、その中心のドットを囲む8
ドットが白等の雑音であり、その中心のドットをノイズ
除去モジュール11は白とする。このノイズ除去モジュ
ールは文字認識前処理部12内に設けているがこれに限
るわけでなく、例えば後述する正規化モジュール16内
に文字単位で格納する時に行ってもよく、またさらには
細線化、線素化の時に行ってもよい。
ノイズ除去モジュール11によってノイズ除去された画
像情報は行ヒストグラムモジュール13、列ヒストグラ
ムモジュール14、さらには読み出し制御モジュール1
5に加わる。行ヒストグラムモジュール13は読み取っ
た情報、例えば前述したイメージスキャナによって読み
取った用紙の内容を各ドット単位で列方向に投影し、各
ドット単位の行のドット数を求めるモジュールである。
すなわち、1ドットの行(横方向)に対し、その1ドッ
ト行にい《つの黒ドソトが存在するかを各1ドット行単
位で求める処理である。また列ヒストグラム14は前述
した行ヒストグラムと同様に列方向に対し投影し、その
投影した黒ドノトの数を求める処理である。
画像メモリ10から行方向に順次1ドット単位で読み出
し、ノイズ除去モジュール11を介して加わったデータ
(ラスタースキャンと同様のドットの読み出し)を、行
ヒストグラムモジュール13は順次黒のドットをカウン
トする(1ドノト行分)。そして、順次行単位で黒のド
ット数を求める。この黒のドット数が各行に対応する行
ヒストグラムとなる。また列ヒストグラム14は1ドッ
ト行内のドット数に対応してそれぞれカウンタを有し1
行のドットが順次加わる度に黒ドノトに対応するカウン
タをインクリメントする。前述した動作を1頁分行うこ
とにより行ヒストグラムモジュール16ならびに列ヒス
トグラムモジュール14からは、それぞれ行位置ならび
に列位置に対するドット数を表したいわゆる行ヒストグ
ラム,列ヒストグラムが求められる。そしてその結果は
読み出し制御モジュール15に加わる。
読み出し制御モジュール15はそれらの行ヒストグラム
,列ヒストグラムから行の位置ならびに列の位置を順次
求める。例えばこの位置は行ヒストグラムの周期や列ヒ
ストグラムの周期によって得ることができる。
読み出し制御モジュール15は行ならびに列の位置を求
めるが、この他に以下の処理を行う。画像データ例えば
イメージスキャナから読みとった情報は紙の位置等によ
り傾きを有することがある。
このため、読み出し制御モジュール15は列ヒストグラ
ムならびに行ヒストグラムが最大値をとるよう、ヒスト
グラムを求める角度を順次変更し、補正角度を求める。
そして前述したノイズ除去モジュール11から加わる画
像情報を再度入力して、最終的なヒストグラムを求め、
その補正した傾きにより得られた行ヒストグラム(ヒス
トグラムが最大値をとる)がOから正に変化する点(正
から0でも可)より1周期分その傾きに対応した1行の
データを読み出し、読み出し制御モジュール15内に設
けられた行バッファに格納する。
読み出し制御モジュールl5はさらにその行バッファに
格納した1行のデータの内、行内における列ヒストグラ
ムを再度求め、列ヒストグラムが0から正に変化する位
置からそのデータを切り出し正規化モジュールl6に出
力する。また変換表作成モジュールl7にも出力する。
この切り出したデータは1文字領域のデータである。
変換表作成モジュールI7は正規化モジュール16によ
って1文字を正規化するための変換デー夕を求めるモジ
ュールであり、たとえば読み出し制御モジュール15に
よって切り出した1文字領域に対し、列方向並びに行方
向に投影し、黒ドノトが存在する列並びに行からドット
単位(行や列単位)で、列並びに行方向のカウンタをイ
ンクリメントし、1文字の領域内の最終値までの値を求
める。このモジュールの回路並びに動作については後述
する正規化の原理に基づき後に詳細に説明する。
正規化モジュール16では、この1文字で切り出したド
ットの行方向並びに列方向の最終値並びに切り出した1
文字の大きさから、その文字が切り出し領域内の全域に
わたって存在する文字に拡大する。例えば64X64ド
ットの領域を1文字領域とする拡大処理を行う。文字の
列方向並びに行方向の値が変換表作成モジュール]7に
おいて48(列並びに行とも)ドノトであったならば、
48ドノトの文字を64ドットに変換する処理を行う。
この処理では特定位置の行や列のデータを繰り返して同
じデータとし文字を拡大する。また、縮小の場合には特
定位置の行や列を繰り返し読み出してOR加算し同一行
や同一列として縮小する。
正規化モジュール16によって1文字領域例えば64X
64ドット内に1文字が拡大された後は、細線化モジュ
ールl8がその文字を細線化する処理を行う。この細線
化モジュール18では中心ドットの上下左右1ドット(
3X3)とさらにその左1ドットと中心からの上2ドッ
ト目の合計11ドットのマスクで細線化処理を行う。ま
たこのマスクは3×3の9ドットで行うこともできる。
前述のマスクによってあらかじめ決められたパターンで
あるときに中心ドットをOとする制御により1回の処理
によって文字を構成するドットの1ドット分の回りの細
線化が図れる。このマスクの細線化を順次繰り返すこと
により1ドットの線による文字とすることができる。
細線化モジュール18によって得られた例えば64X6
4ドットの細線化文字は線素化モジュール19に加わり
線素化される。この線素化モジュールでは目的のドット
すなわち中心ドットから上下方向の黒ドットが存在する
場合、ならびに左右方向に存在する場合、右上、左下に
存在する場合、さらには左上、右下に存在する場合の合
計4種類の線素によって各ドットを表す。なお上述の4
種類の内、複数に属する場合には例えば、上下方向、続
いて左右方向等の順に優先化を行い、各ドット単位でそ
の線素がどちらの方向の存在するかを求める。なお中心
がOドットすなわち白であった場合には線は存在しない
とする。
線素化モジュール19においては、上下、左右、右上が
り斜め、左上がり斜めの4方向さらには線素が存在しな
い場合の5種類があるので、その状態を各ドット単位で
3ビットの値で表し、合計3X6 4 X6 4の情報
とし、特徴ベクトルモジュール20に加える。
特徴ベクトルモジュール20においては前述した線素化
モジュール19で得られた線素化情報を、左右上下にそ
れぞれ8ドット単位で分割し、その分割した領域を下と
右方向に1領域づつ(2×2領域)の合計16ドットの
領域を1ベクトルモジュール領域とし、その1ベクトル
モジュール’pM域内にいくつの上下方向、左右方向、
右上方向、左上方向の4方向の線素が存在するかをカウ
ントする。1 6X1 6ドットの領域を1ベクトルモ
ジュール領域として特徴ベクトルを求めるが、この1ベ
クトルモジュール領域は8ドット単位で移動させるので
行方向ならびに列方向に対しそれぞれ7領域であり合計
7×7の特徴ベクトルの領域となる。
特徴ベクトル化モジュール20においては前述したIN
域単位でその方向の数を求めているが、この数の求める
場合にはそれぞれ重み付けをし、中心部を高く周り部を
外にいくにしたがって低くしている。例えばその重み付
けを中心の4×4の領域の各ドットを重み4、その周り
の2ドット分の各ドットを3、さらにその周りの2ドッ
ト分の各ドットを2、さらにその回りの2ドット分の各
ドットを1とし、重み付けを行って特徴ベクトルを求め
る。
この特徴ベクトルは特定の認識すべき文字を正規化モジ
ュールl6によってすべて同じ大きさにしているので、
同一文字であるならばほぼ同一の特徴ベクトルを有し、
文字単位でその特徴ベクトルが異なってくる。しかしな
がら非常によく僚たモジュールも存在するので、本発明
の実施例においては演算の処理の高速化さらには認識率
の向上をはかるため、特徴ベクトルの標準パターンを用
いてそれぞれの特徴ベクトル化領域すなわちマス内でク
ラス分けを行い、各マス内で20クラスの標準パターン
と、加わる未知入力との距離を求める。すなわち標準パ
ターンの各マス内の特徴ベクトルと特報ベクトルモジュ
ール20によって得られたマス内の特徴ベクトルとの距
離をマス単位で求める。その各マスはクラス分け(クラ
ス1〜クラス20)されており、各マス内クラスの距離
の順位を距離の小さい順に第5番目までのクラスを求め
る。
距離計算モジュール21はこの距離をクラス辞書23−
1 (標準パターンをクラス単位で記憶)を用いて演算
する。尚、個別でもその個々の候補文字に対して求める
場合には候補辞書23−2を用いる(この時にはスイッ
チSWは候補辞書232を選択する)。
上位選出&得点割当モジュール22では前述の上位5ク
ラスを求めるとともに、各クラスに対応した得点を各マ
ス単位で決定する。すなわち上位選出&得点割当モジュ
ール22は距離計算モジュール21より得られた距離か
らクラス単位で第1〜第5番目の順位の各クラスに対し
与える得点を決定し、各文字の得点を求める。例えば第
1番目の距離(短い距離)であったときには5点、その
次に4点、3,2,Iとクラスに対し得点を与える。こ
れはマスlからマス49に対応してそれぞれ設けられる
。上位選出得点モジュール22の処理結果は総合評価モ
ジュール24に加わる。 総合評価モジュール24は入
力対象すなわち入力文字とその候補とが整合する度合い
を計算するモジュールであり、連想整合モード、全数整
合モード、個別整合モードの3種類の動作がある。
連想整合モードは、連想辞書23−3に格納されている
候補に対応したマスクとその属するクラスからその候補
の得点を計算するモードである。
連想辞書は第2図0))の如く、各マスク毎に候補■D
をアドレスとして、その候補がそのマスクにおいて属す
るクラスのクラスIDを格納している。
このデータは、各候補のマスクIDに対応するCdim
次元の部分ベクトルの集合をその(重み付き)距離によ
ってクラスタリングして得られるものであり、結果だけ
が連想辞書に格納される。
同時に距離計算モジュールにおけるクラス辞書23−1
も対応して作成される。
尚、連想辞書23−3とクラス辞書23−1は対応して
おり、そのII類は同じになる.2種類以上の辞書を1
つのメモリに格納する場合、使用辞書指定は辞書参照開
始位置となる。(この辞書を候補IDについて分割して
、それぞれについて並列に総合評価を行うことができ、
より高速なものが要求される場合容易に実現できる)。
連想辞書23−3は、候補aがマスクmで属するクラス
のクラスID:Kを記した表であり、これをC (m,
a)=Kと表すと、候補a(=1〜c  cand)に
対して、 で得られる。尚、ここでP (m,k)は得点を表して
いる。この式により候補aに対する総合評価値V (a
)を得る。
総合評価モジュールの全数整合モード、個別整合モード
は各候補に対し、計算するモードであり。
全数整合モードはa=1〜c  cand、個別整合モ
ードはJ−1 〜c  kind,a=b(j)とし、
距離をd (m,a)で表し を求める。この値V (a)は候補aと入力対象との特
徴ベクトル間の(重み付き)距離である。
上位候補選出モジュール25は各文字対応での上位から
決められた複数の文字例えば5文字を選出し出力する。
この上位5文字が読みとった画像データにおける認識結
果となる。
前述した動作は全てパイプライン処理で成されるもので
ある。すなわち画像データを記憶する画像メモリ10内
の例えば1頁分のデータをバイブライン処理のよって読
み出し、制御モジュール15で行単位に分割するととも
に、正規化モジュール16に1文字単位で出力する。そ
の文字単で前述の細線化,線素化,特徴ベクトル化さら
には認識処理を行う 上位選出モジュール25は総合評価値に基づいて、候補
に順位をつけ、上位5個を選出するモジュールであり、
入力は連想全数整合モードであるならば{ (a’, 
V(a)la’, a = 1 〜c  candを修
正したもの} 個別整数合モードであるならば ( (j, v(aNj =  1〜c  kind,
 a = b (j))(個別整合の総合評価出力) 降/昇順= (文字連想:大きい順、その他:小さい1
1(資))である。また出力は入力のソート結果の順に
並んだ候補ID(または入力順序)とその総合評価値で
ある。
前述した第2図における本発明の実施例においては全体
のシステムから変換表作成モジュールについて説明した
。以下ではさらに詳細に変換表作成モジュールにおける
原理と詳細な回路について説明する。
第2図における正規化モジュールl6が拡大や縮小処理
を実行する場合には、読み出し制御モジュール15によ
って切り出した一文字M域内の文字の大きさを求めなく
てはならない。何故ならば本発明の実施例における認識
処理においては認識率を高めるため文字を同じ大きさに
しなくてはならないからである。このため第3図におけ
る拡大の原理説明図からも明確なようにX軸上の0≦X
≦Wの領域をY軸上のO≦Y≦Dの領域に変更する処理
を行う。
以下では、先ず拡大原理から説明し、続いて変換表作成
モジュール17の詳細な回路動作について説明する。
X,Yが任意の実数値をとるものとすればY軸上の座標
Yに対応するX軸上のXは X=WxY/D          ・− − 1)で
表わされる。これを用いて拡大された図形の座標I(I
は整数、工≦1≦D)に対応する元の図形上の座標X(
Xは整数) X−1<WXI/D≦X     ・・・2)を満たす
点であるものとする。この2)式を変形すると D(X−1)<IXW≦DX    −−−3)が得ら
れる。従って各I(1≦■≦D)について座標Iの要素
を3)式を満たす元の図形の座標Xの要素とすることに
より、幅Dに変形拡大された図形が得られる。
この考え方で入力画像データを正規化するため、先ず入
力図形に対して文字の幅Wを調べるとともに横方向や縦
方向のヒストグラムを作成する。すなわち、変換表を作
成する。
ヒストグラムは線形であるならば画像データ上の文字の
領域に含まれる最も左の点が属数列の値を1とし、それ
より右の列は1づつ増やすことによって得られる。また
行に対しても同様に、文字の領域に加わる最も上の点が
属する行の値を1としそれより下方の行を1づつ増やし
ていくことによって得られる。この文字の幅Wと列の先
端並びに行の先端を変換表作成モジュール17は求める
第4図は本発明の実施例の構成図である。頌域RXが読
み出し制御部15(第2図参照)より切り出されて行単
位でヒストグラム生成回路網(NxN)31に入力する
。ヒストグラム生成回路網(NXN)3 1は第5図に
示した縦方向、横方向のヒストグラムとその入力した文
字の幅を求める回路であり、縦方向のヒストグラムはバ
ッファ(MXI)32に行単位の値として格納される。
また横方向のヒストグラムはヒストグラム生成回路31
から正規化回路網34に図示しないが直接加わる。
ヒストグラム生成回路網31はNXNのシストリックア
レイ構造を有しており、ヒストグラム生成回路綱31を
通過した画像データ(画像データに変化はない)はバッ
ファ(NxN)33に格納される。すなわち画像RXが
最終的にはバッファ33に格納される。尚第2図におい
ては読み出し制御モジュール15の出力は正規化回路網
16にも加わるので、この場合にはこのバッファ33は
必要ではなく正規化モジュール16内に設けても良い。
このヒストグラム生成回路網31によって得られた縦方
向並びに横方向のヒストグラムは正規化回路モジュール
16に加わり、このヒストグラムをもとに正規化モジュ
ール16は動作する。尚正規化回路網34は横方向(列
単位)の正規化を行う回路である。縦方向(行単位)の
正規化はバッファ33 (MxN)からのデータ読み込
み用セル構造回路35によるドット行単位の呼び出しに
よって正規化している。すなわち縦方向の正規化を行い
ながら横方向の正規化に必要な計算をし、この値と入力
データを正規化回路綱34に出力する。
データ読み込み用セル構造回路綱35は縦方向を正規化
する回路であり、データ読み込み用セル回路網35と正
規化回路綱34の動作が始まる時刻をt=1とするなら
ば、縦方向の正規化を行うため、時刻Lで正規化後の図
形のt行目に対応する行を読b込む。
D−h2(i’−1)<t L  ≦ D − h2(
i’ )   ・ ・ ・4〕が成り立つよう、入力画
像の行i″を時刻tで読み取る。換言するならば、ヒス
トグラムの値が4)式を満足するまで縦方向(行の読み
出し順方向)のヒストグラムと入力画像を読み込めば、
縦方向の正規化が行える。これは while ( t L > D−h2(i’) &&
 i’<M )read data && histo
gram;なる処理をセルが行うことで実現できる。ま
た、横方向の正規化を行う時も3)式を満足する処理を
行えば良い。横方向のヒストグラムの値および横方向の
文字幅W呼び込み、1列のセルでは’D − hHj−
1)’ ,  “jW”,  “D − hl(j)”
を計算し、さらに D−hl(j”)<j W   ならば j→j−1,
jり≦D−hl(j’ −1)  ならば j−+j+
1と変換していくことで行う。尚jは正規化の図形にお
ける列、j′は入力図形のおける列を表している。
このような正規化回路網34の動作、ならびにデータ読
み込み用セル回路網35の動作により、横方向と縦方向
の正規化がなされ、得られる図形はDXDの正規化され
た図形になる。
前述の正規化を行うためには入力文字のヒストグラムを
必要とする。以下ではこのヒストグラム生成についてさ
らに詳細に説明する。
第6図は本発明の実施例のヒストグラム生成回路網図で
ある。各セルH(1.1)〜H (N,N)はヒストグ
ラム計算セルあるいはシフトレジスタより成る。第4図
に示した如<MXMの入カデータRXがヒストグラム計
算セルH(N,1)とシフトレジスタH(N,2)〜H
 (N,N)に1行ドット単位で加わる。そしてそのヒ
ストグラム計算セルH(N,1)の出力はシフトレジス
タH(N−1.1)にまたシフトレジスタH(N,2)
の出力はヒストグラム計算セルH (N−1.2)に加
わる。さらにシフトレジスタH(N.3)〜H (N,
N)の出力はシフトレジスタ(N−1、3)〜H (N
−1,N)に加わる。すなわち、第1番目においては行
の左端にヒストグラム計算セルを、次の段においては二
番目のドット位置、また3段目においては3ドット目の
位置に順次ヒストグラム計算セルを設け、それぞれ1番
目から2番目、3番目へとそのデータを出力する構造と
している。さらに換言するならばシフトレジスタをそれ
ぞれド7}対応でセルH(N,1)から順次セルH(1
.1)までをシフトレジスタで構成し、その時セルH(
N,1)をヒストグラム計算セルとし、2番目において
は2番目のセルH (N−1.2)をヒストグラム計算
セルとし、3番目は同様に3個目の位置に、そして順々
に最終的にはセルH (1,N)にヒストグラム計算セ
ルを設けそれぞれのドット位置単位で左から次のヒスト
グラム計算セルの位置に結果を出力する構造としている
このそれぞれのヒストグラム計算セル並びにシフトレジ
スタは1クロノクに対応してデータを次の段のシフトレ
ジスタやヒストグラム計算セルに出力する。尚シフトレ
ジスタは送られてきたデータを1クロックを遅延するも
のである。
以下ではさらに詳細に動作を説明する。ヒストダラム生
成回路網の動作の始まる時刻tをt=1とし、エクロッ
クごとにtが1づつ増えていくものとするならば、時刻
tでの各セルでの動作は次のようになる。
■ t≦Mのとき、セル(N,1)〜セル(N.N)は
入力データのt行目を読み込む。M<tのとき,セル(
N,1)〜セル(N,N)は0を読み込む。
■ ヒストグラム計算セル(i,N−i+1)はセル(
i+1,N−i)から送られてきた演算結果とセル(i
+1,N−i+1)から送られてきたデータを用い、後
述のセルの動作に従って処理を行う。
■ ヒストグラム計算セル(i,N−i+1)は、演算
結果をセル(i−1,N−i+2)に送る。
また、l〜N−1行のすべてのセル(i.j)は、セル
(i+1,j)から送られてきたデータをそのままセル
(i−1,j)に送る。
但し、N≦tのときセル(1,N)の演算結果は入力デ
ータの横方向のヒストグラム((N−t+1)行目)の
値(xsvidth , xcounυとなるから、(
MXI)のバンファ32に格納していく。また、セル(
1,j)(0≦j≦1)のデータ(ywidth,xc
ount)は(MxN)のバッファに送られる。
以上の動作はM+N−1クロックで全て完了し、J行目
のヒストグラム計算セルに入力データのJ行目(横方向
)のヒストグラムの値が格納され、(MXI)のバッフ
ァの■行目に入力データの■行目(縦方向)のヒストグ
ラムの値が格納されることになる。
セルを第6図のように配置すれば、たとえば入力図形の
1行目のデータがセル(N,1)で処理され、時刻(I
+1)で処理結果とその2行目のデータがセル(N−1
.2)で処理されるという具合に同じ行のデータが順に
出会っていくので縦方向と横方向のヒストグラムが同時
に作れる。尚セルを第6図のように配置するかわりに1
次限に配置されたヒストグラム計算セルを用い、図7に
示すようにデータを1クロックづつ別単位で遅延させて
入力してもよい。前述では横方向、縦方向の動作につい
て説明したが以下では前述のヒストグラム計算セルの動
作についてさらに詳細に説明する。
先ず線形の場合のヒストグラム計算セルの横方向のヒス
トグラムについて説明する。横方向のヒストグラムは、
前述したように、画像データ上で文字の領域に含まれる
最も左の点が属する列の値を1とし、それより右の列は
1づつ値を増やしていくことで得られる。従って、入力
画像のある列を走査したとき、もしその列に黒画像が含
まれていて、しかもその列より左の列には黒画像が含ま
れていないとき、その列のヒストグラムの値を1とし、
その列より右の列は、ヒストグラムの値を1ずつ増やす
。j列目のセルはまず(j−1)列目のセルの値を判別
し、それが1以上であればその値に1を加えたものを自
分のセルの値とする。
もし(j−1)列目のセルの値がOであれば、j列目に
黒画素があるか否か調べ、あればセルの値を1にし、な
ければセルの値を0にする。各セルに前述の処理を設け
、入力画像に対し1行目から順に処理すれば、最終的に
横方向のヒストグラムが得られる。
また、文字の幅は、入力画像データ上の最も右の黒画素
の存在する列のヒストグラムの値に等しく、これを求め
ればよい。
なお、縦方向のヒストグラムも、全く同様の考え方で得
ることができる。但し、横方向のときに空間的に分布さ
せていた機能を時間的に配置することになる。
第8図は線形におけるヒストグラム計算セルの詳細な構
成図である。flagは黒画素があったかどうかを判定
するフラグであり、countはヒストグラムの値を格
納し、Widthは文字幅の値を格納する。 1x1 
 1y1 は縦方向か横方向かを表している。また、y
flag xiuidth,xcountは、左の列の
セルの値を用いて処理して結果を右のセルに送り、yw
i6th,ycount,xfalgは自分のセルの値
を用いて処理して結果を自分のセルに格納する。そして
xflag,xcount,xwidth並びにyfl
ag,ycount,ywi6thはそれぞれ以下の式
によって決定される。
横方向 xflag = if data ==1 then 
1else xflag xcount  =  if  xcount>O  
then  xcount+1else if xfl
ag−=1 or data==I then 1el
se xcount xwidth = if xflag==1 or d
ata==l then xcount+1else 
xwidth 縦方向 yflag = if data==1 then 1
else yflag ycount = if ycount>O then
 ycount+1else if yflag==I
 or data==l then 1else yc
ount ywidth = if yflag==1 or d
ata==1 then ycount+1else 
ywidth このようなセルを用いて処理を行うと、最終的に、横力
同のヒストグラムは各セル内のxcounef.,横方
向の文字幅はセル(1,N)のxwidthに、縦方向
の文字幅はセル(1,N)のywidthに格納され、
縦方向のヒストグラムは、時刻N以降セル(1,N)の
ycountとして順に出力されることになる。
次に非線形の場合のヒストグラム計算セルの横方向のヒ
ストグラムについて説明する。非線形の場合は、各列ご
とに、黒画素を横切る回数を数え、それを積算していく
。従って、j列目のセルは、j列内で黒画素を横切った
回数を計算し、その値を積算する。
第9図は非線形におけるヒストグラム計算セルの詳細な
構成図である。flagは黒画素を横切っている途中で
あるかどうかを判定するフラグであり、countはヒ
ストグラムの値を格納する。stackはその行でヒス
トグラムに加算された値の積算値を格納する。 ゛X゛
y′ は縦方向か横方向かを表している。また、yfa
lg,ycount,xstackは、左の列のセルの
値を用いて処理して結果を右のセルに送り、ystac
k,xcount,xflagは自分のセルの値を用い
て処理して結果を自分のセルに格納する。
そして、xflag,xcount,xstack,並
びにyflag,ycount , ystackはそ
れぞれ以下の弐によって決定される。
横方向 xflag = if data==o then O
else 1 if data==1 and xflag==Oth
en  xcount+xstack+1else x
count+xstackxstack = if d
ata−=1 and xflag==O then 
xstack+1else xstack xcount 縦方向 yflag = if data==O then O
else 1 ycount = if data==I and y
flag=司then  ycount+ystack
+1else ycount+ystack+1yst
ack = if data==1 and yfla
g==o then ystack+1else ys
tack このようなセルを用いて処理を行うと、最終的に、横方
向のヒストグラムは第10図の例に示すごとくに、横方
向の文字幅はセル(1,N)のXCountに、縦方向
の文字幅はセル(1.N)のycountに格納され、
縦方向のヒストグラムは、時刻N以降セル(1,N)の
ycountとして順に出力されることになる。
以上のようにヒストグラム計算セルを構成することによ
り、線形、非線形のヒストグラムである変換表を得るこ
とができる。
〔発明の効果〕
以上述べたように本発明によればヒストグラムヲハイブ
ライン構造で並列に処理するのでその変換処理を高速化
することができる。このヒストグラムを高速で求めるの
で、正規化処理を同時に高速化することができる。また
その結果、高速の文字等の認識装置を行うことができる
【図面の簡単な説明】
第1図は本発明の原理ブロソク図、 第2図は本発明の実施例の構成図、 第3図は拡大の原理説明図、 第4図は本発明の実施例の全体の構成図、第5図は縦方
向と横方向のヒストグラム図、第6図は本発明のヒスト
グラム計算回路網図、第7図はデータの流れ図、 第8図はヒストグラム計算セル(tiI形)図、第9図
は横方向のヒストグラム(非線形)図、第10図はヒス
トグラム計算セル(非線形)図である。 H(1.1)〜H(N ]) H(N、1)〜H(N,N)・・・・・セル、H(N,
1). H(N〜1,2)・・・H(1,N)・・・・
・ヒストグラム計算セル.

Claims (1)

  1. 【特許請求の範囲】 1)N個のセル(H(1、1)〜H(N、1)・・・H
    (1、N)〜H(N、N))を直列接続した直列回路を
    N列設け、第m列目の入力側からm番目のセルは、入力
    データをシフトして出力するとともに、前記入力データ
    と第m−1列目のm−1列目のセルより加わる幅データ
    とカウントデータとから幅データとカウントデータとを
    更新してm+1列目の入力側からm+1番目のセルに出
    力するヒストグラム計算セルであり、 該ヒストグラム計算セル以外のセルはシフトレジスタで
    あることを特徴とするシストリックアレイによる変換表
    作成回路。 2)前記ヒストグラム計算セルはフラグレジスタを有し
    、加わる入力データが1の時にフラグを1、0の時には
    現在のフラグの値を保持し、 カウント値が0より大の時に入力するカウントデータを
    インクリメントし、0でかつ前記フラグが1か入力する
    データが1の時にカウントデータを1とし、他の時にカ
    ウント値をそのままとして更新して出力し、 フラグが1かあるいは入力データが1の時カウントデー
    タに1加算して幅データとし他の時に同じ値として入力
    する幅データを出力することを特徴とする請求項1記載
    のシストリックアレイによる変換表作成回路。 3)前記入力データは文字データであり、1文字領域の
    ドットが1ドット行単位で前記直列接続したN個の入力
    に加わり、 前記N列目の入力側からN番目のセルは横方向のヒスト
    グラムを出力することを特徴とする請求項1記載のシス
    トリックアレイによる変換表作成回路。 4)N個のセル(H(1、1)〜H(N、1)・・・ 
    H(1、N)〜H(N、N))を直列接続した直列回路
    をN列設け、第m列目の入力側からm番目のセルは、入
    力データをシフトして出力するシフトレジスタと幅レジ
    スタとカウンタとを有し、入力データが1の時フラグデ
    ータを1とし、0の時はm−1列目の入力側からm−1
    段目のセルから加わるフラグデータを出力フラグデータ
    としてm+1列目の入力側からm+1番目のセルに出力
    し、カウンタの値が0より大の時カウンタを1歩進し、
    入力するフラグデータが1かあるいは入力データが1で
    ある時カウンタを1とし、他の時にはカウンタを変化さ
    せず、前記m−1列目の入力側からm−1段目のセルか
    ら加わるフラグデータが1かあるいは入力データが1の
    時カウンタの値に1加算して幅レジスタに格納し、その
    他の時に幅レジスタの値を保持するヒストグラム計算セ
    ルであり、 他は入力データをシフトして出力するシフトレジスタで
    あることを特徴とするシストリックアレイによる変換表
    作成回路。 5)前記入力データは文字データであり、1文字領域の
    ドットが1ドット行単位で前記直列接続したN個の入力
    に加わり、前記ヒストグラム計算セルは縦方向のヒスト
    グラムを前記幅レジスタとカウンタでそれぞれ求めるこ
    とを特徴とする請求項4記載のシストリッレアレイによ
    る変換表作成回路。
JP2008421A 1990-01-19 1990-01-19 シストリックアレイによる変換表作成回路 Pending JPH03214283A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2008421A JPH03214283A (ja) 1990-01-19 1990-01-19 シストリックアレイによる変換表作成回路
CA002034617A CA2034617C (en) 1990-01-19 1991-01-21 Data processing system
EP91100646A EP0447751B1 (en) 1990-01-19 1991-01-21 Image processing system
DE69131304T DE69131304T2 (de) 1990-01-19 1991-01-21 System zur Bildverarbeitung
US07/644,360 US5436982A (en) 1990-01-19 1991-01-22 Data processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008421A JPH03214283A (ja) 1990-01-19 1990-01-19 シストリックアレイによる変換表作成回路

Publications (1)

Publication Number Publication Date
JPH03214283A true JPH03214283A (ja) 1991-09-19

Family

ID=11692663

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008421A Pending JPH03214283A (ja) 1990-01-19 1990-01-19 シストリックアレイによる変換表作成回路

Country Status (1)

Country Link
JP (1) JPH03214283A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5642444A (en) * 1994-07-28 1997-06-24 Univ North Carolina Specialized image processing system architecture and method for image data arrays

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5642444A (en) * 1994-07-28 1997-06-24 Univ North Carolina Specialized image processing system architecture and method for image data arrays

Similar Documents

Publication Publication Date Title
JP5401695B2 (ja) 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体
US20100180189A1 (en) Information processing method and apparatus, program, and storage medium
CN115423796A (zh) 一种基于TensorRT加速推理的芯片缺陷检测方法及系统
CN114821620B (zh) 基于行文本框纵向合并的文本内容提取识别方法
CN110598703A (zh) 一种基于深度神经网络的ocr识别方法及装置
CN118522019B (zh) 文本识别方法、电子设备以及存储介质
JPH0695192A (ja) 画像認識装置及び画像入力方法
WO2024130857A1 (zh) 一种物品陈列检测方法、装置、设备及可读存储介质
JP2017182438A (ja) 画像処理装置、半導体装置、画像認識装置、移動体装置、及び画像処理方法
JPH03214283A (ja) シストリックアレイによる変換表作成回路
JP4390523B2 (ja) 最小領域による合成画像の分割
CN115482537B (zh) 基于迭代聚类处理ocr识别结果的文本对齐方法及系统
TWI775634B (zh) 英文字體影像辨識方法
JP3172498B2 (ja) イメージ認識用特徴値抽出方法、およびその装置、イメージ解析プログラムを格納する記憶媒体
JPH03214282A (ja) シストリックアレイによる正規化方式
JPH03240175A (ja) ヒストグラム計算回路
Peng et al. Digital Image Processing System Based on FPGA
JPH03214285A (ja) データ変換方式
CN118038476B (zh) 一种航行资料表格定位方法、系统、设备及存储介质
JPH03214284A (ja) データ変換方式
EP0447751B1 (en) Image processing system
JPH03268054A (ja) 高速並列処理システム
JPH1049684A (ja) 高速モーメント計算装置
JPH03268088A (ja) 総合評価回路
JPH03126188A (ja) 文字認識装置