JPH03260885A - 高速文字認識前処理用シストリックアレイ - Google Patents
高速文字認識前処理用シストリックアレイInfo
- Publication number
- JPH03260885A JPH03260885A JP2058043A JP5804390A JPH03260885A JP H03260885 A JPH03260885 A JP H03260885A JP 2058043 A JP2058043 A JP 2058043A JP 5804390 A JP5804390 A JP 5804390A JP H03260885 A JPH03260885 A JP H03260885A
- Authority
- JP
- Japan
- Prior art keywords
- data
- cell
- normalization
- processing
- register
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概 要〕
文字の認識を行うにあたり、画像データを前処理する高
速文字認識前処理用シストリックアレイに関し、 文字認識装置における扱うデータ量の多い前処理を高速
に行う高速文字認識前処理用シストリックアレイを提供
することを目的とし、 イメージデータが並列に少なくともドツト単位で加わり
、該ドツトデータを次段へ出力するセルをシストリック
アレイに接続し、該セルは入力するドツトデータと、該
データから入力する方向に対して垂直方向の隣合うセル
より加わるデータとを処理するプログラムと処理中のデ
ータとを記憶するメモリと、前記処理においてデータの
加算比較を少なくとも行うALUと、入力したデータを
記憶するとともに、次段に出力する第1のレジスタと、
前記処理結果を記憶するとともに前記隣合うセルに対向
した隣合うセルに出力する第2のレジスタとより威るよ
うに構成する。
速文字認識前処理用シストリックアレイに関し、 文字認識装置における扱うデータ量の多い前処理を高速
に行う高速文字認識前処理用シストリックアレイを提供
することを目的とし、 イメージデータが並列に少なくともドツト単位で加わり
、該ドツトデータを次段へ出力するセルをシストリック
アレイに接続し、該セルは入力するドツトデータと、該
データから入力する方向に対して垂直方向の隣合うセル
より加わるデータとを処理するプログラムと処理中のデ
ータとを記憶するメモリと、前記処理においてデータの
加算比較を少なくとも行うALUと、入力したデータを
記憶するとともに、次段に出力する第1のレジスタと、
前記処理結果を記憶するとともに前記隣合うセルに対向
した隣合うセルに出力する第2のレジスタとより威るよ
うに構成する。
本発明は、文字認識装置に係り、更に詳しくは文字の認
識を行うにあたり、画像データを前処理する高速文字認
識前処理用シストリックアレイに関する。
識を行うにあたり、画像データを前処理する高速文字認
識前処理用シストリックアレイに関する。
近年、文書の管理が計算機によって行われるようになっ
てきた。それにともない、既存の文書を計重機に自動的
に読み取らせ、効率よく入力する光学文字読み取り装置
! (OCR)に対する社会的要求が急速に増大してい
る。それに応えるために、OCRは高速・高精度である
こと、小型であることなどが要求され、実現されつつあ
る。
てきた。それにともない、既存の文書を計重機に自動的
に読み取らせ、効率よく入力する光学文字読み取り装置
! (OCR)に対する社会的要求が急速に増大してい
る。それに応えるために、OCRは高速・高精度である
こと、小型であることなどが要求され、実現されつつあ
る。
文字認識装置においても前述のOCRの高速・高精度化
を要求しているものであり、これまでに高速・高精度化
を計ったOCRを用いた様々な認識方式が開発されてい
る。それらの概略を流れで表すと、イメージデータの入
力・前処理(切り出し・正規化)・特徴抽出・認識の過
程に分けられる。このうち、前処理の部分はほとんどす
べての文字認識手法に共通している。しかしながら、正
規化等の前処理は特に重要であるが、文字の大きさとい
う大局的情報を必要とするため、従来は逐次的処理で行
われていた。
を要求しているものであり、これまでに高速・高精度化
を計ったOCRを用いた様々な認識方式が開発されてい
る。それらの概略を流れで表すと、イメージデータの入
力・前処理(切り出し・正規化)・特徴抽出・認識の過
程に分けられる。このうち、前処理の部分はほとんどす
べての文字認識手法に共通している。しかしながら、正
規化等の前処理は特に重要であるが、文字の大きさとい
う大局的情報を必要とするため、従来は逐次的処理で行
われていた。
一方、文字切り出しや正規化は画像処理の一種であり、
この分野で開発された画像処理用の汎用の小型並列処理
プロセッサを文字認識へ適用する研究も行われている。
この分野で開発された画像処理用の汎用の小型並列処理
プロセッサを文字認識へ適用する研究も行われている。
しかし、単に画像処理用のプロセッサを文字認識に用い
ることと、文字認識専用のプロセッサを用いて簡単でよ
り高速なシステムを構成することとは処理時間等におい
て大きな差異があり、文字認識専用でないかぎりこの処
理速度能力に問題がある。
ることと、文字認識専用のプロセッサを用いて簡単でよ
り高速なシステムを構成することとは処理時間等におい
て大きな差異があり、文字認識専用でないかぎりこの処
理速度能力に問題がある。
また、文字認識アルゴリズムによっては、正規化後、細
線化・線素化等の二次元画像処理が必要なものもあるが
、細線化や線素化は各画素近傍の局所的情報に基づく反
復処理であって、それをパイプライン形アルゴリズムを
用いて効率的に行う方法は既に提案されている。しかし
、従来のこの種の方法で正規化を効率よく実現する方法
は得られていない。
線化・線素化等の二次元画像処理が必要なものもあるが
、細線化や線素化は各画素近傍の局所的情報に基づく反
復処理であって、それをパイプライン形アルゴリズムを
用いて効率的に行う方法は既に提案されている。しかし
、従来のこの種の方法で正規化を効率よく実現する方法
は得られていない。
前述した文字認識装置には高認識率さらには高速化が要
求されている。認識率を高めるためには高精度読取りが
要求されるが、この高精度読み取りによりデータ量が増
加し、認識処理が遅くなるという問題を発生していた。
求されている。認識率を高めるためには高精度読取りが
要求されるが、この高精度読み取りによりデータ量が増
加し、認識処理が遅くなるという問題を発生していた。
また、逆に高速化するにはデータ数を低下させなくては
ならず、これによって認識率が下がるという問題を発生
していた。
ならず、これによって認識率が下がるという問題を発生
していた。
すなわち、OCR等が高精度・高速化がなされていても
認識のための処理が遅く、これが原因となって認識装置
における高精度化・高速化を満足できなかった。特に、
前述した前処理では画像データを扱うため、その処理に
多くの時間を必要とし、全体の処理の実行を遅らせてし
まう問題を有していた。
認識のための処理が遅く、これが原因となって認識装置
における高精度化・高速化を満足できなかった。特に、
前述した前処理では画像データを扱うため、その処理に
多くの時間を必要とし、全体の処理の実行を遅らせてし
まう問題を有していた。
本発明は、文字認識装置における扱うデータ量の多い前
処理を高速に行う高速文字vl識前処理用シストリック
アレイを提供することを目的とする。
処理を高速に行う高速文字vl識前処理用シストリック
アレイを提供することを目的とする。
第1図は本発明の原理ブロック図である。
セル1は、メモリ2.ALU3.第1のレジスタ4.第
2のレジスタ5を有し、シストリックアレイ状に接続さ
れている。
2のレジスタ5を有し、シストリックアレイ状に接続さ
れている。
メモリ2は、入力するドツトデータと、そのデータが人
力する方向に対して垂直方向の隣合うセルより加わるデ
ータとを処理するプログラムと処理中のデータとを記憶
する。
力する方向に対して垂直方向の隣合うセルより加わるデ
ータとを処理するプログラムと処理中のデータとを記憶
する。
ALU3は、前記プログラムが処理するデータの加算・
比較を少なくとも行う。
比較を少なくとも行う。
第1のレジスタ4は入力したデータを記憶するとともに
次段に出力する。
次段に出力する。
第2のレジスタ5は、前記処理結果を記憶するとともに
、前記隣合うセルに対向した隣合うセルにを出力する。
、前記隣合うセルに対向した隣合うセルにを出力する。
シストリックアレイ構造に構成された各セルにイメージ
データがドツト単位で加わり、ドツト単位で人力したデ
ータを処理する。
データがドツト単位で加わり、ドツト単位で人力したデ
ータを処理する。
メモリ2はイメージデータを処理するためのうログラム
を記憶しており、そのプログラムをセルlが実行して加
算や比較等の簡単な演算処理を行い、その結果を第2の
レジスタ5に加える。このとき、これらの処理において
は、第2のレジスタが出力するセルと、対向する隣のセ
ルとから結果が加わっており、その結果と第1のレジス
タ4に記憶されたイメージデータ等を用いて処理する。
を記憶しており、そのプログラムをセルlが実行して加
算や比較等の簡単な演算処理を行い、その結果を第2の
レジスタ5に加える。このとき、これらの処理において
は、第2のレジスタが出力するセルと、対向する隣のセ
ルとから結果が加わっており、その結果と第1のレジス
タ4に記憶されたイメージデータ等を用いて処理する。
そしてその結果を第2のレジスタ5に加えるとともに隣
のセルに出力する。また、第1のレジスタ4で記憶した
ドツトデータは次段のセルにも加わっており、次段にお
いても同様の処理を順次行う。
のセルに出力する。また、第1のレジスタ4で記憶した
ドツトデータは次段のセルにも加わっており、次段にお
いても同様の処理を順次行う。
セル1をシストリックアレイ構造にしているので、入力
した複数のドツトデータをドツト対応でセルは演算し次
段に出力するとともに隣のセルにもその結果を出力する
ので、入力方向と垂直方向に関係するドツトデータの処
理が可能となり(並列処理)、更にパイプライン処理す
るので、高速の各種の処理が可能となる。また、処理に
必要とする演算は加算・比較等、であるので簡単なAL
Uで槽底することができ、セルを安価とすることができ
る。
した複数のドツトデータをドツト対応でセルは演算し次
段に出力するとともに隣のセルにもその結果を出力する
ので、入力方向と垂直方向に関係するドツトデータの処
理が可能となり(並列処理)、更にパイプライン処理す
るので、高速の各種の処理が可能となる。また、処理に
必要とする演算は加算・比較等、であるので簡単なAL
Uで槽底することができ、セルを安価とすることができ
る。
以下、図面を用いて本発明の詳細な説明する。
第2図は本発明の実施例の文字認識の流れ図である。用
紙等に印刷された文字を認識するため先ず画像を読み取
る(画像入力、: 1nput image Sl)、
そしてその読み取った1ペ一ジ分にわたってヒストグラ
ムを計算する(calculate histogra
m S2)、このヒストグラム計算はページ内における
縦方向、横方向への投影ドツト数の加算である。またこ
のヒストグラム針)ES2においては用紙等の傾きをも
補正するため使用される傾き範囲内に対応してそれぞれ
傾いているであろうとした角度に対応してヒストグラム
を求める。そして続いて傾き補正(correct 1
nclination 、 S 3 )を行う。この傾
き補正S3は前述のヒストグラム計算S2においてそれ
ぞれの角度でなされたヒストグラムから紙の傾きを求め
その傾きに対応した処理を行う、ヒストグラムはその傾
きに対応しヒストグラム値の最大値と最小値の差は正規
の位置に配置された時に最大となる。すなわち複数の傾
きに対応してそれぞれヒストグラム計算をした場合、そ
の最大値と最小値の差が最大となる時の傾きが用紙の傾
きであり、傾き補正S3においてはこの傾きを求める。
紙等に印刷された文字を認識するため先ず画像を読み取
る(画像入力、: 1nput image Sl)、
そしてその読み取った1ペ一ジ分にわたってヒストグラ
ムを計算する(calculate histogra
m S2)、このヒストグラム計算はページ内における
縦方向、横方向への投影ドツト数の加算である。またこ
のヒストグラム針)ES2においては用紙等の傾きをも
補正するため使用される傾き範囲内に対応してそれぞれ
傾いているであろうとした角度に対応してヒストグラム
を求める。そして続いて傾き補正(correct 1
nclination 、 S 3 )を行う。この傾
き補正S3は前述のヒストグラム計算S2においてそれ
ぞれの角度でなされたヒストグラムから紙の傾きを求め
その傾きに対応した処理を行う、ヒストグラムはその傾
きに対応しヒストグラム値の最大値と最小値の差は正規
の位置に配置された時に最大となる。すなわち複数の傾
きに対応してそれぞれヒストグラム計算をした場合、そ
の最大値と最小値の差が最大となる時の傾きが用紙の傾
きであり、傾き補正S3においてはこの傾きを求める。
その結果は文字切り出しくextract a reg
ion of character pattern
S 4 )に加わる。
ion of character pattern
S 4 )に加わる。
文字切り出しS4はヒストグラム計算によって求められ
た、例えば最大値の周期から文字の領域を求め、その領
域単位で前述の傾き補正S3によって得られた補正値に
対応し順次1文字を切り出す。
た、例えば最大値の周期から文字の領域を求め、その領
域単位で前述の傾き補正S3によって得られた補正値に
対応し順次1文字を切り出す。
本発明の実施例においては文書の読み取り(用紙の読み
取り)はページ単位で行い、前述の処理32〜S4によ
って最終的にそれぞれの1文字単位での領域の分割がな
される。前述した処理52〜S4の文字分割化(seg
mentation of character pa
tterns)と、その領域の分割化に対応し文字単位
での正規化とを行う(normalization)。
取り)はページ単位で行い、前述の処理32〜S4によ
って最終的にそれぞれの1文字単位での領域の分割がな
される。前述した処理52〜S4の文字分割化(seg
mentation of character pa
tterns)と、その領域の分割化に対応し文字単位
での正規化とを行う(normalization)。
正規化においては先ず変換表作成を行う(maketr
ansform function for norm
alization S 5 ) 。
ansform function for norm
alization S 5 ) 。
この変換表作成S5は、後述するが入力した文字を特定
の大きさに正規化するための角辺の拡大縮小をドツト単
位で行うテーブルを作成する処理であり、このテーブル
を作成した後拡大縮小処理(map 5m1th th
e transform function S 6
)を行い、読み取った1文字の領域において特定の大き
さの文字とする処理いわゆる正規化処理を行う。
の大きさに正規化するための角辺の拡大縮小をドツト単
位で行うテーブルを作成する処理であり、このテーブル
を作成した後拡大縮小処理(map 5m1th th
e transform function S 6
)を行い、読み取った1文字の領域において特定の大き
さの文字とする処理いわゆる正規化処理を行う。
例えば1文字の切り出しドツトがMXMドツトであり正
規化後の文字の大きさがDXDドツトであった時には、
MXMドツトを読み取った領域の内に存在する文字を全
てDXDとする処理である。
規化後の文字の大きさがDXDドツトであった時には、
MXMドツトを読み取った領域の内に存在する文字を全
てDXDとする処理である。
前述の処理35.S6による正規化(normaliz
atton)を行った後、各文字単位での特徴抽出(e
xtract features S 7 )を行い
、その特徴と予め求められている辞書内の文字との距離
を求める。そして、その距離から認識(recogni
ze S 8 ) L、最も距離の少ないものを辞書内
の文字コードを認識結果として出力(out put
S 9)する。
atton)を行った後、各文字単位での特徴抽出(e
xtract features S 7 )を行い
、その特徴と予め求められている辞書内の文字との距離
を求める。そして、その距離から認識(recogni
ze S 8 ) L、最も距離の少ないものを辞書内
の文字コードを認識結果として出力(out put
S 9)する。
辞書のような文字認識において、前述の処理ヒストグラ
ム計XS2〜拡大縮小S6は認識を行うための前処理で
ある。このような処理は全てドツト単位で行わなくては
ならず、その処理量は多大なものである6本発明におい
ては前述の前処理52〜S6をシストリックアレイ化し
高速に行わせている。以下では各処理へのシストリック
アレイ化を説明する。
ム計XS2〜拡大縮小S6は認識を行うための前処理で
ある。このような処理は全てドツト単位で行わなくては
ならず、その処理量は多大なものである6本発明におい
ては前述の前処理52〜S6をシストリックアレイ化し
高速に行わせている。以下では各処理へのシストリック
アレイ化を説明する。
以下では、まず正規化アルゴリズムについて述べ、次に
このアルゴリズムを実現するシストリックアレイについ
て説明する。なお、特に断らない限り、入力画像はMX
Mの二値画像であるとし、DXDの大きさに正規化する
ものとする。
このアルゴリズムを実現するシストリックアレイについ
て説明する。なお、特に断らない限り、入力画像はMX
Mの二値画像であるとし、DXDの大きさに正規化する
ものとする。
〔正規化用変換関数の作成アルゴリズム〕正規化は、も
との画像を一定の大きさに拡大(または縮小)し、入力
画像上の文字領域の位置や大きさの違いによる影響を吸
収しようとする処理である。最も簡単な正規化は、入力
画像を一定の大きさに線形伸縮することで、線形正規化
という、それ以外の正規化、つまり非線形正規化の1つ
に、入力画像の行方向、列方向の線密度(白画素から黒
画素への反転数) f (i) 、 g(j)を求め、
変換関数F(i) 、 G(j)を と定義して写像する。ただし、11+Jsは、それぞれ
黒画素画存在する領域の最も上の行、最も左の列を表し
、また、bは非線形の度合を決める正の重み係数で、通
常は1である。
との画像を一定の大きさに拡大(または縮小)し、入力
画像上の文字領域の位置や大きさの違いによる影響を吸
収しようとする処理である。最も簡単な正規化は、入力
画像を一定の大きさに線形伸縮することで、線形正規化
という、それ以外の正規化、つまり非線形正規化の1つ
に、入力画像の行方向、列方向の線密度(白画素から黒
画素への反転数) f (i) 、 g(j)を求め、
変換関数F(i) 、 G(j)を と定義して写像する。ただし、11+Jsは、それぞれ
黒画素画存在する領域の最も上の行、最も左の列を表し
、また、bは非線形の度合を決める正の重み係数で、通
常は1である。
第3図は非線形正規化の別図である。以下では、第3図
を参照してまず列方向の正規化について説明する。拡大
の場合は(a)のj゛列を(ロ)の第(G(j’)XD
/W)列から第(G(j”+1)xD/W−1)列に対
応させ、縮小の場合は、(ロ)の第4列を(a)のG−
’(rjxW/D )で定まる連続した複数の列に対
応させる0行方向についてもF (J)、 Hを用いて
同様にできる。ただし、H,Wはそれぞれ黒画素が存在
する領域におけるF(j)、 G(j)の最大値であり
、「 は切り上げを表す。このような非線形正規化は手
書き漢字認識に有効である。
を参照してまず列方向の正規化について説明する。拡大
の場合は(a)のj゛列を(ロ)の第(G(j’)XD
/W)列から第(G(j”+1)xD/W−1)列に対
応させ、縮小の場合は、(ロ)の第4列を(a)のG−
’(rjxW/D )で定まる連続した複数の列に対
応させる0行方向についてもF (J)、 Hを用いて
同様にできる。ただし、H,Wはそれぞれ黒画素が存在
する領域におけるF(j)、 G(j)の最大値であり
、「 は切り上げを表す。このような非線形正規化は手
書き漢字認識に有効である。
一方線形正規化は、式(1)、 (2)でb−oとおい
た場合に相当するので、以下では正規化はすべてこの変
換関数による写像で行う。
た場合に相当するので、以下では正規化はすべてこの変
換関数による写像で行う。
これらの変換関数F(i)、 G(j)は第4図の二重
ループプログラムで求めることができる。プログラム中
で、r den (i ) 、 c den (
j )はそれぞれf (i)、 g U)に対応し、
r ace(i)、 r−acc(j)がそれぞれ
F(i)、 GO)に相当する。 jag(i)(j)
は入力画像の1行j列目の画素を表し、黒画素なら1、
白画素なら0である。また、H−r wax (M)
、 Ww c wax (M)とする。
ループプログラムで求めることができる。プログラム中
で、r den (i ) 、 c den (
j )はそれぞれf (i)、 g U)に対応し、
r ace(i)、 r−acc(j)がそれぞれ
F(i)、 GO)に相当する。 jag(i)(j)
は入力画像の1行j列目の画素を表し、黒画素なら1、
白画素なら0である。また、H−r wax (M)
、 Ww c wax (M)とする。
〔正規化(変換関数による写像)アルゴリズム〕正規化
は、変換関数を用いて、「行方向の正規化→横変換→列
方向の正規化→縦横変換」という手順で実現する(第6
図)、縦横変換(90°回転)については、特に述べな
いが、専用の2人出力ボートを持つメモリ素子回路によ
り実現される。
は、変換関数を用いて、「行方向の正規化→横変換→列
方向の正規化→縦横変換」という手順で実現する(第6
図)、縦横変換(90°回転)については、特に述べな
いが、専用の2人出力ボートを持つメモリ素子回路によ
り実現される。
行方向の正規化は次のアルゴリズムである。
ただし、iimg(i)は入力画像のi行目、03mg
(i )は正規化後の画像のi行目を表し、Dは正規
化後の大きさを表す。
(i )は正規化後の画像のi行目を表し、Dは正規
化後の大きさを表す。
一般に、
のように、右辺の配列の添字が関数の形で表されている
ループプログラムは、シストリックアルゴリズムに変換
しにくい、そこで冗長にはなるが、(4)式を次のよう
な二重ループプログラムに書き換える。
ループプログラムは、シストリックアルゴリズムに変換
しにくい、そこで冗長にはなるが、(4)式を次のよう
な二重ループプログラムに書き換える。
ただし、h (i)はMt とM2の間の整数値のみを
取るものとする。(4)式と(5)式が同値であること
は容易に理解されよう、このような変換を行うことによ
り、(4)式を実現するシストリックアレーを得ること
ができる。
取るものとする。(4)式と(5)式が同値であること
は容易に理解されよう、このような変換を行うことによ
り、(4)式を実現するシストリックアレーを得ること
ができる。
この変換を(3)式に対して行い、条件式を関数F(i
)を用いて書き直せば、第5図のようなループプログラ
ムが得られる。ただし、変換関数F (i)を配列F(
i)で表した。
)を用いて書き直せば、第5図のようなループプログラ
ムが得られる。ただし、変換関数F (i)を配列F(
i)で表した。
第4図、第5図の正規化ループプログラムから、変換関
数を作成し、正規化を行うM個のセルからなる一次元の
シストリックアレーが第7図のごとく構成できる。尚、
i行目のセルを「セルi」と呼ぶ。
数を作成し、正規化を行うM個のセルからなる一次元の
シストリックアレーが第7図のごとく構成できる。尚、
i行目のセルを「セルi」と呼ぶ。
アレーの全体図及び1個のセルの構成図を第8図に示す
。セルは、レジスタの値を加算・比較する機能を持ち、
レジスタに格納する値を制御できるALUと、6個の計
算値格納用レジスタ、1個の画体データ入力用レジスタ
、および、セル機能を記述するRAMで槽底される。こ
のうち、4個のレジスタは、隣のセルに値を送ることが
できる。
。セルは、レジスタの値を加算・比較する機能を持ち、
レジスタに格納する値を制御できるALUと、6個の計
算値格納用レジスタ、1個の画体データ入力用レジスタ
、および、セル機能を記述するRAMで槽底される。こ
のうち、4個のレジスタは、隣のセルに値を送ることが
できる。
尚、0内、0内はそれぞれ変換間数作成時、正規化時の
レジスタの名称で、以後セル機能を記述する際に用いる
。
レジスタの名称で、以後セル機能を記述する際に用いる
。
RAMには、あらかじめ、セル機能を記述するマイクロ
プログラムを格納しておく、各セルは、クロックごとに
、RAMに記述された動作に従い、各レジスタの値を更
新する。
プログラムを格納しておく、各セルは、クロックごとに
、RAMに記述された動作に従い、各レジスタの値を更
新する。
次では、このシストリックアレーへのデータの入力およ
びセルiのセル機能について述べる。ただし、セル(i
−1)のレジスタrからの人力をr(−1)と表すもの
とする。また、動作開始し時刻をt−1とする。
びセルiのセル機能について述べる。ただし、セル(i
−1)のレジスタrからの人力をr(−1)と表すもの
とする。また、動作開始し時刻をt−1とする。
〔シストリックアレーの変換関数作成〕セルの初期化で
はレジスタの値をすべて0とする。
はレジスタの値をすべて0とする。
データの人力時にセルiには、時刻tに入力画像のi行
(t−i+1)列目の画素を人力する。結果的には、第
9図のように一行ごとにシフトさせたデータを入力する
。
(t−i+1)列目の画素を人力する。結果的には、第
9図のように一行ごとにシフトさせたデータを入力する
。
セル機能は第4図のループプログラムから、次の機能が
定まる。
定まる。
r den=if img==o and 1npu
t==1then r den+1 else r den ; r acc=if r den==Oand r
acc(−1)==Othen 0 else r den Xb 十r acc(−1
)+1 ;r max=if r den==Ot
hen r wax(−1)else r ac
e ; c den=if tag(−1)==Oand 1
nput==1then c den(−1)+
1else c den(−1) ; c acc=if c den==o and c
acc==Othen 0else c den
X b+ c ace +1;else
c acc ; 1B=input ; ただし、セルlでは、 r acc(−1)= r wax(−1)= c
den(−1)=0とする。bの値は通常1(非線
形)かO(線形)である、また、灰量では乗算も考える
が、2倍、4倍という乗算に限ることでシフトで実現し
、乗算器を用いないようにもできる。
t==1then r den+1 else r den ; r acc=if r den==Oand r
acc(−1)==Othen 0 else r den Xb 十r acc(−1
)+1 ;r max=if r den==Ot
hen r wax(−1)else r ac
e ; c den=if tag(−1)==Oand 1
nput==1then c den(−1)+
1else c den(−1) ; c acc=if c den==o and c
acc==Othen 0else c den
X b+ c ace +1;else
c acc ; 1B=input ; ただし、セルlでは、 r acc(−1)= r wax(−1)= c
den(−1)=0とする。bの値は通常1(非線
形)かO(線形)である、また、灰量では乗算も考える
が、2倍、4倍という乗算に限ることでシフトで実現し
、乗算器を用いないようにもできる。
データの出力時には変換関数の作成は2Mクロックで完
了し、行方向の変換関数のi行目の値は、セルiのレジ
スタr accに格納される。また、列方向の変換関
数のj列目の値は、時刻t −Mtjに、セルMのレジ
スタc accから出力される。
了し、行方向の変換関数のi行目の値は、セルiのレジ
スタr accに格納される。また、列方向の変換関
数のj列目の値は、時刻t −Mtjに、セルMのレジ
スタc accから出力される。
さらに、行、列方向の最大値H,Wは、動作完了時(時
刻t−2M)のセルMのレジスタr laX。
刻t−2M)のセルMのレジスタr laX。
C■axの値となる。
セルの初期化ではレジスタi iBには入力画像のi
行目のデータ(1行分二Mビット)を、画体入力用レジ
スタを通して(あるいは直接)格納し、accl、ac
c2にはそれぞれDXF(i−1)。
行目のデータ(1行分二Mビット)を、画体入力用レジ
スタを通して(あるいは直接)格納し、accl、ac
c2にはそれぞれDXF(i−1)。
D X F (i)の値を格納しておく、ただし、列方
向の正規化の時は、F (i)の代わりに列方向変換関
数G(j)を用いる。また、他のレジスタにはOを格納
する。データの入力はない。
向の正規化の時は、F (i)の代わりに列方向変換関
数G(j)を用いる。また、他のレジスタにはOを格納
する。データの入力はない。
セル機能としては第5図のループプログラムから、次の
機能が定まる。
機能が定まる。
max=max(−1) ;
sum=if max==Q then 0else
sum+max ; o img=if accl < sum
and sum ≦ acc2then i
1H else o 1B(−1) ; たたし、セル1では o img(−1)=O,1lax(−1)=r
waxとする。ここで、r laXは、変換関数作
成の際に求めた行方向最大値である0列方向の正規化の
ときは、列方向最大値c waxを用いる。
sum+max ; o img=if accl < sum
and sum ≦ acc2then i
1H else o 1B(−1) ; たたし、セル1では o img(−1)=O,1lax(−1)=r
waxとする。ここで、r laXは、変換関数作
成の際に求めた行方向最大値である0列方向の正規化の
ときは、列方向最大値c waxを用いる。
データの出力時には正規化はM+Dクロックで完了し、
正規化後の画像のi行目は、時刻t −M+iにセルM
のレジスタo imgから出力される。
正規化後の画像のi行目は、時刻t −M+iにセルM
のレジスタo imgから出力される。
レジスタi imgをNビット(N<M)にせざるを
えない時は、N列毎にわけて正規化する。またaccl
、acc2の値の計算は、変換関数作成時のセル機能で
、“+l°の代わりに“十D°とすることで、乗算器を
使わずに表現できる。
えない時は、N列毎にわけて正規化する。またaccl
、acc2の値の計算は、変換関数作成時のセル機能で
、“+l°の代わりに“十D°とすることで、乗算器を
使わずに表現できる。
以上においては、非線形におけるシストリックアレーに
より正規化について説明したが、以下ではさらに様“々
な正規化について説明する。
より正規化について説明したが、以下ではさらに様“々
な正規化について説明する。
正規化用シストリックアレーを用い、レジスタのデータ
を変更することによって、文字認識で有用と思われる様
々な正規化を実現する。ただし、以下では行方向に対す
る変更方法について説明するが列方向も全く同様の方法
で変更できる。また、行方向と列方向を組み合わせるこ
ともできる。
を変更することによって、文字認識で有用と思われる様
々な正規化を実現する。ただし、以下では行方向に対す
る変更方法について説明するが列方向も全く同様の方法
で変更できる。また、行方向と列方向を組み合わせるこ
ともできる。
なお、以下では、セルiのレジスタacc2及びセル(
i+1)のレジスタacclに格納する値を、F(i)
Xsize+pos とし、セルlのレジスタWaXに代入する値を量ax と記し、5ize、pos、■axを具体的にどう与え
るかで各種正規化を実現する。通常の正規化は、5iz
e=D、 pos=o、 max=r wax
である。
i+1)のレジスタacclに格納する値を、F(i)
Xsize+pos とし、セルlのレジスタWaXに代入する値を量ax と記し、5ize、pos、■axを具体的にどう与え
るかで各種正規化を実現する。通常の正規化は、5iz
e=D、 pos=o、 max=r wax
である。
指定サイズ正規化では文字!!識の対象をワードプロセ
ッサによる印刷文字とした場合、よく用いられる文字の
サイズに、全角、半角、174角等がある。これらをす
べて同一の大きさに正規化して認識する方法もあるが、
全角と半角では一般にフォントが異なり、また、全角、
半角は半角として認識する必要が生じる場合もあるため
、正規化後の大きさはDXDに固定ではなく、自由に変
えることができる方がよい。
ッサによる印刷文字とした場合、よく用いられる文字の
サイズに、全角、半角、174角等がある。これらをす
べて同一の大きさに正規化して認識する方法もあるが、
全角と半角では一般にフォントが異なり、また、全角、
半角は半角として認識する必要が生じる場合もあるため
、正規化後の大きさはDXDに固定ではなく、自由に変
えることができる方がよい。
また、このような正規化を行うと、正規化後の画像はD
XDの領域全体を占めず、空白部分が生じる。従って、
文字領域をDXDのどの部分に配置するかということを
指定できると便利である。
XDの領域全体を占めず、空白部分が生じる。従って、
文字領域をDXDのどの部分に配置するかということを
指定できると便利である。
正規化後の大きさをdにするには、
5ize = d
max=r 重ax
とする、 posの値は文字領域の配置位置によって
異なり、 となる。乗算器を使わない場合はdは2のべき乗に限る
。
異なり、 となる。乗算器を使わない場合はdは2のべき乗に限る
。
縦横同化比率正規化では、“1”や°−′といった縦長
、横長の文字は、通常の正規化ではDXDの枠金体にク
ロック画素領域が広がってしまい、元の形の情報が失わ
れてしまう。このようなときは、縦横を同比率で正規化
することも望まれる。
、横長の文字は、通常の正規化ではDXDの枠金体にク
ロック画素領域が広がってしまい、元の形の情報が失わ
れてしまう。このようなときは、縦横を同比率で正規化
することも望まれる。
入力画像が縦長の場合は、行方向は通常の処理でよい、
横長(c wax > r wax)の場合、縦横
を同比率で正規化するには、 size=D max=c wax とする、なお、本節の考え方は、指定サイズ正規化と組
み合わせることができ、縦横同比率でd×dの範囲内に
収めるといった処理も可能である。
横長(c wax > r wax)の場合、縦横
を同比率で正規化するには、 size=D max=c wax とする、なお、本節の考え方は、指定サイズ正規化と組
み合わせることができ、縦横同比率でd×dの範囲内に
収めるといった処理も可能である。
位置正規化においてはいわゆる「パターンマツチング法
」によって認識を行うような場合は、拡大・縮小や変形
を行わず、位置のみを合わせる正規化も必要になろう、
このような正規化を行うには、 5ize= 1 鵬ax=1 とする。
」によって認識を行うような場合は、拡大・縮小や変形
を行わず、位置のみを合わせる正規化も必要になろう、
このような正規化を行うには、 5ize= 1 鵬ax=1 とする。
上述3の正規化を第8図のプロセッサを用いて実際に行
った例を第10図に示す。
った例を第10図に示す。
以上では、正規化について詳細に本発明の実施例を用い
て説明したが、以下では本発明の実施例を文字切り出し
への適応について説明する。
て説明したが、以下では本発明の実施例を文字切り出し
への適応について説明する。
正規化用シストリックアレーを文字切り出しのために必
要となる黒画素のヒストグラム計寡、傾き補正処理へ適
用する。なお、ここで扱うデータはMXNの二値画像で
あるとする。Nは、入力画像データの横方向の長さに相
当する。
要となる黒画素のヒストグラム計寡、傾き補正処理へ適
用する。なお、ここで扱うデータはMXNの二値画像で
あるとする。Nは、入力画像データの横方向の長さに相
当する。
ヒストグラム掲載は、正規化用変換関数の作成とほぼ同
様のアルゴリズムであり、第11図のループプログラム
で書ける。データの入力方法などは変えずにセル機能を
次のようにして実現できる。
様のアルゴリズムであり、第11図のループプログラム
で書ける。データの入力方法などは変えずにセル機能を
次のようにして実現できる。
r den=if 1nput==1 then r
den +1else r den ; c den=if 1nput==1 then c
den(−1) +1else c den (
−1) ;ヒストグラムのみを求めるのであれば他のレ
ジスタは使用しないが、r acc、 c acc
を用い、セル機能を、 r acc= r den + r ace(−
1) :c acc= c den 十c ace ;
と定義すれば、行、列方向のヒストグラムの累積値や画
像全体の黒画素の数などを求めることができる0文字切
り出しのアルゴリズムによっては、これらの値を用いる
ものと思われる。
den +1else r den ; c den=if 1nput==1 then c
den(−1) +1else c den (
−1) ;ヒストグラムのみを求めるのであれば他のレ
ジスタは使用しないが、r acc、 c acc
を用い、セル機能を、 r acc= r den + r ace(−
1) :c acc= c den 十c ace ;
と定義すれば、行、列方向のヒストグラムの累積値や画
像全体の黒画素の数などを求めることができる0文字切
り出しのアルゴリズムによっては、これらの値を用いる
ものと思われる。
傾き補正は、第12図に示すように、入力画像をに列ご
とのブロックに分割し、第LブロックをL−1行だけ、
上または下にシフトする。ただし、傾きは小さいと仮定
し、Kは上述したブロックのシフトによって傾きが補正
できる、ようにするための値で、入力画像の傾きから求
まる定数である。
とのブロックに分割し、第LブロックをL−1行だけ、
上または下にシフトする。ただし、傾きは小さいと仮定
し、Kは上述したブロックのシフトによって傾きが補正
できる、ようにするための値で、入力画像の傾きから求
まる定数である。
この傾き補正は、ブロックごとの位置の正規化であると
みなせる。第Lブロックを扱う場合の動作は、次のよう
になる。
みなせる。第Lブロックを扱う場合の動作は、次のよう
になる。
セルの初期化においてはレジスタi imgに入力画
像のi行目のデータ(Kヒフ1分)を格納する。
像のi行目のデータ(Kヒフ1分)を格納する。
データの入力はない。
セル機能においてはセルiには次の機能を持たせる。
max=max(−1) ;
o 1H=if max==i then
i 1Helse o 1H(−1) ; ただし、セル1では、 Ol−g(−1)=0 ; とする。ここで、tは時刻、Lはブロック番号を表す。
i 1Helse o 1H(−1) ; ただし、セル1では、 Ol−g(−1)=0 ; とする。ここで、tは時刻、Lはブロック番号を表す。
データの出力ではブロックごとの動作は2Mクロックで
完了し、変換後の画像のi行目は、時刻t=M+iにセ
ルMのレジスタo iIIgから出力される。
完了し、変換後の画像のi行目は、時刻t=M+iにセ
ルMのレジスタo iIIgから出力される。
以上本発明の実施例を変換表作成、正規化、ヒストグラ
ム計纂、傾き補正について説明したが、はぼ同一の槽底
でさらに各セルを構成するプロセッサは比較、加算等の
ALUでよく、従来のプロセッサと比べはるかに素子数
の少ないLSIで構成できる。またプログラムを変更す
るのみで各種の処理を行うことかできる。
ム計纂、傾き補正について説明したが、はぼ同一の槽底
でさらに各セルを構成するプロセッサは比較、加算等の
ALUでよく、従来のプロセッサと比べはるかに素子数
の少ないLSIで構成できる。またプログラムを変更す
るのみで各種の処理を行うことかできる。
以上述べたように本発明によれば専用のプログラマブル
セルをシストリックアレー構成とし、パイプラインで並
列に処理しているので、各種の処理を高速化することが
できる。また、プログラマブルセルは簡単なALUによ
って構成されるので安価とすることができる。さらには
、プログラマブルであるので変換表作成、正規化、ヒス
トグラム計算、傾き補正等に共通に使用できる。
セルをシストリックアレー構成とし、パイプラインで並
列に処理しているので、各種の処理を高速化することが
できる。また、プログラマブルセルは簡単なALUによ
って構成されるので安価とすることができる。さらには
、プログラマブルであるので変換表作成、正規化、ヒス
トグラム計算、傾き補正等に共通に使用できる。
第1図は本発明の原理ブロック図、
第2図は本発明の実施例の文字認識のフローチャート、
第3図は非線形正規化の偶因、
第4図は変換関数の作成を示す図、
第5図は正規化用ループプログラムを示す図、第6図は
正規化の流れを示す図、 第7図はアレーの構成国、 第8図はセルの構成国、 第9図はデータのフローチャート、 第10図は様々な正規化図、 第11図はヒストグラム計算を示す図、第12図は傾き
補正図である。 1・・・セル、 2・・・メモリ、 3・・・ALU。 4・・・第1のレジスタ、 5・・・第2のレジスタ。
正規化の流れを示す図、 第7図はアレーの構成国、 第8図はセルの構成国、 第9図はデータのフローチャート、 第10図は様々な正規化図、 第11図はヒストグラム計算を示す図、第12図は傾き
補正図である。 1・・・セル、 2・・・メモリ、 3・・・ALU。 4・・・第1のレジスタ、 5・・・第2のレジスタ。
Claims (1)
- 【特許請求の範囲】 イメージデータが並列に少なくともドット単位で加わり
、該ドットデータを次段へ出力するセル(1)をシスト
リックアレイに接続し、 該セルは入力するドットデータと、該データから入力す
る方向に対して垂直方向の隣合うセルより加わるデータ
とを処理するプログラムと処理中のデータとを記憶する
メモリ(2)と、前記処理においてデータの加算比較を
少なくとも行うALU(3)と、入力したデータを記憶
するとともに、次段に出力する第1のレジスタ(4)と
、前記処理結果を記憶するとともに前記隣合うセルに対
向した隣合うセルに出力する第2のレジスタ(5)とよ
り成ることを特徴とする高速文字認識前処理用シストリ
ックアレイ。
Priority Applications (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2058043A JPH03260885A (ja) | 1990-03-12 | 1990-03-12 | 高速文字認識前処理用シストリックアレイ |
| CA002034617A CA2034617C (en) | 1990-01-19 | 1991-01-21 | Data processing system |
| EP91100646A EP0447751B1 (en) | 1990-01-19 | 1991-01-21 | Image processing system |
| DE69131304T DE69131304T2 (de) | 1990-01-19 | 1991-01-21 | System zur Bildverarbeitung |
| US07/644,360 US5436982A (en) | 1990-01-19 | 1991-01-22 | Data processing system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2058043A JPH03260885A (ja) | 1990-03-12 | 1990-03-12 | 高速文字認識前処理用シストリックアレイ |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH03260885A true JPH03260885A (ja) | 1991-11-20 |
Family
ID=13072908
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2058043A Pending JPH03260885A (ja) | 1990-01-19 | 1990-03-12 | 高速文字認識前処理用シストリックアレイ |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH03260885A (ja) |
-
1990
- 1990-03-12 JP JP2058043A patent/JPH03260885A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0431961B1 (en) | Image reduction/enlargement technique | |
| US20190304066A1 (en) | Synthesis method of chinese printed character images and device thereof | |
| WO2007022460A2 (en) | Post-ocr image segmentation into spatially separated text zones | |
| JPH05500874A (ja) | ディジタル化書類における選択本文の自動抽出のための多角形準拠式方法 | |
| CN102282572A (zh) | 表示图像块的方法和系统 | |
| US11887393B2 (en) | End-to-end system for extracting tabular data present in electronic documents and method thereof | |
| EP0518462B1 (en) | Filtering system and operation method for very high-speed image processing | |
| US20020039456A1 (en) | Image data adjusting device and method | |
| CN113592720B (zh) | 图像的缩放处理方法、装置、设备、存储介质 | |
| WO2021051527A1 (zh) | 基于图像分割的文字定位方法、装置、设备及存储介质 | |
| US5590247A (en) | Character string outputting method and apparatus capable of varying sizes of characters | |
| CN111611883B (zh) | 基于最小单元格聚类的表格版面分析方法、系统及设备 | |
| EP4075381A1 (en) | Image processing method and system | |
| CN113435331B (zh) | 图像文字识别方法、系统、电子设备及存储介质 | |
| CN115937537A (zh) | 一种目标图像的智能识别方法、装置、设备及存储介质 | |
| CN112541535B (zh) | 基于互补的多分支深度学习进行三维点云分类方法 | |
| CN117115821B (zh) | 基于语义分析的图文识别修复方法、系统、设备及介质 | |
| CN115294590B (zh) | 图像中单字的检测方法及装置、电子设备、存储介质 | |
| US5809180A (en) | Data conversion system for line-narrowing a pattern | |
| CN115239848A (zh) | 基于自然场景文字检测、擦除与再生成的自标注图文合成方法及应用 | |
| JPH03260885A (ja) | 高速文字認識前処理用シストリックアレイ | |
| JP7430219B2 (ja) | 文書情報構造化装置、文書情報構造化方法およびプログラム | |
| Wang et al. | On parameter-dependent connected components of gray images | |
| US20200019803A1 (en) | Method and apparatus for determining summation of pixel characteristics for rectangular region of digital image avoiding non-aligned loads using multiple copies of input data | |
| US5436982A (en) | Data processing system |