JPS5847064B2 - 文字読取方式 - Google Patents
文字読取方式Info
- Publication number
- JPS5847064B2 JPS5847064B2 JP53082512A JP8251278A JPS5847064B2 JP S5847064 B2 JPS5847064 B2 JP S5847064B2 JP 53082512 A JP53082512 A JP 53082512A JP 8251278 A JP8251278 A JP 8251278A JP S5847064 B2 JPS5847064 B2 JP S5847064B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- characters
- mask
- line sensor
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Description
【発明の詳細な説明】
この発明は、文字の切り出しを行わずに文字認識を連続
的に行えるようにした文字読取方式に関するものである
。
的に行えるようにした文字読取方式に関するものである
。
文字認識技術については非常に多くの方法が提案されて
いる。
いる。
しかし、それらは共通に一つの処理を必要とする。
それは行上に連続的に書かれ、または印字された文字を
一つ一つ文字毎に切り出してくる処理である。
一つ一つ文字毎に切り出してくる処理である。
すなわち、一文字をとり込んだという前提で後の全ての
処理が行われる。
処理が行われる。
この一つの文字が切り出されるという事は、現在のOC
R技術にとっては非常に大きな必要条件であり、実際そ
のため、手書きOCRではOCR用紙には必ず文字枠が
印刷されており、その内に文字を書くことが指定されて
いる。
R技術にとっては非常に大きな必要条件であり、実際そ
のため、手書きOCRではOCR用紙には必ず文字枠が
印刷されており、その内に文字を書くことが指定されて
いる。
一方、印刷文字では、文字間隔を取るために10文字/
インチが必ず指定される。
インチが必ず指定される。
しかしながら実際上の問題としては、この条件はかなり
きついものである。
きついものである。
特に印字文字については、12文字/インチは非常によ
く使用されるものであり、この場合には文字間隔が白地
で取れるという事を期待することはできない。
く使用されるものであり、この場合には文字間隔が白地
で取れるという事を期待することはできない。
この様な理由で、この発明では文字の切り出しを行わず
に文字を認識する方法を提案するものである。
に文字を認識する方法を提案するものである。
この発明を説明する前にさらに従来技術について簡単に
説明する。
説明する。
上述したような切り出しの前処理を行わない唯一の方法
として、従来考えられているものは、各文字カテゴリー
の標準マスクを用意して、それらと一定の文字枠内に入
ってくる入力文字とを連続的に相関を取る方式である。
として、従来考えられているものは、各文字カテゴリー
の標準マスクを用意して、それらと一定の文字枠内に入
ってくる入力文字とを連続的に相関を取る方式である。
しかし、この方式では平面の相関をいちいちその移動毎
に計算して求めなければならず、しかも各文字カテゴリ
ー毎にそれを行うのであり、計算量と要求される速度を
考慮すると、かなり大損りなものとならざるを得ない。
に計算して求めなければならず、しかも各文字カテゴリ
ー毎にそれを行うのであり、計算量と要求される速度を
考慮すると、かなり大損りなものとならざるを得ない。
しかも、入力文字は印字文字としても、大きさ、同一文
字カテゴリーに属する文字でも、例えばフォントによる
形の変動などがあり、これらの変動を吸収するためには
、文字カテゴリー毎に多くの二次元の標準マスクを必要
とし、かつそれらと整合を取る必要がある。
字カテゴリーに属する文字でも、例えばフォントによる
形の変動などがあり、これらの変動を吸収するためには
、文字カテゴリー毎に多くの二次元の標準マスクを必要
とし、かつそれらと整合を取る必要がある。
このような理由で上述の考え方には実際上は多くの難問
がある。
がある。
そこで、上述の単純な相関法を排除し特徴抽出の立場に
立ったとしても、なお、文字を必ずしも正しく切り出し
ていないということのために問題がある。
立ったとしても、なお、文字を必ずしも正しく切り出し
ていないということのために問題がある。
例えは、いちいち線を追跡したりなどして精密に特徴を
取っていくということでは、切り出しが必要である相関
法に欠点があるという同じ意味でうまくいかない。
取っていくということでは、切り出しが必要である相関
法に欠点があるという同じ意味でうまくいかない。
したがって、特徴抽出はできるだけ単純なものでなげれ
ばならず、しかも加法的であることが望ましいのである
。
ばならず、しかも加法的であることが望ましいのである
。
こSで加法的であるとは、文字が移動していって所定の
枠内に入る文字パターンが変っていくわけであるが、そ
の変化毎にいちいち全面を見て改めて特徴を取るという
のではなく、その時刻までの特徴に関するある結果が有
効に利用される事、もう少し詳しく云うと、文字パター
ンの消滅と出現部分だけが、既存のものに加法的に結合
されて、文字パターン全体の特徴が得られるという事が
望ましいのである。
枠内に入る文字パターンが変っていくわけであるが、そ
の変化毎にいちいち全面を見て改めて特徴を取るという
のではなく、その時刻までの特徴に関するある結果が有
効に利用される事、もう少し詳しく云うと、文字パター
ンの消滅と出現部分だけが、既存のものに加法的に結合
されて、文字パターン全体の特徴が得られるという事が
望ましいのである。
具体的にこの要求を満たすために、この発明で取り上げ
られる特徴は局所的特徴か、または文字が行方向に移動
していくのであるから列方向における大域的な特徴であ
る。
られる特徴は局所的特徴か、または文字が行方向に移動
していくのであるから列方向における大域的な特徴であ
る。
そして加法的であるという事から、それらの特徴頻度(
ヒストグラム)が考えられる。
ヒストグラム)が考えられる。
かくして、まず最初にこれらの特徴のヒストグラムベク
トル(以下特徴ベクトルと云う) が与えられる。
トル(以下特徴ベクトルと云う) が与えられる。
fl、・°゛・曲゛、fnは各特徴の頻度を表わす。
さて、この様にして得られた特徴ベクトルfは必ずしも
文字の識別に良いものであるとは限らない。
文字の識別に良いものであるとは限らない。
そこでこれを識別の立場でできるだけ良いものに組み直
す必要がある。
す必要がある。
これには多変量解析の手法を用いることにより、学習デ
ータを与えてやれは自動的に求めることができるのであ
る。
ータを与えてやれは自動的に求めることができるのであ
る。
すなわちこれは特徴ベクトルfのある線形変換行列Aを
与えることであり、とのAは全文字カテゴリーのデータ
集合(fi)から求めることができる。
与えることであり、とのAは全文字カテゴリーのデータ
集合(fi)から求めることができる。
−万、各文字カテゴリー毎のデータ集合
(fi)。
から、新しく変換された特徴軸における標準文字パター
ンが求められ、これが各文字カテゴリーのマスクとなる
。
ンが求められ、これが各文字カテゴリーのマスクとなる
。
かくして、入力文字は各移動位置毎に特徴ヒストグラム
が加法的に求められ、特徴ベクトルが得られ、これが新
しい特徴軸に変換されて、この新しい特徴軸で各文字カ
テゴリー毎のマスクと整合が取られ、あるしきい値以上
の整合度が得られたマスクの文字カテゴリーが入力文字
のカテゴリーとされる。
が加法的に求められ、特徴ベクトルが得られ、これが新
しい特徴軸に変換されて、この新しい特徴軸で各文字カ
テゴリー毎のマスクと整合が取られ、あるしきい値以上
の整合度が得られたマスクの文字カテゴリーが入力文字
のカテゴリーとされる。
上記の原理に基づくこの発明の一実施例について、以下
図面を参照して説明する。
図面を参照して説明する。
第1図は読取るべき文字「A、B、CJと読取枠の作用
をするラインセンサ1との関係を示している。
をするラインセンサ1との関係を示している。
ラインセンサ1は、列方向に一列に並んだ多数の素子1
a〜1nからなり、各素子は例えば光電変換素子からな
り、入力信号を光電変換する。
a〜1nからなり、各素子は例えば光電変換素子からな
り、入力信号を光電変換する。
ラインセンサ1は第1図の矢印の行方向に走査される。
文字I−A、B、CJは行方向に並べて書かれたタイプ
印字、または手書き文字とする。
印字、または手書き文字とする。
簡単のため、前処理部は簡略したものを考えることにす
る。
る。
すなわち、ラインセンサ1から得られたビデオ信号は、
一定のしきい値で二値化されるものとする。
一定のしきい値で二値化されるものとする。
すなわち、黒を1″′、白をN 011のように二値化
する。
する。
これを第2図に示す。第2図において、ラインセンサ1
の各素子1a〜1nのアナログ情報は二値化回路2によ
って所定のしきい値以上、以下によって1”またはn
Ottにディジタル化される。
の各素子1a〜1nのアナログ情報は二値化回路2によ
って所定のしきい値以上、以下によって1”またはn
Ottにディジタル化される。
二値化回路2の出力は順次nビットのバッファシフトレ
ジスタ(以下BSRという)3に記憶される。
ジスタ(以下BSRという)3に記憶される。
4は特徴抽出用バッファシフトレジスタ(以下FBSR
といつ)で、4個のB S R4a > 4 b t
4 cからなるn×3ビツトのものである。
といつ)で、4個のB S R4a > 4 b t
4 cからなるn×3ビツトのものである。
その動作について説明すると、一部分のサン7リングが
ラインセンサ1により終了すると、B5R3は一杯にな
る。
ラインセンサ1により終了すると、B5R3は一杯にな
る。
その段階でその一部分の情報がn行3列のFBSR4に
同時に転送される。
同時に転送される。
この時、既に存在していたFBSR4の一番上のBSR
Ja内の情報は消滅するので、事前にすぐ下の行のBS
R4bにシフトされる必要がある。
Ja内の情報は消滅するので、事前にすぐ下の行のBS
R4bにシフトされる必要がある。
この事はFBSR4の真中のBSR4bについても同様
でBSRJaから転送される前に、それまで記憶してい
た情報をBSR4cに転送しなげればならない。
でBSRJaから転送される前に、それまで記憶してい
た情報をBSR4cに転送しなげればならない。
この様にFBSR4は、まず列方向にシフト可能なレジ
スタ群でなければならない。
スタ群でなければならない。
カくシテ、一番最初の状況を除いて、このFBSR4に
は、近接する3列の文字パターン情報が常に貯えられて
いることになる。
は、近接する3列の文字パターン情報が常に貯えられて
いることになる。
次に、特徴抽出(局所的、大域的)について説明する。
第2図のように情報を取り込んだところで、次に特徴を
抽出するmに入る。
抽出するmに入る。
特徴抽出は大きく2種類に分けられる。
すなわち、局所的と列方向の大域的とである6
局所的な特徴としては種々のものが考えられるが、と五
では系統的で効果的であることがわかっているn次の自
己相関系列のうち、3次までを3×3のマスクで実現し
たものを使用する。
では系統的で効果的であることがわかっているn次の自
己相関系列のうち、3次までを3×3のマスクで実現し
たものを使用する。
このようなマスク系列の一例を第3図に示す。
第3図には應1〜涜25までの25枚のマスクが示され
ており、各マスクは3×3の9個所のうち、どこがl
?1であるかを示してあり、*印のところは1″でも0
″でもよいことを示している。
ており、各マスクは3×3の9個所のうち、どこがl
?1であるかを示してあり、*印のところは1″でも0
″でもよいことを示している。
したがって、・/I61のマスクについて云えば、中心
力19171でさえあれば、このマスクの出力は常に1
′”ということになる。
力19171でさえあれば、このマスクの出力は常に1
′”ということになる。
そして、贋1のマスクは1次マスク、/i6.2〜應5
は2次マスク、屑6〜A25は3次マスクを示している
。
は2次マスク、屑6〜A25は3次マスクを示している
。
さて、FBSR4に貯えられたn行3列のパターンから
上述のマスクにより整合をとり、各マスクのヒストグラ
ムを求めるのであるが、このための回路を第4図に示す
。
上述のマスクにより整合をとり、各マスクのヒストグラ
ムを求めるのであるが、このための回路を第4図に示す
。
第4図において、上方に示す3×3の枠は、第2図のF
BSR4の最右端の3×3の部分に相当し、枠内は#0
〜#8までのアドレスが付しである。
BSR4の最右端の3×3の部分に相当し、枠内は#0
〜#8までのアドレスが付しである。
各アドレス#0〜#8における1″または0”の値はノ
リツブフロップFF、 とアンドゲートANDで構成
される回路の各フリップフロップFF、の入力に加えら
れる。
リツブフロップFF、 とアンドゲートANDで構成
される回路の各フリップフロップFF、の入力に加えら
れる。
したがって、第3図のマスクのパターンと照合すれば容
易に理解できるように所定の組合せの出力からどのマス
クと整合がとれたかが判別される。
易に理解できるように所定の組合せの出力からどのマス
クと整合がとれたかが判別される。
例えば、第3図の/1618のマスクを例にとると、こ
の場合にはアドレス#O1#3、#5が”111の場合
であるから、#0と#3を入力とするアンドゲートから
の出力と、#0と#5を入力とするアンドゲートからの
出力とを入力とするアンドゲートからの出力が涜18の
出力ということになる。
の場合にはアドレス#O1#3、#5が”111の場合
であるから、#0と#3を入力とするアンドゲートから
の出力と、#0と#5を入力とするアンドゲートからの
出力とを入力とするアンドゲートからの出力が涜18の
出力ということになる。
かくして、25次元の1″、N OI+型要素もつ局所
特徴ベクトルが現われることになる。
特徴ベクトルが現われることになる。
一方、第2甲のFBSR4の最右端から情報を取り出す
には、FBSR40行方向にシフトさせなげればならな
い。
には、FBSR40行方向にシフトさせなげればならな
い。
また、情報が失われないように、これは元(最左端)に
戻す必要があり、そのためFBSR4は二次元シフトレ
ジスタで、かつ巡回型である。
戻す必要があり、そのためFBSR4は二次元シフトレ
ジスタで、かつ巡回型である。
次に、このようにして得られたマスクの整合結果からヒ
ストグラムを作り特徴ベクトルを得る必要がある。
ストグラムを作り特徴ベクトルを得る必要がある。
これを第5図に示す。第5図はラインセンサ1の各列毎
のヒストグラムレジスタ5を示すもので、この例の場合
には、1文字を走査する走査長はラインセンサ1の幅の
20倍、すなわら、一文字の走査にラインセンサ1は2
0回入力があるものとしているまた、行の数は25ある
ものとする。
のヒストグラムレジスタ5を示すもので、この例の場合
には、1文字を走査する走査長はラインセンサ1の幅の
20倍、すなわら、一文字の走査にラインセンサ1は2
0回入力があるものとしているまた、行の数は25ある
ものとする。
したがって各25ビツトのメモリ58.1〜51−25
152.1〜5□、25.・・・・パ・・・520−1
〜5□o、250500個が配列されており、行方向に
シフトレジスタを構成している。
152.1〜5□、25.・・・・パ・・・520−1
〜5□o、250500個が配列されており、行方向に
シフトレジスタを構成している。
第1列目のメモリ50.□〜5□、2.には、第4図の
/161〜/%25の各マスクの出力(マスクと同様應
1〜A25で表わす)が入力される。
/161〜/%25の各マスクの出力(マスクと同様應
1〜A25で表わす)が入力される。
そして、ラインセンサ1がその幅だけ走査方向にシフト
スる毎にラインセンサ1から出力が出てメモリ54.1
〜51.25に記憶され、それまでの記憶は次段のメモ
リ5□、□〜52.25に転送される。
スる毎にラインセンサ1から出力が出てメモリ54.1
〜51.25に記憶され、それまでの記憶は次段のメモ
リ5□、□〜52.25に転送される。
このようにして、ラインセンサ1の移動に伴って常にそ
れまでの20列分の記憶がヒストグラムレジスタ5に記
憶されることになる。
れまでの20列分の記憶がヒストグラムレジスタ5に記
憶されることになる。
したがって、ヒストグラムレジスタ5の内容と第1図の
文字との対応をみると、ある時点では丁度文字IAJに
対応しているときもあるし、あるときは文字rAJと文
字rBJが半分ずつ対応しているときもあるというよう
に、ラインセンサ1の動きに応じてその内容を変えてい
くことになる。
文字との対応をみると、ある時点では丁度文字IAJに
対応しているときもあるし、あるときは文字rAJと文
字rBJが半分ずつ対応しているときもあるというよう
に、ラインセンサ1の動きに応じてその内容を変えてい
くことになる。
第6図はヒストグラム累積器6の一例を示すもので、6
□〜625は8ビツトのアップダウンカウンタでありそ
の各加算端子7□〜7□5には第5図のヒストグラムレ
ジスタ5の第1列目の各メモリ5□、□〜51−25の
出力がそれぞれ加えられ、また各減算端子8□〜825
には同じく第20列目の各メモリ52o、□〜520.
25の出力層(1)〜應(25)が加えられている。
□〜625は8ビツトのアップダウンカウンタでありそ
の各加算端子7□〜7□5には第5図のヒストグラムレ
ジスタ5の第1列目の各メモリ5□、□〜51−25の
出力がそれぞれ加えられ、また各減算端子8□〜825
には同じく第20列目の各メモリ52o、□〜520.
25の出力層(1)〜應(25)が加えられている。
したがって、ヒストグラム累積器6の内容はラインセン
サ1が1列分次に移動すると新しくその列の出力が加算
され、1番古い列の情報が減算されることになり、常に
第5図のヒストグラムレジスタ5の各行における1”ま
たはe@ Optの数の合計をカウントすることになる
。
サ1が1列分次に移動すると新しくその列の出力が加算
され、1番古い列の情報が減算されることになり、常に
第5図のヒストグラムレジスタ5の各行における1”ま
たはe@ Optの数の合計をカウントすることになる
。
かくして、局所的特徴がヒストグラム累積器6に得られ
る。
る。
以上は局所的なn次元(上記の例ではn = 25 )
特徴ベクトルの作り方について述べたのであるが、この
n次元特徴ベクトルの用い方については後述することに
し、次に大域的特徴の抽出について説明する。
特徴ベクトルの作り方について述べたのであるが、この
n次元特徴ベクトルの用い方については後述することに
し、次に大域的特徴の抽出について説明する。
列方向における大域的な特徴として1.こ工では次の2
種類をとり上げる。
種類をとり上げる。
一つはランレングスと呼ばれるもので、2値画偉の符号
化によく使用されるものであって、連続する黒または白
の長さを測るものである。
化によく使用されるものであって、連続する黒または白
の長さを測るものである。
もう一つはモーメントである(なお、モーメントについ
ては、とSでは使用しないのでその説明は省略する)。
ては、とSでは使用しないのでその説明は省略する)。
ランレングスを検出する具体的回路を第7図に示す。
第7図aは“1″のランレングス、第1図すはOjjの
ランレングスの検出に用いられる。
ランレングスの検出に用いられる。
まず、初期状態として、第7図a、bのフリップ70ツ
ブF1□〜F13)FOI〜F03はすべてセットされ
ているものとする。
ブF1□〜F13)FOI〜F03はすべてセットされ
ているものとする。
はじめにシフトレジスタSRの最右端が“1″である場
合の″1 ?1のランレングスの検出について説明スル
。
合の″1 ?1のランレングスの検出について説明スル
。
この場合には、第7図aにおいて、カウンタC11に′
″1111バカれ以外はフリップフロップF1□、F□
2tF13のQ出力によりカウンタC□2.C□3の前
のゲートがインヒビジョンされてカウントされない。
″1111バカれ以外はフリップフロップF1□、F□
2tF13のQ出力によりカウンタC□2.C□3の前
のゲートがインヒビジョンされてカウントされない。
この様に′1゛が続く限りその数がカウンタC□1にカ
ウントされる。
ウントされる。
第7図すにおいては同様にしてカウンタC61゜Co2
.・・・・・・・・・もその前のゲートがインヒビジョ
ンされカウントされない。
.・・・・・・・・・もその前のゲートがインヒビジョ
ンされカウントされない。
そこで、シフトレジスタSRの最右端が「・・・・・・
・・・01」となる時がきて最初のn 、 510ラン
が切れた時、ケー1−G、がオンとなり、フリップフロ
ップF1□のに入力はl”となり、フリップフロップF
1□はトグルしてQ出力は″1″→″0パとなる。
・・・01」となる時がきて最初のn 、 510ラン
が切れた時、ケー1−G、がオンとなり、フリップフロ
ップF1□のに入力はl”となり、フリップフロップF
1□はトグルしてQ出力は″1″→″0パとなる。
したがってカウンタC1□のカウントが終ると同時にカ
ウンタC□2の前のゲートのインヒビジョンは解ける。
ウンタC□2の前のゲートのインヒビジョンは解ける。
しかし、この時、ノリツブフロップF1□のQ出力は1
クロツク遅れているので、これはフリップフロップF□
22F□3をトグルしない。
クロツク遅れているので、これはフリップフロップF□
22F□3をトグルしない。
そこでシフトレジスタSRが、そのま、 N 099の
ランが続けばそれは第7図すのカウンタCo1にカウン
トされるが、「・・・・・・・・・OIJがシフトレジ
スタSRに現れて“O”のランが切れればゲートGoが
オンしてノリツブフロップF。
ランが続けばそれは第7図すのカウンタCo1にカウン
トされるが、「・・・・・・・・・OIJがシフトレジ
スタSRに現れて“O”のランが切れればゲートGoが
オンしてノリツブフロップF。
□はトグルし、FolのQ出力は1″→″0″となり、
次のカウンタC62の前のゲートのインヒビジョンを解
<。
次のカウンタC62の前のゲートのインヒビジョンを解
<。
一方、このまS第2の1″′のシンが続けば、第7図a
のカウンタC□2にそれはカウントされる。
のカウンタC□2にそれはカウントされる。
なお、J入力がN O+1であればに入力の入力にかか
わらず各ノリツブフロップはセットされることはないこ
とに注意する。
わらず各ノリツブフロップはセットされることはないこ
とに注意する。
すなわち、一旦60″になればそれはそのま工の状態を
に入力の入力のいかんに力へわらず保持する。
に入力の入力のいかんに力へわらず保持する。
さて、再び第2の“1”のランが切れて「・・−・・・
・・・OIJがシフトレジスタSRに現われると、今度
はゲー)G、のインヒビジョンは解かれているので、ゲ
ートG12はオンとなり、フリップフロップF12はト
グルしてカウンタC□2のカウントは終る。
・・・OIJがシフトレジスタSRに現われると、今度
はゲー)G、のインヒビジョンは解かれているので、ゲ
ートG12はオンとなり、フリップフロップF12はト
グルしてカウンタC□2のカウントは終る。
このようにして、カウンタC□□には最初の1”のラン
レングス、カウンタC□2には第2の、カウンタC□3
には第3のそれらがカウントされる。
レングス、カウンタC□2には第2の、カウンタC□3
には第3のそれらがカウントされる。
同様にカウンタC81には最初の0′″のランレングス
、カウンタC82には第2の、カウンタC□3には第3
のそれらがカウントされることになる。
、カウンタC82には第2の、カウンタC□3には第3
のそれらがカウントされることになる。
このようにしてジンレングスはに次のベクトルにより表
現されることになる。
現されることになる。
このようにして、二つの特徴ベクトル、すなわち、n次
元の局所的特徴ベクトルとに次元(実際には高々8)の
ランレングスベクトルが得られる。
元の局所的特徴ベクトルとに次元(実際には高々8)の
ランレングスベクトルが得られる。
重要な事はこれらは全て第1図のFBSR4に示される
ような3Xnの領域内だけで求まるということである。
ような3Xnの領域内だけで求まるということである。
なお、ランレングスベクトルの場合も局所的特徴ベクト
ルと同様にしてヒストグラムを求めることができるが、
こ工では説明を省略した。
ルと同様にしてヒストグラムを求めることができるが、
こ工では説明を省略した。
次に、上述のようにして得られた局所的特徴ベクトルと
大域的特徴ベクトルを判別分析に都合がよいように線形
統合してm次元ベクトルに変換する手段について説明す
る。
大域的特徴ベクトルを判別分析に都合がよいように線形
統合してm次元ベクトルに変換する手段について説明す
る。
こ〜でも、局所的特徴ベクトルすなわちn次元のヒスト
グラムfを新しい特徴軸に変換することについて説明す
る。
グラムfを新しい特徴軸に変換することについて説明す
る。
この変換はにAなる行列を乗じてm次元ベクトルgを得
ることである。
ることである。
すなわちを行うことである。
これには乗算と加算とを必要とする。
今、簡単のために、n−25、■−10とすると、行列
への各係数はそれぞれ8ビツトで、a1□、a12、・
・・・・・・・・alo−25となる。
への各係数はそれぞれ8ビツトで、a1□、a12、・
・・・・・・・・alo−25となる。
この行列Aは25次元を10次元に縮約するものとする
。
。
このような特徴軸変換とその後の整合とをとる回路の一
例のブロック図を第8図に示す。
例のブロック図を第8図に示す。
第8図において、6は第6図で説明したヒストグラム累
積器であり、10は行列Aの係数設定器で、8ビットレ
ジスタ10□〜10,5oからなる。
積器であり、10は行列Aの係数設定器で、8ビットレ
ジスタ10□〜10,5oからなる。
これらは固定メモリでよい。
ヒストグラム累積器6と係数設定器100両出力は演算
器11に入力され、こ五で、乗算、加算が実行されて新
しい特徴軸でのg(例えば10次元)が演算器11から
得られる。
器11に入力され、こ五で、乗算、加算が実行されて新
しい特徴軸でのg(例えば10次元)が演算器11から
得られる。
次に、この10次元(一般にはnより少ないm次元)ベ
クトルgとマスクとの整合が実行される。
クトルgとマスクとの整合が実行される。
これはベクトルgと、マスクg*iとの距離を求めるこ
とであるが、と二では例として差の絶対値という単純な
ものをとる。
とであるが、と二では例として差の絶対値という単純な
ものをとる。
すなわち、こ\で、iはアルファベット26文字と数字
10文字の計36文字の数を示している。
10文字の計36文字の数を示している。
第8図ではマスク群12として、8ビツトレジスタを用
い、36群の各群についてカテゴリーを10種として計
360個のマスクを用意しである。
い、36群の各群についてカテゴリーを10種として計
360個のマスクを用意しである。
一方、13は演算部で、こ亙で前述した演算が行われる
。
。
そうして、これらの演算結果が4ビツトで30ケのレジ
スタ群からなるメモリ14に貯えられ、これらが並列的
に最小値検出器15によって比較され、最小値を与える
文字のカテゴリーが入力された文字の答えとして出力さ
れる。
スタ群からなるメモリ14に貯えられ、これらが並列的
に最小値検出器15によって比較され、最小値を与える
文字のカテゴリーが入力された文字の答えとして出力さ
れる。
16は制御部を示す。
なお、こ工で1問題になるのは、行列Aをいかにうまく
求めるかであるが、これは多変量解析の手法を適用する
ことにより、学習文字データから自動的に構成すること
ができる。
求めるかであるが、これは多変量解析の手法を適用する
ことにより、学習文字データから自動的に構成すること
ができる。
多変量解析そのものについては、既に知られていること
なので、これ以上の説明は省略する。
なので、これ以上の説明は省略する。
上述の整合は、ラインセンサ1(第1図)の移動毎(1
行ステップ毎)に行われたものであり、この意味でほと
んど連続的に整合結果が得られることになる。
行ステップ毎)に行われたものであり、この意味でほと
んど連続的に整合結果が得られることになる。
すなわち、上述した例では各文字バラインセンサ1が2
0回走査方向にラインセンサ1の幅だけ動いて1文字が
走査されたことになるから、各回毎に第8図の最小値検
出器15から答が出される。
0回走査方向にラインセンサ1の幅だけ動いて1文字が
走査されたことになるから、各回毎に第8図の最小値検
出器15から答が出される。
この状態を文字とラインセンサ1および答との関係で示
すと第9図のようになる。
すと第9図のようになる。
第9図において、ラインセンサ1の幅で各文字rAJ
rBJを切ったのを点線で示す。
rBJを切ったのを点線で示す。
各文字の走査の始めのうちは何の文字だかわからず、答
は?であるが、走査が進むにつれて答がはっきりしrA
JまたはrBJの文字であることが判別される。
は?であるが、走査が進むにつれて答がはっきりしrA
JまたはrBJの文字であることが判別される。
そして、この答は連続的であり、ラインセンサ1の動き
につれて出るものであって、従来の文字の切り出しによ
るもののように、1文字分に対して1つの答というので
はなく、ラインセンサ1の幅で1文字分の幅を割った数
だけの答が出ることになり、すべて連続的に実行される
。
につれて出るものであって、従来の文字の切り出しによ
るもののように、1文字分に対して1つの答というので
はなく、ラインセンサ1の幅で1文字分の幅を割った数
だけの答が出ることになり、すべて連続的に実行される
。
なお、上記実施例では、パターン例として文字を対象に
したが、この発明はこれに限定されるものでなく、この
発明で云う文字とは広義の意味で用いたものであって他
のパターンも含むものである。
したが、この発明はこれに限定されるものでなく、この
発明で云う文字とは広義の意味で用いたものであって他
のパターンも含むものである。
以上詳細に説明したように、この発明は一定の読取枠で
文字列入力を連続的に走査し、これから局所的特徴また
は大域的な特徴を作り、その出現頻度からn次元特徴ベ
クトルを作り、これを次いで線形統合してm次元ベクト
ルを作り、このm次元ベクトルとあらかじめカテゴリー
毎に構成されたマスクとを連続的に整合をとって文字を
読取るようにしたので、従来のように文字の切り出しが
全く不要となり、しかも連続して文字読出しができる利
点を有する。
文字列入力を連続的に走査し、これから局所的特徴また
は大域的な特徴を作り、その出現頻度からn次元特徴ベ
クトルを作り、これを次いで線形統合してm次元ベクト
ルを作り、このm次元ベクトルとあらかじめカテゴリー
毎に構成されたマスクとを連続的に整合をとって文字を
読取るようにしたので、従来のように文字の切り出しが
全く不要となり、しかも連続して文字読出しができる利
点を有する。
第1図はこの発明の詳細な説明するための文字列とライ
ンセンサとの関係を示す図、第2図は同じくラインセン
サとBSR,FBSRとの関係を示す図、第3図は局所
的特徴を見出すために用いられるマスクのパターン例を
示す図、第4図は第2図のFBSRの第3図のマスクと
の整合をとる回路例を示す図、第5図はヒストグラムレ
ジスタの一例を示す図、第6図はヒストグラム累積器の
一例を示す図、第7図はランレングスを測定する回路の
一例を示す図、第8図は特徴軸変換とその後の整合をと
る回路の一例を示すブロック図、第9図は文字とライン
センサおよび答との関係を示す説明図である。 図中、1はラインセンサ、2は2値化回路、3はB5R
14はFBSR15はヒストグラムレジスタ、6はヒス
トグラム累積器、9はカウンタ、10は係数設定器、1
1は演算器、12はマスク群、13は演算部、14はメ
モリ、15は最小値検出器、16は制御部である。
ンセンサとの関係を示す図、第2図は同じくラインセン
サとBSR,FBSRとの関係を示す図、第3図は局所
的特徴を見出すために用いられるマスクのパターン例を
示す図、第4図は第2図のFBSRの第3図のマスクと
の整合をとる回路例を示す図、第5図はヒストグラムレ
ジスタの一例を示す図、第6図はヒストグラム累積器の
一例を示す図、第7図はランレングスを測定する回路の
一例を示す図、第8図は特徴軸変換とその後の整合をと
る回路の一例を示すブロック図、第9図は文字とライン
センサおよび答との関係を示す説明図である。 図中、1はラインセンサ、2は2値化回路、3はB5R
14はFBSR15はヒストグラムレジスタ、6はヒス
トグラム累積器、9はカウンタ、10は係数設定器、1
1は演算器、12はマスク群、13は演算部、14はメ
モリ、15は最小値検出器、16は制御部である。
Claims (1)
- 1 文字列入力を一定の読取枠で連続的に走査し、前記
読取枠内における局所的または行方向に移動していく文
字列方向における大域的な特徴の出現頻度からn次元特
徴ベクトルを作り、このn次元特徴ベクトルを判別分析
の手法により線形統合してm次元ベクトルを作り、一方
、あらかじめ文字カテゴリー毎に構成されたマスクを用
意しておき、このマスクと前記m次元ベクトルとを連続
的に整合をとることにより文字の切り出し無しに文字を
認識することを特徴とする文字読取方式。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP53082512A JPS5847064B2 (ja) | 1978-07-08 | 1978-07-08 | 文字読取方式 |
| US06/054,704 US4288779A (en) | 1978-07-08 | 1979-07-05 | Method and apparatus for character reading |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP53082512A JPS5847064B2 (ja) | 1978-07-08 | 1978-07-08 | 文字読取方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5510618A JPS5510618A (en) | 1980-01-25 |
| JPS5847064B2 true JPS5847064B2 (ja) | 1983-10-20 |
Family
ID=13776568
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP53082512A Expired JPS5847064B2 (ja) | 1978-07-08 | 1978-07-08 | 文字読取方式 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US4288779A (ja) |
| JP (1) | JPS5847064B2 (ja) |
Families Citing this family (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4395699A (en) * | 1979-09-10 | 1983-07-26 | Environmental Research Institute Of Michigan | Method and apparatus for pattern recognition and detection |
| JPS56110191A (en) * | 1980-02-05 | 1981-09-01 | Tokyo Keiki Co Ltd | Type character recognizing device |
| US4490848A (en) * | 1982-03-31 | 1984-12-25 | General Electric Company | Method and apparatus for sorting corner points in a visual image processing system |
| US4493105A (en) * | 1982-03-31 | 1985-01-08 | General Electric Company | Method and apparatus for visual image processing |
| DE3278861D1 (en) * | 1982-05-27 | 1988-09-08 | I2S | Automatic container testing process and device comparing transparency |
| GB2152658A (en) * | 1984-01-09 | 1985-08-07 | Philips Electronic Associated | Object sorting system |
| US5177795A (en) * | 1985-11-05 | 1993-01-05 | Canon Kabushiki Kaisha | Image processing apparatus |
| US4791675A (en) * | 1985-12-31 | 1988-12-13 | Schlumberger Systems And Services, Inc. | VSP Connectivity pattern recognition system |
| US4903313A (en) * | 1986-07-03 | 1990-02-20 | Ricoh Company, Ltd. | Character recognition method |
| US4760607A (en) * | 1986-07-31 | 1988-07-26 | Machine Vision International Corporation | Apparatus and method for implementing transformations in grayscale image processing |
| US4837842A (en) * | 1986-09-19 | 1989-06-06 | Holt Arthur W | Character and pattern recognition machine and method |
| US5097517A (en) * | 1987-03-17 | 1992-03-17 | Holt Arthur W | Method and apparatus for processing bank checks, drafts and like financial documents |
| EP0363828B1 (en) * | 1988-10-11 | 1999-01-07 | Kabushiki Kaisha Ouyo Keisoku Kenkyusho | Method and apparatus for adaptive learning type general purpose image measurement and recognition |
| US5101445A (en) * | 1989-03-16 | 1992-03-31 | Unisys Corporation | Method and apparatus for filtering digital data by concatenating preprocessed overlapping groups of the data |
| EP0498978A1 (en) * | 1991-02-13 | 1992-08-19 | International Business Machines Corporation | Mechanical recognition of characters in cursive script |
| US5410613A (en) * | 1991-07-17 | 1995-04-25 | Matsushita Electric Industrial Co., Ltd. | Pattern recognizing apparatus |
| JP3361124B2 (ja) * | 1991-07-30 | 2003-01-07 | ゼロックス・コーポレーション | テキストを含む2次元画像上での画像処理方法と画像処理装置 |
| US5960112A (en) * | 1996-11-26 | 1999-09-28 | Wen-Hsing Hsu | Method and device for the automatic matching of seal prints |
| US7392287B2 (en) | 2001-03-27 | 2008-06-24 | Hemisphere Ii Investment Lp | Method and apparatus for sharing information using a handheld device |
| JP6355908B2 (ja) * | 2013-09-30 | 2018-07-11 | 国立大学法人広島大学 | シンボル認識装置および車両用標識認識装置 |
| CN107102998A (zh) | 2016-02-22 | 2017-08-29 | 阿里巴巴集团控股有限公司 | 一种字符串距离计算方法和装置 |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3165718A (en) * | 1961-12-04 | 1965-01-12 | Ibm | Speciment identification apparatus |
| US3297993A (en) * | 1963-12-19 | 1967-01-10 | Ibm | Apparatus for generating information regarding the spatial distribution of a function |
| US3347981A (en) * | 1964-03-18 | 1967-10-17 | Polaroid Corp | Method for transmitting digital data in connection with document reproduction system |
| US3346845A (en) * | 1964-12-11 | 1967-10-10 | Bunker Ramo | Character recognition method and apparatus |
| FR1504564A (fr) * | 1965-08-25 | 1967-12-08 | Nippon Electric Co | Dispositif automatique d'identification de caractères |
| DE1774314B1 (de) * | 1968-05-22 | 1972-03-23 | Standard Elek K Lorenz Ag | Einrichtung zur maschinellen zeichenerkennung |
| US3845466A (en) * | 1970-11-18 | 1974-10-29 | California Inst Of Techn | System and method for character recognition |
| US3723970A (en) * | 1971-01-04 | 1973-03-27 | Scan Optics Inc | Optical character recognition system |
| US3873972A (en) * | 1971-11-01 | 1975-03-25 | Theodore H Levine | Analytic character recognition system |
| US4104616A (en) * | 1976-01-28 | 1978-08-01 | Sumitomo Electric Industries, Ltd. | Hand operated optical character recognition system |
| IT1055430B (it) * | 1976-02-23 | 1981-12-21 | Tasco Spa | Procedimento e apparecchiatura per il riconoscimento in tempo reale di immagini |
-
1978
- 1978-07-08 JP JP53082512A patent/JPS5847064B2/ja not_active Expired
-
1979
- 1979-07-05 US US06/054,704 patent/US4288779A/en not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| US4288779A (en) | 1981-09-08 |
| JPS5510618A (en) | 1980-01-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS5847064B2 (ja) | 文字読取方式 | |
| US4087788A (en) | Data compression system | |
| US4910787A (en) | Discriminator between handwritten and machine-printed characters | |
| JPS6357831B2 (ja) | ||
| US4190820A (en) | Signal train verification system using landmarks | |
| JPH0215106B2 (ja) | ||
| US4086567A (en) | Handwriting verification system using landmarks | |
| EP0524797B1 (en) | Image processing method and apparatus | |
| JPH06282686A (ja) | 文字認識方法 | |
| JPS62254282A (ja) | 重畳するパタ−ンを分離する方法及び装置 | |
| JPH0458073B2 (ja) | ||
| JP2801602B2 (ja) | 単語認識装置 | |
| JP2590099B2 (ja) | 文字読取方式 | |
| JP2580976B2 (ja) | 文字切出し装置 | |
| JP3387681B2 (ja) | 特徴抽出処理装置 | |
| JPH0432433B2 (ja) | ||
| JPS6111886A (ja) | 文字認識方式 | |
| JPH0259504B2 (ja) | ||
| JPS596418B2 (ja) | 文字読取方式 | |
| JPH04256194A (ja) | 文字認識処理方式 | |
| JPS5931105B2 (ja) | 文字読取装置 | |
| JPS58163081A (ja) | オンライン手書き文字認識方式 | |
| JPS60168283A (ja) | 文字認識装置 | |
| JPH0137790B2 (ja) | ||
| JPS6022793B2 (ja) | 文字識別装置 |