JPS5848183A

JPS5848183A - 文字認識システム

Info

Publication number: JPS5848183A
Application number: JP57140476A
Authority: JP
Inventors: ペペ・サイ; ジエイムズ・ジイング−テイング・ヤング
Original assignee: Burroughs Corp
Current assignee: Unisys Corp
Priority date: 1981-09-11
Filing date: 1982-08-11
Publication date: 1983-03-22
Also published as: JPH0440749B2; EP0079251A2; DE3280099D1; EP0079251B1; EP0079251A3

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】この発明は、］１処衰機器などとともに用いるための文
字認識システムに関する。そ、れは多くのフォーマット
の印刷文字や自由な手書き文字に使用することができる
。それは、幾何学的技術と呼ばれていて、ディジタルの
形をした骨格およびストローク幅データを利用する文字
コード認識技術を採用しており、それらのデー゛・夕は
識別を可能にするため標準文字コードパターンのデータ
と比較される。ＩＩ準文字コードと比較して最初に識別
されない一文字コードは、さらに処理されかつ特別の文
字を識別するためさらに試験が行なわれる。

種々のフォーマットの印刷文字および小切手の金額のよ
うな手書き文字を認識するための文字処理装置に対する
先行技術のシステム紘、統計学上の技術を利用するシス
テムを含む、そのようなシステムにおける困難の１つは
、元の統計学上の分析に含まれていない文字のａｍを判
断するためにシステムを適合させることが困難であるこ
とである。この発明に係るシステムは、索引テーブルを
形成しているメモリにおいて所望の変換が行なわれるよ
うにすることによって、この困難を非常（簡単に克服し
ている。これは、先行技術には容易　　′に利用できな
い方法でシステムの選択度および感度を変更することを
可能にしている。

成る機械印刷文字をＩ！戴するため（サブスペース技術
がうま〈実施されており、そこでは文字が占める全体の
スペース・のうちの一部分のみが原型クラスと比較する
ために使用されるので「サブスペース」の語句が与えら
れている。その技術の単純さを考慮すると、この技術を
他の機械印刷文字の認識および自由な手書き文字の認識
にまで拡張することを望むのは当然である。しかし不幸
にも、印１文字の成る字体および自由な手書き文字と組
合わされた変形にサブスペース技術が適用できるかどう
かは以下、に述べる理由によりわからない。

まず、サブスペース技術は、特徴抽出が着手される前に
区分され０分離され、あるいは囲まれることのできる特
定の文字を使用することに強く依存していることである
。さらに、文字は一定のピッチで形成されなければなら
ないことである。これらの特性は、゛すべでの印刷文字
において見い出されるとは限らないし、かっけとんどの
場合小切手上の自由に手書きされた金額においては起こ
らない。それらの不足は膳要な同題を提供し、事実、そ
れらはサブスペース技術を手書き文字および成る種の印
刷文字に適用する試みの失敗の主な原因である。

サブスペース技術は、一般的に、各文字を特別の方法で
３×３あるいは５×５に等分割されたセ９− ルのように分割することに依存している。各セルにおけ
る平均的な灰色の度合は、９つのセルに対して＆ｔ９つ
の特徴ベクトルをおよび２５のセルに対しては２５の特
徴ベクトルを特徴とする特徴として働く、（文字３のよ
うな）文字の各クラスにおけるｉ徴ベクトルの配分は、
自己相関によって、すなわち１つのランダム表敬の場合
における平均および標準偏差に相当する二次のモデルに
よ？て作られる。成る種の機械印刷文字に対しては、文
字ストロークの位置は１つの文字フォントから鉋の文字
フォントま！はあまり表化しないので、このモデリング
は適切である。第２Ａ図は、２５の背景に対するクラス
３（ここでは各０−９の数字はクラスとして表示されて
いる）の自由な手書き文字の見本を示す、これらの例に
おいて線、ストロークは５×５セルの成る領域から他の
領域へおもいきって移動しているのが見られ、これは自
由な手書き文字クラスの特徴ベクトルの配分の自己相関
モデリングが不適当であることを説明している。

１０− この発明において採用されている幾何―的技術は、特徴
抽出より前に区分することを必要としないので、サブス
ペース技術に伴う目間を避けている。文字構造はデータ
表現ノイズコード（すなわち、文字コードとしては認識
されないコード）のために容易に変更され、かつ不所望
の構造は知られた文字コードの表現を提供するためその
ようなデータから容易に除去される。（第１０Ａ図にお
けるクラス４．８および９の間におけるよう−）クラス
のｌの混同は、文字イメージの最初の分析から抽出され
た特徴を用いることにより、それらの差を強調する特別
な試験特徴を使用することにより解決される。

様々なフォーマットの印刷された英数字の文字。

英数字ではない他のシンボルを表現している文字および
自由な手書き文字のような文字を識別するのに文書処理
システムなどとともに用いる文字認識システムが誇示、
されてい゛る。システムμ、骨格の形およびストローク
幅特性に関する詳輻のような文字の選択された幾何学的
な特徴を表わしている信号の形でシステムの外部から受
けられたデータを処理するための手段を含む。システム
は、前記信号から特徴および枝分類を表わしている成る
データを抽出しかつ文字を表わしている文字コードを作
り出す手段を含む。システムは、−知の文字コーｔ’に
：ＩＩ着することを表わしているデータを知られた文字
コードを表わしているデータと比較するための手段を含
む、もし比較の結果とし工肯定的な識別がなされれば、
処ｌＪ！装置は謹則された文字を示す出力信号を提供す
る。

もし比較の結果として識別がなされなければ、システム
は未知の文字の特徴を表わしているデータをさらに次の
処理のために識別されなかったデータとして送る。付加
的な処理手段が、前記識別されなかったデータに応答し
て直接的に識別を試みるために、あるいはそれの分析１
行ないかつ前記識別されなかったデータおよび前記分析
からの情報を組み入れている修正されたデータを与える
ために結合されている。後者の場合、肯定的な識別を求
めて、識別されなかったデータと知られたデータとを比
較するため、修正されたデータはその後前記手段に送ら
れる。

付加的な処理手段は、同一の文字コードを作るはとに充
分に似ている異なった文字を識別するためストローク幅
に関連がある分析を含む細かな特徴試験を与えるための
「混同コード」処Ｗ′装置を含む。もし試験が成功すれ
ば、混同コード処Ｉｌ装置は文字を識別している出力を
与え、もし成功しなければ、処Ｗ装置は文字コードを入
閣の解釈に委ねる。

付加的な処１ｌｉｉｉ置はまた、特徴を表わしている前
記データからしばしば連鎖している不所望の要素あるい
はノイズを除去するための「ノイズ処理装置」を含む。

ノイズ処理装置はその後、肯定的な識別を求めての比較
のために前記手段に不所望のＩＩＩを表わしているさほ
ど重要でないデータである修正されたデータを提供する
。

前記のものにおいては、簡単のために、処理は一連の様
式で起こるものとして述べられている。

記録ごとの多くの文書の読取りを含む実施例にお１３− いてデータが作られるスピードのために、好ましい実施
例における処］ｌは実際上は平行した先翻り制御モード
で行なわれるであろう。

さて、この発明が関連しているシステムの全体的な説明
のために第１図のブロック図に戻る。このシステムによ
れば、イメージデータは１０で示される読取りおよび予
備的な処理のための装置からバス１２に与えられる。こ
のイメージデータは、−ａＯのような書類が矢印Ａの方
向に書類輸送トラックＴを通って移動するときに書類を
スキャンすることから抽出される。典型的な書類輸送シ
ステムは、［サーボ駆動の書類供Ｉａ＠瞳のための制御
装置（Ｃ０ｎｔｒＯＩ　Ｉｅｒ　　ｆｏｒ　　ａ　　Ｓ
　ｅｒＶ（Ｉ　　Ｄ　ｒｌｖａｎ　　ｏｏｃｕｓｉｅｎ
ｔ　　Ｆｅｅｄ＠ｒ　）　Ｊと■し７％　ＯＪＬ／　Ｆ
・エイ・フエイシグ（）ｌａｒｏｌｄ　　Ａ、　　Ｆａ
ｉｌ（１）の名義１１９８０年６８３０日に出願された
ともに出願中のアメリカ合衆国特許出願において示され
ており、そしてその出願はこの発明と同じ■り受は人に
譲渡されており参考としてここに取入れられている。

１４− バス１２上のイメージデータは、ストローク幅を表わし
ているディジタル信号とともに各文字の裸の骨格を表わ
しているディジタル信号の形でのデータを提供する輻纏
器およびストローク幅分析器１４によγて分析される０
分析器１４からのデータはバス１６によって特徴抽出器
または枝分類ｓｉａに供給され、その特徴抽出器１８は
荒い特徴あるいは位相数学的特徴を抽出しかつ読取器お
よび処理装置によって検出された各文字に対す、る位相
数学的特徴に関する情報を含んでいる文字コードあるい
は構造コードを作り出す１文字コードあるいは構造コー
ドを、文字のすべての関連した枝特徴およびそれの関連
した節の連鎖（あるいは連続したリンケージ）のように
定義することができる。好ましい場合においては、特徴
抽出器１８は、枝の数、ループの数、枝のタイプなどの
ような位相数学的特徴を抽出するた゛めかつ文字コード
を発生させるのに必要な他の動作を゛与えるため、ハー
ドロジックあるいはＴＴＬ行列が使用できるけれども、
バロース８１９００あるいはそれより大型のコンピュー
タを使用することｋより実施できるであろう。

文字コードはバス２０によって索引テーブル２２に与え
られ、索引テーブル２２はｆＩＡ！！！構造テーブル（
あるいはテンプレート）４０におけるデータとの比較を
与え、かつそこに（１）受取った文字コードと原型テー
ブルにおけるデータ（あるいはテンプレート）との直接
的な整合、　　（２）　ｒｌｌ同したクラス」あるいは
（３）　「ノイズコード」があるかどうかに従って受取
った情報を分類する。

（１）データの直接的な整合、（２）混同したコードあ
るいはり、ラスおよび（３）ノイズコードに関する記載
は以下に行なう。索引テーブル２２は、好ましくはＴＴ
Ｌ八−ドワイヤロジックにより形成されるであろう、　
ｊｌｌｌｌｌｌ造テーブル４０は、好ましくはＴＴＬ行
列により形成される。特徴抽出器１Ｂは、好ましい場合
においてはＴＴＬ八−ドワイヤロジックを使用すること
により形ｊｌ！される。

もしく１）直接的な整合があれば、ｌｌＩ別された文字
を示す信号は、識別された文字の直接的な読出しとして
用いるためバス２４およびバス２６によりて直接的にバ
ス２８に送られる。この情報は、マイクロプロセッサお
よびプリンタを含むであろう利用−置に与えられるであ
ろう。

文字コードが１つの文字あるいはデータのクラスよりも
むしろ１以上の文字あるいはデータのクラスを表わすこ
とをもしも索引テーブルが示すならば、＜ｉ＞ｖｉ同し
たコードあるい−は混同したクラスと分類される状態が
示される。特別な試験特徴を包含する手順がその混同を
解決するために要求される。適当な試論特徴は混同コー
ド処ｓｉ装置３２として示される装置によって与えられ
、その処理装−は索引テーブル２２およびバス２４から
のＩ！同コード信号をバス３０によって受ける。処理装
置３２はバス２８に識別信号を与える。識別が完了して
いない場合は、その装置は識別されたデータをバス３３
によって索引テーブルに発送する。Ｉｌ同コード処ｍｓ
装は、好ましくはインテル８０３５のようなマイクロプ
ロセッサを使用して１７− 形成されるであろう。

もし特徴抽出−１８からの文字コードがコードテーブル
２２の中にないならば、それは前述した（１）あるいは
（２）のいずれかに属するものとしては識別されないこ
とを意味し、我々はそれを上記クラス（３）に対応して
いるノイズフードと呼ぶ、その場合、文字コードはバス
２４および３４を経由してノイズ処理装置３６に処理の
ために送られ、そしてそれから索引テーブルにおける比
較のためにバス３７に送られる。ノイズ処３！＠置は、
好ましくはインテル８０３５のようなマイクロプロセッ
サを用いることにより形成さるであろう。

第ｉ＊に示されているこの発明の１つの局面は、文字原
型が付加されたり消去されたりする容重さである。ブロ
ック４０は、バス３８によって索引テーブル２２からの
アクセスに従って付加あるいは消去によって変更される
テーブルの形での原型構造情報源である。このことは原
型構造テーブルがＴＴＬ行列あるいは他のメモリ装置へ
の命令の１８− −単な加算により、あるいはそのようなメモリ装置から
の命令の減算によりいかにして修正されるかを示す。

読取器および処理装置１０および細棒器およびストロー
ク幅分析１１１４は、この発明の実施において採用され
るべき信号源としてここに参照されている他の出願にお
いて詳報に開示されている。

読取器および処ｌｌ装置の例は、この出願と同じ譲り受
は人に“譲渡されている「適用できるＯＣＲフＤントＺ
ントシスＴム（Ａｄａｐｔｉｖｅ　　ＯＣＲＦｒａｎｔ
−ｅｎｄ　　Ｓｙｓｔｅｍ　）　Ｊと題しビープ・サイ
（Ｐｏｐｅ　　Ｓｉｙ＞　、　Ｏバート・プｏ　ス（Ｒ
ｏｂｅｒｔＢｌｏｓｓ）およびゲアリイ・ビイ・コーペ
ンハーバー（Ｑ　ａｒｙ　　Ｂ　、　　Ｃｏｐｅｎｈａ
ｖｅｒ　）の名義で１９７９年５月４日に出願されたと
もに係属中のアメリカ合衆国特許出願番号３５．９９−
３号（現在放棄されている）に示されている。読取器お
よび処理装置の他の例は、［ピクセル修正−！回路（ｐ
ｉｘｅｌ　　Ｑｏｒｒｅｃｔｌｏｎ　　ｌ−ｏｇｉｃ　
　Ｑｌｒｃｕｌｔ）Ｊと題しシミー・ネイル（Ｊ　１ｓ
ｓｌｅ　　Ｎ　５ｉｌｌ）およ（ｊテ−ヒｙ　Ｆ　−サ
トン（［）ａｖｉｄ　　５ｕｔｔｏｎ　）の名義で出願
されたともに係属中のアメリカ合衆国特許出願中に見い
出される。細線器およびストローク幅分析器の例はとも
に係属中の特許出願中に示されている。特徴抽出−と組
み合わされ−たｓｅａおよびストローク幅分析器の例は
、Ｅ文字認識のための前処理および特徴抽出システム（
ｐ　ｒｅｐｒｏｃｅｓｓｌｎｃ＋　　ａｎｄ　　Ｆ　ｅ
ａｔｕｒａ　　Ｅ　ｘｔｒａｃｔｉｏｎ　　Ｓ　ｙｓｔ
ｅａｆｏｒ　　Ｃｈａｒａｃｔｅｒ　　Ｒｅｃｏｇｎｉ
ｔｌｏｎ）　Ｊと晒しチョーチｉｒ　’７−２−　（Ｑ
ｈａｕｃｈａｎｇ　　Ｓｕ　）の名義で１９７９年７月
２４日に発行されこの出願と同じ譲り受は人に譲渡され
たアメリカ合衆国特許番号４．１６２．４８２＠におい
て示されている。上記の出願および特許はここに参考と
して組み入れられている。

この発明の進んだ議論に対するよりよい基礎の提供のた
めに、細線器およびストローク幅分析器の簡単な説明を
行なう。細線ａおよびストローク幅分析！１１４に採用
されているアルゴリズムは、結合性を破壊することのな
い除去により、存在している境界における点を除去する
ことによって層ずつ文字の境界を浸蝕する。この手順は
もはや点が除去できないようになるまで連続的に与えら
れる°。残りの点は文字の骨格を形成し、それは１４に
よって保有されているストローク幅情報とともに完全に
文字を描写する。骨格およびストローク幅が完全に文字
を記述するという主張は、各骨格点にその点におけるス
トローク幅と等しい直径を有する円盤を描くことにより
元の文字は非常に近似したもので再構成され得るという
事実により確証される。新しい骨格ｓｕｉは、ケース（
１）の例において、文字の直接的な識別に使用される文
字の基礎構造を提唱する。上記ケース（２）および（３
）における混同を解決するのに必要とされる幾何学的特
徴の抽出およびさらに進んだ分析を容易に、するために
、またその骨格の使用がなされてもよい。

先に示したように、骨格およびその関連したストローク
幅は任意の線状物の元の形状を完全に定義することが知
られている。この発明は、以下の２１− ような特性を有する文字１！戴システムにおいてこの事
実を使用している。

１、　特徴抽出に先立つて文字の区分を必要としない。

２、　文字銀型表現が容易に付加されたり消去されたり
するのを可能にしている。

３、　第ルベルの認識および荒い位相数学的かつ幾何学
的特徴の抽出が容易になされるの！可能にしており、そ
こでは特徴は次のものを含む。

ａ、　枝の数す、　ループの数Ｃ１枝のタイプｄ、　枝の結合性４、　元の分解能のレベルに至るまでの混同の分析に用
いるため報かい特徴の迅速な抽出を可能にしており、次
のものを含む。

ａ、　所定の骨格点におけるストローク幅す、　校内の
あるいは枝閣のストローク幅Ｃ１第３Δ図に示すような
直線の接合点に角ＣＲＳ＊或されておりかつ第３Ｂ図に
示すよう２２− な直線の窪んだ側に窪みＣｖが生じている角および窪み
のような形状特徴骨格表現は、文字構造の記述を害鳥にする。文字を表示
する骨格における点には３つのタイプがある。それは、
（１）端点あるいは１つ−の鱗り合うものを有する点、
（２）枝点あるいは正確に２つの隣り合うものを有する
点および（３）接合点あるいは３以上の隣り合うものを
有する点である。

第３Ｃ図、３０図および３Ｅｌを注目して、鷺こにはそ
れぞれ端点ＥＰ、枝点８Ｐおよび接合点ＪＰが表わされ
ている。これらのｒ点」の各々は、３点×３点の窓にお
いて中心に位置した点と関連づけられている骨格点を調
べることにより決定される。もし中心点が１つだけの隣
り合う点を有しているならば（第３Ｃ図）、中心点は端
点である。

もし中心点が２つの隣り合う一点を有しているならば（
第３Ｄ図）、−それは枝点である。もし中心点が３＆Ｘ
上の隣り合う点を有しているならば（第３Ｅ１ｍ）　、
それは接合点である。端点および接合点は、節点とも呼
ばれる一臨界点として注目され得る。

臨界点あるいは節点は、この発明の実施においては、特
定の順序で番号がつけられる。もちろん、節は種々の任
意の方法で番号がつけられるけれどもこの発明の目的の
ためには１つの好ましい方法しかないということが紹厳
される。その方法は、第１の臨界点あるいは節を最上部
と、かつ第２の臨界点を最下部と常に名づける樅の特徴
と一致する。横の特徴についても、第１の節は常に左の
節であり第２の節は常に右の節である。この規約は、同
一の符号が与えられた群がった節あるいは接続された節
について、第１の臨界点は最上部あるいは左側にあか第
２の臨界点は最下部あるいは右側にあるというように要
約することがきる。この発明の応用は＃１９ａｉに示さ
れている。

さらに、端点および／または接合点は、節１゜節２など
と呼ばれる節の組を定義する１節１から始まり節２に終
わる連続的な枝点のリストは、ここでは節１は節２に一
致ル得るが、枝を定義する。

枝は、それゆえ、１つの臨界点（節）から始まり他の（
あるいは同一の）臨界点（節）に終わる一連の枝点によ
、−）で形成されると言うことができる。

枝の収集は、枝の組を定義する０節の組および／または
枝の組は、文字の構造を定義するのに用いられる。第２
Ｂ図において、−例として、（Ｎｌ。

Ｎ２）は節の組を定義し、（８１，８２）は枝の組を定
義しかつ（Ｎ１．Ｎ２）（８１，８２）は文字「９」の
構造を定義する。第９図に示すように、文字「１」は節
の組Ｎ１．Ｎ２によりて定義される。

この発明を使用する実施に従った文字ａｍにおいては、
各校は、纏１曲線あるいはループといった分類のうちの
１つとの適合、を確立するため、特徴抽出器１８・によ
って荒い位相数学的方法で分類される。この分類を確立
するためにａつの測定が用いられる。それは、抑揚率（
ＤＭ）、最小方形誤差（Ｓ）および校長（ＭＤ）である
。抑揚率は、枝の２つの節を連結している直線の長さの
２つの節を連結している枝の長さに対する比重として定
義される。この定義によって、直線の抑揚率は１であり
、閉ループのそれは０でありカーブのそれ２５− は０と１の−にある。第４Ａ１１．第４Ｂ図および第４
Ｃｌｌ＆ｔ、そへでれ直線Ｌ１のカーブＬ２に対する関
係（ＤＭ−Ｌｌ／Ｌ２＜ゝ１）、長さＯの直線のループ
ＬＰに対する関係（ＤＭ−０）および轄Ｌ１の纏Ｌ３に
対する関係（ＤＭ−Ｌ１／Ｌ３−１）として抑揚率（Ｄ
Ｍ）を示す、第５図は、ＤＭ、８部よびＭｊ）−のディ
ジタ寿表現の形のデータを用いていかにしてこの荒い分
類がなされやかを示すフローチャートである。

第５図におけるパラメータｉＳ以下のように定義される
。

ＮＳ−開始節符号ＮＴ−終了節符号ＤＭ−抑揚率Ｓ　−最小方形誤差ＭＯ−校長Ｔ　Ｈ１−Ｔ　Ｈ４−Ｌきい値枝は、さらに以下の組あるいは特徴に分類することがで
き、そして付加的なおよび／または麹の粗あるいは特徴
が使用され、なおかつそれはこの２６− 発明のＩｉａ内であるということが認識されるであろう
。

纏−’（Ｈ，Ｖ）曲線−（Ｃ，Ｄ、Ｓ、Ｚ）ループ−（ＯＡ、０８．Ｏ）これらの例は第６Ａｌｌに示されている１文字構造、す
なわちその節を通じての文字の枝の粘合性は、骨格ａｍ
において明白になる。第ルベル諺■における構遁の比較
の目的荀ために、文字コードが定＠される。文字コード
を作るために、各校は第６ＡＩＩに示されている粗ある
いは特徴の１つに割当てられる。

第６Ａ図の特徴は、数字のクラスを表現するた゛めに選
定された。特徴の各々は、枝における許容できる歪みの
同等のクラスを定義する。たとえ−ば、第６Ｂ図に示さ
れている枝は、第６Ａ図における「輪画的１１１１Ｊに
向かい合っている０列において示されるようなり形状の
カーブとしてすべて分類されるべきである。興味ある文
字は、この発明の精神から離れることなく、示された。

数字だけでなくＡＳＣＩＩコードにおいて表わされてい
る文字のような多くの傭のタイプの文字を含むことがで
きるということが認識されるであろう。

の　　　　　　　　　　ｅａｂｅｒａｈｌ　　　　　　
　ｒａｄ＠１１１１１１ａ４’６％ｕｒＮ属１１（ｄｅ
ｇｒｅｅ　　ｏｆ　　ｂｅｌｏｎｇｌｎｇｎｅｓｓ　）
　Ｊは、輪９曲輪またはループの各特徴に対して定−さ
れる、纏特徴の関連度は、その傾斜角によって決定され
る。この目的のため、φきい値角θ丁が選定され、そし
てそれは水平および垂直の纏、の閤の境界を確立する。

ここで、θは、纏の水平に対する角度である。纏に対す
る関連度は、したがって次のように定義される。

ｒ　ｖ−＜　ｒｏｌ−１０Ｔ　＋）／（９０−１８，１
）：ｌθ１２１θマ１！直纏一〇五その他ｆ　　Ｈ−（ｌ　０丁　１−１０１）／１θＴ１：１θ
１≦１θＴ１水平輪一〇二その１１′ ４Ｆ）１ＬＬ曲輪特ＩＩＩ　（Ｃ，Ｄ、Ｓ、Ｚ）のうちの１つの関連
度は、曲輪枝を３つの等しい区分に分割することによっ
て決定され、ここで各曲線特徴に対して各区分上におい
て好ましい方向が定−される。曲線特徴の関連度は、そ
の俵各区分において点の数に標準化された好ましい方向
を満足する枝点の数を数えることにより得られる。第７
図は、理想化されたＣ曲線に対する好ましい方向を示す
。

曲線特徴のより詳細な分析は、第１６図、第１７図、第
１８図および第１９図の議論から明らかであろう、第１
６図は、使用されている区分化の方法を示すために手当
たり次第に選ばれた角型的な０曲線を示す１区分は、次
に示す索引（第１６図に示されている）によって定義さ
れるようにばば等しく分割されている。

区分５−ＥＧＩ：１からＭＤ３区分５ＥＧ２：　（ＭＤ３＋１＞から（ＭＤ３＋ＭＤＭ
）区分５ＥＧ３：　（ＭＤ３＋ＭＤＭ＋１）から（ＭＯ−
１）ここでＭＤ３−　（ＭＤ−１＞／３　：ＭＤＭ−（Ｍ２
９− Ｄ−１）　−２ＭＤ３　：およびＭＤは枝の良さである
。２つのベクトルＩＸＤおよびＩＹＤは次のように定義
される。

ＩＸＤ（１）−ＩＸ（１＋１）−１Ｘ（１）ＩＹＤ（１
）　−１Ｙ（１＋１）−１Ｙ（１）：１−１．２．−、
ＭＤ−１ここでＩＸ８よびＩＹはＸおよびＹの枝座標を表わす、
ＩＸＤＧ−８各する＋１および一１項は、それでれ枝を
横切っての右および左の動きを意味する。

ＩＹＤにおける＋１および一１項は、それでれ枝を横切
っての下および上の−きを意味する。

２つの計数ベクトルＩＸＲおよびＩＸＴがこのシステム
に採用されている。ベクトルＩＸＲは、各区分における
上下左右の動きの数の計数を包含する。ベクトルＩＸＴ
＆ｔ、各区分における記入事項の数の計数を包含する。

各特徴テンプレートは、各区分において好ましい方向に
お番する０でない記入事項を有するベクトルによって定
義される。第１７＠および第１８図は計数ベクトルＩＸ
Ｒ，ＩＸＴを示し、第１９図はテンプレートベクトルの
３０− 例を示す、−例として、第１９図の最初の行におけるＤ
テンプレートを考えてみると、それは区分１．２および
３における右、下および左の好ましい−きにそれぞれ対
応している索引１．９および６におけるＯでない旧人事
項を有する。ＩＸＲによって与えられる枝の好ましい動
きとそのテンプレートＸによって定義される各特徴の好
ましい動きとの相関関係は、次に示すＲｘで与えられる
。

１ｕｌ枝は、Ｒｘを最大にするＸと組合わされた特徴に劇当て
られ、ここでＸ−テンプレートからのＯｏＣ・・・であ
る。

ルー　　　のループ特徴の関連度は、枝の最下部ＹＴＯＰ％および最
下部Ｙａｏｙ境界に関して節の相互の位置によって決定
される１位置のしきい値ＹＴＨは、ＹＴＯＰおよびＹａ
ｏｔ閣で選定される（第８図参照）、関連度は次のとお
りである。

ｆｏａ−（Ｙ−ＹｙＨ）／（ＹｔＨＹｖｏｐ）：Ｙ≧Ｙ
ＴＨ −〇＝その飽ｆ　ｏ　ａ　”　（Ｙｖ　Ｈ−Ｙ）　／　（Ｙ″＆＠Ｔ
−ＹＴＨ）：Ｙ＜ＹＴＨ −〇：その他コー０枝特徴は文字の構造を記述するのに使用される。

２つの枝は共通の節を有しているかどうかについて一連
しているといえる０文字コード（構造ニード）は、すべ
ての関連している枝特徴およびそれらの対応する節対の
連鎖また紘直列の結合である。

第９１１は、数字に対する典型的な文字コードを示す１
文字コード鉢、許容できる歪みを含む方法で文字の等価
なりラスを定義する。新しい文字コードは、特徴におい
て新しい一連が見い出されるに従って簡単に加えられ、
かつ発生目数が減少するに従っτ連成されたり削除され
たりする。許容できる文字コードのテーブルは、索引テ
ーブル２２において発生させられかつ記憶される。その
テーブルに記憶されたコードμ文字コードの唯一の表現
である。第ルベルの認識は、単純なテーブルの調査、す
なわち、構造整合によって達成される。

整合の結果は、ケース（１）直接整合、ケース（２）混
同したクラスまたはコードおよびケース（３）ノイズコ
ードとして先に確認した３つのケースのうちの１つとし
て表わすことができる。ケース（１）において、文字コ
ードは唯一のクラスを表わし１！麿は完了する。ケース
（２）において、文字コードは藁同コードと呼ばれると
ころのリフつかのクラスを表わしそしてこの混同を解決
するために特別の試論特徴が採用される。ケーｉ　（３
）において、文字コードはコードテーブルの中にはなく
そしてそのコードはノイズコードと呼ばれる。

ケース（１）の文字コードが見い出されるとＩＩＩｍは
完了する。混同コードまたはノイズコードが見い出され
ると付加的な処理が必要とされる。

１１各校は、１対の節を結合している各々の連続的な枝点の
ｘ　ｅ　Ｖ座標をコード化することによって表現される
＠　Ｘ　＊　Ｖ座標リストはともに１つの翼。

３３− ソ座標リスト配列に詰められる。その配列はその後、各
校の長さを表示する表現を含むポインタ配列によって境
界が定められる。第１ｏｓ−ｉａａおよび第１０８−２
図は、第１０＾−１図および第１・０＾−２図において
示されている３つの文字の骨格表現を示す、試験の例に
おいては次の情報が記憶される。もちろん、ＩＣＬおよ
びＩＡｕＴは、この段鴎では未知の文字コードの処理か
らは湧常では入手できないであろう。

ＩＣＬ、　　ＩＡＬＪＴ、　　ＭＢ、　　Ｋ１．　　Ｋ
２．　　夏　Ｌ。

九、　ＩＸ、　ＩＹここで、ＩＣＬ　　　：クラスコードＩＡＵＴ　　：ＩｉｌコードＭＢ　　　：枝の数に１　　　：使用されな１Ｉ）１０個の要素配列に２　　　：各節対の符号を含む１０−の要素配列ＩＬ　　　二枝の数よりも１大きいものＬＢ　　　：各
校の長さを含む１０個の３４− Ｗ章配列ＩＸ、ＩＹ：各枝点の×、ｙ座標をそれでれ含む１００
−の要素配列第１０Ｂ−１図および第１０８−２図における最初の記
録は次の、情報を含む。

１、　１ＯＬ−４；　　文字は４である。

２、　　　ＩＡｕＴ−７７８：　　１１７７８によって
書かれている。

３、　　ＭＳ−２：　　文字は２つの枝を有する。

４、　Ｋ１−空配列５、　に２（１）−１１，に２（２）−１２：第１およ
び第２の枝は、それぞれ節対（１＝、　１　）および（
１，２）に接続されている。

６、　　ＩＬ−３７、１Ｂ（２）−４２，ＬＢ（３）−１１；第１および
第２の枝は、それぞれ長さ４２および１１である。

８、　そこには２つの枝がある。

枝１−（（ＩＸ（１）、ＩＹ（１））。

（ＩＸ　（２）、ＩＹ　（２）’）、−。

（ＥＸ　　（４２）、　　ＩＹ　（４２））−（（１９
，２４＞、　　（１８，２４）、−、（２０，２４））枝２−＜（ＩＸ（４３）、ＩＹ（４３））、　　（ＥＸ
　（４４））、−。

（ＩＸ　　（５３）、　　ＩＹ　（５３））−（（２０
，２５）、　　（２０，２６）−、（２１，３５））４．８および９に対する文字コードのコンピュータコー
ドが、関連した大きさの情報および試験例において利用
できるように示されているＩＣＬおよび１＾ＬＩＴとと
もに第１００ＩＩにおいて示されている。しかし、ｘｃ
ｔ−ｓよび■ＡＵＴ＆ｔ、未知の文字コードからは正常
で＆を知ることができないであろう。

ＩＣＬ、ＩＡＵＴ、Ｍｅ、に１．に２．ＬＮ。

ＩＨＴ、ＩＷＴここでＩＯＬ　　：クラスコードＩＡＵＴ：１者コードＭＢ　　：枝の数に１　　：各校のコードを含む１０個の要素配列に２　　：各校に対応する各節対の符号を含む１０個の
要素配列ＬＮ　　：各校の長さを含む１０−の要素配列ＩＨＴ　　：各校の高さを含む１０−の要素配列ＩＷＴ　　：各校の幅を含む１０儂の要素配列第１０Ｃ図における最初の記録は次の情報を含む。

１、　　　ＩＣＬ−４：文字は４である。

２、　　　ＩＡＵＴ−７７８：１者７７８によって書か
れている。

３、　　ＭＢ−２二文字は２つの枝を有する。

４、　　Ｋ１　（１）−１３，Ｋｌ　（２）−２；第１
および第２の枝は、それぞれ１３および２としてコード
化される。

５、　　Ｋ２（１）−１１，に２　（２）　−１２：３
７− 第１および第２の枝は、それｆれ節対（１，−１）およ
び（１，２）に接続されている。

６、　　ＬＮ（１）−４２，ＬＮ（２）−１１：第１お
よび第２の枝は、それぞれ長さ４２および１１である。

７、　１ＨＴ（１）−１９，ＩＨＴ（２）−１１：第１
および第２の枝は、それでれ真６１９および１１である
。

８、　　　ＩＷＴ（１）−１４，１ＷＴ（−２）−２：
第１６よび第２の枝は、それぞれ暢１４および２である
。

コー０の　　　　−ス第１０＾−１１ｉおよび第１ＯＡ−２１１は、このシス
テムに従うて分析されたとき同一の文字コーｔ’ｔ６ｔ
）８Ｖ（１２）−ＯＡ（１１）！生ずる３つの異なった
文字４，８．９を示し、混同したコードまたはクラスを
包含するケース（２）の状態である。この状態によって
与えられた混同を解決するために、詳纏な特徴を含む特
別な試験が３２で示されている■同コード処Ｓ装置（第
１１１）＆−３８− よって使用される。−例として、次の特徴が、４゜８お
よび９の−で識別するの玉伴う混同を解決するために用
いられる。

１、　ストロ−゛り幅比ＳＴＲ，これは、枝８の平均ス
トローク幅の枝ＯＡの平均ストローク幅に対する比率で
ある。この特徴は、４および９に対しては小さいが８に
対しては大きい。

２、　枝幅比ＷＴＲ，これは、枝ＯＡの枝椙およびその
平均ストローク幅の枝Ｖの平均ストローク幅に対する比
率である。この特徴は、４および９に対しては大きいが
８に対しては小さい。

３、　尖鋭率ＴＲ，これは、枝ＯＡの左右の輪郭の上部
５つの部分の平均の枝ＯＡの左右の輪郭の最大値に対す
る比率である。この特徴は、４に対゛しては小さいが８
および９に対しては大きい。

４、　枝ＯＡの最大の左右の開隔の相対位ＩＩＰＭ、こ
の位置は、４に対しては枝の最下部に近く８および９に
対しては中間部のどこかにある。

上述した特別の試験特徴を用いる４、８および９に対す
る分類は以下に示す。

ｏｕＬ　亀　　ｏｕＬ文字’−Ｖ（１２）−ＯＡ（１１）　　　８’！’Ｒ９
１４１Ａ？Ｒ（？Ｈ４２／１８２Ｔ１４３文字８　ｍ　
Ｖ（１２）−ＯＡ（１１）　　ｇ’ｌ’Ｒ＞’！！’Ｈ
１ｌｌＡＷＴＲ≦１８２−分類の意味論の部分は、境界
がしきい値によりて定義基れる断片状の直轄領域を定義
する。もし特徴が適切に設計されていれば□、この慎域
は充分膜分離されるであろう、しきい値パラメーター、
非常に安定であり決定は大して臨界的ではないであろう
、− 各校特徴に対しては、抽出できる有限の数り特性がある
のみである。いくつかの＄ＩＩＩＪＩ的な特徴線、長さ
、平均ストローク幅、ストローク幅標準偏差。

縦横比、５つの方向の連鎖コード（ここ〒は、分解能を
＾めるため、枝は３つの代わりに５つの区分に部分され
る。）、５つの平均ストロク幅。

ループ枝の尖鋭差などである。これらの特別な試験の（
詳報な）特徴は丁゛一度混同したケース（２）が見い出
されると、各々のそのような混同上たクラスの分類にお
いて特徴が利用できるようにするため、予め計算され得
る。

ノ　　コー°の　　　ケース３上記ケース（３）のノイズコードは、コードテーブルの
中にないコードである。２種類のノイズコードがある。

すなわち、タイプ（ａ）は、元のコードテーブル−には
含まれておらず、後で加えられ得る確かな構造を有する
ノイズコードであり、タイプ（ｂ）は、確かな構造を有
していないノイズコードで゛あり、それはその構造を確
かなものにするためのノイズ処理を必要とする。

自由な手書き文字認識におけるノイズ問題の検討により
、上記タイプ（ｂ）のノイズは一次的には個々の書き万
機式または前処理によってもたらされることが明らかと
なる。ＩＩ々の様式は人が寵く方法に原因があり、それ
は第１１図Ｏｒａ」で示されるような付加的なループお
よび拡張された枝のようなものに帰着する。前処理の同
層は、しきい値の不適切な選択のため（第１２図）また
は不適当な平滑化のため（第１３図）により起こる。

しきい値（第１２１１）の不適当な選択に起因す４１− るノイズ１ＩＩＩ＆を次の原因となる。すなわち、（ａ
）浸蝕または骨格化処理が施された後に小゛さな抱に帰
着する文字ストロークにおけるピンホール。

ｔｂ）多数の枝をループ内に発生させている枝の橋渡し
またはループの部分的な充満のための不所望の枝、（Ｏ
）文字のストロークに沿った不均一の灰色レベル強度の
ための必要な枝の除去である。

第１２図は、不適当なしきい値設定のいくつ卆の効果を
示す、他方では、不適当な平滑化は、第１３図に示した
ような不所望の付着した短い枝のようなごつごりした端
を生じさせる。

ノイズコード処理のフローチャートは第１４図に示す、
アルゴリズムは以下に示す。

１、　　ＲＬ＜）ＯＰ−この処Ｗ装置は、文字の大きさ
に対して小さいと考えられるすべてのループを除去、す
る、残りの構造は索引コードテーブル中の構造と比較さ
れる。もし一致が検出されるとアルゴリズムは終了し、
そうでなければＭＡＸＬＯＰに進む。

２、　　ＭＡＸＬＯＰ−こ（Ｄ処Ｓ＊ｔＵ、ルーフ４２
− 中のすべての枝を除去する。残りの構造はコードテーブ
ル中の構造と比較される。もし一致が見い出されるとア
ルゴリズムは終了し、そうでなければＲＢＬＩＢＬＥに
進む。

３、　　ＲＢＵＢＬＥ−この処Ｉｌ＠轍は文°字の大き
さに対して小さいと考えられるすべての泡を除去する。

残りの構造はコードテーブル中の構造と比較される。も
し一致が見い出されるとフルヲリズムはＩｌｌし、そう
でなければＡＤＢＲ２に進む。

４、　　ＡＤＢＲ２−この処理装置は、正確に２つの枝
が付けられた各節を試験する。これらの２つの枝は連鎖
に対する候補者である。連鎖には２つの種類がある。す
なわち、永久的なものと非永久的なものである。永久的
な連鎖は、一度２つの枝が連鎖されると次の処理に１い
ては連鎖されたままであるということを意味する。非永
久的な連鎖は、連鎖および次に続く動作のための一連チ
ェックの後２つの枝は連鎖が解かれることを意味する。

全体の枝の長さおよび枝のタイプに依存して、処理の順
序は以下のようになされる。

畠）　全体の校長の増大している層−における２つの１
纏の枝は連鎖される。これは永久的な連鎖であり、第１
４・Ｂａ１ｅよび第１５Ａｌｌにおいて「１」で示され
ている。

−）　　全体の校長の増大している順序における纏およ
び自着の枝は連鎖される。これは非永久的な連鎖であり
、第１４８ＩＩおよび第１５８１１において「５」で示
されている。

Ｏ）　全体の校長の増大している順序における２つの、
―纏枝は連鎖される。これは非永久的な連鎖であり第１
５８１ｉにおいて示されている。第１５ＢＩＩａ！２つ
のタイプの非永久的な連鎖を示す。

処理は、コードテーブル中で一致を生ずる処理順序で連
鎖を見い出そうとする。もし２以上の連鎖が見い出され
るとこれは不合格でありアルゴリズムは終了し、もし１
または０が見い出されるとＲＴＩＰに進む。

５、　　ＲＴＩＰ−この処ＷＩＩｌｌｌは、枝を削除し
それ＆ｔｍ箸的４―作である。もし充分に注意して行な
りな＄すれば文字の構造゛を破壊するであろう。

実際においては、削除され得る枝の長さを元の文字構造
の４０％以下に制限すべきである。結合性を破壊するこ
となくｍｓされ得る３つのタイプの枝がある。すなわち
、　　（ａ−）第１１８図におけるｒａＪのような先端
の枝、（ｂ）第１１Ａ図におけるｒａＪのような大きい
ループの枝および（０，）大きい泡の枝である。処理の
順序は校長の増大している順序からである。枝の削除の
後に残りの構造は一致のために照合される。もし一致′
が見い出されないと影響を受けた節はそれに２つの枝だ
けが付けられているかどうかを決定するために照合され
る。もしそうであれば連鎖が与えられ残りの構′ａ＆！
再び一致のために照合される。この処理は２つの構造の
一致が見い出されるまで続けられ、ＡＤＢＲ２における
ものを含む、もし２つの構造が見い出されると確信度す
なわち残りの校長の各構造の元の校長に対する比重は比
較される。もし低い確信度が成る量以下であれば高い確
信度の構造が選択さ、れる。

第１４Ｂ図は上述したアルゴリズムに従った操４５− 作間の間係を表わす図表であり、「雑音のある」かつ識
別不可−の文字の骨格の様々な見本、その文字の操作後
およびそれ７ｍ！別が行なわれる参照文字を示す。

１１１１１１３８口ｍ第２０ＡＩＩは読まれるべき書類上に現われるような一
連の手書き文字の代表である。第２０８図は、読取−お
よび処ｌｌ装置１０を通しての処！ならびに纏纏器およ
びストローク幅分１１１１４における一纏化の慢ブラウ
ン雪上に纏われるようなそれらの文字の骨格の代表であ
る。「５」および「８」以外の認識け、索引テーブル２
２および組合わされた原形構造テーブル４０のみの使用
の結果により１００％の確信度でなされ豐ることがわか
りた。「５」に対する直接の認識の結果における確信度
はおよそ８３％であり「８」に対するそれはおよそ９１
％である。この場合にお番する「５」および［８」の認
識は、ノイズ処１１＠置３６における付加的な処理によ
り１００％に達するであろう。

４６− 第２１Ａｌｌは、読まれるべき書類上に現われるような
印刷された文字の代表である。第２１８図は読取器およ
び処ｌ！装置１０を通しての処理ならびに輯纏器および
ストローク幅分析１１１４における細線化の後のそれら
の文字の骨格の代表である。

この例においては、他のプリンタ文字フォントを採用す
る他の例におけるのと同じ＜、＆ｔＷすぺτの文字に対
する結果←おける確信度は１００％であることｄわかっ
た。

以上を要約すると、自由な手書き文字およびさまざまな
様式の印刷文字の１！麿を可能にする゛技術が開示され
た。各文字は最初にその骨格および骨格における各点の
関連づけられたストローク幅情報の表現で記述される。

骨格は文字コードによって表１Ｉされた文字（統合論情
報）の構造を抽出するのに使用され、そしてストローク
幅情報は識別関数によって表現される特別や試験特徴（
意味論情報）を抽出するのに使用される。

与えられたクラスに対する既知の文字コードの収集およ
びそれらの関連づけられた識別関数からなるクラス分類
量が使用されている。一般的に言えば、クラス「×」に
対する分類器は次によって表わされる。

ここでＮはクラスｒＸＪにおける原形または様式の数で
ある１文字コードがただ１つのとき、すなわち文字−の
構造が文字クラスを単一に定義するとき識別関数は空で
ある１分１ＩＩＩＩＩＩｌｌは、文字コードおよびそれ
らの関連づけられた識別偶数の加算または減算の賽墨な
手段を提供する。入うてくる未知の文字は、未知の文字
の文字コードおよびそれの最良の応答を生ずる関連づ番
ツられた識別関数が最もよく一致する文字コードを含む
クラスに劇当てられる。

任意の文字の骨格およびストローク幅情報の表現は、元
の文字がそれらから再び構成され得るという意味で完全
である。その表現は我々に、枝の数、ループの数、枝の
タイプおよび讐れらの結合性のような荒い幾何学的また
は位相数学的特徴を害烏に抽出する手段を提供する。そ
の１ｌＩｌｌはまた、枝肉のまたは枝閤の地域的なスト
ローク幅および局部の形状特徴を比較するような技術に
よりより詳細な特徴を抽出する手段を我々に提供する。

１つの文字について荒い特徴から報かい特徴へと必要と
する情報を抽出する能力は、開示された幾何学的ＩＩＩ
ＩｉＭ術の独特な特性のうちの１つである。

【図面の簡単な説明】

第１１１１は、印刷された英数字の文字および自由な手
書き文字のような文字を処理するためのこの発明が関係
しているシステムを示すブロック図である。第２Ａ図は
、見かけ上は互いに非常に興なっているけれども同じ文
字コードＤ（１，２＞・Ｄ（２，３）を共有する４つの
自由な手書き文字「３」の見本を示す、第２Ｂ図は文字
（Ｂ１．Ｂ２）・（Ｎ１．Ｎ２）を定義するためにいか
にして節の組ｒＮ１．Ｎ２Ｊの構造が枝の組（Ｂ１゜Ｂ
２）の構造と粘合されるかを示す手書きの「９」４９− の表示である。第３Ａ図および第３Ｂ図は、混同コード
−の混同の解決を可能にするために分析される角および
窪みに関する朝かな特徴の例を示す。第３０．３０および３Ｅ図は、文字構造の記述に重要な
３つの点の憫として端点、枝点および接合点を示す、第
４Ａ、４Ｂおよび４０図は、（Ａ）曲線および輪、（Ｂ
）点または長さＯの纏およびループならびに（Ｃ）２つ
の重輪に関する抑揚亭を示す、第５図は、特定の受取り
たデータが纏。１纏またはループに関する情報を含んでいるかどうかを
確立するためにいかにして荒い位相数学的分類がなされ
るかを示すフローチャートである。第６Ａ図は、種々の絵画的表現に使用される分類な示す
図である。第６８１１は、０形状をした曲線のグループ
を示す図である。第７図は、理想的なＣ１纏の枝点を数
えるのに使用する好ましい方向を示す、第８図は、ルー
プ枝分類の基礎を示す図である。第９図は、クラスｒＯ
Ｊから「９」を形成もている数字に対する文字コードを
示す典型的な文字の図である。第１０ＡＩＩは、第１Ｏ
Ａ−１５０− 図および第１０Ａ−２１１の関係を示す、第１ＯＡ−１
図は、このシステムに従って分析されたとき同一の文字
コードすなわちＶ（１，２）・０Ａ（１，１）によって
表わされる２つの異なった文字ｒ４Ｊ、ｒ８Ｊを示し、
第１ＯＡ−２１１は、第３の文字「９」を示す、第１０
８．１０Ｂ−１およびｌ０Ｂ−２１１は、第１０Ａ、１
０＾−１および１０Ａ−２図におけるｒ４Ｊ、ｒ８Ｊお
よび「９」の骨格に関連しているる一ド情報の例ｉ示す
、ｌｌｌｌｏＣ図は、第１０Ａ図のｒ４Ｊ、ｒ８Ｊおよ
び「９」に対する文字コード情報のｔＳ＊ある。第１１図は、余分のループおよび枝の形をとっている手
書き文字に対する個々の書式の特性を示す。第１２１１Ｉは、不完全に選定されたまたは不適当なし
きい値での操作に起因するいくつかの結果を示す、第１
３図は、不適当な平滑化の効果のうちの成るものを示す
。第１４Ａ１１１は、この発明にｔりたノイズコード処
理のフローチャートを示す。第１４８Ｅは、第１４Ａ図
のフローチャートに従った操作の前後の文字の見本を示
す図である。第１５１− ５Ａ図は永久的な連鎖の例を示し、第１５８ｍ１は非永
久的な連鎖の例を示す、第１６図は、この発明に従った
文字の区分化を表現するために連げれたＡＩ！６６　ｒ
り５２ＤＪ　ｈ−７ｔｔ示す、第１７１１は、各区分に
おける上下左右の−きの数の計数に関する計数ベクトル
ＩＸＲを示す、第１８図は、各区分における記入事項の
数の計数を包含する計数ベクトルＩＸＴを示す、第１９
１１は、テン７レートベクトルの例を示す、第２０Ａ図
は、読まれるべき書類上に稠わ゛れるような処理される
べき一連の手書き文字を示す、ｌＩ２０Ｂ図は、ストロ
ーク幅分析器において文字が細線化６れた俵にブラウン
雪上に現われるような第２０Ａ図の文字の骨格を示す、
第２１Ａ図は、読まれるべき書類上に現われるような一
連の印刷文字を示す、第２１８図は、処理の後にＣＲＴ
＆：Ｗねれるような第２１Ａ図の文字の骨格を表わす。図において、１０＆を読取器および処ｌｌ装値、１４は
一纏器およびストローク幅分析器、１８＆を特徴抽出−
１２２は索引テーブル、３２は漉同コー５２− ド処理装置、３６はノイズ処ＷＩ装置、４０はＩｌｌｌ
ｌ過構造テーブルる。５３− ＩＧ、２Ａ。ＦＩＧ、３Ｃ，ＦＩＧ、３Ｄ、　　　ＦＩＧ、３Ｅ。ＦＩＧ、４Ｂ。ＦＩＧ、８゜ＦＩＧ、ＩＯＣ。ＩＣＬ、　ＩＡＵＴ、　　Ｍｅ、　Ｋｌ、　Ｋ２．　Ｌ
Ｎ、　Ｉ）ＩＴ、　ＩＷＴＦＩＧ、坦。ＦＩＧ、１６゜コ、１９６（］１）ｎｏＯ１００００１ＯＯＩＯ１ＣｎＯｏＯＩＯｏｏｌＯＯ１６

Claims

【特許請求の範囲】

（１）　骨格およびストローク幅の特性を含む文字の畿
何学的特徴を表わす信号の形式でデータを処理するため
の文字ｉｉ＋ｍシステムであって、前記信号から文字の
選択された特徴を表わしていｉデータの形式で文字コー
ドを抽出する手段と、前記文字コードと既知の文字の文
字コードを表わすデータとを比較し、肯定的な識別がな
されれば識別された文字を示している出力信号を与える
手段とを含む、文字ｉｉｍシステム。
（２）　前記データの比較のための前記手段は、肯定的
な識別がなされなければ、前記文字コードをくうに次の処理のために送る手段と、前記文字コードの受取りに応答してそれの分析を行ない
かつ前記分析から発生された情報を組入れた変更された
文字コードを作るように結合されている処理手段と、肯定的な識別を求めて前記変更された文字コードを前記
比較のための手段に送る手段とを含む、特許請求の範−
第１項記載の文字認識システム。
（３）　前記゛データの比較のためめ前記手段は、肯定
的な識別がなされなければ、前記文字コードをさらに次の処理のために送るための手
段と、前記文字コードに応答するように結合されていて、文字
の肯定的な識別を確立するために同一の文字コードを有
する興なりた文字を讃則するために輻かな特徴試験を与
えるための一同コード処理装置を含む処理手段とを含み
、前記濶同コード処Ｗ装置は前記識別された文字を示す出
力を与える、特許請求のｌｌｌ１ｌ第１１ｊＩ記°載の
文字認識システム。
（４）　前記処理手段は、索引テーブル中のいずれかの文字クラスに属するものと
して直接的に認識されることができない文字コードを修
正するためのノイズコード処褒装置を含み、前記ノイズコード処Ｉｌ装置は、索引テーブルに比較お
よび識別のために送られるべき修正された文字コードを
与える、特許請求の範囲第２項または一＃１３項記載の
文字ａｓｉシステム。
（５）　ノイズコード処ｌｌ装置は、前記文字コードの
選択された要素を除去しかつ前記修正された文字コード
を発生する手段を含む、特許請求の範囲第４一記載の文
字認識システム。
（６）　前記ノイズコード処Ｉ！装置は、正確に２つの
枝が付けられている文字コードの各節を試験し、前記処理装置は、２つの枝を連鎖し、それらを１つの枝
に減じ、かつその結果の修正された文字を比較および識
別のために索引テーブルに送る、特許請求の範囲第５項
記載の文字認識システム。
（７）　ノイズコード処理装置は、索引テーブルにおけ
る一致が確保さｉることなく２つの連鎖が企てられたと
いう事実で調査を特徴する特許請求の範囲第６項記載の
文字Ｉ！厘システム。
（８）　ノイズコード処ｌｌ装置は、結合性を破壊する
ことなく枝の部分を削除するための手段を含み、前記枝
は先端の枝、大きいループの枝および大きい泡の枝を含
む、特許請求の範囲第４項記載のｉ字ｉｉｎシステム。
（９）′　データが文字の幾何学的特徴を表わしている
信号の形式で受けられる書類処理機−に用いるための文
字認識システムであって、前記信号からの文字の独特な
特徴を表わしているデータを抽出するための手段と、前記データを既知の文字の特徴を表わしているデータと
比較するための処Ｗ装置手段とを含み、前記処１ｕｉ装
置手段は、１つが識別されたとき特定の文字を示してい
る出力信号を与え、かつ、前記処ｌ！装置手段は、どの
特定の文字も認識されないとき前記データを付加的な処
ＩＩ！装置に送る、文字ａｌｌシステム−
（１０）　データ″は、複数の稜点により相互に連結さ
れた節点を含む骨格の形状を表わし、かつ、データ抽出
のための手段は、纏、曲線およびループを表わすデータ
閤で識別するための手段を含む、特許請求の範囲第９璃
記載の文字１ｇ１ｍシステム。
（１１）　付加的な処理装置は、前記データの受取りに応答してそれの分析を行ない前記
分析から発生された情報を組入れた変更されたデータを
作り、かつ前記データと既知の文字の特徴を表わしているデータと
を比較するために前記変更されたデータを前記処３！！
装置手段に送る手段を含む、特許請求の範囲第９項また
は第１０項記載の文字認識システム。
（１２）　付加的な処理装置は、−前記変更されたデー
タに応答するように結合されていて、文字の肯定的な識
別を確立するために同一の文字コードを有する興なりた
文字囲で識別するために報かな特徴試験を与えるための
混同コード−処理装置を含み、前記混同コード処Ｉｌ＠胃は識別された文字を示す出力
を特徴する特許請求の範囲第９項または５− 第１０項記載の文字認識システム。
（１３）　前記処理手段は、処ｌｌ装置におけるどの文
字クラスに属するものとして直接的に識別され得ない文
字コードを修正するためのノイズコード処Ｗ装置を含み
、前記ノイズコード処ｌｌ！ｌｌ１ｌ！は、比較および識
別のために処Ｓ装置に送られるべき修正きれた文字コー
ドを特徴する特許請求の範囲第９項ま些は捧１０項記載
の文字区議システム。
（１４）　ノイズコード処ｌ！装置は、前記文字コード
の選択された要素を除去し前記修正された文字コードを
発生させる手段を含む、特許請求の範囲第１３項記載の
文字認麿システム。
（１５）　ノイズコード処ｌ！装置は、正確に２つの枝
が付けられている文字コードの各節を試験し、前記処理装置は、２つの枝を連鎖し、それらを１つの枝
に減じ、かつ比較および識別のためにその結果の修正さ
れた文字を索引テーブルに送る、特許請求の範囲第１３
項記載の文字ｍｓｉシステム。６一
（１６）　ノイズコード処理装置は、索引テーブルにお
いて一致が確保されることなく２つの連鎖が企てられた
という事実で調査を特徴する特許請求の範囲第１５項記
載の文字認識システム。
（１７）　ノイズコード処理装置は、結合性を破壊する
ことなく枝の部分を削除することにより文字コードを修
正するための手段を含み、前記枝は先端の枝、大きいル
ープの枝および大きい泡の枝を含む、特許請求の範囲第
１３項記載の文−！！ＦＩ！ｌ！謙システム。