JPS5848183A - 文字認識システム - Google Patents
文字認識システムInfo
- Publication number
- JPS5848183A JPS5848183A JP57140476A JP14047682A JPS5848183A JP S5848183 A JPS5848183 A JP S5848183A JP 57140476 A JP57140476 A JP 57140476A JP 14047682 A JP14047682 A JP 14047682A JP S5848183 A JPS5848183 A JP S5848183A
- Authority
- JP
- Japan
- Prior art keywords
- character
- code
- branches
- data
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/34—Smoothing or thinning of the pattern; Morphological operations; Skeletonisation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
この発明は、]1処衰機器などとともに用いるための文
字認識システムに関する。そ、れは多くのフォーマット
の印刷文字や自由な手書き文字に使用することができる
。それは、幾何学的技術と呼ばれていて、ディジタルの
形をした骨格およびストローク幅データを利用する文字
コード認識技術を採用しており、それらのデー゛・夕は
識別を可能にするため標準文字コードパターンのデータ
と比較される。II準文字コードと比較して最初に識別
されない一文字コードは、さらに処理されかつ特別の文
字を識別するためさらに試験が行なわれる。
字認識システムに関する。そ、れは多くのフォーマット
の印刷文字や自由な手書き文字に使用することができる
。それは、幾何学的技術と呼ばれていて、ディジタルの
形をした骨格およびストローク幅データを利用する文字
コード認識技術を採用しており、それらのデー゛・夕は
識別を可能にするため標準文字コードパターンのデータ
と比較される。II準文字コードと比較して最初に識別
されない一文字コードは、さらに処理されかつ特別の文
字を識別するためさらに試験が行なわれる。
種々のフォーマットの印刷文字および小切手の金額のよ
うな手書き文字を認識するための文字処理装置に対する
先行技術のシステム紘、統計学上の技術を利用するシス
テムを含む、そのようなシステムにおける困難の1つは
、元の統計学上の分析に含まれていない文字のamを判
断するためにシステムを適合させることが困難であるこ
とである。この発明に係るシステムは、索引テーブルを
形成しているメモリにおいて所望の変換が行なわれるよ
うにすることによって、この困難を非常(簡単に克服し
ている。これは、先行技術には容易 ′に利用できな
い方法でシステムの選択度および感度を変更することを
可能にしている。
うな手書き文字を認識するための文字処理装置に対する
先行技術のシステム紘、統計学上の技術を利用するシス
テムを含む、そのようなシステムにおける困難の1つは
、元の統計学上の分析に含まれていない文字のamを判
断するためにシステムを適合させることが困難であるこ
とである。この発明に係るシステムは、索引テーブルを
形成しているメモリにおいて所望の変換が行なわれるよ
うにすることによって、この困難を非常(簡単に克服し
ている。これは、先行技術には容易 ′に利用できな
い方法でシステムの選択度および感度を変更することを
可能にしている。
成る機械印刷文字をI!戴するため(サブスペース技術
がうま〈実施されており、そこでは文字が占める全体の
スペース・のうちの一部分のみが原型クラスと比較する
ために使用されるので「サブスペース」の語句が与えら
れている。その技術の単純さを考慮すると、この技術を
他の機械印刷文字の認識および自由な手書き文字の認識
にまで拡張することを望むのは当然である。しかし不幸
にも、印1文字の成る字体および自由な手書き文字と組
合わされた変形にサブスペース技術が適用できるかどう
かは以下、に述べる理由によりわからない。
がうま〈実施されており、そこでは文字が占める全体の
スペース・のうちの一部分のみが原型クラスと比較する
ために使用されるので「サブスペース」の語句が与えら
れている。その技術の単純さを考慮すると、この技術を
他の機械印刷文字の認識および自由な手書き文字の認識
にまで拡張することを望むのは当然である。しかし不幸
にも、印1文字の成る字体および自由な手書き文字と組
合わされた変形にサブスペース技術が適用できるかどう
かは以下、に述べる理由によりわからない。
まず、サブスペース技術は、特徴抽出が着手される前に
区分され0分離され、あるいは囲まれることのできる特
定の文字を使用することに強く依存していることである
。さらに、文字は一定のピッチで形成されなければなら
ないことである。これらの特性は、゛すべでの印刷文字
において見い出されるとは限らないし、かっけとんどの
場合小切手上の自由に手書きされた金額においては起こ
らない。それらの不足は膳要な同題を提供し、事実、そ
れらはサブスペース技術を手書き文字および成る種の印
刷文字に適用する試みの失敗の主な原因である。
区分され0分離され、あるいは囲まれることのできる特
定の文字を使用することに強く依存していることである
。さらに、文字は一定のピッチで形成されなければなら
ないことである。これらの特性は、゛すべでの印刷文字
において見い出されるとは限らないし、かっけとんどの
場合小切手上の自由に手書きされた金額においては起こ
らない。それらの不足は膳要な同題を提供し、事実、そ
れらはサブスペース技術を手書き文字および成る種の印
刷文字に適用する試みの失敗の主な原因である。
サブスペース技術は、一般的に、各文字を特別の方法で
3×3あるいは5×5に等分割されたセ9− ルのように分割することに依存している。各セルにおけ
る平均的な灰色の度合は、9つのセルに対して&t9つ
の特徴ベクトルをおよび25のセルに対しては25の特
徴ベクトルを特徴とする特徴として働く、(文字3のよ
うな)文字の各クラスにおけるi徴ベクトルの配分は、
自己相関によって、すなわち1つのランダム表敬の場合
における平均および標準偏差に相当する二次のモデルに
よ?て作られる。成る種の機械印刷文字に対しては、文
字ストロークの位置は1つの文字フォントから鉋の文字
フォントま!はあまり表化しないので、このモデリング
は適切である。第2A図は、25の背景に対するクラス
3(ここでは各0−9の数字はクラスとして表示されて
いる)の自由な手書き文字の見本を示す、これらの例に
おいて線、ストロークは5×5セルの成る領域から他の
領域へおもいきって移動しているのが見られ、これは自
由な手書き文字クラスの特徴ベクトルの配分の自己相関
モデリングが不適当であることを説明している。
3×3あるいは5×5に等分割されたセ9− ルのように分割することに依存している。各セルにおけ
る平均的な灰色の度合は、9つのセルに対して&t9つ
の特徴ベクトルをおよび25のセルに対しては25の特
徴ベクトルを特徴とする特徴として働く、(文字3のよ
うな)文字の各クラスにおけるi徴ベクトルの配分は、
自己相関によって、すなわち1つのランダム表敬の場合
における平均および標準偏差に相当する二次のモデルに
よ?て作られる。成る種の機械印刷文字に対しては、文
字ストロークの位置は1つの文字フォントから鉋の文字
フォントま!はあまり表化しないので、このモデリング
は適切である。第2A図は、25の背景に対するクラス
3(ここでは各0−9の数字はクラスとして表示されて
いる)の自由な手書き文字の見本を示す、これらの例に
おいて線、ストロークは5×5セルの成る領域から他の
領域へおもいきって移動しているのが見られ、これは自
由な手書き文字クラスの特徴ベクトルの配分の自己相関
モデリングが不適当であることを説明している。
10−
この発明において採用されている幾何―的技術は、特徴
抽出より前に区分することを必要としないので、サブス
ペース技術に伴う目間を避けている。文字構造はデータ
表現ノイズコード(すなわち、文字コードとしては認識
されないコード)のために容易に変更され、かつ不所望
の構造は知られた文字コードの表現を提供するためその
ようなデータから容易に除去される。(第10A図にお
けるクラス4.8および9の間におけるよう−)クラス
のlの混同は、文字イメージの最初の分析から抽出され
た特徴を用いることにより、それらの差を強調する特別
な試験特徴を使用することにより解決される。
抽出より前に区分することを必要としないので、サブス
ペース技術に伴う目間を避けている。文字構造はデータ
表現ノイズコード(すなわち、文字コードとしては認識
されないコード)のために容易に変更され、かつ不所望
の構造は知られた文字コードの表現を提供するためその
ようなデータから容易に除去される。(第10A図にお
けるクラス4.8および9の間におけるよう−)クラス
のlの混同は、文字イメージの最初の分析から抽出され
た特徴を用いることにより、それらの差を強調する特別
な試験特徴を使用することにより解決される。
様々なフォーマットの印刷された英数字の文字。
英数字ではない他のシンボルを表現している文字および
自由な手書き文字のような文字を識別するのに文書処理
システムなどとともに用いる文字認識システムが誇示、
されてい゛る。システムμ、骨格の形およびストローク
幅特性に関する詳輻のような文字の選択された幾何学的
な特徴を表わしている信号の形でシステムの外部から受
けられたデータを処理するための手段を含む。システム
は、前記信号から特徴および枝分類を表わしている成る
データを抽出しかつ文字を表わしている文字コードを作
り出す手段を含む。システムは、−知の文字コーt’に
:II着することを表わしているデータを知られた文字
コードを表わしているデータと比較するための手段を含
む、もし比較の結果とし工肯定的な識別がなされれば、
処lJ!装置は謹則された文字を示す出力信号を提供す
る。
自由な手書き文字のような文字を識別するのに文書処理
システムなどとともに用いる文字認識システムが誇示、
されてい゛る。システムμ、骨格の形およびストローク
幅特性に関する詳輻のような文字の選択された幾何学的
な特徴を表わしている信号の形でシステムの外部から受
けられたデータを処理するための手段を含む。システム
は、前記信号から特徴および枝分類を表わしている成る
データを抽出しかつ文字を表わしている文字コードを作
り出す手段を含む。システムは、−知の文字コーt’に
:II着することを表わしているデータを知られた文字
コードを表わしているデータと比較するための手段を含
む、もし比較の結果とし工肯定的な識別がなされれば、
処lJ!装置は謹則された文字を示す出力信号を提供す
る。
もし比較の結果として識別がなされなければ、システム
は未知の文字の特徴を表わしているデータをさらに次の
処理のために識別されなかったデータとして送る。付加
的な処理手段が、前記識別されなかったデータに応答し
て直接的に識別を試みるために、あるいはそれの分析1
行ないかつ前記識別されなかったデータおよび前記分析
からの情報を組み入れている修正されたデータを与える
ために結合されている。後者の場合、肯定的な識別を求
めて、識別されなかったデータと知られたデータとを比
較するため、修正されたデータはその後前記手段に送ら
れる。
は未知の文字の特徴を表わしているデータをさらに次の
処理のために識別されなかったデータとして送る。付加
的な処理手段が、前記識別されなかったデータに応答し
て直接的に識別を試みるために、あるいはそれの分析1
行ないかつ前記識別されなかったデータおよび前記分析
からの情報を組み入れている修正されたデータを与える
ために結合されている。後者の場合、肯定的な識別を求
めて、識別されなかったデータと知られたデータとを比
較するため、修正されたデータはその後前記手段に送ら
れる。
付加的な処理手段は、同一の文字コードを作るはとに充
分に似ている異なった文字を識別するためストローク幅
に関連がある分析を含む細かな特徴試験を与えるための
「混同コード」処W′装置を含む。もし試験が成功すれ
ば、混同コード処Il装置は文字を識別している出力を
与え、もし成功しなければ、処W装置は文字コードを入
閣の解釈に委ねる。
分に似ている異なった文字を識別するためストローク幅
に関連がある分析を含む細かな特徴試験を与えるための
「混同コード」処W′装置を含む。もし試験が成功すれ
ば、混同コード処Il装置は文字を識別している出力を
与え、もし成功しなければ、処W装置は文字コードを入
閣の解釈に委ねる。
付加的な処1liii置はまた、特徴を表わしている前
記データからしばしば連鎖している不所望の要素あるい
はノイズを除去するための「ノイズ処理装置」を含む。
記データからしばしば連鎖している不所望の要素あるい
はノイズを除去するための「ノイズ処理装置」を含む。
ノイズ処理装置はその後、肯定的な識別を求めての比較
のために前記手段に不所望のIIIを表わしているさほ
ど重要でないデータである修正されたデータを提供する
。
のために前記手段に不所望のIIIを表わしているさほ
ど重要でないデータである修正されたデータを提供する
。
前記のものにおいては、簡単のために、処理は一連の様
式で起こるものとして述べられている。
式で起こるものとして述べられている。
記録ごとの多くの文書の読取りを含む実施例にお13−
いてデータが作られるスピードのために、好ましい実施
例における処]lは実際上は平行した先翻り制御モード
で行なわれるであろう。
例における処]lは実際上は平行した先翻り制御モード
で行なわれるであろう。
さて、この発明が関連しているシステムの全体的な説明
のために第1図のブロック図に戻る。このシステムによ
れば、イメージデータは10で示される読取りおよび予
備的な処理のための装置からバス12に与えられる。こ
のイメージデータは、−aOのような書類が矢印Aの方
向に書類輸送トラックTを通って移動するときに書類を
スキャンすることから抽出される。典型的な書類輸送シ
ステムは、[サーボ駆動の書類供Ia@瞳のための制御
装置(C0ntrOI Ier for a S
erV(I D rlvan oocusien
t Feed@r ) Jと■し7% OJL/ F
・エイ・フエイシグ()larold A、 Fa
il(1)の名義11980年6830日に出願された
ともに出願中のアメリカ合衆国特許出願において示され
ており、そしてその出願はこの発明と同じ■り受は人に
譲渡されており参考としてここに取入れられている。
のために第1図のブロック図に戻る。このシステムによ
れば、イメージデータは10で示される読取りおよび予
備的な処理のための装置からバス12に与えられる。こ
のイメージデータは、−aOのような書類が矢印Aの方
向に書類輸送トラックTを通って移動するときに書類を
スキャンすることから抽出される。典型的な書類輸送シ
ステムは、[サーボ駆動の書類供Ia@瞳のための制御
装置(C0ntrOI Ier for a S
erV(I D rlvan oocusien
t Feed@r ) Jと■し7% OJL/ F
・エイ・フエイシグ()larold A、 Fa
il(1)の名義11980年6830日に出願された
ともに出願中のアメリカ合衆国特許出願において示され
ており、そしてその出願はこの発明と同じ■り受は人に
譲渡されており参考としてここに取入れられている。
14−
バス12上のイメージデータは、ストローク幅を表わし
ているディジタル信号とともに各文字の裸の骨格を表わ
しているディジタル信号の形でのデータを提供する輻纏
器およびストローク幅分析器14によγて分析される0
分析器14からのデータはバス16によって特徴抽出器
または枝分類siaに供給され、その特徴抽出器18は
荒い特徴あるいは位相数学的特徴を抽出しかつ読取器お
よび処理装置によって検出された各文字に対す、る位相
数学的特徴に関する情報を含んでいる文字コードあるい
は構造コードを作り出す1文字コードあるいは構造コー
ドを、文字のすべての関連した枝特徴およびそれの関連
した節の連鎖(あるいは連続したリンケージ)のように
定義することができる。好ましい場合においては、特徴
抽出器18は、枝の数、ループの数、枝のタイプなどの
ような位相数学的特徴を抽出するた゛めかつ文字コード
を発生させるのに必要な他の動作を゛与えるため、ハー
ドロジックあるいはTTL行列が使用できるけれども、
バロース81900あるいはそれより大型のコンピュー
タを使用することkより実施できるであろう。
ているディジタル信号とともに各文字の裸の骨格を表わ
しているディジタル信号の形でのデータを提供する輻纏
器およびストローク幅分析器14によγて分析される0
分析器14からのデータはバス16によって特徴抽出器
または枝分類siaに供給され、その特徴抽出器18は
荒い特徴あるいは位相数学的特徴を抽出しかつ読取器お
よび処理装置によって検出された各文字に対す、る位相
数学的特徴に関する情報を含んでいる文字コードあるい
は構造コードを作り出す1文字コードあるいは構造コー
ドを、文字のすべての関連した枝特徴およびそれの関連
した節の連鎖(あるいは連続したリンケージ)のように
定義することができる。好ましい場合においては、特徴
抽出器18は、枝の数、ループの数、枝のタイプなどの
ような位相数学的特徴を抽出するた゛めかつ文字コード
を発生させるのに必要な他の動作を゛与えるため、ハー
ドロジックあるいはTTL行列が使用できるけれども、
バロース81900あるいはそれより大型のコンピュー
タを使用することkより実施できるであろう。
文字コードはバス20によって索引テーブル22に与え
られ、索引テーブル22はfIA!!!構造テーブル(
あるいはテンプレート)40におけるデータとの比較を
与え、かつそこに(1)受取った文字コードと原型テー
ブルにおけるデータ(あるいはテンプレート)との直接
的な整合、 (2) rll同したクラス」あるいは
(3) 「ノイズコード」があるかどうかに従って受取
った情報を分類する。
られ、索引テーブル22はfIA!!!構造テーブル(
あるいはテンプレート)40におけるデータとの比較を
与え、かつそこに(1)受取った文字コードと原型テー
ブルにおけるデータ(あるいはテンプレート)との直接
的な整合、 (2) rll同したクラス」あるいは
(3) 「ノイズコード」があるかどうかに従って受取
った情報を分類する。
(1)データの直接的な整合、(2)混同したコードあ
るいはり、ラスおよび(3)ノイズコードに関する記載
は以下に行なう。索引テーブル22は、好ましくはTT
L八−ドワイヤロジックにより形成されるであろう、
jllllll造テーブル40は、好ましくはTTL行
列により形成される。特徴抽出器1Bは、好ましい場合
においてはTTL八−ドワイヤロジックを使用すること
により形jl!される。
るいはり、ラスおよび(3)ノイズコードに関する記載
は以下に行なう。索引テーブル22は、好ましくはTT
L八−ドワイヤロジックにより形成されるであろう、
jllllll造テーブル40は、好ましくはTTL行
列により形成される。特徴抽出器1Bは、好ましい場合
においてはTTL八−ドワイヤロジックを使用すること
により形jl!される。
もしく1)直接的な整合があれば、llI別された文字
を示す信号は、識別された文字の直接的な読出しとして
用いるためバス24およびバス26によりて直接的にバ
ス28に送られる。この情報は、マイクロプロセッサお
よびプリンタを含むであろう利用−置に与えられるであ
ろう。
を示す信号は、識別された文字の直接的な読出しとして
用いるためバス24およびバス26によりて直接的にバ
ス28に送られる。この情報は、マイクロプロセッサお
よびプリンタを含むであろう利用−置に与えられるであ
ろう。
文字コードが1つの文字あるいはデータのクラスよりも
むしろ1以上の文字あるいはデータのクラスを表わすこ
とをもしも索引テーブルが示すならば、<i>vi同し
たコードあるい−は混同したクラスと分類される状態が
示される。特別な試験特徴を包含する手順がその混同を
解決するために要求される。適当な試論特徴は混同コー
ド処si装置32として示される装置によって与えられ
、その処理装−は索引テーブル22およびバス24から
のI!同コード信号をバス30によって受ける。処理装
置32はバス28に識別信号を与える。識別が完了して
いない場合は、その装置は識別されたデータをバス33
によって索引テーブルに発送する。Il同コード処ms
装は、好ましくはインテル8035のようなマイクロプ
ロセッサを使用して17− 形成されるであろう。
むしろ1以上の文字あるいはデータのクラスを表わすこ
とをもしも索引テーブルが示すならば、<i>vi同し
たコードあるい−は混同したクラスと分類される状態が
示される。特別な試験特徴を包含する手順がその混同を
解決するために要求される。適当な試論特徴は混同コー
ド処si装置32として示される装置によって与えられ
、その処理装−は索引テーブル22およびバス24から
のI!同コード信号をバス30によって受ける。処理装
置32はバス28に識別信号を与える。識別が完了して
いない場合は、その装置は識別されたデータをバス33
によって索引テーブルに発送する。Il同コード処ms
装は、好ましくはインテル8035のようなマイクロプ
ロセッサを使用して17− 形成されるであろう。
もし特徴抽出−18からの文字コードがコードテーブル
22の中にないならば、それは前述した(1)あるいは
(2)のいずれかに属するものとしては識別されないこ
とを意味し、我々はそれを上記クラス(3)に対応して
いるノイズフードと呼ぶ、その場合、文字コードはバス
24および34を経由してノイズ処理装置36に処理の
ために送られ、そしてそれから索引テーブルにおける比
較のためにバス37に送られる。ノイズ処3!@置は、
好ましくはインテル8035のようなマイクロプロセッ
サを用いることにより形成さるであろう。
22の中にないならば、それは前述した(1)あるいは
(2)のいずれかに属するものとしては識別されないこ
とを意味し、我々はそれを上記クラス(3)に対応して
いるノイズフードと呼ぶ、その場合、文字コードはバス
24および34を経由してノイズ処理装置36に処理の
ために送られ、そしてそれから索引テーブルにおける比
較のためにバス37に送られる。ノイズ処3!@置は、
好ましくはインテル8035のようなマイクロプロセッ
サを用いることにより形成さるであろう。
第i*に示されているこの発明の1つの局面は、文字原
型が付加されたり消去されたりする容重さである。ブロ
ック40は、バス38によって索引テーブル22からの
アクセスに従って付加あるいは消去によって変更される
テーブルの形での原型構造情報源である。このことは原
型構造テーブルがTTL行列あるいは他のメモリ装置へ
の命令の18− −単な加算により、あるいはそのようなメモリ装置から
の命令の減算によりいかにして修正されるかを示す。
型が付加されたり消去されたりする容重さである。ブロ
ック40は、バス38によって索引テーブル22からの
アクセスに従って付加あるいは消去によって変更される
テーブルの形での原型構造情報源である。このことは原
型構造テーブルがTTL行列あるいは他のメモリ装置へ
の命令の18− −単な加算により、あるいはそのようなメモリ装置から
の命令の減算によりいかにして修正されるかを示す。
読取器および処理装置10および細棒器およびストロー
ク幅分析1114は、この発明の実施において採用され
るべき信号源としてここに参照されている他の出願にお
いて詳報に開示されている。
ク幅分析1114は、この発明の実施において採用され
るべき信号源としてここに参照されている他の出願にお
いて詳報に開示されている。
読取器および処ll装置の例は、この出願と同じ譲り受
は人に“譲渡されている「適用できるOCRフDントZ
ントシスTム(Adaptive OCRFrant
−end System ) Jと題しビープ・サイ
(Pope Siy> 、 Oバート・プo ス(R
obertBloss)およびゲアリイ・ビイ・コーペ
ンハーバー(Q ary B 、 Copenha
ver )の名義で1979年5月4日に出願されたと
もに係属中のアメリカ合衆国特許出願番号35.99−
3号(現在放棄されている)に示されている。読取器お
よび処理装置の他の例は、[ピクセル修正−!回路(p
ixel Qorrectlon l−ogic
Qlrcult)Jと題しシミー・ネイル(J 1s
sle N 5ill)およ(jテ−ヒy F −サ
トン([)avid 5utton )の名義で出願
されたともに係属中のアメリカ合衆国特許出願中に見い
出される。細線器およびストローク幅分析器の例はとも
に係属中の特許出願中に示されている。特徴抽出−と組
み合わされ−たseaおよびストローク幅分析器の例は
、E文字認識のための前処理および特徴抽出システム(
p reprocesslnc+ and F e
atura E xtraction S yst
eafor Character Recogni
tlon) Jと晒しチョーチir ’7−2− (Q
hauchang Su )の名義で1979年7月
24日に発行されこの出願と同じ譲り受は人に譲渡され
たアメリカ合衆国特許番号4.162.482@におい
て示されている。上記の出願および特許はここに参考と
して組み入れられている。
は人に“譲渡されている「適用できるOCRフDントZ
ントシスTム(Adaptive OCRFrant
−end System ) Jと題しビープ・サイ
(Pope Siy> 、 Oバート・プo ス(R
obertBloss)およびゲアリイ・ビイ・コーペ
ンハーバー(Q ary B 、 Copenha
ver )の名義で1979年5月4日に出願されたと
もに係属中のアメリカ合衆国特許出願番号35.99−
3号(現在放棄されている)に示されている。読取器お
よび処理装置の他の例は、[ピクセル修正−!回路(p
ixel Qorrectlon l−ogic
Qlrcult)Jと題しシミー・ネイル(J 1s
sle N 5ill)およ(jテ−ヒy F −サ
トン([)avid 5utton )の名義で出願
されたともに係属中のアメリカ合衆国特許出願中に見い
出される。細線器およびストローク幅分析器の例はとも
に係属中の特許出願中に示されている。特徴抽出−と組
み合わされ−たseaおよびストローク幅分析器の例は
、E文字認識のための前処理および特徴抽出システム(
p reprocesslnc+ and F e
atura E xtraction S yst
eafor Character Recogni
tlon) Jと晒しチョーチir ’7−2− (Q
hauchang Su )の名義で1979年7月
24日に発行されこの出願と同じ譲り受は人に譲渡され
たアメリカ合衆国特許番号4.162.482@におい
て示されている。上記の出願および特許はここに参考と
して組み入れられている。
この発明の進んだ議論に対するよりよい基礎の提供のた
めに、細線器およびストローク幅分析器の簡単な説明を
行なう。細線aおよびストローク幅分析!114に採用
されているアルゴリズムは、結合性を破壊することのな
い除去により、存在している境界における点を除去する
ことによって層ずつ文字の境界を浸蝕する。この手順は
もはや点が除去できないようになるまで連続的に与えら
れる°。残りの点は文字の骨格を形成し、それは14に
よって保有されているストローク幅情報とともに完全に
文字を描写する。骨格およびストローク幅が完全に文字
を記述するという主張は、各骨格点にその点におけるス
トローク幅と等しい直径を有する円盤を描くことにより
元の文字は非常に近似したもので再構成され得るという
事実により確証される。新しい骨格suiは、ケース(
1)の例において、文字の直接的な識別に使用される文
字の基礎構造を提唱する。上記ケース(2)および(3
)における混同を解決するのに必要とされる幾何学的特
徴の抽出およびさらに進んだ分析を容易に、するために
、またその骨格の使用がなされてもよい。
めに、細線器およびストローク幅分析器の簡単な説明を
行なう。細線aおよびストローク幅分析!114に採用
されているアルゴリズムは、結合性を破壊することのな
い除去により、存在している境界における点を除去する
ことによって層ずつ文字の境界を浸蝕する。この手順は
もはや点が除去できないようになるまで連続的に与えら
れる°。残りの点は文字の骨格を形成し、それは14に
よって保有されているストローク幅情報とともに完全に
文字を描写する。骨格およびストローク幅が完全に文字
を記述するという主張は、各骨格点にその点におけるス
トローク幅と等しい直径を有する円盤を描くことにより
元の文字は非常に近似したもので再構成され得るという
事実により確証される。新しい骨格suiは、ケース(
1)の例において、文字の直接的な識別に使用される文
字の基礎構造を提唱する。上記ケース(2)および(3
)における混同を解決するのに必要とされる幾何学的特
徴の抽出およびさらに進んだ分析を容易に、するために
、またその骨格の使用がなされてもよい。
先に示したように、骨格およびその関連したストローク
幅は任意の線状物の元の形状を完全に定義することが知
られている。この発明は、以下の21− ような特性を有する文字1!戴システムにおいてこの事
実を使用している。
幅は任意の線状物の元の形状を完全に定義することが知
られている。この発明は、以下の21− ような特性を有する文字1!戴システムにおいてこの事
実を使用している。
1、 特徴抽出に先立つて文字の区分を必要としない。
2、 文字銀型表現が容易に付加されたり消去されたり
するのを可能にしている。
するのを可能にしている。
3、 第ルベルの認識および荒い位相数学的かつ幾何学
的特徴の抽出が容易になされるの!可能にしており、そ
こでは特徴は次のものを含む。
的特徴の抽出が容易になされるの!可能にしており、そ
こでは特徴は次のものを含む。
a、 枝の数
す、 ループの数
C1枝のタイプ
d、 枝の結合性
4、 元の分解能のレベルに至るまでの混同の分析に用
いるため報かい特徴の迅速な抽出を可能にしており、次
のものを含む。
いるため報かい特徴の迅速な抽出を可能にしており、次
のものを含む。
a、 所定の骨格点におけるストローク幅す、 校内の
あるいは枝閣のストローク幅C1第3Δ図に示すような
直線の接合点に角CRS*或されておりかつ第3B図に
示すよう22− な直線の窪んだ側に窪みCvが生じている角および窪み
のような形状特徴 骨格表現は、文字構造の記述を害鳥にする。文字を表示
する骨格における点には3つのタイプがある。それは、
(1)端点あるいは1つ−の鱗り合うものを有する点、
(2)枝点あるいは正確に2つの隣り合うものを有する
点および(3)接合点あるいは3以上の隣り合うものを
有する点である。
あるいは枝閣のストローク幅C1第3Δ図に示すような
直線の接合点に角CRS*或されておりかつ第3B図に
示すよう22− な直線の窪んだ側に窪みCvが生じている角および窪み
のような形状特徴 骨格表現は、文字構造の記述を害鳥にする。文字を表示
する骨格における点には3つのタイプがある。それは、
(1)端点あるいは1つ−の鱗り合うものを有する点、
(2)枝点あるいは正確に2つの隣り合うものを有する
点および(3)接合点あるいは3以上の隣り合うものを
有する点である。
第3C図、30図および3Elを注目して、鷺こにはそ
れぞれ端点EP、枝点8Pおよび接合点JPが表わされ
ている。これらのr点」の各々は、3点×3点の窓にお
いて中心に位置した点と関連づけられている骨格点を調
べることにより決定される。もし中心点が1つだけの隣
り合う点を有しているならば(第3C図)、中心点は端
点である。
れぞれ端点EP、枝点8Pおよび接合点JPが表わされ
ている。これらのr点」の各々は、3点×3点の窓にお
いて中心に位置した点と関連づけられている骨格点を調
べることにより決定される。もし中心点が1つだけの隣
り合う点を有しているならば(第3C図)、中心点は端
点である。
もし中心点が2つの隣り合う一点を有しているならば(
第3D図)、−それは枝点である。もし中心点が3&X
上の隣り合う点を有しているならば(第3E1m) 、
それは接合点である。端点および接合点は、節点とも呼
ばれる一臨界点として注目され得る。
第3D図)、−それは枝点である。もし中心点が3&X
上の隣り合う点を有しているならば(第3E1m) 、
それは接合点である。端点および接合点は、節点とも呼
ばれる一臨界点として注目され得る。
臨界点あるいは節点は、この発明の実施においては、特
定の順序で番号がつけられる。もちろん、節は種々の任
意の方法で番号がつけられるけれどもこの発明の目的の
ためには1つの好ましい方法しかないということが紹厳
される。その方法は、第1の臨界点あるいは節を最上部
と、かつ第2の臨界点を最下部と常に名づける樅の特徴
と一致する。横の特徴についても、第1の節は常に左の
節であり第2の節は常に右の節である。この規約は、同
一の符号が与えられた群がった節あるいは接続された節
について、第1の臨界点は最上部あるいは左側にあか第
2の臨界点は最下部あるいは右側にあるというように要
約することがきる。この発明の応用は#19aiに示さ
れている。
定の順序で番号がつけられる。もちろん、節は種々の任
意の方法で番号がつけられるけれどもこの発明の目的の
ためには1つの好ましい方法しかないということが紹厳
される。その方法は、第1の臨界点あるいは節を最上部
と、かつ第2の臨界点を最下部と常に名づける樅の特徴
と一致する。横の特徴についても、第1の節は常に左の
節であり第2の節は常に右の節である。この規約は、同
一の符号が与えられた群がった節あるいは接続された節
について、第1の臨界点は最上部あるいは左側にあか第
2の臨界点は最下部あるいは右側にあるというように要
約することがきる。この発明の応用は#19aiに示さ
れている。
さらに、端点および/または接合点は、節1゜節2など
と呼ばれる節の組を定義する1節1から始まり節2に終
わる連続的な枝点のリストは、ここでは節1は節2に一
致ル得るが、枝を定義する。
と呼ばれる節の組を定義する1節1から始まり節2に終
わる連続的な枝点のリストは、ここでは節1は節2に一
致ル得るが、枝を定義する。
枝は、それゆえ、1つの臨界点(節)から始まり他の(
あるいは同一の)臨界点(節)に終わる一連の枝点によ
、−)で形成されると言うことができる。
あるいは同一の)臨界点(節)に終わる一連の枝点によ
、−)で形成されると言うことができる。
枝の収集は、枝の組を定義する0節の組および/または
枝の組は、文字の構造を定義するのに用いられる。第2
B図において、−例として、(Nl。
枝の組は、文字の構造を定義するのに用いられる。第2
B図において、−例として、(Nl。
N2)は節の組を定義し、(81,82)は枝の組を定
義しかつ(N1.N2)(81,82)は文字「9」の
構造を定義する。第9図に示すように、文字「1」は節
の組N1.N2によりて定義される。
義しかつ(N1.N2)(81,82)は文字「9」の
構造を定義する。第9図に示すように、文字「1」は節
の組N1.N2によりて定義される。
この発明を使用する実施に従った文字amにおいては、
各校は、纏1曲線あるいはループといった分類のうちの
1つとの適合、を確立するため、特徴抽出器18・によ
って荒い位相数学的方法で分類される。この分類を確立
するためにaつの測定が用いられる。それは、抑揚率(
DM)、最小方形誤差(S)および校長(MD)である
。抑揚率は、枝の2つの節を連結している直線の長さの
2つの節を連結している枝の長さに対する比重として定
義される。この定義によって、直線の抑揚率は1であり
、閉ループのそれは0でありカーブのそれ25− は0と1の−にある。第4A11.第4B図および第4
Cll&t、そへでれ直線L1のカーブL2に対する関
係(DM−Ll/L2<ゝ1)、長さOの直線のループ
LPに対する関係(DM−0)および轄L1の纏L3に
対する関係(DM−L1/L3−1)として抑揚率(D
M)を示す、第5図は、DM、8部よびMj)−のディ
ジタ寿表現の形のデータを用いていかにしてこの荒い分
類がなされやかを示すフローチャートである。
各校は、纏1曲線あるいはループといった分類のうちの
1つとの適合、を確立するため、特徴抽出器18・によ
って荒い位相数学的方法で分類される。この分類を確立
するためにaつの測定が用いられる。それは、抑揚率(
DM)、最小方形誤差(S)および校長(MD)である
。抑揚率は、枝の2つの節を連結している直線の長さの
2つの節を連結している枝の長さに対する比重として定
義される。この定義によって、直線の抑揚率は1であり
、閉ループのそれは0でありカーブのそれ25− は0と1の−にある。第4A11.第4B図および第4
Cll&t、そへでれ直線L1のカーブL2に対する関
係(DM−Ll/L2<ゝ1)、長さOの直線のループ
LPに対する関係(DM−0)および轄L1の纏L3に
対する関係(DM−L1/L3−1)として抑揚率(D
M)を示す、第5図は、DM、8部よびMj)−のディ
ジタ寿表現の形のデータを用いていかにしてこの荒い分
類がなされやかを示すフローチャートである。
第5図におけるパラメータiS以下のように定義される
。
。
NS−開始節符号
NT−終了節符号
DM−抑揚率
S −最小方形誤差
MO−校長
T H1−T H4−Lきい値
枝は、さらに以下の組あるいは特徴に分類することがで
き、そして付加的なおよび/または麹の粗あるいは特徴
が使用され、なおかつそれはこの26− 発明のIia内であるということが認識されるであろう
。
き、そして付加的なおよび/または麹の粗あるいは特徴
が使用され、なおかつそれはこの26− 発明のIia内であるということが認識されるであろう
。
纏−’(H,V)
曲線−(C,D、S、Z)
ループ−(OA、08.O)
これらの例は第6Allに示されている1文字構造、す
なわちその節を通じての文字の枝の粘合性は、骨格am
において明白になる。第ルベル諺■における構遁の比較
の目的荀ために、文字コードが定@される。文字コード
を作るために、各校は第6AIIに示されている粗ある
いは特徴の1つに割当てられる。
なわちその節を通じての文字の枝の粘合性は、骨格am
において明白になる。第ルベル諺■における構遁の比較
の目的荀ために、文字コードが定@される。文字コード
を作るために、各校は第6AIIに示されている粗ある
いは特徴の1つに割当てられる。
第6A図の特徴は、数字のクラスを表現するた゛めに選
定された。特徴の各々は、枝における許容できる歪みの
同等のクラスを定義する。たとえ−ば、第6B図に示さ
れている枝は、第6A図における「輪画的1111Jに
向かい合っている0列において示されるようなり形状の
カーブとしてすべて分類されるべきである。興味ある文
字は、この発明の精神から離れることなく、示された。
定された。特徴の各々は、枝における許容できる歪みの
同等のクラスを定義する。たとえ−ば、第6B図に示さ
れている枝は、第6A図における「輪画的1111Jに
向かい合っている0列において示されるようなり形状の
カーブとしてすべて分類されるべきである。興味ある文
字は、この発明の精神から離れることなく、示された。
数字だけでなくASCIIコードにおいて表わされてい
る文字のような多くの傭のタイプの文字を含むことがで
きるということが認識されるであろう。
る文字のような多くの傭のタイプの文字を含むことがで
きるということが認識されるであろう。
の eaberahl
rad@111111a4’6%urN属11(de
gree of belonglngness )
Jは、輪9曲輪またはループの各特徴に対して定−さ
れる、纏特徴の関連度は、その傾斜角によって決定され
る。この目的のため、φきい値角θ丁が選定され、そし
てそれは水平および垂直の纏、の閤の境界を確立する。
rad@111111a4’6%urN属11(de
gree of belonglngness )
Jは、輪9曲輪またはループの各特徴に対して定−さ
れる、纏特徴の関連度は、その傾斜角によって決定され
る。この目的のため、φきい値角θ丁が選定され、そし
てそれは水平および垂直の纏、の閤の境界を確立する。
ここで、θは、纏の水平に対する角度である。纏に対す
る関連度は、したがって次のように定義される。
る関連度は、したがって次のように定義される。
r v−< rol−10T +)/(90−18,1
):lθ121θマ1!直纏 一〇五その他 f H−(l 0丁 1−101)/1θT1:1θ
1≦1θT1水平輪 一〇二その11′ 4F)1LL 曲輪特III (C,D、S、Z)のうちの1つの関連
度は、曲輪枝を3つの等しい区分に分割することによっ
て決定され、ここで各曲線特徴に対して各区分上におい
て好ましい方向が定−される。曲線特徴の関連度は、そ
の俵各区分において点の数に標準化された好ましい方向
を満足する枝点の数を数えることにより得られる。第7
図は、理想化されたC曲線に対する好ましい方向を示す
。
):lθ121θマ1!直纏 一〇五その他 f H−(l 0丁 1−101)/1θT1:1θ
1≦1θT1水平輪 一〇二その11′ 4F)1LL 曲輪特III (C,D、S、Z)のうちの1つの関連
度は、曲輪枝を3つの等しい区分に分割することによっ
て決定され、ここで各曲線特徴に対して各区分上におい
て好ましい方向が定−される。曲線特徴の関連度は、そ
の俵各区分において点の数に標準化された好ましい方向
を満足する枝点の数を数えることにより得られる。第7
図は、理想化されたC曲線に対する好ましい方向を示す
。
曲線特徴のより詳細な分析は、第16図、第17図、第
18図および第19図の議論から明らかであろう、第1
6図は、使用されている区分化の方法を示すために手当
たり次第に選ばれた角型的な0曲線を示す1区分は、次
に示す索引(第16図に示されている)によって定義さ
れるようにばば等しく分割されている。
18図および第19図の議論から明らかであろう、第1
6図は、使用されている区分化の方法を示すために手当
たり次第に選ばれた角型的な0曲線を示す1区分は、次
に示す索引(第16図に示されている)によって定義さ
れるようにばば等しく分割されている。
区分5−EGI:1からMD3
区分5EG2: (MD3+1>から(MD3+MDM
) 区分5EG3: (MD3+MDM+1)から(MO−
1) ここでMD3− (MD−1>/3 :MDM−(M2
9− D−1) −2MD3 :およびMDは枝の良さである
。2つのベクトルIXDおよびIYDは次のように定義
される。
) 区分5EG3: (MD3+MDM+1)から(MO−
1) ここでMD3− (MD−1>/3 :MDM−(M2
9− D−1) −2MD3 :およびMDは枝の良さである
。2つのベクトルIXDおよびIYDは次のように定義
される。
IXD(1)−IX(1+1)−1X(1)IYD(1
) −1Y(1+1)−1Y(1):1−1.2.−、
MD−1 ここでIX8よびIYはXおよびYの枝座標を表わす、
IXDG−8各する+1および一1項は、それでれ枝を
横切っての右および左の動きを意味する。
) −1Y(1+1)−1Y(1):1−1.2.−、
MD−1 ここでIX8よびIYはXおよびYの枝座標を表わす、
IXDG−8各する+1および一1項は、それでれ枝を
横切っての右および左の動きを意味する。
IYDにおける+1および一1項は、それでれ枝を横切
っての下および上の−きを意味する。
っての下および上の−きを意味する。
2つの計数ベクトルIXRおよびIXTがこのシステム
に採用されている。ベクトルIXRは、各区分における
上下左右の動きの数の計数を包含する。ベクトルIXT
&t、各区分における記入事項の数の計数を包含する。
に採用されている。ベクトルIXRは、各区分における
上下左右の動きの数の計数を包含する。ベクトルIXT
&t、各区分における記入事項の数の計数を包含する。
各特徴テンプレートは、各区分において好ましい方向に
お番する0でない記入事項を有するベクトルによって定
義される。第17@および第18図は計数ベクトルIX
R,IXTを示し、第19図はテンプレートベクトルの
30− 例を示す、−例として、第19図の最初の行におけるD
テンプレートを考えてみると、それは区分1.2および
3における右、下および左の好ましい−きにそれぞれ対
応している索引1.9および6におけるOでない旧人事
項を有する。IXRによって与えられる枝の好ましい動
きとそのテンプレートXによって定義される各特徴の好
ましい動きとの相関関係は、次に示すRxで与えられる
。
お番する0でない記入事項を有するベクトルによって定
義される。第17@および第18図は計数ベクトルIX
R,IXTを示し、第19図はテンプレートベクトルの
30− 例を示す、−例として、第19図の最初の行におけるD
テンプレートを考えてみると、それは区分1.2および
3における右、下および左の好ましい−きにそれぞれ対
応している索引1.9および6におけるOでない旧人事
項を有する。IXRによって与えられる枝の好ましい動
きとそのテンプレートXによって定義される各特徴の好
ましい動きとの相関関係は、次に示すRxで与えられる
。
1
ul
枝は、Rxを最大にするXと組合わされた特徴に劇当て
られ、ここでX−テンプレートからのOoC・・・であ
る。
られ、ここでX−テンプレートからのOoC・・・であ
る。
ルー の
ループ特徴の関連度は、枝の最下部YTOP%および最
下部Yaoy境界に関して節の相互の位置によって決定
される1位置のしきい値YTHは、YTOPおよびYa
ot閣で選定される(第8図参照)、関連度は次のとお
りである。
下部Yaoy境界に関して節の相互の位置によって決定
される1位置のしきい値YTHは、YTOPおよびYa
ot閣で選定される(第8図参照)、関連度は次のとお
りである。
foa−(Y−YyH)/(YtHYvop):Y≧Y
TH −〇=その飽 f o a ” (Yv H−Y) / (Y″&@T
−YTH):Y<YTH −〇:その他 コー0 枝特徴は文字の構造を記述するのに使用される。
TH −〇=その飽 f o a ” (Yv H−Y) / (Y″&@T
−YTH):Y<YTH −〇:その他 コー0 枝特徴は文字の構造を記述するのに使用される。
2つの枝は共通の節を有しているかどうかについて一連
しているといえる0文字コード(構造ニード)は、すべ
ての関連している枝特徴およびそれらの対応する節対の
連鎖また紘直列の結合である。
しているといえる0文字コード(構造ニード)は、すべ
ての関連している枝特徴およびそれらの対応する節対の
連鎖また紘直列の結合である。
第911は、数字に対する典型的な文字コードを示す1
文字コード鉢、許容できる歪みを含む方法で文字の等価
なりラスを定義する。新しい文字コードは、特徴におい
て新しい一連が見い出されるに従って簡単に加えられ、
かつ発生目数が減少するに従っτ連成されたり削除され
たりする。許容できる文字コードのテーブルは、索引テ
ーブル22において発生させられかつ記憶される。その
テーブルに記憶されたコードμ文字コードの唯一の表現
である。第ルベルの認識は、単純なテーブルの調査、す
なわち、構造整合によって達成される。
文字コード鉢、許容できる歪みを含む方法で文字の等価
なりラスを定義する。新しい文字コードは、特徴におい
て新しい一連が見い出されるに従って簡単に加えられ、
かつ発生目数が減少するに従っτ連成されたり削除され
たりする。許容できる文字コードのテーブルは、索引テ
ーブル22において発生させられかつ記憶される。その
テーブルに記憶されたコードμ文字コードの唯一の表現
である。第ルベルの認識は、単純なテーブルの調査、す
なわち、構造整合によって達成される。
整合の結果は、ケース(1)直接整合、ケース(2)混
同したクラスまたはコードおよびケース(3)ノイズコ
ードとして先に確認した3つのケースのうちの1つとし
て表わすことができる。ケース(1)において、文字コ
ードは唯一のクラスを表わし1!麿は完了する。ケース
(2)において、文字コードは藁同コードと呼ばれると
ころのリフつかのクラスを表わしそしてこの混同を解決
するために特別の試論特徴が採用される。ケーi (3
)において、文字コードはコードテーブルの中にはなく
そしてそのコードはノイズコードと呼ばれる。
同したクラスまたはコードおよびケース(3)ノイズコ
ードとして先に確認した3つのケースのうちの1つとし
て表わすことができる。ケース(1)において、文字コ
ードは唯一のクラスを表わし1!麿は完了する。ケース
(2)において、文字コードは藁同コードと呼ばれると
ころのリフつかのクラスを表わしそしてこの混同を解決
するために特別の試論特徴が採用される。ケーi (3
)において、文字コードはコードテーブルの中にはなく
そしてそのコードはノイズコードと呼ばれる。
ケース(1)の文字コードが見い出されるとIIImは
完了する。混同コードまたはノイズコードが見い出され
ると付加的な処理が必要とされる。
完了する。混同コードまたはノイズコードが見い出され
ると付加的な処理が必要とされる。
11
各校は、1対の節を結合している各々の連続的な枝点の
x e V座標をコード化することによって表現される
@ X * V座標リストはともに1つの翼。
x e V座標をコード化することによって表現される
@ X * V座標リストはともに1つの翼。
33−
ソ座標リスト配列に詰められる。その配列はその後、各
校の長さを表示する表現を含むポインタ配列によって境
界が定められる。第1os−iaaおよび第108−2
図は、第10^−1図および第1・0^−2図において
示されている3つの文字の骨格表現を示す、試験の例に
おいては次の情報が記憶される。もちろん、ICLおよ
びIAuTは、この段鴎では未知の文字コードの処理か
らは湧常では入手できないであろう。
校の長さを表示する表現を含むポインタ配列によって境
界が定められる。第1os−iaaおよび第108−2
図は、第10^−1図および第1・0^−2図において
示されている3つの文字の骨格表現を示す、試験の例に
おいては次の情報が記憶される。もちろん、ICLおよ
びIAuTは、この段鴎では未知の文字コードの処理か
らは湧常では入手できないであろう。
ICL、 IALJT、 MB、 K1. K
2. 夏 L。
2. 夏 L。
九、 IX、 IY
ここで、ICL :クラスコード
IAUT :Iilコード
MB :枝の数
に1 :使用されな1I)10個の要素配列
に2 :各節対の符号を含む10−の要素配列
IL 二枝の数よりも1大きいものLB :各
校の長さを含む10個の34− W章配列 IX、IY:各枝点の×、y座標をそれでれ含む100
−の要素配 列 第10B−1図および第108−2図における最初の記
録は次の、情報を含む。
校の長さを含む10個の34− W章配列 IX、IY:各枝点の×、y座標をそれでれ含む100
−の要素配 列 第10B−1図および第108−2図における最初の記
録は次の、情報を含む。
1、 1OL−4; 文字は4である。
2、 IAuT−778: 11778によって
書かれている。
書かれている。
3、 MS−2: 文字は2つの枝を有する。
4、 K1−空配列
5、 に2(1)−11,に2(2)−12:第1およ
び第2の枝は、それぞれ節対(1=、 1 )および(
1,2)に接続されている。
び第2の枝は、それぞれ節対(1=、 1 )および(
1,2)に接続されている。
6、 IL−3
7、1B(2)−42,LB(3)−11;第1および
第2の枝は、それぞれ長さ42および11である。
第2の枝は、それぞれ長さ42および11である。
8、 そこには2つの枝がある。
枝1−((IX(1)、IY(1))。
(IX (2)、IY (2)’)、−。
(EX (42)、 IY (42))−((19
,24>、 (18,24)、−、(20,24)) 枝2−<(IX(43)、IY(43))、 (EX
(44))、−。
,24>、 (18,24)、−、(20,24)) 枝2−<(IX(43)、IY(43))、 (EX
(44))、−。
(IX (53)、 IY (53))−((20
,25)、 (20,26)−、(21,35)) 4.8および9に対する文字コードのコンピュータコー
ドが、関連した大きさの情報および試験例において利用
できるように示されているICLおよび1^LITとと
もに第100IIにおいて示されている。しかし、xc
t−sよび■AUT&t、未知の文字コードからは正常
で&を知ることができないであろう。
,25)、 (20,26)−、(21,35)) 4.8および9に対する文字コードのコンピュータコー
ドが、関連した大きさの情報および試験例において利用
できるように示されているICLおよび1^LITとと
もに第100IIにおいて示されている。しかし、xc
t−sよび■AUT&t、未知の文字コードからは正常
で&を知ることができないであろう。
ICL、IAUT、Me、に1.に2.LN。
IHT、IWT
ここでIOL :クラスコード
IAUT:1者コード
MB :枝の数
に1 :各校のコードを含む10個の要素配列
に2 :各校に対応する各節対の符号を含む10個の
要素配列 LN :各校の長さを含む10−の要素配列 IHT :各校の高さを含む10−の要素配列 IWT :各校の幅を含む10儂の要素配列 第10C図における最初の記録は次の情報を含む。
要素配列 LN :各校の長さを含む10−の要素配列 IHT :各校の高さを含む10−の要素配列 IWT :各校の幅を含む10儂の要素配列 第10C図における最初の記録は次の情報を含む。
1、 ICL−4:文字は4である。
2、 IAUT−778:1者778によって書か
れている。
れている。
3、 MB−2二文字は2つの枝を有する。
4、 K1 (1)−13,Kl (2)−2;第1
および第2の枝は、それぞれ13および2としてコード
化される。
および第2の枝は、それぞれ13および2としてコード
化される。
5、 K2(1)−11,に2 (2) −12:3
7− 第1および第2の枝は、それfれ節対(1,−1)およ
び(1,2)に接続されている。
7− 第1および第2の枝は、それfれ節対(1,−1)およ
び(1,2)に接続されている。
6、 LN(1)−42,LN(2)−11:第1お
よび第2の枝は、それぞれ長さ42および11である。
よび第2の枝は、それぞれ長さ42および11である。
7、 1HT(1)−19,IHT(2)−11:第1
および第2の枝は、それでれ真619および11である
。
および第2の枝は、それでれ真619および11である
。
8、 IWT(1)−14,1WT(−2)−2:
第16よび第2の枝は、それぞれ暢14および2である
。
第16よび第2の枝は、それぞれ暢14および2である
。
コー0の −ス
第10^−11iおよび第1OA−211は、このシス
テムに従うて分析されたとき同一の文字コーt’t6t
)8V(12)−OA(11)!生ずる3つの異なった
文字4,8.9を示し、混同したコードまたはクラスを
包含するケース(2)の状態である。この状態によって
与えられた混同を解決するために、詳纏な特徴を含む特
別な試験が32で示されている■同コード処S装置(第
111)&−38− よって使用される。−例として、次の特徴が、4゜8お
よび9の−で識別するの玉伴う混同を解決するために用
いられる。
テムに従うて分析されたとき同一の文字コーt’t6t
)8V(12)−OA(11)!生ずる3つの異なった
文字4,8.9を示し、混同したコードまたはクラスを
包含するケース(2)の状態である。この状態によって
与えられた混同を解決するために、詳纏な特徴を含む特
別な試験が32で示されている■同コード処S装置(第
111)&−38− よって使用される。−例として、次の特徴が、4゜8お
よび9の−で識別するの玉伴う混同を解決するために用
いられる。
1、 ストロ−゛り幅比STR,これは、枝8の平均ス
トローク幅の枝OAの平均ストローク幅に対する比率で
ある。この特徴は、4および9に対しては小さいが8に
対しては大きい。
トローク幅の枝OAの平均ストローク幅に対する比率で
ある。この特徴は、4および9に対しては小さいが8に
対しては大きい。
2、 枝幅比WTR,これは、枝OAの枝椙およびその
平均ストローク幅の枝Vの平均ストローク幅に対する比
率である。この特徴は、4および9に対しては大きいが
8に対しては小さい。
平均ストローク幅の枝Vの平均ストローク幅に対する比
率である。この特徴は、4および9に対しては大きいが
8に対しては小さい。
3、 尖鋭率TR,これは、枝OAの左右の輪郭の上部
5つの部分の平均の枝OAの左右の輪郭の最大値に対す
る比率である。この特徴は、4に対゛しては小さいが8
および9に対しては大きい。
5つの部分の平均の枝OAの左右の輪郭の最大値に対す
る比率である。この特徴は、4に対゛しては小さいが8
および9に対しては大きい。
4、 枝OAの最大の左右の開隔の相対位IIPM、こ
の位置は、4に対しては枝の最下部に近く8および9に
対しては中間部のどこかにある。
の位置は、4に対しては枝の最下部に近く8および9に
対しては中間部のどこかにある。
上述した特別の試験特徴を用いる4、8および9に対す
る分類は以下に示す。
る分類は以下に示す。
ouL 亀 ouL
文字’−V(12)−OA(11) 8’!’R9
141A?R(?H42/182T143文字8 m
V(12)−OA(11) g’l’R>’!!’H
1llAWTR≦182−分類の意味論の部分は、境界
がしきい値によりて定義基れる断片状の直轄領域を定義
する。もし特徴が適切に設計されていれば□、この慎域
は充分膜分離されるであろう、しきい値パラメーター、
非常に安定であり決定は大して臨界的ではないであろう
、− 各校特徴に対しては、抽出できる有限の数り特性がある
のみである。いくつかの$IIIJI的な特徴線、長さ
、平均ストローク幅、ストローク幅標準偏差。
141A?R(?H42/182T143文字8 m
V(12)−OA(11) g’l’R>’!!’H
1llAWTR≦182−分類の意味論の部分は、境界
がしきい値によりて定義基れる断片状の直轄領域を定義
する。もし特徴が適切に設計されていれば□、この慎域
は充分膜分離されるであろう、しきい値パラメーター、
非常に安定であり決定は大して臨界的ではないであろう
、− 各校特徴に対しては、抽出できる有限の数り特性がある
のみである。いくつかの$IIIJI的な特徴線、長さ
、平均ストローク幅、ストローク幅標準偏差。
縦横比、5つの方向の連鎖コード(ここ〒は、分解能を
^めるため、枝は3つの代わりに5つの区分に部分され
る。)、5つの平均ストロク幅。
^めるため、枝は3つの代わりに5つの区分に部分され
る。)、5つの平均ストロク幅。
ループ枝の尖鋭差などである。これらの特別な試験の(
詳報な)特徴は丁゛一度混同したケース(2)が見い出
されると、各々のそのような混同上たクラスの分類にお
いて特徴が利用できるようにするため、予め計算され得
る。
詳報な)特徴は丁゛一度混同したケース(2)が見い出
されると、各々のそのような混同上たクラスの分類にお
いて特徴が利用できるようにするため、予め計算され得
る。
ノ コー°の ケース3
上記ケース(3)のノイズコードは、コードテーブルの
中にないコードである。2種類のノイズコードがある。
中にないコードである。2種類のノイズコードがある。
すなわち、タイプ(a)は、元のコードテーブル−には
含まれておらず、後で加えられ得る確かな構造を有する
ノイズコードであり、タイプ(b)は、確かな構造を有
していないノイズコードで゛あり、それはその構造を確
かなものにするためのノイズ処理を必要とする。
含まれておらず、後で加えられ得る確かな構造を有する
ノイズコードであり、タイプ(b)は、確かな構造を有
していないノイズコードで゛あり、それはその構造を確
かなものにするためのノイズ処理を必要とする。
自由な手書き文字認識におけるノイズ問題の検討により
、上記タイプ(b)のノイズは一次的には個々の書き万
機式または前処理によってもたらされることが明らかと
なる。II々の様式は人が寵く方法に原因があり、それ
は第11図Ora」で示されるような付加的なループお
よび拡張された枝のようなものに帰着する。前処理の同
層は、しきい値の不適切な選択のため(第12図)また
は不適当な平滑化のため(第13図)により起こる。
、上記タイプ(b)のノイズは一次的には個々の書き万
機式または前処理によってもたらされることが明らかと
なる。II々の様式は人が寵く方法に原因があり、それ
は第11図Ora」で示されるような付加的なループお
よび拡張された枝のようなものに帰着する。前処理の同
層は、しきい値の不適切な選択のため(第12図)また
は不適当な平滑化のため(第13図)により起こる。
しきい値(第1211)の不適当な選択に起因す41−
るノイズ1III&を次の原因となる。すなわち、(a
)浸蝕または骨格化処理が施された後に小゛さな抱に帰
着する文字ストロークにおけるピンホール。
)浸蝕または骨格化処理が施された後に小゛さな抱に帰
着する文字ストロークにおけるピンホール。
tb)多数の枝をループ内に発生させている枝の橋渡し
またはループの部分的な充満のための不所望の枝、(O
)文字のストロークに沿った不均一の灰色レベル強度の
ための必要な枝の除去である。
またはループの部分的な充満のための不所望の枝、(O
)文字のストロークに沿った不均一の灰色レベル強度の
ための必要な枝の除去である。
第12図は、不適当なしきい値設定のいくつ卆の効果を
示す、他方では、不適当な平滑化は、第13図に示した
ような不所望の付着した短い枝のようなごつごりした端
を生じさせる。
示す、他方では、不適当な平滑化は、第13図に示した
ような不所望の付着した短い枝のようなごつごりした端
を生じさせる。
ノイズコード処理のフローチャートは第14図に示す、
アルゴリズムは以下に示す。
アルゴリズムは以下に示す。
1、 RL<)OP−この処W装置は、文字の大きさ
に対して小さいと考えられるすべてのループを除去、す
る、残りの構造は索引コードテーブル中の構造と比較さ
れる。もし一致が検出されるとアルゴリズムは終了し、
そうでなければMAXLOPに進む。
に対して小さいと考えられるすべてのループを除去、す
る、残りの構造は索引コードテーブル中の構造と比較さ
れる。もし一致が検出されるとアルゴリズムは終了し、
そうでなければMAXLOPに進む。
2、 MAXLOP−こ(D処S*tU、ルーフ42
− 中のすべての枝を除去する。残りの構造はコードテーブ
ル中の構造と比較される。もし一致が見い出されるとア
ルゴリズムは終了し、そうでなければRBLIBLEに
進む。
− 中のすべての枝を除去する。残りの構造はコードテーブ
ル中の構造と比較される。もし一致が見い出されるとア
ルゴリズムは終了し、そうでなければRBLIBLEに
進む。
3、 RBUBLE−この処Il@轍は文°字の大き
さに対して小さいと考えられるすべての泡を除去する。
さに対して小さいと考えられるすべての泡を除去する。
残りの構造はコードテーブル中の構造と比較される。も
し一致が見い出されるとフルヲリズムはIllし、そう
でなければADBR2に進む。
し一致が見い出されるとフルヲリズムはIllし、そう
でなければADBR2に進む。
4、 ADBR2−この処理装置は、正確に2つの枝
が付けられた各節を試験する。これらの2つの枝は連鎖
に対する候補者である。連鎖には2つの種類がある。す
なわち、永久的なものと非永久的なものである。永久的
な連鎖は、一度2つの枝が連鎖されると次の処理に1い
ては連鎖されたままであるということを意味する。非永
久的な連鎖は、連鎖および次に続く動作のための一連チ
ェックの後2つの枝は連鎖が解かれることを意味する。
が付けられた各節を試験する。これらの2つの枝は連鎖
に対する候補者である。連鎖には2つの種類がある。す
なわち、永久的なものと非永久的なものである。永久的
な連鎖は、一度2つの枝が連鎖されると次の処理に1い
ては連鎖されたままであるということを意味する。非永
久的な連鎖は、連鎖および次に続く動作のための一連チ
ェックの後2つの枝は連鎖が解かれることを意味する。
全体の枝の長さおよび枝のタイプに依存して、処理の順
序は以下のようになされる。
序は以下のようになされる。
畠) 全体の校長の増大している層−における2つの1
纏の枝は連鎖される。これは永久的な連鎖であり、第1
4・Ba1eよび第15Allにおいて「1」で示され
ている。
纏の枝は連鎖される。これは永久的な連鎖であり、第1
4・Ba1eよび第15Allにおいて「1」で示され
ている。
−) 全体の校長の増大している順序における纏およ
び自着の枝は連鎖される。これは非永久的な連鎖であり
、第148IIおよび第15811において「5」で示
されている。
び自着の枝は連鎖される。これは非永久的な連鎖であり
、第148IIおよび第15811において「5」で示
されている。
O) 全体の校長の増大している順序における2つの、
―纏枝は連鎖される。これは非永久的な連鎖であり第1
581iにおいて示されている。第15BIIa!2つ
のタイプの非永久的な連鎖を示す。
―纏枝は連鎖される。これは非永久的な連鎖であり第1
581iにおいて示されている。第15BIIa!2つ
のタイプの非永久的な連鎖を示す。
処理は、コードテーブル中で一致を生ずる処理順序で連
鎖を見い出そうとする。もし2以上の連鎖が見い出され
るとこれは不合格でありアルゴリズムは終了し、もし1
または0が見い出されるとRTIPに進む。
鎖を見い出そうとする。もし2以上の連鎖が見い出され
るとこれは不合格でありアルゴリズムは終了し、もし1
または0が見い出されるとRTIPに進む。
5、 RTIP−この処WIIlllは、枝を削除し
それ&tm箸的4―作である。もし充分に注意して行な
りな$すれば文字の構造゛を破壊するであろう。
それ&tm箸的4―作である。もし充分に注意して行な
りな$すれば文字の構造゛を破壊するであろう。
実際においては、削除され得る枝の長さを元の文字構造
の40%以下に制限すべきである。結合性を破壊するこ
となくmsされ得る3つのタイプの枝がある。すなわち
、 (a−)第118図におけるraJのような先端
の枝、(b)第11A図におけるraJのような大きい
ループの枝および(0,)大きい泡の枝である。処理の
順序は校長の増大している順序からである。枝の削除の
後に残りの構造は一致のために照合される。もし一致′
が見い出されないと影響を受けた節はそれに2つの枝だ
けが付けられているかどうかを決定するために照合され
る。もしそうであれば連鎖が与えられ残りの構′a&!
再び一致のために照合される。この処理は2つの構造の
一致が見い出されるまで続けられ、ADBR2における
ものを含む、もし2つの構造が見い出されると確信度す
なわち残りの校長の各構造の元の校長に対する比重は比
較される。もし低い確信度が成る量以下であれば高い確
信度の構造が選択さ、れる。
の40%以下に制限すべきである。結合性を破壊するこ
となくmsされ得る3つのタイプの枝がある。すなわち
、 (a−)第118図におけるraJのような先端
の枝、(b)第11A図におけるraJのような大きい
ループの枝および(0,)大きい泡の枝である。処理の
順序は校長の増大している順序からである。枝の削除の
後に残りの構造は一致のために照合される。もし一致′
が見い出されないと影響を受けた節はそれに2つの枝だ
けが付けられているかどうかを決定するために照合され
る。もしそうであれば連鎖が与えられ残りの構′a&!
再び一致のために照合される。この処理は2つの構造の
一致が見い出されるまで続けられ、ADBR2における
ものを含む、もし2つの構造が見い出されると確信度す
なわち残りの校長の各構造の元の校長に対する比重は比
較される。もし低い確信度が成る量以下であれば高い確
信度の構造が選択さ、れる。
第14B図は上述したアルゴリズムに従った操45−
作間の間係を表わす図表であり、「雑音のある」かつ識
別不可−の文字の骨格の様々な見本、その文字の操作後
およびそれ7m!別が行なわれる参照文字を示す。
別不可−の文字の骨格の様々な見本、その文字の操作後
およびそれ7m!別が行なわれる参照文字を示す。
11111138口m
第20AIIは読まれるべき書類上に現われるような一
連の手書き文字の代表である。第208図は、読取−お
よび処ll装置10を通しての処!ならびに纏纏器およ
びストローク幅分11114における一纏化の慢ブラウ
ン雪上に纏われるようなそれらの文字の骨格の代表であ
る。「5」および「8」以外の認識け、索引テーブル2
2および組合わされた原形構造テーブル40のみの使用
の結果により100%の確信度でなされ豐ることがわか
りた。「5」に対する直接の認識の結果における確信度
はおよそ83%であり「8」に対するそれはおよそ91
%である。この場合にお番する「5」および[8」の認
識は、ノイズ処11@置36における付加的な処理によ
り100%に達するであろう。
連の手書き文字の代表である。第208図は、読取−お
よび処ll装置10を通しての処!ならびに纏纏器およ
びストローク幅分11114における一纏化の慢ブラウ
ン雪上に纏われるようなそれらの文字の骨格の代表であ
る。「5」および「8」以外の認識け、索引テーブル2
2および組合わされた原形構造テーブル40のみの使用
の結果により100%の確信度でなされ豐ることがわか
りた。「5」に対する直接の認識の結果における確信度
はおよそ83%であり「8」に対するそれはおよそ91
%である。この場合にお番する「5」および[8」の認
識は、ノイズ処11@置36における付加的な処理によ
り100%に達するであろう。
46−
第21Allは、読まれるべき書類上に現われるような
印刷された文字の代表である。第218図は読取器およ
び処l!装置10を通しての処理ならびに輯纏器および
ストローク幅分析1114における細線化の後のそれら
の文字の骨格の代表である。
印刷された文字の代表である。第218図は読取器およ
び処l!装置10を通しての処理ならびに輯纏器および
ストローク幅分析1114における細線化の後のそれら
の文字の骨格の代表である。
この例においては、他のプリンタ文字フォントを採用す
る他の例におけるのと同じ<、&tWすぺτの文字に対
する結果←おける確信度は100%であることdわかっ
た。
る他の例におけるのと同じ<、&tWすぺτの文字に対
する結果←おける確信度は100%であることdわかっ
た。
以上を要約すると、自由な手書き文字およびさまざまな
様式の印刷文字の1!麿を可能にする゛技術が開示され
た。各文字は最初にその骨格および骨格における各点の
関連づけられたストローク幅情報の表現で記述される。
様式の印刷文字の1!麿を可能にする゛技術が開示され
た。各文字は最初にその骨格および骨格における各点の
関連づけられたストローク幅情報の表現で記述される。
骨格は文字コードによって表1Iされた文字(統合論情
報)の構造を抽出するのに使用され、そしてストローク
幅情報は識別関数によって表現される特別や試験特徴(
意味論情報)を抽出するのに使用される。
報)の構造を抽出するのに使用され、そしてストローク
幅情報は識別関数によって表現される特別や試験特徴(
意味論情報)を抽出するのに使用される。
与えられたクラスに対する既知の文字コードの収集およ
びそれらの関連づけられた識別関数からなるクラス分類
量が使用されている。一般的に言えば、クラス「×」に
対する分類器は次によって表わされる。
びそれらの関連づけられた識別関数からなるクラス分類
量が使用されている。一般的に言えば、クラス「×」に
対する分類器は次によって表わされる。
ここでNはクラスrXJにおける原形または様式の数で
ある1文字コードがただ1つのとき、すなわち文字−の
構造が文字クラスを単一に定義するとき識別関数は空で
ある1分1IIIIIIllは、文字コードおよびそれ
らの関連づけられた識別偶数の加算または減算の賽墨な
手段を提供する。入うてくる未知の文字は、未知の文字
の文字コードおよびそれの最良の応答を生ずる関連づ番
ツられた識別関数が最もよく一致する文字コードを含む
クラスに劇当てられる。
ある1文字コードがただ1つのとき、すなわち文字−の
構造が文字クラスを単一に定義するとき識別関数は空で
ある1分1IIIIIIllは、文字コードおよびそれ
らの関連づけられた識別偶数の加算または減算の賽墨な
手段を提供する。入うてくる未知の文字は、未知の文字
の文字コードおよびそれの最良の応答を生ずる関連づ番
ツられた識別関数が最もよく一致する文字コードを含む
クラスに劇当てられる。
任意の文字の骨格およびストローク幅情報の表現は、元
の文字がそれらから再び構成され得るという意味で完全
である。その表現は我々に、枝の数、ループの数、枝の
タイプおよび讐れらの結合性のような荒い幾何学的また
は位相数学的特徴を害烏に抽出する手段を提供する。そ
の1lIllはまた、枝肉のまたは枝閤の地域的なスト
ローク幅および局部の形状特徴を比較するような技術に
よりより詳細な特徴を抽出する手段を我々に提供する。
の文字がそれらから再び構成され得るという意味で完全
である。その表現は我々に、枝の数、ループの数、枝の
タイプおよび讐れらの結合性のような荒い幾何学的また
は位相数学的特徴を害烏に抽出する手段を提供する。そ
の1lIllはまた、枝肉のまたは枝閤の地域的なスト
ローク幅および局部の形状特徴を比較するような技術に
よりより詳細な特徴を抽出する手段を我々に提供する。
1つの文字について荒い特徴から報かい特徴へと必要と
する情報を抽出する能力は、開示された幾何学的III
IiM術の独特な特性のうちの1つである。
する情報を抽出する能力は、開示された幾何学的III
IiM術の独特な特性のうちの1つである。
第1111は、印刷された英数字の文字および自由な手
書き文字のような文字を処理するためのこの発明が関係
しているシステムを示すブロック図である。第2A図は
、見かけ上は互いに非常に興なっているけれども同じ文
字コードD(1,2>・D(2,3)を共有する4つの
自由な手書き文字「3」の見本を示す、第2B図は文字
(B1.B2)・(N1.N2)を定義するためにいか
にして節の組rN1.N2Jの構造が枝の組(B1゜B
2)の構造と粘合されるかを示す手書きの「9」49− の表示である。第3A図および第3B図は、混同コード
−の混同の解決を可能にするために分析される角および
窪みに関する朝かな特徴の例を示す。 第30.30および3E図は、文字構造の記述に重要な
3つの点の憫として端点、枝点および接合点を示す、第
4A、4Bおよび40図は、(A)曲線および輪、(B
)点または長さOの纏およびループならびに(C)2つ
の重輪に関する抑揚亭を示す、第5図は、特定の受取り
たデータが纏。 1纏またはループに関する情報を含んでいるかどうかを
確立するためにいかにして荒い位相数学的分類がなされ
るかを示すフローチャートである。 第6A図は、種々の絵画的表現に使用される分類な示す
図である。第6811は、0形状をした曲線のグループ
を示す図である。第7図は、理想的なC1纏の枝点を数
えるのに使用する好ましい方向を示す、第8図は、ルー
プ枝分類の基礎を示す図である。第9図は、クラスrO
Jから「9」を形成もている数字に対する文字コードを
示す典型的な文字の図である。第10AIIは、第1O
A−150− 図および第10A−211の関係を示す、第1OA−1
図は、このシステムに従って分析されたとき同一の文字
コードすなわちV(1,2)・0A(1,1)によって
表わされる2つの異なった文字r4J、r8Jを示し、
第1OA−211は、第3の文字「9」を示す、第10
8.10B−1およびl0B−211は、第10A、1
0^−1および10A−2図におけるr4J、r8Jお
よび「9」の骨格に関連しているる一ド情報の例i示す
、lllloC図は、第10A図のr4J、r8Jおよ
び「9」に対する文字コード情報のtS*ある。 第11図は、余分のループおよび枝の形をとっている手
書き文字に対する個々の書式の特性を示す。 第1211Iは、不完全に選定されたまたは不適当なし
きい値での操作に起因するいくつかの結果を示す、第1
3図は、不適当な平滑化の効果のうちの成るものを示す
。第14A111は、この発明にtりたノイズコード処
理のフローチャートを示す。第148Eは、第14A図
のフローチャートに従った操作の前後の文字の見本を示
す図である。第151− 5A図は永久的な連鎖の例を示し、第158m1は非永
久的な連鎖の例を示す、第16図は、この発明に従った
文字の区分化を表現するために連げれたAI!66 r
り52DJ h−7tt示す、第1711は、各区分に
おける上下左右の−きの数の計数に関する計数ベクトル
IXRを示す、第18図は、各区分における記入事項の
数の計数を包含する計数ベクトルIXTを示す、第19
11は、テン7レートベクトルの例を示す、第20A図
は、読まれるべき書類上に稠わ゛れるような処理される
べき一連の手書き文字を示す、lI20B図は、ストロ
ーク幅分析器において文字が細線化6れた俵にブラウン
雪上に現われるような第20A図の文字の骨格を示す、
第21A図は、読まれるべき書類上に現われるような一
連の印刷文字を示す、第218図は、処理の後にCRT
&:Wねれるような第21A図の文字の骨格を表わす。 図において、10&を読取器および処ll装値、14は
一纏器およびストローク幅分析器、18&を特徴抽出−
122は索引テーブル、32は漉同コー52− ド処理装置、36はノイズ処WI装置、40はIlll
l過構造テーブルる。 53− IG、2A。 FIG、3C,FIG、3D、 FIG、3E。 FIG、4B。 FIG、8゜ FIG、IOC。 ICL、 IAUT、 Me、 Kl、 K2. L
N、 I)IT、 IWTFIG、坦。 FIG、16゜ コ、196 ( ]1)noO100001OOIO 1CnOoOIOoolOO16
書き文字のような文字を処理するためのこの発明が関係
しているシステムを示すブロック図である。第2A図は
、見かけ上は互いに非常に興なっているけれども同じ文
字コードD(1,2>・D(2,3)を共有する4つの
自由な手書き文字「3」の見本を示す、第2B図は文字
(B1.B2)・(N1.N2)を定義するためにいか
にして節の組rN1.N2Jの構造が枝の組(B1゜B
2)の構造と粘合されるかを示す手書きの「9」49− の表示である。第3A図および第3B図は、混同コード
−の混同の解決を可能にするために分析される角および
窪みに関する朝かな特徴の例を示す。 第30.30および3E図は、文字構造の記述に重要な
3つの点の憫として端点、枝点および接合点を示す、第
4A、4Bおよび40図は、(A)曲線および輪、(B
)点または長さOの纏およびループならびに(C)2つ
の重輪に関する抑揚亭を示す、第5図は、特定の受取り
たデータが纏。 1纏またはループに関する情報を含んでいるかどうかを
確立するためにいかにして荒い位相数学的分類がなされ
るかを示すフローチャートである。 第6A図は、種々の絵画的表現に使用される分類な示す
図である。第6811は、0形状をした曲線のグループ
を示す図である。第7図は、理想的なC1纏の枝点を数
えるのに使用する好ましい方向を示す、第8図は、ルー
プ枝分類の基礎を示す図である。第9図は、クラスrO
Jから「9」を形成もている数字に対する文字コードを
示す典型的な文字の図である。第10AIIは、第1O
A−150− 図および第10A−211の関係を示す、第1OA−1
図は、このシステムに従って分析されたとき同一の文字
コードすなわちV(1,2)・0A(1,1)によって
表わされる2つの異なった文字r4J、r8Jを示し、
第1OA−211は、第3の文字「9」を示す、第10
8.10B−1およびl0B−211は、第10A、1
0^−1および10A−2図におけるr4J、r8Jお
よび「9」の骨格に関連しているる一ド情報の例i示す
、lllloC図は、第10A図のr4J、r8Jおよ
び「9」に対する文字コード情報のtS*ある。 第11図は、余分のループおよび枝の形をとっている手
書き文字に対する個々の書式の特性を示す。 第1211Iは、不完全に選定されたまたは不適当なし
きい値での操作に起因するいくつかの結果を示す、第1
3図は、不適当な平滑化の効果のうちの成るものを示す
。第14A111は、この発明にtりたノイズコード処
理のフローチャートを示す。第148Eは、第14A図
のフローチャートに従った操作の前後の文字の見本を示
す図である。第151− 5A図は永久的な連鎖の例を示し、第158m1は非永
久的な連鎖の例を示す、第16図は、この発明に従った
文字の区分化を表現するために連げれたAI!66 r
り52DJ h−7tt示す、第1711は、各区分に
おける上下左右の−きの数の計数に関する計数ベクトル
IXRを示す、第18図は、各区分における記入事項の
数の計数を包含する計数ベクトルIXTを示す、第19
11は、テン7レートベクトルの例を示す、第20A図
は、読まれるべき書類上に稠わ゛れるような処理される
べき一連の手書き文字を示す、lI20B図は、ストロ
ーク幅分析器において文字が細線化6れた俵にブラウン
雪上に現われるような第20A図の文字の骨格を示す、
第21A図は、読まれるべき書類上に現われるような一
連の印刷文字を示す、第218図は、処理の後にCRT
&:Wねれるような第21A図の文字の骨格を表わす。 図において、10&を読取器および処ll装値、14は
一纏器およびストローク幅分析器、18&を特徴抽出−
122は索引テーブル、32は漉同コー52− ド処理装置、36はノイズ処WI装置、40はIlll
l過構造テーブルる。 53− IG、2A。 FIG、3C,FIG、3D、 FIG、3E。 FIG、4B。 FIG、8゜ FIG、IOC。 ICL、 IAUT、 Me、 Kl、 K2. L
N、 I)IT、 IWTFIG、坦。 FIG、16゜ コ、196 ( ]1)noO100001OOIO 1CnOoOIOoolOO16
Claims (17)
- (1) 骨格およびストローク幅の特性を含む文字の畿
何学的特徴を表わす信号の形式でデータを処理するため
の文字ii+mシステムであって、前記信号から文字の
選択された特徴を表わしていiデータの形式で文字コー
ドを抽出する手段と、前記文字コードと既知の文字の文
字コードを表わすデータとを比較し、肯定的な識別がな
されれば識別された文字を示している出力信号を与える
手段とを含む、文字iimシステム。 - (2) 前記データの比較のための前記手段は、肯定的
な識別がなされなければ、 前記文字コードをくうに次の処理のために送る手段と、 前記文字コードの受取りに応答してそれの分析を行ない
かつ前記分析から発生された情報を組入れた変更された
文字コードを作るように結合されている処理手段と、 肯定的な識別を求めて前記変更された文字コードを前記
比較のための手段に送る手段とを含む、特許請求の範−
第1項記載の文字認識システム。 - (3) 前記゛データの比較のためめ前記手段は、肯定
的な識別がなされなければ、 前記文字コードをさらに次の処理のために送るための手
段と、 前記文字コードに応答するように結合されていて、文字
の肯定的な識別を確立するために同一の文字コードを有
する興なりた文字を讃則するために輻かな特徴試験を与
えるための一同コード処理装置を含む処理手段とを含み
、 前記濶同コード処W装置は前記識別された文字を示す出
力を与える、特許請求のlll1l第11jI記°載の
文字認識システム。 - (4) 前記処理手段は、 索引テーブル中のいずれかの文字クラスに属するものと
して直接的に認識されることができない文字コードを修
正するためのノイズコード処褒装置を含み、 前記ノイズコード処Il装置は、索引テーブルに比較お
よび識別のために送られるべき修正された文字コードを
与える、特許請求の範囲第2項または一#13項記載の
文字asiシステム。 - (5) ノイズコード処ll装置は、前記文字コードの
選択された要素を除去しかつ前記修正された文字コード
を発生する手段を含む、特許請求の範囲第4一記載の文
字認識システム。 - (6) 前記ノイズコード処I!装置は、正確に2つの
枝が付けられている文字コードの各節を試験し、 前記処理装置は、2つの枝を連鎖し、それらを1つの枝
に減じ、かつその結果の修正された文字を比較および識
別のために索引テーブルに送る、特許請求の範囲第5項
記載の文字認識システム。 - (7) ノイズコード処理装置は、索引テーブルにおけ
る一致が確保さiることなく2つの連鎖が企てられたと
いう事実で調査を特徴する特許請求の範囲第6項記載の
文字I!厘システム。 - (8) ノイズコード処ll装置は、結合性を破壊する
ことなく枝の部分を削除するための手段を含み、前記枝
は先端の枝、大きいループの枝および大きい泡の枝を含
む、特許請求の範囲第4項記載のi字iinシステム。 - (9)′ データが文字の幾何学的特徴を表わしている
信号の形式で受けられる書類処理機−に用いるための文
字認識システムであって、前記信号からの文字の独特な
特徴を表わしているデータを抽出するための手段と、 前記データを既知の文字の特徴を表わしているデータと
比較するための処W装置手段とを含み、前記処1ui装
置手段は、1つが識別されたとき特定の文字を示してい
る出力信号を与え、かつ、前記処l!装置手段は、どの
特定の文字も認識されないとき前記データを付加的な処
II!装置に送る、文字allシステム− - (10) データ″は、複数の稜点により相互に連結さ
れた節点を含む骨格の形状を表わし、かつ、データ抽出
のための手段は、纏、曲線およびループを表わすデータ
閤で識別するための手段を含む、特許請求の範囲第9璃
記載の文字1g1mシステム。 - (11) 付加的な処理装置は、 前記データの受取りに応答してそれの分析を行ない前記
分析から発生された情報を組入れた変更されたデータを
作り、かつ 前記データと既知の文字の特徴を表わしているデータと
を比較するために前記変更されたデータを前記処3!!
装置手段に送る手段を含む、特許請求の範囲第9項また
は第10項記載の文字認識システム。 - (12) 付加的な処理装置は、−前記変更されたデー
タに応答するように結合されていて、文字の肯定的な識
別を確立するために同一の文字コードを有する興なりた
文字囲で識別するために報かな特徴試験を与えるための
混同コード−処理装置を含み、 前記混同コード処Il@胃は識別された文字を示す出力
を特徴する特許請求の範囲第9項または5− 第10項記載の文字認識システム。 - (13) 前記処理手段は、処ll装置におけるどの文
字クラスに属するものとして直接的に識別され得ない文
字コードを修正するためのノイズコード処W装置を含み
、 前記ノイズコード処ll!ll1l!は、比較および識
別のために処S装置に送られるべき修正きれた文字コー
ドを特徴する特許請求の範囲第9項ま些は捧10項記載
の文字区議システム。 - (14) ノイズコード処l!装置は、前記文字コード
の選択された要素を除去し前記修正された文字コードを
発生させる手段を含む、特許請求の範囲第13項記載の
文字認麿システム。 - (15) ノイズコード処l!装置は、正確に2つの枝
が付けられている文字コードの各節を試験し、 前記処理装置は、2つの枝を連鎖し、それらを1つの枝
に減じ、かつ比較および識別のためにその結果の修正さ
れた文字を索引テーブルに送る、特許請求の範囲第13
項記載の文字msiシステム。 6一 - (16) ノイズコード処理装置は、索引テーブルにお
いて一致が確保されることなく2つの連鎖が企てられた
という事実で調査を特徴する特許請求の範囲第15項記
載の文字認識システム。 - (17) ノイズコード処理装置は、結合性を破壊する
ことなく枝の部分を削除することにより文字コードを修
正するための手段を含み、前記枝は先端の枝、大きいル
ープの枝および大きい泡の枝を含む、特許請求の範囲第
13項記載の文−!!FI!l!謙システム。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US30111781A | 1981-09-11 | 1981-09-11 | |
| US301117 | 1981-11-09 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5848183A true JPS5848183A (ja) | 1983-03-22 |
| JPH0440749B2 JPH0440749B2 (ja) | 1992-07-06 |
Family
ID=23162028
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57140476A Granted JPS5848183A (ja) | 1981-09-11 | 1982-08-11 | 文字認識システム |
Country Status (3)
| Country | Link |
|---|---|
| EP (1) | EP0079251B1 (ja) |
| JP (1) | JPS5848183A (ja) |
| DE (1) | DE3280099D1 (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01175847A (ja) * | 1987-12-30 | 1989-07-12 | Taihei Sansho:Kk | 治療用シート |
| JPH0358759U (ja) * | 1989-10-06 | 1991-06-07 | ||
| JPH04104894U (ja) * | 1991-02-15 | 1992-09-09 | コンデ株式会社 | 体温縫いぐるみ |
| CN115830634A (zh) * | 2022-11-30 | 2023-03-21 | 苏州大学 | 一种基于图元素的通用骨架检测方法 |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2553608B2 (ja) * | 1988-01-04 | 1996-11-13 | 住友電気工業 株式会社 | 光学文字読取装置 |
| JPH01246678A (ja) * | 1988-03-29 | 1989-10-02 | Toshiba Corp | パターン認識装置 |
| US5625710A (en) * | 1988-07-20 | 1997-04-29 | Fujitsu Limited | Character recognition apparatus using modification of a characteristic quantity |
| DE68928703T2 (de) * | 1988-07-20 | 1998-12-10 | Fujitsu Ltd., Kawasaki, Kanagawa | Buchstabenerkennungsvorrichtung |
| JPH032985A (ja) * | 1989-05-31 | 1991-01-09 | Hitachi Ltd | パターン識別方法および装置 |
| US4987603A (en) * | 1988-09-22 | 1991-01-22 | Glory Kogyo Kabushiki Kaisha | Recognition method for letter patterns |
| EP0600585A3 (en) * | 1992-11-20 | 1994-11-02 | Mutoh Ind Ltd | Freehand drawing identification system. |
| DE4308245C1 (de) * | 1993-03-16 | 1994-11-03 | Friedemann Groh | Verfahren zur Erkennung von Schriftzeichen oder Schriftzügen |
| CN102385707A (zh) * | 2010-08-30 | 2012-03-21 | 阿里巴巴集团控股有限公司 | 一种数字图像识别的方法、装置及爬虫服务器 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5341136A (en) * | 1976-09-28 | 1978-04-14 | Agency Of Ind Science & Technol | Pattern reading system |
| JPS54114050A (en) * | 1978-02-24 | 1979-09-05 | Nippon Telegr & Teleph Corp <Ntt> | Pattern recognition processing method |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5428248B2 (ja) * | 1974-10-21 | 1979-09-14 |
-
1982
- 1982-07-30 EP EP82401438A patent/EP0079251B1/en not_active Expired - Lifetime
- 1982-07-30 DE DE8282401438T patent/DE3280099D1/de not_active Expired - Lifetime
- 1982-08-11 JP JP57140476A patent/JPS5848183A/ja active Granted
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5341136A (en) * | 1976-09-28 | 1978-04-14 | Agency Of Ind Science & Technol | Pattern reading system |
| JPS54114050A (en) * | 1978-02-24 | 1979-09-05 | Nippon Telegr & Teleph Corp <Ntt> | Pattern recognition processing method |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01175847A (ja) * | 1987-12-30 | 1989-07-12 | Taihei Sansho:Kk | 治療用シート |
| JPH0358759U (ja) * | 1989-10-06 | 1991-06-07 | ||
| JPH04104894U (ja) * | 1991-02-15 | 1992-09-09 | コンデ株式会社 | 体温縫いぐるみ |
| CN115830634A (zh) * | 2022-11-30 | 2023-03-21 | 苏州大学 | 一种基于图元素的通用骨架检测方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| DE3280099D1 (de) | 1990-03-08 |
| EP0079251B1 (en) | 1990-01-31 |
| EP0079251A3 (en) | 1985-01-16 |
| JPH0440749B2 (ja) | 1992-07-06 |
| EP0079251A2 (en) | 1983-05-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Yu et al. | A generic system for form dropout | |
| Lai et al. | Detection of dimension sets in engineering drawings | |
| US5841902A (en) | System and method for unconstrained on-line alpha-numerical handwriting recognition | |
| EP0740263B1 (en) | Method of training character templates for use in a recognition system | |
| US5515455A (en) | System for recognizing handwritten words of cursive script | |
| CN112508011A (zh) | 一种基于神经网络的ocr识别方法及设备 | |
| Chen et al. | Handwritten character recognition using a 2-layer random graph model by relaxation matching | |
| KR19980023917A (ko) | 패턴 인식 장치 및 방법 | |
| JPS5848183A (ja) | 文字認識システム | |
| Amin | Recognition of hand-printed characters based on structural description and inductive logic programming | |
| MX2007010180A (es) | Importacion inteligente de informacion de la interfaz de usuario de aplicacion del exterior utilizando inteligencia artificial. | |
| Hansen | A Matlab Project in Optical Character Recognition (OCR) | |
| JPH08235341A (ja) | ドキュメントファイリング装置および方法 | |
| Casey et al. | Optical recognition of chemical graphics | |
| Den Hartog et al. | Knowledge-based interpretation of utility maps | |
| CN112766082B (zh) | 基于宏微观特征的中文文本笔迹鉴别方法、装置及存储介质 | |
| den Hartog et al. | Knowledge-based segmentation for automatic map interpretation | |
| ALshebeili et al. | Arabic character recognition using 1-D slices of the character spectrum | |
| Halder et al. | Individuality of isolated Bangla numerals | |
| Tou et al. | Automatic recognition of handwritten characters via feature extraction and multi-level decision | |
| Le et al. | Document classification using connectionist models | |
| Saeed et al. | Automatic recognition of handwritten Arabic using maximally stable extremal region features | |
| Amin | Recognition of printed Arabic text using machine learning | |
| Watt et al. | Recognition of Hand-Printed Numerals Reduced to Graph-Representable Form. | |
| JPH06103402A (ja) | 名刺認識装置 |