JPH03217996A - 手書き文字識別方法 - Google Patents

手書き文字識別方法

Info

Publication number
JPH03217996A
JPH03217996A JP2318195A JP31819590A JPH03217996A JP H03217996 A JPH03217996 A JP H03217996A JP 2318195 A JP2318195 A JP 2318195A JP 31819590 A JP31819590 A JP 31819590A JP H03217996 A JPH03217996 A JP H03217996A
Authority
JP
Japan
Prior art keywords
character
prototype
discrimination
characters
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2318195A
Other languages
English (en)
Inventor
Hamed A Ellozy
ヘイムド・アブデルファター・エロジィー
Henry H Jeanty
ヘンリー・ヘンリック・ジャンティー
Charles C Tappert
チャールズ・カーソン・タッパート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH03217996A publication Critical patent/JPH03217996A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24317Piecewise classification, i.e. whereby each classification requires several discriminant rules
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A.産業上の利用分野 本発明は一般に第1のプロトタイプ文字認識システムに
係り、特に対状(ρairtmise)識別測度を用い
た第1のプロトタイプ文字認識システムに関する。
B.従来の技術 対状識別法は第1のプロトタイプ文字を認識する方法と
して知られている。一般に、この方法は混同し易い1対
の文字を分離するため1つ以上の特殊な手順が用いられ
る。知覚研究から対状識別アルゴリズムが開発されてい
る。例えば、文字対の間を識別するために人が使用する
方法の研究から、機能的属性に基づく文字識別の理論が
開発されている。このような研究の例は以下に示す雑誌
に報告されている。ワイ・ワタナベ(YJatanab
e) +ジエー・ギョーバ(J.Gyoba) .ティ
ー・ヒラタ(T.旧ra ta)およびケー・マルヤマ
(K.Maruyama), ’不明瞭な文字の人認識
に対する心理学的方法」,J.rnst.TVEngr
s. of Japan, Vol.39. pp.5
09 〜515. 1985、およびワイ・ワタナベ(
Y.Watanabe) ,ジェー・ギジーバ(J.G
yoba)およびケー・マルヤマ(K.Maruyam
a)  r第1のプロトタイプカタカナ文字の認識作業
における反応時間と眼の運動:ハヤシの定量化による文
字認識の識別式解析の実験的検証」, Japanes
e J.Psychology, Vol.54. p
p.58〜51. 1983。第1のプロトタイプ文字
に係る若干の対識別方法が、ティー・サカイ(T.Sa
kai) + ケー・オダカ(κ. Odaka) +
およびティー・トイダ(T.Toida)らの「オンラ
イン第1のプロトタイプ文字入力装置の開発に向けての
幾つかの方法」,Proc. 7th Int. Co
nf. Pattern Recognition, 
pp.1052〜1054. 1984  およびシー
・ワイ・スーエン(C.Y.Suen)およびアール・
ジエー・シルマン(R.J.Shillman) らの
「大知覚のモデルに基づく無拘束手刷文字の低誤り率光
学的文字認識j,IEEE Trans. Syste
ms, Man and Cybernetics, 
vol.7, pp.491〜495, June 1
977に示されている。後者の文献では、U−V文字対
を区別するため線形識別式が使用され、また重み付け係
数が学習段階の間に決定される特徴の相対的重要性に従
って決定されることが報告されている。また、ビー・エ
ー・ブレッサ(B.A.Blesser) ,ティー・
ティー・ククリンスキー(T.T.Kuklinski
) + およびアール・ジエー・シルマン( R. J
. Sh i l lman) らは「文字認識の心理
学的理論に基づく特徴選択のための経験的テスト」, 
Pattern Recognition, VOl.
8! ρp.77〜85. 1976に、物理的属性,
知覚的属性,および機能的属性の概念に基づ《文字の理
論を開示している。刺激文字を見る人から良好率が得ら
れ、また各々の刺激に対して対象に沿って平均化するこ
とにより2つの平均良好率が得られた(pp.80〜8
1)。
ティー・エルーシエイク(T.El−Sheikh)ら
の「分離されたアラビア文字の自動認識J Signa
l Processing, Vol.14+ 2 M
arch 1988には線形識別機能に従う対状識別の
方法が示されている。しかしながら、線形識別機能は2
つのクラスの文字を分類できない場合があることが知ら
れている。これは特に、2つのクラスが類似した文字か
らなる場合に生じる。このような線形識別機能を用いる
ことにより生じる他の問題点として、対をなす両文字は
同様の表示を持たなければならないということがある。
これは、形状の輪郭のフーリエ級数表示の初めのn個の
係数を用いることにより実現されることが報告されてい
る。
ジー・タウセイント(G.Tousssain1)  
らの「英語テキストのクラスタ解析J , IEEE,
 197Bには文字,文字対などの分布が示されている
。なお、対状という用語はlO種類のテキストの対の間
の差を記述するために用いられている。
米国特許第3, 868. 635号明細書には専用ハ
ードウェアを用いて文字を認識するシステムおよび文字
の特徴の有無を計数する方法が示されている。
例えば、「U」または「v」のいずれかである未知文字
が与えられたとき、前記米国特許明細書に記載のシステ
ムはクラス「U」に属する未知文字の特徴数およびクラ
ス「v」に属する同様の特徴数を計数し、これらの計数
に基づいて判定がなされている。しかしながら、前記米
国特許明細書第3欄.第11〜14行に示されたように
、使用される特徴の種類に関しては何らの示唆も与えら
れていない。従って、前記米国特許は第1のプロトタイ
プ文字認識システムを意図するものではなく、フォント
が一般によく定義されている光学的文字認識システムを
意図するものと考えられる。
エー・ソム(^. Sow)らの[2進距離マトリクス
を使用する代表的パターンの選択方法について」,IE
EE Transactions on system
s+ Man and Cybernetics. V
ol.FMC−10, No.8+ August 1
980には代表的パターンを選択する非反復的方法が提
案されている。この方法はサンプル間のユークリッド距
離に基づくものである。しかしながら、ある文字対間の
ユークリッド距離の概念はほとんどまたは全く意味を持
たないことを示すことができる。例えば、2つのストロ
ークをもって書かれたときの文字対「T」および「十」
のストローク毎の比較は何らの差も示さない。2つの文
字の間の差はユークリッド距離関数を用いた場合は得ら
れないが、2つのストロークのトボロジー的関係を用い
た場合に得られる。即ち、この文字対に対して「べ−ス
ライン上の水平ストロークの高さ」という特徴は2つの
文字の間を識別するように作用する。
米国特許第3.111.646号明細書には筆記体文字
を測定する方法と装置が開示されている。この米国特許
明細書によれば、コンパレータが第1のプロトタイプ文
字の識別に関して常に明瞭な判定に達するものと明らか
に仮定しているが、よく知られるようにそうならない場
合がしばしばある。
C.発明が解決しようとする課題 従って、本発明の目的は、識別式の所定のインベントリ
から1つ以上の対状識別測度を自動的に選択する第1の
プロトタイプ文字認識システムを提供することにある。
本発明の他の目的は、識別式の所定のインベントリを展
開するときパターンにおける閉鎖度またはストロークの
直線性などの心理学的に重要な文字特徴を考慮した第1
のプロトタイプ文字認識システムを提供することにある
更に本発明の他の目的は、対状の識別測度を使用すると
共に1組のトレーニング文字から決定される標準偏差の
平均により除算された平均の差として提案された識別測
度に関わる良好値を決定する第1のプロトタイプ文字認
識システムを提供することにある。
更に本発明の目的は、対状の識別測度を使用すると共に
文字の識別に関する最終判定を行う際に特徴選択子の重
み付け出力を使用する改良識別式第1のプロトタイプ文
字認識システムを提供することにある。
D.課題を解決するための手段 上記従来の問題点および本発明の目的は、第1の文字を
類似の特性を有する第2の文字から区別する方法により
克服され、実現される。この方法は、(a)トレーニン
グセットにおける元の文字の発生回数(N)に係り、ま
たトレーニング文字の間を正しく区別する際のパーセン
ト精度(P)に係る所定のしきい値を満足する1つ以上
の識別式を選択するステップと、(b)識別式に係る良
好値(G)と(P)との積(p*c)に等しい重みを各
々の選択された識別式に割り当てるステップと、(C)
重みを加算して第1文字と第2文字とを識別するステッ
プとを含むものである。
トレーニングのセッションの間に、第1文字および第2
文字に係る少なくとも1つの識別測度は潜在的識別測度
と共に複数のプロトタイプ第1文字および複数のプロト
タイプ第2文字を評価するステップにより決定される。
次に、第1のプロトタイプ認識セッションの間に、この
方法は少なくとも1つの予め決定された識別測度と共に
第1プロトタイプ文字または第2プロトタイプ文字のい
ずれかであるとして識別された入力文字を解析する。
前記評価するステップは第1プロトタイプ文字および第
2プロトタイプ文字に係る良好値を計算するステップを
含んでいる。この良好値は、次式:良好値 平均(char1)一平均(char2)={平均(c
harm)十標準偏差(char2) ) / 2に従
って、第1プロトタイプ文字(char1)の平均値と
第21ロトタイプ文字(char2)の平均値との差を
第1プロトタイプ文字の平均との差を、第1プロトタイ
プ文字の標準偏差との平均で除した値として定義される
ものである。
更に前記評価ステップは、複数の条件が満足されること
が見出されたとき、1組の識別測度の中から潜在的な識
別測度を選択するステップを含んでいる。前記複数の,
条件には、<a)プロトタイプ文字のトレーニングセッ
トが複数の第11ロトタイプ文字と複数の第2プロトタ
イプ文字の各々の少なくとも(N)回の発生を与えるこ
とが見出されるという条件と、(b)潜在的な識別測度
がトレーニングセットのプロトタイプ第1文字とプロト
タイプ第2文字の少なくとも(P)パーセントを正しく
識別するという条件が含まれる。
E.実施例 } 第1図は、電子タブレッ}14と文字認識器l8の間に
結合されたセグメンテーションプロセッサ12を有する
文字認識システム10のブロック図である。
タブレット14には一連の適切な市販電子タブレットの
いずれかが用いられる。タブレット14は針またはペン
l5を備えており、これによりユーザは、ペン・ダウン
位置では、タブレット14の表面に版画または第1のプ
ロトタイプ英数字文字などのシンボルを形成する。タブ
レット14はx−yタブレット座標系上のペン15の位
置を表すX軸およびy軸出力信号を与える。ストローク
捕捉手段16は、タブレットからのx−y出力をしゃ断
してx−y位置対データを生成してセグメンテーション
プロセッサ12に供するソフトウェア作業を実行する。
セグメンテーションプロセッサには接続されたストロー
クおよび未接続ストロークを示すデータを出力し、これ
は本発明の文字認識器18に入力される。この文字認識
器18はストロークの接続グループの個性を決定するよ
うに動作し、英数字文字などの検証されたシンボルを表
す出力18aを与える。
ここで、本発明は、与えられたシンボルが少なくとも1
つのストロークからなる一連の第1のプロトタイプシン
ボルの認識に適用可能である。従ってシステム10は、
各種言語の筆記文字に関わるシンボル、および数学的シ
ンボルおよびその他の形態のシンボルを認識することが
できる。本発明は第1のプロトタイプシンボルのオンラ
イン,実時間認識への使用を意図してはいるが、単にそ
のような実時間システムに限定されるものではない。
以下に詳細に示すように、本発明の文字認識器18は対
状の識別測度を使用し、心理学的意味を有することが知
られる文字特徴選択子を考慮したものである。更に、こ
の文字認識器18は第1のプロトタイプ文字の同定に関
して最終判定を行う際に文字等選択子の重み付け出力を
使用する。
第1表は筆記英言語で混同の恐れがある文字対をリスト
したものである。対をなす文字の間で混同をもたらすも
のには閉鎖度やラインの拡張、またはその他の特徴など
がる。しかし、一般に、1つ以上の特徴により対をなす
文字を識別することができる。例えば、英語の場合、D
−P識別式はライン拡張の1つであるが、C−0識別式
は閉鎖の1つである。「#STRJ8は、文字を形成す
る一連のストロークを示している。
第1表 共通する混同に対する対状識別大文字= A−H C−L C−O D−P 3 1 1 1.2 閉鎖 他の特@(角対曲がり) 閉鎖 ライン拡張 O−U,V U一■ V一Y 1 ■ 2 閉鎖 他の特@(角対曲がり) ライン拡張 X−Y       2 小文字: a−u1 a−di,2 b−h1,2 c−el c−ol g−yl.2 h−nl,2 o−u,vl r−vl u−v’l x−y2 大文字/小文字: K−k    2.3 ライン拡張 閉鎖 ライン拡張 閉鎖 閉鎖,他の特徴 C−O参照 閉鎖 ライン拡張 0−U,V参照 他の特徴 U一V参照 X−Y参照 ライン拡張 (角) 数および文字/数二 0.0−6   1 4−9    1.2 ライン拡張,他の特徴 閉鎖,ライン拡張,他の 特徴の組合わせ G−6 3,  s−5 2,z−2 a−9 b−6 他の特徴 他の特徴(角対曲がり) 他の特徴(角対曲がり) ライン拡張 他の特徴 知覚的研究から得られたこのような識別式情報により、
本発明は第1表の文字対を分離すると共に区別する識別
測度を提供する。これらの識別測度は、ライン拡張,閉
鎖およびその他の特徴に対して、それぞれ、第2.3.
4表にリストされる。
これらの表は更に、特定の測度が適用される混同し易い
文字対もリストしている。識別測度は容易に得ることが
できる。また、これらの識別測度は通常は一般的な性質
を有しており、また数個の文字対を識別すると共に有用
な相補的識別式を有している。但し、第2.3.4表に
リストした識別式は多くの用途に有用に使用されるが、
全ての用途に対して最適ではなく、また全ての筆記者に
適用できるものではない。従って、本発明の教えは以下
にリストされる識別測度のみに制限されるものではなく
、以下の識別測度の導出例に従ってより広い範囲の応用
が与えられるものである。
表中、L(*)はラインセグメント(*)の長さの和で
あり、cg(*.)は重心(*),  H (*)はy
max (* ) −ymin (* ) , Wid
th はxmax(*)xmin(*)であり、またd
ist.は距離を略したものである。
宕 ← 吹 ← 次に、識別測度を決定する方法の例として、第2表の最
初の識別測度につき詳細に説明する。ライン拡張を最適
に測定する混同し易い文字対DPの提案された識別測度
は正確な形で次のように表される。
識別式 H(char) 第2図はこの識別測度を文字対D−Pに適用した例を示
し、第3a図.第3b図はそれぞれD−P識別に対する
確率分布を示したものである。簡単のため、第2表には
y(win of curved part of c
har)の代わりに、最後の点のy座標である’y(l
astp1)Jが再び用いられ、即ち、 となる。
本発明の一側面によれば、上記提案された識別測度は、
人によって一般的に考えられることが見出されている特
徴、特に「文字の最終点の相対高さ」に従って決定され
る。この一般的な識別式は次のような文字対を識別する
。即ち、1ストロークD−P,曲がりストロークが最後
のときの2ストロークD−P,低い水平ストロークが最
後のときのI−1,およびyのより短いストロークが最
後のときの2ストロークx−yを識別する。この識別式
は更に、有用な相補的識別式、即ち第2表からの「文字
の最初の点の相対高さ」および第3表からの相対幅を処
理する文字対を有している。
本発明の他の側面によれば、混同し易い文字対に関わる
識別機能は、提案された機能を特定し、この提案された
機能により一連の異なる文字対を解析することにより、
必要に応じて、自動的に選択される。この点で、自動選
択はアルファベットの独立性を保証することが見出され
ている。更に、特定の識別測度を先験的に特定すると、
文字形成のかなりの変化がアルファベット内で生じ得る
という問題が発生する。しかし、識別測度の自動決定に
はシステム10をかなりトレーニングする必要がある。
このようなトレーニング時間を減らすには、ユーザは混
同し易い文字の付加的なプロトタイプまたはサンプルを
入力することが要求される代わりに、通常混同される文
字対に対する潜在的候補識別測度が特定されてよい。
識別式を自動的に選択する他の方法としては、少なくと
も大文字.小文字のようなアルファベットやアラビャ数
字に対して識別式を手動で選択するものが考えられる。
この点で、知覚研究の間に最適として見出された識別式
を選択することができる。
識別測度を選択する際、また各々のプロトタイプに対し
ては、他のクラスの最も近いプロトタイプが決定される
。接近した文字対に対しては、以下に示すように本発明
に従って互いの所定しきい値内で1つ以上の識別測度が
決定される。各々のプロトタイプが少なくともN個の元
の文字の平均である2つのプロトタイプの各々に対して
は、平均および各々の識別式の標準偏差が決定される。
次に、各々の識別測度の「良好」偵が決定される。
この場合の良好値とは、次式: 良好値 ={平均(char1)士標準偏差(char2) )
 / 2に従って第1文字(char1)の平に従つて
、第1文字(char2)の平均との差を第1文字の平
均との差を、第1文字の標準偏差との平均により除した
値として定義される。
提案された識別測度は、識別測度の組に含まれるものに
対して、それらの良好値およびトレーニング用プロトタ
イプ文字を識別するそれらの能力にもとづいて選択され
る。文字対に関わり、選択されるべき提案された識別測
度に対しては、対をなす2文字の各々はトレーニングセ
ット中に少なくともN個のトークン( token)を
持たなければならず、また識別測度はトレーニング文字
の少なくとも(P)パーセントを分離または区別しなけ
ればならない。識別式判定に用いるしきい値は、(a)
排反確率分布に対するギャップ間の中間に設定されるか
、または(b)重畳する確率分布に供するトレーニング
データに対して最適認識を与えるように} 設定される。
第1のプロトタイプ認識字の識別測度の自動選択には使
用可能な識別機能のインヘントリ、即ち、文字間の適当
な差を測定する1組の識別機能が要求される。
識別式を自動的に選択する場合も、提案された識別測度
により分離されたプロトタイプ文字対のパーセントのカ
ントオフしきい値などの基準に基づいて良好な識別式の
みを注意深く選択する必要がある。これはまた十分なプ
ロトタイプデー夕が与えられることを意味する。例えば
、混同し易い文字対の各々の少なくとも12個のトーク
ンが見出されて識別測度を確立するための適切な結果を
与えている。
通常は、文字認識セッションの途中にエラスチックマッ
チングなどの手法が第1のプロトタイプ文字認識時に先
ず使用される。このエラスチックマッチング法がプロト
タイプとの整合を示す値に戻るときは、他の識別測度法
は要求されない。しかしながら、エラスチックマッチン
グ法があいまいな結果に戻ったときは、本発明の識別測
度法によりそのあいまいさは取り除かれる。勿論、エラ
スティックマッチング法から戻された値は、文字の同定
に関して最終決定を行う際に付加的な重み付け因子とし
て考えることができる。例えば、エラスチックマッチン
グに密接に関係する方法が、米国特許第4,317, 
109号明細書「オンライン実時間ベースで動作する第
1のプロトタイプ文字用パターン認識システム」に示さ
れている。
上記のような識別測度は次のように、また第4図のフロ
ーチャートに示されたように用いられる。
エラスチックマッチングなどの文字同定法の適用後、第
2の文字選択が残るときは1対の文字の間には混同が存
在している。第2の文字選択は、第2文字に関わる値が
近接している、即ち第1文字のあるしきい値内にあると
きに残ると考えられる。
本発明によれば、しきい値(N)および(P)を満足す
る全ての識別式はその良好値とトレーニングデータに関
する精度の積(p*c)に等しい重みが割り当てられ、
これらの重みは最終識別を行うために加算される。
例えば、第5表は文字「Z」と「2」を識別する例を示
したものである。エラスチックマッチング法は文字「Z
」を選択するが、対状識別法は正しい文字「2」を選択
する。一時的に同定された文字Z−2が用いられて所定
の識別機能で構成されたテーブルに割り付けられ、適当
な識別機能を選択する。このテーブルにおいては、各々
の識別機能はこれに関連して、第2表〜第4表に示した
ものと同様にして、1つ以上の適用可能文字対を有する
。Z−2の決定に際しては、しきい値N=12およびP
−95を満足する3つの識別式が同定され、選択される
。選択された機能によるストローク座標の解析から文字
「2」が得られる。
第5表 選沢 Z−2に対する識別式  PGP*G2 高さ/幅の比 95.6 2.87 273.9 第4図は本発明を用いた池の例を示すフローチャート図
である。図において、潜在的な識別機能が先ず決定され
る。例えば、閉鎖に基づいて文字対U−0を区別するた
め潜在的な識別機能が決定される。この例においては、
識別機能は、単一ストロークの最初および最後の点は「
O」の場合は比較的近接し、「U」の場合は更に離れる
べきであるという観察に基づいて与えられる。一連のプ
ロトタイプ文字、好適には少なくとも(N)個が潜在的
識別機能により逐次評価され、また混同し易い文字対に
対する提案された識別機能に対する良好値が上記のよう
に決定される。トレーニングに対するパーセント補正が
所定しきい値(P)、例えば95パーセントを越えたと
きは、識別機能は文字対に関わる識別機能のライブラリ
に収容される。この決定の間に、ストロークの直線性な
どの若干の識別式は、所定しきい値内に入るトレーニン
グに対するパーセント補正を有することが見出される。
従って、しきい値(P)以下になる潜在的識別機能はこ
れらの文字対には関わらないことになる。
例. N=12,  P=95の場合、大文字および小文字ア
ラビア数字,および特殊シンボルを含む1組の第1のプ
ロトタイプデータに対して次のような結果が得られた。
本発明の対状識別測度法によると、識別エラーは3.4
パーセント(21/619)だけ減少することがわかる
。この場合、元のエラーの10パーセントのみが認識器
に起因し、対状識別法は認識器に起因するエラーを約1
/3だけ低減させている。残るエラーの殆どは、人によ
っては認識され得ないあいまいに書かれた文字に起因す
るものである。
本発明の対状識別法は迅速且つ正確である。高速性は、
トレーニング中に大半の計算がなされることになる。即
ち、識別式の選択、それぞれの良好値の計算、パーセン
ト補正およびしきい値の決定は全て、認識過程自体では
なくトレーニング中に実行される。本発明の上記好適な
実施例においては個々の筆記者がそれぞれトレーニング
文字を入力して筆記者固有の識別機能を生成したが、本
発明の範囲内で多くの異なる筆記者により使用可能な一
般的な組の識別機能を与えることも可能である。
本発明の教えは、若干の従来方法の場合のように単一の
種類の文字表面に限定されるものではない。本発明の方
法は更に上記の線形識別機能に関わる問題点を解消する
ものである。更に本発明の教えは、「x」のような実際
の輪郭を持たない文字の識別、および多くのストローク
をもって書かれた文字の識別に有用である。
E.発明の効果 本発明によれば、対状識別法の精度及び速度を向上させ
ることができる。
【図面の簡単な説明】
第1図は本発明の実施に適した第1のプロトタイプ文字
認識システムのブロック図、 第2図は文字対D−Pの識別要素を例示する図、第3a
図および第3b図はD−P識別に対する代表的な確率分
布を示す図、 第4図は本発明の動作を示すフローチャートである。 10・・・・・文字認識システム 12・・・・・セグメンテーションプロセッサ14・・
・・・タブレット l6・・・・・ストローク捕捉手段 18・ ・文字認識器

Claims (1)

  1. 【特許請求の範囲】 (1)第2の手書き文字から第1の手書き文字を識別す
    る、手書き認識システムにおける方法であって、 トレーニングセットにおける元の文字の発生数(N)と
    トレーニング文字を正しく区別するに際してのパーセン
    ト精度(P)に関わる所定のしきい値とに関わる所定の
    しきい値を満足する1つ以上の識別式を選択するステッ
    プと、 前記識別式に係る良好値(G)と前記パーセント精度(
    P)との積(P×G)に等しい重みを選択された識別式
    の各々に割り当てるステップと、前記重みを加算して前
    記第1文字と第2文字とを識別するステップとを含む手
    書き文字識別方法。 (2)Gは、第1のプロトタイプ文字(char1)の
    平均と第2のプロトタイプ文字(char2)の平均と
    の差を、次式: 良好値 ={平均(char1)−平均(char2)}/{(
    標準偏差(char1)+標準偏差(char2))/
    2}に従って、第1のプロトタイプ文字の標準偏差と第
    2のプロトタイプ文字の標準偏差との平均で除算したも
    のとして定義される請求項1記載の手書き文字識別方法
    。 (3)(a)識別式判定のためのしきい値は、第1のプ
    ロトタイプ文字と第2のプロトタイプ文字の排反確率分
    布の間のギャップ内のほぼ中間にあると決定されるか、
    または(b)第1のプロトタイプ文字と第2のプロトタ
    イプ文字の重なり確率分布に対する正しい文字の最適認
    識を与えるように決定される請求項2記載の手書き文字
    識別方法。 (4)前記発生回数(N)は少なくとも約12であり、
    前記パーセント精度(P)は約95パーセントである請
    求項1記載の手書き文字識別方法。 (5)第2の文字から第1の文字を識別する、手書き認
    識システムにおける方法であって、 前記第1文字および前記第2文字に関わる少なくとも1
    つの識別測度をトレーニングセッション時に決定するス
    テップであって、複数の第1のプロトタイプ文字と複数
    の第2のプロトタイプ文字を潜在的な識別測度により評
    価するステップを含むステップと、 手書き認識セッションの間に、予め決定された識別測度
    の少なくとも1つにより第1のプロトタイプ文字または
    第2のプロトタイプ文字のいずれかであるとして識別さ
    れた入力文字を評価するステップとを含み、 前記決定ステップは第1のプロトタイプ文字および第2
    のプロトタイプ文字に関わる良好値を計算するステップ
    を含み、前記良好値は、第1のプロトタイプ文字(ch
    ar1)の平均と第2のプロトタイプ文字(char2
    )の平均との差を、次式:良好値 ={平均(char1)−平均(char2)}/{(
    標準偏差(char1)+標準偏差(char2))/
    2}に従って、第1のプロトタイプ文字の標準偏差と第
    2のプロトタイプ文字の標準偏差の平均で除算したもの
    として定義される手書き文字識別方法。 (6)前記決定ステップは複数の条件が満足されること
    がわかったとき潜在的な識別測度を選択するステップを
    含み、前記複数の条件には、(a)プロトタイプ文字の
    トレーニングセットが複数の第1のプロトタイプ文字と
    複数の第2のプロトタイプ文字の各々の少なくとも(N
    )回の発生を含むことが見出されるということ、(b)
    前記潜在的識別測度が少なくとも前記トレーニングセッ
    トの(P)パーセントの第1のプロトタイプ文字と第2
    のプロトタイプ文字とを正しく識別することが含まれる
    請求項5記載の手書き文字識別方法。 (7)識別式判定用しきい値は、第1のプロトタイプ文
    字および第2のプロトタイプ文字の排反確率分布の間の
    ギャップ内のほぼ中間にあるように決定される請求項6
    記載の手書き文字識別方法。 (8)識別式判定用しきい値は、第1のプロトタイプ文
    字および第2のプロトタイプ文字の重なり合う確率分布
    に対して正しい文字の最適認識を与えるように決定され
    る請求項6記載の手書き文字識別方法。 (9)前記発生回数(N)は少なくとも約12である請
    求項6記載の手書き文字識別方法。 (10)前記評価ステップは、1つ以上の予め決定され
    た識別測度に従って入力文字に関わるストロークまたは
    複数のストロークを解析するステップと、 各々の識別測度解析の結果を加算して各々の文字に対す
    る結果を得るステップと、 最大の結果値を有する文字を選択するステップとを含む
    請求項5記載の手書き文字識別方法。 (11)第1文字または第2文字のいずれかであると一
    時的に識別された手書き文字の識別を手書き認識システ
    ムを用いて決定する方法であって、文字を表す手書きス
    トロークまたは複数のストロークを入力するステップと
    、1組の対状識別測度から選択された1つ以上の対状識
    別測度に従ってストロークを解析するステップとを含み
    、前記選択された対状識別測度または複数の測度は、複
    数(≧N)の第1のプロトタイプ文字と複数(≧N)の
    第2のプロトタイプ文字に基づいて第1文字と第2文字
    を少なくとも(P)パーセント時間を正確に識別するよ
    うに予め決定されている手書き文字識別決定方法。 (12)各々の対状識別測度は1組の対状識別測度から
    選択され、これらの識別測度は、▲数式、化学式、表等
    があります▼ ▲数式、化学式、表等があります▼ から成り、ここに複数の文字対(PAIR)に対して各
    々の文字は一連のストローク(#STR)により形成さ
    れ、各々のストロークはxおよびy座標により定義され
    、また長さL(*)はラインセグメント(*)の長さの
    和であり、cg(*)は重心(*)、H(*)はyma
    x(*)−ymin(*)であり、Widthはxma
    x(*)−xmin(*)である請求項11記載の手書
    き文字識別決定方法。 (13)トレーニングセッションの間に文字対に関わる
    1つ以上の対状識別式を決定する初期ステップを含み、
    この決定ステップは潜在的な対状識別測度と共に複数の
    第1のプロトタイプ文字と複数の第2のプロトタイプ文
    字を評価するステップを含み、ここに前記決定ステップ
    は第1のプロトタイプ文字および第2のプロトタイプ文
    字に係る良好値を計算するステップを含み、また前記良
    好値は、次式: 良好値 ={平均(char1)−平均(char2)}/{(
    標準偏差(char1)+標準偏差(char2))/
    2}に従って、第1のプロトタイプ文字(char1)
    の平均と第2のプロトタイプ文字(char2)の平均
    との差を、第1のプロトタイプ文字の標準偏差と第2の
    プロトタイプ文字の標準偏差との平均で除した値として
    定義される請求項11記載の手書き文字識別決定方法。 (14)前記(N)は少なくとも約12であり、(P)
    は約95パーセントである請求項11記載の手書き文字
    識別決定方法。 (15)前記解析ステップは、 各々の選択された識別測度に、識別測度に係る良好値(
    G)と前記(P)との積(P*G)に等しい重みを割り
    当てるステップと、 前記重みを加算して第1文字と第2文字とを識別するス
    テップとを含む請求項13記載の手書き文字識別決定方
    法。 (16)前記解析ステップは、線形拡張、閉鎖、その他
    の特徴、およびそれらの組合わせからなる群から選択さ
    れた文字ストローク特徴に基づいて第1文字と第2文字
    とを識別する対状識別式を選択する初期ステップを含む
    請求項11記載の手書き文字識別決定方法。(17)前
    記解析ステップは、第1文字と第2文字とを可視的に識
    別するとき人により与えられることが知られる文字特徴
    に基づいて第1文字と第2文字とを識別する対状識別式
    を選択する初期ステップを含む請求項11記載の手書き
    文字識別決定方法。 (18)前記1つ以上の対状識別測度は入力文字の一時
    的識別に基づいて選択される請求項11記載の手書き文
    字識別決定方法。
JP2318195A 1990-01-12 1990-11-26 手書き文字識別方法 Pending JPH03217996A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/463,770 US5005205A (en) 1990-01-12 1990-01-12 Handwriting recognition employing pairwise discriminant measures
US463,770 1990-01-12

Publications (1)

Publication Number Publication Date
JPH03217996A true JPH03217996A (ja) 1991-09-25

Family

ID=23841304

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2318195A Pending JPH03217996A (ja) 1990-01-12 1990-11-26 手書き文字識別方法

Country Status (4)

Country Link
US (1) US5005205A (ja)
EP (1) EP0436819B1 (ja)
JP (1) JPH03217996A (ja)
DE (1) DE69027519T2 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5559895A (en) * 1991-11-08 1996-09-24 Cornell Research Foundation, Inc. Adaptive method and system for real time verification of dynamic human signatures
US5373117A (en) * 1992-08-10 1994-12-13 Ncr Corporation Method for reducing errors in a digitizer
US5337372A (en) * 1992-10-13 1994-08-09 At&T Bell Laboratories Method and apparatus for symbol recognition using multidimensional preprocessing at multiple resolutions
US5647022A (en) * 1992-10-13 1997-07-08 Lucent Technologies Inc. Method and apparatus for symbol recognition using multidimensional preprocessing and symbol sorting
US5625708A (en) * 1992-10-13 1997-04-29 Lucent Technologies, Inc. Method and apparatus for symbol recognition using multidimensional preprocessing
US5491758A (en) * 1993-01-27 1996-02-13 International Business Machines Corporation Automatic handwriting recognition using both static and dynamic parameters
US6366697B1 (en) 1993-10-06 2002-04-02 Xerox Corporation Rotationally desensitized unistroke handwriting recognition
EP0654755B1 (en) * 1993-11-23 2000-08-02 International Business Machines Corporation A system and method for automatic handwriting recognition with a writer-independent chirographic label alphabet
JPH09506730A (ja) * 1993-12-17 1997-06-30 クインテット、インコーポレイテッド 自動署名検証の方法
US5774586A (en) * 1994-05-04 1998-06-30 Ncr Corporation Method and apparatus for standardization of inputs to word recognition systems
US5602938A (en) * 1994-05-20 1997-02-11 Nippon Telegraph And Telephone Corporation Method of generating dictionary for pattern recognition and pattern recognition method using the same
DE69533479T2 (de) 1994-07-01 2005-09-22 Palm Computing, Inc., Los Altos Zeichensatz mit zeichen aus mehreren strichen und handschrifterkennungssystem
US5802205A (en) * 1994-09-09 1998-09-01 Motorola, Inc. Method and system for lexical processing
US5737443A (en) * 1994-11-14 1998-04-07 Motorola, Inc. Method of joining handwritten input
CN1102275C (zh) * 1994-11-14 2003-02-26 摩托罗拉公司 分解手写体输入的装置和方法
JP3744997B2 (ja) * 1996-01-12 2006-02-15 キヤノン株式会社 文字認識装置及びその方法
US5956409A (en) * 1996-04-29 1999-09-21 Quintet, Inc. Secure application of seals
US5909509A (en) * 1996-05-08 1999-06-01 Industrial Technology Research Inst. Statistical-based recognition of similar characters
US6320985B1 (en) * 1998-07-31 2001-11-20 International Business Machines Corporation Apparatus and method for augmenting data in handwriting recognition system
US6293139B1 (en) 1999-11-03 2001-09-25 Memc Electronic Materials, Inc. Method of determining performance characteristics of polishing pads
US7336827B2 (en) * 2000-11-08 2008-02-26 New York University System, process and software arrangement for recognizing handwritten characters
AUPR824401A0 (en) * 2001-10-15 2001-11-08 Silverbrook Research Pty. Ltd. Methods and systems (npw002)
US7734094B2 (en) * 2006-06-28 2010-06-08 Microsoft Corporation Techniques for filtering handwriting recognition results
US7724957B2 (en) * 2006-07-31 2010-05-25 Microsoft Corporation Two tiered text recognition
US20120216113A1 (en) * 2011-02-18 2012-08-23 Google Inc. Touch gestures for text-entry operations

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5725082A (en) * 1980-07-23 1982-02-09 Fujitsu Ltd Pattern recognition processing system
JPS6068483A (ja) * 1983-09-21 1985-04-19 Fujitsu Ltd 文字識別装置
JPS6089291A (ja) * 1983-10-19 1985-05-20 Sharp Corp 文字認識方式
JPS6355686A (ja) * 1986-08-27 1988-03-10 Nec Corp パタ−ン認識方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NO865239L (no) * 1985-04-26 1986-12-22 Battelle Memorial Institute Fremgangsmaate for sammenligning av en haandskrift med en referanseskrift.

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5725082A (en) * 1980-07-23 1982-02-09 Fujitsu Ltd Pattern recognition processing system
JPS6068483A (ja) * 1983-09-21 1985-04-19 Fujitsu Ltd 文字識別装置
JPS6089291A (ja) * 1983-10-19 1985-05-20 Sharp Corp 文字認識方式
JPS6355686A (ja) * 1986-08-27 1988-03-10 Nec Corp パタ−ン認識方法

Also Published As

Publication number Publication date
EP0436819B1 (en) 1996-06-19
DE69027519D1 (de) 1996-07-25
US5005205A (en) 1991-04-02
DE69027519T2 (de) 1997-01-23
EP0436819A3 (en) 1992-12-23
EP0436819A2 (en) 1991-07-17

Similar Documents

Publication Publication Date Title
JPH03217996A (ja) 手書き文字識別方法
US5854855A (en) Method and system using meta-classes and polynomial discriminant functions for handwriting recognition
US6052481A (en) Automatic method for scoring and clustering prototypes of handwritten stroke-based data
US5802205A (en) Method and system for lexical processing
Parui et al. Online handwritten Bangla character recognition using HMM
WO1997020284A1 (en) Method and system for velocity-based handwriting recognition
EP0564827B1 (en) A post-processing error correction scheme using a dictionary for on-line handwriting recognition
US5917941A (en) Character segmentation technique with integrated word search for handwriting recognition
Biswas et al. Writer identification of Bangla handwritings by radon transform projection profile
US12450934B2 (en) Systems and methods for handwriting recognition
Bhattacharya et al. An end-to-end system for Bangla online handwriting recognition
WO1996009607A1 (en) Handwritten pattern recognizer
Chaabouni et al. Fractal and multi-fractal for arabic offline writer identification
Tan An algorithm for online strokes verification of Chinese characters using discrete features
JP4958236B2 (ja) 手書きパターンを認識するための方法及び装置
JP4194020B2 (ja) 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
WO2017069001A1 (ja) プログラム、情報記憶媒体及び情報処理装置
JP7104965B2 (ja) プログラム及びクラスタリング装置
JP2671984B2 (ja) 情報認識装置
KR100414051B1 (ko) 문자의획인식방법
KR960001102B1 (ko) 수서인식 시스템에서의 케이스 혼동을 해결하는 방법
Wang et al. On-line signature verification using segment-to-segment graph matching
JP3446769B2 (ja) 文字認識装置
JP2001243425A (ja) オンライン文字認識装置およびオンライン文字認識方法
Mondal et al. Improved shape code based word matching for multi-script documents