JPS59123085A

JPS59123085A - 文字認識方法

Info

Publication number: JPS59123085A
Application number: JP58171439A
Authority: JP
Inventors: グレゴリ−・マ−チン・ベツドナ−; ジヨン・チヤ−ルズ・ハ−マン; マンスリ・セルヴアプライ・イエンガ−・ナラシマ
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1982-12-27
Filing date: 1983-09-19
Publication date: 1984-07-16
Also published as: EP0114996A2; CA1199407A; EP0114996A3

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔技術分野〕文字認識の分野では手書き文字を識別するための有効で
費用のかからない方法をもたらすことが望ましい。この
ような方法が見つかれば、中央演算処理場所で必要とさ
れる情報がまず遠隔位置で手書きで生成される状況の下
では非常に有用となるはずである。遠隔位置の手書き原
稿を自動的に読み取ることによって手書きの情報を中央
位置で書き直す必要をなくすことができれば、中央演算
処理システムとの直接対話が実現可能になる。本発明者
等は、大した費用をかけずに、かかるプロセスに使用で
きる方法を発見した。

〔従来技術〕

現在利用できる文字認識システムは、標準化ないし正規
化された字形の分析を試みるものである。

これらのシステムでは、原稿上の文字を走査して、一連
の２進ビット行として記録する。多くの場合、自然に書
かれた文字の占める面積は、認識を得るために必要な面
積よりも広い。余剰データ・ビットを記録し分析するこ
とは時間と費用がかかる恐れがある。これらの難点を避
けるため文字の認識が得られる範囲で文字の形をできる
だけ小さく再形成するのが通常である。普通このことは
、文字の「正規化」と呼ばれている。従来技術では、こ
の正規化プロセス中に文字を元の大きさの約１７２に縮
小するのが普通である。かかる文字サイズの縮小が意味
をもち有用となるには、それを効率のよい信頼できる認
識プロセスと組み合せることが不可欠である。

互いに区別できる文字の特徴を識別しようとする試みは
数多く行われてきたが、従来の手法は必ず非常に複雑で
費用のかかる認識技術を必要とするものであった。

１９７９年５月１５日発行のカワの米国特許第４１５５
０７２号には、非常に歪んだ文字を認識できる文字認識
装置が記載されている。しかし、カワの装置が効果を発
輝するには、文字の形を変えねばならない。カワの特許
では、文字を１行ずつ走査し、拡大率に応じて文字の水
平寸法を正規化する平均化アルゴリズムにもとづいて、
各行を修正ないし正規化する。こうすることによって、
歪んだ文字が歪んでいない形に似たものになり、カワの
認識論理と容易に調和÷きるものになる。

文字を正規化した後、カワは、各走査行中で文字の始め
と終りを測定し、始めと終りの中の部分を等しい６つの
間隔に分割する。次に、この等しい６つの間隔を、分類
コードに変換しなけれ２ばならない。始めと終りの位置
の値および分類コードを、標準文字を表すコード表と対
比することによって、文字の読みを識別することができ
る。カワの手順には、多数の欠点がある。第一に、認識
される文字を、文字が僅かしか歪んでいないようにする
精巧な文字正規化ルーチンにかける必要があり従って単
に文字を縮小して位置調整するだけの正規化装置には使
用できない。また、−行の始めと終りの位置の間の部分
を適正に分離するための実体的ゲーティング・タイミン
グ回路構成が必要である。

走査された情報の操作は、各行を順次扱うかあるいは他
の行と並行して扱うかに応じて時間または費用がかかる
。

〔発明の特徴〕

本発明者等は手書き文字の規格化された字形を分析し、
これらの文字を相互に区別する特性を識別するための新
規な方法を発見した。

本発明者等は、文字の論力的オーバーレーを共通りラス
の範囲内で最大にし、異なるクラスの文字の間の論理的
分離を向上させる多数の簡単な測定特性を発見した。［
文字のオーバーレー」という場合、手書きされた実際の
文字がどれだけ歪んでいても、特定の文字クラスについ
ては同一である文字の特性を指すことにする。明らかに
その文字クラスについては無条件に不変であり、他の文
字クラスには決して現れない文字の特徴を見つけること
ができれば、その特定の特徴を識別するだけでその文字
に対する完全なオーバーレーを得ることができる。

本発明は、カワの欠点を除くもので、又カワの技法とは
逆に最終認識プロセスから独立している。

本発明者等は認識すべき文字の正規化された形の複数回
走査から、複数の遷移測定値を引き出す、文字を認識す
る方法を開発した。

手書き文字をまず行列中の複数個のビットとして表し、
正規化された形に変換する。正規化プロセスは１本発明
の構成部分ではないので、ここでは説明しない。

文字が正規化された後、文字認識プロセスの次のステッ
プは、文字表示から遷移測定値を引き出すことである。

本発明者等は１文字を識別する際に、他の種類の測定値
も使用でき、文字の明確な識別を得るためにそれらが必
要となることも多いが、４種の遷移測定値が特に価値が
あることを発見した。本発明者等が特に有用であること
を発見した４種の基本的遷移測定値とは、前端白色部、
前端黒色部、遷移部、後端白色部の測定値である。

前端白色部側定値とはある文字の走査線の始めから走査
線中の黒色部の最初の瞬間までの間隔の測定値である。

前端黒色部側定値とは、走査線中の黒色部前端の始めか
ら走査線中の白色表現の次の瞬間までの間隔の測定値で
ある。

遷移測定値とは走査線中での黒色から白色への変更回数
の測定値である。これは、走査線がぶつかった黒線の数
を示す。

後端白色部側定値とは走査線中の最後の黒色表現から走
査線の終りまでの間隔の測定値である。

本プロセスにより、高さ１６走査線、幅１３ビットの正
規化文字を認識することが可能である。

各走査線に対する遷移測定値が、コードに従って１６ビ
ツトの遷移測定値バク１−ル中に記録される。

良好な具体例では、遷移測定ベクトルの最初の３ビツト
が走査線の前端黒色部の走行長さないし間隔を示し、次
の５ビツトが前端白色部走行長さを示し次の４ビットが
後端白色部走行長さないし間隔を示し、最後の４ビツト
がその行の黒色から白色への遷移の回数と性質を示す。

最後のグループ中の最初のピッ１〜は検出された黒色−
白色−黒色遷移の２つの黒色部分の間に白色ビットが複
数個あるかどうかを示すことができ、後の３ビツトは実
際に黒色−白色遷移の回数を示す。

〔実施例〕

本発明の良好な一実施例では、遷移測定値ベクトルは、
次のようにコード化されている。

Ｋノ五　　条件　　　　　　　指　　　　ボ１　　　オ
ン　　前端黒色部走行長さくＬＢＲＬ）＝３２　　　オ
ン　　ＬＢＲＬ＝４３　　　オン　　ＬＢＲＬ＞４４　　　オン　　前端白色部走行長さくＬＷＲＬ）＝２
５　　　オン　　ＬＷＲＬ＝３６　　　オン　　ＬＷＲＬ＝４ないし５７　　　オン　
　ＬＷＲＬ＝６８　　　オン　　ＬＷＲＬ＞６９　　　オン　　後端白色部走行長さくＴＷＲＬ）＝３
１０　　　　オン　　ＴＷＲＬ＝４ないし５１１　　　
　オン　　ＴＷＲＬ＝６１２　　　　オン　　ＴＷＲＬ＞６１３　　　オン　　黒色−白色−黒色遷移に対する複数
白色ビット（ＭＷＢ）１４　　　　オン　　黒色−白色一図遷移１５　　　　
オン　　黒色−白色−黒色遷移１６　　　　オン　　黒
色−白色一黒色一白色一黒色遷移この良好な具体例では
、−回のテーブル索引で遷移ａ１す定値ベクトルが得ら
れ、レジスター／バッファーに記憶される。このテーブ
ルは概念的には、それぞれ異なるビットの走査線組合せ
の一つを表す、２１１個のアドレスからなっている。統
合走査線の右側ＩＯビットにもとづく２１０個のアドレ
スをもつテーブルを使用することにより、テーブルのサ
イズは大幅に減少する。走査線の最初の３ピツ１〜から
の情報を収容するため、テーブルから得られる値を修正
して、走査線全体を表す最終的遷移ｎ１す定値ベクトル
をもたらす。文字「８」を表現するためのテーブル索引
手続きは、次のように表すことができる。

（以下余白）ビデオ・ビットのパターン　　　゛　　　′ベクトルＷ
ＷｌｉｌｌＮＷＷＢＢＢＢＷＷ１１　　　　　　０１０
０００１０１００００１００１ｉ１ＷＷｗＢＢＢＷＷＢ
ＢＷＩｉｌ　　　　　　　１００００１００００００１
０１０ＷＷＷＢＢＷＩＩＷＷＷＢＢＷ　　　　　　　０
０００１０００００００１０１０ＷＷｎＢＢＷＷＷＢＢ
ＷＷ　　　　　　　０００００１００００００１０１０
ｗｗｗｗｗＢｓｗＢＢｔｙｎ　　　　　　　ｏｏｏｏｏ
ｉｏｏｔｏｏｏｏｏｔ。

１ｉ１ＷＷＷＷｌＩＩＩＢＢＷｌｉｌｎ　　　　　　　
１０００００１００１０００１００ＷＷＷＷ１１１１１
ＷＢＢ１１ｎｌｉｌ　　　　　　　０００００００１０
１０００１００ＷＩＮ１１１１ＩＢＢＢＷＢＢＩＷ　　
　　　　　１００００１００１０００００１０１ＩＩＩ
ＩＢＢＢ’１ｉｌｌｉｌｌｌＢＢＷＷＷ　　　　　　　
　１００１００００１０００１０１０ＷＢＢＷＷＩＢＢ
ＷＷＷＩＮ　　　　　　　００００１００００１００１
０１０ＢＢＢＩＩＷＷＢＢＷＷＩＩＷＷ　　　　　　　
　１００００００００１００１０１０［３ＢＷＷｌｉｌ
ＢＢｎＷＷＩｄＷ　　　　　　　００００００００００
１０１０１０１１ＢＢＷＩＩＢＢＷＷＩＩＷＩＩＩＩ　
　　　　　　　００００１０００００１０１０１０１＋
Ｉ［３１１１１１ｉ１８ＢＷＷＷＷＷＷ　　　　　　　
００００１０００００１．．０１０１０ＷＢＢＢＢＢＢ
ＷＷＷＷＷＷ　　　　　　　　００１０１０００００１
００１００ＷＷＢＢＢＩ３ＷＷＩｄｌｔｌｌｌＷＷ　　
　　　　　　０１０１０００００００１０１００この文
字について得られた遷移測定値ベクトルを次に詳しく説
明するようにして１次の認識決定プロセスで利用するこ
とができる。

拘束されない文字パターンのストロークの幅、形、大き
さおよび向きの歪みを扱う場合に、遷移測定値の考え方
を用いれば認識論理に著しい不変性が付与される。

前端および後端白色部走行長さは、一般にパターンの外
部輪廓を定義する。組込みＯＲにより、パターン、形、
大きさにある程度の変動が許され、従って同じクラスの
パターンのオーバーレーがより望ましいものとなる。

黒化部走行長さは、ストロークの太さおよび長さ特性に
関する情報を与え、白色部走行長さを補足するのに必要
な次元深さを与える。連関する黒色部ゲーティングは、
スＩ−ロークの動揺を補償するが必要な垂直ストローク
と水平ストロークの分離は保持する、ストローク・オー
バーレー効果をもたらす。

ｌ）遷移の黒色部ゲーティングは、傾斜パターン、誤登
録パターン、歪んだパターンを補償する能力をもたらす
。遷移自体は固有の論理和効果をもたらし、同じクラス
のパターンを他のクラスから分離しながらオーバーレー
できるようにする。遷移は、パターンの大きさを効果的
に正規化しながら。

より激しい形の歪みを補償する。

実際に手書き文字を認識しようと試みる場合には、明ら
かに認識プロセスを実現するために利用できる全ての手
段を使用するのが、慎重なやり方である。本発明者等は
、認識プロセスのための方法をうまく組み合せることに
より明確な文字認識が非常に容易に得られることを発見
した。文字の明確な識別を受けるには遷移測定値ベクト
ルを正規化文字入力の解釈と組み合せて使用することに
よって文字を識別することが必要の場合が普通である。

その他の状況の下では１文字の識別を得るために、記録
された正規化イメージの他の特殊な特性を探し出すこと
が望ましいことがある。認識システムを１本発明者等が
開発したユニークな遷移測定値ベクトル体系を含めて、
これまでに開発された全ての識別技術を最大限に利用で
きるように設計するのが、本発明者等の意図である。

本発明者等が有用であることを発見したもう一つの識別
手段は、形状弁別機能の使用である。この機能は、実際
の文字パターンとそれに対応する形のより詳しい位相評
価を分析することによってより芝しい文字分離を分解す
るために特別に設計されている。この機能は文字クラス
の弁別をよくするため、遷移測定値定義域に重ねて設計
されている。

文字情報を正規化し、遷移測定値をとり、所定機能を決
定した後に、実際の文字識別プロセスが開始する。この
識別プロセスの良好な具体例では、文字識別性を得るた
めに論理ツリーと（９孔）検査機を使用する。論理ツリ
ーは、それぞれ識別すべき文字が特定の特徴ないし属性
をもってｔ）る力１を識別するように設計されている、
一連の論理モジュールからなっている。これらの一連の
論理モジュールを論理的に組み合せることにより５文字
が特定の識別性をもっているかどうかを確証することが
できる。これが実現されると、文字情報をその文字に対
する緊密に設計されたプール式と対比する事によって、
識別性を確認する。確認が得られる場合、文字は識別さ
れ認識される。確認が得られない場合、その文字が別の
表現を持ち得るかどうかを決定するために、次の処理を
行う。

この認識プロセスを図面に則してもつと詳しく説明する
。

第１図は、文字認識システムの全体を概念的に示したも
のである。手書き文字の情報をデジタル化原稿ビデオ信
号１に変換し、通信アダプター２を介して、データ処理
装置３に送る。デジタル化ビデオ信号にビデオ前処理４
を加えて、各文字に対する情報を他の文字から分離する
。この前処理　　　−により情報が充分に位置調整され
て、文字情報を含まない区域は、処理されず、良好なオ
ーノベーレー特性が維持される。　　　　　　　　　　
　　　〜前処理の完了後、文字情報を正規化する（５）
。

正規化によって各文字イメージの標準基本サイズが得ら
れ、その結果、信頼できるやり方でうまく比較を行うこ
とができるようになる。

文字が正規化された後、指定された遷移測定６を行う。

これらの測定から文字イメージ中の遷移の性質、頻度、
発生に関する情報が与えられる。

各行で特定の色が横切る間隔の遷移測定値も得られる。

正規化文字は、文字の形状弁別機能７を展開するのにも
使用される。例えば文字が数字「８」の特性である「左
の切込み」をもつことをシステムは認識できる。

文字の正規化の後に遷移測定値および形状弁別特徴の情
報を収集し、後で詳しく説明するように、論理ツリー検
査機８中の論理ツリーを用いて文字を識別する。論理ツ
リーによる識別の後輪理ツリー及び検査機８中の精密に
設計されたプール論理検査機中で文字識別を検査する。

第２Ａ図ないし２Ｅ図は若干の遷移測定値の例を示した
もので、同じ文字の２つの表現が非常に異なった形をし
ている場合でも特定の文字に対する測定値が相対的に一
様であることを立証するのに役立つ。

第２Ａ図は、数字「８」の３つの行の黒色（Ｂ）白色（
ＩＩ）遷移測定を示したものである。１行目は文字ｒＢ
ＷＢＪが示すように２つの黒色（Ｂ）部の間に１つの白
色（υ）部があることを示している。２行目では、文字
ｒＢＪが示すように一つの黒色遷移しか検出されない。

３行目は再び２−っの黒色部の間に１つの白色部がある
ことを示すｒＢＷＢＪ遷移を示している。すぐにわかる
ように文字「８」の２つのパターンは、非常に異なって
いるが、双方の与える遷移情報は、基本的に同じである
。この情報は、相対的に不変なので、文字の識別に非常
に有用である。

第２Ｂ図は、別の文字について遷移測定値が類似する２
つの行を示したものであり、やはり文字の形が変っても
遷移測定値によって決定される文字の特徴は余り変らな
いことを示している。

第２Ｃ図は前端白色部走行長さの測定がどう行われるか
を示したものである。正規化された文字を位置調整して
、その文字の少くとも若干部分が測定エツジに触れるよ
うにする。各走査行毎番二選択された行における位置調
整された文字のエツジと最初に呪われる黒色部の間の列
位置の数をカウントする。本発明者等は、測定の絶対値
自身よりも有用な、特定の測定値範囲を定義した。前述
した特定の良好な具体例では得られる測定値は、前端白
色部走行長さが２ビツト、３ビツト、４〜５ビツト　６
ビツト、または７ビツト以上である。

この測定値の指示がその行に対する遷移測定値ベクｌ−
ルの４番目〜８番目のビット位置に記憶される。

第２Ｄ図は、後端白色部走行長さくＴＷＲＬ）の測定を
示したものである。前述の特定の具体例における’］：
’ＷＲ’Ｌに対する測定値は３ビツト、４〜５ピッ１−
１６ビツ１−１および７ビツト以上である。これらの測
定値指示は、遷移測定値ベクトルの９番目〜１２番目の
ビット位置に記憶される。

第２Ｅ図は、前端黒色部走行長さくＬＢＲＬ、）の測定
を示したものである。これらの測定器よ、黒色部が最初
に現われる列から、白色部をもつ次の列まで行う。この
場合も、重要なの番よ、測定イ直の絶対長さではなくて
、相対長さである。前述の特定の具体例では、３ビツト
、４ビツト、および５ビツト以上のＬＢＲＬ測定値が、
遷移測定）直ベクトルの最初の３ビツトに記憶される。

遷移測定値ビットの最後の４つのビット位置番よ、ある
行の色遷移の回数および特定の複数白色ビットを示すの
に使用する。

以上をまとめると、正規化文字の５の１３ビツトの各行
は、６で１６ビツトの遷移測定イ直ベク（−ルをもたら
す。

次に遷移測定値ベクトルの第２の良好な具体仔１につい
て説明する。

（以下余白）ビット　　　　ピッ１〜がオンの場合の説明１　　　　
　　前端黒色部走行長さ＝３１〜２＝４１〜３〉４４　　　　　　前端白色部走行長さ＝２４〜５＝３４〜６　　　　、　　　　　　　　　　　＝４１５４〜
７＝６４〜８〉６９　　　　　　後端白色部走行長さ＝３９〜１０　　　
　　　　　　　　　　　＝４１５９〜■１＝６９〜１２〉６１３　　　　　　２つの黒色部の間に白色ビットが複数
ある事を示す（ビット１５がオンの場合のみ）１４　　
　　　１つの白色−黒色遷移を示す１５　　　　　　　
黒色−白色−黒色遷移を示す１６　　　　　　　黒色−
白色一黒色一白色〜黒色遷移を示すこの第２の具体例で
は、特定の条件を表現する全てのビットがそれよりも高
い条件が検出された場合に、オンのままでオフに切換わ
らない。例えば前端黒色部走行長さが４ビツトの場合、
先の具体例では、ビット１がオフに変るはずであるが、
この場合は、ビットｌと２は、共にオンのままとなる。

各正規化文字は、高さが１６行なので、各文字は、６の
１６ビツト遷移測定値ベクトル１６個で表されるはずで
ある。各文字に対する遷移測定値ベクトルは６の３２バ
イトのバッファーに記憶され、認識プロセス中保存され
る。

先にも指摘したように、５の正規化文字と６の遷移測定
値だけでは、情報が不充分で手書き文字を明確に識別で
きないことが多い。従って、文字に関する追加的情報を
収集する。この追加的情報の一部は、正規化文字自体か
ら直接得られるが、その他の情報は、遷移測定値から得
られる。

第３八図ないし３０図は、正規化文字にもどって形状弁
別特徴が文字識別のプロセスに有用となる例を示したも
のである。この形状弁別配置では、文字パターンが１２
の固定区域に分別される。特定区域を選択して、分離す
べき文字のグループないしクラスを識別することにより
、制限区域からのピッ１−を戦略的に選択して、各グル
ープを望み通り分離できる特徴をもたらす特徴選択を計
画することができる。第３Ａ図ないし３０図に示した８
字左切込みの例は、この特徴選択プロセスの見本である
。区域４．５−７．８のビット・パターンを比較すると
、その文字が文字「８」の８字切込み特性を持っている
か、それとも第３Ｃ図に示した文字「０」の場合のよう
に、この特性を持っていないかが容易に示される。同様
にして、特定の文字または文字グループの他の重要な特
徴を識別し、認識プロセスで利用することができる。

５で正規化文字、６で遷移測定値ベクトル、７で文字の
特徴が得られると、認識プロセスが開始される。この認
識プロセスはまず論理ツリーを用いて論理的選択を実施
し、文字の識別性に関して、選択が行われると、精密に
設計されたプール式を用いて、その識別性を検査するこ
とからなっている。この選択・検査プロセスによって文
字は明確に認識される。確認が得られない場合には、別
の論理プロセスを選択して、ツリー論理プロセスを繰返
すことができる。このプロセスは、望む限り何度でも繰
返すことができる。

後述する特定の例では５の正規化文字ビデオ信号、７の
形状弁別特徴情報、６の遷移測定値ベクトルがツリー論
理装置８で利用できる。ツリー論理装置８は、特定の特
性をもつ選択された文字グループをその特性をもたない
他の文字グループから分離できるように設計された一連
の論理的弁別装置、回路などからなっている。どの論理
回路ま　′たは装置を選択するかは文字情報の事前の論
理的検査の結果によって決定される。

この例はツリー論理プロセスを非常に簡略化して示した
ものである。実際の設計では、論理ツリーは、子息上の
判断ブロックからなることもある。

必要な判断ブロックの数は認識すべき文字ビットの大き
さおよび文字ビット内の各文字の誤いによつてほぼ決ま
る。実際に本発明者等は、ここに記載した遷移測定値ベ
クトルを使用すれば、はとんどの場合に、文字ビット中
の類似文字のオーバーレーが増大して、正規化ビデオ信
号のみを使用して認識情報をもたらす場合や、さらには
前記のカワの米国特許第４１５５０７９号などのように
何らかの形で、測定を行う場合よりも、認識を得るのに
必要な論理ツリーの大きさが著しく小さくなることを発
見した。

第４図に簡略化して示した例では、まずノード１１で遷
移測定値ベクトルの特定の特性について検査する。その
特性が見つかれば、論理は、ツリーの左側へ進むか、見
つからない場合は、もう一方の方向に論理が進む。実際
には、論理ツリーは各文字グループ間の最もはっきりし
た分離をもたらすテストを最初に実施するように設計さ
れている。従ってほとんどの場合には、その文字につい
て行う最初のまたは、ごく初めの方のテストで遷移測定
値ベクトルを使用することになる。同図に於て、Ｎ：正
規化ビデオ信号、Ｍ：遷移測定値、Ｆ：形状弁別特徴を
、夫々表わす。

第４図からすぐにわかるように、最終的な文字識別を得
るために、その文字について一連のテストを実施する。

この例が示すように、これらのテストには、ノード１５
や１６などのように、実際の正規化ビデオ信号を見るこ
とを含むものもあり、ノード１２．１３．１４などのよ
うに、形状弁別特徴を使用するものや、遷移測定値を使
うものもある。

第５図は、文字「６」を文字「８」と区別するための論
理ツリーの例を示したものであり、その文字について得
られた測定値ベクトルを用いてノード１４で文字の上半
部をテストすることによって、区別がなされる。同図に
於て、 ■：４行目で遷移＝１ ■）ニア行目で後端白色部＝６ ■二６行目で遷移＝１ ■＝３行目で前端白色部＝６ ■：５行目で後端白色部≧７ ■＝６行目で前端黒色部≧５ ■＝３行目で前端白色部≧７を夫々表わす。このプロセスでは、７行目の後端白色部
走行長さなど、その文字のある特徴が、文字「８Ｊを文
字［６」から分離するのに重要なので、検査される。７
行目の後端白一色部などのテス１〜は文字「０」を文字
「８」と区別する際に有用な情報を与えないので、これ
らの文字の分離を得るために使用されることはない。第
５図からすぐにわかるよう−に、例えば、その文字が唯
一つの形でしかあり得ないと論理が満足するまで前回の
論理ゲーティング・オペレーションの結果にもとづいて
、一連の論理ゲーティング・オペレーションが実施され
る。この例では、論理が求める特微力へ存在するとの在
論を下し、第５図に示したように「オン」に出力を与え
た場合、その文字は、「８」の頂部の特徴ではなく、「
６」の幹部の特徴をもつとみなされる。「オフ」出力が
得られた場合、その文字は、「８」の頂部の特徴をもつ
とみなされる。この時点で、論理が文字を識別したこと
になる。

もちろん我々が開始した精巧な認識プロセスを用いた場
合でも、なお若干のあいまし）さが残ることがあり得る
ので当該技術で周知のように文字の識別性を検査しなけ
ればならない。はっきりしているが誤まった認識をもた
らすという問題を避けるため、緊密設計されたプール論
理を用し＼て、文字識別を検査する。これに通した論理
ツリー・検査機の一例がＩＢＭのＴＤＢ　１９８１年１
月号３６６３〜４頁所載の「２−レベル文字認識」（゛
Ｔｗｏ−Ｌｅｖｅｌ　Ｃｈａｒａｃｔｅｒ　Ｒｅｃｏｇ
ｎｉｔｉｏｎ”）と題する論文に記載されている。

以上の説明からすぐにわかるように、認識すべき各文字
について遷移測定値ベクトルを得ると、既知のものより
もずっと認識プロセスが改良される。遷移測定値ベクト
ルによって、手書き文字を認識するための認識システム
に伴いがちな歪みのない文字に関する情報を得るための
機構が実現される。先行技術では、文字の識別に文字の
正規化ビデオ形が使用されることが多かった。その結果
、文字の正規化形は、認識プロセスで実現される理想形
と厳密に一致しないため、しばしば文字が識別されず、
あるいは、誤まって識別されることが起こった。遷移測
定値ベクトルは、手書きの文字がどれほど歪んでいよう
とも、同じ文字に対して、はとんど常に類似の測定値を
与えるので、この問題は、本発明によって完全に克服さ
れる。その上遷移測定値ベクトルは、文字の正規化ビデ
オ表現に存在する分離特徴を破壊することはない。測定
すべき特性をうまく選択することにより、類似している
が同じではない文字間の分離が遷移測定値バク１−ル中
で保持される。すなわち本発明者等は、認識プロセスに
遷移測定値ベタ１〜ルを使用することによって、文字識
別プロセスが著しく簡略になることを発見した。

【図面の簡単な説明】

第１図は、文字認識システムを概念的に表した図、第２
Ａ図ないし２Ｅ図は遷移測定値の例を示す図、第３八図
ないし３０図は形状弁別特徴の例を示す図、第４図は、
文字を区別するためのツリー論理の一部を示す図、第５
図は、文字の形状弁別特徴を区別するためのツリー論理
の一部を示す図である。１・・・・デジタル化原稿ビデオ信号、２・・・・通信
アダプター、３・・・・データ処理装置、４・・・・ビ
デオ前処理、５・・・・正規化、６・・・・遷移測定、
７・・・・形状弁別機能、８・・・・ツリー・検査機。出願人　インターナショナル・ビジネス・マシーンズ・
コーポレーション

Claims

【特許請求の範囲】

（１）認識すべき文字から各々その特性に対する可能な
１組の測定値のうちの１つによって表される予定の走査
線遷移特性に関する複数の測定値を引き出すこと、及び
該文字に対する選択された１つの該測定値を該文字が識
別できるように論理的に組み合せることからなる文字を
認識する方法。
（２）論理的に組み合せる該ステップは該測定値の列を
作成すること、および線列の各部分を順次検査すること
からなり、該各部分は認識すべき該文字の特定の遷移特
性を表し、該部分の該順次検査の結果から該文字を識別
する特許請求の範囲第（１）項記載の方法。