JPH10198762A

JPH10198762A - ニューロによるパターン認識／限定文字列認識システム及び文字パターン分類装置

Info

Publication number: JPH10198762A
Application number: JP9001447A
Authority: JP
Inventors: Fumiaki Takeda; 史章竹田; Yoshiyuki Matsumoto; 芳幸松本; Keisuke Watanabe; 啓介渡邊
Original assignee: Glory Ltd
Current assignee: Glory Ltd
Priority date: 1997-01-08
Filing date: 1997-01-08
Publication date: 1998-07-31

Abstract

(57)【要約】【課題】手書き文字列等の種々の変形した記号群や、
位置ズレ，回転，大きさの違い等のある記号群について
も、高い精度で効率良く識別し分類することができるニ
ューロによるパターン認識システムを提供する。【解決手段】被分類対象に含まれる独立した個々の特
徴の存在程度を表す第１のアナログ信号及び存在しない
程度を表す第２のアナログ信号を出力するために並列に
前記特徴の個数だけ設けられた前段ニューロコンピュー
タ２０と、前記前段ニューロコンピュータからの前記第
１及び第２のアナログ信号を入力して処理し前記被分類
対象が予め決められた複数のカテゴリのいずれに属する
かの情報を出力する後段ニューロコンピュータ３０とを
設ける。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、認識すべき文字群
が限られた記名式投票用紙等の用紙に記入された文字群
の認識を高速に行い、カテゴリの分類等を行う装置に関
し、特に、手書き文字列等、各種変形要素を含む記号列
のニューロ認識を行う際のニューロ用入力データの作成
方法、及びパターン認識／文字列認識システム，文字パ
ターン分類装置などに適用されるニューロコンピュータ
の構成に関する。

【０００２】

【従来の技術】貨幣，文字等の入力画像から被識別対象
を認識する装置としては、予め設定されている基準パタ
ーンとのマッチングにより認識するようにしたものが一
般的である。例えば、文字を認識する場合は、入力画像
から得た入力文字パターンと複数の文字パターン候補と
のパターンマッチングによりそれぞれの類似度を算出
し、最大類似度を得た文字パターン候補の情報を認識結
果として出力することで、入力文字を認識するようにし
ている。これに対し、近年、ニューロコンピュータを用
いて文字等のパターンを認識するようにした装置が数多
く提案されている。

【０００３】ニューロコンピュータを用いて貨幣，文字
等のパターンを認識する装置の例としては、図１０に示
すようなものがある。図１０のパターン認識装置は、被
識別対象１の文字等をイメージセンサ２で読取って入力
画像３を得る。図１０の入力画像３の場合、縦，横各８
分割なので、Ｄ（ｉ．ｊ）（但しｉ＝１〜８、ｊ＝１〜
８）の６４画素の入力情報として取得する。そして、こ
の６４個の各画素データを分離演算部５に直接入力す
る。このとき、分離演算部５の入力層のニューロ素子
は、各画素に対応した６４個が必要となる。そして、こ
の入力情報に基づきニューラルネットワークを用いてパ
ターンの認識を行うようになっている。

【０００４】しかし、図１０の認識装置では、分離演算
部５に入力する情報数が入力画像３の画素数だけ必要で
あるため、入力層のニューロ素子も画素数と同じ数だけ
必要となってくる。従って、多数のニューロ素子を有す
る入力層を設けなければならず、それに対応して隠れ層
も多数のニューロ素子を設ける必要があり、結局、非常
に大がかりな分離演算部５を用いなければパターン認識
を行ない得ないという問題がある。

【０００５】この問題を解決するために分離演算部の縮
小化を図ったパターン認識装置としては、例えば、特開
平５−３２４８３８号公報に記載のものが挙げられる。
このパターン認識装置では、図１１に示すように、分離
演算部の前段に前処理部４を設け、センサ２で計測され
た被識別対象１の入力画像３を複数のメッシュ状マスク
４１〜４Ｎを用いて縮小化し、複数の画像代表値に変換
し、縮小化した画像代表値をスラブ値ＳＢ１〜ＳＢｎに
して分離演算部（ニューラルネットワーク）５に入力す
るようにしている。そして、画像代表値を入力した分離
演算部５では、重み係数を用いて判定パターン毎に分離
演算値を算出して判定部６に出力し、分離演算値の中で
最大値を有するパターンを被識別対象のパターン画像と
して判定部６で判定するようにしている。メッシュ状マ
スクを用いる理由は、次のことによる。画像の特徴量と
して画素値の総和であるスラブ値を用いる場合は、例え
ば“Ｆ”と“Ｋ”の様に、異なるパターンを有する画像
でもスラブ値が等しくなる場合が存在する。そこで、特
定の部分が被覆されたメッシュ状のマスクを用いること
で、異なるスラブ値を生成して分離能力を高めるように
している。

【０００６】ところで、ニューロコンピュータを用いて
画像のパターン認識をする場合には、いかに特徴のある
画像データをスラブ値として作成し、その入力層に入れ
ることができるかによって、その処理速度および認識の
信頼性が決定される。そのために、図１１に示した上述
のパターン認識装置では、取り込んだ画像に部分的にマ
スクを掛けることによって特徴のある画像代表値として
スラブ値にして入力層に入力するようにしている。ま
た、このマスクの効率の良い作成方法についても数多く
提案されている。例えば、紙幣を対象としたニューロ識
別装置では、紙幣の画像データから抽出した光学パター
ン画像に対して紙幣の搬送方向と平行にランダムに複数
種のカラムマスクを施し、各光学パターン画像における
非マスク画素の総和（スラブ値）に変換し、このスラブ
値をニューラルネットワークの入力層に入力するように
したものが提案されている。

【０００７】また、特願平５−２８５５２７号公報に
は、紙幣等のパターン認識において生物の３大特徴であ
る交差、淘汰、突然変異をコンピュータでシミュレーシ
ョンすることにより、識別に最適なマスクを決定すると
いう、遺伝アルゴリズムを用いたマスクの最適化方法が
記載されている。この方法では、マスクを符号化して遺
伝子として設定し、複数種のマスクから成るマスクパタ
ーンをかけた画像データ総和値をニューラルネットワー
クの入力層に入力して、被識別対象の識別を学習させて
その結果を評価し、所定の識別達成度に応じて上記マス
クパターンを淘汰し、残ったマスクパターンに対して遺
伝子組み替えを実行して世代交代させ、この世代交代さ
せたマスクパターンを用いて学習を実行するという一連
の処理を、所定の世代交代数内で所定の識別達成値に達
するまで繰り返すことで、最適なマスク配置を得るよう
にしている。

【０００８】この様に効率のよいマスクを掛けて特徴デ
ータを得るようにした装置も存在するが、マスクを掛け
て処理するだけでは、選挙の投票用紙に書かれた候捕者
の氏名、政党名の手書きの文字を、しかも漢字、平仮
名、カタカナの文字を認識する場合には難しさがある。

【０００９】また、複数のニューラルネットワークを用
いてパターン認識を行うようにしたものも提案されてい
る。例えば、特開平５−１３５０００号公報には、複数
のカテゴリがあって、個々のニューラルネットワークの
規模を大きくせずして、マルチネットワークを構築する
ようにしたものが記載されている。図１２は、その原理
ブロック図を示しており、カテゴリＡ、カテゴリＣのよ
うに、同一のカテゴリであっても、１個のニューラルネ
ットワーク５Ａでパターン認識ができない時には、複数
のニューラルネットワーク５Ａに分割して学習を行わせ
るようにしてある。このようにして、同一のカテゴリで
離散的な値をとる場合にそれぞれの離散値毎にニューラ
ルネットワークを設けて学習を可能としている。この場
合、アルファベットの大文字をカテゴリＡに、アルファ
ベットの小文字をカテゴリＢにというように、複数のデ
ータを大別して分類する場合は、ニューラルネットワー
クの数が少なくて済む。これに対して、文字列の認識は
個々のカテゴリが異なることになるので、この文字列毎
にニューラルネットワークを設ければ良いことになる
が、これでは、ニューラルネットワークの数が多くなっ
てしまい非効率である。

【００１０】

【発明が解決しようとする課題】上述のように、従来の
マスク方式を用いたものであると、癖字等、変形された
文字を読むことが困難であった。なぜなら固定したマス
クを読取った文字画像に適応して特徴データを抽出しよ
うとしても、書き手がかわれば文字の形がずれてしまう
ので、満足な文字認識ができないからである。また、複
数のニューラルネットワークを設け、複数のニューラル
ネットワークで学習を行うようにしたものでは、文字列
を認識させたい場合には、ニューラルネットワークの数
が多くなり、適さないという欠点があった。また、テン
プレートマッチングと言った処理が一般的に使われてい
るが、記名式投票用紙のような場合は個々の文字は手書
き文字を対象としているので、癖字などがあり文字列に
対してテンプレートマッチングを行うことができず、文
字列から個々の１文字１文字を切り出すことも容易では
ないというような問題があった。

【００１１】本発明は上述のような事情から成されたも
のであり、本発明の目的は、手書き文字列等の種々の変
形した記号群や、位置ズレ，回転，大きさの違い等のあ
る記号群についても、高い精度で効率良く識別し分類す
ることができるニューロによるパターン認識／限定文字
列認識システム及び文字パターン分類装置を提供するこ
とにある。

【００１２】

【課題を解決するための手段】本発明は、被分類対象を
予め決められた複数のカテゴリに分類するニューロコン
ピュータを用いたパターン認識システムに関するもので
あり、本発明の上記目的は、前記ニューロコンピュータ
が、前記被分類対象に含まれる独立した個々の特徴の存
在程度を表す第１のアナログ信号及び存在しない程度を
表す第２のアナログ信号を出力するために並列に、前記
特徴の個数だけ設けられた前段ニューロコンピュータ
と、前記前段ニューロコンピュータからの前記第１及び
第２のアナログ信号を入力して処理し前記被分類対象が
前記カテゴリのいずれに属するかの情報を出力する後段
ニューロコンピュータとから成ることによって達成され
る。

【００１３】また、本発明は、記名式投票用紙に記入さ
れた文字列など、認識すべき文字列が限定されている文
字列をニューラルネットワークを用いて認識するニュー
ロによる限定文字列認識システムに関するものであり、
本発明の上記目的は、該当なしを含まない被分類文字列
を予め決められた複数の文字列に分類するために、前記
被分類文字列に含まれるホール，交差，端点等の各特徴
に対応して並列に設けられた複数の前段ニューラルネッ
トワークと、前記各前段ニューラルネットワークからの
各出力信号を入力して処理する後段ニューラルネットワ
ークとを備え、前記各前段ニューラルネットワークは予
め前記各特徴に対して学習を行い、前記被分類文字列の
複数の画像代表値を並列入力して前記各特徴について特
徴有りの程度を表す第１のアナログ信号及び特徴無しの
程度を表す第２のアナログ信号をそれぞれ出力し、前記
後段ニューラルネットワークは、前記各前段ニューラル
ネットワークからの前記第１及び第２のアナログ信号を
入力して処理し前記被分類文字列が前記予め決められた
複数の文字列のどれに該当するかの情報を出力するよう
になっていることによって達成される。

【００１４】また、本発明は、ニューロによる文字パタ
ーン分類装置に関するものであり、本発明の上記目的
は、被分類文字列の画像をブロック化するブロック化手
段と、前記ブロック化された画像データをフーリエ変換
するフーリエ変換手段と、前記フーリエ変換後のデータ
のうち所定の周波数成分のデータを抽出してスラブ値と
して採用するスラブ抽出手段と、前記抽出されたスラブ
値を並列入力し、予め形状要素毎に設定された前記被分
類文字列の特徴にどれだけ近いか及び／又はどれだけ遠
いかのアナログ信号を出力する各特徴毎に設けられた前
段ニューラルネットワークと、前記前段ニューラルネッ
トワークの出力をスラブ値として入力層に直接入力し、
前記被分類文字列が分類対象のカテゴリのいずれになる
かの情報を出力する後段ニューラルネットワークとを備
えることよって達成される。

【００１５】

【発明の実施の形態】癖字や大きさの大小，向きの違い
等の種々の変形パターンを有する手書きの文字群や記号
群（以下、「シンボルと呼ぶ」）を被識別／分類対象と
して、識別もしくは予め決められた複数のカテゴリに分
類する場合、シンボル全体のパターンを認識することに
よって当該シンボルを判別するのは困難である。そこ
で、本発明では、癖字等の変形文字であっても普遍な部
分に着目して、この特徴点が有るか無いかをもとに当該
シンボルを判別するようにしている。すなわち、線の交
わりや、線で囲まれた領域の有無、端点の個数などに着
目し、他のシンボルとの違いを複数の特徴点で認識し、
入力シンボルの識別もしくは入力シンボルの属するカテ
ゴリの判別を行うようにしている。

【００１６】以下に説明する実施の形態では、撮像され
た画像から入力シンボルの領域を切り出してその大きさ
を拡大、縮小手段により標準と定めた大きさとした後、
その画像から線の交わりや、線で囲まれた領域の有無、
端点の個数等の特徴をフーリエ変換によって取出し、周
波数成分の全て若しくは所定の周波数成分のデータを抽
出してスラブ値としている。そして、シンボルに含まれ
る独立した個々の特徴について専用に処理する複数のニ
ューロコンピュータを並列に設け、上記スラブ値を各ニ
ューロコンピュータの入力層に入れて各特徴の有無の程
度を出力させ、この出力を後段の識別用ニューロコンピ
ュータの入力層に入力して、最終的なシンボルのカテゴ
リ分類を行うようにしている。

【００１７】以下、図面に基づいて本発明の好適な実施
の形態について詳細に説明する。図１は本発明システム
の主要部の構成例を示すブロック図であり、大別する
と、入力画像３を処理してスラブ値を生成する前処理部
１０と、特徴抽出用の複数のニューラルネットワークを
有する第１のニューロコンピュータ２０と、識別用のニ
ューラルネットワークを有する第２のニューロコンピュ
ータ３０と、判定部４０とから構成される。前処理部１
０では、用紙１に記入されたシンボル（本例では文字
列）の画像データ３を切出して標準の大きさにスケーリ
ング処理した後にブロック化し、ブロック化した画像デ
ータにフーリエ変換処理を施し、スラブ値を選択して出
力する。第１のニューロコンピュータ（以下、「第１ニ
ューロ」とする）２０は、複数の特徴抽出ニューロを具
備しており、前処理部１０からのスラブ値を並列入力
し、被分類対象のシンボルに含まれる各特徴毎に予め学
習したニューロ重みにより、各特徴の存在程度を出力す
る。第２のニューロコンピュータ（以下、「第２ニュー
ロ」とする）３０では、第１ニューロ２０の出力を新た
なスラブ値として直接入力し、カテゴリ毎に予め学習し
たニューロ重みにより、各カテゴリ毎の分離演算値を出
力する。そして、判定部４０では、第２ニュー３０から
の各カテゴリ毎の分離演算値に基づいて、入力シンボル
のカテゴリを判定するようになっている。以下、各部の
構成と動作例についてそれぞれ詳細に説明する。

【００１８】先ず、前処理部１０におけるデータ処理に
ついて図１及び図２を参照して説明する。被分類対象の
シンボルが記入された用紙１はＣＣＤ等で成るイメージ
エリアセンサ２で撮像され、入力画像（文字群原画像）
３が画像フレームメモリに格納される。図２（Ａ）は入
力画像３の一例を示している。ここでは、記入枠３ａ内
に記入されたシンボルを認識する場合を例として説明す
る。前処理部１０内の画像切出部１１では、予め設定さ
れている用紙情報に基づいて入力シンボルの記入枠３ａ
を認識し、記入枠３ａ内の画像ＲＡを切出す。そして、
図２（Ｂ）に示すように、ヒストグラムＨｈｉｓｔ，Ｖ
ｈｉｓｔを作成して入力シンボルの形状の縦の長さ（垂
直方向のヒストグラム長）Ｗｙと、横の長さ（水平方向
のヒストグラム長）Ｗｘをそれぞれ求め、図２（Ｃ）に
示すように、記号部の画像ＭＤを抽出する。

【００１９】抽出された入力シンボルの画像ＭＤは、画
像スケーリング部１２で拡大又は縮小されて、図２
（Ｄ）に示すように、標準の大きさの画像ＭＤ’に変換
される。そして、画像ブロック化部１３で、図２（Ｅ）
及び（Ｆ）に示すように、ｎ×ｍ個のデータにブロック
分割されてフーリエ変換部１４に入力される。上記の分
割数ｎ×ｍは、予め文字，文字列，図形等の被分類シン
ボルの大きさや形状に基づいて設定されている。フーリ
エ変換部１４部では、ｎ×ｍ個のデータをそれぞれフー
リエ変換し、シンボル中の特徴を周波数に置き換える。
スラブ値抽出部１５では、フーリエ変換されたｎ×ｍ個
のデータの周波数成分の全て若しくは所定の周波数成分
のデータを抽出し、図２（Ｇ）に示すように、抽出した
ｉ個のデータをスラブ値ＳＢ１〜ＳＢｉとする。

【００２０】図３は、ＦＦＴ（ＦａｓｔＦｏｕｒｉｅ
ｒＴｒａｎｓｆｅｒ；フーリエ変換処理）の処理結果
の一例を示しており、スラブ値抽出部１５では、例えば
ｎ×ｍ＝１００個のＦＦＴデータの内、低周波成分側の
５０個の周波数のパワースペクトル（以下、フーリエパ
ワースペクトルとする）を第１ニューロのスラブ値とし
て抽出する。ここで、フーリエパワースペクトルを採用
するのは次の理由に基づいている。例えば、連続的に搬
送されて来る紙葉類を対象とした場合、採取されるデー
タは、紙葉類の搬送による種々の誤差を含んだものとな
っており、特にサンプルずれによる誤差の比重は大きい
と予想される。したがって、サンプリングされた時系列
データのフーリエパワースペクトルを用いればこの誤差
を除去することができ、識別能力の向上につながるから
である。

【００２１】次に、第１ニューロ２０の構成例について
説明する。第１ニューロ２０は、図１のように、被分類
対象のシンボルに含まれる各特徴量（各特徴の有り，無
しの存在程度を示す値）を出力する複数の特徴抽出ニュ
ーロ２１〜２Ｎから構成される。特徴抽出ニューロ２１
〜２Ｎは、各特徴に対応して特徴個数分並列に設けら
れ、ホール（穴），交点（交差），端点等の独立したＮ
個の特徴をそれぞれ専用に処理し、予め学習した各特徴
のニューロ重み（特徴量抽出ウエイト）により、特徴有
り，特徴無しの程度をそれぞれ“０”〜“１”のアナロ
グ信号で出力するようになっている。本例では、“１”
に近いほど確信度が高く、“０”に近いほど確信度が低
い値が出力される。従って、各特徴抽出ニューロ２１〜
２Ｎの出力情報は、予め設定されている各特徴に対して
どの程度類似しているか、或いは類似していないかを示
す“確信量”を表していると言える。

【００２２】図４は、第１ニューロ２０内の特徴抽出ニ
ューロ２Ｎの構成例を示しており、１つの特徴抽出ニュ
ーロは、大別すると入力層、中間層、出力層の３つから
成っている。入力層は、前処理部１０で生成されるスラ
ブ値の最大個数分のニューロ素子が設けられており、前
処理されたスラブ値ＳＢ１〜ＳＢｉを対応するニューロ
素子に入力する。中間層は少なくとも１つのニューロ素
子の層から成り、入力層の情報を分離演算して出力層に
伝達する役割を果たしている。この中間層のニューロ素
子が多くなればそれだけ、入力層の各ニューロ素子の情
報の変動に対しても不変に、各パターンの各々に分離し
て演算することが可能となる。出力層は、２つのニュー
ロ素子から成り、特徴Ｎの有、無の程度を示す２つの確
信量Ｄ（Ｎ，１），（Ｎ，２）を出力するようになって
いる。

【００２３】次に、第１ニューロ２０における学習時の
動作例について説明する。１種類の特徴Ｐを学習させる
為には、その特徴Ｐとの違いを持つ、もう一つのグルー
プ（特徴Ｐ以外）を用意する必要がある。これが特徴Ｐ
に対するその他のグループＰｘとなる。例えば、特徴の
数をＮとし、ｉ番目の特徴をＰｉとすると、識別対象の
シンボルの内、特徴Ｐｉ以外のもの全てが特徴Ｐｉに対
するその他のグループＰｉｘとなる。そして、ＰｉとＰ
ｉｘの特徴画像から、第１ニューロ２０で使用するＮ個
の特徴量抽出ウエイトを作成する。ここでは、ホール，
交点，端点の３種類の特徴Ｐ１，Ｐ２，Ｐ３を具体例と
して説明する。この場合、学習用データは、○，×，△
等のホール，交点，端点を象徴するデータ（特徴基本デ
ータ）である。

【００２４】図５は、ホール，交点，端点の特徴量抽出
ウエイトの作成方法をブロック図で示している。特徴Ｐ
１（ホール）のウエイトを作成する場合は、Ｐ１の特徴
画像（特徴基本データ）とその他のグループＰ１ｘの特
徴画像を所定の大きさにスケーリングした後、ｎ×ｍ個
のデータにブロック化し、ブロック分割されたデータに
ＦＦＴを施す。そして、ＦＦＴの出力をスラブ値として
第１ニューロ２０に入力し、ホール形状を学習させたウ
エイトをＰ１ウエイト（ホールウエイト）とする。同様
にして、Ｐ２ウエイト（交点ウエイト）、Ｐ３ウエイト
（端点ウエイト）というように、抽出したい特徴数分の
特徴量抽出ウエイトを作成する。図６（Ａ），（Ｂ），
（Ｃ）は、それぞれ“ホール”、“交点”、“４個の端
点”を例としたＦＦＴ結果の例を示しており、同図のよ
うなＦＦＴデータに基づいて各特徴量抽出ウエイトが作
成される。なお、本例では、ニューラルネットワークの
学習アルゴリズムは、次の数１で与えられる慣性項、振
動項を付加した改良型バックプロパゲーション法を用い
ている。

【００２５】

【数１】

【００２６】次に、第１ニューロ２０における評価時の
動作例について説明する。評価時には、入力シンボルの
画像３を処理して図形中の特徴が周波数に置き換えられ
たｎ×ｍ個のデータの内の所定の周波数成分若しくは周
波数成分の全てが、スラブ値として第１ニューロ２０の
各特徴抽出ニューロ２１〜２Ｎの入力層にそれぞれ入力
される。この評価画像の入力データ（スラブ値ＳＢ１〜
ＳＢｉ）を前述の複数ニューロ（ウエイト）で評価する
と、ニューロの汎化能力により、未学習画像データであ
っても、学習した特徴をニューロが見つけると、“有
り”が１に近く反応する。見つけられない場合は、“無
し”が１近くになる。従って、１つの特徴につき、特徴
が有るという確信量と無いという確信量を表す２つのア
ナログ値が出力されることになる。これらのウエイトで
評価されたニューロの結果の組み合わせが、第１ニュー
ロ２０の評価出力となる。本例では、１つのウエイトで
２つの出力があるので、第１ニューロ２０の出力データ
Ｄ（１，１）〜Ｄ（Ｎ，２）はＮ×２個になる。以上の
ように、第１ニューロ２０では、被分類対象のシンボル
に含まれる各特徴毎に予め調整された重みにより入力シ
ンボルの各特徴量を評価し、各特徴の有る、無いの程度
を示すデータを０〜１の間のアナログ値で出力するよう
になっている。

【００２７】次に、第２ニューロ３０の構成例について
説明する。第２ニューロ３０は、図１に示したように第
１ニューロ２０の後段に設けられ、入力層、中間層、出
力層の３つから成る単一ニューロで構成される。入力層
は、特徴の種類に対応して特徴個数×２個のニューロ素
子が設けられており、第１ニューロ２０からの特徴数Ｎ
×２個の出力Ｄ（１，１），Ｄ（１，２）〜Ｄ（Ｎ，
１），Ｄ（Ｎ，２）をスラブ値として各ニューロ素子に
入力する。中間層は少なくとも１つのニューロ素子の層
から成り、入力層の情報を分離演算して出力層に伝達す
る役割を果たしている。出力層は、分類すべきカテゴリ
Ｃ（１）〜Ｃ（Ｍ）に１対１に対応するようにＭ個のニ
ューロ素子が設けられている。第２ニューロ３０の出力
層から出力されるデータＣ（１）〜Ｃ（Ｍ）は、予め決
められたＭ個の各カテゴリに対応する分離演算値であ
り、この分離演算値が判定部４０に入力されて入力シン
ボルの属するカテゴリが判定されるようになっている。

【００２８】ここで、カテゴリの概念について説明す
る。カテゴリとは、同類のものが、その中に入るべき部
門・範囲・種類であり、図７に示すようなデータ分布が
与えられた場合、各集合Ｃ（１），Ｃ（２），…，Ｃ
（５）に属するデータがそれぞれカテゴリＣ（１），Ｃ
（２），…，Ｃ（５）と意味づけられる。その場合、ど
のようにカテゴリを分けるかはテーマによって異なって
くる。例えば、政党を択一的に選択して投票する議院選
挙では、それぞれの政党が各カテゴリとなる。この場
合、各被分類文字列は政党名であり、分類すべきカテゴ
リと１対１に対応し、分類結果＝被分類文字列の認識結
果となる。一方、数字の文字列はカテゴリＣ（１）、漢
字の文字列はカテゴリＣ（２）、ひらがなの文字列はカ
テゴリＣ（３）というように、入力シンボルを特定の種
別に分類する場合は、各被分類文字列は、分類すべきカ
テゴリとｎ対１に対応する。本発明では、図７の各集合
Ｃ（１），Ｃ（２），…，Ｃ（５）において、１つの集
合に属する個々のデータが個々の特徴、即ちカテゴリの
各特徴に相当し、第２ニューロ３０では、第１ニューロ
３０から出力される各特徴量（確信量）の組み合わせか
らカテゴリを特定し、入力シンボルの属するカテゴリを
判定するようにしている。

【００２９】次に、第２ニューロ３０における学習及び
評価時の動作例について説明する。第２ニューロのウエ
イトを作成する際には、学習用データは、評価するシン
ボルの基本データ（被分類対象の一般的手書き文字群）
を用いる。特徴抽出用の第１ニューロ２０で、例えば
“口”という文字を評価した場合、次の表１のようにな
る。

【表１】

【００３０】前述のように第１ニューロ２０では、これ
らのビット列を、１〜０の範囲で表現されるアナログ値
とし、シンボルに含まれる特徴をＮ×２個のアナログデ
ータの組み合わせとして表現し、このデータ列を第２ニ
ューロ３０に入力する。以下、被分類文字列の具体例と
して“××党”，“××党”，“××××党”で説明す
る。この場合、××党の文字列では、ホール（口や○の
ように線で囲まれた部分）は、“自”の部分が３個，
“由”の部分が４個，“党”の部分が１個の合計８個存
在し、交点（＋や×のように線が交差する点）は、
“由”の部分が２個存在し、端点（直線部の端点）は、
“自”の部分が１個，“由”の部分が１個，“党”の部
分が７個の合計９個存在する。但し、上記に示した個数
は、理解しやすくするために具体的な値を示したもので
あり、第１ニューロの学習用データ（特徴基本データ）
としてどのような形状のデータを用いるかによって変わ
ってくる。自由党の文字列と同様に、他の文字列につい
て各特徴の存在個数を調べ、固有特徴量に違いのあるも
のを識別用の特徴として用いるようにする。

【００３１】上記の党名を識別するための特徴として、
例えば、：Ｐ１＝ホール８個の有り／無し、：Ｐ２
＝端点９個の有り／無し、：Ｐ３＝交点１個の有り／
無し、：Ｐ４＝交点２個の有り／無し、：Ｐ５＝ホ
ール１個の有り／無し、：Ｐ６＝ホール２個の有り／
無し、の６種類の特徴Ｐ１〜Ｐ６を用いる。これらの特
徴Ｐ１〜Ｐ６に対するウエイトを第１ニューロ２０で生
成して評価すると、その評価結果は、６×２＝１２個の
データ列となる。この具体的な評価結果をまとめると、
次の表２のようになる。

【００３２】

【表２】

【００３３】次に、上記表２の３党（３パターン）のデ
ータの違いを第２ニューロ３０で学習し、識別用ウエイ
トを生成する。評価では、図８に示すように、第１ニュ
ーロ２０の出力をスラブ値として入力し、入力シンボル
３Ａが３つのカテゴリＣ（１）〜Ｃ（３）のどのカテゴ
リに該当するかを識別する。従って、第２ニューロ３０
の結果は、“××党”，“××党”“××××党”のど
れかのカテゴリに反応することになる。

【００３４】以上のように、第１ニューロ２０では、手
書き文字列等のシンボルの特徴を抽出するために、識別
したいシンボルの持つ特徴を複数のニューロによって学
習させ、評価では、それらの特徴の存在を判定し、この
データ列を第２ニューロ３０に引き渡す。第２ニューロ
３０では、識別するシンボルの特徴データ列を識別対象
シンボルのパターン分学習させ、評価では、どのシンボ
ルパターンに該当するかを識別するようになっている。

【００３５】以下に、本発明を投票用紙計数仕分機に適
用した場合の一実施例を説明する。図９は本発明を適用
した投票用紙計数仕分機の外観構成を示しており、本体
５１の正面上部には液晶表示部５２、スタート／ストッ
プキ−５３、ファンクションキ−５４から成る操作パネ
ルが設けられており、正面左側には、左側面に取り付け
られるスタッカ５７に対応した位置にスタッカ番号を表
示するＬＥＤ表示器５５が設けられている。また、本体
右側面にはホッパ部５６が設けられている。このホッパ
は例えば５００枚の容量を有している。仕分けされる投
票用紙はホッパ部５６に載置され、仕分けされてスタッ
カ部５７に収納される。スタッカ部５７はｎ段（本例で
は４段）のスタッカより成っており、最下段のスタッカ
は無効票や読取不能票などのリジェクト専用となってい
る。

【００３６】上述のような構成の投票用紙計数仕分機に
おいては、従来は、予め列記された氏名の上方に自ら筆
記用具を介して×印や○印を付して投票する投票用紙、
例えば、最高裁判所裁判官国民審査や市長選挙の投票用
紙を対象としていたが、本発明を適用することにより、
記名式の投票用紙を対象とすることが可能となる。即
ち、手書きされた政党名や候補者名を入力シンボルとし
て図１の前処理部１０で前述の前処理を実行し、第１ニ
ューロ２０及び第２ニューロ３０を介して入力シンボル
のカテゴリ（政党や候補者、無効票）を識別し、判定部
４０若しくは上位の制御部により、各カテゴリ毎に投票
用紙を分類及び集計すると共に、仕分けることが可能と
なる。

【００３７】なお、上述した実施の形態では、被分類対
象と分類カテゴリとを１対１に対応させて、主に文字列
を識別する場合を例として説明したが、ｎ対１に対応さ
せて、マーク等の変形記号を含む種々の記号群をカテゴ
リ分類することも、勿論可能である。また、特徴の例と
してホール，交点（交差），端点を具体例として説明し
たが、これらに限るものではなく、例えばフーリエパワ
ースペクトルにて、特徴の違いが現れるような形状要素
であれば、その部分を特徴として採用することができ
る。また、第１ニューロの構成例では、１つの特徴に対
して有、無の程度を示す２つのデータを出力する場合を
例として説明したが、分類のテーマによっては、いずれ
か一方であっても分類可能である。また、上述のような
投票用紙計数仕分機に限らず、本発明は、アンケート用
紙の集計装置、種々のフォントパターンを必要としない
手書き数字認識装置、文字パターン分類装置など、手書
き文字やマーク等の種々の記号群を識別して処理する装
置に対して効果的に適用することができる。

【００３８】

【発明の効果】以上に説明したように、本発明によれ
ば、複数のニューロから構成される第１ニューロによっ
て被分類シンボルの特徴を抽出し、その結果を用いて第
２ニューロにより被分類シンボルの属するカテゴリを識
別するようにしているので、従来の装置では識別が困難
であった手書き文字を含む種々の変形した文字群や、位
置ズレ，回転，大きさの違い等の文字群についても、効
率良く高い精度で分類し識別することが可能となる。ま
た、ニューロの中間情報を特徴抽出の確信値として得る
ことができ、識別システムの解析が容易となる。また、
文字群に限らず、種々の形状パターンを有する図形等に
ついても高い精度で分類し識別することが可能となる。

【図面の簡単な説明】

【図１】本発明の主要部の構成例を示すブロック図であ
る。

【図２】本発明の前処理部におけるデータ処理を説明す
るための図である。

【図３】本発明におけるフーリエ変換処理の結果の一例
を示す図である。

【図４】本発明における特徴抽出ニューロの一構成例を
示すブロック図である。

【図５】本発明における第１ニューロで使用する特徴量
抽出ウエイトの作成方法を説明するためのブロック図で
ある。

【図６】本発明における特徴量抽出ウエイト作成時のフ
ーリエ変換処理の結果の具体例を示す図である。

【図７】本発明におけるカテゴリの概念を説明するため
の図である。

【図８】本発明における評価時の動作例を説明するため
の図である。

【図９】本発明を適用した投票用紙計数仕分機の構成例
を示す外観斜視図である。

【図１０】従来のパターン認識装置の第１の例を示すブ
ロック構成図である。

【図１１】従来のパターン認識装置の第２の例を示すブ
ロック構成図である。

【図１２】従来のパターン認識装置の第３の例を示す原
理ブロック図である。

【符号の説明】

２イメージエリアセンサ３入力画像１０前処理部２０前段ニューロコンピュータ（第１ニューロ）２１〜２Ｎ特徴抽出ニューロ３０後段ニューロコンピュータ（第２ニューロ）４０判定部

Claims

【特許請求の範囲】

【請求項１】被分類対象を予め決められた複数のカテ
ゴリに分類するニューロコンピュータを用いたパターン
認識システムにおいて、前記ニューロコンピュータが、
前記被分類対象に含まれる独立した個々の特徴の存在程
度を表す第１のアナログ信号及び存在しない程度を表す
第２のアナログ信号を出力するために並列に、前記特徴
の個数だけ設けられた前段ニューロコンピュータと、前
記前段ニューロコンピュータからの前記第１及び第２の
アナログ信号を入力して処理し前記被分類対象が前記カ
テゴリのいずれに属するかの情報を出力する後段ニュー
ロコンピュータとから成ることを特徴とするニューロに
よるパターン認識システム。
【請求項２】該当なしを含まない被分類文字列を予め
決められた複数の文字列に分類するために、前記被分類
文字列に含まれるホール，交差，端点等の各特徴に対応
して並列に設けられた複数の前段ニューラルネットワー
クと、前記各前段ニューラルネットワークからの各出力
信号を入力して処理する後段ニューラルネットワークと
を備え、前記各前段ニューラルネットワークは予め前記
各特徴に対して学習を行い、前記被分類文字列の複数の
画像代表値を並列入力して前記各特徴について特徴有り
の程度を表す第１のアナログ信号及び特徴無しの程度を
表す第２のアナログ信号をそれぞれ出力し、前記後段ニ
ューラルネットワークは、前記各前段ニューラルネット
ワークからの前記第１及び第２のアナログ信号を入力し
て処理し前記被分類文字列が前記予め決められた複数の
文字列のどれに該当するかの情報を出力するようになっ
ていることを特徴とするニューロによる限定文字列認識
システム。
【請求項３】被分類文字列の画像をブロック化するブ
ロック化手段と、前記ブロック化された画像データをフ
ーリエ変換するフーリエ変換手段と、前記フーリエ変換
後のデータのうち所定の周波数成分のデータを抽出して
スラブ値として採用するスラブ抽出手段と、前記抽出さ
れたスラブ値を並列入力し、予め形状要素毎に設定され
た前記被分類文字列の特徴にどれだけ近いか及び／又は
どれだけ遠いかのアナログ信号を出力する各特徴毎に設
けられた前段ニューラルネットワークと、前記前段ニュ
ーラルネットワークの出力をスラブ値として入力層に直
接入力し、前記被分類文字列が分類対象のカテゴリのい
ずれになるかの情報を出力する後段ニューラルネットワ
ークとを備えたことを特徴とするニューロによる文字パ
ターン分類装置。