JPH10198762A - ニューロによるパターン認識/限定文字列認識システム及び文字パターン分類装置 - Google Patents
ニューロによるパターン認識/限定文字列認識システム及び文字パターン分類装置Info
- Publication number
- JPH10198762A JPH10198762A JP9001447A JP144797A JPH10198762A JP H10198762 A JPH10198762 A JP H10198762A JP 9001447 A JP9001447 A JP 9001447A JP 144797 A JP144797 A JP 144797A JP H10198762 A JPH10198762 A JP H10198762A
- Authority
- JP
- Japan
- Prior art keywords
- neuro
- feature
- character string
- classified
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003909 pattern recognition Methods 0.000 title claims description 16
- 238000013528 artificial neural network Methods 0.000 claims description 38
- 238000000034 method Methods 0.000 claims description 17
- 210000002569 neuron Anatomy 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 230000000903 blocking effect Effects 0.000 claims description 4
- 230000001537 neural effect Effects 0.000 claims 1
- 238000000605 extraction Methods 0.000 abstract description 22
- 238000007781 pre-processing Methods 0.000 abstract description 12
- 238000000926 separation method Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 238000011156 evaluation Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 108010043296 Neurocan Proteins 0.000 description 1
- 102100030466 Neurocan core protein Human genes 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】
【課題】 手書き文字列等の種々の変形した記号群や、
位置ズレ,回転,大きさの違い等のある記号群について
も、高い精度で効率良く識別し分類することができるニ
ューロによるパターン認識システムを提供する。 【解決手段】 被分類対象に含まれる独立した個々の特
徴の存在程度を表す第1のアナログ信号及び存在しない
程度を表す第2のアナログ信号を出力するために並列に
前記特徴の個数だけ設けられた前段ニューロコンピュー
タ20と、前記前段ニューロコンピュータからの前記第
1及び第2のアナログ信号を入力して処理し前記被分類
対象が予め決められた複数のカテゴリのいずれに属する
かの情報を出力する後段ニューロコンピュータ30とを
設ける。
位置ズレ,回転,大きさの違い等のある記号群について
も、高い精度で効率良く識別し分類することができるニ
ューロによるパターン認識システムを提供する。 【解決手段】 被分類対象に含まれる独立した個々の特
徴の存在程度を表す第1のアナログ信号及び存在しない
程度を表す第2のアナログ信号を出力するために並列に
前記特徴の個数だけ設けられた前段ニューロコンピュー
タ20と、前記前段ニューロコンピュータからの前記第
1及び第2のアナログ信号を入力して処理し前記被分類
対象が予め決められた複数のカテゴリのいずれに属する
かの情報を出力する後段ニューロコンピュータ30とを
設ける。
Description
【0001】
【発明の属する技術分野】本発明は、認識すべき文字群
が限られた記名式投票用紙等の用紙に記入された文字群
の認識を高速に行い、カテゴリの分類等を行う装置に関
し、特に、手書き文字列等、各種変形要素を含む記号列
のニューロ認識を行う際のニューロ用入力データの作成
方法、及びパターン認識/文字列認識システム,文字パ
ターン分類装置などに適用されるニューロコンピュータ
の構成に関する。
が限られた記名式投票用紙等の用紙に記入された文字群
の認識を高速に行い、カテゴリの分類等を行う装置に関
し、特に、手書き文字列等、各種変形要素を含む記号列
のニューロ認識を行う際のニューロ用入力データの作成
方法、及びパターン認識/文字列認識システム,文字パ
ターン分類装置などに適用されるニューロコンピュータ
の構成に関する。
【0002】
【従来の技術】貨幣,文字等の入力画像から被識別対象
を認識する装置としては、予め設定されている基準パタ
ーンとのマッチングにより認識するようにしたものが一
般的である。例えば、文字を認識する場合は、入力画像
から得た入力文字パターンと複数の文字パターン候補と
のパターンマッチングによりそれぞれの類似度を算出
し、最大類似度を得た文字パターン候補の情報を認識結
果として出力することで、入力文字を認識するようにし
ている。これに対し、近年、ニューロコンピュータを用
いて文字等のパターンを認識するようにした装置が数多
く提案されている。
を認識する装置としては、予め設定されている基準パタ
ーンとのマッチングにより認識するようにしたものが一
般的である。例えば、文字を認識する場合は、入力画像
から得た入力文字パターンと複数の文字パターン候補と
のパターンマッチングによりそれぞれの類似度を算出
し、最大類似度を得た文字パターン候補の情報を認識結
果として出力することで、入力文字を認識するようにし
ている。これに対し、近年、ニューロコンピュータを用
いて文字等のパターンを認識するようにした装置が数多
く提案されている。
【0003】ニューロコンピュータを用いて貨幣,文字
等のパターンを認識する装置の例としては、図10に示
すようなものがある。図10のパターン認識装置は、被
識別対象1の文字等をイメージセンサ2で読取って入力
画像3を得る。図10の入力画像3の場合、縦,横各8
分割なので、D(i.j)(但しi=1〜8、j=1〜
8)の64画素の入力情報として取得する。そして、こ
の64個の各画素データを分離演算部5に直接入力す
る。このとき、分離演算部5の入力層のニューロ素子
は、各画素に対応した64個が必要となる。そして、こ
の入力情報に基づきニューラルネットワークを用いてパ
ターンの認識を行うようになっている。
等のパターンを認識する装置の例としては、図10に示
すようなものがある。図10のパターン認識装置は、被
識別対象1の文字等をイメージセンサ2で読取って入力
画像3を得る。図10の入力画像3の場合、縦,横各8
分割なので、D(i.j)(但しi=1〜8、j=1〜
8)の64画素の入力情報として取得する。そして、こ
の64個の各画素データを分離演算部5に直接入力す
る。このとき、分離演算部5の入力層のニューロ素子
は、各画素に対応した64個が必要となる。そして、こ
の入力情報に基づきニューラルネットワークを用いてパ
ターンの認識を行うようになっている。
【0004】しかし、図10の認識装置では、分離演算
部5に入力する情報数が入力画像3の画素数だけ必要で
あるため、入力層のニューロ素子も画素数と同じ数だけ
必要となってくる。従って、多数のニューロ素子を有す
る入力層を設けなければならず、それに対応して隠れ層
も多数のニューロ素子を設ける必要があり、結局、非常
に大がかりな分離演算部5を用いなければパターン認識
を行ない得ないという問題がある。
部5に入力する情報数が入力画像3の画素数だけ必要で
あるため、入力層のニューロ素子も画素数と同じ数だけ
必要となってくる。従って、多数のニューロ素子を有す
る入力層を設けなければならず、それに対応して隠れ層
も多数のニューロ素子を設ける必要があり、結局、非常
に大がかりな分離演算部5を用いなければパターン認識
を行ない得ないという問題がある。
【0005】この問題を解決するために分離演算部の縮
小化を図ったパターン認識装置としては、例えば、特開
平5−324838号公報に記載のものが挙げられる。
このパターン認識装置では、図11に示すように、分離
演算部の前段に前処理部4を設け、センサ2で計測され
た被識別対象1の入力画像3を複数のメッシュ状マスク
41〜4Nを用いて縮小化し、複数の画像代表値に変換
し、縮小化した画像代表値をスラブ値SB1〜SBnに
して分離演算部(ニューラルネットワーク)5に入力す
るようにしている。そして、画像代表値を入力した分離
演算部5では、重み係数を用いて判定パターン毎に分離
演算値を算出して判定部6に出力し、分離演算値の中で
最大値を有するパターンを被識別対象のパターン画像と
して判定部6で判定するようにしている。メッシュ状マ
スクを用いる理由は、次のことによる。画像の特徴量と
して画素値の総和であるスラブ値を用いる場合は、例え
ば“F”と“K”の様に、異なるパターンを有する画像
でもスラブ値が等しくなる場合が存在する。そこで、特
定の部分が被覆されたメッシュ状のマスクを用いること
で、異なるスラブ値を生成して分離能力を高めるように
している。
小化を図ったパターン認識装置としては、例えば、特開
平5−324838号公報に記載のものが挙げられる。
このパターン認識装置では、図11に示すように、分離
演算部の前段に前処理部4を設け、センサ2で計測され
た被識別対象1の入力画像3を複数のメッシュ状マスク
41〜4Nを用いて縮小化し、複数の画像代表値に変換
し、縮小化した画像代表値をスラブ値SB1〜SBnに
して分離演算部(ニューラルネットワーク)5に入力す
るようにしている。そして、画像代表値を入力した分離
演算部5では、重み係数を用いて判定パターン毎に分離
演算値を算出して判定部6に出力し、分離演算値の中で
最大値を有するパターンを被識別対象のパターン画像と
して判定部6で判定するようにしている。メッシュ状マ
スクを用いる理由は、次のことによる。画像の特徴量と
して画素値の総和であるスラブ値を用いる場合は、例え
ば“F”と“K”の様に、異なるパターンを有する画像
でもスラブ値が等しくなる場合が存在する。そこで、特
定の部分が被覆されたメッシュ状のマスクを用いること
で、異なるスラブ値を生成して分離能力を高めるように
している。
【0006】ところで、ニューロコンピュータを用いて
画像のパターン認識をする場合には、いかに特徴のある
画像データをスラブ値として作成し、その入力層に入れ
ることができるかによって、その処理速度および認識の
信頼性が決定される。そのために、図11に示した上述
のパターン認識装置では、取り込んだ画像に部分的にマ
スクを掛けることによって特徴のある画像代表値として
スラブ値にして入力層に入力するようにしている。ま
た、このマスクの効率の良い作成方法についても数多く
提案されている。例えば、紙幣を対象としたニューロ識
別装置では、紙幣の画像データから抽出した光学パター
ン画像に対して紙幣の搬送方向と平行にランダムに複数
種のカラムマスクを施し、各光学パターン画像における
非マスク画素の総和(スラブ値)に変換し、このスラブ
値をニューラルネットワークの入力層に入力するように
したものが提案されている。
画像のパターン認識をする場合には、いかに特徴のある
画像データをスラブ値として作成し、その入力層に入れ
ることができるかによって、その処理速度および認識の
信頼性が決定される。そのために、図11に示した上述
のパターン認識装置では、取り込んだ画像に部分的にマ
スクを掛けることによって特徴のある画像代表値として
スラブ値にして入力層に入力するようにしている。ま
た、このマスクの効率の良い作成方法についても数多く
提案されている。例えば、紙幣を対象としたニューロ識
別装置では、紙幣の画像データから抽出した光学パター
ン画像に対して紙幣の搬送方向と平行にランダムに複数
種のカラムマスクを施し、各光学パターン画像における
非マスク画素の総和(スラブ値)に変換し、このスラブ
値をニューラルネットワークの入力層に入力するように
したものが提案されている。
【0007】また、特願平5−285527号公報に
は、紙幣等のパターン認識において生物の3大特徴であ
る交差、淘汰、突然変異をコンピュータでシミュレーシ
ョンすることにより、識別に最適なマスクを決定すると
いう、遺伝アルゴリズムを用いたマスクの最適化方法が
記載されている。この方法では、マスクを符号化して遺
伝子として設定し、複数種のマスクから成るマスクパタ
ーンをかけた画像データ総和値をニューラルネットワー
クの入力層に入力して、被識別対象の識別を学習させて
その結果を評価し、所定の識別達成度に応じて上記マス
クパターンを淘汰し、残ったマスクパターンに対して遺
伝子組み替えを実行して世代交代させ、この世代交代さ
せたマスクパターンを用いて学習を実行するという一連
の処理を、所定の世代交代数内で所定の識別達成値に達
するまで繰り返すことで、最適なマスク配置を得るよう
にしている。
は、紙幣等のパターン認識において生物の3大特徴であ
る交差、淘汰、突然変異をコンピュータでシミュレーシ
ョンすることにより、識別に最適なマスクを決定すると
いう、遺伝アルゴリズムを用いたマスクの最適化方法が
記載されている。この方法では、マスクを符号化して遺
伝子として設定し、複数種のマスクから成るマスクパタ
ーンをかけた画像データ総和値をニューラルネットワー
クの入力層に入力して、被識別対象の識別を学習させて
その結果を評価し、所定の識別達成度に応じて上記マス
クパターンを淘汰し、残ったマスクパターンに対して遺
伝子組み替えを実行して世代交代させ、この世代交代さ
せたマスクパターンを用いて学習を実行するという一連
の処理を、所定の世代交代数内で所定の識別達成値に達
するまで繰り返すことで、最適なマスク配置を得るよう
にしている。
【0008】この様に効率のよいマスクを掛けて特徴デ
ータを得るようにした装置も存在するが、マスクを掛け
て処理するだけでは、選挙の投票用紙に書かれた候捕者
の氏名、政党名の手書きの文字を、しかも漢字、平仮
名、カタカナの文字を認識する場合には難しさがある。
ータを得るようにした装置も存在するが、マスクを掛け
て処理するだけでは、選挙の投票用紙に書かれた候捕者
の氏名、政党名の手書きの文字を、しかも漢字、平仮
名、カタカナの文字を認識する場合には難しさがある。
【0009】また、複数のニューラルネットワークを用
いてパターン認識を行うようにしたものも提案されてい
る。例えば、特開平5−135000号公報には、複数
のカテゴリがあって、個々のニューラルネットワークの
規模を大きくせずして、マルチネットワークを構築する
ようにしたものが記載されている。図12は、その原理
ブロック図を示しており、カテゴリA、カテゴリCのよ
うに、同一のカテゴリであっても、1個のニューラルネ
ットワーク5Aでパターン認識ができない時には、複数
のニューラルネットワーク5Aに分割して学習を行わせ
るようにしてある。このようにして、同一のカテゴリで
離散的な値をとる場合にそれぞれの離散値毎にニューラ
ルネットワークを設けて学習を可能としている。この場
合、アルファベットの大文字をカテゴリAに、アルファ
ベットの小文字をカテゴリBにというように、複数のデ
ータを大別して分類する場合は、ニューラルネットワー
クの数が少なくて済む。これに対して、文字列の認識は
個々のカテゴリが異なることになるので、この文字列毎
にニューラルネットワークを設ければ良いことになる
が、これでは、ニューラルネットワークの数が多くなっ
てしまい非効率である。
いてパターン認識を行うようにしたものも提案されてい
る。例えば、特開平5−135000号公報には、複数
のカテゴリがあって、個々のニューラルネットワークの
規模を大きくせずして、マルチネットワークを構築する
ようにしたものが記載されている。図12は、その原理
ブロック図を示しており、カテゴリA、カテゴリCのよ
うに、同一のカテゴリであっても、1個のニューラルネ
ットワーク5Aでパターン認識ができない時には、複数
のニューラルネットワーク5Aに分割して学習を行わせ
るようにしてある。このようにして、同一のカテゴリで
離散的な値をとる場合にそれぞれの離散値毎にニューラ
ルネットワークを設けて学習を可能としている。この場
合、アルファベットの大文字をカテゴリAに、アルファ
ベットの小文字をカテゴリBにというように、複数のデ
ータを大別して分類する場合は、ニューラルネットワー
クの数が少なくて済む。これに対して、文字列の認識は
個々のカテゴリが異なることになるので、この文字列毎
にニューラルネットワークを設ければ良いことになる
が、これでは、ニューラルネットワークの数が多くなっ
てしまい非効率である。
【0010】
【発明が解決しようとする課題】上述のように、従来の
マスク方式を用いたものであると、癖字等、変形された
文字を読むことが困難であった。なぜなら固定したマス
クを読取った文字画像に適応して特徴データを抽出しよ
うとしても、書き手がかわれば文字の形がずれてしまう
ので、満足な文字認識ができないからである。また、複
数のニューラルネットワークを設け、複数のニューラル
ネットワークで学習を行うようにしたものでは、文字列
を認識させたい場合には、ニューラルネットワークの数
が多くなり、適さないという欠点があった。また、テン
プレートマッチングと言った処理が一般的に使われてい
るが、記名式投票用紙のような場合は個々の文字は手書
き文字を対象としているので、癖字などがあり文字列に
対してテンプレートマッチングを行うことができず、文
字列から個々の1文字1文字を切り出すことも容易では
ないというような問題があった。
マスク方式を用いたものであると、癖字等、変形された
文字を読むことが困難であった。なぜなら固定したマス
クを読取った文字画像に適応して特徴データを抽出しよ
うとしても、書き手がかわれば文字の形がずれてしまう
ので、満足な文字認識ができないからである。また、複
数のニューラルネットワークを設け、複数のニューラル
ネットワークで学習を行うようにしたものでは、文字列
を認識させたい場合には、ニューラルネットワークの数
が多くなり、適さないという欠点があった。また、テン
プレートマッチングと言った処理が一般的に使われてい
るが、記名式投票用紙のような場合は個々の文字は手書
き文字を対象としているので、癖字などがあり文字列に
対してテンプレートマッチングを行うことができず、文
字列から個々の1文字1文字を切り出すことも容易では
ないというような問題があった。
【0011】本発明は上述のような事情から成されたも
のであり、本発明の目的は、手書き文字列等の種々の変
形した記号群や、位置ズレ,回転,大きさの違い等のあ
る記号群についても、高い精度で効率良く識別し分類す
ることができるニューロによるパターン認識/限定文字
列認識システム及び文字パターン分類装置を提供するこ
とにある。
のであり、本発明の目的は、手書き文字列等の種々の変
形した記号群や、位置ズレ,回転,大きさの違い等のあ
る記号群についても、高い精度で効率良く識別し分類す
ることができるニューロによるパターン認識/限定文字
列認識システム及び文字パターン分類装置を提供するこ
とにある。
【0012】
【課題を解決するための手段】本発明は、被分類対象を
予め決められた複数のカテゴリに分類するニューロコン
ピュータを用いたパターン認識システムに関するもので
あり、本発明の上記目的は、前記ニューロコンピュータ
が、前記被分類対象に含まれる独立した個々の特徴の存
在程度を表す第1のアナログ信号及び存在しない程度を
表す第2のアナログ信号を出力するために並列に、前記
特徴の個数だけ設けられた前段ニューロコンピュータ
と、前記前段ニューロコンピュータからの前記第1及び
第2のアナログ信号を入力して処理し前記被分類対象が
前記カテゴリのいずれに属するかの情報を出力する後段
ニューロコンピュータとから成ることによって達成され
る。
予め決められた複数のカテゴリに分類するニューロコン
ピュータを用いたパターン認識システムに関するもので
あり、本発明の上記目的は、前記ニューロコンピュータ
が、前記被分類対象に含まれる独立した個々の特徴の存
在程度を表す第1のアナログ信号及び存在しない程度を
表す第2のアナログ信号を出力するために並列に、前記
特徴の個数だけ設けられた前段ニューロコンピュータ
と、前記前段ニューロコンピュータからの前記第1及び
第2のアナログ信号を入力して処理し前記被分類対象が
前記カテゴリのいずれに属するかの情報を出力する後段
ニューロコンピュータとから成ることによって達成され
る。
【0013】また、本発明は、記名式投票用紙に記入さ
れた文字列など、認識すべき文字列が限定されている文
字列をニューラルネットワークを用いて認識するニュー
ロによる限定文字列認識システムに関するものであり、
本発明の上記目的は、該当なしを含まない被分類文字列
を予め決められた複数の文字列に分類するために、前記
被分類文字列に含まれるホール,交差,端点等の各特徴
に対応して並列に設けられた複数の前段ニューラルネッ
トワークと、前記各前段ニューラルネットワークからの
各出力信号を入力して処理する後段ニューラルネットワ
ークとを備え、前記各前段ニューラルネットワークは予
め前記各特徴に対して学習を行い、前記被分類文字列の
複数の画像代表値を並列入力して前記各特徴について特
徴有りの程度を表す第1のアナログ信号及び特徴無しの
程度を表す第2のアナログ信号をそれぞれ出力し、前記
後段ニューラルネットワークは、前記各前段ニューラル
ネットワークからの前記第1及び第2のアナログ信号を
入力して処理し前記被分類文字列が前記予め決められた
複数の文字列のどれに該当するかの情報を出力するよう
になっていることによって達成される。
れた文字列など、認識すべき文字列が限定されている文
字列をニューラルネットワークを用いて認識するニュー
ロによる限定文字列認識システムに関するものであり、
本発明の上記目的は、該当なしを含まない被分類文字列
を予め決められた複数の文字列に分類するために、前記
被分類文字列に含まれるホール,交差,端点等の各特徴
に対応して並列に設けられた複数の前段ニューラルネッ
トワークと、前記各前段ニューラルネットワークからの
各出力信号を入力して処理する後段ニューラルネットワ
ークとを備え、前記各前段ニューラルネットワークは予
め前記各特徴に対して学習を行い、前記被分類文字列の
複数の画像代表値を並列入力して前記各特徴について特
徴有りの程度を表す第1のアナログ信号及び特徴無しの
程度を表す第2のアナログ信号をそれぞれ出力し、前記
後段ニューラルネットワークは、前記各前段ニューラル
ネットワークからの前記第1及び第2のアナログ信号を
入力して処理し前記被分類文字列が前記予め決められた
複数の文字列のどれに該当するかの情報を出力するよう
になっていることによって達成される。
【0014】また、本発明は、ニューロによる文字パタ
ーン分類装置に関するものであり、本発明の上記目的
は、被分類文字列の画像をブロック化するブロック化手
段と、前記ブロック化された画像データをフーリエ変換
するフーリエ変換手段と、前記フーリエ変換後のデータ
のうち所定の周波数成分のデータを抽出してスラブ値と
して採用するスラブ抽出手段と、前記抽出されたスラブ
値を並列入力し、予め形状要素毎に設定された前記被分
類文字列の特徴にどれだけ近いか及び/又はどれだけ遠
いかのアナログ信号を出力する各特徴毎に設けられた前
段ニューラルネットワークと、前記前段ニューラルネッ
トワークの出力をスラブ値として入力層に直接入力し、
前記被分類文字列が分類対象のカテゴリのいずれになる
かの情報を出力する後段ニューラルネットワークとを備
えることよって達成される。
ーン分類装置に関するものであり、本発明の上記目的
は、被分類文字列の画像をブロック化するブロック化手
段と、前記ブロック化された画像データをフーリエ変換
するフーリエ変換手段と、前記フーリエ変換後のデータ
のうち所定の周波数成分のデータを抽出してスラブ値と
して採用するスラブ抽出手段と、前記抽出されたスラブ
値を並列入力し、予め形状要素毎に設定された前記被分
類文字列の特徴にどれだけ近いか及び/又はどれだけ遠
いかのアナログ信号を出力する各特徴毎に設けられた前
段ニューラルネットワークと、前記前段ニューラルネッ
トワークの出力をスラブ値として入力層に直接入力し、
前記被分類文字列が分類対象のカテゴリのいずれになる
かの情報を出力する後段ニューラルネットワークとを備
えることよって達成される。
【0015】
【発明の実施の形態】癖字や大きさの大小,向きの違い
等の種々の変形パターンを有する手書きの文字群や記号
群(以下、「シンボルと呼ぶ」)を被識別/分類対象と
して、識別もしくは予め決められた複数のカテゴリに分
類する場合、シンボル全体のパターンを認識することに
よって当該シンボルを判別するのは困難である。そこ
で、本発明では、癖字等の変形文字であっても普遍な部
分に着目して、この特徴点が有るか無いかをもとに当該
シンボルを判別するようにしている。すなわち、線の交
わりや、線で囲まれた領域の有無、端点の個数などに着
目し、他のシンボルとの違いを複数の特徴点で認識し、
入力シンボルの識別もしくは入力シンボルの属するカテ
ゴリの判別を行うようにしている。
等の種々の変形パターンを有する手書きの文字群や記号
群(以下、「シンボルと呼ぶ」)を被識別/分類対象と
して、識別もしくは予め決められた複数のカテゴリに分
類する場合、シンボル全体のパターンを認識することに
よって当該シンボルを判別するのは困難である。そこ
で、本発明では、癖字等の変形文字であっても普遍な部
分に着目して、この特徴点が有るか無いかをもとに当該
シンボルを判別するようにしている。すなわち、線の交
わりや、線で囲まれた領域の有無、端点の個数などに着
目し、他のシンボルとの違いを複数の特徴点で認識し、
入力シンボルの識別もしくは入力シンボルの属するカテ
ゴリの判別を行うようにしている。
【0016】以下に説明する実施の形態では、撮像され
た画像から入力シンボルの領域を切り出してその大きさ
を拡大、縮小手段により標準と定めた大きさとした後、
その画像から線の交わりや、線で囲まれた領域の有無、
端点の個数等の特徴をフーリエ変換によって取出し、周
波数成分の全て若しくは所定の周波数成分のデータを抽
出してスラブ値としている。そして、シンボルに含まれ
る独立した個々の特徴について専用に処理する複数のニ
ューロコンピュータを並列に設け、上記スラブ値を各ニ
ューロコンピュータの入力層に入れて各特徴の有無の程
度を出力させ、この出力を後段の識別用ニューロコンピ
ュータの入力層に入力して、最終的なシンボルのカテゴ
リ分類を行うようにしている。
た画像から入力シンボルの領域を切り出してその大きさ
を拡大、縮小手段により標準と定めた大きさとした後、
その画像から線の交わりや、線で囲まれた領域の有無、
端点の個数等の特徴をフーリエ変換によって取出し、周
波数成分の全て若しくは所定の周波数成分のデータを抽
出してスラブ値としている。そして、シンボルに含まれ
る独立した個々の特徴について専用に処理する複数のニ
ューロコンピュータを並列に設け、上記スラブ値を各ニ
ューロコンピュータの入力層に入れて各特徴の有無の程
度を出力させ、この出力を後段の識別用ニューロコンピ
ュータの入力層に入力して、最終的なシンボルのカテゴ
リ分類を行うようにしている。
【0017】以下、図面に基づいて本発明の好適な実施
の形態について詳細に説明する。図1は本発明システム
の主要部の構成例を示すブロック図であり、大別する
と、入力画像3を処理してスラブ値を生成する前処理部
10と、特徴抽出用の複数のニューラルネットワークを
有する第1のニューロコンピュータ20と、識別用のニ
ューラルネットワークを有する第2のニューロコンピュ
ータ30と、判定部40とから構成される。前処理部1
0では、用紙1に記入されたシンボル(本例では文字
列)の画像データ3を切出して標準の大きさにスケーリ
ング処理した後にブロック化し、ブロック化した画像デ
ータにフーリエ変換処理を施し、スラブ値を選択して出
力する。第1のニューロコンピュータ(以下、「第1ニ
ューロ」とする)20は、複数の特徴抽出ニューロを具
備しており、前処理部10からのスラブ値を並列入力
し、被分類対象のシンボルに含まれる各特徴毎に予め学
習したニューロ重みにより、各特徴の存在程度を出力す
る。第2のニューロコンピュータ(以下、「第2ニュー
ロ」とする)30では、第1ニューロ20の出力を新た
なスラブ値として直接入力し、カテゴリ毎に予め学習し
たニューロ重みにより、各カテゴリ毎の分離演算値を出
力する。そして、判定部40では、第2ニュー30から
の各カテゴリ毎の分離演算値に基づいて、入力シンボル
のカテゴリを判定するようになっている。以下、各部の
構成と動作例についてそれぞれ詳細に説明する。
の形態について詳細に説明する。図1は本発明システム
の主要部の構成例を示すブロック図であり、大別する
と、入力画像3を処理してスラブ値を生成する前処理部
10と、特徴抽出用の複数のニューラルネットワークを
有する第1のニューロコンピュータ20と、識別用のニ
ューラルネットワークを有する第2のニューロコンピュ
ータ30と、判定部40とから構成される。前処理部1
0では、用紙1に記入されたシンボル(本例では文字
列)の画像データ3を切出して標準の大きさにスケーリ
ング処理した後にブロック化し、ブロック化した画像デ
ータにフーリエ変換処理を施し、スラブ値を選択して出
力する。第1のニューロコンピュータ(以下、「第1ニ
ューロ」とする)20は、複数の特徴抽出ニューロを具
備しており、前処理部10からのスラブ値を並列入力
し、被分類対象のシンボルに含まれる各特徴毎に予め学
習したニューロ重みにより、各特徴の存在程度を出力す
る。第2のニューロコンピュータ(以下、「第2ニュー
ロ」とする)30では、第1ニューロ20の出力を新た
なスラブ値として直接入力し、カテゴリ毎に予め学習し
たニューロ重みにより、各カテゴリ毎の分離演算値を出
力する。そして、判定部40では、第2ニュー30から
の各カテゴリ毎の分離演算値に基づいて、入力シンボル
のカテゴリを判定するようになっている。以下、各部の
構成と動作例についてそれぞれ詳細に説明する。
【0018】先ず、前処理部10におけるデータ処理に
ついて図1及び図2を参照して説明する。被分類対象の
シンボルが記入された用紙1はCCD等で成るイメージ
エリアセンサ2で撮像され、入力画像(文字群原画像)
3が画像フレームメモリに格納される。図2(A)は入
力画像3の一例を示している。ここでは、記入枠3a内
に記入されたシンボルを認識する場合を例として説明す
る。前処理部10内の画像切出部11では、予め設定さ
れている用紙情報に基づいて入力シンボルの記入枠3a
を認識し、記入枠3a内の画像RAを切出す。そして、
図2(B)に示すように、ヒストグラムHhist,V
histを作成して入力シンボルの形状の縦の長さ(垂
直方向のヒストグラム長)Wyと、横の長さ(水平方向
のヒストグラム長)Wxをそれぞれ求め、図2(C)に
示すように、記号部の画像MDを抽出する。
ついて図1及び図2を参照して説明する。被分類対象の
シンボルが記入された用紙1はCCD等で成るイメージ
エリアセンサ2で撮像され、入力画像(文字群原画像)
3が画像フレームメモリに格納される。図2(A)は入
力画像3の一例を示している。ここでは、記入枠3a内
に記入されたシンボルを認識する場合を例として説明す
る。前処理部10内の画像切出部11では、予め設定さ
れている用紙情報に基づいて入力シンボルの記入枠3a
を認識し、記入枠3a内の画像RAを切出す。そして、
図2(B)に示すように、ヒストグラムHhist,V
histを作成して入力シンボルの形状の縦の長さ(垂
直方向のヒストグラム長)Wyと、横の長さ(水平方向
のヒストグラム長)Wxをそれぞれ求め、図2(C)に
示すように、記号部の画像MDを抽出する。
【0019】抽出された入力シンボルの画像MDは、画
像スケーリング部12で拡大又は縮小されて、図2
(D)に示すように、標準の大きさの画像MD’に変換
される。そして、画像ブロック化部13で、図2(E)
及び(F)に示すように、n×m個のデータにブロック
分割されてフーリエ変換部14に入力される。上記の分
割数n×mは、予め文字,文字列,図形等の被分類シン
ボルの大きさや形状に基づいて設定されている。フーリ
エ変換部14部では、n×m個のデータをそれぞれフー
リエ変換し、シンボル中の特徴を周波数に置き換える。
スラブ値抽出部15では、フーリエ変換されたn×m個
のデータの周波数成分の全て若しくは所定の周波数成分
のデータを抽出し、図2(G)に示すように、抽出した
i個のデータをスラブ値SB1〜SBiとする。
像スケーリング部12で拡大又は縮小されて、図2
(D)に示すように、標準の大きさの画像MD’に変換
される。そして、画像ブロック化部13で、図2(E)
及び(F)に示すように、n×m個のデータにブロック
分割されてフーリエ変換部14に入力される。上記の分
割数n×mは、予め文字,文字列,図形等の被分類シン
ボルの大きさや形状に基づいて設定されている。フーリ
エ変換部14部では、n×m個のデータをそれぞれフー
リエ変換し、シンボル中の特徴を周波数に置き換える。
スラブ値抽出部15では、フーリエ変換されたn×m個
のデータの周波数成分の全て若しくは所定の周波数成分
のデータを抽出し、図2(G)に示すように、抽出した
i個のデータをスラブ値SB1〜SBiとする。
【0020】図3は、FFT(Fast Fourie
r Transfer;フーリエ変換処理)の処理結果
の一例を示しており、スラブ値抽出部15では、例えば
n×m=100個のFFTデータの内、低周波成分側の
50個の周波数のパワースペクトル(以下、フーリエパ
ワースペクトルとする)を第1ニューロのスラブ値とし
て抽出する。ここで、フーリエパワースペクトルを採用
するのは次の理由に基づいている。例えば、連続的に搬
送されて来る紙葉類を対象とした場合、採取されるデー
タは、紙葉類の搬送による種々の誤差を含んだものとな
っており、特にサンプルずれによる誤差の比重は大きい
と予想される。したがって、サンプリングされた時系列
データのフーリエパワースペクトルを用いればこの誤差
を除去することができ、識別能力の向上につながるから
である。
r Transfer;フーリエ変換処理)の処理結果
の一例を示しており、スラブ値抽出部15では、例えば
n×m=100個のFFTデータの内、低周波成分側の
50個の周波数のパワースペクトル(以下、フーリエパ
ワースペクトルとする)を第1ニューロのスラブ値とし
て抽出する。ここで、フーリエパワースペクトルを採用
するのは次の理由に基づいている。例えば、連続的に搬
送されて来る紙葉類を対象とした場合、採取されるデー
タは、紙葉類の搬送による種々の誤差を含んだものとな
っており、特にサンプルずれによる誤差の比重は大きい
と予想される。したがって、サンプリングされた時系列
データのフーリエパワースペクトルを用いればこの誤差
を除去することができ、識別能力の向上につながるから
である。
【0021】次に、第1ニューロ20の構成例について
説明する。第1ニューロ20は、図1のように、被分類
対象のシンボルに含まれる各特徴量(各特徴の有り,無
しの存在程度を示す値)を出力する複数の特徴抽出ニュ
ーロ21〜2Nから構成される。特徴抽出ニューロ21
〜2Nは、各特徴に対応して特徴個数分並列に設けら
れ、ホール(穴),交点(交差),端点等の独立したN
個の特徴をそれぞれ専用に処理し、予め学習した各特徴
のニューロ重み(特徴量抽出ウエイト)により、特徴有
り,特徴無しの程度をそれぞれ“0”〜“1”のアナロ
グ信号で出力するようになっている。本例では、“1”
に近いほど確信度が高く、“0”に近いほど確信度が低
い値が出力される。従って、各特徴抽出ニューロ21〜
2Nの出力情報は、予め設定されている各特徴に対して
どの程度類似しているか、或いは類似していないかを示
す“確信量”を表していると言える。
説明する。第1ニューロ20は、図1のように、被分類
対象のシンボルに含まれる各特徴量(各特徴の有り,無
しの存在程度を示す値)を出力する複数の特徴抽出ニュ
ーロ21〜2Nから構成される。特徴抽出ニューロ21
〜2Nは、各特徴に対応して特徴個数分並列に設けら
れ、ホール(穴),交点(交差),端点等の独立したN
個の特徴をそれぞれ専用に処理し、予め学習した各特徴
のニューロ重み(特徴量抽出ウエイト)により、特徴有
り,特徴無しの程度をそれぞれ“0”〜“1”のアナロ
グ信号で出力するようになっている。本例では、“1”
に近いほど確信度が高く、“0”に近いほど確信度が低
い値が出力される。従って、各特徴抽出ニューロ21〜
2Nの出力情報は、予め設定されている各特徴に対して
どの程度類似しているか、或いは類似していないかを示
す“確信量”を表していると言える。
【0022】図4は、第1ニューロ20内の特徴抽出ニ
ューロ2Nの構成例を示しており、1つの特徴抽出ニュ
ーロは、大別すると入力層、中間層、出力層の3つから
成っている。入力層は、前処理部10で生成されるスラ
ブ値の最大個数分のニューロ素子が設けられており、前
処理されたスラブ値SB1〜SBiを対応するニューロ
素子に入力する。中間層は少なくとも1つのニューロ素
子の層から成り、入力層の情報を分離演算して出力層に
伝達する役割を果たしている。この中間層のニューロ素
子が多くなればそれだけ、入力層の各ニューロ素子の情
報の変動に対しても不変に、各パターンの各々に分離し
て演算することが可能となる。出力層は、2つのニュー
ロ素子から成り、特徴Nの有、無の程度を示す2つの確
信量D(N,1),(N,2)を出力するようになって
いる。
ューロ2Nの構成例を示しており、1つの特徴抽出ニュ
ーロは、大別すると入力層、中間層、出力層の3つから
成っている。入力層は、前処理部10で生成されるスラ
ブ値の最大個数分のニューロ素子が設けられており、前
処理されたスラブ値SB1〜SBiを対応するニューロ
素子に入力する。中間層は少なくとも1つのニューロ素
子の層から成り、入力層の情報を分離演算して出力層に
伝達する役割を果たしている。この中間層のニューロ素
子が多くなればそれだけ、入力層の各ニューロ素子の情
報の変動に対しても不変に、各パターンの各々に分離し
て演算することが可能となる。出力層は、2つのニュー
ロ素子から成り、特徴Nの有、無の程度を示す2つの確
信量D(N,1),(N,2)を出力するようになって
いる。
【0023】次に、第1ニューロ20における学習時の
動作例について説明する。1種類の特徴Pを学習させる
為には、その特徴Pとの違いを持つ、もう一つのグルー
プ(特徴P以外)を用意する必要がある。これが特徴P
に対するその他のグループPxとなる。例えば、特徴の
数をNとし、i番目の特徴をPiとすると、識別対象の
シンボルの内、特徴Pi以外のもの全てが特徴Piに対
するその他のグループPixとなる。そして、PiとP
ixの特徴画像から、第1ニューロ20で使用するN個
の特徴量抽出ウエイトを作成する。ここでは、ホール,
交点,端点の3種類の特徴P1,P2,P3を具体例と
して説明する。この場合、学習用データは、○,×,△
等のホール,交点,端点を象徴するデータ(特徴基本デ
ータ)である。
動作例について説明する。1種類の特徴Pを学習させる
為には、その特徴Pとの違いを持つ、もう一つのグルー
プ(特徴P以外)を用意する必要がある。これが特徴P
に対するその他のグループPxとなる。例えば、特徴の
数をNとし、i番目の特徴をPiとすると、識別対象の
シンボルの内、特徴Pi以外のもの全てが特徴Piに対
するその他のグループPixとなる。そして、PiとP
ixの特徴画像から、第1ニューロ20で使用するN個
の特徴量抽出ウエイトを作成する。ここでは、ホール,
交点,端点の3種類の特徴P1,P2,P3を具体例と
して説明する。この場合、学習用データは、○,×,△
等のホール,交点,端点を象徴するデータ(特徴基本デ
ータ)である。
【0024】図5は、ホール,交点,端点の特徴量抽出
ウエイトの作成方法をブロック図で示している。特徴P
1(ホール)のウエイトを作成する場合は、P1の特徴
画像(特徴基本データ)とその他のグループP1xの特
徴画像を所定の大きさにスケーリングした後、n×m個
のデータにブロック化し、ブロック分割されたデータに
FFTを施す。そして、FFTの出力をスラブ値として
第1ニューロ20に入力し、ホール形状を学習させたウ
エイトをP1ウエイト(ホールウエイト)とする。同様
にして、P2ウエイト(交点ウエイト)、P3ウエイト
(端点ウエイト)というように、抽出したい特徴数分の
特徴量抽出ウエイトを作成する。図6(A),(B),
(C)は、それぞれ“ホール”、“交点”、“4個の端
点”を例としたFFT結果の例を示しており、同図のよ
うなFFTデータに基づいて各特徴量抽出ウエイトが作
成される。なお、本例では、ニューラルネットワークの
学習アルゴリズムは、次の数1で与えられる慣性項、振
動項を付加した改良型バックプロパゲーション法を用い
ている。
ウエイトの作成方法をブロック図で示している。特徴P
1(ホール)のウエイトを作成する場合は、P1の特徴
画像(特徴基本データ)とその他のグループP1xの特
徴画像を所定の大きさにスケーリングした後、n×m個
のデータにブロック化し、ブロック分割されたデータに
FFTを施す。そして、FFTの出力をスラブ値として
第1ニューロ20に入力し、ホール形状を学習させたウ
エイトをP1ウエイト(ホールウエイト)とする。同様
にして、P2ウエイト(交点ウエイト)、P3ウエイト
(端点ウエイト)というように、抽出したい特徴数分の
特徴量抽出ウエイトを作成する。図6(A),(B),
(C)は、それぞれ“ホール”、“交点”、“4個の端
点”を例としたFFT結果の例を示しており、同図のよ
うなFFTデータに基づいて各特徴量抽出ウエイトが作
成される。なお、本例では、ニューラルネットワークの
学習アルゴリズムは、次の数1で与えられる慣性項、振
動項を付加した改良型バックプロパゲーション法を用い
ている。
【0025】
【数1】
【0026】次に、第1ニューロ20における評価時の
動作例について説明する。評価時には、入力シンボルの
画像3を処理して図形中の特徴が周波数に置き換えられ
たn×m個のデータの内の所定の周波数成分若しくは周
波数成分の全てが、スラブ値として第1ニューロ20の
各特徴抽出ニューロ21〜2Nの入力層にそれぞれ入力
される。この評価画像の入力データ(スラブ値SB1〜
SBi)を前述の複数ニューロ(ウエイト)で評価する
と、ニューロの汎化能力により、未学習画像データであ
っても、学習した特徴をニューロが見つけると、“有
り”が1に近く反応する。見つけられない場合は、“無
し”が1近くになる。従って、1つの特徴につき、特徴
が有るという確信量と無いという確信量を表す2つのア
ナログ値が出力されることになる。これらのウエイトで
評価されたニューロの結果の組み合わせが、第1ニュー
ロ20の評価出力となる。本例では、1つのウエイトで
2つの出力があるので、第1ニューロ20の出力データ
D(1,1)〜D(N,2)はN×2個になる。以上の
ように、第1ニューロ20では、被分類対象のシンボル
に含まれる各特徴毎に予め調整された重みにより入力シ
ンボルの各特徴量を評価し、各特徴の有る、無いの程度
を示すデータを0〜1の間のアナログ値で出力するよう
になっている。
動作例について説明する。評価時には、入力シンボルの
画像3を処理して図形中の特徴が周波数に置き換えられ
たn×m個のデータの内の所定の周波数成分若しくは周
波数成分の全てが、スラブ値として第1ニューロ20の
各特徴抽出ニューロ21〜2Nの入力層にそれぞれ入力
される。この評価画像の入力データ(スラブ値SB1〜
SBi)を前述の複数ニューロ(ウエイト)で評価する
と、ニューロの汎化能力により、未学習画像データであ
っても、学習した特徴をニューロが見つけると、“有
り”が1に近く反応する。見つけられない場合は、“無
し”が1近くになる。従って、1つの特徴につき、特徴
が有るという確信量と無いという確信量を表す2つのア
ナログ値が出力されることになる。これらのウエイトで
評価されたニューロの結果の組み合わせが、第1ニュー
ロ20の評価出力となる。本例では、1つのウエイトで
2つの出力があるので、第1ニューロ20の出力データ
D(1,1)〜D(N,2)はN×2個になる。以上の
ように、第1ニューロ20では、被分類対象のシンボル
に含まれる各特徴毎に予め調整された重みにより入力シ
ンボルの各特徴量を評価し、各特徴の有る、無いの程度
を示すデータを0〜1の間のアナログ値で出力するよう
になっている。
【0027】次に、第2ニューロ30の構成例について
説明する。第2ニューロ30は、図1に示したように第
1ニューロ20の後段に設けられ、入力層、中間層、出
力層の3つから成る単一ニューロで構成される。入力層
は、特徴の種類に対応して特徴個数×2個のニューロ素
子が設けられており、第1ニューロ20からの特徴数N
×2個の出力D(1,1),D(1,2)〜D(N,
1),D(N,2)をスラブ値として各ニューロ素子に
入力する。中間層は少なくとも1つのニューロ素子の層
から成り、入力層の情報を分離演算して出力層に伝達す
る役割を果たしている。出力層は、分類すべきカテゴリ
C(1)〜C(M)に1対1に対応するようにM個のニ
ューロ素子が設けられている。第2ニューロ30の出力
層から出力されるデータC(1)〜C(M)は、予め決
められたM個の各カテゴリに対応する分離演算値であ
り、この分離演算値が判定部40に入力されて入力シン
ボルの属するカテゴリが判定されるようになっている。
説明する。第2ニューロ30は、図1に示したように第
1ニューロ20の後段に設けられ、入力層、中間層、出
力層の3つから成る単一ニューロで構成される。入力層
は、特徴の種類に対応して特徴個数×2個のニューロ素
子が設けられており、第1ニューロ20からの特徴数N
×2個の出力D(1,1),D(1,2)〜D(N,
1),D(N,2)をスラブ値として各ニューロ素子に
入力する。中間層は少なくとも1つのニューロ素子の層
から成り、入力層の情報を分離演算して出力層に伝達す
る役割を果たしている。出力層は、分類すべきカテゴリ
C(1)〜C(M)に1対1に対応するようにM個のニ
ューロ素子が設けられている。第2ニューロ30の出力
層から出力されるデータC(1)〜C(M)は、予め決
められたM個の各カテゴリに対応する分離演算値であ
り、この分離演算値が判定部40に入力されて入力シン
ボルの属するカテゴリが判定されるようになっている。
【0028】ここで、カテゴリの概念について説明す
る。カテゴリとは、同類のものが、その中に入るべき部
門・範囲・種類であり、図7に示すようなデータ分布が
与えられた場合、各集合C(1),C(2),…,C
(5)に属するデータがそれぞれカテゴリC(1),C
(2),…,C(5)と意味づけられる。その場合、ど
のようにカテゴリを分けるかはテーマによって異なって
くる。例えば、政党を択一的に選択して投票する議院選
挙では、それぞれの政党が各カテゴリとなる。この場
合、各被分類文字列は政党名であり、分類すべきカテゴ
リと1対1に対応し、分類結果=被分類文字列の認識結
果となる。一方、数字の文字列はカテゴリC(1)、漢
字の文字列はカテゴリC(2)、ひらがなの文字列はカ
テゴリC(3)というように、入力シンボルを特定の種
別に分類する場合は、各被分類文字列は、分類すべきカ
テゴリとn対1に対応する。本発明では、図7の各集合
C(1),C(2),…,C(5)において、1つの集
合に属する個々のデータが個々の特徴、即ちカテゴリの
各特徴に相当し、第2ニューロ30では、第1ニューロ
30から出力される各特徴量(確信量)の組み合わせか
らカテゴリを特定し、入力シンボルの属するカテゴリを
判定するようにしている。
る。カテゴリとは、同類のものが、その中に入るべき部
門・範囲・種類であり、図7に示すようなデータ分布が
与えられた場合、各集合C(1),C(2),…,C
(5)に属するデータがそれぞれカテゴリC(1),C
(2),…,C(5)と意味づけられる。その場合、ど
のようにカテゴリを分けるかはテーマによって異なって
くる。例えば、政党を択一的に選択して投票する議院選
挙では、それぞれの政党が各カテゴリとなる。この場
合、各被分類文字列は政党名であり、分類すべきカテゴ
リと1対1に対応し、分類結果=被分類文字列の認識結
果となる。一方、数字の文字列はカテゴリC(1)、漢
字の文字列はカテゴリC(2)、ひらがなの文字列はカ
テゴリC(3)というように、入力シンボルを特定の種
別に分類する場合は、各被分類文字列は、分類すべきカ
テゴリとn対1に対応する。本発明では、図7の各集合
C(1),C(2),…,C(5)において、1つの集
合に属する個々のデータが個々の特徴、即ちカテゴリの
各特徴に相当し、第2ニューロ30では、第1ニューロ
30から出力される各特徴量(確信量)の組み合わせか
らカテゴリを特定し、入力シンボルの属するカテゴリを
判定するようにしている。
【0029】次に、第2ニューロ30における学習及び
評価時の動作例について説明する。第2ニューロのウエ
イトを作成する際には、学習用データは、評価するシン
ボルの基本データ(被分類対象の一般的手書き文字群)
を用いる。特徴抽出用の第1ニューロ20で、例えば
“口”という文字を評価した場合、次の表1のようにな
る。
評価時の動作例について説明する。第2ニューロのウエ
イトを作成する際には、学習用データは、評価するシン
ボルの基本データ(被分類対象の一般的手書き文字群)
を用いる。特徴抽出用の第1ニューロ20で、例えば
“口”という文字を評価した場合、次の表1のようにな
る。
【表1】
【0030】前述のように第1ニューロ20では、これ
らのビット列を、1〜0の範囲で表現されるアナログ値
とし、シンボルに含まれる特徴をN×2個のアナログデ
ータの組み合わせとして表現し、このデータ列を第2ニ
ューロ30に入力する。以下、被分類文字列の具体例と
して“××党”,“××党”,“××××党”で説明す
る。この場合、××党の文字列では、ホール(口や○の
ように線で囲まれた部分)は、“自”の部分が3個,
“由”の部分が4個,“党”の部分が1個の合計8個存
在し、交点(+や×のように線が交差する点)は、
“由”の部分が2個存在し、端点(直線部の端点)は、
“自”の部分が1個,“由”の部分が1個,“党”の部
分が7個の合計9個存在する。但し、上記に示した個数
は、理解しやすくするために具体的な値を示したもので
あり、第1ニューロの学習用データ(特徴基本データ)
としてどのような形状のデータを用いるかによって変わ
ってくる。自由党の文字列と同様に、他の文字列につい
て各特徴の存在個数を調べ、固有特徴量に違いのあるも
のを識別用の特徴として用いるようにする。
らのビット列を、1〜0の範囲で表現されるアナログ値
とし、シンボルに含まれる特徴をN×2個のアナログデ
ータの組み合わせとして表現し、このデータ列を第2ニ
ューロ30に入力する。以下、被分類文字列の具体例と
して“××党”,“××党”,“××××党”で説明す
る。この場合、××党の文字列では、ホール(口や○の
ように線で囲まれた部分)は、“自”の部分が3個,
“由”の部分が4個,“党”の部分が1個の合計8個存
在し、交点(+や×のように線が交差する点)は、
“由”の部分が2個存在し、端点(直線部の端点)は、
“自”の部分が1個,“由”の部分が1個,“党”の部
分が7個の合計9個存在する。但し、上記に示した個数
は、理解しやすくするために具体的な値を示したもので
あり、第1ニューロの学習用データ(特徴基本データ)
としてどのような形状のデータを用いるかによって変わ
ってくる。自由党の文字列と同様に、他の文字列につい
て各特徴の存在個数を調べ、固有特徴量に違いのあるも
のを識別用の特徴として用いるようにする。
【0031】上記の党名を識別するための特徴として、
例えば、:P1=ホール8個の有り/無し、:P2
=端点9個の有り/無し、:P3=交点1個の有り/
無し、:P4=交点2個の有り/無し、:P5=ホ
ール1個の有り/無し、:P6=ホール2個の有り/
無し、の6種類の特徴P1〜P6を用いる。これらの特
徴P1〜P6に対するウエイトを第1ニューロ20で生
成して評価すると、その評価結果は、6×2=12個の
データ列となる。この具体的な評価結果をまとめると、
次の表2のようになる。
例えば、:P1=ホール8個の有り/無し、:P2
=端点9個の有り/無し、:P3=交点1個の有り/
無し、:P4=交点2個の有り/無し、:P5=ホ
ール1個の有り/無し、:P6=ホール2個の有り/
無し、の6種類の特徴P1〜P6を用いる。これらの特
徴P1〜P6に対するウエイトを第1ニューロ20で生
成して評価すると、その評価結果は、6×2=12個の
データ列となる。この具体的な評価結果をまとめると、
次の表2のようになる。
【0032】
【表2】
【0033】次に、上記表2の3党(3パターン)のデ
ータの違いを第2ニューロ30で学習し、識別用ウエイ
トを生成する。評価では、図8に示すように、第1ニュ
ーロ20の出力をスラブ値として入力し、入力シンボル
3Aが3つのカテゴリC(1)〜C(3)のどのカテゴ
リに該当するかを識別する。従って、第2ニューロ30
の結果は、“××党”,“××党”“××××党”のど
れかのカテゴリに反応することになる。
ータの違いを第2ニューロ30で学習し、識別用ウエイ
トを生成する。評価では、図8に示すように、第1ニュ
ーロ20の出力をスラブ値として入力し、入力シンボル
3Aが3つのカテゴリC(1)〜C(3)のどのカテゴ
リに該当するかを識別する。従って、第2ニューロ30
の結果は、“××党”,“××党”“××××党”のど
れかのカテゴリに反応することになる。
【0034】以上のように、第1ニューロ20では、手
書き文字列等のシンボルの特徴を抽出するために、識別
したいシンボルの持つ特徴を複数のニューロによって学
習させ、評価では、それらの特徴の存在を判定し、この
データ列を第2ニューロ30に引き渡す。第2ニューロ
30では、識別するシンボルの特徴データ列を識別対象
シンボルのパターン分学習させ、評価では、どのシンボ
ルパターンに該当するかを識別するようになっている。
書き文字列等のシンボルの特徴を抽出するために、識別
したいシンボルの持つ特徴を複数のニューロによって学
習させ、評価では、それらの特徴の存在を判定し、この
データ列を第2ニューロ30に引き渡す。第2ニューロ
30では、識別するシンボルの特徴データ列を識別対象
シンボルのパターン分学習させ、評価では、どのシンボ
ルパターンに該当するかを識別するようになっている。
【0035】以下に、本発明を投票用紙計数仕分機に適
用した場合の一実施例を説明する。図9は本発明を適用
した投票用紙計数仕分機の外観構成を示しており、本体
51の正面上部には液晶表示部52、スタート/ストッ
プキ−53、ファンクションキ−54から成る操作パネ
ルが設けられており、正面左側には、左側面に取り付け
られるスタッカ57に対応した位置にスタッカ番号を表
示するLED表示器55が設けられている。また、本体
右側面にはホッパ部56が設けられている。このホッパ
は例えば500枚の容量を有している。仕分けされる投
票用紙はホッパ部56に載置され、仕分けされてスタッ
カ部57に収納される。スタッカ部57はn段(本例で
は4段)のスタッカより成っており、最下段のスタッカ
は無効票や読取不能票などのリジェクト専用となってい
る。
用した場合の一実施例を説明する。図9は本発明を適用
した投票用紙計数仕分機の外観構成を示しており、本体
51の正面上部には液晶表示部52、スタート/ストッ
プキ−53、ファンクションキ−54から成る操作パネ
ルが設けられており、正面左側には、左側面に取り付け
られるスタッカ57に対応した位置にスタッカ番号を表
示するLED表示器55が設けられている。また、本体
右側面にはホッパ部56が設けられている。このホッパ
は例えば500枚の容量を有している。仕分けされる投
票用紙はホッパ部56に載置され、仕分けされてスタッ
カ部57に収納される。スタッカ部57はn段(本例で
は4段)のスタッカより成っており、最下段のスタッカ
は無効票や読取不能票などのリジェクト専用となってい
る。
【0036】上述のような構成の投票用紙計数仕分機に
おいては、従来は、予め列記された氏名の上方に自ら筆
記用具を介して×印や○印を付して投票する投票用紙、
例えば、最高裁判所裁判官国民審査や市長選挙の投票用
紙を対象としていたが、本発明を適用することにより、
記名式の投票用紙を対象とすることが可能となる。即
ち、手書きされた政党名や候補者名を入力シンボルとし
て図1の前処理部10で前述の前処理を実行し、第1ニ
ューロ20及び第2ニューロ30を介して入力シンボル
のカテゴリ(政党や候補者、無効票)を識別し、判定部
40若しくは上位の制御部により、各カテゴリ毎に投票
用紙を分類及び集計すると共に、仕分けることが可能と
なる。
おいては、従来は、予め列記された氏名の上方に自ら筆
記用具を介して×印や○印を付して投票する投票用紙、
例えば、最高裁判所裁判官国民審査や市長選挙の投票用
紙を対象としていたが、本発明を適用することにより、
記名式の投票用紙を対象とすることが可能となる。即
ち、手書きされた政党名や候補者名を入力シンボルとし
て図1の前処理部10で前述の前処理を実行し、第1ニ
ューロ20及び第2ニューロ30を介して入力シンボル
のカテゴリ(政党や候補者、無効票)を識別し、判定部
40若しくは上位の制御部により、各カテゴリ毎に投票
用紙を分類及び集計すると共に、仕分けることが可能と
なる。
【0037】なお、上述した実施の形態では、被分類対
象と分類カテゴリとを1対1に対応させて、主に文字列
を識別する場合を例として説明したが、n対1に対応さ
せて、マーク等の変形記号を含む種々の記号群をカテゴ
リ分類することも、勿論可能である。また、特徴の例と
してホール,交点(交差),端点を具体例として説明し
たが、これらに限るものではなく、例えばフーリエパワ
ースペクトルにて、特徴の違いが現れるような形状要素
であれば、その部分を特徴として採用することができ
る。また、第1ニューロの構成例では、1つの特徴に対
して有、無の程度を示す2つのデータを出力する場合を
例として説明したが、分類のテーマによっては、いずれ
か一方であっても分類可能である。また、上述のような
投票用紙計数仕分機に限らず、本発明は、アンケート用
紙の集計装置、種々のフォントパターンを必要としない
手書き数字認識装置、文字パターン分類装置など、手書
き文字やマーク等の種々の記号群を識別して処理する装
置に対して効果的に適用することができる。
象と分類カテゴリとを1対1に対応させて、主に文字列
を識別する場合を例として説明したが、n対1に対応さ
せて、マーク等の変形記号を含む種々の記号群をカテゴ
リ分類することも、勿論可能である。また、特徴の例と
してホール,交点(交差),端点を具体例として説明し
たが、これらに限るものではなく、例えばフーリエパワ
ースペクトルにて、特徴の違いが現れるような形状要素
であれば、その部分を特徴として採用することができ
る。また、第1ニューロの構成例では、1つの特徴に対
して有、無の程度を示す2つのデータを出力する場合を
例として説明したが、分類のテーマによっては、いずれ
か一方であっても分類可能である。また、上述のような
投票用紙計数仕分機に限らず、本発明は、アンケート用
紙の集計装置、種々のフォントパターンを必要としない
手書き数字認識装置、文字パターン分類装置など、手書
き文字やマーク等の種々の記号群を識別して処理する装
置に対して効果的に適用することができる。
【0038】
【発明の効果】以上に説明したように、本発明によれ
ば、複数のニューロから構成される第1ニューロによっ
て被分類シンボルの特徴を抽出し、その結果を用いて第
2ニューロにより被分類シンボルの属するカテゴリを識
別するようにしているので、従来の装置では識別が困難
であった手書き文字を含む種々の変形した文字群や、位
置ズレ,回転,大きさの違い等の文字群についても、効
率良く高い精度で分類し識別することが可能となる。ま
た、ニューロの中間情報を特徴抽出の確信値として得る
ことができ、識別システムの解析が容易となる。また、
文字群に限らず、種々の形状パターンを有する図形等に
ついても高い精度で分類し識別することが可能となる。
ば、複数のニューロから構成される第1ニューロによっ
て被分類シンボルの特徴を抽出し、その結果を用いて第
2ニューロにより被分類シンボルの属するカテゴリを識
別するようにしているので、従来の装置では識別が困難
であった手書き文字を含む種々の変形した文字群や、位
置ズレ,回転,大きさの違い等の文字群についても、効
率良く高い精度で分類し識別することが可能となる。ま
た、ニューロの中間情報を特徴抽出の確信値として得る
ことができ、識別システムの解析が容易となる。また、
文字群に限らず、種々の形状パターンを有する図形等に
ついても高い精度で分類し識別することが可能となる。
【図1】本発明の主要部の構成例を示すブロック図であ
る。
る。
【図2】本発明の前処理部におけるデータ処理を説明す
るための図である。
るための図である。
【図3】本発明におけるフーリエ変換処理の結果の一例
を示す図である。
を示す図である。
【図4】本発明における特徴抽出ニューロの一構成例を
示すブロック図である。
示すブロック図である。
【図5】本発明における第1ニューロで使用する特徴量
抽出ウエイトの作成方法を説明するためのブロック図で
ある。
抽出ウエイトの作成方法を説明するためのブロック図で
ある。
【図6】本発明における特徴量抽出ウエイト作成時のフ
ーリエ変換処理の結果の具体例を示す図である。
ーリエ変換処理の結果の具体例を示す図である。
【図7】本発明におけるカテゴリの概念を説明するため
の図である。
の図である。
【図8】本発明における評価時の動作例を説明するため
の図である。
の図である。
【図9】本発明を適用した投票用紙計数仕分機の構成例
を示す外観斜視図である。
を示す外観斜視図である。
【図10】従来のパターン認識装置の第1の例を示すブ
ロック構成図である。
ロック構成図である。
【図11】従来のパターン認識装置の第2の例を示すブ
ロック構成図である。
ロック構成図である。
【図12】従来のパターン認識装置の第3の例を示す原
理ブロック図である。
理ブロック図である。
2 イメージエリアセンサ 3 入力画像 10 前処理部 20 前段ニューロコンピュータ(第1ニューロ) 21〜2N 特徴抽出ニューロ 30 後段ニューロコンピュータ(第2ニューロ) 40 判定部
Claims (3)
- 【請求項1】 被分類対象を予め決められた複数のカテ
ゴリに分類するニューロコンピュータを用いたパターン
認識システムにおいて、前記ニューロコンピュータが、
前記被分類対象に含まれる独立した個々の特徴の存在程
度を表す第1のアナログ信号及び存在しない程度を表す
第2のアナログ信号を出力するために並列に、前記特徴
の個数だけ設けられた前段ニューロコンピュータと、前
記前段ニューロコンピュータからの前記第1及び第2の
アナログ信号を入力して処理し前記被分類対象が前記カ
テゴリのいずれに属するかの情報を出力する後段ニュー
ロコンピュータとから成ることを特徴とするニューロに
よるパターン認識システム。 - 【請求項2】 該当なしを含まない被分類文字列を予め
決められた複数の文字列に分類するために、前記被分類
文字列に含まれるホール,交差,端点等の各特徴に対応
して並列に設けられた複数の前段ニューラルネットワー
クと、前記各前段ニューラルネットワークからの各出力
信号を入力して処理する後段ニューラルネットワークと
を備え、前記各前段ニューラルネットワークは予め前記
各特徴に対して学習を行い、前記被分類文字列の複数の
画像代表値を並列入力して前記各特徴について特徴有り
の程度を表す第1のアナログ信号及び特徴無しの程度を
表す第2のアナログ信号をそれぞれ出力し、前記後段ニ
ューラルネットワークは、前記各前段ニューラルネット
ワークからの前記第1及び第2のアナログ信号を入力し
て処理し前記被分類文字列が前記予め決められた複数の
文字列のどれに該当するかの情報を出力するようになっ
ていることを特徴とするニューロによる限定文字列認識
システム。 - 【請求項3】 被分類文字列の画像をブロック化するブ
ロック化手段と、前記ブロック化された画像データをフ
ーリエ変換するフーリエ変換手段と、前記フーリエ変換
後のデータのうち所定の周波数成分のデータを抽出して
スラブ値として採用するスラブ抽出手段と、前記抽出さ
れたスラブ値を並列入力し、予め形状要素毎に設定され
た前記被分類文字列の特徴にどれだけ近いか及び/又は
どれだけ遠いかのアナログ信号を出力する各特徴毎に設
けられた前段ニューラルネットワークと、前記前段ニュ
ーラルネットワークの出力をスラブ値として入力層に直
接入力し、前記被分類文字列が分類対象のカテゴリのい
ずれになるかの情報を出力する後段ニューラルネットワ
ークとを備えたことを特徴とするニューロによる文字パ
ターン分類装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9001447A JPH10198762A (ja) | 1997-01-08 | 1997-01-08 | ニューロによるパターン認識/限定文字列認識システム及び文字パターン分類装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9001447A JPH10198762A (ja) | 1997-01-08 | 1997-01-08 | ニューロによるパターン認識/限定文字列認識システム及び文字パターン分類装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH10198762A true JPH10198762A (ja) | 1998-07-31 |
Family
ID=11501703
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9001447A Pending JPH10198762A (ja) | 1997-01-08 | 1997-01-08 | ニューロによるパターン認識/限定文字列認識システム及び文字パターン分類装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH10198762A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012023550A (ja) * | 2010-07-14 | 2012-02-02 | Musashi Eng Co Ltd | 投票用紙の読取装置および読取方法 |
| JP2020155825A (ja) * | 2019-03-18 | 2020-09-24 | 株式会社東芝 | 受信信号のOn−Offパターン決定装置および方法、ならびに受信信号の復調装置および方法 |
| CN113221801A (zh) * | 2021-05-24 | 2021-08-06 | 北京奇艺世纪科技有限公司 | 版号信息识别方法、装置、电子设备及可读存储介质 |
| CN116401419A (zh) * | 2022-01-04 | 2023-07-07 | 株式会社东芝 | 检索装置、检索系统、检索方法以及存储介质 |
-
1997
- 1997-01-08 JP JP9001447A patent/JPH10198762A/ja active Pending
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012023550A (ja) * | 2010-07-14 | 2012-02-02 | Musashi Eng Co Ltd | 投票用紙の読取装置および読取方法 |
| JP2020155825A (ja) * | 2019-03-18 | 2020-09-24 | 株式会社東芝 | 受信信号のOn−Offパターン決定装置および方法、ならびに受信信号の復調装置および方法 |
| CN113221801A (zh) * | 2021-05-24 | 2021-08-06 | 北京奇艺世纪科技有限公司 | 版号信息识别方法、装置、电子设备及可读存储介质 |
| CN113221801B (zh) * | 2021-05-24 | 2023-08-18 | 北京奇艺世纪科技有限公司 | 版号信息识别方法、装置、电子设备及可读存储介质 |
| CN116401419A (zh) * | 2022-01-04 | 2023-07-07 | 株式会社东芝 | 检索装置、检索系统、检索方法以及存储介质 |
| JP2023099885A (ja) * | 2022-01-04 | 2023-07-14 | 株式会社東芝 | 検索装置、検索システム、検索方法、プログラム、及び記憶媒体 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Patil et al. | Neural network based system for script identification in Indian documents | |
| US5097517A (en) | Method and apparatus for processing bank checks, drafts and like financial documents | |
| EP1345162B1 (en) | Character recognition system and method | |
| CN111652332B (zh) | 基于二分类的深度学习手写中文字符识别方法及系统 | |
| US5504822A (en) | Character recognition system | |
| EP0113410A2 (en) | Image processors | |
| CN115620312A (zh) | 跨模态字符笔迹验证方法、系统、设备及存储介质 | |
| JP2010134957A (ja) | パターン認識方法 | |
| US20070065003A1 (en) | Real-time recognition of mixed source text | |
| Gazzah et al. | Neural networks and support vector machines classifiers for writer identification using Arabic script. | |
| Srihari et al. | Biometric and forensic aspects of digital document processing | |
| JP4932177B2 (ja) | 硬貨分類装置および硬貨分類方法 | |
| CN101326518B (zh) | 用于墨水笔记的手写体识别的方法和装置 | |
| CN112651323A (zh) | 一种基于文本行检测的中文手写体识别方法及系统 | |
| JPH10198762A (ja) | ニューロによるパターン認識/限定文字列認識システム及び文字パターン分類装置 | |
| Gupta et al. | World coin currency detection using various techniques and their comparative analysis | |
| Shinde et al. | Feedforward back propagation neural network (FFBPNN) based approach for the identification of handwritten math equations | |
| WO1988002157A1 (en) | Character and pattern recognition machine and method | |
| Garg et al. | Handwritten Gurumukhi character recognition using neural networks | |
| Anisimov et al. | Bank check reading: Recognizing the courtesy amount | |
| JP3332952B2 (ja) | 硬貨識別装置 | |
| Imama et al. | A Slice-based Character Recognition Technique for Handwritten Devanagari Script | |
| Gurung et al. | Digitization of Devanagari Handwritten Text Using CNN | |
| JP3657565B2 (ja) | 画像パターン同定・認識方法 | |
| Albadawi et al. | Classifying of Isolated Handwritten Arabic Characters (on-line) Using Machine Learning Methods |