JPH0644376A

JPH0644376A - 画像特徴抽出装置、画像認識方法及び画像認識装置

Info

Publication number: JPH0644376A
Application number: JP5125730A
Authority: JP
Inventors: Yasunori Kuratomi; 靖規藏富; Kuni Ogawa; 久仁小川
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1992-05-28
Filing date: 1993-05-27
Publication date: 1994-02-18

Abstract

(57)【要約】【目的】ニューラルネットワークを用いた画像認識装
置において、高い認識率を得る。【構成】入力部１が作製したビットイメージを、特徴
抽出部２、及び認識部３を構成するニューラルネットワ
ークによって処理して、画像を認識する。特徴抽出部で
は、まず形状抽出部４を構成する第１のニューラルネッ
トワークによって、ビットイメージから特定方向の線分
あるいは特定の幾何学形状を抽出する。方向検出部５を
構成する第２のニューラルネットワークでは、第１の特
定形状に対して第２の特定形状が存在する方向並びに存
在量を抽出する。この特徴をもとに認識部を構成する第
３のニューラルネットワークによって画像を認識する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、人間の大脳神経系と類
似の入出力動作を模倣して構成されるニューラルネット
ワークを用いて、画像を認識する装置及び画像認識方法
に関する。

【０００２】

【従来の技術】近年、認識手段としてニューラルネット
ワークを用いる認識装置が検討されており、その中で文
字認識は重要な応用の一つである（森、横澤、梅田：”
ＰＤＰモデルによる手書き漢字認識”、信学技報、ＭＢ
Ｅ８７−１５６、pp.407-414(1988)）。図１２は従来の
一般的な、ニューラルネットワークを用いる文字認識装
置の構成図である。文字入力部６０は、文字の画像パタ
ーンを光電変換して文字データを作製し識別部６１に入
力する。ここで、文字データとは、図１３に示すよう
な、２次元のビットイメージである。識別部６１は文字
データを、ニューラルネットワークにより処理し、文字
を識別する。そして、識別部６１は認識結果を記憶部６
２、若しくは表示部６３に送る。

【０００３】この図１２の認識部が用いるニューラルネ
ットワークの説明図を図１４に示す。文字入力部６０が
作製した文字データ６４は、入力層６５の対応するニュ
ーロン６６に入力する。ニューロン６６は受け取った文
字データをシナプスと呼ぶ通路６７を通して中間層６８
の全てのニューロン６９に送る。但し、送られたデータ
は、ニューロン６９に入力するとき、重み付けされ入力
する。この重みをシナプス荷重と呼ぶ。中間層６９のニ
ューロンは、入力された全てのデータ値の総和を計算
し、この総和に非線形関数を作用させた結果を出力す
る。この出力結果はシナプス７０を通して出力層７１の
全てのニューロン７２に入力する。この時も、シナプス
荷重により重み付けされ入力する。出力層のニューロン
は、入力された値の総和を計算し、最大値検出部７３に
送る。最大値検出部は、出力層の各ニューロンから送ら
れた値の最大値を求め、最大値を出力したニューロンに
対応している文字を、識別結果として記憶部６２、若し
くは、表示部６３に送る。

【０００４】シナプス荷重はバックプロパゲーションな
どの学習により決定される。例えばアルファベットを認
識する場合には、ニューラルネットワークにアルファベ
ットを順次入力し、所望の出力結果が得られるまで繰り
返し学習を行ない、シナプス荷重を決定するのである。
その際、認識能力を向上するために、数種類の文字種に
ついて学習を行っている。

【０００５】

【発明が解決しようとする課題】画像の特徴を求めるこ
とを特徴抽出と呼ぶ。ニューラルネットワークを用いた
認識装置は、例えば文字を認識する場合には、文字入力
部により抽出された特徴量をニューラルネットワークの
入力信号として文字を認識する。文字入力部がどのよう
な特徴を抽出するかによって認識能力は変化する。

【０００６】従来の認識装置は、特徴量として文字入力
部が作製した文字データのメッシュ特徴を用いていた。
即ち、読みとった文字データにおいて、各メッシュの濃
度をある一定の閾値で２値化したビットイメージ、ある
いは０−１の範囲で規格化した濃度値をもとに認識して
いた。つまり、文字のどの部分が黒いかという情報をも
とに認識を行っていた。従って、予めニューラルネット
ワークが学習した文字に対して、変形している文字や、
あるいは位置ずれした文字を正しく認識できない欠点が
あった。変形した文字に対する認識率を向上させるため
には、数十種類の文字種について学習せねばならない。
しかしながら印刷数字の認識に用途を限定しても、８０
％程度の認識率しか得られなかった。また、学習に莫大
な時間を要していた。

【０００７】特に大きさが異なる文字を正しく認識させ
ることはきわめて困難であった。そこで従来の認識装置
では、文字入力部で、入力文字の重心を求め、大きさを
正規化して文字データを作成していた。しかしながら、
この正規化処理に莫大な時間を要するため、高速な認識
ができないという欠点があった。

【０００８】文字以外の２次元画像を認識する場合も同
様の欠点が存在している。本発明は、上記課題を解決
し、認識能力が高い画像認識装置及び画像認識方法を提
供することを目的とする。さらに、文字データの特徴を
抽出するのに適した装置を提供することを目的とする。

【０００９】

【課題を解決するための手段】本発明は上記課題を解決
するために、画像を入力する入力部と、画像の特徴を抽
出する特徴抽出部と、抽出した特徴をもとに画像を認識
する認識部から構成され、前記特徴抽出部は、入力画像
から画像を構成する特定方向の線分または特定の幾何学
形状（以下、特定形状と略記する）を抽出する形状抽出
部と、抽出した第１の特定形状に対して、第２の特定形
状が入力画像内に存在する方向並びに存在量を検出する
方向検出部を具備することを特徴とする。

【００１０】本発明の画像認識装置は、画像を入力する
手段、該入力された画像から予め決められた複数の形状
を抽出する手段、該抽出された複数の形状の内の第１の
形状上の各点を基準として、該抽出された複数の形状の
内の第２の形状が存在する方向を表す第１の特徴量を抽
出する手段、該第１の特徴量に基づいて、該第１の形状
に対して特定の方向に存在する該第２の形状の存在量を
表す第２の特徴量を抽出する手段、及び該第２の特徴量
に基づいて、該入力された画像を認識する手段を備えて
おり、これにより、上記目的が達成される。

【００１１】前記複数の形状は、縦線分、横線分、左斜
め線分、及び右斜め線分の内の少なくとも１つを含むこ
とが好ましい。

【００１２】前記複数の形状は、幾何学的な形状を含ん
でもよい。前記複数の形状を抽出する手段は、該複数の
形状を抽出するための複数の層を有しており、該複数の
層のそれぞれは、Ｍ×Ｎ個の要素を有するマトリックス
によって表され、前記第１の特徴量を抽出する手段は、
前記第１の特徴量を抽出するための少なくとも１つの第
１の領域を有しており、該少なくとも１つの第１の領域
は複数の第２の領域を有しており、該複数の第２の領域
のそれぞれは、Ｍ×Ｎ個の要素を有する第３のマトリッ
クスによって表され、該第１の特徴量は、前記第１の形
状を抽出するための層を表す第１のマトリックスの要素
と前記第２の形状を抽出するための層を表す第２のマト
リックスの要素と該第３のマトリックスの要素の間との
結合によって規定されてもよい。

【００１３】前記第１のマトリックスにおいてｉ行ｊ列
に位置する要素をの値をｕ^l（ｉ，ｊ）、それの値をｕ^l
_i,j、前記第２のマトリックスにおいてｉ行ｊ列に位置
する要素をｕ^l'（ｉ，ｊ）、それの値をｕ^l' _i,j、前記
第３のマトリックスにおいてｉ行ｊ列に位置する要素を
ｄ^l->l' _k（ｉ，ｊ）、それの値をｄ^l->l' _k,i,j、該第２
のマトリックスにおいてｐ行ｑ列に位置する要素ｕ
^l'（ｐ，ｑ）が要素ｕ^l'（ｉ，ｊ）に対して方向ｋに位
置する場合には１であり、その他の場合には０である係
数をｗ^k（ｉ，ｊ）_p,q、特定の方向を表すパラメータを
ｋと表すとき、前記結合は、下式（数５）によって表さ
れてもよい。

【００１４】

【数５】

【００１５】前記第１の特徴量を抽出する手段は、前記
第１の特徴量を抽出するための少なくとも１つの第１の
領域を有しており、該少なくとも１つの第１の領域は複
数の第２の領域を有しており、該複数の第２の領域のそ
れぞれは、Ｍ×Ｎ個の要素を有する第３のマトリックス
によって表され、前記第２の特徴量を抽出する手段は、
該第２の特徴量を抽出するための少なくとも１つの第３
の領域を有しており、該少なくとも１つの第３の領域
は、複数個の要素を有する第４のマトリックスによって
表され、該第２の特徴量は、該第３のマトリックスの要
素と該第４のマトリックスの要素との間の結合によって
規定されてもよい。

【００１６】前記第３のマトリックスにおいてｉ行ｊ列
に位置する要素をｄ^l->l' _k（ｉ，ｊ）、それの値をｄ
^l->l' _k,i,j、前記第４のマトリックスにおいてｉ行ｊ列
に位置する要素をｒ^l->l'（ｋ）、それの値をｒ^l->l' _k
と表すとき、前記結合は、下式（数６）によって表され
てもよい。

【００１７】

【数６】

【００１８】前記画像を認識する手段は、前記入力され
た画像を識別するための識別層を有しており、該識別層
は複数の要素を有しており、該複数の要素のそれぞれ
は、前記第３の領域を表す前記第３のマトリックスの要
素に結合されてもよい。

【００１９】前記識別層の要素、及び前記第４のマトリ
ックスの要素のそれぞれはニューロンであり、前記識別
層、及び前記識別層に結合された前記第３の領域は、ニ
ューラルネットワークの少なくとも一部を構成してもよ
い。

【００２０】本発明の画像認識方法は、画像を入力する
ステップ、該入力された画像から予め決められた複数の
形状を抽出するステップ、該抽出された複数の形状の内
の第１の形状上の各点を基準として、該抽出された複数
の形状の内の第２の形状が存在する方向を表す第１の特
徴量を抽出するステップ、該第１の特徴量に基づいて、
該第１の形状に対して特定の方向に存在する該第２の形
状の存在量を表す第２の特徴量を抽出するステップ、及
び該第２の特徴量に基づいて、該入力された画像を認識
するステップを包含しており、これにより、上記目的が
達成される。

【００２１】前記複数の形状を抽出するステップは、前
記第１の形状をＭ×Ｎ個の要素を有する第１のマトリッ
クスを用いて表現するステップ、及び前記第２の形状を
Ｍ×Ｎ個の要素を有する第２のマトリックスを用いて表
現するステップを包含しており、前記第１の特徴量を抽
出するステップは、前記第１の特徴量をＭ×Ｎ個の要素
を有する複数の第３のマトリックスを含む少なくとも１
つの領域を用いて表現するステップを包含しており、該
第１の特徴量は、該第１のマトリックスの要素と該第２
のマトリックスの要素と該第３のマトリックスの要素と
の間の結合によって規定されてもよい。

【００２２】前記第１のマトリックスにおいてｉ行ｊ列
に位置する要素をの値をｕ^l（ｉ，ｊ）、それの値をｕ^l
_i,j、前記第２のマトリックスにおいてｉ行ｊ列に位置
する要素をｕ^l'（ｉ，ｊ）、それの値をｕ^l' _i,j、前記
第３のマトリックスにおいてｉ行ｊ列に位置する要素を
ｄ^l->l' _k（ｉ，ｊ）、それの値をｄ^l->l' _k,i,j、該第２
のマトリックスにおいてｐ行ｑ列に位置する要素ｕ
^l'（ｐ，ｑ）が要素ｕ^l'（ｉ，ｊ）に対して方向ｋに位
置する場合には１であり、その他の場合には０である係
数をｗ^k（ｉ，ｊ）_p,q、特定の方向を表すパラメータを
ｋと表すとき、前記結合は、下式（数７）によって表さ
れてもよい。

【００２３】

【数７】

【００２４】前記第１の特徴量を抽出するステップは、
前記第１の特徴量をＭ×Ｎ個の要素を有する複数の第３
のマトリックスを含む少なくとも１つの領域を用いて表
現するステップを包含しており、前記第２の特徴量を抽
出するステップは、該第２の特徴量を複数個の要素を有
する少なくとも１つの第４のマトリックスを用いて表現
するステップを包含しており、該第２の特徴量は、該第
３のマトリックスの要素と該第４のマトリックスの要素
との間の結合によって規定されてもよい。

【００２５】前記第３のマトリックスにおいてｉ行ｊ列
に位置する要素をｄ^l->l' _k（ｉ，ｊ）、それの値をｄ
^l->l' _k,i,j、前記第４のマトリックスにおいてｉ行ｊ列
に位置する要素をｒ^l->l'（ｋ）、それの値をｒ^l->l' _k
と表すとき、前記結合は、下式（数８）によって表され
てもよい。

【００２６】

【数８】

【００２７】前記画像を認識するステップは、前記値ｒ
^l->l' _k及び重み付け係数に基づいて、該画像を識別する
ステップを包含し、前記画像認識方法は、該値ｒ^l->l' _k
の総和によって正規化された該値ｒ^l->l' _kに基づいて、
該重み付け係数を効率的に改変する学習ステップをさら
に包含することが好ましい。

【００２８】前記画像を認識するステップは、前記値ｒ
^l->l' _k及び重み付け係数に基づいて、該画像を識別する
ステップを包含し、前記画像認識方法は、該値ｒ^l->l' _k
の最大値によって正規化された該値ｒ^l->l' _kに基づい
て、該重み付け係数を効率的に改変する学習ステップを
さらに包含することが好ましい。

【００２９】本発明の入力画像の特徴を抽出するための
装置は、該入力画像の内、第１の形状を表すパターンを
表示する第１の表示手段、該第１の表示手段によって表
示される該第１の形状を表すパターン上に位置する特定
の点を基準として、特定の方向に位置する複数の点を表
すパターンを表示する第２の表示手段、該入力画像の
内、第２の形状を表すパターンを多重展開することによ
って得られるパターンを表示する第３の表示手段、該第
１、該第２、及び該第３の表示手段によって表示される
パターンを重ね合わせる重ね合わせ手段、及び該重ね合
わせられたパターンを検知するための検知手段を備えて
おり、これにより、上記目的が達成される。

【００３０】前記第１、前記第２、及び前記第３の表示
手段は、透過型空間光変調素子であってもよい。

【００３１】前記第２の表示手段は、透過型空間光変調
素子であり、前記第１、及び前記第３の表示手段は、光
書き込み型空間光変調素子であってもよい。

【００３２】前記重ね合わせ手段は、光書き込み型空間
光変調素子であってもよい。

【００３３】

【作用】簡単のため、以下に本発明を文字認識に応用す
る場合について本発明の作用を説明する。認識率を向上
させるためには、文字の種々の変形に対して不変な特徴
量を用いて認識すればよい。文字の大きさ、位置ずれに
不変な特徴量を抽出すれば、大きさの異なる文字を正し
く認識できる。本発明の特徴抽出部は、入力部が作製す
る文字データから、次の特徴量を抽出する。

【００３４】（１）特定形状（縦、横、左斜め、右斜め
の線分、または幾何学形状）の存在情報。

【００３５】（２）ある特定形状に対して、他の特定形
状が存在する方向およびその量。すなわち、文字を構成
しているある特定形状に対して、他の特定形状がどの方
向にどの程度の量で存在するかという情報をもとに文字
を識別する。

【００３６】同じ文字であれば大きさが異なっていて
も、文字を構成する線分や幾何学形状の相対的な位置関
係は不変である。従って本発明の特徴抽出部が抽出する
上記特徴量は、文字の大きさ並びに位置ずれに不変な特
徴である。

【００３７】以上説明したように、本発明に用いるニュ
ーラルネットワークでは、文字の変形に対して許容度の
高い特徴量を抽出できるため、大きさの異なる手書き文
字についても認識率が高い。また学習に使用する文字の
種類は数種類でよいので学習を高速に終了できる。な
お、上記作用は文字以外の２次元画像の認識においても
同様の効果を奏すことができる。

【００３８】

【実施例】以下、本発明の認識装置について図面を参照
しながら詳細に説明する。

【００３９】（実施例１）本発明の実施例の構成図を図
１に示す。この認識装置は、入力部１、特徴抽出部２、
認識部３から構成される。入力部１は、入力画像から２
次元のビットイメージを作製し、特徴抽出部２へ情報を
送る。形状抽出部４はビットイメージから各種特定形状
を抽出する。方向検出部５は、各種特定形状の相対的な
位置関係を抽出後、認識部３に情報を送る。認識部３
は、送られた情報をもとに画像を認識する。

【００４０】次に特徴抽出部２の具体的な出力例を図２
に示し、抽出過程を説明する。図２（ａ）は入力部１に
より作製されたビットイメージ６である（白い部分は”
０”、黒い部分は”１”である）。ビットイメージ６の
マトリックスサイズは例えば６０×６０である。図２
（ｂ）は、形状抽出部４の出力結果である。出力は、特
定形状として例えば縦線分抽出結果７、及び横線分抽出
結果８からなる。各出力結果も各々６０×６０のビット
イメージである。図２（ｃ）は方向検出部の出力結果９
を表わす。方向検出部は、例えば縦線分を基準として横
線分がどの方向（均等に分割された８方向）に存在する
かを抽出する。図２（ｃ）の各領域１０〜１７は、縦線
分を基準とした場合の横線分の存在する方向を表わし、
黒丸の大きさは各方向に存在する横線分の長さを表わ
す。例えば領域１０の出力は縦線分の上部に横線分が黒
丸の直径相当分の長さ存在することを意味する。同様に
領域１２の出力は横線分が縦線分の右中段部に黒丸の直
径分相当することを意味する。

【００４１】図３を用いて方向検出部の出力９の意味に
ついて詳細に説明する。図の正方形はビットイメージ６
である。いま、縦線分が存在しているビット１８’を中
心としてビットイメージ全体を覆う円を描く。このビッ
ト１８’を基準として、図の円を均等に８分割すること
で方向１０’〜１７’が定義できる。つまりビット１
８’に位置する縦線分を基準とすれば、横線分は方向１
３’〜１５’に存在することになる。従って図２（ｃ）
における領域１３〜１５が出力する。実際の図２（ｃ）
の出力は、縦線分上のすべての点を基準として作製され
たものである。

【００４２】図２（ａ）に与えられたパターン”＋”を
構成する縦線分”｜”の上部１９を基準とすれば、横線
分は方向１３’〜１５’にかけて存在していることにな
る。同様に、縦線分”｜”の下部２０の縦線分を基準と
すれば、横線分は、方向１７’、１０’、１１’に存在
することになる。縦線分中央部２１を基準とすれば横線
分は方向１２’、１６’に存在することになる。従って
方向検出部の出力は図２（ｃ）のようになる。

【００４３】図４及び図５は同じく縦線分と横線分から
構成される図形に対する各部の出力を表わしている。各
図の（ａ）は入力ビットイメージ、（ｂ）は各線分抽出
結果、（ｃ）は方向検出部の出力結果である。図４
（ａ）に示したパターンの場合は、図４（ｃ）に示した
ように領域１０〜１４が出力する。また図５（ａ）のパ
ターンの場合には図５（ｃ）に示したように領域１０、
１４〜１７が出力する。このように方向検出部の出力結
果９は、縦線分と横線分の相対的な位置関係を表わした
ものであり、縦線分と横線分の相対的な位置関係が変化
すればこの特徴は必ず変化する。

【００４４】この方向検出部の出力９はパターンの大き
さ及び位置に依存しない点が大きな特長である。図６は
大きさ並びに存在位置の異なる”＋”に対する方向検出
部９の出力を表わしている。図６（ｂ）に示したように
各領域の出力強度（黒丸の直径で表わされる）は小さく
なるが、出力パターンは図４（ｃ）と完全に一致する。

【００４５】以上詳細に説明したように、本発明の特徴
抽出部はパターンの大きさ並びに存在位置に影響されな
い特徴を抽出できる。認識部はこの特徴をもとに認識す
るので極めて高い認識能力を実現できる。

【００４６】以下に具体的な構成例について図７を用い
て詳述する。この認識装置は入力部１、特徴抽出部２、
認識部３から構成される。さらに特徴抽出部２は、形状
抽出部４である第１のニューラルネットワーク４’、方
向検出部５である第２のニューラルネットワーク５’か
らなる。また認識部３は、第３のニューラルネットワー
クからなる。入力文字は入力部１により２次元のビット
イメージに変換される。ビットイメージは第１のニュー
ラルネットワーク４’の入力層３４に与えられる。形状
抽出層３５は、入力層のニューロン数（この図では例え
ば３×３ニューロン）と同数個のニューロンを２次元に
配置した縦線分抽出層３５’、及び横線分抽出層３５”
からなる。縦線分抽出層３５’では、入力ビットイメー
ジから縦線分を、横線分抽出層３５”では横線分を抽出
する。

【００４７】線分抽出の原理を縦線分抽出を例にして簡
単に説明する。いま、ニューラルネットワークの入力層
３４と縦線分抽出層３５’は、同数個のニューロンを２
次元に配置しており、入力層３４及び縦線分抽出層３
５’の中で、上からｉ番目、左からｊ番目（ｉ行ｊ列）
に位置しているニューロンの出力を、各々ｘ¹ _ij、ｘ² _ij
と表わす。ここで、第２層のニューロンは、入力層３４
の対応するニューロン（入力層３４内で同じ座標に位置
しているニューロン）、及びその上下に隣接して並んで
いるニューロンと結合していると仮定する（設定１）。
従って、縦線分抽出層３５’のニューロンの出力関数を
ｆとおくと、ｘ² _ijは、（数９）で表せる（設定２）。

【００４８】

【数９】

【００４９】

【数１０】

【００５０】入力画像に縦の線分が存在している場合に
は、例えばｘ¹ _i-lj＝ｘ¹ _ij＝ｘ¹ _i+l _j＝１であり、入力
層３４内で縦方向に連続して並んでいるニューロンが出
力する。

【００５１】従って、縦線分抽出層３５’のニューロン
は、上記３つの設定により、対応する入力層３４のニュ
ーロンが縦の線分を構成しているときに限って出力する
ので、縦の線分を抽出することになる。

【００５２】横、斜めの方向の線分の抽出も同様であ
り、横線分抽出層３５”のニューロンと入力層３４のニ
ューロンの結合を、対応するニューロンと例えばその左
右１個とすれば、横方向の線分を抽出できる。このとき
の横線分抽出層３５”のニューロンの出力は（数１１）
で表せる。ここで、ｘ³ _ijは、横線分抽出層３５”の中
で上からｉ番目左からｊ番目（ｉ行ｊ列）に位置してい
るニューロンの出力を表す。

【００５３】

【数１１】

【００５４】同様に左斜め、右斜めの線分を抽出する場
合には、結合は各々、（数１２）、（数１３）で表され
る。ここで、ｘ⁴ _ijは、左斜め線分抽出層（不図示）の
中で上からｉ番目左からｊ番目（ｉ行ｊ列）に位置して
いるニューロンの出力を表し、ｘ⁵ _ijは、右斜め線分抽
出層（不図示）の中で上からｉ番目左からｊ番目（ｉ行
ｊ列）に位置しているニューロンの出力を表す。

【００５５】

【数１２】

【００５６】

【数１３】

【００５７】第１層と同数個のニューロンを２次元に配
置した領域を４つ準備し、各領域に一つの線分を割り当
てた第２層を形成すれば、同時に４方向を抽出できる。

【００５８】同様に、特定の幾何学形状を抽出すること
も可能であり、例えば、”＾”の形状は、（数１４）で
表される結合により抽出できる。ここで、ｘ⁶ _ijは、特
定の幾何学形状抽出層（不図示）の中で上からｉ番目左
からｊ番目（ｉ行ｊ列）に位置しているニューロンの出
力を表す。

【００５９】

【数１４】

【００６０】同様に、”＋”、”「”、”じ”、等の形
状が抽出できる。この第２層３５の出力が方向検出部５
を構成する第２のニューラルネットワーク５’の入力と
なる。第２のニューラルネットワークは方向検出層３６
及び統合層３７から構成される。方向検出層３６は縦線
分を基準として横線分がどの方向に存在するかを検出す
る機能を持ち、各方向に相当する領域３９〜４６の８つ
の領域から構成される（中央の斜線部はニューロンでは
ない）。各領域３９〜４６は入力層３４と同じマトリッ
クスサイズ（この図では簡単のため３×３）である。例
えば領域３９は縦線分に対して横線分が左斜め上部（図
３の方向１７’に相当）方向に存在するか否かを抽出す
る。そのために、領域３９のニューロン３９’は縦線分
抽出層３５’の対応する位置のニューロン４７、及びニ
ューロン４７に対して横線分抽出層中で方向１７’（左
斜め上部）に位置するニューロン４８と結合している。

【００６１】ここで、ニューロン４８が、なぜニューロ
ン４７に対して方向１７’に位置することになるのか説
明する。ニューロン４７は入力層３４中のニューロン４
９の位置に縦線分が存在する場合に発火し、同様にニュ
ーロン４８は入力層３４中のニューロン５０の位置に横
線分が存在する場合に発火する。入力パターン中のニュ
ーロン４９の位置に存在する縦線分を基準とすれば、ニ
ューロン５０の位置に存在する横線分は方向１７’に位
置することになる。従って、ニューロン４７で抽出した
縦線分を基準とすれば、ニューロン４８が抽出する横線
分は方向１７’に位置することになる。

【００６２】ニューロン３９’はニューロン４７及び４
８が同時に発火している場合、すなわち、ニューロン４
９が縦線分を構成しており、かつ横線分が方向１７’に
存在する場合に限り発火することになる。

【００６３】同様にニューロン３９”は、縦線分抽出層
３５’中の対応する位置のニューロン４７’及び、ニュ
ーロン４７’に対して方向１７’に位置する横線分抽出
層３５”中のニューロン４８及び４８’と結合させる。
このニューロン３９”は、ニューロン４８、４８’の少
なくともどちらか一方が発火しており、かつ４７’が発
火している場合に限り発火する。

【００６４】他の領域４０〜４６中のニューロンも同様
の結合により、縦線分に対し横線分が存在する領域を抽
出する。例えば領域４４は、縦線分に対して方向１４’
（真下方向）に存在する横線分の情報を抽出する。その
ために、領域４４中のニューロン４４’は、縦線分抽出
層３５’の対応するニューロン４７、およびニューロン
４７からみて方向１４’に位置する横線分抽出層のニュ
ーロン４８”と結合される。さらにこのニューロン４
４’は、ニューロン４７及びニューロン４８”が同時に
出力する場合に限り発火する。この様な結合により、縦
線分に対し横線分が存在する領域が抽出できる。

【００６５】図７に示したように、統合層３７は方向検
出層３６の出力を局所的に統合する。すなわち、統合層
３７のニューロンは合計８ニューロン（図面では便宜的
に３×３であるが斜線部はニューロンではない）であ
り、各ニューロンは方向検出層３６の対応する各領域３
９〜４６の出力を同一のシナプス荷重、例えば１により
重み付けして統合する。さらに入力信号の総和に例えば
線形関数を作用させた結果を出力する。この統合層３７
の出力状態が図２（ｃ）、図４（ｃ）、図５（ｃ）であ
る。

【００６６】認識部は、統合層３７、出力層３８の第３
のニューラルネットワークからなる。出力層３８のニュ
ーロンは、統合層３７の全てのニューロンと結合させ
る。各ニューロンは、シナプス荷重により重み付けされ
た入力信号の総和を求め、総和が最も大きいニューロン
だけが出力する（最大値検出）。

【００６７】本実施例では、基本的動作を説明するため
に少ないニューロン数であったが、ニューロン数を増加
し、抽出する特定形状の種類を増加することによって種
々の認識が可能である。また認識部は、統合層及び出力
層の２層であったが、３層以上の構造を用いることも可
能である。

【００６８】（実施例２）本実施例では、本発明を手書
き文字認識に応用する場合について説明する。図８は、
本発明の認識装置における特徴抽出部及び認識部を構成
するニューラルネットワークモデルの構成図である。本
実施例のニューラルネットワークは、入力層３４、形状
抽出層３５、方向検出層３６、統合層３７、出力層３８
からなる。基本的な動作は、実施例１の図７で示したニ
ューラルネットワークと同じである。入力層のマトリッ
クスサイズは例えば６０×６０ニューロンである。線分
抽出層３５は、入力層３４と同数個のニューロンを２次
元に配置した縦線分抽出層５２、横線分抽出層５３、左
斜め線分抽出層５４、右斜め線分抽出層５５からなる。
各層５２〜５５では、実施例１で説明した原理に基づ
き、４方向の線分を独立に抽出する。方向検出層３６は
各線分間の相対的位置関係を抽出する。それぞれ、領域
２４は縦線と縦線、領域２５は縦線と横線、領域２６は
縦線と左斜め線、領域２７は縦線と右斜め線、領域２８
は横線と横線、領域２９は横線と左斜め線、領域３０は
横線と右斜め線、領域３１は左斜め線と左斜め線、領域
３２は左斜め線と右斜め線、領域３３は右斜め線と右斜
め線の相対関係を抽出する。各領域２４〜３３は、各々
合計８つの小領域に分割される（図８では各領域は３×
３に分割されているが、２行２列目の領域にニューロン
は存在しない）。各小領域は６０×６０のマトリックス
サイズであり、各ニューロンはある方向の線分１が、あ
る方向の線分２に対して、特定方向に存在する場合にそ
の長さを出力する。

【００６９】例えば、領域２５の小領域５６中のニュー
ロンは、横線分が縦線分に対して、方向１４’（真下方
向）に存在する場合に発火する。同様に、領域３２の小
領域５７中のニューロンは、右斜め線分が左斜め線分に
対して方向１１’（右上部方向）に存在する場合に発火
する。

【００７０】上記機能を実現するために、例えば小領域
５６（マトリックスサイス゛60×60）のｉ行ｊ列に位置するニュー
ロン５６’を、線分抽出層３５の次の２種類のニューロ
ンと結合させる（設定１）。１．縦線分抽出層５２（マトリックスサイス゛60×60）のｉ行ｊ列
に位置するニューロン５２’。２．横線分抽出層５３（マトリックスサイス゛60×60）のｉ行ｊ列
に位置するニューロンを基準として、方向１４’（真下
方向）に位置するニューロン群５３’（図中の斜線
部）。

【００７１】このとき、ニューロン５２’が発火してお
り（縦線分がｉ行ｊ列に存在する）、かつニューロン群
５３’の中に発火しているニューロンが存在する（横線
分がｉ行ｊ列のニューロンを基準として方向１４’に存
在する）場合に限りニューロン５６’は発火する。この
ときの出力強度はニューロン群５３’中の発火している
ニューロン数（横線分の長さ）に比例させる（設定
２）。以上の設定１、２、により小領域５６中のニュー
ロン５６’は入力パターンのｉ行ｊ列に位置する縦線分
に対して、方向１４’に存在する横線分の長さを抽出で
きる。

【００７２】同様に、領域３２の小領域５７（マトリックスサイ
ス゛60×60）のｍ行ｎ列に位置するニューロン５７’を、１．左斜め線分抽出層５４（マトリックスサイス゛60×60）のｍ行
ｎ列に位置するニューロン５４’、２．右斜め線分抽出層５５（マトリックスサイス゛60×60）のｍ行
ｎ列に位置するニューロンを基準として方向１１’に存
在するニューロン群５５’（図中の斜線部）と結合させ
る（設定１’）。

【００７３】このとき、ニューロン５４’が発火してお
り（左斜め線分がｍ行ｎ列に存在する）、かつニューロ
ン群５５’の中に発火しているニューロンが存在する
（右斜め線分がｍ行ｎ列のニューロンを基準として方向
１１’に存在する）場合に限りニューロン５７’は発火
する。このときの出力強度はニューロン群５５’中の発
火しているニューロン数（左斜め線分の長さ）に比例さ
せる（設定２’）。以上の設定１’、２’によりニュー
ロン５７’は、ｍ行ｎ列に位置する左斜め線分に対し
て、方向１１’に存在する右斜め線分の長さを抽出でき
る。

【００７４】統合層３７の各ニューロンは方向検出層の
対応する小領域のニューロンの出力を統合する。すなわ
ち、統合層３７のニューロン５８は方向検出層３６の領
域２４中の小領域２４’（マトリックスサイス゛60×60：縦線分に
対して他の縦線分が方向１７’に存在する長さを抽出し
ている）の全てのニューロンと、例えばシナプス荷重１
で結合しており（設定３）、入力信号の総和に比例する
値を出力する（設定４）。従ってニューロン５８の出力
は、入力パターン全体で、縦線分に対して方向１７’に
存在する縦線分の長さの総和に相当する。

【００７５】同様に例えばニューロン５９は、方向検出
層３６の領域２６中の小領域２６’（マトリックスサイス゛60×6
0：縦線分に対して左斜め線分が方向１４’に存在する
長さを抽出している）の全てのニューロンと結合する。
従ってニューロン５９は、入力パターンの縦線分に対し
て、方向１４’に存在する左斜め線分の長さの総和を抽
出することになる。

【００７６】上記設定３、４により統合層３７（マトリックス
サイス゛8×10）の出力は各種線分間の相対的位置関係を抽
出する。この線分統合層３７の出力状態は、実施例１で
詳細に説明したように、入力パターンの存在位置、大き
さに依存しないものである（ただし、出力の絶対値は大
きさに依存する）。出力層３８の各ニューロンは、統合
層３７の全てのニューロンと結合し、入力信号の総和が
最大のニューロンだけが出力し、対応する文字が認識結
果となる。

【００７７】図９及び図１０に数字１に対する各部の出
力を示す。各図の（ａ）はビットイメージ（マトリックスサイス゛
60×60）、（ｂ）は線分抽出層３５の出力、（ｃ）は統
合層３７の出力を表わしている。各図（ｂ）の５２、５
３、５４、５５は各々縦線分、横線分、左斜め線分（”
／”）、右斜め線分（”＼”）抽出結果を表わしてい
る。また各図（ｃ）の２４〜３３は、各種線分間の相対
的な位置関係を表わしている。すなわち、２４は縦線分
と縦線分の相対的な位置関係、２５は縦線分と横線分、
２６は縦線分と左斜め線分、２７は縦線分と右斜め線
分、２８は横線分と横線分、２９は横線分と左斜め線
分、３０は横線分と右斜め線分、３１は左斜め線分と左
斜め線分、３２は左斜め線分と右斜め線分、３３は右斜
め線分と右斜め線分の相対的な位置関係を表わしてい
る。

【００７８】統合層の出力である図９（ｃ）と図１０
（ｃ）の出力状態は、大きさ及び存在位置の異なる手書
き数字”１”に対するものであるが非常によく似てい
る。従って本発明の認識装置によれば大きさ、位置ズレ
に影響されない認識を実現できる。

【００７９】学習は、この統合層３７と出力層３８の間
のみ実施すればよい。本実施例では直交学習法を用い
て、図１１（ａ）に示す５種類の数字１０文字を学習さ
せた。学習後の認識装置に図１１（ｂ）に示した未学習
パターンを入力したところ、いずれも正しく認識でき
た。

【００８０】次に、本発明の一実施例の画像認識方法を
説明する。図１５は、画像認識方法の手順を示すフロー
チャートである。以下、各ステップを詳述する。

【００８１】ステップＳ１：入力（２値化）認識対象となる文字等の画像は、観測領域（不図示）に
入力される。観測領域は、Ｎ×Ｎ個の要素を有するマト
リックスによって表される。観測領域に入力された画像
は、以下のルールに基づいて、２値化パターンに変換さ
れる。その２値化パターンもＮ×Ｎ個の要素を有するマ
トリックスであって、各要素は０又は１の値をとるマト
リックスによって表される。

【００８２】ルール１：観測領域を表すマトリックスの
各要素は、２値化パターンを表すマトリックスの各要素
に１対１に対応する。

【００８３】ルール２：２値化パターンを表すマトリッ
クスにおいてｉ行ｊ列に位置する要素をｘ（ｉ，ｊ）、
それの値をｘ_i,_jとする。値ｘ_i,_jは（数１５）によって
決定される。

【００８４】

【数１５】

【００８５】ここで、ｓ_ijは、観測領域を表すマトリッ
クスにおいてｉ行ｊ列に位置する要素内に含まれる文字
線分の長さを表す。すなわち、観測領域を表すマトリッ
クスにおいてｉ行ｊ列に位置する要素が認識対象となる
文字の少なくとも一部を含んでいる場合には、値ｘ_i,_j
は１となる。その他の場合には、値ｘ_i,_jは０となる。

【００８６】このようにして得られる２値化パターン
は、図８の入力層３４に入力される。入力層３４はＮ×
Ｎ個の要素を有するマトリックスによって表される。入
力層３４を表すマトリックスの各要素は、２値化パター
ンを表すマトリックスの各要素に１対１に対応してお
り、２値化パターンを表すマトリックスの各要素の値と
同一の値を出力する。

【００８７】ステップＳ２：線分抽出入力層３４の出力に基づいて、予め決められた複数の形
状が抽出される。ここでは、その予め決められた複数の
形状は、４種類の線分、すなわち、縦線分、横線分、左
斜め線分及び右斜め線分である。他の形状を抽出するこ
とも可能である。線分ｌを以下のように定義する。

【００８８】線分ｌ：ｌ＝１の場合、縦線分ｌ＝２の場合、横線分ｌ＝３の場合、左斜め線分ｌ＝４の場合、右斜め線分図８の形状抽出層３５は、４種類の線分を抽出するため
の線分抽出層５２〜５５を有している。ここでは、線分
ｌを抽出するための４つの線分抽出層５２〜５５をそれ
ぞれＵ^l（ｌ＝１、２、３、４）と表す。

【００８９】線分抽出層Ｕ^lのそれぞれは、Ｎ×Ｎ個の
要素を有するマトリックスによって表される。線分抽出
層Ｕ^lを表すマトリックスにおいてｉ行ｊ列に位置する
要素をｕ^l（ｉ，ｊ）、それの値をｕ^l _i,_jとする。値ｕ^l
_i,_jは（数１６）によって決定される。

【００９０】

【数１６】

【００９１】ここで、Φ［・］は出力関数、ｗ^l _mnは重
み付け係数、Ω^lは要素ｘ（ｉ，ｊ）及び要素ｕ^l（ｉ，
ｊ）の間の結合を規定する（ｍ，ｎ）の集合を表し、そ
れぞれ（数１７）〜（数１９）の関係を満たす。

【００９２】

【数１７】

【００９３】

【数１８】

【００９４】

【数１９】

【００９５】上述の入力層３４及び線分抽出層Ｕ^lの間
の結合を規定する（数１８）に示されるように、線分抽
出を効率的に行うためには、ｗ^l _0,0＝２が最適である。
しかし、出力関数及び出力関数の閾値を調整することに
より、ｗ^l _0,0＞１を満たす重み付け係数を用いることも
可能である。

【００９６】（表１）は、入力層３４の出力及び縦線分
を抽出するための線分抽出層Ｕ¹の出力の間の対応関係
を示す。

【００９７】

【表１】

【００９８】ここで、ｗ^l _0,0＝ｅ（＞１）である。表１
において、第２欄（ａ）は、線分抽出層Ｕ¹の要素ｕ¹
_i;jが１を出力すべき場合を示し、第３欄（ｂ）は線分
抽出層Ｕ¹の要素ｕ¹ _i;jが０を出力べき場合を示す。こ
のような出力を得るためには、（数１７）によって規定
される出力関数Φの代わりに、（数２０）によって規定
される出力関数Φを用い、その出力関数の閾値θを（数
２１）を満たすように与えればよい。出力関数の閾値θ
が（数２１）を満たすならば、線分抽出層Ｕ¹の要素ｕ¹
_i;jが１を出力すべき場合、閾値θは入力信号の総和ξ
より小さく、かつ、線分抽出層Ｕ¹の要素ｕ¹ _i;jが０を
出力すべき場合、閾値θは入力信号の総和ξより大き
い。従って、（数２０）によって規定される出力関数Φ
を入力信号の総和ξに適用することにより、縦線分の抽
出を行うことが可能である。同様にして、他の線分を抽
出することも可能である。

【００９９】

【数２０】

【０１００】

【数２１】

【０１０１】上述した方法以外の方法によって、例え
ば、パターンマッチングの方法によって線分抽出を行う
ことも可能である。以下、図１６（ａ）に示される２値
化された光パターンから図１６（ｂ）に示されるマスク
パターンを用いて縦線分を抽出する方法を説明する。図
１６において、黒い部分の光量をＩ、白い部分の光量を
０とする。図１６（ｂ）のマスクパターンを図１６
（ａ）の光パターンの左上から順次移動させながら透過
光量が測定される。測定された透過光量が２Ｉであれば
光パターン上に縦線分が存在することがわかる。他の線
分を抽出する場合には、図１６（ｃ）〜（ｅ）に示され
るマスクパターンを用いることにより、同様の手順で線
分抽出を行うことが可能である。

【０１０２】ステップＳ３：方向抽出４種類の線分の抽出結果に基づいて、抽出された線分ｌ
の各点を基準として、他の線分ｌ’が存在する方向を表
す第１の特徴量が抽出される。

【０１０３】４種類の線分ｌの内、相異なる２種類の線
分を選ぶ組み合わせは６通りである。図８の方向抽出層
３６は、線分ｌに対して他の線分ｌ’の相対的な位置関
係を抽出するための少なくとも６個の領域を有してい
る。これらの領域をそれぞれＤ ^l->l'と表す。ここで
は、簡単のため、線分ｌに対して同一の線分ｌの相対的
な位置関係は考慮しないものとする。例えば、縦線分
（ｌ＝１）を基準として、横線分（ｌ＝２）が存在する
方向を表す特徴量を抽出するための領域はＤ^1->2と表さ
れ、横線分（ｌ＝２）を基準として、左斜め線分（ｌ＝
３）が存在する方向を表す特徴量を抽出するための領域
はＤ^2->3と表される。

【０１０４】方向抽出層３６の領域Ｄ^l->l'は、８個の
領域ｄ^l->l'（ｋ）をそれぞれ有している。ここで、ｋ
は特定の方向を表すパラメータであり、ｋ＝１〜８はそ
れぞれ図３に示される方向１０’〜１７’に対応する。
例えば、領域Ｄ^1->2は８個の領域ｄ^1->2（ｋ）（ｋ＝１
〜８）を有している。

【０１０５】領域ｄ^l->l'（ｋ）のそれぞれは、Ｎ×Ｎ
個の要素を有するマトリックスによって表される。領域
ｄ^l->l'（ｋ）を表すマトリックスにおいてｉ行ｊ列に
位置する要素をｄ^l->l' _k（ｉ，ｊ）、それの値をｄ
^l->l' _k,i,jとする。値ｄ^l->l' _k,i _,jは、線分抽出層Ｕ^l
における線分ｌ上に位置する各要素ｕ^l（ｉ，ｊ）を基
準として、方向ｋに存在する他の線分ｌ’の長さを表す
ように、（数２２）に示すように規定される。（数２
２）は、線分抽出層Ｕ^l及びＵ^l'と方向抽出層３６の領
域Ｄ^l->l'との間の結合を規定する。

【０１０６】

【数２２】

【０１０７】ここで、Ω^kは領域ｄ^l->l'（ｋ）と線分抽
出層Ｕ^l及びＵ^l'との間の結合を規定する（ｍ，ｎ）の
集合である。（ｍ，ｎ）は、線分抽出層Ｕ^l'において要
素ｕ ^l'（ｉ，ｊ）を基準点とした場合のその基準点から
みて方向ｋに存在する要素の相対座標を表す。また、ｗ
^k（ｉ，ｊ）_p,qは重み付け係数を表す。ｗ^k（ｉ，ｊ）
_p,qは、線分抽出層Ｕ^l'においてｐ行ｑ列に位置する要
素ｕ^l'（ｐ，ｑ）がｉ行ｊ列に位置する要素ｕ^l'（ｉ，
ｊ）に対して方向ｋに位置する場合には１となり、その
他の場合には０となる係数である。

【０１０８】線分ｌに対して他の線分ｌ’が存在する方
向の種類は８に限られない。例えば、図３に示される円
の分割数を１６にして、１６個の方向を定義することも
可能である。この場合、それらの方向ｋ＝１〜１６に応
じて、方向抽出層３６の領域Ｄ^l->l'が１６個の領域ｄ
^l->l'（ｋ）をそれぞれ有するようにすればよい。

【０１０９】ステップＳ４：長さ抽出ステップＳ３で抽出された第１の特徴量に基づいて、線
分ｌを基準として、方向ｋに存在する他の線分ｌ’の長
さを表す第２の特徴量が抽出される。

【０１１０】図８の統合層３７は少なくとも６個の領域
を有している。これらの領域をそれぞれＲ^l->l'と表
す。領域Ｒ^l->l'は、８個のニューロンｒ^l->l'（ｋ）を
それぞれ有している。ここで、ｋは特定の方向を表すパ
ラメータであり、ｋ＝１〜８はそれぞれ図３に示される
方向１０’〜１７’に対応する。例えば、領域Ｒ^1->2は
８個のニューロンｒ^1->2（ｋ）（ｋ＝１〜８）を有して
いる。

【０１１１】ニューロンｒ^l->l'（ｋ）の値をｒ^l->l' _k
とする。値ｒ^l->l' _kは、線分ｌを基準として、方向ｋに
存在する線分ｌ’の長さを表すように、（数２３）に示
すように規定される。（数２３）は、方向抽出層３６の
領域Ｄ^l->l'と統合層３７の領域Ｒ^l->l'との間の結合を
規定する。

【０１１２】

【数２３】

【０１１３】あるいは、（数２３）の代わりに、（数２
４）を用いてもよい。（数２４）は（数２３）の右辺に
示される総和に出力関数ｆを作用させたものである。出
力関数ｆ［・］としては、シグモイド関数などが一般的
に用いられる。（数２３）は（数２４）の出力関数ｆと
して線形関数（ｙ＝ｘ）を用いた例に他ならない。

【０１１４】

【数２４】

【０１１５】ステップＳ５：認識統合層３７の各領域Ｒ^l->l'の出力に基づいて、入力文
字が識別される。例えば、アルファベットの２６文字を
識別させるためには、出力層３８が少なくとも２６個の
ニューロンを有していればよい。出力層３８のニューロ
ンをｙ（ｊ）、それの値をｙ_jとする。値ｙ_jは、（数２
５）に示すように規定される。（数２５）は、統合層３
７の領域Ｒ^l->l'と出力層３８との間の結合を規定す
る。

【０１１６】

【数２５】

【０１１７】ここで、δ_jは統合層３７の領域Ｒ^l->l'か
らの入力信号の総和を表す。δ_jは（数２６）に示すよ
うに規定される。また、ｗ^l->l' _jkはシナプス荷重、ｆ
_max｛δ_j｝は、総和δ_jを比較し、総和δ_jが最大となる
要素の出力を１とし、他の要素の出力を０とする演算子
を表す。このシナプス荷重ｗ^l->l' _jkは、学習により改
変され得る。直交学習法を用いて学習を行うことが好ま
しい。

【０１１８】

【数２６】

【０１１９】入力画像から領域Ｒ^l->l'におけるニュー
ロンｒ^l->l'（ｋ）の出力を得るまでの処理を画像認識
のための前処理（特徴抽出処理）と考えると、認識部３
は統合層３７及び出力層３８の２層からなるいわゆるパ
ーセプトロンとみなすことができる。ニューロンｒ
^l->l'（ｋ）の出力を３層以上の階層型ニューラルネッ
トワークによって処理することにより、画像認識を行う
ことも可能である。この場合、いわゆる誤差伝搬学習法
を用いて学習を行うことが好ましい。

【０１２０】次に、上述のシナプス荷重ｗ^l->l' _jkを効
率よく改変するための学習方法を説明する。

【０１２１】（数２７）は、直交学習法を用いて学習を
行う場合のシナプス荷重の遷移を示す。

【０１２２】

【数２７】

【０１２３】ここで、ｗ^l->l'（ｔ）_jkはｔ回学習後の
領域Ｒ^l->l'におけるニューロンｒ^l- ^>l'（ｋ）と出力層
３８のニューロンｙ（ｊ）との間の結合に関するシナプ
ス荷重、αは学習ゲイン、ｔ_jは教師信号を表す。教師
信号とは、ある画像が入力された場合にニューロンｙ
（ｊ）が出力すべき期待値をいう。

【０１２４】例えば、２６個のアルファベットを学習さ
せる場合には、予め用意された異なる数種類の文字を順
次学習させ、すべての文字を正しく認識できた時点で、
学習を終了させる。学習回数は以下のように規定され
る。学習のために予め用意された各文字を１回ずつすべ
ての文字について学習させた場合に、学習回数は１回と
カウントされる。

【０１２５】しかしながら、（数２７）に基づく学習
は、学習させる文字の大きさが異なっている場合には学
習収束性が悪い、すなわち、すべての文字を正しく認識
するまでに多くの学習回数を要するという問題点を有し
ていた。この原因は以下のように考えられる。（数２
７）の右辺第２項はシナプス荷重の修正量を表してい
る。（数２７）から明らかなように、１回の学習につ
き、値ｒ^l->l' _kに比例した修正を行うことになる。上述
したように、値ｒ^l->l' _kは入力画像における線分ｌを基
準として方向ｋに位置する線分ｌ’の長さを表してい
る。入力される文字の大きさが大きくなると、各線分の
長さは当然長くなる。その結果、値ｒ^l->l' _kの絶対値も
大きくなる。このように、１文字当たりのシナプス荷重
の修正量が入力される文字の大きさに依存してしまうの
で、異なる大きさの文字が混在した複数の文字を学習さ
せる場合に、学習収束性が悪くなるおそれがあった。

【０１２６】上記の問題点を解決する方法を以下に説明
する。値ｒ^l->l' _kを正規化することにより、大きさが不
均一な文字を学習させる場合の学習収束性が大幅に改善
されることが分かった。正規化の方法としては、以下に
示す２とおりの方法が考えられる。（１）領域Ｒ^l->l'におけるすべてのニューロンｒ^l->l'
（ｋ）の出力の総和を用いてそれの出力を正規化する方
法。この方法によれば、正規化された値ｒ^l->l' _n _orm,k
は（数２８）に示すようにして求められる。（２）領域Ｒ^l->l'におけるニューロンｒ^l->l'（ｋ）の
出力の内、最大値を用いてそれの出力を正規化する方
法。この方法によれば、正規化された値ｒ^l->l' _nor _m,k
は（数２９）に示すようにして求められる。

【０１２７】

【数２８】

【０１２８】

【数２９】

【０１２９】従って、学習式（数２７）は、（数３０）
によって置き換えられ得る。

【０１３０】

【数３０】

【０１３１】（表２）は、学習式（数３０）に基づいて
学習を行った場合の学習収束性の結果を示す。表２に示
されるように、正規化された値ｒ^l->l' _norm,kを用いる
ことにより、学習収束性が大幅に改善されることが確認
された。このように、正規化は高速学習に極めて有効で
ある。

【０１３２】

【表２】

【０１３３】図１７（ａ）〜（ｄ）は、文字「Ｊ」が入
力された場合の入力層３４、形状抽出層３５、方向抽出
層３６、及び統合層３７のそれぞれの出力の具体例を示
している。図中、空白の部分は要素の値が０であること
を示す。以下、方向抽出層３６の各領域Ｄ^l->l'に示さ
れている値の意味を説明する。例えば、図１７（ｃ）に
示されるように、領域Ｄ^1->2の領域ｄ^1->2（８）の３行
４列に位置する要素の値は２となっている。これは、線
分抽出層Ｕ¹の３行４列に位置する要素を基準として、
左上方向（ｋ＝８）に存在する横線分の要素の数が２個
だからである。この場合、その２個の要素とは、線分抽
出層Ｕ²の２行２列に位置する要素及び２行３列に位置
する要素である。同様にして、線分抽出層Ｕ¹の４行４
列に位置する要素を基準として、左上方向（ｋ＝８）に
存在する横線分の要素の数が２個であるので、領域Ｄ
^1->2の領域ｄ^1->2（８）の４行４列に位置する要素の値
は２、線分抽出層Ｕ¹の５行４列に位置する要素を基準
として、左上方向（ｋ＝８）に存在する横線分の要素の
数が１個であるので、領域Ｄ^1->2の領域ｄ^1->2（８）の
５行４列に位置する要素の値は１となっている。図１７
（ｄ）に示されるように、領域Ｄ^1->2の領域ｄ
^1->2（８）の要素の値の総和（２＋２＋１＝５）は、統
合層３７の領域Ｒ^1->2の１行１列に現れる。これは、領
域ｄ^l->l'（ｋ）の要素の値の総和が要素ｒ^l->l'（ｋ）
の値となるように、領域ｄ^l->l'（ｋ）と領域Ｒ ^l->l'と
が結合されているからである。

【０１３４】以下、線分抽出を実行するための特徴抽出
光ニューロン素子(Feature Extracting Optical Neuron
Device)を説明する。

【０１３５】図１８は、特徴抽出光ニューロン素子の断
面を示す。この素子は、透明電極を有する２枚のガラス
基板、それらのガラス基板によって挟まれた光導電層、
及び光変調層を備えている。また、光導電層と光変調層
との間に、ニューロン電極が設けられている。光導電層
は、厚さ約１．７μｍのアモルファスシリコン(a-Si:H)
からなり、光変調層は、セルギャップが約１μｍの強誘
電性液晶(FLC)からなる。ニューロン電極は、厚さ約５
００オングストロームのアルミニウム薄膜からなる。

【０１３６】特徴抽出光ニューロン素子は、基本動作と
して光和算と閾値処理とを実行する。以下にその基本動
作の概略を示す。（１）光導電層側から書き込み光が入射されると、その
書き込み光の強度に正確に比例した光電流が光導電層内
に発生する。書き込み光は、通常２次元の強度分布を有
しているので、発生した光電流も２次元の強度分布を有
している。（２）発生した光電流はニューロン電極毎に集められ、
集められた光電流の総和が計算される（光和算の実
行）。（３）集められた光電流の総和が、所定の閾値を越える
と、光変調層の強誘電性液晶がスイッチングする（閾値
処理）。その結果、読み出し光が光変調層により変調さ
れる。

【０１３７】次に、特徴抽出光ニューロン素子を用いた
読み出し光学系についてその動作を簡単に説明する。書
き込み光が２次元の強度分布を有する光パターンである
のに対し、読み出し光は面光源からの均質な白色光であ
る。読み出し光は、偏光子（不図示）を介して直線偏光
に変換され、光変調層側から本素子に入射される。光変
調層を通過した読み出し光はニューロン電極により反射
され、再び光変調層を通過する。このとき、光変調層が
スイッチングしている場合には、読み出し光の偏光方向
は９０度回転する。光変調層がスイッチングしていない
場合には、読み出し光の偏光方向は変化しない。本素子
から出力された読み出し光は、ビームスプリッタ（不図
示）を介して、偏光子と直交する偏光軸を有する検光子
（不図示）に入力される。その結果、本素子から出力さ
れた読み出し光の内、光変調層がスイッチングしていた
部分に対応する読み出し光のみが検光子を通過する。光
変調層に用いられる強誘電性液晶の高速応答性により、
毎秒３０００パターン以上の処理が可能である。

【０１３８】次に、特徴抽出光ニューロン素子によって
実行される線分抽出の原理を説明する。ニューロン電極
の形状は、書き込み光について光和算を実行するための
領域を規定する。

【０１３９】図１９（ａ）は、「縦」線分を抽出するた
めのニューロン電極の形状、及びその配置を示す。破線
で囲まれた領域が１つのニューロンに相当する。１つの
ニューロン電極は、縦方向に並ぶ２つのニューロンにま
たがり、かつ、そのニューロン電極の面積が対応する各
ニューロンよってほぼ二分されるように配置される。入
力パターンは、図１９（ｂ）に示されるように、８×８
個の画素から構成される２値化パターンである。各画素
の値は０又は１のいずれかである。この入力パターン
は、図１９（ａ）に示される破線で囲まれた１つのニュ
ーロンに１つの画素が対応するように光導電層側から入
力される。ここで、１個のニューロン電極を二分した面
積をＳ、入力パターンにおける”１”の画素の光強度を
Ｉ、及び入力パターンにおける”０”の画素の光強度を
０とする。「縦」線分が存在する場合には、縦方向に並
ぶ２つの画素が同時に”１”を出力するので、それらの
画素に対応するニューロン電極には、合計２ＳＩの光量
に相当する光電流が集められる。これに対し、縦方向に
並ぶ２つの画素の内、一方の画素のみが”１”を出力
し、他方の画素が”０”を出力した場合には、それらの
画素に対応するニューロン電極には、ＳＩの光量に相当
する光電流しか集められない。従って、特徴抽出光ニュ
ーロン素子の閾値θに対して、ＳＩ＜θ＜２ＳＩの関係
を満たすように入力パターンの光強度Ｉを調整すれば、
「縦」線分が存在する場合に限り、光変調層はオフ状態
からオン状態に変化する。

【０１４０】図１９（ｃ）は、上記の原理に基づいて図
１９（ｂ）の入力パターンから「縦」線分を抽出した実
験結果を示す。

【０１４１】「横」、「左斜め」、及び「右斜め」方向
の線分も上述した原理と同じ原理に基づいて抽出される
ことが可能である。

【０１４２】図２０は、「縦」、「横」、「左斜め」、
及び「右斜め」方向の線分を抽出するための４つの線分
抽出面を有する特徴抽出光ニューロン素子を示す。図２
０に示されるように、「左斜め」及び「右斜め」方向の
線分を抽出するための線分抽出面においては、ニューロ
ン電極の形状は、面積Ｓを有する単位電極が、面積が無
視できる程度の微小電極により斜め方向に結合された形
状となっている。入力パターンに含まれる４方向の線分
を同時にかつ独立して抽出するためには、例えば、１つ
の入力パターンをレンズアレイ（不図示）を用いて４つ
の入力パターンに多重展開し、多重展開された入力パタ
ーンのそれぞれを４つの線分抽出面のそれぞれに同時に
入力すればよい。図１９（ｂ）に示される入力パターン
を各線分抽出面に同時に入力した場合の出力結果を図２
１に示す。入力パターン「Ａ」に含まれる線分が方向別
に抽出されていることがわかる。

【０１４３】図２２は、１個のニューロン電極に光信号
を与えた場合の出力特性を示す。図２２は、入力光量が
２μＷを越えると、光変調層の強誘電性液晶がオフ状態
からオン状態に変化する急峻な閾値特性を示している。
これにより、本素子が上述した閾値条件（ＳＩ＜θ＜２
ＳＩ）を満たすための十分な出力特性を有していること
がわかる。

【０１４４】以下、方向抽出及び長さ抽出を実行するた
めの光システムの原理を説明する。図２３は、光システ
ムの構成を示す。この光システムは、光源（不図示）、
３枚の透過型液晶テレビＬＣＴＶ１〜３、及び受光デバ
イス（不図示）を備えている。光源から出射された光
は、透過型液晶テレビＬＣＴＶ１〜３を介して受光デバ
イスに達する。以下に、透過型液晶テレビＬＣＴＶ１〜
３の機能を説明する。

【０１４５】ＬＣＴＶ１：線分抽出層Ｕ^lをの出力を表
示するための透過型液晶テレビである。従って、ＬＣＴ
Ｖ１は、Ｎ×Ｎ個の要素を有するマトリックスによって
表現され、２値化パターンから線分ｌを抽出した結果を
表示する。

【０１４６】ＬＣＴＶ２：（数２２）における係数ｗ^k
（ｉ，ｊ）_p,qを表示するための透過型液晶テレビであ
る。ＬＣＴＶ２は、Ｎ×Ｎ個の領域に分割され、さらに
各領域はＮ×Ｎ個の要素を有するマトリックスによって
表現される。すなわち、ＬＣＴＶ２は、Ｎ²×Ｎ²個の要
素を有するマトリックスによって表現される。ＬＣＴＶ
２においてｉ行ｊ列に位置する領域は、線分抽出層Ｕ^l
の要素ｕ^l（ｉ，ｊ）に対応し、その領域に含まれるＮ
×Ｎ個の要素の内、その領域においてｉ行ｊ列に位置す
る要素を基準として特定の方向ｋに存在する要素は１を
出力し、その領域においてｉ行ｊ列に位置する要素を基
準として特定の方向ｋに存在しない要素は０を出力す
る。

【０１４７】ＬＣＴＶ３：線分抽出層Ｕ^l'の多重像を表
示するための透過型液晶テレビである。ＬＣＴＶ３は、
Ｎ×Ｎ個の領域に分割され、さらに各領域はＮ×Ｎ個の
要素を有するマトリックスによって表現される。すなわ
ち、ＬＣＴＶ３もＬＣＴＶ２と同様に、Ｎ²×Ｎ²個の要
素を有するマトリックスによって表現される。各領域は
線分抽出層Ｕ^l'の出力を表示する。従って、ＬＣＴＶ３
全体では、線分抽出層Ｕ^l'の出力をＮ×Ｎ個多重展開し
たパターンを表示することになる。

【０１４８】ＬＣＴＶ２においてｉ行ｊ列に位置する領
域とＬＣＴＶ３においてｉ行ｊ列に位置する領域とを重
ね合わせることにより、ｗ^k（ｉ，ｊ）_p,q＊ｕ
^l' _p,q（対応する要素毎の積：アダマール積）が得られ
る。従って、これらの積を領域毎に和算した結果は、ｗ
^k（ｉ，ｊ）_p,q＊ｕ^l' _p,qの総和と一致する。

【０１４９】ＬＣＴＶ１においてｉ行ｊ列に位置する要
素とＬＣＴＶ２及び３の対応する領域とを重ね合わせる
ことにより、ｕ^l _ijとｗ^k（ｉ，ｊ）_p,q＊ｕ^l' _p,qとの積
演算が実行される。ＬＣＴＶ１〜３を重ね合わせた結果
を、領域毎に和算することにより、ｄ^l->l' _k,i,jが得ら
れる。（数２３）に示すように、ｉ及びｊについて和算
することにより、ｒ^l->l' _kが得られる。

【０１５０】他の方向ｋ’について、ｄ^l->l' _k',i,j、
ｒ^l->l' _k'を得るためには、ＬＣＴＶ２に表示される係
数をｗ^k'（ｉ，ｊ）_p,qに書き換えればよい。

【０１５１】例えば、図２３を参照して、５行４列に存
在する縦線分を基準として方向ｋ＝１（上方向）に存在
する横線分を抽出する場合を考える。ＬＴＣＶ１の５行
４列に位置する要素２３１は１を出力する。ＬＴＣＶ２
の５行４列に位置する領域２３２において、その領域の
５行４列に位置する要素を基準として上方向に存在する
要素は１を出力し、その他の要素は０を出力する。ＬＴ
ＣＶ３の５行４列に位置する領域２３３の各要素は、線
分抽出層Ｕ^l'の要素と同じ値を出力する。図中、黒い部
分は値１を出力する要素を表わし、白い部分は値０を出
力する要素を表わす。要素２３１、領域２３２、及び領
域２３３を重ね合わせることにより、領域２３４が得ら
れる。この重ね合わせ演算は、対応する要素の値がすべ
て１の場合、演算結果が１となり、その他の場合、演算
結果が０となるように実行される。領域２３４において
値１を出力する要素の数はｄ^1->2 _1,5,4の値に等しい。
従って、ｄ^1->2 _1,5,4＝３である。

【０１５２】上述した光システムにおいて、ＬＣＴＶ１
及びＬＣＴＶ３は光書き込み型の液晶素子であってもよ
い。

【０１５３】また、前述したすべての実施例において、
マトリックスはＮ×Ｎ個の要素を有しているとして説明
した。ここで、Ｎは任意の自然数を表す。しかし、マト
リックスは、必ずしも同じ数の行要素、列要素を有して
いる必要はない。すなわち、マトリックスは、Ｍ×Ｎ個
（Ｍ≠Ｎ）の要素を有していてもよい。ここで、Ｎ、Ｍ
は任意の自然数を表す。

【０１５４】図２４は、線分抽出、方向抽出、及び長さ
抽出を実行する光システムの構成を示す。

【０１５５】Ｈｅ−Ｎｅレーザ２４１から出射される光
は、レンズ２４２を介して２値化された入力パターンを
表示するための透過型空間光変調素子２４３に入力され
る。透過型空間光変調素子２４３からの出力は、入力パ
ターンから横線分を抽出するための特徴抽出光ニューロ
ン素子２４４に書き込み光として入力されるとともにハ
ーフミラー２４５、ミラー２４６〜２４８を経由して入
力パターンから縦線分を抽出するための特徴抽出光ニュ
ーロン素子２４９に書き込み光として入力される。

【０１５６】光源２５０から出射される光は、偏光ビー
ムスプリッタ２５１を介して特徴抽出光ニューロン素子
２４４に読み出し光として入力される。特徴抽出光ニュ
ーロン素子２４４からの反射光は、入力パターンから横
線分を抽出した結果を表す。その反射光は、レンズアレ
イ２５２に入力され、多重展開される。その後、多重展
開された反射光は、透過型空間光変調素子２５７を通過
し、光書き込み型空間光変調素子２５８に書き込み光と
して入力される。尚、透過型空間光変調素子２５７は、
方向抽出のための係数を規定するために用いられる。

【０１５７】Ｈｅ−Ｎｅレーザ２５３から出射される光
は、レンズ２５４、及び偏光子２５５を介して直線偏光
に変換され、偏光ビームスプリッタ２５６を介して、特
徴抽出光ニューロン素子２４９に読み出し光として入力
される。特徴抽出光ニューロン素子２４９からの反射光
は、入力パターンから縦線分を抽出した結果を表す。そ
の反射光は、光書込み型空間光変調素子２５８に読み出
し光として入力される。光書込み型空間光変調素子２５
８は、例えば、図１８の光ニューロン素子のニューロン
電極の代わりに誘電体ミラーが設けられた構造を有して
いる。光書込み型空間光変調素子２５８からの反射光
は、入力パターンから縦線分を抽出した結果と方向抽出
のための係数と入力パターンから横線分を抽出した結果
の多重像とを重ね合わせた結果を表す。その反射光は、
偏光子２５５と直交する偏光軸を有する検光子２５９に
入力される。検光子２５９を通過した光は、レンズ２６
０を介して受光デバイス２６１によって検出される。

【０１５８】受光デバイス２６１は、コンピュータ（不
図示）に接続される。コンピュータは、受光デバイスに
よる検出結果に基づいて、認識プロセスを実行する。

【０１５９】図２４において、破線部２７０、２７１、
及び２７２には、それぞれ図２３のＬＣＴＶ１〜３に表
示されるパターンと同様のパターンが現れる。従って、
上述した線分抽出、方向抽出、及び長さ抽出の原理をこ
の光システムを用いて実行することが可能である。

【０１６０】尚、本発明は上記実施例に限定されるもの
ではなく、発明の主旨に基づいて種種の変形が可能であ
り、これらを本発明の範囲から排除するものではない。

【０１６１】

【発明の効果】以上詳細に説明したように、本発明の画
像認識装置及び画像認識方法によれば文字の位置ズレや
大きさの変動に影響されない高い認識機能を実現でき
る。

【０１６２】また、大きさが異なったり、位置ズレのあ
るパターンを学習させる必要が無いので、学習が容易で
高速に終了できる。

【０１６３】さらに、本発明の装置によれば、ある特定
形状に対して他の特定形状が存在する方向およびその量
を検出することができる。これにより、画像の大きさや
位置に依存しない画像の特徴を抽出することができる。
これは、文字データの特徴抽出に適している。

【図面の簡単な説明】

【図１】本発明にかかる認識装置の構成を表わすブロッ
ク図

【図２】（ａ）は入力部により作製されたビットイメー
ジの一例を示す概略図（ｂ）は線分抽出結果を示す概略図（ｃ）は方向検出部の出力結果の一例を示す概略図

【図３】線分の相対的位置関係を説明する概念図

【図４】（ａ）は入力部により作製されたビットイメー
ジの一例を示す概略図（ｂ）は線分抽出結果を示す概略図（ｃ）は方向検出部の出力結果の一例を示す概略図

【図５】（ａ）は入力部により作製されたビットイメー
ジの一例を示す概略図（ｂ）は線分抽出結果を示す概略図（ｃ）は方向検出部の出力結果を示す概略図

【図６】（ａ）は入力部により作製されたビットイメー
ジの一例を示す概略図（ｂ）はビットイメージにより作製された方向検出部の
出力を示す概略図

【図７】本発明にかかる一実施例に用いるニューラルネ
ットワークの構成図

【図８】本発明の一実施例で用いたニューラルネットワ
ークの構成図

【図９】（ａ）は入力部により作製されたビットイメー
ジの一例を示す概略図（ｂ）は線分抽出層の出力を示す概略図（ｃ）は統合層の出力結果を示す概略図

【図１０】（ａ）は入力部により作製されたビットイメ
ージの一例を示す概略図（ｂ）は線分抽出層の出力を示す概略図（ｃ）は統合層の出力結果を示す概略図

【図１１】（ａ）は本発明の認識装置が予め学習した文
字を示す概略図（ｂ）は本発明の認識装置が正しく認識できた文字の例
を示す概略図

【図１２】従来例の認識装置の構成を示すブロック図

【図１３】ビットイメージの概略図

【図１４】従来例で使用するニューラルネットワークの
構成を示す図

【図１５】本発明の画像認識方法の手順を示すフローチ
ャート

【図１６】（ａ）は２値化された入力パターンの例を示
す図（ｂ）は縦線分を抽出するためのマスクパターンの例を
示す図（ｃ）は横線分を抽出するためのマスクパターンの例を
示す図（ｄ）は左斜め線分を抽出するためのマスクパターンの
例を示す図（ｅ）は右斜め線分を抽出するためのマスクパターンの
例を示す図

【図１７】入力層、形状抽出層、方向抽出層、統合層の
それぞれの出力の具体例を示す図

【図１８】特徴抽出光ニューロン素子の断面を示す図

【図１９】（ａ）は縦線分を抽出するためのニューロン
電極の形状及び配置を示す図（ｂ）は２値化された入力パターンの例を示す図（ｃ）は（ｂ）に示す入力パターンから縦線分を抽出し
た実験結果を示す図

【図２０】４方向の線分を抽出するための４つの線分抽
出面を有する特徴抽出光ニューロン素子を示す図

【図２１】図２１に示す特徴抽出光ニューロン素子の出
力結果の例を示す図

【図２２】１個のニューロン電極に光信号を与えた場合
の出力特性を示す図

【図２３】方向抽出及び長さ抽出を実行するための光シ
ステムの構成を示す図

【図２４】線分抽出、方向抽出、及び長さ抽出を実行す
るための光システムの構成を示す図

【符号の説明】

１入力部２特徴抽出部３認識部４形状抽出部５方向検出部

Claims

【特許請求の範囲】

【請求項１】入力画像の特徴を抽出するための装置であ
って、該入力画像の内、第１の形状を表すパターンを表示する
第１の表示手段、該第１の表示手段によって表示される該第１の形状を表
すパターン上に位置する特定の点を基準として、特定の
方向に位置する複数の点を表すパターンを表示する第２
の表示手段、該入力画像の内、第２の形状を表すパターンを多重展開
することによって得られるパターンを表示する第３の表
示手段、該第１、該第２、及び該第３の表示手段によって表示さ
れるパターンを重ね合わせる重ね合わせ手段、及び該重
ね合わせられたパターンを検知するための検知手段を備
えた画像特徴抽出装置。
【請求項２】第１、第２、及び第３の表示手段は、透過
型空間光変調素子である、請求項１に記載の画像特徴抽
出装置。
【請求項３】第２の表示手段は、透過型空間光変調素子
であり、第１及び第３の表示手段は、光書き込み型空間
光変調素子である、請求項１に記載の画像特徴抽出装
置。
【請求項４】重ね合わせ手段は、光書き込み型空間光変
調素子である、請求項１に記載の画像特徴抽出装置。
【請求項５】画像を入力するステップ、該入力された画像から予め決められた複数の形状を抽出
するステップ、該抽出された複数の形状の内の第１の形状上の各点を基
準として、該抽出された複数の形状の内の第２の形状が
存在する方向を表す第１の特徴量を抽出するステップ、該第１の特徴量に基づいて、該第１の形状に対して特定
の方向に存在する該第２の形状の存在量を表す第２の特
徴量を抽出するステップ、及び該第２の特徴量に基づい
て、該入力された画像を認識するステップを包含する画
像認識方法。
【請求項６】複数の形状を抽出するステップは、第１の
形状をＭ×Ｎ個の要素を有する第１のマトリックスを用
いて表現するステップ、及び第２の形状をＭ×Ｎ個の要
素を有する第２のマトリックスを用いて表現するステッ
プを包含しており、第１の特徴量を抽出するステップは、前記第１の特徴量
をＭ×Ｎ個の要素を有する複数の第３のマトリックスを
含む少なくとも１つの領域を用いて表現するステップを
包含しており、該第１の特徴量は、該第１のマトリックスの要素と該第
２のマトリックスの要素と該第３のマトリックスの要素
との間の結合によって規定され、Ｍ及びＮは任意の自然
数を表す、請求項５に記載の画像認識方法。
【請求項７】第１のマトリックスにおいてｉ行ｊ列に位
置する要素をの値をｕ ^l（ｉ，ｊ）、それの値を
ｕ^l _i,j、第２のマトリックスにおいてｉ行ｊ列に位置す
る要素をｕ^l'（ｉ，ｊ）、それの値をｕ^l' _i,j、第３の
マトリックスにおいてｉ行ｊ列に位置する要素をｄ
^l->l' _k（ｉ，ｊ）、それの値をｄ^l->l' _k,i,j、該第２の
マトリックスにおいてｐ行ｑ列に位置する要素ｕ
^l'（ｐ，ｑ）が要素ｕ^l'（ｉ，ｊ）に対して方向ｋに位
置する場合には１であり、その他の場合には０である係
数をｗ^k（ｉ，ｊ）_p,q、特定の方向を表すパラメータを
ｋと表すとき、結合は、下式（数１）によって表され
る、請求項６に記載の画像認識方法。【数１】
【請求項８】第１の特徴量を抽出するステップは、前記
第１の特徴量をＭ×Ｎ個の要素を有する複数の第３のマ
トリックスを含む少なくとも１つの領域を用いて表現す
るステップを包含しており、第２の特徴量を抽出するステップは、該第２の特徴量を
複数個の要素を有する少なくとも１つの第４のマトリッ
クスを用いて表現するステップを包含しており、該第２の特徴量は、該第３のマトリックスの要素と該第
４のマトリックスの要素との間の結合によって規定さ
れ、Ｍ及びＮは任意の自然数を表す、請求項５に記載の
画像認識方法。
【請求項９】第３のマトリックスにおいてｉ行ｊ列に位
置する要素をｄ^l->l' _k（ｉ，ｊ）、それの値をｄ^l->l'
_k,i,j、第４のマトリックスにおいてｉ行ｊ列に位置す
る要素をｒ^l->l'（ｋ）、それの値をｒ^l->l' _kと表すと
き、結合は、下式（数２）によって表される、請求項８
に記載の画像認識方法。【数２】
【請求項１０】画像を認識するステップは、値ｒ^l->l' _k
及び重み付け係数に基づいて、該画像を識別するステッ
プを包含し、画像認識方法は、該値ｒ^l->l' _kの総和によ
って正規化された該値ｒ^l->l' _kに基づいて、該重み付け
係数を効率的に改変する学習ステップをさらに包含す
る、請求項９に記載の画像認識方法。
【請求項１１】画像を認識するステップは、値ｒ^l->l' _k
及び重み付け係数に基づいて、該画像を識別するステッ
プを包含し、画像認識方法は、該値ｒ^l->l' _kの最大値に
よって正規化された該値ｒ^l->l' _kに基づいて、該重み付
け係数を効率的に改変する学習ステップをさらに包含す
る、請求項９に記載の画像認識方法。
【請求項１２】画像を入力する手段、該入力された画像から予め決められた複数の形状を抽出
する手段、該抽出された複数の形状の内の第１の形状上の各点を基
準として、該抽出された複数の形状の内の第２の形状が
存在する方向を表す第１の特徴量を抽出する手段、該第１の特徴量に基づいて、該第１の形状に対して特定
の方向に存在する該第２の形状の存在量を表す第２の特
徴量を抽出する手段、及び該第２の特徴量に基づいて、
該入力された画像を認識する手段を備えた画像認識装
置。
【請求項１３】複数の形状は、縦線分、横線分、左斜め
線分、及び右斜め線分の内の少なくとも１つを含む、請
求項１２に記載の画像認識装置。
【請求項１４】複数の形状は、幾何学的な形状を含む、
請求項１２に記載の画像認識装置。
【請求項１５】複数の形状を抽出する手段は、該複数の
形状を抽出するための複数の層を有しており、該複数の
層のそれぞれは、Ｍ×Ｎ個の要素を有するマトリックス
によって表され、第１の特徴量を抽出する手段は、前記第１の特徴量を抽
出するための少なくとも１つの第１の領域を有してお
り、該少なくとも１つの第１の領域は複数の第２の領域
を有しており、該複数の第２の領域のそれぞれは、Ｍ×
Ｎ個の要素を有する第３のマトリックスによって表さ
れ、該第１の特徴量は、前記第１の形状を抽出するための層
を表す第１のマトリックスの要素と前記第２の形状を抽
出するための層を表す第２のマトリックスの要素と該第
３のマトリックスの要素との間の結合によって規定さ
れ、Ｍ及びＮは任意の自然数を表す、請求項１２に記載
の画像認識装置。
【請求項１６】第１のマトリックスにおいてｉ行ｊ列に
位置する要素をの値をｕ^l（ｉ，ｊ）、それの値をｕ^l
_i,j、第２のマトリックスにおいてｉ行ｊ列に位置する
要素をｕ^l'（ｉ，ｊ）、それの値をｕ^l' _i,j、第３のマ
トリックスにおいてｉ行ｊ列に位置する要素をｄ^l->l' _k
（ｉ，ｊ）、それの値をｄ^l->l' _k,i,j、該第２のマトリ
ックスにおいてｐ行ｑ列に位置する要素ｕ^l'（ｐ，ｑ）
が要素ｕ^l'（ｉ，ｊ）に対して方向ｋに位置する場合に
は１であり、その他の場合には０である係数をｗ
^k（ｉ，ｊ）_p,q、特定の方向を表すパラメータをｋと表
すとき、結合は、下式（数３）によって表される、請求
項１５に記載の画像認識装置。【数３】
【請求項１７】第１の特徴量を抽出する手段は、前記第
１の特徴量を抽出するための少なくとも１つの第１の領
域を有しており、該少なくとも１つの第１の領域は複数
の第２の領域を有しており、該複数の第２の領域のそれ
ぞれは、Ｍ×Ｎ個の要素を有する第３のマトリックスに
よって表され、第２の特徴量を抽出する手段は、該第２の特徴量を抽出
するための少なくとも１つの第３の領域を有しており、
該少なくとも１つの第３の領域は、複数個の要素を有す
る第４のマトリックスによって表され、該第２の特徴量は、該第３のマトリックスの要素と該第
４のマトリックスの要素との間の結合によって規定さ
れ、Ｍ及びＮは任意の自然数を表す、請求項１２に記載
の画像認識装置。
【請求項１８】第３のマトリックスにおいてｉ行ｊ列に
位置する要素をｄ^l->l ^' _k（ｉ，ｊ）、それの値をｄ
^l->l' _k,i,j、第４のマトリックスにおいてｉ行ｊ列に位
置する要素をｒ^l->l'（ｋ）、それの値をｒ^l->l' _kと表
すとき、結合は、下式（数４）によって表される、請求
項１７に記載の画像認識装置。【数４】
【請求項１９】画像を認識する手段は、入力された画像
を識別するための識別層を有しており、該識別層は複数
の要素を有しており、該複数の要素のそれぞれは、第３
の領域を表す第４のマトリックスの要素に結合される、
請求項１２の画像認識装置。
【請求項２０】識別層の要素、及び第３のマトリックス
の要素のそれぞれはニューロンであり、前記識別層、及
び前記識別層に結合された第３の領域は、ニューラルネ
ットワークの少なくとも一部を構成する、請求項１９に
記載の画像認識装置。