JPH0644376A - 画像特徴抽出装置、画像認識方法及び画像認識装置 - Google Patents
画像特徴抽出装置、画像認識方法及び画像認識装置Info
- Publication number
- JPH0644376A JPH0644376A JP5125730A JP12573093A JPH0644376A JP H0644376 A JPH0644376 A JP H0644376A JP 5125730 A JP5125730 A JP 5125730A JP 12573093 A JP12573093 A JP 12573093A JP H0644376 A JPH0644376 A JP H0644376A
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- line segment
- image
- extracting
- elements
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】
【目的】 ニューラルネットワークを用いた画像認識装
置において、高い認識率を得る。 【構成】 入力部1が作製したビットイメージを、特徴
抽出部2、及び認識部3を構成するニューラルネットワ
ークによって処理して、画像を認識する。特徴抽出部で
は、まず形状抽出部4を構成する第1のニューラルネッ
トワークによって、ビットイメージから特定方向の線分
あるいは特定の幾何学形状を抽出する。方向検出部5を
構成する第2のニューラルネットワークでは、第1の特
定形状に対して第2の特定形状が存在する方向並びに存
在量を抽出する。この特徴をもとに認識部を構成する第
3のニューラルネットワークによって画像を認識する。
置において、高い認識率を得る。 【構成】 入力部1が作製したビットイメージを、特徴
抽出部2、及び認識部3を構成するニューラルネットワ
ークによって処理して、画像を認識する。特徴抽出部で
は、まず形状抽出部4を構成する第1のニューラルネッ
トワークによって、ビットイメージから特定方向の線分
あるいは特定の幾何学形状を抽出する。方向検出部5を
構成する第2のニューラルネットワークでは、第1の特
定形状に対して第2の特定形状が存在する方向並びに存
在量を抽出する。この特徴をもとに認識部を構成する第
3のニューラルネットワークによって画像を認識する。
Description
【0001】
【産業上の利用分野】本発明は、人間の大脳神経系と類
似の入出力動作を模倣して構成されるニューラルネット
ワークを用いて、画像を認識する装置及び画像認識方法
に関する。
似の入出力動作を模倣して構成されるニューラルネット
ワークを用いて、画像を認識する装置及び画像認識方法
に関する。
【0002】
【従来の技術】近年、認識手段としてニューラルネット
ワークを用いる認識装置が検討されており、その中で文
字認識は重要な応用の一つである(森、横澤、梅田:”
PDPモデルによる手書き漢字認識”、信学技報、MB
E87−156、pp.407-414(1988))。図12は従来の
一般的な、ニューラルネットワークを用いる文字認識装
置の構成図である。文字入力部60は、文字の画像パタ
ーンを光電変換して文字データを作製し識別部61に入
力する。ここで、文字データとは、図13に示すよう
な、2次元のビットイメージである。識別部61は文字
データを、ニューラルネットワークにより処理し、文字
を識別する。そして、識別部61は認識結果を記憶部6
2、若しくは表示部63に送る。
ワークを用いる認識装置が検討されており、その中で文
字認識は重要な応用の一つである(森、横澤、梅田:”
PDPモデルによる手書き漢字認識”、信学技報、MB
E87−156、pp.407-414(1988))。図12は従来の
一般的な、ニューラルネットワークを用いる文字認識装
置の構成図である。文字入力部60は、文字の画像パタ
ーンを光電変換して文字データを作製し識別部61に入
力する。ここで、文字データとは、図13に示すよう
な、2次元のビットイメージである。識別部61は文字
データを、ニューラルネットワークにより処理し、文字
を識別する。そして、識別部61は認識結果を記憶部6
2、若しくは表示部63に送る。
【0003】この図12の認識部が用いるニューラルネ
ットワークの説明図を図14に示す。文字入力部60が
作製した文字データ64は、入力層65の対応するニュ
ーロン66に入力する。ニューロン66は受け取った文
字データをシナプスと呼ぶ通路67を通して中間層68
の全てのニューロン69に送る。但し、送られたデータ
は、ニューロン69に入力するとき、重み付けされ入力
する。この重みをシナプス荷重と呼ぶ。中間層69のニ
ューロンは、入力された全てのデータ値の総和を計算
し、この総和に非線形関数を作用させた結果を出力す
る。この出力結果はシナプス70を通して出力層71の
全てのニューロン72に入力する。この時も、シナプス
荷重により重み付けされ入力する。出力層のニューロン
は、入力された値の総和を計算し、最大値検出部73に
送る。最大値検出部は、出力層の各ニューロンから送ら
れた値の最大値を求め、最大値を出力したニューロンに
対応している文字を、識別結果として記憶部62、若し
くは、表示部63に送る。
ットワークの説明図を図14に示す。文字入力部60が
作製した文字データ64は、入力層65の対応するニュ
ーロン66に入力する。ニューロン66は受け取った文
字データをシナプスと呼ぶ通路67を通して中間層68
の全てのニューロン69に送る。但し、送られたデータ
は、ニューロン69に入力するとき、重み付けされ入力
する。この重みをシナプス荷重と呼ぶ。中間層69のニ
ューロンは、入力された全てのデータ値の総和を計算
し、この総和に非線形関数を作用させた結果を出力す
る。この出力結果はシナプス70を通して出力層71の
全てのニューロン72に入力する。この時も、シナプス
荷重により重み付けされ入力する。出力層のニューロン
は、入力された値の総和を計算し、最大値検出部73に
送る。最大値検出部は、出力層の各ニューロンから送ら
れた値の最大値を求め、最大値を出力したニューロンに
対応している文字を、識別結果として記憶部62、若し
くは、表示部63に送る。
【0004】シナプス荷重はバックプロパゲーションな
どの学習により決定される。例えばアルファベットを認
識する場合には、ニューラルネットワークにアルファベ
ットを順次入力し、所望の出力結果が得られるまで繰り
返し学習を行ない、シナプス荷重を決定するのである。
その際、認識能力を向上するために、数種類の文字種に
ついて学習を行っている。
どの学習により決定される。例えばアルファベットを認
識する場合には、ニューラルネットワークにアルファベ
ットを順次入力し、所望の出力結果が得られるまで繰り
返し学習を行ない、シナプス荷重を決定するのである。
その際、認識能力を向上するために、数種類の文字種に
ついて学習を行っている。
【0005】
【発明が解決しようとする課題】画像の特徴を求めるこ
とを特徴抽出と呼ぶ。ニューラルネットワークを用いた
認識装置は、例えば文字を認識する場合には、文字入力
部により抽出された特徴量をニューラルネットワークの
入力信号として文字を認識する。文字入力部がどのよう
な特徴を抽出するかによって認識能力は変化する。
とを特徴抽出と呼ぶ。ニューラルネットワークを用いた
認識装置は、例えば文字を認識する場合には、文字入力
部により抽出された特徴量をニューラルネットワークの
入力信号として文字を認識する。文字入力部がどのよう
な特徴を抽出するかによって認識能力は変化する。
【0006】従来の認識装置は、特徴量として文字入力
部が作製した文字データのメッシュ特徴を用いていた。
即ち、読みとった文字データにおいて、各メッシュの濃
度をある一定の閾値で2値化したビットイメージ、ある
いは0−1の範囲で規格化した濃度値をもとに認識して
いた。つまり、文字のどの部分が黒いかという情報をも
とに認識を行っていた。従って、予めニューラルネット
ワークが学習した文字に対して、変形している文字や、
あるいは位置ずれした文字を正しく認識できない欠点が
あった。変形した文字に対する認識率を向上させるため
には、数十種類の文字種について学習せねばならない。
しかしながら印刷数字の認識に用途を限定しても、80
%程度の認識率しか得られなかった。また、学習に莫大
な時間を要していた。
部が作製した文字データのメッシュ特徴を用いていた。
即ち、読みとった文字データにおいて、各メッシュの濃
度をある一定の閾値で2値化したビットイメージ、ある
いは0−1の範囲で規格化した濃度値をもとに認識して
いた。つまり、文字のどの部分が黒いかという情報をも
とに認識を行っていた。従って、予めニューラルネット
ワークが学習した文字に対して、変形している文字や、
あるいは位置ずれした文字を正しく認識できない欠点が
あった。変形した文字に対する認識率を向上させるため
には、数十種類の文字種について学習せねばならない。
しかしながら印刷数字の認識に用途を限定しても、80
%程度の認識率しか得られなかった。また、学習に莫大
な時間を要していた。
【0007】特に大きさが異なる文字を正しく認識させ
ることはきわめて困難であった。そこで従来の認識装置
では、文字入力部で、入力文字の重心を求め、大きさを
正規化して文字データを作成していた。しかしながら、
この正規化処理に莫大な時間を要するため、高速な認識
ができないという欠点があった。
ることはきわめて困難であった。そこで従来の認識装置
では、文字入力部で、入力文字の重心を求め、大きさを
正規化して文字データを作成していた。しかしながら、
この正規化処理に莫大な時間を要するため、高速な認識
ができないという欠点があった。
【0008】文字以外の2次元画像を認識する場合も同
様の欠点が存在している。本発明は、上記課題を解決
し、認識能力が高い画像認識装置及び画像認識方法を提
供することを目的とする。さらに、文字データの特徴を
抽出するのに適した装置を提供することを目的とする。
様の欠点が存在している。本発明は、上記課題を解決
し、認識能力が高い画像認識装置及び画像認識方法を提
供することを目的とする。さらに、文字データの特徴を
抽出するのに適した装置を提供することを目的とする。
【0009】
【課題を解決するための手段】本発明は上記課題を解決
するために、画像を入力する入力部と、画像の特徴を抽
出する特徴抽出部と、抽出した特徴をもとに画像を認識
する認識部から構成され、前記特徴抽出部は、入力画像
から画像を構成する特定方向の線分または特定の幾何学
形状(以下、特定形状と略記する)を抽出する形状抽出
部と、抽出した第1の特定形状に対して、第2の特定形
状が入力画像内に存在する方向並びに存在量を検出する
方向検出部を具備することを特徴とする。
するために、画像を入力する入力部と、画像の特徴を抽
出する特徴抽出部と、抽出した特徴をもとに画像を認識
する認識部から構成され、前記特徴抽出部は、入力画像
から画像を構成する特定方向の線分または特定の幾何学
形状(以下、特定形状と略記する)を抽出する形状抽出
部と、抽出した第1の特定形状に対して、第2の特定形
状が入力画像内に存在する方向並びに存在量を検出する
方向検出部を具備することを特徴とする。
【0010】本発明の画像認識装置は、画像を入力する
手段、該入力された画像から予め決められた複数の形状
を抽出する手段、該抽出された複数の形状の内の第1の
形状上の各点を基準として、該抽出された複数の形状の
内の第2の形状が存在する方向を表す第1の特徴量を抽
出する手段、該第1の特徴量に基づいて、該第1の形状
に対して特定の方向に存在する該第2の形状の存在量を
表す第2の特徴量を抽出する手段、及び該第2の特徴量
に基づいて、該入力された画像を認識する手段を備えて
おり、これにより、上記目的が達成される。
手段、該入力された画像から予め決められた複数の形状
を抽出する手段、該抽出された複数の形状の内の第1の
形状上の各点を基準として、該抽出された複数の形状の
内の第2の形状が存在する方向を表す第1の特徴量を抽
出する手段、該第1の特徴量に基づいて、該第1の形状
に対して特定の方向に存在する該第2の形状の存在量を
表す第2の特徴量を抽出する手段、及び該第2の特徴量
に基づいて、該入力された画像を認識する手段を備えて
おり、これにより、上記目的が達成される。
【0011】前記複数の形状は、縦線分、横線分、左斜
め線分、及び右斜め線分の内の少なくとも1つを含むこ
とが好ましい。
め線分、及び右斜め線分の内の少なくとも1つを含むこ
とが好ましい。
【0012】前記複数の形状は、幾何学的な形状を含ん
でもよい。前記複数の形状を抽出する手段は、該複数の
形状を抽出するための複数の層を有しており、該複数の
層のそれぞれは、M×N個の要素を有するマトリックス
によって表され、前記第1の特徴量を抽出する手段は、
前記第1の特徴量を抽出するための少なくとも1つの第
1の領域を有しており、該少なくとも1つの第1の領域
は複数の第2の領域を有しており、該複数の第2の領域
のそれぞれは、M×N個の要素を有する第3のマトリッ
クスによって表され、該第1の特徴量は、前記第1の形
状を抽出するための層を表す第1のマトリックスの要素
と前記第2の形状を抽出するための層を表す第2のマト
リックスの要素と該第3のマトリックスの要素の間との
結合によって規定されてもよい。
でもよい。前記複数の形状を抽出する手段は、該複数の
形状を抽出するための複数の層を有しており、該複数の
層のそれぞれは、M×N個の要素を有するマトリックス
によって表され、前記第1の特徴量を抽出する手段は、
前記第1の特徴量を抽出するための少なくとも1つの第
1の領域を有しており、該少なくとも1つの第1の領域
は複数の第2の領域を有しており、該複数の第2の領域
のそれぞれは、M×N個の要素を有する第3のマトリッ
クスによって表され、該第1の特徴量は、前記第1の形
状を抽出するための層を表す第1のマトリックスの要素
と前記第2の形状を抽出するための層を表す第2のマト
リックスの要素と該第3のマトリックスの要素の間との
結合によって規定されてもよい。
【0013】前記第1のマトリックスにおいてi行j列
に位置する要素をの値をul(i,j)、それの値をul
i,j、前記第2のマトリックスにおいてi行j列に位置
する要素をul'(i,j)、それの値をul' i,j、前記
第3のマトリックスにおいてi行j列に位置する要素を
dl->l' k(i,j)、それの値をdl->l' k,i,j、該第2
のマトリックスにおいてp行q列に位置する要素u
l'(p,q)が要素ul'(i,j)に対して方向kに位
置する場合には1であり、その他の場合には0である係
数をwk(i,j)p,q、特定の方向を表すパラメータを
kと表すとき、前記結合は、下式(数5)によって表さ
れてもよい。
に位置する要素をの値をul(i,j)、それの値をul
i,j、前記第2のマトリックスにおいてi行j列に位置
する要素をul'(i,j)、それの値をul' i,j、前記
第3のマトリックスにおいてi行j列に位置する要素を
dl->l' k(i,j)、それの値をdl->l' k,i,j、該第2
のマトリックスにおいてp行q列に位置する要素u
l'(p,q)が要素ul'(i,j)に対して方向kに位
置する場合には1であり、その他の場合には0である係
数をwk(i,j)p,q、特定の方向を表すパラメータを
kと表すとき、前記結合は、下式(数5)によって表さ
れてもよい。
【0014】
【数5】
【0015】前記第1の特徴量を抽出する手段は、前記
第1の特徴量を抽出するための少なくとも1つの第1の
領域を有しており、該少なくとも1つの第1の領域は複
数の第2の領域を有しており、該複数の第2の領域のそ
れぞれは、M×N個の要素を有する第3のマトリックス
によって表され、前記第2の特徴量を抽出する手段は、
該第2の特徴量を抽出するための少なくとも1つの第3
の領域を有しており、該少なくとも1つの第3の領域
は、複数個の要素を有する第4のマトリックスによって
表され、該第2の特徴量は、該第3のマトリックスの要
素と該第4のマトリックスの要素との間の結合によって
規定されてもよい。
第1の特徴量を抽出するための少なくとも1つの第1の
領域を有しており、該少なくとも1つの第1の領域は複
数の第2の領域を有しており、該複数の第2の領域のそ
れぞれは、M×N個の要素を有する第3のマトリックス
によって表され、前記第2の特徴量を抽出する手段は、
該第2の特徴量を抽出するための少なくとも1つの第3
の領域を有しており、該少なくとも1つの第3の領域
は、複数個の要素を有する第4のマトリックスによって
表され、該第2の特徴量は、該第3のマトリックスの要
素と該第4のマトリックスの要素との間の結合によって
規定されてもよい。
【0016】前記第3のマトリックスにおいてi行j列
に位置する要素をdl->l' k(i,j)、それの値をd
l->l' k,i,j、前記第4のマトリックスにおいてi行j列
に位置する要素をrl->l'(k)、それの値をrl->l' k
と表すとき、前記結合は、下式(数6)によって表され
てもよい。
に位置する要素をdl->l' k(i,j)、それの値をd
l->l' k,i,j、前記第4のマトリックスにおいてi行j列
に位置する要素をrl->l'(k)、それの値をrl->l' k
と表すとき、前記結合は、下式(数6)によって表され
てもよい。
【0017】
【数6】
【0018】前記画像を認識する手段は、前記入力され
た画像を識別するための識別層を有しており、該識別層
は複数の要素を有しており、該複数の要素のそれぞれ
は、前記第3の領域を表す前記第3のマトリックスの要
素に結合されてもよい。
た画像を識別するための識別層を有しており、該識別層
は複数の要素を有しており、該複数の要素のそれぞれ
は、前記第3の領域を表す前記第3のマトリックスの要
素に結合されてもよい。
【0019】前記識別層の要素、及び前記第4のマトリ
ックスの要素のそれぞれはニューロンであり、前記識別
層、及び前記識別層に結合された前記第3の領域は、ニ
ューラルネットワークの少なくとも一部を構成してもよ
い。
ックスの要素のそれぞれはニューロンであり、前記識別
層、及び前記識別層に結合された前記第3の領域は、ニ
ューラルネットワークの少なくとも一部を構成してもよ
い。
【0020】本発明の画像認識方法は、画像を入力する
ステップ、該入力された画像から予め決められた複数の
形状を抽出するステップ、該抽出された複数の形状の内
の第1の形状上の各点を基準として、該抽出された複数
の形状の内の第2の形状が存在する方向を表す第1の特
徴量を抽出するステップ、該第1の特徴量に基づいて、
該第1の形状に対して特定の方向に存在する該第2の形
状の存在量を表す第2の特徴量を抽出するステップ、及
び該第2の特徴量に基づいて、該入力された画像を認識
するステップを包含しており、これにより、上記目的が
達成される。
ステップ、該入力された画像から予め決められた複数の
形状を抽出するステップ、該抽出された複数の形状の内
の第1の形状上の各点を基準として、該抽出された複数
の形状の内の第2の形状が存在する方向を表す第1の特
徴量を抽出するステップ、該第1の特徴量に基づいて、
該第1の形状に対して特定の方向に存在する該第2の形
状の存在量を表す第2の特徴量を抽出するステップ、及
び該第2の特徴量に基づいて、該入力された画像を認識
するステップを包含しており、これにより、上記目的が
達成される。
【0021】前記複数の形状を抽出するステップは、前
記第1の形状をM×N個の要素を有する第1のマトリッ
クスを用いて表現するステップ、及び前記第2の形状を
M×N個の要素を有する第2のマトリックスを用いて表
現するステップを包含しており、前記第1の特徴量を抽
出するステップは、前記第1の特徴量をM×N個の要素
を有する複数の第3のマトリックスを含む少なくとも1
つの領域を用いて表現するステップを包含しており、該
第1の特徴量は、該第1のマトリックスの要素と該第2
のマトリックスの要素と該第3のマトリックスの要素と
の間の結合によって規定されてもよい。
記第1の形状をM×N個の要素を有する第1のマトリッ
クスを用いて表現するステップ、及び前記第2の形状を
M×N個の要素を有する第2のマトリックスを用いて表
現するステップを包含しており、前記第1の特徴量を抽
出するステップは、前記第1の特徴量をM×N個の要素
を有する複数の第3のマトリックスを含む少なくとも1
つの領域を用いて表現するステップを包含しており、該
第1の特徴量は、該第1のマトリックスの要素と該第2
のマトリックスの要素と該第3のマトリックスの要素と
の間の結合によって規定されてもよい。
【0022】前記第1のマトリックスにおいてi行j列
に位置する要素をの値をul(i,j)、それの値をul
i,j、前記第2のマトリックスにおいてi行j列に位置
する要素をul'(i,j)、それの値をul' i,j、前記
第3のマトリックスにおいてi行j列に位置する要素を
dl->l' k(i,j)、それの値をdl->l' k,i,j、該第2
のマトリックスにおいてp行q列に位置する要素u
l'(p,q)が要素ul'(i,j)に対して方向kに位
置する場合には1であり、その他の場合には0である係
数をwk(i,j)p,q、特定の方向を表すパラメータを
kと表すとき、前記結合は、下式(数7)によって表さ
れてもよい。
に位置する要素をの値をul(i,j)、それの値をul
i,j、前記第2のマトリックスにおいてi行j列に位置
する要素をul'(i,j)、それの値をul' i,j、前記
第3のマトリックスにおいてi行j列に位置する要素を
dl->l' k(i,j)、それの値をdl->l' k,i,j、該第2
のマトリックスにおいてp行q列に位置する要素u
l'(p,q)が要素ul'(i,j)に対して方向kに位
置する場合には1であり、その他の場合には0である係
数をwk(i,j)p,q、特定の方向を表すパラメータを
kと表すとき、前記結合は、下式(数7)によって表さ
れてもよい。
【0023】
【数7】
【0024】前記第1の特徴量を抽出するステップは、
前記第1の特徴量をM×N個の要素を有する複数の第3
のマトリックスを含む少なくとも1つの領域を用いて表
現するステップを包含しており、前記第2の特徴量を抽
出するステップは、該第2の特徴量を複数個の要素を有
する少なくとも1つの第4のマトリックスを用いて表現
するステップを包含しており、該第2の特徴量は、該第
3のマトリックスの要素と該第4のマトリックスの要素
との間の結合によって規定されてもよい。
前記第1の特徴量をM×N個の要素を有する複数の第3
のマトリックスを含む少なくとも1つの領域を用いて表
現するステップを包含しており、前記第2の特徴量を抽
出するステップは、該第2の特徴量を複数個の要素を有
する少なくとも1つの第4のマトリックスを用いて表現
するステップを包含しており、該第2の特徴量は、該第
3のマトリックスの要素と該第4のマトリックスの要素
との間の結合によって規定されてもよい。
【0025】前記第3のマトリックスにおいてi行j列
に位置する要素をdl->l' k(i,j)、それの値をd
l->l' k,i,j、前記第4のマトリックスにおいてi行j列
に位置する要素をrl->l'(k)、それの値をrl->l' k
と表すとき、前記結合は、下式(数8)によって表され
てもよい。
に位置する要素をdl->l' k(i,j)、それの値をd
l->l' k,i,j、前記第4のマトリックスにおいてi行j列
に位置する要素をrl->l'(k)、それの値をrl->l' k
と表すとき、前記結合は、下式(数8)によって表され
てもよい。
【0026】
【数8】
【0027】前記画像を認識するステップは、前記値r
l->l' k及び重み付け係数に基づいて、該画像を識別する
ステップを包含し、前記画像認識方法は、該値rl->l' k
の総和によって正規化された該値rl->l' kに基づいて、
該重み付け係数を効率的に改変する学習ステップをさら
に包含することが好ましい。
l->l' k及び重み付け係数に基づいて、該画像を識別する
ステップを包含し、前記画像認識方法は、該値rl->l' k
の総和によって正規化された該値rl->l' kに基づいて、
該重み付け係数を効率的に改変する学習ステップをさら
に包含することが好ましい。
【0028】前記画像を認識するステップは、前記値r
l->l' k及び重み付け係数に基づいて、該画像を識別する
ステップを包含し、前記画像認識方法は、該値rl->l' k
の最大値によって正規化された該値rl->l' kに基づい
て、該重み付け係数を効率的に改変する学習ステップを
さらに包含することが好ましい。
l->l' k及び重み付け係数に基づいて、該画像を識別する
ステップを包含し、前記画像認識方法は、該値rl->l' k
の最大値によって正規化された該値rl->l' kに基づい
て、該重み付け係数を効率的に改変する学習ステップを
さらに包含することが好ましい。
【0029】本発明の入力画像の特徴を抽出するための
装置は、該入力画像の内、第1の形状を表すパターンを
表示する第1の表示手段、該第1の表示手段によって表
示される該第1の形状を表すパターン上に位置する特定
の点を基準として、特定の方向に位置する複数の点を表
すパターンを表示する第2の表示手段、該入力画像の
内、第2の形状を表すパターンを多重展開することによ
って得られるパターンを表示する第3の表示手段、該第
1、該第2、及び該第3の表示手段によって表示される
パターンを重ね合わせる重ね合わせ手段、及び該重ね合
わせられたパターンを検知するための検知手段を備えて
おり、これにより、上記目的が達成される。
装置は、該入力画像の内、第1の形状を表すパターンを
表示する第1の表示手段、該第1の表示手段によって表
示される該第1の形状を表すパターン上に位置する特定
の点を基準として、特定の方向に位置する複数の点を表
すパターンを表示する第2の表示手段、該入力画像の
内、第2の形状を表すパターンを多重展開することによ
って得られるパターンを表示する第3の表示手段、該第
1、該第2、及び該第3の表示手段によって表示される
パターンを重ね合わせる重ね合わせ手段、及び該重ね合
わせられたパターンを検知するための検知手段を備えて
おり、これにより、上記目的が達成される。
【0030】前記第1、前記第2、及び前記第3の表示
手段は、透過型空間光変調素子であってもよい。
手段は、透過型空間光変調素子であってもよい。
【0031】前記第2の表示手段は、透過型空間光変調
素子であり、前記第1、及び前記第3の表示手段は、光
書き込み型空間光変調素子であってもよい。
素子であり、前記第1、及び前記第3の表示手段は、光
書き込み型空間光変調素子であってもよい。
【0032】前記重ね合わせ手段は、光書き込み型空間
光変調素子であってもよい。
光変調素子であってもよい。
【0033】
【作用】簡単のため、以下に本発明を文字認識に応用す
る場合について本発明の作用を説明する。認識率を向上
させるためには、文字の種々の変形に対して不変な特徴
量を用いて認識すればよい。文字の大きさ、位置ずれに
不変な特徴量を抽出すれば、大きさの異なる文字を正し
く認識できる。本発明の特徴抽出部は、入力部が作製す
る文字データから、次の特徴量を抽出する。
る場合について本発明の作用を説明する。認識率を向上
させるためには、文字の種々の変形に対して不変な特徴
量を用いて認識すればよい。文字の大きさ、位置ずれに
不変な特徴量を抽出すれば、大きさの異なる文字を正し
く認識できる。本発明の特徴抽出部は、入力部が作製す
る文字データから、次の特徴量を抽出する。
【0034】(1)特定形状(縦、横、左斜め、右斜め
の線分、または幾何学形状)の存在情報。
の線分、または幾何学形状)の存在情報。
【0035】(2)ある特定形状に対して、他の特定形
状が存在する方向およびその量。すなわち、文字を構成
しているある特定形状に対して、他の特定形状がどの方
向にどの程度の量で存在するかという情報をもとに文字
を識別する。
状が存在する方向およびその量。すなわち、文字を構成
しているある特定形状に対して、他の特定形状がどの方
向にどの程度の量で存在するかという情報をもとに文字
を識別する。
【0036】同じ文字であれば大きさが異なっていて
も、文字を構成する線分や幾何学形状の相対的な位置関
係は不変である。従って本発明の特徴抽出部が抽出する
上記特徴量は、文字の大きさ並びに位置ずれに不変な特
徴である。
も、文字を構成する線分や幾何学形状の相対的な位置関
係は不変である。従って本発明の特徴抽出部が抽出する
上記特徴量は、文字の大きさ並びに位置ずれに不変な特
徴である。
【0037】以上説明したように、本発明に用いるニュ
ーラルネットワークでは、文字の変形に対して許容度の
高い特徴量を抽出できるため、大きさの異なる手書き文
字についても認識率が高い。また学習に使用する文字の
種類は数種類でよいので学習を高速に終了できる。な
お、上記作用は文字以外の2次元画像の認識においても
同様の効果を奏すことができる。
ーラルネットワークでは、文字の変形に対して許容度の
高い特徴量を抽出できるため、大きさの異なる手書き文
字についても認識率が高い。また学習に使用する文字の
種類は数種類でよいので学習を高速に終了できる。な
お、上記作用は文字以外の2次元画像の認識においても
同様の効果を奏すことができる。
【0038】
【実施例】以下、本発明の認識装置について図面を参照
しながら詳細に説明する。
しながら詳細に説明する。
【0039】(実施例1)本発明の実施例の構成図を図
1に示す。この認識装置は、入力部1、特徴抽出部2、
認識部3から構成される。入力部1は、入力画像から2
次元のビットイメージを作製し、特徴抽出部2へ情報を
送る。形状抽出部4はビットイメージから各種特定形状
を抽出する。方向検出部5は、各種特定形状の相対的な
位置関係を抽出後、認識部3に情報を送る。認識部3
は、送られた情報をもとに画像を認識する。
1に示す。この認識装置は、入力部1、特徴抽出部2、
認識部3から構成される。入力部1は、入力画像から2
次元のビットイメージを作製し、特徴抽出部2へ情報を
送る。形状抽出部4はビットイメージから各種特定形状
を抽出する。方向検出部5は、各種特定形状の相対的な
位置関係を抽出後、認識部3に情報を送る。認識部3
は、送られた情報をもとに画像を認識する。
【0040】次に特徴抽出部2の具体的な出力例を図2
に示し、抽出過程を説明する。図2(a)は入力部1に
より作製されたビットイメージ6である(白い部分は”
0”、黒い部分は”1”である)。ビットイメージ6の
マトリックスサイズは例えば60×60である。図2
(b)は、形状抽出部4の出力結果である。出力は、特
定形状として例えば縦線分抽出結果7、及び横線分抽出
結果8からなる。各出力結果も各々60×60のビット
イメージである。図2(c)は方向検出部の出力結果9
を表わす。方向検出部は、例えば縦線分を基準として横
線分がどの方向(均等に分割された8方向)に存在する
かを抽出する。図2(c)の各領域10〜17は、縦線
分を基準とした場合の横線分の存在する方向を表わし、
黒丸の大きさは各方向に存在する横線分の長さを表わ
す。例えば領域10の出力は縦線分の上部に横線分が黒
丸の直径相当分の長さ存在することを意味する。同様に
領域12の出力は横線分が縦線分の右中段部に黒丸の直
径分相当することを意味する。
に示し、抽出過程を説明する。図2(a)は入力部1に
より作製されたビットイメージ6である(白い部分は”
0”、黒い部分は”1”である)。ビットイメージ6の
マトリックスサイズは例えば60×60である。図2
(b)は、形状抽出部4の出力結果である。出力は、特
定形状として例えば縦線分抽出結果7、及び横線分抽出
結果8からなる。各出力結果も各々60×60のビット
イメージである。図2(c)は方向検出部の出力結果9
を表わす。方向検出部は、例えば縦線分を基準として横
線分がどの方向(均等に分割された8方向)に存在する
かを抽出する。図2(c)の各領域10〜17は、縦線
分を基準とした場合の横線分の存在する方向を表わし、
黒丸の大きさは各方向に存在する横線分の長さを表わ
す。例えば領域10の出力は縦線分の上部に横線分が黒
丸の直径相当分の長さ存在することを意味する。同様に
領域12の出力は横線分が縦線分の右中段部に黒丸の直
径分相当することを意味する。
【0041】図3を用いて方向検出部の出力9の意味に
ついて詳細に説明する。図の正方形はビットイメージ6
である。いま、縦線分が存在しているビット18’を中
心としてビットイメージ全体を覆う円を描く。このビッ
ト18’を基準として、図の円を均等に8分割すること
で方向10’〜17’が定義できる。つまりビット1
8’に位置する縦線分を基準とすれば、横線分は方向1
3’〜15’に存在することになる。従って図2(c)
における領域13〜15が出力する。実際の図2(c)
の出力は、縦線分上のすべての点を基準として作製され
たものである。
ついて詳細に説明する。図の正方形はビットイメージ6
である。いま、縦線分が存在しているビット18’を中
心としてビットイメージ全体を覆う円を描く。このビッ
ト18’を基準として、図の円を均等に8分割すること
で方向10’〜17’が定義できる。つまりビット1
8’に位置する縦線分を基準とすれば、横線分は方向1
3’〜15’に存在することになる。従って図2(c)
における領域13〜15が出力する。実際の図2(c)
の出力は、縦線分上のすべての点を基準として作製され
たものである。
【0042】図2(a)に与えられたパターン”+”を
構成する縦線分”|”の上部19を基準とすれば、横線
分は方向13’〜15’にかけて存在していることにな
る。同様に、縦線分”|”の下部20の縦線分を基準と
すれば、横線分は、方向17’、10’、11’に存在
することになる。縦線分中央部21を基準とすれば横線
分は方向12’、16’に存在することになる。従って
方向検出部の出力は図2(c)のようになる。
構成する縦線分”|”の上部19を基準とすれば、横線
分は方向13’〜15’にかけて存在していることにな
る。同様に、縦線分”|”の下部20の縦線分を基準と
すれば、横線分は、方向17’、10’、11’に存在
することになる。縦線分中央部21を基準とすれば横線
分は方向12’、16’に存在することになる。従って
方向検出部の出力は図2(c)のようになる。
【0043】図4及び図5は同じく縦線分と横線分から
構成される図形に対する各部の出力を表わしている。各
図の(a)は入力ビットイメージ、(b)は各線分抽出
結果、(c)は方向検出部の出力結果である。図4
(a)に示したパターンの場合は、図4(c)に示した
ように領域10〜14が出力する。また図5(a)のパ
ターンの場合には図5(c)に示したように領域10、
14〜17が出力する。このように方向検出部の出力結
果9は、縦線分と横線分の相対的な位置関係を表わした
ものであり、縦線分と横線分の相対的な位置関係が変化
すればこの特徴は必ず変化する。
構成される図形に対する各部の出力を表わしている。各
図の(a)は入力ビットイメージ、(b)は各線分抽出
結果、(c)は方向検出部の出力結果である。図4
(a)に示したパターンの場合は、図4(c)に示した
ように領域10〜14が出力する。また図5(a)のパ
ターンの場合には図5(c)に示したように領域10、
14〜17が出力する。このように方向検出部の出力結
果9は、縦線分と横線分の相対的な位置関係を表わした
ものであり、縦線分と横線分の相対的な位置関係が変化
すればこの特徴は必ず変化する。
【0044】この方向検出部の出力9はパターンの大き
さ及び位置に依存しない点が大きな特長である。図6は
大きさ並びに存在位置の異なる”+”に対する方向検出
部9の出力を表わしている。図6(b)に示したように
各領域の出力強度(黒丸の直径で表わされる)は小さく
なるが、出力パターンは図4(c)と完全に一致する。
さ及び位置に依存しない点が大きな特長である。図6は
大きさ並びに存在位置の異なる”+”に対する方向検出
部9の出力を表わしている。図6(b)に示したように
各領域の出力強度(黒丸の直径で表わされる)は小さく
なるが、出力パターンは図4(c)と完全に一致する。
【0045】以上詳細に説明したように、本発明の特徴
抽出部はパターンの大きさ並びに存在位置に影響されな
い特徴を抽出できる。認識部はこの特徴をもとに認識す
るので極めて高い認識能力を実現できる。
抽出部はパターンの大きさ並びに存在位置に影響されな
い特徴を抽出できる。認識部はこの特徴をもとに認識す
るので極めて高い認識能力を実現できる。
【0046】以下に具体的な構成例について図7を用い
て詳述する。この認識装置は入力部1、特徴抽出部2、
認識部3から構成される。さらに特徴抽出部2は、形状
抽出部4である第1のニューラルネットワーク4’、方
向検出部5である第2のニューラルネットワーク5’か
らなる。また認識部3は、第3のニューラルネットワー
クからなる。入力文字は入力部1により2次元のビット
イメージに変換される。ビットイメージは第1のニュー
ラルネットワーク4’の入力層34に与えられる。形状
抽出層35は、入力層のニューロン数(この図では例え
ば3×3ニューロン)と同数個のニューロンを2次元に
配置した縦線分抽出層35’、及び横線分抽出層35”
からなる。縦線分抽出層35’では、入力ビットイメー
ジから縦線分を、横線分抽出層35”では横線分を抽出
する。
て詳述する。この認識装置は入力部1、特徴抽出部2、
認識部3から構成される。さらに特徴抽出部2は、形状
抽出部4である第1のニューラルネットワーク4’、方
向検出部5である第2のニューラルネットワーク5’か
らなる。また認識部3は、第3のニューラルネットワー
クからなる。入力文字は入力部1により2次元のビット
イメージに変換される。ビットイメージは第1のニュー
ラルネットワーク4’の入力層34に与えられる。形状
抽出層35は、入力層のニューロン数(この図では例え
ば3×3ニューロン)と同数個のニューロンを2次元に
配置した縦線分抽出層35’、及び横線分抽出層35”
からなる。縦線分抽出層35’では、入力ビットイメー
ジから縦線分を、横線分抽出層35”では横線分を抽出
する。
【0047】線分抽出の原理を縦線分抽出を例にして簡
単に説明する。いま、ニューラルネットワークの入力層
34と縦線分抽出層35’は、同数個のニューロンを2
次元に配置しており、入力層34及び縦線分抽出層3
5’の中で、上からi番目、左からj番目(i行j列)
に位置しているニューロンの出力を、各々x1 ij、x2 ij
と表わす。ここで、第2層のニューロンは、入力層34
の対応するニューロン(入力層34内で同じ座標に位置
しているニューロン)、及びその上下に隣接して並んで
いるニューロンと結合していると仮定する(設定1)。
従って、縦線分抽出層35’のニューロンの出力関数を
fとおくと、x2 ijは、(数9)で表せる(設定2)。
単に説明する。いま、ニューラルネットワークの入力層
34と縦線分抽出層35’は、同数個のニューロンを2
次元に配置しており、入力層34及び縦線分抽出層3
5’の中で、上からi番目、左からj番目(i行j列)
に位置しているニューロンの出力を、各々x1 ij、x2 ij
と表わす。ここで、第2層のニューロンは、入力層34
の対応するニューロン(入力層34内で同じ座標に位置
しているニューロン)、及びその上下に隣接して並んで
いるニューロンと結合していると仮定する(設定1)。
従って、縦線分抽出層35’のニューロンの出力関数を
fとおくと、x2 ijは、(数9)で表せる(設定2)。
【0048】
【数9】
【0049】
【数10】
【0050】入力画像に縦の線分が存在している場合に
は、例えばx1 i-lj=x1 ij=x1 i+l j=1であり、入力
層34内で縦方向に連続して並んでいるニューロンが出
力する。
は、例えばx1 i-lj=x1 ij=x1 i+l j=1であり、入力
層34内で縦方向に連続して並んでいるニューロンが出
力する。
【0051】従って、縦線分抽出層35’のニューロン
は、上記3つの設定により、対応する入力層34のニュ
ーロンが縦の線分を構成しているときに限って出力する
ので、縦の線分を抽出することになる。
は、上記3つの設定により、対応する入力層34のニュ
ーロンが縦の線分を構成しているときに限って出力する
ので、縦の線分を抽出することになる。
【0052】横、斜めの方向の線分の抽出も同様であ
り、横線分抽出層35”のニューロンと入力層34のニ
ューロンの結合を、対応するニューロンと例えばその左
右1個とすれば、横方向の線分を抽出できる。このとき
の横線分抽出層35”のニューロンの出力は(数11)
で表せる。ここで、x3 ijは、横線分抽出層35”の中
で上からi番目左からj番目(i行j列)に位置してい
るニューロンの出力を表す。
り、横線分抽出層35”のニューロンと入力層34のニ
ューロンの結合を、対応するニューロンと例えばその左
右1個とすれば、横方向の線分を抽出できる。このとき
の横線分抽出層35”のニューロンの出力は(数11)
で表せる。ここで、x3 ijは、横線分抽出層35”の中
で上からi番目左からj番目(i行j列)に位置してい
るニューロンの出力を表す。
【0053】
【数11】
【0054】同様に左斜め、右斜めの線分を抽出する場
合には、結合は各々、(数12)、(数13)で表され
る。ここで、x4 ijは、左斜め線分抽出層(不図示)の
中で上からi番目左からj番目(i行j列)に位置して
いるニューロンの出力を表し、x5 ijは、右斜め線分抽
出層(不図示)の中で上からi番目左からj番目(i行
j列)に位置しているニューロンの出力を表す。
合には、結合は各々、(数12)、(数13)で表され
る。ここで、x4 ijは、左斜め線分抽出層(不図示)の
中で上からi番目左からj番目(i行j列)に位置して
いるニューロンの出力を表し、x5 ijは、右斜め線分抽
出層(不図示)の中で上からi番目左からj番目(i行
j列)に位置しているニューロンの出力を表す。
【0055】
【数12】
【0056】
【数13】
【0057】第1層と同数個のニューロンを2次元に配
置した領域を4つ準備し、各領域に一つの線分を割り当
てた第2層を形成すれば、同時に4方向を抽出できる。
置した領域を4つ準備し、各領域に一つの線分を割り当
てた第2層を形成すれば、同時に4方向を抽出できる。
【0058】同様に、特定の幾何学形状を抽出すること
も可能であり、例えば、”^”の形状は、(数14)で
表される結合により抽出できる。ここで、x6 ijは、特
定の幾何学形状抽出層(不図示)の中で上からi番目左
からj番目(i行j列)に位置しているニューロンの出
力を表す。
も可能であり、例えば、”^”の形状は、(数14)で
表される結合により抽出できる。ここで、x6 ijは、特
定の幾何学形状抽出層(不図示)の中で上からi番目左
からj番目(i行j列)に位置しているニューロンの出
力を表す。
【0059】
【数14】
【0060】同様に、”+”、”「”、”じ”、等の形
状が抽出できる。この第2層35の出力が方向検出部5
を構成する第2のニューラルネットワーク5’の入力と
なる。第2のニューラルネットワークは方向検出層36
及び統合層37から構成される。方向検出層36は縦線
分を基準として横線分がどの方向に存在するかを検出す
る機能を持ち、各方向に相当する領域39〜46の8つ
の領域から構成される(中央の斜線部はニューロンでは
ない)。各領域39〜46は入力層34と同じマトリッ
クスサイズ(この図では簡単のため3×3)である。例
えば領域39は縦線分に対して横線分が左斜め上部(図
3の方向17’に相当)方向に存在するか否かを抽出す
る。そのために、領域39のニューロン39’は縦線分
抽出層35’の対応する位置のニューロン47、及びニ
ューロン47に対して横線分抽出層中で方向17’(左
斜め上部)に位置するニューロン48と結合している。
状が抽出できる。この第2層35の出力が方向検出部5
を構成する第2のニューラルネットワーク5’の入力と
なる。第2のニューラルネットワークは方向検出層36
及び統合層37から構成される。方向検出層36は縦線
分を基準として横線分がどの方向に存在するかを検出す
る機能を持ち、各方向に相当する領域39〜46の8つ
の領域から構成される(中央の斜線部はニューロンでは
ない)。各領域39〜46は入力層34と同じマトリッ
クスサイズ(この図では簡単のため3×3)である。例
えば領域39は縦線分に対して横線分が左斜め上部(図
3の方向17’に相当)方向に存在するか否かを抽出す
る。そのために、領域39のニューロン39’は縦線分
抽出層35’の対応する位置のニューロン47、及びニ
ューロン47に対して横線分抽出層中で方向17’(左
斜め上部)に位置するニューロン48と結合している。
【0061】ここで、ニューロン48が、なぜニューロ
ン47に対して方向17’に位置することになるのか説
明する。ニューロン47は入力層34中のニューロン4
9の位置に縦線分が存在する場合に発火し、同様にニュ
ーロン48は入力層34中のニューロン50の位置に横
線分が存在する場合に発火する。入力パターン中のニュ
ーロン49の位置に存在する縦線分を基準とすれば、ニ
ューロン50の位置に存在する横線分は方向17’に位
置することになる。従って、ニューロン47で抽出した
縦線分を基準とすれば、ニューロン48が抽出する横線
分は方向17’に位置することになる。
ン47に対して方向17’に位置することになるのか説
明する。ニューロン47は入力層34中のニューロン4
9の位置に縦線分が存在する場合に発火し、同様にニュ
ーロン48は入力層34中のニューロン50の位置に横
線分が存在する場合に発火する。入力パターン中のニュ
ーロン49の位置に存在する縦線分を基準とすれば、ニ
ューロン50の位置に存在する横線分は方向17’に位
置することになる。従って、ニューロン47で抽出した
縦線分を基準とすれば、ニューロン48が抽出する横線
分は方向17’に位置することになる。
【0062】ニューロン39’はニューロン47及び4
8が同時に発火している場合、すなわち、ニューロン4
9が縦線分を構成しており、かつ横線分が方向17’に
存在する場合に限り発火することになる。
8が同時に発火している場合、すなわち、ニューロン4
9が縦線分を構成しており、かつ横線分が方向17’に
存在する場合に限り発火することになる。
【0063】同様にニューロン39”は、縦線分抽出層
35’中の対応する位置のニューロン47’及び、ニュ
ーロン47’に対して方向17’に位置する横線分抽出
層35”中のニューロン48及び48’と結合させる。
このニューロン39”は、ニューロン48、48’の少
なくともどちらか一方が発火しており、かつ47’が発
火している場合に限り発火する。
35’中の対応する位置のニューロン47’及び、ニュ
ーロン47’に対して方向17’に位置する横線分抽出
層35”中のニューロン48及び48’と結合させる。
このニューロン39”は、ニューロン48、48’の少
なくともどちらか一方が発火しており、かつ47’が発
火している場合に限り発火する。
【0064】他の領域40〜46中のニューロンも同様
の結合により、縦線分に対し横線分が存在する領域を抽
出する。例えば領域44は、縦線分に対して方向14’
(真下方向)に存在する横線分の情報を抽出する。その
ために、領域44中のニューロン44’は、縦線分抽出
層35’の対応するニューロン47、およびニューロン
47からみて方向14’に位置する横線分抽出層のニュ
ーロン48”と結合される。さらにこのニューロン4
4’は、ニューロン47及びニューロン48”が同時に
出力する場合に限り発火する。この様な結合により、縦
線分に対し横線分が存在する領域が抽出できる。
の結合により、縦線分に対し横線分が存在する領域を抽
出する。例えば領域44は、縦線分に対して方向14’
(真下方向)に存在する横線分の情報を抽出する。その
ために、領域44中のニューロン44’は、縦線分抽出
層35’の対応するニューロン47、およびニューロン
47からみて方向14’に位置する横線分抽出層のニュ
ーロン48”と結合される。さらにこのニューロン4
4’は、ニューロン47及びニューロン48”が同時に
出力する場合に限り発火する。この様な結合により、縦
線分に対し横線分が存在する領域が抽出できる。
【0065】図7に示したように、統合層37は方向検
出層36の出力を局所的に統合する。すなわち、統合層
37のニューロンは合計8ニューロン(図面では便宜的
に3×3であるが斜線部はニューロンではない)であ
り、各ニューロンは方向検出層36の対応する各領域3
9〜46の出力を同一のシナプス荷重、例えば1により
重み付けして統合する。さらに入力信号の総和に例えば
線形関数を作用させた結果を出力する。この統合層37
の出力状態が図2(c)、図4(c)、図5(c)であ
る。
出層36の出力を局所的に統合する。すなわち、統合層
37のニューロンは合計8ニューロン(図面では便宜的
に3×3であるが斜線部はニューロンではない)であ
り、各ニューロンは方向検出層36の対応する各領域3
9〜46の出力を同一のシナプス荷重、例えば1により
重み付けして統合する。さらに入力信号の総和に例えば
線形関数を作用させた結果を出力する。この統合層37
の出力状態が図2(c)、図4(c)、図5(c)であ
る。
【0066】認識部は、統合層37、出力層38の第3
のニューラルネットワークからなる。出力層38のニュ
ーロンは、統合層37の全てのニューロンと結合させ
る。各ニューロンは、シナプス荷重により重み付けされ
た入力信号の総和を求め、総和が最も大きいニューロン
だけが出力する(最大値検出)。
のニューラルネットワークからなる。出力層38のニュ
ーロンは、統合層37の全てのニューロンと結合させ
る。各ニューロンは、シナプス荷重により重み付けされ
た入力信号の総和を求め、総和が最も大きいニューロン
だけが出力する(最大値検出)。
【0067】本実施例では、基本的動作を説明するため
に少ないニューロン数であったが、ニューロン数を増加
し、抽出する特定形状の種類を増加することによって種
々の認識が可能である。また認識部は、統合層及び出力
層の2層であったが、3層以上の構造を用いることも可
能である。
に少ないニューロン数であったが、ニューロン数を増加
し、抽出する特定形状の種類を増加することによって種
々の認識が可能である。また認識部は、統合層及び出力
層の2層であったが、3層以上の構造を用いることも可
能である。
【0068】(実施例2)本実施例では、本発明を手書
き文字認識に応用する場合について説明する。図8は、
本発明の認識装置における特徴抽出部及び認識部を構成
するニューラルネットワークモデルの構成図である。本
実施例のニューラルネットワークは、入力層34、形状
抽出層35、方向検出層36、統合層37、出力層38
からなる。基本的な動作は、実施例1の図7で示したニ
ューラルネットワークと同じである。入力層のマトリッ
クスサイズは例えば60×60ニューロンである。線分
抽出層35は、入力層34と同数個のニューロンを2次
元に配置した縦線分抽出層52、横線分抽出層53、左
斜め線分抽出層54、右斜め線分抽出層55からなる。
各層52〜55では、実施例1で説明した原理に基づ
き、4方向の線分を独立に抽出する。方向検出層36は
各線分間の相対的位置関係を抽出する。それぞれ、領域
24は縦線と縦線、領域25は縦線と横線、領域26は
縦線と左斜め線、領域27は縦線と右斜め線、領域28
は横線と横線、領域29は横線と左斜め線、領域30は
横線と右斜め線、領域31は左斜め線と左斜め線、領域
32は左斜め線と右斜め線、領域33は右斜め線と右斜
め線の相対関係を抽出する。各領域24〜33は、各々
合計8つの小領域に分割される(図8では各領域は3×
3に分割されているが、2行2列目の領域にニューロン
は存在しない)。各小領域は60×60のマトリックス
サイズであり、各ニューロンはある方向の線分1が、あ
る方向の線分2に対して、特定方向に存在する場合にそ
の長さを出力する。
き文字認識に応用する場合について説明する。図8は、
本発明の認識装置における特徴抽出部及び認識部を構成
するニューラルネットワークモデルの構成図である。本
実施例のニューラルネットワークは、入力層34、形状
抽出層35、方向検出層36、統合層37、出力層38
からなる。基本的な動作は、実施例1の図7で示したニ
ューラルネットワークと同じである。入力層のマトリッ
クスサイズは例えば60×60ニューロンである。線分
抽出層35は、入力層34と同数個のニューロンを2次
元に配置した縦線分抽出層52、横線分抽出層53、左
斜め線分抽出層54、右斜め線分抽出層55からなる。
各層52〜55では、実施例1で説明した原理に基づ
き、4方向の線分を独立に抽出する。方向検出層36は
各線分間の相対的位置関係を抽出する。それぞれ、領域
24は縦線と縦線、領域25は縦線と横線、領域26は
縦線と左斜め線、領域27は縦線と右斜め線、領域28
は横線と横線、領域29は横線と左斜め線、領域30は
横線と右斜め線、領域31は左斜め線と左斜め線、領域
32は左斜め線と右斜め線、領域33は右斜め線と右斜
め線の相対関係を抽出する。各領域24〜33は、各々
合計8つの小領域に分割される(図8では各領域は3×
3に分割されているが、2行2列目の領域にニューロン
は存在しない)。各小領域は60×60のマトリックス
サイズであり、各ニューロンはある方向の線分1が、あ
る方向の線分2に対して、特定方向に存在する場合にそ
の長さを出力する。
【0069】例えば、領域25の小領域56中のニュー
ロンは、横線分が縦線分に対して、方向14’(真下方
向)に存在する場合に発火する。同様に、領域32の小
領域57中のニューロンは、右斜め線分が左斜め線分に
対して方向11’(右上部方向)に存在する場合に発火
する。
ロンは、横線分が縦線分に対して、方向14’(真下方
向)に存在する場合に発火する。同様に、領域32の小
領域57中のニューロンは、右斜め線分が左斜め線分に
対して方向11’(右上部方向)に存在する場合に発火
する。
【0070】上記機能を実現するために、例えば小領域
56(マトリックスサイス゛60×60)のi行j列に位置するニュー
ロン56’を、線分抽出層35の次の2種類のニューロ
ンと結合させる(設定1)。 1.縦線分抽出層52(マトリックスサイス゛60×60)のi行j列
に位置するニューロン52’。 2.横線分抽出層53(マトリックスサイス゛60×60)のi行j列
に位置するニューロンを基準として、方向14’(真下
方向)に位置するニューロン群53’(図中の斜線
部)。
56(マトリックスサイス゛60×60)のi行j列に位置するニュー
ロン56’を、線分抽出層35の次の2種類のニューロ
ンと結合させる(設定1)。 1.縦線分抽出層52(マトリックスサイス゛60×60)のi行j列
に位置するニューロン52’。 2.横線分抽出層53(マトリックスサイス゛60×60)のi行j列
に位置するニューロンを基準として、方向14’(真下
方向)に位置するニューロン群53’(図中の斜線
部)。
【0071】このとき、ニューロン52’が発火してお
り(縦線分がi行j列に存在する)、かつニューロン群
53’の中に発火しているニューロンが存在する(横線
分がi行j列のニューロンを基準として方向14’に存
在する)場合に限りニューロン56’は発火する。この
ときの出力強度はニューロン群53’中の発火している
ニューロン数(横線分の長さ)に比例させる(設定
2)。以上の設定1、2、により小領域56中のニュー
ロン56’は入力パターンのi行j列に位置する縦線分
に対して、方向14’に存在する横線分の長さを抽出で
きる。
り(縦線分がi行j列に存在する)、かつニューロン群
53’の中に発火しているニューロンが存在する(横線
分がi行j列のニューロンを基準として方向14’に存
在する)場合に限りニューロン56’は発火する。この
ときの出力強度はニューロン群53’中の発火している
ニューロン数(横線分の長さ)に比例させる(設定
2)。以上の設定1、2、により小領域56中のニュー
ロン56’は入力パターンのi行j列に位置する縦線分
に対して、方向14’に存在する横線分の長さを抽出で
きる。
【0072】同様に、領域32の小領域57(マトリックスサイ
ス゛60×60)のm行n列に位置するニューロン57’を、 1.左斜め線分抽出層54(マトリックスサイス゛60×60)のm行
n列に位置するニューロン54’、 2.右斜め線分抽出層55(マトリックスサイス゛60×60)のm行
n列に位置するニューロンを基準として方向11’に存
在するニューロン群55’(図中の斜線部)と結合させ
る(設定1’)。
ス゛60×60)のm行n列に位置するニューロン57’を、 1.左斜め線分抽出層54(マトリックスサイス゛60×60)のm行
n列に位置するニューロン54’、 2.右斜め線分抽出層55(マトリックスサイス゛60×60)のm行
n列に位置するニューロンを基準として方向11’に存
在するニューロン群55’(図中の斜線部)と結合させ
る(設定1’)。
【0073】このとき、ニューロン54’が発火してお
り(左斜め線分がm行n列に存在する)、かつニューロ
ン群55’の中に発火しているニューロンが存在する
(右斜め線分がm行n列のニューロンを基準として方向
11’に存在する)場合に限りニューロン57’は発火
する。このときの出力強度はニューロン群55’中の発
火しているニューロン数(左斜め線分の長さ)に比例さ
せる(設定2’)。以上の設定1’、2’によりニュー
ロン57’は、m行n列に位置する左斜め線分に対し
て、方向11’に存在する右斜め線分の長さを抽出でき
る。
り(左斜め線分がm行n列に存在する)、かつニューロ
ン群55’の中に発火しているニューロンが存在する
(右斜め線分がm行n列のニューロンを基準として方向
11’に存在する)場合に限りニューロン57’は発火
する。このときの出力強度はニューロン群55’中の発
火しているニューロン数(左斜め線分の長さ)に比例さ
せる(設定2’)。以上の設定1’、2’によりニュー
ロン57’は、m行n列に位置する左斜め線分に対し
て、方向11’に存在する右斜め線分の長さを抽出でき
る。
【0074】統合層37の各ニューロンは方向検出層の
対応する小領域のニューロンの出力を統合する。すなわ
ち、統合層37のニューロン58は方向検出層36の領
域24中の小領域24’(マトリックスサイス゛60×60:縦線分に
対して他の縦線分が方向17’に存在する長さを抽出し
ている)の全てのニューロンと、例えばシナプス荷重1
で結合しており(設定3)、入力信号の総和に比例する
値を出力する(設定4)。従ってニューロン58の出力
は、入力パターン全体で、縦線分に対して方向17’に
存在する縦線分の長さの総和に相当する。
対応する小領域のニューロンの出力を統合する。すなわ
ち、統合層37のニューロン58は方向検出層36の領
域24中の小領域24’(マトリックスサイス゛60×60:縦線分に
対して他の縦線分が方向17’に存在する長さを抽出し
ている)の全てのニューロンと、例えばシナプス荷重1
で結合しており(設定3)、入力信号の総和に比例する
値を出力する(設定4)。従ってニューロン58の出力
は、入力パターン全体で、縦線分に対して方向17’に
存在する縦線分の長さの総和に相当する。
【0075】同様に例えばニューロン59は、方向検出
層36の領域26中の小領域26’(マトリックスサイス゛60×6
0:縦線分に対して左斜め線分が方向14’に存在する
長さを抽出している)の全てのニューロンと結合する。
従ってニューロン59は、入力パターンの縦線分に対し
て、方向14’に存在する左斜め線分の長さの総和を抽
出することになる。
層36の領域26中の小領域26’(マトリックスサイス゛60×6
0:縦線分に対して左斜め線分が方向14’に存在する
長さを抽出している)の全てのニューロンと結合する。
従ってニューロン59は、入力パターンの縦線分に対し
て、方向14’に存在する左斜め線分の長さの総和を抽
出することになる。
【0076】上記設定3、4により統合層37(マトリックス
サイス゛8×10)の出力は各種線分間の相対的位置関係を抽
出する。この線分統合層37の出力状態は、実施例1で
詳細に説明したように、入力パターンの存在位置、大き
さに依存しないものである(ただし、出力の絶対値は大
きさに依存する)。出力層38の各ニューロンは、統合
層37の全てのニューロンと結合し、入力信号の総和が
最大のニューロンだけが出力し、対応する文字が認識結
果となる。
サイス゛8×10)の出力は各種線分間の相対的位置関係を抽
出する。この線分統合層37の出力状態は、実施例1で
詳細に説明したように、入力パターンの存在位置、大き
さに依存しないものである(ただし、出力の絶対値は大
きさに依存する)。出力層38の各ニューロンは、統合
層37の全てのニューロンと結合し、入力信号の総和が
最大のニューロンだけが出力し、対応する文字が認識結
果となる。
【0077】図9及び図10に数字1に対する各部の出
力を示す。各図の(a)はビットイメージ(マトリックスサイス゛
60×60)、(b)は線分抽出層35の出力、(c)は統
合層37の出力を表わしている。各図(b)の52、5
3、54、55は各々縦線分、横線分、左斜め線分(”
/”)、右斜め線分(”\”)抽出結果を表わしてい
る。また各図(c)の24〜33は、各種線分間の相対
的な位置関係を表わしている。すなわち、24は縦線分
と縦線分の相対的な位置関係、25は縦線分と横線分、
26は縦線分と左斜め線分、27は縦線分と右斜め線
分、28は横線分と横線分、29は横線分と左斜め線
分、30は横線分と右斜め線分、31は左斜め線分と左
斜め線分、32は左斜め線分と右斜め線分、33は右斜
め線分と右斜め線分の相対的な位置関係を表わしてい
る。
力を示す。各図の(a)はビットイメージ(マトリックスサイス゛
60×60)、(b)は線分抽出層35の出力、(c)は統
合層37の出力を表わしている。各図(b)の52、5
3、54、55は各々縦線分、横線分、左斜め線分(”
/”)、右斜め線分(”\”)抽出結果を表わしてい
る。また各図(c)の24〜33は、各種線分間の相対
的な位置関係を表わしている。すなわち、24は縦線分
と縦線分の相対的な位置関係、25は縦線分と横線分、
26は縦線分と左斜め線分、27は縦線分と右斜め線
分、28は横線分と横線分、29は横線分と左斜め線
分、30は横線分と右斜め線分、31は左斜め線分と左
斜め線分、32は左斜め線分と右斜め線分、33は右斜
め線分と右斜め線分の相対的な位置関係を表わしてい
る。
【0078】統合層の出力である図9(c)と図10
(c)の出力状態は、大きさ及び存在位置の異なる手書
き数字”1”に対するものであるが非常によく似てい
る。従って本発明の認識装置によれば大きさ、位置ズレ
に影響されない認識を実現できる。
(c)の出力状態は、大きさ及び存在位置の異なる手書
き数字”1”に対するものであるが非常によく似てい
る。従って本発明の認識装置によれば大きさ、位置ズレ
に影響されない認識を実現できる。
【0079】学習は、この統合層37と出力層38の間
のみ実施すればよい。本実施例では直交学習法を用い
て、図11(a)に示す5種類の数字10文字を学習さ
せた。学習後の認識装置に図11(b)に示した未学習
パターンを入力したところ、いずれも正しく認識でき
た。
のみ実施すればよい。本実施例では直交学習法を用い
て、図11(a)に示す5種類の数字10文字を学習さ
せた。学習後の認識装置に図11(b)に示した未学習
パターンを入力したところ、いずれも正しく認識でき
た。
【0080】次に、本発明の一実施例の画像認識方法を
説明する。図15は、画像認識方法の手順を示すフロー
チャートである。以下、各ステップを詳述する。
説明する。図15は、画像認識方法の手順を示すフロー
チャートである。以下、各ステップを詳述する。
【0081】ステップS1:入力(2値化) 認識対象となる文字等の画像は、観測領域(不図示)に
入力される。観測領域は、N×N個の要素を有するマト
リックスによって表される。観測領域に入力された画像
は、以下のルールに基づいて、2値化パターンに変換さ
れる。その2値化パターンもN×N個の要素を有するマ
トリックスであって、各要素は0又は1の値をとるマト
リックスによって表される。
入力される。観測領域は、N×N個の要素を有するマト
リックスによって表される。観測領域に入力された画像
は、以下のルールに基づいて、2値化パターンに変換さ
れる。その2値化パターンもN×N個の要素を有するマ
トリックスであって、各要素は0又は1の値をとるマト
リックスによって表される。
【0082】ルール1:観測領域を表すマトリックスの
各要素は、2値化パターンを表すマトリックスの各要素
に1対1に対応する。
各要素は、2値化パターンを表すマトリックスの各要素
に1対1に対応する。
【0083】ルール2:2値化パターンを表すマトリッ
クスにおいてi行j列に位置する要素をx(i,j)、
それの値をxi,jとする。値xi,jは(数15)によって
決定される。
クスにおいてi行j列に位置する要素をx(i,j)、
それの値をxi,jとする。値xi,jは(数15)によって
決定される。
【0084】
【数15】
【0085】ここで、sijは、観測領域を表すマトリッ
クスにおいてi行j列に位置する要素内に含まれる文字
線分の長さを表す。すなわち、観測領域を表すマトリッ
クスにおいてi行j列に位置する要素が認識対象となる
文字の少なくとも一部を含んでいる場合には、値xi,j
は1となる。その他の場合には、値xi,jは0となる。
クスにおいてi行j列に位置する要素内に含まれる文字
線分の長さを表す。すなわち、観測領域を表すマトリッ
クスにおいてi行j列に位置する要素が認識対象となる
文字の少なくとも一部を含んでいる場合には、値xi,j
は1となる。その他の場合には、値xi,jは0となる。
【0086】このようにして得られる2値化パターン
は、図8の入力層34に入力される。入力層34はN×
N個の要素を有するマトリックスによって表される。入
力層34を表すマトリックスの各要素は、2値化パター
ンを表すマトリックスの各要素に1対1に対応してお
り、2値化パターンを表すマトリックスの各要素の値と
同一の値を出力する。
は、図8の入力層34に入力される。入力層34はN×
N個の要素を有するマトリックスによって表される。入
力層34を表すマトリックスの各要素は、2値化パター
ンを表すマトリックスの各要素に1対1に対応してお
り、2値化パターンを表すマトリックスの各要素の値と
同一の値を出力する。
【0087】ステップS2:線分抽出 入力層34の出力に基づいて、予め決められた複数の形
状が抽出される。ここでは、その予め決められた複数の
形状は、4種類の線分、すなわち、縦線分、横線分、左
斜め線分及び右斜め線分である。他の形状を抽出するこ
とも可能である。 線分lを以下のように定義する。
状が抽出される。ここでは、その予め決められた複数の
形状は、4種類の線分、すなわち、縦線分、横線分、左
斜め線分及び右斜め線分である。他の形状を抽出するこ
とも可能である。 線分lを以下のように定義する。
【0088】線分l:l=1の場合、縦線分 l=2の場合、横線分 l=3の場合、左斜め線分 l=4の場合、右斜め線分 図8の形状抽出層35は、4種類の線分を抽出するため
の線分抽出層52〜55を有している。ここでは、線分
lを抽出するための4つの線分抽出層52〜55をそれ
ぞれUl(l=1、2、3、4)と表す。
の線分抽出層52〜55を有している。ここでは、線分
lを抽出するための4つの線分抽出層52〜55をそれ
ぞれUl(l=1、2、3、4)と表す。
【0089】線分抽出層Ulのそれぞれは、N×N個の
要素を有するマトリックスによって表される。線分抽出
層Ulを表すマトリックスにおいてi行j列に位置する
要素をul(i,j)、それの値をul i,jとする。値ul
i,jは(数16)によって決定される。
要素を有するマトリックスによって表される。線分抽出
層Ulを表すマトリックスにおいてi行j列に位置する
要素をul(i,j)、それの値をul i,jとする。値ul
i,jは(数16)によって決定される。
【0090】
【数16】
【0091】ここで、Φ[・]は出力関数、wl mnは重
み付け係数、Ωlは要素x(i,j)及び要素ul(i,
j)の間の結合を規定する(m,n)の集合を表し、そ
れぞれ(数17)〜(数19)の関係を満たす。
み付け係数、Ωlは要素x(i,j)及び要素ul(i,
j)の間の結合を規定する(m,n)の集合を表し、そ
れぞれ(数17)〜(数19)の関係を満たす。
【0092】
【数17】
【0093】
【数18】
【0094】
【数19】
【0095】上述の入力層34及び線分抽出層Ulの間
の結合を規定する(数18)に示されるように、線分抽
出を効率的に行うためには、wl 0,0=2が最適である。
しかし、出力関数及び出力関数の閾値を調整することに
より、wl 0,0>1を満たす重み付け係数を用いることも
可能である。
の結合を規定する(数18)に示されるように、線分抽
出を効率的に行うためには、wl 0,0=2が最適である。
しかし、出力関数及び出力関数の閾値を調整することに
より、wl 0,0>1を満たす重み付け係数を用いることも
可能である。
【0096】(表1)は、入力層34の出力及び縦線分
を抽出するための線分抽出層U1の出力の間の対応関係
を示す。
を抽出するための線分抽出層U1の出力の間の対応関係
を示す。
【0097】
【表1】
【0098】ここで、wl 0,0=e(>1)である。表1
において、第2欄(a)は、線分抽出層U1の要素u1
i;jが1を出力すべき場合を示し、第3欄(b)は線分
抽出層U1の要素u1 i;jが0を出力べき場合を示す。こ
のような出力を得るためには、(数17)によって規定
される出力関数Φの代わりに、(数20)によって規定
される出力関数Φを用い、その出力関数の閾値θを(数
21)を満たすように与えればよい。出力関数の閾値θ
が(数21)を満たすならば、線分抽出層U1の要素u1
i;jが1を出力すべき場合、閾値θは入力信号の総和ξ
より小さく、かつ、線分抽出層U1の要素u1 i;jが0を
出力すべき場合、閾値θは入力信号の総和ξより大き
い。従って、(数20)によって規定される出力関数Φ
を入力信号の総和ξに適用することにより、縦線分の抽
出を行うことが可能である。同様にして、他の線分を抽
出することも可能である。
において、第2欄(a)は、線分抽出層U1の要素u1
i;jが1を出力すべき場合を示し、第3欄(b)は線分
抽出層U1の要素u1 i;jが0を出力べき場合を示す。こ
のような出力を得るためには、(数17)によって規定
される出力関数Φの代わりに、(数20)によって規定
される出力関数Φを用い、その出力関数の閾値θを(数
21)を満たすように与えればよい。出力関数の閾値θ
が(数21)を満たすならば、線分抽出層U1の要素u1
i;jが1を出力すべき場合、閾値θは入力信号の総和ξ
より小さく、かつ、線分抽出層U1の要素u1 i;jが0を
出力すべき場合、閾値θは入力信号の総和ξより大き
い。従って、(数20)によって規定される出力関数Φ
を入力信号の総和ξに適用することにより、縦線分の抽
出を行うことが可能である。同様にして、他の線分を抽
出することも可能である。
【0099】
【数20】
【0100】
【数21】
【0101】上述した方法以外の方法によって、例え
ば、パターンマッチングの方法によって線分抽出を行う
ことも可能である。以下、図16(a)に示される2値
化された光パターンから図16(b)に示されるマスク
パターンを用いて縦線分を抽出する方法を説明する。図
16において、黒い部分の光量をI、白い部分の光量を
0とする。図16(b)のマスクパターンを図16
(a)の光パターンの左上から順次移動させながら透過
光量が測定される。測定された透過光量が2Iであれば
光パターン上に縦線分が存在することがわかる。他の線
分を抽出する場合には、図16(c)〜(e)に示され
るマスクパターンを用いることにより、同様の手順で線
分抽出を行うことが可能である。
ば、パターンマッチングの方法によって線分抽出を行う
ことも可能である。以下、図16(a)に示される2値
化された光パターンから図16(b)に示されるマスク
パターンを用いて縦線分を抽出する方法を説明する。図
16において、黒い部分の光量をI、白い部分の光量を
0とする。図16(b)のマスクパターンを図16
(a)の光パターンの左上から順次移動させながら透過
光量が測定される。測定された透過光量が2Iであれば
光パターン上に縦線分が存在することがわかる。他の線
分を抽出する場合には、図16(c)〜(e)に示され
るマスクパターンを用いることにより、同様の手順で線
分抽出を行うことが可能である。
【0102】ステップS3:方向抽出 4種類の線分の抽出結果に基づいて、抽出された線分l
の各点を基準として、他の線分l’が存在する方向を表
す第1の特徴量が抽出される。
の各点を基準として、他の線分l’が存在する方向を表
す第1の特徴量が抽出される。
【0103】4種類の線分lの内、相異なる2種類の線
分を選ぶ組み合わせは6通りである。図8の方向抽出層
36は、線分lに対して他の線分l’の相対的な位置関
係を抽出するための少なくとも6個の領域を有してい
る。これらの領域をそれぞれD l->l'と表す。ここで
は、簡単のため、線分lに対して同一の線分lの相対的
な位置関係は考慮しないものとする。例えば、縦線分
(l=1)を基準として、横線分(l=2)が存在する
方向を表す特徴量を抽出するための領域はD1->2と表さ
れ、横線分(l=2)を基準として、左斜め線分(l=
3)が存在する方向を表す特徴量を抽出するための領域
はD2->3と表される。
分を選ぶ組み合わせは6通りである。図8の方向抽出層
36は、線分lに対して他の線分l’の相対的な位置関
係を抽出するための少なくとも6個の領域を有してい
る。これらの領域をそれぞれD l->l'と表す。ここで
は、簡単のため、線分lに対して同一の線分lの相対的
な位置関係は考慮しないものとする。例えば、縦線分
(l=1)を基準として、横線分(l=2)が存在する
方向を表す特徴量を抽出するための領域はD1->2と表さ
れ、横線分(l=2)を基準として、左斜め線分(l=
3)が存在する方向を表す特徴量を抽出するための領域
はD2->3と表される。
【0104】方向抽出層36の領域Dl->l'は、8個の
領域dl->l'(k)をそれぞれ有している。ここで、k
は特定の方向を表すパラメータであり、k=1〜8はそ
れぞれ図3に示される方向10’〜17’に対応する。
例えば、領域D1->2は8個の領域d1->2(k)(k=1
〜8)を有している。
領域dl->l'(k)をそれぞれ有している。ここで、k
は特定の方向を表すパラメータであり、k=1〜8はそ
れぞれ図3に示される方向10’〜17’に対応する。
例えば、領域D1->2は8個の領域d1->2(k)(k=1
〜8)を有している。
【0105】領域dl->l'(k)のそれぞれは、N×N
個の要素を有するマトリックスによって表される。領域
dl->l'(k)を表すマトリックスにおいてi行j列に
位置する要素をdl->l' k(i,j)、それの値をd
l->l' k,i,jとする。値dl->l' k,i ,jは、線分抽出層Ul
における線分l上に位置する各要素ul(i,j)を基
準として、方向kに存在する他の線分l’の長さを表す
ように、(数22)に示すように規定される。(数2
2)は、線分抽出層Ul及びUl'と方向抽出層36の領
域Dl->l'との間の結合を規定する。
個の要素を有するマトリックスによって表される。領域
dl->l'(k)を表すマトリックスにおいてi行j列に
位置する要素をdl->l' k(i,j)、それの値をd
l->l' k,i,jとする。値dl->l' k,i ,jは、線分抽出層Ul
における線分l上に位置する各要素ul(i,j)を基
準として、方向kに存在する他の線分l’の長さを表す
ように、(数22)に示すように規定される。(数2
2)は、線分抽出層Ul及びUl'と方向抽出層36の領
域Dl->l'との間の結合を規定する。
【0106】
【数22】
【0107】ここで、Ωkは領域dl->l'(k)と線分抽
出層Ul及びUl'との間の結合を規定する(m,n)の
集合である。(m,n)は、線分抽出層Ul'において要
素u l'(i,j)を基準点とした場合のその基準点から
みて方向kに存在する要素の相対座標を表す。また、w
k(i,j)p,qは重み付け係数を表す。wk(i,j)
p,qは、線分抽出層Ul'においてp行q列に位置する要
素ul'(p,q)がi行j列に位置する要素ul'(i,
j)に対して方向kに位置する場合には1となり、その
他の場合には0となる係数である。
出層Ul及びUl'との間の結合を規定する(m,n)の
集合である。(m,n)は、線分抽出層Ul'において要
素u l'(i,j)を基準点とした場合のその基準点から
みて方向kに存在する要素の相対座標を表す。また、w
k(i,j)p,qは重み付け係数を表す。wk(i,j)
p,qは、線分抽出層Ul'においてp行q列に位置する要
素ul'(p,q)がi行j列に位置する要素ul'(i,
j)に対して方向kに位置する場合には1となり、その
他の場合には0となる係数である。
【0108】線分lに対して他の線分l’が存在する方
向の種類は8に限られない。例えば、図3に示される円
の分割数を16にして、16個の方向を定義することも
可能である。この場合、それらの方向k=1〜16に応
じて、方向抽出層36の領域Dl->l'が16個の領域d
l->l'(k)をそれぞれ有するようにすればよい。
向の種類は8に限られない。例えば、図3に示される円
の分割数を16にして、16個の方向を定義することも
可能である。この場合、それらの方向k=1〜16に応
じて、方向抽出層36の領域Dl->l'が16個の領域d
l->l'(k)をそれぞれ有するようにすればよい。
【0109】ステップS4:長さ抽出 ステップS3で抽出された第1の特徴量に基づいて、線
分lを基準として、方向kに存在する他の線分l’の長
さを表す第2の特徴量が抽出される。
分lを基準として、方向kに存在する他の線分l’の長
さを表す第2の特徴量が抽出される。
【0110】図8の統合層37は少なくとも6個の領域
を有している。これらの領域をそれぞれRl->l'と表
す。領域Rl->l'は、8個のニューロンrl->l'(k)を
それぞれ有している。ここで、kは特定の方向を表すパ
ラメータであり、k=1〜8はそれぞれ図3に示される
方向10’〜17’に対応する。例えば、領域R1->2は
8個のニューロンr1->2(k)(k=1〜8)を有して
いる。
を有している。これらの領域をそれぞれRl->l'と表
す。領域Rl->l'は、8個のニューロンrl->l'(k)を
それぞれ有している。ここで、kは特定の方向を表すパ
ラメータであり、k=1〜8はそれぞれ図3に示される
方向10’〜17’に対応する。例えば、領域R1->2は
8個のニューロンr1->2(k)(k=1〜8)を有して
いる。
【0111】ニューロンrl->l'(k)の値をrl->l' k
とする。値rl->l' kは、線分lを基準として、方向kに
存在する線分l’の長さを表すように、(数23)に示
すように規定される。(数23)は、方向抽出層36の
領域Dl->l'と統合層37の領域Rl->l'との間の結合を
規定する。
とする。値rl->l' kは、線分lを基準として、方向kに
存在する線分l’の長さを表すように、(数23)に示
すように規定される。(数23)は、方向抽出層36の
領域Dl->l'と統合層37の領域Rl->l'との間の結合を
規定する。
【0112】
【数23】
【0113】あるいは、(数23)の代わりに、(数2
4)を用いてもよい。(数24)は(数23)の右辺に
示される総和に出力関数fを作用させたものである。出
力関数f[・]としては、シグモイド関数などが一般的
に用いられる。(数23)は(数24)の出力関数fと
して線形関数(y=x)を用いた例に他ならない。
4)を用いてもよい。(数24)は(数23)の右辺に
示される総和に出力関数fを作用させたものである。出
力関数f[・]としては、シグモイド関数などが一般的
に用いられる。(数23)は(数24)の出力関数fと
して線形関数(y=x)を用いた例に他ならない。
【0114】
【数24】
【0115】ステップS5:認識 統合層37の各領域Rl->l'の出力に基づいて、入力文
字が識別される。例えば、アルファベットの26文字を
識別させるためには、出力層38が少なくとも26個の
ニューロンを有していればよい。出力層38のニューロ
ンをy(j)、それの値をyjとする。値yjは、(数2
5)に示すように規定される。(数25)は、統合層3
7の領域Rl->l'と出力層38との間の結合を規定す
る。
字が識別される。例えば、アルファベットの26文字を
識別させるためには、出力層38が少なくとも26個の
ニューロンを有していればよい。出力層38のニューロ
ンをy(j)、それの値をyjとする。値yjは、(数2
5)に示すように規定される。(数25)は、統合層3
7の領域Rl->l'と出力層38との間の結合を規定す
る。
【0116】
【数25】
【0117】ここで、δjは統合層37の領域Rl->l'か
らの入力信号の総和を表す。δjは(数26)に示すよ
うに規定される。また、wl->l' jkはシナプス荷重、f
max{δj}は、総和δjを比較し、総和δjが最大となる
要素の出力を1とし、他の要素の出力を0とする演算子
を表す。このシナプス荷重wl->l' jkは、学習により改
変され得る。直交学習法を用いて学習を行うことが好ま
しい。
らの入力信号の総和を表す。δjは(数26)に示すよ
うに規定される。また、wl->l' jkはシナプス荷重、f
max{δj}は、総和δjを比較し、総和δjが最大となる
要素の出力を1とし、他の要素の出力を0とする演算子
を表す。このシナプス荷重wl->l' jkは、学習により改
変され得る。直交学習法を用いて学習を行うことが好ま
しい。
【0118】
【数26】
【0119】入力画像から領域Rl->l'におけるニュー
ロンrl->l'(k)の出力を得るまでの処理を画像認識
のための前処理(特徴抽出処理)と考えると、認識部3
は統合層37及び出力層38の2層からなるいわゆるパ
ーセプトロンとみなすことができる。ニューロンr
l->l'(k)の出力を3層以上の階層型ニューラルネッ
トワークによって処理することにより、画像認識を行う
ことも可能である。この場合、いわゆる誤差伝搬学習法
を用いて学習を行うことが好ましい。
ロンrl->l'(k)の出力を得るまでの処理を画像認識
のための前処理(特徴抽出処理)と考えると、認識部3
は統合層37及び出力層38の2層からなるいわゆるパ
ーセプトロンとみなすことができる。ニューロンr
l->l'(k)の出力を3層以上の階層型ニューラルネッ
トワークによって処理することにより、画像認識を行う
ことも可能である。この場合、いわゆる誤差伝搬学習法
を用いて学習を行うことが好ましい。
【0120】次に、上述のシナプス荷重wl->l' jkを効
率よく改変するための学習方法を説明する。
率よく改変するための学習方法を説明する。
【0121】(数27)は、直交学習法を用いて学習を
行う場合のシナプス荷重の遷移を示す。
行う場合のシナプス荷重の遷移を示す。
【0122】
【数27】
【0123】ここで、wl->l'(t)jkはt回学習後の
領域Rl->l'におけるニューロンrl- >l'(k)と出力層
38のニューロンy(j)との間の結合に関するシナプ
ス荷重、αは学習ゲイン、tjは教師信号を表す。教師
信号とは、ある画像が入力された場合にニューロンy
(j)が出力すべき期待値をいう。
領域Rl->l'におけるニューロンrl- >l'(k)と出力層
38のニューロンy(j)との間の結合に関するシナプ
ス荷重、αは学習ゲイン、tjは教師信号を表す。教師
信号とは、ある画像が入力された場合にニューロンy
(j)が出力すべき期待値をいう。
【0124】例えば、26個のアルファベットを学習さ
せる場合には、予め用意された異なる数種類の文字を順
次学習させ、すべての文字を正しく認識できた時点で、
学習を終了させる。学習回数は以下のように規定され
る。学習のために予め用意された各文字を1回ずつすべ
ての文字について学習させた場合に、学習回数は1回と
カウントされる。
せる場合には、予め用意された異なる数種類の文字を順
次学習させ、すべての文字を正しく認識できた時点で、
学習を終了させる。学習回数は以下のように規定され
る。学習のために予め用意された各文字を1回ずつすべ
ての文字について学習させた場合に、学習回数は1回と
カウントされる。
【0125】しかしながら、(数27)に基づく学習
は、学習させる文字の大きさが異なっている場合には学
習収束性が悪い、すなわち、すべての文字を正しく認識
するまでに多くの学習回数を要するという問題点を有し
ていた。この原因は以下のように考えられる。(数2
7)の右辺第2項はシナプス荷重の修正量を表してい
る。(数27)から明らかなように、1回の学習につ
き、値rl->l' kに比例した修正を行うことになる。上述
したように、値rl->l' kは入力画像における線分lを基
準として方向kに位置する線分l’の長さを表してい
る。入力される文字の大きさが大きくなると、各線分の
長さは当然長くなる。その結果、値rl->l' kの絶対値も
大きくなる。このように、1文字当たりのシナプス荷重
の修正量が入力される文字の大きさに依存してしまうの
で、異なる大きさの文字が混在した複数の文字を学習さ
せる場合に、学習収束性が悪くなるおそれがあった。
は、学習させる文字の大きさが異なっている場合には学
習収束性が悪い、すなわち、すべての文字を正しく認識
するまでに多くの学習回数を要するという問題点を有し
ていた。この原因は以下のように考えられる。(数2
7)の右辺第2項はシナプス荷重の修正量を表してい
る。(数27)から明らかなように、1回の学習につ
き、値rl->l' kに比例した修正を行うことになる。上述
したように、値rl->l' kは入力画像における線分lを基
準として方向kに位置する線分l’の長さを表してい
る。入力される文字の大きさが大きくなると、各線分の
長さは当然長くなる。その結果、値rl->l' kの絶対値も
大きくなる。このように、1文字当たりのシナプス荷重
の修正量が入力される文字の大きさに依存してしまうの
で、異なる大きさの文字が混在した複数の文字を学習さ
せる場合に、学習収束性が悪くなるおそれがあった。
【0126】上記の問題点を解決する方法を以下に説明
する。値rl->l' kを正規化することにより、大きさが不
均一な文字を学習させる場合の学習収束性が大幅に改善
されることが分かった。正規化の方法としては、以下に
示す2とおりの方法が考えられる。 (1)領域Rl->l'におけるすべてのニューロンrl->l'
(k)の出力の総和を用いてそれの出力を正規化する方
法。この方法によれば、正規化された値rl->l' n orm,k
は(数28)に示すようにして求められる。 (2)領域Rl->l'におけるニューロンrl->l'(k)の
出力の内、最大値を用いてそれの出力を正規化する方
法。この方法によれば、正規化された値rl->l' nor m,k
は(数29)に示すようにして求められる。
する。値rl->l' kを正規化することにより、大きさが不
均一な文字を学習させる場合の学習収束性が大幅に改善
されることが分かった。正規化の方法としては、以下に
示す2とおりの方法が考えられる。 (1)領域Rl->l'におけるすべてのニューロンrl->l'
(k)の出力の総和を用いてそれの出力を正規化する方
法。この方法によれば、正規化された値rl->l' n orm,k
は(数28)に示すようにして求められる。 (2)領域Rl->l'におけるニューロンrl->l'(k)の
出力の内、最大値を用いてそれの出力を正規化する方
法。この方法によれば、正規化された値rl->l' nor m,k
は(数29)に示すようにして求められる。
【0127】
【数28】
【0128】
【数29】
【0129】従って、学習式(数27)は、(数30)
によって置き換えられ得る。
によって置き換えられ得る。
【0130】
【数30】
【0131】(表2)は、学習式(数30)に基づいて
学習を行った場合の学習収束性の結果を示す。表2に示
されるように、正規化された値rl->l' norm,kを用いる
ことにより、学習収束性が大幅に改善されることが確認
された。このように、正規化は高速学習に極めて有効で
ある。
学習を行った場合の学習収束性の結果を示す。表2に示
されるように、正規化された値rl->l' norm,kを用いる
ことにより、学習収束性が大幅に改善されることが確認
された。このように、正規化は高速学習に極めて有効で
ある。
【0132】
【表2】
【0133】図17(a)〜(d)は、文字「J」が入
力された場合の入力層34、形状抽出層35、方向抽出
層36、及び統合層37のそれぞれの出力の具体例を示
している。図中、空白の部分は要素の値が0であること
を示す。以下、方向抽出層36の各領域Dl->l'に示さ
れている値の意味を説明する。例えば、図17(c)に
示されるように、領域D1->2の領域d1->2(8)の3行
4列に位置する要素の値は2となっている。これは、線
分抽出層U1の3行4列に位置する要素を基準として、
左上方向(k=8)に存在する横線分の要素の数が2個
だからである。この場合、その2個の要素とは、線分抽
出層U2の2行2列に位置する要素及び2行3列に位置
する要素である。同様にして、線分抽出層U1の4行4
列に位置する要素を基準として、左上方向(k=8)に
存在する横線分の要素の数が2個であるので、領域D
1->2の領域d1->2(8)の4行4列に位置する要素の値
は2、線分抽出層U1の5行4列に位置する要素を基準
として、左上方向(k=8)に存在する横線分の要素の
数が1個であるので、領域D1->2の領域d1->2(8)の
5行4列に位置する要素の値は1となっている。図17
(d)に示されるように、領域D1->2の領域d
1->2(8)の要素の値の総和(2+2+1=5)は、統
合層37の領域R1->2の1行1列に現れる。これは、領
域dl->l'(k)の要素の値の総和が要素rl->l'(k)
の値となるように、領域dl->l'(k)と領域R l->l'と
が結合されているからである。
力された場合の入力層34、形状抽出層35、方向抽出
層36、及び統合層37のそれぞれの出力の具体例を示
している。図中、空白の部分は要素の値が0であること
を示す。以下、方向抽出層36の各領域Dl->l'に示さ
れている値の意味を説明する。例えば、図17(c)に
示されるように、領域D1->2の領域d1->2(8)の3行
4列に位置する要素の値は2となっている。これは、線
分抽出層U1の3行4列に位置する要素を基準として、
左上方向(k=8)に存在する横線分の要素の数が2個
だからである。この場合、その2個の要素とは、線分抽
出層U2の2行2列に位置する要素及び2行3列に位置
する要素である。同様にして、線分抽出層U1の4行4
列に位置する要素を基準として、左上方向(k=8)に
存在する横線分の要素の数が2個であるので、領域D
1->2の領域d1->2(8)の4行4列に位置する要素の値
は2、線分抽出層U1の5行4列に位置する要素を基準
として、左上方向(k=8)に存在する横線分の要素の
数が1個であるので、領域D1->2の領域d1->2(8)の
5行4列に位置する要素の値は1となっている。図17
(d)に示されるように、領域D1->2の領域d
1->2(8)の要素の値の総和(2+2+1=5)は、統
合層37の領域R1->2の1行1列に現れる。これは、領
域dl->l'(k)の要素の値の総和が要素rl->l'(k)
の値となるように、領域dl->l'(k)と領域R l->l'と
が結合されているからである。
【0134】以下、線分抽出を実行するための特徴抽出
光ニューロン素子(Feature Extracting Optical Neuron
Device)を説明する。
光ニューロン素子(Feature Extracting Optical Neuron
Device)を説明する。
【0135】図18は、特徴抽出光ニューロン素子の断
面を示す。この素子は、透明電極を有する2枚のガラス
基板、それらのガラス基板によって挟まれた光導電層、
及び光変調層を備えている。また、光導電層と光変調層
との間に、ニューロン電極が設けられている。光導電層
は、厚さ約1.7μmのアモルファスシリコン(a-Si:H)
からなり、光変調層は、セルギャップが約1μmの強誘
電性液晶(FLC)からなる。ニューロン電極は、厚さ約5
00オングストロームのアルミニウム薄膜からなる。
面を示す。この素子は、透明電極を有する2枚のガラス
基板、それらのガラス基板によって挟まれた光導電層、
及び光変調層を備えている。また、光導電層と光変調層
との間に、ニューロン電極が設けられている。光導電層
は、厚さ約1.7μmのアモルファスシリコン(a-Si:H)
からなり、光変調層は、セルギャップが約1μmの強誘
電性液晶(FLC)からなる。ニューロン電極は、厚さ約5
00オングストロームのアルミニウム薄膜からなる。
【0136】特徴抽出光ニューロン素子は、基本動作と
して光和算と閾値処理とを実行する。以下にその基本動
作の概略を示す。 (1)光導電層側から書き込み光が入射されると、その
書き込み光の強度に正確に比例した光電流が光導電層内
に発生する。書き込み光は、通常2次元の強度分布を有
しているので、発生した光電流も2次元の強度分布を有
している。 (2)発生した光電流はニューロン電極毎に集められ、
集められた光電流の総和が計算される(光和算の実
行)。 (3)集められた光電流の総和が、所定の閾値を越える
と、光変調層の強誘電性液晶がスイッチングする(閾値
処理)。その結果、読み出し光が光変調層により変調さ
れる。
して光和算と閾値処理とを実行する。以下にその基本動
作の概略を示す。 (1)光導電層側から書き込み光が入射されると、その
書き込み光の強度に正確に比例した光電流が光導電層内
に発生する。書き込み光は、通常2次元の強度分布を有
しているので、発生した光電流も2次元の強度分布を有
している。 (2)発生した光電流はニューロン電極毎に集められ、
集められた光電流の総和が計算される(光和算の実
行)。 (3)集められた光電流の総和が、所定の閾値を越える
と、光変調層の強誘電性液晶がスイッチングする(閾値
処理)。その結果、読み出し光が光変調層により変調さ
れる。
【0137】次に、特徴抽出光ニューロン素子を用いた
読み出し光学系についてその動作を簡単に説明する。書
き込み光が2次元の強度分布を有する光パターンである
のに対し、読み出し光は面光源からの均質な白色光であ
る。読み出し光は、偏光子(不図示)を介して直線偏光
に変換され、光変調層側から本素子に入射される。光変
調層を通過した読み出し光はニューロン電極により反射
され、再び光変調層を通過する。このとき、光変調層が
スイッチングしている場合には、読み出し光の偏光方向
は90度回転する。光変調層がスイッチングしていない
場合には、読み出し光の偏光方向は変化しない。本素子
から出力された読み出し光は、ビームスプリッタ(不図
示)を介して、偏光子と直交する偏光軸を有する検光子
(不図示)に入力される。その結果、本素子から出力さ
れた読み出し光の内、光変調層がスイッチングしていた
部分に対応する読み出し光のみが検光子を通過する。光
変調層に用いられる強誘電性液晶の高速応答性により、
毎秒3000パターン以上の処理が可能である。
読み出し光学系についてその動作を簡単に説明する。書
き込み光が2次元の強度分布を有する光パターンである
のに対し、読み出し光は面光源からの均質な白色光であ
る。読み出し光は、偏光子(不図示)を介して直線偏光
に変換され、光変調層側から本素子に入射される。光変
調層を通過した読み出し光はニューロン電極により反射
され、再び光変調層を通過する。このとき、光変調層が
スイッチングしている場合には、読み出し光の偏光方向
は90度回転する。光変調層がスイッチングしていない
場合には、読み出し光の偏光方向は変化しない。本素子
から出力された読み出し光は、ビームスプリッタ(不図
示)を介して、偏光子と直交する偏光軸を有する検光子
(不図示)に入力される。その結果、本素子から出力さ
れた読み出し光の内、光変調層がスイッチングしていた
部分に対応する読み出し光のみが検光子を通過する。光
変調層に用いられる強誘電性液晶の高速応答性により、
毎秒3000パターン以上の処理が可能である。
【0138】次に、特徴抽出光ニューロン素子によって
実行される線分抽出の原理を説明する。ニューロン電極
の形状は、書き込み光について光和算を実行するための
領域を規定する。
実行される線分抽出の原理を説明する。ニューロン電極
の形状は、書き込み光について光和算を実行するための
領域を規定する。
【0139】図19(a)は、「縦」線分を抽出するた
めのニューロン電極の形状、及びその配置を示す。破線
で囲まれた領域が1つのニューロンに相当する。1つの
ニューロン電極は、縦方向に並ぶ2つのニューロンにま
たがり、かつ、そのニューロン電極の面積が対応する各
ニューロンよってほぼ二分されるように配置される。入
力パターンは、図19(b)に示されるように、8×8
個の画素から構成される2値化パターンである。各画素
の値は0又は1のいずれかである。この入力パターン
は、図19(a)に示される破線で囲まれた1つのニュ
ーロンに1つの画素が対応するように光導電層側から入
力される。ここで、1個のニューロン電極を二分した面
積をS、入力パターンにおける”1”の画素の光強度を
I、及び入力パターンにおける”0”の画素の光強度を
0とする。「縦」線分が存在する場合には、縦方向に並
ぶ2つの画素が同時に”1”を出力するので、それらの
画素に対応するニューロン電極には、合計2SIの光量
に相当する光電流が集められる。これに対し、縦方向に
並ぶ2つの画素の内、一方の画素のみが”1”を出力
し、他方の画素が”0”を出力した場合には、それらの
画素に対応するニューロン電極には、SIの光量に相当
する光電流しか集められない。従って、特徴抽出光ニュ
ーロン素子の閾値θに対して、SI<θ<2SIの関係
を満たすように入力パターンの光強度Iを調整すれば、
「縦」線分が存在する場合に限り、光変調層はオフ状態
からオン状態に変化する。
めのニューロン電極の形状、及びその配置を示す。破線
で囲まれた領域が1つのニューロンに相当する。1つの
ニューロン電極は、縦方向に並ぶ2つのニューロンにま
たがり、かつ、そのニューロン電極の面積が対応する各
ニューロンよってほぼ二分されるように配置される。入
力パターンは、図19(b)に示されるように、8×8
個の画素から構成される2値化パターンである。各画素
の値は0又は1のいずれかである。この入力パターン
は、図19(a)に示される破線で囲まれた1つのニュ
ーロンに1つの画素が対応するように光導電層側から入
力される。ここで、1個のニューロン電極を二分した面
積をS、入力パターンにおける”1”の画素の光強度を
I、及び入力パターンにおける”0”の画素の光強度を
0とする。「縦」線分が存在する場合には、縦方向に並
ぶ2つの画素が同時に”1”を出力するので、それらの
画素に対応するニューロン電極には、合計2SIの光量
に相当する光電流が集められる。これに対し、縦方向に
並ぶ2つの画素の内、一方の画素のみが”1”を出力
し、他方の画素が”0”を出力した場合には、それらの
画素に対応するニューロン電極には、SIの光量に相当
する光電流しか集められない。従って、特徴抽出光ニュ
ーロン素子の閾値θに対して、SI<θ<2SIの関係
を満たすように入力パターンの光強度Iを調整すれば、
「縦」線分が存在する場合に限り、光変調層はオフ状態
からオン状態に変化する。
【0140】図19(c)は、上記の原理に基づいて図
19(b)の入力パターンから「縦」線分を抽出した実
験結果を示す。
19(b)の入力パターンから「縦」線分を抽出した実
験結果を示す。
【0141】「横」、「左斜め」、及び「右斜め」方向
の線分も上述した原理と同じ原理に基づいて抽出される
ことが可能である。
の線分も上述した原理と同じ原理に基づいて抽出される
ことが可能である。
【0142】図20は、「縦」、「横」、「左斜め」、
及び「右斜め」方向の線分を抽出するための4つの線分
抽出面を有する特徴抽出光ニューロン素子を示す。図2
0に示されるように、「左斜め」及び「右斜め」方向の
線分を抽出するための線分抽出面においては、ニューロ
ン電極の形状は、面積Sを有する単位電極が、面積が無
視できる程度の微小電極により斜め方向に結合された形
状となっている。入力パターンに含まれる4方向の線分
を同時にかつ独立して抽出するためには、例えば、1つ
の入力パターンをレンズアレイ(不図示)を用いて4つ
の入力パターンに多重展開し、多重展開された入力パタ
ーンのそれぞれを4つの線分抽出面のそれぞれに同時に
入力すればよい。図19(b)に示される入力パターン
を各線分抽出面に同時に入力した場合の出力結果を図2
1に示す。入力パターン「A」に含まれる線分が方向別
に抽出されていることがわかる。
及び「右斜め」方向の線分を抽出するための4つの線分
抽出面を有する特徴抽出光ニューロン素子を示す。図2
0に示されるように、「左斜め」及び「右斜め」方向の
線分を抽出するための線分抽出面においては、ニューロ
ン電極の形状は、面積Sを有する単位電極が、面積が無
視できる程度の微小電極により斜め方向に結合された形
状となっている。入力パターンに含まれる4方向の線分
を同時にかつ独立して抽出するためには、例えば、1つ
の入力パターンをレンズアレイ(不図示)を用いて4つ
の入力パターンに多重展開し、多重展開された入力パタ
ーンのそれぞれを4つの線分抽出面のそれぞれに同時に
入力すればよい。図19(b)に示される入力パターン
を各線分抽出面に同時に入力した場合の出力結果を図2
1に示す。入力パターン「A」に含まれる線分が方向別
に抽出されていることがわかる。
【0143】図22は、1個のニューロン電極に光信号
を与えた場合の出力特性を示す。図22は、入力光量が
2μWを越えると、光変調層の強誘電性液晶がオフ状態
からオン状態に変化する急峻な閾値特性を示している。
これにより、本素子が上述した閾値条件(SI<θ<2
SI)を満たすための十分な出力特性を有していること
がわかる。
を与えた場合の出力特性を示す。図22は、入力光量が
2μWを越えると、光変調層の強誘電性液晶がオフ状態
からオン状態に変化する急峻な閾値特性を示している。
これにより、本素子が上述した閾値条件(SI<θ<2
SI)を満たすための十分な出力特性を有していること
がわかる。
【0144】以下、方向抽出及び長さ抽出を実行するた
めの光システムの原理を説明する。図23は、光システ
ムの構成を示す。この光システムは、光源(不図示)、
3枚の透過型液晶テレビLCTV1〜3、及び受光デバ
イス(不図示)を備えている。光源から出射された光
は、透過型液晶テレビLCTV1〜3を介して受光デバ
イスに達する。以下に、透過型液晶テレビLCTV1〜
3の機能を説明する。
めの光システムの原理を説明する。図23は、光システ
ムの構成を示す。この光システムは、光源(不図示)、
3枚の透過型液晶テレビLCTV1〜3、及び受光デバ
イス(不図示)を備えている。光源から出射された光
は、透過型液晶テレビLCTV1〜3を介して受光デバ
イスに達する。以下に、透過型液晶テレビLCTV1〜
3の機能を説明する。
【0145】LCTV1:線分抽出層Ulをの出力を表
示するための透過型液晶テレビである。従って、LCT
V1は、N×N個の要素を有するマトリックスによって
表現され、2値化パターンから線分lを抽出した結果を
表示する。
示するための透過型液晶テレビである。従って、LCT
V1は、N×N個の要素を有するマトリックスによって
表現され、2値化パターンから線分lを抽出した結果を
表示する。
【0146】LCTV2:(数22)における係数wk
(i,j)p,qを表示するための透過型液晶テレビであ
る。LCTV2は、N×N個の領域に分割され、さらに
各領域はN×N個の要素を有するマトリックスによって
表現される。すなわち、LCTV2は、N2×N2個の要
素を有するマトリックスによって表現される。LCTV
2においてi行j列に位置する領域は、線分抽出層Ul
の要素ul(i,j)に対応し、その領域に含まれるN
×N個の要素の内、その領域においてi行j列に位置す
る要素を基準として特定の方向kに存在する要素は1を
出力し、その領域においてi行j列に位置する要素を基
準として特定の方向kに存在しない要素は0を出力す
る。
(i,j)p,qを表示するための透過型液晶テレビであ
る。LCTV2は、N×N個の領域に分割され、さらに
各領域はN×N個の要素を有するマトリックスによって
表現される。すなわち、LCTV2は、N2×N2個の要
素を有するマトリックスによって表現される。LCTV
2においてi行j列に位置する領域は、線分抽出層Ul
の要素ul(i,j)に対応し、その領域に含まれるN
×N個の要素の内、その領域においてi行j列に位置す
る要素を基準として特定の方向kに存在する要素は1を
出力し、その領域においてi行j列に位置する要素を基
準として特定の方向kに存在しない要素は0を出力す
る。
【0147】LCTV3:線分抽出層Ul'の多重像を表
示するための透過型液晶テレビである。LCTV3は、
N×N個の領域に分割され、さらに各領域はN×N個の
要素を有するマトリックスによって表現される。すなわ
ち、LCTV3もLCTV2と同様に、N2×N2個の要
素を有するマトリックスによって表現される。各領域は
線分抽出層Ul'の出力を表示する。従って、LCTV3
全体では、線分抽出層Ul'の出力をN×N個多重展開し
たパターンを表示することになる。
示するための透過型液晶テレビである。LCTV3は、
N×N個の領域に分割され、さらに各領域はN×N個の
要素を有するマトリックスによって表現される。すなわ
ち、LCTV3もLCTV2と同様に、N2×N2個の要
素を有するマトリックスによって表現される。各領域は
線分抽出層Ul'の出力を表示する。従って、LCTV3
全体では、線分抽出層Ul'の出力をN×N個多重展開し
たパターンを表示することになる。
【0148】LCTV2においてi行j列に位置する領
域とLCTV3においてi行j列に位置する領域とを重
ね合わせることにより、wk(i,j)p,q*u
l' p,q(対応する要素毎の積:アダマール積)が得られ
る。従って、これらの積を領域毎に和算した結果は、w
k(i,j)p,q*ul' p,qの総和と一致する。
域とLCTV3においてi行j列に位置する領域とを重
ね合わせることにより、wk(i,j)p,q*u
l' p,q(対応する要素毎の積:アダマール積)が得られ
る。従って、これらの積を領域毎に和算した結果は、w
k(i,j)p,q*ul' p,qの総和と一致する。
【0149】LCTV1においてi行j列に位置する要
素とLCTV2及び3の対応する領域とを重ね合わせる
ことにより、ul ijとwk(i,j)p,q*ul' p,qとの積
演算が実行される。LCTV1〜3を重ね合わせた結果
を、領域毎に和算することにより、dl->l' k,i,jが得ら
れる。(数23)に示すように、i及びjについて和算
することにより、rl->l' kが得られる。
素とLCTV2及び3の対応する領域とを重ね合わせる
ことにより、ul ijとwk(i,j)p,q*ul' p,qとの積
演算が実行される。LCTV1〜3を重ね合わせた結果
を、領域毎に和算することにより、dl->l' k,i,jが得ら
れる。(数23)に示すように、i及びjについて和算
することにより、rl->l' kが得られる。
【0150】他の方向k’について、dl->l' k',i,j、
rl->l' k'を得るためには、LCTV2に表示される係
数をwk'(i,j)p,qに書き換えればよい。
rl->l' k'を得るためには、LCTV2に表示される係
数をwk'(i,j)p,qに書き換えればよい。
【0151】例えば、図23を参照して、5行4列に存
在する縦線分を基準として方向k=1(上方向)に存在
する横線分を抽出する場合を考える。LTCV1の5行
4列に位置する要素231は1を出力する。LTCV2
の5行4列に位置する領域232において、その領域の
5行4列に位置する要素を基準として上方向に存在する
要素は1を出力し、その他の要素は0を出力する。LT
CV3の5行4列に位置する領域233の各要素は、線
分抽出層Ul'の要素と同じ値を出力する。図中、黒い部
分は値1を出力する要素を表わし、白い部分は値0を出
力する要素を表わす。要素231、領域232、及び領
域233を重ね合わせることにより、領域234が得ら
れる。この重ね合わせ演算は、対応する要素の値がすべ
て1の場合、演算結果が1となり、その他の場合、演算
結果が0となるように実行される。領域234において
値1を出力する要素の数はd1->2 1,5,4の値に等しい。
従って、d1->2 1,5,4=3である。
在する縦線分を基準として方向k=1(上方向)に存在
する横線分を抽出する場合を考える。LTCV1の5行
4列に位置する要素231は1を出力する。LTCV2
の5行4列に位置する領域232において、その領域の
5行4列に位置する要素を基準として上方向に存在する
要素は1を出力し、その他の要素は0を出力する。LT
CV3の5行4列に位置する領域233の各要素は、線
分抽出層Ul'の要素と同じ値を出力する。図中、黒い部
分は値1を出力する要素を表わし、白い部分は値0を出
力する要素を表わす。要素231、領域232、及び領
域233を重ね合わせることにより、領域234が得ら
れる。この重ね合わせ演算は、対応する要素の値がすべ
て1の場合、演算結果が1となり、その他の場合、演算
結果が0となるように実行される。領域234において
値1を出力する要素の数はd1->2 1,5,4の値に等しい。
従って、d1->2 1,5,4=3である。
【0152】上述した光システムにおいて、LCTV1
及びLCTV3は光書き込み型の液晶素子であってもよ
い。
及びLCTV3は光書き込み型の液晶素子であってもよ
い。
【0153】また、前述したすべての実施例において、
マトリックスはN×N個の要素を有しているとして説明
した。ここで、Nは任意の自然数を表す。しかし、マト
リックスは、必ずしも同じ数の行要素、列要素を有して
いる必要はない。すなわち、マトリックスは、M×N個
(M≠N)の要素を有していてもよい。ここで、N、M
は任意の自然数を表す。
マトリックスはN×N個の要素を有しているとして説明
した。ここで、Nは任意の自然数を表す。しかし、マト
リックスは、必ずしも同じ数の行要素、列要素を有して
いる必要はない。すなわち、マトリックスは、M×N個
(M≠N)の要素を有していてもよい。ここで、N、M
は任意の自然数を表す。
【0154】図24は、線分抽出、方向抽出、及び長さ
抽出を実行する光システムの構成を示す。
抽出を実行する光システムの構成を示す。
【0155】He−Neレーザ241から出射される光
は、レンズ242を介して2値化された入力パターンを
表示するための透過型空間光変調素子243に入力され
る。透過型空間光変調素子243からの出力は、入力パ
ターンから横線分を抽出するための特徴抽出光ニューロ
ン素子244に書き込み光として入力されるとともにハ
ーフミラー245、ミラー246〜248を経由して入
力パターンから縦線分を抽出するための特徴抽出光ニュ
ーロン素子249に書き込み光として入力される。
は、レンズ242を介して2値化された入力パターンを
表示するための透過型空間光変調素子243に入力され
る。透過型空間光変調素子243からの出力は、入力パ
ターンから横線分を抽出するための特徴抽出光ニューロ
ン素子244に書き込み光として入力されるとともにハ
ーフミラー245、ミラー246〜248を経由して入
力パターンから縦線分を抽出するための特徴抽出光ニュ
ーロン素子249に書き込み光として入力される。
【0156】光源250から出射される光は、偏光ビー
ムスプリッタ251を介して特徴抽出光ニューロン素子
244に読み出し光として入力される。特徴抽出光ニュ
ーロン素子244からの反射光は、入力パターンから横
線分を抽出した結果を表す。その反射光は、レンズアレ
イ252に入力され、多重展開される。その後、多重展
開された反射光は、透過型空間光変調素子257を通過
し、光書き込み型空間光変調素子258に書き込み光と
して入力される。尚、透過型空間光変調素子257は、
方向抽出のための係数を規定するために用いられる。
ムスプリッタ251を介して特徴抽出光ニューロン素子
244に読み出し光として入力される。特徴抽出光ニュ
ーロン素子244からの反射光は、入力パターンから横
線分を抽出した結果を表す。その反射光は、レンズアレ
イ252に入力され、多重展開される。その後、多重展
開された反射光は、透過型空間光変調素子257を通過
し、光書き込み型空間光変調素子258に書き込み光と
して入力される。尚、透過型空間光変調素子257は、
方向抽出のための係数を規定するために用いられる。
【0157】He−Neレーザ253から出射される光
は、レンズ254、及び偏光子255を介して直線偏光
に変換され、偏光ビームスプリッタ256を介して、特
徴抽出光ニューロン素子249に読み出し光として入力
される。特徴抽出光ニューロン素子249からの反射光
は、入力パターンから縦線分を抽出した結果を表す。そ
の反射光は、光書込み型空間光変調素子258に読み出
し光として入力される。光書込み型空間光変調素子25
8は、例えば、図18の光ニューロン素子のニューロン
電極の代わりに誘電体ミラーが設けられた構造を有して
いる。光書込み型空間光変調素子258からの反射光
は、入力パターンから縦線分を抽出した結果と方向抽出
のための係数と入力パターンから横線分を抽出した結果
の多重像とを重ね合わせた結果を表す。その反射光は、
偏光子255と直交する偏光軸を有する検光子259に
入力される。検光子259を通過した光は、レンズ26
0を介して受光デバイス261によって検出される。
は、レンズ254、及び偏光子255を介して直線偏光
に変換され、偏光ビームスプリッタ256を介して、特
徴抽出光ニューロン素子249に読み出し光として入力
される。特徴抽出光ニューロン素子249からの反射光
は、入力パターンから縦線分を抽出した結果を表す。そ
の反射光は、光書込み型空間光変調素子258に読み出
し光として入力される。光書込み型空間光変調素子25
8は、例えば、図18の光ニューロン素子のニューロン
電極の代わりに誘電体ミラーが設けられた構造を有して
いる。光書込み型空間光変調素子258からの反射光
は、入力パターンから縦線分を抽出した結果と方向抽出
のための係数と入力パターンから横線分を抽出した結果
の多重像とを重ね合わせた結果を表す。その反射光は、
偏光子255と直交する偏光軸を有する検光子259に
入力される。検光子259を通過した光は、レンズ26
0を介して受光デバイス261によって検出される。
【0158】受光デバイス261は、コンピュータ(不
図示)に接続される。コンピュータは、受光デバイスに
よる検出結果に基づいて、認識プロセスを実行する。
図示)に接続される。コンピュータは、受光デバイスに
よる検出結果に基づいて、認識プロセスを実行する。
【0159】図24において、破線部270、271、
及び272には、それぞれ図23のLCTV1〜3に表
示されるパターンと同様のパターンが現れる。従って、
上述した線分抽出、方向抽出、及び長さ抽出の原理をこ
の光システムを用いて実行することが可能である。
及び272には、それぞれ図23のLCTV1〜3に表
示されるパターンと同様のパターンが現れる。従って、
上述した線分抽出、方向抽出、及び長さ抽出の原理をこ
の光システムを用いて実行することが可能である。
【0160】尚、本発明は上記実施例に限定されるもの
ではなく、発明の主旨に基づいて種種の変形が可能であ
り、これらを本発明の範囲から排除するものではない。
ではなく、発明の主旨に基づいて種種の変形が可能であ
り、これらを本発明の範囲から排除するものではない。
【0161】
【発明の効果】以上詳細に説明したように、本発明の画
像認識装置及び画像認識方法によれば文字の位置ズレや
大きさの変動に影響されない高い認識機能を実現でき
る。
像認識装置及び画像認識方法によれば文字の位置ズレや
大きさの変動に影響されない高い認識機能を実現でき
る。
【0162】また、大きさが異なったり、位置ズレのあ
るパターンを学習させる必要が無いので、学習が容易で
高速に終了できる。
るパターンを学習させる必要が無いので、学習が容易で
高速に終了できる。
【0163】さらに、本発明の装置によれば、ある特定
形状に対して他の特定形状が存在する方向およびその量
を検出することができる。これにより、画像の大きさや
位置に依存しない画像の特徴を抽出することができる。
これは、文字データの特徴抽出に適している。
形状に対して他の特定形状が存在する方向およびその量
を検出することができる。これにより、画像の大きさや
位置に依存しない画像の特徴を抽出することができる。
これは、文字データの特徴抽出に適している。
【図1】本発明にかかる認識装置の構成を表わすブロッ
ク図
ク図
【図2】(a)は入力部により作製されたビットイメー
ジの一例を示す概略図 (b)は線分抽出結果を示す概略図 (c)は方向検出部の出力結果の一例を示す概略図
ジの一例を示す概略図 (b)は線分抽出結果を示す概略図 (c)は方向検出部の出力結果の一例を示す概略図
【図3】線分の相対的位置関係を説明する概念図
【図4】(a)は入力部により作製されたビットイメー
ジの一例を示す概略図 (b)は線分抽出結果を示す概略図 (c)は方向検出部の出力結果の一例を示す概略図
ジの一例を示す概略図 (b)は線分抽出結果を示す概略図 (c)は方向検出部の出力結果の一例を示す概略図
【図5】(a)は入力部により作製されたビットイメー
ジの一例を示す概略図 (b)は線分抽出結果を示す概略図 (c)は方向検出部の出力結果を示す概略図
ジの一例を示す概略図 (b)は線分抽出結果を示す概略図 (c)は方向検出部の出力結果を示す概略図
【図6】(a)は入力部により作製されたビットイメー
ジの一例を示す概略図 (b)はビットイメージにより作製された方向検出部の
出力を示す概略図
ジの一例を示す概略図 (b)はビットイメージにより作製された方向検出部の
出力を示す概略図
【図7】本発明にかかる一実施例に用いるニューラルネ
ットワークの構成図
ットワークの構成図
【図8】本発明の一実施例で用いたニューラルネットワ
ークの構成図
ークの構成図
【図9】(a)は入力部により作製されたビットイメー
ジの一例を示す概略図 (b)は線分抽出層の出力を示す概略図 (c)は統合層の出力結果を示す概略図
ジの一例を示す概略図 (b)は線分抽出層の出力を示す概略図 (c)は統合層の出力結果を示す概略図
【図10】(a)は入力部により作製されたビットイメ
ージの一例を示す概略図 (b)は線分抽出層の出力を示す概略図 (c)は統合層の出力結果を示す概略図
ージの一例を示す概略図 (b)は線分抽出層の出力を示す概略図 (c)は統合層の出力結果を示す概略図
【図11】(a)は本発明の認識装置が予め学習した文
字を示す概略図 (b)は本発明の認識装置が正しく認識できた文字の例
を示す概略図
字を示す概略図 (b)は本発明の認識装置が正しく認識できた文字の例
を示す概略図
【図12】従来例の認識装置の構成を示すブロック図
【図13】ビットイメージの概略図
【図14】従来例で使用するニューラルネットワークの
構成を示す図
構成を示す図
【図15】本発明の画像認識方法の手順を示すフローチ
ャート
ャート
【図16】(a)は2値化された入力パターンの例を示
す図 (b)は縦線分を抽出するためのマスクパターンの例を
示す図 (c)は横線分を抽出するためのマスクパターンの例を
示す図 (d)は左斜め線分を抽出するためのマスクパターンの
例を示す図 (e)は右斜め線分を抽出するためのマスクパターンの
例を示す図
す図 (b)は縦線分を抽出するためのマスクパターンの例を
示す図 (c)は横線分を抽出するためのマスクパターンの例を
示す図 (d)は左斜め線分を抽出するためのマスクパターンの
例を示す図 (e)は右斜め線分を抽出するためのマスクパターンの
例を示す図
【図17】入力層、形状抽出層、方向抽出層、統合層の
それぞれの出力の具体例を示す図
それぞれの出力の具体例を示す図
【図18】特徴抽出光ニューロン素子の断面を示す図
【図19】(a)は縦線分を抽出するためのニューロン
電極の形状及び配置を示す図 (b)は2値化された入力パターンの例を示す図 (c)は(b)に示す入力パターンから縦線分を抽出し
た実験結果を示す図
電極の形状及び配置を示す図 (b)は2値化された入力パターンの例を示す図 (c)は(b)に示す入力パターンから縦線分を抽出し
た実験結果を示す図
【図20】4方向の線分を抽出するための4つの線分抽
出面を有する特徴抽出光ニューロン素子を示す図
出面を有する特徴抽出光ニューロン素子を示す図
【図21】図21に示す特徴抽出光ニューロン素子の出
力結果の例を示す図
力結果の例を示す図
【図22】1個のニューロン電極に光信号を与えた場合
の出力特性を示す図
の出力特性を示す図
【図23】方向抽出及び長さ抽出を実行するための光シ
ステムの構成を示す図
ステムの構成を示す図
【図24】線分抽出、方向抽出、及び長さ抽出を実行す
るための光システムの構成を示す図
るための光システムの構成を示す図
1 入力部 2 特徴抽出部 3 認識部 4 形状抽出部 5 方向検出部
Claims (20)
- 【請求項1】入力画像の特徴を抽出するための装置であ
って、 該入力画像の内、第1の形状を表すパターンを表示する
第1の表示手段、 該第1の表示手段によって表示される該第1の形状を表
すパターン上に位置する特定の点を基準として、特定の
方向に位置する複数の点を表すパターンを表示する第2
の表示手段、 該入力画像の内、第2の形状を表すパターンを多重展開
することによって得られるパターンを表示する第3の表
示手段、 該第1、該第2、及び該第3の表示手段によって表示さ
れるパターンを重ね合わせる重ね合わせ手段、及び該重
ね合わせられたパターンを検知するための検知手段を備
えた画像特徴抽出装置。 - 【請求項2】第1、第2、及び第3の表示手段は、透過
型空間光変調素子である、請求項1に記載の画像特徴抽
出装置。 - 【請求項3】第2の表示手段は、透過型空間光変調素子
であり、第1及び第3の表示手段は、光書き込み型空間
光変調素子である、請求項1に記載の画像特徴抽出装
置。 - 【請求項4】重ね合わせ手段は、光書き込み型空間光変
調素子である、請求項1に記載の画像特徴抽出装置。 - 【請求項5】画像を入力するステップ、 該入力された画像から予め決められた複数の形状を抽出
するステップ、 該抽出された複数の形状の内の第1の形状上の各点を基
準として、該抽出された複数の形状の内の第2の形状が
存在する方向を表す第1の特徴量を抽出するステップ、 該第1の特徴量に基づいて、該第1の形状に対して特定
の方向に存在する該第2の形状の存在量を表す第2の特
徴量を抽出するステップ、及び該第2の特徴量に基づい
て、該入力された画像を認識するステップを包含する画
像認識方法。 - 【請求項6】複数の形状を抽出するステップは、第1の
形状をM×N個の要素を有する第1のマトリックスを用
いて表現するステップ、及び第2の形状をM×N個の要
素を有する第2のマトリックスを用いて表現するステッ
プを包含しており、 第1の特徴量を抽出するステップは、前記第1の特徴量
をM×N個の要素を有する複数の第3のマトリックスを
含む少なくとも1つの領域を用いて表現するステップを
包含しており、 該第1の特徴量は、該第1のマトリックスの要素と該第
2のマトリックスの要素と該第3のマトリックスの要素
との間の結合によって規定され、M及びNは任意の自然
数を表す、請求項5に記載の画像認識方法。 - 【請求項7】第1のマトリックスにおいてi行j列に位
置する要素をの値をu l(i,j)、それの値を
ul i,j、第2のマトリックスにおいてi行j列に位置す
る要素をul'(i,j)、それの値をul' i,j、第3の
マトリックスにおいてi行j列に位置する要素をd
l->l' k(i,j)、それの値をdl->l' k,i,j、該第2の
マトリックスにおいてp行q列に位置する要素u
l'(p,q)が要素ul'(i,j)に対して方向kに位
置する場合には1であり、その他の場合には0である係
数をwk(i,j)p,q、特定の方向を表すパラメータを
kと表すとき、結合は、下式(数1)によって表され
る、請求項6に記載の画像認識方法。 【数1】 - 【請求項8】第1の特徴量を抽出するステップは、前記
第1の特徴量をM×N個の要素を有する複数の第3のマ
トリックスを含む少なくとも1つの領域を用いて表現す
るステップを包含しており、 第2の特徴量を抽出するステップは、該第2の特徴量を
複数個の要素を有する少なくとも1つの第4のマトリッ
クスを用いて表現するステップを包含しており、 該第2の特徴量は、該第3のマトリックスの要素と該第
4のマトリックスの要素との間の結合によって規定さ
れ、M及びNは任意の自然数を表す、請求項5に記載の
画像認識方法。 - 【請求項9】第3のマトリックスにおいてi行j列に位
置する要素をdl->l' k(i,j)、それの値をdl->l'
k,i,j、第4のマトリックスにおいてi行j列に位置す
る要素をrl->l'(k)、それの値をrl->l' kと表すと
き、結合は、下式(数2)によって表される、請求項8
に記載の画像認識方法。 【数2】 - 【請求項10】画像を認識するステップは、値rl->l' k
及び重み付け係数に基づいて、該画像を識別するステッ
プを包含し、画像認識方法は、該値rl->l' kの総和によ
って正規化された該値rl->l' kに基づいて、該重み付け
係数を効率的に改変する学習ステップをさらに包含す
る、請求項9に記載の画像認識方法。 - 【請求項11】画像を認識するステップは、値rl->l' k
及び重み付け係数に基づいて、該画像を識別するステッ
プを包含し、画像認識方法は、該値rl->l' kの最大値に
よって正規化された該値rl->l' kに基づいて、該重み付
け係数を効率的に改変する学習ステップをさらに包含す
る、請求項9に記載の画像認識方法。 - 【請求項12】画像を入力する手段、 該入力された画像から予め決められた複数の形状を抽出
する手段、 該抽出された複数の形状の内の第1の形状上の各点を基
準として、該抽出された複数の形状の内の第2の形状が
存在する方向を表す第1の特徴量を抽出する手段、 該第1の特徴量に基づいて、該第1の形状に対して特定
の方向に存在する該第2の形状の存在量を表す第2の特
徴量を抽出する手段、及び該第2の特徴量に基づいて、
該入力された画像を認識する手段を備えた画像認識装
置。 - 【請求項13】複数の形状は、縦線分、横線分、左斜め
線分、及び右斜め線分の内の少なくとも1つを含む、請
求項12に記載の画像認識装置。 - 【請求項14】複数の形状は、幾何学的な形状を含む、
請求項12に記載の画像認識装置。 - 【請求項15】複数の形状を抽出する手段は、該複数の
形状を抽出するための複数の層を有しており、該複数の
層のそれぞれは、M×N個の要素を有するマトリックス
によって表され、 第1の特徴量を抽出する手段は、前記第1の特徴量を抽
出するための少なくとも1つの第1の領域を有してお
り、該少なくとも1つの第1の領域は複数の第2の領域
を有しており、該複数の第2の領域のそれぞれは、M×
N個の要素を有する第3のマトリックスによって表さ
れ、 該第1の特徴量は、前記第1の形状を抽出するための層
を表す第1のマトリックスの要素と前記第2の形状を抽
出するための層を表す第2のマトリックスの要素と該第
3のマトリックスの要素との間の結合によって規定さ
れ、M及びNは任意の自然数を表す、請求項12に記載
の画像認識装置。 - 【請求項16】第1のマトリックスにおいてi行j列に
位置する要素をの値をul(i,j)、それの値をul
i,j、第2のマトリックスにおいてi行j列に位置する
要素をul'(i,j)、それの値をul' i,j、第3のマ
トリックスにおいてi行j列に位置する要素をdl->l' k
(i,j)、それの値をdl->l' k,i,j、該第2のマトリ
ックスにおいてp行q列に位置する要素ul'(p,q)
が要素ul'(i,j)に対して方向kに位置する場合に
は1であり、その他の場合には0である係数をw
k(i,j)p,q、特定の方向を表すパラメータをkと表
すとき、結合は、下式(数3)によって表される、請求
項15に記載の画像認識装置。 【数3】 - 【請求項17】第1の特徴量を抽出する手段は、前記第
1の特徴量を抽出するための少なくとも1つの第1の領
域を有しており、該少なくとも1つの第1の領域は複数
の第2の領域を有しており、該複数の第2の領域のそれ
ぞれは、M×N個の要素を有する第3のマトリックスに
よって表され、 第2の特徴量を抽出する手段は、該第2の特徴量を抽出
するための少なくとも1つの第3の領域を有しており、
該少なくとも1つの第3の領域は、複数個の要素を有す
る第4のマトリックスによって表され、 該第2の特徴量は、該第3のマトリックスの要素と該第
4のマトリックスの要素との間の結合によって規定さ
れ、M及びNは任意の自然数を表す、請求項12に記載
の画像認識装置。 - 【請求項18】第3のマトリックスにおいてi行j列に
位置する要素をdl->l ' k(i,j)、それの値をd
l->l' k,i,j、第4のマトリックスにおいてi行j列に位
置する要素をrl->l'(k)、それの値をrl->l' kと表
すとき、結合は、下式(数4)によって表される、請求
項17に記載の画像認識装置。 【数4】 - 【請求項19】画像を認識する手段は、入力された画像
を識別するための識別層を有しており、該識別層は複数
の要素を有しており、該複数の要素のそれぞれは、第3
の領域を表す第4のマトリックスの要素に結合される、
請求項12の画像認識装置。 - 【請求項20】識別層の要素、及び第3のマトリックス
の要素のそれぞれはニューロンであり、前記識別層、及
び前記識別層に結合された第3の領域は、ニューラルネ
ットワークの少なくとも一部を構成する、請求項19に
記載の画像認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5125730A JPH0644376A (ja) | 1992-05-28 | 1993-05-27 | 画像特徴抽出装置、画像認識方法及び画像認識装置 |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4-136585 | 1992-05-28 | ||
| JP13658592 | 1992-05-28 | ||
| JP5125730A JPH0644376A (ja) | 1992-05-28 | 1993-05-27 | 画像特徴抽出装置、画像認識方法及び画像認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0644376A true JPH0644376A (ja) | 1994-02-18 |
Family
ID=26462065
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5125730A Pending JPH0644376A (ja) | 1992-05-28 | 1993-05-27 | 画像特徴抽出装置、画像認識方法及び画像認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0644376A (ja) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN104036271A (zh) * | 2014-06-11 | 2014-09-10 | 新达通科技股份有限公司 | 一种字符和纸币冠字号码的识别方法及装置和atm机 |
| JP2015072610A (ja) * | 2013-10-03 | 2015-04-16 | 株式会社デンソー | 群情報記憶認識装置 |
| US9181071B2 (en) | 2011-03-24 | 2015-11-10 | Kito Corporation | Hoist equipped with power-off type electromagnetic brake |
| WO2020032506A1 (ko) * | 2018-08-07 | 2020-02-13 | 전북대학교산학협력단 | 시각 감지 시스템 및 이를 이용한 시각 감지 방법 |
| JP2021103521A (ja) * | 2019-12-24 | 2021-07-15 | 財團法人工業技術研究院Industrial Technology Research Institute | ニューラルネットワーク演算装置および方法 |
-
1993
- 1993-05-27 JP JP5125730A patent/JPH0644376A/ja active Pending
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9181071B2 (en) | 2011-03-24 | 2015-11-10 | Kito Corporation | Hoist equipped with power-off type electromagnetic brake |
| JP2015072610A (ja) * | 2013-10-03 | 2015-04-16 | 株式会社デンソー | 群情報記憶認識装置 |
| CN104036271A (zh) * | 2014-06-11 | 2014-09-10 | 新达通科技股份有限公司 | 一种字符和纸币冠字号码的识别方法及装置和atm机 |
| CN104036271B (zh) * | 2014-06-11 | 2017-08-25 | 新达通科技股份有限公司 | 一种字符和纸币冠字号码的识别方法及装置和atm机 |
| WO2020032506A1 (ko) * | 2018-08-07 | 2020-02-13 | 전북대학교산학협력단 | 시각 감지 시스템 및 이를 이용한 시각 감지 방법 |
| JP2021103521A (ja) * | 2019-12-24 | 2021-07-15 | 財團法人工業技術研究院Industrial Technology Research Institute | ニューラルネットワーク演算装置および方法 |
| US12265904B2 (en) | 2019-12-24 | 2025-04-01 | Industrial Technology Research Institute | Apparatus and method for neural network computation |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5793932A (en) | Image recognition device and an image recognition method | |
| US5842191A (en) | Neural network that incorporates direct optical imaging | |
| CA2015740C (en) | Hierarchical constrained automatic learning network for character recognition | |
| Sinha et al. | Lensless computational imaging through deep learning | |
| DE60017738T2 (de) | Phasenextraktion in der optischen datenverarbeitung | |
| Bacca et al. | Compressive spectral image reconstruction using deep prior and low-rank tensor representation | |
| DE112020005932T5 (de) | Systeme und verfahren zur segmentierung von transparenten objekten mittels polarisationsmerkmalen | |
| CN105825511B (zh) | 一种基于深度学习的图片背景清晰度检测方法 | |
| US20230368012A1 (en) | Systems and methods for metasurface smart glass for object recognition | |
| US5511134A (en) | Image recognition device and image recognition method | |
| Zhang et al. | Soft matching network with application to defect inspection | |
| JPH0644376A (ja) | 画像特徴抽出装置、画像認識方法及び画像認識装置 | |
| CN118506141A (zh) | 一种基于多模态特征对齐的遥感影像融合分类方法 | |
| CN116310808B (zh) | 基于显著检测网络的非规则幕墙板材识别方法及装置 | |
| Fukushima | Use of non-uniform spatial blur for image comparison: symmetry axis extraction | |
| Lázaro et al. | SOM Segmentation of gray scale images for optical recognition | |
| DE69431377T2 (de) | Selbstorganisierendes Musterlernsystem | |
| JP3094070B2 (ja) | 光学的パターン認識分類装置 | |
| JP3099203B2 (ja) | 光学的パタ−ン認識分類装置 | |
| JPH02240790A (ja) | 文字認識装置 | |
| Choi et al. | Biologically motivated trainable selective attention model using adaptive resonance theory network | |
| JPH0367381A (ja) | 文字認識装置 | |
| Ram | Automatic Equation Solver-A Technology Enhancement For Instructional Automation | |
| Stearns | Neural network that incorporates direct optical imaging | |
| US20230281431A1 (en) | Computer implemented method for processing structured data |