JPH03260888A - 標準パターン作成方法 - Google Patents
標準パターン作成方法Info
- Publication number
- JPH03260888A JPH03260888A JP2057993A JP5799390A JPH03260888A JP H03260888 A JPH03260888 A JP H03260888A JP 2057993 A JP2057993 A JP 2057993A JP 5799390 A JP5799390 A JP 5799390A JP H03260888 A JPH03260888 A JP H03260888A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- standard pattern
- feature
- function
- density
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、パターンマツチングによる文字認識処理に用
いる標準パターンの作成方法に関する。
いる標準パターンの作成方法に関する。
パターンマツチングを用いた一般的な文字認識処理手順
を第2図に示す。同図において、ステップS1は文字画
像入力、ステップS2は特徴抽出、ステップS3は字種
判別、を示す。
を第2図に示す。同図において、ステップS1は文字画
像入力、ステップS2は特徴抽出、ステップS3は字種
判別、を示す。
ここで、字種判別部(ステップ33)では、認識対象と
なる文字ごとにあらかじめ用意された標準パターンと入
力画像から抽出された特徴パターンとの間で類似度が算
出され、入力文字の字種が判別される。
なる文字ごとにあらかじめ用意された標準パターンと入
力画像から抽出された特徴パターンとの間で類似度が算
出され、入力文字の字種が判別される。
類似度Gは、標準パターンと人力画像の特徴パターンそ
れぞれをn次元のベクトルS (n)、 P (n)と
して、以下の式から求められる。
れぞれをn次元のベクトルS (n)、 P (n)と
して、以下の式から求められる。
ここで、(s、p)=Σ= S (i) P (i)で
あり、ベクトルの内積をあられす。(S、S)、(P、
P)はそれぞれ、標準パターン、特徴パターンの自己相
関値と呼ばれる。
あり、ベクトルの内積をあられす。(S、S)、(P、
P)はそれぞれ、標準パターン、特徴パターンの自己相
関値と呼ばれる。
このようにして使用される標準パターンの一般的な作成
手順を第3図に示す。
手順を第3図に示す。
同図に見られるように、ステップSlで得た複数のサン
プルからの特徴抽出をステップS2で行い、その結果を
ステップS3で各要素ごとに足し込み、ステップS4で
得られる総和パターンに対し、必要に応じた濃度変換を
ステップS5で施して標準パターンを得る。ここで言う
濃度とは特徴要素の大きさをさす。以後同様とする。
プルからの特徴抽出をステップS2で行い、その結果を
ステップS3で各要素ごとに足し込み、ステップS4で
得られる総和パターンに対し、必要に応じた濃度変換を
ステップS5で施して標準パターンを得る。ここで言う
濃度とは特徴要素の大きさをさす。以後同様とする。
一般に濃度変換としては、それぞれの標準パターンの中
の最大要素を所定の値Fに揃えるように、他の要素もそ
れに比例して一律的に大きさを変換する処理が行われる
。複数ある字種の中のj番目字種の総和パターンJ(n
)の最大要素をM、とすれば、標準パターンS、(n)
のi番目の要素は、5J(i)=Hj(i)・F/MJ
・・・・・・(1)として得られる。
の最大要素を所定の値Fに揃えるように、他の要素もそ
れに比例して一律的に大きさを変換する処理が行われる
。複数ある字種の中のj番目字種の総和パターンJ(n
)の最大要素をM、とすれば、標準パターンS、(n)
のi番目の要素は、5J(i)=Hj(i)・F/MJ
・・・・・・(1)として得られる。
これは認識処理を行う装置の有効桁数や、標準パターン
の格納領域の制約から、限られたビット幅を有効に使う
ためである。または、入力画像の特徴パターンと標準パ
ターンの濃度のオーダを一致させるため、総和パターン
の各要素をサンプル数で割る処理が行われる。
の格納領域の制約から、限られたビット幅を有効に使う
ためである。または、入力画像の特徴パターンと標準パ
ターンの濃度のオーダを一致させるため、総和パターン
の各要素をサンプル数で割る処理が行われる。
所で、このようにして作成された標準パターンが、結果
的に、少数の突出した値の特徴要素をもつことがあり、
その場合、これらの突出した要素が字種の判別に大きな
影響を与えることが判明した。すなわち、文字の変動に
弱くなり、認識率が低くなる。
的に、少数の突出した値の特徴要素をもつことがあり、
その場合、これらの突出した要素が字種の判別に大きな
影響を与えることが判明した。すなわち、文字の変動に
弱くなり、認識率が低くなる。
第4図は、従来手法で作成された標準パターンにおける
濃度分布を示したグラフであるが、横軸に沿って濃度2
55.208及び207の所にそれぞれ、1個の画素が
存在し、少数の突出した値の特徴要素になっていること
が分かる。
濃度分布を示したグラフであるが、横軸に沿って濃度2
55.208及び207の所にそれぞれ、1個の画素が
存在し、少数の突出した値の特徴要素になっていること
が分かる。
本発明の目的は、かかる問題点を改善し、少数の突出し
た値の特徴要素をもつ標準パターンの場合には、それら
の特徴要素をうまく処理することにより、認識率の低下
を招かないようにした標準パターンの作成方法を提供す
ることにある。
た値の特徴要素をもつ標準パターンの場合には、それら
の特徴要素をうまく処理することにより、認識率の低下
を招かないようにした標準パターンの作成方法を提供す
ることにある。
標準パターン作成時、各サンプルの特徴抽出結果を足し
込んだ総和パターンが、少数の突出した特徴要素をもつ
とき、該総和パターンの各特徴要素に対し、a乗根(a
>1.0)をとる演算や対数に類似した関数f (x)
を用いた演算をほどこすことにより、第6図に示すよう
な濃度の非線形変換を行い、この後、必要に応じた濃度
の線形変換を行う。
込んだ総和パターンが、少数の突出した特徴要素をもつ
とき、該総和パターンの各特徴要素に対し、a乗根(a
>1.0)をとる演算や対数に類似した関数f (x)
を用いた演算をほどこすことにより、第6図に示すよう
な濃度の非線形変換を行い、この後、必要に応じた濃度
の線形変換を行う。
f (x)は、任意のX(≧0)に対して以下の条件を
満たすような凸関数である。
満たすような凸関数である。
f(x) −f(x−711x)≧f(x+、dx)−
f(x)≧0・・・・・・(2) さらに、以下の条件を満たす。
f(x)≧0・・・・・・(2) さらに、以下の条件を満たす。
ここで、Axは任意の正の実数であり、関数の増分を表
す。
す。
上記の如き非線形変換を施すことにより、突出した特徴
要素を、そうでない特徴要素よりも一段と押え込むこと
が可能になるから、これにより、文字の変動に強い安定
した標準パターンを得ることができ、従来と同様の処理
を用いた認識処理において認識率を向上させることがで
きる。
要素を、そうでない特徴要素よりも一段と押え込むこと
が可能になるから、これにより、文字の変動に強い安定
した標準パターンを得ることができ、従来と同様の処理
を用いた認識処理において認識率を向上させることがで
きる。
〔実施例]
第1図は本発明の一実施例としての標準パターン作成方
法を示すフローチャートである。同図に見られるように
、各サンプル画像に対し順次特徴抽出処理が施され足し
込まれる。この総和パターンに対して、ステップS5に
見られる如く、各特徴要素のa乗根(aは1.0より大
きな実数)をとり、その結果で新たな総和パターンを得
る。すなわち、a乗根をとる演算は、下記に示すような
非線形関数f (x)を用いた演算により、非線形な濃
度変換を行うことを意味する。
法を示すフローチャートである。同図に見られるように
、各サンプル画像に対し順次特徴抽出処理が施され足し
込まれる。この総和パターンに対して、ステップS5に
見られる如く、各特徴要素のa乗根(aは1.0より大
きな実数)をとり、その結果で新たな総和パターンを得
る。すなわち、a乗根をとる演算は、下記に示すような
非線形関数f (x)を用いた演算により、非線形な濃
度変換を行うことを意味する。
f (x)=χI/11 ・・・・
・・(4)その後、更に、従来も行われていた濃度変換
(第1図のステップS6或いは第3図のステップS5)
として、前記(1)式を用いた濃度変換が行われる。こ
こでは、各特徴要素のビット長を8ピントに圧縮するた
めF=255として一律的な濃度変換を行っている。従
来手法と異なるのは各特徴要素の8乗根をとって非線形
変換を行う点である。
・・(4)その後、更に、従来も行われていた濃度変換
(第1図のステップS6或いは第3図のステップS5)
として、前記(1)式を用いた濃度変換が行われる。こ
こでは、各特徴要素のビット長を8ピントに圧縮するた
めF=255として一律的な濃度変換を行っている。従
来手法と異なるのは各特徴要素の8乗根をとって非線形
変換を行う点である。
従来手法と本手法(a=4)を用いた場合の標準パター
ンの例を、“あ”という文字について、学習サンプル数
80個で、特徴抽出手法として、(16x16)メツシ
ュに正規化された画像の輪郭画素を白画素を挟んだ輪郭
画素間の相対距離で複数の特徴面(例えば15面)に割
り付ける手法(特願平11年第71757号)を用いて
作成し比較してみると、後者の方が、突出した特徴要素
を低く抑え、その後、全体をカサ上げするように濃度変
換しているので、全体に濃度が濃くなっているのが分か
る。
ンの例を、“あ”という文字について、学習サンプル数
80個で、特徴抽出手法として、(16x16)メツシ
ュに正規化された画像の輪郭画素を白画素を挟んだ輪郭
画素間の相対距離で複数の特徴面(例えば15面)に割
り付ける手法(特願平11年第71757号)を用いて
作成し比較してみると、後者の方が、突出した特徴要素
を低く抑え、その後、全体をカサ上げするように濃度変
換しているので、全体に濃度が濃くなっているのが分か
る。
本発明による手法で標準パターンをひらがな75文字に
対して作成し、判別式として類似度を用いた従来と同様
の認識処理を学習サンプル80文字、ひらがな75字種
に対して行った場合、従来手法で作成された標準パター
ンを用いた場合の認識率90.5%に対して、95.5
%に認識率が向上した。変数a (8乗根のa)と認識
率の関係を第5図に示したので参照されたい。
対して作成し、判別式として類似度を用いた従来と同様
の認識処理を学習サンプル80文字、ひらがな75字種
に対して行った場合、従来手法で作成された標準パター
ンを用いた場合の認識率90.5%に対して、95.5
%に認識率が向上した。変数a (8乗根のa)と認識
率の関係を第5図に示したので参照されたい。
本発明は、前記特徴抽出手法に依存するものではなく、
伝播停止処理を用いた背景特徴(特開昭59−792号
公報)でも、その有効性が確認されている。
伝播停止処理を用いた背景特徴(特開昭59−792号
公報)でも、その有効性が確認されている。
ここでは前記(4)式において、a=4としたが、aの
最適値は認識対象とするフィールドや特徴抽出手法、判
別式の種類によって異なると考えられる。また、総和パ
ターンの各特徴要素の対数をとる非線形変換も、8乗根
をとる非線形変換と同様に有効である。すなわち、f
(x)として下記に示す関数を用いる。
最適値は認識対象とするフィールドや特徴抽出手法、判
別式の種類によって異なると考えられる。また、総和パ
ターンの各特徴要素の対数をとる非線形変換も、8乗根
をとる非線形変換と同様に有効である。すなわち、f
(x)として下記に示す関数を用いる。
f (x)=log+o(x + 1) −
−(5)ただし、前記(4〉式におけるaを大きくして
いくと特徴パターンは2値画像に近づき、認識率は低下
する。そこで、サンプル画像から抽出された特徴パター
ンの各要素をa乗して足し込み、前記総和パターンを得
ることで、総和パターンにおける濃度分布をある程度保
存したまま、突出した特徴要素の値を低く押さえること
ができる。
−(5)ただし、前記(4〉式におけるaを大きくして
いくと特徴パターンは2値画像に近づき、認識率は低下
する。そこで、サンプル画像から抽出された特徴パター
ンの各要素をa乗して足し込み、前記総和パターンを得
ることで、総和パターンにおける濃度分布をある程度保
存したまま、突出した特徴要素の値を低く押さえること
ができる。
本発明によれば、標準パターン作成時に、各サンプル文
字画像から抽出した特徴要素の足し込み総和パターンに
おいて、生しることのある突出した特徴要素を押え込む
ような非線形変換を、各特徴要素に施して標準パターン
を作成することにより、認識率が向上するという利点が
ある。非線形変換として4乗根を用いる場合、認識率は
90.5%から95.5%に向上し、認識率にして53
%の改善がみられた。
字画像から抽出した特徴要素の足し込み総和パターンに
おいて、生しることのある突出した特徴要素を押え込む
ような非線形変換を、各特徴要素に施して標準パターン
を作成することにより、認識率が向上するという利点が
ある。非線形変換として4乗根を用いる場合、認識率は
90.5%から95.5%に向上し、認識率にして53
%の改善がみられた。
第1図は本発明の一実施例を示すフローチャート、第2
図はパターンマツチングを用いる一般的な文字認識手順
を示すフローチャート、第3図は従来の標準パターン作
成方法を示すフローチャート、第4図は従来手法により
得られる標準パターンの濃度分布を示すグラフ、第5図
は変数aと認識率の関係を示す特性図、第6図は本発明
による非線形変換の特性例を示す特性図、である。 符号の説明 S1〜S6・・・ステップ 第 1 図 第 2 図 第 図 第 5 図 第 図
図はパターンマツチングを用いる一般的な文字認識手順
を示すフローチャート、第3図は従来の標準パターン作
成方法を示すフローチャート、第4図は従来手法により
得られる標準パターンの濃度分布を示すグラフ、第5図
は変数aと認識率の関係を示す特性図、第6図は本発明
による非線形変換の特性例を示す特性図、である。 符号の説明 S1〜S6・・・ステップ 第 1 図 第 2 図 第 図 第 5 図 第 図
Claims (1)
- 1)パターンマッチングによる文字認識処理のために用
いる標準パターンを複数のサンプル文字画像から作成す
る標準パターン作成方法において、各サンプル文字画像
からの特徴抽出結果を各特徴要素毎に足し込んでその総
和パターンを得た後、得られた該総和パターンを構成す
る各特徴要素に対し、その大きさのa乗根(但し、a>
1.0)をとる演算又は対数をとる演算の如き、非線形
変換を行う演算を施して、その演算結果から成る総和パ
ターンを得る段階を含むことを特徴とする標準パターン
作成方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2057993A JP2749692B2 (ja) | 1990-03-12 | 1990-03-12 | 標準パターン作成方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2057993A JP2749692B2 (ja) | 1990-03-12 | 1990-03-12 | 標準パターン作成方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH03260888A true JPH03260888A (ja) | 1991-11-20 |
| JP2749692B2 JP2749692B2 (ja) | 1998-05-13 |
Family
ID=13071535
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2057993A Expired - Lifetime JP2749692B2 (ja) | 1990-03-12 | 1990-03-12 | 標準パターン作成方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2749692B2 (ja) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60160488A (ja) * | 1984-02-01 | 1985-08-22 | Nec Corp | パタン認識における標準パタン作成方式 |
| JPS63313283A (ja) * | 1987-06-17 | 1988-12-21 | Agency Of Ind Science & Technol | 画像正規化方法 |
| JPH01116892A (ja) * | 1987-10-30 | 1989-05-09 | Agency Of Ind Science & Technol | 非線形正規化方法 |
-
1990
- 1990-03-12 JP JP2057993A patent/JP2749692B2/ja not_active Expired - Lifetime
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60160488A (ja) * | 1984-02-01 | 1985-08-22 | Nec Corp | パタン認識における標準パタン作成方式 |
| JPS63313283A (ja) * | 1987-06-17 | 1988-12-21 | Agency Of Ind Science & Technol | 画像正規化方法 |
| JPH01116892A (ja) * | 1987-10-30 | 1989-05-09 | Agency Of Ind Science & Technol | 非線形正規化方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2749692B2 (ja) | 1998-05-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN113011581B (zh) | 神经网络模型压缩方法、装置、电子设备及可读存储介质 | |
| Cai et al. | Deep learning with low precision by half-wave gaussian quantization | |
| CN110874636B (zh) | 一种神经网络模型压缩方法、装置和计算机设备 | |
| CN109800865B (zh) | 神经网络生成及图像处理方法和装置、平台、电子设备 | |
| CN109284761B (zh) | 一种图像特征提取方法、装置、设备及可读存储介质 | |
| US20230143985A1 (en) | Data feature extraction method and related apparatus | |
| CN110909874A (zh) | 一种神经网络模型的卷积运算优化方法和装置 | |
| JP7020331B2 (ja) | クラスタリング装置、方法、及びプログラム | |
| CN117997619B (zh) | 一种基于深度学习的Web攻击端到端检测方法、系统及介质 | |
| KR102476695B1 (ko) | 텍스트 분류를 위한 적응형 콘볼루션 필터 생성 방법 및 서버 | |
| KR20240113154A (ko) | 텍스트 분류 모델을 이용한 텍스트 분류 장치 및 방법 | |
| Hirata et al. | Iterative design of morphological binary image operators | |
| KR102726377B1 (ko) | 이진 신경망 생성 방법 및 장치 | |
| JPH03260888A (ja) | 標準パターン作成方法 | |
| US11853387B2 (en) | Method, electronic device and storage medium for data projection | |
| Prono et al. | A non-conventional sum-and-max based neural network layer for low power classification | |
| Sattiraju et al. | Adaptive BPSO based feature selection and skin detection based background removal for enhanced face recognition | |
| CN111382764B (zh) | 人脸识别或手势识别的神经网络模型建立方法、装置及计算机可读存储介质 | |
| KR102834846B1 (ko) | 대용량 입력 데이터의 분할 처리가 가능한 소프트맥스 연산 방법, 장치 및 컴퓨터프로그램 | |
| Jeng et al. | Multidimensional Quantum Convolution with Arbitrary Filtering and Unity Stride | |
| Tao et al. | Image segmentation based on PCNN model | |
| CN110889413A (zh) | 实现光学字符识别的终端设备确定方法及装置 | |
| US20240378436A1 (en) | Partial Quantization To Achieve Full Quantized Model On Edge Device | |
| Barrah et al. | New technique for face recognition based on singular value decomposition (SVD) | |
| KR102707241B1 (ko) | 신경망 알고리즘이 적용된 이미지 프로세서에서의 영상데이터 처리 방법 및 장치 |