JPH04177485A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH04177485A
JPH04177485A JP2303641A JP30364190A JPH04177485A JP H04177485 A JPH04177485 A JP H04177485A JP 2303641 A JP2303641 A JP 2303641A JP 30364190 A JP30364190 A JP 30364190A JP H04177485 A JPH04177485 A JP H04177485A
Authority
JP
Japan
Prior art keywords
character
input
information
layer
line segments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2303641A
Other languages
English (en)
Inventor
Kazutaka Kawakami
川上 和隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic System Solutions Japan Co Ltd
Original Assignee
Matsushita Graphic Communication Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Graphic Communication Systems Inc filed Critical Matsushita Graphic Communication Systems Inc
Priority to JP2303641A priority Critical patent/JPH04177485A/ja
Publication of JPH04177485A publication Critical patent/JPH04177485A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は文字画像をニューラル1ノドを用いて認識する
文字認識装置に関する。
従来の技術 文字などのパターンをL’2 Riするとは、同し性質
をもつパターンをクラスに分類する操作で、例えば英文
字AからZは26のパターンクラスを持っている。この
パターン認識はまず入カバターンより特徴量を抽出し、
この特徴量をもとに識別または分類を行う2段階の処理
からなっている。文字を識別する場合には、ストローク
の直線性、方向。
長さ1位置関係などが重要な特徴量となる。文字の認識
の手法としては従来より多くの方法が提示されている。
例えば橋本新一部著r文字認識概論」オーム社(198
2年)などに詳説されている。しかし文字画像には、ノ
イズ、字体の多さ1人間の手書き文字の場合には個人差
などの変動要因が多く、認識が困難な場合も多い、近年
になってこれらの手法とは異なるニューラルネットを用
いて文字カテゴリの識別処理を行う手法が開発されつつ
ある。
ニューラルぶソトは人間の脳を真(以た不ノトワーりで
あり、脳のニューロンに対応したユニ・7トが複数個、
複雑に接続している。各ユニットの動作、およびユニッ
ト間の接続形態を適切に定めることでパターン認識機能
を実施させることができる。
このネットワークの一例を第6図を用いて簡単に説明す
る。ニューラルネットはjbyトワークの構造から大き
くパターン連想型と自動連想型の2つに分類される。パ
ターン連想型とは入カバターンをある出カバターンに変
換するネットワークであり、自動連想型とは複数のパタ
ーンをネットワークに格納し、入カバターンに最も近い
パターンを出力するネットワークである。第6図は連想
型のニューラルネットワークを示し、入力層、中間層。
出力層という階層構造を採る。ここで中間層は”hid
den 1ayer’と呼ばれ重要な働きをする。ネッ
トワークは入力層、中間層、出力層の方向に結合してい
るが、各層内での結合はなく、出力層から入力層に向う
結合もない。つまり”feedforiiard”のネ
ットワークである。各層の各ユニットの結合強さは可変
の重みW i jによって表わされている。
27トワークの学習は次のように行う。人力層の各ユニ
ットに入力データを与え、この入力データを各ユニット
で変換じて中間層ココ伝え、最後に出力層から出力する
。この出力値と望ましい出力値とを比較し、その差を減
らすように重みW目を変えてゆく。故に重みWijの学
習はfeedbackとなる。なお詳細はj口径エレク
トロニクス1987.8゜10 (No、427)号J
に記載されている。
第5図はニューラルネットを文字認識に用いた場合の説
明図である。ニューラルぶノドは入力層11、中間層1
2.出力層13の3層から成る多層構造をとり、入力層
11に文字画像データを直接あるいは特徴量に変換して
入力し、出力層13に望ましい出力としての教師信号を
与えて学習させ、多数の文字データを記憶させる。第5
図の場合、数字の2を横方向に走査して2値データとし
て入力し学習させている状況を表わす。文字認識を行う
場合は、判別したい文字画像データを入力層より人力し
、出力により文字カテゴリの識別を行う。
なお、ニューラルネットを用いた方法の特徴として、内
部的には分散表現がとられ、並列処理が行なわれるため
に雑音に強いこと、また学習させることにより多くのカ
テゴリを記憶できることがあげられる。特にフィードフ
ォワード形におけるハックプロパゲーション法により学
習が容易に行われ、認識性能も従来のニューラルネット
を用いない手法と同等となってきている。
発明が解決しようとする課題 しかし、ニューラルネットによる識別を行う場合、特に
フィードフォワード形のネットワークにハックプロパゲ
ーション手法を用いる場合、文字の位置、角度の変動に
非常に弱いという欠点があった。これを第5図を用いて
説明すると、第5図の場合、文字2を走査し一次元のデ
ータとして入力している。これはこの文字画像の位置情
報を入力しているにすぎない。またこの場合隣接するデ
ータとの相関が与えられておらず、−次元のビットパタ
ーンを与えていることになり、位置ずれにより全く異な
るビットパターンになってしまい認、識できない場合が
生しる。このため変動に強い特徴量を抽出して与える試
みがなされた。例えば、電子情報通信学会研究報告P 
RV8B−1501’複数の特徴ヘクトルを利用したニ
ューラル2・ノドによる手書き文字認tJhs加藤誠巳
他、電子情報通信学会パターン認識・理解研究会、技術
研究報告1988年Nn150において、その成果が述
べられているが、従来からの手法に比べて性能は向上し
ておらず、またフィードフォワード形のニューラルネッ
トが一種の非線形識別関数を用いたバタンマツチングを
行っていると考えられ、諸々の特徴量が必ずしもニュー
ラルネットを用いた認識機構に最適ではなかった。
本発明は上述の問題点に鑑みてなされたものであり、文
字画像の変動に強く、ニューラルネットに適した特徴量
を用いた文字認識装置を提供することを目的とする。
tliMを解決するための手段 上記目的を達成するため、対象文字を細線化して所定長
さに分割し、各々の角度情報1位置情報をニューラルフ
ットに入力するようにしたものであり、本発明の文字認
識装置は、文字を含む画像データから文字部分を切り出
しこの文字画像を細線化する細線化手段と、この細線化
された画像を所定の長さの線分に分割しこの分割された
線分の角度情報と位置情報を含む特徴量を抽出する特徴
抽出部と、この特徴量を入力し識別文字を出力するニュ
ーラルネットとを備えたものである。また、前記ニュー
ラルネットの入力層は、前記特徴量の角度情報に応した
数の入力部を有するようにするとよい。また、前記分割
された線分の角度情報および位置情報を、隣接する線分
の角度情報および位置情報に応じて修正し前記特徴量と
するとよい3作用 識別対象文字を細線化し、所定の長さに分割し、分割し
た各長さの角度情報と位置情報をニューラルネットの入
力としているので識別情報が多(なり識別の精度が向上
する。また位置情報はx、  yの2次元情報であり、
これに角度情報が加わると3次元となるので、ニューラ
ルネットの入力部を角度情報に応し7た数だけ設けて入
力することにより、2次元ココ−ラル不フトで3次元入
力を可能とする。また、分割された線分の角度情報およ
び位置情報を隣接する線分の角度情報および位置情報に
応じて修正して特徴量を生成することにより、隣接情報
との相関が与えられるため認識性能が向上する。
実施例 以下、本発明の一実施例を第1図〜第4図を用いて説明
する。第1図は本実施例の構成を示すブロック図である
。本実施例の文字認識装置は、文字を含む画像データか
ら文字部分を切り出しこの文字画像を細線化する細線化
部1と、この細線化した画像を所定の長さの線分に分割
し、この分割された線分iの角度情報θ、と位置情報(
X、5y、)を抽出する特徴抽出部2と、ニューラルネ
ットからなり、このニューラルネットは、入力層3と、
中間層4と、中間層5と、出力層6よりなる。人力層3
は角度割に入力部を有し、0度入力部3L 45度入力
部32.90度入力部33.135度入力部34よりな
る。また中間層4は各入力部31〜34に対応じて中間
層、11.42.43.44から構成される。
次に動作について第2図〜第4図を用いて説明する。第
2図は本実施例の動作を示すフロー図である。ステップ
21で細線化部lに文字を含む画像を入力し、1文字分
の画像を切り出し、細線化処理を行う(ステップ22)
、細線化の手法としては、種々の手法が公表されている
。(例えば、C,J。
Hilditch : Linear 5keleto
ns from 5quare Cupb。
ards、 Machine Intelligenc
e 4. B、 Melzer他編。
tlniversity Press、 f!dinb
urgh、PP、403〜420.1969年を用いる
ことができる。、)次に特徴抽出部2へ入力しこの細線
化済み画像データを一定の長さに分割する(ステップ2
3)。これは例えば、画像をスキャンしてゆき、最初の
端点を探し、そこから順次8近傍をたどってゆく、そし
て一定長(例えば5N素)毎に区切り1つの線分とし、
さらに次の線分を追跡してゆく。丁字形や十字形になっ
ている部分は、追跡してきた方向に近い方をたどること
にし、残った部分は1回の追跡が終わった後、前述の端
点のスキャンから再度始めることですべての文字線が線
分に分割できる。
以上の処理を第3図に示す。第3図は認識対象文字を2
とした場合を示したもので、(a)は細線化した結果を
示し、(b)は一定の長さに分割した状況を示す。次に
各線分のX軸方向(第3図(a)に示す)に対する角度
を夏山するとともにその線分の中心点の座標を夏出し、
角度情報0.2位1情報(X、。
ylを特徴量として抽出する(ステップ24)。
角度θ、については、360度でなく0度〜180度以
内に換算する。例えば、270度は90度とする。
また、ココ一うルネットの入力部は0度入力部31゜4
5度入力32.90度入力部33.135度入力部34
の4つしか設けていない、このため角度θ、が入力部3
の各角度と異なる時はその角度θ、の両側に位置する入
力部にその入力部の角度との差に応じて分割して入力す
る5例えばθ1−45度のときは45度入力部32への
入力値は1で他へは0.θ、−30度のときは30度の
線分は30/45−0.7より、45度入力部32への
人力が0.7で0度入力部31への入力を0.3とする
。第4図はこの状態を表した図である。
第3図fb)に示す各線分の角度別の分布を示したもの
で第4図(ajは0度の線分を示し、黒丸が0度の線分
のある位置を示す、(a)に示すように3つの線分ば0
度である。(bjは45度の線分、(C)は90度。
(a)は135度の線分を示す5次にステップ25に示
す隣接情報による修正を行う、これは隣接する線分の角
度情報1位置情報に所定の重みづけをして加えてもよく
、またガウシアン分布型のフィルタ演算を施してもよい
。この−例を第4図のCe)〜(fi)に示す、(e)
は0度の両隣である135度、45度の線分の角度情報
、位置情報に所定の重みづけして加えたものである。C
e)において、(a)の黒丸は大きく表し、(b)の黒
丸が小さい値で加算され、(d)の黒丸の影響は表われ
ていない、これにより(ejは、(a)を基本とし、そ
の両隣の情報を加味した状況を表している。ここで黒丸
の大きさは強さを表している。
当然0度の(aJの影響が最も大きい、(f)は(b)
を基本とし、その両隣の「a)と(C)の影響を反映し
ている。
以下(g)、 <h)も同様である。このように処理さ
れた(e)〜(ハ)のデータを入力部31〜34にそれ
ぞれ入力することによりニューうルふ・ノドに学習、認
識させる。各人力部31〜34に人力されたデータは中
間層4.5を経て出力層6へと順次出力が伝播し、出力
層6は例えば、カテゴリ別に1つのニューロンが割り当
てられており、これを用いて学習、認識が行われる。こ
こでネットワークはフィードフォワード形に必ずしも限
定するものでなく、また層数も一例を示したものである
発明の効果 以上の説明から明らかなように、本発明は文字画像デー
タから位置情報と角度情報を含む特徴量を抽出してニュ
ーラル不ントに入力することにより文字認識性能を向上
させることができる。さらにこの特徴量に隣接するデー
タの情報を加味することにより認識性能をさらに向上さ
せることができる。
【図面の簡単な説明】
第1図は本発明の実施例の構成を示すブロンク図、第2
図は本実施例の動作を示すフロー図、第3図は細線化処
理および所定長さに分割する処理を説明する図、第4図
は角度別に分割する処理および隣接情報を加味する処理
を説明する図、第5図は従来のニューラルネットで文字
認識をiテう説明図、第6図は連想型のニューラルネッ
トワークを説明する図である。 l・・・・・・細線化部、2・・・・−・特徴抽出部、
3・〜・・・・入力層、4,5・・・・・・中間層、6
・−・・・・出力層。 代理人の氏名 弁理士 小鍜治 明 ほか2名第 l 
図 /6 へ7J 第2図 第3図 (υ) 第4図 te)(f)   t9)   (h)第5図

Claims (3)

    【特許請求の範囲】
  1. (1)文字を含む画像データから文字部分を切り出しこ
    の文字画像を細線化する細線化手段と、この細線化され
    た画像を所定の長さの線分に分割しこの分割された線分
    の角度情報と位置情報を含む特徴量を抽出する特徴抽出
    部と、この特徴量を入力し識別文字を出力するニューラ
    ルネットとを備えたことを特徴とする文字認識装置。
  2. (2)前記ニューラルネットの入力層は、前記特徴量の
    角度情報に応じた数の入力部を有することを特徴とする
    請求項1記載の文字認識装置。
  3. (3)前記分割された線分の角度情報および位置情報を
    隣接する線分の角度情報および位置情報に応じて修正し
    前記特徴量とすることを特徴とする請求項1または2記
    載の文字認識装置。
JP2303641A 1990-11-07 1990-11-07 文字認識装置 Pending JPH04177485A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2303641A JPH04177485A (ja) 1990-11-07 1990-11-07 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2303641A JPH04177485A (ja) 1990-11-07 1990-11-07 文字認識装置

Publications (1)

Publication Number Publication Date
JPH04177485A true JPH04177485A (ja) 1992-06-24

Family

ID=17923446

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2303641A Pending JPH04177485A (ja) 1990-11-07 1990-11-07 文字認識装置

Country Status (1)

Country Link
JP (1) JPH04177485A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6188790B1 (en) 1996-02-29 2001-02-13 Tottori Sanyo Electric Ltd. Method and apparatus for pre-recognition character processing
CN115393856A (zh) * 2022-06-14 2022-11-25 国网浙江省电力有限公司丽水供电公司 一种光学字符识别系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58163080A (ja) * 1982-03-23 1983-09-27 Fujitsu Ltd 文字の特徴抽出方式
JPS63298494A (ja) * 1987-05-29 1988-12-06 Hitachi Ltd パタ−ン認識装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58163080A (ja) * 1982-03-23 1983-09-27 Fujitsu Ltd 文字の特徴抽出方式
JPS63298494A (ja) * 1987-05-29 1988-12-06 Hitachi Ltd パタ−ン認識装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6188790B1 (en) 1996-02-29 2001-02-13 Tottori Sanyo Electric Ltd. Method and apparatus for pre-recognition character processing
CN115393856A (zh) * 2022-06-14 2022-11-25 国网浙江省电力有限公司丽水供电公司 一种光学字符识别系统及方法
CN115393856B (zh) * 2022-06-14 2025-09-23 国网浙江省电力有限公司丽水供电公司 一种光学字符识别系统及方法

Similar Documents

Publication Publication Date Title
Chang et al. A new model for fingerprint classification by ridge distribution sequences
CN111652332B (zh) 基于二分类的深度学习手写中文字符识别方法及系统
JP2022532177A (ja) 偽造された顔の認識方法、装置、および非一時的コンピュータ可読記憶媒体
CN111311702B (zh) 一种基于BlockGAN的图像生成和识别模块及方法
CN115862045B (zh) 基于图文识别技术的病例自动识别方法、系统、设备及存储介质
CN115880704B (zh) 一种病例的自动编目方法、系统、设备及存储介质
JP2010134957A (ja) パターン認識方法
CN115170876B (zh) 一种基于因果干涉注意力的图像识别方法
CN115881265A (zh) 电子病历智能病案质控方法、系统、设备及存储介质
JPH08167000A (ja) 文字認識装置および方法
CN116543437B (zh) 一种基于遮挡-特征映射关系的遮挡人脸识别方法
US6233352B1 (en) Information processing method and apparatus
JPH04177485A (ja) 文字認識装置
CN117237937A (zh) 一种基于PointNet++网络的无序零件识别方法
Ajao et al. Yoruba handwriting word recognition quality evaluation of preprocessing attributes using information theory approach
Roth An approach to recognition of printed music
CN118196569A (zh) 一种基于cnn和lstm的跨媒体目标检测方法
CN117037904B (zh) 一种基于图像的dna甲基化位点识别方法
Rehman Neural computing for online Arabic handwriting recognition using hard stroke features mining
Mokshith Reddy et al. Signature Verification using Edge Detection and Oc-Svm
CN113554571B (zh) 一种图像去雾方法、装置、电子设备及存储介质
CN111553336B (zh) 基于连体段的印刷体维吾尔文文档图像识别系统及方法
Wang et al. The research of microscopic image segmentation and recognition on the cancer cells fallen into peritoneal effusion
Ravi et al. Fuzzy logic based character recognizer
Nguyen-Tan et al. Handwriting recognition using B-Spline curve