JPH0253831B2 - - Google Patents

Info

Publication number
JPH0253831B2
JPH0253831B2 JP57111262A JP11126282A JPH0253831B2 JP H0253831 B2 JPH0253831 B2 JP H0253831B2 JP 57111262 A JP57111262 A JP 57111262A JP 11126282 A JP11126282 A JP 11126282A JP H0253831 B2 JPH0253831 B2 JP H0253831B2
Authority
JP
Japan
Prior art keywords
character
series
dictionary
line segments
partial pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP57111262A
Other languages
English (en)
Other versions
JPS592193A (ja
Inventor
Yoshihisa Fujii
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57111262A priority Critical patent/JPS592193A/ja
Publication of JPS592193A publication Critical patent/JPS592193A/ja
Publication of JPH0253831B2 publication Critical patent/JPH0253831B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (A) 発明の技術分野 本発明は、文字認識装置、特に漢字を例えば
「へん」と「つくり」とに分離して認識精度を高
めるようにした文字認識装置において、文字スト
ロークによつて挾まれる白領域を代表する文字内
部線分を抽出して、その系列を求め、当該系列の
発生態様にもとづいて、1つの文字を部分パター
ンに分離するようにした文字認識装置に関するも
のである。
(B) 技術の背景と問題点 漢字認識処理に当つては、先づ何んらかの公知
の手段によつて大分類を行い、その上で認識対象
文字を例えば「へん」、「かんむり」、「つくり」な
どの部分パターンに分離して夫々を認識し、全体
としての認識精度を向上させることが考慮されて
いる。
しかし、漢字特に手書き漢字の場合には、例え
ば「へん」と「つくり」とが部分的に接触してい
たりして、必らずしも十分な分離を行うことがで
きず、正しく分離しようとすると部分パターンの
種類によつて処理の仕方を異にする必要があるな
ど汎用性に欠けるという難点をもつている。
(C) 発明の目的と構成 本発明は上記の点を解決することを目的として
おり、本発明の文字認識装置は、認識対象漢字文
字を走査して特徴を抽出し、標準漢字文字に対応
した特徴が格納されている辞書の内容と照合し
て、上記認識対象漢字文字のカテゴリを決定する
に当つて、単一の文字内を部分パターンに分離し
て認識精度を高めるようにした文字認識装置にお
いて、認識対象漢字文字を水平方向に探索した際
における文字ストロークに挾まれる白領域を代表
する水平方向文字内部線分の系列と、当該認識対
象漢字文字を垂直方向に探索した際における文字
ストロークに挾まれる白領域を代表する垂直方向
文字内部線分の系列とを抽出すると共に、1つの
文字内を分離可能なカテゴリ文字の個々について
当該分離が生じる場合の上記文字内部線分の系列
を部分パターン分離用辞書に格納してなり、上記
抽出された文字内部線分の系列と上記辞書の内容
とを照合し、単一の文字を部分パターンに分離す
るようにしたことを特徴としている。以下図面を
参照しつつ説明する。
(D) 発明の実施例 第1図A,Bは夫々本発明にいう文字内部線分
とそれによる部分パターン分離の概念を説明する
説明図、第2図は本発明に用いられる部分パター
ン分離用辞書の一実施例内容を説明する説明図、
第3図は本発明の一実施例構成を示す。
第1図Aに示す如き手書き漢字1が与えられた
とき、図示矢印方向に走査2を行い、 (i) 背景の左白領域から最初に黒領域に達した点
Aを抽出する。
(ii) 次に黒領域から白領域に達した点aを抽出す
る。
(iii) 次に白領域から黒領域に達した点Bを抽出す
る。
(iv) 次に黒領域から白領域に達した点bを抽出す
る。
〓 (v) 最后に黒領域から背景の右白領域に達した点
nを抽出する。
ようにする。そしてこのように抽出された点aと
点Bとの中央点(仮にP1とする)、点bと点N
との中央点(仮にP2とする)……を求めてお
く。
この状態の下で、第1図図示の場合には上下に
並ぶ走査線に対応して得られた点P1,P2,…
…の夫々について、上下方向に連結して、第1図
に示す如き水平方向文字内部線分L1,L2,…
…を抽出する。なお、このとき、上下に並ぶ2つ
の走査に対応して得られた上記例えば点P1に対
応する点の水平位置が閾値以上離れていれば、線
分L1などが不連続であるとみる。そして、各線
分の始端と終端とが求まると、この両端をいわば
直線で結んだ図示線分L1,L2,……が得られ
る。更に上記始端や終端が文字の黒領域によつて
封さがれている場合(図示黒丸)と封さがれてい
ない場合(図示白丸)とを区別して抽出するよう
にされる。
上記の如き文字内部線分の抽出は、文字を垂直
方向に走査した場合にも同様に得られる。
水平方向に走査した場合に得られる水平方向文
字内部線分は、第1図AやBに示される線分L
1,L2,……のみではないが、第1図A図示の
如く線分L1,L2,L3の系列が存在したり、
また第1図B図示の如く線分L1,L2,L3の
如く系列が存在したりした場合には、当該文字
「教」から左右の各部分パターンに分離され得る
ことを明らかにしている。
このように1つの文字例えば手書き文字「教」
について部分パターンに分離できる水平方向文字
内部線分の系列を種々調査しておき、これらの各
系列を第2図図示の如く部分パターン分離用辞書
に登録しておく。
第2図は、文字「教」を左右に分離する際に現
われる各種の「文字内部線分の系列」を示してい
る。図示の系列は第1図A図示の場合に対応
し、図示の系列は第1図B図示の場合に対応
し、図示の系列は……の如く、一般に複数種類
の系列が登録される。
第3図は本発明の一実施例構成を示している。
図中の符号3は入力文字であつて例えば第1図A
に示される如き文字、4は大分類回路であつて例
えば第1図A図示の文字1が入力されたとき従来
公知の手段によつて候補文字群(例えば教、数、
散……)を抽出するもの、5は部分パターン分離
判定回路であつて公知の手段によつて上記候補文
字群に属する文字が左・右または上・下の部分パ
ターンに分離可能なものか否かを決定するもの、
6は水平方向文字内部線分を抽出してその系列を
得るもの、7は垂直方向文字内部線分を抽出して
その系列を得るもの、8は部分パターン分離用辞
書、9は線分探索回路であつて辞書8の内容と回
路6や7によつて抽出された系列とを照合して部
分パターンを決定するもの、10は部分パターン
辞書であつて各部分パターンについての認識特徴
が格納されているもの、11は判定回路であつて
部分パターン辞書10の内容にもとづいて上記決
定された部分パターンが如何なる形状をもつ部分
パターンであるかを判定して入力文字についての
認識を行い文字コードを出力するものを表わして
いる。
入力文字は大分類回路4によつて例えば(教、
数、散、……)の如き候補文字群に属するものと
判定される。そして入力文字が左・右または上・
下に分類可能か否かを、部分パターン分離判定回
路5が判定する。分離可能な場合、回路6や7に
よつて上述の文字内部線分の系列が上述の如く抽
出される。
この抽出結果は、部分パターン分離用辞書8の
内容と照合され、部分パターンを得る。該部分パ
ターンは判定回路11に導びかれ、部分パターン
辞書10の内容にもとづいて、上記得られた部分
パターンが如何なる形状をもつ部分パターンであ
るかを判定する。そして、判定回路11は、例え
ば第1図A図示の文字が「孝」なる部分パターン
と「父」なる部分パターンとで構成されているこ
とを知つて、第1図A図示の文字が「教」である
ことを決定する。
なお、第3図図示の大分類回路4や部分パター
ン分離判定回路5や判定回路11などにおいて利
用する特徴量については、従来公知のものを利用
することができるが、例えば第1図A図示の点A
を上下方向に連らねた場合に得られる輪郭左線分
系列や点nを上下方向に連らねた場合に得られる
輪郭右線分系列を利用することができる。これら
の特徴を利用する場合には、上記文字内部線分系
列を抽出する処理と同様な処理によつて一緒に抽
出することが可能となる。
(E) 発明の効果 以上説明した如く、本発明によれば、漢字を複
数の部分パターンに分離することが容易となり、
文字認識精度を向上せしめることが可能となる。
【図面の簡単な説明】
第1図A,Bは夫々本発明にいう文字内部線分
とそれによる部分パターン分離の概念を説明する
説明図、第2図は本発明に用いられる部分パター
ン分離用辞書の一実施例内容を説明する説明図、
第3図は本発明の一実施例構成を示す。 図中、1は認識対象の漢字、2は走査線、4は
大分類回路、5は部分パターン分離判定回路、6
は水平方向線分抽出回路、7は垂直方向線分抽出
回路、8は部分パターン分離用辞書、9は線分探
索回路、10は部分パターン辞書、11は判定回
路を表わす。

Claims (1)

    【特許請求の範囲】
  1. 1 認識対象漢字文字を走査して特徴を抽出し、
    標準漢字文字に対応した特徴が格納されている辞
    書の内容と照合して、上記認識対象漢字文字のカ
    テゴリを決定するに当つて、単一の文字内を部分
    パターンに分離して認識精度を高めるようにした
    文字認識装置において、認識対象漢字文字を水平
    方向に探索した際における文字ストロークに挾ま
    れる白領域を代表する水平方向文字内部線分の系
    列と、当該認識対象漢字文字を垂直方向に探索し
    た際における文字ストロークに挾まれる白領域を
    代表する垂直方向文字内部線分の系列とを抽出す
    ると共に、1つの文字内を分離可能なカテゴリ文
    字の個々について当該分離が生じる場合の上記文
    字内部線分の系列を部分パターン分離用辞書に格
    納してなり、上記抽出された文字内部線分の系列
    と上記辞書の内容とを照合し、単一の文字を部分
    パターンに分離するようにしたことを特徴とする
    文字認識装置。
JP57111262A 1982-06-28 1982-06-28 文字認識装置 Granted JPS592193A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57111262A JPS592193A (ja) 1982-06-28 1982-06-28 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57111262A JPS592193A (ja) 1982-06-28 1982-06-28 文字認識装置

Publications (2)

Publication Number Publication Date
JPS592193A JPS592193A (ja) 1984-01-07
JPH0253831B2 true JPH0253831B2 (ja) 1990-11-19

Family

ID=14556737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57111262A Granted JPS592193A (ja) 1982-06-28 1982-06-28 文字認識装置

Country Status (1)

Country Link
JP (1) JPS592193A (ja)

Also Published As

Publication number Publication date
JPS592193A (ja) 1984-01-07

Similar Documents

Publication Publication Date Title
US5668892A (en) Table recognition apparatus
EP0542566A2 (en) Character recognition method and apparatus thereof
JPS5837779A (ja) 文書処理装置
Bai et al. An approach to extracting the target text line from a document image captured by a pen scanner
JPH0253831B2 (ja)
Heutte et al. Combining structural and statistical features for the recognition of handwritten characters
KR19980058349A (ko) 영상정보를 이용한 사람 식별 방법
JPH0253830B2 (ja)
Chen et al. Segmentation of handwritten connected numeral string using background and foreground analysis
JPS57209574A (en) Kanji (chinese characters) recognizing device
KR100248384B1 (ko) 다국어 문서 인식에서 개별 문자 추출 방법 및 그 인식 시스템
JPH0246988B2 (ja)
JP2797523B2 (ja) 図面続取装置
KR100241447B1 (ko) 윤곽선 정보를 이용한 영문/숫자 인식방법
JPS59136879A (ja) 文字認識方式
JPH05120483A (ja) 文字認識装置
JP2578768B2 (ja) 画像処理方法
JPS6252912B2 (ja)
JPS57113185A (en) Character recognition system
Lu et al. A background-thinning based algorithm for separating connected handwritten digit strings
JPS61188679A (ja) ストローク近似直線抽出による文字認識装置及び方法
JPH08202883A (ja) 図面自動入力装置における塗り潰し図形認識方法
JPH0683890A (ja) 図面自動入力装置における線種認識方法
JPS61220081A (ja) パタ−ン切り出し及び認識方式
JPH04222057A (ja) 図面自動入力装置の文字・図形要素認識方法