JPH0338630B2 - - Google Patents

Info

Publication number
JPH0338630B2
JPH0338630B2 JP59192330A JP19233084A JPH0338630B2 JP H0338630 B2 JPH0338630 B2 JP H0338630B2 JP 59192330 A JP59192330 A JP 59192330A JP 19233084 A JP19233084 A JP 19233084A JP H0338630 B2 JPH0338630 B2 JP H0338630B2
Authority
JP
Japan
Prior art keywords
character type
similarity
recognition
categories
priority
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP59192330A
Other languages
English (en)
Other versions
JPS6170678A (ja
Inventor
Hiroshi Matsumura
Tatsunosuke Iwahara
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP59192330A priority Critical patent/JPS6170678A/ja
Publication of JPS6170678A publication Critical patent/JPS6170678A/ja
Publication of JPH0338630B2 publication Critical patent/JPH0338630B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (イ) 産業上の利用分野 本発明は、手書き漢字を認識する文字認識シス
テムに係り、候補字種カテゴリーの認識順位決定
方式に関する。
(ロ) 従来の技術 一般に、文字認識システムでは、入力文字パタ
ーンから抽出した特徴パターンと、予め辞書部に
登録された字種カテゴリー毎の標準特徴パターン
との類似度を計算し、類似度の大きいn個の候補
字種カテゴリーを選択する。そして、類似度の最
も大きい候補字種カテゴリーを認識結果として出
力すると共に、誤認識の訂正のために、選択した
n個の候補字種カテゴリーには、類似度の大きい
順の第1位から第n位までの認識順位を決定して
おく。
ところが、上述の如く、認識順位の決定に類似
度のみを用いていたのでは誤認識が多く、そこ
で、類似度による複数の候補字種カテゴリーの選
択後に、何らかの後処理を施して認識順位を決定
する方式が考えられるようになつた。
そして、従来、後処理としては、特開昭59−
32082号公報に開示されているように、文法的処
理を行なうものや、特開昭59−27381号公報のよ
うに、被認識文字の前後の文字が、漢字か、カタ
カナかあるいはひらがらを判定するものが提案さ
れていた。
(ハ) 発明が解決しようとする問題点 従来の技術においては、文法的処理を後処理と
して行なうので、文法的な辞書等の知識部が莫大
となり、更には、その処理内容が非常に複雑にな
るという問題があり、又、前後の文字が、漢字か
カタカナか等を判定する方式では、選択した候補
字種カテゴリーが漢字やひらがなばかりである場
合には、認識率の向上は期待できなかつた。
そこで、本願出願人は、莫大な知識部を必要と
せず、短かい処理時間で認識率を向上させるた
め、学校教育の学習段階あるいは頻度等に応じ
て、字種カテゴリーの各々に優先度を定めてお
き、この優先度を用いて類似度計算により得られ
た複数の候補字種カテゴリーの認識順位を決定し
ようとしたが、候補字種カテゴリー全てについて
優先度による認識順位の入れ換えを行なうと、類
似度が非常に大きくても優先度が低いと認識順位
が下位に落ちてしまつたり、逆に、類似度が非常
に小さくても他に優先度の高い字種カテゴリーが
ないと、この字種カテゴリーが上位に来てしま
い、このために、誤認識が起るという問題が出て
きた。
(ニ) 問題点を解決するための手段 本発明は、字種カテゴリーの各々に優先度を定
めておくと共に、計算結果としての類似度を複数
の閾値と比較することにより、複数の候補字種カ
テゴリーをクラス分けし、このクラス内でのみ優
先度に基づく認識順位の入れ換えを行なつて、最
終的な認識順位を決定するものである。
(ホ) 作用 本発明では、類似度が似通つた候補字種カテゴ
リー同志で、優先度による順位入れ換えが行なわ
れることとなり、類似度が大きく異なものについ
ては、優先度による入れ換えは行なわれない。
(ヘ) 実施例 第1図は、本発明を適用した文字認識システム
のブロツク図であり、(1)は入力用原稿に書かれた
文字を読取り、読取り結果を2値の文字パターン
として出力する文字観測部、(2)は入力文字パター
ンから特徴パターンを抽出する特徴抽出部、(3)は
字種カテゴリー毎の標準特徴パターンを記憶した
辞書部、(4)は抽出した特徴パターンと標準特徴パ
ターンとのマツチングを行ない、両パターンの類
似度を計算するパターンマツチング部である。
辞書部3の字種カテゴリーは、頻度あるいは学
校教育の学習段階に応じたカテゴリー分けが為さ
れており、各カテゴリーセツトに優先度が定めら
れている。例えば、第2図に示すように、小学校
1〜3年で学習する字種カテゴリーをカテゴリー
セツト1,3a、小学校4〜6年で学習する字種
カテゴリーをカテゴリーセツト2,3b、中学校
以上で学習する字種カテゴリーをカテゴリーセツ
ト3,3c、というように全ての字種カテゴリー
を3つのカテゴリーセツトに分け、カテゴリーセ
ツト1〜3に順に優先度0〜2を定めている。
パターンマツチング部4は、カテゴリーセツト
1〜3に各々対応する3つの演算部4a〜4cを
備えており、各演算部は各カテゴリーセツトの中
から類似度の大きい順にn個の候補字種カテゴリ
ーを選択し、その字種コード及び計算結果として
の類似度を、候補メモリ5に格納する。この際、
演算部では対応するカテゴリーセツトの優先度を
字種コード及び類似度に付加し、これら3つの情
報が各々の候補字種カテゴリーの情報として候補
メモリ5に記憶される。このようにして、候補メ
モリ5には、各カテゴリーセツトの中からn個づ
つ、合計3n個の候補字種カテゴリーが記憶され
る。
更に、第1図において、6は頻似度と優先度と
の関係を記憶した知識部、7はこの知識部6の内
容を参照して、候補メモリ5に記憶された3n個
の候補字種カテゴリーのうち上位n個の認識順位
を決定し、その字種コードを認識順位順に結果メ
モリ8に格納するクラスタリング制御処理部であ
つて、答出力制御部9は、認識順位が第1位の字
種コードを認識結果としてワープロあるいはパソ
コン等の文字表示装置に出力し、その字種の表示
を行なわせる。そして、答出力制御部9はオペレ
ータから誤認識の指示があれば、第2位以下の字
種コードを順次出力し、正しい認識結果が表示さ
れるように出力の制御を行なう。
次に、クラスタリング制御処理部7の処理及び
知識部6の内容について、更に詳しく説明する。
本実施例では、類似度としてシテイブロツク距
離dを用い、この距離が小さいほど類似度が大き
いとしており、知識部6には、各候補字種カテゴ
リーのシテイブロツク距離dを比較するための複
数の閾値D〓,D〓,D〓(D〓<D〓<D〓)が記憶されて
いる。クラスタリング制御処理部7は、第3図の
フローチヤートに示すように、先ず、候補メモリ
5に記憶された3n個の候補字種カテゴリーの中
から、距離が小さい順にn個の候補字種カテゴリ
ーG1,G2,……,Goを選択し、これらを順に作
業メモリ7aに記憶する。そして、これらn個の
候補字種カテゴリーの各々の距離d1,d2,……,
doを複数の閾値D〓,D〓,D〓と比較することによ
り、候補字種カテゴリーG1〜Goを第4図に示す
ような、A,B,C,Dの4つのクラスにクラス
分けを行なう。即ち、クラスタリング制御処理部
7には、各クラス毎に、そのクラスに属する候補
字種カテゴリーが作業メモリ7aのどのアドレス
まで入つているかを示すクラスポインタ10a〜
10dを備えており、第3図のフローチヤートに
示すように、各ポインタ10a,10b,10
c,10dの内容TA,TB,TC,TDが、距離
の比較の際インクリメントされて行く。例えば、
作業メモリ7aのアドレス0〜1にAクラス、ア
ドレス2〜4にBクス、アドレス5〜6にCクラ
ス、アドレス7にDクラスの候補字種カテゴリー
が記憶されていれば、クラス分けにより、各ポイ
ンタの内容は、TA=2,TB=5,TC=7,
TD=8となる。
ところで、知識部6には、第4図に示すよう
に、各クラスにおける優先度による順位入れ換え
の可否が予め記憶されており、Aクラスでは優先
度による順位入れ換えを行なわず、B及びCクラ
スでは同じクラス内のみで優先度による順位入れ
換えを行なうように定めている。そして、クラス
タリング制御処理部7はこの知識部6の内容を参
照して認識順位の決定を行なう。
ここで、字種コードがMI,シテイブロツク距
離がdI,優先度がPI(I=A,B,……,H,K,
L,……,R,S,T,……,Z,DI=0,1,
2)の候補字種カテゴリーGIを(MI,dI,PI
と表わすこととし、今、仮に、第5図イに示すよ
うに、カテゴリーセツト1〜3の各々々から、類
似度が大きい上位8個づつの候補字種カテゴリー
が候補メモリ5に選択され、各シテイブロツク距
離dIの関係が、dS<dK<dT<dA<dL<dU<dB<dM
<……であつたとすると、クラスタリング制御処
理部7の作業メモリ7aには、第5図ロに示すよ
うに、距離dIが小さい順に8個の候補字種カテゴ
リーGS〜GMが選択記憶される。
そこで、これら8個の候補字種カテゴリー全て
を優先度PIに基づいて順位入れ換えを行なうと、
結果メモリ8には、第5図ハに示すような順位で
字種コードMA〜MUが記憶され、類似度が第1位
の字種コードMSは、優先度が「2」と低いため
第6位に、そして、類似度が第7位の字種コード
MSは優先度が「0」と高いため第2位に、各々
順位が決定されてしまう。
ところが、候補字種カテゴリーの各シテイブロ
ツク距離dIと閾値D〓,D〓,D〓との関係が、例え
ば、dS<D〓<dK,dL<D〓<dU,dM<D〓であつた
とすると、本実施例では、クラスタリング制御処
理部7がクラス分けを行なうため、各クラスポイ
ンタ10a〜10dの内容は、TA=1,TB=
5,TC=8,TD=0となり、候補字種カテゴ
リーGSがAクラス、候補字種カテゴリーGK,GT
GA,GLがBクラス、候補字種カテゴリーGU
GB,GMがCクラスにクラス分けされる。そして
クラスタリング制御処理部7は、Aクラスの字種
コードMSを第1位の認識順位としてそのまま結
果メモリ8に記憶し、次にBクラスの4つの字種
コードMK,MT,MA,MLを優先度により順位の
入れ換えを行なう。即ち、これらの優先度は、
PK=1,PT=2,PA=0,PL=1なので、順位
はMA,MK,ML,MTとなり、この順に結果メ
モリ8に記憶される。Cクラスの字種コードにつ
いても同様、優先度による順位入れ換えが行なわ
れ、順位はMB,MM,MUとなり、従つて、結果
メモリ8には、第5図ニに示すように、認識順位
が決定される。
第5図ニを第5図ハと比較すれば明らかなよう
に、本発明では、類似度が似通つた候補字種カテ
ゴリーの中だけで、優先度による順位入れ換えが
行なわれることとなり、類似度が極端に小さい候
補が上位の認識順位に来たり、類似度が大きい候
補が非常に下位の認識順位に落ちてしまうことが
ない。即ち、類似度の計算結果を基本にし、優先
度を補助的に用いる順位決定方式が実現される。
ところで、本実施例では、辞書部3を優先度に
応じたカテゴリーセツトに分割したが、各字種カ
テゴリーに優先度情報を付加しておけば、必ずし
も辞書部3を分割するる必要はない。
(ト) 発明の効果 本発明に依れば、類似度が似通つた候補字種カ
テゴリーの中だけで、優先度による認識順位の入
れ換えが行なわれ、類似度が大きく異なるものに
ついては優先度による入れ換えが行なわれないの
で、類似度を基本し、優先度を補助的に用いる理
想的な順位決定方式が実現され、認識率が向上す
る。
【図面の簡単な説明】
第1図は本発明を適用した文字認識システムの
ブロツク図、第2図はカテゴリーセツトの内容を
示す説明図、第3図はクラスタリング制御処理部
の処理内容の一部を示すフローチヤート、第4図
は知識部の内容を示す説明図、第5図は認識順位
決定の具体例を示す説明図である。 主な図番の説明、3…辞書部、4…パターンマ
ツチング部、5…候補メモリ、6…知識部、7…
クラスタリング制御部、8…結果メモリ、9…答
出力制御部。

Claims (1)

    【特許請求の範囲】
  1. 1 入力文字パターンから抽出した特徴パターン
    と、予め辞書部に登録された字種カテゴリー毎の
    標準特徴パターンとの類似度を計算し、複数の候
    補字種カテゴリーを選択する文字認識システムに
    おいて、前記字種カテゴリーの各々に優先度を定
    めておくと共に、前記計算結果としての類似度を
    複数の閾値と比較することにより前記複数の候補
    字種カテゴリーをクラス分けし、該クラス内のみ
    で前記優先度に基づく候補字種カテゴリーの認識
    順位の入れ換えを行なうようにしたことを特徴と
    する認識順位決定方式。
JP59192330A 1984-09-13 1984-09-13 認識順位決定方式 Granted JPS6170678A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59192330A JPS6170678A (ja) 1984-09-13 1984-09-13 認識順位決定方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59192330A JPS6170678A (ja) 1984-09-13 1984-09-13 認識順位決定方式

Publications (2)

Publication Number Publication Date
JPS6170678A JPS6170678A (ja) 1986-04-11
JPH0338630B2 true JPH0338630B2 (ja) 1991-06-11

Family

ID=16289489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59192330A Granted JPS6170678A (ja) 1984-09-13 1984-09-13 認識順位決定方式

Country Status (1)

Country Link
JP (1) JPS6170678A (ja)

Also Published As

Publication number Publication date
JPS6170678A (ja) 1986-04-11

Similar Documents

Publication Publication Date Title
US4677585A (en) Method for obtaining common mode information and common field attribute information for a plurality of card images
JPH11120293A (ja) 文字認識/修正方式
WO1995017734A1 (en) Method and apparatus for pattern recognition, and method of compiling dictionary for pattern recognition
KR930010909B1 (ko) 한글자모열로부터의 한글문자 인식방법
JPH0338630B2 (ja)
JPH0338631B2 (ja)
JPH0337231B2 (ja)
JP3109476B2 (ja) 候補数制御機能付き文字認識装置及び方法
JPS6162986A (ja) 認識順位決定方式
JPS62251986A (ja) 誤読文字訂正処理装置
JP2639314B2 (ja) 文字認識方式
JPS6186883A (ja) オンライン手書き文字認識方式
JPH08190603A (ja) 文字認識装置及びその候補文字表示方法
JPS6162985A (ja) 認識順位決定方式
JPS60247793A (ja) オンライン手書文字認識装置
JPH05298489A (ja) 文字認識方式
JPS62281082A (ja) 文字認識装置
JP2878772B2 (ja) 光学的文字読取装置
JP3138665B2 (ja) 手書き文字認識方式および記録媒体
JP2765617B2 (ja) 文字認識装置
JPH0827819B2 (ja) 手書き文字認識の侯補文字表示方法及びそれを用いた手書き文字認識装置
JPS62236087A (ja) 文字認識装置
JPH0944606A (ja) 文字認識処理方法
JPH08147406A (ja) 文字認識装置
JPH0934890A (ja) 手書き文字入力装置及び仮名漢字変換方法