JPH0338631B2 - - Google Patents
Info
- Publication number
- JPH0338631B2 JPH0338631B2 JP59194128A JP19412884A JPH0338631B2 JP H0338631 B2 JPH0338631 B2 JP H0338631B2 JP 59194128 A JP59194128 A JP 59194128A JP 19412884 A JP19412884 A JP 19412884A JP H0338631 B2 JPH0338631 B2 JP H0338631B2
- Authority
- JP
- Japan
- Prior art keywords
- priority
- character type
- recognition
- difference
- categories
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
(イ) 産業上の利用分野
本発は、手書き漢字を認識する文字認識システ
ムに係り、候補字種カテゴリーの認識順位決定方
式に関する。[Detailed Description of the Invention] (a) Field of Industrial Application The present invention relates to a character recognition system for recognizing handwritten kanji, and relates to a recognition ranking determination method for candidate character type categories.
(ロ) 従来の技術
一搬に、文字認識システムでは、入力文字パタ
ーンから抽出した特徴パターンと、予め辞書部に
登録された字種カテゴリー毎の標準特徴パターン
との類似度を計算し、類似度の大きいn個の候補
字種カテゴリーを選択する。そして、類似度の最
も大きい候補字種カテゴリーを認識結果として出
力すると共に、誤認識の訂正のために、選択した
n個の候補字種カテゴリーには、類似度の大きい
順に第1位から第n位までの認識順位を決定して
おく。(b) Conventional technology First, in a character recognition system, the degree of similarity between a feature pattern extracted from an input character pattern and a standard feature pattern for each character type category registered in advance in a dictionary section is calculated, and the degree of similarity is calculated. n candidate character type categories with a large value are selected. Then, in addition to outputting the candidate character type category with the highest degree of similarity as a recognition result, in order to correct misrecognition, the selected n candidate character type categories are ranked from 1st to nth in order of the degree of similarity. Decide on the recognition ranking up to the first rank.
ところが、上述の如く、認識順位の決定に類似
度のみを用いていたのでは誤認識が多く、そこ
で、類似度による複数の候補字種カテゴリーの選
択後に、何らかの後処理を施して認識順位を決定
する方式が考えられるようになつた。 However, as mentioned above, using only similarity to determine the recognition ranking often results in false recognition, so after selecting multiple candidate character categories based on similarity, some post-processing is performed to determine the recognition ranking. Now I can think of a way to do that.
そして、従来、後処理としては、特開昭59−
32082号公報に開示されているように、文法的処
理を行なうものや、特開昭59−27381号公報のよ
うに、被認識文字の前後の文字が、漢字か、カタ
カナか或いはひらがなかを判定するものが提案さ
れていた。 Conventionally, as post-processing, JP-A-59-
As disclosed in Japanese Patent No. 32082, there are methods that perform grammatical processing, and methods that determine whether the characters before and after the recognized character are kanji, katakana, or hiragana, as in Japanese Patent Application Laid-open No. 59-27381. Something was proposed.
(ハ) 発明が解決しようとする問題点
従来の技術においては、文法的処理を後処理と
して行なうので、文法的な辞書等の知識部が莫大
となり、更には、その処理内容が非常に複雑にな
るという問題があり、又、前後の文字が、漢字か
カタカナか等を判定する方式では、選択した候補
字種カテゴリーが漢字やひらがなばかりである場
合には、認識率の向上は期待できなかつた。(c) Problems to be solved by the invention In the conventional technology, grammatical processing is performed as post-processing, so the knowledge section such as a grammatical dictionary becomes enormous, and furthermore, the processing content becomes extremely complicated. Furthermore, with the method of determining whether the preceding and succeeding characters are kanji or katakana, if the selected candidate character category is only kanji or hiragana, it cannot be expected to improve the recognition rate. .
そこで、本願出願人は、莫大な知識部を必要と
せず、短かい処理時間で認識率を向上させるた
め、学校教育の学習段階あるいは頻度等に応じ
て、字種カデゴリーの各々に優先度を定めてお
き、この優先度と類似度とを用いて複数の候補字
種カテゴリーの認識順位を決定しようとしたが、
類似度と優先度の兼ね合いにより認識率が変わる
ので、この兼ね合いをいかにうまく設定するかと
いうことが問題となつてきた。 Therefore, in order to improve the recognition rate in a short processing time without requiring a huge knowledge department, the applicant set priorities for each character type category according to the learning stage or frequency of school education. I tried to determine the recognition order of multiple candidate character type categories using this priority and similarity, but
Since the recognition rate changes depending on the balance between similarity and priority, the problem has been how to properly set this balance.
(ニ) 問題点を解決するための手段
本発明は、候補字種カテゴリー同志の類似度の
差及び優先度の差を計算し、類似度の差が所定値
より大きい場合は、優先度の差が所定値より大き
いときのみ優先度による認識順位の入れ換えを行
ない、優先度の差が所定値より小さいときは優先
度による認識順位の入れ換えを行なわないように
して、候補字種カテゴリーの認識順位を決定する
ようにしたものである。(d) Means for solving the problem The present invention calculates the difference in similarity and the difference in priority between candidate character type categories, and if the difference in similarity is larger than a predetermined value, the difference in priority is calculated. The recognition order of the candidate character type category is changed by swapping the recognition order based on the priority only when the difference in priority is greater than a predetermined value, and not replacing the recognition order based on the priority when the difference in priority is smaller than the predetermined value. It was decided to do so.
(ホ) 作用
本発明では、類似度がある程度離れた候補字種
カテゴリー同志においては、それらの優先度が接
近しているときには優先度が無視され類似度のみ
により認識順位が決定され、それらの優先度が大
きく異なるときのみに優先度に基づく認識順位が
決定されることとなり、従つて、類似度及び優先
度を共に有効に活用した認識順位の決定が為さ
れ、認識率が向上する。(e) Effect In the present invention, in candidate character type categories whose similarities are separated by a certain degree, when their priorities are close, the priorities are ignored and the recognition order is determined only by the similarity. The recognition order based on the priority is determined only when the degrees are significantly different. Therefore, the recognition order is determined by effectively utilizing both the similarity and the priority, and the recognition rate is improved.
(ヘ) 実施例
第1図は、本発明を適用した文字認識システム
のブロツク図であり、1は入力用原稿に書かれた
文字を読取り、読取り結果を2値の文字パターン
として出力する文字観測部、2は入力文字パター
ンから特徴パターンを抽出する特徴抽出部、3は
字種カテゴリー毎の標準特徴パターンを記憶した
辞書部、4は抽出した特徴パターンと標準特徴パ
ターンとのマツチングを行ない、両パターンの類
似度を計算するパターンマツチング部である。(F) Embodiment Figure 1 is a block diagram of a character recognition system to which the present invention is applied, and 1 is a character observation system that reads characters written on an input manuscript and outputs the reading results as a binary character pattern. 2 is a feature extraction unit that extracts feature patterns from input character patterns; 3 is a dictionary unit that stores standard feature patterns for each character type category; and 4 is a feature extraction unit that matches extracted feature patterns with standard feature patterns; This is a pattern matching unit that calculates the similarity of patterns.
辞書部3の字種カテゴリーは、頻度あるいは学
校教育の学習段階に応じたカテゴリー分けが為さ
れており、各カテゴリーセツトに優先度が定めら
れている。例えば、第2図に示すように、小学校
1〜3年で学習する字種カテゴリーをカテゴリー
セツト1,3a、小学校4〜6年で学習する字種
カテゴリーをカテゴリーセツト2,3b、中学校
以上で学習する字種カテゴリーをカテゴリーセツ
ト3,3c、というように全ての字種カテゴリー
を3つのカテゴリーセツトに分け、カテゴリーセ
ツト1〜3に順に優先度0〜2を定めている。 The character type categories in the dictionary section 3 are divided into categories according to frequency or learning stage of school education, and a priority is determined for each category set. For example, as shown in Figure 2, the glyph categories learned in the first to third years of elementary school are set to category sets 1 and 3a, the glyph categories learned in the fourth to sixth years of elementary school are set to category sets 2 and 3b, and the glyph categories learned in junior high school and above. All character categories are divided into three category sets, such as category sets 3 and 3c, and priorities 0 to 2 are assigned to category sets 1 to 3 in order.
パターンマツチング部4は、カテゴリーセツト
1〜3に各々対応する3つの演算部4a〜4cを
備えており、各演算部に各カテゴリーセツトの中
から類似度の大きい順にn個の候補字種カテゴリ
ーを選択し、その字種コード及び計算結果として
の類似度を、候補メモリ5に格納する。この際、
演算部では対応するカテゴリーセツトの優先度を
字種コード及び類似度に付加し、これら3つの情
報が各々の候補字種カテゴリーの情報として候補
メモリ5に記憶される。このようにして、候補メ
モリ5には、各カテゴリーセツトの中からn個づ
つ、合計3n個の候補字種カテゴリーが記憶され
る。 The pattern matching unit 4 includes three calculation units 4a to 4c corresponding to category sets 1 to 3, respectively, and each calculation unit selects n candidate character type categories from each category set in descending order of similarity. is selected, and its character type code and the degree of similarity as a calculation result are stored in the candidate memory 5. On this occasion,
The calculation unit adds the priority of the corresponding category set to the character type code and similarity, and these three pieces of information are stored in the candidate memory 5 as information for each candidate character type category. In this way, candidate memory 5 stores n candidate character type categories from each category set, for a total of 3n candidate character type categories.
更に、第1図において、6は類似度と優先度と
の関係を記憶した知識部、7はこの知識部6の内
容を参照して、候補メモリ5に記憶された3n個
の候補字種カテゴリーのうち上位n個の認識順位
を決定し、その字種コードを認識順位順に結果メ
モリ8に格納するクラスタリング制御処理部であ
つて、答出力制御部9は、認識順位が第1位の字
種コードを認識結果としてワープロあるいはパソ
コン等の文字表示装置に出力し、その字種の表示
を行なわせる。そして、答出力制御部9はオペレ
ータから誤認識の指示があれば、第2位以下の字
種コードを順次出力し、正しい認識結果が表示さ
れるように出力の制御を行なう。 Further, in FIG. 1, reference numeral 6 denotes a knowledge section that stores the relationship between similarity and priority, and 7 refers to the contents of this knowledge section 6 to determine the 3n candidate character type categories stored in the candidate memory 5. It is a clustering control processing unit that determines the recognition ranking of the top n characters among them and stores the character type codes in the result memory 8 in order of recognition ranking, and the answer output control unit 9 determines the character type with the first recognition ranking. The code is output as a recognition result to a character display device such as a word processor or a personal computer, and the type of character is displayed. If the operator gives an instruction of incorrect recognition, the answer output control section 9 sequentially outputs the second and lower character type codes and controls the output so that the correct recognition result is displayed.
次に、クラスタリング制御処理部7の処理及び
知識部6の内容について、更に詳しく説明する。 Next, the processing of the clustering control processing section 7 and the contents of the knowledge section 6 will be explained in more detail.
本実施例では、類似度としてシテイブロツク距
離dを用い、この距離が小さいほど類似度が大き
いとしており、知識部6には、各候補字種カテゴ
リーのシテイブロツク距離dを比較するための複
数の閾値D〓,D〓,D〓(D〓<D〓<D〓)が記憶されて
いる。クラスタリング制御処理部7は、第3図の
フローチヤートに示すように、先ず、候補メモリ
5に記憶された3n個の候補字種カテゴリーの中
から、距離が小さい順にn個の候補字種カテゴリ
ーG1,G2…Goを選択し、これらを順に作業メモ
リ7aに記憶する。そして、これらn個の候補字
種カテゴリーの各々の距離d1,d2…doを複数の閾
値D〓,D〓,D〓と比較することにより、候補字種
カテゴリーG1〜Goを第4図に示すようなA、B、
C、Dの4つのクラスにクラス分けを行なう。即
ち、クラスタリング制御処理部7には、各クラス
毎に、そのクラスに属する候補字種カテゴリーが
作業メモリ7aのどのアドレスまで入つているか
を示すクラスポインタ10a〜10dを備えてお
り、第3図のフローチヤートに示すように、各ポ
インタ10a,10b,10c,10dの内容
TA、TB、TC、TDが、距離の比較の際インク
リメントされて行く。例えば、作業メモリ7aの
アドレス0〜1にAクラス、アドレス2〜4にB
クラス、アドレス5〜6にCクラス、アドレス7
にDクラスの候補字種カテゴリーが記憶されてい
れば、クラス分けにより、各ボインタの内容は、
TA=2、TB=5、TC=7、TD=8となる。 In this embodiment, the city block distance d is used as the degree of similarity, and it is assumed that the smaller this distance is, the greater the degree of similarity is. Threshold values D〓, D〓, D〓 (D〓<D〓<D〓) are stored. As shown in the flowchart of FIG. 3, the clustering control processing unit 7 first selects n candidate character type categories G from the 3n candidate character type categories stored in the candidate memory 5 in descending order of distance. 1 , G 2 . . . G o are selected and stored in order in the working memory 7a. Then , by comparing distances d 1 , d 2 . A, B, as shown in Figure 4,
Classification is performed into four classes, C and D. That is, the clustering control processing unit 7 is provided with class pointers 10a to 10d for each class, which indicate to which address in the working memory 7a candidate character type categories belonging to that class are stored. As shown in the flowchart, the contents of each pointer 10a, 10b, 10c, 10d
TA, TB, TC, and TD are incremented when comparing distances. For example, class A is assigned to addresses 0 to 1 of the working memory 7a, and class B is assigned to addresses 2 to 4 of the working memory 7a.
Class, address 5-6, C class, address 7
If the D class candidate character type category is stored in , the content of each pointer will be
TA=2, TB=5, TC=7, TD=8.
ところで、知識部6には、第4図に示すよう
に、各クラスにおける優先度による順位入れ換え
の可否及び条件が予め記憶されており、クラスタ
リング制御処理部7は、この知識部6の内容を参
照して、候補メモリ5に記憶された複数の候補字
種カテゴリーの認識順位の決定を行なう。 By the way, as shown in FIG. 4, the knowledge section 6 stores in advance whether or not the order of priority can be changed and the conditions for each class, and the clustering control processing section 7 refers to the contents of this knowledge section 6. Then, the recognition ranking of the plurality of candidate character type categories stored in the candidate memory 5 is determined.
ここで、字種コードがMI,シテイブロツク距
離がdI,優先度がP〓(I=A,B,…H,K,L,
…R,S,T,…Z,PI=0,1,2)の候補字
種カテゴリーGIを(MI,dI,PI)と表わすこと
とし、今、仮に、第5図イに示すように、カテゴ
リーセツト1〜3の各々から、類似度が大きい上
位8個づつの候補字種カテゴリーが候補メモリ5
に選択され、各シテイブロツク距離dIの関係が、
dS<dK<dL<dT<dA<dU<dM<dB<…であつたと
すると、クラスタリング制御処理部7の作業メモ
リ7aには、第5図ロに示すように、距離dIが小
さい順に8個の候補字種カテゴリーGS〜GBが選
択記憶される。 Here, the character type code is M I , the city block distance is d I , and the priority is P〓(I=A, B,...H, K, L,
...R, S, T, ...Z, P I = 0, 1, 2), the candidate character type category G I is expressed as (M I , d I , P I ). As shown in FIG.
is selected, and the relationship between each city block distance d I is
Assuming that d S < d K < d L < d T < d A < d U < d M < d B <..., the working memory 7a of the clustering control processing section 7 has the following information as shown in FIG. , eight candidate character type categories G S to G B are selected and stored in descending order of distance d I .
そこで、候補字種カテゴリーの各シテイブロツ
ク距離dIと閾値D〓,D〓,D〓との関係が、例えば、
dK<D〓<dL,dA<D〓<dU,dB<D〓であつたとす
ると、クラスタリング処理部7によつてクラス分
けが行なわれ、各クラスポインタ10a〜10d
の内容は、TA=2,TB=5,TC8,TD=0と
なる。即ち、候補字種カテゴリーGS,GKがAク
ラスに、候補字種カテゴリーGL,GT,GAがBク
ラスに、そして、候補字種カテゴリーGU,GM,
GBがCクラスにクラス分けされる。次に、クラ
スタリング制御処理部7は知識部6を参照して各
クラスにおける候補字種カテゴリーの順位入れ換
えを行なう。このとき作業メモリ7aのアドレス
0〜7までの候補字種カテゴリーG1〜G8の字種
コードをM(1)〜M(8),シテイブロツク距離
をd(1)〜d(8),優先度をP(1)〜P(8)、
最終認識順位がi位の字種カテゴリーの字種コー
ドをm(i)と定める。 Therefore, the relationship between each city block distance d I of the candidate character type category and the threshold values D〓, D〓, D〓 is, for example,
If d K <D〓<d L , d A <D〓<d U , d B <D〓, the clustering processing unit 7 performs classification, and each class pointer 10a to 10d
The contents are TA=2, TB=5, TC8, TD=0. That is, the candidate character categories G S , G K are in the A class, the candidate character categories GL , G T , and G A are in the B class, and the candidate character categories G U , GM ,
G B is classified into C class. Next, the clustering control processing section 7 refers to the knowledge section 6 and rearranges the ranking of candidate character type categories in each class. At this time, the character type codes of candidate character type categories G1 to G8 at addresses 0 to 7 in the working memory 7a are set to M(1) to M(8), the city block distance is set to d(1) to d(8), Set the priority to P(1) to P(8),
The character type code of the character type category whose final recognition rank is i is defined as m(i).
すると、先ずAクラスの字種カテゴリーについ
ては優先度による入れ換えを行なわないので、字
種コードMS及びMKを第1位m(1)及び第2位
m(2)と決定し、その順位で結果メモリ8に書
込む。次のBクラスの3つの字種コードML,
MT,MAについては第6図のフローチヤートに示
す処理を行なう。即ち、Bクラスの場合は、初期
値としてm(i)=M(TA+1),i=TA+1,
l=TB,τo=aと設定する。 Then, first of all, since the character type category of class A is not replaced by priority, character type codes M S and M K are determined as the first m (1) and the second m (2), and their ranks are The result is written to memory 8. The following three character type codes for B class M L ,
Regarding M T and M A , the processing shown in the flowchart of FIG. 6 is performed. That is, in the case of B class, the initial values are m(i)=M(TA+1), i=TA+1,
Set l=TB and τo=a.
上述の例においては、TA=2、TB=5なの
で、先ずm(3)の字種コードの決定が行なわれ
る。ここで、dT−dL>a,dA−dT>aであり、従
つて、dA−dl>aとする。 In the above example, since TA=2 and TB=5, first the character type code of m(3) is determined. Here, d T −d L >a, d A −d T >a, and therefore d A −d l >a.
先ず、GLとGTの距離の差τ=dT−dLが計算さ
れ、所定値aと比較される。この場合τ>aなの
で、次に優先度の差t=PL−PTが計算され所定
値1と比較される。この場合PLはPTより優先度
が高いので−1となり、m(3)即ちMLとMTの
入れ換えは行なわれない。次にGLとGAの距離の
差γ=dA−dLが計算され、所定値aと比較され、
τ>aなので、優先度の差t=PL−PAが計算さ
れてτが所定値1より大きいかどうかが比較され
る。この場合PAはPLより優先度が高いがt=1
なので、MLとMAとの優先度による入れ換えは行
なわれない。依つて、この時点で第3位の認識順
位m(3)がMLと決定され、M(3)〜M(5)は
ML,MT,MAのままである。そして、次にm
(4)の字種コードの決定を行なう。この場合も、
GTとGAの距離の差τ=dA−dTが計算され、所定
値aと比較される。τ>aなので優先度の差t=
PT−PAが計算され所定値1より大きいかどうか
が比較される。この場合、優先度の差は、t=2
となるので、MTとMAとの優先度による順位入れ
換えが行なわれ依つて認識順位第4位の字種コー
ドm(4)がMAと決定される。m(4)について
の処理が終了すると、i=5となりl=TB=5
と等しくなるので、Bクラスにおける優先度によ
る順位入れ換え処理が終了し、第3位〜第5位の
認識順位は、ML,MA,MTと決定される。尚、
Bクラス内で単純に優先度により順位を決定すれ
ば、MA,ML,MTとなる。 First, the distance difference τ=d T −d L between G L and G T is calculated and compared with a predetermined value a. In this case, since τ>a, next the priority difference t=P L -P T is calculated and compared with the predetermined value 1. In this case, P L has a higher priority than P T , so it becomes -1, and m(3), that is, M L and M T are not swapped. Next, the difference in distance between G L and G A , γ = d A - d L , is calculated and compared with a predetermined value a,
Since τ>a, the priority difference t=P L -P A is calculated and compared to see if τ is larger than a predetermined value 1. In this case, P A has higher priority than P L , but t=1
Therefore, priority swapping between M L and M A is not performed. Therefore, at this point, the third recognition rank m(3) is determined to be M L , and M(3) to M(5) are
M L , M T , and M A remain the same. And then m
(4) The character type code is determined. In this case too,
The distance difference τ=d A −d T between G T and G A is calculated and compared with a predetermined value a. Since τ>a, the difference in priority t=
P T -P A is calculated and compared to see if it is larger than a predetermined value 1. In this case, the difference in priority is t=2
Therefore, the order of M T and M A is exchanged based on the priority, and the character type code m(4) which ranks fourth in the recognition order is determined to be M A. When the processing for m(4) is completed, i=5 and l=TB=5
Therefore, the ranking replacement process based on the priority in the B class is completed, and the recognition rankings of the third to fifth places are determined as M L , MA , and M T . still,
If the order is simply determined based on priority within class B, it becomes M A , M L , and M T .
ところが、例えば、dT−dL≦a,dA−dT≦a,
dA−dL≦aと上述の例に比べて、各候補字種カテ
ゴリーの距離が接近していたとすると、優先度の
差に関係なく優先度による順位入れ換えが行なわ
れるので、この場合の認識順位は、MA,ML,
MTと決定される。 However, for example, d T −d L ≦a, d A −d T ≦a,
If d A − d L ≦ a and the distance between each candidate character type category is closer than in the above example, the recognition in this case The ranking is M A , M L ,
It is determined that M T.
このようにして、決定された字種コードML,
MA,MTは結果メモリ8に送出され、MS,MKに
続いてこの順に記憶される。 In this way, the determined character type code M L ,
M A and M T are sent to the result memory 8 and stored in this order following M S and M K.
次に、クラスタリング制御処理部7は、Cクラ
スの処理に移る。 Next, the clustering control processing section 7 moves on to C class processing.
Cクラスの場合、初期値として、m(i)=M
(TB+1),i=TB+1,l=TC,τp=bと設
定され、Bクラスの場合と同様、第6図のフロー
チヤートに示す処理が行なわれる。例えば、dM
−dU>b,dB−dM>bであるとし、従つて、dB−
dU>bであつたならば、τ=dM−dU>bであり、
MMの優先度はMUの優先度より高いが、優先度の
差t=PU−PM=1≦1であるので、MUとMMと
は優先度による順位入れ換えが行なわれない。次
に、τ=dB−dUが計算されτ>bであつて、且つ
PU−PB=2>1なのでMUとMBが優先度により入
れ換えられ、MB,MM,MUとなつて、第6位の
字種コードm(6)がMBに決定される。そして、
MMとMUとは優先度がMMの方が高いので、これ
らの順位はそのままとなる。従つて、第6位〜第
8位の字種コードがMB,MM,MUと決定され、
結果メモリ(8)にこの順に記憶される。 In the case of C class, as an initial value, m(i)=M
(TB+1), i=TB+1, l=TC, and τ p =b, and the process shown in the flowchart of FIG. 6 is performed as in the case of the B class. For example, d M
−d U >b, d B −d M >b, so d B −
If d U > b, then τ = d M − d U > b,
The priority of M M is higher than the priority of M U , but since the difference in priority is t = P U − P M = 1≦1, M U and M M are not swapped based on priority. . Next, τ=d B −d U is calculated such that τ>b and
Since P U − P B = 2 > 1, M U and M B are exchanged according to priority, becoming M B , M M , M U , and the 6th character type code m (6) is determined as M B. be done. and,
Since M M and M U have a higher priority, their rankings remain unchanged. Therefore, the 6th to 8th character type codes are determined as M B , M M , M U ,
The results are stored in the result memory (8) in this order.
以上のようにして順位が決定されると、結果メ
モリ8には、第5図ハに示すような順位で8個の
字種コードが記憶されることになる。 When the rankings are determined as described above, eight character type codes are stored in the result memory 8 in the rankings shown in FIG. 5C.
このように、本発明では2つの候補字種カテゴ
リーにおいて、その距離の差が所定値より大きい
とき、優先度が接近している場合は、優先度によ
る順位入れ換えが行なわれず、優先度が離れてい
るときのみに優先度による順位入れ換えが行なわ
れる。 In this way, in the present invention, when the difference in the distance between two candidate character type categories is greater than a predetermined value, and the priorities are close, the rankings are not swapped based on the priorities, and the priorities are far apart. Reordering based on priority is performed only when there is a problem.
本実施例においては、優先度を0,1,2の3
段階としたが、その段階を増やしても本発明は適
用可能である。又、本実施例では、辞書部3を優
先度に応じたカテゴリーセツトに分割したが、各
字種カテゴリーに優先度情報を付加しておけば、
必ずしも辞書部3を分割する必要はない。更に具
体的処理においては第6図のフローチヤートとは
逆に、優先度の差をチエツクした後に距離の差を
チエツクしてもよい。 In this embodiment, the priority is 0, 1, and 2.
Although the steps are described above, the present invention is applicable even if the steps are increased. Furthermore, in this embodiment, the dictionary section 3 is divided into category sets according to priorities, but if priority information is added to each character type category,
It is not necessarily necessary to divide the dictionary section 3. Furthermore, in a more specific process, contrary to the flowchart of FIG. 6, the distance difference may be checked after the priority difference is checked.
尚、作業メモリ7aに選択記憶される候補字種
カテゴリーは、各クラスのもの全てを必ずしも含
むわけではなく、全候補字種カテゴリーがBクラ
スあるいはCクラスだけの場合もあり、この場合
はこれらの同一クラス内だけで全ての認識順位が
決定される。 Note that the candidate character type categories selectively stored in the working memory 7a do not necessarily include all of the items in each class, and there are cases where all the candidate character type categories are only B class or C class, and in this case, these All recognition rankings are determined only within the same class.
実験によれば、同一クラスの候補字種カテゴリ
ー全てを優先度により順位の決定を行なつた場合
は、第1位の認識率が約90.0%であつたが、本発
明を適用すると認識率が約92.5%と向上した。 According to experiments, when ranking all candidate character categories in the same class based on priority, the recognition rate for the first place was approximately 90.0%, but when the present invention is applied, the recognition rate increases. This improved to approximately 92.5%.
(ト) 発明の効果
本発明に依れば、類似度と優先度を共に有効に
活用して、候補字種カテゴリーの認識順位を決定
することができ、従つて、認識率が向上する。
又、知識部としては莫大な容量を必要とせず、更
には短かい処理時間で順位の決定が行なえるよう
になる。(G) Effects of the Invention According to the present invention, it is possible to determine the recognition order of candidate character type categories by effectively utilizing both similarity and priority, and therefore, the recognition rate is improved.
Furthermore, the knowledge section does not require a huge capacity, and furthermore, ranking can be determined in a short processing time.
第1図は本発明を適用した文字認識システムの
ブロツク図、第2図はカテゴリーセツトの内容を
示す説明図、第3図はクラスタリング制御処理部
のクラス分け処理の内容を示すフローチヤート、
第4図は知識部の内容を示す説明図、第5図は認
識順位決定の具体例を示す説明図、第6図はクラ
スタリング制御処理部の順位入れ換え処理の内容
を示すフローチヤートである。
主な図番の説明、3…辞書部、4…パターンマ
ツチング部、5…候補メモリ、6…知識部、7…
クラスタリング制御処理部、8…結果メモリ、9
…答出力制御部。
FIG. 1 is a block diagram of a character recognition system to which the present invention is applied, FIG. 2 is an explanatory diagram showing the contents of a category set, and FIG. 3 is a flowchart showing the contents of the classification process of the clustering control processing section.
FIG. 4 is an explanatory diagram showing the contents of the knowledge section, FIG. 5 is an explanatory diagram showing a specific example of recognition ranking determination, and FIG. 6 is a flowchart showing the contents of the ranking replacement process of the clustering control processing section. Explanation of main figure numbers, 3...Dictionary section, 4...Pattern matching section, 5...Candidate memory, 6...Knowledge section, 7...
Clustering control processing unit, 8...Result memory, 9
...Answer output control section.
Claims (1)
と、予め辞書部に登録された字種カデコリー毎の
標準特徴パターンとの類似度を計算して、複数の
候補字種カテゴリーを選択すると共に、前記字種
カテゴリーの各々に優先度を定めておき、前記類
似度と優先度に基づいて認識順位を決定する方式
において、前記候補字種カテゴリー同志の類似度
の差及び優先度の差を計算し、前記類似度の差が
所定値より大きい場合は、前記優先度の差が所定
値より大きいときのみ優先度による認識順位の入
れ変えを行ない、前記優先度の差が所定値より小
さいときは優先度による認識順位の入れ換えを行
なわないようにしたことを特徴とする認識順位決
定方法。1 Calculate the degree of similarity between the feature pattern extracted from the input character pattern and the standard feature pattern for each character type cadecory registered in advance in the dictionary section, select a plurality of candidate character type categories, and select the character type category from the character type category. In a method in which a priority is determined for each of the candidate character type categories and a recognition order is determined based on the similarity and priority, the difference in similarity and the difference in priority between the candidate character type categories are calculated, and the If the difference in priorities is larger than a predetermined value, the recognition order based on priority is changed only when the difference in priority is greater than a predetermined value, and when the difference in priority is smaller than a predetermined value, the recognition order based on priority is changed. A recognition ranking determination method characterized by not replacing .
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59194128A JPS6172376A (en) | 1984-09-17 | 1984-09-17 | Recognizing order deciding system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59194128A JPS6172376A (en) | 1984-09-17 | 1984-09-17 | Recognizing order deciding system |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6172376A JPS6172376A (en) | 1986-04-14 |
| JPH0338631B2 true JPH0338631B2 (en) | 1991-06-11 |
Family
ID=16319370
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59194128A Granted JPS6172376A (en) | 1984-09-17 | 1984-09-17 | Recognizing order deciding system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6172376A (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2795719B2 (en) * | 1990-03-07 | 1998-09-10 | 富士通株式会社 | Best priority search processing method based on difference of recognition distance |
| JP2674542B2 (en) * | 1995-01-30 | 1997-11-12 | 株式会社日立製作所 | Handwriting recognition device |
-
1984
- 1984-09-17 JP JP59194128A patent/JPS6172376A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6172376A (en) | 1986-04-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0634185B2 (en) | Input word recognition device | |
| US4677585A (en) | Method for obtaining common mode information and common field attribute information for a plurality of card images | |
| JPH0981730A (en) | Pattern recognition method and apparatus and computer control apparatus | |
| WO1995017734A1 (en) | Method and apparatus for pattern recognition, and method of compiling dictionary for pattern recognition | |
| JPH0338631B2 (en) | ||
| JP2000348141A (en) | Input information prediction method and apparatus, and program storage medium | |
| JPS6126192A (en) | Method for recognizing hungul character from hungul letter string | |
| JP2718391B2 (en) | Line-symmetric figure shaping device | |
| JPH0338630B2 (en) | ||
| JP7771935B2 (en) | Character extraction method | |
| JPH0337231B2 (en) | ||
| JPH0935006A (en) | Character recognition device | |
| JPH05298489A (en) | System for recognizing character | |
| JP2894305B2 (en) | Recognition device candidate correction method | |
| JP3367973B2 (en) | Character processing method and apparatus | |
| JPS6186883A (en) | Online handwritten character recognition method | |
| JPH08190603A (en) | Character recognition device and its candidate character display method | |
| JP2842271B2 (en) | Handwritten character string input device | |
| JPS6162986A (en) | Recognition order determining system | |
| JPS61163479A (en) | Sequence processing circuit | |
| JP2765617B2 (en) | Character recognition device | |
| JPH05233711A (en) | Information search method with search child learning | |
| JP2637762B2 (en) | Pattern detail identification method | |
| JP2878772B2 (en) | Optical character reader | |
| JP2639314B2 (en) | Character recognition method |