JPS5882373A - Online character recognizing method - Google Patents
Online character recognizing methodInfo
- Publication number
- JPS5882373A JPS5882373A JP56180363A JP18036381A JPS5882373A JP S5882373 A JPS5882373 A JP S5882373A JP 56180363 A JP56180363 A JP 56180363A JP 18036381 A JP18036381 A JP 18036381A JP S5882373 A JPS5882373 A JP S5882373A
- Authority
- JP
- Japan
- Prior art keywords
- pseudo
- kanji
- dictionary
- character
- radical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
【発明の詳細な説明】
不発明は、情報処理機器の入力装置として用いらJする
オンライン手書文字認識装置に関わる認識方法に関1゛
−るものである。DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a recognition method related to an online handwritten character recognition device used as an input device for information processing equipment.
従来の手書文字入力ワードプロセノサは手書文字を認識
するためにオンライン手書文字認識技術を用いていたが
、・lり11えば数字、アルファベット、ひらがな、漢
字を認識する場合、数字10ケ、アルファベット26ケ
、ひらがな46文字及び濁点、半濁点をはじめと1ろ記
号類を含むと約200字あり、又、漢字をJ■5C62
26第1水準漢字集合に限っても2965字存在する。Conventional handwritten character input word processors used online handwritten character recognition technology to recognize handwritten characters. There are approximately 200 characters including 26 alphabets, 46 hiragana characters, voiced marks, half-voiced marks, and 1-ro symbols, and kanji J■5C62
There are 2,965 characters in the 26 first level kanji set.
漢字を常用漢字にしはっても1945字あり計2000
文字を越えろこととなる。Even if kanji are used as common kanji, there are 1945 characters, totaling 2000.
It means going beyond the written word.
さて、漢字を当用漢字とし合計2000字強の文字を認
識する手書文字入力日本語ワードプロセノザも発表され
ているがその認識処理は、例えばK −、L展開法を用
いて、漢字を直接認識せんと1−ろ等、ハードウェア量
が犬となりJ−ぎるという欠点があった。又、前記の例
に限らず手書漢字を数字、アルファベント、ひらがな等
と同じアルゴリズムで直接認識せんとするため、認識の
ための計算量が膨大となり処理時間がかがろこととなり
、この処埋時間を短縮するため・・−ドウエア量の増加
を招(という、実用化という観点からみた場合正大な欠
点があった。Now, a handwritten character input Japanese word processor that recognizes over 2000 characters in total using kanji as regular kanji has been announced, but the recognition process uses, for example, the K-, L expansion method to directly recognize kanji. There was a drawback that the amount of hardware was too large, such as front and back. In addition, handwritten kanji, not limited to the above example, are not directly recognized using the same algorithm as numbers, alphabento, hiragana, etc., so the amount of calculation for recognition is enormous and the processing time is long. In order to shorten the embedding time, this resulted in an increase in the amount of hardware (this was a major drawback from the point of view of practical application).
本発明は前記の欠点を除去することを[]的どじ、漢字
を細分化して細分化された文字の:′1’l)分集合を
認識し前記認識された部分集合の集まりと(〜て漢字を
識別1−るものであって、等何泊に認識1′る漢字の字
数を減づろと共に辞書に要I−ろ記憶簀I11゛をも減
づるもので認識対象の文字i’i#居はMt+記文字の
部分集合の系列の形で登録できるため認識文字数の増加
にともなう記憶容量の増加を低くオdさえろことかでき
ろという特徴を有1−ろ。The purpose of the present invention is to eliminate the above-mentioned drawbacks by subdividing Chinese characters, recognizing subsets of the subdivided characters, and forming a collection of the recognized subsets (~). It is a method for identifying kanji, and it is used to reduce the number of kanji that can be recognized, etc., and also to reduce the number of kanji that need to be stored in the dictionary, such as character i'i to be recognized. Since the ``#'' can be registered in the form of a series of subsets of Mt+ characters, it has the feature of being able to reduce the increase in storage capacity due to an increase in the number of recognized characters.
以下図面により実施例を説明する。1
第1図は本発明の一実施例を示′1−ブロンク図であっ
て1はタブレット、2は認識部、3は漢字を細分化した
文字の部分集合と漢字以外の文字(以下擬似部首という
)の特徴と擬似部1″]コートを格納した擬似部首辞書
、4は認識+−192で認識さ、lzた擬似部首コ ド
を格納−4−ろ入力レジスタ、5は入力レジスタ4内に
格納さ、1′1ている1ケ又はNbの(3)
擬似部首コ・−ドより文字を選択する選択回路、6は擬
似部首コードと文字コートを格納した文字辞書の如く構
成されて居ろ。タブレノl−1より入力されたストロー
ク情報は、認識部2へ送られる。Examples will be described below with reference to the drawings. 1 Figure 1 shows an embodiment of the present invention; 1 is a bronch diagram; 1 is a tablet, 2 is a recognition unit, and 3 is a subset of characters obtained by subdividing kanji and characters other than kanji (hereinafter referred to as a pseudo part). A pseudo-radical dictionary that stores the features of the neck) and pseudo-parts 1''] code, 4 is a pseudo-radical dictionary that stores the pseudo-radical codes recognized by recognition +-192, lz-4 is an input register, and 5 is an input register. A selection circuit for selecting a character from a pseudo radical code (3) of 1'1 or Nb stored in 4, and 6 a character dictionary storing pseudo radical codes and character codes. The stroke information input from the tablet notebook l-1 is sent to the recognition unit 2.
認識部2(まオンライン手書に好適な周知のストローク
アナリシス法やに、 −L展開法等により各擬似部首を
認識1″′るよ5に働く。認識部2で認識1−ろ際は、
擬似部首の特徴と擬似部首コードを格納した擬似部首辞
書3を用いろ。認識部2の出力(′f−1擬似部首コー
ドのり1条で入力レジスタ4に認識さ牙する都度出力さ
れ格納さ才′1ろ。入力レジスタ4より格Ji’lされ
ている擬似部首コードが順次出力され、選択回路5に入
力されろ。選択回路5では、文字辞書6の内容と入力レ
ジスタ4の出力の擬似部首コードとにより文字を選択し
結果の文字コードを出力する。Recognition unit 2 (works to recognize each pseudo radical using the well-known stroke analysis method suitable for online handwriting, -L expansion method, etc.). ,
Use the pseudo-radical dictionary 3 that stores pseudo-radical features and pseudo-radical codes. The output of the recognition unit 2 ('f-1 pseudo radical code is output and stored each time it is recognized in the input register 4. The codes are sequentially output and input to the selection circuit 5. The selection circuit 5 selects characters based on the contents of the character dictionary 6 and the pseudo radical code output from the input register 4, and outputs the resulting character code.
第2図は擬似部首辞書−3の一例を示1゛。000より
続<16進の数字は擬似部首コートを示し、擬似↑lX
lX−ドの右側には各擬似部首が記載されている3゜実
際の辞書では、各擬似部首の位置には認識部2(4)
の認識アルゴリズムに基(特徴テークが記載されるがこ
こでは説明の便のため各擬似部首そのものを示¥。なお
擬似部首辞書3には、漢字以外のひらがな、数字、アル
ファベント等は細分化さA1ず直接格納されている。FIG. 2 shows an example of the pseudo radical dictionary-3. Continuing from 000 < Hexadecimal numbers indicate pseudo radical coats, pseudo ↑lX
Each pseudo-radical is listed on the right side of the IX-do.3 In the actual dictionary, the position of each pseudo-radical is based on the recognition algorithm of recognition unit 2 (4) (feature take is written). For convenience of explanation, each pseudo-radical itself is shown here. In the pseudo-radical dictionary 3, hiragana, numbers, alpha vents, etc. other than kanji are directly stored without being subdivided into A1.
第3図は、入力レジスタ4の詳細を示す。0は認識部2
よりの出力、10〜(7は入力レジスタ4内の1゜レジ
スター1フレジスタ、]8は切4! It’ll M
、円は入力レジスタ4の出力を示す。FIG. 3 shows details of the input register 4. 0 is recognition unit 2
Output from 10~(7 is 1° register 1 register in input register 4, ]8 is off 4! It'll M
, the circle indicates the output of the input register 4.
第4図は文字辞書6の一部分を示す。第4図第3行目は
、擬似部首コード176で示さ脂(るI−立−1という
擬似部首と擬似部首コード0FI(で示さ」1ろ「日」
とい59似部首により「音」という文字であることを示
し、「音」という文字の文字コードは、JISC622
6コードで3231−4というコードであることを示j
。尚、第4図の0内文字は説明の便のため記載したもの
で実際の辞書は擬似部−i¥+コードと文字コートで構
成される。FIG. 4 shows a portion of the character dictionary 6. The third line of Figure 4 shows the pseudo radical code 176, which indicates the pseudo radical RUI-Tachi-1, and the pseudo radical code 0FI (indicated by 1, 日).
The 59-like radical indicates the character ``sound'', and the character code for the character ``sound'' is JISC622.
6 code indicates the code 3231-4
. Note that the characters inside 0 in FIG. 4 are shown for convenience of explanation, and the actual dictionary is composed of a pseudo part -i\+ code and a character code.
第5図は、「彰」という文字を入力した時の本発明によ
る処理を示すため入力レジスタ4の1゜レジスタ10〜
■7レジスタ17へ入力される擬似部首コードを示した
ものである。FIG. 5 shows the processing according to the present invention when the character "Akira" is input.
(7) The pseudo radical code input to the register 17 is shown.
以下、第5図を中心と1〜で本発明によるオンライン手
書文字認識の方法について「彰」という文字を例にとり
詳細に説明する。Hereinafter, the online handwritten character recognition method according to the present invention will be described in detail in 1 to 1 with reference to FIG. 5, taking the character "Akira" as an example.
先づタイミング′■゛、でタブレット1より操作渚が「
1」を入力すると「゛」は認識部2へ出力され、認識部
2に於いて擬似部−―静置(以下辞書という。)3を用
いて擬似部首として登録されているか否かを検定するが
「゛」は辞書3に登録されていないため、未定義コード
*を■。レジスタ10に登録する。First of all, at the timing '■゛, the operation Nagisa from tablet 1 is ``
1" is input, "゛" is output to the recognition unit 2, and the recognition unit 2 tests whether it is registered as a pseudo radical using the pseudo part -- stationary (hereinafter referred to as dictionary) 3. However, since "゛" is not registered in Dictionary 3, the undefined code * is written as ■. Register in register 10.
ついでタイミングT2で1/」かタブレット1より入力
されると、タイミングT、で未定義の11」と合せて「
]という擬似部首が辞書3にあるかどうかを認識部2に
おいて検定すると、第2図で示されろ様に擬似部首コー
ド050としてビ′」という擬似部首が登録されている
ため、■oレジスタ10に050というコードがセント
されろ。Then, at timing T2, ``1/'' is input from tablet 1, and at timing T, undefined 11'' is input, along with ``1/''.
] When the recognition unit 2 tests whether the pseudo-radical ``B'' exists in the dictionary 3, the pseudo-radical ``Bi''' is registered as the pseudo-radical code 050, as shown in FIG. Write the code 050 to o register 10.
タイミングT3で入力されろ「゛」は擬似部首が辞書3
に登録されていないため、■oレジスタ10はそのまま
にして■ルジスタ11に未定義コー1’ * ヲ登録す
る。Input at timing T3 "゛" is a pseudo radical in dictionary 3
Since it is not registered in the register 11, the undefined code 1' * is registered in the register 11 while leaving the o register 10 as is.
タイミング′(4で入力された「′」は、解重3に登録
されていないがタイミングT3で未定義の「゛」と合せ
て「′」という擬似部首が辞3!(3に014という擬
似部首コードで登録されているため、1ルジスタ月の未
定義コードを消去して新たに014というコードがセッ
トされる。なお、1疑似川イ1コード050ど014で
新たな擬似部首となるがどうかについて[パ・」という
文字で辞書3を用いて検定するが「パ」という文字は独
立の擬似部首として辞書3に存在しないため、■oレジ
スタ10、■ルジスタ11の内容は変らないで保持され
ろ。The "'" input at timing '(4) is not registered in demultiplexing 3, but at timing T3, the pseudo radical "'" is added to the undefined "゛" and the pseudo radical "014" is added to the end 3! Since it is registered as a pseudo-radical code, the undefined code of 1 Rujista month is deleted and a new code of 014 is set.In addition, 1 pseudo-radical 1 code 050 014 is used as a new pseudo-radical. Dictionary 3 is used to test the character ``pa'' to see if it is true, but since the character ``pa'' does not exist in dictionary 3 as an independent pseudo-radical, the contents of ■o register 10 and ■rugister 11 do not change. Don't be held.
タイミング′I″5で゛「−」が入力されろと1−」と
(・う文字は辞書3より擬似部首コード004でル)る
ことか判明するため■2レジスタ12に00/lが七ノ
ドされ、その後「・′」及び1立」について擬似部首コ
ードが辞書3に登録されているが否かを検定する。即ち
、その文字内の全ストロークについて最小個数の擬似部
首コードで表現するために検定な行なうこととなる。こ
の場合し′」は擬似部首コードとして登録されてな(「
立」は、擬似部首コード176として辞書に登録されて
いる。従って1゜レジスタ10. I、レジスタ11、
■2レジスタ12をリセットし、■。レジスタ10に1
76を登録する。か(して「立」という文字は、第2図
で示す擬似部首コード176で示される1ケの擬似部首
であることを示すこととなる。At timing ``I'' 5, it becomes clear that ``-'' is input as ``1-'' (the ``character'' is entered with pseudo radical code 004 from dictionary 3), so 00/l is entered in register 12 of 2. After that, it is checked whether pseudo-radical codes are registered in the dictionary 3 for "・'" and "1-tachi". That is, a test is performed to express all strokes in the character using the minimum number of pseudo-radical codes. In this case, "shi'" is registered as a pseudo-radical code ("
” is registered in the dictionary as a pseudo-radical code 176. Therefore, 1° register 10. I, register 11,
■2Reset register 12,■. 1 in register 10
Register 76. (Thus, the character ``tate'' indicates that it is one pseudo radical shown by the pseudo radical code 176 shown in FIG. 2.
同様にして第5図に示すように「彰」という文字に関し
て、結果的に擬似部首コード176 、OFB 。Similarly, as shown in FIG. 5, for the character "Akira", the resulting pseudo radical code is 176, OFB.
045.065で表わされる文字であることが認識され
ろ。なお、タイミング′■゛、で3ケの擬似部首コード
よりなる入力文字を再検定して1ケの擬似部首コード1
76を識別したのと同様に、タイミングT9では擬似部
首コード021よりなる文字と未定義の1 」及び「
」より擬似部首コードoPBなる文字「日」を識別し、
さらに又タイミング’l’l l + T13 rT、
4においてもそれぞれ2ケの擬似部首コードと識別され
た入力文字から1ケの擬似部首コードを識別している。Recognize that it is a character represented by 045.065. In addition, at the timing '■゛, the input character consisting of three pseudo radical codes is re-verified and one pseudo radical code 1 is obtained.
76, at timing T9, the character consisting of the pseudo radical code 021 and the undefined 1' and '
” to identify the character “day” with the pseudo radical code oPB,
Furthermore, the timing 'l'l l + T13 rT,
4, one pseudo radical code is identified from each input character identified as two pseudo radical codes.
こり〕様にして一種の最長一致法により擬似部首コード
の検定を行なつ不いる。一般的に最長一致法の場合、そ
の入力すべてが入力され終ってから一致を見ることが一
般的である。即ち、入力された全ストロークに対して判
定し、擬似部首と認めらねない場合は最後の1ストロー
クを除いて判定するという手法をとるが擬似部面−コー
ドとして辞書3に登録されている擬似部首の数が数字、
アルファベット、ひらがな、記号等を加えても600ケ
強であり多きな数になら′II[いこと、更には、人が
文字を入力する速度が遅いことを勘案して、入力順に検
定を行なっているものである。In this way, pseudo-radical codes are tested using a type of longest-match method. Generally, in the case of the longest match method, a match is generally checked after all of the inputs have been input. In other words, all input strokes are judged, and if the stroke cannot be recognized as a pseudo-radical, the judgment is made excluding the last stroke, which is registered in Dictionary 3 as a pseudo-radical code. The number of pseudoradicals is a number,
Even if you add the alphabet, hiragana, symbols, etc., there are over 600 characters, and if the number is large, it will be difficult to use. It is something that exists.
以上説明したように、タブレット]より「彰」を入力す
ることにより入力レジスタ4内の1゜レジスタ10〜1
3レジスタ13内に擬似称(涌コード176゜OL”B
、 045,065 が格納されろ。こねら入力レジ
スタ4内の1゜レジスタ10〜■7レジスタ17の内容
は1)換回路18により出ブ月9に順次導出さ」1、選
択回路5に入力される。選択回路5では、入力された擬
似部首コードにより、第4南に示′1″文字−1¥書6
を用いてJIS C6226による文字コードを選択す
る。As explained above, by inputting "Akira" from the tablet, the 1° registers 10 to 1 in the input register 4
3 Pseudo name in register 13 (waku code 176゜OL”B
, 045,065 are stored. The contents of the 1° register 10 to the 7 register 17 in the input register 4 are 1) sequentially derived by the conversion circuit 18 in the month of release 9 and input to the selection circuit 5. In the selection circuit 5, based on the input pseudo-radical code, the 4th south is the '1'' character - 1 ¥6
Select the character code according to JIS C6226 using .
すなわち、入力レジスタ4内の■。レジスタ10〜■7
レジスタ17に格納されている擬似部首コードが176
、01”B 、 045,065であることにより選択
回路5により、文字辞書6を調べると第4図に示す如く
擬似部首コードが176、OFB 、 045,065
である文字は3E34なる文字コードで示されろ漢字「
彰」であることが判明する。That is, ■ in the input register 4. Register 10~■7
The pseudo radical code stored in register 17 is 176
, 01"B, 045,065, the selection circuit 5 searches the character dictionary 6, and as shown in FIG. 4, the pseudo radical code is 176, OFB, 045,065.
The character `` is indicated by the character code 3E34.
It turns out to be Akira.
以上の様にして3E34なろJIS C6226文字コ
ードが選択回路5より出力されろことによりタブレット
1より入力された手書文字が漢字「彰」であることが認
識されろ。As described above, the 3E34 JIS C6226 character code is outputted from the selection circuit 5, thereby recognizing that the handwritten character input from the tablet 1 is the kanji character "Ang".
以上詳細に説明したように前記実施例に於いては、漢字
を細分化して、細分化された文字の擬似部首となづけた
部分集合を認識し前記認識された擬似部首の集まりとし
て漢字を識別する方法を示す。ここで擬似部首を認識す
るためには、簡単なアルゴリズムの認識部2と、漢字の
数に比して極めて少数の擬似部首からなる擬似部首辞書
3でよいこととなる。例えば数字、アルファベット、ひ
らがな、記号類及びJ T S C6226第1水準漢
字集合2965字のための擬似部灯の数は600強でル
)す、この内400強が漢字2965字のための擬似部
首である。このように漢字2965字の字数を本発明に
よれば認識時のみ等測的に減少させろ効果を而1−るこ
ととなる。又、第2図に示′f擬似部言辞吉3の内容を
認識するための認識部2の機能は、周知のストロークア
ナリシス法等の簡単なアルゴリズムで゛よいことはその
道の専門家であれば容易に理解できるものと考える。更
にこれら認識さA′また擬似部首の集まりとして漢字を
含む文字を識別1−ろための文字群書6は、第4図に示
す様に単に擬似部首コードとJ Is C6226によ
る漢字コードだけで構成できるため漢字を含めた文字の
字数が多(なった場合でも極めて少量のメモリしか増加
しないことも本発明の利点であり、擬似部言辞■″3及
び文字辞書6を合せても、直接漢字を含む文字の特徴を
記録した従来の辞書の容量が犬であったのと相違して極
めて少量となるため、オンライン手書文字認識を、その
対象を漢字2965字より構成されるJiS C622
6第1水準漢字集合にまで広げたとしても、手軽に提供
することができ、もって、[
情報処理全般にとって好適な入力装置を安価に提供する
ことができる。As explained in detail above, in the above embodiment, a kanji is subdivided, a subset of the subdivided characters is recognized, and a kanji is created as a collection of the recognized pseudo-radicals. Show how to identify. In order to recognize pseudo-radicals here, it is sufficient to use a recognition unit 2 with a simple algorithm and a pseudo-radical dictionary 3 consisting of a very small number of pseudo-radicals compared to the number of Chinese characters. For example, the number of pseudo parts for numbers, alphabets, hiragana, symbols, and the 2965 characters in the first level kanji set of JTSC6226 is over 600, of which over 400 are for the 2965 characters in kanji. It's the neck. In this way, according to the present invention, the number of 2965 Chinese characters is reduced isometrically only during recognition, resulting in an additional effect. Furthermore, an expert in the field will understand that the function of the recognition unit 2 for recognizing the contents of the pseudo-part 3 shown in Figure 2 can be performed using a simple algorithm such as the well-known stroke analysis method. I think it's easy to understand. Furthermore, the character group book 6 for identifying characters containing kanji as a collection of pseudo-radicals is simply a pseudo-radical code and a kanji code based on J Is C6226, as shown in Figure 4. Another advantage of the present invention is that even if the number of characters including kanji is large (even if the number of characters is large, only a very small amount of memory will be increased), Since the capacity of conventional dictionaries that record the characteristics of characters including kanji is extremely small, unlike dogs, online handwritten character recognition has been developed using JiS C622, which consists of 2965 kanji characters.
Even if it is extended to the 6th level kanji set, it can be easily provided, thereby making it possible to provide an input device suitable for general information processing at a low cost.
前記実施例では基本的な要素について説明したが、以下
に示す様に各種の改良を実施することによりよりよいオ
ンライン手書文字認識力法を提供jろことができるので
以下に説明′8ろ。Although the basic elements have been explained in the above embodiment, it is possible to provide a better online handwritten character recognition method by implementing various improvements as shown below, which will be explained below.
第1に、前記実施例では標準的な擬似部首辞書3を1ケ
だけ設けたが、標準的な辞書の他に使用者各個人用の擬
似部首相関辞書を1ケ又は複数個設け、認識しづらい擬
似部首を含んだ文字の擬似部首について後から追加登録
ができる構成とすれば、より一層認識率の向上が図J″
Iるとともに認識 1アルゴリズム自体も簡易なもので
よ(なるという効果がある。First, in the above embodiment, only one standard pseudo-radical dictionary 3 is provided, but in addition to the standard dictionary, one or more pseudo-radical correlation dictionaries for each user are provided. If the configuration is such that the pseudo radicals of characters containing pseudo radicals that are difficult to recognize can be additionally registered later, the recognition rate can be further improved.
The algorithm itself is simple and has the effect of recognizing it.
第2に、前記実施例では文字辞書6の内容として擬似部
首コードと文字コードだけの組合せとしたが第4図の例
でも明らかな様に同じ「\門という文字でも「立」単独
で1つの文字を+n成するもの、「妾」、「音」、1章
」、「意」、「−童」の様に文字の上部にr−””−」
が位置するもの、「彰」、「韻」の様に文字の左上部に
ド−」が位置1−るもの等がある。これらの「立」は前
記実施例では全く同一に扱って居り、字数が実施例程度
の場合問題はないが、字数を更に増加させたい場合にお
いてはこれら「立」という文字の位置情報を文字辞書6
に含ませA1ば更に認識率を向」ニさせろことができる
。位置情報としてはJ T S C6226字形索引第
4項の字形構成を用いれは充分である。Second, in the above embodiment, the content of the character dictionary 6 was a combination of only pseudo-radical codes and character codes, but as is clear from the example in FIG. Something that consists of two letters +n, ``concubine'', ``on'', ``Chapter 1'', ``meaning'', ``-dou''(r-""-") at the top of the letter.
There are some characters such as ``Akira'' and ``Rime'' that have a ``do'' at the upper left of the character. These ``tachi'' are treated exactly the same in the above example, and there is no problem if the number of characters is about the same as in the example, but if you want to further increase the number of characters, the position information of these characters ``tachi'' can be changed to a character dictionary. 6
If A1 is included in A1, the recognition rate can be further improved. It is sufficient to use the glyph structure in item 4 of the JTSC6226 glyph index as the position information.
第3に前記実施例では、第5図を用いて説明した如く新
しいストロークがタブレット1より入力される毎に第1
ストロークまでさかのほって今■)かれた前記性しいス
トローク迄が1つの擬似部1ト1を構成しているかどう
かについて、入力さAまたストロークについて検定すべ
(説明した。例えば擬似部首「3」と「・」と「−」は
擬似部首コードでは050 、014 、004である
が、この3ケの擬似部に1が集った「立」も擬似部首で
ありそのコードは176であることを「立」のストロー
クにより擬似部首辞書3を参照して求めた。Thirdly, in the above embodiment, each time a new stroke is input from the tablet 1, as explained using FIG.
Looking backwards to the stroke, it is necessary to verify whether the stroke up to the above-mentioned natural stroke constitutes one pseudo radical 1 (explained).For example, the pseudo radical "3" ”, “・”, and “-” are pseudo-radical codes 050, 014, and 004, but “tate”, which has 1 in these three pseudo-radicals, is also a pseudo-radical and its code is 176. A certain thing was determined by referring to the pseudo radical dictionary 3 using the stroke of ``tate''.
しかしながら、認識部2より参照する辞書として擬似部
首辞書3の他に、(擬似部首050 ) +(擬似部首
014 ) +(擬似部首004. ) −(擬似部面
176)の如き擬似部首間の相関々係を示す擬似部首相
関辞書を設けれは、認識処理時間が極めて早くなるとい
う効果がある。However, in addition to the pseudo radical dictionary 3 as a dictionary referred to by the recognition unit 2, there are also pseudo radicals such as (pseudo radical 050) + (pseudo radical 014) + (pseudo radical 004.) - (pseudo radical 176). Providing a pseudo-radical correlation dictionary that indicates the correlation between radicals has the effect of extremely shortening the recognition processing time.
以上詳細に説明した様に、本発明は認識が困難な漢字を
細分化しこの細分化した擬似部首を認識し擬似部首の集
まりとして漢字を識別するため、先づ認識辞書に要する
記1意容量が極小でよく更に認識文字数の増加にともな
う記憶容量の増加を極めて低(おさえられ更に、前記説
明の通り認識するのは擬似部首とし・うカナレベルのも
のであるため認識率そのものも高く保てるという好適な
オンライン手書文字認識方法を安価に提供することがで
きる。As explained in detail above, the present invention subdivides kanji that are difficult to recognize, recognizes the subdivided pseudo-radicals, and identifies kanji as a collection of pseudo-radicals. The storage capacity is extremely small, and the increase in memory capacity as the number of recognized characters increases is kept to an extremely low level.Furthermore, as explained above, the recognition rate itself can be kept high because it recognizes only pseudo radicals and kana level. A suitable online handwritten character recognition method can be provided at low cost.
第1図は本発明の一実施例のブロック図、第2図は擬似
部首辞書の1例を示す図、第3図は入力レジスタの詳細
図、第4図は文字辞書の部分図、第5図は本発明による
認識方法を示I−図である。
1 タブレット、 2・・・認識部、3・・・擬
似部首辞書、 4・・・入力レジスタ、5・・選択
回路、 6・・・文字辞書、9・・認識部2よ
りの出力、
10〜17・・・入力レジスタ4内の1゜レジスター1
フレジスタ、
18・・切換回路、 19・・・入力レジス
タ4の出力。
特許出願人
沖電気工業株式会社
特許出願代理人
弁理士 山 本 恵 −
(15)
第1図
第3図FIG. 1 is a block diagram of an embodiment of the present invention, FIG. 2 is a diagram showing an example of a pseudo-radical dictionary, FIG. 3 is a detailed diagram of an input register, FIG. 4 is a partial diagram of a character dictionary, and FIG. FIG. 5 is a diagram showing the recognition method according to the present invention. 1 Tablet, 2... Recognition unit, 3... Pseudo radical dictionary, 4... Input register, 5... Selection circuit, 6... Character dictionary, 9... Output from recognition unit 2, 10 ~17...1° register 1 in input register 4
FR register, 18...Switching circuit, 19...Output of input register 4. Patent applicant Oki Electric Industry Co., Ltd. Patent application agent Megumi Yamamoto - (15) Figure 1 Figure 3
Claims (1)
字の特徴を格納する辞書とを有し、タブレットからの情
報を辞書の特徴と比較して手書文字を識別するオンライ
ン文字識別方法において、漢字を細分化した部分集合パ
ターン及び漢字以外の文字の全体のパターンの特徴を格
納する第1辞書と、漢字の部分集合の集まり及び漢字以
外の文字に対して文字コードを格納する第2辞書と、タ
ブレットからの情報と第1辞書ア゛出力とを比較する認
識部と、認識結果を格納する入力レジスタと、入力レジ
スタの内容を第2辞書と比較して文字を識別する選択回
路とより構成され、漢字を音μ分集合切に比較識別する
ことを特徴とするオンライン文字認識方法。In an online character identification method that includes a tablet that extracts stroke information of handwritten characters and a dictionary that stores character features, the information from the tablet is compared with the features of the dictionary to identify handwritten characters. a first dictionary that stores characteristics of subdivided subset patterns and the entire pattern of characters other than kanji; a second dictionary that stores character codes for collections of subsets of kanji and characters other than kanji; and a tablet. A recognition unit that compares information from the first dictionary with the output of the first dictionary, an input register that stores the recognition result, and a selection circuit that compares the contents of the input register with the second dictionary to identify characters, An online character recognition method characterized by comparing and identifying kanji characters by sound μ.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56180363A JPS5882373A (en) | 1981-11-12 | 1981-11-12 | Online character recognizing method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56180363A JPS5882373A (en) | 1981-11-12 | 1981-11-12 | Online character recognizing method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5882373A true JPS5882373A (en) | 1983-05-17 |
| JPH0258664B2 JPH0258664B2 (en) | 1990-12-10 |
Family
ID=16081929
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56180363A Granted JPS5882373A (en) | 1981-11-12 | 1981-11-12 | Online character recognizing method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5882373A (en) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60200383A (en) * | 1984-03-24 | 1985-10-09 | Oki Electric Ind Co Ltd | On-line character recognizing system |
| JPS61271586A (en) * | 1985-05-27 | 1986-12-01 | Fujitsu Ltd | Character recognizing system |
| JPS62271086A (en) * | 1986-05-20 | 1987-11-25 | Canon Inc | Pattern recognizing device |
| JPS63155389A (en) * | 1986-12-19 | 1988-06-28 | Toshiba Corp | On-line character recognizing device |
| JPH01258088A (en) * | 1988-04-07 | 1989-10-16 | Fujitsu Ltd | On-line system for recognizing hand-written character |
| JPH02122387A (en) * | 1988-09-30 | 1990-05-10 | Lgz Landis & Gyr Zug Ag | Bar code section and reader for bar code |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5539925A (en) * | 1978-09-11 | 1980-03-21 | Nippon Telegr & Teleph Corp <Ntt> | Character recognition processing system |
-
1981
- 1981-11-12 JP JP56180363A patent/JPS5882373A/en active Granted
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5539925A (en) * | 1978-09-11 | 1980-03-21 | Nippon Telegr & Teleph Corp <Ntt> | Character recognition processing system |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60200383A (en) * | 1984-03-24 | 1985-10-09 | Oki Electric Ind Co Ltd | On-line character recognizing system |
| JPS61271586A (en) * | 1985-05-27 | 1986-12-01 | Fujitsu Ltd | Character recognizing system |
| JPS62271086A (en) * | 1986-05-20 | 1987-11-25 | Canon Inc | Pattern recognizing device |
| JPS63155389A (en) * | 1986-12-19 | 1988-06-28 | Toshiba Corp | On-line character recognizing device |
| JPH01258088A (en) * | 1988-04-07 | 1989-10-16 | Fujitsu Ltd | On-line system for recognizing hand-written character |
| JPH02122387A (en) * | 1988-09-30 | 1990-05-10 | Lgz Landis & Gyr Zug Ag | Bar code section and reader for bar code |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0258664B2 (en) | 1990-12-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Samih et al. | Multilingual code-switching identification via lstm recurrent neural networks | |
| Ullmann | A binary n-gram technique for automatic correction of substitution, deletion, insertion and reversal errors in words | |
| US5467407A (en) | Method and apparatus for recognizing cursive writing from sequential input information | |
| US5029223A (en) | Constraint driven-on line recognition of handwritten characters and symbols | |
| CN102982021B (en) | For eliminating the method for the ambiguity of the multiple pronunciations in language conversion | |
| JPS60142793A (en) | Character recognition method | |
| CN110377882B (en) | Method, apparatus, system and storage medium for determining pinyin of text | |
| US5331557A (en) | Audio-video coding system for Chinese characters | |
| CN109359227A (en) | Methods, Apparatus, Computer Equipment and Storage Media for Obtaining Similar Trademarks | |
| CN108563634A (en) | Method and system for identifying character spelling errors, computer equipment and storage medium | |
| JPS5882373A (en) | Online character recognizing method | |
| Karimi et al. | UniParma at SemEval-2021 task 5: Toxic spans detection using CharacterBERT and bag-of-words model | |
| KR20000039018A (en) | Method for coding borrowed words and search method using coded words | |
| US7889927B2 (en) | Chinese character search method and apparatus thereof | |
| RU2004115749A (en) | UNLIMITED LANGUAGE COMPUTERIZED ENCODING-DECODING SYSTEM AND METHOD | |
| JPH0896081A (en) | Character recognition device and character recognition method | |
| JPS592191A (en) | Recognizing and processing system of handwritten japanese sentence | |
| CN1102255C (en) | Dictionary recording method, method and apparatus for identification of characters | |
| TW452711B (en) | Method using word affix for word search | |
| JPS5884372A (en) | Recognizing method for on-line character written by specific writer | |
| JPH0282380A (en) | Character recognizing method | |
| JPH01287774A (en) | Japanese data input processor | |
| JPS6293776A (en) | information recognition device | |
| JP2002149641A (en) | Handwritten character recognition device and recording medium with handwritten character recognition program recorded thereon | |
| JPS6162985A (en) | Recognition order determining system |