JPS5882373A - オンライン文字認識方法 - Google Patents
オンライン文字認識方法Info
- Publication number
- JPS5882373A JPS5882373A JP56180363A JP18036381A JPS5882373A JP S5882373 A JPS5882373 A JP S5882373A JP 56180363 A JP56180363 A JP 56180363A JP 18036381 A JP18036381 A JP 18036381A JP S5882373 A JPS5882373 A JP S5882373A
- Authority
- JP
- Japan
- Prior art keywords
- pseudo
- kanji
- dictionary
- character
- radical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
不発明は、情報処理機器の入力装置として用いらJする
オンライン手書文字認識装置に関わる認識方法に関1゛
−るものである。
オンライン手書文字認識装置に関わる認識方法に関1゛
−るものである。
従来の手書文字入力ワードプロセノサは手書文字を認識
するためにオンライン手書文字認識技術を用いていたが
、・lり11えば数字、アルファベット、ひらがな、漢
字を認識する場合、数字10ケ、アルファベット26ケ
、ひらがな46文字及び濁点、半濁点をはじめと1ろ記
号類を含むと約200字あり、又、漢字をJ■5C62
26第1水準漢字集合に限っても2965字存在する。
するためにオンライン手書文字認識技術を用いていたが
、・lり11えば数字、アルファベット、ひらがな、漢
字を認識する場合、数字10ケ、アルファベット26ケ
、ひらがな46文字及び濁点、半濁点をはじめと1ろ記
号類を含むと約200字あり、又、漢字をJ■5C62
26第1水準漢字集合に限っても2965字存在する。
漢字を常用漢字にしはっても1945字あり計2000
文字を越えろこととなる。
文字を越えろこととなる。
さて、漢字を当用漢字とし合計2000字強の文字を認
識する手書文字入力日本語ワードプロセノザも発表され
ているがその認識処理は、例えばK −、L展開法を用
いて、漢字を直接認識せんと1−ろ等、ハードウェア量
が犬となりJ−ぎるという欠点があった。又、前記の例
に限らず手書漢字を数字、アルファベント、ひらがな等
と同じアルゴリズムで直接認識せんとするため、認識の
ための計算量が膨大となり処理時間がかがろこととなり
、この処埋時間を短縮するため・・−ドウエア量の増加
を招(という、実用化という観点からみた場合正大な欠
点があった。
識する手書文字入力日本語ワードプロセノザも発表され
ているがその認識処理は、例えばK −、L展開法を用
いて、漢字を直接認識せんと1−ろ等、ハードウェア量
が犬となりJ−ぎるという欠点があった。又、前記の例
に限らず手書漢字を数字、アルファベント、ひらがな等
と同じアルゴリズムで直接認識せんとするため、認識の
ための計算量が膨大となり処理時間がかがろこととなり
、この処埋時間を短縮するため・・−ドウエア量の増加
を招(という、実用化という観点からみた場合正大な欠
点があった。
本発明は前記の欠点を除去することを[]的どじ、漢字
を細分化して細分化された文字の:′1’l)分集合を
認識し前記認識された部分集合の集まりと(〜て漢字を
識別1−るものであって、等何泊に認識1′る漢字の字
数を減づろと共に辞書に要I−ろ記憶簀I11゛をも減
づるもので認識対象の文字i’i#居はMt+記文字の
部分集合の系列の形で登録できるため認識文字数の増加
にともなう記憶容量の増加を低くオdさえろことかでき
ろという特徴を有1−ろ。
を細分化して細分化された文字の:′1’l)分集合を
認識し前記認識された部分集合の集まりと(〜て漢字を
識別1−るものであって、等何泊に認識1′る漢字の字
数を減づろと共に辞書に要I−ろ記憶簀I11゛をも減
づるもので認識対象の文字i’i#居はMt+記文字の
部分集合の系列の形で登録できるため認識文字数の増加
にともなう記憶容量の増加を低くオdさえろことかでき
ろという特徴を有1−ろ。
以下図面により実施例を説明する。1
第1図は本発明の一実施例を示′1−ブロンク図であっ
て1はタブレット、2は認識部、3は漢字を細分化した
文字の部分集合と漢字以外の文字(以下擬似部首という
)の特徴と擬似部1″]コートを格納した擬似部首辞書
、4は認識+−192で認識さ、lzた擬似部首コ ド
を格納−4−ろ入力レジスタ、5は入力レジスタ4内に
格納さ、1′1ている1ケ又はNbの(3) 擬似部首コ・−ドより文字を選択する選択回路、6は擬
似部首コードと文字コートを格納した文字辞書の如く構
成されて居ろ。タブレノl−1より入力されたストロー
ク情報は、認識部2へ送られる。
て1はタブレット、2は認識部、3は漢字を細分化した
文字の部分集合と漢字以外の文字(以下擬似部首という
)の特徴と擬似部1″]コートを格納した擬似部首辞書
、4は認識+−192で認識さ、lzた擬似部首コ ド
を格納−4−ろ入力レジスタ、5は入力レジスタ4内に
格納さ、1′1ている1ケ又はNbの(3) 擬似部首コ・−ドより文字を選択する選択回路、6は擬
似部首コードと文字コートを格納した文字辞書の如く構
成されて居ろ。タブレノl−1より入力されたストロー
ク情報は、認識部2へ送られる。
認識部2(まオンライン手書に好適な周知のストローク
アナリシス法やに、 −L展開法等により各擬似部首を
認識1″′るよ5に働く。認識部2で認識1−ろ際は、
擬似部首の特徴と擬似部首コードを格納した擬似部首辞
書3を用いろ。認識部2の出力(′f−1擬似部首コー
ドのり1条で入力レジスタ4に認識さ牙する都度出力さ
れ格納さ才′1ろ。入力レジスタ4より格Ji’lされ
ている擬似部首コードが順次出力され、選択回路5に入
力されろ。選択回路5では、文字辞書6の内容と入力レ
ジスタ4の出力の擬似部首コードとにより文字を選択し
結果の文字コードを出力する。
アナリシス法やに、 −L展開法等により各擬似部首を
認識1″′るよ5に働く。認識部2で認識1−ろ際は、
擬似部首の特徴と擬似部首コードを格納した擬似部首辞
書3を用いろ。認識部2の出力(′f−1擬似部首コー
ドのり1条で入力レジスタ4に認識さ牙する都度出力さ
れ格納さ才′1ろ。入力レジスタ4より格Ji’lされ
ている擬似部首コードが順次出力され、選択回路5に入
力されろ。選択回路5では、文字辞書6の内容と入力レ
ジスタ4の出力の擬似部首コードとにより文字を選択し
結果の文字コードを出力する。
第2図は擬似部首辞書−3の一例を示1゛。000より
続<16進の数字は擬似部首コートを示し、擬似↑lX
lX−ドの右側には各擬似部首が記載されている3゜実
際の辞書では、各擬似部首の位置には認識部2(4) の認識アルゴリズムに基(特徴テークが記載されるがこ
こでは説明の便のため各擬似部首そのものを示¥。なお
擬似部首辞書3には、漢字以外のひらがな、数字、アル
ファベント等は細分化さA1ず直接格納されている。
続<16進の数字は擬似部首コートを示し、擬似↑lX
lX−ドの右側には各擬似部首が記載されている3゜実
際の辞書では、各擬似部首の位置には認識部2(4) の認識アルゴリズムに基(特徴テークが記載されるがこ
こでは説明の便のため各擬似部首そのものを示¥。なお
擬似部首辞書3には、漢字以外のひらがな、数字、アル
ファベント等は細分化さA1ず直接格納されている。
第3図は、入力レジスタ4の詳細を示す。0は認識部2
よりの出力、10〜(7は入力レジスタ4内の1゜レジ
スター1フレジスタ、]8は切4! It’ll M
、円は入力レジスタ4の出力を示す。
よりの出力、10〜(7は入力レジスタ4内の1゜レジ
スター1フレジスタ、]8は切4! It’ll M
、円は入力レジスタ4の出力を示す。
第4図は文字辞書6の一部分を示す。第4図第3行目は
、擬似部首コード176で示さ脂(るI−立−1という
擬似部首と擬似部首コード0FI(で示さ」1ろ「日」
とい59似部首により「音」という文字であることを示
し、「音」という文字の文字コードは、JISC622
6コードで3231−4というコードであることを示j
。尚、第4図の0内文字は説明の便のため記載したもの
で実際の辞書は擬似部−i¥+コードと文字コートで構
成される。
、擬似部首コード176で示さ脂(るI−立−1という
擬似部首と擬似部首コード0FI(で示さ」1ろ「日」
とい59似部首により「音」という文字であることを示
し、「音」という文字の文字コードは、JISC622
6コードで3231−4というコードであることを示j
。尚、第4図の0内文字は説明の便のため記載したもの
で実際の辞書は擬似部−i¥+コードと文字コートで構
成される。
第5図は、「彰」という文字を入力した時の本発明によ
る処理を示すため入力レジスタ4の1゜レジスタ10〜
■7レジスタ17へ入力される擬似部首コードを示した
ものである。
る処理を示すため入力レジスタ4の1゜レジスタ10〜
■7レジスタ17へ入力される擬似部首コードを示した
ものである。
以下、第5図を中心と1〜で本発明によるオンライン手
書文字認識の方法について「彰」という文字を例にとり
詳細に説明する。
書文字認識の方法について「彰」という文字を例にとり
詳細に説明する。
先づタイミング′■゛、でタブレット1より操作渚が「
1」を入力すると「゛」は認識部2へ出力され、認識部
2に於いて擬似部−―静置(以下辞書という。)3を用
いて擬似部首として登録されているか否かを検定するが
「゛」は辞書3に登録されていないため、未定義コード
*を■。レジスタ10に登録する。
1」を入力すると「゛」は認識部2へ出力され、認識部
2に於いて擬似部−―静置(以下辞書という。)3を用
いて擬似部首として登録されているか否かを検定するが
「゛」は辞書3に登録されていないため、未定義コード
*を■。レジスタ10に登録する。
ついでタイミングT2で1/」かタブレット1より入力
されると、タイミングT、で未定義の11」と合せて「
]という擬似部首が辞書3にあるかどうかを認識部2に
おいて検定すると、第2図で示されろ様に擬似部首コー
ド050としてビ′」という擬似部首が登録されている
ため、■oレジスタ10に050というコードがセント
されろ。
されると、タイミングT、で未定義の11」と合せて「
]という擬似部首が辞書3にあるかどうかを認識部2に
おいて検定すると、第2図で示されろ様に擬似部首コー
ド050としてビ′」という擬似部首が登録されている
ため、■oレジスタ10に050というコードがセント
されろ。
タイミングT3で入力されろ「゛」は擬似部首が辞書3
に登録されていないため、■oレジスタ10はそのまま
にして■ルジスタ11に未定義コー1’ * ヲ登録す
る。
に登録されていないため、■oレジスタ10はそのまま
にして■ルジスタ11に未定義コー1’ * ヲ登録す
る。
タイミング′(4で入力された「′」は、解重3に登録
されていないがタイミングT3で未定義の「゛」と合せ
て「′」という擬似部首が辞3!(3に014という擬
似部首コードで登録されているため、1ルジスタ月の未
定義コードを消去して新たに014というコードがセッ
トされる。なお、1疑似川イ1コード050ど014で
新たな擬似部首となるがどうかについて[パ・」という
文字で辞書3を用いて検定するが「パ」という文字は独
立の擬似部首として辞書3に存在しないため、■oレジ
スタ10、■ルジスタ11の内容は変らないで保持され
ろ。
されていないがタイミングT3で未定義の「゛」と合せ
て「′」という擬似部首が辞3!(3に014という擬
似部首コードで登録されているため、1ルジスタ月の未
定義コードを消去して新たに014というコードがセッ
トされる。なお、1疑似川イ1コード050ど014で
新たな擬似部首となるがどうかについて[パ・」という
文字で辞書3を用いて検定するが「パ」という文字は独
立の擬似部首として辞書3に存在しないため、■oレジ
スタ10、■ルジスタ11の内容は変らないで保持され
ろ。
タイミング′I″5で゛「−」が入力されろと1−」と
(・う文字は辞書3より擬似部首コード004でル)る
ことか判明するため■2レジスタ12に00/lが七ノ
ドされ、その後「・′」及び1立」について擬似部首コ
ードが辞書3に登録されているが否かを検定する。即ち
、その文字内の全ストロークについて最小個数の擬似部
首コードで表現するために検定な行なうこととなる。こ
の場合し′」は擬似部首コードとして登録されてな(「
立」は、擬似部首コード176として辞書に登録されて
いる。従って1゜レジスタ10. I、レジスタ11、
■2レジスタ12をリセットし、■。レジスタ10に1
76を登録する。か(して「立」という文字は、第2図
で示す擬似部首コード176で示される1ケの擬似部首
であることを示すこととなる。
(・う文字は辞書3より擬似部首コード004でル)る
ことか判明するため■2レジスタ12に00/lが七ノ
ドされ、その後「・′」及び1立」について擬似部首コ
ードが辞書3に登録されているが否かを検定する。即ち
、その文字内の全ストロークについて最小個数の擬似部
首コードで表現するために検定な行なうこととなる。こ
の場合し′」は擬似部首コードとして登録されてな(「
立」は、擬似部首コード176として辞書に登録されて
いる。従って1゜レジスタ10. I、レジスタ11、
■2レジスタ12をリセットし、■。レジスタ10に1
76を登録する。か(して「立」という文字は、第2図
で示す擬似部首コード176で示される1ケの擬似部首
であることを示すこととなる。
同様にして第5図に示すように「彰」という文字に関し
て、結果的に擬似部首コード176 、OFB 。
て、結果的に擬似部首コード176 、OFB 。
045.065で表わされる文字であることが認識され
ろ。なお、タイミング′■゛、で3ケの擬似部首コード
よりなる入力文字を再検定して1ケの擬似部首コード1
76を識別したのと同様に、タイミングT9では擬似部
首コード021よりなる文字と未定義の1 」及び「
」より擬似部首コードoPBなる文字「日」を識別し、
さらに又タイミング’l’l l + T13 rT、
4においてもそれぞれ2ケの擬似部首コードと識別され
た入力文字から1ケの擬似部首コードを識別している。
ろ。なお、タイミング′■゛、で3ケの擬似部首コード
よりなる入力文字を再検定して1ケの擬似部首コード1
76を識別したのと同様に、タイミングT9では擬似部
首コード021よりなる文字と未定義の1 」及び「
」より擬似部首コードoPBなる文字「日」を識別し、
さらに又タイミング’l’l l + T13 rT、
4においてもそれぞれ2ケの擬似部首コードと識別され
た入力文字から1ケの擬似部首コードを識別している。
こり〕様にして一種の最長一致法により擬似部首コード
の検定を行なつ不いる。一般的に最長一致法の場合、そ
の入力すべてが入力され終ってから一致を見ることが一
般的である。即ち、入力された全ストロークに対して判
定し、擬似部首と認めらねない場合は最後の1ストロー
クを除いて判定するという手法をとるが擬似部面−コー
ドとして辞書3に登録されている擬似部首の数が数字、
アルファベット、ひらがな、記号等を加えても600ケ
強であり多きな数になら′II[いこと、更には、人が
文字を入力する速度が遅いことを勘案して、入力順に検
定を行なっているものである。
の検定を行なつ不いる。一般的に最長一致法の場合、そ
の入力すべてが入力され終ってから一致を見ることが一
般的である。即ち、入力された全ストロークに対して判
定し、擬似部首と認めらねない場合は最後の1ストロー
クを除いて判定するという手法をとるが擬似部面−コー
ドとして辞書3に登録されている擬似部首の数が数字、
アルファベット、ひらがな、記号等を加えても600ケ
強であり多きな数になら′II[いこと、更には、人が
文字を入力する速度が遅いことを勘案して、入力順に検
定を行なっているものである。
以上説明したように、タブレット]より「彰」を入力す
ることにより入力レジスタ4内の1゜レジスタ10〜1
3レジスタ13内に擬似称(涌コード176゜OL”B
、 045,065 が格納されろ。こねら入力レジ
スタ4内の1゜レジスタ10〜■7レジスタ17の内容
は1)換回路18により出ブ月9に順次導出さ」1、選
択回路5に入力される。選択回路5では、入力された擬
似部首コードにより、第4南に示′1″文字−1¥書6
を用いてJIS C6226による文字コードを選択す
る。
ることにより入力レジスタ4内の1゜レジスタ10〜1
3レジスタ13内に擬似称(涌コード176゜OL”B
、 045,065 が格納されろ。こねら入力レジ
スタ4内の1゜レジスタ10〜■7レジスタ17の内容
は1)換回路18により出ブ月9に順次導出さ」1、選
択回路5に入力される。選択回路5では、入力された擬
似部首コードにより、第4南に示′1″文字−1¥書6
を用いてJIS C6226による文字コードを選択す
る。
すなわち、入力レジスタ4内の■。レジスタ10〜■7
レジスタ17に格納されている擬似部首コードが176
、01”B 、 045,065であることにより選択
回路5により、文字辞書6を調べると第4図に示す如く
擬似部首コードが176、OFB 、 045,065
である文字は3E34なる文字コードで示されろ漢字「
彰」であることが判明する。
レジスタ17に格納されている擬似部首コードが176
、01”B 、 045,065であることにより選択
回路5により、文字辞書6を調べると第4図に示す如く
擬似部首コードが176、OFB 、 045,065
である文字は3E34なる文字コードで示されろ漢字「
彰」であることが判明する。
以上の様にして3E34なろJIS C6226文字コ
ードが選択回路5より出力されろことによりタブレット
1より入力された手書文字が漢字「彰」であることが認
識されろ。
ードが選択回路5より出力されろことによりタブレット
1より入力された手書文字が漢字「彰」であることが認
識されろ。
以上詳細に説明したように前記実施例に於いては、漢字
を細分化して、細分化された文字の擬似部首となづけた
部分集合を認識し前記認識された擬似部首の集まりとし
て漢字を識別する方法を示す。ここで擬似部首を認識す
るためには、簡単なアルゴリズムの認識部2と、漢字の
数に比して極めて少数の擬似部首からなる擬似部首辞書
3でよいこととなる。例えば数字、アルファベット、ひ
らがな、記号類及びJ T S C6226第1水準漢
字集合2965字のための擬似部灯の数は600強でル
)す、この内400強が漢字2965字のための擬似部
首である。このように漢字2965字の字数を本発明に
よれば認識時のみ等測的に減少させろ効果を而1−るこ
ととなる。又、第2図に示′f擬似部言辞吉3の内容を
認識するための認識部2の機能は、周知のストロークア
ナリシス法等の簡単なアルゴリズムで゛よいことはその
道の専門家であれば容易に理解できるものと考える。更
にこれら認識さA′また擬似部首の集まりとして漢字を
含む文字を識別1−ろための文字群書6は、第4図に示
す様に単に擬似部首コードとJ Is C6226によ
る漢字コードだけで構成できるため漢字を含めた文字の
字数が多(なった場合でも極めて少量のメモリしか増加
しないことも本発明の利点であり、擬似部言辞■″3及
び文字辞書6を合せても、直接漢字を含む文字の特徴を
記録した従来の辞書の容量が犬であったのと相違して極
めて少量となるため、オンライン手書文字認識を、その
対象を漢字2965字より構成されるJiS C622
6第1水準漢字集合にまで広げたとしても、手軽に提供
することができ、もって、[ 情報処理全般にとって好適な入力装置を安価に提供する
ことができる。
を細分化して、細分化された文字の擬似部首となづけた
部分集合を認識し前記認識された擬似部首の集まりとし
て漢字を識別する方法を示す。ここで擬似部首を認識す
るためには、簡単なアルゴリズムの認識部2と、漢字の
数に比して極めて少数の擬似部首からなる擬似部首辞書
3でよいこととなる。例えば数字、アルファベット、ひ
らがな、記号類及びJ T S C6226第1水準漢
字集合2965字のための擬似部灯の数は600強でル
)す、この内400強が漢字2965字のための擬似部
首である。このように漢字2965字の字数を本発明に
よれば認識時のみ等測的に減少させろ効果を而1−るこ
ととなる。又、第2図に示′f擬似部言辞吉3の内容を
認識するための認識部2の機能は、周知のストロークア
ナリシス法等の簡単なアルゴリズムで゛よいことはその
道の専門家であれば容易に理解できるものと考える。更
にこれら認識さA′また擬似部首の集まりとして漢字を
含む文字を識別1−ろための文字群書6は、第4図に示
す様に単に擬似部首コードとJ Is C6226によ
る漢字コードだけで構成できるため漢字を含めた文字の
字数が多(なった場合でも極めて少量のメモリしか増加
しないことも本発明の利点であり、擬似部言辞■″3及
び文字辞書6を合せても、直接漢字を含む文字の特徴を
記録した従来の辞書の容量が犬であったのと相違して極
めて少量となるため、オンライン手書文字認識を、その
対象を漢字2965字より構成されるJiS C622
6第1水準漢字集合にまで広げたとしても、手軽に提供
することができ、もって、[ 情報処理全般にとって好適な入力装置を安価に提供する
ことができる。
前記実施例では基本的な要素について説明したが、以下
に示す様に各種の改良を実施することによりよりよいオ
ンライン手書文字認識力法を提供jろことができるので
以下に説明′8ろ。
に示す様に各種の改良を実施することによりよりよいオ
ンライン手書文字認識力法を提供jろことができるので
以下に説明′8ろ。
第1に、前記実施例では標準的な擬似部首辞書3を1ケ
だけ設けたが、標準的な辞書の他に使用者各個人用の擬
似部首相関辞書を1ケ又は複数個設け、認識しづらい擬
似部首を含んだ文字の擬似部首について後から追加登録
ができる構成とすれば、より一層認識率の向上が図J″
Iるとともに認識 1アルゴリズム自体も簡易なもので
よ(なるという効果がある。
だけ設けたが、標準的な辞書の他に使用者各個人用の擬
似部首相関辞書を1ケ又は複数個設け、認識しづらい擬
似部首を含んだ文字の擬似部首について後から追加登録
ができる構成とすれば、より一層認識率の向上が図J″
Iるとともに認識 1アルゴリズム自体も簡易なもので
よ(なるという効果がある。
第2に、前記実施例では文字辞書6の内容として擬似部
首コードと文字コードだけの組合せとしたが第4図の例
でも明らかな様に同じ「\門という文字でも「立」単独
で1つの文字を+n成するもの、「妾」、「音」、1章
」、「意」、「−童」の様に文字の上部にr−””−」
が位置するもの、「彰」、「韻」の様に文字の左上部に
ド−」が位置1−るもの等がある。これらの「立」は前
記実施例では全く同一に扱って居り、字数が実施例程度
の場合問題はないが、字数を更に増加させたい場合にお
いてはこれら「立」という文字の位置情報を文字辞書6
に含ませA1ば更に認識率を向」ニさせろことができる
。位置情報としてはJ T S C6226字形索引第
4項の字形構成を用いれは充分である。
首コードと文字コードだけの組合せとしたが第4図の例
でも明らかな様に同じ「\門という文字でも「立」単独
で1つの文字を+n成するもの、「妾」、「音」、1章
」、「意」、「−童」の様に文字の上部にr−””−」
が位置するもの、「彰」、「韻」の様に文字の左上部に
ド−」が位置1−るもの等がある。これらの「立」は前
記実施例では全く同一に扱って居り、字数が実施例程度
の場合問題はないが、字数を更に増加させたい場合にお
いてはこれら「立」という文字の位置情報を文字辞書6
に含ませA1ば更に認識率を向」ニさせろことができる
。位置情報としてはJ T S C6226字形索引第
4項の字形構成を用いれは充分である。
第3に前記実施例では、第5図を用いて説明した如く新
しいストロークがタブレット1より入力される毎に第1
ストロークまでさかのほって今■)かれた前記性しいス
トローク迄が1つの擬似部1ト1を構成しているかどう
かについて、入力さAまたストロークについて検定すべ
(説明した。例えば擬似部首「3」と「・」と「−」は
擬似部首コードでは050 、014 、004である
が、この3ケの擬似部に1が集った「立」も擬似部首で
ありそのコードは176であることを「立」のストロー
クにより擬似部首辞書3を参照して求めた。
しいストロークがタブレット1より入力される毎に第1
ストロークまでさかのほって今■)かれた前記性しいス
トローク迄が1つの擬似部1ト1を構成しているかどう
かについて、入力さAまたストロークについて検定すべ
(説明した。例えば擬似部首「3」と「・」と「−」は
擬似部首コードでは050 、014 、004である
が、この3ケの擬似部に1が集った「立」も擬似部首で
ありそのコードは176であることを「立」のストロー
クにより擬似部首辞書3を参照して求めた。
しかしながら、認識部2より参照する辞書として擬似部
首辞書3の他に、(擬似部首050 ) +(擬似部首
014 ) +(擬似部首004. ) −(擬似部面
176)の如き擬似部首間の相関々係を示す擬似部首相
関辞書を設けれは、認識処理時間が極めて早くなるとい
う効果がある。
首辞書3の他に、(擬似部首050 ) +(擬似部首
014 ) +(擬似部首004. ) −(擬似部面
176)の如き擬似部首間の相関々係を示す擬似部首相
関辞書を設けれは、認識処理時間が極めて早くなるとい
う効果がある。
以上詳細に説明した様に、本発明は認識が困難な漢字を
細分化しこの細分化した擬似部首を認識し擬似部首の集
まりとして漢字を識別するため、先づ認識辞書に要する
記1意容量が極小でよく更に認識文字数の増加にともな
う記憶容量の増加を極めて低(おさえられ更に、前記説
明の通り認識するのは擬似部首とし・うカナレベルのも
のであるため認識率そのものも高く保てるという好適な
オンライン手書文字認識方法を安価に提供することがで
きる。
細分化しこの細分化した擬似部首を認識し擬似部首の集
まりとして漢字を識別するため、先づ認識辞書に要する
記1意容量が極小でよく更に認識文字数の増加にともな
う記憶容量の増加を極めて低(おさえられ更に、前記説
明の通り認識するのは擬似部首とし・うカナレベルのも
のであるため認識率そのものも高く保てるという好適な
オンライン手書文字認識方法を安価に提供することがで
きる。
第1図は本発明の一実施例のブロック図、第2図は擬似
部首辞書の1例を示す図、第3図は入力レジスタの詳細
図、第4図は文字辞書の部分図、第5図は本発明による
認識方法を示I−図である。 1 タブレット、 2・・・認識部、3・・・擬
似部首辞書、 4・・・入力レジスタ、5・・選択
回路、 6・・・文字辞書、9・・認識部2よ
りの出力、 10〜17・・・入力レジスタ4内の1゜レジスター1
フレジスタ、 18・・切換回路、 19・・・入力レジス
タ4の出力。 特許出願人 沖電気工業株式会社 特許出願代理人 弁理士 山 本 恵 − (15) 第1図 第3図
部首辞書の1例を示す図、第3図は入力レジスタの詳細
図、第4図は文字辞書の部分図、第5図は本発明による
認識方法を示I−図である。 1 タブレット、 2・・・認識部、3・・・擬
似部首辞書、 4・・・入力レジスタ、5・・選択
回路、 6・・・文字辞書、9・・認識部2よ
りの出力、 10〜17・・・入力レジスタ4内の1゜レジスター1
フレジスタ、 18・・切換回路、 19・・・入力レジス
タ4の出力。 特許出願人 沖電気工業株式会社 特許出願代理人 弁理士 山 本 恵 − (15) 第1図 第3図
Claims (1)
- 手書文字のストローク情報を抽出するタブレットと、文
字の特徴を格納する辞書とを有し、タブレットからの情
報を辞書の特徴と比較して手書文字を識別するオンライ
ン文字識別方法において、漢字を細分化した部分集合パ
ターン及び漢字以外の文字の全体のパターンの特徴を格
納する第1辞書と、漢字の部分集合の集まり及び漢字以
外の文字に対して文字コードを格納する第2辞書と、タ
ブレットからの情報と第1辞書ア゛出力とを比較する認
識部と、認識結果を格納する入力レジスタと、入力レジ
スタの内容を第2辞書と比較して文字を識別する選択回
路とより構成され、漢字を音μ分集合切に比較識別する
ことを特徴とするオンライン文字認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56180363A JPS5882373A (ja) | 1981-11-12 | 1981-11-12 | オンライン文字認識方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56180363A JPS5882373A (ja) | 1981-11-12 | 1981-11-12 | オンライン文字認識方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5882373A true JPS5882373A (ja) | 1983-05-17 |
| JPH0258664B2 JPH0258664B2 (ja) | 1990-12-10 |
Family
ID=16081929
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56180363A Granted JPS5882373A (ja) | 1981-11-12 | 1981-11-12 | オンライン文字認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5882373A (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60200383A (ja) * | 1984-03-24 | 1985-10-09 | Oki Electric Ind Co Ltd | オンライン文字認識装置 |
| JPS61271586A (ja) * | 1985-05-27 | 1986-12-01 | Fujitsu Ltd | 文字認識方式 |
| JPS62271086A (ja) * | 1986-05-20 | 1987-11-25 | Canon Inc | パタ−ン認識装置 |
| JPS63155389A (ja) * | 1986-12-19 | 1988-06-28 | Toshiba Corp | オンライン文字認識装置 |
| JPH01258088A (ja) * | 1988-04-07 | 1989-10-16 | Fujitsu Ltd | オンライン手書き文字認識方式 |
| JPH02122387A (ja) * | 1988-09-30 | 1990-05-10 | Lgz Landis & Gyr Zug Ag | バーコード区画とバーコードの読取装置 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5539925A (en) * | 1978-09-11 | 1980-03-21 | Nippon Telegr & Teleph Corp <Ntt> | Character recognition processing system |
-
1981
- 1981-11-12 JP JP56180363A patent/JPS5882373A/ja active Granted
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5539925A (en) * | 1978-09-11 | 1980-03-21 | Nippon Telegr & Teleph Corp <Ntt> | Character recognition processing system |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60200383A (ja) * | 1984-03-24 | 1985-10-09 | Oki Electric Ind Co Ltd | オンライン文字認識装置 |
| JPS61271586A (ja) * | 1985-05-27 | 1986-12-01 | Fujitsu Ltd | 文字認識方式 |
| JPS62271086A (ja) * | 1986-05-20 | 1987-11-25 | Canon Inc | パタ−ン認識装置 |
| JPS63155389A (ja) * | 1986-12-19 | 1988-06-28 | Toshiba Corp | オンライン文字認識装置 |
| JPH01258088A (ja) * | 1988-04-07 | 1989-10-16 | Fujitsu Ltd | オンライン手書き文字認識方式 |
| JPH02122387A (ja) * | 1988-09-30 | 1990-05-10 | Lgz Landis & Gyr Zug Ag | バーコード区画とバーコードの読取装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0258664B2 (ja) | 1990-12-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Samih et al. | Multilingual code-switching identification via lstm recurrent neural networks | |
| JP2726568B2 (ja) | 文字認識方法及び装置 | |
| Ullmann | A binary n-gram technique for automatic correction of substitution, deletion, insertion and reversal errors in words | |
| US5467407A (en) | Method and apparatus for recognizing cursive writing from sequential input information | |
| CN102982021B (zh) | 用于消除语言转换中的多个读法的歧义的方法 | |
| JPS60142793A (ja) | 文字認識方法 | |
| CN110377882B (zh) | 用于确定文本的拼音的方法、装置、系统和存储介质 | |
| US5331557A (en) | Audio-video coding system for Chinese characters | |
| CN109359227A (zh) | 近似商标的获取方法、装置、计算机设备和存储介质 | |
| CN108563634A (zh) | 文字拼写错误的识别方法、系统、计算机设备及存储介质 | |
| JPS5882373A (ja) | オンライン文字認識方法 | |
| KR100288144B1 (ko) | 한글로 표기된 외래어 코드화 방법 및 그를 이용한 검색 방법 | |
| Karimi et al. | UniParma at SemEval-2021 task 5: Toxic spans detection using CharacterBERT and bag-of-words model | |
| US7889927B2 (en) | Chinese character search method and apparatus thereof | |
| RU2004115749A (ru) | Неограниченная языком компьютеризованная кодирующая-декодирующая система и способ | |
| JPH0896081A (ja) | 文字認識装置及び文字認識方法 | |
| JPS592191A (ja) | 手書き日本語文の認識処理方式 | |
| CN1102255C (zh) | 辞典登录方法,文字识别方法及文字识别装置 | |
| TW452711B (en) | Method using word affix for word search | |
| JPS5884372A (ja) | 特定筆記者オンライン文字認識方法 | |
| JPH01287774A (ja) | 和文データ入力処理装置 | |
| JPS6293776A (ja) | 情報認識装置 | |
| JP2002149641A (ja) | 手書文字認識装置、及び手書文字認識プログラムを記録した記録媒体 | |
| JPS6162985A (ja) | 認識順位決定方式 | |
| JPS6321226B2 (ja) |