JPS5882373A - オンライン文字認識方法 - Google Patents

オンライン文字認識方法

Info

Publication number
JPS5882373A
JPS5882373A JP56180363A JP18036381A JPS5882373A JP S5882373 A JPS5882373 A JP S5882373A JP 56180363 A JP56180363 A JP 56180363A JP 18036381 A JP18036381 A JP 18036381A JP S5882373 A JPS5882373 A JP S5882373A
Authority
JP
Japan
Prior art keywords
pseudo
kanji
dictionary
character
radical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56180363A
Other languages
English (en)
Other versions
JPH0258664B2 (ja
Inventor
Shuzo Owaku
大和久 修三
Akio Nagano
長野 昭夫
Katsuhide Tanoshima
田野島 克秀
「まん」木 正義
Masayoshi Yurugi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP56180363A priority Critical patent/JPS5882373A/ja
Publication of JPS5882373A publication Critical patent/JPS5882373A/ja
Publication of JPH0258664B2 publication Critical patent/JPH0258664B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 不発明は、情報処理機器の入力装置として用いらJする
オンライン手書文字認識装置に関わる認識方法に関1゛
−るものである。
従来の手書文字入力ワードプロセノサは手書文字を認識
するためにオンライン手書文字認識技術を用いていたが
、・lり11えば数字、アルファベット、ひらがな、漢
字を認識する場合、数字10ケ、アルファベット26ケ
、ひらがな46文字及び濁点、半濁点をはじめと1ろ記
号類を含むと約200字あり、又、漢字をJ■5C62
26第1水準漢字集合に限っても2965字存在する。
漢字を常用漢字にしはっても1945字あり計2000
文字を越えろこととなる。
さて、漢字を当用漢字とし合計2000字強の文字を認
識する手書文字入力日本語ワードプロセノザも発表され
ているがその認識処理は、例えばK −、L展開法を用
いて、漢字を直接認識せんと1−ろ等、ハードウェア量
が犬となりJ−ぎるという欠点があった。又、前記の例
に限らず手書漢字を数字、アルファベント、ひらがな等
と同じアルゴリズムで直接認識せんとするため、認識の
ための計算量が膨大となり処理時間がかがろこととなり
、この処埋時間を短縮するため・・−ドウエア量の増加
を招(という、実用化という観点からみた場合正大な欠
点があった。
本発明は前記の欠点を除去することを[]的どじ、漢字
を細分化して細分化された文字の:′1’l)分集合を
認識し前記認識された部分集合の集まりと(〜て漢字を
識別1−るものであって、等何泊に認識1′る漢字の字
数を減づろと共に辞書に要I−ろ記憶簀I11゛をも減
づるもので認識対象の文字i’i#居はMt+記文字の
部分集合の系列の形で登録できるため認識文字数の増加
にともなう記憶容量の増加を低くオdさえろことかでき
ろという特徴を有1−ろ。
以下図面により実施例を説明する。1 第1図は本発明の一実施例を示′1−ブロンク図であっ
て1はタブレット、2は認識部、3は漢字を細分化した
文字の部分集合と漢字以外の文字(以下擬似部首という
)の特徴と擬似部1″]コートを格納した擬似部首辞書
、4は認識+−192で認識さ、lzた擬似部首コ ド
を格納−4−ろ入力レジスタ、5は入力レジスタ4内に
格納さ、1′1ている1ケ又はNbの(3) 擬似部首コ・−ドより文字を選択する選択回路、6は擬
似部首コードと文字コートを格納した文字辞書の如く構
成されて居ろ。タブレノl−1より入力されたストロー
ク情報は、認識部2へ送られる。
認識部2(まオンライン手書に好適な周知のストローク
アナリシス法やに、 −L展開法等により各擬似部首を
認識1″′るよ5に働く。認識部2で認識1−ろ際は、
擬似部首の特徴と擬似部首コードを格納した擬似部首辞
書3を用いろ。認識部2の出力(′f−1擬似部首コー
ドのり1条で入力レジスタ4に認識さ牙する都度出力さ
れ格納さ才′1ろ。入力レジスタ4より格Ji’lされ
ている擬似部首コードが順次出力され、選択回路5に入
力されろ。選択回路5では、文字辞書6の内容と入力レ
ジスタ4の出力の擬似部首コードとにより文字を選択し
結果の文字コードを出力する。
第2図は擬似部首辞書−3の一例を示1゛。000より
続<16進の数字は擬似部首コートを示し、擬似↑lX
lX−ドの右側には各擬似部首が記載されている3゜実
際の辞書では、各擬似部首の位置には認識部2(4) の認識アルゴリズムに基(特徴テークが記載されるがこ
こでは説明の便のため各擬似部首そのものを示¥。なお
擬似部首辞書3には、漢字以外のひらがな、数字、アル
ファベント等は細分化さA1ず直接格納されている。
第3図は、入力レジスタ4の詳細を示す。0は認識部2
よりの出力、10〜(7は入力レジスタ4内の1゜レジ
スター1フレジスタ、]8は切4! It’ll M 
、円は入力レジスタ4の出力を示す。
第4図は文字辞書6の一部分を示す。第4図第3行目は
、擬似部首コード176で示さ脂(るI−立−1という
擬似部首と擬似部首コード0FI(で示さ」1ろ「日」
とい59似部首により「音」という文字であることを示
し、「音」という文字の文字コードは、JISC622
6コードで3231−4というコードであることを示j
。尚、第4図の0内文字は説明の便のため記載したもの
で実際の辞書は擬似部−i¥+コードと文字コートで構
成される。
第5図は、「彰」という文字を入力した時の本発明によ
る処理を示すため入力レジスタ4の1゜レジスタ10〜
■7レジスタ17へ入力される擬似部首コードを示した
ものである。
以下、第5図を中心と1〜で本発明によるオンライン手
書文字認識の方法について「彰」という文字を例にとり
詳細に説明する。
先づタイミング′■゛、でタブレット1より操作渚が「
1」を入力すると「゛」は認識部2へ出力され、認識部
2に於いて擬似部−―静置(以下辞書という。)3を用
いて擬似部首として登録されているか否かを検定するが
「゛」は辞書3に登録されていないため、未定義コード
*を■。レジスタ10に登録する。
ついでタイミングT2で1/」かタブレット1より入力
されると、タイミングT、で未定義の11」と合せて「
]という擬似部首が辞書3にあるかどうかを認識部2に
おいて検定すると、第2図で示されろ様に擬似部首コー
ド050としてビ′」という擬似部首が登録されている
ため、■oレジスタ10に050というコードがセント
されろ。
タイミングT3で入力されろ「゛」は擬似部首が辞書3
に登録されていないため、■oレジスタ10はそのまま
にして■ルジスタ11に未定義コー1’ * ヲ登録す
る。
タイミング′(4で入力された「′」は、解重3に登録
されていないがタイミングT3で未定義の「゛」と合せ
て「′」という擬似部首が辞3!(3に014という擬
似部首コードで登録されているため、1ルジスタ月の未
定義コードを消去して新たに014というコードがセッ
トされる。なお、1疑似川イ1コード050ど014で
新たな擬似部首となるがどうかについて[パ・」という
文字で辞書3を用いて検定するが「パ」という文字は独
立の擬似部首として辞書3に存在しないため、■oレジ
スタ10、■ルジスタ11の内容は変らないで保持され
ろ。
タイミング′I″5で゛「−」が入力されろと1−」と
(・う文字は辞書3より擬似部首コード004でル)る
ことか判明するため■2レジスタ12に00/lが七ノ
ドされ、その後「・′」及び1立」について擬似部首コ
ードが辞書3に登録されているが否かを検定する。即ち
、その文字内の全ストロークについて最小個数の擬似部
首コードで表現するために検定な行なうこととなる。こ
の場合し′」は擬似部首コードとして登録されてな(「
立」は、擬似部首コード176として辞書に登録されて
いる。従って1゜レジスタ10. I、レジスタ11、
■2レジスタ12をリセットし、■。レジスタ10に1
76を登録する。か(して「立」という文字は、第2図
で示す擬似部首コード176で示される1ケの擬似部首
であることを示すこととなる。
同様にして第5図に示すように「彰」という文字に関し
て、結果的に擬似部首コード176 、OFB 。
045.065で表わされる文字であることが認識され
ろ。なお、タイミング′■゛、で3ケの擬似部首コード
よりなる入力文字を再検定して1ケの擬似部首コード1
76を識別したのと同様に、タイミングT9では擬似部
首コード021よりなる文字と未定義の1 」及び「 
」より擬似部首コードoPBなる文字「日」を識別し、
さらに又タイミング’l’l l + T13 rT、
4においてもそれぞれ2ケの擬似部首コードと識別され
た入力文字から1ケの擬似部首コードを識別している。
こり〕様にして一種の最長一致法により擬似部首コード
の検定を行なつ不いる。一般的に最長一致法の場合、そ
の入力すべてが入力され終ってから一致を見ることが一
般的である。即ち、入力された全ストロークに対して判
定し、擬似部首と認めらねない場合は最後の1ストロー
クを除いて判定するという手法をとるが擬似部面−コー
ドとして辞書3に登録されている擬似部首の数が数字、
アルファベット、ひらがな、記号等を加えても600ケ
強であり多きな数になら′II[いこと、更には、人が
文字を入力する速度が遅いことを勘案して、入力順に検
定を行なっているものである。
以上説明したように、タブレット]より「彰」を入力す
ることにより入力レジスタ4内の1゜レジスタ10〜1
3レジスタ13内に擬似称(涌コード176゜OL”B
 、 045,065 が格納されろ。こねら入力レジ
スタ4内の1゜レジスタ10〜■7レジスタ17の内容
は1)換回路18により出ブ月9に順次導出さ」1、選
択回路5に入力される。選択回路5では、入力された擬
似部首コードにより、第4南に示′1″文字−1¥書6
を用いてJIS C6226による文字コードを選択す
る。
すなわち、入力レジスタ4内の■。レジスタ10〜■7
レジスタ17に格納されている擬似部首コードが176
、01”B 、 045,065であることにより選択
回路5により、文字辞書6を調べると第4図に示す如く
擬似部首コードが176、OFB 、 045,065
である文字は3E34なる文字コードで示されろ漢字「
彰」であることが判明する。
以上の様にして3E34なろJIS C6226文字コ
ードが選択回路5より出力されろことによりタブレット
1より入力された手書文字が漢字「彰」であることが認
識されろ。
以上詳細に説明したように前記実施例に於いては、漢字
を細分化して、細分化された文字の擬似部首となづけた
部分集合を認識し前記認識された擬似部首の集まりとし
て漢字を識別する方法を示す。ここで擬似部首を認識す
るためには、簡単なアルゴリズムの認識部2と、漢字の
数に比して極めて少数の擬似部首からなる擬似部首辞書
3でよいこととなる。例えば数字、アルファベット、ひ
らがな、記号類及びJ T S C6226第1水準漢
字集合2965字のための擬似部灯の数は600強でル
)す、この内400強が漢字2965字のための擬似部
首である。このように漢字2965字の字数を本発明に
よれば認識時のみ等測的に減少させろ効果を而1−るこ
ととなる。又、第2図に示′f擬似部言辞吉3の内容を
認識するための認識部2の機能は、周知のストロークア
ナリシス法等の簡単なアルゴリズムで゛よいことはその
道の専門家であれば容易に理解できるものと考える。更
にこれら認識さA′また擬似部首の集まりとして漢字を
含む文字を識別1−ろための文字群書6は、第4図に示
す様に単に擬似部首コードとJ Is C6226によ
る漢字コードだけで構成できるため漢字を含めた文字の
字数が多(なった場合でも極めて少量のメモリしか増加
しないことも本発明の利点であり、擬似部言辞■″3及
び文字辞書6を合せても、直接漢字を含む文字の特徴を
記録した従来の辞書の容量が犬であったのと相違して極
めて少量となるため、オンライン手書文字認識を、その
対象を漢字2965字より構成されるJiS C622
6第1水準漢字集合にまで広げたとしても、手軽に提供
することができ、もって、[ 情報処理全般にとって好適な入力装置を安価に提供する
ことができる。
前記実施例では基本的な要素について説明したが、以下
に示す様に各種の改良を実施することによりよりよいオ
ンライン手書文字認識力法を提供jろことができるので
以下に説明′8ろ。
第1に、前記実施例では標準的な擬似部首辞書3を1ケ
だけ設けたが、標準的な辞書の他に使用者各個人用の擬
似部首相関辞書を1ケ又は複数個設け、認識しづらい擬
似部首を含んだ文字の擬似部首について後から追加登録
ができる構成とすれば、より一層認識率の向上が図J″
Iるとともに認識 1アルゴリズム自体も簡易なもので
よ(なるという効果がある。
第2に、前記実施例では文字辞書6の内容として擬似部
首コードと文字コードだけの組合せとしたが第4図の例
でも明らかな様に同じ「\門という文字でも「立」単独
で1つの文字を+n成するもの、「妾」、「音」、1章
」、「意」、「−童」の様に文字の上部にr−””−」
が位置するもの、「彰」、「韻」の様に文字の左上部に
ド−」が位置1−るもの等がある。これらの「立」は前
記実施例では全く同一に扱って居り、字数が実施例程度
の場合問題はないが、字数を更に増加させたい場合にお
いてはこれら「立」という文字の位置情報を文字辞書6
に含ませA1ば更に認識率を向」ニさせろことができる
。位置情報としてはJ T S C6226字形索引第
4項の字形構成を用いれは充分である。
第3に前記実施例では、第5図を用いて説明した如く新
しいストロークがタブレット1より入力される毎に第1
ストロークまでさかのほって今■)かれた前記性しいス
トローク迄が1つの擬似部1ト1を構成しているかどう
かについて、入力さAまたストロークについて検定すべ
(説明した。例えば擬似部首「3」と「・」と「−」は
擬似部首コードでは050 、014 、004である
が、この3ケの擬似部に1が集った「立」も擬似部首で
ありそのコードは176であることを「立」のストロー
クにより擬似部首辞書3を参照して求めた。
しかしながら、認識部2より参照する辞書として擬似部
首辞書3の他に、(擬似部首050 ) +(擬似部首
014 ) +(擬似部首004. ) −(擬似部面
176)の如き擬似部首間の相関々係を示す擬似部首相
関辞書を設けれは、認識処理時間が極めて早くなるとい
う効果がある。
以上詳細に説明した様に、本発明は認識が困難な漢字を
細分化しこの細分化した擬似部首を認識し擬似部首の集
まりとして漢字を識別するため、先づ認識辞書に要する
記1意容量が極小でよく更に認識文字数の増加にともな
う記憶容量の増加を極めて低(おさえられ更に、前記説
明の通り認識するのは擬似部首とし・うカナレベルのも
のであるため認識率そのものも高く保てるという好適な
オンライン手書文字認識方法を安価に提供することがで
きる。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図、第2図は擬似
部首辞書の1例を示す図、第3図は入力レジスタの詳細
図、第4図は文字辞書の部分図、第5図は本発明による
認識方法を示I−図である。 1 タブレット、    2・・・認識部、3・・・擬
似部首辞書、   4・・・入力レジスタ、5・・選択
回路、     6・・・文字辞書、9・・認識部2よ
りの出力、 10〜17・・・入力レジスタ4内の1゜レジスター1
フレジスタ、 18・・切換回路、      19・・・入力レジス
タ4の出力。 特許出願人 沖電気工業株式会社 特許出願代理人 弁理士  山 本 恵 − (15) 第1図 第3図

Claims (1)

    【特許請求の範囲】
  1. 手書文字のストローク情報を抽出するタブレットと、文
    字の特徴を格納する辞書とを有し、タブレットからの情
    報を辞書の特徴と比較して手書文字を識別するオンライ
    ン文字識別方法において、漢字を細分化した部分集合パ
    ターン及び漢字以外の文字の全体のパターンの特徴を格
    納する第1辞書と、漢字の部分集合の集まり及び漢字以
    外の文字に対して文字コードを格納する第2辞書と、タ
    ブレットからの情報と第1辞書ア゛出力とを比較する認
    識部と、認識結果を格納する入力レジスタと、入力レジ
    スタの内容を第2辞書と比較して文字を識別する選択回
    路とより構成され、漢字を音μ分集合切に比較識別する
    ことを特徴とするオンライン文字認識方法。
JP56180363A 1981-11-12 1981-11-12 オンライン文字認識方法 Granted JPS5882373A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56180363A JPS5882373A (ja) 1981-11-12 1981-11-12 オンライン文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56180363A JPS5882373A (ja) 1981-11-12 1981-11-12 オンライン文字認識方法

Publications (2)

Publication Number Publication Date
JPS5882373A true JPS5882373A (ja) 1983-05-17
JPH0258664B2 JPH0258664B2 (ja) 1990-12-10

Family

ID=16081929

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56180363A Granted JPS5882373A (ja) 1981-11-12 1981-11-12 オンライン文字認識方法

Country Status (1)

Country Link
JP (1) JPS5882373A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60200383A (ja) * 1984-03-24 1985-10-09 Oki Electric Ind Co Ltd オンライン文字認識装置
JPS61271586A (ja) * 1985-05-27 1986-12-01 Fujitsu Ltd 文字認識方式
JPS62271086A (ja) * 1986-05-20 1987-11-25 Canon Inc パタ−ン認識装置
JPS63155389A (ja) * 1986-12-19 1988-06-28 Toshiba Corp オンライン文字認識装置
JPH01258088A (ja) * 1988-04-07 1989-10-16 Fujitsu Ltd オンライン手書き文字認識方式
JPH02122387A (ja) * 1988-09-30 1990-05-10 Lgz Landis & Gyr Zug Ag バーコード区画とバーコードの読取装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5539925A (en) * 1978-09-11 1980-03-21 Nippon Telegr & Teleph Corp <Ntt> Character recognition processing system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5539925A (en) * 1978-09-11 1980-03-21 Nippon Telegr & Teleph Corp <Ntt> Character recognition processing system

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60200383A (ja) * 1984-03-24 1985-10-09 Oki Electric Ind Co Ltd オンライン文字認識装置
JPS61271586A (ja) * 1985-05-27 1986-12-01 Fujitsu Ltd 文字認識方式
JPS62271086A (ja) * 1986-05-20 1987-11-25 Canon Inc パタ−ン認識装置
JPS63155389A (ja) * 1986-12-19 1988-06-28 Toshiba Corp オンライン文字認識装置
JPH01258088A (ja) * 1988-04-07 1989-10-16 Fujitsu Ltd オンライン手書き文字認識方式
JPH02122387A (ja) * 1988-09-30 1990-05-10 Lgz Landis & Gyr Zug Ag バーコード区画とバーコードの読取装置

Also Published As

Publication number Publication date
JPH0258664B2 (ja) 1990-12-10

Similar Documents

Publication Publication Date Title
Samih et al. Multilingual code-switching identification via lstm recurrent neural networks
JP2726568B2 (ja) 文字認識方法及び装置
Ullmann A binary n-gram technique for automatic correction of substitution, deletion, insertion and reversal errors in words
US5467407A (en) Method and apparatus for recognizing cursive writing from sequential input information
CN102982021B (zh) 用于消除语言转换中的多个读法的歧义的方法
JPS60142793A (ja) 文字認識方法
CN110377882B (zh) 用于确定文本的拼音的方法、装置、系统和存储介质
US5331557A (en) Audio-video coding system for Chinese characters
CN109359227A (zh) 近似商标的获取方法、装置、计算机设备和存储介质
CN108563634A (zh) 文字拼写错误的识别方法、系统、计算机设备及存储介质
JPS5882373A (ja) オンライン文字認識方法
KR100288144B1 (ko) 한글로 표기된 외래어 코드화 방법 및 그를 이용한 검색 방법
Karimi et al. UniParma at SemEval-2021 task 5: Toxic spans detection using CharacterBERT and bag-of-words model
US7889927B2 (en) Chinese character search method and apparatus thereof
RU2004115749A (ru) Неограниченная языком компьютеризованная кодирующая-декодирующая система и способ
JPH0896081A (ja) 文字認識装置及び文字認識方法
JPS592191A (ja) 手書き日本語文の認識処理方式
CN1102255C (zh) 辞典登录方法,文字识别方法及文字识别装置
TW452711B (en) Method using word affix for word search
JPS5884372A (ja) 特定筆記者オンライン文字認識方法
JPH01287774A (ja) 和文データ入力処理装置
JPS6293776A (ja) 情報認識装置
JP2002149641A (ja) 手書文字認識装置、及び手書文字認識プログラムを記録した記録媒体
JPS6162985A (ja) 認識順位決定方式
JPS6321226B2 (ja)