JPS5882373A

JPS5882373A - オンライン文字認識方法

Info

Publication number: JPS5882373A
Application number: JP56180363A
Authority: JP
Inventors: Shuzo Owaku; 大和久　修三; Akio Nagano; 長野　昭夫; Katsuhide Tanoshima; 田野島　克秀; 「まん」木　正義; Masayoshi Yurugi
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1981-11-12
Filing date: 1981-11-12
Publication date: 1983-05-17
Also published as: JPH0258664B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】不発明は、情報処理機器の入力装置として用いらＪする
オンライン手書文字認識装置に関わる認識方法に関１゛
−るものである。

従来の手書文字入力ワードプロセノサは手書文字を認識
するためにオンライン手書文字認識技術を用いていたが
、・ｌり１１えば数字、アルファベット、ひらがな、漢
字を認識する場合、数字１０ケ、アルファベット２６ケ
、ひらがな４６文字及び濁点、半濁点をはじめと１ろ記
号類を含むと約２００字あり、又、漢字をＪ■５Ｃ６２
２６第１水準漢字集合に限っても２９６５字存在する。

漢字を常用漢字にしはっても１９４５字あり計２０００
文字を越えろこととなる。

さて、漢字を当用漢字とし合計２０００字強の文字を認
識する手書文字入力日本語ワードプロセノザも発表され
ているがその認識処理は、例えばＫ　−、Ｌ展開法を用
いて、漢字を直接認識せんと１−ろ等、ハードウェア量
が犬となりＪ−ぎるという欠点があった。又、前記の例
に限らず手書漢字を数字、アルファベント、ひらがな等
と同じアルゴリズムで直接認識せんとするため、認識の
ための計算量が膨大となり処理時間がかがろこととなり
、この処埋時間を短縮するため・・−ドウエア量の増加
を招（という、実用化という観点からみた場合正大な欠
点があった。

本発明は前記の欠点を除去することを［］的どじ、漢字
を細分化して細分化された文字の：′１’ｌ）分集合を
認識し前記認識された部分集合の集まりと（〜て漢字を
識別１−るものであって、等何泊に認識１′る漢字の字
数を減づろと共に辞書に要Ｉ−ろ記憶簀Ｉ１１゛をも減
づるもので認識対象の文字ｉ’ｉ＃居はＭｔ＋記文字の
部分集合の系列の形で登録できるため認識文字数の増加
にともなう記憶容量の増加を低くオｄさえろことかでき
ろという特徴を有１−ろ。

以下図面により実施例を説明する。１第１図は本発明の一実施例を示′１−ブロンク図であっ
て１はタブレット、２は認識部、３は漢字を細分化した
文字の部分集合と漢字以外の文字（以下擬似部首という
）の特徴と擬似部１″］コートを格納した擬似部首辞書
、４は認識＋−１９２で認識さ、ｌｚた擬似部首コ　ド
を格納−４−ろ入力レジスタ、５は入力レジスタ４内に
格納さ、１′１ている１ケ又はＮｂの（３）擬似部首コ・−ドより文字を選択する選択回路、６は擬
似部首コードと文字コートを格納した文字辞書の如く構
成されて居ろ。タブレノｌ−１より入力されたストロー
ク情報は、認識部２へ送られる。

認識部２（まオンライン手書に好適な周知のストローク
アナリシス法やに、　−Ｌ展開法等により各擬似部首を
認識１″′るよ５に働く。認識部２で認識１−ろ際は、
擬似部首の特徴と擬似部首コードを格納した擬似部首辞
書３を用いろ。認識部２の出力（′ｆ−１擬似部首コー
ドのり１条で入力レジスタ４に認識さ牙する都度出力さ
れ格納さ才′１ろ。入力レジスタ４より格Ｊｉ’ｌされ
ている擬似部首コードが順次出力され、選択回路５に入
力されろ。選択回路５では、文字辞書６の内容と入力レ
ジスタ４の出力の擬似部首コードとにより文字を選択し
結果の文字コードを出力する。

第２図は擬似部首辞書−３の一例を示１゛。０００より
続＜１６進の数字は擬似部首コートを示し、擬似↑ｌＸ
ｌＸ−ドの右側には各擬似部首が記載されている３゜実
際の辞書では、各擬似部首の位置には認識部２（４）の認識アルゴリズムに基（特徴テークが記載されるがこ
こでは説明の便のため各擬似部首そのものを示￥。なお
擬似部首辞書３には、漢字以外のひらがな、数字、アル
ファベント等は細分化さＡ１ず直接格納されている。

第３図は、入力レジスタ４の詳細を示す。０は認識部２
よりの出力、１０〜（７は入力レジスタ４内の１゜レジ
スター１フレジスタ、］８は切４！　Ｉｔ’ｌｌ　Ｍ　
、円は入力レジスタ４の出力を示す。

第４図は文字辞書６の一部分を示す。第４図第３行目は
、擬似部首コード１７６で示さ脂（るＩ−立−１という
擬似部首と擬似部首コード０ＦＩ（で示さ」１ろ「日」
とい５９似部首により「音」という文字であることを示
し、「音」という文字の文字コードは、ＪＩＳＣ６２２
６コードで３２３１−４というコードであることを示ｊ
。尚、第４図の０内文字は説明の便のため記載したもの
で実際の辞書は擬似部−ｉ￥＋コードと文字コートで構
成される。

第５図は、「彰」という文字を入力した時の本発明によ
る処理を示すため入力レジスタ４の１゜レジスタ１０〜
■７レジスタ１７へ入力される擬似部首コードを示した
ものである。

以下、第５図を中心と１〜で本発明によるオンライン手
書文字認識の方法について「彰」という文字を例にとり
詳細に説明する。

先づタイミング′■゛、でタブレット１より操作渚が「
１」を入力すると「゛」は認識部２へ出力され、認識部
２に於いて擬似部−―静置（以下辞書という。）３を用
いて擬似部首として登録されているか否かを検定するが
「゛」は辞書３に登録されていないため、未定義コード
＊を■。レジスタ１０に登録する。

ついでタイミングＴ２で１／」かタブレット１より入力
されると、タイミングＴ、で未定義の１１」と合せて「
］という擬似部首が辞書３にあるかどうかを認識部２に
おいて検定すると、第２図で示されろ様に擬似部首コー
ド０５０としてビ′」という擬似部首が登録されている
ため、■ｏレジスタ１０に０５０というコードがセント
されろ。

タイミングＴ３で入力されろ「゛」は擬似部首が辞書３
に登録されていないため、■ｏレジスタ１０はそのまま
にして■ルジスタ１１に未定義コー１’　＊　ヲ登録す
る。

タイミング′（４で入力された「′」は、解重３に登録
されていないがタイミングＴ３で未定義の「゛」と合せ
て「′」という擬似部首が辞３！（３に０１４という擬
似部首コードで登録されているため、１ルジスタ月の未
定義コードを消去して新たに０１４というコードがセッ
トされる。なお、１疑似川イ１コード０５０ど０１４で
新たな擬似部首となるがどうかについて［パ・」という
文字で辞書３を用いて検定するが「パ」という文字は独
立の擬似部首として辞書３に存在しないため、■ｏレジ
スタ１０、■ルジスタ１１の内容は変らないで保持され
ろ。

タイミング′Ｉ″５で゛「−」が入力されろと１−」と
（・う文字は辞書３より擬似部首コード００４でル）る
ことか判明するため■２レジスタ１２に００／ｌが七ノ
ドされ、その後「・′」及び１立」について擬似部首コ
ードが辞書３に登録されているが否かを検定する。即ち
、その文字内の全ストロークについて最小個数の擬似部
首コードで表現するために検定な行なうこととなる。こ
の場合し′」は擬似部首コードとして登録されてな（「
立」は、擬似部首コード１７６として辞書に登録されて
いる。従って１゜レジスタ１０．　Ｉ、レジスタ１１、
■２レジスタ１２をリセットし、■。レジスタ１０に１
７６を登録する。か（して「立」という文字は、第２図
で示す擬似部首コード１７６で示される１ケの擬似部首
であることを示すこととなる。

同様にして第５図に示すように「彰」という文字に関し
て、結果的に擬似部首コード１７６　、ＯＦＢ　。

０４５．０６５で表わされる文字であることが認識され
ろ。なお、タイミング′■゛、で３ケの擬似部首コード
よりなる入力文字を再検定して１ケの擬似部首コード１
７６を識別したのと同様に、タイミングＴ９では擬似部
首コード０２１よりなる文字と未定義の１　」及び「　
」より擬似部首コードｏＰＢなる文字「日」を識別し、
さらに又タイミング’ｌ’ｌ　ｌ　＋　Ｔ１３　ｒＴ、
４においてもそれぞれ２ケの擬似部首コードと識別され
た入力文字から１ケの擬似部首コードを識別している。

こり〕様にして一種の最長一致法により擬似部首コード
の検定を行なつ不いる。一般的に最長一致法の場合、そ
の入力すべてが入力され終ってから一致を見ることが一
般的である。即ち、入力された全ストロークに対して判
定し、擬似部首と認めらねない場合は最後の１ストロー
クを除いて判定するという手法をとるが擬似部面−コー
ドとして辞書３に登録されている擬似部首の数が数字、
アルファベット、ひらがな、記号等を加えても６００ケ
強であり多きな数になら′ＩＩ［いこと、更には、人が
文字を入力する速度が遅いことを勘案して、入力順に検
定を行なっているものである。

以上説明したように、タブレット］より「彰」を入力す
ることにより入力レジスタ４内の１゜レジスタ１０〜１
３レジスタ１３内に擬似称（涌コード１７６゜ＯＬ”Ｂ
　、　０４５，０６５　が格納されろ。こねら入力レジ
スタ４内の１゜レジスタ１０〜■７レジスタ１７の内容
は１）換回路１８により出ブ月９に順次導出さ」１、選
択回路５に入力される。選択回路５では、入力された擬
似部首コードにより、第４南に示′１″文字−１￥書６
を用いてＪＩＳ　Ｃ６２２６による文字コードを選択す
る。

すなわち、入力レジスタ４内の■。レジスタ１０〜■７
レジスタ１７に格納されている擬似部首コードが１７６
、０１”Ｂ　、　０４５，０６５であることにより選択
回路５により、文字辞書６を調べると第４図に示す如く
擬似部首コードが１７６、ＯＦＢ　、　０４５，０６５
である文字は３Ｅ３４なる文字コードで示されろ漢字「
彰」であることが判明する。

以上の様にして３Ｅ３４なろＪＩＳ　Ｃ６２２６文字コ
ードが選択回路５より出力されろことによりタブレット
１より入力された手書文字が漢字「彰」であることが認
識されろ。

以上詳細に説明したように前記実施例に於いては、漢字
を細分化して、細分化された文字の擬似部首となづけた
部分集合を認識し前記認識された擬似部首の集まりとし
て漢字を識別する方法を示す。ここで擬似部首を認識す
るためには、簡単なアルゴリズムの認識部２と、漢字の
数に比して極めて少数の擬似部首からなる擬似部首辞書
３でよいこととなる。例えば数字、アルファベット、ひ
らがな、記号類及びＪ　Ｔ　Ｓ　Ｃ６２２６第１水準漢
字集合２９６５字のための擬似部灯の数は６００強でル
）す、この内４００強が漢字２９６５字のための擬似部
首である。このように漢字２９６５字の字数を本発明に
よれば認識時のみ等測的に減少させろ効果を而１−るこ
ととなる。又、第２図に示′ｆ擬似部言辞吉３の内容を
認識するための認識部２の機能は、周知のストロークア
ナリシス法等の簡単なアルゴリズムで゛よいことはその
道の専門家であれば容易に理解できるものと考える。更
にこれら認識さＡ′また擬似部首の集まりとして漢字を
含む文字を識別１−ろための文字群書６は、第４図に示
す様に単に擬似部首コードとＪ　Ｉｓ　Ｃ６２２６によ
る漢字コードだけで構成できるため漢字を含めた文字の
字数が多（なった場合でも極めて少量のメモリしか増加
しないことも本発明の利点であり、擬似部言辞■″３及
び文字辞書６を合せても、直接漢字を含む文字の特徴を
記録した従来の辞書の容量が犬であったのと相違して極
めて少量となるため、オンライン手書文字認識を、その
対象を漢字２９６５字より構成されるＪｉＳ　Ｃ６２２
６第１水準漢字集合にまで広げたとしても、手軽に提供
することができ、もって、［情報処理全般にとって好適な入力装置を安価に提供する
ことができる。

前記実施例では基本的な要素について説明したが、以下
に示す様に各種の改良を実施することによりよりよいオ
ンライン手書文字認識力法を提供ｊろことができるので
以下に説明′８ろ。

第１に、前記実施例では標準的な擬似部首辞書３を１ケ
だけ設けたが、標準的な辞書の他に使用者各個人用の擬
似部首相関辞書を１ケ又は複数個設け、認識しづらい擬
似部首を含んだ文字の擬似部首について後から追加登録
ができる構成とすれば、より一層認識率の向上が図Ｊ″
Ｉるとともに認識　１アルゴリズム自体も簡易なもので
よ（なるという効果がある。

第２に、前記実施例では文字辞書６の内容として擬似部
首コードと文字コードだけの組合せとしたが第４図の例
でも明らかな様に同じ「＼門という文字でも「立」単独
で１つの文字を＋ｎ成するもの、「妾」、「音」、１章
」、「意」、「−童」の様に文字の上部にｒ−””−」
が位置するもの、「彰」、「韻」の様に文字の左上部に
ド−」が位置１−るもの等がある。これらの「立」は前
記実施例では全く同一に扱って居り、字数が実施例程度
の場合問題はないが、字数を更に増加させたい場合にお
いてはこれら「立」という文字の位置情報を文字辞書６
に含ませＡ１ば更に認識率を向」ニさせろことができる
。位置情報としてはＪ　Ｔ　Ｓ　Ｃ６２２６字形索引第
４項の字形構成を用いれは充分である。

第３に前記実施例では、第５図を用いて説明した如く新
しいストロークがタブレット１より入力される毎に第１
ストロークまでさかのほって今■）かれた前記性しいス
トローク迄が１つの擬似部１ト１を構成しているかどう
かについて、入力さＡまたストロークについて検定すべ
（説明した。例えば擬似部首「３」と「・」と「−」は
擬似部首コードでは０５０　、０１４　、００４である
が、この３ケの擬似部に１が集った「立」も擬似部首で
ありそのコードは１７６であることを「立」のストロー
クにより擬似部首辞書３を参照して求めた。

しかしながら、認識部２より参照する辞書として擬似部
首辞書３の他に、（擬似部首０５０　）　＋（擬似部首
０１４　）　＋（擬似部首００４．　）　−（擬似部面
１７６）の如き擬似部首間の相関々係を示す擬似部首相
関辞書を設けれは、認識処理時間が極めて早くなるとい
う効果がある。

以上詳細に説明した様に、本発明は認識が困難な漢字を
細分化しこの細分化した擬似部首を認識し擬似部首の集
まりとして漢字を識別するため、先づ認識辞書に要する
記１意容量が極小でよく更に認識文字数の増加にともな
う記憶容量の増加を極めて低（おさえられ更に、前記説
明の通り認識するのは擬似部首とし・うカナレベルのも
のであるため認識率そのものも高く保てるという好適な
オンライン手書文字認識方法を安価に提供することがで
きる。

【図面の簡単な説明】

第１図は本発明の一実施例のブロック図、第２図は擬似
部首辞書の１例を示す図、第３図は入力レジスタの詳細
図、第４図は文字辞書の部分図、第５図は本発明による
認識方法を示Ｉ−図である。１　タブレット、　　　　２・・・認識部、３・・・擬
似部首辞書、　　　４・・・入力レジスタ、５・・選択
回路、　　　　　６・・・文字辞書、９・・認識部２よ
りの出力、１０〜１７・・・入力レジスタ４内の１゜レジスター１
フレジスタ、１８・・切換回路、　　　　　　１９・・・入力レジス
タ４の出力。特許出願人沖電気工業株式会社特許出願代理人弁理士　　山　本　恵　− （１５）第１図第３図

Claims

【特許請求の範囲】

手書文字のストローク情報を抽出するタブレットと、文
字の特徴を格納する辞書とを有し、タブレットからの情
報を辞書の特徴と比較して手書文字を識別するオンライ
ン文字識別方法において、漢字を細分化した部分集合パ
ターン及び漢字以外の文字の全体のパターンの特徴を格
納する第１辞書と、漢字の部分集合の集まり及び漢字以
外の文字に対して文字コードを格納する第２辞書と、タ
ブレットからの情報と第１辞書ア゛出力とを比較する認
識部と、認識結果を格納する入力レジスタと、入力レジ
スタの内容を第２辞書と比較して文字を識別する選択回
路とより構成され、漢字を音μ分集合切に比較識別する
ことを特徴とするオンライン文字認識方法。