JPH11272802A - 文字認識装置及び方法 - Google Patents
文字認識装置及び方法Info
- Publication number
- JPH11272802A JPH11272802A JP10071984A JP7198498A JPH11272802A JP H11272802 A JPH11272802 A JP H11272802A JP 10071984 A JP10071984 A JP 10071984A JP 7198498 A JP7198498 A JP 7198498A JP H11272802 A JPH11272802 A JP H11272802A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- similar
- candidate
- handwritten
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【課題】正解文字が上位の候補となる確率を高める。
【解決手段】認識部102は、文字入力装置101のタ
ブレット面に筆記された手書き文字の筆跡パターンを当
該入力装置101から受け取って手書き文字の認識処理
を行ない、認識候補を出力する。照合部104は、認識
部102からの各候補文字により類似文字辞書105を
検索して類似文字を全て検出する。候補結合部106
は、認識部102からの各候補文字と照合部104から
の各類似文字とを結合して全て認識候補として出力す
る。詳細識別部107は候補結合部106からの各認識
候補について、対応する詳細識別辞書108内の標準パ
ターンを文字入力装置101からの筆跡パターンの特徴
と比較することで、類似性の評価を行ない、その評価結
果をもとに当該各認識候補の順位付けを行なう。
ブレット面に筆記された手書き文字の筆跡パターンを当
該入力装置101から受け取って手書き文字の認識処理
を行ない、認識候補を出力する。照合部104は、認識
部102からの各候補文字により類似文字辞書105を
検索して類似文字を全て検出する。候補結合部106
は、認識部102からの各候補文字と照合部104から
の各類似文字とを結合して全て認識候補として出力す
る。詳細識別部107は候補結合部106からの各認識
候補について、対応する詳細識別辞書108内の標準パ
ターンを文字入力装置101からの筆跡パターンの特徴
と比較することで、類似性の評価を行ない、その評価結
果をもとに当該各認識候補の順位付けを行なう。
Description
【0001】
【発明の属する技術分野】本発明は、手書き文字を認識
する文字認識装置及び方法に係り、特に認識の結果候補
として得られた文字の類似文字を候補に追加する文字認
識装置及び方法に関する。
する文字認識装置及び方法に係り、特に認識の結果候補
として得られた文字の類似文字を候補に追加する文字認
識装置及び方法に関する。
【0002】
【従来の技術】従来より、手書きで入力された文字を認
識し出力する手書き文字認識装置が種々開発されてい
る。この種の文字認識装置における代表的な文字認識手
順は次の通りである。
識し出力する手書き文字認識装置が種々開発されてい
る。この種の文字認識装置における代表的な文字認識手
順は次の通りである。
【0003】まず、筆記者が記入した文字に対して認識
処理を行なう。次に、認識結果の第1位候補を表示す
る。筆記者が第1位候補を正しくないと判断した場合に
は、認識結果の第2位候補以下を表示する。筆記者はそ
れらの候補(認識文字候補)の中から正解を選び出すこ
とになる。
処理を行なう。次に、認識結果の第1位候補を表示す
る。筆記者が第1位候補を正しくないと判断した場合に
は、認識結果の第2位候補以下を表示する。筆記者はそ
れらの候補(認識文字候補)の中から正解を選び出すこ
とになる。
【0004】ここで、候補数が多いと、第2位以下の候
補から正解文字を選ぶのに手間取る可能性がある。更
に、第2位以下の候補に正解がない場合、筆記者は再度
同じ文字を記入しなければならない。
補から正解文字を選ぶのに手間取る可能性がある。更
に、第2位以下の候補に正解がない場合、筆記者は再度
同じ文字を記入しなければならない。
【0005】以上のことを考えると、文字認識装置に要
求されるのは、 (1)まず、認識結果の第1位候補が正解であること (2)そうでない場合には、第2位以下の候補の中に正
解があること (3)但し、候補数は少ないほど良いの3点である。
求されるのは、 (1)まず、認識結果の第1位候補が正解であること (2)そうでない場合には、第2位以下の候補の中に正
解があること (3)但し、候補数は少ないほど良いの3点である。
【0006】ところで文字認識において、その対象とな
る文字種は、例えば日本語の場合であれば、漢字、ひら
がな、カタカナ、数字、アルファベット、記号など様々
である。これらの文字種の中には、形状が類似した文字
も多い。それらの手書き文字を判別するのに微妙な形状
の差を抽出する必要があり、認識が困難である。また、
正解文字が候補中に入らないで正解文字に類似した文字
だけが候補に入っている場合も多い。
る文字種は、例えば日本語の場合であれば、漢字、ひら
がな、カタカナ、数字、アルファベット、記号など様々
である。これらの文字種の中には、形状が類似した文字
も多い。それらの手書き文字を判別するのに微妙な形状
の差を抽出する必要があり、認識が困難である。また、
正解文字が候補中に入らないで正解文字に類似した文字
だけが候補に入っている場合も多い。
【0007】例えば、「ク」「ワ」「7」の3文字は形
状が類似しているため誤認識しやすい。「ク」を手書き
入力(筆記)したのに、類似文字の「ワ」や「7」は候
補中にあっても、肝心の「ク」(つまり正解文字)がな
い場合もある。
状が類似しているため誤認識しやすい。「ク」を手書き
入力(筆記)したのに、類似文字の「ワ」や「7」は候
補中にあっても、肝心の「ク」(つまり正解文字)がな
い場合もある。
【0008】そこで、このような結果にならないため
に、形状が類似した文字の集合(類似文字集合)が登録
された類似文字辞書を用意しておき、認識結果中の文字
候補が類似文字辞書中に含まれる場合、文字候補の類似
文字を全て候補に追加するという、特公平3−6670
4号公報に記載されたような文字認識技術が考え出され
た。
に、形状が類似した文字の集合(類似文字集合)が登録
された類似文字辞書を用意しておき、認識結果中の文字
候補が類似文字辞書中に含まれる場合、文字候補の類似
文字を全て候補に追加するという、特公平3−6670
4号公報に記載されたような文字認識技術が考え出され
た。
【0009】この文字認識技術について、先ほどの
「ク」「ワ」「7」の例で説明する。まず、「ク」
「ワ」「7」の3文字を類似文字として類似文字辞書に
登録しておく。認識結果の文字候補に「ク」「ワ」
「7」のどれかの文字がある場合、残りの文字を必ず候
補に追加する。この処理を行なうことで、筆記者が
「ク」を入力した場合、認識結果の候補に「ク」がなく
ても、「ワ」か「7」があれば、「ク」が必ず追加され
ることになる。
「ク」「ワ」「7」の例で説明する。まず、「ク」
「ワ」「7」の3文字を類似文字として類似文字辞書に
登録しておく。認識結果の文字候補に「ク」「ワ」
「7」のどれかの文字がある場合、残りの文字を必ず候
補に追加する。この処理を行なうことで、筆記者が
「ク」を入力した場合、認識結果の候補に「ク」がなく
ても、「ワ」か「7」があれば、「ク」が必ず追加され
ることになる。
【0010】つまり、特公平3−66704号公報に記
載された文字認識技術(以下、先行技術と称する)の特
徴は、入力された手書き文字に類似した形状の文字を全
て認識結果の候補に入れることができるようにした点に
ある。
載された文字認識技術(以下、先行技術と称する)の特
徴は、入力された手書き文字に類似した形状の文字を全
て認識結果の候補に入れることができるようにした点に
ある。
【0011】
【発明が解決しようとする課題】上記した先行技術で
は、手書き入力された文字に対する認識処理の結果、候
補中に類似文字辞書に載っている文字があれば、無条件
に当該文字の類似文字を全て候補に追加していた。この
ため先行技術では、次の2つの問題が生じる。
は、手書き入力された文字に対する認識処理の結果、候
補中に類似文字辞書に載っている文字があれば、無条件
に当該文字の類似文字を全て候補に追加していた。この
ため先行技術では、次の2つの問題が生じる。
【0012】1番目の問題は、入力された文字とは形状
が異なる文字が類似文字として追加される可能性がある
ということである。例えば、アルファベットの「l(エ
ル)」と数字の「1(イチ)」は縦棒を用いて(例えば
明朝体やゴシック体風に)書かれた場合には類似文字だ
が、筆記体で書かれたアルファベットの「l(エル)」
と数字の「1(イチ)」とは全く形状が異なる。このよ
うな場合、類似文字辞書に「l(エル)」と「1(イ
チ)」が登録されているからといって単純に追加するの
は問題である。例えば、筆記者が筆記体の「l(エ
ル)」を記入した場合に、「l(エル)」が候補に入
り、「1(イチ)」は候補外だったとする。つまり、正
しい文字認識処理が行なわれたとする。ところが、「l
(エル)」と「1(イチ)」とが類似文字として類似文
字辞書に登録されているので、入力された筆記体の文字
「l(エル)」とは形状が異なっていても「1(イ
チ)」が必ず候補に追加されてしまう。
が異なる文字が類似文字として追加される可能性がある
ということである。例えば、アルファベットの「l(エ
ル)」と数字の「1(イチ)」は縦棒を用いて(例えば
明朝体やゴシック体風に)書かれた場合には類似文字だ
が、筆記体で書かれたアルファベットの「l(エル)」
と数字の「1(イチ)」とは全く形状が異なる。このよ
うな場合、類似文字辞書に「l(エル)」と「1(イ
チ)」が登録されているからといって単純に追加するの
は問題である。例えば、筆記者が筆記体の「l(エ
ル)」を記入した場合に、「l(エル)」が候補に入
り、「1(イチ)」は候補外だったとする。つまり、正
しい文字認識処理が行なわれたとする。ところが、「l
(エル)」と「1(イチ)」とが類似文字として類似文
字辞書に登録されているので、入力された筆記体の文字
「l(エル)」とは形状が異なっていても「1(イ
チ)」が必ず候補に追加されてしまう。
【0013】2番目の問題は、候補数が増加するという
点である。これについて図9を参照して説明する。例え
ば、数字の「1(イチ)」を筆記した場合の認識処理の
結果として、アルファベットの「f」「t」[e」「l
(エル)」が第1位〜第4位候補として得られ、その候
補には正解文字「1(イチ)」が入っていないものとす
る。ここで候補「f」「t」[e」「l(エル)」のそ
れぞれについて類似辞書を参照することで、図9に示す
ように、その類似文字を全て候補に追加する。この類似
文字追加により、最終結果には確かに正解文字「1(イ
チ)」が追加される。しかし、他の類似文字も多数追加
される。なお、図9において同一の網かけが施されてい
る文字同士が同種の類似文字である。
点である。これについて図9を参照して説明する。例え
ば、数字の「1(イチ)」を筆記した場合の認識処理の
結果として、アルファベットの「f」「t」[e」「l
(エル)」が第1位〜第4位候補として得られ、その候
補には正解文字「1(イチ)」が入っていないものとす
る。ここで候補「f」「t」[e」「l(エル)」のそ
れぞれについて類似辞書を参照することで、図9に示す
ように、その類似文字を全て候補に追加する。この類似
文字追加により、最終結果には確かに正解文字「1(イ
チ)」が追加される。しかし、他の類似文字も多数追加
される。なお、図9において同一の網かけが施されてい
る文字同士が同種の類似文字である。
【0014】さて筆記者は、まず第1位の候補を探す。
正解文字「1」がないので、次に第2位候補以下を探
す。ところが、候補が多数あるため、正解文字「1」を
見つけるまでに時間がかかる。
正解文字「1」がないので、次に第2位候補以下を探
す。ところが、候補が多数あるため、正解文字「1」を
見つけるまでに時間がかかる。
【0015】このように上記先行技術では、類似文字辞
書を用いることで正解文字が認識結果の候補中に含まれ
るようにできるものの、手書き入力された文字とは形状
が異なる文字が類似文字として候補中に追加される問
題、及び候補数が増加するという問題があった。
書を用いることで正解文字が認識結果の候補中に含まれ
るようにできるものの、手書き入力された文字とは形状
が異なる文字が類似文字として候補中に追加される問
題、及び候補数が増加するという問題があった。
【0016】更に上記先行技術では、追加された候補文
字(類似文字)の候補順位は、対応する本来の認識結果
の候補文字(認識文字候補)の候補順位(更には類似文
字辞書中の類似文字の並び順)で一意に定められるよう
になっており、手書き入力された文字の形状との類似性
を考慮した類似文字相互間の順位付けや、手書き入力さ
れた文字の形状との類似性を考慮した類似文字を含めた
候補文字相互間の順位付けについては何も考慮されてい
ない。正解文字が認識結果の候補になくて類似文字とし
て追加される場合には、正解文字が上位候補として追加
されるような機構があることが望まれる。
字(類似文字)の候補順位は、対応する本来の認識結果
の候補文字(認識文字候補)の候補順位(更には類似文
字辞書中の類似文字の並び順)で一意に定められるよう
になっており、手書き入力された文字の形状との類似性
を考慮した類似文字相互間の順位付けや、手書き入力さ
れた文字の形状との類似性を考慮した類似文字を含めた
候補文字相互間の順位付けについては何も考慮されてい
ない。正解文字が認識結果の候補になくて類似文字とし
て追加される場合には、正解文字が上位候補として追加
されるような機構があることが望まれる。
【0017】本発明は、上記の問題を解決するためにな
されたものであり、その目的は、正解文字をできるだけ
上位の候補に入れることができる文字認識装置及び方法
を提供することにある。
されたものであり、その目的は、正解文字をできるだけ
上位の候補に入れることができる文字認識装置及び方法
を提供することにある。
【0018】本発明の他の目的は、認識候補に類似した
文字(類似文字)に対して予め定められた評価尺度に基
づき評価を行ない、その評価結果に基づいて、当該類似
文字を候補に追加するか否かを判定することにより、入
力文字とは形状が異なる文字が候補に含まれて候補数が
増加するのを防ぐことができる文字認識装置及び方法を
提供することにある。
文字(類似文字)に対して予め定められた評価尺度に基
づき評価を行ない、その評価結果に基づいて、当該類似
文字を候補に追加するか否かを判定することにより、入
力文字とは形状が異なる文字が候補に含まれて候補数が
増加するのを防ぐことができる文字認識装置及び方法を
提供することにある。
【0019】
【課題を解決するための手段】本発明は、筆記された手
書き文字の筆跡パターンを検出して、当該パターンを示
す手書き文字情報を出力する文字入力装置と、この文字
入力装置からの手書き文字情報に基づいて筆記された文
字を認識し、その認識結果として認識候補を取得する認
識手段と、形状が類似した類似文字群が登録された類似
文字辞書記憶手段と、認識手段により取得された認識候
補により類似文字辞書記憶手段を検索することで当該認
識候補の類似文字を全て検出する照合手段と、認識手段
により取得された認識候補と照合手段により検出された
類似文字とを併せて全て認識候補として出力する候補結
合手段と、この候補結合手段により出力された各認識候
補を対象に、文字入力装置からの手書き文字情報との類
似性についての評価を行なって、その評価結果をもとに
当該各認識候補の順位付けを行なう詳細識別手段とを備
えたことを特徴とする。
書き文字の筆跡パターンを検出して、当該パターンを示
す手書き文字情報を出力する文字入力装置と、この文字
入力装置からの手書き文字情報に基づいて筆記された文
字を認識し、その認識結果として認識候補を取得する認
識手段と、形状が類似した類似文字群が登録された類似
文字辞書記憶手段と、認識手段により取得された認識候
補により類似文字辞書記憶手段を検索することで当該認
識候補の類似文字を全て検出する照合手段と、認識手段
により取得された認識候補と照合手段により検出された
類似文字とを併せて全て認識候補として出力する候補結
合手段と、この候補結合手段により出力された各認識候
補を対象に、文字入力装置からの手書き文字情報との類
似性についての評価を行なって、その評価結果をもとに
当該各認識候補の順位付けを行なう詳細識別手段とを備
えたことを特徴とする。
【0020】このような構成においては、手書き文字情
報に基づいて行なわれる認識処理の結果としての認識候
補(候補文字)により類似文字辞書記憶手段を検索する
ことで、当該認識候補の類似文字が全て検出される。こ
の検出された類似文字は、上記認識処理により求められ
た認識候補と併せられて(結合されて)全て最終的な認
識候補として出力される。そして、この最終的な各認識
候補を対象に、上記手書き文字情報との類似性について
の評価が行なわれ、その評価結果をもとに当該各認識候
補の順位付けが行なわれる。
報に基づいて行なわれる認識処理の結果としての認識候
補(候補文字)により類似文字辞書記憶手段を検索する
ことで、当該認識候補の類似文字が全て検出される。こ
の検出された類似文字は、上記認識処理により求められ
た認識候補と併せられて(結合されて)全て最終的な認
識候補として出力される。そして、この最終的な各認識
候補を対象に、上記手書き文字情報との類似性について
の評価が行なわれ、その評価結果をもとに当該各認識候
補の順位付けが行なわれる。
【0021】このように、類似文字を含めて最終的な各
候補文字と手書き文字情報との類似性の評価を行なうこ
とにより、つまり手書き文字情報が最終的な各候補文字
にどの程度類似しているかを認識処理によって評価する
ことにより(このような評価のための処理を詳細識別処
理と呼ぶ)、たとえ類似文字側に正解文字がある場合で
も、その正解文字が認識候補の上位に順位付けされる確
率を高めることが可能となる。
候補文字と手書き文字情報との類似性の評価を行なうこ
とにより、つまり手書き文字情報が最終的な各候補文字
にどの程度類似しているかを認識処理によって評価する
ことにより(このような評価のための処理を詳細識別処
理と呼ぶ)、たとえ類似文字側に正解文字がある場合で
も、その正解文字が認識候補の上位に順位付けされる確
率を高めることが可能となる。
【0022】ここで、最終的な各候補文字を対象とする
詳細識別処理には、上記認識候補を取得した際の認識処
理で適用した方式とは性質の異なる認識方式を用いると
よい。
詳細識別処理には、上記認識候補を取得した際の認識処
理で適用した方式とは性質の異なる認識方式を用いると
よい。
【0023】また、順位付けの方式としては、全ての認
識候補文字を対象に行なう方式(前者の方式)、或いは
(認識処理により求められる)本来の認識候補文字とそ
の類似文字の集合(同種の類似文字の集合)内でのみ順
位付けを行なう方式(後者の方式)が適用可能である。
後者の方式では、候補結合手段において認識候補文字
(本来の認識候補文字)とその類似文字を結合して出力
する際に、各類似文字集合を単位として、その類似文字
集合相互間の並び(順位)を、当該各集合における認識
候補文字の認識処理での順位に一致させて出力する第1
の方式、或いは各認識候補文字の順位を認識処理での順
位に一致させ、その認識候補文字の列の後ろに、当該認
識候補文字を除く各類似文字集合を、対応する認識候補
文字の順位に応じた順序で並べて出力する第2の方式を
適用するとよい。また、第2の方式を適用する場合に
は、認識候補文字(本来の認識候補文字)の群だけで順
位付け(順位の入れ替え)を行なうと共に、認識候補文
字を除く各類似文字の群だけで順位付け(順位の入れ替
え)を行なうことも可能である。
識候補文字を対象に行なう方式(前者の方式)、或いは
(認識処理により求められる)本来の認識候補文字とそ
の類似文字の集合(同種の類似文字の集合)内でのみ順
位付けを行なう方式(後者の方式)が適用可能である。
後者の方式では、候補結合手段において認識候補文字
(本来の認識候補文字)とその類似文字を結合して出力
する際に、各類似文字集合を単位として、その類似文字
集合相互間の並び(順位)を、当該各集合における認識
候補文字の認識処理での順位に一致させて出力する第1
の方式、或いは各認識候補文字の順位を認識処理での順
位に一致させ、その認識候補文字の列の後ろに、当該認
識候補文字を除く各類似文字集合を、対応する認識候補
文字の順位に応じた順序で並べて出力する第2の方式を
適用するとよい。また、第2の方式を適用する場合に
は、認識候補文字(本来の認識候補文字)の群だけで順
位付け(順位の入れ替え)を行なうと共に、認識候補文
字を除く各類似文字の群だけで順位付け(順位の入れ替
え)を行なうことも可能である。
【0024】また本発明は、照合手段により検出された
全ての類似文字に対して予め定められた評価尺度に基づ
く評価を行なってその評価値を求める類似文字評価手段
を追加し、認識手段の認識処理により求められた認識候
補と照合手段により検出された類似文字とを併せて最終
的な認識候補として候補結合手段が出力する際に、この
最終的な各認識候補を対象として、当該候補結合手段に
おいて対応する評価値をもとに順位付けが行なわれる構
成としたことをも特徴とする。ここでは、詳細識別手段
は不要となる。
全ての類似文字に対して予め定められた評価尺度に基づ
く評価を行なってその評価値を求める類似文字評価手段
を追加し、認識手段の認識処理により求められた認識候
補と照合手段により検出された類似文字とを併せて最終
的な認識候補として候補結合手段が出力する際に、この
最終的な各認識候補を対象として、当該候補結合手段に
おいて対応する評価値をもとに順位付けが行なわれる構
成としたことをも特徴とする。ここでは、詳細識別手段
は不要となる。
【0025】このような構成においては、類似文字評価
手段にて類似文字に対する評価が行なわれてその評価値
が求められ、類似文字を含めた最終的な認識候補を対象
とする順位付けが対応する評価値に基づいて行なわれる
ため、認識候補として追加される類似文字のうちで、入
力された手書き文字と形状が異なる文字について、候補
順位を下げることができる。逆に、入力された手書き文
字と形状が類似した文字は上位候補に入れることができ
る。
手段にて類似文字に対する評価が行なわれてその評価値
が求められ、類似文字を含めた最終的な認識候補を対象
とする順位付けが対応する評価値に基づいて行なわれる
ため、認識候補として追加される類似文字のうちで、入
力された手書き文字と形状が異なる文字について、候補
順位を下げることができる。逆に、入力された手書き文
字と形状が類似した文字は上位候補に入れることができ
る。
【0026】ここで、類似文字評価手段における類似文
字の評価値の取得方法として、(1)文字入力装置から
の手書き文字情報を認識手段により当該類似文字の特徴
と比較させて、その比較結果を表す評価値を認識手段か
ら受け取る方法、(2)認識手段による認識処理で求め
られる当該類似文字に対応する認識候補の評価値を、そ
のまま当該類似文字の評価値として取得する方法、
(3)同種の類似文字同士の類似度が予め登録された類
似文字辞書記憶手段を用い、類似文字の評価値として、
当該類似文字辞書記憶手段に登録されている対応する類
似度を用いる方法のいずれかを適用するとよい。
字の評価値の取得方法として、(1)文字入力装置から
の手書き文字情報を認識手段により当該類似文字の特徴
と比較させて、その比較結果を表す評価値を認識手段か
ら受け取る方法、(2)認識手段による認識処理で求め
られる当該類似文字に対応する認識候補の評価値を、そ
のまま当該類似文字の評価値として取得する方法、
(3)同種の類似文字同士の類似度が予め登録された類
似文字辞書記憶手段を用い、類似文字の評価値として、
当該類似文字辞書記憶手段に登録されている対応する類
似度を用いる方法のいずれかを適用するとよい。
【0027】また本発明は、上記候補結合手段に、認識
手段の認識処理により求められた認識候補と照合手段に
より検出された類似文字とを併せて全て最終的な認識候
補として、対応する評価値(以下、第1の評価値と称す
る)と共に出力する機能だけを持たせ、つまり上記候補
結合手段には各認識候補に対する順位付けの機能を持た
せずに、代わりに詳細識別手段に次の機能、即ち最終的
な各認識候補を対象に文字入力装置からの手書き文字情
報との類似性についての評価を行なって第2のタイプの
評価値を求め、当該各認識候補の順位付けを対応する第
1及び第2のタイプの評価値をもとに行なう機能を持た
せるようにしたことをも特徴とする。
手段の認識処理により求められた認識候補と照合手段に
より検出された類似文字とを併せて全て最終的な認識候
補として、対応する評価値(以下、第1の評価値と称す
る)と共に出力する機能だけを持たせ、つまり上記候補
結合手段には各認識候補に対する順位付けの機能を持た
せずに、代わりに詳細識別手段に次の機能、即ち最終的
な各認識候補を対象に文字入力装置からの手書き文字情
報との類似性についての評価を行なって第2のタイプの
評価値を求め、当該各認識候補の順位付けを対応する第
1及び第2のタイプの評価値をもとに行なう機能を持た
せるようにしたことをも特徴とする。
【0028】このように、類似文字を含めた最終的な各
認識候補を対象とする順位付けを、認識手段での認識処
理または類似文字評価手段での評価処理で取得される第
1の評価値と、詳細識別手段での詳細識別処理で取得さ
れる第2の評価値の両評価値に基づいて行なうことで、
正解文字が上位にくる確率を高めることができる。
認識候補を対象とする順位付けを、認識手段での認識処
理または類似文字評価手段での評価処理で取得される第
1の評価値と、詳細識別手段での詳細識別処理で取得さ
れる第2の評価値の両評価値に基づいて行なうことで、
正解文字が上位にくる確率を高めることができる。
【0029】ここで、第1及び第2の評価値に基づく順
位付けを行なうのに、(1)単純に第1及び第2の評価
値の和の値の大きさによって順位付けを行なう方法、
(2)第1及び第2の評価値にそれぞれ固有の値を重み
付けした線形和の値の大きさによって順位付けを行なう
方法のいずれかを適用するとよい。
位付けを行なうのに、(1)単純に第1及び第2の評価
値の和の値の大きさによって順位付けを行なう方法、
(2)第1及び第2の評価値にそれぞれ固有の値を重み
付けした線形和の値の大きさによって順位付けを行なう
方法のいずれかを適用するとよい。
【0030】また本発明は、上記類似文字評価手段の評
価結果をもとに実際に認識候補に追加する類似文字を決
定する類似文字判定手段を付加するようにしたことをも
特徴とする。
価結果をもとに実際に認識候補に追加する類似文字を決
定する類似文字判定手段を付加するようにしたことをも
特徴とする。
【0031】このような構成においては、(認識手段が
取得した認識候補の類似文字として)照合手段により類
似文字辞書から取得された文字であっても、手書き文字
と形状が異なる文字(類似文字)については、候補から
除外することができる。
取得した認識候補の類似文字として)照合手段により類
似文字辞書から取得された文字であっても、手書き文字
と形状が異なる文字(類似文字)については、候補から
除外することができる。
【0032】ここで、手書き文字と形状が異なる類似文
字が除外された最終的な認識候補を対象に詳細識別手段
にて詳細識別処理を行ない、追加した類似文字を含めた
順位付けを行なうことにより、正解文字が上位にくる確
率を高めることができる。
字が除外された最終的な認識候補を対象に詳細識別手段
にて詳細識別処理を行ない、追加した類似文字を含めた
順位付けを行なうことにより、正解文字が上位にくる確
率を高めることができる。
【0033】
【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。 [第1の実施形態]図1は本発明の第1の実施形態に係
る文字認識装置の構成を示すブロック図である。
図面を参照して説明する。 [第1の実施形態]図1は本発明の第1の実施形態に係
る文字認識装置の構成を示すブロック図である。
【0034】図1に示す文字認識装置は、文字入力装置
101、認識部102、認識辞書103、照合部10
4、類似文字辞書105、候補結合部106、詳細識別
部107、及び詳細識別辞書108から構成される。
101、認識部102、認識辞書103、照合部10
4、類似文字辞書105、候補結合部106、詳細識別
部107、及び詳細識別辞書108から構成される。
【0035】文字入力装置101は、タブレット等の座
標入力面を備えた手書き文字入力装置であり、筆記者が
記入した手書き文字の形状(筆跡)を表す手書き文字パ
ターン(文字ストロークの座標系列からなる筆跡パター
ン)を出力する。
標入力面を備えた手書き文字入力装置であり、筆記者が
記入した手書き文字の形状(筆跡)を表す手書き文字パ
ターン(文字ストロークの座標系列からなる筆跡パター
ン)を出力する。
【0036】認識部102は、文字入力装置101から
送られた手書き文字パターン(と各種文字についてその
文字の特徴を表す標準パターンが登録された認識辞書1
03との間で比較を行なうことで、各標準パターンとの
類似度、或いは距離を表す評価値を得て、その評価値
(の示す候補順位)をもとに認識文字候補を出力する周
知の文字認識処理を行なう。認識部102は、認識処理
の結果として、上位の文字候補のみ、例えば第1位から
予め定められた順位(第N位とする)までの文字候補
(候補数がNに満たない場合には全候補)、或いは予め
定められた評価値(類似度または距離)の基準を満たす
文字候補を、認識文字候補として出力する。この認識文
字候補(の情報)は、文字コードとその評価値である。
送られた手書き文字パターン(と各種文字についてその
文字の特徴を表す標準パターンが登録された認識辞書1
03との間で比較を行なうことで、各標準パターンとの
類似度、或いは距離を表す評価値を得て、その評価値
(の示す候補順位)をもとに認識文字候補を出力する周
知の文字認識処理を行なう。認識部102は、認識処理
の結果として、上位の文字候補のみ、例えば第1位から
予め定められた順位(第N位とする)までの文字候補
(候補数がNに満たない場合には全候補)、或いは予め
定められた評価値(類似度または距離)の基準を満たす
文字候補を、認識文字候補として出力する。この認識文
字候補(の情報)は、文字コードとその評価値である。
【0037】照合部104は、認識部102から送られ
た認識文字候補に形状が類似した文字を類似文字辞書1
05から検索して類似文字候補として出力する。類似文
字辞書105には、図2に示すように、形状が類似した
文字(類似文字)の集合(類似文字集合)が登録されて
いる。各類似文字集合には、当該集合の識別情報として
例えば固有の番号(類似文字番号)が付されている。
た認識文字候補に形状が類似した文字を類似文字辞書1
05から検索して類似文字候補として出力する。類似文
字辞書105には、図2に示すように、形状が類似した
文字(類似文字)の集合(類似文字集合)が登録されて
いる。各類似文字集合には、当該集合の識別情報として
例えば固有の番号(類似文字番号)が付されている。
【0038】候補結合部106は、認識部102から送
られた認識文字候補と照合部104から送られた類似文
字候補とを結合して全て文字候補として出力する。詳細
識別部107は、各種文字についてその文字の特徴を表
す標準パターンが登録された認識辞書103から、候補
結合部106により送られた認識文字候補の標準パター
ンを取り出して、文字入力装置101により送られる手
書き文字パターンの特徴との間で比較を行なって(類似
度、或いは距離を表す評価値を得ることで)類似性を評
価する。詳細識別部107は、この評価結果に基づき、
文字候補群の順位の入れ替えを行なう。
られた認識文字候補と照合部104から送られた類似文
字候補とを結合して全て文字候補として出力する。詳細
識別部107は、各種文字についてその文字の特徴を表
す標準パターンが登録された認識辞書103から、候補
結合部106により送られた認識文字候補の標準パター
ンを取り出して、文字入力装置101により送られる手
書き文字パターンの特徴との間で比較を行なって(類似
度、或いは距離を表す評価値を得ることで)類似性を評
価する。詳細識別部107は、この評価結果に基づき、
文字候補群の順位の入れ替えを行なう。
【0039】次に、図1の構成の動作を説明する。文字
入力装置101は、タブレット等に筆記者が文字を記入
すると、その手書き文字の形状を表す手書き文字パター
ン(筆跡パターン)を認識部102に送る。認識部10
2は、この手書き文字パターンを受け取ると、例えば特
願平8−078855号に記載されたようなストローク
構造に基づく文字認識方式により手書き入力文字の認識
処理を行なう。即ち認識部102は、受け取った手書き
文字パターンと認識辞書103中の全標準パターンとの
間で比較を行ない、評価値の良い上位の候補(を表す文
字コードとその評価値)を認識文字候補として例えば候
補順位の順番で出力していく。
入力装置101は、タブレット等に筆記者が文字を記入
すると、その手書き文字の形状を表す手書き文字パター
ン(筆跡パターン)を認識部102に送る。認識部10
2は、この手書き文字パターンを受け取ると、例えば特
願平8−078855号に記載されたようなストローク
構造に基づく文字認識方式により手書き入力文字の認識
処理を行なう。即ち認識部102は、受け取った手書き
文字パターンと認識辞書103中の全標準パターンとの
間で比較を行ない、評価値の良い上位の候補(を表す文
字コードとその評価値)を認識文字候補として例えば候
補順位の順番で出力していく。
【0040】照合部104は、認識部102から(当該
認識部102での認識結果としての)認識文字候補が候
補順位の順番で出力される毎に、その認識文字候補を受
け取って、当該文字候補により類似文字辞書105を検
索する。もし、該当する文字を含む類似文字集合が類似
文字辞書105にある場合には、照合部104は、その
類似文字集合中の認識部102から受け取った文字(文
字候補)以外の類似文字を類似文字候補として出力す
る。
認識部102での認識結果としての)認識文字候補が候
補順位の順番で出力される毎に、その認識文字候補を受
け取って、当該文字候補により類似文字辞書105を検
索する。もし、該当する文字を含む類似文字集合が類似
文字辞書105にある場合には、照合部104は、その
類似文字集合中の認識部102から受け取った文字(文
字候補)以外の類似文字を類似文字候補として出力す
る。
【0041】候補結合部106は、認識部102から候
補順に順次送られる認識文字候補と、その文字候補に対
応して照合部104から送られる類似文字候補とを結合
(マージ)して、全て文字候補として出力する。文字候
補は、その順番(候補順位)に意味があるので、結合す
る際にどのような順番で順位付けを行なうかが問題とな
る。
補順に順次送られる認識文字候補と、その文字候補に対
応して照合部104から送られる類似文字候補とを結合
(マージ)して、全て文字候補として出力する。文字候
補は、その順番(候補順位)に意味があるので、結合す
る際にどのような順番で順位付けを行なうかが問題とな
る。
【0042】そこで、この候補結合部106の動作の具
体例について説明する。まず、認識部102から送られ
る認識文字候補の数をNとし、各候補をci (i=1,
2,…,N)とする。ここで、iの値は、認識文字候補
の候補順位を表す。また、第i位候補ci に対する類似
文字(類似文字候補)をci(j)(j=1,…,Mi )と
する。但し、ci に類似文字がなければMi =0であ
り、ci(j)は存在しない。
体例について説明する。まず、認識部102から送られ
る認識文字候補の数をNとし、各候補をci (i=1,
2,…,N)とする。ここで、iの値は、認識文字候補
の候補順位を表す。また、第i位候補ci に対する類似
文字(類似文字候補)をci(j)(j=1,…,Mi )と
する。但し、ci に類似文字がなければMi =0であ
り、ci(j)は存在しない。
【0043】候補結合部106は、各認識文字候補ci
を候補順に並べることを前提として候補ci とその類似
文字ci(j)(の群)をまとめて並べ、図3(a)に示す
ように、c1 ,c1(1),…,c1(M1) ,c2 ,c2(1),
…,c2(M2) ,…,cN ,cN(1),…,cN(MN) の順で
出力する。ここで、候補ci の類似文字ci(j)群の並び
順は、類似文字辞書105における並び順に一致するも
のとするが、どのような並び順であっても構わない。
を候補順に並べることを前提として候補ci とその類似
文字ci(j)(の群)をまとめて並べ、図3(a)に示す
ように、c1 ,c1(1),…,c1(M1) ,c2 ,c2(1),
…,c2(M2) ,…,cN ,cN(1),…,cN(MN) の順で
出力する。ここで、候補ci の類似文字ci(j)群の並び
順は、類似文字辞書105における並び順に一致するも
のとするが、どのような並び順であっても構わない。
【0044】この他に、各認識文字候補ci を候補順に
並べ、その候補ci の列の後ろに、各認識文字候補ci
の並びと同じ順番で、対応する類似文字ci(j)(の群)
を並べ、図3(b)に示すように、c1 ,c2 ,…,c
N ,c1(1),…,c1(M1) ,c2(1),…,c2(M2) ,c
N(1),…,cN(MN) の順で出力するようにしても構わな
い。
並べ、その候補ci の列の後ろに、各認識文字候補ci
の並びと同じ順番で、対応する類似文字ci(j)(の群)
を並べ、図3(b)に示すように、c1 ,c2 ,…,c
N ,c1(1),…,c1(M1) ,c2(1),…,c2(M2) ,c
N(1),…,cN(MN) の順で出力するようにしても構わな
い。
【0045】ここで、各認識文字候補ci は認識部10
2から候補順位の順番で送られるため、候補結合部10
6での図3(a)または(b)に示す並びの結合処理の
ために、認識部102が評価値を併せて送ることは必ず
しも必要でない。
2から候補順位の順番で送られるため、候補結合部10
6での図3(a)または(b)に示す並びの結合処理の
ために、認識部102が評価値を併せて送ることは必ず
しも必要でない。
【0046】なお、詳細識別部107において、後述す
るように全認識文字候補ではなくて、候補ci とその類
似文字ci(j)の中で、つまり同種の類似文字集合内で順
位付け(順位の入れ替え)を行なう場合には、そのc
i ,ci(j)に、類似文字辞書105内での類似文字番号
を付加する必要がある。そのためには、照合部104で
は、候補結合部106に出力する類似文字ci(j)に対応
する類似文字番号を付加し、候補結合部106では、そ
の類似文字ci(j)に対応する認識部102からの候補c
i に当該類似文字番号を付加すればよい。
るように全認識文字候補ではなくて、候補ci とその類
似文字ci(j)の中で、つまり同種の類似文字集合内で順
位付け(順位の入れ替え)を行なう場合には、そのc
i ,ci(j)に、類似文字辞書105内での類似文字番号
を付加する必要がある。そのためには、照合部104で
は、候補結合部106に出力する類似文字ci(j)に対応
する類似文字番号を付加し、候補結合部106では、そ
の類似文字ci(j)に対応する認識部102からの候補c
i に当該類似文字番号を付加すればよい。
【0047】詳細識別部107は、候補結合部106か
ら文字候補の列が送られると、以下の処理を行なう。ま
ず詳細識別部107は、候補結合部106から順に送ら
れる各候補をKt (t=1,…,L)とすると、詳細識
別辞書108内の各候補Kt の標準パターン(ここでは
標準の特徴ベクトルパターン)と、文字入力装置101
から送られる手書き文字パターン(筆記された文字のパ
ターン)から抽出した特徴(ここでは特徴ベクトルパタ
ーン)とを比較して、評価値(詳細評価値)vi を得
る。このように詳細識別部107では、認識部102で
用いた方式とは性質が異なる文字認識方式により評価を
行なう。
ら文字候補の列が送られると、以下の処理を行なう。ま
ず詳細識別部107は、候補結合部106から順に送ら
れる各候補をKt (t=1,…,L)とすると、詳細識
別辞書108内の各候補Kt の標準パターン(ここでは
標準の特徴ベクトルパターン)と、文字入力装置101
から送られる手書き文字パターン(筆記された文字のパ
ターン)から抽出した特徴(ここでは特徴ベクトルパタ
ーン)とを比較して、評価値(詳細評価値)vi を得
る。このように詳細識別部107では、認識部102で
用いた方式とは性質が異なる文字認識方式により評価を
行なう。
【0048】その理由について述べる。仮に、認識部1
02で用いた文字認識方式を詳細識別部107でも適用
するものとする。この場合、各候補Kt のうち、照合部
104により得られた類似文字候補(ci(j))の群は、
認識部102での認識処理で認識文字候補外とされたも
のであることから、詳細識別部107においても認識文
字候補ci より常に低い順位付けがなされてしまう。つ
まり、認識部102で用いた方式と性質が同じ文字認識
方式を詳細識別部107で適用すると、類似文字候補の
群の中に正解文字が含まれていたとしても、その正解文
字は上位候補となり得ないからである。本実施形態で
は、詳細識別部107での評価には、認識部102で適
用される特願平8−078855号に記載された文字認
識方式(ストローク構造に基づく認識方式)とは異な
る、例えば特願平8−049035号に記載されたよう
な統計的認識方式を用いるようにしている。勿論、認識
部102及び詳細識別部107で適用する認識方式は、
これに限るものではなく、性質が異なるものであれば、
どのような認識方式であっても構わない。
02で用いた文字認識方式を詳細識別部107でも適用
するものとする。この場合、各候補Kt のうち、照合部
104により得られた類似文字候補(ci(j))の群は、
認識部102での認識処理で認識文字候補外とされたも
のであることから、詳細識別部107においても認識文
字候補ci より常に低い順位付けがなされてしまう。つ
まり、認識部102で用いた方式と性質が同じ文字認識
方式を詳細識別部107で適用すると、類似文字候補の
群の中に正解文字が含まれていたとしても、その正解文
字は上位候補となり得ないからである。本実施形態で
は、詳細識別部107での評価には、認識部102で適
用される特願平8−078855号に記載された文字認
識方式(ストローク構造に基づく認識方式)とは異な
る、例えば特願平8−049035号に記載されたよう
な統計的認識方式を用いるようにしている。勿論、認識
部102及び詳細識別部107で適用する認識方式は、
これに限るものではなく、性質が異なるものであれば、
どのような認識方式であっても構わない。
【0049】詳細識別部107は、認識部102で用い
た方式と異なる文字認識方式により各候補Kt の評価
(詳細識別)を行なうと、例えば全ての候補Kt を対象
に、その評価値(詳細評価値)vi に従う順位付けを行
なって、当該全候補Kt の候補順位を入れ替える。この
場合、認識文字候補c1 ,c2 ,…,cN のうちの例え
ば最下位候補cN の類似文字cN(j)も最上位となる可能
性がある。詳細識別部107がこのような順位付けを行
なう場合には、候補結合部106は図3(a)または
(b)に示す並びの結合処理を行なう必要はなく、どの
ような並び順で各候補Kt を詳細識別部107に出力す
るようにしても構わない。
た方式と異なる文字認識方式により各候補Kt の評価
(詳細識別)を行なうと、例えば全ての候補Kt を対象
に、その評価値(詳細評価値)vi に従う順位付けを行
なって、当該全候補Kt の候補順位を入れ替える。この
場合、認識文字候補c1 ,c2 ,…,cN のうちの例え
ば最下位候補cN の類似文字cN(j)も最上位となる可能
性がある。詳細識別部107がこのような順位付けを行
なう場合には、候補結合部106は図3(a)または
(b)に示す並びの結合処理を行なう必要はなく、どの
ような並び順で各候補Kt を詳細識別部107に出力す
るようにしても構わない。
【0050】なお、候補結合部106から送られる全て
の候補Kt のうちの同種の類似文字の集合内でのみ、対
応する評価値vi に基づく候補順位の入れ替えを行なう
ようにしても構わない。ここで、同種の類似文字の集合
は、候補結合部106から送られる候補Kt の列のう
ち、同一の類似文字番号iが付加された候補ci 並びに
類似文字ci(j)の集合として選択される。この類似文字
番号iの類似文字集合内では、評価値vi に基づく候補
順位の入れ替えによって、類似文字ci(j)が候補ci よ
り上位となる可能性がある。但し、類似文字番号iの集
合内での候補順位の入れ替えによって、他の類似文字集
合内での候補順位が変化することはない。
の候補Kt のうちの同種の類似文字の集合内でのみ、対
応する評価値vi に基づく候補順位の入れ替えを行なう
ようにしても構わない。ここで、同種の類似文字の集合
は、候補結合部106から送られる候補Kt の列のう
ち、同一の類似文字番号iが付加された候補ci 並びに
類似文字ci(j)の集合として選択される。この類似文字
番号iの類似文字集合内では、評価値vi に基づく候補
順位の入れ替えによって、類似文字ci(j)が候補ci よ
り上位となる可能性がある。但し、類似文字番号iの集
合内での候補順位の入れ替えによって、他の類似文字集
合内での候補順位が変化することはない。
【0051】具体例を挙げるならば、候補結合部106
よる結合が図3(a)のように行なわれる場合であれ
ば、認識文字候補c1 ,c2 ,…,cN のうちの例えば
最下位候補cN 並びにその類似文字cN(j)(類似文字番
号iの類似文字集合内の各文字)は、それより上位の候
補c1 ,c2 ,…,cN-1 並びにその類似文字c1(j),
c2(j),…,cN-1(j)より上位となることはない。但
し、類似文字cN(j)が対応する候補cN より上位となる
可能性はある。
よる結合が図3(a)のように行なわれる場合であれ
ば、認識文字候補c1 ,c2 ,…,cN のうちの例えば
最下位候補cN 並びにその類似文字cN(j)(類似文字番
号iの類似文字集合内の各文字)は、それより上位の候
補c1 ,c2 ,…,cN-1 並びにその類似文字c1(j),
c2(j),…,cN-1(j)より上位となることはない。但
し、類似文字cN(j)が対応する候補cN より上位となる
可能性はある。
【0052】一方、候補結合部106よる結合が図3
(b)のように行なわれる場合には、認識文字候補c
1 ,c2 ,…,cN のうちの例えば最下位候補cN 並び
にその類似文字cN(j)は、それより上位の候補c1 ,c
2 ,…,cN-1 より上位となることはない。但し、類似
文字cN(j)が、対応する候補cN より上位となり、更に
他の類似文字c1(j),c2(j),…,cN-1(j)の少なくと
も1つより上位となる可能性はある。
(b)のように行なわれる場合には、認識文字候補c
1 ,c2 ,…,cN のうちの例えば最下位候補cN 並び
にその類似文字cN(j)は、それより上位の候補c1 ,c
2 ,…,cN-1 より上位となることはない。但し、類似
文字cN(j)が、対応する候補cN より上位となり、更に
他の類似文字c1(j),c2(j),…,cN-1(j)の少なくと
も1つより上位となる可能性はある。
【0053】この他に、図3(b)の結合方式では、候
補c1 〜cN の中だけで順位の入れ替えを行なうと共
に、類似文字c1(1),…,c1(M1) 〜cN(1),…,c
N(MN) の中だけで順位の入れ替えを行なうようにしても
構わない。
補c1 〜cN の中だけで順位の入れ替えを行なうと共
に、類似文字c1(1),…,c1(M1) 〜cN(1),…,c
N(MN) の中だけで順位の入れ替えを行なうようにしても
構わない。
【0054】さて、詳細識別部107での各候補Kt に
対する評価(詳細識別)の結果に基づいて順位が入れ替
えられた(新たに順位付けされた)候補Kt の列は、図
示せぬユーザインタフェースに送られる。ユーザインタ
フェースは、まず候補Kt の列のうちの第1位候補を表
示する。筆記者が第1位候補を正しくないと判断し、次
候補を要求した場合には、ユーザインタフェースは第2
位候補以下を表示する。筆記者はそれらの候補の中から
正解を選択する。
対する評価(詳細識別)の結果に基づいて順位が入れ替
えられた(新たに順位付けされた)候補Kt の列は、図
示せぬユーザインタフェースに送られる。ユーザインタ
フェースは、まず候補Kt の列のうちの第1位候補を表
示する。筆記者が第1位候補を正しくないと判断し、次
候補を要求した場合には、ユーザインタフェースは第2
位候補以下を表示する。筆記者はそれらの候補の中から
正解を選択する。
【0055】以上に述べたように本実施形態において
は、候補に追加した類似文字を含めて詳細識別を行なう
ことによって、正解文字が上位の候補となる確率を高く
することができる。
は、候補に追加した類似文字を含めて詳細識別を行なう
ことによって、正解文字が上位の候補となる確率を高く
することができる。
【0056】なお、詳細識別を認識部102で最初から
行なうことも可能である。但し、全文字種に対して詳細
識別を行なうのは計算量が多大になるため得策ではな
く、本実施形態のようにある程度候補数を絞ってから行
なう方が、計算時間の点からも有利である。
行なうことも可能である。但し、全文字種に対して詳細
識別を行なうのは計算量が多大になるため得策ではな
く、本実施形態のようにある程度候補数を絞ってから行
なう方が、計算時間の点からも有利である。
【0057】また、詳細識別部107での候補順位の入
れ替えを同種の類似文字の集合内でのみ行なう場合に
は、当該詳細識別部107での詳細識別(評価)に、そ
の類似文字の集合に固有の方式、例えばペアチェックと
呼ばれる簡単な識別方式を適用することも可能である。
ペアチェック方式とは、類似文字が「土」と「士」の場
合を例にとると、その類似文字の相違部分である上と
下、2つの横ストロークの標準的な長さを、手書き文字
パターンの対応するストロークと比較して、評価値vi
を得る方式である。ここで、手書き文字パターンのどの
ストロークと比較するかは、各類似文字集合毎に、詳細
識別辞書108に予め登録しておけばよい。
れ替えを同種の類似文字の集合内でのみ行なう場合に
は、当該詳細識別部107での詳細識別(評価)に、そ
の類似文字の集合に固有の方式、例えばペアチェックと
呼ばれる簡単な識別方式を適用することも可能である。
ペアチェック方式とは、類似文字が「土」と「士」の場
合を例にとると、その類似文字の相違部分である上と
下、2つの横ストロークの標準的な長さを、手書き文字
パターンの対応するストロークと比較して、評価値vi
を得る方式である。ここで、手書き文字パターンのどの
ストロークと比較するかは、各類似文字集合毎に、詳細
識別辞書108に予め登録しておけばよい。
【0058】また、詳細識別部107の詳細識別機能
(評価機能)と詳細識別結果(評価結果)に基づく順位
入れ替え(順位付け)機能とを独立させ、順位入れ替え
機能(を持つ手段)が詳細識別機能(を持つ手段)を利
用する構成とすることも可能である。 [第2の実施形態]図4は本発明の第2の実施形態に係
る文字認識装置の構成を示すブロック図であり、図1と
同一部分には同一符号を付してある。
(評価機能)と詳細識別結果(評価結果)に基づく順位
入れ替え(順位付け)機能とを独立させ、順位入れ替え
機能(を持つ手段)が詳細識別機能(を持つ手段)を利
用する構成とすることも可能である。 [第2の実施形態]図4は本発明の第2の実施形態に係
る文字認識装置の構成を示すブロック図であり、図1と
同一部分には同一符号を付してある。
【0059】図4の文字認識装置が図1の文字認識装置
と異なる点は、照合部104から出力される類似文字に
対して評価を行なう類似文字評価部409を新たに設け
ると共に、候補結合部106に代えて、認識部102か
らの評価値付きの認識文字候補(の群)と類似文字評価
部409からの評価値付きの類似文字候補(の群)とを
当該評価値をもとに順位付けして結合し、全ての候補を
新たに認識文字候補として出力する候補結合部406を
用いたことにある。この構成では、図1で用いられてい
た詳細識別部107及び詳細識別辞書108は不要とな
る。
と異なる点は、照合部104から出力される類似文字に
対して評価を行なう類似文字評価部409を新たに設け
ると共に、候補結合部106に代えて、認識部102か
らの評価値付きの認識文字候補(の群)と類似文字評価
部409からの評価値付きの類似文字候補(の群)とを
当該評価値をもとに順位付けして結合し、全ての候補を
新たに認識文字候補として出力する候補結合部406を
用いたことにある。この構成では、図1で用いられてい
た詳細識別部107及び詳細識別辞書108は不要とな
る。
【0060】次に、図4の構成の動作を説明する。文字
入力装置101は、タブレット等に筆記者が文字を記入
すると、その手書き文字の形状を表す手書き文字パター
ンを認識部102に送る。認識部102は、この手書き
文字パターンと認識辞書103中の全標準パターンとの
間で比較を行ない、評価値の良い上位の候補(を表す文
字コードとその評価値)を認識文字候補として照合部1
04及び候補結合部406に順に出力する。
入力装置101は、タブレット等に筆記者が文字を記入
すると、その手書き文字の形状を表す手書き文字パター
ンを認識部102に送る。認識部102は、この手書き
文字パターンと認識辞書103中の全標準パターンとの
間で比較を行ない、評価値の良い上位の候補(を表す文
字コードとその評価値)を認識文字候補として照合部1
04及び候補結合部406に順に出力する。
【0061】照合部104は、認識部102から出力さ
れる各認識文字候補について類似文字辞書105を検索
し、該当する文字を含む類似文字集合がある場合には、
その類似文字集合中の認識文字候補以外の類似文字(の
文字コード)を類似文字候補として類似文字評価部40
9に出力する。
れる各認識文字候補について類似文字辞書105を検索
し、該当する文字を含む類似文字集合がある場合には、
その類似文字集合中の認識文字候補以外の類似文字(の
文字コード)を類似文字候補として類似文字評価部40
9に出力する。
【0062】類似文字評価部409は、照合部104か
ら出力される類似文字に対して予め定められた評価尺度
に基づいて評価を行ない、その評価値を類似文字(の文
字コード)と共に候補結合部406に出力する。以下、
この類似文字評価部409の詳細を説明する。
ら出力される類似文字に対して予め定められた評価尺度
に基づいて評価を行ない、その評価値を類似文字(の文
字コード)と共に候補結合部406に出力する。以下、
この類似文字評価部409の詳細を説明する。
【0063】まず、認識部102から候補文字Ii 及び
その評価値si からなる認識文字候補が入力された際
の、照合部104の出力、即ち文字Ii の類似文字をI
i(j)(j=1,…Mi )とする。このとき類似文字評価
部409は、類似文字Ii(j)(j=1,…Mi )に対す
る評価値si(j)を次の(1)〜(3)のいずれか1つの
方式(評価尺度)により決定する。
その評価値si からなる認識文字候補が入力された際
の、照合部104の出力、即ち文字Ii の類似文字をI
i(j)(j=1,…Mi )とする。このとき類似文字評価
部409は、類似文字Ii(j)(j=1,…Mi )に対す
る評価値si(j)を次の(1)〜(3)のいずれか1つの
方式(評価尺度)により決定する。
【0064】(1)類似文字Ii(j)の認識部102での
評価値を、類似文字評価部409での当該文字Ii(j)の
評価値si(j)とする第1の方式 この第1の方式では、類似文字評価部409は、評価す
べき類似文字Ii(j)の文字コードを、図4中の破線で示
される経路400を介して認識部102に送って、その
文字コードの示す文字Ii(j)に対応する認識辞書103
内の標準パターンと手書き文字パターンとの比較を行な
わせ、当該文字Ii(j)に対する評価値を求めさせる。こ
の文字Ii(j)に対する評価値は認識辞書103から類似
文字評価部409に返される。
評価値を、類似文字評価部409での当該文字Ii(j)の
評価値si(j)とする第1の方式 この第1の方式では、類似文字評価部409は、評価す
べき類似文字Ii(j)の文字コードを、図4中の破線で示
される経路400を介して認識部102に送って、その
文字コードの示す文字Ii(j)に対応する認識辞書103
内の標準パターンと手書き文字パターンとの比較を行な
わせ、当該文字Ii(j)に対する評価値を求めさせる。こ
の文字Ii(j)に対する評価値は認識辞書103から類似
文字評価部409に返される。
【0065】類似文字評価部409は、認識辞書103
から類似文字Ii(j)に対する評価値を受け取ると、その
評価値を、当該文字Ii(j)の評価値si(j)と決定する。 (2)Ii の評価値si をそのまま類似文字Ii(j)の評
価値si(j)とする第2の方式 この第2の方式では、照合部104は、認識部102か
ら送られる認識候補文字Ii の評価値si を、当該文字
Ii の類似文字Ii(j)と共に類似文字評価部409に出
力する必要がある。
から類似文字Ii(j)に対する評価値を受け取ると、その
評価値を、当該文字Ii(j)の評価値si(j)と決定する。 (2)Ii の評価値si をそのまま類似文字Ii(j)の評
価値si(j)とする第2の方式 この第2の方式では、照合部104は、認識部102か
ら送られる認識候補文字Ii の評価値si を、当該文字
Ii の類似文字Ii(j)と共に類似文字評価部409に出
力する必要がある。
【0066】類似文字評価部409は、照合部104か
ら文字Ii の評価値si を受け取ると、当該si をその
まま類似文字Ii(j)の評価値si(j)とする。 (3)照合部104から類似文字Ii(j)と共に与えられ
る類似度を、当該文字Ii(j)の評価値si(j)とする第3
の方式 この第3の方式では、類似文字辞書105の辞書データ
構造を、図5に示すような、各類似文字集合毎に(その
集合内の類似文字同士の類似の度合いを表す)類似度が
登録された構造とする必要がある。また、照合部104
には、類似文字辞書105を検索して類似文字を抽出す
る際に、対応する類似度も取り出し、類似文字と組にし
て類似文字評価部409に送る機能を持たせる必要があ
る。こうすることで、類似文字評価部409は、照合部
104から類似文字Ii(j)を受け取った場合、それと組
をなす類似度を当該文字Ii(j)の評価値si(j)とするこ
とができる。
ら文字Ii の評価値si を受け取ると、当該si をその
まま類似文字Ii(j)の評価値si(j)とする。 (3)照合部104から類似文字Ii(j)と共に与えられ
る類似度を、当該文字Ii(j)の評価値si(j)とする第3
の方式 この第3の方式では、類似文字辞書105の辞書データ
構造を、図5に示すような、各類似文字集合毎に(その
集合内の類似文字同士の類似の度合いを表す)類似度が
登録された構造とする必要がある。また、照合部104
には、類似文字辞書105を検索して類似文字を抽出す
る際に、対応する類似度も取り出し、類似文字と組にし
て類似文字評価部409に送る機能を持たせる必要があ
る。こうすることで、類似文字評価部409は、照合部
104から類似文字Ii(j)を受け取った場合、それと組
をなす類似度を当該文字Ii(j)の評価値si(j)とするこ
とができる。
【0067】類似文字評価部409は、上記(1)〜
(3)のいずれかの方式で、各類似文字Ii(j)の評価値
si(j)を決定すると、その評価値si(j)を類似文字I
i(j)と共に候補結合部406に出力する。
(3)のいずれかの方式で、各類似文字Ii(j)の評価値
si(j)を決定すると、その評価値si(j)を類似文字I
i(j)と共に候補結合部406に出力する。
【0068】候補結合部406は、認識部102から送
られてくる候補文字Ii とその評価値si 、及び類似文
字評価部409から送られてくる(当該文字Ii に関す
る)類似文字Ii(j)とその評価値si(j)を受け取り、こ
れら評価値の大きさを基準にして、候補順位を決定し、
その決定した順位に従って全ての候補を認識文字候補と
して出力する。
られてくる候補文字Ii とその評価値si 、及び類似文
字評価部409から送られてくる(当該文字Ii に関す
る)類似文字Ii(j)とその評価値si(j)を受け取り、こ
れら評価値の大きさを基準にして、候補順位を決定し、
その決定した順位に従って全ての候補を認識文字候補と
して出力する。
【0069】なお、類似文字評価部409で決定する評
価値に、(1)〜(3)で求められる評価値の少なくと
も2つを組み合わせた値(例えば評価値の和の値、或い
は各方式に固有の重みが付けられた評価値の和の値)を
用いるようにしても構わない。
価値に、(1)〜(3)で求められる評価値の少なくと
も2つを組み合わせた値(例えば評価値の和の値、或い
は各方式に固有の重みが付けられた評価値の和の値)を
用いるようにしても構わない。
【0070】以上に述べたように本実施形態において
は、追加した類似文字に対して類似文字評価部409に
て評価を行なうことによって、追加した類似文字が入力
された文字と形状が異なる場合にはその順位を下げるこ
とができる。 [第3の実施形態]図6は本発明の第3の実施形態に係
る文字認識装置の構成を示すブロック図であり、図4と
同一部分には同一符号を付してある。
は、追加した類似文字に対して類似文字評価部409に
て評価を行なうことによって、追加した類似文字が入力
された文字と形状が異なる場合にはその順位を下げるこ
とができる。 [第3の実施形態]図6は本発明の第3の実施形態に係
る文字認識装置の構成を示すブロック図であり、図4と
同一部分には同一符号を付してある。
【0071】図6の文字認識装置の特徴は、図4の構成
における候補結合部406の後段に(図1中の詳細識別
部107及び詳細識別辞書108に相当する)詳細識別
部607及び詳細識別辞書608を設けたことにある。
における候補結合部406の後段に(図1中の詳細識別
部107及び詳細識別辞書108に相当する)詳細識別
部607及び詳細識別辞書608を設けたことにある。
【0072】詳細識別部607は、候補結合部406か
ら出力される各認識文字候補についての詳細識別辞書6
08内の標準パターンと文字入力装置101から送られ
る手書き文字パターンとを比較して、各認識文字候補の
評価を行ない、各候補の順位を入れ替える(図1中の詳
細識別部107と同様の)処理を行なう。図1中の詳細
識別部107との違いは、各候補の順位を決定するの
に、以下に述べるように候補結合部406から出力され
る各候補に付されている評価値(st )も用いられるこ
とである。
ら出力される各認識文字候補についての詳細識別辞書6
08内の標準パターンと文字入力装置101から送られ
る手書き文字パターンとを比較して、各認識文字候補の
評価を行ない、各候補の順位を入れ替える(図1中の詳
細識別部107と同様の)処理を行なう。図1中の詳細
識別部107との違いは、各候補の順位を決定するの
に、以下に述べるように候補結合部406から出力され
る各候補に付されている評価値(st )も用いられるこ
とである。
【0073】まず、候補結合部406からの出力で得ら
れる候補をΚt (t=1,…,L)、その評価値をst
とする。ここで、Κt は前記第2の実施形態におけるI
i とIi(j)に相当し、st は前記第2の実施形態におけ
るsi とsi(j)に相当する。
れる候補をΚt (t=1,…,L)、その評価値をst
とする。ここで、Κt は前記第2の実施形態におけるI
i とIi(j)に相当し、st は前記第2の実施形態におけ
るsi とsi(j)に相当する。
【0074】詳細識別部607は、詳細識別辞書608
内の各候補Kt の標準パターンと、文字入力装置101
から送られる手書き文字パターン(筆記された文字のパ
ターン)とを比較して、評価値(詳細評価値)vt を得
る。
内の各候補Kt の標準パターンと、文字入力装置101
から送られる手書き文字パターン(筆記された文字のパ
ターン)とを比較して、評価値(詳細評価値)vt を得
る。
【0075】次に詳細識別部607は、各候補Kt の詳
細評価値vt と、候補結合部406からの出力で得られ
る当該候補Kt の評価値st とをもとに候補順位を決定
し、その決定した順位に従って全ての候補Kt を認識文
字候補として出力する。ここでの候補順位の決定方式
(つまり順位付け方式)としては、各候補Kt 毎に、対
応する詳細評価値vt と評価値st の和(vt +st )
をとって、その和の値の大きさを基準に候補順位を決定
する方式、或いはvt とst との値を重み付けした線形
和(wv ・vt +ws ・st )の値の大きさを基準に候
補順位を決定する方式などが適用可能である。
細評価値vt と、候補結合部406からの出力で得られ
る当該候補Kt の評価値st とをもとに候補順位を決定
し、その決定した順位に従って全ての候補Kt を認識文
字候補として出力する。ここでの候補順位の決定方式
(つまり順位付け方式)としては、各候補Kt 毎に、対
応する詳細評価値vt と評価値st の和(vt +st )
をとって、その和の値の大きさを基準に候補順位を決定
する方式、或いはvt とst との値を重み付けした線形
和(wv ・vt +ws ・st )の値の大きさを基準に候
補順位を決定する方式などが適用可能である。
【0076】なお、候補結合部406からの出力に類似
文字番号を加え、(前記第1の実施形態でも述べたよう
に)同種の類似文字の間だけで順位入れ替え処理を行な
うようにしても構わない。
文字番号を加え、(前記第1の実施形態でも述べたよう
に)同種の類似文字の間だけで順位入れ替え処理を行な
うようにしても構わない。
【0077】以上に述べたように本実施形態において
は、追加した類似文字に対して、評価計算を行なうこと
によって、類似文字辞書に載っているという理由によ
り、入力文字とは形状が異なる文字が認識結果の上位に
くることを防ぐことができる。また、追加される類似文
字と認識部102による認識結果からの候補とを詳細識
別部607での詳細識別処理によって同じ基準で評価を
行なうことにより、認識精度を高めることができる。 [第4の実施形態]図7は本発明の第4の実施形態に係
る文字認識装置の構成を示すブロック図であり、図4と
同一部分には同一符号を付してある。
は、追加した類似文字に対して、評価計算を行なうこと
によって、類似文字辞書に載っているという理由によ
り、入力文字とは形状が異なる文字が認識結果の上位に
くることを防ぐことができる。また、追加される類似文
字と認識部102による認識結果からの候補とを詳細識
別部607での詳細識別処理によって同じ基準で評価を
行なうことにより、認識精度を高めることができる。 [第4の実施形態]図7は本発明の第4の実施形態に係
る文字認識装置の構成を示すブロック図であり、図4と
同一部分には同一符号を付してある。
【0078】図7の文字認識装置の特徴は、図4の構成
における類似文字評価部409と候補結合部406との
間に、類似文字判定部710を設けたことにある。類似
文字判定部710は、類似文字評価部409から得られ
る類似文字に対する評価値を予め定められた閾値と比較
し、その閾値を越える場合のみ、当該類似文字を候補結
合部406に出力する。閾値以下の場合には出力しな
い。
における類似文字評価部409と候補結合部406との
間に、類似文字判定部710を設けたことにある。類似
文字判定部710は、類似文字評価部409から得られ
る類似文字に対する評価値を予め定められた閾値と比較
し、その閾値を越える場合のみ、当該類似文字を候補結
合部406に出力する。閾値以下の場合には出力しな
い。
【0079】このように本実施形態においては、類似文
字辞書105に登録されている類似文字に関して類似文
字評価値が一定値以上のものだけを候補結合部406に
出力するという制限を加えることによって、入力文字と
は形状が異なる文字を取り除き、候補数の増加を抑える
ことができる。 [第5の実施形態]図8は本発明の第5の実施形態に係
る文字認識装置の構成を示すブロック図であり、図7と
同一部分には同一符号を付してある。
字辞書105に登録されている類似文字に関して類似文
字評価値が一定値以上のものだけを候補結合部406に
出力するという制限を加えることによって、入力文字と
は形状が異なる文字を取り除き、候補数の増加を抑える
ことができる。 [第5の実施形態]図8は本発明の第5の実施形態に係
る文字認識装置の構成を示すブロック図であり、図7と
同一部分には同一符号を付してある。
【0080】図8の文字認識装置の特徴は、類似文字判
定部710を備えた図8の構成における候補結合部40
6の後段に、(図6中の)詳細識別部607及び詳細識
別辞書608を設けたことにある。
定部710を備えた図8の構成における候補結合部40
6の後段に、(図6中の)詳細識別部607及び詳細識
別辞書608を設けたことにある。
【0081】このような実施形態においては、照合部1
04にて追加された類似文字に対して、類似文字評価部
409が評価値に基づき実際に追加すべきか否かの判定
を行なうことによって、類似文字辞書105に載ってい
るという理由で入力文字とは形状が異なる文字が認識文
字候補となるのを防ぐことができ、したがって認識結果
の上位にくることを防ぐことができる。また、追加され
る類似文字と認識結果からの候補とを詳細識別部607
での詳細識別により同じ基準で評価を行なうことによ
り、認識精度を高めることができる。
04にて追加された類似文字に対して、類似文字評価部
409が評価値に基づき実際に追加すべきか否かの判定
を行なうことによって、類似文字辞書105に載ってい
るという理由で入力文字とは形状が異なる文字が認識文
字候補となるのを防ぐことができ、したがって認識結果
の上位にくることを防ぐことができる。また、追加され
る類似文字と認識結果からの候補とを詳細識別部607
での詳細識別により同じ基準で評価を行なうことによ
り、認識精度を高めることができる。
【0082】以上に述べた実施形態で適用される、認識
部102による認識処理、照合部104による照合処
理、候補結合部106,406による候補結合処理、詳
細識別部107,607による詳細識別処理並びに詳細
識別結果に基づく順位付け(順位入れ替え)処理、類似
文字評価部409による類似文字評価処理、類似文字判
定部710による類似文字判定処理は、プログラム読み
取り可能なコンピュータに当該処理を実行させるための
プログラムを記録した、CD−ROM、フロッピーディ
スク、メモリカード等の記録媒体を装着して、当該記録
媒体に記録されているプログラムをコンピュータで読み
取り実行させることによっても実現される。ここで、認
識部102による認識処理、詳細識別部107,607
による詳細識別処理は既存の文字認識ソフトウェアを用
いて実行することが可能なため、記録媒体に記録するプ
ログラムとしては、上記認識処理及び詳細識別処理を省
いた処理をコンピュータに実行させるためのプログラム
であっても構わない。なお、プログラムを記録した記録
媒体の内容が、通信回線等を介してコンピュータにダウ
ンロードされるものであっても構わない。
部102による認識処理、照合部104による照合処
理、候補結合部106,406による候補結合処理、詳
細識別部107,607による詳細識別処理並びに詳細
識別結果に基づく順位付け(順位入れ替え)処理、類似
文字評価部409による類似文字評価処理、類似文字判
定部710による類似文字判定処理は、プログラム読み
取り可能なコンピュータに当該処理を実行させるための
プログラムを記録した、CD−ROM、フロッピーディ
スク、メモリカード等の記録媒体を装着して、当該記録
媒体に記録されているプログラムをコンピュータで読み
取り実行させることによっても実現される。ここで、認
識部102による認識処理、詳細識別部107,607
による詳細識別処理は既存の文字認識ソフトウェアを用
いて実行することが可能なため、記録媒体に記録するプ
ログラムとしては、上記認識処理及び詳細識別処理を省
いた処理をコンピュータに実行させるためのプログラム
であっても構わない。なお、プログラムを記録した記録
媒体の内容が、通信回線等を介してコンピュータにダウ
ンロードされるものであっても構わない。
【0083】
【発明の効果】以上詳述したように本発明によれば、認
識候補として追加された類似文字を含めて、手書き文字
との類似性についての評価(詳細識別)を行なって、そ
の結果をもとに各認識候補の順位付けを行なうようにし
たので、正解文字をできるだけ上位の候補に入れること
ができる。
識候補として追加された類似文字を含めて、手書き文字
との類似性についての評価(詳細識別)を行なって、そ
の結果をもとに各認識候補の順位付けを行なうようにし
たので、正解文字をできるだけ上位の候補に入れること
ができる。
【0084】また本発明によれば、類似文字に対して評
価を行なうようにしたので、その評価結果をもとに、追
加される類似文字のうちで、入力された手書き文字と形
状が異なる文字について候補順位を下げることができ
る。
価を行なうようにしたので、その評価結果をもとに、追
加される類似文字のうちで、入力された手書き文字と形
状が異なる文字について候補順位を下げることができ
る。
【0085】また本発明によれば、類似文字に対する評
価結果をもとに、認識候補として実際に追加される類似
文字を制限するようにしたので、類似文字辞書にあって
も、入力された手書き文字と形状が異なる文字について
は、認識候補から除外することができる。
価結果をもとに、認識候補として実際に追加される類似
文字を制限するようにしたので、類似文字辞書にあって
も、入力された手書き文字と形状が異なる文字について
は、認識候補から除外することができる。
【0086】また本発明によれば、手書き文字と形状が
異なる類似文字が除外された最終的な認識候補を対象に
詳細識別を行なって順位付けを行なうようにしたので、
正解文字が上位にくる確率を高めることができる。
異なる類似文字が除外された最終的な認識候補を対象に
詳細識別を行なって順位付けを行なうようにしたので、
正解文字が上位にくる確率を高めることができる。
【図1】本発明の第1の実施形態に係る文字認識装置の
構成を示すブロック図。
構成を示すブロック図。
【図2】類似文字辞書105の辞書データ構造例を示す
図。
図。
【図3】候補結合部106による文字認識候補ci とそ
の類似文字ci(j)(の群)に対する結合例を示す図。
の類似文字ci(j)(の群)に対する結合例を示す図。
【図4】本発明の第2の実施形態に係る文字認識装置の
構成を示すブロック図。
構成を示すブロック図。
【図5】類似文字辞書105の他の辞書データ構造例を
示す図。
示す図。
【図6】本発明の第3の実施形態に係る文字認識装置の
構成を示すブロック図。
構成を示すブロック図。
【図7】本発明の第4の実施形態に係る文字認識装置の
構成を示すブロック図。
構成を示すブロック図。
【図8】本発明の第5の実施形態に係る文字認識装置の
構成を示すブロック図。
構成を示すブロック図。
【図9】手書き文字の認識処理で得られた候補文字の類
似文字を候補に単純に追加する従来技術の問題を説明す
るための図。
似文字を候補に単純に追加する従来技術の問題を説明す
るための図。
101…文字入力装置 102…認識部 103…認識辞書 104…照合部 105…類似文字辞書 106,406…候補結合部 107,607…詳細識別部 108,608…詳細識別辞書 409…類似文字評価部 710…類似文字判定部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 河村 聡典 神奈川県川崎市幸区柳町70番地 株式会社 東芝柳町工場内 (72)発明者 名取 直毅 神奈川県川崎市幸区柳町70番地 株式会社 東芝柳町工場内 (72)発明者 小山 和雄 東京都青梅市新町1381番地1 東芝コンピ ュ―タエンジニアリング株式会社内 (72)発明者 坂井 一郎 東京都青梅市新町1381番地1 東芝コンピ ュ―タエンジニアリング株式会社内
Claims (17)
- 【請求項1】 筆記された手書き文字の筆跡パターンを
検出して、当該パターンを示す手書き文字情報を出力す
る文字入力装置と、 前記文字入力装置からの手書き文字情報に基づいて筆記
された文字を認識し、その認識結果として認識候補を取
得する認識手段と、 形状が類似した類似文字群が登録された類似文字辞書記
憶手段と、 前記認識手段により取得された認識候補により前記類似
文字辞書記憶手段を検索することで当該認識候補の類似
文字を全て検出する照合手段と、 前記認識手段により取得された認識候補と前記照合手段
により検出された類似文字とを併せて全て認識候補とし
て出力する候補結合手段と、 前記候補結合手段により出力された各認識候補を対象
に、前記文字入力装置からの手書き文字情報との類似性
についての評価を行なって、その評価結果をもとに当該
各認識候補の順位付けを行なう詳細識別手段とを具備す
ることを特徴とする文字認識装置。 - 【請求項2】 前記詳細識別手段は、前記認識手段での
認識に用いた方式とは性質が異なる認識方式により評価
を行なうことを特徴とする請求項1記載の文字認識装
置。 - 【請求項3】 筆記された手書き文字の筆跡パターンを
検出して、当該パターンを示す手書き文字情報を出力す
る文字入力装置と、 前記文字入力装置からの手書き文字情報に基づいて筆記
された文字を認識し、その認識結果として評価値付きの
認識候補を取得する認識手段と、 形状が類似した類似文字群が登録された類似文字辞書記
憶手段と、 前記認識手段により取得された認識候補により前記類似
文字辞書記憶手段を検索することで当該認識候補の類似
文字を全て検出する照合手段と、 前記照合手段により検出された全ての類似文字に対して
予め定められた評価尺度に基づく評価を行なってその評
価値を求める類似文字評価手段と、 前記認識手段により取得された認識候補と前記類似文字
評価手段により評価値が求められた類似文字を併せて全
て認識候補として出力する候補結合手段であって、対応
する評価値をもとに順位付けを行なう候補結合手段とを
具備することを特徴とする文字認識装置。 - 【請求項4】 上記類似文字評価手段は、前記文字入力
装置からの手書き文字情報を前記認識手段により前記各
類似文字の特徴と比較させることで当該各類似文字の評
価値を取得することを特徴とする請求項3記載の文字認
識装置。 - 【請求項5】 上記類似文字評価手段は、前記類似文字
の評価値として、前記認識手段により取得された対応す
る認識候補の評価値を採用することを特徴とする請求項
3記載の文字認識装置。 - 【請求項6】 前記類似文字辞書記憶手段には、同種の
類似文字同士の類似度が予め登録されており、 上記類似文字評価手段は、前記類似文字の評価値とし
て、前記類似文字辞書記憶手段に登録されている対応す
る前記類似度を採用することを特徴とする請求項3記載
の文字認識装置。 - 【請求項7】 筆記された手書き文字の筆跡パターンを
検出して、当該パターンを示す手書き文字情報を出力す
る文字入力装置と、 前記文字入力装置からの手書き文字情報に基づいて筆記
された文字を認識し、その認識結果として第1のタイプ
の評価値の付いた認識候補を取得する認識手段と、 形状が類似した類似文字群が登録された類似文字辞書記
憶手段と、 前記認識手段により取得された認識候補により前記類似
文字辞書記憶手段を検索することで当該認識候補の類似
文字を全て検出する照合手段と、 前記照合手段により検出された全ての類似文字に対して
予め定められた評価尺度に基づく評価を行なって第1の
タイプの評価値を求める類似文字評価手段と、 前記認識手段により取得された認識候補と前記類似文字
評価手段により評価値が求められた類似文字を併せて全
て認識候補として対応する前記第1の評価値と共に出力
する候補結合手段と、 前記候補結合手段により出力された各認識候補を対象
に、前記文字入力装置からの手書き文字情報との類似性
についての評価を行なって第2のタイプの評価値を求
め、当該各認識候補の順位付けを対応する前記第1及び
第2のタイプの評価値をもとに行なう詳細識別手段とを
具備することを特徴とする文字認識装置。 - 【請求項8】 筆記された手書き文字の筆跡パターンを
検出して、当該パターンを示す手書き文字情報を出力す
る文字入力装置と、 前記文字入力装置からの手書き文字情報に基づいて筆記
された文字を認識し、その認識結果として評価値付きの
認識候補を取得する認識手段と、 形状が類似した類似文字群が登録された類似文字辞書記
憶手段と、 前記認識手段により取得された認識候補により前記類似
文字辞書記憶手段を検索することで当該認識候補の類似
文字を全て検出する照合手段と、 前記照合手段により検出された全ての類似文字に対して
“予め定められた評価尺度に基づく評価を行なう類似文
字評価手段と、 前記類似文字評価手段の評価結果をもとに実際に認識候
補に追加する類似文字を決定する類似文字判定手段と、 前記認識手段により取得された認識候補と類似文字判定
手段により認識候補に追加することが決定された類似文
字を併せて全て認識候補として出力する候補結合手段と
を具備することを特徴とする文字認識装置。 - 【請求項9】 筆記された手書き文字の筆跡パターンを
検出して、当該パターンを示す手書き文字情報を出力す
る文字入力装置と、 前記文字入力装置からの手書き文字情報に基づいて筆記
された文字を認識し、その認識結果として第1のタイプ
の評価値の付いた認識候補を取得する認識手段と、 形状が類似した類似文字群が登録された類似文字辞書記
憶手段と、 前記認識手段により取得された認識候補により前記類似
文字辞書記憶手段を検索することで当該認識候補の類似
文字を全て検出する照合手段と、 前記照合手段により検出された全ての類似文字に対して
“予め定められた評価尺度に基づく評価を行なって前記
第1のタイプの評価値を求める類似文字評価手段と、 前記類似文字評価手段の評価結果をもとに実際に認識候
補に追加する類似文字を決定する類似文字判定手段と、 前記認識手段により取得された認識候補と類似文字判定
手段により認識候補に追加することが決定された類似文
字を併せて全て認識候補として対応する前記第1の評価
値と共に出力する候補結合手段と、 前記候補結合手段により出力された各認識候補を対象
に、前記文字入力装置からの手書き文字情報との類似性
についての評価を行なって第2のタイプの評価値を求
め、当該各認識候補の順位付けを対応する前記第1及び
第2のタイプの評価値をもとに行なう詳細識別手段とを
具備することを特徴とする文字認識装置。 - 【請求項10】 筆記された手書き文字の筆跡パターン
を示す手書き文字情報に基づいて筆記された文字を認識
し、その認識結果として認識候補を出力し、 形状が類似した類似文字群が登録された類似文字辞書記
憶手段を前記出力された認識候補により検索することで
当該認識候補の類似文字を全て検出し、 前記出力された認識候補と前記検出された類似文字とを
併せて全て最終的な認識候補として出力し、 前記出力された最終的な各認識候補を対象に、前記手書
き文字情報との類似性についての評価を行なって、その
評価結果をもとに当該各認識候補の順位付けを行なうこ
とを特徴とする文字認識方法。 - 【請求項11】 筆記された手書き文字の筆跡パターン
を示す手書き文字情報に基づいて筆記された文字を認識
して、その認識結果として評価値付きの認識候補を出力
し、 形状が類似した類似文字群が登録された類似文字辞書記
憶手段を前記出力された認識候補により検索することで
当該認識候補の類似文字を全て検出し、 前記検出された全ての類似文字に対して予め定められた
評価尺度に基づく評価を行なってその評価値を求め、 前記出力された認識候補と前記評価値が求められた類似
文字とを併せて全て最終的な認識候補として扱い、当該
最終的な各認識候補に対して対応する評価値をもとに順
位付けを行なうことを特徴とする文字認識方法。 - 【請求項12】 筆記された手書き文字の筆跡パターン
を示す手書き文字情報に基づいて筆記された文字を認識
し、その認識結果として第1のタイプの評価値の付いた
認識候補を出力し、 形状が類似した類似文字群が登録された類似文字辞書記
憶手段を前記出力された認識候補により検索することで
当該認識候補の類似文字を全て検出し、 前記検出された全ての類似文字に対して予め定められた
評価尺度に基づく評価を行なって前記第1のタイプの評
価値を求め、 前記出力された認識候補と前記評価値が求められた類似
文字とを併せて全て最終的な認識候補として対応する前
記第1の評価値と共に出力し、 前記出力された最終的な各認識候補を対象に、前記手書
き文字情報との類似性についての評価を行なって第2の
タイプの評価値を求め、当該各認識候補の順位付けを対
応する前記第1及び第2のタイプの評価値をもとに行な
うことを特徴とする文字認識方法。 - 【請求項13】 筆記された手書き文字の筆跡パターン
を示す手書き文字情報に基づいて筆記された文字を認識
し、その認識結果として評価値付きの認識候補を出力
し、 形状が類似した類似文字群が登録された類似文字辞書記
憶手段を前記出力された認識候補により検索することで
当該認識候補の類似文字を全て検出し、 前記検出された全ての類似文字に対して予め定められた
評価尺度に基づく評価を行ない、 その評価結果をもとに実際に認識候補に追加する類似文
字を決定し、 前記出力された認識候補と前記決定された類似文字とを
併せて全て最終的な認識候補として出力することを特徴
とする文字認識方法。 - 【請求項14】 筆記された手書き文字の筆跡パターン
を示す手書き文字情報に基づいて筆記された文字を認識
し、その認識結果として第1のタイプの評価値の付いた
認識候補を出力し、 形状が類似した類似文字群が登録された類似文字辞書記
憶手段を前記出力された認識候補により検索することで
当該認識候補の類似文字を全て検出し、 前記検出された全ての類似文字に対して予め定められた
評価尺度に基づく評価を行なって前記第1のタイプの評
価値を求め、 前記求められた第1のタイプの評価値をもとに実際に認
識候補に追加する類似文字を決定し、 前記出力された認識候補と前記決定された類似文字とを
併せて全て最終的な認識候補として対応する前記第1の
評価値と共に出力し、 前記出力された最終的な各認識候補を対象に、前記手書
き文字情報との類似性についての評価を行なって第2の
タイプの評価値を求め、当該各認識候補の順位付けを対
応する前記第1及び第2のタイプの評価値をもとに行な
うことを特徴とする文字認識方法。 - 【請求項15】 筆記された手書き文字の筆跡パターン
を示す手書き文字情報に基づいて筆記された文字を認識
し、その認識結果として認識候補を出力する認識処理
と、 形状が類似した類似文字群が登録された類似文字辞書記
憶手段を前記出力された認識候補により検索することで
当該認識候補の類似文字を全て検出する照合処理と、 前記出力された認識候補と前記検出された類似文字とを
併せて全て最終的な認識候補として出力する候補結合処
理と、 前記出力された最終的な各認識候補を対象に、前記手書
き文字情報との類似性についての評価を行なって、その
評価結果をもとに当該各認識候補の順位付けを行なう詳
細識別・順位付け処理とをコンピュータに実行させるた
めのプログラムを記録したコンピュータ読取り可能な記
録媒体。 - 【請求項16】 筆記された手書き文字の筆跡パターン
を示す手書き文字情報に基づいて筆記された文字を認識
し、その認識結果として第1のタイプの評価値の付いた
認識候補を出力する認識処理と、 形状が類似した類似文字群が登録された類似文字辞書記
憶手段を前記出力された認識候補により検索することで
当該認識候補の類似文字を全て検出する照合処理と、 前記検出された全ての類似文字に対して予め定められた
評価尺度に基づく評価を行なって前記第1のタイプの評
価値を求める類似文字評価処理と、 前記求められた第1のタイプの評価値をもとに実際に認
識候補に追加する類似文字を決定する類似文字判定処理
と、 前記出力された認識候補と前記決定された類似文字とを
併せて全て最終的な認識候補として対応する前記第1の
評価値と共に出力する候補結合処理と、 前記出力された最終的な各認識候補を対象に、前記手書
き文字情報との類似性についての評価を行なって第2の
タイプの評価値を求め、当該各認識候補の順位付けを対
応する前記第1及び第2のタイプの評価値をもとに行な
う詳細識別・順位付け処理とをコンピュータに実行させ
るためのプログラムを記録したコンピュータ読取り可能
な記録媒体。 - 【請求項17】 筆記された手書き文字の筆跡パターン
を示す手書き文字情報に基づいて筆記された文字を認識
する認識処理の結果としての認識候補を受け取って、形
状が類似した類似文字群が登録された類似文字辞書記憶
手段を当該認識候補により検索することで当該認識候補
の類似文字を全て検出する照合処理と、 前記認識候補と前記検出された類似文字とを併せて全て
最終的な認識候補として出力する候補結合処理と、 前記出力された最終的な各認識候補を対象とする、前記
手書き文字情報との類似性についての評価のための詳細
識別処理を外部に要求し、その評価結果を受け取って当
該各認識候補の順位付けを行なう順位付け処理とをコン
ピュータに実行させるためのプログラムを記録したコン
ピュータ読取り可能な記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10071984A JPH11272802A (ja) | 1998-03-20 | 1998-03-20 | 文字認識装置及び方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10071984A JPH11272802A (ja) | 1998-03-20 | 1998-03-20 | 文字認識装置及び方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH11272802A true JPH11272802A (ja) | 1999-10-08 |
Family
ID=13476250
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10071984A Pending JPH11272802A (ja) | 1998-03-20 | 1998-03-20 | 文字認識装置及び方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH11272802A (ja) |
-
1998
- 1998-03-20 JP JP10071984A patent/JPH11272802A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11514698B2 (en) | Intelligent extraction of information from a document | |
| KR100249055B1 (ko) | 문자인식장치및방법 | |
| US5917941A (en) | Character segmentation technique with integrated word search for handwriting recognition | |
| EP0564827B1 (en) | A post-processing error correction scheme using a dictionary for on-line handwriting recognition | |
| KR100487386B1 (ko) | 부수 모델에 기초한 초서체 한자 수기 주석의 검색법 | |
| US20050074169A1 (en) | Holistic-analytical recognition of handwritten text | |
| JP3452774B2 (ja) | 文字認識方法 | |
| Bai et al. | Keyword spotting in document images through word shape coding | |
| EP1564675B1 (en) | Apparatus and method for searching for digital ink query | |
| KR20070110399A (ko) | 인식 그래프 | |
| JP3917349B2 (ja) | 文字認識結果を利用して情報を検索する検索装置および方法 | |
| US20030123730A1 (en) | Document recognition system and method using vertical line adjacency graphs | |
| US6320985B1 (en) | Apparatus and method for augmenting data in handwriting recognition system | |
| JPH11272802A (ja) | 文字認識装置及び方法 | |
| JP3419251B2 (ja) | 文字認識装置及び文字認識方法 | |
| JP2903779B2 (ja) | 文字列認識方法及びその装置 | |
| KR20070090188A (ko) | 수기 패턴을 인식하기 위한 방법 및 장치 | |
| JPH08512162A (ja) | 筆記体の書込み分析方法 | |
| JP3374762B2 (ja) | 文字認識方法及びその装置 | |
| Amin | Recognition of printed Arabic text using machine learning | |
| JPH09114926A (ja) | オンライン文字認識における入力文字大分類方法および装置 | |
| KR100332752B1 (ko) | 문자인식방법 | |
| JP3209197B2 (ja) | 文字認識装置及び文字認識プログラムを記録した記録媒体 | |
| JPH10198761A (ja) | 文字認識方法および文字認識装置 | |
| JPH0210473B2 (ja) |