JPH08180137A - 文字入力装置 - Google Patents
文字入力装置Info
- Publication number
- JPH08180137A JPH08180137A JP6323031A JP32303194A JPH08180137A JP H08180137 A JPH08180137 A JP H08180137A JP 6323031 A JP6323031 A JP 6323031A JP 32303194 A JP32303194 A JP 32303194A JP H08180137 A JPH08180137 A JP H08180137A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- recognition information
- information
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】日本語の一般的な傾向を利用することにより、
日本語として尤もらしい認識結果を出力し、文字認識率
を向上させることが可能な文字入力装置を提供する。 【構成】制御手段103は、記憶手段102が格納して
いるプログラムを実行することにより、座標入力手段1
01が入力した筆記データに似通っている度合いが大き
い1つ以上の文字を表す文字コードを出力し、さらに、
これら1つ以上の文字コードのうちのいずれか1つを認
識結果として出力するが、この際に、同じ字種の文字が
連続して出現することが多いという日本語の一般的な傾
向を利用して、前回認識結果として出力された文字コー
ドが表す文字の字種と同じ字種となる文字を表す文字コ
ードを、優先的に認識結果として出力する。
日本語として尤もらしい認識結果を出力し、文字認識率
を向上させることが可能な文字入力装置を提供する。 【構成】制御手段103は、記憶手段102が格納して
いるプログラムを実行することにより、座標入力手段1
01が入力した筆記データに似通っている度合いが大き
い1つ以上の文字を表す文字コードを出力し、さらに、
これら1つ以上の文字コードのうちのいずれか1つを認
識結果として出力するが、この際に、同じ字種の文字が
連続して出現することが多いという日本語の一般的な傾
向を利用して、前回認識結果として出力された文字コー
ドが表す文字の字種と同じ字種となる文字を表す文字コ
ードを、優先的に認識結果として出力する。
Description
【0001】
【産業上の利用分野】本発明は、文字入力装置に係り、
特に、手書きされた文字の筆記データを文字コードに変
換し、変換した文字コードで表される文字を表示する文
字入力装置に関する。
特に、手書きされた文字の筆記データを文字コードに変
換し、変換した文字コードで表される文字を表示する文
字入力装置に関する。
【0002】
【従来の技術】近年、コンピュータの小型化に伴い、可
搬性を重視した「ペンコンピュータ」と称される情報処
理装置が普及している。一般に、ペンコンピュータは、
持ち運ばれることを前提としているので、ペンおよびタ
ブレットを入力手段としており、操作者は、一方の手で
本体を持ち、もう一方の手でペンを持ちながらタブレッ
トに対して入力操作を行うことができる。ペンコンピュ
ータは、キーボードやマウスのように固定台を必要とし
ないので、移動中や立ったままでの操作に適している。
搬性を重視した「ペンコンピュータ」と称される情報処
理装置が普及している。一般に、ペンコンピュータは、
持ち運ばれることを前提としているので、ペンおよびタ
ブレットを入力手段としており、操作者は、一方の手で
本体を持ち、もう一方の手でペンを持ちながらタブレッ
トに対して入力操作を行うことができる。ペンコンピュ
ータは、キーボードやマウスのように固定台を必要とし
ないので、移動中や立ったままでの操作に適している。
【0003】このように、操作者は、卓上コンピュータ
において文字を入力する場合は、キーボードで文字を入
力していたが、ペンコンピュータにおいては、ペンでタ
ブレットに対して文字を手書きして入力する。
において文字を入力する場合は、キーボードで文字を入
力していたが、ペンコンピュータにおいては、ペンでタ
ブレットに対して文字を手書きして入力する。
【0004】このようにして入力された筆記データは、
文字認識処理が行われることによって、文字コードに変
換され、変換された文字コードで表される文字が表示さ
れる。
文字認識処理が行われることによって、文字コードに変
換され、変換された文字コードで表される文字が表示さ
れる。
【0005】文字認識処理とは、文字の標準的な筆記パ
ターンである標準筆記パターンおよび文字を表す文字コ
ードを文字ごとに記憶している文字認識辞書を参照する
ことにより、入力された筆記データが標準筆記パターン
に似通っている度合いを示す一致度を求め、求めた一致
度が予め決められた値より大きい標準筆記パターンに対
応する文字コードを認識結果として出力する処理である
が、操作者が意図した文字を表す文字コードが常に認識
結果として出力されるわけではない。
ターンである標準筆記パターンおよび文字を表す文字コ
ードを文字ごとに記憶している文字認識辞書を参照する
ことにより、入力された筆記データが標準筆記パターン
に似通っている度合いを示す一致度を求め、求めた一致
度が予め決められた値より大きい標準筆記パターンに対
応する文字コードを認識結果として出力する処理である
が、操作者が意図した文字を表す文字コードが常に認識
結果として出力されるわけではない。
【0006】例えば、「カ(カタカナ)」という文字と
「力(漢字)」という文字とは非常に似通っており、ま
た、「一(漢字)」という文字と「ー(長音)」という文
字とは非常に似通っているので、いずれの文字の筆記デ
ータが入力されたかを明確に区別することが困難であ
り、操作者が意図した文字を表す文字コードを認識結果
として出力することができない場合がある。このとき、
操作者は、認識結果を修正するための認識結果修正操作
を行わねばならず、操作上の負担となる。
「力(漢字)」という文字とは非常に似通っており、ま
た、「一(漢字)」という文字と「ー(長音)」という文
字とは非常に似通っているので、いずれの文字の筆記デ
ータが入力されたかを明確に区別することが困難であ
り、操作者が意図した文字を表す文字コードを認識結果
として出力することができない場合がある。このとき、
操作者は、認識結果を修正するための認識結果修正操作
を行わねばならず、操作上の負担となる。
【0007】この操作者の負担を減らすためには、文字
認識処理の文字認識率(正しい認識結果を出力できる割
合)を向上させることが重要であり、現在は、90%〜
95%の文字認識率が得られるようになっている。
認識処理の文字認識率(正しい認識結果を出力できる割
合)を向上させることが重要であり、現在は、90%〜
95%の文字認識率が得られるようになっている。
【0008】ところが、従来の文字認識処理は、1文字
ごとに、該文字の筆記データの一致度を求めるようにな
っていることから、上述した例のように似通っている文
字については、いずれの文字の筆記データが入力された
かを明確に区別することが依然として困難であった。
ごとに、該文字の筆記データの一致度を求めるようにな
っていることから、上述した例のように似通っている文
字については、いずれの文字の筆記データが入力された
かを明確に区別することが依然として困難であった。
【0009】そこで、文字認識処理に加えて、認識結果
が日本語文であることを前提にして、前後の認識結果を
参照することにより、認識結果を自動的に修正するとい
う単語処理を行うようにすることができる。
が日本語文であることを前提にして、前後の認識結果を
参照することにより、認識結果を自動的に修正するとい
う単語処理を行うようにすることができる。
【0010】単語処理は、例えば、「カ(カタカナ)」
という文字の筆記データが入力されたか「力(漢字)」
という文字の筆記データが入力されたかを区別するため
に、前の認識結果を参照し、前の認識結果が「重」とい
う文字を表す文字コードであった場合には、「重力」と
いう単語を構成する文字の筆記データが入力されたらし
いと推測し、「カ(カタカナ)」という文字を表す文字
コードより「力(漢字)」という文字を表す文字コード
を、優先的に認識結果として出力するものである。な
お、単語処理を行うためには、日本語として存在する全
ての単語ごとに、該単語を構成する文字を表す文字コー
ドを記憶している単語辞書を備えるようにする必要があ
る。
という文字の筆記データが入力されたか「力(漢字)」
という文字の筆記データが入力されたかを区別するため
に、前の認識結果を参照し、前の認識結果が「重」とい
う文字を表す文字コードであった場合には、「重力」と
いう単語を構成する文字の筆記データが入力されたらし
いと推測し、「カ(カタカナ)」という文字を表す文字
コードより「力(漢字)」という文字を表す文字コード
を、優先的に認識結果として出力するものである。な
お、単語処理を行うためには、日本語として存在する全
ての単語ごとに、該単語を構成する文字を表す文字コー
ドを記憶している単語辞書を備えるようにする必要があ
る。
【0011】また、さらに、単語同士の接続関係を示す
情報を単語辞書に加えることによって、単語同士が接続
される可能性をも調べるようにしたの日本語処理を行う
ようにすることもできる。
情報を単語辞書に加えることによって、単語同士が接続
される可能性をも調べるようにしたの日本語処理を行う
ようにすることもできる。
【0012】単語処理および日本語処理の詳細について
は、特開平1−231185号公報,特開平2−124
81号公報を参照されたい。
は、特開平1−231185号公報,特開平2−124
81号公報を参照されたい。
【0013】
【発明が解決しようとする課題】ところで、一般に、文
字認識処理は、実際には、1つの文字の筆記データにつ
いて、まず、10個程度の文字コードを認識候補として
出力し、それらのうちの1つを認識結果として出力する
ようになっている。そこで、1つの文字の筆記データに
ついて、いずれの認識候補を認識結果として出力するか
を決定するためには、全ての認識候補の組み合わせに対
して単語処理や日本語処理を行わなければならず、例え
ば、2つの文字の筆記データについては、10×10通
りの認識候補の組み合わせが生じ、3つの文字の筆記デ
ータについては、10×10×10通りの認識候補の組
み合わせが生じるので、これらの全ての認識候補の組み
合わせに対して単語処理や日本語処理を行うためには、
多大な処理時間を要し、また、ペンコンピュータのよう
な小型の情報処理装置の処理速度では、実用上困難であ
る。
字認識処理は、実際には、1つの文字の筆記データにつ
いて、まず、10個程度の文字コードを認識候補として
出力し、それらのうちの1つを認識結果として出力する
ようになっている。そこで、1つの文字の筆記データに
ついて、いずれの認識候補を認識結果として出力するか
を決定するためには、全ての認識候補の組み合わせに対
して単語処理や日本語処理を行わなければならず、例え
ば、2つの文字の筆記データについては、10×10通
りの認識候補の組み合わせが生じ、3つの文字の筆記デ
ータについては、10×10×10通りの認識候補の組
み合わせが生じるので、これらの全ての認識候補の組み
合わせに対して単語処理や日本語処理を行うためには、
多大な処理時間を要し、また、ペンコンピュータのよう
な小型の情報処理装置の処理速度では、実用上困難であ
る。
【0014】そこで、本発明の目的は、単語処理や日本
語処理を行わずに、日本語の一般的な傾向を利用するこ
とにより、日本語として尤もらしい認識結果を出力し、
文字認識率を向上させることが可能な文字入力装置を提
供することにある。
語処理を行わずに、日本語の一般的な傾向を利用するこ
とにより、日本語として尤もらしい認識結果を出力し、
文字認識率を向上させることが可能な文字入力装置を提
供することにある。
【0015】
【課題を解決するための手段】本発明で利用する日本語
の一般的な傾向としては、第1に、日本語においては、
同じ字種の文字が、いくつかの文字数分だけ連続して出
現することが多いという傾向が挙げられる。例えば、カ
タカナおよび英字は、文章中では名詞(外来語や固有名
詞等)として使用されることが多く、また、数字は、2
桁以上続くものが多い。
の一般的な傾向としては、第1に、日本語においては、
同じ字種の文字が、いくつかの文字数分だけ連続して出
現することが多いという傾向が挙げられる。例えば、カ
タカナおよび英字は、文章中では名詞(外来語や固有名
詞等)として使用されることが多く、また、数字は、2
桁以上続くものが多い。
【0016】また、本発明で利用する日本語の一般的な
傾向としては、第2に、日本語においては、数十万語の
単語が存在するが、日常生活で使用される単語は、たか
だか数百語程度であり、特定の単語が繰り返し出現する
ことが多いという傾向が挙げられる。特に、テーマが絞
られた1つの文章中では、第2の傾向は顕著である。
傾向としては、第2に、日本語においては、数十万語の
単語が存在するが、日常生活で使用される単語は、たか
だか数百語程度であり、特定の単語が繰り返し出現する
ことが多いという傾向が挙げられる。特に、テーマが絞
られた1つの文章中では、第2の傾向は顕著である。
【0017】そこで、本発明は、上記第1の傾向を利用
して、文字認識処理によって出力された文字コードのう
ち、前回認識結果として出力された文字コードで表され
る文字の字種と同じ字種となるような文字コードを、優
先的に認識結果として出力するようにしている。
して、文字認識処理によって出力された文字コードのう
ち、前回認識結果として出力された文字コードで表され
る文字の字種と同じ字種となるような文字コードを、優
先的に認識結果として出力するようにしている。
【0018】また、本発明は、上記第2の傾向を利用し
て、認識結果として出力されたことがある連続する複数
の文字コードを、1つの単語を構成する要素である複数
の文字を表す文字コードであるとみなして記憶してお
き、以降は、この記憶内容に基づいて認識結果を出力す
るようにしている。ただし、認識結果として出力された
ことがある連続する2つの文字コードの全てを記憶する
わけではなく、例えば、連続する2つの漢字,連続する
2つのカタカナ,連続する2つの英字を表す文字コード
を記憶するようにしている。
て、認識結果として出力されたことがある連続する複数
の文字コードを、1つの単語を構成する要素である複数
の文字を表す文字コードであるとみなして記憶してお
き、以降は、この記憶内容に基づいて認識結果を出力す
るようにしている。ただし、認識結果として出力された
ことがある連続する2つの文字コードの全てを記憶する
わけではなく、例えば、連続する2つの漢字,連続する
2つのカタカナ,連続する2つの英字を表す文字コード
を記憶するようにしている。
【0019】具体的には、本発明は、上記第1の傾向を
利用した文字入力装置として、(1)手書きされた文字
の筆記データを入力する手書き入力手段、(2)文字ご
とに、該文字の標準的な筆記パターンである標準筆記パ
ターン、該文字を表す文字コード、および、該文字の字
種を記憶している文字認識辞書記憶手段、(3)上記手
書き入力手段が入力した筆記データが上記標準筆記パタ
ーンに似通っている度合いを示す一致度を求め、求めた
一致度が予め決められた値より大きい標準筆記パターン
に対応する文字コードおよび字種を、求めた一致度と共
に、文字認識情報として出力する文字認識手段、(4)
上記文字認識手段が出力した文字認識情報を記憶する文
字認識情報記憶手段、(5)文字の字種ごとに、該字種
の文字の次に出現する文字が何の字種となるかの確率を
示す、予め決められた確率値を記憶している字種連接情
報記憶手段、(6)上記字種連接情報記憶手段が記憶し
ている確率値に応じて、上記文字認識情報記憶手段が記
憶している文字認識情報ごとに、該文字認識情報が示す
一致度に加算すべき加算点を計算し、該一致度と計算し
た加算点との合計値が最も大きい文字認識情報を、認識
結果として出力する加算点計算手段、(7)上記手書き
入力手段が入力した筆記データ、および、上記加算点計
算手段が認識結果として出力した文字認識情報が示す文
字コードで表される文字を表示する表示手段、を備えた
文字入力装置を提供している。
利用した文字入力装置として、(1)手書きされた文字
の筆記データを入力する手書き入力手段、(2)文字ご
とに、該文字の標準的な筆記パターンである標準筆記パ
ターン、該文字を表す文字コード、および、該文字の字
種を記憶している文字認識辞書記憶手段、(3)上記手
書き入力手段が入力した筆記データが上記標準筆記パタ
ーンに似通っている度合いを示す一致度を求め、求めた
一致度が予め決められた値より大きい標準筆記パターン
に対応する文字コードおよび字種を、求めた一致度と共
に、文字認識情報として出力する文字認識手段、(4)
上記文字認識手段が出力した文字認識情報を記憶する文
字認識情報記憶手段、(5)文字の字種ごとに、該字種
の文字の次に出現する文字が何の字種となるかの確率を
示す、予め決められた確率値を記憶している字種連接情
報記憶手段、(6)上記字種連接情報記憶手段が記憶し
ている確率値に応じて、上記文字認識情報記憶手段が記
憶している文字認識情報ごとに、該文字認識情報が示す
一致度に加算すべき加算点を計算し、該一致度と計算し
た加算点との合計値が最も大きい文字認識情報を、認識
結果として出力する加算点計算手段、(7)上記手書き
入力手段が入力した筆記データ、および、上記加算点計
算手段が認識結果として出力した文字認識情報が示す文
字コードで表される文字を表示する表示手段、を備えた
文字入力装置を提供している。
【0020】なお、上記字種連接情報記憶手段が記憶し
ている確率値は、次に出現する文字の字種が前の文字の
字種と同じ字種となる確率値が、次に出現する文字の字
種が前の文字の字種と異なる字種となる確率値より大き
くなるようになっており、上記加算点計算手段は、上記
字種連接情報記憶手段が記憶している確率値に応じて文
字認識情報についての加算点を計算する際に、該文字認
識情報が示す字種と前回認識結果として出力された文字
認識情報が示す字種とから、該文字認識情報に対応する
確率値を求め、求めた確率値が大きいほど、該文字認識
情報についての加算点が大きくなるようにすることが好
ましい。
ている確率値は、次に出現する文字の字種が前の文字の
字種と同じ字種となる確率値が、次に出現する文字の字
種が前の文字の字種と異なる字種となる確率値より大き
くなるようになっており、上記加算点計算手段は、上記
字種連接情報記憶手段が記憶している確率値に応じて文
字認識情報についての加算点を計算する際に、該文字認
識情報が示す字種と前回認識結果として出力された文字
認識情報が示す字種とから、該文字認識情報に対応する
確率値を求め、求めた確率値が大きいほど、該文字認識
情報についての加算点が大きくなるようにすることが好
ましい。
【0021】また、上記加算点計算手段が認識結果とし
て出力した文字認識情報が示す字種と同じ字種を含む文
字認識情報が、それまでにいくつだけ連続して認識結果
として出力されているかを示す連続字種数を計算する連
続字種数計算手段をさらに備えるようにすることがで
き、このようにした場合は、上記加算点計算手段は、さ
らに、上記連続字種数計算手段が計算した連続字種数が
大きいほど、前回認識結果として出力された文字認識情
報が示す字種と同じ字種を含む文字認識情報についての
加算点が小さくなるようにすることができる。
て出力した文字認識情報が示す字種と同じ字種を含む文
字認識情報が、それまでにいくつだけ連続して認識結果
として出力されているかを示す連続字種数を計算する連
続字種数計算手段をさらに備えるようにすることがで
き、このようにした場合は、上記加算点計算手段は、さ
らに、上記連続字種数計算手段が計算した連続字種数が
大きいほど、前回認識結果として出力された文字認識情
報が示す字種と同じ字種を含む文字認識情報についての
加算点が小さくなるようにすることができる。
【0022】一方、本発明は、上記第2の傾向を利用し
た文字入力装置として、(1)手書きされた文字の筆記
データを入力する手書き入力手段、(2)文字ごとに、
該文字の標準的な筆記パターンである標準筆記パター
ン、該文字を表す文字コード、および、該文字の字種を
記憶している文字認識辞書記憶手段、(3)上記手書き
入力手段が入力した筆記データが上記標準筆記パターン
に似通っている度合いを示す一致度を求め、求めた一致
度が予め決められた値より大きい標準筆記パターンに対
応する文字コードおよび字種を、求めた一致度と共に、
文字認識情報として出力する文字認識手段、(4)上記
文字認識手段が出力した文字認識情報を記憶する文字認
識情報記憶手段、(5)1つの単語を構成する要素とな
る複数の文字を表す文字コードを組にした連接文字情報
を記憶する連接文字情報記憶手段、(6)上記連接文字
情報記憶手段が記憶している連接文字情報に基づいて、
上記文字認識情報記憶手段が記憶している文字認識情報
ごとに、該文字認識情報が示す一致度に加算すべき加算
点を計算し、該一致度と計算した加算点との合計値が最
も大きい文字認識情報を、認識結果として出力する加算
点計算手段、(7)上記手書き入力手段が入力した筆記
データ、および、上記加算点計算手段が認識結果として
出力した文字認識情報が示す文字コードで表される文字
を表示する表示手段、を備えた文字入力装置を提供して
いる。
た文字入力装置として、(1)手書きされた文字の筆記
データを入力する手書き入力手段、(2)文字ごとに、
該文字の標準的な筆記パターンである標準筆記パター
ン、該文字を表す文字コード、および、該文字の字種を
記憶している文字認識辞書記憶手段、(3)上記手書き
入力手段が入力した筆記データが上記標準筆記パターン
に似通っている度合いを示す一致度を求め、求めた一致
度が予め決められた値より大きい標準筆記パターンに対
応する文字コードおよび字種を、求めた一致度と共に、
文字認識情報として出力する文字認識手段、(4)上記
文字認識手段が出力した文字認識情報を記憶する文字認
識情報記憶手段、(5)1つの単語を構成する要素とな
る複数の文字を表す文字コードを組にした連接文字情報
を記憶する連接文字情報記憶手段、(6)上記連接文字
情報記憶手段が記憶している連接文字情報に基づいて、
上記文字認識情報記憶手段が記憶している文字認識情報
ごとに、該文字認識情報が示す一致度に加算すべき加算
点を計算し、該一致度と計算した加算点との合計値が最
も大きい文字認識情報を、認識結果として出力する加算
点計算手段、(7)上記手書き入力手段が入力した筆記
データ、および、上記加算点計算手段が認識結果として
出力した文字認識情報が示す文字コードで表される文字
を表示する表示手段、を備えた文字入力装置を提供して
いる。
【0023】そして、上記連接文字情報記憶手段は、予
め決められた同じ字種を示す複数の文字認識情報が認識
結果として連続して出力されているならば、これら複数
の文字認識情報が示す文字コードで表される文字が1つ
の単語を構成する要素となる複数の文字であるとみなし
て、これら複数の文字認識情報が示す文字コードを組に
したものを、上記連接文字情報として記憶するようにし
ている。
め決められた同じ字種を示す複数の文字認識情報が認識
結果として連続して出力されているならば、これら複数
の文字認識情報が示す文字コードで表される文字が1つ
の単語を構成する要素となる複数の文字であるとみなし
て、これら複数の文字認識情報が示す文字コードを組に
したものを、上記連接文字情報として記憶するようにし
ている。
【0024】なお、上記構成に加えて、上記表示手段が
表示した文字を表す文字コードを含む文字認識情報と、
該該文字認識情報以外の他の文字認識情報とを入れ替え
る旨の指示を受付ける受付手段をさらに備えるようにし
てもよく、このようにした場合は、上記表示手段は、上
記受付手段が入れ替える旨の指示を受付けた場合に、表
示している文字を、該入れ替える旨が指示された文字認
識情報が示す文字コードで表される文字に変更して表示
するようにし、また、上記連接文字情報記憶手段は、上
記受付手段が入れ替える旨の指示を受付けた場合に、予
め決められた同じ字種を示す複数の文字認識情報が認識
結果として連続して出力されているならば、これら複数
の文字認識情報が示す文字コードで表される文字が1つ
の単語を構成する要素となる複数の文字であるとみなし
て、これら複数の文字認識情報が示す文字コードを組に
したものを、上記連接文字情報として記憶するようにす
ることができる。
表示した文字を表す文字コードを含む文字認識情報と、
該該文字認識情報以外の他の文字認識情報とを入れ替え
る旨の指示を受付ける受付手段をさらに備えるようにし
てもよく、このようにした場合は、上記表示手段は、上
記受付手段が入れ替える旨の指示を受付けた場合に、表
示している文字を、該入れ替える旨が指示された文字認
識情報が示す文字コードで表される文字に変更して表示
するようにし、また、上記連接文字情報記憶手段は、上
記受付手段が入れ替える旨の指示を受付けた場合に、予
め決められた同じ字種を示す複数の文字認識情報が認識
結果として連続して出力されているならば、これら複数
の文字認識情報が示す文字コードで表される文字が1つ
の単語を構成する要素となる複数の文字であるとみなし
て、これら複数の文字認識情報が示す文字コードを組に
したものを、上記連接文字情報として記憶するようにす
ることができる。
【0025】上記加算点計算手段は、上記連接文字情報
記憶手段が記憶している連接文字情報に基づいて文字認
識情報についての加算点を計算する際に、該文字認識情
報が示す文字コードと前回認識結果として出力された文
字認識情報が示す文字コードとを組にしたものを含む連
接文字情報が上記連接文字情報記憶手段に記憶されてい
る文字認識情報についての加算点を、予め決められた値
とするようにすることができる。
記憶手段が記憶している連接文字情報に基づいて文字認
識情報についての加算点を計算する際に、該文字認識情
報が示す文字コードと前回認識結果として出力された文
字認識情報が示す文字コードとを組にしたものを含む連
接文字情報が上記連接文字情報記憶手段に記憶されてい
る文字認識情報についての加算点を、予め決められた値
とするようにすることができる。
【0026】なお、本明細書において、「文字」という
記述には、記号を含むものとする。
記述には、記号を含むものとする。
【0027】
【作用】上述したように、一致度は、筆記データについ
て文字単位で文字認識処理を行った結果求められる値で
あり、一致度が最も大きい文字認識情報を認識結果とし
て出力すると、前後関係がいっさい参照されていない認
識結果が出力されることとなるので、区別することが困
難な文字の筆記データについて、操作者の意図通りの認
識結果が出力されない場合がある。そこで、本発明で
は、前回認識結果として出力された文字認識情報の内容
を参照することにより計算した加算点と一致度との合計
値が最も大きい文字認識情報を認識結果として出力する
ようにしている。
て文字単位で文字認識処理を行った結果求められる値で
あり、一致度が最も大きい文字認識情報を認識結果とし
て出力すると、前後関係がいっさい参照されていない認
識結果が出力されることとなるので、区別することが困
難な文字の筆記データについて、操作者の意図通りの認
識結果が出力されない場合がある。そこで、本発明で
は、前回認識結果として出力された文字認識情報の内容
を参照することにより計算した加算点と一致度との合計
値が最も大きい文字認識情報を認識結果として出力する
ようにしている。
【0028】前回認識結果として出力された文字認識情
報の内容のうち、文字認識情報についての加算点を計算
する際に参照する内容とは、上記第1の傾向を利用する
場合は字種であり、上述した第2の傾向を利用する場合
は文字コードである。
報の内容のうち、文字認識情報についての加算点を計算
する際に参照する内容とは、上記第1の傾向を利用する
場合は字種であり、上述した第2の傾向を利用する場合
は文字コードである。
【0029】詳しくは、上記第1の傾向を利用した文字
入力装置において、上記字種連接情報記憶手段が記憶し
ている確率値は、字種ごとに、該字種の文字の次に出現
する文字の字種が何であるかを統計的に調査した結果に
基づいて、予め決められた値であり、特に、次に出現す
る文字の字種が前の文字の字種と同じ字種となる確率値
が、次に出現する文字の字種が前の文字の字種と異なる
字種となる確率値より大きくなるようになっている。
入力装置において、上記字種連接情報記憶手段が記憶し
ている確率値は、字種ごとに、該字種の文字の次に出現
する文字の字種が何であるかを統計的に調査した結果に
基づいて、予め決められた値であり、特に、次に出現す
る文字の字種が前の文字の字種と同じ字種となる確率値
が、次に出現する文字の字種が前の文字の字種と異なる
字種となる確率値より大きくなるようになっている。
【0030】そこで、上記加算点計算手段が上記確率値
に応じて計算する文字認識情報についての加算点は、前
回認識結果として出力された文字認識情報が示す字種と
同じ字種を含む文字認識情報についての加算点が、前回
認識結果として出力された文字認識情報が示す字種と異
なる字種を含む文字認識情報についての加算点より大き
くなる。
に応じて計算する文字認識情報についての加算点は、前
回認識結果として出力された文字認識情報が示す字種と
同じ字種を含む文字認識情報についての加算点が、前回
認識結果として出力された文字認識情報が示す字種と異
なる字種を含む文字認識情報についての加算点より大き
くなる。
【0031】また、上記加算点計算手段は、文字認識情
報の加算点を計算すると、文字認識情報が示す一致度と
計算した加算点との合計値が最も大きい文字認識情報
を、認識結果として出力するので、前回認識結果として
出力された文字認識情報が示す字種と同じ字種を含む文
字認識情報が、優先的に認識結果として出力されること
となる。
報の加算点を計算すると、文字認識情報が示す一致度と
計算した加算点との合計値が最も大きい文字認識情報
を、認識結果として出力するので、前回認識結果として
出力された文字認識情報が示す字種と同じ字種を含む文
字認識情報が、優先的に認識結果として出力されること
となる。
【0032】従って、日本語として尤もらしい認識結果
を出力し、文字認識率を向上させることができるように
なる。
を出力し、文字認識率を向上させることができるように
なる。
【0033】また、詳しくは、上記第2の傾向を利用し
た文字入力装置において、上記連接文字情報記憶手段が
記憶している連接文字情報は、1つの単語を構成する要
素となる複数の文字を表す文字コードを組にしたもので
ある。
た文字入力装置において、上記連接文字情報記憶手段が
記憶している連接文字情報は、1つの単語を構成する要
素となる複数の文字を表す文字コードを組にしたもので
ある。
【0034】そこで、上記加算点計算手段が上記連接文
字情報に基づいて計算する文字認識情報についての加算
点は、該文字認識情報が示す文字コードと前回認識結果
として出力された文字認識情報が示す文字コードとを組
にしたものを含む連接文字情報が上記連接文字情報記憶
手段に記憶されている文字認識情報についての加算点の
みが、予め決められた値となる。
字情報に基づいて計算する文字認識情報についての加算
点は、該文字認識情報が示す文字コードと前回認識結果
として出力された文字認識情報が示す文字コードとを組
にしたものを含む連接文字情報が上記連接文字情報記憶
手段に記憶されている文字認識情報についての加算点の
みが、予め決められた値となる。
【0035】また、上記加算点計算手段は、文字認識情
報についての加算点を計算すると、文字認識情報が示す
一致度と計算した加算点との合計値が最も大きい文字認
識情報を、認識結果として出力し、上記連接文字情報記
憶手段は、予め決められた同じ字種(例えば、カタカ
ナ,漢字,英字)を示す複数の文字認識情報が認識結果
として連続して出力されているならば、これら複数の文
字認識情報が示す文字コードで表される文字が1つの単
語を構成する要素となる複数の文字であるとみなして、
これら複数の文字認識情報が示す文字コードを組にした
ものを、上記連接文字情報として記憶するので、1度で
も認識結果として出力されたことがある、同じ字種を含
む連続する複数の文字認識情報は、以降は、優先的に認
識結果として出力されることとなる。
報についての加算点を計算すると、文字認識情報が示す
一致度と計算した加算点との合計値が最も大きい文字認
識情報を、認識結果として出力し、上記連接文字情報記
憶手段は、予め決められた同じ字種(例えば、カタカ
ナ,漢字,英字)を示す複数の文字認識情報が認識結果
として連続して出力されているならば、これら複数の文
字認識情報が示す文字コードで表される文字が1つの単
語を構成する要素となる複数の文字であるとみなして、
これら複数の文字認識情報が示す文字コードを組にした
ものを、上記連接文字情報として記憶するので、1度で
も認識結果として出力されたことがある、同じ字種を含
む連続する複数の文字認識情報は、以降は、優先的に認
識結果として出力されることとなる。
【0036】従って、単語として学習するのと同様の効
果が得られるので、単語処理や日本語処理を行わなくて
も、日本語として尤もらしい認識結果を出力し、文字認
識率を向上させることができるようになる。さらに、単
語処理や日本語処理を行わないことから、高速に認識結
果を出力することができるようになる。
果が得られるので、単語処理や日本語処理を行わなくて
も、日本語として尤もらしい認識結果を出力し、文字認
識率を向上させることができるようになる。さらに、単
語処理や日本語処理を行わないことから、高速に認識結
果を出力することができるようになる。
【0037】
【実施例】以下、本発明の実施例について図面を参照し
て説明する。
て説明する。
【0038】図1は本実施例の文字入力装置の機能ブロ
ック図である。
ック図である。
【0039】図1において、101は座標入力手段、1
02は記憶手段、103は制御手段、104は表示手
段、105は外部記憶手段、106は電源、107は電
源スイッチである。
02は記憶手段、103は制御手段、104は表示手
段、105は外部記憶手段、106は電源、107は電
源スイッチである。
【0040】座標入力手段101は、具体的には、手書
きされた筆記データをオンラインで入力するタブレット
や、手書きされている筆記データをオフラインで入力す
るスキャナーであり、本実施例では、座標入力手段10
1がタブレットである場合について説明する。
きされた筆記データをオンラインで入力するタブレット
や、手書きされている筆記データをオフラインで入力す
るスキャナーであり、本実施例では、座標入力手段10
1がタブレットである場合について説明する。
【0041】記憶手段102は、具体的には、主メモリ
であり、各種プログラムおよび文字認識辞書等を格納し
ている。また、制御手段103は、具体的には、CPU
であり、記憶手段102に格納されている各種プログラ
ムを実行する。
であり、各種プログラムおよび文字認識辞書等を格納し
ている。また、制御手段103は、具体的には、CPU
であり、記憶手段102に格納されている各種プログラ
ムを実行する。
【0042】表示手段104は、具体的には、液晶表示
装置やCRTであり、座標入力手段101が入力した筆
記データや制御手段103による各種プログラムの実行
結果を表示する。本実施例では、表示手段104が液晶
表示装置である場合について説明する。
装置やCRTであり、座標入力手段101が入力した筆
記データや制御手段103による各種プログラムの実行
結果を表示する。本実施例では、表示手段104が液晶
表示装置である場合について説明する。
【0043】外部記憶手段105は、具体的には、フロ
ッピィディスクやICカードである。また、電源106
は、これらの手段に電流を供給し、電源スイッチ107
は、電源106による電流供給の入/切を操作者が指示
するためものである。
ッピィディスクやICカードである。また、電源106
は、これらの手段に電流を供給し、電源スイッチ107
は、電源106による電流供給の入/切を操作者が指示
するためものである。
【0044】図2は本実施例の文字入力装置の外観図で
ある。
ある。
【0045】図2に示すように、本実施例の文字入力装
置は、大別して、本体201と付属のペン202とから
構成されている。本体201は、記憶手段102,制御
手段103,電源106を内蔵しており、また、電源ス
イッチ107,透明なタブレットの下に液晶表示装置を
配置した表示一体型タブレット203,外部記憶手段1
05の挿入口204を備えている。
置は、大別して、本体201と付属のペン202とから
構成されている。本体201は、記憶手段102,制御
手段103,電源106を内蔵しており、また、電源ス
イッチ107,透明なタブレットの下に液晶表示装置を
配置した表示一体型タブレット203,外部記憶手段1
05の挿入口204を備えている。
【0046】操作者が表示一体型タブレット203上を
ペン202で触れると、ペン202で触れられた位置
は、タブレットによってその座標データが検知され、検
知された座標データは、制御手段103に出力される。
これにより、操作者は、キーボードを用いずに、ペン2
02で、筆記データを手書きしたり各種指示を行うこと
ができる。
ペン202で触れると、ペン202で触れられた位置
は、タブレットによってその座標データが検知され、検
知された座標データは、制御手段103に出力される。
これにより、操作者は、キーボードを用いずに、ペン2
02で、筆記データを手書きしたり各種指示を行うこと
ができる。
【0047】次に、本実施例の文字入力装置における操
作者の操作の流れについて、図3〜図10を用いて説明
する。
作者の操作の流れについて、図3〜図10を用いて説明
する。
【0048】図3は電源スイッチ107が投入された直
後の表示一体型タブレット203の画面表示例を示して
いる。
後の表示一体型タブレット203の画面表示例を示して
いる。
【0049】図3に示すように、表示一体型タブレット
203には、文字(文字コードで表される文字)を表示
する本文領域301と、次の文字の表示位置を示すカー
ソル302と、操作者が文字の筆記データを手書きする
文字枠303と、手書きされた筆記データについて文字
認識処理を行う旨を指示する認識ボタン304と、文字
認識処理によって出力された全ての認識候補の文字(文
字コードで表される文字)を表示する認識候補枠305
と、認識結果の文字(文字コードで表される文字)を本
文領域301に表示する旨を指示する確定ボタン306
とが表示されている。
203には、文字(文字コードで表される文字)を表示
する本文領域301と、次の文字の表示位置を示すカー
ソル302と、操作者が文字の筆記データを手書きする
文字枠303と、手書きされた筆記データについて文字
認識処理を行う旨を指示する認識ボタン304と、文字
認識処理によって出力された全ての認識候補の文字(文
字コードで表される文字)を表示する認識候補枠305
と、認識結果の文字(文字コードで表される文字)を本
文領域301に表示する旨を指示する確定ボタン306
とが表示されている。
【0050】操作者は、文字入力を行う場合に、まず、
図4に示すように、文字枠303にペン202で文字の
筆記データを手書きする。これにより、タブレットによ
って該筆記データの座標データが検知され、検知された
座標データに対応する液晶表示板の画素が反転表示され
て、該筆記データの筆跡が文字枠303内に表示され
る。なお、ここでは、操作者は、「日」という文字を意
図した筆記データを手書きしている。
図4に示すように、文字枠303にペン202で文字の
筆記データを手書きする。これにより、タブレットによ
って該筆記データの座標データが検知され、検知された
座標データに対応する液晶表示板の画素が反転表示され
て、該筆記データの筆跡が文字枠303内に表示され
る。なお、ここでは、操作者は、「日」という文字を意
図した筆記データを手書きしている。
【0051】続いて、操作者は、図5に示すように、認
識ボタン304をペン202で触れることにより、該筆
記データについて文字認識処理を行う旨を指示する。こ
れにより、該筆記データについての文字認識処理が行わ
れて、1つ以上の認識候補が出力され、これらの認識候
補のうちの第1の認識候補の文字が、認識結果の文字と
して、該筆記データの代わりに文字枠303に表示され
る。ここでは、操作者の意図通りの文字(「日」)が文
字枠303に表示されている。なお、1つ以上の認識候
補のうちのいずれを第1の認識候補として決定するかに
ついては後述する。
識ボタン304をペン202で触れることにより、該筆
記データについて文字認識処理を行う旨を指示する。こ
れにより、該筆記データについての文字認識処理が行わ
れて、1つ以上の認識候補が出力され、これらの認識候
補のうちの第1の認識候補の文字が、認識結果の文字と
して、該筆記データの代わりに文字枠303に表示され
る。ここでは、操作者の意図通りの文字(「日」)が文
字枠303に表示されている。なお、1つ以上の認識候
補のうちのいずれを第1の認識候補として決定するかに
ついては後述する。
【0052】続いて、操作者は、上述した操作と同様
に、図6に示すように、文字枠303にペン202で文
字の筆記データを手書きし、認識ボタン304をペン2
02で触れることにより、該データについて文字認識処
理を行う旨を指示する。なお、ここでは、操作者は、
「立」という文字を意図した筆記データを手書きしてい
る。
に、図6に示すように、文字枠303にペン202で文
字の筆記データを手書きし、認識ボタン304をペン2
02で触れることにより、該データについて文字認識処
理を行う旨を指示する。なお、ここでは、操作者は、
「立」という文字を意図した筆記データを手書きしてい
る。
【0053】これにより、該筆記データについての文字
認識処理が行われて、1つ以上の認識候補が出力され、
これらの認識候補のうちの第1の認識候補の文字が、認
識結果の文字として、該筆記データの代わりに文字枠3
03に表示されるが、ここで、例えば、図7に示すよう
に、操作者の意図通りの文字(「日」)とな異なる文字
(「主」)が文字枠303に表示されてしまった場合
に、操作者は、第1の認識候補(認識結果)以外の他の
認識候補のうちの所望の認識候補を第1の認識候補に修
正するための認識結果修正操作を行う。
認識処理が行われて、1つ以上の認識候補が出力され、
これらの認識候補のうちの第1の認識候補の文字が、認
識結果の文字として、該筆記データの代わりに文字枠3
03に表示されるが、ここで、例えば、図7に示すよう
に、操作者の意図通りの文字(「日」)とな異なる文字
(「主」)が文字枠303に表示されてしまった場合
に、操作者は、第1の認識候補(認識結果)以外の他の
認識候補のうちの所望の認識候補を第1の認識候補に修
正するための認識結果修正操作を行う。
【0054】すなわち、操作者は、図8に示すように、
文字枠303に表示されている認識結果の文字
(「主」)をペン202で触れることにより、該文字認
識結果を第1の認識候補とする全ての認識候補の文字を
認識候補枠305に表示する旨を指示する。これによ
り、第1の認識候補を含む全ての認識候補の文字(ここ
では、「主」,「立」,「安」,「広」,「皿」)が認
識候補枠305に表示されるので、操作者は、これらの
文字のうちの意図通りの文字(「立」)をペン202で
触れることにより、該文字の認識候補を第1の認識候補
に修正する旨を指示する。これにより、操作者が修正す
る旨を指示した文字(「立」)の認識候補が第1の認識
候補に修正され、図9に示すように、修正後の第1の認
識候補の文字(「立」)が、修正前の第1の認識候補の
文字(「主」)に代わって文字枠303に表示される。
文字枠303に表示されている認識結果の文字
(「主」)をペン202で触れることにより、該文字認
識結果を第1の認識候補とする全ての認識候補の文字を
認識候補枠305に表示する旨を指示する。これによ
り、第1の認識候補を含む全ての認識候補の文字(ここ
では、「主」,「立」,「安」,「広」,「皿」)が認
識候補枠305に表示されるので、操作者は、これらの
文字のうちの意図通りの文字(「立」)をペン202で
触れることにより、該文字の認識候補を第1の認識候補
に修正する旨を指示する。これにより、操作者が修正す
る旨を指示した文字(「立」)の認識候補が第1の認識
候補に修正され、図9に示すように、修正後の第1の認
識候補の文字(「立」)が、修正前の第1の認識候補の
文字(「主」)に代わって文字枠303に表示される。
【0055】操作者は、認識結果修正操作を終了する
と、図10に示すように、確定ボタン306をペン20
2で触れることにより、文字枠303に表示されている
認識結果の文字を本文領域301に表示する旨を指示す
る。これにより、文字枠303に表示されている認識結
果の文字(「日」,「立」)が、本文領域301に表示
される。
と、図10に示すように、確定ボタン306をペン20
2で触れることにより、文字枠303に表示されている
認識結果の文字を本文領域301に表示する旨を指示す
る。これにより、文字枠303に表示されている認識結
果の文字(「日」,「立」)が、本文領域301に表示
される。
【0056】さて、本実施例の文字入力装置は、文字認
識処理によって出力された1つ以上の認識候補のうちの
から第1の認識候補(認識結果)を決定する際に、従来
のような単語処理や日本語処理を行わずに、日本語の一
般的な傾向を利用することにより、日本語として尤もら
しい認識結果を出力し、文字認識率を向上させることを
可能としたものである。
識処理によって出力された1つ以上の認識候補のうちの
から第1の認識候補(認識結果)を決定する際に、従来
のような単語処理や日本語処理を行わずに、日本語の一
般的な傾向を利用することにより、日本語として尤もら
しい認識結果を出力し、文字認識率を向上させることを
可能としたものである。
【0057】本実施例で利用する日本語の一般的な傾向
としては、第1に、日本語において、カタカナおよび英
字は、文章中では名詞(外来語や固有名詞等)として使
用されることが多く、従って、いくつかの文字数分だけ
連続して出現することが多いという傾向が挙げられる。
また、日本語において、数字は、2桁以上続くものが多
く、従って、いくつかの文字数分だけ連続して出現する
ことが多いという傾向が挙げられる。
としては、第1に、日本語において、カタカナおよび英
字は、文章中では名詞(外来語や固有名詞等)として使
用されることが多く、従って、いくつかの文字数分だけ
連続して出現することが多いという傾向が挙げられる。
また、日本語において、数字は、2桁以上続くものが多
く、従って、いくつかの文字数分だけ連続して出現する
ことが多いという傾向が挙げられる。
【0058】この第1の傾向を利用すると、例えば、筆
記データの手書きの仕方によっては、操作者が「シ(カ
タカナ)」,「ス(カタカナ)」,「テ(カタカ
ナ)」,「ム(カタカナ)」という文字を意図していた
のに、「シ」,「又(漢字)」,「千(漢字)」,
「ム」という認識結果の文字が表示されてしまったり、
操作者が「P(英字)」,「O(英字)」,「T(英
字)」,「A(英字)」,「T(英字)」,「O(英
字)」という文字を意図していたのに、「P」,「0
(数字)」,「丁(漢字)」,「A」,「丁(漢
字)」,「0(数字)」という認識結果の文字が表示さ
れてしまうことを防止することができる。
記データの手書きの仕方によっては、操作者が「シ(カ
タカナ)」,「ス(カタカナ)」,「テ(カタカ
ナ)」,「ム(カタカナ)」という文字を意図していた
のに、「シ」,「又(漢字)」,「千(漢字)」,
「ム」という認識結果の文字が表示されてしまったり、
操作者が「P(英字)」,「O(英字)」,「T(英
字)」,「A(英字)」,「T(英字)」,「O(英
字)」という文字を意図していたのに、「P」,「0
(数字)」,「丁(漢字)」,「A」,「丁(漢
字)」,「0(数字)」という認識結果の文字が表示さ
れてしまうことを防止することができる。
【0059】そこで、この第1の傾向を利用するための
機能として、本実施例では、前の認識結果の文字の字種
を引き継ぐような認識候補を第1の認識候補(認識結
果)として決定する機能を設けるようにしている。以
下、この機能を字種継承機能と称する。
機能として、本実施例では、前の認識結果の文字の字種
を引き継ぐような認識候補を第1の認識候補(認識結
果)として決定する機能を設けるようにしている。以
下、この機能を字種継承機能と称する。
【0060】また、本実施例で利用する日本語の一般的
な傾向としては、第2に、日本語においては、数十万語
の単語が存在するが、日常生活で使用する単語はたかだ
か数百語程度であり、特定の単語が繰り返し出現するこ
とが多いという傾向が挙げられる。
な傾向としては、第2に、日本語においては、数十万語
の単語が存在するが、日常生活で使用する単語はたかだ
か数百語程度であり、特定の単語が繰り返し出現するこ
とが多いという傾向が挙げられる。
【0061】そこで、この第2の傾向を利用するための
機能として、本実施例では、1度入力された単語を学習
しておき、以降は、学習内容に基づいて認識結果(第1
の認識候補)を決定する機能を設けるようにしている。
ただし、本実施例では、従来のように単語辞書を参照せ
ずに、連続する2つの漢字,連続する2つのカタカナ,
連続する2つの英字を、1つの単語を構成する要素とみ
なして、学習するようにする。以下、この機能を連接学
習機能と称する。
機能として、本実施例では、1度入力された単語を学習
しておき、以降は、学習内容に基づいて認識結果(第1
の認識候補)を決定する機能を設けるようにしている。
ただし、本実施例では、従来のように単語辞書を参照せ
ずに、連続する2つの漢字,連続する2つのカタカナ,
連続する2つの英字を、1つの単語を構成する要素とみ
なして、学習するようにする。以下、この機能を連接学
習機能と称する。
【0062】なお、本実施例では、字種継承機能および
連接学習機能の2つの機能を設けるようにして説明して
いるが、いずれか一方のみを設けるようにすることも容
易にできることはいうまでもない。
連接学習機能の2つの機能を設けるようにして説明して
いるが、いずれか一方のみを設けるようにすることも容
易にできることはいうまでもない。
【0063】本実施例の文字入力装置において、文字認
識処理、および、字種継承機能および連接学習機能を実
現するための処理は、具体的には、制御手段103が、
記憶手段102に格納されている各種プログラムを実行
することにより実現することができる。また、記憶手段
102には、各種プログラムが使用する各種データ(文
字認識辞書を含む。)も格納される。
識処理、および、字種継承機能および連接学習機能を実
現するための処理は、具体的には、制御手段103が、
記憶手段102に格納されている各種プログラムを実行
することにより実現することができる。また、記憶手段
102には、各種プログラムが使用する各種データ(文
字認識辞書を含む。)も格納される。
【0064】図11は記憶手段102の内容を模式的に
示す図である。
示す図である。
【0065】図11に示すように、記憶手段102は、
各種プログラム領域1101と、認識候補データ領域1
102と、連接頻度データ領域1103と、減衰パラメ
ータデータ領域1104と、字種継承文字数領域110
5と、連接記憶データ領域1106と、座標データ領域
1107と、本文データ領域1108とから構成されて
いる。
各種プログラム領域1101と、認識候補データ領域1
102と、連接頻度データ領域1103と、減衰パラメ
ータデータ領域1104と、字種継承文字数領域110
5と、連接記憶データ領域1106と、座標データ領域
1107と、本文データ領域1108とから構成されて
いる。
【0066】各種プログラム領域1101は、文字認識
処理を行う文字認識処理プログラム,後述するメイン処
理プログラム,後述する連接学習処理プログラム,後述
する加算点計算処理プログラムを含む各種プログラムが
格納される領域である。
処理を行う文字認識処理プログラム,後述するメイン処
理プログラム,後述する連接学習処理プログラム,後述
する加算点計算処理プログラムを含む各種プログラムが
格納される領域である。
【0067】認識候補データ領域1102は、文字認識
処理によって出力された認識候補が格納される領域であ
り、この詳細については後述する。
処理によって出力された認識候補が格納される領域であ
り、この詳細については後述する。
【0068】連接頻度データ領域1103,減衰パラメ
ータデータ領域1104,字種継承文字数領域1105
は、字種継承機能を実現するために必要なデータが格納
される領域であり、これらの詳細については後述する。
ータデータ領域1104,字種継承文字数領域1105
は、字種継承機能を実現するために必要なデータが格納
される領域であり、これらの詳細については後述する。
【0069】連接記憶データ領域1106は、連接学習
機能を実現するために必要なデータが格納される領域で
あり、この詳細については後述する。
機能を実現するために必要なデータが格納される領域で
あり、この詳細については後述する。
【0070】座標データ領域1107は、手書きされた
筆記データの座標データが格納される領域であり、本文
データ領域1108は、本文領域301に表示されてい
る文字の文字コードが格納される領域である。
筆記データの座標データが格納される領域であり、本文
データ領域1108は、本文領域301に表示されてい
る文字の文字コードが格納される領域である。
【0071】なお、これらの領域1101〜1108
は、必要に応じて、一部または全部が独立した個々のメ
モリで実現するようにすることもできる。
は、必要に応じて、一部または全部が独立した個々のメ
モリで実現するようにすることもできる。
【0072】図12は認識候補データ領域1102の内
容を模式的に示す図であり、図7に示した画面表示とな
っている状態での内容を示している。
容を模式的に示す図であり、図7に示した画面表示とな
っている状態での内容を示している。
【0073】図12において、1201は1つ目の文字
枠303に手書きされた筆記データについての認識候補
が格納される認識候補記憶領域、1202は2つ目の文
字枠303に手書きされた筆記データについての認識候
補が格納される認識候補記憶領域であり、認識候補デー
タ領域1104には、少なくとも文字枠303の数分だ
けの認識候補記憶領域が設けられている。
枠303に手書きされた筆記データについての認識候補
が格納される認識候補記憶領域、1202は2つ目の文
字枠303に手書きされた筆記データについての認識候
補が格納される認識候補記憶領域であり、認識候補デー
タ領域1104には、少なくとも文字枠303の数分だ
けの認識候補記憶領域が設けられている。
【0074】認識候補記憶領域は、全ての認識候補のそ
れぞれについて、該認識候補の文字コードが格納される
文字コードフィールド1203と、該認識候補の文字の
字種が格納される字種フィールド1204と、該認識候
補の一致度が格納される一致度フィールド1205と、
字種継承機能または連接学習機能の出力結果である加算
点が格納される加算点フィールド1206とから構成さ
れている。
れぞれについて、該認識候補の文字コードが格納される
文字コードフィールド1203と、該認識候補の文字の
字種が格納される字種フィールド1204と、該認識候
補の一致度が格納される一致度フィールド1205と、
字種継承機能または連接学習機能の出力結果である加算
点が格納される加算点フィールド1206とから構成さ
れている。
【0075】例えば、認識候補記憶領域1201におい
て、文字コードフィールド1203には、「日」,
「月」,「円」,「目」,「白」とう5つの文字の認識
候補の文字コードが格納されており、字種フィールド1
204には、それぞれの文字が漢字である旨を示す
「漢」が格納されている。
て、文字コードフィールド1203には、「日」,
「月」,「円」,「目」,「白」とう5つの文字の認識
候補の文字コードが格納されており、字種フィールド1
204には、それぞれの文字が漢字である旨を示す
「漢」が格納されている。
【0076】なお、文字認識処理においては、文字ごと
に、標準的な筆記データである標準筆記パターンとそれ
に対応する文字コードとが格納されている文字認識辞書
を参照することにより、認識候補を出力するようになっ
ている。すなわち、手書きされた筆記データと文字認識
辞書中の標準筆記パターンとを照合して、両者の形が似
通っている度合いを示す値(ここでは、値が大きいほど
似通っている度合いが高いとものとする。)を一致度と
して求め、求めた一致度が予め決められた閾値より大き
い場合に、該標準筆記パターンに対応する文字コード
を、求めた一致度と共に、認識候補として出力するよう
になっている。そこで、出力された認識候補の文字コー
ドが、文字コードフィールド1203に格納され、ま
た、該認識候補の一致度が、一致度フィールド1205
に格納されることとなる。
に、標準的な筆記データである標準筆記パターンとそれ
に対応する文字コードとが格納されている文字認識辞書
を参照することにより、認識候補を出力するようになっ
ている。すなわち、手書きされた筆記データと文字認識
辞書中の標準筆記パターンとを照合して、両者の形が似
通っている度合いを示す値(ここでは、値が大きいほど
似通っている度合いが高いとものとする。)を一致度と
して求め、求めた一致度が予め決められた閾値より大き
い場合に、該標準筆記パターンに対応する文字コード
を、求めた一致度と共に、認識候補として出力するよう
になっている。そこで、出力された認識候補の文字コー
ドが、文字コードフィールド1203に格納され、ま
た、該認識候補の一致度が、一致度フィールド1205
に格納されることとなる。
【0077】本実施例では、文字認識辞書中に、さら
に、文字の字種(ひらがな,カタカナ,漢字,数字,英
字,記号)が格納されるようにしており、文字認識処理
が、文字コードおよび一致度と共に、字種も出力するよ
うにしている。そこで、出力された認識候補の字種が、
字種フィールド1204に格納されることとなる。
に、文字の字種(ひらがな,カタカナ,漢字,数字,英
字,記号)が格納されるようにしており、文字認識処理
が、文字コードおよび一致度と共に、字種も出力するよ
うにしている。そこで、出力された認識候補の字種が、
字種フィールド1204に格納されることとなる。
【0078】ところで、従来の文字認識処理において
は、一致度が最も大きい認識候補が第1の認識候補とし
て決定され、優先的に認識結果として出力されるように
なっていた。しかし、この一致度は、筆記データと標準
筆記パターンとを文字単位で照合した結果に基づいて求
められた値であるので、前後関係がいっさい参照されて
いない認識結果が出力されることとなっていた。このた
め、上述したように、「シ」,「ス」,「テ」,「ム」
という文字の認識結果や「P」,「O」,「T」,
「A」,「T」,「O」という文字の認識結果が意図通
り得られない場合がある。
は、一致度が最も大きい認識候補が第1の認識候補とし
て決定され、優先的に認識結果として出力されるように
なっていた。しかし、この一致度は、筆記データと標準
筆記パターンとを文字単位で照合した結果に基づいて求
められた値であるので、前後関係がいっさい参照されて
いない認識結果が出力されることとなっていた。このた
め、上述したように、「シ」,「ス」,「テ」,「ム」
という文字の認識結果や「P」,「O」,「T」,
「A」,「T」,「O」という文字の認識結果が意図通
り得られない場合がある。
【0079】そこで、本実施例では、前の文字の認識結
果を参照することにより、認識候補ごとの加算点を計算
し、計算した加算点を加算点フィールド1206に格納
するようにしている。そして、1つ以上の認識候補のう
ちから第1の認識候補を決定する際に、一致度フィール
ド1205に格納されている一致度と加算点フィールド
1206に格納されている加算点とを合計した値(以
下、優先度と称す。)が最も大きい認識候補を第1の認
識候補として決定するようにしている。なお、加算点を
計算する加算点計算処理の詳細については後述する。
果を参照することにより、認識候補ごとの加算点を計算
し、計算した加算点を加算点フィールド1206に格納
するようにしている。そして、1つ以上の認識候補のう
ちから第1の認識候補を決定する際に、一致度フィール
ド1205に格納されている一致度と加算点フィールド
1206に格納されている加算点とを合計した値(以
下、優先度と称す。)が最も大きい認識候補を第1の認
識候補として決定するようにしている。なお、加算点を
計算する加算点計算処理の詳細については後述する。
【0080】図13は連接頻度データ領域1103の内
容を模式的に示す図である。
容を模式的に示す図である。
【0081】連接頻度データ領域1103には、字種ご
とに、該字種の文字の次に出現する文字の字種が何であ
るかを統計的に調査した結果に基づいて予め決められた
値が格納されている。
とに、該字種の文字の次に出現する文字の字種が何であ
るかを統計的に調査した結果に基づいて予め決められた
値が格納されている。
【0082】図13において、iは前の文字の字種を示
し、jはその次の文字の字種を示している。i行j列は
字種iの次に字種jが出現する確率Pijを示している。
例えば、前の文字がカタカナである場合に、次の文字が
カタカナである確率は、70%であることを示してい
る。
し、jはその次の文字の字種を示している。i行j列は
字種iの次に字種jが出現する確率Pijを示している。
例えば、前の文字がカタカナである場合に、次の文字が
カタカナである確率は、70%であることを示してい
る。
【0083】図14は減衰パラメータデータ領域110
4の内容を模式的に示す図である。
4の内容を模式的に示す図である。
【0084】カタカナ,英字,数字は、上述したように
連続して出現することが多いという傾向があるが、連続
する文字数は有限である。そこで、本実施例では、字種
継承機能が、同じ字種の文字が連続するごとに、徐々に
その機能を減衰していくようになっており、減衰パラメ
ータデータ領域1104には、そのための減衰率が格納
されている。
連続して出現することが多いという傾向があるが、連続
する文字数は有限である。そこで、本実施例では、字種
継承機能が、同じ字種の文字が連続するごとに、徐々に
その機能を減衰していくようになっており、減衰パラメ
ータデータ領域1104には、そのための減衰率が格納
されている。
【0085】同じ字種の文字が連続する文字数の平均は
字種ごとに異なるので、減衰率は、字種ごとに、該字種
の文字が連続する文字数を統計的に調査した結果に基づ
いて予め決められた値となっている。
字種ごとに異なるので、減衰率は、字種ごとに、該字種
の文字が連続する文字数を統計的に調査した結果に基づ
いて予め決められた値となっている。
【0086】図15は継承文字数領域1105の内容を
模式的に示す図である。
模式的に示す図である。
【0087】継承文字数領域1105には、減衰パラメ
ータデータ領域1104に格納されている減衰率と共
に、字種継承機能を減衰するために使用される継承文字
数が格納される。継承文字数は、第1の認識候補として
決定した認識候補の文字の字種が、それまでに何文字分
だけ連続して同じ字種であったかを示す値である。例え
ば、図9に示したように、操作者が認識結果修正操作を
行った後の画面表示となっている状態では、継承文字数
領域1105には、「2」が格納されることとなる。
ータデータ領域1104に格納されている減衰率と共
に、字種継承機能を減衰するために使用される継承文字
数が格納される。継承文字数は、第1の認識候補として
決定した認識候補の文字の字種が、それまでに何文字分
だけ連続して同じ字種であったかを示す値である。例え
ば、図9に示したように、操作者が認識結果修正操作を
行った後の画面表示となっている状態では、継承文字数
領域1105には、「2」が格納されることとなる。
【0088】図16は連接記憶データ領域1106の内
容を模式的に示す図である。
容を模式的に示す図である。
【0089】連接記憶データ領域1106には、操作者
が認識結果修正操作を行った場合に、修正する旨が指示
された文字の文字コードと1つ前の文字の文字コードと
を組にしたもの(以下、連接文字コード組と称す。)が
格納される。例えば、図9に示したように、操作者が認
識結果修正操作を行った後の画面表示となっている状態
では、連接記憶データ領域1106には、「日」という
文字の文字コードと「立」という文字の文字コードとを
組にした連接文字コード組が格納されることとなる。
が認識結果修正操作を行った場合に、修正する旨が指示
された文字の文字コードと1つ前の文字の文字コードと
を組にしたもの(以下、連接文字コード組と称す。)が
格納される。例えば、図9に示したように、操作者が認
識結果修正操作を行った後の画面表示となっている状態
では、連接記憶データ領域1106には、「日」という
文字の文字コードと「立」という文字の文字コードとを
組にした連接文字コード組が格納されることとなる。
【0090】ただし、連接記憶データ領域1106に
は、操作者が修正する旨を指示した文字の字種と1つ前
の文字(文字枠303に表示されている文字)の字種と
が同じ場合であり、かつ、その字種が漢字,カタカナ,
英字のうちのいずれかであった場合に限り、その内容が
格納される。
は、操作者が修正する旨を指示した文字の字種と1つ前
の文字(文字枠303に表示されている文字)の字種と
が同じ場合であり、かつ、その字種が漢字,カタカナ,
英字のうちのいずれかであった場合に限り、その内容が
格納される。
【0091】漢字,カタカナ,英字は、単語として繰り
返し入力されることが多いので、1度入力された連続す
る2つの漢字,連続する2つのカタカナ,連続する2つ
の英字を、1つの単語を構成する要素とみなして、それ
らの文字コードを組にした連接文字コード組を連接記憶
データ領域1106に格納しておき、以降は、連接記憶
データ領域1106に連接文字コード組として格納され
ている文字コードの認識候補を優先的に第1の認識候補
として決定することにより、単語処理や日本語処理を行
わなくても、日本語として尤もらしい認識結果を出力
し、文字認識率を高めることができる。また、単語処理
や日本語処理を行わないことから、高速に認識結果を出
力することができるようになる。
返し入力されることが多いので、1度入力された連続す
る2つの漢字,連続する2つのカタカナ,連続する2つ
の英字を、1つの単語を構成する要素とみなして、それ
らの文字コードを組にした連接文字コード組を連接記憶
データ領域1106に格納しておき、以降は、連接記憶
データ領域1106に連接文字コード組として格納され
ている文字コードの認識候補を優先的に第1の認識候補
として決定することにより、単語処理や日本語処理を行
わなくても、日本語として尤もらしい認識結果を出力
し、文字認識率を高めることができる。また、単語処理
や日本語処理を行わないことから、高速に認識結果を出
力することができるようになる。
【0092】次に、本実施例の文字入力装置において、
字種継承機能および連接学習機能を実現するための処理
について、図17〜図22を用いて説明する。
字種継承機能および連接学習機能を実現するための処理
について、図17〜図22を用いて説明する。
【0093】図17はメイン処理プログラムのフローチ
ャートである。
ャートである。
【0094】メイン処理プログラムは、電源スイッチ1
07が投入されると起動され、まず、ハードウェア的な
初期化処理を行う(ステップ1701)。続いて、タブ
レットが座標データを検知したか否かを判定し(ステッ
プ1702)、座標データを検知したと判定した場合
は、該座標データが、文字枠303内にあるか(ステッ
プ1703)、認識ボタン304内にあるか(ステップ
1704)、確定ボタン306内にあるか(ステップ1
705)、認識候補枠305内にあるか(ステップ17
06)を調べる。
07が投入されると起動され、まず、ハードウェア的な
初期化処理を行う(ステップ1701)。続いて、タブ
レットが座標データを検知したか否かを判定し(ステッ
プ1702)、座標データを検知したと判定した場合
は、該座標データが、文字枠303内にあるか(ステッ
プ1703)、認識ボタン304内にあるか(ステップ
1704)、確定ボタン306内にあるか(ステップ1
705)、認識候補枠305内にあるか(ステップ17
06)を調べる。
【0095】タブレットが検知した座標データが文字枠
303内にある場合は(ステップ1703)、文字枠3
03に筆記データが手書きされた場合(図4に示した画
面表示となっている状態)、および、文字枠303に表
示されている文字が触れられた場合と(図8に示した画
面表示となっている状態)の2つの場合が考えられるの
で、文字枠303に文字が表示されているか否かを調べ
る(ステップ1707)。
303内にある場合は(ステップ1703)、文字枠3
03に筆記データが手書きされた場合(図4に示した画
面表示となっている状態)、および、文字枠303に表
示されている文字が触れられた場合と(図8に示した画
面表示となっている状態)の2つの場合が考えられるの
で、文字枠303に文字が表示されているか否かを調べ
る(ステップ1707)。
【0096】文字枠303に文字が表示されていないな
らば、文字枠303に筆記データが手書きされた場合で
あることを意味しているので、タブレットが検知した座
標データに対応する液晶表示装置の画素を反転表示さ
せ、図4に示した画面表示のように、手書きされた筆記
データの筆跡を表示すると共に(ステップ1708)、
該座標データを座標データ領域1107に格納する(ス
テップ1709)。また、文字枠303に文字が表示さ
れているならば、文字枠303に表示されている文字が
触れられた場合であることを意味しているので、該文字
の認識候補を第1の認識候補とする全ての認識候補を、
認識候補データ領域1102から取り出して、図8に示
した画面表示のように、取り出した認識候補の文字を認
識候補枠305に表示する(ステップ1710)。
らば、文字枠303に筆記データが手書きされた場合で
あることを意味しているので、タブレットが検知した座
標データに対応する液晶表示装置の画素を反転表示さ
せ、図4に示した画面表示のように、手書きされた筆記
データの筆跡を表示すると共に(ステップ1708)、
該座標データを座標データ領域1107に格納する(ス
テップ1709)。また、文字枠303に文字が表示さ
れているならば、文字枠303に表示されている文字が
触れられた場合であることを意味しているので、該文字
の認識候補を第1の認識候補とする全ての認識候補を、
認識候補データ領域1102から取り出して、図8に示
した画面表示のように、取り出した認識候補の文字を認
識候補枠305に表示する(ステップ1710)。
【0097】また、タブレットが検知した座標データが
認識ボタン304内にある場合は(ステップ170
4)、認識ボタン304が触れられたことを意味してい
るので、座標データ領域1107に座標データが格納さ
れているか否かを調べ(ステップ1711)、座標デー
タが格納されているならば、該座標データ(筆記デー
タ)について文字認識処理を行うように、文字認識処理
プログラムを起動する(ステップ1712)。文字認識
処理プログラムが行う文字認識処理は上述した通りであ
り、文字認識処理プログラムが文字認識処理を終了する
と、文字認識処理によって出力された認識候補(文字コ
ード,字種,一致度)を、一致度が大きい順に、認識候
補データ領域1102に格納し(ステップ1713)、
格納した時点での第1の認識候補の文字の字種と同じ字
種の文字(文字枠303に表示されている文字)がそれ
までに何文字分だけ連続しているかを、該第1の認識候
補の文字から前にさかのぼって計算し、計算結果を継承
文字数領域1105に格納する(ステップ1714)。
この計算は、具体的には、認識候補データ領域1102
において、該第1の認識候補が格納されている認識候補
記憶領域より前の全ての認識候補記憶領域に格納されて
いる第1の認識候補の字種フィールド1205を参照す
ることにより行うことができる。
認識ボタン304内にある場合は(ステップ170
4)、認識ボタン304が触れられたことを意味してい
るので、座標データ領域1107に座標データが格納さ
れているか否かを調べ(ステップ1711)、座標デー
タが格納されているならば、該座標データ(筆記デー
タ)について文字認識処理を行うように、文字認識処理
プログラムを起動する(ステップ1712)。文字認識
処理プログラムが行う文字認識処理は上述した通りであ
り、文字認識処理プログラムが文字認識処理を終了する
と、文字認識処理によって出力された認識候補(文字コ
ード,字種,一致度)を、一致度が大きい順に、認識候
補データ領域1102に格納し(ステップ1713)、
格納した時点での第1の認識候補の文字の字種と同じ字
種の文字(文字枠303に表示されている文字)がそれ
までに何文字分だけ連続しているかを、該第1の認識候
補の文字から前にさかのぼって計算し、計算結果を継承
文字数領域1105に格納する(ステップ1714)。
この計算は、具体的には、認識候補データ領域1102
において、該第1の認識候補が格納されている認識候補
記憶領域より前の全ての認識候補記憶領域に格納されて
いる第1の認識候補の字種フィールド1205を参照す
ることにより行うことができる。
【0098】続いて、座標データ領域1107を初期化
した後(ステップ1715)、ステップ1714で認識
候補データ領域1102に格納された認識候補の加算点
を計算する加算点計算処理を行うように、加算点計算処
理プログラムを起動する(ステップ1716)。なお、
加算点計算処理の詳細については後述する。
した後(ステップ1715)、ステップ1714で認識
候補データ領域1102に格納された認識候補の加算点
を計算する加算点計算処理を行うように、加算点計算処
理プログラムを起動する(ステップ1716)。なお、
加算点計算処理の詳細については後述する。
【0099】加算点計算処理プログラムが加算点計算処
理を終了すると、認識候補データ領域1102におい
て、計算された加算点が加算点フィールド1206に格
納され、一致度フィールド1205に格納されている一
致度と加算点フィールド1206に格納されている加算
点とを合計した優先度が大きい順に、認識候補が並び替
えられているので、該優先度が最も大きい認識候補(1
番目に格納されている認識候補)を第1の認識候補とし
て決定し、決定した第1の認識候補の文字を、図5およ
び図7に示した画面表示のように、文字枠303に表示
する(ステップ1717)。
理を終了すると、認識候補データ領域1102におい
て、計算された加算点が加算点フィールド1206に格
納され、一致度フィールド1205に格納されている一
致度と加算点フィールド1206に格納されている加算
点とを合計した優先度が大きい順に、認識候補が並び替
えられているので、該優先度が最も大きい認識候補(1
番目に格納されている認識候補)を第1の認識候補とし
て決定し、決定した第1の認識候補の文字を、図5およ
び図7に示した画面表示のように、文字枠303に表示
する(ステップ1717)。
【0100】また、タブレットが検知した座標データが
確定ボタン306内にある場合は(ステップ170
5)、確定ボタン306が触れられたことを意味してい
るので、認識候補データ領域1102に認識候補が格納
されているか否かを調べ(ステップ1718)、認識候
補が格納されているならば、そのうちの第1の認識候補
の文字コードを本文データ領域1108のデータ末尾に
追加して格納すると共に(ステップ1719)、該文字
コードの文字を本文領域301のカーソル302が示す
表示位置に表示する(ステップ1720)。
確定ボタン306内にある場合は(ステップ170
5)、確定ボタン306が触れられたことを意味してい
るので、認識候補データ領域1102に認識候補が格納
されているか否かを調べ(ステップ1718)、認識候
補が格納されているならば、そのうちの第1の認識候補
の文字コードを本文データ領域1108のデータ末尾に
追加して格納すると共に(ステップ1719)、該文字
コードの文字を本文領域301のカーソル302が示す
表示位置に表示する(ステップ1720)。
【0101】続いて、認識候補データ領域1102を初
期化し(ステップ1721)、継承文字数領域1105
を初期化し(ステップ1722)、文字枠303内を初
期化する(ステップ1723)。
期化し(ステップ1721)、継承文字数領域1105
を初期化し(ステップ1722)、文字枠303内を初
期化する(ステップ1723)。
【0102】また、タブレットが検知した座標データが
認識候補枠305内にある場合は(ステップ170
6)、認識候補枠305に文字が表示されているか否か
を調べ(ステップ1724)、文字が表示されているな
らば、図9に示した画面表示のように、認識候補枠30
5に表示されている文字が触れられたことを意味してい
るので、認識候補データ領域1102において、触れら
れた文字の認識候補、すなわち、修正する旨が指示され
た文字の認識候補とその時点の第1の認識候補とを入れ
替えて、修正する旨が指示された文字の認識候補を第1
の認識候補とする(ステップ1725)。
認識候補枠305内にある場合は(ステップ170
6)、認識候補枠305に文字が表示されているか否か
を調べ(ステップ1724)、文字が表示されているな
らば、図9に示した画面表示のように、認識候補枠30
5に表示されている文字が触れられたことを意味してい
るので、認識候補データ領域1102において、触れら
れた文字の認識候補、すなわち、修正する旨が指示され
た文字の認識候補とその時点の第1の認識候補とを入れ
替えて、修正する旨が指示された文字の認識候補を第1
の認識候補とする(ステップ1725)。
【0103】続いて、修正する旨が指示された文字の認
識候補を学習する連接学習処理を行うように、連接学習
処理プログラムを起動する(ステップ1726)。な
お、連接学習処理の詳細については後述する。
識候補を学習する連接学習処理を行うように、連接学習
処理プログラムを起動する(ステップ1726)。な
お、連接学習処理の詳細については後述する。
【0104】連接学習処理プログラムが連接学習処理を
終了すると、ステップ1725で入れ替えられた後の第
1の認識候補の文字コードの文字を、文字枠303に表
示されている文字の代わりに表示し(ステップ172
7)、認識候補枠305内を初期化する(ステップ17
28)。また、ステップ1725で入れ替えられた後の
第1の認識候補の文字の字種と同じ字種の文字(文字枠
303に表示されている文字)がそれまでに何文字分だ
け連続しているかを、該文字から前にさかのぼって計算
し、計算結果を継承文字数領域1105に格納する(ス
テップ1729)。この計算は、具体的には、認識候補
データ領域1102において、該第1の認識候補の文字
の認識候補が格納されている認識候補記憶領域より前の
全ての認識候補記憶領域に格納されている第1の認識候
補の字種フィールド1205を参照することにより行う
ことができる。
終了すると、ステップ1725で入れ替えられた後の第
1の認識候補の文字コードの文字を、文字枠303に表
示されている文字の代わりに表示し(ステップ172
7)、認識候補枠305内を初期化する(ステップ17
28)。また、ステップ1725で入れ替えられた後の
第1の認識候補の文字の字種と同じ字種の文字(文字枠
303に表示されている文字)がそれまでに何文字分だ
け連続しているかを、該文字から前にさかのぼって計算
し、計算結果を継承文字数領域1105に格納する(ス
テップ1729)。この計算は、具体的には、認識候補
データ領域1102において、該第1の認識候補の文字
の認識候補が格納されている認識候補記憶領域より前の
全ての認識候補記憶領域に格納されている第1の認識候
補の字種フィールド1205を参照することにより行う
ことができる。
【0105】続いて、ステップ1725で入れ替えられ
た後の第1の認識候補の文字以降の文字(文字枠303
に表示る文字)の認識候補の加算点を計算する加算点計
算処理を行うように、加算点計算処理プログラムを起動
する(ステップ1730)。
た後の第1の認識候補の文字以降の文字(文字枠303
に表示る文字)の認識候補の加算点を計算する加算点計
算処理を行うように、加算点計算処理プログラムを起動
する(ステップ1730)。
【0106】ここで、ステップ1730で加算点計算処
理を行う理由について説明する。
理を行う理由について説明する。
【0107】操作者が、複数文字分の筆記データを文字
枠303に手書きした後に認識ボタン304をペン20
2で触れた場合は、該複数文字分の筆記データの認識結
果の文字が文字枠303に表示されることとなるが、こ
のとき、操作者が、途中の文字について認識結果修正操
作を行うと、ステップ1729で継承文字数領域110
5に格納された継承文字数が以前に格納されていた値と
異なることがあり、それに伴って、該文字以降の文字の
認識候補の加算点が変わってくることがある。そこで、
このような場合に、修正する旨が指示された文字以降の
全ての文字の認識候補の加算点を再計算し、一致度と再
計算した加算点とを合計した優先度が大きい順に、認識
候補を入れ替えるようにする。ステップ1730で加算
点計算処理を行うのは、この加算点の再計算を行うため
である。
枠303に手書きした後に認識ボタン304をペン20
2で触れた場合は、該複数文字分の筆記データの認識結
果の文字が文字枠303に表示されることとなるが、こ
のとき、操作者が、途中の文字について認識結果修正操
作を行うと、ステップ1729で継承文字数領域110
5に格納された継承文字数が以前に格納されていた値と
異なることがあり、それに伴って、該文字以降の文字の
認識候補の加算点が変わってくることがある。そこで、
このような場合に、修正する旨が指示された文字以降の
全ての文字の認識候補の加算点を再計算し、一致度と再
計算した加算点とを合計した優先度が大きい順に、認識
候補を入れ替えるようにする。ステップ1730で加算
点計算処理を行うのは、この加算点の再計算を行うため
である。
【0108】加算点計算処理プログラムが加算点計算処
理を終了すると、認識候補データ領域1102におい
て、再計算された加算点が加算点フィールド1206に
格納され、一致度フィールド1205に格納されている
一致度と加算点フィールド1206に格納されている加
算点とを合計した優先度が大きい順に、認識候補が並び
替えられているので、該優先度が最も大きい認識候補
(1番目に格納されている認識候補)を第1の認識候補
として決定し、決定した第1の認識候補の文字を文字枠
303に表示する(ステップ1731)。
理を終了すると、認識候補データ領域1102におい
て、再計算された加算点が加算点フィールド1206に
格納され、一致度フィールド1205に格納されている
一致度と加算点フィールド1206に格納されている加
算点とを合計した優先度が大きい順に、認識候補が並び
替えられているので、該優先度が最も大きい認識候補
(1番目に格納されている認識候補)を第1の認識候補
として決定し、決定した第1の認識候補の文字を文字枠
303に表示する(ステップ1731)。
【0109】なお、本実施例では、操作者が認識結果修
正操作を行った場合にのみ、ステップ1726で連接学
習処理を行うようにしているが、記憶手段102の容量
がある程度大きいならば、操作者が文字の筆記データを
手書きする度に連接学習処理を行って、学習する機会を
増やすようにしてもよい。
正操作を行った場合にのみ、ステップ1726で連接学
習処理を行うようにしているが、記憶手段102の容量
がある程度大きいならば、操作者が文字の筆記データを
手書きする度に連接学習処理を行って、学習する機会を
増やすようにしてもよい。
【0110】また、本実施例では、ステップ1712で
行われる文字認識処理によって、1つ以上の認識候補が
必ず出力されすることを前提としているが、文字認識処
理において、操作者が手書きした筆記データとの間の一
致度が予め決められた閾値より大きい標準筆記データが
文字認識辞書に格納されていない場合には、認識候補が
1つも出力されなくなるので、このような場合は、閾値
を下げて、再度、文字認識処理を行うことにより、1つ
以上の認識候補が必ず出力されるようになっている。と
ころが、一致度が小さい認識候補、すなわち、形があま
り似通っていない認識候補が出力されることとなるの
で、このような場合には、後述するように、連接記憶デ
ータ領域1106を参照し、過去に1度でも手書きされ
たことがある文字の認識候補があるならば、該認識候補
以外の認識候補を切り捨てるようにすることにより、余
分な認識候補を出力しないようにすることができる。
行われる文字認識処理によって、1つ以上の認識候補が
必ず出力されすることを前提としているが、文字認識処
理において、操作者が手書きした筆記データとの間の一
致度が予め決められた閾値より大きい標準筆記データが
文字認識辞書に格納されていない場合には、認識候補が
1つも出力されなくなるので、このような場合は、閾値
を下げて、再度、文字認識処理を行うことにより、1つ
以上の認識候補が必ず出力されるようになっている。と
ころが、一致度が小さい認識候補、すなわち、形があま
り似通っていない認識候補が出力されることとなるの
で、このような場合には、後述するように、連接記憶デ
ータ領域1106を参照し、過去に1度でも手書きされ
たことがある文字の認識候補があるならば、該認識候補
以外の認識候補を切り捨てるようにすることにより、余
分な認識候補を出力しないようにすることができる。
【0111】図18はステップ1726の連接学習処理
を行う連接学習処理プログラムのフローチャートであ
る。
を行う連接学習処理プログラムのフローチャートであ
る。
【0112】連接学習処理は、操作者が認識結果修正操
作を行った場合に、修正する旨が指示された文字の文字
コードと1つ前の文字(文字枠303に表示されている
文字)の文字コードとを組にした連接文字コード組を、
連接記憶データ領域1106に格納する処理である。た
だし、修正する旨が指示された文字の字種と1つ前の文
字の字種とが同じ字種であり、かつ、該字種が漢字,カ
タカナ,英字のうちのいずれかであった場合に限って、
連接文字コード組を格納する。
作を行った場合に、修正する旨が指示された文字の文字
コードと1つ前の文字(文字枠303に表示されている
文字)の文字コードとを組にした連接文字コード組を、
連接記憶データ領域1106に格納する処理である。た
だし、修正する旨が指示された文字の字種と1つ前の文
字の字種とが同じ字種であり、かつ、該字種が漢字,カ
タカナ,英字のうちのいずれかであった場合に限って、
連接文字コード組を格納する。
【0113】具体的には、操作者が修正する旨を指示し
た文字の字種が、漢字,カタカナ,英字のうちのいずれ
かであるか否かを調べ(ステップ1801)、漢字,カ
タカナ,英字のうちのいずれかであるならば、修正する
旨が指示された文字の字種と1つ前の文字の字種とが同
じであるか否かを判定し、同じであるならば、連接文字
コード組を取得する(ステップ1802)。連接文字コ
ード組の取得は、具体的には、認識候補データ領域11
02において、修正する旨が指示された文字の認識候補
が格納されている認識候補記憶領域より1つ前の認識候
補記憶領域を参照することにより行うことができる。
た文字の字種が、漢字,カタカナ,英字のうちのいずれ
かであるか否かを調べ(ステップ1801)、漢字,カ
タカナ,英字のうちのいずれかであるならば、修正する
旨が指示された文字の字種と1つ前の文字の字種とが同
じであるか否かを判定し、同じであるならば、連接文字
コード組を取得する(ステップ1802)。連接文字コ
ード組の取得は、具体的には、認識候補データ領域11
02において、修正する旨が指示された文字の認識候補
が格納されている認識候補記憶領域より1つ前の認識候
補記憶領域を参照することにより行うことができる。
【0114】ステップ1802で連接文字コード組が取
得できたならば、取得した連接文字コード組を連接記憶
データ領域1106に格納する(ステップ1803)。
得できたならば、取得した連接文字コード組を連接記憶
データ領域1106に格納する(ステップ1803)。
【0115】なお、連接文字コード組を格納する際に、
既に同じ連接文字コード組が格納されていることが考え
られるが、このようなときには、既に格納されている連
接文字コード組に上書きして格納するようにしてもよい
し、重複する連接文字コード組を格納することを許容す
るようにしてもよい。
既に同じ連接文字コード組が格納されていることが考え
られるが、このようなときには、既に格納されている連
接文字コード組に上書きして格納するようにしてもよい
し、重複する連接文字コード組を格納することを許容す
るようにしてもよい。
【0116】また、連接文字コード組を新しい順に格納
するようにすることもでき、この場合は、既に同じ連接
文字コード組が格納されているときには、既に格納され
ている連接文字コード組を削除してから、新たに取得し
た連接文字コード組を格納するようにする。
するようにすることもでき、この場合は、既に同じ連接
文字コード組が格納されているときには、既に格納され
ている連接文字コード組を削除してから、新たに取得し
た連接文字コード組を格納するようにする。
【0117】図19はステップ1716およびステップ
1730の加算点計算処理を行う加算点計算処理プログ
ラムのフローチャートである。
1730の加算点計算処理を行う加算点計算処理プログ
ラムのフローチャートである。
【0118】上述したように、文字認識処理が行われた
後、文字認識処理によって出力された認識候補(文字コ
ード,字種,一致度)が、一致度が大きい順に、認識候
補データ領域1102に格納されるが、一致度は、筆記
データについて文字単位で文字認識処理を行った結果で
あり、前後関係は、いっさい参照していない。そこで、
ステップ1716で、図19のフローチャートに示す加
算点計算処理を行うことにより、認識候補データ領域1
102に格納された認識候補の加算点を計算し、一致度
と計算した加算点とを合計した優先度が大きい順に、認
識候補を入れ替えるようにしている。
後、文字認識処理によって出力された認識候補(文字コ
ード,字種,一致度)が、一致度が大きい順に、認識候
補データ領域1102に格納されるが、一致度は、筆記
データについて文字単位で文字認識処理を行った結果で
あり、前後関係は、いっさい参照していない。そこで、
ステップ1716で、図19のフローチャートに示す加
算点計算処理を行うことにより、認識候補データ領域1
102に格納された認識候補の加算点を計算し、一致度
と計算した加算点とを合計した優先度が大きい順に、認
識候補を入れ替えるようにしている。
【0119】また、上述したように、操作者が途中の文
字について認識結果修正操作を行うと、継承文字数が変
更されることがあり、それに伴って、該文字以降の文字
の認識候補の加算点が変わってくることがある。そこ
で、ステップ1730で、操作者が修正する旨を指示し
た文字以降の文字数分だけ、図19のフローチャートに
示す加算点計算処理を行うことにより、操作者が修正す
る旨を指示した文字以降の全ての文字について、該文字
の認識候補の加算点を再計算し、一致度と再計算した加
算点とを合計した優先度が大きい順に、認識候補を入れ
替えるようにしている。
字について認識結果修正操作を行うと、継承文字数が変
更されることがあり、それに伴って、該文字以降の文字
の認識候補の加算点が変わってくることがある。そこ
で、ステップ1730で、操作者が修正する旨を指示し
た文字以降の文字数分だけ、図19のフローチャートに
示す加算点計算処理を行うことにより、操作者が修正す
る旨を指示した文字以降の全ての文字について、該文字
の認識候補の加算点を再計算し、一致度と再計算した加
算点とを合計した優先度が大きい順に、認識候補を入れ
替えるようにしている。
【0120】加算点には、以下に説明するように、連接
学習機能による加算点と字種継承機能による加算点があ
るが、本実施例では、連接学習機能による加算点を優先
するようにしている。すなわち、通常は、字種継承機能
による加算点を用い、特に、操作者が過去に認識結果修
正操作を行ったことがある文字に対しては、連接学習機
能による加算点を優先して用いるようにすることによ
り、日本語の一般的な傾向を利用しながら、操作者の操
作に合わせて文字認識率を向上させることができるよう
にしている。
学習機能による加算点と字種継承機能による加算点があ
るが、本実施例では、連接学習機能による加算点を優先
するようにしている。すなわち、通常は、字種継承機能
による加算点を用い、特に、操作者が過去に認識結果修
正操作を行ったことがある文字に対しては、連接学習機
能による加算点を優先して用いるようにすることによ
り、日本語の一般的な傾向を利用しながら、操作者の操
作に合わせて文字認識率を向上させることができるよう
にしている。
【0121】具体的には、加算点を計算しようとしてい
る認識候補が格納されている認識候補記憶領域と1つ前
の認識候補記憶領域とを参照し、前者に格納されている
全ての認識候補の文字コードと後者に格納されている第
1の認識候補の文字コードとをそれぞれ組にしたものに
ついて、該組と一致する連接文字コード組が連接記憶デ
ータ領域1106に格納されているか否かを調べる(ス
テップ1901)。一致する連接文字コード組が格納さ
れているならば(ステップ1902)、該組にした文字
コードの認識候補について、連接学習機能による加算点
を計算し、計算した加算点を加算点フィールド1206
に格納する(ステップ1903)。連接学習機能による
加算点は、具体的には、予め決められた正の値である。
る認識候補が格納されている認識候補記憶領域と1つ前
の認識候補記憶領域とを参照し、前者に格納されている
全ての認識候補の文字コードと後者に格納されている第
1の認識候補の文字コードとをそれぞれ組にしたものに
ついて、該組と一致する連接文字コード組が連接記憶デ
ータ領域1106に格納されているか否かを調べる(ス
テップ1901)。一致する連接文字コード組が格納さ
れているならば(ステップ1902)、該組にした文字
コードの認識候補について、連接学習機能による加算点
を計算し、計算した加算点を加算点フィールド1206
に格納する(ステップ1903)。連接学習機能による
加算点は、具体的には、予め決められた正の値である。
【0122】なお、連接学習処理において、連接記憶デ
ータ領域1106に重複する連接文字コード組を格納す
ることを許容するようにした場合は、一致する連接文字
コード組が2つ以上格納されていることもあるので、そ
のときは、予め決められた正の値に一致する連接文字コ
ード組が格納されている数を乗じた値を加算点とするこ
とによって、学習回数を加算点に反映させることができ
る。また、連接学習処理において、連接記憶データ領域
1106に連接文字コード組を新しい順に格納するよう
にした場合は、一致する連接文字コード組が格納された
時点が新しいほど、大きい値となるようにすることによ
って、学習の新/旧を加算点に反映させることができ
る。
ータ領域1106に重複する連接文字コード組を格納す
ることを許容するようにした場合は、一致する連接文字
コード組が2つ以上格納されていることもあるので、そ
のときは、予め決められた正の値に一致する連接文字コ
ード組が格納されている数を乗じた値を加算点とするこ
とによって、学習回数を加算点に反映させることができ
る。また、連接学習処理において、連接記憶データ領域
1106に連接文字コード組を新しい順に格納するよう
にした場合は、一致する連接文字コード組が格納された
時点が新しいほど、大きい値となるようにすることによ
って、学習の新/旧を加算点に反映させることができ
る。
【0123】続いて、加算点を計算しようとしている認
識候補の全てについて、加算点の計算を終了すると、認
識候補データ領域1102において、一致度と加算点と
を合計した優先度が大きい順に、認識候補を並び替える
(ステップ1904)。
識候補の全てについて、加算点の計算を終了すると、認
識候補データ領域1102において、一致度と加算点と
を合計した優先度が大きい順に、認識候補を並び替える
(ステップ1904)。
【0124】図20は連接学習機能による加算点の具体
例を示す図であり、図9に示した画面表示のように、操
作者が認識結果修正操作を行った後、操作者が、2度目
に、「日」,「立」という文字を意図した筆記データを
手書きした場合の認識候補データ領域1102の内容を
示している。
例を示す図であり、図9に示した画面表示のように、操
作者が認識結果修正操作を行った後、操作者が、2度目
に、「日」,「立」という文字を意図した筆記データを
手書きした場合の認識候補データ領域1102の内容を
示している。
【0125】操作者が「日」,「立」という文字を意図
した筆記データを手書きした場合に、1度目は、操作者
の意図とは異なる「日」,「主」という文字の認識候補
が第1の認識候補として決定されてしまい、誤認識され
ることとなるが、「立」という文字についての認識結果
修正操作が行われたことにより、「日」という文字の文
字コードと「立」という文字の文字コードとを組にした
連接文字コード組が連接記憶データ領域1106に格納
されているので、2度目は、連接学習機能による加算点
が用いられて、図20に示すように、「立」という文字
の認識候補の加算点が「+50」となる。そこで、一致
度と学習内容に応じた加算点とを合計した優先度が最も
大きい「立」という文字の認識候補が「主」という文字
の認識候補と入れ替わり、「日」,「立」の文字の認識
候補が第1の認識候補として決定されて、操作者の意図
通りの認識結果が得られるようになる。
した筆記データを手書きした場合に、1度目は、操作者
の意図とは異なる「日」,「主」という文字の認識候補
が第1の認識候補として決定されてしまい、誤認識され
ることとなるが、「立」という文字についての認識結果
修正操作が行われたことにより、「日」という文字の文
字コードと「立」という文字の文字コードとを組にした
連接文字コード組が連接記憶データ領域1106に格納
されているので、2度目は、連接学習機能による加算点
が用いられて、図20に示すように、「立」という文字
の認識候補の加算点が「+50」となる。そこで、一致
度と学習内容に応じた加算点とを合計した優先度が最も
大きい「立」という文字の認識候補が「主」という文字
の認識候補と入れ替わり、「日」,「立」の文字の認識
候補が第1の認識候補として決定されて、操作者の意図
通りの認識結果が得られるようになる。
【0126】このように、加算点を計算しようとしてい
る全ての認識候補の文字コードと1つ前の文字の文字コ
ード(第1の認識候補の文字コード)とをそれぞれ組に
したもののうち、連接記憶データ領域1106に格納さ
れている連接文字コード組と一致する組は、該組が1つ
の単語を構成する要素であることを意味しているので、
該組にした文字コードの認識候補の加算点(連接学習機
能による加算点)が計算されて、第1の認識候補として
決定される度合いが大きくなる。従って、単語処理や日
本語処理を行わなくても、連接学習機能によって、
「日」,「立」という、操作者の意図通りの認識結果を
出力し、文字認識率を向上させることができる。
る全ての認識候補の文字コードと1つ前の文字の文字コ
ード(第1の認識候補の文字コード)とをそれぞれ組に
したもののうち、連接記憶データ領域1106に格納さ
れている連接文字コード組と一致する組は、該組が1つ
の単語を構成する要素であることを意味しているので、
該組にした文字コードの認識候補の加算点(連接学習機
能による加算点)が計算されて、第1の認識候補として
決定される度合いが大きくなる。従って、単語処理や日
本語処理を行わなくても、連接学習機能によって、
「日」,「立」という、操作者の意図通りの認識結果を
出力し、文字認識率を向上させることができる。
【0127】一方、一致する連接文字コード組が格納さ
れていないならば(ステップ1902)、字種継承機能
による加算点を計算する(ステップ1905)。
れていないならば(ステップ1902)、字種継承機能
による加算点を計算する(ステップ1905)。
【0128】ここで、ステップ1905の字種継承機能
による加算点の計算処理について、図21のフローチャ
ートを用いて説明する。
による加算点の計算処理について、図21のフローチャ
ートを用いて説明する。
【0129】上述したように、従来のように文字単位で
文字認識処理を行った場合は、「PO」,「T」,
「A」,「T」,「O」のように識別しにくい文字の場
合は、誤認識が生じてしまう。そこで、本実施例では、
字種ごとに、該字種の文字の次に出現する文字の字種が
何であるかを統計的に調査した結果に基づいて予め決め
られた値(確率)を、連接頻度データ領域1103に格
納しておき、字種継承機能を実現することができるよう
にしている。また、カタカナ,英字,数字は、単語とし
て連続して出現することが多いという傾向があるが、連
続する文字数は有限であるので、字種継承機能を徐々に
減衰していくようにするために、字種ごとに、該字種の
文字が連続する文字数を統計的に調査した結果に基づい
て予め決められた値(減衰率)を、減衰パラメータデー
タ領域1104に格納しておくと共に、第1の認識候補
として決定した認識候補の文字の字種が、それまでに何
文字分だけ連続して同じ字種であったかを示す値(継承
文字数)を、継承文字数領域1105に格納するように
している。
文字認識処理を行った場合は、「PO」,「T」,
「A」,「T」,「O」のように識別しにくい文字の場
合は、誤認識が生じてしまう。そこで、本実施例では、
字種ごとに、該字種の文字の次に出現する文字の字種が
何であるかを統計的に調査した結果に基づいて予め決め
られた値(確率)を、連接頻度データ領域1103に格
納しておき、字種継承機能を実現することができるよう
にしている。また、カタカナ,英字,数字は、単語とし
て連続して出現することが多いという傾向があるが、連
続する文字数は有限であるので、字種継承機能を徐々に
減衰していくようにするために、字種ごとに、該字種の
文字が連続する文字数を統計的に調査した結果に基づい
て予め決められた値(減衰率)を、減衰パラメータデー
タ領域1104に格納しておくと共に、第1の認識候補
として決定した認識候補の文字の字種が、それまでに何
文字分だけ連続して同じ字種であったかを示す値(継承
文字数)を、継承文字数領域1105に格納するように
している。
【0130】具体的には、認識候補データ領域1102
において、加算点を計算しようとしている認識候補が格
納されている認識候補記憶領域の1つ前の認識候補記憶
領域に認識候補が格納されているか否かを調べることに
より、認識候補の加算点を計算しようとしている文字の
1つ前に文字(文字枠303に表示されている文字)が
あるか否かを調べ(ステップ2101)、文字があるな
らば、変数iに、1つ前の文字の字種(1つ前の文字の
認識候補のうちの第1の認識候補の文字の字種)を設定
し(ステップ2102)、変数jに、現在処理対象とし
ている認識候補(k番目の認識候補)の文字の字種を設
定する(ステップ2103)。
において、加算点を計算しようとしている認識候補が格
納されている認識候補記憶領域の1つ前の認識候補記憶
領域に認識候補が格納されているか否かを調べることに
より、認識候補の加算点を計算しようとしている文字の
1つ前に文字(文字枠303に表示されている文字)が
あるか否かを調べ(ステップ2101)、文字があるな
らば、変数iに、1つ前の文字の字種(1つ前の文字の
認識候補のうちの第1の認識候補の文字の字種)を設定
し(ステップ2102)、変数jに、現在処理対象とし
ている認識候補(k番目の認識候補)の文字の字種を設
定する(ステップ2103)。
【0131】続いて、変数i(1つ前の文字の字種)お
よび変数j(k番目の認識候補の文字の字種)から、
(式1)を用いて、k番目の認識候補の加算点Dijを
計算する(ステップ2104)。
よび変数j(k番目の認識候補の文字の字種)から、
(式1)を用いて、k番目の認識候補の加算点Dijを
計算する(ステップ2104)。
【0132】 Dij=(Pij+N×αi×Pij)×A …(式1) ここで、Pijは、連接頻度データ領域1103に格納
されている確率であり、Nは、継承文字数領域1105
に格納されている継承文字数であり、αiは、減衰パラ
メータデータ領域1104に格納されている減衰率であ
る。また、Aは、字種継承機能による加算点の重み付け
を調整するためのパラメータであり、予め決められた値
となっている。
されている確率であり、Nは、継承文字数領域1105
に格納されている継承文字数であり、αiは、減衰パラ
メータデータ領域1104に格納されている減衰率であ
る。また、Aは、字種継承機能による加算点の重み付け
を調整するためのパラメータであり、予め決められた値
となっている。
【0133】連接頻度データ領域1103において、図
13に示したように、確率Pijは、ひらがな,カタカ
ナ,英字,数字が連続する傾向が強くなるように、その
値が予め決められているので、前の文字の字種と同じ字
種である文字の認識候補の加算点Dijが大きくなり、
字種継承機能を実現することができるようになってい
る。
13に示したように、確率Pijは、ひらがな,カタカ
ナ,英字,数字が連続する傾向が強くなるように、その
値が予め決められているので、前の文字の字種と同じ字
種である文字の認識候補の加算点Dijが大きくなり、
字種継承機能を実現することができるようになってい
る。
【0134】また、継承文字数Nが大きくなるほど、加
算点Dijは徐々に減衰する。例えば、カタカナの場合
は、N=0では、Dij=(70+0)×0.5=35
となり、N=1では、Dij=(70+1×(−0.
2)×70)×0.5=28となり、N=2では、Di
j=21となり、N=3では、Dij=14となり、N
=4では、Dij=7となる。なお、ここでは、A=
0.5として計算しているが、例えば、認識候補の一致
度の平均値が大きいほど、Aの値を大きくするようにす
るなど、一致度の大きさに応じてAの値を変更すること
ができる。
算点Dijは徐々に減衰する。例えば、カタカナの場合
は、N=0では、Dij=(70+0)×0.5=35
となり、N=1では、Dij=(70+1×(−0.
2)×70)×0.5=28となり、N=2では、Di
j=21となり、N=3では、Dij=14となり、N
=4では、Dij=7となる。なお、ここでは、A=
0.5として計算しているが、例えば、認識候補の一致
度の平均値が大きいほど、Aの値を大きくするようにす
るなど、一致度の大きさに応じてAの値を変更すること
ができる。
【0135】このように、継承文字数Nが大きくなるに
従って、ある時点で、加算点Dijは負の数に転じるの
で、加算点Dijが正であるか否かを調べ(ステップ2
105)、正であるならば、加算点Dijを認識候補デ
ータ領域1102の加算点フィールド1206に格納す
る(ステップ2106)。なお、加算点Dijの正/負
を判定しないようにすると、前の文字の字種と同じ字種
である文字の認識候補は、ある文字数分だけ連続してい
る間は、優先度が大きくなり、該文字数を超えて連続す
ると、逆に、優先度が小さくなるようにすることが可能
となる。
従って、ある時点で、加算点Dijは負の数に転じるの
で、加算点Dijが正であるか否かを調べ(ステップ2
105)、正であるならば、加算点Dijを認識候補デ
ータ領域1102の加算点フィールド1206に格納す
る(ステップ2106)。なお、加算点Dijの正/負
を判定しないようにすると、前の文字の字種と同じ字種
である文字の認識候補は、ある文字数分だけ連続してい
る間は、優先度が大きくなり、該文字数を超えて連続す
ると、逆に、優先度が小さくなるようにすることが可能
となる。
【0136】続いて、加算点を計算しようとしている全
ての認識候補について、加算点Dijを計算し、計算した
加算点Dijを加算点フィールド1206に格納した後
は(ステップ2107)、認識候補データ領域1102
において、一致度と加算点とを合計した優先度が大きい
順に、認識候補を並び替える(ステップ2108)。そ
して、並び替えた結果、第1の認識候補となった認識候
補の文字の字種と同じ字種の文字が、それまでに何文字
分だけ連続しているかを、該第1の認識候補の文字から
前にさかのぼって計算し、計算結果を継承文字数領域1
105に格納する(ステップ2109)。この計算は、
具体的には、認識候補データ領域1102において、該
第1の認識候補が格納されている認識候補記憶領域より
前の全ての認識候補記憶領域に格納されている第1の認
識候補の字種フィールド1205を参照することにより
行うことができる。
ての認識候補について、加算点Dijを計算し、計算した
加算点Dijを加算点フィールド1206に格納した後
は(ステップ2107)、認識候補データ領域1102
において、一致度と加算点とを合計した優先度が大きい
順に、認識候補を並び替える(ステップ2108)。そ
して、並び替えた結果、第1の認識候補となった認識候
補の文字の字種と同じ字種の文字が、それまでに何文字
分だけ連続しているかを、該第1の認識候補の文字から
前にさかのぼって計算し、計算結果を継承文字数領域1
105に格納する(ステップ2109)。この計算は、
具体的には、認識候補データ領域1102において、該
第1の認識候補が格納されている認識候補記憶領域より
前の全ての認識候補記憶領域に格納されている第1の認
識候補の字種フィールド1205を参照することにより
行うことができる。
【0137】図22は字種継承機能による加算点の具体
例を示す図であり、操作者が、「シ」,「ス」,
「テ」,「ム」という文字を意図した筆記データを手書
きした場合の認識候補データ領域1102の内容を示し
ている。
例を示す図であり、操作者が、「シ」,「ス」,
「テ」,「ム」という文字を意図した筆記データを手書
きした場合の認識候補データ領域1102の内容を示し
ている。
【0138】操作者が「シ」,「ス」,「テ」,「ム」
という文字を意図した筆記データを手書きした場合に、
字種継承機能による加算点を用いないと、図22(a)
に示すように、一致度が最も大きい「シ」,「又」,
「千」,「ム」という文字の認識候補が第1の認識候補
として決定されてしまい、誤認識されることとなるが、
字種継承機能による加算点を用いると、図22(b)に
示すように、一致度と加算点Dijとを合計した優先度
が最も大きい「ス」,「テ」という文字の認識候補が
「又」,「千」という文字の認識候補と入れ替わるの
で、「シ」,「ス」,「テ」,「ム」という文字の認識
候補が第1の認識候補として決定されて、操作者の意図
通りの認識結果が得られるようになる。
という文字を意図した筆記データを手書きした場合に、
字種継承機能による加算点を用いないと、図22(a)
に示すように、一致度が最も大きい「シ」,「又」,
「千」,「ム」という文字の認識候補が第1の認識候補
として決定されてしまい、誤認識されることとなるが、
字種継承機能による加算点を用いると、図22(b)に
示すように、一致度と加算点Dijとを合計した優先度
が最も大きい「ス」,「テ」という文字の認識候補が
「又」,「千」という文字の認識候補と入れ替わるの
で、「シ」,「ス」,「テ」,「ム」という文字の認識
候補が第1の認識候補として決定されて、操作者の意図
通りの認識結果が得られるようになる。
【0139】このように、「シ」という文字以降の文字
の認識候補については、1つ前の文字の字種がカタカナ
であるので、該文字の字種がカタカナであるような認識
候補の加算点が計算されて、第1の認識候補として決定
される度合いが大きくなる。従って、単語処理や日本語
処理を行わなくても、字種継承機能によって、「シ」,
「ス」,「テ」,「ム」という、日本語として尤もらし
い認識結果を出力し、文字認識率を向上させることがで
きる。
の認識候補については、1つ前の文字の字種がカタカナ
であるので、該文字の字種がカタカナであるような認識
候補の加算点が計算されて、第1の認識候補として決定
される度合いが大きくなる。従って、単語処理や日本語
処理を行わなくても、字種継承機能によって、「シ」,
「ス」,「テ」,「ム」という、日本語として尤もらし
い認識結果を出力し、文字認識率を向上させることがで
きる。
【0140】
【発明の効果】以上説明したように、本発明によれば、
単語処理や日本語処理を行わなくても、日本語の一般的
な傾向を利用することにより、日本語として尤もらしい
認識結果を出力し、文字認識率を向上させることが可能
な文字入力装置を提供することが可能となる。
単語処理や日本語処理を行わなくても、日本語の一般的
な傾向を利用することにより、日本語として尤もらしい
認識結果を出力し、文字認識率を向上させることが可能
な文字入力装置を提供することが可能となる。
【0141】また、単語処理や日本語処理を行わないこ
とから、高速に認識結果を出力することができるように
なる。
とから、高速に認識結果を出力することができるように
なる。
【図1】本実施例の文字入力装置の機能ブロック図。
【図2】本実施例の文字入力装置の外観図。
【図3】本実施例の画面表示例を示す説明図。
【図4】本実施例の画面表示例を示す説明図。
【図5】本実施例の画面表示例を示す説明図。
【図6】本実施例の画面表示例を示す説明図。
【図7】本実施例の画面表示例を示す説明図。
【図8】本実施例の画面表示例を示す説明図。
【図9】本実施例の画面表示例を示す説明図。
【図10】本実施例の画面表示例を示す説明図。
【図11】記憶手段の内容を模式的に示す説明図。
【図12】認識候補データ領域の内容を模式的に示す説
明図。
明図。
【図13】連接頻度データ領域の内容を模式的に示す説
明図。
明図。
【図14】減衰パラメータデータ領域の内容を模式的に
示す説明図。
示す説明図。
【図15】継承文字数領域の内容を模式的に示す説明
図。
図。
【図16】連接記憶データ領域の内容を模式的に示す説
明図。
明図。
【図17】メイン処理プログラムのフローチャート。
【図18】連接学習処理プログラムのフローチャート。
【図19】加算点計算処理プログラムのフローチャー
ト。
ト。
【図20】連接学習機能による加算点の具体例を示す説
明図。
明図。
【図21】字種継承機能による加算点計算処理のフロー
チャート。
チャート。
【図22】字種継承機能による加算点の具体例を示す説
明図。
明図。
101…座標入力手段、102…記憶手段、103…制
御手段、104…表示手段、105…外部記憶手段、1
06…電源、107…電源スイッチ、201…本体、2
02…ペン、203…表示一体型タブレット、204…
挿入口、301…本文領域、302…カーソル、303
…文字枠、304…認識ボタン、305…認識候補枠、
306…確定ボタン、1101…各種プログラム領域、
1102…認識候補データ領域、1103…連接頻度デ
ータ領域、1104…減衰パラメータデータ領域、11
05…字種継承文字数領域、1106…連接記憶データ
領域、1107…座標データ領域、1108…本文デー
タ領域、1201,1202…認識候補記憶領域、12
03…文字コードフィールド、1204…字種フィール
ド、1205…一致度フィールド、1206…加算点フ
ィールド。
御手段、104…表示手段、105…外部記憶手段、1
06…電源、107…電源スイッチ、201…本体、2
02…ペン、203…表示一体型タブレット、204…
挿入口、301…本文領域、302…カーソル、303
…文字枠、304…認識ボタン、305…認識候補枠、
306…確定ボタン、1101…各種プログラム領域、
1102…認識候補データ領域、1103…連接頻度デ
ータ領域、1104…減衰パラメータデータ領域、11
05…字種継承文字数領域、1106…連接記憶データ
領域、1107…座標データ領域、1108…本文デー
タ領域、1201,1202…認識候補記憶領域、12
03…文字コードフィールド、1204…字種フィール
ド、1205…一致度フィールド、1206…加算点フ
ィールド。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 隈井 裕之 神奈川県横浜市戸塚区吉田町292番地 株 式会社日立製作所映像メディア研究所内 (72)発明者 松田 泰昌 神奈川県横浜市戸塚区吉田町292番地 株 式会社日立製作所映像メディア研究所内
Claims (11)
- 【請求項1】手書きされた文字の筆記データを入力する
手書き入力手段と、 文字ごとに、該文字の標準的な筆記パターンである標準
筆記パターン、該文字を表す文字コード、および、該文
字の字種を記憶している文字認識辞書記憶手段と、 上記手書き入力手段が入力した筆記データが上記標準筆
記パターンに似通っている度合いを示す一致度を求め、
求めた一致度が予め決められた値より大きい標準筆記パ
ターンに対応する文字コードおよび字種を、求めた一致
度と共に、文字認識情報として出力する文字認識手段
と、 上記文字認識手段が出力した文字認識情報を記憶する文
字認識情報記憶手段と、 文字の字種ごとに、該字種の文字の次に出現する文字が
何の字種となるかの確率を示す、予め決められた確率値
を記憶している字種連接情報記憶手段と、 上記字種連接情報記憶手段が記憶している確率値に応じ
て、上記文字認識情報記憶手段が記憶している文字認識
情報ごとに、該文字認識情報が示す一致度に加算すべき
加算点を計算し、該一致度と計算した加算点との合計値
が最も大きい文字認識情報を、認識結果として出力する
加算点計算手段と、 上記手書き入力手段が入力した筆記データ、および、上
記加算点計算手段が認識結果として出力した文字認識情
報が示す文字コードで表される文字を表示する表示手段
とを備えたことを特徴とする文字入力装置。 - 【請求項2】請求項1記載の文字入力装置において、 上記表示手段が表示した文字を表す文字コードを含む文
字認識情報と、該該文字認識情報以外の他の文字認識情
報とを入れ替える旨の指示を受付ける受付手段をさらに
備え、 上記表示手段は、上記受付手段が入れ替える旨の指示を
受付けた場合に、表示している文字を、該入れ替える旨
が指示された文字認識情報が示す文字コードで表される
文字に変更して表示し、 上記加算点計算手段は、上記表示手段が文字を変更して
表示した場合に、該文字を表す文字コードを含む文字認
識情報以降に、既に認識結果として文字認識情報を出力
している全ての文字認識情報について、再度加算点を計
算し、認識結果を出力しなおすことを特徴とする文字入
力装置。 - 【請求項3】手書きされた文字の筆記データを入力する
手書き入力手段と、 文字ごとに、該文字の標準的な筆記パターンである標準
筆記パターン、該文字を表す文字コード、および、該文
字の字種を記憶している文字認識辞書記憶手段と、 上記手書き入力手段が入力した筆記データが上記標準筆
記パターンに似通っている度合いを示す一致度を求め、
求めた一致度が予め決められた値より大きい標準筆記パ
ターンに対応する文字コードおよび字種を、求めた一致
度と共に、文字認識情報として出力する文字認識手段
と、 上記文字認識手段が出力した文字認識情報を記憶する文
字認識情報記憶手段と、 1つの単語を構成する要素となる複数の文字を表す文字
コードを組にした連接文字情報を記憶する連接文字情報
記憶手段と、 上記連接文字情報記憶手段が記憶している連接文字情報
に基づいて、上記文字認識情報記憶手段が記憶している
文字認識情報ごとに、該文字認識情報が示す一致度に加
算すべき加算点を計算し、該一致度と計算した加算点と
の合計値が最も大きい文字認識情報を、認識結果として
出力する加算点計算手段と、 上記手書き入力手段が入力した筆記データ、および、上
記加算点計算手段が認識結果として出力した文字認識情
報が示す文字コードで表される文字を表示する表示手段
とを備え、 上記連接文字情報記憶手段は、予め決められた同じ字種
を示す複数の文字認識情報が認識結果として連続して出
力されているならば、これら複数の文字認識情報が示す
文字コードで表される文字が1つの単語を構成する要素
となる複数の文字であるとみなして、これら複数の文字
認識情報が示す文字コードを組にしたものを、上記連接
文字情報として記憶することを特徴とすることを特徴と
する文字入力装置。 - 【請求項4】手書きされた文字の筆記データを入力する
手書き入力手段と、 文字ごとに、該文字の標準的な筆記パターンである標準
筆記パターン、該文字を表す文字コード、および、該文
字の字種を記憶している文字認識辞書記憶手段と、 上記手書き入力手段が入力した筆記データが上記標準筆
記パターンに似通っている度合いを示す一致度を求め、
求めた一致度が予め決められた値より大きい標準筆記パ
ターンに対応する文字コードおよび字種を、求めた一致
度と共に、文字認識情報として出力する文字認識手段
と、 上記文字認識手段が出力した文字認識情報を記憶する文
字認識情報記憶手段と、 1つの単語を構成する要素となる複数の文字を表す文字
コードを組にした連接文字情報を記憶する連接文字情報
記憶手段と、 上記連接文字情報記憶手段が記憶している連接文字情報
に基づいて、上記文字認識情報記憶手段が記憶している
文字認識情報ごとに、該文字認識情報が示す一致度に加
算すべき加算点を計算し、該一致度と計算した加算点と
の合計値が最も大きい文字認識情報を、認識結果として
出力する加算点計算手段と、 上記表示手段が表示した文字を表す文字コードを含む文
字認識情報と、該該文字認識情報以外の他の文字認識情
報とを入れ替える旨の指示を受付ける受付手段と、 上記手書き入力手段が入力した筆記データ、および、上
記加算点計算手段が認識結果として出力した文字認識情
報が示す文字コードで表される文字を表示する表示手段
とを備え、 上記表示手段は、上記受付手段が入れ替える旨の指示を
受付けた場合に、表示している文字を、該入れ替える旨
が指示された文字認識情報が示す文字コードで表される
文字に変更して表示し、 上記連接文字情報記憶手段は、上記受付手段が入れ替え
る旨の指示を受付けた場合に、予め決められた同じ字種
を示す複数の文字認識情報が認識結果として連続して出
力されているならば、これら複数の文字認識情報が示す
文字コードで表される文字が1つの単語を構成する要素
となる複数の文字であるとみなして、これら複数の文字
認識情報が示す文字コードを組にしたものを、上記連接
文字情報として記憶することを特徴とすることを特徴と
する文字入力装置。 - 【請求項5】請求項4記載の文字入力装置において、 上記加算点計算手段は、上記表示手段が文字を変更して
表示した場合に、該文字を表す文字コードを含む文字認
識情報以降に、既に認識結果として文字認識情報を出力
している全ての文字認識情報について、再度加算点を計
算し、認識結果を出力しなおすことを特徴とする文字入
力装置。 - 【請求項6】請求項3,4または5記載の文字入力装置
において、 上記加算点計算手段は、上記連接文字情報記憶手段が記
憶している連接文字情報に基づいて文字認識情報につい
ての加算点を計算する際に、該文字認識情報が示す文字
コードと前回認識結果として出力された文字認識情報が
示す文字コードとを組にしたものを含む連接文字情報が
上記連接文字情報記憶手段に記憶されている文字認識情
報についての加算点を、予め決められた値とすることを
特徴とする文字入力装置。 - 【請求項7】請求項3,4,5または6記載の文字入力
装置において、 文字の字種ごとに、該字種の文字の次に出現する文字が
何の字種となるか野確率を示す、予め決められた確率値
を記憶している字種連接情報記憶手段をさらに備え、 上記加算点計算手段は、上記文字認識情報記憶手段が記
憶している文字認識情報のうち、いずれかの文字認識情
報が示す文字コードと前回認識結果として出力された文
字認識情報が示す文字コードとを組にしたものを含む連
接文字情報が上記連接文字情報記憶手段に記憶されてい
る場合には、上記連接文字情報記憶手段が記憶している
連接文字情報に基づいて加算点を計算し、そうでない場
合には、さらに、上記字種連接情報記憶手段が記憶して
いる確率値に応じて加算点を計算することを特徴とする
文字入力装置。 - 【請求項8】請求項1,2または7記載の文字入力装置
において、 上記字種連接情報記憶手段が記憶している確率値は、次
に出現する文字の字種が前の文字の字種と同じ字種とな
る確率値が、次に出現する文字の字種が前の文字の字種
と異なる字種となる確率値より大きくなるようになって
おり、 上記加算点計算手段は、上記字種連接情報記憶手段が記
憶している確率値に応じて文字認識情報についての加算
点を計算する際に、該文字認識情報が示す字種と前回認
識結果として出力された文字認識情報が示す字種とか
ら、該文字認識情報に対応する確率値を求め、求めた確
率値が大きいほど、該文字認識情報についての加算点が
大きくなるようにすることを特徴とする文字入力装置。 - 【請求項9】請求項8記載の文字入力装置において、 上記加算点計算手段が認識結果として出力した文字認識
情報が示す字種と同じ字種を含む文字認識情報が、それ
までにいくつだけ連続して認識結果として出力されてい
るかを示す連続字種数を計算する連続字種数計算手段を
さらに備え、 上記加算点計算手段は、さらに、上記連続字種数計算手
段が計算した連続字種数が大きいほど、前回認識結果と
して出力された文字認識情報が示す字種と同じ字種を含
む文字認識情報についての加算点が小さくなるようにす
ることを特徴とする文字入力装置。 - 【請求項10】手書きされた文字の筆記データに似通っ
ている度合いが大きい、1つ以上の文字を表す文字コー
ドを出力する第1のステップと、 現時点で出力されている文字コードのうちのいずれか1
つを、認識結果として出力する第2のステップとを有
し、 上記第2のステップにおいて、現時点で出力されている
1つ以上の文字コードのうち、前回認識結果として出力
された文字コードで表される文字の字種と同じ字種とな
るような文字を表す文字コードを、優先的に認識結果と
して出力することを特徴とする文字認識方法。 - 【請求項11】手書きされた文字の筆記データに似通っ
ている度合いが大きい、1つ以上の文字を表す文字コー
ドを出力する第1のステップと、 現時点で出力されている文字コードのうちのいずれか1
つを、認識結果として出力する第2のステップとを有
し、 上記第2のステップにおいて、現時点で出力されている
1つ以上の文字コードのうち、該文字コードで表される
文字の字種と前回認識結果として出力された文字コード
で表される文字の字種とが予め決められた同じ字種であ
り、かつ、該文字コードと前回認識結果として出力され
た文字コードとを組にしたものが、連続する2つの認識
結果として過去に出力されたことがある文字コードを、
優先的に認識結果として出力することを特徴とする文字
認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6323031A JPH08180137A (ja) | 1994-12-26 | 1994-12-26 | 文字入力装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6323031A JPH08180137A (ja) | 1994-12-26 | 1994-12-26 | 文字入力装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH08180137A true JPH08180137A (ja) | 1996-07-12 |
Family
ID=18150348
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6323031A Pending JPH08180137A (ja) | 1994-12-26 | 1994-12-26 | 文字入力装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH08180137A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008243227A (ja) * | 2001-10-15 | 2008-10-09 | Silverbrook Research Pty Ltd | 手書き文字認識で使用されるテンプレートを生成する方法および装置 |
-
1994
- 1994-12-26 JP JP6323031A patent/JPH08180137A/ja active Pending
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008243227A (ja) * | 2001-10-15 | 2008-10-09 | Silverbrook Research Pty Ltd | 手書き文字認識で使用されるテンプレートを生成する方法および装置 |
| US7881536B2 (en) | 2001-10-15 | 2011-02-01 | Silverbrook Research Pty Ltd | Identifying a string formed from a number of hand-written characters |
| US8000531B2 (en) | 2001-10-15 | 2011-08-16 | Silverbrook Research Pty Ltd | Classifying a string formed from a known number of hand-written characters |
| US8285048B2 (en) | 2001-10-15 | 2012-10-09 | Silverbrook Research Pty Ltd | Classifying a string formed from hand-written characters |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7283126B2 (en) | System and method for providing gesture suggestions to enhance interpretation of user input | |
| JP3131287B2 (ja) | パターン認識装置 | |
| US6493464B1 (en) | Multiple pen stroke character set and handwriting recognition system with immediate response | |
| US5680480A (en) | Method and apparatus for training a recognizer | |
| US8341556B2 (en) | Method and system for attention-free user input on a computing device | |
| US20060088216A1 (en) | Apparatus, method, and program for handwriting recognition | |
| US20040239534A1 (en) | Component-based, adaptive stroke-order system | |
| JPH06332610A (ja) | 手書き情報入力処理方式 | |
| CA2390503C (en) | System and method for providing gesture suggestions to enhance interpretation of user input | |
| US8849034B2 (en) | System, method, and apparatus for triggering recognition of a handwritten shape | |
| JP2003196593A (ja) | 文字認識装置および文字認識方法および文字認識プログラム | |
| US20020085772A1 (en) | Intelligent correction key | |
| JPH08180137A (ja) | 文字入力装置 | |
| JPH0896081A (ja) | 文字認識装置及び文字認識方法 | |
| JPH0950433A (ja) | 手書き文字認識装置 | |
| JPH07320001A (ja) | 文字認識装置,認識辞書の参照方法 | |
| JP3210778B2 (ja) | 手書き文字認識装置 | |
| JP2804660B2 (ja) | 文書処理装置 | |
| JPH09231310A (ja) | 情報処理装置 | |
| JPH06150066A (ja) | 手書き文字認識装置 | |
| JPS61131089A (ja) | 手書き文字認識装置 | |
| JPH0744658A (ja) | 文字認識装置及び文字認識方法 | |
| JPH09106439A (ja) | 文字認識装置及びその方法及びコンピュータ制御装置 | |
| JPH09204496A (ja) | 文字入力装置 | |
| JPS61138383A (ja) | 手書き文字認識装置 |