JPH0330190B2 - - Google Patents
Info
- Publication number
- JPH0330190B2 JPH0330190B2 JP59052935A JP5293584A JPH0330190B2 JP H0330190 B2 JPH0330190 B2 JP H0330190B2 JP 59052935 A JP59052935 A JP 59052935A JP 5293584 A JP5293584 A JP 5293584A JP H0330190 B2 JPH0330190 B2 JP H0330190B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition result
- recognition
- frequency
- character code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000012937 correction Methods 0.000 claims description 43
- 230000004044 response Effects 0.000 claims description 3
- 230000003416 augmentation Effects 0.000 claims 1
- 239000000945 filler Substances 0.000 description 15
- 238000010586 diagram Methods 0.000 description 9
- 238000000034 method Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
〔発明の技術分野〕
この発明は、用紙等に筆記具等で記入される文
字等を認識し、当該文字を表す文字コードを決定
する文字認識装置に関するものであり、特に記入
者毎に特有な略字等の変形文字の認識に関するも
のである。
字等を認識し、当該文字を表す文字コードを決定
する文字認識装置に関するものであり、特に記入
者毎に特有な略字等の変形文字の認識に関するも
のである。
従来の文字認識装置の多くは、不特定多数の記
入者によつて記入される文字を認識の主対象とし
ているため、多数の記入者が記入する文字パター
ンの平均的な変形を表現すると考えられる1種類
の認識辞書を用いて文字認識を行つていた。この
ため記入者ごとに特有な略字や大きく変形された
文字に対しては誤認識又は認識拒否となる確率が
大きかつた。これを防止するためにはJISで定め
られた標準字形等に倣つて記入することを記入者
に要望していた。
入者によつて記入される文字を認識の主対象とし
ているため、多数の記入者が記入する文字パター
ンの平均的な変形を表現すると考えられる1種類
の認識辞書を用いて文字認識を行つていた。この
ため記入者ごとに特有な略字や大きく変形された
文字に対しては誤認識又は認識拒否となる確率が
大きかつた。これを防止するためにはJISで定め
られた標準字形等に倣つて記入することを記入者
に要望していた。
しかし、標準字形に倣つて記入しなければなら
ないという制限に対しては記入者側の抵抗が少な
くなく、文字認識装置の普及をさまたげる原因と
なつていた。
ないという制限に対しては記入者側の抵抗が少な
くなく、文字認識装置の普及をさまたげる原因と
なつていた。
これを取除くために提案された方法は記入者限
定方式とも称すべきもので、話者限定式の音声認
識装置に類似し、記入者ごとに定められた認識辞
書を使用するものである。この方式の一例として
は特公昭58−53393号公報に開示されており、複
数の認識辞書を備えていて、記入者コードを入力
することによつて当該記入者用の認識辞書を選び
出して使用するものである。この方式では記入者
に依存した字形の変形に対処することはできる
が、以下に述べるような欠点があるために、実用
的とは言い難い。
定方式とも称すべきもので、話者限定式の音声認
識装置に類似し、記入者ごとに定められた認識辞
書を使用するものである。この方式の一例として
は特公昭58−53393号公報に開示されており、複
数の認識辞書を備えていて、記入者コードを入力
することによつて当該記入者用の認識辞書を選び
出して使用するものである。この方式では記入者
に依存した字形の変形に対処することはできる
が、以下に述べるような欠点があるために、実用
的とは言い難い。
すなわち、第1の欠点としては、多数の記入者
に対し使用可能とするためには多数の種類の認識
辞書を必要とし、これを格納するための膨大な記
憶容量を必要とすることである。漢字を認識する
ための認識辞書は1種類で数メガバイトの記憶容
量を必要とし、100種類の認識辞書を格納する場
合、磁気デイスク装置等の外部記憶装置を用いる
にしても、記憶装置が甚だ高価なものになる。
に対し使用可能とするためには多数の種類の認識
辞書を必要とし、これを格納するための膨大な記
憶容量を必要とすることである。漢字を認識する
ための認識辞書は1種類で数メガバイトの記憶容
量を必要とし、100種類の認識辞書を格納する場
合、磁気デイスク装置等の外部記憶装置を用いる
にしても、記憶装置が甚だ高価なものになる。
比較的低価格なフレキシブルデイスク装置等の
外部記憶装置に多数の種類の認識辞書を記憶し、
そのうちから記入者コードによつて選択される1
種類の認識辞書だけを高速メモリに転送して使用
することもできるが、この場合には転送に必要な
時間が大きくなるという欠点がある。
外部記憶装置に多数の種類の認識辞書を記憶し、
そのうちから記入者コードによつて選択される1
種類の認識辞書だけを高速メモリに転送して使用
することもできるが、この場合には転送に必要な
時間が大きくなるという欠点がある。
第2の欠点は、記入者毎の認識辞書を作成する
ことの困難性にある。文字認識装置自体が、記入
者の記入した文字パターンから学習して、当該記
入者に対する認識辞書を作成することは、現在の
技術においては未だに達成されておらず、認識辞
書の作成には多少とも人間の介在を必要とするた
め、多数の種類の認識辞書を作成するには、多数
の技術者の多大の時間を必要とする。
ことの困難性にある。文字認識装置自体が、記入
者の記入した文字パターンから学習して、当該記
入者に対する認識辞書を作成することは、現在の
技術においては未だに達成されておらず、認識辞
書の作成には多少とも人間の介在を必要とするた
め、多数の種類の認識辞書を作成するには、多数
の技術者の多大の時間を必要とする。
また、認識辞書を作成する場合には、1カテゴ
リ当り(1つの文字コード当り)少くとも数十種
類以上の文字パターンを必要とするとされてお
り、数千個以上のカテゴリを対象とする漢字に関
しては、認識辞書作成に必要なすべての文字パタ
ーンを記入者に書かせることはほとんど不可能で
ある。
リ当り(1つの文字コード当り)少くとも数十種
類以上の文字パターンを必要とするとされてお
り、数千個以上のカテゴリを対象とする漢字に関
しては、認識辞書作成に必要なすべての文字パタ
ーンを記入者に書かせることはほとんど不可能で
ある。
第3の欠点としては、認識辞書が登録されてい
ない記入者は使用できないという点がある。この
ため、登録されていない記入者は標準的な文字パ
ターンを記入し、標準的な文字パターンを対象と
する認識辞書を使用せねばならぬという欠点があ
つた。
ない記入者は使用できないという点がある。この
ため、登録されていない記入者は標準的な文字パ
ターンを記入し、標準的な文字パターンを対象と
する認識辞書を使用せねばならぬという欠点があ
つた。
この発明は上記のような従来のものの欠点を除
去するためになされたもので、この発明では標準
的な文字パターンを対象とした認識辞書と、記入
者に対応して更新可能な認識結果修正テーブルを
備え、記入者と装置との間のマンマシンインタフ
エイスを構成するブラウン管表示装置(一般的に
は文字表示手段)及びキーボード(一般的には文
字入力手段)を備え、このマンマシンインタフエ
イスを介して記入者が文字認識結果を修正するこ
とにより認識結果修正テーブルに当該記入者特有
の修正情報を蓄積し、この修正情報が蓄積された
認識結果修正テーブルを用いて修正を行うように
したものである。
去するためになされたもので、この発明では標準
的な文字パターンを対象とした認識辞書と、記入
者に対応して更新可能な認識結果修正テーブルを
備え、記入者と装置との間のマンマシンインタフ
エイスを構成するブラウン管表示装置(一般的に
は文字表示手段)及びキーボード(一般的には文
字入力手段)を備え、このマンマシンインタフエ
イスを介して記入者が文字認識結果を修正するこ
とにより認識結果修正テーブルに当該記入者特有
の修正情報を蓄積し、この修正情報が蓄積された
認識結果修正テーブルを用いて修正を行うように
したものである。
以下この発明の実施例を図面について説明す
る。第1図はこの発明の一実施例を示すブロツク
図であつて、図において、1は用紙、2は走査手
段、3は認識手段、4は認識辞書、5は制御手
段、6は記憶手段、7は文字表示手段、8は文字
入力手段である。認識辞書4は標準的な文字パタ
ーンを対象とする認識辞書である。したがつて
1,2,3,4の動作は標準的な文字パターンを
対象とする認識辞書を備えた従来の装置の動作と
同様であり、よく知られているのでその説明は省
略する。
る。第1図はこの発明の一実施例を示すブロツク
図であつて、図において、1は用紙、2は走査手
段、3は認識手段、4は認識辞書、5は制御手
段、6は記憶手段、7は文字表示手段、8は文字
入力手段である。認識辞書4は標準的な文字パタ
ーンを対象とする認識辞書である。したがつて
1,2,3,4の動作は標準的な文字パターンを
対象とする認識辞書を備えた従来の装置の動作と
同様であり、よく知られているのでその説明は省
略する。
記憶手段6には認識結果修正テーブル(後節で
説明する)が格納されており、制御手段5は汎用
のマイクロプロセツサ等で構成され、認識手段3
から文字の認識結果として出力される文字コード
を記憶手段6に記憶される認識結果修正テーブル
の内容と比較して修正し、最終認識結果とすべき
文字コードを決定し、この決定した文字コードを
文字表示手段7へ入力する。
説明する)が格納されており、制御手段5は汎用
のマイクロプロセツサ等で構成され、認識手段3
から文字の認識結果として出力される文字コード
を記憶手段6に記憶される認識結果修正テーブル
の内容と比較して修正し、最終認識結果とすべき
文字コードを決定し、この決定した文字コードを
文字表示手段7へ入力する。
文字表示手段7は文字コードをアドレスとして
当該文字のドツトパターンが格納されているフオ
ントメモリを内蔵し、入力された文字コードによ
つてフオントメモリから当該文字のドツトパター
ンを読出してこれをブラウン管表示面に表示す
る。
当該文字のドツトパターンが格納されているフオ
ントメモリを内蔵し、入力された文字コードによ
つてフオントメモリから当該文字のドツトパター
ンを読出してこれをブラウン管表示面に表示す
る。
記入者は文字表示手段7に表示された文字配列
を観察し、その文字配列中に誤認識文字があつた
場合には、その誤認識文字を文字入力手段8から
の入力によつて正しい文字に置換する。入力すべ
き文字がローマ字やかな文字等の場合は、文字入
力手段8のキーボードのキーに当該文字が書いて
あるキーを操作すればその文字の文字コードを入
力することができ、入力すべき文字が漢字の場合
は、かな漢字変換技術等を利用し、かな文字をキ
ーインすることにより、所望の漢字を入力するこ
とができる。制御手段5の中には文字表示手段7
に表示される文字の配列に対応した位置に文字コ
ードの配列を記憶するリフレツシユメモリが内蔵
されており、文字表示手段7の表示面のカーソル
位置を文字入力手段8からの入力によつて所望の
位置に設定した上で、所望の文字をキーインする
と、上記カーソル位置に対応するリフレツシユメ
モリの位置の文字コードがキーインされた文字の
文字コードに修正され、この修正された文字コー
ドに対応する文字のドツトパターンが文字表示手
段7上に表示される。すべての誤認識文字に対す
る修正を終ると、記入者は文字入力手段8を用い
て制御手段5に終了信号を送る。
を観察し、その文字配列中に誤認識文字があつた
場合には、その誤認識文字を文字入力手段8から
の入力によつて正しい文字に置換する。入力すべ
き文字がローマ字やかな文字等の場合は、文字入
力手段8のキーボードのキーに当該文字が書いて
あるキーを操作すればその文字の文字コードを入
力することができ、入力すべき文字が漢字の場合
は、かな漢字変換技術等を利用し、かな文字をキ
ーインすることにより、所望の漢字を入力するこ
とができる。制御手段5の中には文字表示手段7
に表示される文字の配列に対応した位置に文字コ
ードの配列を記憶するリフレツシユメモリが内蔵
されており、文字表示手段7の表示面のカーソル
位置を文字入力手段8からの入力によつて所望の
位置に設定した上で、所望の文字をキーインする
と、上記カーソル位置に対応するリフレツシユメ
モリの位置の文字コードがキーインされた文字の
文字コードに修正され、この修正された文字コー
ドに対応する文字のドツトパターンが文字表示手
段7上に表示される。すべての誤認識文字に対す
る修正を終ると、記入者は文字入力手段8を用い
て制御手段5に終了信号を送る。
制御手段5はこの終了信号を受けた時点のリフ
レツシユメモリの内容を正しい認識として、記憶
手段6内の認識結果修正テーブルの内容を更新す
る。
レツシユメモリの内容を正しい認識として、記憶
手段6内の認識結果修正テーブルの内容を更新す
る。
第2図はこの発明の動作による認識結果の一例
を示す図で、9,10,11,12は用紙1に記
入された文字、13,14,15,16は9,1
0,11,12がそれぞれ認識された文字コード
を表す。入力文字9では問を略字で記入したため
「同」と誤認識され、入力文字10では層を略字
で記入したため「乃」と誤認識され、入力文字1
1では機を略字で記入したため「桟」(サン)と
認識され、入力文字12では訣が認識辞書4中に
存在しない(すなわち訣は外字である)ため
「訳」(ヤク)と誤認識された例を示す。
を示す図で、9,10,11,12は用紙1に記
入された文字、13,14,15,16は9,1
0,11,12がそれぞれ認識された文字コード
を表す。入力文字9では問を略字で記入したため
「同」と誤認識され、入力文字10では層を略字
で記入したため「乃」と誤認識され、入力文字1
1では機を略字で記入したため「桟」(サン)と
認識され、入力文字12では訣が認識辞書4中に
存在しない(すなわち訣は外字である)ため
「訳」(ヤク)と誤認識された例を示す。
第3図は記憶装置6に格納されている認識結果
修正テーブルの一部の初期状態を示す図である。
図において、13aは認識結果、17aは最終認
識結果、18aは頻度である。初期状態であるた
め認識結果と最終認識結果が一致し、その頻度は
1であつて、最終認識結果の他のらんは空らんと
なつている。第3図の認識結果のらんは第2図に
関連した説明の便宜のために仮に集めて配列した
ものであつて、認識結果修正テーブル内の配列は
アドレスの容易なように文字コードのビツトパタ
ーンに従い、あるいはJISの漢字コードの順に配
列されている。
修正テーブルの一部の初期状態を示す図である。
図において、13aは認識結果、17aは最終認
識結果、18aは頻度である。初期状態であるた
め認識結果と最終認識結果が一致し、その頻度は
1であつて、最終認識結果の他のらんは空らんと
なつている。第3図の認識結果のらんは第2図に
関連した説明の便宜のために仮に集めて配列した
ものであつて、認識結果修正テーブル内の配列は
アドレスの容易なように文字コードのビツトパタ
ーンに従い、あるいはJISの漢字コードの順に配
列されている。
ある記入者が、初めて第1図に示す装置を使用
する場合には、初期状態の認識結果修正テーブル
が格納されているフレキシブルシートをフレキシ
ブルデイスク装置等の記憶手段に差込み、用紙1
上に手書きによつて入力文字9〜12(第2図の
場合)を記入したとすると、従来の装置における
と同様の動作により、認識手段3からは第2図1
3〜16に示す認識結果が出力される。制御手段
5は認識結果修正テーブルを参照して修正を行う
のであるが、この場合、第3図に示すように認識
結果13aと最終認識結果17aとは同一である
ため、何等修正されることなく第2図13〜16
に示す認識結果がそのまま文字表示手段7に表示
される。
する場合には、初期状態の認識結果修正テーブル
が格納されているフレキシブルシートをフレキシ
ブルデイスク装置等の記憶手段に差込み、用紙1
上に手書きによつて入力文字9〜12(第2図の
場合)を記入したとすると、従来の装置における
と同様の動作により、認識手段3からは第2図1
3〜16に示す認識結果が出力される。制御手段
5は認識結果修正テーブルを参照して修正を行う
のであるが、この場合、第3図に示すように認識
結果13aと最終認識結果17aとは同一である
ため、何等修正されることなく第2図13〜16
に示す認識結果がそのまま文字表示手段7に表示
される。
記入者は、先に説明したように、文字入力手段
8を用いて誤認識文字を正しい文字に置換する。
この置換操作によつて、文字表示手段7に表示さ
れた文字パターンが修正され、この文字に対応す
る制御手段5のリフレツシユメモリ内の文字コー
ドが修正され、認識結果修正テーブルが更新され
る。文字表示手段7の表示とリフレツシユメモリ
の文字コードの修正については既に説明した所で
あるが、たとえば、認識結果13として文字表示
手段7に表示される「同」を「間」に修正した場
合は、認識結果修正テーブルの修正は次のように
して行われる。
8を用いて誤認識文字を正しい文字に置換する。
この置換操作によつて、文字表示手段7に表示さ
れた文字パターンが修正され、この文字に対応す
る制御手段5のリフレツシユメモリ内の文字コー
ドが修正され、認識結果修正テーブルが更新され
る。文字表示手段7の表示とリフレツシユメモリ
の文字コードの修正については既に説明した所で
あるが、たとえば、認識結果13として文字表示
手段7に表示される「同」を「間」に修正した場
合は、認識結果修正テーブルの修正は次のように
して行われる。
すなわち、第2図の認識結果13〜16が認識
手段3から制御手段5に入力されると、この認識
結果13〜16に対応する認識結果修正テーブル
の部分が記憶手段6から読出されて制御手段5内
のデータメモリ領域に一時書込まれる。第3図は
その書込まれた記憶であると見ることができる。
但し、第3図中「間」「層」「機」の行は説明の参
考のために併記した部分で制御手段5内に書込む
必要はない。認識結果修正テーブルから制御手段
5内に書込んだ部分を用いて、認識手段3からの
入力を修正するが、第3図に示すように、認識結
果修正テーブルが初期状態の時は、先に説明した
ように、修正が行われず、文字表示手段7には、
たとえば、「同題」13として表示される。記入
者が「同」を「問」と修正したとき、制御手段5
内のリフレツシユメモリの文字コード(同)が文
字コード(問)と修正されると同時に第3図の認
識結果「同」の行の最終認識結果の第1列が
「問」の文字コードに修正されその頻度らんに1
が記入され、第1列に前から記憶されていたデー
タは第2列にシフトされる。
手段3から制御手段5に入力されると、この認識
結果13〜16に対応する認識結果修正テーブル
の部分が記憶手段6から読出されて制御手段5内
のデータメモリ領域に一時書込まれる。第3図は
その書込まれた記憶であると見ることができる。
但し、第3図中「間」「層」「機」の行は説明の参
考のために併記した部分で制御手段5内に書込む
必要はない。認識結果修正テーブルから制御手段
5内に書込んだ部分を用いて、認識手段3からの
入力を修正するが、第3図に示すように、認識結
果修正テーブルが初期状態の時は、先に説明した
ように、修正が行われず、文字表示手段7には、
たとえば、「同題」13として表示される。記入
者が「同」を「問」と修正したとき、制御手段5
内のリフレツシユメモリの文字コード(同)が文
字コード(問)と修正されると同時に第3図の認
識結果「同」の行の最終認識結果の第1列が
「問」の文字コードに修正されその頻度らんに1
が記入され、第1列に前から記憶されていたデー
タは第2列にシフトされる。
正しい文字への置換が終了すると、記入者は文
字入力手段8を用いて制御部5に終了信号を送
る。その時点において制御部5内の認識結果修正
テーブルの1部は第4図に示すとおりになつてい
る。第4図において「題」13c、「高」14a、
「械」15c、「別」16bは修正を受けなかつた
ので頻度らんに1が加算されて2になつている。
最終認識結果の配列は頻度の高いものを前の列に
し、同一頻度のものは後から出て来た文字コード
を前の列にする。
字入力手段8を用いて制御部5に終了信号を送
る。その時点において制御部5内の認識結果修正
テーブルの1部は第4図に示すとおりになつてい
る。第4図において「題」13c、「高」14a、
「械」15c、「別」16bは修正を受けなかつた
ので頻度らんに1が加算されて2になつている。
最終認識結果の配列は頻度の高いものを前の列に
し、同一頻度のものは後から出て来た文字コード
を前の列にする。
制御部5は終了信号を受けると制御部5内で修
正された内容に従つて記憶手段6内の認識結果修
正テーブルを修正する。
正された内容に従つて記憶手段6内の認識結果修
正テーブルを修正する。
また、認識手段3は1個の文字パターンに対し
複数の文字コードと、その確からしさの順位を付
して出力し、この複数の文字コードをそれぞれの
文字のドツトパターンとして文字表示手段7に表
示し、記入者がいずれかの文字を選択するように
構成することもできる。
複数の文字コードと、その確からしさの順位を付
して出力し、この複数の文字コードをそれぞれの
文字のドツトパターンとして文字表示手段7に表
示し、記入者がいずれかの文字を選択するように
構成することもできる。
以上のようにして、フレキシブルシート中には
当該記入者に対応する認識結果修正テーブルの情
報が順次蓄積されてゆくが、当該記入者が第1図
の装置の使用を終了したときは、自分の用いるフ
レキシブルシートを記憶手段6から取り出して別
に保管し、次に第1図の装置を使用するときに再
び記憶手段6に装着すればよい。
当該記入者に対応する認識結果修正テーブルの情
報が順次蓄積されてゆくが、当該記入者が第1図
の装置の使用を終了したときは、自分の用いるフ
レキシブルシートを記憶手段6から取り出して別
に保管し、次に第1図の装置を使用するときに再
び記憶手段6に装着すればよい。
たとえば、認識結果修正テーブルの内容が第5
図のようになつている場合、第2図入力文字9〜
12が再び入力されると、文字表示手段7には最
終認識結果の正しい文字が表示され、記入者はこ
れを確認して終了信号を送るだけでよく、この場
合認識結果修正テーブルでは頻度のらんが更新さ
れる。第5図はこの更新された認識結果修正テー
ブルを示す。第3図乃至第5図において左のらん
外に斜線を施した行は第3図について説明したと
おり、第2図の9〜12に示す入力文字には直接
関係のない部分である。
図のようになつている場合、第2図入力文字9〜
12が再び入力されると、文字表示手段7には最
終認識結果の正しい文字が表示され、記入者はこ
れを確認して終了信号を送るだけでよく、この場
合認識結果修正テーブルでは頻度のらんが更新さ
れる。第5図はこの更新された認識結果修正テー
ブルを示す。第3図乃至第5図において左のらん
外に斜線を施した行は第3図について説明したと
おり、第2図の9〜12に示す入力文字には直接
関係のない部分である。
第6図は特定の記入者が、この発明の装置を多
数回使用した場合、その記入者に対する認識結果
修正テーブルの内容の一部の一例を示す図であ
る。この記入者は第2図9〜12に示すような略
字を使用するため、認識結果が「問」13a、
「層」14b、「機」15aとなるのは他の文字の
文字パターンが誤認識された場合が大部分であ
り、「題」13c、「高」14a、「械」15c、
「別」16bは大部分が正しく認識されたことを
示す。また、「乃」14cと「桟」15b(サン)
はこの記入者によつてほとんど使用されず、「層」
と「機」に修正されたことを示す。また「同」1
3bは「同」、「問」、「間」から「同」13bと認
識されることが多く、最終認識結果はこれらの文
字の使用頻度で決定される。「訳」16aも使用
頻度が高く、「訳」と最終認識されることが多い
が、外字の「訣」が「訳」と認識されたことがあ
る事実を示す。
数回使用した場合、その記入者に対する認識結果
修正テーブルの内容の一部の一例を示す図であ
る。この記入者は第2図9〜12に示すような略
字を使用するため、認識結果が「問」13a、
「層」14b、「機」15aとなるのは他の文字の
文字パターンが誤認識された場合が大部分であ
り、「題」13c、「高」14a、「械」15c、
「別」16bは大部分が正しく認識されたことを
示す。また、「乃」14cと「桟」15b(サン)
はこの記入者によつてほとんど使用されず、「層」
と「機」に修正されたことを示す。また「同」1
3bは「同」、「問」、「間」から「同」13bと認
識されることが多く、最終認識結果はこれらの文
字の使用頻度で決定される。「訳」16aも使用
頻度が高く、「訳」と最終認識されることが多い
が、外字の「訣」が「訳」と認識されたことがあ
る事実を示す。
第7図は第1図の文字表示手段7の表示例を示
す図であつて、19は制御手段5から出力される
最終認識結果の文字列、20,21はそれぞれ文
字列19の文字「訳」、「別」がそれぞれ第1列目
に存在する認識結果修正テーブル(第6図16
a,16b)の各行の内容を示す。記入者は2
0,21の表示中から選択して19の表示を修正
することができるので、修正すべき文字の文字コ
ードの入力が容易となる。
す図であつて、19は制御手段5から出力される
最終認識結果の文字列、20,21はそれぞれ文
字列19の文字「訳」、「別」がそれぞれ第1列目
に存在する認識結果修正テーブル(第6図16
a,16b)の各行の内容を示す。記入者は2
0,21の表示中から選択して19の表示を修正
することができるので、修正すべき文字の文字コ
ードの入力が容易となる。
以上のようにして、この発明によれば記入者個
有の略字も認識できるようになるが、第6図に示
すとおり、たとえば「乃」及び「桟」(サン)を
それぞれ「層」及び「機」と誤認識することがあ
る。しかし、この記入者は「乃」及び「桟」(サ
ン)は第6図に示すとおり殆んど使用していない
ので問題は少い。
有の略字も認識できるようになるが、第6図に示
すとおり、たとえば「乃」及び「桟」(サン)を
それぞれ「層」及び「機」と誤認識することがあ
る。しかし、この記入者は「乃」及び「桟」(サ
ン)は第6図に示すとおり殆んど使用していない
ので問題は少い。
個々の記入者が実際に手書き文字として使用す
る字種は比較的限られた数である。たとえば、漢
字を対象とする文字認識装置においては認識辞書
4内の文字コードの種類はJIS第1水準の約3000
字程度であるとし、仮に認識結果修正テーブルの
認識結果列には3000字の文字コードを配列したと
しても、個々の記入者に限定すれば800字程度が
使用されるものであり、認識結果修正テーブルか
らも上記800字程度の字種に対し読出し書込みが
行われるのである。たとえば、電子工学の技術者
が作成する文章には「乃」とか「桟」(サン)と
かは殆んど含まれておらず、このような文字を誤
認識しても、略字を認識できる方が遥かに効果が
ある。
る字種は比較的限られた数である。たとえば、漢
字を対象とする文字認識装置においては認識辞書
4内の文字コードの種類はJIS第1水準の約3000
字程度であるとし、仮に認識結果修正テーブルの
認識結果列には3000字の文字コードを配列したと
しても、個々の記入者に限定すれば800字程度が
使用されるものであり、認識結果修正テーブルか
らも上記800字程度の字種に対し読出し書込みが
行われるのである。たとえば、電子工学の技術者
が作成する文章には「乃」とか「桟」(サン)と
かは殆んど含まれておらず、このような文字を誤
認識しても、略字を認識できる方が遥かに効果が
ある。
また、たとえば、「桟」(サン)を認識辞書4か
ら除外しても、「機」に対する略字「桟」を記入
した場合、これが「機」と認識される確率は少
く、他の文字に認識されることが多いので、認識
手段3では「桟」(サン)と認識させておいて、
制御手段5により「機」に修正した方がよい。
ら除外しても、「機」に対する略字「桟」を記入
した場合、これが「機」と認識される確率は少
く、他の文字に認識されることが多いので、認識
手段3では「桟」(サン)と認識させておいて、
制御手段5により「機」に修正した方がよい。
文字認識に頻度を利用することは従来の装置に
おいても行われたが、この発明における頻度の利
用とは本質的に異るものである。たとえば、従来
の装置では、認識手段から複数の認識候補文字の
文字コードとその文字パターンの類似度とを出力
し、この類似度と当該文字の使用頻度との関数に
よつて最も確からしい文字コードを決定するもの
であり、認識候補文字中に正しい文字が含まれて
いない場合は、正しく認識されることがない。
おいても行われたが、この発明における頻度の利
用とは本質的に異るものである。たとえば、従来
の装置では、認識手段から複数の認識候補文字の
文字コードとその文字パターンの類似度とを出力
し、この類似度と当該文字の使用頻度との関数に
よつて最も確からしい文字コードを決定するもの
であり、認識候補文字中に正しい文字が含まれて
いない場合は、正しく認識されることがない。
また、かな漢字変換では、同音語の選択基準の
1つとして使用頻度が利用されることがあるが、
これは、同一読みから選択され得る文字の種類に
変化を生ずることはなく、この発明の認識結果修
正テーブルように最終認識結果が変化するように
利用されるのとは異なる。
1つとして使用頻度が利用されることがあるが、
これは、同一読みから選択され得る文字の種類に
変化を生ずることはなく、この発明の認識結果修
正テーブルように最終認識結果が変化するように
利用されるのとは異なる。
なお、第6図において認識結果らんの「同」1
3bの最終認識結果の頻度が「同」65、「問」
60、「間」55で3者の間の混同は避け難いが、
これはこの発明に係る文字認識装置の限界であつ
て、マンマシンインタフエイスを介して修正しな
ければならぬ問題である。
3bの最終認識結果の頻度が「同」65、「問」
60、「間」55で3者の間の混同は避け難いが、
これはこの発明に係る文字認識装置の限界であつ
て、マンマシンインタフエイスを介して修正しな
ければならぬ問題である。
なお、以上の説明で、文字表示手段7を観察し
文字入力手段8を操作する操作者は、用紙1へ文
字を記入した記入者と同一人と想定して説明した
が、操作者と記入者が同一人でなくても差支えな
いことは申すまでもない。
文字入力手段8を操作する操作者は、用紙1へ文
字を記入した記入者と同一人と想定して説明した
が、操作者と記入者が同一人でなくても差支えな
いことは申すまでもない。
更に、記入者別の認識結果修正テーブルが、そ
れぞれ別のフレキシブルシートに格納されるとし
て説明したが、すべての記入者に対する認識結果
修正テーブルを記憶手段6にまとめて格納し、記
入者に対応した識別コード等を文字入力手段8か
ら入力することによつて当該記入者に対応する認
識結果修正テーブルを選択し、又は用紙1上の所
定の位置に記入者を識別する文字又は識別コード
を記入しておき、これを認識して当該記入者に対
応する認識結果修正テーブルを選択することがで
きる。認識結果修正テーブルは文字コードを記憶
するだけでよく、比較的小容量の記憶装置に格納
することができる。
れぞれ別のフレキシブルシートに格納されるとし
て説明したが、すべての記入者に対する認識結果
修正テーブルを記憶手段6にまとめて格納し、記
入者に対応した識別コード等を文字入力手段8か
ら入力することによつて当該記入者に対応する認
識結果修正テーブルを選択し、又は用紙1上の所
定の位置に記入者を識別する文字又は識別コード
を記入しておき、これを認識して当該記入者に対
応する認識結果修正テーブルを選択することがで
きる。認識結果修正テーブルは文字コードを記憶
するだけでよく、比較的小容量の記憶装置に格納
することができる。
記入者の同定が不可能な場合は、認識手段3の
出力をそのまま制御手段5を介し文字表示手段7
に表示すればよい。
出力をそのまま制御手段5を介し文字表示手段7
に表示すればよい。
また、以上の説明では、認識手段3からは、1
つの文字パターンに対応して1つの文字コードだ
けを出力したが、これを、1つの文字パターンに
対応して複数の文字コードを、当該文字コードの
基準パターンに対する類似度と共に出力してもよ
いとし、制御手段5においても各文字コードに対
する類似度をも参照して最終認識結果を決定する
こともできる。
つの文字パターンに対応して1つの文字コードだ
けを出力したが、これを、1つの文字パターンに
対応して複数の文字コードを、当該文字コードの
基準パターンに対する類似度と共に出力してもよ
いとし、制御手段5においても各文字コードに対
する類似度をも参照して最終認識結果を決定する
こともできる。
更には、記入者がタブレツト等に手書きする文
字を実時間で認識するオンライン認識にも適用す
ることができる。オンライン認識では記入者毎の
特性が表われやすい筆順情報を利用することが多
く、この発明の効果も発揮されやすい。
字を実時間で認識するオンライン認識にも適用す
ることができる。オンライン認識では記入者毎の
特性が表われやすい筆順情報を利用することが多
く、この発明の効果も発揮されやすい。
以上のようにこの発明によれば、記入者毎に備
えられる認識結果修正テーブルによつて最終認識
結果を決定し、かつ認識結果修正テーブルは使用
するたびに増補改訂が行われるので、各記入者の
記入した文字を正確に文字認識することができ
る。
えられる認識結果修正テーブルによつて最終認識
結果を決定し、かつ認識結果修正テーブルは使用
するたびに増補改訂が行われるので、各記入者の
記入した文字を正確に文字認識することができ
る。
第1図はこの発明の一実施例を示すブロツク
図、第2図はこの発明の動作による認識結果の一
例を示す図、第3図、第4図、第5図、第6図は
それぞれこの発明の認識結果修正テーブルの一部
の内容を示す図、第7図は第1図の文字表示手段
の表示例を示す図である。 1……用紙、2……走査手段、3……認識手
段、4……認識辞書、5……制御手段、6……記
憶手段、7……文字表示手段、8……文字入力手
段。
図、第2図はこの発明の動作による認識結果の一
例を示す図、第3図、第4図、第5図、第6図は
それぞれこの発明の認識結果修正テーブルの一部
の内容を示す図、第7図は第1図の文字表示手段
の表示例を示す図である。 1……用紙、2……走査手段、3……認識手
段、4……認識辞書、5……制御手段、6……記
憶手段、7……文字表示手段、8……文字入力手
段。
Claims (1)
- 【特許請求の範囲】 1 用紙等に記入される文字等を光電変換して当
該文字等の文字パターンを表す電気信号を出力す
る走査手段、 認識対象文字等の基準的なパターンと、各基準
パターンに相当する文字等の文字コードとの対応
を記憶する認識辞書、 上記走査手段から出力される文字パターンを上
記認識辞書内の基準パターンと対照して上記走査
手段から出力される文字パターンに対応する文字
コードを決定する認識手段、 上記認識辞書内のすべての文字コードを認識結
果らんに配列し、この認識結果らんの各文字コー
ドに対し複数の文字コードとその出現頻度とを示
す数値とが書込まれる最終認識結果と頻度らんを
備えた認識結果修正テーブル、 上記用紙等に記入することのある記入者ごとに
上記認識結果修正テーブルを備え、初期状態にお
ける認識結果修正テーブルの上記最終認識結果と
頻度らんの先頭位置に、対応する認識結果らんの
文字コードを書込みその頻度として数値1を書込
み、上記用紙等の記入者毎に当該記入者に対応す
る認識結果修正テーブルを選択使用する手段、 上記認識手段が決定した文字コードを入力し上
記認識結果修正テーブルを参照し、上記入力した
文字コードと同一の文字コードが記憶されている
認識結果らんに対応する最終認識結果と頻度らん
の先頭の文字コードを読出す制御手段、 この制御手段が読出した文字コードを当該文字
のドツトパターンに変換して表示面上に表示する
文字表示手段、 この文字表示手段に表示された文字のドツトパ
ターンを観察して、必要な場合は、修正すべき文
字の文字コードを入力し、上記文字表示手段に表
示される文字を修正する文字入力手段、 この文字入力手段によつて必要な修正が行われ
た後の上記文字表示手段の表示内容に従つて上記
認識結果修正テーブルへの書込みを行い、上記認
識結果らんに対応して上記文字表示手段を表示さ
れている文字の文字コードが最終認識結果と頻度
らんに既に記憶されているときは当該文字コード
に対応する頻度に数値1を加算し、上記文字表示
手段に表示されている文字の文字コードが上記最
終認識結果と頻度らんに存在しないときは上記最
終認識結果と頻度らんの空らんの場所に当該文字
コードと頻度としての数値1とを書込み、同一の
最終認識結果らんにおいては頻度の最大の文字コ
ードを先頭に配置し、頻度の最大の文字コードが
複数種類存在するときはその中で最近に当該頻度
に到達した文字コードを先頭に配置する認識結果
修正テーブルの増補改訂手段を備えた文字認識装
置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59052935A JPS60196886A (ja) | 1984-03-19 | 1984-03-19 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59052935A JPS60196886A (ja) | 1984-03-19 | 1984-03-19 | 文字認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS60196886A JPS60196886A (ja) | 1985-10-05 |
| JPH0330190B2 true JPH0330190B2 (ja) | 1991-04-26 |
Family
ID=12928713
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59052935A Granted JPS60196886A (ja) | 1984-03-19 | 1984-03-19 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS60196886A (ja) |
-
1984
- 1984-03-19 JP JP59052935A patent/JPS60196886A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS60196886A (ja) | 1985-10-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5550930A (en) | Method and system for training a handwriting recognizer at the time of misrecognition | |
| EP0645730B1 (en) | Handwritten keyboardless-entry computer system | |
| US5157737A (en) | Handwritten keyboardless entry computer system | |
| US6493464B1 (en) | Multiple pen stroke character set and handwriting recognition system with immediate response | |
| US4327421A (en) | Chinese printing system | |
| KR20210128603A (ko) | 폰트 생성 방법 및 시스템 | |
| JP3394694B2 (ja) | フォーマット情報登録方法及びocrシステム | |
| JPH0330190B2 (ja) | ||
| JP3365538B2 (ja) | オンライン文字認識方法および装置 | |
| JPH037992B2 (ja) | ||
| JPS6054709B2 (ja) | 文字認識方法および文字認識装置 | |
| JPH0152787B2 (ja) | ||
| JPS6331832B2 (ja) | ||
| JP2578748B2 (ja) | 手書情報処理方法 | |
| JPS6061875A (ja) | パターン認識装置における標準パターン作成方法 | |
| JP2674542B2 (ja) | 手書き文字認識装置 | |
| JPS63303482A (ja) | 文字認識後処理方式 | |
| JPH0365587B2 (ja) | ||
| JPH07271897A (ja) | 文字認識装置 | |
| JP3481850B2 (ja) | 文字認識装置 | |
| JPH06187486A (ja) | 手書き文字入力装置 | |
| JPH07192081A (ja) | 手書き文字入力装置 | |
| JPS61133487A (ja) | 文字認識装置 | |
| JPS595385A (ja) | 手書文字/図形認識装置 | |
| JPH04268986A (ja) | 文字認識装置 |