JPH0319589B2 - - Google Patents
Info
- Publication number
- JPH0319589B2 JPH0319589B2 JP58203843A JP20384383A JPH0319589B2 JP H0319589 B2 JPH0319589 B2 JP H0319589B2 JP 58203843 A JP58203843 A JP 58203843A JP 20384383 A JP20384383 A JP 20384383A JP H0319589 B2 JPH0319589 B2 JP H0319589B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- kanji
- word
- character
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000013139 quantization Methods 0.000 claims description 7
- 230000003287 optical effect Effects 0.000 claims description 4
- 238000012015 optical character recognition Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 235000001630 Pyrus pyrifolia var culta Nutrition 0.000 description 1
- 240000002609 Pyrus pyrifolia var. culta Species 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は、特に手書き漢字を認識するための光
学的文字読取装置に関する。
学的文字読取装置に関する。
〔発明の技術的背景とその問題点〕
近年、手書き漢字認識用の光学的文字読取装置
(OCR)には、認識精度を向上させるために手書
き漢字に対応する振り仮名文字(通常片仮名文
字)の読取結果をガイドとして、漢字の認識処理
を行なう方式のものが開発されている(特願照56
−99573)。
(OCR)には、認識精度を向上させるために手書
き漢字に対応する振り仮名文字(通常片仮名文
字)の読取結果をガイドとして、漢字の認識処理
を行なう方式のものが開発されている(特願照56
−99573)。
この方式のOCRでは、帳票上に予め漢字に対
応する振り仮名文字が記入されており、この振り
仮名文字の読取結果に基づいて漢字の認識結果か
ら得られる複数の候補文字から答となる認識結果
が選択されるように構成されている。
応する振り仮名文字が記入されており、この振り
仮名文字の読取結果に基づいて漢字の認識結果か
ら得られる複数の候補文字から答となる認識結果
が選択されるように構成されている。
しかしながら上記のような方式のOCRは、漢
字の認識精度が振り仮名文字(片仮名文字)の認
識結果に依存しており、振り仮名文字の認識処理
が高精度で行なわれることにより有効となる方式
である。このため、例えば月見里(ヤマナシ)、
五月雨(サミダレ)などのように特殊な読み方の
漢字には予め正しい振り仮名を付すことが困難で
あるため、上記のような方式のOCRでは読取ミ
スが生ずることがある。また、通常の漢字の場合
でも、振り仮名文字である片仮名文字を完全に認
識することは不可能であるため、高い精度で漢字
を読取ることは困難である。
字の認識精度が振り仮名文字(片仮名文字)の認
識結果に依存しており、振り仮名文字の認識処理
が高精度で行なわれることにより有効となる方式
である。このため、例えば月見里(ヤマナシ)、
五月雨(サミダレ)などのように特殊な読み方の
漢字には予め正しい振り仮名を付すことが困難で
あるため、上記のような方式のOCRでは読取ミ
スが生ずることがある。また、通常の漢字の場合
でも、振り仮名文字である片仮名文字を完全に認
識することは不可能であるため、高い精度で漢字
を読取ることは困難である。
本発明は上記の事情に鑑みてなされたもので、
その目的は、振り仮名文字の認識結果を参照して
漢字の認識を行なう方式のOCRにおいて、高い
精度で漢字の認識を行なうことができる光学的文
字読取装置を提供することにある。
その目的は、振り仮名文字の認識結果を参照して
漢字の認識を行なう方式のOCRにおいて、高い
精度で漢字の認識を行なうことができる光学的文
字読取装置を提供することにある。
本発明では、漢字及びその漢字に対応する振り
仮名文字が記録された帳票に対して、各文字を文
字単位で認識する文字認識手段が設けられる。こ
の文字認識手段の文字単位の各認識結果に基づい
て、漢字及び振り仮名のそれぞれからなる単語が
単語認識手段により認識される。単語認識手段
は、予め用意されている単語認識用テーブルを参
照して各単語単の認識処理を行なう。
仮名文字が記録された帳票に対して、各文字を文
字単位で認識する文字認識手段が設けられる。こ
の文字認識手段の文字単位の各認識結果に基づい
て、漢字及び振り仮名のそれぞれからなる単語が
単語認識手段により認識される。単語認識手段
は、予め用意されている単語認識用テーブルを参
照して各単語単の認識処理を行なう。
制御手段は、単語認識手段からの各単語単位の
認識結果を照合し、その照合結果が漢字および振
り仮名文字の各単語単位の認識結果が相互に対応
する場合にその各認識結果を最終的答として出力
するように構成されている。
認識結果を照合し、その照合結果が漢字および振
り仮名文字の各単語単位の認識結果が相互に対応
する場合にその各認識結果を最終的答として出力
するように構成されている。
これにより、漢字及び振り仮名の各文字を同時
にしかも正確に認識でき、結果的に高い精度で漢
字を読取ることができるものである。
にしかも正確に認識でき、結果的に高い精度で漢
字を読取ることができるものである。
以下図面を参照して本発明の一実施例について
説明する。第1図は一実施例に係わるOCRの部
分的構成を示すブロツク図である。第1図におい
て、走査部10は帳票(第2図に示す)上を走査
してその帳票に記録された漢字及び振り仮名用片
仮名文字のそれぞれを光電変換し、各量子化パタ
ーン(2値化信号からなる文字パターン)を文字
認識部11へ出力する。この文字認識部11は、
走査部10から送られる量子化パターンに基づい
て帳票上の、漢字及び振り仮名用片仮名文字の認
識処理を文字単位で行なう。
説明する。第1図は一実施例に係わるOCRの部
分的構成を示すブロツク図である。第1図におい
て、走査部10は帳票(第2図に示す)上を走査
してその帳票に記録された漢字及び振り仮名用片
仮名文字のそれぞれを光電変換し、各量子化パタ
ーン(2値化信号からなる文字パターン)を文字
認識部11へ出力する。この文字認識部11は、
走査部10から送られる量子化パターンに基づい
て帳票上の、漢字及び振り仮名用片仮名文字の認
識処理を文字単位で行なう。
単語認識部12は、文字認識部11から出力さ
れる漢字及び片仮名文字の各認識結果(文字単
位)に基づいて、それぞれの文字からなる各単語
を認識する。単語認識部12は、予め漢字及び片
仮名文字のそれぞれについて単語単位の認識用テ
ーブル(辞書)を記憶している。制御部13は、
単語認識部12から出力される漢字及び片仮名文
字の各単語単位の認識結果を照合し、その照合結
果において各単語単位の認識結果が相互に対応す
る場合にその各認識結果を最終的答として出力す
る。また、制御部13は走査部10、文字認識部
11及び単語認識部12の各動作を制御する。
れる漢字及び片仮名文字の各認識結果(文字単
位)に基づいて、それぞれの文字からなる各単語
を認識する。単語認識部12は、予め漢字及び片
仮名文字のそれぞれについて単語単位の認識用テ
ーブル(辞書)を記憶している。制御部13は、
単語認識部12から出力される漢字及び片仮名文
字の各単語単位の認識結果を照合し、その照合結
果において各単語単位の認識結果が相互に対応す
る場合にその各認識結果を最終的答として出力す
る。また、制御部13は走査部10、文字認識部
11及び単語認識部12の各動作を制御する。
上記のような構成のOCRにおいて、その動作
を説明する。先ず、第2図に示すような帳票が走
査部10により走査されて、その帳票上に記録さ
れた漢字及びその振り仮名用片仮名がそれぞれ量
子化パターンに変換されて文字認識部11に送ら
れる。ここで、帳票には第2図に示すように漢字
20が記入される文字エリア21及びその漢字2
0に対応する振り仮名用片仮名文字(以下単にカ
タカナと称する)22が記入される文字エリア2
3が予め設けられている。走査部10からは、帳
票上の漢字20及びカタカナ22に対応する各量
子化パターンが文字認識部11へ送られる。文字
認識部11では、走査部10からの各量子化パタ
ーンに基づいて漢字20及びカタカナ22に対す
る文字単位の認識処理が行なわれる。
を説明する。先ず、第2図に示すような帳票が走
査部10により走査されて、その帳票上に記録さ
れた漢字及びその振り仮名用片仮名がそれぞれ量
子化パターンに変換されて文字認識部11に送ら
れる。ここで、帳票には第2図に示すように漢字
20が記入される文字エリア21及びその漢字2
0に対応する振り仮名用片仮名文字(以下単にカ
タカナと称する)22が記入される文字エリア2
3が予め設けられている。走査部10からは、帳
票上の漢字20及びカタカナ22に対応する各量
子化パターンが文字認識部11へ送られる。文字
認識部11では、走査部10からの各量子化パタ
ーンに基づいて漢字20及びカタカナ22に対す
る文字単位の認識処理が行なわれる。
文字認識部11で認識された文字単位の各認識
結果は、順次単語認識部12へ送られる。単語認
識部12は、文字単位の各認識結果を例えばバツ
フアメモリ内に単語単位毎に格納する。この場
合、制御部13により予め用意されているフオー
マツトテーブル(帳票上に記入される文字20,
22の位置を指示する情報等が記憶されている)
に基づいて、単語単位毎に上記各認識結果が単語
認識部12に送られる。これにより、単語認識部
12では単語単位(即ち例えば名字と名前毎の単
語)の認識処理が行なわれる。
結果は、順次単語認識部12へ送られる。単語認
識部12は、文字単位の各認識結果を例えばバツ
フアメモリ内に単語単位毎に格納する。この場
合、制御部13により予め用意されているフオー
マツトテーブル(帳票上に記入される文字20,
22の位置を指示する情報等が記憶されている)
に基づいて、単語単位毎に上記各認識結果が単語
認識部12に送られる。これにより、単語認識部
12では単語単位(即ち例えば名字と名前毎の単
語)の認識処理が行なわれる。
ところで、例えば第3図に示すように文字認識
部11でのカタカナに対する認識結果において、
名字の1文字30及び名前の1文字31がそれぞ
れ特定できないとする。このときの各認識結果3
0,31の候補文字32,33は、それぞれ2文
字づつとする。また例えば第4図に示すように文
字認識部11での漢字に対する認識結果におい
て、名字の1文字40及び名前の1文字41がそ
れぞれ特定できないとする。このときの各認識結
果40,41の候補文字42,43は、それぞれ
2文字づつとする。単語認識部12では、上記の
ような単語単位のカタカナ(第3図)及び漢字
(第4図)に対して、第5図及び第6図に示す単
語認識用テーブル(以下単語辞書と称する)に基
づいて単語単位の認識処理が行なわれる。即ち、
第3図に示すカタカナに対する認識処理では、第
5図に示す単語辞書に基づいて、単語認識が行な
われる。名字の「サカク」および名前の「ケニ
オ」の各単語は単語辞書に存在しないため除去さ
れる。これにより、名字及び名前の各カタカナの
単語認識結果として、第7図に示す単語「サカ
イ」及び「クニオ」の両者が単語認識部12から
制御部1へ送られる。このとき、「サカイ」及び
「クニオ」の各振り仮名に対応する複数の漢字7
0,71が共に制御部13へ送られる。
部11でのカタカナに対する認識結果において、
名字の1文字30及び名前の1文字31がそれぞ
れ特定できないとする。このときの各認識結果3
0,31の候補文字32,33は、それぞれ2文
字づつとする。また例えば第4図に示すように文
字認識部11での漢字に対する認識結果におい
て、名字の1文字40及び名前の1文字41がそ
れぞれ特定できないとする。このときの各認識結
果40,41の候補文字42,43は、それぞれ
2文字づつとする。単語認識部12では、上記の
ような単語単位のカタカナ(第3図)及び漢字
(第4図)に対して、第5図及び第6図に示す単
語認識用テーブル(以下単語辞書と称する)に基
づいて単語単位の認識処理が行なわれる。即ち、
第3図に示すカタカナに対する認識処理では、第
5図に示す単語辞書に基づいて、単語認識が行な
われる。名字の「サカク」および名前の「ケニ
オ」の各単語は単語辞書に存在しないため除去さ
れる。これにより、名字及び名前の各カタカナの
単語認識結果として、第7図に示す単語「サカ
イ」及び「クニオ」の両者が単語認識部12から
制御部1へ送られる。このとき、「サカイ」及び
「クニオ」の各振り仮名に対応する複数の漢字7
0,71が共に制御部13へ送られる。
また、第4図に示す漢字に対する単語認識部1
2の認識処理では、第6図に示す単語辞書に基づ
いて検索され、上記第3図のカタカナの認識結果
(サカ及びニオ)及び第4図の候補文字42,4
3に応じた漢字「坂井」及び「邦夫」の両者が選
択される。これにより、単語認識部12からは、
第8図に示す認識結果(坂井及び邦夫)が各対応
するカタカナ80,81と共に制御部13へ送ら
れる。
2の認識処理では、第6図に示す単語辞書に基づ
いて検索され、上記第3図のカタカナの認識結果
(サカ及びニオ)及び第4図の候補文字42,4
3に応じた漢字「坂井」及び「邦夫」の両者が選
択される。これにより、単語認識部12からは、
第8図に示す認識結果(坂井及び邦夫)が各対応
するカタカナ80,81と共に制御部13へ送ら
れる。
制御部13では、単語認識部12から送られる
第7図及び第8図に示す各認識結果が照合され
る。そして、単語単位のカタカナ及び漢字の両者
が相互に対応する認識結果がそれぞれ最終的答と
して出力される。即ち、この場合には第9図に示
すような答が制御部13から出力される。制御部
13での照合処理の結果において、相互に対応す
るカタカナ及び漢字の各認識結果が存在しない場
合にはリジエクト処理となる。
第7図及び第8図に示す各認識結果が照合され
る。そして、単語単位のカタカナ及び漢字の両者
が相互に対応する認識結果がそれぞれ最終的答と
して出力される。即ち、この場合には第9図に示
すような答が制御部13から出力される。制御部
13での照合処理の結果において、相互に対応す
るカタカナ及び漢字の各認識結果が存在しない場
合にはリジエクト処理となる。
このようにして、帳票上に記入された単語単位
の漢字及びその振り仮名となるカタカナをそれぞ
れ認識処理し、その各認識結果を照合する。これ
により、単語単位の漢字及びカタカナがそれぞれ
相互に対応するような組合せ結果を最終的答とし
て出力することができる。したがつて、振り仮名
であるカタカナの文字単位の認識結果が完全でな
い場合でも、単語単位での漢字及びカタカナの相
互に対応する組合せ結果として答を出力するた
め、漢字の誤読率を大幅に低下させることができ
る。また、上記のように単語単位による認識処理
が行なわれるため、特別な読み方をする漢字(例
えば月見里、五月雨)に対する読取処理にも有効
となる。
の漢字及びその振り仮名となるカタカナをそれぞ
れ認識処理し、その各認識結果を照合する。これ
により、単語単位の漢字及びカタカナがそれぞれ
相互に対応するような組合せ結果を最終的答とし
て出力することができる。したがつて、振り仮名
であるカタカナの文字単位の認識結果が完全でな
い場合でも、単語単位での漢字及びカタカナの相
互に対応する組合せ結果として答を出力するた
め、漢字の誤読率を大幅に低下させることができ
る。また、上記のように単語単位による認識処理
が行なわれるため、特別な読み方をする漢字(例
えば月見里、五月雨)に対する読取処理にも有効
となる。
以上詳述したように本発明によれば、振り仮名
文字及び漢字の各単語単位の認識結果を照合し、
相互に対応する振り仮名文字と漢字の組合せ結果
を最終的答として出力することにより、振り仮名
文字の文字単位の認識結果が不完全の場合でも、
漢字に対する誤読率を大幅に低下させることがで
きる。したがつて、結果的に高い精度で漢字の認
識を行なうことができるものである。
文字及び漢字の各単語単位の認識結果を照合し、
相互に対応する振り仮名文字と漢字の組合せ結果
を最終的答として出力することにより、振り仮名
文字の文字単位の認識結果が不完全の場合でも、
漢字に対する誤読率を大幅に低下させることがで
きる。したがつて、結果的に高い精度で漢字の認
識を行なうことができるものである。
第1図は本発明の一実施例に係わる光学的文字
読取装置の構成を示すブロツク図、第2図は帳票
の一例を示す図、第3図及び第4図はそれぞれ第
1図の文字認識部の認識結果の一例を示す図、第
5図及び第6図はそれぞれ第1図の単語認識部に
用意される単語認識用テーブルの一例を示す図、
第7図及び第8図はそれぞれ第1図の単語認識部
の認識結果の一例を示す図、第9図は第1図の制
御部の最終的答の一例を示す図である。 10……走査部、11……文字認識部、12…
…単語認識部、13……制御部。
読取装置の構成を示すブロツク図、第2図は帳票
の一例を示す図、第3図及び第4図はそれぞれ第
1図の文字認識部の認識結果の一例を示す図、第
5図及び第6図はそれぞれ第1図の単語認識部に
用意される単語認識用テーブルの一例を示す図、
第7図及び第8図はそれぞれ第1図の単語認識部
の認識結果の一例を示す図、第9図は第1図の制
御部の最終的答の一例を示す図である。 10……走査部、11……文字認識部、12…
…単語認識部、13……制御部。
Claims (1)
- 1 漢字を記録するための文字エリアおよびその
漢字に対応する振り仮名文字を記録するための文
字エリアを有する帳票と、この帳票に記録された
上記漢字および振り仮名文字を光電変換して量子
化パターンを出力する走査部と、この走査部から
出力される量子化パターンに基づいて上記漢字お
よび振り仮名文字のそれぞれを文字単位で認識す
る文字認識手段と、この文字認識手段から出力さ
れる文字単位の認識結果に基づいて上記漢字およ
び振り仮名文字のそれぞれからなる単語を予め用
意されている単語認識用テーブルを参照して認識
する単語認識手段と、この単語認識手段から出力
される各単語単位の認識結果を照合しその照合結
果において漢字および振り仮名文字の各単語単位
の認識結果が相互に対応する場合にその各認識結
果を最終的答として出力する制御手段とを具備し
てなることを特徴とする光学的文字読取装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58203843A JPS6095689A (ja) | 1983-10-31 | 1983-10-31 | 光学的文字読取装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58203843A JPS6095689A (ja) | 1983-10-31 | 1983-10-31 | 光学的文字読取装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6095689A JPS6095689A (ja) | 1985-05-29 |
| JPH0319589B2 true JPH0319589B2 (ja) | 1991-03-15 |
Family
ID=16480613
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58203843A Granted JPS6095689A (ja) | 1983-10-31 | 1983-10-31 | 光学的文字読取装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6095689A (ja) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2746899B2 (ja) * | 1988-03-11 | 1998-05-06 | 株式会社東芝 | 文字認識装置 |
| JPH01316889A (ja) * | 1988-06-17 | 1989-12-21 | Fujitsu Ltd | 手書き文字認識方式 |
| JPH0546806A (ja) * | 1991-08-20 | 1993-02-26 | Oki Electric Ind Co Ltd | 文字認識方法 |
-
1983
- 1983-10-31 JP JP58203843A patent/JPS6095689A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6095689A (ja) | 1985-05-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2553608B2 (ja) | 光学文字読取装置 | |
| JPH0319589B2 (ja) | ||
| JPS6316795B2 (ja) | ||
| JP2732593B2 (ja) | 文字読取システム | |
| JPS5816375A (ja) | 光学的読取装置 | |
| JPH0256086A (ja) | 文字認識の後処理方法 | |
| JPS59158482A (ja) | 文字認識装置 | |
| JP2538543B2 (ja) | 文字情報認識装置 | |
| JP2615834B2 (ja) | 単語読取装置 | |
| JPS6160184A (ja) | 光学的文字読取装置 | |
| JPS6074094A (ja) | 文字認識装置 | |
| JP2784004B2 (ja) | 文字認識装置 | |
| JPH0514952B2 (ja) | ||
| JPS59188783A (ja) | 文字判定処理方式 | |
| JPS5972577A (ja) | 図面読取装置 | |
| JPH0475557B2 (ja) | ||
| JPS6115288A (ja) | 光学的文字読取装置 | |
| JPH0272497A (ja) | 光学的文字読取装置 | |
| JPH0576674B2 (ja) | ||
| JPS5933579A (ja) | 文字認識方式 | |
| JPS62177686A (ja) | 光学的文字読取装置 | |
| JPS60138689A (ja) | 文字認識方法 | |
| JPH02278393A (ja) | 単語認識装置 | |
| JPS5914078A (ja) | 帳票読取装置 | |
| JPS5890275A (ja) | 日本語文書読取方式 |