JPS61153781A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPS61153781A
JPS61153781A JP59281130A JP28113084A JPS61153781A JP S61153781 A JPS61153781 A JP S61153781A JP 59281130 A JP59281130 A JP 59281130A JP 28113084 A JP28113084 A JP 28113084A JP S61153781 A JPS61153781 A JP S61153781A
Authority
JP
Japan
Prior art keywords
character
kanji
recognition
characters
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59281130A
Other languages
English (en)
Inventor
Tomoko Baba
智子 馬場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Computer Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Computer Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Computer Engineering Corp filed Critical Toshiba Corp
Priority to JP59281130A priority Critical patent/JPS61153781A/ja
Publication of JPS61153781A publication Critical patent/JPS61153781A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野1 本発明は、漢字文字のiul処理を行なう光学的文字読
取装置に関する。
[発明の技術的背景とその問題点] 近年、英数字及び平仮名文字だけでなく漢字文字の読取
を行なうことができる光学的文字読取装置が実用化され
ている。このような光学的文字読取装置では、読取対象
である漢字は種類が多く又類似した文字も多いため、誤
読及びリジェクト処理の発生が比較的多くなる。
従来、上記のようなりジエクト処理では、リジェクトさ
れた文字がCRTディスプレイ装隨に表示される。オペ
レータは、表示された漢字文字を確認し、その漢字に対
する音又は訓読みを仮名文字でキーボードから入力する
。そして、入力された仮名文字が漢字文字に変換される
ことにより、読取処理が修正されることになる。このた
め、従来では誤読及びリジェクト処理の修、正処理が多
くなり、オペレータの作業時間や煩わしい手間が多くな
る問題があった。
[発明の目的] 本発明の目的は、読取対象の漢字文字に対して誤読及び
リジェクトを大幅に減少して読取率を向上することによ
り、オペレータの作業効率を高めることができる光学的
文字読取装置を提供することにある。
[発明の概IIJ 本発明では、予め各漢字文字に対応する送り仮名文字群
からなるテーブルを記憶した送り仮名辞書メモリが設け
られる。読取対象の漢字文字認識の結果、読取不能(リ
ジェクト)となった場合、Wll平手段らは複数の認識
候補文字が出力される。
候補文字識別手段は、認識候補文字に付加された送り仮
名文字の認識結果に基づいて、送り仮名辞書メモリのテ
ーブルを走査して送り仮名文字の認識結果に対応する漢
字文字を最終的g*結果として出力するように構成され
ている。
このような構成により、複数のgas補文字から最終的
な認識結果を得ることができ、結果的にオペレータの作
業の不要な読取率を高めることが可能となる。
[発明の実施例] 以下図面を参照して本発明の一実施例を説明する。第1
図は一実施例に係わる光学的文字読取装置の構成を示す
ブロック図である。第1図において、量子化部10は、
図示しない充電変換部から出力されるアナログ信号Aを
デジタル信号りに変換する。このアナログ信号Aは、帳
票上に記録された文字が光電変換部により走査されて得
られる電気信号である。量子化部10から出力されたデ
ジタル信号りである文字パターンデータは、前処理部1
1で正規化、ノイズ除去及び整形等の前処理の後に認識
部12へ出力される。認識部12は、予め用意された辞
書メモリ13内の標準パターンに基づいて、前処理部1
1から出力される文字パターンに対する類似度演算をし
て認識処理を行なう。この認識処理の結果、正しく認識
できたときはその答えを文字コードとして出力し、類似
度値が接近しており認識不能(リジエク・ト)の場合に
は、リジェクトコードと類似度値を付加した候補文字と
を出力する。
候補文字選択部14は、認識部12の認識処理の結果、
リジェクトされた場合には!I識郡部12ら出力された
候補文字の中から類似度値の^い例えば上位5位までの
候補文字を選択して出力する。識別部15は、候補文字
選択部14から出力された候補文字が漢字文字である場
合7、その漢字文字に付加された送り仮名文字に基づい
て送り仮名辞書メモリ16のテーブルを走査して、最終
的認識結果Rを出力する。送り仮名辞書メモリ16は、
予め所定の漢字に対応する送り仮名文字群からなるテー
ブルを記憶している。
このような構成の光学的文字読取装置において、同実施
例の動作を説明する。先ず、帳票上に記録された漢字文
字が、前記のように光電変換部、量子化部10及び前処
理部11を経て、デジタル信号の文字パターンに変換さ
れたとする。この文字パーターンが認識部12に出力さ
れて、認識処理されることになる。111部12では、
辞書メモリ13に記憶された標準パターンとX+a対象
の文字パターンとのマツチング処理が行われて、最大類
似度値の標準パターンの文字コードが認識結果として出
力される。
ここで、認識部12の認識処理において最大類似度値の
パターンが特定できない場合、即ちリジェクトされたと
きは、候補文字選択部14は認識部12から出力された
複数の候補文字の中から類似度値の高い上位5位、まで
の候補文字(文字コード)を出力する。即ち、候補文字
選択部14は、例えば第3図に示すような類似した候補
文字群30〜35を識別部15に出力する。識別部15
では、候補文字選択部14から出力された複数の候補文
字(例えば第3図の文字群33)から最終的なg*結結
果上なる文字が識別される。
ところで、識別部15は、認識対象の漢字文字に付加さ
れた送り仮名文字の認識結果を認識部12または候補文
字選択部14から読込む。送り仮名文字は認識処理の容
易な平仮名文字であるため、その認1M果は認識部12
で特定されて識別部15へ出力される。識別部15は、
送り仮名文字の認識結果に基づいて、送り仮名辞書メモ
リ16のテーブルを走査する。ここで、送り仮名辞書メ
モリ16は例えば第2図に示すようなテーブルを記憶し
ている。このテーブルは、類似形の多い漢字文字群に対
応して、それぞれの活用語尾を登録したものである。
候補文字選択部14から出力された候補文字群が例えば
第3図の文字群33である場合、識別部15は送り仮名
文字(例えば「り」とする)に応じて上記テーブルを走
査し、例えばrlll<Jという単語データ(コード1
13となる)を特定する。これにより、識別部15は、
複数の候補文字から特定の候補文字を最終的認識結果と
して識別する。
このようにして、認識対象の漢字文字に対して候補文字
が出力された場合、その漢字に付加された送り仮名文字
により送り仮名辞書メモリ16を参照する。この送り仮
名辞書メモリ16のテーブルに基づいて、送り仮名文字
が適正な語尾として使用される漢字文字が特定されるこ
とになる。したがって、類似した候補文字の中から、最
終的i!!識結果となる漢字文字を特定して出力するこ
とが可能となる。
ここで、上記のように送り仮名文字により候補文字を特
定する場合、漢字に付加される1文字目の送り仮名文字
だけでは特定できない場合がある。
例えば、第3図の文字群32から成る候補文字群の場合
、認識対象の文字が「欠」であると送り仮名文字「け」
だけでは識別ができない。このような場合には2文字目
の送り仮名文字「る」の認識結果も利用して、識別部1
5は第2図のテーブルから「欠ける」という単語データ
(コード311とな。
る)を読出し、候補文字群から最終的認識結果である漢
字「欠」を特定することができる。
[発明の効果] 以上詳述したように本発明によれば、類似形の多い漢字
文字を認識する場合、その漢字に付加された送り仮名文
字のvtil結果を利用することにより、lI!!識率
を大幅に高めることが可能となる。したがって、漢字文
字に対するWA読及びリジェクトを大幅に減少すること
ができる。このため結果的に、誤読及びリジェクトが発
生した際に必要なオペレータの修正作業を減少すること
ができ、操作効率を向上させることができるものである
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図、第2図は同実施例の送り仮名
辞書メモリのテーブル内容の一例を示す図、第3図は同
実施例の候補文字選択部で。 選択された候補文字群の一例を示す図である。 12・・・!!識部、13・・・辞書メモリ、14・・
・候補文字選択部、15・・・識別部、16・・・送り
仮名辞書メモリ。 出願人代理人 弁理士 鈴 江 武 彦第1図 第2図

Claims (1)

    【特許請求の範囲】
  1. 帳票上に記録された文字に対する認識処理を実行し読取
    不能文字が発生したとき複数の認識候補文字を出力する
    認識手段と、予め漢字文字に対応する送り仮名文字群か
    らなるテーブルを記憶した送り仮名辞書メモリと、上記
    認識手段から出力される認識候補文字が漢字文字の場合
    その読取不能文字に付加された送り仮名文字の認識結果
    に基づいて上記送り仮名辞書メモリの上記テーブルを走
    査して上記送り仮名文字の認識結果に対応する漢字文字
    を最終的認識結果として出力する候補文字識別手段とを
    具備してなることを特徴とする光学的文字読取装置。
JP59281130A 1984-12-26 1984-12-26 光学的文字読取装置 Pending JPS61153781A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59281130A JPS61153781A (ja) 1984-12-26 1984-12-26 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59281130A JPS61153781A (ja) 1984-12-26 1984-12-26 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPS61153781A true JPS61153781A (ja) 1986-07-12

Family

ID=17634780

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59281130A Pending JPS61153781A (ja) 1984-12-26 1984-12-26 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPS61153781A (ja)

Similar Documents

Publication Publication Date Title
JP3139521B2 (ja) 自動言語決定装置
JPS61153781A (ja) 光学的文字読取装置
JPH0157837B2 (ja)
JPS6115288A (ja) 光学的文字読取装置
JPS59158482A (ja) 文字認識装置
JPS60254388A (ja) 光学的文字読取装置
JPS6336389A (ja) 文字読取装置
JPS6160189A (ja) 光学的文字読取装置
JPS63263588A (ja) 文字読取装置
JPS60110089A (ja) 文字認識装置
JPS6139175A (ja) 光学的文字読取装置
JPS58125183A (ja) 光学文字読取装置における認識不能文字表示方法
JPS59188783A (ja) 文字判定処理方式
JPS61114388A (ja) 文字入力装置
JPH01217686A (ja) 文字読取装置
JPS6145378A (ja) 単語読取装置
JPH0259504B2 (ja)
JPS6435674A (en) Character recognizing method
JPS61188679A (ja) ストローク近似直線抽出による文字認識装置及び方法
JPS6174087A (ja) 単語読み取り装置
JPS59197970A (ja) 文字読取装置用帳票
JPS5931105B2 (ja) 文字読取装置
JPS59149569A (ja) 光学的文字読取装置
JPS63143683A (ja) 光学的文字読取り装置
JPS63208180A (ja) 文字認識装置