JPH0757042A - 文字読取方法および装置 - Google Patents

文字読取方法および装置

Info

Publication number
JPH0757042A
JPH0757042A JP5203434A JP20343493A JPH0757042A JP H0757042 A JPH0757042 A JP H0757042A JP 5203434 A JP5203434 A JP 5203434A JP 20343493 A JP20343493 A JP 20343493A JP H0757042 A JPH0757042 A JP H0757042A
Authority
JP
Japan
Prior art keywords
character
image
unit
images
image group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5203434A
Other languages
English (en)
Inventor
Sueji Miyahara
末治 宮原
Akira Suzuki
章 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5203434A priority Critical patent/JPH0757042A/ja
Publication of JPH0757042A publication Critical patent/JPH0757042A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 オペレータが読取不能文字を容易に、効率良
く変換することができるようにする。 【構成】 認識部6が文字データに変換できなかった読
取不能文字は、クラスタリング部6によりクラスタリン
グされ、各イメージ群に区分される。また、クラス化さ
れたイメージ群は代表イメージとその他のイメージで表
わされ、その候補文字が抽出される。代表イメージ群と
それに対応する候補文字とは表示制御部2に引き渡され
る。表示制御部2は、クラスタリング部6より渡された
情報に基づき、当該代表イメージ群に属する文字イメー
ジと候補文字とを表示部1の同一表示画面上に表示す
る。操作部9はこの表示画面に基づいて、候補文字のい
ずれかが正解文字として選択されるか、新たに正解文字
が入力されると、当該代表イメージ群に対応する各文字
イメージ群を正解文字に対応する文字データに一括変換
する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、書面上の文字画像を読
み取り、読み取った文字画像中の文字パターンの文字イ
メージを文字データに変換する文字読取方法および装置
に関する。
【0002】
【従来の技術】従来、この種の文字読取置においては、
読取不能文字が発生した場合には、読取不能文字に対応
する文字イメージを1文字ずつ表示して、オペレータに
正しい文字を遂次入力させるか、複数の文字イメージを
同時に表示して正しい文字を選択させることにより、読
取不能文字を文字データに変換している。これらの場合
には、読取不能文字は1文字ずつ変換しなければならな
い。
【0003】
【発明が解決しようとする課題】上述した従来の文字読
取装置においては、読取不能文字を1文字ずつ変換しな
ければならないため、熟練したオペレータが操作したと
しても、読取不能文字の表示速度以上の速度で変換する
ことはできない。また、この繰返しの多い変換操作はオ
ペレータが多大な疲労感を与えることになる。さらに、
オペレータが熟練していない場合には、視線が「表示さ
れている読取不能文字」と「正しい文字を入力するため
に操作しなければならないキーボード等の操作部あるい
は候補文字の表示された表示位置」との間を各文字毎に
往復しなければならないために、前述の不都合は一段と
大きくなる。
【0004】本発明の目的は、オペレータが読取不能文
字を容易に、効率良く変換することができる文字読取方
法および装置を提供することにある。
【0005】
【課題を解決するための手段】本発明の文字読取方法
は、書面上の文字画像を読み取り、読み取った文字画像
の各文字パターンの文字イメージを文字データに変換
し、一定値以上の確度で変換できなかった文字イメージ
を読取不能文字とする文字パターン認識ステップと、読
取不能文字を類似するもの同士グループ化するクラスタ
リングにより、それぞれにクラス化されたイメージ群を
形成するクラスタリングステップと、クラス内のイメー
ジに対し、さらにグループ化の処理を行ない、類似性の
高いものとしてグループ化されたものは、複数個のイメ
ージの中から1個のイメージを代表イメージとして選択
して、代表イメージとその他のイメージとによってクラ
ス内の代表イメージ群を形成するとともに、クラス内の
イメージに該当する候補文字を、代表イメージ群ととも
に同一表示画面に表示する不確定文字表示ステップと、
画面表示された候補文字の内のいずれかの選択、ないし
は新たに入力される入力文字を、表示されている代表イ
メージ群に対応する正解文字と看做し、画面表示されて
いる代表イメージ群に含まれるイメージ群を、正解文字
に対応する文字データに一括変換し、変換した文字デー
タを出力する変換処理ステップとからなる。
【0006】また、本発明の文字読取装置は、書面上の
文字画像を読み取り、読み取った文字画像の各文字パタ
ーン毎に切り取り、文字イメージとして出力するイメー
ジ処理部と、イメージ処理部からの文字イメージを文字
データに変換するか、一定値以上の確度で変換できなか
った文字イメージは読取不能文字とする認識部と、読取
不能文字として指示されるイメージ群の中の文字イメー
ジをイメージ処理部から入力し、指示される候補文字と
ともに表示部の同一画面に表示する表示制御部と、表示
部と、認識部から変換済みの文字データおよび読取不能
文字を受け取り、読取不能文字については類似するもの
同士グループ化し、類似性の近いものを集めるクラスタ
リングと、類似性の高いものとしてグループ化されたも
のは、複数個のイメージを1個のイメージで代表させる
とともに、代表イメージとその他のイメージとによって
表示順序を形成し、それらの認識結果の中からクラスタ
リングされたイメージ群に該当する候補文字を選択し、
クリスタリングされた代表イメージ群とこれに対応する
候補文字とを表示部の同一画面に表示するように表示制
御部に指示するクラスタリング部と、候補文字中から選
択された正解文字あるいは新たに入力された正解文字を
知らされると、画面表示されていた代表イメージ群に対
応する各イメージ群を正解文字に対応する文字データに
一括変換し、変換した文字データを出力する操作部とを
有する。
【0007】
【作用】図5は本発明の原理の説明図である。領域A,
B,・・・内に存在する×印は読取不能文字に対してク
ラスタリングされた文字パターンを示している。また、
領域a,b,・・・内の×印はクラスタリング結果を
「パターン間の距離の近いものの個数」によって更にグ
ルーピングした結果の文字パターンを示している。この
ようなグルーピングの結果から、領域a,bの中に存在
する文字パターンはそれぞれグループの代表パターンa
1,b1(図3のイメージ21が代表イメージとなる)で
のみで代表させ、領域a,b以外のイメージai
i+1,・・・,a i+n (図3のイメージ22,23,
・・・)は個々の文字パターンを代表パターンとして表
示画面に表示してやれば、領域a,b,・・・に含まれ
る文字パターンに対してはオペレータは確認の作業をし
なくてもよいことになる。
【0008】以上の原理に基づき、本発明の文字読取装
置は次のように動作する。
【0009】認識部が文字データに変換できなかった読
取不能文字は、クラスタリング部によりクラスタリング
され、イメージ群に区分される。また、クラス化された
イメージ群は代表イメージとその他のイメージで表わさ
れ、代表イメージとその他のイメージは代表イメージ群
を形成し、その候補文字が抽出される。代表イメージ群
とそれに対応する候補文字とは表示制御部に引き渡され
る。表示制御部は、クラスタリング部より渡された情報
に基づき、当該代表イメージ群に属する文字イメージと
候補文字とを表示部の同一表示画面上に表示する。操作
部はこの表示画面に基づいて、候補文字のいずれかが正
解文字として選択されるか、新たに正解文字が入力され
ると、当該代表イメージ群に対応する各文字イメージ群
を正解文字に対応する文字データに一括変換する。この
操作をクラス化されたイメージ群ごとに実施し、全ての
文字画像を文字データに変換する。
【0010】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0011】図1は本発明の一実施例の文字読取装置の
ブロック図、図2はその動作を示すフローチャート、図
3は表示部1に表示されたイメージ群およびその候補文
字を示す図、図4は図3に示された表示中のイメージ群
に属さないと示された文字イメージが斜線表示されてい
る状態を示す図である。
【0012】イメージ処理部4は、入力データである文
字画像を一文字ずつの文字パターンに切り出し記憶する
とともに、切り出した文字パターンを文字イメージとし
て順次認識部5に出力する。
【0013】認識部5は、イメージ処理部4より入力し
た文字イメージを認識部5内の認識辞書と照合し、最も
類似しているものを検出し、検出した文字データを文字
認識結果としてクラスタリング部6に出力する。ただ
し、照合の結果類似度が一定レベル以下のものについて
は、読取不能文字として出力する。
【0014】クラスタリング部6は、認識部5における
照合の結果、読取不能文字と判定されたものを集結さ
せ、文字イメージ同志の類似性を評価する。次に、類似
に関する距離が近くて、かつ、他カテゴリの認識辞書の
距離が近いもの同士を同一イメージ群に区分することに
より、クラスタリング処理7を行なう。さらに、代表イ
メージ抽出処理8において、クラスタリングされた文字
パターン同士の類似性の度合を評価してグループ化を行
ない、類似性の高いものは複数のイメージを1個の文字
イメージで代表される代表イメージを検出して、代表イ
メージとグループ化されなかったイメージ(これらは代
表イメージ群を形成する)とを似ているものから順に表
示できるように整理した結果を保存し、保存した代表イ
メージ群を順次表示制御部2に表示するように指示す
る。代表イメージ群を指示する際、クラスタリング部6
は、内部に保持する認識結果の内容のうち代表イメージ
群の中に位置する文字パターンの候補文字を、出現個数
の多い順序、あるいは候補の上位に多く出現する順序に
従い出力する。操作部9(例えば、キーボードあるいは
マウス)からの指示により同一イメージ群に属さないと
して、表示制御部2から伝達されたイメージに対しては
再度クラスタリングを行なう。なお、クラスタリングの
手法については一般に知られていることであるが、適当
な資料を挙げれば「文字認識概論」(著者 橋本新一
郎、出版社 電気通信協会、特に第14頁の記載)があ
る。
【0015】表示制御部2は、クラスタリング部6から
指示された代表イメージ群の各イメージに対応する文字
イメージをイメージ処理部4から入力し、表示部1に表
示させる。また、表示制御部2は、表示部1に表示させ
た各文字イメージのうち操作部9より、表示されている
代表イメージ群には該当しない旨の指示を受けた文字イ
メージについては、他のものと区別するのを容易にする
ために斜線で覆い(表示を停止する等の方法をとっても
よい)、クラスタリング部6にその旨を伝える。表示さ
れている候補文字中のいずれかが、当該代表イメージ群
に属するものとされたイメージ群に対応する正解文字と
して操作部9から選択されると、クラスタリング部6は
該当するイメージ群の読取不能文字を、選択された正解
文字に一括変換する(この変換の場合、選択されるのが
第一位の代表文字であればリターンキーの押下のみでよ
いように設定するのが好ましい)。もちろん、操作部9
から別途指示された入力文字に一括変換することも可能
にされている。また、装置立ち上げ時に予め(所望であ
れば、各イメージ群が表示された際)、操作部9から表
示文字数を増加するように指示があった場合は、イメー
ジ群の各文字イメージを表示する際に、表示文字数制御
テーブル3を参照して、テーブル3から読み出した文字
数分の文字イメージを表示すべき各文字イメージの前後
に追加して出力するようにイメージ処理部4に指示す
る。
【0016】クラスタリング部6がクラスタリングした
全イメージ群について候補文字あるいは入力文字への変
換が終了したら、イメージ処理部4が保持した文字画像
の文字データへの変換は終了したものと看做し、クラス
タリング部6に保持された全文字データを出力し、例え
ばフロッピーディスクなどへ格納し、次の文字画像をイ
メージ処理部4に取込み、変換操作を繰返す。
【0017】次に、図1の実施例の動作について、図2
のフローチャートおよび図3の表示部1の表示を示す図
を参照して説明する。クラスタリング部6は、イメージ
処理部4からの文字パターンに基づき認識部5が出力し
た文字認識結果を受け取り(ステップ11)、受け取っ
た文字認識結果のなかから読取不能文字を抽出する(ス
テップ12)。次に、クラスタリング部6は抽出した読
取不能文字について類似したもの同士を照合してクラス
タリングをするとともに、クラスの中心あるいは各イメ
ージ同士の類似性からパターンが密に集合している位置
を求め、代表イメージを決定する。このとき各イメージ
は代表イメージに近いものからの順序づけを行なう(ス
テップ13)。クラスタリング部6は表示制御部2に指
示して区分した代表イメージ群を表示部1に表示させる
(ステップ14)。
【0018】クラスタリング部6に指示されて表示制御
部2が表示した表示画面の具体例が図3に示されてい
る。すなわち、文字イメージ表示領域21〜40に同一
イメージ群に属する読取不能文字の代表イメージ群が表
示されている(以下に述べるように、この代表イメージ
群は“犬”に属するものとし、イメージ21は代表イメ
ージとする)。また、候補文字表示領域41には候補文
字の類似度が高い第1位のものから順次“犬,大,木,
・・・”と表示されている。図3では、第1位の候補文
字“犬”が左下がりの斜線で覆われている。
【0019】表示制御部2は、表示した代表イメージ群
のクラスタリングが正しいか否かの判定を待つ(ステッ
プ15)。クラスタリングが正しい旨の判定を受けた場
合は、表示を変えずにそのまま、クラスタリングが正し
くないと判定された場合は、操作部9からの指示に基づ
き表示されている代表イメージ群に属さない文字イメー
ジを他の文字イメージと区別するために斜線で覆い、そ
の旨をクラスタリング部6に伝達し(ステップ19)、
第1位に指定されている候補文字が正しいか否かの判定
を待つ(ステップ16)。図3に即して述べれば、図3
のように表示された各文字イメージのうち文字イメージ
表示領域26,27,30,36,38,39,40の
ものは、表示されているイメージ群に属さないものとし
て操作部9の指示により、図4のように右下がりの斜線
で覆われている。
【0020】表示制御部2は、第1位に指定されている
候補文字が正しいとの判定を受けた場合は、第1位に指
定されている候補文字を正解文字と看做して、斜線で覆
われていない、代表イメージ群に含まれる各文字イメー
ジを正解文字に変換すべきことをクラスタリング部6に
伝達し、第1位に指定されている候補文字が正しくない
との判定を受けた場合は、操作部9からの指示に基づき
選択された第2位以下の候補文字を正解文字とするか、
あるいは別途に入力された正解文字(ステップ20)に
変換すべきことをクラスタリング部6に伝達する。図4
では表示部1の文字イメージ表示領域21〜40におい
て、斜線で覆われていない各文字イメージは第1位の候
補文字“犬”であることが示されている。
【0021】伝達された指示に基づき、クラスタリング
部6は表示部1において斜線で覆われていない代表イメ
ージ群に含まれる各文字イメージを正解文字に対応する
文字データに一括変換する(ステップ17)。図4の場
合には、文字イメージ表示領域21〜40において、斜
線で覆われていない各文字イメージは第1位の候補文字
“犬”に対応する文字データに一括変換される。クラス
タリング部6は、読取不能文字に関する変換が全て終了
しているかどうか判定し(ステップ18)、終了してい
なければ、ステップ14に戻り次のイメージ群の変換を
行なう。ステップ18において、変換が全て終了してい
ると判定された場合は、操作部9の指示により変換した
全ての文字データを出力し、一連の操作を終了し、次に
イメージ処理部4が入力する文字画像の変換処理に備え
る。
【0022】
【発明の効果】以上説明したように本発明は、読取不能
文字をクラスタリングし、クラス化されたものの中で、
さらに文字パターン同志の類似性を評価して代表イメー
ジを選んで表示の文字イメージ個数を削減し、候補文字
とともに表示部の同一表示画面に表示するので、表示さ
れた代表イメージ群はどの候補文字に該当するのかを容
易に、かつ少ない文字イメージの認識個数で判断可能と
なる効果があり、また、候補文字のなかから選択される
か新たに入力される正解文字が与えられると代表イメー
ジ群に含まれる各文字イメージを一括変換するので、オ
ペレータの熟練度があまり高くなくとも、変換効率が非
常に高まるという効果もある。
【図面の簡単な説明】
【図1】本発明の一実施例の文字読取装置のブロック図
である。
【図2】図1の文字読取装置の動作を示すフローチャー
トである、。
【図3】図1の実施例において表示部1に表示されたイ
メージ群およびその候補文字を示す図である。
【図4】図3に示された表示中のイメージ群に属さない
と示された文字イメージが斜線表示されている状態を示
す図である。
【図5】本発明の原理の説明図である。
【符号の説明】
1 表示部 2 表示制御部 3 表示文字数制御テーブル 4 イメージ処理部 5 認識部 6 クラスタリング部 7 クラスタリング処理 8 代表イメージ抽出処理 9 操作部 11〜20 ステップ 21〜40 文字イメージ表示領域 41 候補文字表示領域 A,B クラスタリングされた文字パターンの領域 a,b 代表イメージで代表される文字パターン領域 a1,b1 代表イメージ ai〜ai+n 代表イメージの文字パターン領域aに含
まれない文字イメージ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 書面上の文字画像を読み取り、読み取っ
    た文字画像の各文字パターンの文字イメージを文字デー
    タに変換し、一定値以上の確度で変換できなかった文字
    イメージを読取不能文字とする文字パターン認識ステッ
    プと、 前記読取不能文字を類似するもの同士グループ化するク
    ラスタリングにより、それぞれにクラス化されたイメー
    ジ群を形成するクラスタリングステップと、クラス内の
    イメージに対し、さらにグループ化の処理を行ない、類
    似性の高いものとしてグループ化されたものは、複数個
    のイメージの中から1個のイメージを代表イメージとし
    て選択して、代表イメージとその他のイメージとによっ
    てクラス内の代表イメージ群を形成するとともに、クラ
    ス内のイメージに該当する候補文字を、代表イメージ群
    とともに同一表示画面に表示する不確定文字表示ステッ
    プと、 画面表示された候補文字のうちのいずれかの選択ないし
    は新たに入力される入力文字を、表示されているイメー
    ジに対応する正解文字と看做し、画面表示されている代
    表イメージ群に含まれる各イメージ群を、正解文字に対
    応する文字データに一括変換し、変換した文字データを
    出力する変換処理ステップとを有する文字読取方法。
  2. 【請求項2】 書面上の文字画像を読み取り、読み取っ
    た文字画像の各文字パターン毎に切り取り、文字イメー
    ジとして出力するイメージ処理部と、 前記イメージ処理部からの文字イメージを文字データに
    変換するか、一定値以上の確度で変換できなかった文字
    イメージは読取不能文字とする認識部と、 表示部と、 読取不能文字として指示されるイメージ群の中の文字イ
    メージを前記イメージ処理部から入力し、指示される候
    補文字とともに前記表示部の同一画面に表示する表示制
    御部と、 前記認識部から変換済みの文字データおよび読取不能文
    字を受け取り、読取不能文字については類似するもの同
    士グループ化し、類似性の近いものを集めるクラスタリ
    ングと、類似性の高いものとしてグループ化されたもの
    は、複数個のイメージを1個のイメージで代表させると
    ともに、代表イメージとその他のイメージとによって表
    示順序を形成し、それらの認識結果の中からクラスタリ
    ングされたイメージ群に該当する候補文字を選択し、ク
    ラスタリングされた代表イメージ群とこれに対応する候
    補文字とを前記表示部の同一画面に表示するように前記
    表示制御部に指示するクラスタリング部と、 前記候補文字中から選択された正解文字あるいは新たに
    入力された正解文字を知らされると、画面表示されてい
    た代表イメージ群に対応する各イメージ群を正解文字に
    対応する文字データに一括変換し、変換された文字デー
    タを出力する操作部とを有する文字読取装置。
JP5203434A 1993-08-17 1993-08-17 文字読取方法および装置 Pending JPH0757042A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5203434A JPH0757042A (ja) 1993-08-17 1993-08-17 文字読取方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5203434A JPH0757042A (ja) 1993-08-17 1993-08-17 文字読取方法および装置

Publications (1)

Publication Number Publication Date
JPH0757042A true JPH0757042A (ja) 1995-03-03

Family

ID=16474034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5203434A Pending JPH0757042A (ja) 1993-08-17 1993-08-17 文字読取方法および装置

Country Status (1)

Country Link
JP (1) JPH0757042A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8953910B2 (en) 2011-09-30 2015-02-10 International Business Machines Corporation Proof reading of text data generated through optical character recognition

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8953910B2 (en) 2011-09-30 2015-02-10 International Business Machines Corporation Proof reading of text data generated through optical character recognition
US8971670B2 (en) 2011-09-30 2015-03-03 International Business Machines Corporation Proof reading of text data generated through optical character recognition

Similar Documents

Publication Publication Date Title
US5386508A (en) Apparatus for generating programs from inputted flowchart images
US6081620A (en) System and method for pattern recognition
US5185813A (en) Document image processing apparatus
KR0128734B1 (ko) 손으로 쓴 문자 인식 장치
US5369742A (en) Image file and retrieving apparatus and method
JP3727974B2 (ja) 画像処理装置及び方法
EP0325417B1 (en) Document image processing apparatus
EP0709800A2 (en) Method for designing classification trees
JP3319203B2 (ja) 文書ファイリング方法及び装置
JPH0757042A (ja) 文字読取方法および装置
US5119441A (en) Optical character recognition apparatus and method using masks operation
JPH06231298A (ja) 文字読取方法および装置
Li An implementation of ocr system based on skeleton matching
JPH0562021A (ja) 標準フオント及び利用者指定カスタムフオントを認識するための光学式文字認識(ocr)システム
JP2766205B2 (ja) 文字認識装置
JPH06215197A (ja) 文字認識方法および装置
JPH1021325A (ja) 文字認識方法
JP3013442B2 (ja) 図面自動入力装置
JPH01147786A (ja) 表を含む文書の読取装置
JPS62138978A (ja) 筆者識別方式
JP2874815B2 (ja) 日本語文字読取装置
US5751912A (en) Schematic diagram creating system
JPS63118993A (ja) 文字認識方法
JPS58125183A (ja) 光学文字読取装置における認識不能文字表示方法
JPH08202859A (ja) 電子ファイリング装置及びその方法