JPH06150068A - 画像読取装置 - Google Patents

画像読取装置

Info

Publication number
JPH06150068A
JPH06150068A JP4302206A JP30220692A JPH06150068A JP H06150068 A JPH06150068 A JP H06150068A JP 4302206 A JP4302206 A JP 4302206A JP 30220692 A JP30220692 A JP 30220692A JP H06150068 A JPH06150068 A JP H06150068A
Authority
JP
Japan
Prior art keywords
dictionary
user
characters
unit
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4302206A
Other languages
English (en)
Inventor
Toshio Miyazawa
利夫 宮澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP4302206A priority Critical patent/JPH06150068A/ja
Publication of JPH06150068A publication Critical patent/JPH06150068A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 OCR等のユーザが、必要とする文字だけを
認識するための新規の認識用辞書を簡単に作成できるよ
うにする。 【構成】 ユーザが用意した原稿の画像を入力部1より
入力し、認識処理部2で文字を認識する。記憶部5に得
られた認識結果の文字コードと、ユーザにより予め用意
された正解テーブル6上の文字コードとを照合部8で照
合する。辞書作成部9は、照合が一致した文字コードと
特徴量を新規認識用辞書10に登録する。 【効果】 ユーザは原稿と正解テーブルを用意すること
により、ユーザが必要とする文字のみを登録したユーザ
固有の辞書を自動的に作成できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字、図形等の画像の
認識のための辞書の作成技術に関する。
【0002】
【従来の技術】文字や図形等の画像を認識するOCR等
の装置(本明細書では画像読取装置と呼ぶ)の多くは、
認識用辞書の学習機能を備えている。ユーザは、この機
能を利用することにより、手書き文字等の認識を実際に
行ないながら辞書を更新し、手書き文字等の認識率を上
げることができる。
【0003】なお、このような認識辞書の更新に関連し
たものとして、特開平2−242389号公報に開示さ
れた郵便番号読取装置が知られている。この装置では、
郵便物に記載された郵便番号と住所をそれぞれ文字認識
し、認識した住所に対応した郵便番号と、認識した郵便
番号とを照合し、一致しない場合に、一致しなかった郵
便番号の文字の特徴量を認識辞書に追加登録する。
【0004】
【発明が解決しようとする課題】画像読取装置のユーザ
が、必要とする文字等の画像だけを認識対象としたユー
ザ固有の辞書を新規に作成したい場合がある。しかし、
従来の辞書学習機能は、認識結果を利用し、既存の辞書
に登録されている特徴量を修正し、あるいは新しい特徴
量を追加登録する機能であるから、この機能を利用し
て、そのようなユーザ固有の新規の辞書を作成すること
は通常不可能であり、たとえ可能であったとしても極め
て非効率な作業となる。
【0005】本発明の目的は、画像読取装置において、
ユーザが必要とする文字等の画像だけを認識対象とした
新しい認識用辞書を簡単かつ効率的に作成できるように
することである。
【0006】
【課題を解決するための手段】本発明は、原稿画像を読
み取って文字等の画像を認識する画像読取装置におい
て、入力原稿上の文字等の画像についての正解データを
登録したテーブルと、該入力原稿上の画像の認識結果と
該テーブル上の正解データとを照合する照合部と、該照
合部による照合で一致がとれた文字等の画像についての
み登録した認識用辞書を作成する辞書作成部とを備える
ことによって、前記目的を達成するものである。
【0007】
【作用】画像読取装置のユーザは、必要とする文字等の
画像を記した原稿と、この原稿上の文字等の画像につい
ての正解データ(文字コード等)を登録した正解テーブ
ルを用意することによって、画像読取装置で、ユーザが
必要な文字等だけを認識するための新しい認識用辞書が
自動的に作成される。
【0008】
【実施例】図1は、本発明の一実施例に係る画像読取装
置の概略ブロック図である。図1において、1は原稿を
スキャンして原稿の画像データを入力する入力部であ
る。2は文字等の認識処理を行なう認識処理部、3は認
識用辞書、4は認識用辞書の記憶部、5は認識結果デー
タの記憶部である。6はユーザにより予め作成された正
解テーブル、7は正解テーブルの記憶部である。この正
解テーブル6は、外部のパソコン等で作成され、インタ
ーフェイスケーブルを通じて、あるいはフロッピーディ
スク等の媒体を経由して記憶部7にロードされる。
【0009】なお、この種の画像読取装置は、パソコン
等と同様のデータ処理とマンマシンインターフェイスの
ためのハードウエアを装備していることが多い。このよ
うなハードウエア構成の場合には、画像読取装置上で正
解テーブル6を作成させてもよく、これはソフトウエア
のみによって容易に実現できる。
【0010】8は記憶部5に記憶された認識結果データ
と正解テーブル6の内容とを照合する照合部である。9
は辞書作成部であり、記憶部11上に新規の認識用辞書
10のファイルを生成し、照合部8で一致がとれた文字
等の画像のコードと特徴量を新規認識用辞書10に登録
する辞書作成部である。照合部8及び辞書作成部9も、
画像読取装置のハードウエア上でソフトウエアによって
実現してもよい。
【0011】次に、正解テーブル6が記憶部7上に存在
するものとして、認識用辞書10の作成過程を説明す
る。図2は、その説明のための処理フロー図である。
【0012】まず、ユーザが認識辞書作成用に用意した
原稿の画像データを入力部1によって入力する(ステッ
プ100)。入力する原稿は、ユーザが認識対象として
選んだ文字等だけを記したもので、その一例を図3
(a)に示す。正解テーブル6には、原稿上の各文字等
の正解データ(文字コード)が、原稿上の文字等の配列
に対応させて登録されており、したがって図3(a)は
正解テーブル6の内容も示していると考えてよい。
【0013】認識処理部2は、入力画像データに対して
文字等の画像の認識処理を行なう(ステップ102)。
その具体的には、入力画像データより文字等の画像の切
り出し、正規化等の前処理を行なってから文字等の画像
の特徴量を抽出し、それを認識用辞書3に登録されてい
る特徴量と比較することによって、文字等の画像を認識
する。記憶部5には認識結果のデータ、例えば図3
(b)に示すような文字コードと、その他のデータ(画
像より抽出された特徴量、認識用辞書3の特徴量との距
離など)が得られる。
【0014】照合部8によって、認識結果の各文字コー
ドと、正解テーブル6上の対応位置の文字コードとを照
合する(ステップ103)。そして、この照合が一致し
た文字に関して、辞書作成部9は照合部8より文字コー
ドと特徴量のデータを受け取って新規の認識用辞書10
に登録していく(ステップ104)。照合で一致がとれ
なかった文字に関しては、認識処理で切り出しエラー等
により正しく認識できなかったものであり、認識された
文字コードは誤っているので、辞書作成の対象から外
す。
【0015】このようにして、ユーザが必要とする文字
で、確実に認識できる文字だけを登録した新規の認識用
辞書10を簡単に、かつ短時間で作成することができ
る。なお、辞書作成処理において、正しく認識できなか
った文字に関しては、別途、ユーザが追加登録する作業
を行なえばよい。
【0016】
【発明の効果】以上に説明した如く本発明によれば、画
像読取装置のユーザにおいて、ユーザが必要とする文字
等だけを登録した新規の認識用辞書を簡単かつ迅速に作
成できるようになる。
【図面の簡単な説明】
【図1】本発明の一実施例を示す概略ブロック図であ
る。
【図2】新規の認識辞書の作成過程を示す概略処理フロ
ー図である。
【図3】(a)入力原稿または正解テーブルの内容の一
例を示す。 (b)認識結果データの一例を示する
【符号の説明】
1 入力部 2 認識処理部 3 認識用辞書 5 認識結果の記憶部 6 正解テーブル 8 照合部 9 辞書作成部 10 新規の認識用辞書

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 原稿の画像データを入力する入力部と、
    該原稿上の文字等の画像についての正解データを登録し
    たテーブルと、該入力部により入力された画像データに
    対して文字等の画像の認識を行なう認識処理部と、該認
    識処理部による文字等の画像の認識結果と該テーブル上
    の対応した正解データとを照合する照合部と、該照合部
    による照合で一致がとれた文字等の画像についてのみ登
    録した新規の認識用辞書を作成する辞書作成部とを具備
    する画像読取装置。
JP4302206A 1992-11-12 1992-11-12 画像読取装置 Pending JPH06150068A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4302206A JPH06150068A (ja) 1992-11-12 1992-11-12 画像読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4302206A JPH06150068A (ja) 1992-11-12 1992-11-12 画像読取装置

Publications (1)

Publication Number Publication Date
JPH06150068A true JPH06150068A (ja) 1994-05-31

Family

ID=17906229

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4302206A Pending JPH06150068A (ja) 1992-11-12 1992-11-12 画像読取装置

Country Status (1)

Country Link
JP (1) JPH06150068A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013238999A (ja) * 2012-05-15 2013-11-28 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013238999A (ja) * 2012-05-15 2013-11-28 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Similar Documents

Publication Publication Date Title
JP2713622B2 (ja) 表形式文書読取装置
JP2001126010A (ja) 帳票処理装置、帳票定義作成方法、領域抽出方法及び記憶媒体
JPH06150068A (ja) 画像読取装置
US8472719B2 (en) Method of stricken-out character recognition in handwritten text
JP3159087B2 (ja) 文書照合装置および方法
JPH0388062A (ja) 文書作成装置
JP3114446B2 (ja) 文字認識装置
JP3812719B2 (ja) 文書検索装置
JP2004046388A (ja) 情報処理システムおよび文字修正方法
JPH11213087A (ja) 文字認識装置
JPH10302025A (ja) 手書き文字認識装置およびそのプログラム記録媒体
JPH0256086A (ja) 文字認識の後処理方法
JPH09138835A (ja) 文字認識装置
JP4092768B2 (ja) 文字認識装置および文字認識方法
JPS60173688A (ja) パタ−ン処理装置
JP2829002B2 (ja) 文字認識装置
JP2825523B2 (ja) 文字認識装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH05210635A (ja) 入力装置
JPH04348475A (ja) 画像情報検索方法及びその装置
JPH1185898A (ja) 文字認識装置、文字認識方法及び文字認識プログラムを記録した記録媒体
JPH06333083A (ja) 光学式文字読取装置
JPH10247221A (ja) オンライン文字認識装置
JP3873612B2 (ja) 文書登録装置及び文書検索装置並びに文書登録方法及び文書検索方法
JP2549831B2 (ja) 文字認識装置の入力パターン・文字列登録方法