JPH0424781A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPH0424781A
JPH0424781A JP2125935A JP12593590A JPH0424781A JP H0424781 A JPH0424781 A JP H0424781A JP 2125935 A JP2125935 A JP 2125935A JP 12593590 A JP12593590 A JP 12593590A JP H0424781 A JPH0424781 A JP H0424781A
Authority
JP
Japan
Prior art keywords
character
feature extraction
image
character image
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2125935A
Other languages
English (en)
Inventor
Tetsuomi Tanaka
哲臣 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2125935A priority Critical patent/JPH0424781A/ja
Priority to EP91304310A priority patent/EP0457545B1/en
Priority to DE69130655T priority patent/DE69130655T2/de
Publication of JPH0424781A publication Critical patent/JPH0424781A/ja
Priority to US08/235,133 priority patent/US5784501A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/166Normalisation of pattern dimensions
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字の認識を行うことができる文書処理装置
に関する。
〔従来の技術〕
従来、文字の認識に関して以下に示す種々の欠点が考え
られる。
■従来、文字認識装置においては、文字切出し、文字特
徴抽出、識別処理の各段階をへて文字画像から文字コー
ドへの変換処理が行われるが、文字切出しから文字特徴
抽出へ送られる文字画像フォーマットは一定であるのが
普通である。ここで特徴抽出とは文字画像の正規化を行
い、正規化された画像をブロック分割して、各ブロック
単位に方向指数や背けい密度等の文字の特徴量を特徴ベ
クトルとして出力するものである。
■従来臼ヌキ文字を認識処理しようとした場合認識処理
する文字画像を反転処理してから通常の認識処理を行っ
ていた。
■文字の方向には「あ」、「碇」、「年」、「(」等、
種々の方向が考えられるが従来は例えば、「あ」の様に
、決まった方向の文字しか認識しなかった。または特徴
ベクトル並べかえによって対応していた。
■文字方向の分からない文字列を認識する場合に、4方
向で識別し、文字方向を決めて以下文字方向がわかった
後も、特徴ベクトルの並べかえをしなければならなかっ
た。
■従来、イタリック体処理は、不可能か、別の手段を用
いていた。
■従来傾いた文字を認識するためには、スキャナで画像
を入力しなおすか、画像自体を回転処理していた。
■従来認識する画像は1文字車位に分割されて特徴抽出
以下の処理を行っていた。
〔発明が解決しようとしている課題〕
■しかしながら、上記従来例では文字画像フォーマット
が固定であるため、文字認識手段を必要とする種々のシ
ステムを考えた場合にそれぞれのシステムに都合の良い
画像フォーマットに対応しようとした時に文字画像フォ
ーマット自体を特徴抽出部が前提とするフォーマットに
変換するか特徴抽出以下体を変更しなければならない。
前者の場合余分な処理時間がかかり後者の場合は変更毎
に多大な労力を要し経済的ではない。
■しかし、上記従来例では、文字画像反転処理の時間が
余分に必要であった。
■しかし、上記従来例では第1O図に示すようなA4文
書をA4スキャナで読もうとしたときに認識処理出来る
文字方向が決まっているため、2回に分けてスキャナで
読まなければならなかった。また可能であっても処理時
間がかかったりした(特徴ベクトル並べかえ)。
具体的に第11図で説明する。特徴ベクトルとは、(a
)のように文字画像をいくつかのブロックに分割し、そ
のブロックごとの方向指数や白、黒画素の密度等のヒス
トグラムをとることによって得られる。
例では、(C)にしめず1〜4の方向指数を特徴量とす
るものとする(a)を90’ 回転させたものを(b)
として、(a)と(b)を同じように特徴抽出するもの
とする。Ca)における方向指数1は(b)においては
方向指数3として抽出される。また、(a)のブロック
2の特徴は(b)においてブロック9′にあたる。した
がって(b)の特徴ベクトルの方向指数1と3.2と4
を変換しブロック1′ の特徴をブロック4の特徴とす
るというような操作をすることによって(a)と(b)
の特徴ベクトルは同一になる。画素密度などの特徴量も
このような並べかえて可能であり、別の特徴量を特徴ベ
クトルとする場合も変換方法が存在すると考えられる。
■しかしながら従来例では文字方向がわかった後でも特
徴ベクトルを並べかえて文字方向の変換をしなければな
らないので不合理かつ処理時間もかかった。
■しかしながら上記従来例ではイタリック体用に別の手
段がいるという欠点があった。
■しかしながら、上記従来例ではスキャナを読みなおす
場合はユーザの負担があり、画像回転の場合はその回転
時間と文字画像の変形による認識率の低下という欠点が
あった。
■しかしながら上記従来例では「い」を1文字か2文字
かを判定するために「い」、「(」、「)」の3つの画
像が同一画像から生成され不合理である上に本来工つの
画像を3つの画像で管理しなければならないため管理が
大変で文字画像生成のための処理時間がかかるという欠
点があった。
■A4文書40のdpi1ルミ1ページを上記7て実現
した場合にはテーブルメモリのバス幅は24bit必要
(2M B y t e )であり、バス幅とメモリサ
イズが大きくなる。16bitのバス幅にして2回のア
クセスで読み出す場合は処理時間がますという欠点があ
った。
〔課題を解決するための手段(及び作用)〕本発明によ
れば、以下の作用を有するものである。
■本発明によれば、ASBの2つの正規化アドレステー
ブルメモリと、各文字画像のフォーマットに応じて正規
化アドレスを演算するマイクロプロセッサと正規化画像
の各画素に対応する文字画像上のビットアドレスを求め
、前記各画素の情報を該ビットアドレスにある文字画像
上の画素の情報から求めることにより前記ASBの正規
化アドレステーブルを参照し文字画像正規化以降の特徴
抽出を行う特徴抽出部と、文字画像を格納する文字画像
メモリと、これらの制御手段を設けることにより、特徴
抽出部や文字画像フォーマットの変更を必要としない多
種類の画像フォーマットに対応した文字認識装置を実現
できる。
■本発明によれば、文字画像部分が2値の1.0のどち
らかにあたるか記憶する手段と、その記憶された情報に
より、文字格納メモリから特徴抽出部への画像データを
反転、非反転して出力する手段を設けることにより白ぬ
き文字等の処理が出来ることを特徴とした文字認識装置
■本発明によればA、82つの正規化アドレステーブル
メモリと各文字方向によって異なる正規化アドレス演算
する計算機と前記A、Bのテーブルメモリを参照して文
字画像正規化以下の文字特徴抽出部と文字画像を格納す
る文字格納メモリとこれらを制御する制御部を設けるこ
とにより、文字方向が変わっても処理時間が変わらない
ので認識処理が可能な文字認識装置。
■本発明によれば上の3と得られた特徴ベクトルを並べ
替えて4文字方向の特徴ベクトルを作成する能力をもつ
、識別部をもつことにより、高速な、文字方向自動識別
手段をもつ文字認識装置。
■本発明によればlにおいてイタリック体の文字の傾斜
度を補正した正規化アドレスを演算する計算機をもつこ
とによりイタリック体の識別の可能な文字認識装置。
■本発明によればlにおいて文字の傾き度を補正した正
規化アドレスを演算する計算機をもつことにより、傾い
た文字の認識に強い文字認識装置。
■本発明によれば1において認識対象の文字域全体を格
納可能な文字格納メモリと、lからの特徴ベクトルによ
り識別処理をする識別部とこれらを管理する管理部によ
り半角、分離文字等に強い文字認識装置。
■本発明によればlにおいてアドレス演算にシフト加算
手段をもつことにより容易に文字格納メモリを大きく出
来る文字認識装置。テーブルメモリのサイズは1よりも
小さい。
■本発明によればlにおいて文字方向によってアドレス
演算が変わるシフト加算手段をもつことにより容易に文
字格納メモリを大きく出来、文字方向によって処理時間
の変わらない文字認識装置。テーブルメモリのサイズは
lよりも小さい。
〔実施例〕
以下、図面を参照し、本発明の実施例について、詳細に
説明する。尚、本発明は1つの機器において実現しても
良く、複数の機器から成るシステムにおいて、実現して
も良いことは言うまでもない。又、パソコン等にソフト
を供給することによって実現する様にしても良い。
第1図(a)は認識処理の流れを示す図である。
図から明らかな様に、文字特徴抽出部は正規化、画像の
ブロック分割、特徴ベクトル抽出から成っている。後述
する正規化以降の特徴抽出処理とは画像のブロック分割
、特徴ベクトル抽出処理である、尚、特徴ベクトル抽出
処理には、ブロック単位の方向指数や画素密度の抽出や
、そのブロックに刻するフィルタ処理による次元縮小、
例えば7×7のブロックを4×4のブロックに圧縮する
処理など力・ふくまれる。
又、本発明で言う特徴抽出処理とは与えられた文字画像
をある大きさに正規化した画像を作成するしないにかか
わらず、該正規化画像の黒、白画素情報を正規化アドレ
ステーブルより求まる文字画像上のビットアドレス(正
規化ビットアドレス)の画素情報より求め、文字の特徴
量を抽出して特徴ベクトルとして出力するものである。
特徴量は文字の方向量、白黒画素の密度量など任意のも
のである。また、原文字画像、濃淡情報(多値画像)を
もっていても問題はない。そして文字の特徴量を求める
ために原文字画像を正規化する全てのアルゴリズムに使
用出来る。
以下、前記計算機が作成したテーブルを正規化アドレス
テーブルと呼びAとBのテーブルの内容を加算して得ら
れた内容を正規化ビットアドレスと呼ぶ。正規化ビット
アドレスは前記文字メモリ内の1点を表わし、正規化画
像上の1点のデータとなる。
■〔2つの正規化テーブル〕 第1図(b)は本発明の特徴を最もよ(表わす図面であ
り、第1図(a)における文字特徴抽出部の詳細説明図
である。同図において1は前段の文字切出し部よりの入
力部であり文字メモリ上の認識処理に必要な文字位置な
どの文字切出し情報及び文字画像が送られる。2はプロ
クラムメモリ、データメモリを有した計算機、3は文字
画像を格納する文字画像メモリ、4は正規化アドレスを
格納するA、B2つのテーブルメモリ、5はテーブルメ
モリ4を参照し、文字メモリ3内部の文字画像を正規化
以下の特徴抽出処理を行う特徴抽出部、6は前記メモリ
に対する外部アクセスの切換え、及び特徴抽出部等の全
体の制御を行う制御部、7−1〜3は制御部6より信号
を受は各メモリのアクセスを制御するバッファであり、
8は特徴抽出部6より特徴ベクトルを次段の識別部へ送
る出力部である。
まず、第2図(a)の文字画像を同図(b)にあるよう
にNXNのサイズに正規化することを考えてみる。ここ
で文字メモリ内のワード単位をIByteとして1By
te内のビット順はMSB +LSBとしてヒツト7が
Oでビット0が7として順位づけされるものとする。よ
ってO番地ビット7はビットアドレス0となり、1番地
ビット7はビットアドレス8番地となる。
ここで正規化画像(b)上の点(x、  y)が与えら
れた場合の元の文字画像(a)上の点を計算してみると
、 の点となる。第2図(a)から明らかな様に、横方向は
WByte(W・23bit)長であるから元の文字画
像(a)上のビットアドレスを求めるとBit  Ad
dress  (x、  )’)となる。(全て整数、
演算でよい)これは正規化画像を作成するためのデータ
を格納した文字メモリ(3)内のビットアドレスである
ので、以下、正規化ヒツトアドレスと呼ぶ。
よって正規化画像上の点に対応する文字画像の点のアド
レスは(1)項と(2)項の加算で表わされることとな
る。ここてA、82つのテーブルメモリを用意してここ
に正規化ヒツトアドレス演算用に前述の(1)、(2)
項をそれぞれAとBに格納し、特徴抽出部はテーブルA
、Bの内容の加算値によって正規化ビットアドレスを計
算し、それに対応する文字画像上の点を正規化画像上の
点に対応するデータとして正規化処理以降の特徴抽出処
理を行う構成にすれば、A、 Bの内容の変更だけて多
種類の文字フォーマット例えば第3図(a)、(b)、
(c)参照)に対応出来ることとなる。
さて実際の動作であるが、第3図の(a)〜(C)のフ
ォーマットで説明する(a)は、文字画像を出来るだけ
小さくしたもの、(b)は文字の外接矩形の2点で表わ
したもの、(c)は、文字メモリ内に文字切りされた画
像が多数台まれるものである。入力部1より計算機2に
は切り出された文字が第3図の(a)〜(C)のどの場
合であるかを示すフォーマット情報と、文字切りによる
文字位置情報が、文字メモリ3には実際の文字画像が入
力される。計算機2は、まず、フォーマット情報に基づ
いて、文字フォーマットの種類が、(a)〜(C)のど
れにあたるか判定し、それぞれの第3図A (x)、B
 (y)を演算してテーブルメモリ4 (A、B)に格
納する。
演算が終了したことを制御部6へ知らせる。制御部6は
、文字メモリ2とテーブルメモリ4のアクセス権をバッ
ファ7を制御して特徴抽出部5に渡し、特徴抽出部5を
起動する。特徴抽出部5は、テーブルメモリ4のA、B
を参照し、加算により正規化ビットアドレスを演算し該
当する文字メモリ3のビットデータを読みこんで正規化
処理以下の特徴抽出処理を行なう。処理が終了したとこ
ろで特徴抽出部5は制御部6に知らせ、出力部8に得ら
れた特徴ベクトルを出力する。制御部6は終了後メモリ
アクセス権を元にもどし、計算機2に次の処理が出来る
ことを知らせる。
■〔白抜き文字の処理〕 第1図は、本発明を最もよ(表す図であり、6は計算機
2より文字画像が2値の30どちらかを記憶する手段を
有した制御部であり、7−1は、制御部6からの信号を
受は特徴抽出部5の文字メモリ3へのアクセス権を調整
し、かつメモリ3から特徴抽出部5へのデータを反転ま
たは非反転の処理をするものである。
以下、第3図(a)と((1)で説明する。(d)は(
a)を反転した文字(白ヌキ文字)であり大きさなどは
変わらない。(a)で文字本体が2値の”ビにあたると
すると(d)では“ONでありこのまま特徴抽出すると
、文字rAJの全く反対の特徴が出力されてしまう。こ
こで特徴抽出部5が処理をはじめる前にその情報を、制
御部6に記憶させ、制御部6は7−1を制御し文字メモ
リ2から特徴抽出部5へのデータは全て反転させるよう
にする。これによって文字本体の“0”は全て“1”に
変換され(a)と(d)は全く同じ特徴が抽出される。
これにより白ヌキ文字等の認識が可能となる。
尚、白ヌキ文字の検出であるが、ユーザが白ヌキ文字の
まわりの白画素がふ(まないように領域指定する。文字
切出部は領域内の縦または横方向の射影をとる。第3図
(e)で説明すると文書画像上の座標(a、  b) 
−(c、  d)が指定されたとして、上記の射影をと
ると、指定されたa−c間と、b−d間の全域にわたっ
て射影が検出される。ここで(a、 b)と(c、 d
)の座標の画素をlかOを判定する。通常、黒画素が1
として、両方がOてあったならば白ヌキ文字と判断して
白ヌキ文字に対応した文字切出しをする。これによって
、文字の切出しが成功した場合その文字位置情報と白ヌ
キ文字であるという情報を前記実施例に送る。座標を調
べるのは、文書が傾いて、全域に射影がとられた場合と
区別するためである。
または、最初に指定領域の4点の座標の0.1判別をし
てもよい。
■〔2つの正規化テーブル十文字の方向性加味〕第1図
は本発明を最もよく表わす図である。説明は■と同じで
ある。
まず第4図の(a)〜(d)で説明する。(a)が通常
の文字方向であり、文字画像は矢印の方向にアクセスさ
れ左上から右下へ正規化処理がされるものとする。(b
)〜(d)は(a)を90°づつ回転させたものである
が、文字画像が(a)と同じように正規化されると「あ
」という文字とは全く異なる特徴が抽出されてしまう。
そこで文字画像のアクセスを文字の左上から右下へ行な
われるようにすれば、(b)〜(d)の正規化画像は(
a)と同じくなり、(a)と全く同じ特徴ベクトルが抽
出されることになる。すなわち、(b)においては画像
の左下から右上、(C)では右下から左上、(d)では
右上から左下というようにアクセスがなされるようA、
82つのテーブルメモリを書換えてやればよいことにな
る。左側の式が正規化演算式であるが、(a)、(b)
を比べると、(a)のA (x)とB(y)を交換した
形でB (y)の演算式の結果を(b)のA (x)に
逆に並べた形であり、(a)と(C)では(a)のA 
(x)、B (y)をそのまま逆にテーブルメモリ内に
格納する形である。すなわち、テーブル作成のための演
算量がかわらず格納のしかたがかわるだけなのである。
従って入力部1より文字位置情報のほかに、文字方向の
情報を受けとり文字方向によってテーブル4の作成方法
を変えるだけで、特徴抽出部5に影響を与えず全ての方
向の文字の認識処理が行える。
尚、文字方向と文書方向は、人が指定して、文字切出部
はその情報によって文字切出をして文字方向のデータと
共に文字画像、文字位置情報を上記実施例に送り説明し
たように文字方向に応じてASBのテーブルの内容を(
a)〜(d)のように作成し、以下特徴抽出、識別処理
をして結果を出力する。
これにより縦、横混在、文書方向のセツティングミスに
よるスキャナ入力やりなおし等1枚の文書を複数回に分
けてスキャナ入力しないでよいといった点が解決される
■〔■十特徴ベクトル並べ換え技術〕 第5図は本発明を最もよく表わす図である。lは文字入
力部であり、文字位置情報と、文字画像が入力される。
9は前述の■であり文字方向処理可能な特徴抽出装置で
ある。8は9の出力部であり、特徴ベクトルが出力され
る。lOは識別部であり8より得られた特徴ベクトルよ
り距離計算により、最も近い文字フードを出力する。1
1はその文字コード出力部である。本発明では文字方向
の指定はこの識別部10て行う。
ここで特徴ベクトルの性質であるが文字画像をM等分し
た各ブロック単位の方向量や背けい密度であり、並べか
えによって■における処理と同等の効果を得ることが出
来る。しかし並べかえの時間だけ遅くなる。
まず、文字方向の全くわからない文字列に対して、最初
の数文字は第4図(a)の方向で特徴抽出させる。次に
識別部10において並へかえをして第4図(b)〜(d
)の特徴ベクトルを作成してそれぞれについて識別処理
をする。識別結果の平均値の最もよい方向を文字方向と
して9に送る。9は以下、指定された方向で特徴抽出を
行う。これにより、文字方向を自動的に判定し、かつ認
識処理速度の速い(並べかえがいらない)文字認識装置
が出来る。
実際には、文字方向の不明な文書画像に対して、文字切
出し部が画像の射影やヒストグラム処理によって、縦、
横方向の行の検出をして行方向を求める。求まった行を
あらかじめ決めておいた順序(右−左、上→下といった
順)で行に対して文字の切出しをして、上記認識装置に
送り、結果である候補文字列と判定された文字方向を認
識装置より受取る。文字切出し部で判定された行方向と
認識部の文字方向の情報により、候補文字列を並べかえ
て正しい文書とする。文字切出し部はあらかじめ行方向
とそれに対する文字方向によって正しい文書となる文字
列の順序をそうていしておく。並べかえは、文字切出し
を行ったところでやる。認識装置に行単位の各行の文字
数と行数、そうていされる行方向情報も送られる場合は
、第9図のような構成にして管理部I2が並べかえをす
る。
■、■〔■十文字の傾き度補正〕 第1図は本発明を最もよく表わす図である。■と同じで
あるので詳細は省略する。
第6図で説明すると第6図■のようなイタリック体の文
字があった場合にその傾き具合を補正して正規化処理が
行えるようにA、Bのテーブルを作成すれば良いのであ
る。第6図に示す式のB (y)のu+(N−y+1)
カーそれてあり、これi。
第2項の よって特徴抽出部5は一切の変更なしにイタリック体文
字を補正して特徴抽出が可能となり、その認識も可能と
なる。
尚、傾き具合をしめすω1は文字切出し部が検出する。
例えば文字列中に他の文字は正常な切出しが出来、横幅
の極端に広い文字があった場合にイタリック体の角度(
イタリック体の角度はほとんど決まっていて、大多数の
イタリック体がカバーできる)で射影をとり、ω!を近
似的に求める。これにより前記実施例にイタリック体で
あるという情報と傾き度ωIを含めた文字位置情報を送
る。
またはユーザによるイタリック体モードの指定。
又、第7図(a)、(b)2つの画像入力時に傾斜して
しまった文字画像があるがそれぞれ下式のA (x)、
B (y)のように傾き補正をした正規化データをA、
B2つのテーブルメモリ4に格納すれば特徴抽出部5に
は何の変更もなしに傾いた文字を補正した特徴抽出が出
来、よって傾斜文字に対する認識率が向上する。
尚、文字の傾き度ωA、h^と、傾き方向は文字切出し
部が検出する。まず行を通常の方法で切出しを行い外接
矩形を求める。次に文字外接矩形の下端部の中心点の最
小2乗法をとって傾き角θを求める(公知の例による)
。傾き角θが求まったのでその角度で射影をとり傾き度
のA% hAといった傾き度を求める。
■〔文字格納部を広げる〕 第9図は本発明を最もよく表わす図である。lは入力部
であり、前段の文字切り出し部より文字画像は第1図の
文字メモリ2へ各文字情報(例えば第8図の(1)、(
3)、(4)、(5)の位置)は管理部12へ入力され
る。10は第1図より特徴ベクトルを入力され識別距離
計算を行い候補文字と距離値を出力する識別部、12は
第1図と候補文字の管理を行う管理部、11は認識結果
を出力する出力部。
まず第1図においてASB2つのテーブルメモリの加算
によって特徴抽出を行うことを前に述べたが、あつかえ
る最大の画像サイズは加算結果のビット数による。たと
えばA (x)、B (y)力月6bitデータの場合
は最大8KByte、24bitの場合は2M B y
 t eの画像をあつかえることになる。第1図には任
意の画像フォーマット(第3図(a)、(b)、(C)
)が入力出来るので、第8図のような識別処理する全体
の画像てもよいのである。(場合によっては文書1ペ一
ジ分の画像) 最初に入力部1より第1図文字メモリには、認識処理す
る全体の文字画像が送られ、管理部には文字位置情報が
送られる。第8図で説明すると(1)、(3)、(4)
、(5)の位置情報と(3)、(4)は工文字なのか2
文字なのか分からないという情報が送られる。管理部に
はこの情報を元にして(1)、(2)、(3)、(4)
、(5)の文字位置情報として第1図に送る。第1図は
(1)、(2)、(3)、(4)、(5)の順に特徴抽
出をして特徴ベクトルを識別部1oへ送る。この間文字
メモリの内容は変化しない。(文字特徴抽出ごとに送ら
なくて良い)。識別部は(1)〜(5)の順に候補文字
と距離値を管理部12へ送る。管理部には(2)〜(4
)の文字について(2)の第一候補が「いJのような分
離文字であったら(1)、(2)、(3)の文字を出力
部11へ出力する。
(3)、(4)の第一候補が半角文字ならば(1)、(
3)、(4)、(5)を出力部11へ出力する。どちら
でもない場合は距離値を比較して近い方を出力する。
尚、本発明では管理部には文字の位置関係を把握してい
るので「−」がアンダーラインなのがマイナス記号なの
かという判定も位置関係から判定出来る。
■〔シフト加算手段〕 第1図は本発明を最もよく表わす図である。■でも述べ
た様に扱える画像サイズはA (x)、B (y)のビ
ット数に制限される。
第3図(a) 〜(d)においてB (y)には22が
乗算されている。そこてB (y) ’ =B (y)
 /22をテーブルメモリBに格納し特徴抽出部てA 
(x)+ (B (y) (3)の加算をすれば222
8倍の画像メモリを扱えることになる。(1ワードの単
位が2Byteであれば2°216倍) ■〔■十■〕 第1図は本発明を最もよ(表わす図である。
第4図(a)、(c)においてB (y) ’ =B 
(y)/22をテーブルメモリBに格納し、(b)、(
d)においてA (x) ’ =A (x) /22を
テーブルメモリAに格納する。制御部6は計算機2がら
文字方向を記憶し、特徴抽出部5に伝える。特徴抽出部
5は(a)、(c)の場合は、A (x) + (B 
(y) <s)の加算をし、(b)、(d)の場合は(
A (x) (3) 十B (y)の加算をする。効果
は8と同様にテーブルメモリの節約が出きて、かつ4文
字方向の特徴抽出が可能となる。
〔他の実施例〕
第1図において計算機2、特徴抽出部5、制御部6が1
つの計算機である場合、計算機2は文字フォーマットに
応じてテーブルメモリA、Bの内容を作成し、次に特徴
抽出プログラムによって、前記A、Bを参照しながら正
規化以下の特徴抽出処理をする。
これは計算機2がA、Bのテーブルを参照しながら特徴
抽出することて、文字方向、傾きなどに無関係に同一プ
ログラムによって多種類の処理が可能である。・・・(
計算機が高速化された場合と処理時間が問題にならない
場合) 〔実施例3〕 第5図、第9図において第1図計算機2が管理作業をす
る。
〔実施例4〕 第1図において文字格納メモリに文字位置情報と文字画
像が格納され計算機2は文字メモリ3から文字位置情報
を読みこんで処理する。
(文字メモリ内はいかなるフォーマットでも良いので資
源の有効利用が出来る) クレーム1〜7の全ての組合わせ処理が可能例・・・傾
いた分離文字(クレーム6+7)尚第12図は装置全体
の構成ブロック図てあり、lOOはホストであり画像入
力、領域指定、文字の切出し、文書編集といった処理を
する。200はスキャナであり文書画像をホストlへ送
る。300は認識装置であり、ホスト100より送られ
た文字画像フォーマットに応じて、特徴抽出をして(第
1図)、得られた特徴ベクトルを用いて識別処理をする
ことにより文字画像より候補文字の文字コードをホスト
100へ送る。
〔発明の効果〕
以上、詳述した様に本発明によって以下に示す効果が得
られる。
■以上説明したようにA、82つの正規化テーブルメモ
リと文字フォーマットに応じて前記テーブルの内容を作
成する計算機を設けることにより■特徴抽出部の変更な
しに多種類の文字画像フォーマットに対応出来る。
■プロセッサが演算する正規化アドレスはN2個ではな
く2N個であるため比較的処理負担が小さい。
■特徴抽出部が正規化ビットアドレスを演算するのはた
だの加算のみなので簡略化される。
■以上説明したように文字画像メモリのデータを反転、
非反転して、特徴抽出部へ出力する手段を設けたことに
より、 ■白ヌキ文字の認識が可能となる ■文字画像自体を反転させないため処理時間はかわらな
い。
■以上説明したようにA、B2つの正規化テーブルメモ
リと文字方向によって正規化ビットアドレス演算を変更
する計算機を設けたことにより通常と処理時間がかわら
ず、特徴抽出部の変更のいらないでいかなる文字方向で
も認識処理が出来る。
0以上説明したように3と特徴ベクトル並べかえの機能
を有する識別部を有することにより、文字方向の判別、
認識処理が自動的かつ高速にすることが出来る。
■以上説明したようにAXB2つの正規化アトL/ステ
ーブルメモリと文字の傾き度を補正して正規化アドレス
を演算する計算機を設けたことにより、イタリック体の
認識が通常とかわらず出来る。
0以上説明したようにA、82つの正規化テーブルメモ
リと文字の傾き度を補正して正規化アドレスを演算する
計算機を設けたことにより傾いた文字の認識率が向上す
る。
■以上説明したように文字格納メモリを大きくして、管
理部を設けることにより、文字の半角、全角判定および
位置判定が一括して処理出来る。
0以上説明したように、特徴抽出部にシフト加算手段を
設けることにより、テーブルメモリサイズが小さくかつ
接続する文字画像メモリの大きい文字認識装置が実現出
来る。
0以上説明したように、文字方向を記憶する手段と、そ
の記憶に応じた特徴抽出器正規化アドレスシフト加算手
段を設けることによりテープルメモリサイズが小さく、
接続する文字画像メモリが大きく、かつ任意の文字方向
の文字に対し処理時間の変わらずに認識処理する文字認
識装置が実現出来る。
【図面の簡単な説明】
第1図(a)は認識処理のアルゴリズムを示す図、第1
図(b)は本発明の実施例の構成図、第2図は文字正規
化の説明図、 第3図(a)〜(c)は文字フォーマット例、′:43
119(d)(e)は白ヌキ文字例を示す図、第4図は
■の文字方向処理の説明図、 第5図は■の実施例の説明図、 第6図は■のイタリック体文字処理の説明図、第7図は
■の傾き文字処理の説明図、 第8図は■の処理説明図、 第9図は■の実施例の説明図、 第10図は■の従来説明図、 第11図は特徴ベクトル並べかえの説明図、第12図は
装置全体の構成ブロック図。 ■・・・文字切り情報入力部 2・・・計算機 3・・・テーブルメモリA1 4・・・文字格納メモリ 5・・・特徴抽出部 6・・・制御部 8−・・特徴ベク 10・・・識別部 11・・・文字コード出力部 12・・・管理部 トル出力部 (α) 第1図 (b) 坪り呆 ′i#3 図 −−’11 )8 (ω“【) A(1)−七α に) 丈寄f)’19す・・、T本41Aja釈わ耳第W■ (b) \N

Claims (8)

    【特許請求の範囲】
  1. (1)2つのテーブルメモリと、各文字画像の種類に応
    じた処理を行って、前記テーブルメモリの内容を生成す
    る生成手段と認識処理を行う対象の画像を格納する文字
    画像メモリと、前記テーブルメモリ内のデータの加算を
    して、その加算結果に対応する前記文字画像メモリ内の
    ビットデータによって文字画像の正規化以降の文字特徴
    抽出処理をする特徴抽出手段とを有することを特徴とし
    た文書処理装置。
  2. (2)前記文書処理装置において、文字画像部分が2値
    の0、1のどちらにあたるか記憶する手段と、その記憶
    された情報により文字格納メモリから特徴抽出部への画
    像データを反転、非反転して出力する手段を有すること
    を特徴とした請求項第1項記載の文書処理装置。
  3. (3)更に文字方向情報により方向補正をした正規化ア
    ドレステーブルを生成する手段を持つことを特徴とした
    請求項第1項記載の文書処理装置。
  4. (4)更に文字特徴ベクトルを並べかえて4方向特徴ベ
    クトルを生成する手段を有したことを特徴とした請求項
    第3項記載の文書処理装置。
  5. (5)文字の傾き度を補正した正規化アドレステーブル
    を生成する手段とを有したことを特徴とする請求項第1
    項記載の文書処理装置。
  6. (6)前記特徴抽出手段によって、得られた特徴ベクト
    ルと学習データを比較して候補文字を出力する識別処理
    をする識別部と、これらを管理する管理部をもつことを
    特徴とした請求項第1項記載の文書処理装置。
  7. (7)前記2つのテーブルのデータをシフト操作してそ
    のシフト操作されたデータを加算して正規化ビットアド
    レスを演算するシフト加算手段を有したことを特徴とす
    る請求項第1項記載の文書処理装置。
  8. (8)文字方向を記憶する手段とそれに応じた特徴抽出
    手段の正規化ビットアドレス演算用シフト加算手段をも
    つことを特徴とした請求項第1項記載の文書処理装置。
JP2125935A 1990-05-15 1990-05-15 文書処理装置 Pending JPH0424781A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2125935A JPH0424781A (ja) 1990-05-15 1990-05-15 文書処理装置
EP91304310A EP0457545B1 (en) 1990-05-15 1991-05-14 Image processing method and apparatus
DE69130655T DE69130655T2 (de) 1990-05-15 1991-05-14 Verfahren und Gerät zur Bildverarbeitung
US08/235,133 US5784501A (en) 1990-05-15 1994-04-28 Image processing method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2125935A JPH0424781A (ja) 1990-05-15 1990-05-15 文書処理装置

Publications (1)

Publication Number Publication Date
JPH0424781A true JPH0424781A (ja) 1992-01-28

Family

ID=14922607

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2125935A Pending JPH0424781A (ja) 1990-05-15 1990-05-15 文書処理装置

Country Status (4)

Country Link
US (1) US5784501A (ja)
EP (1) EP0457545B1 (ja)
JP (1) JPH0424781A (ja)
DE (1) DE69130655T2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06251199A (ja) * 1993-02-26 1994-09-09 N T T Data Tsushin Kk 文字認識前処理装置
JP2008191943A (ja) * 2007-02-05 2008-08-21 Sanko Co Ltd Icタグホルダ
JP2008282327A (ja) * 2007-05-14 2008-11-20 Sharp Corp 文字対称性判定方法及び文字対称性判定装置
US7715762B2 (en) 2006-07-31 2010-05-11 Sharp Kabushiki Kaisha Developing apparatus and image forming apparatus including same

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6256412B1 (en) * 1996-03-04 2001-07-03 Ricoh Company, Ltd. Image recognition method and apparatus using image rotation information
JPH09259219A (ja) * 1996-03-26 1997-10-03 Sharp Corp 文字認識方法
US6215901B1 (en) * 1997-03-07 2001-04-10 Mark H. Schwartz Pen based computer handwriting instruction
US6975425B1 (en) * 1998-02-26 2005-12-13 Canon Kabushiki Kaisha Information processing apparatus and information processing method
US6882746B1 (en) * 1999-02-01 2005-04-19 Thomson Licensing S.A. Normalized bitmap representation of visual object's shape for search/query/filtering applications
JP4189506B2 (ja) * 2000-06-09 2008-12-03 コニカミノルタビジネステクノロジーズ株式会社 画像処理のための装置、方法及び記録媒体
US20070139412A1 (en) * 2005-12-19 2007-06-21 Microsoft Corporation Automatic font control value determination
US8582889B2 (en) * 2010-01-08 2013-11-12 Qualcomm Incorporated Scale space normalization technique for improved feature detection in uniform and non-uniform illumination changes

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5599680A (en) * 1979-01-24 1980-07-29 Toshiba Corp Character reading control system
JPS5856079A (ja) * 1981-09-29 1983-04-02 Ricoh Co Ltd 光学文字読取装置における文字切出装置
JPS58114176A (ja) * 1981-12-26 1983-07-07 Fujitsu Ltd 図形認識装置
JPS60126779A (ja) * 1983-12-13 1985-07-06 Ricoh Co Ltd 画像正規化装置
JPS6220069A (ja) * 1985-07-19 1987-01-28 Canon Inc 画像情報変換方式
JPS62147584A (ja) * 1985-12-23 1987-07-01 Toshiba Corp 文字読取装置
JPS62166486A (ja) * 1986-01-20 1987-07-22 Matsushita Electric Ind Co Ltd 文字図形読取装置
JPS62166479A (ja) * 1986-01-20 1987-07-22 Ricoh Co Ltd 名刺画像処理方法
JPS6316349B2 (ja) * 1983-02-28 1988-04-08 Tokyo Shibaura Electric Co

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3710323A (en) * 1971-12-13 1973-01-09 Ibm Pattern-size normalizing for recognition apparatus
US4173015A (en) * 1978-08-16 1979-10-30 Recognition Equipment Incorporated System and method for character presence detection
US4658424A (en) * 1981-03-05 1987-04-14 Texas Instruments Incorporated Speech synthesis integrated circuit device having variable frame rate capability
JPS5887652A (ja) * 1981-11-19 1983-05-25 Ricoh Co Ltd 画像処理装置
FR2608295B1 (fr) * 1986-12-12 1989-03-31 France Etat Procede et dispositif de reconnaissance de caracteres
US5136659A (en) * 1987-06-30 1992-08-04 Kokusai Denshin Denwa Kabushiki Kaisha Intelligent coding system for picture signal
JP3046027B2 (ja) * 1987-08-05 2000-05-29 キヤノン株式会社 文字処理方法
US5062141A (en) * 1988-06-02 1991-10-29 Ricoh Company, Ltd. Method of segmenting characters in lines which may be skewed, for allowing improved optical character recognition
US5077811A (en) * 1990-10-10 1991-12-31 Fuji Xerox Co., Ltd. Character and picture image data processing system

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5599680A (en) * 1979-01-24 1980-07-29 Toshiba Corp Character reading control system
JPS5856079A (ja) * 1981-09-29 1983-04-02 Ricoh Co Ltd 光学文字読取装置における文字切出装置
JPS58114176A (ja) * 1981-12-26 1983-07-07 Fujitsu Ltd 図形認識装置
JPS6316349B2 (ja) * 1983-02-28 1988-04-08 Tokyo Shibaura Electric Co
JPS60126779A (ja) * 1983-12-13 1985-07-06 Ricoh Co Ltd 画像正規化装置
JPS6220069A (ja) * 1985-07-19 1987-01-28 Canon Inc 画像情報変換方式
JPS62147584A (ja) * 1985-12-23 1987-07-01 Toshiba Corp 文字読取装置
JPS62166486A (ja) * 1986-01-20 1987-07-22 Matsushita Electric Ind Co Ltd 文字図形読取装置
JPS62166479A (ja) * 1986-01-20 1987-07-22 Ricoh Co Ltd 名刺画像処理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06251199A (ja) * 1993-02-26 1994-09-09 N T T Data Tsushin Kk 文字認識前処理装置
US7715762B2 (en) 2006-07-31 2010-05-11 Sharp Kabushiki Kaisha Developing apparatus and image forming apparatus including same
JP2008191943A (ja) * 2007-02-05 2008-08-21 Sanko Co Ltd Icタグホルダ
JP2008282327A (ja) * 2007-05-14 2008-11-20 Sharp Corp 文字対称性判定方法及び文字対称性判定装置

Also Published As

Publication number Publication date
DE69130655T2 (de) 1999-06-17
DE69130655D1 (de) 1999-02-04
US5784501A (en) 1998-07-21
EP0457545A2 (en) 1991-11-21
EP0457545B1 (en) 1998-12-23
EP0457545A3 (en) 1993-08-11

Similar Documents

Publication Publication Date Title
JP4607633B2 (ja) 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
US5129012A (en) Detecting line segments and predetermined patterns in an optically scanned document
EP1017011A2 (en) Block selection of table features
JPH0424781A (ja) 文書処理装置
US6266444B1 (en) Character processing apparatus and method therefor
US5526440A (en) Hand-written character recognition apparatus
JP3062382B2 (ja) 画像処理装置及び方法
JP3184979B2 (ja) デジタル活字面の輪郭を形成する方法およびその装置
JPH09237318A (ja) イメージスキャナ入力文字画像データの傾き補正方法
JPH0830725A (ja) 画像処理装置及び方法
JP2867531B2 (ja) 文字サイズ認識装置
JP2743378B2 (ja) 文字認識方法
JPH11187231A (ja) 画像検索装置及び画像検索方法
JP2755299B2 (ja) 画像処理方法
JP3320083B2 (ja) 文字認識装置及び方法
JPH08147314A (ja) 認識型文書ファイリング装置及びその制御方法
JPH05189563A (ja) 画像処理装置
JP2595399B2 (ja) 文書処理方法
JPS61196382A (ja) 文字切出し方式
JP3362452B2 (ja) ドットパターンデータをアウトラインデータに変換する際のサンプル点創生方法
JP2963474B2 (ja) 類似文字識別方法
JP2762476B2 (ja) 清書装置
JP2962525B2 (ja) テキストブロック認識方法
JPH0512489A (ja) 表認識装置