JPH0855191A - ドキュメントコンポーネントの減数サンプリング方法 - Google Patents

ドキュメントコンポーネントの減数サンプリング方法

Info

Publication number
JPH0855191A
JPH0855191A JP7211277A JP21127795A JPH0855191A JP H0855191 A JPH0855191 A JP H0855191A JP 7211277 A JP7211277 A JP 7211277A JP 21127795 A JP21127795 A JP 21127795A JP H0855191 A JPH0855191 A JP H0855191A
Authority
JP
Japan
Prior art keywords
document
sampling
subtrahend
component
decimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7211277A
Other languages
English (en)
Other versions
JP2994581B2 (ja
Inventor
Oscar Ernesto Agazzi
アーネスト アガッジ オスカー
Kenneth W Church
ワード チャーチ ケネス
William Arthur Gale
アーサー ゲイル ウィリアム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JPH0855191A publication Critical patent/JPH0855191A/ja
Application granted granted Critical
Publication of JP2994581B2 publication Critical patent/JP2994581B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/993Evaluation of the quality of the acquired pattern

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Processing (AREA)
  • Computer And Data Communications (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 ドキュメントの減数サンプリング方法。 【解決手段】 ドキュメント中のコンポーネント文字を
OCR910が入力として受けコンポーネントの識別同
定の信頼性測定値を出力する。しきい値処理装置835
がこれを受けてしきい値と比較し測定値がしきい値より
も大きい、すなわちコンポーネント文字が十分な信頼性
をもって識別同定される場合は、コンポーネント文字を
フォント置換式減数サンプリング装置830によって減
数サンプリングする。そうでない場合には、ドキュメン
ト中の文字をデシメーション(10%減数法)式減数サ
ンプリング装置840によって減数サンプリングする。
別の実施例においては、文字を2次元非線形フィルタに
かけてデシメーションすることによっても減数サンプリ
ングを行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ドキュメントの減
数サンプリングに関し、詳しくは光学的文字認識、フォ
ント置換、及び等化を用いる減数サンプリングに関す
る。
【0002】
【従来の技術】現代の電気通信及びコンピュータシステ
ムにおける入出力装置は、情報(例えばテキスト、デー
タ、ビデオ、イメージ、等)を、更なる処理又は解釈
(そのシステムを使用している人々による解釈を含む)
のために、そのシステムへ、又は、から転送し、表示す
る装置である。
【0003】ここで関心の対象となる情報は、ドキュメ
ントである。ドキュメントは、種々の形式で提供され
る。例えば、アナログ形式で紙、マイクロフィッシュ、
又は35mmフィルムで提供され、又は代わりに、スク
リーンダンプのようなディジタルビットマップ形式で、
若しくは、ASCII(アスキー)、Latin1、ユ
ニコードのような文字表記、又はLATEX、SGM
L、のようなマークアップ言語、又はポストスクリプト
で表される。
【0004】或る表記のドキュメントを別の表記のドキ
ュメントに変換することは可能である。しかし、変換の
結果、情報の損失が生じ、又はノイズが発生する(例え
ば、ファクシミリ(ファックス)装置によって生成され
るドキュメントにおける解像度の損失)。
【0005】重要なのは、異なる出力装置へ供給するた
めにはドキュメントを異なるレートでサンプリングする
必要があることである。例えば、レーザプリンタは一般
に、300〜600ドット/インチ(dpi)の解像度
を有する紙出力を生成し、一方ファックス装置の出力の
解像度は100〜200dpi、ビットマップ端末の解
像度は75〜100dpiである。
【0006】
【発明が解決しようとする課題】出力装置の解像度より
も高い解像度を有するドキュメントを出力するために
は、一般に、高い方の解像度を有するドキュメント中の
情報の一部分だけを出力するように、高い方の解像度を
有するドキュメントを減数サンプリング(ダウンサンプ
リング)する必要がある。
【0007】標準的な減数サンプリング手法には、低域
フィルタ処理及びデシメーション(10%減数処理)が
ある。しかし、これらの手法は、解像度が非常に低い装
置にはうまく働かない。
【0008】別の減数サンプリング手法としては、フォ
ント置換がある。この方法は、テキスト又は文字表記
(すなわち、文字のシーケンスと位置とが知られている
ような表記)のドキュメントだけに適用される。フォン
トは、文字セットの表記(例えばアルファベット)であ
る。フォントは、いくつもの属性を有する。例えば、字
体(Times Roman、Helvetica、等)、スタイル(太字、
斜体、等)、大きさ(12ポイント、18ポイント、
等)、及びドキュメントを出力する装置の解像度のよう
な属性である。
【0009】フォント置換においては、高い方の解像度
のドキュメント中の文字が識別同定され、その文字は、
低い方の解像度で「見場のよい」ように設計されたフォ
ントを用いてその低い方の解像度の装置へ出力される。
簡単にいえば、フォント置換においては、ドキュメント
中の文字が低い方の解像度の装置へ出力される前に、1
個以上のフォント属性が変更される。
【0010】フォント置換による減数サンプリングの問
題点は、適切な置換フォントを選択できるように、文字
の位置及び実体内容(アイデンティティ)を信頼性を持
って知る必要があることである。このような情報は、L
ATEX、SGMLで表記されるドキュメントにおい
て、又は或る光学的文字認識(OCR)システムにおい
ては利用可能である。しかし、この情報は一般に、多く
の種類のドキュメント(例えばファックス)では容易に
利用できない。
【0011】したがって、低い解像度の装置にドキュメ
ントを出力するために、改善された減数サンプリング方
法が求められている。
【0012】
【課題を解決するための手段】上記の問題は、本発明の
原理に基づき、次の方法を取ることによって解決され
る。すなわち、ドキュメント中のコンポーネントを減数
サンプリングする方法であって、このコンポーネントが
文字表記されていると共に、連関する信頼性測定値を有
する、ような減数サンプリング方法である。この信頼性
測定値は、連関する文字表記がこのコンポーネントを正
しく識別同定するかどうかの確率を表示する。
【0013】本方法は、もしこの信頼性測定値がしきい
値を超える場合には第1の減数サンプリング手法により
このコンポーネントを減数サンプリングし、もしそうで
ない場合には第2の減数サンプリング手法によりこのコ
ンポーネントを減数サンプリングする。
【0014】本発明の推奨実施例において、第1の減数
サンプリング手法は、いわゆるフォント置換であり、第
2の減数サンプリング手法は、いわゆるデシメーション
(10%減数法)である。本発明の別の態様では、デシ
メーションは、コンポーネントの減数サンプリングにお
いて非線形フィルタ処理と組み合わされる。
【0015】
【発明の実施の形態】I.序論 図1は、本発明の方法が実行されるシステムのブロック
図である。図1は、リンク125を介して通信ネットワ
ーク120に対して情報を入出力するためのいくつかの
通信装置110−iからなる。例えば、通信装置110
−1は、メモリ111、キーボード112、CRT(陰
極線管)画面113、及びプロセッサ/モデムからなる
基本パーソナルコンピュータであり、通信装置110−
2は、ファクシミリ(ファックス)装置115、そして
通信装置110−3は、レーザプリンタ116である。
【0016】通信ネットワーク120にはその他の入出
力装置も接続されることも当業者には認識されよう(例
えば、通信装置110−4内の大量記憶媒体、又は通信
装置110−5内のワークステーション及び光学的スキ
ャナ118)。通信ネットワーク自体は、公衆電話ネッ
トワーク、構内通信網(LAN)、等である。
【0017】通信ネットワーク内の各通信装置110−
iは、ドキュメントを生成できる。例えば、通信装置1
10−1はドキュメントをCRT画面上に表示する一
方、レーザプリンタ116はドキュメントを紙に出力す
る。しかし、各通信装置110−iが本来のドキュメン
トの解像度よりも低い解像度でドキュメントを表示又は
プリントする場合がしばしばある。
【0018】したがって、通信装置110−iはドキュ
メントを減数サンプリング(ダウンサンプリング)する
必要がある。減数サンプリングは、高い方の解像度のド
キュメント中の情報を、低い方の解像度の通信装置での
出力用に準備処理する手法である。
【0019】ドキュメントには、情報の有形又は物理的
表記(例えば、紙製のドキュメント、又は、そのアナロ
グ又はディジタル写真でマイクロフィッシュ又はスキャ
ンしたイメージを含む)、情報のハードウエア/ソフト
ウエア/ファームウエア記述(例えば、ポストスクリプ
ト又はLATEX、SGML、のようなマークアップ言
語)及び、記述(例えばビットマッピング)及び強化の
処理における中間ステップが含まれる(SGMLについ
ては、文献(C.Goldfarb, "The SGML Handbook," Caren
don Press, 1990) を参照されたい)。
【0020】ドキュメントを2つのグループに分けると
都合がよい。第1のグループは、ドキュメント中の各文
字について、その文字の表記中の各画素が、「オン」又
は「オフ」のいずれかであるような、ドキュメントのビ
ットマップ表記からなる。この第1のグループのこのよ
うなドキュメントの一例は、ファックスである。
【0021】第2のグループは、ドキュメント中の文字
のシーケンスと文字の位置との指定を含む、ドキュメン
トのテキスト表記からなる。この第2のグループのドキ
ュメントの例は、ASCIIファイル又はSGMLファ
イルである。
【0022】図2(a)は、400dpiから100d
piへ、デシメーションによって減数サンプリングした
ドキュメントの例示である。結果は、ファックス装置の
出力のように見える。ファックスの出力は、見かけと同
じに悪いと一般に信じられている。それは、100〜2
00dpiでテキストを表記しようとしてもよい仕事は
不可能だからである。実際には、ビットマップ端末は7
5〜100dpiで比較的よい結果を出している。この
ことから、ファックス出力で問題なのは、解像度ではな
くて、減数サンプリングの方法であることが判る。
【0023】図2(b)は、フォント置換によって減数
サンプリングした種類のドキュメント、すなわち文字の
位置と内容の実体とが知られているようなドキュメント
の例示である。図2(b)中のドキュメントは、図2の
ドキュメントと同じテキストであるが、10ポイントの
大きさの「Times Roman」の字体で表したも
のである。結果は、ほぼ同じ解像度ではあるが、よりよ
い見場のドキュメントとなっている。
【0024】本発明の方法の第1の実施例を用いて減数
サンプリングした結果の例示である。この第1の実施例
は、可能な場合にフォント置換を用い、必要な場合に他
の方法(この例ではデシメーション)を用いて減数サン
プリングする混合(ハイブリッド)手法である。詳しく
は、ドキュメントが文字の識別子及び位置を指定する場
合又はこの情報を光学的文字認識(OCR)手法によっ
て信頼性をもって得ることができる場合には、この減数
サンプリングは、フォント置換の手法によって行われ
る。
【0025】OCRは、文字の電子的識別同定を提供す
る目的で、手書き、プリント又は表示された文字を自動
的に識別同定するプロセスである。このようなOCRシ
ステムの一例としては、Xerox Imaging Systems から入
手可能なScan WorX システムがある。又、ほかにも種々
のOCRシステム及び手法が利用可能であることを当業
者は認識されよう。
【0026】一般に、OCRシステムは、個々の文字
(例えば、1個の文字、数字、又は句読点)を識別同定
する。しかし、文字毎に認識動作を行う代わりに、コン
ポーネント毎の認識動作をOCRシステムに行わせるこ
とも可能である。ここに、コンポーネントとは、1個の
文字、又は1個の単語(ワード)中のつながった文字
(例えば、1個の単語中の、不鮮明のため隣の文字と相
互に接触してしまっている文字)からなる小さな文字グ
ループ、のいずれかを意味する。
【0027】図3(a)に戻って、もし文字の識別同定
について信頼性がない場合には、減数サンプリングはデ
シメーションによって行われる。このハイブリッド手法
は、ドキュメント中の文字毎にでも又コンポーネント毎
にでも適用できる。図3(a)のドキュメントの方が図
2(a)のドキュメントよりも読みやすいことは、多く
の人が同意されよう。
【0028】本発明の方法の第1の態様は一般に、ドキ
ュメントの見場(外観)を改善するが、第1の態様のハ
イブリッド手法は、OCR解析におけるギャップ(すな
わち、OCRシステムが文字を信頼性をもって識別同定
できないという部分)を強調しがちであり、その結果、
ドキュメントをいささか、ランサム・ノートのように見
えさせてしまう。
【0029】この問題は、チャネル等化の手法を用い
て、フォント置換による減数サンプリングとデシメーシ
ョンによる減数サンプリングとの間の差を減少させると
いう、本発明の方法の第2の態様によって軽減される。
これによって、OCR解析おけるどのようなギャップも
テキストの残りの部分に混合調和される。
【0030】このプロセス(「非線形ドキュメント等化
処理又はフィルタ処理」と称する)によって、図3
(b)のドキュメントが生成された。このプロセスにつ
いては、本出願と同時継続出願関係にある特許出願("A
Method of Nonlinear Filteringof Degrded Document
Images")(AT&T)に記述がある。ここに同出願を
引用文献とする。
【0031】等化後は、OCR解析にギャップを見出す
ことは困難である。テキスト中の英単語"ramification
s" の中の"ramifi"及び"Information" の中の"In"が、
テキストの残りの部分ほどには鮮明ではないが、これら
のギャップを見出すにはかなり注意して見る必要がある
ことを、当業者は認識されよう。
【0032】次の各項において本発明の方法の態様につ
いて述べる。具体的には、第II項においては、可能な
場合にフォント置換を用い、必要な場合にデシメーショ
ンを用いて減数サンプリングする方法について述べる。
詳しくは、この項はデシメーションを用いる必要がある
場合を説明する。第III項は、上に触れた非線形ドキ
ュメント等化手法について詳細に述べる。第IV項にお
いては、本発明の方法を集約し、本発明の方法について
の他の潜在的適用を列記する。
【0033】II.減数サンプリングのハイブリッド方
図4は、本発明の方法の第1の実施例の流れ図で、ドキ
ュメントのテキストファイル表記を減数サンプリングす
る場合を示す。本発明の方法においては、テキスト表記
をコンポーネント毎に減数サンプリングするのが有利で
ある。ここに、コンポーネントとは、1個の単体の文字
(アルファベットの文字、数字、又は句読点のような)
又は1個の単語中のつながった文字(例えば、1個の単
語中の、不鮮明のために隣の文字と相互に接触してしま
っている文字グループ)からなる小さな文字グループの
いずれかを意味する。
【0034】図4のステップ610において、本方法が
或るコンポーネントの識別子とこの識別子の信頼性の測
定値とを受領する。ステップ620において、信頼性測
定値がしきい値と比較され、しきい値を超えているかど
うかが判断される。もし信頼性測定値がしきい値を超え
ている場合、ステップ630においてコンポーネントが
第1の減数サンプリング方法(この例ではフォント置
換)によって減数サンプリングされる。
【0035】もし信頼性測定値がしきい値より低い場
合、ステップ640においてコンポーネントが第2の減
数サンプリング方法(この例ではデシメーション)によ
って減数サンプリングされる。この場合、しきい値は、
フォント置換されたドキュメントのより良い見場よりも
文字をデシメーションで生成する場合に得られるより良
い精度を取るように選択される。
【0036】信頼性測定値は、たぶん或る標準的な既成
品のOCRシステムから得られるかも知れないが、一般
には入手可能ではない。そのため、次の説明で、本発明
の方法の更なる態様としてOCRシステムによって識別
同定されたコンポーネントについての信頼性測定手法を
含む態様を述べる。
【0037】本発明の方法のこの態様は、概して、同じ
ドキュメント中の同じ単語を2例取った場合のその2例
が相互に非常に類似していることがしばしばあり、別々
のドキュメントから1個の単語をそれぞれ取って得た2
例の場合よりもはるかに多く相互類似している、という
事実を利用している。
【0038】1個のドキュメント(又はドキュメントの
特定の性質)中での強い相関関係の効果は驚くには当た
らない。或る特定のコンポーネントの全ての事例が、多
かれ少なかれ同じようにひずまされている場合が多いと
いうことである。
【0039】例えば、これらコンポーネントの事例が現
れたページは各々、おそらく元のドキュメントからほぼ
同一回数のフォトコピー処理を経て来たものである。同
様に、もしそのドキュメントがスキャナでスキャンされ
た場合スキャナにおけるゲインコントロール(利得制
御)は全体にわたってかなり一貫して同一値である。
【0040】この効果を図5で説明する。図5中に、2
個の互いに異なるドキュメントからボックス(囲み部
分)710及び712にそれぞれ、単語"using" のいく
つかの事例を示す。或る特定の単語の事例間の類似性を
視覚的に判断する方法は、単語の各事例のビットマップ
を平均する方法である。初めに、この特定の単語の或る
事例のビットマップ中の各画素が「1」の値(画素が
「オン」であることを示す)又は「0」の値(画素が
「オフ」であることを示す)を有すると仮定する。
【0041】この特定の単語の各事例中の対応する画素
が合計され事例の数で除されて、平均画素値が定められ
る。例えば、囲み部分710の"using" の事例が平均さ
れて囲み部分711の形状が生成され、囲み部分712
の"using" の事例が平均されて囲み部分713の形状が
生成される。囲み部分711及び713それぞれの平均
した事例においては、同じ1個のドキュメント中では、
単語中の文字のまわりのイメージにある少量のぼやけか
ら見られるように、かなり類似した形で生成されてい
る。
【0042】比較のため、これら2個のドキュメント
(すなわち囲み部分711及び713)にわたって"usi
ng" のすべての事例を平均した結果を囲み部分715に
示す。囲み部分715に示すこの結果は、イメージが不
鮮明で認識困難であるという点で不満足なものである。
【0043】単語の2個の事例を比較するより定量的な
方法は、各事例のビットマップ間のハミング距離を計算
する方法である。ハミング距離は、2個のビットマップ
イメージが互いに異なる(一致しない)画素の数として
定義される。大きなハミング距離は、互いに非常に異な
る2個のイメージ、すなわちぼやけて見えるビットマッ
プ平均、に対応する。囲み部分715に見られる結果
は、ハミング距離が大きい場合は、2個のドキュメント
にわたって単語を比較することになることを表明するも
のである。
【0044】しかし、平均化処理を囲み部分711及び
713に示すように、1個のドキュメントの範囲内の同
一の単語の事例に限るならば、一致の程度が改善され
る。これは、「単語の事例の探査範囲を単一のドキュメ
ントに制約する限り、ハミング距離測定値(又はこれに
類似のもの)は、かなりよく使える」ということを表し
ている。
【0045】このことから、ハミング距離の手法を用い
て、2個のボックスを計算しこれら2個のボックス中の
画素が同じ単語に対応するかどうかを点検する述部を構
築することが有利であると判る。ボックスとは、ビット
マップページ上の矩形を定義する4個の変数(すなわ
ち、2個の角部の座標、又は1個の角部の座標及びボッ
クスの高さ及び幅)のセットである。
【0046】なお、もしハミング距離について僅かに非
標準的な定義を用いるならば、2個のイメージの類似性
についてのハミング距離測定有用さも改善されることを
注記したい。2個のイメージの位置決め(例えばサンプ
リングのためのイメージの位置合わせの際の)において
画素に満たない小さなエラーがしばしば存在し、これが
単語の周辺に沿ったハミング距離を大きくする結果とな
ることがある。画素を目標位置の1画素近隣範囲内の画
素に合致させることによってこのエラーを補償すること
が有利である。
【0047】このようにして、画素が見出されると推定
される位置の近くに画素がない場合にだけ1個の画素が
1個のエラーとしてカウントされる。これは、単語の周
辺部でしばしば見出される大きなハミング距離測定値を
避ける「控え目」なハミング距離測定である。
【0048】この控え目なハミング距離を用いて、ドキ
ュメントの全てのコンポーネントをいくつものクラスに
グループ分けし、各々のクラスが1個のコンポーネン
ト、すなわち1個の文字又は1個のフォント内のつなが
った文字グループ、だけに対応するようにすることがで
きる。そうすると、標準の既成品OCRシステム又はソ
フトウエアプログラムを用いてどのクラスがどの文字に
対応しているかを識別同定することができる。
【0049】もし或る特定のクラスが大きく(すなわち
多くの要素を有し)且つそのクラスの各メンバーについ
てのOCR解析結果がかなり一様である場合には、その
クラスのメンバーをフォント置換による減数サンプリン
グに、妥当な自信をもって使うことができる。
【0050】信頼性測定値は、OCR解析結果における
類似性の度合に基づかせると有利である。例えば、もし
或るクラスの要素の割合が高い値を示す(例えば80%
よりも大きい)ことがOCRシステムによって同様に識
別同定された場合には、その割合を信頼性測定値として
用いることができる。
【0051】もし或るクラスの要素の割合が同様にして
十分に大きくないという形でOCRの結果が一様でない
場合には、信頼性測定値は低いことになり、したがって
そのクラスの事例を減数サンプリングするにはデシメー
ションが用いられる。OCR結果の類似性又は一様性に
基づく別の信頼性測定値も考えられることは、当業者に
は認識されよう。
【0052】本発明のこの態様を実施したシステムの概
念図を図6に示す。ドキュメント中のコンポーネントの
イメージのビットマップ表記がOCRシステム820に
入力され、同じくデシメーション式減数サンプリング装
置840に入力される。図6には図示しないが、ドキュ
メントはいくつかのコンポーネントからなり、コンポー
ネントは、システムにそれぞれ別個に入力する必要があ
る。
【0053】標準的なドキュメント処理手法に基づき、
ドキュメント中の各コンポーネントは、「オン」画素を
見出しそれから隣接する「オン」画素を見出すことによ
り、他のコンポーネントから分離できる。隣接する「オ
ン」画素がもはや見出されない、すなわち全ての「オ
ン」画素が「オフ」画素によって包囲される状態になっ
た場合、これらの互いに隣接する「オン」画素が1個の
コンポーネントを形成する。そして、これらの画素を用
いて、システムに入力するビットマップ表記が得られ
る。
【0054】図6に戻って、OCRシステム820が、
コンポーネントのテキスト表記と、そのコンポーネント
の識別同定の信頼性測定値とを出力する。テキスト表記
は、フォント置換式減数サンプリング装置830に入力
される。信頼性測定値は、スイッチ850を制御するし
きい値処理装置835に入力される。
【0055】もし信頼性測定値がしきい値よりも大きい
場合、しきい値処理装置835が信号を出力し、これに
よってスイッチ850が、フォント置換式減数サンプリ
ング装置830によって生成されたコンポーネントの減
数サンプリングバージョンを、システムの出力として選
択する。
【0056】もしそうでない場合には、スイッチ850
は、デシメーション式減数サンプリング装置840によ
って生成されたコンポーネントの減数サンプリングバー
ジョンを、システムの出力として選択する。なお、図6
のシステムによって、もとは文字表記ではなかったドキ
ュメントをフォント置換よって減数サンプリングするこ
とが可能となる。
【0057】III.非線形チャネル等化器を用いた減
数サンプリング方法 この項は、フォント置換による減数サンプリングとデシ
メーションによる減数サンプリングとの間の差異を減少
させるために非線形ドキュメント等化を用いる本発明の
第2の実施例を示す。この方法においては、もしOCR
出力が信頼できない場合、デシメーションだけによる減
数サンプリングの代わりに、入力イメージは等化され、
減数サンプリングされる。等化され減数サンプリングさ
れたイメージは一般に、減数サンプリングだけされたイ
メージよりもよりよい見場のものとなる。
【0058】図7は、本発明の方法のこの第2の実施例
のブロック図である。図6において述べたシステムの場
合のように、コンポーネントのイメージのビットマップ
表記がOCRシステム910に入力される。OCRシス
テム910は、コンポーネントのテキスト表示と識別同
定の信頼性測定値とを出力する。
【0059】テキスト表記はフォント置換式減数サンプ
リング装置920に入力される。ビットマップ表記は
又、2次元非線形フィルタ及びデシメーション装置96
0(又は簡単に、フィルタ960)に入力される。下に
述べるように、フィルタ処理とデシメーション処理とは
組み合わせることができる。
【0060】フィルタ960の使用は、ドキュメントが
受けたひずみが、多くの場合非線形フィルタ処理動作と
してモデル化できるという認識に基づいている。例え
ば、普通の種類のひずみは、しきい値処理に先立つ不鮮
明化である。このようなプロセスは、ドキュメントがフ
ォトコピーされ又はスキャンされるときに生じる。不鮮
明化そのものは、フォトコピー機又はスキャナの光学系
で生じる線形フィルタ処理動作である。これによって、
もとのイメージがバイナリであってもグレイレベルが形
成される。
【0061】バイナリイメージを復元するためには、フ
ィルタ処理されたイメージがしきい値処理される(非線
形動作)。線形フィルタ処理部分が同じでも、しきい値
が異なると得られるイメージは非常に異なったものとな
る。これらの動作は何回も反復して行われることが有り
得る。例えばドキュメントが、たぶん1回よりも多くフ
ォトコピーされそれからスキャンが行われる場合であ
る。
【0062】その結果としての非線形フィルタ処理は、
概して、単純な(すなわちガウス)フィルタ及び数個の
パラメータ(例えばガウスフィルタの標準変位偏差及び
しきい値)では記述できないが、より一般的な非線形フ
ィルタ構造を用いればモデル化が可能である。フィルタ
のパラメータは、手近のドキュメントに特定のひずみを
正確にモデル化するように適応させることができる。
【0063】図7に戻って、フィルタ960が、入力
(劣化)イメージと参照イメージとを用いて調整され
る。フィルタ960の出力をは、デシメーションされビ
ットマップ化され等化されたイメージと称する。参照イ
メージは、参照コンポーネントイメージ記憶装置930
が用いるためにコンポーネントのテキスト表記を供給す
るOCRシステム910を用いて得ることができる。
【0064】参照コンポーネントイメージ記憶装置93
0は、参照イメージ(すなわち非劣化コンポーネントイ
メージ)のビットマップ表記を内蔵する。参照コンポー
ネントイメージ記憶装置930は、OCRシステム91
0によって供給されるテキスト表記を取り込んでそのテ
キスト表記についての参照イメージを出力する参照テー
ブルとして実現すると有利である。
【0065】等化イメージと参照イメージとの差異(合
算器940において定められる)は、エラーで、これは
フィルタを調整するために用いられ、これによって、或
る時間経過後にエラーが可能最小値に減少される。
【0066】図7のシステムは又、フィルタ960の調
整を調節する調整/固定制御器950を有するので有利
である。詳しくは、調整/固定制御器950は、OCR
システム910によって生成された信頼性測定値を用い
てスイッチ980を制御することができる。
【0067】すなわち、もし信頼性測定値が高い場合、
スイッチ980が閉じられる。これはフィルタ960を
調整するために参照イメージを使用できることを示す。
逆に、もし信頼性測定値が低い場合には、参照イメージ
を用いてフィルタ960を調整すべきではなく、したが
って、フィルタ960の誤調整を避けるためスイッチ9
80は開いておく必要がある。
【0068】図6のシステムの場合のように、図7のス
イッチ970を制御するための信頼性測定値が、しきい
値処理装置935に入力される。もし信頼性測定値がし
きい値よりも大きい場合、スイッチ970はシステムの
出力として、フォント置換式減数サンプリング装置92
0によって生成されたコンポーネントの減数サンプリン
グバージョンを選択する。そうでなければ、出力は、フ
ィルタ960によって生成されたコンポーネント減数サ
ンプリングバージョンとなる。
【0069】コンポーネントが減数サンプリングされる
順序は、そのコンポーネントがドキュメント中に現れる
順序と必ずしも同じである必要はない。例えば、OCR
システム910が信頼性をもって認識できる全てのコン
ポーネントをまずフォント置換式減数サンプリングにか
け、同時に同じこれらのコンポーネントを用いてフィル
タ960を調整することが可能である。
【0070】この条件下ではスイッチ980は閉じられ
ていて、スイッチ970がフォント置換式減数サンプリ
ング出力を選択する。信頼性をもって認識することの可
能な全てのコンポーネントがフォント置換式減数サンプ
リングをされ終ると、残りのコンポーネントが等化及び
デシメーションによって減数サンプリングされる。
【0071】この時点で、スイッチ980が開き(フィ
ルタ960を誤って認識されたイメージで調整するのを
避けるため)、スイッチ970がフィルタ960の出力
選択を開始する。この手順が、十分な調整データがフィ
ルタ960の調整に利用可能となるのを確実にする。
【0072】フィルタ960は、2次元配列(アレイ)
の(2M+1)×(2M+1)参照テーブルを形成して
実現する。この各参照テーブルは、(2H+1)×(2
H+1)画素平方のサポートにおいてビットによってア
ドレスされる、
【0073】この場合、イメージ中の位置(i,j)に
おける参照テーブル(k,el)(−M≦k,el≦M) に
対するアドレスa(k,el,i,j) は、次式で与えられ
る。
【数1】
【0074】もしイメージ中の位置(i,j) における
参照テーブル(k,el) の出力をw(k,el,a(k,el,
i,j)) とすると、フィルタの出力は次式で表され
る。
【数2】
【0075】調整プロセスによって、y(i,j) と、
もとのイメージq(i,j) との間の平均二乗差が最小
化される。残留エラーは次式で与えられる。 ε(i,j)=q(i,j)−y(i,j) (3)
【0076】フィルタ960は、要素w(k,el,a
(k,el,i,j))に修正値αε(x,y)を加えること
によって、全てのk,el について対応するようになる。
ここに、αは収斂の速さを定める小さな数である。な
お、フィルタは単に、選択された値i及びjにおいてだ
け出力y(i,j) を計算することで入力信号をデシメ
ーションする。例えば、出力は、i及びjの各々n番目
の値毎に計算される。ここに、nは減数サンプリングフ
ァクタ、すなわち減数サンプリングの前及び後のイメー
ジ解像度の比率である。
【0077】H、M、及びαの一般的な値は、H=1、
M=3、及びα=0.0005 である。
【0078】フィルタ960の構造及び調整の更に詳細
な説明が本出願と同時に出願された特許出願(A Method
of Nonlinear Equalization of Degraded Document Im
ages)に記載されており、ここに引用文献とする。
【0079】IV.結び 以上の開示において、光学的文字認識、フォント置換、
及びデシメーションを用いてドキュメントを減数サンプ
リングする方法について述べた。非線形ドキュメント等
化の手法を用いた減数サンプリングの方法についても開
示した。これらの説明に際しては、特定のハードウエア
又はソフトウエアを引用することはしなかったが、代わ
りにこれらの説明に基づき利用可能な又は望ましいハー
ドウエア又はソフトウエアを当業者が容易に適応させる
ことが可能なように記述した。
【0080】例えば、図7の等化装置については2次元
非線形適応フィルタの実施例を述べたが、本発明の精神
及び技術範囲から外れずに、これに代わって他のフィル
タ構造(例えばニュートラルネットワークに基づくフィ
ルタ)を使用できることを当業者は認識されよう。
【0081】以上の説明は、本発明の一実施例に関する
もので、この技術分野の当業者であれば、本発明の種々
の変形例を考え得るが、それらはいずれも本発明の技術
的範囲に包含される。
【0082】
【発明の効果】以上述べたごとく、本発明によれば、ド
キュメントの文字の減数サンプリング方法において、文
字認識、フォント置換、及びデシメーション等の手法を
組み合わせて用いることによってドキュメントを減数サ
ンプリングするようにしたので、従来技術では困難であ
った解像度が非常に低い装置への出力に関しての減数サ
ンプリングが可能になる。したがって、種々の解像度の
入出力装置を含む情報処理システム業務処理効率が向上
する。
【図面の簡単な説明】
【図1】本発明の方法が実行されるシステムのブロック
図である。
【図2】種々の手法により減数サンプリングしたドキュ
メントを図3と共に例示する説明図である。 (a)デシメーションによって減数サンプリングしたド
キュメントを示す。 (b)フォント置換によって減数サンプリングしたドキ
ュメントを示す。
【図3】種々の手法により減数サンプリングしたドキュ
メントを図2と共に例示する説明図である。 (a)可能な場合にフォント置換を用い必要な場合にデ
シメーションを用いて減数サンプリングする本発明の方
法の第1の実施例、を用いて減数サンプリングしたドキ
ュメントを示す。 (b)等化を用いて減数サンプリングする本発明の方法
の第2の実施例、を用いて減数サンプリングしたドキュ
メントを示す。
【図4】本発明の方法の第1の実施例の流れ図である。
【図5】2種類の異なるドキュメントから選択された英
単語の例示及び1種類のドキュメント中の同じ英単語の
例示である。
【図6】ドキュメントをフォント置換及びデシメーショ
ンを用いて減数サンプリングする本発明の方法の第1の
実施例、を用いるシステムのブロック図である。
【図7】ドキュメントを非線形適応フィルタを用いて減
数サンプリングする本発明の方法の第2の実施例、を用
いるシステムのブロック図である。
【符号の説明】
110−i 通信装置 110−1 基本パーソナルコンピュータ 110−2 ファクシミリ装置(=115) 110−3 レーザプリンタ(=116) 111 メモリ 112 キーボード 113 CRT(陰極線管)画面 114 プロセッサ/モデム 117 大量記憶媒体 118 スキャナ 119 ワークステーション 120 通信ネットワーク 125 リンク 820、910 OCRシステム 830、920 フォント置換式減数サンプリング装置 835、935 しきい値処理装置 840 デシメーション式減数サンプリング装置 850、970、980 スイッチ 930 参照コンポーネントイメージ記憶装置 940 合算器 950 調整/固定制御器 960 2次元非線形フィルタ及びデシメーション装置
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ケネス ワード チャーチ アメリカ合衆国,07928 ニュージャージ ー, チャタム,ロングヒル レイン 2 (72)発明者 ウィリアム アーサー ゲイル アメリカ合衆国,07040 ニュージャージ ー, メイプルウッド,エセックス アヴ ェニュー 17

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 ドキュメント中のコンポーネントを減数
    サンプリングする方法であって、該コンポーネントが文
    字表記されると共に、連関する信頼性測定値を有し、該
    信頼性測定値が、該文字表記によって該コンポーネント
    が識別同定される精度を示す、ような減数サンプリング
    方法において、 もし前記信頼性測定値がしきい値を超える場合には第1
    の減数サンプリング手法により前記コンポーネントを減
    数サンプリングし、もしそうでない場合には第2の減数
    サンプリング手法により前記コンポーネントを減数サン
    プリングするステップを有することを特徴とするドキュ
    メントコンポーネントの減数サンプリング方法。
JP7211277A 1994-07-28 1995-07-28 ドキュメントのダウンサンプリング方法 Expired - Lifetime JP2994581B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/281,879 US6389178B1 (en) 1994-07-28 1994-07-28 Method of downsampling documents
US281879 1994-07-28

Publications (2)

Publication Number Publication Date
JPH0855191A true JPH0855191A (ja) 1996-02-27
JP2994581B2 JP2994581B2 (ja) 1999-12-27

Family

ID=23079152

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7211277A Expired - Lifetime JP2994581B2 (ja) 1994-07-28 1995-07-28 ドキュメントのダウンサンプリング方法

Country Status (5)

Country Link
US (1) US6389178B1 (ja)
EP (1) EP0702319B1 (ja)
JP (1) JP2994581B2 (ja)
CA (1) CA2150055C (ja)
DE (1) DE69512734T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132690A (ja) * 1998-10-22 2000-05-12 Xerox Corp ト―クン化によるイメ―ジ分割を用いたイメ―ジ処理方法および装置

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2165641C2 (ru) * 1999-03-10 2001-04-20 Закрытое акционерное общество "Аби Программное обеспечение" Способ взаимосвязанного активирования компьютерных кодов в виде символов и соответствующих им фрагментов изображения
RU2166209C2 (ru) * 1999-03-15 2001-04-27 Закрытое акционерное общество "Аби Программное обеспечение" Способ построения динамических растровых эталонов компьютерных кодов, выполненных в виде символов, в процессе распознавания соответствующих им фрагментов изображения
JP2001043212A (ja) * 1999-07-23 2001-02-16 Internatl Business Mach Corp <Ibm> 電子文書における文字情報の正規化方法
US6701023B1 (en) * 1999-09-28 2004-03-02 Adobe Systems Incorporated Reducing appearance differences between coded and noncoded units of text
US7039256B2 (en) * 2001-07-12 2006-05-02 International Business Machines Corporation Efficient verification of recognition results
US20040057064A1 (en) * 2002-09-20 2004-03-25 Stringham Gary Glen Method to edit a document on a peripheral device
JP4970301B2 (ja) * 2008-02-08 2012-07-04 シャープ株式会社 画像処理方法、画像処理装置、画像読取装置、画像形成装置、画像処理システム、プログラムおよび記録媒体
US8175388B1 (en) 2009-01-30 2012-05-08 Adobe Systems Incorporated Recognizing text at multiple orientations
EP3799433A1 (en) * 2019-09-24 2021-03-31 Koninklijke Philips N.V. Coding scheme for immersive video with asymmetric down-sampling and machine learning

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3496543A (en) * 1967-01-27 1970-02-17 Singer General Precision On-line read/copy data processing system accepting printed and graphic material
US5359671A (en) * 1992-03-31 1994-10-25 Eastman Kodak Company Character-recognition systems and methods with means to measure endpoint features in character bit-maps
TW222337B (ja) * 1992-09-02 1994-04-11 Motorola Inc

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132690A (ja) * 1998-10-22 2000-05-12 Xerox Corp ト―クン化によるイメ―ジ分割を用いたイメ―ジ処理方法および装置

Also Published As

Publication number Publication date
DE69512734D1 (de) 1999-11-18
JP2994581B2 (ja) 1999-12-27
EP0702319A2 (en) 1996-03-20
EP0702319A3 (en) 1997-02-12
CA2150055C (en) 2000-04-04
EP0702319B1 (en) 1999-10-13
US6389178B1 (en) 2002-05-14
DE69512734T2 (de) 2000-06-08
CA2150055A1 (en) 1996-01-29

Similar Documents

Publication Publication Date Title
JP3264999B2 (ja) 文字認識方法及びその装置
US7512879B2 (en) Intelligent virtual paging paradigm
US12056547B2 (en) Method for generating a quick response code and printing apparatus
US6807304B2 (en) Feature recognition using loose gray scale template matching
EP2288135B1 (en) Deblurring and supervised adaptive thresholding for print-and-scan document image evaluation
JP4604100B2 (ja) 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記憶媒体
EP2270746B1 (en) Method for detecting alterations in printed document using image comparison analyses
US6393150B1 (en) Region-based image binarization system
US5745597A (en) Method of nonlinear equalization of degraded document images
JPH11213149A (ja) 画像処理装置および方法
US6069978A (en) Method and apparatus for improving a text image by using character regeneration
JPH05250409A (ja) ページ方向の高速検出
CN102722729A (zh) 通过用字符的形状特征来比较字符而检测文档变化的方法
JPH0855191A (ja) ドキュメントコンポーネントの減数サンプリング方法
US20100054587A1 (en) Image processing apparatus and image processing method
JP2000067164A (ja) パターン認識方法及び装置並びにテンプレート作成プログラムを記録した記録媒体
EP0680194B1 (en) Image processing device and image output device converting binary image into multi-valued image
US5970169A (en) Method and apparatus for image enhancement
Konya Adaptive methods for robust document image understanding
JP2004246110A (ja) 検版装置、印刷システム、印刷データの検版方法、およびプログラム
US7567725B2 (en) Edge smoothing filter for character recognition
Handley et al. Optimal nonlinear fax restoration
JP5146199B2 (ja) 差分抽出装置及び差分抽出プログラム
JP3017249B2 (ja) 画像再現装置
JPH10336441A (ja) 画像領域属性判別方法

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071022

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081022

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091022

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091022

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101022

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111022

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121022

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121022

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131022

Year of fee payment: 14

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term