JPH03201866A - 圧縮形態のデータを含むデータから画像スキュー角度を決定する方法 - Google Patents
圧縮形態のデータを含むデータから画像スキュー角度を決定する方法Info
- Publication number
- JPH03201866A JPH03201866A JP2341211A JP34121190A JPH03201866A JP H03201866 A JPH03201866 A JP H03201866A JP 2341211 A JP2341211 A JP 2341211A JP 34121190 A JP34121190 A JP 34121190A JP H03201866 A JPH03201866 A JP H03201866A
- Authority
- JP
- Japan
- Prior art keywords
- alignment
- skew
- angle
- line
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Character Input (AREA)
- Image Input (AREA)
- Facsimile Scanning Arrangements (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Processing (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は、概して、走査画像に存在するスキューを検出
する方法に関し、より詳しくは、画像のある特徴のカウ
ントに基づいた、また圧縮された形態で存在する画像の
スキューを検出する方法に関するものである。
する方法に関し、より詳しくは、画像のある特徴のカウ
ントに基づいた、また圧縮された形態で存在する画像の
スキューを検出する方法に関するものである。
人間の目は、直角からごく僅かな偏位を検出することが
でき、エリアシング(aliasing)エラーに起因
する不連続性がこれらの偏位に注意を引きつける簡単な
構造のディジタル画像においては特にそうである。テキ
ストや複雑なグラフィック画像のスキューに対する人間
の感覚に関する有効な情報はほとんどない。明確な特徴
のある座標フレーム中に情報が現れる場合、スキュー角
度は一貫してかつ相当に過大評価される。スキューがあ
るということは、審美学上喜ばしいことではなく、かつ
実用的効果もない。スキューの存在は、一つ或いはそれ
以上のコーナーが、スキューのためにスキャナの視野か
ら外方に外れることにより、画像の全てのソース域の捕
獲が失敗することになる。
でき、エリアシング(aliasing)エラーに起因
する不連続性がこれらの偏位に注意を引きつける簡単な
構造のディジタル画像においては特にそうである。テキ
ストや複雑なグラフィック画像のスキューに対する人間
の感覚に関する有効な情報はほとんどない。明確な特徴
のある座標フレーム中に情報が現れる場合、スキュー角
度は一貫してかつ相当に過大評価される。スキューがあ
るということは、審美学上喜ばしいことではなく、かつ
実用的効果もない。スキューの存在は、一つ或いはそれ
以上のコーナーが、スキューのためにスキャナの視野か
ら外方に外れることにより、画像の全てのソース域の捕
獲が失敗することになる。
スキューした画像は、ページ座標系に正確に記録されて
いるのと同じくらいには、迅速に或いはコンパクトに圧
縮されない。スキューされたフィールドは、例えば刈り
込み(cropping)や仲人のような標準のページ
レイアウトや合成操作に用いるのはより困難である。
いるのと同じくらいには、迅速に或いはコンパクトに圧
縮されない。スキューされたフィールドは、例えば刈り
込み(cropping)や仲人のような標準のページ
レイアウトや合成操作に用いるのはより困難である。
スキューは、ディジタル化の時か或いはとりわけフォト
コピー時におけるディジタル化の前のいずれかにおいて
、紙を供給するに際しての困難さを含むいくつかの場合
に生してくる。再生か、ディジタル走査と、これにより
得られるビットマツプのプリントによってもたらされる
電子写真複写環境においては、スキュー角度の早くて正
確な検出が、スキュー画像の修正と記録するための資源
の必要性を充分に縮小することが可能である。
コピー時におけるディジタル化の前のいずれかにおいて
、紙を供給するに際しての困難さを含むいくつかの場合
に生してくる。再生か、ディジタル走査と、これにより
得られるビットマツプのプリントによってもたらされる
電子写真複写環境においては、スキュー角度の早くて正
確な検出が、スキュー画像の修正と記録するための資源
の必要性を充分に縮小することが可能である。
スキュー角度検出は、伝統的に2工程で行われる。まず
第1に、アライメントの質が基本となっている特徴が決
定され、次いで企てられたアライメントが前のサンプル
アライメント或いは他の基準に関して優れているかどう
かを決定するために種々のテストが課せられる。ここで
いう「アライメント」とは画像の要素の方向付けのこと
である。
第1に、アライメントの質が基本となっている特徴が決
定され、次いで企てられたアライメントが前のサンプル
アライメント或いは他の基準に関して優れているかどう
かを決定するために種々のテストが課せられる。ここで
いう「アライメント」とは画像の要素の方向付けのこと
である。
現在に至るまで、スキュー角度の決定は、圧縮状態での
画像データで達成されてきた。ここで「画像」とはパタ
ーン或いは識別可能域の集合を意味し、画像、表示か或
いはこのどちらでもないか、典型的であるが、排他的で
はなしに、プリントされたページに見いだされるもので
ある。「画像データ」とは、適当なシステムによって画
像の再生に用いられる、典型的であるが、排他的ではな
いフォーマット中のディジタルな画像のことをいう。「
圧縮された」フォーマット中のデータとは、ここでは「
圧縮されていない」フォーマット中のデータから、デー
タを記憶する必要のある例えばビットによるメモリスペ
ースの大きさに縮小されることを意味する。この場合、
データを圧縮するのに用いられる方法は問わない。圧縮
された画像データからのスキュー角度の決定は、現在ま
で考察されてきていない。或いはもし考察されてきてい
るとしても、圧縮された画像データ上からスキューを決
定する操作には必要以上のことであり、かつ、決定的に
画像を圧縮されたデータフォーマットに変換するのは不
必要な工程であるという一般的な考えの下にかたずけら
れてきている。
画像データで達成されてきた。ここで「画像」とはパタ
ーン或いは識別可能域の集合を意味し、画像、表示か或
いはこのどちらでもないか、典型的であるが、排他的で
はなしに、プリントされたページに見いだされるもので
ある。「画像データ」とは、適当なシステムによって画
像の再生に用いられる、典型的であるが、排他的ではな
いフォーマット中のディジタルな画像のことをいう。「
圧縮された」フォーマット中のデータとは、ここでは「
圧縮されていない」フォーマット中のデータから、デー
タを記憶する必要のある例えばビットによるメモリスペ
ースの大きさに縮小されることを意味する。この場合、
データを圧縮するのに用いられる方法は問わない。圧縮
された画像データからのスキュー角度の決定は、現在ま
で考察されてきていない。或いはもし考察されてきてい
るとしても、圧縮された画像データ上からスキューを決
定する操作には必要以上のことであり、かつ、決定的に
画像を圧縮されたデータフォーマットに変換するのは不
必要な工程であるという一般的な考えの下にかたずけら
れてきている。
圧縮されていない画像のスキュー角度を決定する技術と
しては、ヘンリー・ニス・ベアード(Henry S、
Ba1rd)による「印刷物のスキュー角度」と題す
るハイブリッド画像システムに関する5PSEシンポジ
ウム議事録、pp21〜24.1987 (以後、ベア
ードという)に開示されているものを参照する。まず最
初に、ベアードは、マーク或いはテキストである関連要
素とテキストでない要素と識別をしなければならない。
しては、ヘンリー・ニス・ベアード(Henry S、
Ba1rd)による「印刷物のスキュー角度」と題す
るハイブリッド画像システムに関する5PSEシンポジ
ウム議事録、pp21〜24.1987 (以後、ベア
ードという)に開示されているものを参照する。まず最
初に、ベアードは、マーク或いはテキストである関連要
素とテキストでない要素と識別をしなければならない。
この点に関し、この明細書の目的としての「テキスト」
マークすなわち関連要素は、文字、数字、句読点及び関
連する符号からなる。この「テキスト」マークは「非テ
キストJマーク或いはテキストではない典型的にはグラ
フィックス、シンボル或いは画像の描写のような部分で
あるPA連要素と識別されている。基準点を位置決めに
用いる方法として、ベアード技術はテキスト画像にとっ
て意味のある結果を生しるのみである。テキストとして
のこの分類は、テキストマークの最大寸法が予め定めら
れた最大フォントサイズ、例えば24ポイント中のre
mJ以下、ないしこれと同等であることに基づいてベア
ードによって作られたものである。
マークすなわち関連要素は、文字、数字、句読点及び関
連する符号からなる。この「テキスト」マークは「非テ
キストJマーク或いはテキストではない典型的にはグラ
フィックス、シンボル或いは画像の描写のような部分で
あるPA連要素と識別されている。基準点を位置決めに
用いる方法として、ベアード技術はテキスト画像にとっ
て意味のある結果を生しるのみである。テキストとして
のこの分類は、テキストマークの最大寸法が予め定めら
れた最大フォントサイズ、例えば24ポイント中のre
mJ以下、ないしこれと同等であることに基づいてベア
ードによって作られたものである。
ベアード技術のアライメントアルゴリズムは、各マーク
或いは関連する要素に関係した選ばれた特徴のアライメ
ントに基づいて作用する。「マーク」は、関連する要素
として用いるものとする。
或いは関連する要素に関係した選ばれた特徴のアライメ
ントに基づいて作用する。「マーク」は、関連する要素
として用いるものとする。
「関連する要素」は、本願明細書の目的として、一連の
カラー付きユニット、典型的には互いに関連する同様の
色の画素(「ビクセルJ)に定義される。この目的で普
通用いられる特徴は「基準点」である。ここで用いる「
基準点」は予め定められた一連のルール(各マークにつ
き同じルール)によって位置決めされ、かつマークの特
徴を表現する選ばれた目的のために用いられるマークの
ポイント或いは関連するマークのポイントである。例え
ば、ベアードは基準点として各マークのまわりに境界と
なるボックス(枠)の下方中心に用いている。ベアード
の基準点10は第1A図のマーク14のまわりの境界線
12上の十字線として示される。
カラー付きユニット、典型的には互いに関連する同様の
色の画素(「ビクセルJ)に定義される。この目的で普
通用いられる特徴は「基準点」である。ここで用いる「
基準点」は予め定められた一連のルール(各マークにつ
き同じルール)によって位置決めされ、かつマークの特
徴を表現する選ばれた目的のために用いられるマークの
ポイント或いは関連するマークのポイントである。例え
ば、ベアードは基準点として各マークのまわりに境界と
なるボックス(枠)の下方中心に用いている。ベアード
の基準点10は第1A図のマーク14のまわりの境界線
12上の十字線として示される。
英語のテキストの完全に一直線上にある水平線において
、例えば各基準点は文字のベース(ベースラインと呼ぶ
)で同じ水平線16上に位置する。
、例えば各基準点は文字のベース(ベースラインと呼ぶ
)で同じ水平線16上に位置する。
ただし、例えば第1A図の文字「i」、ある種の句読点
及びたれ下り文字、つまりマークの一部がベースライン
より下に下かっている、例えば文字rg」 rpJ等は
別である。基準点が各関連要素に指定されているので、
ドツト付き文字「iJと「j」及び多くの句読点マーク
(:?:”)は−文字当たり一つ以上の基準点か生じる
ことになり、これら基準点のうちの少なくとも一つがベ
ースラインに対して大きくずれてしまう。たれ下がりを
有する文字は基準点から離れて形成されるが、ベースラ
インの近くにはある。たれ下がり文字は統計的にはそう
普通ではなく、ベアードの方法(及び本発明は発明にお
いても)は真のベースラインを決定する効果を認識し、
補正するための手段を提供する。注目したいのは、画像
中の一つの関連要素当たりの基準点は正確には一つであ
るということである。
及びたれ下り文字、つまりマークの一部がベースライン
より下に下かっている、例えば文字rg」 rpJ等は
別である。基準点が各関連要素に指定されているので、
ドツト付き文字「iJと「j」及び多くの句読点マーク
(:?:”)は−文字当たり一つ以上の基準点か生じる
ことになり、これら基準点のうちの少なくとも一つがベ
ースラインに対して大きくずれてしまう。たれ下がりを
有する文字は基準点から離れて形成されるが、ベースラ
インの近くにはある。たれ下がり文字は統計的にはそう
普通ではなく、ベアードの方法(及び本発明は発明にお
いても)は真のベースラインを決定する効果を認識し、
補正するための手段を提供する。注目したいのは、画像
中の一つの関連要素当たりの基準点は正確には一つであ
るということである。
本質的には、ベアードは、交換するアライメントに変化
のために一つの「ライン」当たりの基準点の数を決定す
ることによってスキューを計算した。ここで用いるライ
ンは例えばドキュメント(書類)を横切る走査線及び例
えばマージン或いはページエツジのような選択された特
徴に垂直に方向付けられた想像上の複数の走査線の一つ
を意味する。回転アライメントは、基準点の三角法によ
って計算される。
のために一つの「ライン」当たりの基準点の数を決定す
ることによってスキューを計算した。ここで用いるライ
ンは例えばドキュメント(書類)を横切る走査線及び例
えばマージン或いはページエツジのような選択された特
徴に垂直に方向付けられた想像上の複数の走査線の一つ
を意味する。回転アライメントは、基準点の三角法によ
って計算される。
11B図、第1C図を参照して、1本のライン当たりの
基準点の数の数え方は、矢印pで示される投影方向と鉛
直なアキュムレータライン18上に基準点IOの位置を
投影することによって達成される。
基準点の数の数え方は、矢印pで示される投影方向と鉛
直なアキュムレータライン18上に基準点IOの位置を
投影することによって達成される。
アキュムレータライン18は、例えば6点文字の高さの
1/3に等しい均一の予め定められたhの「ビンJ 2
0に区分される。高さhは適当に変えることができる。
1/3に等しい均一の予め定められたhの「ビンJ 2
0に区分される。高さhは適当に変えることができる。
高さhは2ビクセルと同しくらいに小さくすることもで
きる。しかし、hが小さくなるにつれて、計算時間が長
くなる。重要なのはhが文字の高さに近づくとスキュー
角度決定性能が劣化することである。ビンについて説明
すると、1本のライン当たり正確に一つのビンである。
きる。しかし、hが小さくなるにつれて、計算時間が長
くなる。重要なのはhが文字の高さに近づくとスキュー
角度決定性能が劣化することである。ビンについて説明
すると、1本のライン当たり正確に一つのビンである。
選択されたラインのための基準点の数は、そのラインに
対応するビンに投影される基準点の数と等しくなる。
対応するビンに投影される基準点の数と等しくなる。
この方法は、比較的少ない基準点(画像の性質によって
決まる)となるので、アライメントはlよりも大きい正
の累乗の和、例えば回転してアラインされたビン中に現
れる基準点のカウントの2(二乗の和)に基づいたアラ
イメントの計算によって効果的になされる。分布の変動
は、スキュー角度が決定されるアライメントの「累乗」
指数となるカウントの二乗の和を最大にすることによっ
て最大にされる。qIB図は、基準点10の位置及びビ
ンがスキューされたテキストと一致していないスキュー
されたテキストサンプル上の各ビン20の相対的な大き
さを示す。第1C図は第1B図の同じスキューされた画
像の基準点の一致したビンへの分布を示す。
決まる)となるので、アライメントはlよりも大きい正
の累乗の和、例えば回転してアラインされたビン中に現
れる基準点のカウントの2(二乗の和)に基づいたアラ
イメントの計算によって効果的になされる。分布の変動
は、スキュー角度が決定されるアライメントの「累乗」
指数となるカウントの二乗の和を最大にすることによっ
て最大にされる。qIB図は、基準点10の位置及びビ
ンがスキューされたテキストと一致していないスキュー
されたテキストサンプル上の各ビン20の相対的な大き
さを示す。第1C図は第1B図の同じスキューされた画
像の基準点の一致したビンへの分布を示す。
アライメントの各変動の累乗の計算には、各基準点の位
置がわかっていることが必要である。すなわち基準点の
座標は、原点からの角度と偏位によって基準点を新しい
一連の座標に数学的に変換するのに用いられる。この工
程は基準点を完全に収集するために行われ、この変換の
前後におけるアライメントの累乗が比較される。各々の
比較から最大の累乗を有するアライメントに対応する角
度が保持される。選ばれた範囲内の全ての角度上にアラ
イメントがこの方法によって比較された後、スキュー角
度が最大の累乗を有するアライメントに対応する角度と
みなされる。しかし、アライメントが弱いか或いは多重
アライメントの場合、この仮定は別の方法で証明する必
要がある。
置がわかっていることが必要である。すなわち基準点の
座標は、原点からの角度と偏位によって基準点を新しい
一連の座標に数学的に変換するのに用いられる。この工
程は基準点を完全に収集するために行われ、この変換の
前後におけるアライメントの累乗が比較される。各々の
比較から最大の累乗を有するアライメントに対応する角
度が保持される。選ばれた範囲内の全ての角度上にアラ
イメントがこの方法によって比較された後、スキュー角
度が最大の累乗を有するアライメントに対応する角度と
みなされる。しかし、アライメントが弱いか或いは多重
アライメントの場合、この仮定は別の方法で証明する必
要がある。
本発明は、従来技術の種々の問題点や欠点を解消する新
規なスキュー角度決定方法を提供する。
規なスキュー角度決定方法を提供する。
本発明の一つの観点は、スキュー角度が大きくなるに従
って、マークの底部と境界枠の底部との間の距離が大き
くなるという、ベアードのスキュー角度決定方法におけ
る問題を見つけることにある。この距離の差は、スキュ
ーの角度の正弦の関数として大きくなる。この点が基準
点のカウント中の誤差となり、この誤差の二乗としてス
キュー角度の決定に影響を与える。
って、マークの底部と境界枠の底部との間の距離が大き
くなるという、ベアードのスキュー角度決定方法におけ
る問題を見つけることにある。この距離の差は、スキュ
ーの角度の正弦の関数として大きくなる。この点が基準
点のカウント中の誤差となり、この誤差の二乗としてス
キュー角度の決定に影響を与える。
この観点は、さらにベアード法の問題は、マーク自身の
上に位置される基準点に基づいたスキュー角度を決定す
ることによって解決できることを見つけることに基づい
ている。
上に位置される基準点に基づいたスキュー角度を決定す
ることによって解決できることを見つけることに基づい
ている。
本発明のこの観点に関連した点としては、ラインの端が
スキュー決定の基準となる有効な一連の特徴を形成する
ことを発見することである。特に有効な一連の特徴は、
水平方向に向けられた画像のためのベースラインに、或
いはこれの近くに配置されたラインの端々或いは垂直な
或いは円柱方向に付けられた画像のための垂直ラインで
ある。
スキュー決定の基準となる有効な一連の特徴を形成する
ことを発見することである。特に有効な一連の特徴は、
水平方向に向けられた画像のためのベースラインに、或
いはこれの近くに配置されたラインの端々或いは垂直な
或いは円柱方向に付けられた画像のための垂直ラインで
ある。
包括的な画像中のライン端の検出は困難な仕事であるこ
とが立証されている。しかし、一つの方法が発見され、
かつ一連のライン端を含む一連の特徴を検出する本発明
の他の観点が形成された。
とが立証されている。しかし、一つの方法が発見され、
かつ一連のライン端を含む一連の特徴を検出する本発明
の他の観点が形成された。
連の特徴は、使用するライン端の有効性が少なくなるよ
うな大きさに限定される。一つの走査線を続く走査線と
比較することによって、ピクセルカラー変化が位置決め
される。ピクセルカラー変化の適切な選択が、スキュー
角度を決定する非常に有効に使用できるライン端を含む
一連の特徴を作り出すことができる。
うな大きさに限定される。一つの走査線を続く走査線と
比較することによって、ピクセルカラー変化が位置決め
される。ピクセルカラー変化の適切な選択が、スキュー
角度を決定する非常に有効に使用できるライン端を含む
一連の特徴を作り出すことができる。
本発明の他の観点は、スキュー角度を決定する従来法の
他の問題が、特徴(基準点)位置のコンピュータによる
決定法を含んでいることを認識することである。ベアー
ド法によれば、マークをそれと認めなければならないだ
けでなく、境界枠かマークのまわりに作られ、かつ、境
界枠の下方中心が位置決めされなければならない。
他の問題が、特徴(基準点)位置のコンピュータによる
決定法を含んでいることを認識することである。ベアー
ド法によれば、マークをそれと認めなければならないだ
けでなく、境界枠かマークのまわりに作られ、かつ、境
界枠の下方中心が位置決めされなければならない。
この観点は、さらに上述の問題が第1ラインの走査と次
に続くラインの走査との比較から基準点を決定すること
によって解決できることの発見に基づいていることであ
る。基準点の位置は、次の走査線上の対応する地形的な
特徴なしに、或いはそうでなければ前の走査線上に位置
する対応する地形的な特徴なしに、第1走査線上に位置
決めされた選ばれた地形的特徴の位置に対応する。この
点に関し、この明細書の説明の目的として、「地形的」
とは、マークの特徴を意味し、その画像或いはその部分
が例えば形状、大きさ、湾曲度、オーバーラツプ等のよ
うなその幾何学的形状特徴に基づいている。この点は、
マークの特徴、その画像或いは部分がその幾何学的形状
に基づいてはおらず、例えばカラー陰影等のようなある
他の属性に基づいている「非地形的J特徴から識別され
る。
に続くラインの走査との比較から基準点を決定すること
によって解決できることの発見に基づいていることであ
る。基準点の位置は、次の走査線上の対応する地形的な
特徴なしに、或いはそうでなければ前の走査線上に位置
する対応する地形的な特徴なしに、第1走査線上に位置
決めされた選ばれた地形的特徴の位置に対応する。この
点に関し、この明細書の説明の目的として、「地形的」
とは、マークの特徴を意味し、その画像或いはその部分
が例えば形状、大きさ、湾曲度、オーバーラツプ等のよ
うなその幾何学的形状特徴に基づいている。この点は、
マークの特徴、その画像或いは部分がその幾何学的形状
に基づいてはおらず、例えばカラー陰影等のようなある
他の属性に基づいている「非地形的J特徴から識別され
る。
本発明のさらに他の観点は、スキュー角度決定の従来法
が、テキスト画像のためのみ意味のある結果をもたらす
という認識にある。この点は基準点の位置を決定するの
に用いられる方法となる。
が、テキスト画像のためのみ意味のある結果をもたらす
という認識にある。この点は基準点の位置を決定するの
に用いられる方法となる。
境界枠がマークのまわりに作られ、境界枠の下方中心が
基準点として用いられる。ベアードは、境界枠をテキス
トマークのまわりのみに作るのに選んだ。この選択はテ
キストマークの位置が一致されていること、及び非テキ
ストマークが一致していないことを推測することに基づ
いてなされる。
基準点として用いられる。ベアードは、境界枠をテキス
トマークのまわりのみに作るのに選んだ。この選択はテ
キストマークの位置が一致されていること、及び非テキ
ストマークが一致していないことを推測することに基づ
いてなされる。
境界枠が非テキストマークのまわりに作られた場合、マ
ークから生じた基準点はノイズとして現れ、スキュー角
度を決定するのに必要とする重要なデータからそれてし
まう。この点から、本発明の観点が、スキュー角度決定
がテキスト或いは非テキスト画像に、或いは、テキスト
と非テキストの組み合わせたものに実行できることにあ
ることになる。マーク自身の上に位置された基準点にス
キューの決定の基準を置くことによって、境界枠を作る
必要がなくなる。この観点から非テキストマークから生
じる基準点にはその結果に正確性が大きく加えられる。
ークから生じた基準点はノイズとして現れ、スキュー角
度を決定するのに必要とする重要なデータからそれてし
まう。この点から、本発明の観点が、スキュー角度決定
がテキスト或いは非テキスト画像に、或いは、テキスト
と非テキストの組み合わせたものに実行できることにあ
ることになる。マーク自身の上に位置された基準点にス
キューの決定の基準を置くことによって、境界枠を作る
必要がなくなる。この観点から非テキストマークから生
じる基準点にはその結果に正確性が大きく加えられる。
このようにして、従来技術のテキストの制限が克服され
る。
る。
本発明のさらなる観点は、いかなる方法も圧縮されたフ
ォーマット中の画像データをスキュー角度を決定するの
に用いていないという問題を認識することにある。この
観点は、本発明の他の観点に関係する。すなわち、マー
ク、画像或いは圧縮されたフォーマット中のデータによ
って代表されるその画像或いはその一部におけるスキュ
ー角度決定を実行することが、多くの状況と多くの目的
に関して大変有利である。もし、それが排他的でなけれ
ば、多くの最近のシステムが圧縮されたフォーマット中
で大きな比率でデータを処理すると仮定すると、現時点
では画像データを圧縮されたフォーマットに用いるスキ
ュー決定法のための技術か必要である。
ォーマット中の画像データをスキュー角度を決定するの
に用いていないという問題を認識することにある。この
観点は、本発明の他の観点に関係する。すなわち、マー
ク、画像或いは圧縮されたフォーマット中のデータによ
って代表されるその画像或いはその一部におけるスキュ
ー角度決定を実行することが、多くの状況と多くの目的
に関して大変有利である。もし、それが排他的でなけれ
ば、多くの最近のシステムが圧縮されたフォーマット中
で大きな比率でデータを処理すると仮定すると、現時点
では画像データを圧縮されたフォーマットに用いるスキ
ュー決定法のための技術か必要である。
したがって、本発明のさらに池の観点は、圧縮されたフ
ォーマット中の画像データに基づいたスキュー角度決定
方法を提供することである。この点は、圧縮されたデー
タフォーマット中に検出可能な特徴を用いることを含意
している。すなわち、実質上全てのバイナリ画像圧縮シ
ステムか圧縮(例えばピクセルカラー変化)のために走
査された画像の物理的な特徴に用いる。データを用いる
ことによって、これらの特徴を有することになり、画像
データを完全に圧縮することなしにスキュー角度を決定
することができる。
ォーマット中の画像データに基づいたスキュー角度決定
方法を提供することである。この点は、圧縮されたデー
タフォーマット中に検出可能な特徴を用いることを含意
している。すなわち、実質上全てのバイナリ画像圧縮シ
ステムか圧縮(例えばピクセルカラー変化)のために走
査された画像の物理的な特徴に用いる。データを用いる
ことによって、これらの特徴を有することになり、画像
データを完全に圧縮することなしにスキュー角度を決定
することができる。
CCITTグループ4圧縮フォーマット(以後グループ
4という)は、ファクシミリの画像の伝送、ワークステ
ーションとサーバ間の画像の中間伝送、光学媒体及び磁
気媒体上の記憶フォーマット及び他の適用のための規格
となっている。圧縮アルゴリズムのソフトウェア実行は
、ある特定目的のVLS Iハードウェア実行としても
利用できる。例えば、アドバンスドマイクロデバイシズ
(Advanced Micro Devices)7
971Aプロセツサは、CCITTフォーマットに関す
るデータ圧縮/伸長のための専用回路である。したがっ
て、本発明の他の観点は、グループ4規格によって圧縮
された画像を使用するスキュー決定方法を提供すること
である。
4という)は、ファクシミリの画像の伝送、ワークステ
ーションとサーバ間の画像の中間伝送、光学媒体及び磁
気媒体上の記憶フォーマット及び他の適用のための規格
となっている。圧縮アルゴリズムのソフトウェア実行は
、ある特定目的のVLS Iハードウェア実行としても
利用できる。例えば、アドバンスドマイクロデバイシズ
(Advanced Micro Devices)7
971Aプロセツサは、CCITTフォーマットに関す
るデータ圧縮/伸長のための専用回路である。したがっ
て、本発明の他の観点は、グループ4規格によって圧縮
された画像を使用するスキュー決定方法を提供すること
である。
本発明のこの観点に関連して、非常に有効な結果が、基
準点の位置がスキュー決定に基づいたグループ4圧縮に
よってもたらされる、いわゆる「バスコード」の位置を
用いることによって達成される。二つのタイプのバス、
すなわち白ビクセルのバスと黒ピクセルのバスが認識さ
れている。
準点の位置がスキュー決定に基づいたグループ4圧縮に
よってもたらされる、いわゆる「バスコード」の位置を
用いることによって達成される。二つのタイプのバス、
すなわち白ビクセルのバスと黒ピクセルのバスが認識さ
れている。
CCITTグループ4の圧縮規格では、これらの二つの
間に差異はないが、本発明はさらに二つの観点がある。
間に差異はないが、本発明はさらに二つの観点がある。
第1に白ビクセルを表示するバスコードを選択すること
によって、スキュー角度決定の正確度が大きく改善され
ることを発見し、第2にスキュー角度決定によって二つ
のタイプのバスコード間を区別するための方法を実行す
ることである。
によって、スキュー角度決定の正確度が大きく改善され
ることを発見し、第2にスキュー角度決定によって二つ
のタイプのバスコード間を区別するための方法を実行す
ることである。
本発明の範囲及び従来のスキュー決定方法に関連する問
題に接近する方法は、付随する図面及び特許請求の範囲
と同時に見られるとき、以下の詳細な説明からより容易
に明らかになる。
題に接近する方法は、付随する図面及び特許請求の範囲
と同時に見られるとき、以下の詳細な説明からより容易
に明らかになる。
第1A図は、従来技術の一つの方法によるスキューして
いない画像上の基準点の位置を示す。
いない画像上の基準点の位置を示す。
第1B図は、前記従来技術の方法によるスキューした画
像上の基準点の位置を、整列していないビンへの基準屯
の分布のプロットとともに示す。
像上の基準点の位置を、整列していないビンへの基準屯
の分布のプロットとともに示す。
第1C図は、第1B図に示される同じスキューした画像
上の基準点の位置を、整列したビンへの基準点の分布の
プロットとともに示す。
上の基準点の位置を、整列したビンへの基準点の分布の
プロットとともに示す。
第2図は、本発明のスキュー角度決定方法による動作が
可能なコンピュータシステムの一部を示す。
可能なコンピュータシステムの一部を示す。
第3A図から第3C図は、CCTTTグループ4圧縮規
格の三つのエンコードモードを示す。
格の三つのエンコードモードを示す。
第4A図及び第4B図は、それぞれスキューしていない
及びスキューしたテキストでのCCTTTグループ4圧
縮規格のバスコードに基づいた基準点の位置を示す。
及びスキューしたテキストでのCCTTTグループ4圧
縮規格のバスコードに基づいた基準点の位置を示す。
第5A図及び第5B図は、それぞれスキューしていない
及びスキューしたテキストでのCCITTグループ4圧
縮規格のバスコードからの白バスコードに基ついた基準
点の位置を示す。
及びスキューしたテキストでのCCITTグループ4圧
縮規格のバスコードからの白バスコードに基ついた基準
点の位置を示す。
第6図は、本発明の一つの観点の流れ図を示す。
第7図は、本発明の他の観点の流れ図を示す。
第8図は、本発明の一つの観点の例として使用されたス
キューしたテキストの一部を示す。
キューしたテキストの一部を示す。
第9図は、本発明によるアライメント決定に使用された
第8図のサンプルテキストに対応した白バスコードの位
置を示す。
第8図のサンプルテキストに対応した白バスコードの位
置を示す。
第1O図は、第8図のサンプルのスキューしたテキスト
に対応したアライメントの累乗のプロットを示す。
に対応したアライメントの累乗のプロットを示す。
第11図は、多重スキュー角度を有するテキストに対応
したアライメントの累乗のプロットを示す。
したアライメントの累乗のプロットを示す。
以下、図示実施例を詳細に説明する。
これまでに述べた観点及び他の諸観点を用いた新規なス
キュー決定方法を説明する。本発明の方法は、特に走査
された画像中のスキューの決定に適用可能である。本明
細書において、画像データは、はっきりしたユニットに
、好ましくは画像のラインに分割されると仮定している
。この分割は、例えば画像を走査し、かつ、各走査ライ
ンの始めと終りに或いはライン全長に指示を挿入するこ
とによって達成される。この方法は、当該技術としては
公知である。便宜上、このユニットは以後走査線と呼ぶ
。
キュー決定方法を説明する。本発明の方法は、特に走査
された画像中のスキューの決定に適用可能である。本明
細書において、画像データは、はっきりしたユニットに
、好ましくは画像のラインに分割されると仮定している
。この分割は、例えば画像を走査し、かつ、各走査ライ
ンの始めと終りに或いはライン全長に指示を挿入するこ
とによって達成される。この方法は、当該技術としては
公知である。便宜上、このユニットは以後走査線と呼ぶ
。
普及の度合いが増してくると、走査された画像は圧縮さ
れたフォーマットで処理される。例えば、ファクシミリ
装置は、実質上完全に圧縮されたフォーマットで走査さ
れた画像で動作する。このため、本発明は画像データは
、圧縮された形態(ここでは圧縮されたデータドキュメ
ントとも呼ぶ)を仮定して説明する。
れたフォーマットで処理される。例えば、ファクシミリ
装置は、実質上完全に圧縮されたフォーマットで走査さ
れた画像で動作する。このため、本発明は画像データは
、圧縮された形態(ここでは圧縮されたデータドキュメ
ントとも呼ぶ)を仮定して説明する。
しかし、一つの技術として明白なのは、本発明が圧縮さ
れていない画像中の画像データにも同様に適用可能であ
ることである。
れていない画像中の画像データにも同様に適用可能であ
ることである。
第2図は、本発明が適用される環境のブロックフォーマ
ットを示す。特に第2図は、本発明の種々の観点に基づ
いて動作するように組まれたコンピュータシステム50
の一部を示す。このコンピュータシステム50にはスキ
ャナ52が含まれるか、或いはシステムがスキャナから
の出力信号を受けるようにこれに接続されている。この
スキャナは画像を走査し、かつ、その画像を表すディジ
タルデータはプロセッサ54に連絡されている。このプ
ロセッサは入力及び出力動作を制御lするとともに、バ
ス60を介してプログラムメモリ56とデータメモリ5
8に連結されている。
ットを示す。特に第2図は、本発明の種々の観点に基づ
いて動作するように組まれたコンピュータシステム50
の一部を示す。このコンピュータシステム50にはスキ
ャナ52が含まれるか、或いはシステムがスキャナから
の出力信号を受けるようにこれに接続されている。この
スキャナは画像を走査し、かつ、その画像を表すディジ
タルデータはプロセッサ54に連絡されている。このプ
ロセッサは入力及び出力動作を制御lするとともに、バ
ス60を介してプログラムメモリ56とデータメモリ5
8に連結されている。
プログラムメモリ56は、特にスキャナ62によって画
像の走査を制御するためのルーチン62と、画像を表す
ディジタルデータを圧縮されたデータフォーマットに変
換するためのルーチン64と、この圧縮されたデータか
らスキュー角度を決定するためのルーチン66を含んで
いる。したがって、このプログラムメモリ56は、デー
タメモリ58と関連しており、特に記憶場所68におい
て走査制御ルーチン62の制御下でディジタルデータ構
造かスキャナ52によって作られ、記憶場所70におい
て走査画像の圧縮された描写のデータ構造が圧縮ルーチ
ン64によって作られ、記憶場所72において例えば基
準点の位置のような選択されたポイントデータを含むデ
ータ構造がスキュー角度決定ルーチン66によって作ら
れる。プログラムメモリ56とデータメモリ58間の連
結を容易にするために、入力と出力動作がなされるよう
にして両者か互いにバス60によって接続されている。
像の走査を制御するためのルーチン62と、画像を表す
ディジタルデータを圧縮されたデータフォーマットに変
換するためのルーチン64と、この圧縮されたデータか
らスキュー角度を決定するためのルーチン66を含んで
いる。したがって、このプログラムメモリ56は、デー
タメモリ58と関連しており、特に記憶場所68におい
て走査制御ルーチン62の制御下でディジタルデータ構
造かスキャナ52によって作られ、記憶場所70におい
て走査画像の圧縮された描写のデータ構造が圧縮ルーチ
ン64によって作られ、記憶場所72において例えば基
準点の位置のような選択されたポイントデータを含むデ
ータ構造がスキュー角度決定ルーチン66によって作ら
れる。プログラムメモリ56とデータメモリ58間の連
結を容易にするために、入力と出力動作がなされるよう
にして両者か互いにバス60によって接続されている。
メモリ56及び58に関して一つ付は加ええる点は、こ
れら両者を明確にする目的で別々に描かれているが、実
際には、本発明に影響を与えることなしに、コンピュー
タシステムの単一のメモリブロックの一部としてもよい
。
れら両者を明確にする目的で別々に描かれているが、実
際には、本発明に影響を与えることなしに、コンピュー
タシステムの単一のメモリブロックの一部としてもよい
。
プロセッサの制御下でスキュー検出ルーチン66かデー
タメモリ58の種々の部分にアクセスしてスキュー角度
の計算に必要なデータを得る。−度この計算がなされる
と、スキュー角度が出力部74に出力される。この出力
部は、CRT表示器のような結果を表示する手段と、ハ
ードコピープリンタ等からなるか、或いは結果をさらに
別の操作をするのに、例えば画像データの補正をスキュ
ー等の補正に用いるための手段からなる。
タメモリ58の種々の部分にアクセスしてスキュー角度
の計算に必要なデータを得る。−度この計算がなされる
と、スキュー角度が出力部74に出力される。この出力
部は、CRT表示器のような結果を表示する手段と、ハ
ードコピープリンタ等からなるか、或いは結果をさらに
別の操作をするのに、例えば画像データの補正をスキュ
ー等の補正に用いるための手段からなる。
画像データは、グループ4基準に基づいて圧縮されてき
たと仮定されるが、適当な修正のなされた本発明は、他
の圧縮体系、例えばCCITT2次元グループ3フォー
マット等を用いて同様の結果を作る。グループ4のコー
ド体系は、対をなす続いている走査線に見られるピクセ
ルカラーの変わり目の存在とその相対的間隔に依存して
いる。
たと仮定されるが、適当な修正のなされた本発明は、他
の圧縮体系、例えばCCITT2次元グループ3フォー
マット等を用いて同様の結果を作る。グループ4のコー
ド体系は、対をなす続いている走査線に見られるピクセ
ルカラーの変わり目の存在とその相対的間隔に依存して
いる。
グループ4において、次いで各ラインがコード化される
と「コーディングライン」となり、かつその前の「基準
線」に関してコード化される。最初のラインが人工的に
規定された全白基準線に関してコード化される。グルー
プ4圧縮規格についてのより詳しい説明については、ハ
ンター(Hunter)他による「国際ディジタルファ
クシミリコーディング規格JIEEEfjl事R,Vo
l、 68.に7.1980年7月、 pp854−8
67及び国際電気通信連合、CCITT(国際電信電話
諮問委員会)レッドブック、ジュネーブ1985 (I
S B N 92−6l−02291−X)ヲ参照ス
るものとする。
と「コーディングライン」となり、かつその前の「基準
線」に関してコード化される。最初のラインが人工的に
規定された全白基準線に関してコード化される。グルー
プ4圧縮規格についてのより詳しい説明については、ハ
ンター(Hunter)他による「国際ディジタルファ
クシミリコーディング規格JIEEEfjl事R,Vo
l、 68.に7.1980年7月、 pp854−8
67及び国際電気通信連合、CCITT(国際電信電話
諮問委員会)レッドブック、ジュネーブ1985 (I
S B N 92−6l−02291−X)ヲ参照ス
るものとする。
グループ4フオーマツト中のエンコーディングは、三つ
のモード、すなわち垂直、水平、及びパスがある。これ
ら三つのモードは第3A図、第3B図及び第3C図に基
づいて次に説明する。近接する走査線が、例えば黒から
白への基準線上で第1ピクセルカラー変化があるかどう
か、コーディングライン上に対応するピクセルカラー変
化(すなわちこちらも黒から白)が存在するどうかを決
定するのに比較される。基準線上の変化からコーディン
グライン上の変化の存在と相対的間隔がモードの決定に
用いられる。
のモード、すなわち垂直、水平、及びパスがある。これ
ら三つのモードは第3A図、第3B図及び第3C図に基
づいて次に説明する。近接する走査線が、例えば黒から
白への基準線上で第1ピクセルカラー変化があるかどう
か、コーディングライン上に対応するピクセルカラー変
化(すなわちこちらも黒から白)が存在するどうかを決
定するのに比較される。基準線上の変化からコーディン
グライン上の変化の存在と相対的間隔がモードの決定に
用いられる。
第3A図を参照して、垂直モードは近接する走査線上で
黒から白或いは白から黒への移り変わり何時が水平方向
に近接(≦3ピクセル)しているとき、従って少ないビ
ット数でエンコードされる場合に用いられる。水平モー
ドは、移り変わり位置が第3B図に示すように3ピクセ
ルよりも離れている場合に用いられる。バスモードは、
基準線上の移り変わりが第3C図に示すように、コーデ
ィングライン上に対応するものがない場合に用いられる
。
黒から白或いは白から黒への移り変わり何時が水平方向
に近接(≦3ピクセル)しているとき、従って少ないビ
ット数でエンコードされる場合に用いられる。水平モー
ドは、移り変わり位置が第3B図に示すように3ピクセ
ルよりも離れている場合に用いられる。バスモードは、
基準線上の移り変わりが第3C図に示すように、コーデ
ィングライン上に対応するものがない場合に用いられる
。
圧縮されたデータは、特にコーディングラインとは反対
に基準線上で測定され偏位を意味する偏位と一緒にモー
ドコードを含んでいる。
に基準線上で測定され偏位を意味する偏位と一緒にモー
ドコードを含んでいる。
第4A図、第4B図を参照して、ベアードが用いたマー
クのまわりの境界線上に配置された基準点の代わりに、
本発明はマークの地形的特徴の位置に基ついて基準点を
位置決めする。これら地形的特徴は、単にマーク自身の
上に位置される。特に、スキューは、画像のグループ4
圧縮表現中のパスコードの位置から決定される。スキュ
ーされていないテキスト及びスキューされたテキスト上
のノくスコード基準点7bの位置は、それぞれ第4A図
。
クのまわりの境界線上に配置された基準点の代わりに、
本発明はマークの地形的特徴の位置に基ついて基準点を
位置決めする。これら地形的特徴は、単にマーク自身の
上に位置される。特に、スキューは、画像のグループ4
圧縮表現中のパスコードの位置から決定される。スキュ
ーされていないテキスト及びスキューされたテキスト上
のノくスコード基準点7bの位置は、それぞれ第4A図
。
第4B図においてrXJ印で示される。
全てのバスコードは、マーク上のポイント(1点)に図
して規定されるので、スキューの範囲に拘わらず、全て
の基準点はマーク上のある点で位置決められる。さらに
、一つ以上のバスコードがマークを表す圧縮されたデー
タ中にあるので、1つのマークより一つ以上の基準点が
あることになる。例えば、典型的なフォントスタイルに
とってはパスは上下のケースrAJ、 rHJ、
rK」等ヲ含む多くの文字のベースラインに沿って二つ
の位置に生じる。また上下のケース「M」のベースライ
ンに沿って三つの位置に生しる。
して規定されるので、スキューの範囲に拘わらず、全て
の基準点はマーク上のある点で位置決められる。さらに
、一つ以上のバスコードがマークを表す圧縮されたデー
タ中にあるので、1つのマークより一つ以上の基準点が
あることになる。例えば、典型的なフォントスタイルに
とってはパスは上下のケースrAJ、 rHJ、
rK」等ヲ含む多くの文字のベースラインに沿って二つ
の位置に生じる。また上下のケース「M」のベースライ
ンに沿って三つの位置に生しる。
パスはエリアシングエラーとしても発生し、例えば第4
図に示すようにスキューされていない「G」のクロスバ
−〇下側及びスキューされていない「K」の右脚に見ら
れる。このようなエリアシングエラーを区別することは
本発明の範囲外である。しかし、ある状況のエリアシン
グエラーは有効で意味のある結果に結びつく。例えば、
長い水平方向の構造がディジタル化されると、エリアシ
ングエラーがしばしば発生する。このエリアシングエラ
ーの存在によって、黒から白への移り変わりを表すバス
コードを生ぜしめる結果となるので、長い水平線は、そ
のコードが表出するアライメント中に全くあいまいさを
含まずに多数のバスコードを提供する。従って、水平方
向に整列された図形的構造が、それがエリアシングエラ
ーを生じる傾向にあるために、スキュー角度の決定を大
きく改善する。ここで、つけ加えておかなければならな
いのは、大きい非水平方向構造は、本発明の特性を大き
く低下させることはないということである。なぜなら、
この構造は一般的にバスコードを生じるエリアシングエ
ラーに従属していないからであり、エリアシングエラー
がグループ4垂直モードを用いてエンコードされるため
である。
図に示すようにスキューされていない「G」のクロスバ
−〇下側及びスキューされていない「K」の右脚に見ら
れる。このようなエリアシングエラーを区別することは
本発明の範囲外である。しかし、ある状況のエリアシン
グエラーは有効で意味のある結果に結びつく。例えば、
長い水平方向の構造がディジタル化されると、エリアシ
ングエラーがしばしば発生する。このエリアシングエラ
ーの存在によって、黒から白への移り変わりを表すバス
コードを生ぜしめる結果となるので、長い水平線は、そ
のコードが表出するアライメント中に全くあいまいさを
含まずに多数のバスコードを提供する。従って、水平方
向に整列された図形的構造が、それがエリアシングエラ
ーを生じる傾向にあるために、スキュー角度の決定を大
きく改善する。ここで、つけ加えておかなければならな
いのは、大きい非水平方向構造は、本発明の特性を大き
く低下させることはないということである。なぜなら、
この構造は一般的にバスコードを生じるエリアシングエ
ラーに従属していないからであり、エリアシングエラー
がグループ4垂直モードを用いてエンコードされるため
である。
二つのタイプのパス即ち白ピクセルのパスによる白パス
と、黒ビクセルによる黒パスがある。白パスは黒構造の
底部を表すものであるから、たとえばライン端のような
処理されていないビットマツプ中の関連要素の底部に見
られるものと幾分類似している。実際に、各関連要素の
底部において少なくとも一つのパスが保証される。従っ
て、白パスは基準点として用いるのは有利であるが、当
該技術においては、本発明に基づいて適当な状況におい
て黒パスもスキュー角度を決定するのに用いることがで
きることは明白である。スキューされていないテキスト
及びスキューされたテキスト上の白バスコード基準点7
8の位置をそれぞれ第5A図、第5B図に矢印で示す。
と、黒ビクセルによる黒パスがある。白パスは黒構造の
底部を表すものであるから、たとえばライン端のような
処理されていないビットマツプ中の関連要素の底部に見
られるものと幾分類似している。実際に、各関連要素の
底部において少なくとも一つのパスが保証される。従っ
て、白パスは基準点として用いるのは有利であるが、当
該技術においては、本発明に基づいて適当な状況におい
て黒パスもスキュー角度を決定するのに用いることがで
きることは明白である。スキューされていないテキスト
及びスキューされたテキスト上の白バスコード基準点7
8の位置をそれぞれ第5A図、第5B図に矢印で示す。
パスのグループ4エンコードは、白パスと黒パスを区別
していない。パスのどのカラーがエンコードされたかを
知るために、状態を維持しなければならない。本発明に
よれば、状態は架空の完全な白の最初のラインに対応し
て設定されたバイナリ状態ビットによって維持される。
していない。パスのどのカラーがエンコードされたかを
知るために、状態を維持しなければならない。本発明に
よれば、状態は架空の完全な白の最初のラインに対応し
て設定されたバイナリ状態ビットによって維持される。
パスコードが生じるために、状態ビットが反転され、こ
れによってバスコードの状態(すなわちカラー)のラン
ニングトラックが維持される。
れによってバスコードの状態(すなわちカラー)のラン
ニングトラックが維持される。
第4A図、第4B図と第5A図、第5B図を比較すると
、第5図のテキストのベースラインに生じた基準点の数
は、第4図の基準点よりも少なくなっているのがわかる
。たとえば、第4A図、第4B図において文字rOJ8
0では二つの基準点すなわち上方ポイント8J2と下方
ポイント84があることが分かる。下方ポイント84は
ベースライン86上にあるが、上方ポイント82はベー
スライン上にない。第5A図、第5B図において、同じ
文字「O」80ではベースライン90上に位置する単一
の基準点88があるだけである。これは図形的な表示で
、白パスはアライメントによるスキュー測定を基準とす
る基準点を提供するために有利である。しかし、ある種
の「ノイズ」が白バスを用いることで発生する。すなわ
ち発生したいくつかの基準点は、ベースライン上には直
接位置せず、ベースライン情報に加えられる。
、第5図のテキストのベースラインに生じた基準点の数
は、第4図の基準点よりも少なくなっているのがわかる
。たとえば、第4A図、第4B図において文字rOJ8
0では二つの基準点すなわち上方ポイント8J2と下方
ポイント84があることが分かる。下方ポイント84は
ベースライン86上にあるが、上方ポイント82はベー
スライン上にない。第5A図、第5B図において、同じ
文字「O」80ではベースライン90上に位置する単一
の基準点88があるだけである。これは図形的な表示で
、白パスはアライメントによるスキュー測定を基準とす
る基準点を提供するために有利である。しかし、ある種
の「ノイズ」が白バスを用いることで発生する。すなわ
ち発生したいくつかの基準点は、ベースライン上には直
接位置せず、ベースライン情報に加えられる。
例えば文字「C」は二つの自パスを生じることがあり、
その一つはマークの底部にもう一つは文字「C」の右側
の開口部の上方限界を形成するストロークの底部に生じ
る。同様にして、バスコードのもとになる文字「M」の
中心の底部がある種のフォントでベースライン上にてな
いことかある。
その一つはマークの底部にもう一つは文字「C」の右側
の開口部の上方限界を形成するストロークの底部に生じ
る。同様にして、バスコードのもとになる文字「M」の
中心の底部がある種のフォントでベースライン上にてな
いことかある。
この種のノイズ信号を区別することは本発明の範囲外で
ある。しかし、このノイズ信号の発生は統計上そうしば
しば生じるものではなく、スキュー角度決定の精度を大
きく落とすものでもなく、また計算時間が相当長くなる
わけでもない。
ある。しかし、このノイズ信号の発生は統計上そうしば
しば生じるものではなく、スキュー角度決定の精度を大
きく落とすものでもなく、また計算時間が相当長くなる
わけでもない。
第6図は第2図のプログラムメモリ56の実施例のブロ
ックダイヤグラムを示す。ルーチン66の出発点につき
、画像が走査されると仮定すると、ディジタルデータが
走査された画像に対応して発生され、このディジタルデ
ータがグループ4圧縮データを生じるような選択された
データ圧縮方法に基づいて圧縮の処理が課せられる。
ックダイヤグラムを示す。ルーチン66の出発点につき
、画像が走査されると仮定すると、ディジタルデータが
走査された画像に対応して発生され、このディジタルデ
ータがグループ4圧縮データを生じるような選択された
データ圧縮方法に基づいて圧縮の処理が課せられる。
まず、例えばデータメモリ58の記憶場所72に記憶さ
れた圧縮された画像データのデータ構造中の白バスコー
ドが位置決めされる。これを第6図のボックス92で示
す。−度目バスコードが位置決めされると、適当な座標
系の位置が決定される。これをボックス94で示す。横
軸x1縦軸yを有する直角座標の座標対が一般的にこの
目的として便利であるが、本発明の範囲内で、例えば極
座標のような他の座標系もそれが適当な場合に用いるこ
ともできる。座標対アレイ96をコンピユーテイングア
ライメントで使用するために形成できる。これについて
は次に詳しく説明する。白バスコードの位置の座標対を
記憶した後、走査されたページの終端が達したかどうか
を決定するためにテストが98で行われる。もし到達し
ておれば、次に詳しく説明するようにスキュー角度の決
定が行われる。
れた圧縮された画像データのデータ構造中の白バスコー
ドが位置決めされる。これを第6図のボックス92で示
す。−度目バスコードが位置決めされると、適当な座標
系の位置が決定される。これをボックス94で示す。横
軸x1縦軸yを有する直角座標の座標対が一般的にこの
目的として便利であるが、本発明の範囲内で、例えば極
座標のような他の座標系もそれが適当な場合に用いるこ
ともできる。座標対アレイ96をコンピユーテイングア
ライメントで使用するために形成できる。これについて
は次に詳しく説明する。白バスコードの位置の座標対を
記憶した後、走査されたページの終端が達したかどうか
を決定するためにテストが98で行われる。もし到達し
ておれば、次に詳しく説明するようにスキュー角度の決
定が行われる。
もし到達していなければ、ページ上にもし白バスコード
があれば次操作のためにサーチが行われる。
があれば次操作のためにサーチが行われる。
前述の四つの工程92〜98は、座標決定ルーチン10
0として集合的に表される。走査決定ルーチン66はサ
ブルーチンとなり、次に走査決定ルーチン66はサブル
ーチンとなり、次に第7図に基づいてさらに説明する。
0として集合的に表される。走査決定ルーチン66はサ
ブルーチンとなり、次に走査決定ルーチン66はサブル
ーチンとなり、次に第7図に基づいてさらに説明する。
ブロック 101はグループ4圧縮フオーマツト中のデ
ータの入力を表す。x−y座標対を用いて、Xとyをま
ずページのスタートを表す0におく。この様子を工程1
02で示し、各々の新しい走査されたページのスタート
において行う。
ータの入力を表す。x−y座標対を用いて、Xとyをま
ずページのスタートを表す0におく。この様子を工程1
02で示し、各々の新しい走査されたページのスタート
において行う。
ブロック 103は、グループ4コードの検出を表す。
これまでに説明したように、三つのタイプのグループ4
コード、すなわち水平、垂直及びバスのコードがある。
コード、すなわち水平、垂直及びバスのコードがある。
前述したCCITTレッドブックを参照する。検出グル
ープ4コードがキャラクタ列認識によって実行できる。
ープ4コードがキャラクタ列認識によって実行できる。
当該技術範囲内のこれ以外の種々の方法でもコード検出
できる。
できる。
度グループ4コードか検出されると、そのタイプを決定
する必要がある。すなわち、三つのグループ4タイプの
うちのとれであるか、つまりバスコードか白バスコード
か或いは黒バスコードであるか決定しなければならない
。この工程は一連のテストによって行われ、その結果で
X座標がどのように決定されたかが決定される。X座標
がXの前回値に相当すると、座標決定ルーチン100を
通る直前のバス中の工程103によって位置決めされた
コードと関連し、新しいX値に相当すると、座標決定ル
ーチン100を通る今回のバス中の工程103によって
位置決めされたコードと関連する。
する必要がある。すなわち、三つのグループ4タイプの
うちのとれであるか、つまりバスコードか白バスコード
か或いは黒バスコードであるか決定しなければならない
。この工程は一連のテストによって行われ、その結果で
X座標がどのように決定されたかが決定される。X座標
がXの前回値に相当すると、座標決定ルーチン100を
通る直前のバス中の工程103によって位置決めされた
コードと関連し、新しいX値に相当すると、座標決定ル
ーチン100を通る今回のバス中の工程103によって
位置決めされたコードと関連する。
コードが位置決めされると、そのコードが水平コードで
あるかどうかを決定するためにテストが課される。もし
そうであれば、Xの新しい値はXの古い値に、水平コー
ドに関する偏位値を加えたものとなる。すなわち、グル
ープ4の水平モードはモードを示すコードと、基準ピク
セルカラーの移り目と今回ピクセルカラーの移り目との
間のビクセル数を示す偏位を含んでいる。水平コードの
場合、この偏位は特定ライン上ピクセルカラーの移り目
と同じライン上の次のピクセルカラーの移り目との間の
ビクセル数になる。この状態を106で示す。
あるかどうかを決定するためにテストが課される。もし
そうであれば、Xの新しい値はXの古い値に、水平コー
ドに関する偏位値を加えたものとなる。すなわち、グル
ープ4の水平モードはモードを示すコードと、基準ピク
セルカラーの移り目と今回ピクセルカラーの移り目との
間のビクセル数を示す偏位を含んでいる。水平コードの
場合、この偏位は特定ライン上ピクセルカラーの移り目
と同じライン上の次のピクセルカラーの移り目との間の
ビクセル数になる。この状態を106で示す。
注目したい重要な点は、Xのこの新しい値はアライメン
トを決定するのに用いる横座標値にはならないことであ
る。というよりはむしろこの値は走査線上の第1ビクセ
ル位置から偏位したランニング値である。自バスコード
に関係するX値のみがアライメント決定に用いられる。
トを決定するのに用いる横座標値にはならないことであ
る。というよりはむしろこの値は走査線上の第1ビクセ
ル位置から偏位したランニング値である。自バスコード
に関係するX値のみがアライメント決定に用いられる。
水平コードが検出されたと仮定された時期を求めるため
に2進ピクセルカラー状態ビツトが122でインクリメ
ントされる。この操作を行う方法と目的を次に詳しく説
明する。−度Xの新しい値が計算されると、Xは108
でチエツクされ、ライン端が到達されたかどうかが決定
される。この操作はビクセル中でXを走査線の公知の長
さと比較することによって好適に行うことができ、Xが
この値に達するとライン端が検出されたことになる。
に2進ピクセルカラー状態ビツトが122でインクリメ
ントされる。この操作を行う方法と目的を次に詳しく説
明する。−度Xの新しい値が計算されると、Xは108
でチエツクされ、ライン端が到達されたかどうかが決定
される。この操作はビクセル中でXを走査線の公知の長
さと比較することによって好適に行うことができ、Xが
この値に達するとライン端が検出されたことになる。
ライン端が到達していなければ、このラインにつきコー
ド検出が103にて続行される。ライン端が到達すると
、Xは次のラインの始まりに対応して110にて0に設
定され、ライン数のランニングカウントを保持している
yが1だけインクリメントされ、111でチエツクされ
てページ端が到達したかどうかが決定される。この決定
は、Xについてはyをページ当たりの公知のライン数と
の比較により行い、yがこの値に達すれば、ページ端が
検出されたことになる。ページ端に到達すると、多数の
アライメント角度を通過した種々のアライメントのため
の累乗か+26で決定される。これについては、次に詳
しく説明する。ページ端に到達していなければ、コード
検出が103で再開される。
ド検出が103にて続行される。ライン端が到達すると
、Xは次のラインの始まりに対応して110にて0に設
定され、ライン数のランニングカウントを保持している
yが1だけインクリメントされ、111でチエツクされ
てページ端が到達したかどうかが決定される。この決定
は、Xについてはyをページ当たりの公知のライン数と
の比較により行い、yがこの値に達すれば、ページ端が
検出されたことになる。ページ端に到達すると、多数の
アライメント角度を通過した種々のアライメントのため
の累乗か+26で決定される。これについては、次に詳
しく説明する。ページ端に到達していなければ、コード
検出が103で再開される。
コードが水平でないと決定されると、垂直コートである
かどうかを112でテストする必要がある。
かどうかを112でテストする必要がある。
垂直モード中の基準線上の値として用いるために種々の
ラインからなる移り変わり位置を記憶する必要がある。
ラインからなる移り変わり位置を記憶する必要がある。
この操作は(xi、、x2.、 ・・・xn、)形式
の配列で行われる。ここにrは基準線(前の走査線)上
の値を示し、nは基準線上の全コード数である。前のラ
インにつきX値を保持すればよいだけであるから、新し
いX値は一度決定された古い値に上書きてきる。この操
作は114で示される。
の配列で行われる。ここにrは基準線(前の走査線)上
の値を示し、nは基準線上の全コード数である。前のラ
インにつきX値を保持すればよいだけであるから、新し
いX値は一度決定された古い値に上書きてきる。この操
作は114で示される。
垂直コードが検出されたと仮定すると、Xに対する値が
次のようにして116で計算される。垂直モードは基準
線とのビクセルb1におけるビクセル移り目との間の偏
位からコード化される。この偏位の計 にはX値のみ関
係するので、この屁には単に xb、−xa、 で
簡単に計算できる。
次のようにして116で計算される。垂直モードは基準
線とのビクセルb1におけるビクセル移り目との間の偏
位からコード化される。この偏位の計 にはX値のみ関
係するので、この屁には単に xb、−xa、 で
簡単に計算できる。
ここにx b +及びXa、は各々ビクセルb、とaに
おけるX値である。新しいX値は古いX値にこの偏位を
加えたものである。再度、2進のピクセルカラー状態ビ
ットが122でインクリメントされ、新しいX値が10
8でテストされラインの終端が達したかどうかが決定さ
れ、ページの終端が到達していれば+12で決定される
ようにして次々実行される。
おけるX値である。新しいX値は古いX値にこの偏位を
加えたものである。再度、2進のピクセルカラー状態ビ
ットが122でインクリメントされ、新しいX値が10
8でテストされラインの終端が達したかどうかが決定さ
れ、ページの終端が到達していれば+12で決定される
ようにして次々実行される。
検出されたコードが104.112でのテストに失敗す
ると、コードは消去工程によってバスコードになる。す
でに説明したように、白バスコードと黒バスコードを区
別するのは重要である。白バスコードはアライメントの
決定に用いられるか、黒バスコードはこれに用いられな
い。グループ4は白バスコードと黒バスコードを区別し
ないので、2進ピクセ1ルのトラックを保持して、11
8におけるカラー状態ビットの状態を決定する。まず最
初に、状態ビットが112においてOに設定される。任
意に、0が自バスコードに対応して運ばれる。コードが
検出される毎に状態ビットがチエツクされる。
ると、コードは消去工程によってバスコードになる。す
でに説明したように、白バスコードと黒バスコードを区
別するのは重要である。白バスコードはアライメントの
決定に用いられるか、黒バスコードはこれに用いられな
い。グループ4は白バスコードと黒バスコードを区別し
ないので、2進ピクセ1ルのトラックを保持して、11
8におけるカラー状態ビットの状態を決定する。まず最
初に、状態ビットが112においてOに設定される。任
意に、0が自バスコードに対応して運ばれる。コードが
検出される毎に状態ビットがチエツクされる。
状態ビットが0でない、すなわち、バスコードが白バス
コードでない場合、Xの新しい値が120においてXの
古い値と等しく設定される。次に現れるコードがバスコ
ードでないと仮定すると、次のコードは、次のXを正し
く計算するのに必要な必要情報を連想できる。次に現れ
るコードがバスコード、であれば、コードがバスコード
でないものが現れるまで処理が繰り返される。この工程
はグループ4バスコードの最も重要な部分である。引き
続いて、Xの新しい値が120で設定され、状態ビット
が次に現れるバスコードのために122で増幅される。
コードでない場合、Xの新しい値が120においてXの
古い値と等しく設定される。次に現れるコードがバスコ
ードでないと仮定すると、次のコードは、次のXを正し
く計算するのに必要な必要情報を連想できる。次に現れ
るコードがバスコード、であれば、コードがバスコード
でないものが現れるまで処理が繰り返される。この工程
はグループ4バスコードの最も重要な部分である。引き
続いて、Xの新しい値が120で設定され、状態ビット
が次に現れるバスコードのために122で増幅される。
状態ビットがOに等しいと決定されると、自バスコード
が現れたことになる。この白バスコードの位置は、アラ
イメントの累乗を計算する目的と、いくつかのアライメ
ント角度の両端を掃引する次に説明する転換工程のため
に保持しなけらばならない。この工程は、第2図のデー
タメモリ58の選択されたポイントデータ記憶場所72
で行われる。
が現れたことになる。この白バスコードの位置は、アラ
イメントの累乗を計算する目的と、いくつかのアライメ
ント角度の両端を掃引する次に説明する転換工程のため
に保持しなけらばならない。この工程は、第2図のデー
タメモリ58の選択されたポイントデータ記憶場所72
で行われる。
白バスコードの記憶場所の保持は124で行われる。
次いで、Xが設定され、前述したように状態ビットがイ
ンクリメントされ、ライン端とページ端がチエツクされ
る。
ンクリメントされ、ライン端とページ端がチエツクされ
る。
第6図に戻り、この説明はライン端が達したと仮定して
続けられる。もしそのような場合、累乗は参照番号12
6で示した部所で異なるアライメント角度を有、する複
数のアライメントにつき決定しなければならない。まず
最初にアライメント角度が128にて0に設定される。
続けられる。もしそのような場合、累乗は参照番号12
6で示した部所で異なるアライメント角度を有、する複
数のアライメントにつき決定しなければならない。まず
最初にアライメント角度が128にて0に設定される。
このアライメントはその画像が走査されたアライメント
に対応している。このアライメント角度につきアライメ
ントの累乗が概して上述したようにして計算される。こ
の場合、一つのコールがデータメモリ58の記憶場所7
2でなされ、そこに記憶されたX値の数値が各ラインに
つき決定される。この様子が各ラインごとのビンのサイ
ズを表している。各ラインにおけるX値の数の2乗か、
130て配列に累計され、現在のアライメント角度での
アライメントの累乗が表される。2乗の配列が、132
て、現在のアライメント角度と共に、データメモリ58
の一部に記憶される。
に対応している。このアライメント角度につきアライメ
ントの累乗が概して上述したようにして計算される。こ
の場合、一つのコールがデータメモリ58の記憶場所7
2でなされ、そこに記憶されたX値の数値が各ラインに
つき決定される。この様子が各ラインごとのビンのサイ
ズを表している。各ラインにおけるX値の数の2乗か、
130て配列に累計され、現在のアライメント角度での
アライメントの累乗が表される。2乗の配列が、132
て、現在のアライメント角度と共に、データメモリ58
の一部に記憶される。
次いで、アライメント角度が134にて例えば1度のよ
うな選択された大きさだけインクリメントされる。アラ
イメントの累乗は、アライメント角度の範囲内のアライ
メントにつき決定される。アライメント角度の範囲の選
択は、たとえばアライメント角度の予想される範囲、ア
ライメントの予想される強さ、アライメントの予想され
る数等の多数の要素に依存している。アライメント角度
の値が大きくなればなるほど、任意の角度の増大のため
の計算時間が長くなる。いずれにしても、スキュー角度
の範囲の一例は−40から+40度となる。
うな選択された大きさだけインクリメントされる。アラ
イメントの累乗は、アライメント角度の範囲内のアライ
メントにつき決定される。アライメント角度の範囲の選
択は、たとえばアライメント角度の予想される範囲、ア
ライメントの予想される強さ、アライメントの予想され
る数等の多数の要素に依存している。アライメント角度
の値が大きくなればなるほど、任意の角度の増大のため
の計算時間が長くなる。いずれにしても、スキュー角度
の範囲の一例は−40から+40度となる。
したがって、−度インクリメントされると現在のアライ
メント角度か、選択された範囲外にあるかとうかを決定
するテストをする必要がある。これが136で行われる
。現在のアライメント角度が選択された範囲外になけれ
ば、白バスコードの位置が138で翻訳される。翻訳の
いくつかの方法として、バスコードの記憶場所の有無、
その適用可能性が使用された座標系に依存しているか、
メモリの大きさが利用可能か、要求されている計算速度
か等々がある。−例を挙げると、 X、 :XCO5α −ySin C1y1=XS
lnα−yCO8α 現在のアライメント角度が選択範囲外にある場合には、
次いで、前もって格納された種々のアライメントの累乗
と比較されることにより最大出力が決定される。この最
大累乗は、次いで、種々の形式で、たとえば、絶対角度
、それらの累乗を伴った角度のスペクトルで142に出
力される。出力の形式は、前述したように結果の使用意
図に依存する。以下、本発明の特定の例について説明す
る。
メント角度か、選択された範囲外にあるかとうかを決定
するテストをする必要がある。これが136で行われる
。現在のアライメント角度が選択された範囲外になけれ
ば、白バスコードの位置が138で翻訳される。翻訳の
いくつかの方法として、バスコードの記憶場所の有無、
その適用可能性が使用された座標系に依存しているか、
メモリの大きさが利用可能か、要求されている計算速度
か等々がある。−例を挙げると、 X、 :XCO5α −ySin C1y1=XS
lnα−yCO8α 現在のアライメント角度が選択範囲外にある場合には、
次いで、前もって格納された種々のアライメントの累乗
と比較されることにより最大出力が決定される。この最
大累乗は、次いで、種々の形式で、たとえば、絶対角度
、それらの累乗を伴った角度のスペクトルで142に出
力される。出力の形式は、前述したように結果の使用意
図に依存する。以下、本発明の特定の例について説明す
る。
例
第8図に示されているのは、本発明の方法をテストする
ために使用されたサンプルテキストである。ビンサイズ
は、ディジタル画像(すなわち、画像の幅を横切って垂
直位置にlピクセル分だけ相違して)における最小検知
可能スキューを反映して、二つのピクセルに設定される
。同じ理由により、角度増分サイズは、このスレショル
ド以下にスキュー角度を分解するための試みがなされな
いように、制限される。アライメントは、+/−80度
の範囲にわたって測定される。
ために使用されたサンプルテキストである。ビンサイズ
は、ディジタル画像(すなわち、画像の幅を横切って垂
直位置にlピクセル分だけ相違して)における最小検知
可能スキューを反映して、二つのピクセルに設定される
。同じ理由により、角度増分サイズは、このスレショル
ド以下にスキュー角度を分解するための試みがなされな
いように、制限される。アライメントは、+/−80度
の範囲にわたって測定される。
第8図のサンプルのスキューしたテキストのための白バ
スコード位置が第9図に示されている。
スコード位置が第9図に示されている。
これらの白バスコードは、種々の回転アライメントを計
算するために使用される。第1O図は、第8図のこれら
の自パス基準用のアライメント関係の関数としての累乗
を示す。スキュー角度は、角度が水平の0度指示から相
違する累乗ピークに比例しているので、第1O図のプロ
ットから図式的に決定される。
算するために使用される。第1O図は、第8図のこれら
の自パス基準用のアライメント関係の関数としての累乗
を示す。スキュー角度は、角度が水平の0度指示から相
違する累乗ピークに比例しているので、第1O図のプロ
ットから図式的に決定される。
第10図の三つの破線で示された円弧に注目する。
最も内側の円弧は、基準点が整列されなかった場合に予
測される累乗レベルを示す。次の円弧は、80度にわた
って走査した場合の平均累乗レベルを示す。最も外側の
円弧は、ピーク累乗レベルを示す。これらの円弧は、累
乗計算アルゴリズムにより決定されるように、ピーク累
乗の統計的な特徴を表している。
測される累乗レベルを示す。次の円弧は、80度にわた
って走査した場合の平均累乗レベルを示す。最も外側の
円弧は、ピーク累乗レベルを示す。これらの円弧は、累
乗計算アルゴリズムにより決定されるように、ピーク累
乗の統計的な特徴を表している。
ベアードのようなアライメント方法が、画像の圧縮され
た表現であるグループ4の白バスの位置に対応している
基準点に適用された場合、基礎になる画像においてスキ
ュー角度を決定する効率的で正確な手段が得られる。
た表現であるグループ4の白バスの位置に対応している
基準点に適用された場合、基礎になる画像においてスキ
ュー角度を決定する効率的で正確な手段が得られる。
テスト
CCITTテストデータによる本システムのテストによ
れば、本発明は、殆どの場合にスキュー角度検出特性に
おいて顕著な改善を示している。
れば、本発明は、殆どの場合にスキュー角度検出特性に
おいて顕著な改善を示している。
幾つかのCCITTテストファイル(CC1からCC8
)は、付mlに示されており、ベアードの方法と本方法
との間のスキュー角度検出特性の比較が、第1表に示さ
れている。各個においては、両方のスキュー角度検出ア
ルゴリズムは生のビットマツプに適用され、仮想のスキ
ューしていない画像におけるアルゴリズムにより検出さ
れたスキューの量を決定する。次いて、ビットマツプは
、ディジタル的に、−3,0度から+5.0度まで回転
され、スキュー角度決定が再度実行される。
)は、付mlに示されており、ベアードの方法と本方法
との間のスキュー角度検出特性の比較が、第1表に示さ
れている。各個においては、両方のスキュー角度検出ア
ルゴリズムは生のビットマツプに適用され、仮想のスキ
ューしていない画像におけるアルゴリズムにより検出さ
れたスキューの量を決定する。次いて、ビットマツプは
、ディジタル的に、−3,0度から+5.0度まで回転
され、スキュー角度決定が再度実行される。
第1表
上記テストの注目すべき結果は、テキストであれ非テキ
ストであれ、マークを分類するステップが取り除かれる
ことである。実際、本発明によれば、主に非テキスト的
であるCC2のような画像に対して非常に適切で正確な
結果が得られる。この結果は、スキュー角度が決定され
ている構造に明白に結びついている基準点から出る高い
スキュー角度において特に重要である。
ストであれ、マークを分類するステップが取り除かれる
ことである。実際、本発明によれば、主に非テキスト的
であるCC2のような画像に対して非常に適切で正確な
結果が得られる。この結果は、スキュー角度が決定され
ている構造に明白に結びついている基準点から出る高い
スキュー角度において特に重要である。
ハーフトーン領域はグループ4勧告の非圧縮モードを使
用してエンコードされるべきであり、また、バスコード
の使用に関わりがないので、非直交スクリーン角度での
ハーフトーンの存在は、本発明のアルゴリズムの特性を
劣化させることがない。それにも拘わらず、本技術にお
けるノ)−フトーン材料の存在の効果は未だテストされ
たことがない。
用してエンコードされるべきであり、また、バスコード
の使用に関わりがないので、非直交スクリーン角度での
ハーフトーンの存在は、本発明のアルゴリズムの特性を
劣化させることがない。それにも拘わらず、本技術にお
けるノ)−フトーン材料の存在の効果は未だテストされ
たことがない。
累乗分布の形状の特徴記述は、ページ画像における単純
なスキュー角度の支配に関して有効な一般化を導くこと
ができる。第11図を参照すれば、多重井戸で規定され
たピークは、ソース画像における多重井戸で表されたア
ライメントの指示である。このような多重アライメント
を決定する方法は、単一のアライメントを有する画像の
スキューを決定する方法から実質的に相違がない。
なスキュー角度の支配に関して有効な一般化を導くこと
ができる。第11図を参照すれば、多重井戸で規定され
たピークは、ソース画像における多重井戸で表されたア
ライメントの指示である。このような多重アライメント
を決定する方法は、単一のアライメントを有する画像の
スキューを決定する方法から実質的に相違がない。
本発明は、全ページ画像にわたる主要なスキュー角度に
関して一般化するように設計されている。
関して一般化するように設計されている。
しかし、多重スキュー角度は、広告コピーや不適正に糊
つけされた加工品において生じ得る。このような場合、
依然この技術は全画像について一般化することができ、
この−膜化は、画像の特徴記述において有用であったり
そうでなかったりする。
つけされた加工品において生じ得る。このような場合、
依然この技術は全画像について一般化することができ、
この−膜化は、画像の特徴記述において有用であったり
そうでなかったりする。
相対的なスキュー角度が、広告コピーにおけるように大
きなところでは、ページ画像に対する単一スキュー角度
特性の指定は意味がないけれども、糊つけエラーの場合
には、単一スキュー角度決定は、単なる単純な利用可能
な手段と同様に、画像を表すのには十分である。
きなところでは、ページ画像に対する単一スキュー角度
特性の指定は意味がないけれども、糊つけエラーの場合
には、単一スキュー角度決定は、単なる単純な利用可能
な手段と同様に、画像を表すのには十分である。
このように、本発明は、スキュー角度を決定する目的の
ために、画像の特徴、特に地形的な特徴を、位置決めし
、選択して利用するための方法を開示している。本発明
は、従来技術で詳細に述べられた方法よりもずっと計算
が簡単になる。本発明はまた、安価なデータ圧縮パッケ
ージの広い範囲の利用及びこれらのパッケージを一つの
システムに統合する簡単さの点で有利である。
ために、画像の特徴、特に地形的な特徴を、位置決めし
、選択して利用するための方法を開示している。本発明
は、従来技術で詳細に述べられた方法よりもずっと計算
が簡単になる。本発明はまた、安価なデータ圧縮パッケ
ージの広い範囲の利用及びこれらのパッケージを一つの
システムに統合する簡単さの点で有利である。
一般に、本発明に関連する当業者にとって、本発明の構
造上の種々の変更、種々に異なった実施態様及び応用が
、本発明の精神及び範囲から離れることなくなしつる。
造上の種々の変更、種々に異なった実施態様及び応用が
、本発明の精神及び範囲から離れることなくなしつる。
このように、ここでの開示及び記述は、例を挙げて説明
されたが、これに限定する意図はないものである。
されたが、これに限定する意図はないものである。
第1A図は、従来技術の一つの方法によるスキューして
いない画像上の基準点の位置を示す。 第1B図は、前記従来技術の方法によるスキューした画
像上の基準点の位置を、整列していないビンへの基準点
の分布のプロットとともに示す。 第1C図は、第1B図に示される同じスキューした画像
上の基準点の位置を、整列したビンへの基準点の分布の
プロットとともに示す。 第2図は、本発明のスキュー角度決定方法による動作が
可能なコンピュータシステムの一部を示す。 第3A図から第3C図は、CCITTグループ4圧縮規
格の三つのエンコードモードを示す。 第4A図及び第4B図は、それぞれスキューしていない
及びスキューしたテキストでのCCITTグループ4圧
縮規格のバスコードに基づいた基準点の位置を示す。 第5A図及び第5B図は、それぞれスキューしていない
及びスキューしたテキストでのCCITTグループ4圧
縮規格のバスコードからの白バスコードに基づいた基準
点の位置を示す。 第6図は、本発明の一つの観点の流れ図を示す。 第7図は、本発明の他の観点の流れ図を示す。 第8図は、本発明の一つの観点の例として使用されたス
キューしたテキストの一部を示す。 第9図は、本発明によるアライメント決定に使用された
第8図のサンプルテキストに対応した白バスコードの位
置を示す。 第10図は、第8図のサンプルのスキューしたテキスト
に対応したアライメントの累乗のプロットを示す。 第11図は、多重スキュー角度を有するテキストに対応
したアライメントの累乗のプロットを示す。 50:コンピュータシステム
いない画像上の基準点の位置を示す。 第1B図は、前記従来技術の方法によるスキューした画
像上の基準点の位置を、整列していないビンへの基準点
の分布のプロットとともに示す。 第1C図は、第1B図に示される同じスキューした画像
上の基準点の位置を、整列したビンへの基準点の分布の
プロットとともに示す。 第2図は、本発明のスキュー角度決定方法による動作が
可能なコンピュータシステムの一部を示す。 第3A図から第3C図は、CCITTグループ4圧縮規
格の三つのエンコードモードを示す。 第4A図及び第4B図は、それぞれスキューしていない
及びスキューしたテキストでのCCITTグループ4圧
縮規格のバスコードに基づいた基準点の位置を示す。 第5A図及び第5B図は、それぞれスキューしていない
及びスキューしたテキストでのCCITTグループ4圧
縮規格のバスコードからの白バスコードに基づいた基準
点の位置を示す。 第6図は、本発明の一つの観点の流れ図を示す。 第7図は、本発明の他の観点の流れ図を示す。 第8図は、本発明の一つの観点の例として使用されたス
キューしたテキストの一部を示す。 第9図は、本発明によるアライメント決定に使用された
第8図のサンプルテキストに対応した白バスコードの位
置を示す。 第10図は、第8図のサンプルのスキューしたテキスト
に対応したアライメントの累乗のプロットを示す。 第11図は、多重スキュー角度を有するテキストに対応
したアライメントの累乗のプロットを示す。 50:コンピュータシステム
Claims (1)
- 【特許請求の範囲】 1、スキュー角度が一連のアライメントの選択された一
つに対応する角度として決定され、各アライメントが選
択に基づいた関連する累乗を有し、各アライメントの累
乗がそのアライメント毎に選択された特徴のライン当た
りのカウントから計算され、画像データがピクセルカラ
ー変化のポイントの表示を含んでいる、画像のスキュー
角度を決定する方法であって、 ピクセルカラー変化の前記ポイントの選択されたポイン
トを前記選択された特徴として選択する工程と; アライメントを選択する工程と; 前記アライメント毎にピクセルカラー変化の前記選択さ
れたポイントの位置を決定する工程ピクセルカラー変化
の前記選択されたポイントの位置から前記アライメント
の累乗を計算する工程と; を含む方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US454339 | 1989-12-21 | ||
| US07/454,339 US5245676A (en) | 1989-12-21 | 1989-12-21 | Determination of image skew angle from data including data in compressed form |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH03201866A true JPH03201866A (ja) | 1991-09-03 |
| JP3390000B2 JP3390000B2 (ja) | 2003-03-24 |
Family
ID=23804223
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP34121190A Expired - Fee Related JP3390000B2 (ja) | 1989-12-21 | 1990-11-30 | 画像の分析方法 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US5245676A (ja) |
| EP (1) | EP0434415B1 (ja) |
| JP (1) | JP3390000B2 (ja) |
| DE (1) | DE69032344T2 (ja) |
Families Citing this family (42)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5979768A (en) * | 1988-01-14 | 1999-11-09 | Intermec I.P. Corp. | Enhanced bar code resolution through relative movement of sensor and object |
| US6688523B1 (en) | 1988-08-31 | 2004-02-10 | Intermec Ip Corp. | System for reading optical indicia |
| US6889903B1 (en) | 1988-08-31 | 2005-05-10 | Intermec Ip Corp. | Method and apparatus for optically reading information |
| US6681994B1 (en) | 1988-08-31 | 2004-01-27 | Intermec Ip Corp. | Method and apparatus for optically reading information |
| US5245676A (en) * | 1989-12-21 | 1993-09-14 | Xerox Corporation | Determination of image skew angle from data including data in compressed form |
| US6373997B1 (en) | 1991-07-30 | 2002-04-16 | Xerox Corporation | Coarse and fine skew measurement |
| JP3238504B2 (ja) * | 1991-12-05 | 2001-12-17 | ゼロックス・コーポレーション | 書類分類方法 |
| JP3233981B2 (ja) * | 1992-05-26 | 2001-12-04 | オリンパス光学工業株式会社 | シンボル情報読取装置 |
| JP3253356B2 (ja) * | 1992-07-06 | 2002-02-04 | 株式会社リコー | 文書画像の領域識別方法 |
| GB2273383A (en) * | 1992-12-10 | 1994-06-15 | Ibm | Character recognition |
| JP3050007B2 (ja) * | 1993-08-26 | 2000-06-05 | ミノルタ株式会社 | 画像読取装置およびこれを備えた画像形成装置 |
| US5410417A (en) * | 1994-02-10 | 1995-04-25 | Motorola, Inc. | Method and apparatus for correcting an angle of an optical image for improving the efficiency of facsimile encoding of the image |
| EP0811946A3 (en) * | 1994-04-15 | 1998-01-14 | Canon Kabushiki Kaisha | Image pre-processor for character recognition system |
| US5638466A (en) * | 1995-08-30 | 1997-06-10 | Horizon Marketing Corporation Aka Wordwand | Method and apparatus for deskewing images of symbols having a non-linear baseline |
| JP3006466B2 (ja) | 1995-09-28 | 2000-02-07 | 日本電気株式会社 | 文字入力装置 |
| US5867612A (en) * | 1996-03-27 | 1999-02-02 | Xerox Corporation | Method and apparatus for the fast scaling of an image |
| US5901253A (en) * | 1996-04-04 | 1999-05-04 | Hewlett-Packard Company | Image processing system with image cropping and skew correction |
| US6104834A (en) | 1996-08-01 | 2000-08-15 | Ricoh Company Limited | Matching CCITT compressed document images |
| GB9711022D0 (en) | 1997-05-28 | 1997-07-23 | Rank Xerox Ltd | Text/image selection from document images |
| JP3471578B2 (ja) | 1997-08-29 | 2003-12-02 | シャープ株式会社 | 行方向判定装置、画像傾き検出装置及び画像傾き補正装置 |
| KR100264331B1 (ko) * | 1998-05-26 | 2000-08-16 | 윤종용 | 원고 비틀림 보정 장치 및 방법 |
| US6549680B1 (en) * | 1998-06-23 | 2003-04-15 | Xerox Corporation | Method and apparatus for deskewing and despeckling of images |
| US7305617B2 (en) * | 2000-02-12 | 2007-12-04 | Adobe Systems Incorporated | Method for aligning text to baseline grids and to CJK character grids |
| JP2002358514A (ja) | 2000-12-14 | 2002-12-13 | Ricoh Co Ltd | 画像歪み補正装置、プログラム、記憶媒体、画像歪み補正方法、画像読取装置および画像形成装置 |
| JP2003115039A (ja) | 2001-07-11 | 2003-04-18 | Ricoh Co Ltd | 文書ファイリング装置、文書ファイリング方法、プログラムおよび記憶媒体 |
| US7206104B2 (en) * | 2002-02-12 | 2007-04-17 | Chun-Hung Lee | Method for automatically determining document position in a scanner window |
| US7499806B2 (en) * | 2002-02-14 | 2009-03-03 | Illumina, Inc. | Image processing in microsphere arrays |
| US7305612B2 (en) * | 2003-03-31 | 2007-12-04 | Siemens Corporate Research, Inc. | Systems and methods for automatic form segmentation for raster-based passive electronic documents |
| US6914700B2 (en) | 2003-04-17 | 2005-07-05 | Lexmark International, Inc. | Method for reducing migrating residual error in error diffusion halftoning |
| TWI236838B (en) * | 2004-04-22 | 2005-07-21 | Avision Inc | Image acquisition device and method capable of rotating document images |
| US20060039627A1 (en) * | 2004-08-21 | 2006-02-23 | Xerox Corporation | Real-time processing of grayscale image data |
| US7515772B2 (en) * | 2004-08-21 | 2009-04-07 | Xerox Corp | Document registration and skew detection system |
| US7391930B2 (en) * | 2004-12-17 | 2008-06-24 | Primax Electronics Ltd. | Angle de-skew device and method thereof |
| US8023155B2 (en) * | 2005-03-31 | 2011-09-20 | Hubin Jiang | Imaging system with quality audit capability |
| NO20052656D0 (no) | 2005-06-02 | 2005-06-02 | Lumex As | Geometrisk bildetransformasjon basert pa tekstlinjesoking |
| US8116550B2 (en) * | 2006-12-20 | 2012-02-14 | Cytyc Corporation | Method and system for locating and focusing on fiducial marks on specimen slides |
| US8160393B2 (en) * | 2008-09-18 | 2012-04-17 | Certifi Media Inc. | Method for image skew detection |
| WO2011001439A2 (en) | 2009-07-02 | 2011-01-06 | Hewlett-Packard Development Company, L.P. | Skew detection |
| KR101621848B1 (ko) * | 2009-12-14 | 2016-06-01 | 삼성전자주식회사 | 화상처리장치 및 방법 |
| JP6642833B2 (ja) * | 2016-10-28 | 2020-02-12 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
| WO2018143950A1 (en) * | 2017-01-31 | 2018-08-09 | Hewlett-Packard Development Company, L.P. | Direct memory access based hardware deskew |
| US11455762B2 (en) * | 2017-12-14 | 2022-09-27 | Adobe Inc. | Text border tool and enhanced corner options for background shading |
Family Cites Families (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3831146A (en) * | 1973-03-19 | 1974-08-20 | Ibm | Optimum scan angle determining means |
| US4251799A (en) * | 1979-03-30 | 1981-02-17 | International Business Machines Corporation | Optical character recognition using baseline information |
| EP0020897B1 (de) * | 1979-06-26 | 1983-11-16 | International Business Machines Corporation | Vorrichtung zur Bestimmung des optimalen Abtastwinkels von Druckschriften |
| JPS5887652A (ja) * | 1981-11-19 | 1983-05-25 | Ricoh Co Ltd | 画像処理装置 |
| JPS58134368A (ja) * | 1982-02-05 | 1983-08-10 | Ricoh Co Ltd | 文書画像処理装置 |
| US4558461A (en) * | 1983-06-17 | 1985-12-10 | Litton Systems, Inc. | Text line bounding system |
| US4723297A (en) * | 1984-09-27 | 1988-02-02 | Siemens Aktiengesellschaft | Method for automatic correction of character skew in the acquisition of a text original in the form of digital scan results |
| JPS62267610A (ja) * | 1986-05-16 | 1987-11-20 | Fuji Electric Co Ltd | 対象パタ−ンの回転角検出方式 |
| US4876730A (en) * | 1987-02-25 | 1989-10-24 | Lundy Electronics & Systems, Inc. | Optical character reader with skew recognition |
| JPS63268081A (ja) * | 1987-04-17 | 1988-11-04 | インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション | 文書の文字を認識する方法及び装置 |
| JPS6478381A (en) * | 1987-09-21 | 1989-03-23 | Toshiba Corp | Picture processing method |
| JPS6482286A (en) * | 1987-09-25 | 1989-03-28 | Toshiba Corp | Image inclination detector |
| WO1989005495A1 (en) * | 1987-12-02 | 1989-06-15 | Eastman Kodak Company | Skew detector for digital image processing system |
| US4866784A (en) * | 1987-12-02 | 1989-09-12 | Eastman Kodak Company | Skew detector for digital image processing system |
| US5001766A (en) * | 1988-05-16 | 1991-03-19 | At&T Bell Laboratories | Apparatus and method for skew control of document images |
| US5187753A (en) * | 1989-12-08 | 1993-02-16 | Xerox Corporation | Method and apparatus for identification and correction of document skew |
| US5245676A (en) * | 1989-12-21 | 1993-09-14 | Xerox Corporation | Determination of image skew angle from data including data in compressed form |
-
1989
- 1989-12-21 US US07/454,339 patent/US5245676A/en not_active Expired - Fee Related
-
1990
- 1990-11-30 JP JP34121190A patent/JP3390000B2/ja not_active Expired - Fee Related
- 1990-12-20 EP EP90313970A patent/EP0434415B1/en not_active Expired - Lifetime
- 1990-12-20 DE DE69032344T patent/DE69032344T2/de not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| EP0434415B1 (en) | 1998-05-27 |
| DE69032344T2 (de) | 1998-12-03 |
| US5245676A (en) | 1993-09-14 |
| DE69032344D1 (de) | 1998-07-02 |
| EP0434415A2 (en) | 1991-06-26 |
| JP3390000B2 (ja) | 2003-03-24 |
| EP0434415A3 (en) | 1991-11-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH03201866A (ja) | 圧縮形態のデータを含むデータから画像スキュー角度を決定する方法 | |
| US5506918A (en) | Document skew detection/control system for printed document images containing a mixture of pure text lines and non-text portions | |
| US6738154B1 (en) | Locating the position and orientation of multiple objects with a smart platen | |
| JP4101290B2 (ja) | 書式処理時の自動ページ登録及び自動領域検出のためのシステム及び方法 | |
| US5778092A (en) | Method and apparatus for compressing color or gray scale documents | |
| US5854853A (en) | Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks | |
| JP2986383B2 (ja) | ライン走査画像のためのスキューを補正する方法及びその装置 | |
| US6956587B1 (en) | Method of automatically cropping and adjusting scanned images | |
| US5452374A (en) | Skew detection and correction of a document image representation | |
| US7567708B2 (en) | Apparatus and method for image processing | |
| JP3883696B2 (ja) | 多数の写真をスキャンしかつ検出するとともに人工エッジを除去するための方法 | |
| US5892854A (en) | Automatic image registration using binary moments | |
| EP1091320A2 (en) | Processing multiple digital images | |
| JPH07192086A (ja) | 画像傾き検出方法 | |
| JP4419269B2 (ja) | 二次元コード抽出方法 | |
| EP1081648B1 (en) | Method for processing a digital image | |
| JPH05250409A (ja) | ページ方向の高速検出 | |
| US6771842B1 (en) | Document image skew detection method | |
| JP3238504B2 (ja) | 書類分類方法 | |
| US5467410A (en) | Identification of a blank page in an image processing system | |
| JP3209746B2 (ja) | 文字認識システムで用いる文字位置確認装置および方法 | |
| US20100177959A1 (en) | Color form dropout using dynamic geometric solid thresholding | |
| Farrow et al. | Detecting the skew angle in document images | |
| JP3303246B2 (ja) | 画像処理装置 | |
| JPS6325391B2 (ja) |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |