JPH06243292A - 光学的文字認識方法及びその装置 - Google Patents
光学的文字認識方法及びその装置Info
- Publication number
- JPH06243292A JPH06243292A JP5333347A JP33334793A JPH06243292A JP H06243292 A JPH06243292 A JP H06243292A JP 5333347 A JP5333347 A JP 5333347A JP 33334793 A JP33334793 A JP 33334793A JP H06243292 A JPH06243292 A JP H06243292A
- Authority
- JP
- Japan
- Prior art keywords
- color
- character
- ratio
- unknown character
- unknown
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/224—Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
- G06V10/12—Details of acquisition arrangements; Constructional details thereof
- G06V10/14—Optical characteristics of the device performing the acquisition or on the illumination arrangements
- G06V10/143—Sensing or illuminating at different wavelengths
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】 (修正有)
【目的】 複数の既知の文字の中から未知の文字を光学
的に識別する方法及び装置を提供すること。 【構成】 各既知の文字は、予め選択された比率の優勢
色と劣勢色を有している。未知の文字は、少なくとも1
つの幾何学的特徴並びに優勢色及び劣勢色を含む複数の
画素を有する。本発明の方法及び装置は、未知の文字の
少なくとも1つの幾何学的特徴の検査を含み、それによ
って未知の文字に対して、仮定的アイデンティティが作
られる。未知の文字の複数の画素の一部がサンプリング
され、且つサンプリングされた部分に含まれる優勢色と
劣勢色との比率が決定される。決定された比率が、仮定
的アイデンティティに対応する既知の文字の予め選択さ
れた比率と比較される。決定された比率が、仮定的アイ
デンティティに対応する既知の文字の予め選択された比
率の所定の範囲内にあれば、その仮定的アイデンティテ
ィが未知の文字に対して割り当てられる。
的に識別する方法及び装置を提供すること。 【構成】 各既知の文字は、予め選択された比率の優勢
色と劣勢色を有している。未知の文字は、少なくとも1
つの幾何学的特徴並びに優勢色及び劣勢色を含む複数の
画素を有する。本発明の方法及び装置は、未知の文字の
少なくとも1つの幾何学的特徴の検査を含み、それによ
って未知の文字に対して、仮定的アイデンティティが作
られる。未知の文字の複数の画素の一部がサンプリング
され、且つサンプリングされた部分に含まれる優勢色と
劣勢色との比率が決定される。決定された比率が、仮定
的アイデンティティに対応する既知の文字の予め選択さ
れた比率と比較される。決定された比率が、仮定的アイ
デンティティに対応する既知の文字の予め選択された比
率の所定の範囲内にあれば、その仮定的アイデンティテ
ィが未知の文字に対して割り当てられる。
Description
【0001】
【産業上の利用分野】本発明は、広くは光学的文字認
識、即ちOCRに関し、特に、異なるカラー(色)属性
を有する文字の光学的文字認識のための方法及び装置に
関するものである。さらに特定するならば、本発明は、
幾何学的OCR技術及びカラー・コード化OCR技術の
双方を用いて、異なるカラー属性を有する文字の光学的
文字認識のための方法及び装置に関するものである。
識、即ちOCRに関し、特に、異なるカラー(色)属性
を有する文字の光学的文字認識のための方法及び装置に
関するものである。さらに特定するならば、本発明は、
幾何学的OCR技術及びカラー・コード化OCR技術の
双方を用いて、異なるカラー属性を有する文字の光学的
文字認識のための方法及び装置に関するものである。
【0002】
【従来の技術】光学的文字認識、即ちOCR(optical
character recognition)は、図形文字を識別するため
に光学的手段を利用する文字認識のための技術である。
解析または処理を行うデータをデータ処理システムに入
力するために、光学的走査装置(光学スキャナ)または
光学読取り装置等の装置を用いることができる。文書の
「走査(Scanning)」によって通常ビット・マップが作
られる。これは、画像全体を2値形式による画素単位で
表現したものである。ビット・マップは、例えば、ペイ
ンティング・アプリケーションや画像編集ソフトウェア
を用いて処理される。一方、ビット・マップ画像がテキ
ストを含んでいる場合、そのテキストについては、ワー
ドプロセッサや表計算アプリケーションを用いて編集し
たり、アクセスしたりすることができない。なぜなら、
これらのアプリケーションは、ビット・マップ形式のデ
ータ中のテキストを認識しないからである。通常、ワー
ドプロセッサや表計算アプリケーションは、ASCII
(American Standard Code for Information Interchan
ge)と呼ばれるコードを用いることによってアルファベ
ット及び数字を認識する。その結果、ユーザがビット・
マップ形式におけるテキストを処理したい場合、走査さ
れたテキストを、ワードプロセッサや表計算アプリケー
ションにより編集可能な形式に変換しなければならな
い。OCR技術は、しばしばビット・マップ形式のテキ
ストをワードプロセッサや表計算アプリケーションによ
り利用可能な形式に変換するために利用される。
character recognition)は、図形文字を識別するため
に光学的手段を利用する文字認識のための技術である。
解析または処理を行うデータをデータ処理システムに入
力するために、光学的走査装置(光学スキャナ)または
光学読取り装置等の装置を用いることができる。文書の
「走査(Scanning)」によって通常ビット・マップが作
られる。これは、画像全体を2値形式による画素単位で
表現したものである。ビット・マップは、例えば、ペイ
ンティング・アプリケーションや画像編集ソフトウェア
を用いて処理される。一方、ビット・マップ画像がテキ
ストを含んでいる場合、そのテキストについては、ワー
ドプロセッサや表計算アプリケーションを用いて編集し
たり、アクセスしたりすることができない。なぜなら、
これらのアプリケーションは、ビット・マップ形式のデ
ータ中のテキストを認識しないからである。通常、ワー
ドプロセッサや表計算アプリケーションは、ASCII
(American Standard Code for Information Interchan
ge)と呼ばれるコードを用いることによってアルファベ
ット及び数字を認識する。その結果、ユーザがビット・
マップ形式におけるテキストを処理したい場合、走査さ
れたテキストを、ワードプロセッサや表計算アプリケー
ションにより編集可能な形式に変換しなければならな
い。OCR技術は、しばしばビット・マップ形式のテキ
ストをワードプロセッサや表計算アプリケーションによ
り利用可能な形式に変換するために利用される。
【0003】汎用的なOCR技術は、2つの主な範疇に
分けられる。即ち(1)幾何学的OCR、または(2)
カラー・コード化OCRである。第1の技術である幾何
学的OCRは、画素またはドットの集まりである文字の
形状または幾何学的表現に基づいて文字を認識しようと
する。ここで「文字(character)」とは、光学スキャ
ナや光学読取り装置等のOCR装置によって、または人
間が読み取ることによって認識可能な印刷された記号も
しくは書かれた記号を含む意味で用いられている。この
文字は、アルファベットまたはアイコンでもよい。さら
に、「画素」及び「ドット」という用語は、OCR装置
によって認識可能な顕著なポイントを記述するために互
換的に用いられる。たとえ文字が多くの色によって表現
されている場合であっても、形状解析を行う前にそれら
の多くの色は黒またはグレー・スケールに変換される。
幾何学的OCRの手法によれば99.5%という高い認
識確度が得られるが、それでも尚、文字形状の欠陥及び
文字形状の多様性のために認識エラーが生じる。文字形
状の欠陥とは、汚れた文字や不適切に作られた文字のこ
とである。文字形状の多様性とは、OCR装置が認識す
るべく設計された文字フォント以外の文字フォントのこ
とである。
分けられる。即ち(1)幾何学的OCR、または(2)
カラー・コード化OCRである。第1の技術である幾何
学的OCRは、画素またはドットの集まりである文字の
形状または幾何学的表現に基づいて文字を認識しようと
する。ここで「文字(character)」とは、光学スキャ
ナや光学読取り装置等のOCR装置によって、または人
間が読み取ることによって認識可能な印刷された記号も
しくは書かれた記号を含む意味で用いられている。この
文字は、アルファベットまたはアイコンでもよい。さら
に、「画素」及び「ドット」という用語は、OCR装置
によって認識可能な顕著なポイントを記述するために互
換的に用いられる。たとえ文字が多くの色によって表現
されている場合であっても、形状解析を行う前にそれら
の多くの色は黒またはグレー・スケールに変換される。
幾何学的OCRの手法によれば99.5%という高い認
識確度が得られるが、それでも尚、文字形状の欠陥及び
文字形状の多様性のために認識エラーが生じる。文字形
状の欠陥とは、汚れた文字や不適切に作られた文字のこ
とである。文字形状の多様性とは、OCR装置が認識す
るべく設計された文字フォント以外の文字フォントのこ
とである。
【0004】第2のOCR技術である、カラー・コード
化OCRは、その文字の色に基づいて文字を認識しよう
とするものである。この手法においては、カラー化画素
が、文字の形状を示すためのみでなく、文字の識別を示
すためにも利用される。例えば、「A」が赤で、「B」
が青で、そして「C」が黄で印刷される。カラー・コー
ド化OCR技術は形状処理を行わないので、幾何学的O
CR技術で通常見られるような形状処理エラーを生じに
くい。しかしながら、カラー・コード化OCR技術は、
カラー処理エラーを生じやすい。そのようなカラー処理
エラーは、インクの色のずれ、不適切な色密度、不適切
な色強度、あるいはカラー光学スキャナの誤操作などの
形態をとる。
化OCRは、その文字の色に基づいて文字を認識しよう
とするものである。この手法においては、カラー化画素
が、文字の形状を示すためのみでなく、文字の識別を示
すためにも利用される。例えば、「A」が赤で、「B」
が青で、そして「C」が黄で印刷される。カラー・コー
ド化OCR技術は形状処理を行わないので、幾何学的O
CR技術で通常見られるような形状処理エラーを生じに
くい。しかしながら、カラー・コード化OCR技術は、
カラー処理エラーを生じやすい。そのようなカラー処理
エラーは、インクの色のずれ、不適切な色密度、不適切
な色強度、あるいはカラー光学スキャナの誤操作などの
形態をとる。
【0005】従って、幾何学的OCR技術における形状
処理エラー及びカラー・コード化OCR技術におけるカ
ラー処理エラーの双方の欠陥を克服した上で、OCR技
術の確度を上げることができる方法及びシステムが望ま
れている。
処理エラー及びカラー・コード化OCR技術におけるカ
ラー処理エラーの双方の欠陥を克服した上で、OCR技
術の確度を上げることができる方法及びシステムが望ま
れている。
【0006】
【発明が解決しようとする課題】本発明の目的は、光学
的文字認識のための改良された方法及びシステムを提供
することである。本発明の別の目的は、異なるカラー属
性を有する文字の光学的認識のための方法及び装置を提
供することである。さらに本発明の別の目的は、幾何学
的OCR技術及びカラー・コード化OCR技術の双方を
用いて、異なるカラー属性を有する文字の光学的認識の
ための方法及び装置を提供することである。
的文字認識のための改良された方法及びシステムを提供
することである。本発明の別の目的は、異なるカラー属
性を有する文字の光学的認識のための方法及び装置を提
供することである。さらに本発明の別の目的は、幾何学
的OCR技術及びカラー・コード化OCR技術の双方を
用いて、異なるカラー属性を有する文字の光学的認識の
ための方法及び装置を提供することである。
【0007】
【課題を解決するための手段】本発明は、複数の既知の
文字の中にある未知の文字の光学的な識別を可能にする
ものである。既知の文字はそれぞれ、予め選択された比
率の優勢色と劣勢色を有している。未知の文字は、少な
くとも1つの幾何学的特徴、並びに優勢色及び劣勢色を
含む複数の画素を有している。本発明の方法及びシステ
ムは、未知の文字の少なくとも1つの幾何学的特徴の検
査を含む。この少なくとも1つの幾何学的特徴の検査に
より、未知の文字の仮定的な正体、即ちアイデンティテ
ィ(identity)が算出される。未知の文字の複数の画素
の一部がサンプリングされ、そしてサンプリングされた
部分の優勢色と劣勢色の比が、そのサンプリングされた
画素から決定される。この決定された比を、仮定的アイ
デンティティに対応する既知の文字に関して予め選択さ
れた比と比較する。この決定された比が、仮定的アイデ
ンティティに対応する既知の文字について予め選択され
た比の所定の範囲内にある場合は、この仮定的アイデン
ティティが未知の文字に充てられる。
文字の中にある未知の文字の光学的な識別を可能にする
ものである。既知の文字はそれぞれ、予め選択された比
率の優勢色と劣勢色を有している。未知の文字は、少な
くとも1つの幾何学的特徴、並びに優勢色及び劣勢色を
含む複数の画素を有している。本発明の方法及びシステ
ムは、未知の文字の少なくとも1つの幾何学的特徴の検
査を含む。この少なくとも1つの幾何学的特徴の検査に
より、未知の文字の仮定的な正体、即ちアイデンティテ
ィ(identity)が算出される。未知の文字の複数の画素
の一部がサンプリングされ、そしてサンプリングされた
部分の優勢色と劣勢色の比が、そのサンプリングされた
画素から決定される。この決定された比を、仮定的アイ
デンティティに対応する既知の文字に関して予め選択さ
れた比と比較する。この決定された比が、仮定的アイデ
ンティティに対応する既知の文字について予め選択され
た比の所定の範囲内にある場合は、この仮定的アイデン
ティティが未知の文字に充てられる。
【0008】
【実施例】図1は、本発明を好適例に従って実施するた
めのデータ処理システムを描いたものである。パーソナ
ル・コンピュータ50は、システム装置52、ビデオ表
示装置54、キーボード56、カラー光学スキャナ5
7、及びマウス58を有する。パーソナル・コンピュー
タ50としては、PS/2コンピュータ等の適切なコン
ピュータを用いることができる。「PS/2」はIntern
ational Business Machines Corporation (IBM)の
登録商標である。図1に示された例はパーソナル・コン
ピュータを含んでいるが、本発明の好適例は、例えば知
的ワークステーションやミニコンピュータ等の他の形式
のデータ処理システムにおいても実施可能である。
めのデータ処理システムを描いたものである。パーソナ
ル・コンピュータ50は、システム装置52、ビデオ表
示装置54、キーボード56、カラー光学スキャナ5
7、及びマウス58を有する。パーソナル・コンピュー
タ50としては、PS/2コンピュータ等の適切なコン
ピュータを用いることができる。「PS/2」はIntern
ational Business Machines Corporation (IBM)の
登録商標である。図1に示された例はパーソナル・コン
ピュータを含んでいるが、本発明の好適例は、例えば知
的ワークステーションやミニコンピュータ等の他の形式
のデータ処理システムにおいても実施可能である。
【0009】図2は、本発明の好適例を実施しているパ
ーソナル・コンピュータ50の中の、選択された構成要
素のブロック図である。好適例ではシステム装置52
は、その中の様々な構成要素間を相互に接続し且つ通信
を行わせるためのシステム・バス60を備えている。マ
イクロプロセッサ62はシステム・バス60に接続さ
れ、また同じくシステム・バス60に接続された数値演
算コプロセッサ64を有していてもよい。システム・バ
ス60としては、IBMによるマイクロチャネル・シス
テム(Maicro Channel system)がある。「マイクロチ
ャネル」は、IBMの登録商標である。さらに直接メモ
リアクセス(DMA)制御装置66がシステム・バス6
0に接続されており、それによって様々な装置が大きな
入出力(I/O)転送の間にマイクロプロセッサ62か
らのサイクルを利用することが可能になる。
ーソナル・コンピュータ50の中の、選択された構成要
素のブロック図である。好適例ではシステム装置52
は、その中の様々な構成要素間を相互に接続し且つ通信
を行わせるためのシステム・バス60を備えている。マ
イクロプロセッサ62はシステム・バス60に接続さ
れ、また同じくシステム・バス60に接続された数値演
算コプロセッサ64を有していてもよい。システム・バ
ス60としては、IBMによるマイクロチャネル・シス
テム(Maicro Channel system)がある。「マイクロチ
ャネル」は、IBMの登録商標である。さらに直接メモ
リアクセス(DMA)制御装置66がシステム・バス6
0に接続されており、それによって様々な装置が大きな
入出力(I/O)転送の間にマイクロプロセッサ62か
らのサイクルを利用することが可能になる。
【0010】読取り専用メモリ(ROM)68及びラン
ダム・アクセス・メモリ(RAM)70もまた、システ
ム・バス60に接続されている。ROM68は、パワー
オン自己検査(POST)及び基本入出力システム(B
IOS)を含んでいる。これらは、ディスク駆動装置及
びキーボード等のハードウェア動作を制御する。ROM
68は、マイクロプロセッサ62のアドレス空間の64
0キロバイトから1メガバイトまでの範囲にマッピング
されている。システム・バス60に接続されているCM
OSRAM72は、システム構成情報を含んでいる。
ダム・アクセス・メモリ(RAM)70もまた、システ
ム・バス60に接続されている。ROM68は、パワー
オン自己検査(POST)及び基本入出力システム(B
IOS)を含んでいる。これらは、ディスク駆動装置及
びキーボード等のハードウェア動作を制御する。ROM
68は、マイクロプロセッサ62のアドレス空間の64
0キロバイトから1メガバイトまでの範囲にマッピング
されている。システム・バス60に接続されているCM
OSRAM72は、システム構成情報を含んでいる。
【0011】さらに、メモリ制御装置74、バス制御装
置76、及び割込み制御装置78もまたシステム・バス
60に接続されており、これらは、システム・バス60
を介した様々な周辺装置、アダプタ、及びデバイス間の
データ流れの制御を補助している。システム装置52
は、さらに様々な入出力制御装置を備えている。即ち、
キーボード及びマウス制御装置80、ビデオ制御装置8
2、パラレル制御装置84、シリアル制御装置86、及
びディスケット制御装置88等である。キーボード及び
マウス制御装置80は、キーボード90及びマウス92
のためのハードウェア・インターフェースを行う。ビデ
オ制御装置82は、ビデオ表示装置94のためのハード
ウェア・インターフェースを行う。パラレル制御装置8
4は、プリンタ96等のためのハードウェア・インター
フェースを行う。シリアル制御装置86は、モデム98
等のためのハードウェア・インターフェースを行う。デ
ィスケット制御装置88は、フロッピーディスク装置1
00のためのハードウェア・インターフェースを行う。
さらにディスク制御装置102等の拡張カードをシステ
ム・バス60に追加することが可能であり、これはハー
ドディスク装置104のためのハードウェア・インター
フェースを行う。空スロット106は、他の周辺装置、
アダプタ、及びデバイスをシステム装置52に追加でき
るように設けられている。空スロット106に、カラー
光学スキャナ57等の走査装置を制御するためのアダプ
タを設けてもよい。
置76、及び割込み制御装置78もまたシステム・バス
60に接続されており、これらは、システム・バス60
を介した様々な周辺装置、アダプタ、及びデバイス間の
データ流れの制御を補助している。システム装置52
は、さらに様々な入出力制御装置を備えている。即ち、
キーボード及びマウス制御装置80、ビデオ制御装置8
2、パラレル制御装置84、シリアル制御装置86、及
びディスケット制御装置88等である。キーボード及び
マウス制御装置80は、キーボード90及びマウス92
のためのハードウェア・インターフェースを行う。ビデ
オ制御装置82は、ビデオ表示装置94のためのハード
ウェア・インターフェースを行う。パラレル制御装置8
4は、プリンタ96等のためのハードウェア・インター
フェースを行う。シリアル制御装置86は、モデム98
等のためのハードウェア・インターフェースを行う。デ
ィスケット制御装置88は、フロッピーディスク装置1
00のためのハードウェア・インターフェースを行う。
さらにディスク制御装置102等の拡張カードをシステ
ム・バス60に追加することが可能であり、これはハー
ドディスク装置104のためのハードウェア・インター
フェースを行う。空スロット106は、他の周辺装置、
アダプタ、及びデバイスをシステム装置52に追加でき
るように設けられている。空スロット106に、カラー
光学スキャナ57等の走査装置を制御するためのアダプ
タを設けてもよい。
【0012】当業者であれば、図2に示されたハードウ
ェアが特定のアプリケーションのために変形可能である
ことは自明であろう。例えば、光学ディスク媒体、音響
アダプタ、PALやEPROM等のチップ・プログラミ
ング・デバイス等々を、図2に示したハードウェアに追
加したり、置き換えたりして利用することもできる。
ェアが特定のアプリケーションのために変形可能である
ことは自明であろう。例えば、光学ディスク媒体、音響
アダプタ、PALやEPROM等のチップ・プログラミ
ング・デバイス等々を、図2に示したハードウェアに追
加したり、置き換えたりして利用することもできる。
【0013】本発明は、識別する未知の文字に含まれる
劣勢色の優勢色に対する一定の比を用いて、未知の文字
を識別するための方法及び装置を提供する。この比のデ
ータは、未知の文字を識別するべく指定された信頼度に
到達するために必要なサンプルの寸法を縮小するために
利用することができる。その結果、信頼度レベルに到達
することに関連する手順を簡略化することができる。本
発明の好適例においては、劣勢色は文字の中のいずれの
位置にも無作為に配置されている。文字の大きさを変え
ることにより人間にとって劣勢色が見え易くなる場合、
この劣勢色の配置は、比例フォントベースの文字につい
て特に重要である。
劣勢色の優勢色に対する一定の比を用いて、未知の文字
を識別するための方法及び装置を提供する。この比のデ
ータは、未知の文字を識別するべく指定された信頼度に
到達するために必要なサンプルの寸法を縮小するために
利用することができる。その結果、信頼度レベルに到達
することに関連する手順を簡略化することができる。本
発明の好適例においては、劣勢色は文字の中のいずれの
位置にも無作為に配置されている。文字の大きさを変え
ることにより人間にとって劣勢色が見え易くなる場合、
この劣勢色の配置は、比例フォントベースの文字につい
て特に重要である。
【0014】未知の文字の中の優勢色の画素の属性を、
OCRにより判別可能な劣勢色の画素の属性と交錯させ
る技術が、本発明の好適例において利用される。本発明
の好適例においては、劣勢色の画素は、OCR装置また
はプログラムにより判別可能であればよく、人間の感知
により判別可能である必要はない。その文字は、人間の
目には単色として感知されることが好ましい。本発明
は、周知の技術である確率的技法を用いて、未知の文字
の推定される正体、即ち仮定もしくは仮定的なアイデン
ティティを決定し、その後、劣勢色の比率についての情
報を利用して試験のために適切な少数の無作為サンプル
を選ぶ。その後、画素のサンプリングを経てこの仮定が
試験される。結果的に、各未知の文字についての通常の
幾何学的情報が、仮定を設けるために利用される。この
仮定に対して、幾何学的情報を用いて確率が計算され
る。この仮定は、カラー・コード化OCR解析を用いて
確認されるか、または否定される。本発明の好適例にお
いては、カラー属性は無作為サンプルから検知され、そ
してこの無作為サンプルの解析は、幾何学的OCR解析
により作られた仮定を確認するか、または否定するため
の根拠としての役割をする。
OCRにより判別可能な劣勢色の画素の属性と交錯させ
る技術が、本発明の好適例において利用される。本発明
の好適例においては、劣勢色の画素は、OCR装置また
はプログラムにより判別可能であればよく、人間の感知
により判別可能である必要はない。その文字は、人間の
目には単色として感知されることが好ましい。本発明
は、周知の技術である確率的技法を用いて、未知の文字
の推定される正体、即ち仮定もしくは仮定的なアイデン
ティティを決定し、その後、劣勢色の比率についての情
報を利用して試験のために適切な少数の無作為サンプル
を選ぶ。その後、画素のサンプリングを経てこの仮定が
試験される。結果的に、各未知の文字についての通常の
幾何学的情報が、仮定を設けるために利用される。この
仮定に対して、幾何学的情報を用いて確率が計算され
る。この仮定は、カラー・コード化OCR解析を用いて
確認されるか、または否定される。本発明の好適例にお
いては、カラー属性は無作為サンプルから検知され、そ
してこの無作為サンプルの解析は、幾何学的OCR解析
により作られた仮定を確認するか、または否定するため
の根拠としての役割をする。
【0015】例えば、未知の文字に関する幾何学的OC
R解析は、その未知の文字が「A」であるという90%
の信頼度もしくは確率を算出する。この仮定には、その
記号がアルファベット「A」であるという空(null)仮
定(H0)と、その未知の文字が「A」ではないという
代替(alternate)仮定(H1)が含まれる。カラー・
コード化OCR解析から得られる信頼度ファクタ(確
率)は、空仮定または代替仮定のいずれかを選択するた
めに利用される。
R解析は、その未知の文字が「A」であるという90%
の信頼度もしくは確率を算出する。この仮定には、その
記号がアルファベット「A」であるという空(null)仮
定(H0)と、その未知の文字が「A」ではないという
代替(alternate)仮定(H1)が含まれる。カラー・
コード化OCR解析から得られる信頼度ファクタ(確
率)は、空仮定または代替仮定のいずれかを選択するた
めに利用される。
【0016】次に、未知の文字を構成する画素が、劣勢
色の画素を探査するために無作為にサンプリングされ
る。そして、所定のレベルの信頼度に対して空仮定を確
認するためにこれを利用できる。ここで、アルファベッ
ト「A」が1000個の画素から構成され、且つ劣勢色
である青が優勢色である黒と交錯するように決められて
いると仮定する。従来、指定されたレベルに対して空仮
定を確認するために十分な青の画素を検知するには、O
CRプロセスにおいて多数の無作為サンプルを必要とし
た。本発明の好適例においては、その文字に関する劣勢
色の画素(即ち、青)の比率が、統計的に期待される青
の画素の数を検知するために必要なサンプル寸法を縮小
するために利用される。サンプル中における優勢色の画
素に対する劣勢色の画素の比が、表中で予め選択された
比と比較される。サンプリング画素から決められた計算
による比と、仮定されたアイデンティティから決められ
た表の比との間の相関が、その仮定を受け入れるか、あ
るいは否定するかを決定するために利用される。
色の画素を探査するために無作為にサンプリングされ
る。そして、所定のレベルの信頼度に対して空仮定を確
認するためにこれを利用できる。ここで、アルファベッ
ト「A」が1000個の画素から構成され、且つ劣勢色
である青が優勢色である黒と交錯するように決められて
いると仮定する。従来、指定されたレベルに対して空仮
定を確認するために十分な青の画素を検知するには、O
CRプロセスにおいて多数の無作為サンプルを必要とし
た。本発明の好適例においては、その文字に関する劣勢
色の画素(即ち、青)の比率が、統計的に期待される青
の画素の数を検知するために必要なサンプル寸法を縮小
するために利用される。サンプル中における優勢色の画
素に対する劣勢色の画素の比が、表中で予め選択された
比と比較される。サンプリング画素から決められた計算
による比と、仮定されたアイデンティティから決められ
た表の比との間の相関が、その仮定を受け入れるか、あ
るいは否定するかを決定するために利用される。
【0017】例えば、アルファベット「A」が、予め選
択された比10%の劣勢色画素を有するとする。未知の
文字に含まれる画素の無作為サンプリングの結果、1
1.5%の比が得られたとする。これら2つの数の間の
相関が、未知の文字が本当にアルファベット「A」であ
る確率を決定するために利用される。仮定により示され
た未知の文字のアイデンティティは、受け入れられる
か、あるいは否定されるまでは、「仮定的アイデンティ
ティ」と呼ばれる。サンプリングされた劣勢色青の画素
の比が、予め選択された比から所定の範囲、例えば±2
%の外に逸れている場合、この仮定は否定される。本発
明の好適例において利用されるアプリケーションや走査
装置等のファクタによって、様々な範囲を選択可能であ
る。
択された比10%の劣勢色画素を有するとする。未知の
文字に含まれる画素の無作為サンプリングの結果、1
1.5%の比が得られたとする。これら2つの数の間の
相関が、未知の文字が本当にアルファベット「A」であ
る確率を決定するために利用される。仮定により示され
た未知の文字のアイデンティティは、受け入れられる
か、あるいは否定されるまでは、「仮定的アイデンティ
ティ」と呼ばれる。サンプリングされた劣勢色青の画素
の比が、予め選択された比から所定の範囲、例えば±2
%の外に逸れている場合、この仮定は否定される。本発
明の好適例において利用されるアプリケーションや走査
装置等のファクタによって、様々な範囲を選択可能であ
る。
【0018】次に図3は、サンプリング領域500内の
3個の文字「T」501、「H」511、「E」521
からなる単語「THE」の表現を本発明の好適例によっ
て示している。優勢色及び劣勢色のコード化技術によ
り、各文字が未知の文字に関係する優勢色及び未知の文
字に関係する劣勢色によって表されている。優勢色は、
人間でも容易に判別可能である。劣勢色は、優勢色と結
合し、絡み合い、混ざり合い、もしくは重なり合う。劣
勢色は、人間には判別不能であるが、カラー・スキャナ
によって判別可能であることが好ましい。例えば、
「T」501、「H」511、「E」521の字体は、
全て優勢色、即ち黒から構成されている。優勢色である
黒は、人間の読み手によって判別可能であり、従ってこ
の文字は人間に対して黒に見える。
3個の文字「T」501、「H」511、「E」521
からなる単語「THE」の表現を本発明の好適例によっ
て示している。優勢色及び劣勢色のコード化技術によ
り、各文字が未知の文字に関係する優勢色及び未知の文
字に関係する劣勢色によって表されている。優勢色は、
人間でも容易に判別可能である。劣勢色は、優勢色と結
合し、絡み合い、混ざり合い、もしくは重なり合う。劣
勢色は、人間には判別不能であるが、カラー・スキャナ
によって判別可能であることが好ましい。例えば、
「T」501、「H」511、「E」521の字体は、
全て優勢色、即ち黒から構成されている。優勢色である
黒は、人間の読み手によって判別可能であり、従ってこ
の文字は人間に対して黒に見える。
【0019】文字「T」501の字体の一部を拡大した
図503は、劣勢色505を示しており、これは文字
「T」501に関係するカラー、赤から構成されてい
る。劣勢色505は人間には判別不能であるが、カラー
・スキャナによって判別可能である。劣勢色505はま
た、優勢色である黒の中で結合し、絡み合い、混ざり合
い、もしくは重なり合っている。文字「H」511の字
体の一部を拡大した図513は、劣勢色515を示して
おり、これは文字「H」511に関係するカラー、茶色
から構成されている。上記のように、劣勢色515は人
間には気付かれないが、カラー・スキャナによって判別
可能である。劣勢色515はまた、優勢色である黒の中
で結合し、絡み合い、混ざり合い、もしくは重なり合っ
ている。文字「E」521の字体の一部を拡大した図5
23は、劣勢色525を示しており、これは文字「E」
521に関係するカラー、青から構成されている。劣勢
色515は人間には判別不能であるが、カラー・スキャ
ナによって判別可能である。劣勢色515はまた、優勢
色である黒の中で結合し、絡み合い、混ざり合い、もし
くは重なり合っている。
図503は、劣勢色505を示しており、これは文字
「T」501に関係するカラー、赤から構成されてい
る。劣勢色505は人間には判別不能であるが、カラー
・スキャナによって判別可能である。劣勢色505はま
た、優勢色である黒の中で結合し、絡み合い、混ざり合
い、もしくは重なり合っている。文字「H」511の字
体の一部を拡大した図513は、劣勢色515を示して
おり、これは文字「H」511に関係するカラー、茶色
から構成されている。上記のように、劣勢色515は人
間には気付かれないが、カラー・スキャナによって判別
可能である。劣勢色515はまた、優勢色である黒の中
で結合し、絡み合い、混ざり合い、もしくは重なり合っ
ている。文字「E」521の字体の一部を拡大した図5
23は、劣勢色525を示しており、これは文字「E」
521に関係するカラー、青から構成されている。劣勢
色515は人間には判別不能であるが、カラー・スキャ
ナによって判別可能である。劣勢色515はまた、優勢
色である黒の中で結合し、絡み合い、混ざり合い、もし
くは重なり合っている。
【0020】図4は、本発明の好適例により、幾何学的
基準及びカラー基準を用いて未知の文字を認識するため
の方法及びシステムを示した流れ図である。このプロセ
スはブロック195で開始され、ブロック200へ進
む。ブロック200では、認識可能な文字を含んでいる
か否か不明である画像の一部を走査する。この走査は、
本発明の好適例によるカラー光学スキャナにより行って
もよい。
基準及びカラー基準を用いて未知の文字を認識するため
の方法及びシステムを示した流れ図である。このプロセ
スはブロック195で開始され、ブロック200へ進
む。ブロック200では、認識可能な文字を含んでいる
か否か不明である画像の一部を走査する。この走査は、
本発明の好適例によるカラー光学スキャナにより行って
もよい。
【0021】次に、プロセスはブロック205に進み、
既知の幾何学的OCR技術を用いて幾何学的OCR目標
仮定を作る。未知の文字に対して1またはそれ以上の仮
定を作ってもよい。空仮定(H0)及び代替仮定(H
1)が、本発明の好適例に従って作られる。例えば、こ
の仮定は、その記号が「A」である、あるいは、「A」
ではない、というものである。即ち、空仮定(H0)
が、未知の文字は「A」であるとし、そして代替仮定
(H1)が、未知の文字は「A」ではない、とする。そ
の後、プロセスはブロック210に進む。ブロック21
0では、画像の一部に含まれる特定の目標文字である未
知の文字についての、幾何学的OCR目標仮定の確率を
計算する。ここで、各仮定に対する確率が算出される。
例えば、H0が90%の確率であり、H1が10%の確
率であるとする。ブロック210においてはさらに、他
の考えられる目標文字に対するこれらの確率を計算す
る。
既知の幾何学的OCR技術を用いて幾何学的OCR目標
仮定を作る。未知の文字に対して1またはそれ以上の仮
定を作ってもよい。空仮定(H0)及び代替仮定(H
1)が、本発明の好適例に従って作られる。例えば、こ
の仮定は、その記号が「A」である、あるいは、「A」
ではない、というものである。即ち、空仮定(H0)
が、未知の文字は「A」であるとし、そして代替仮定
(H1)が、未知の文字は「A」ではない、とする。そ
の後、プロセスはブロック210に進む。ブロック21
0では、画像の一部に含まれる特定の目標文字である未
知の文字についての、幾何学的OCR目標仮定の確率を
計算する。ここで、各仮定に対する確率が算出される。
例えば、H0が90%の確率であり、H1が10%の確
率であるとする。ブロック210においてはさらに、他
の考えられる目標文字に対するこれらの確率を計算す
る。
【0022】示された例においてはただ2つの仮定H0
及びH1のみが作られるが、本発明に従って、記号に対
して他にも仮定及び確率を作ってよい。例えば、ブロッ
ク210においてさらに、未知の文字が「B」である確
率が30%であり、未知の文字が「C」である確率が5
%である、等々の計算を行ってもよい。
及びH1のみが作られるが、本発明に従って、記号に対
して他にも仮定及び確率を作ってよい。例えば、ブロッ
ク210においてさらに、未知の文字が「B」である確
率が30%であり、未知の文字が「C」である確率が5
%である、等々の計算を行ってもよい。
【0023】その後、プロセスはブロック215に進
み、幾何学的OCR目標仮定により示された文字に対応
する指定された劣勢色比率を、カラー比率表から検索す
る。以下の表1は、本発明の好適例におけるカラー比率
表に見られる情報を示したものである。
み、幾何学的OCR目標仮定により示された文字に対応
する指定された劣勢色比率を、カラー比率表から検索す
る。以下の表1は、本発明の好適例におけるカラー比率
表に見られる情報を示したものである。
【0024】
【表1】 表1 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− 文字 劣勢色 劣勢色の比率(%) −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− A 青 10 a 青 7 B 緑 10 b 緑 7 C 赤 10 c 赤 6 D 青 14 d 青 3 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
【0025】例えば、仮定H0において、未知の文字は
アルファベット「A」である、とする。表1に示される
カラー比率表において文字「A」を探すと、文字「A」
は劣勢色として10%の青の画素を有しており、従って
文字「A」に含まれる青の画素の比率は10%であるこ
とがわかる。次にプロセスはブロック220に進む。ブ
ロック220において、最小限のサンプル寸法が決定さ
れる。その後、プロセスはブロック225に進み、最小
限のサンプル寸法によって特定される回数だけ未知の文
字のサンプリングを行う。
アルファベット「A」である、とする。表1に示される
カラー比率表において文字「A」を探すと、文字「A」
は劣勢色として10%の青の画素を有しており、従って
文字「A」に含まれる青の画素の比率は10%であるこ
とがわかる。次にプロセスはブロック220に進む。ブ
ロック220において、最小限のサンプル寸法が決定さ
れる。その後、プロセスはブロック225に進み、最小
限のサンプル寸法によって特定される回数だけ未知の文
字のサンプリングを行う。
【0026】次にプロセスはブロック227に進む。ブ
ロック227において、サンプリングされた各画素に対
して色の決定がなされる。劣勢色と優勢色の識別もま
た、このブロックで行われる。その後プロセスはブロッ
ク229に進み、サンプリングされた画素の中の優勢色
に対する劣勢色の比率を計算する。それからブロック2
31へ進む。ブロック231においては、サンプリング
された劣勢色が、幾何学的OCR目標仮定により示され
た文字についての劣勢色に一致するか否かが判断され
る。双方の劣勢色が一致しない場合、プロセスはブロッ
ク260へ進みエラー処理を行う。エラー処理について
は以下でさらに詳細に記述する
ロック227において、サンプリングされた各画素に対
して色の決定がなされる。劣勢色と優勢色の識別もま
た、このブロックで行われる。その後プロセスはブロッ
ク229に進み、サンプリングされた画素の中の優勢色
に対する劣勢色の比率を計算する。それからブロック2
31へ進む。ブロック231においては、サンプリング
された劣勢色が、幾何学的OCR目標仮定により示され
た文字についての劣勢色に一致するか否かが判断され
る。双方の劣勢色が一致しない場合、プロセスはブロッ
ク260へ進みエラー処理を行う。エラー処理について
は以下でさらに詳細に記述する
【0027】ブロック231において、サンプリングさ
れた劣勢色が、幾何学的OCR目標仮定により示された
文字についての劣勢色に一致する場合、プロセスはブロ
ック235に進む。ブロック235において、決定され
た比率が、幾何学的OCR目標仮定により示された文字
についての表における比率の所定の範囲内にあるか否か
が判断される。決定された比率が、所定の範囲内、例え
ば±2%以内にある場合、プロセスはブロック240に
進む。ブロック240では、書込みバッファがフル状態
か否かが判断される。本発明の好適例における書込みバ
ッファは、プログラムが一連の認識された文字を書き込
むバッファである。書込みバッファがフル状態でない場
合、プロセスはブロック245に進み、認識された文字
を書込みバッファに書込む。その後、プロセスはブロッ
ク250に進む。ブロック250において、走査が完了
したか否かが判断される。走査が完了したならば、この
プロセスはブロック255において終了する。しかしな
がら、走査が完了していない場合、このプロセスは、さ
らに画像の走査を行うためにブロック200に戻る。
れた劣勢色が、幾何学的OCR目標仮定により示された
文字についての劣勢色に一致する場合、プロセスはブロ
ック235に進む。ブロック235において、決定され
た比率が、幾何学的OCR目標仮定により示された文字
についての表における比率の所定の範囲内にあるか否か
が判断される。決定された比率が、所定の範囲内、例え
ば±2%以内にある場合、プロセスはブロック240に
進む。ブロック240では、書込みバッファがフル状態
か否かが判断される。本発明の好適例における書込みバ
ッファは、プログラムが一連の認識された文字を書き込
むバッファである。書込みバッファがフル状態でない場
合、プロセスはブロック245に進み、認識された文字
を書込みバッファに書込む。その後、プロセスはブロッ
ク250に進む。ブロック250において、走査が完了
したか否かが判断される。走査が完了したならば、この
プロセスはブロック255において終了する。しかしな
がら、走査が完了していない場合、このプロセスは、さ
らに画像の走査を行うためにブロック200に戻る。
【0028】ブロック240において書込みバッファが
フル状態の場合、ブロック260へ進み、当業者に周知
のエラー処理ルーチンまたは例外処理ルーチンにより処
理される。ブロック260のエラー処理ルーチンにおけ
るデフォールト・プロセスは、書込みバッファの内容を
出力ファイルへ送り、そして書込みバッファをクリアす
ることである。さらにエラー処理ルーチンは、出力装置
265を介してユーザにエラーを報告する。デフォール
ト動作の代わりに、ブロック260においてエラーに対
するユーザ指定の対応を実行してもよい。例えば、入力
装置270を介してユーザにより指定された出力装置を
指示する、等である。その後、プロセスはブロック24
5に戻り、認識された文字を書込みバッファに書き込
む。
フル状態の場合、ブロック260へ進み、当業者に周知
のエラー処理ルーチンまたは例外処理ルーチンにより処
理される。ブロック260のエラー処理ルーチンにおけ
るデフォールト・プロセスは、書込みバッファの内容を
出力ファイルへ送り、そして書込みバッファをクリアす
ることである。さらにエラー処理ルーチンは、出力装置
265を介してユーザにエラーを報告する。デフォール
ト動作の代わりに、ブロック260においてエラーに対
するユーザ指定の対応を実行してもよい。例えば、入力
装置270を介してユーザにより指定された出力装置を
指示する、等である。その後、プロセスはブロック24
5に戻り、認識された文字を書込みバッファに書き込
む。
【0029】再び235を参照すると、決定された比率
が、表の比率の所定の範囲内にない場合、プロセスはや
はりブロック260へ進みエラー処理を行う。
が、表の比率の所定の範囲内にない場合、プロセスはや
はりブロック260へ進みエラー処理を行う。
【0030】図5は、図4のブロック220において最
小限のサンプル寸法を決定するための方法及びシステム
を示した流れ図である。このプロセスはブロック600
において開始され、ブロック602に進む。ブロック6
02において、サンプル寸法表が存在するか否かが判断
される。サンプル寸法表が存在する場合、プロセスはブ
ロック604に進み、幾何学的OCR目標仮定により示
された文字に対応するサンプル寸法を、サンプル寸法表
から検索する。その後、プロセスはブロック606に戻
る。ブロック602において、サンプル寸法表が存在し
ない場合、プロセスはブロック608に進む。ブロック
608において、サンプル寸法を所定のデフォールト値
に設定する。そしてプロセスはやはりブロック606に
戻る。
小限のサンプル寸法を決定するための方法及びシステム
を示した流れ図である。このプロセスはブロック600
において開始され、ブロック602に進む。ブロック6
02において、サンプル寸法表が存在するか否かが判断
される。サンプル寸法表が存在する場合、プロセスはブ
ロック604に進み、幾何学的OCR目標仮定により示
された文字に対応するサンプル寸法を、サンプル寸法表
から検索する。その後、プロセスはブロック606に戻
る。ブロック602において、サンプル寸法表が存在し
ない場合、プロセスはブロック608に進む。ブロック
608において、サンプル寸法を所定のデフォールト値
に設定する。そしてプロセスはやはりブロック606に
戻る。
【0031】
【発明の効果】本発明によって、複数の既知の文字の中
から未知の文字を光学的に識別するための方法及び装置
が提供される。
から未知の文字を光学的に識別するための方法及び装置
が提供される。
【図1】本発明の方法及びシステムを実施するために使
用可能なデータ処理システムを描いた図である。
用可能なデータ処理システムを描いた図である。
【図2】本発明の好適例を実施できる、図1に示された
データ処理システムの選択された構成要素のブロック図
である。
データ処理システムの選択された構成要素のブロック図
である。
【図3】本発明の好適例によって、文字を表現するカラ
ー・コード化技術を示した図である。
ー・コード化技術を示した図である。
【図4】本発明の好適例によって、幾何学的基準及びカ
ラー基準を用いて文字を認識するための方法及びシステ
ムを示した流れ図である。
ラー基準を用いて文字を認識するための方法及びシステ
ムを示した流れ図である。
【図5】本発明の好適例によるサンプル寸法の決定を示
した流れ図である。
した流れ図である。
50 パーソナル・コンピュータ 52 システム装置 54 表示装置 56 キーボード 57 光学スキャナ 58 マウス
───────────────────────────────────────────────────── フロントページの続き (72)発明者 グレゴリー・ピー・フィッツパトリック アメリカ合衆国76137 テキサス州、フォ ート・ウォース、ナンバーツーサウザンド アンドテン、ウエスタン・センター・ブル バード 3400 (72)発明者 マービン・エル・ウィリアムズ アメリカ合衆国75067 テキサス州、ルイ スビル、セトラーズ・ウェイ 1152
Claims (2)
- 【請求項1】複数の既知の文字の中から未知の文字を光
学的に識別するデータ処理システムにおける方法であっ
て、該複数の既知の文字のそれぞれが、予め選択された
比率による優勢色と劣勢色を有し、且つ該未知の文字
が、少なくとも1つの幾何学的特徴並びに優勢色及び劣
勢色を含む複数の画素を有しており、 前記未知の文字の前記少なくとも1つの幾何学的特徴を
検査するステップと、 前記少なくとも1つの幾何学的特徴の前記検査により、
前記未知の文字に対する仮定的アイデンティティを作る
ステップと、 前記未知の文字の前記複数の画素の一部をサンプリング
し、且つ該複数の画素の該サンプリングされた部分に含
まれる前記優勢色と前記劣勢色との比率を決定するステ
ップと、 前記決定された比率と、前記仮定的アイデンティティに
対応する前記複数の既知の文字の1つに対する予め選択
された比率とを比較するステップと、 前記決定された比率が、前記複数の既知の文字の1つに
対する予め選択された比率の所定の範囲内にある場合、
前記仮定的アイデンティティを前記未知の文字に割当て
るステップとを含む、 未知の文字を光学的に識別するデータ処理システムにお
ける方法。 - 【請求項2】複数の既知の文字の中から未知の文字を光
学的に識別するデータ処理システムであって、該複数の
既知の文字のそれぞれが、予め選択された比率による優
勢色と劣勢色を有し、且つ該未知の文字が、少なくとも
1つの幾何学的特徴並びに優勢色及び劣勢色を含む複数
の画素を有しており、 前記未知の文字の前記少なくとも1つの幾何学的特徴を
検査する手段と、 前記少なくとも1つの幾何学的特徴の前記検査により、
前記未知の文字に対する仮定的アイデンティティを作る
手段と、 前記未知の文字の前記複数の画素の一部をサンプリング
し、且つ該複数の画素の該サンプリングされた部分に含
まれる前記優勢色と前記劣勢色との比率を決定する手段
と、 前記決定された比率と、前記仮定的アイデンティティに
対応する前記複数の既知の文字の1つに対する予め選択
された比率とを比較する手段と、 前記決定された比率が、前記複数の既知の文字の1つに
対する予め選択された比率の所定の範囲内にある場合、
前記仮定的アイデンティティを前記未知の文字に割当て
る手段とを含む、 未知の文字を光学的に識別するデータ処理システム。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US010967 | 1993-01-29 | ||
| US08/010,967 US5835625A (en) | 1993-01-29 | 1993-01-29 | Method and apparatus for optical character recognition utilizing proportional nonpredominant color analysis |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH06243292A true JPH06243292A (ja) | 1994-09-02 |
| JP2574994B2 JP2574994B2 (ja) | 1997-01-22 |
Family
ID=21748275
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5333347A Expired - Lifetime JP2574994B2 (ja) | 1993-01-29 | 1993-12-27 | 光学的文字認識方法及びその装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US5835625A (ja) |
| JP (1) | JP2574994B2 (ja) |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3178305B2 (ja) * | 1995-06-29 | 2001-06-18 | オムロン株式会社 | 画像処理方法及び装置並びにそれを搭載した複写機,スキャナ及びプリンター |
| US6460766B1 (en) * | 1996-10-28 | 2002-10-08 | Francis Olschafskie | Graphic symbols and method and system for identification of same |
| US6906699B1 (en) * | 1998-04-30 | 2005-06-14 | C Technologies Ab | Input unit, method for using the same and input system |
| US6246803B1 (en) | 1998-12-27 | 2001-06-12 | The University Of Kansas | Real-time feature-based video stream validation and distortion analysis system using color moments |
| US6897867B2 (en) * | 1999-12-17 | 2005-05-24 | Fujitsu Limited | Information comparison display apparatus using colors and a method thereof |
| JP4631133B2 (ja) * | 2000-06-09 | 2011-02-16 | コニカミノルタビジネステクノロジーズ株式会社 | 文字認識処理のための装置、方法及び記録媒体 |
| US6847976B1 (en) * | 2000-06-15 | 2005-01-25 | Terrence B. Peace | Method and apparatus for significance testing and confidence interval construction based on user-specified distribution |
| US20040172401A1 (en) * | 2000-06-15 | 2004-09-02 | Peace Terrence B. | Significance testing and confidence interval construction based on user-specified distributions |
| US7191103B2 (en) * | 2001-08-08 | 2007-03-13 | Hewlett-Packard Development Company, L.P. | Predominant color identification in digital images |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3938088A (en) * | 1971-12-30 | 1976-02-10 | Xerox Corporation | Character coding and recognition system |
| US3786237A (en) * | 1972-03-13 | 1974-01-15 | R Postal | Mechanically readable system using premarked substrate |
| USRE31692E (en) * | 1972-05-02 | 1984-10-02 | Optical Recognition Systems, Inc. | Combined magnetic optical character reader |
| US3949363A (en) * | 1974-06-28 | 1976-04-06 | Recognition Equipment, Incorporated | Bar-Code/MICR/OCR merge |
| US4637051A (en) * | 1983-07-18 | 1987-01-13 | Pitney Bowes Inc. | System having a character generator for printing encrypted messages |
| US4987603A (en) * | 1988-09-22 | 1991-01-22 | Glory Kogyo Kabushiki Kaisha | Recognition method for letter patterns |
| CA2037173C (en) * | 1990-03-30 | 1996-01-09 | Hirofumi Kameyama | Character recognizing system |
-
1993
- 1993-01-29 US US08/010,967 patent/US5835625A/en not_active Expired - Fee Related
- 1993-12-27 JP JP5333347A patent/JP2574994B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JP2574994B2 (ja) | 1997-01-22 |
| US5835625A (en) | 1998-11-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5748809A (en) | Active area identification on a machine readable form using form landmarks | |
| US5410611A (en) | Method for identifying word bounding boxes in text | |
| US6038351A (en) | Apparatus and method for multi-entity, mixed document environment document identification and processing | |
| US5875261A (en) | Method of and apparatus for optical character recognition based on geometric and color attribute hypothesis testing | |
| KR100315318B1 (ko) | 비트맵이미지의처리방법및처리장치,비트맵이미지의처리를행하는이미지처리프로그램을저장한기억매체 | |
| US7769235B2 (en) | Text recognition method using a trainable classifier | |
| US6701015B2 (en) | Character string extraction apparatus and method based on basic component in document image | |
| US6282316B1 (en) | Image processing method and apparatus that use handwritten gestures for editing | |
| JP2574994B2 (ja) | 光学的文字認識方法及びその装置 | |
| US20020051574A1 (en) | Character recognition method, program and recording medium | |
| US6535652B2 (en) | Image retrieval apparatus and method, and computer-readable memory therefor | |
| US20010043742A1 (en) | Communication document detector | |
| US5396564A (en) | Method of and apparatus for recognizing predominate and non-predominate color code characters for optical character recognition | |
| JP2002015280A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
| JP3319203B2 (ja) | 文書ファイリング方法及び装置 | |
| JPH04502526A (ja) | 像認識 | |
| JPH0333990A (ja) | マスク処理を用いる光学式文字認識装置及び方法 | |
| US11710331B2 (en) | Systems and methods for separating ligature characters in digitized document images | |
| JPH06243291A (ja) | 光学的文字認識方法及びその装置 | |
| JP3466894B2 (ja) | 楽譜認識方法及びその装置並びに楽譜認識プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JP4109738B2 (ja) | 画像処理方法及び装置及びその記憶媒体 | |
| JPH02250193A (ja) | 図形・文字分離方式 | |
| JPS5949671A (ja) | 光学的文字読取装置 | |
| JPH06223221A (ja) | 文字認識装置 | |
| JP2004013188A (ja) | 帳票読取り装置および帳票読取り方法ならびプログラム |