JPH02191085A - 画像2値化識別方法 - Google Patents
画像2値化識別方法Info
- Publication number
- JPH02191085A JPH02191085A JP1011479A JP1147989A JPH02191085A JP H02191085 A JPH02191085 A JP H02191085A JP 1011479 A JP1011479 A JP 1011479A JP 1147989 A JP1147989 A JP 1147989A JP H02191085 A JPH02191085 A JP H02191085A
- Authority
- JP
- Japan
- Prior art keywords
- image
- picture
- binarization
- multilevel
- variance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、文字認識などのパターン認識装置における画
像2値化認識方法に関する。
像2値化認識方法に関する。
従来の技術
一般に、文字認識などのパターン認識装置において処理
される画像は、スキャナのCCDイメージセンサ出力な
どの値を閾値(スレッシュレベル)によって白黒2値化
したものである。この際、印字状態の良くない原稿であ
っても最適なる2値化を可能とするため、原稿の濃度の
相違に対応して各々最適な2値画像を生成する必要があ
る。
される画像は、スキャナのCCDイメージセンサ出力な
どの値を閾値(スレッシュレベル)によって白黒2値化
したものである。この際、印字状態の良くない原稿であ
っても最適なる2値化を可能とするため、原稿の濃度の
相違に対応して各々最適な2値画像を生成する必要があ
る。
ここに、このような2値化方法に関しては、種々の方法
が提案されている。例えば、「昭和52年度電子通信学
会情報部門全国大会、大津展之、「濃度分布からの閾値
決定法」中、145」なる文献に示される濃度分布から
の閾値決定法がある。
が提案されている。例えば、「昭和52年度電子通信学
会情報部門全国大会、大津展之、「濃度分布からの閾値
決定法」中、145」なる文献に示される濃度分布から
の閾値決定法がある。
これは、濃度分布の0次、1次モーメントのみを利用し
、積分に基づいて最適なる閾値を決定するものである。
、積分に基づいて最適なる閾値を決定するものである。
発明が解決しようとする課題
ここに、文字認識において対象となる原稿には、ワイヤ
ドツトプリンタ等により印字されたぼやけた画像のもの
や、レーザプリンタ等より印字されたシャープな画像の
もの、あるいは、印刷活字により印刷されたもの、手書
き又はコピーによるもの等がある。
ドツトプリンタ等により印字されたぼやけた画像のもの
や、レーザプリンタ等より印字されたシャープな画像の
もの、あるいは、印刷活字により印刷されたもの、手書
き又はコピーによるもの等がある。
ところが、濃度分布からの閾値決定法による場合、文字
認識などのパターン認識において扱われる画像としての
「線」のつぶれやかすれに対する処理としては、効果的
な方法ではない。即ち、上記のように、原稿によっては
印字状態が異なるため、2値化などの前処理において全
てを同一に扱うことは、適切なる画像認識の支障となる
。
認識などのパターン認識において扱われる画像としての
「線」のつぶれやかすれに対する処理としては、効果的
な方法ではない。即ち、上記のように、原稿によっては
印字状態が異なるため、2値化などの前処理において全
てを同一に扱うことは、適切なる画像認識の支障となる
。
課題を解決するための手段
請求項1記載の発明では、多値量子化された画像に対し
て白黒2値の画像に変換し、認識辞書を用いて文字を認
識するパターン認識装置における最適2値化方法におい
て、画像特性に応じて異なる2値化方式を用意し、多値
画像の各濃度レベル毎の画素数を計数し、最も淡いレベ
ルの画素を除いた濃度レベルと画素数との分散値を求め
、求められた分散値により画像特性を識別し、識別され
た画像特性に応じて2値化方式を切替え、切替えられた
2値化方式により多値画像を2値化するようにした。
て白黒2値の画像に変換し、認識辞書を用いて文字を認
識するパターン認識装置における最適2値化方法におい
て、画像特性に応じて異なる2値化方式を用意し、多値
画像の各濃度レベル毎の画素数を計数し、最も淡いレベ
ルの画素を除いた濃度レベルと画素数との分散値を求め
、求められた分散値により画像特性を識別し、識別され
た画像特性に応じて2値化方式を切替え、切替えられた
2値化方式により多値画像を2値化するようにした。
また、請求項2記載の発明では、請求項1記載の発明に
加え、印字状態の種類に応じて異なる認識辞書を用意し
、求められた分散値により画像特性を識別し、識別され
た画像特性に基づき画像の印字状態の種類を推定し、推
定された印字状態の種類に応じて認識辞書を切替えるよ
うにした。
加え、印字状態の種類に応じて異なる認識辞書を用意し
、求められた分散値により画像特性を識別し、識別され
た画像特性に基づき画像の印字状態の種類を推定し、推
定された印字状態の種類に応じて認識辞書を切替えるよ
うにした。
作用
原稿画像には例えばレーザプリンタのようにシャープな
画像、ワイヤドツトプリンタのようにぼやけた画像等が
ある。そこで、請求項1記載の発明によれば、多値画像
の各濃度レベル毎の画素数の計数結果に基づき最も淡い
レベルの画素を除いた濃度レベルと画素数との分散値に
より、このような画像特性を識別し、その画像特性にあ
った方式の2値化方式により2値化処理を行うので、種
々の画像特性を持つ原稿の場合であっても、各々の原稿
画像について最適なる2値化処理が行なわれることにな
る。
画像、ワイヤドツトプリンタのようにぼやけた画像等が
ある。そこで、請求項1記載の発明によれば、多値画像
の各濃度レベル毎の画素数の計数結果に基づき最も淡い
レベルの画素を除いた濃度レベルと画素数との分散値に
より、このような画像特性を識別し、その画像特性にあ
った方式の2値化方式により2値化処理を行うので、種
々の画像特性を持つ原稿の場合であっても、各々の原稿
画像について最適なる2値化処理が行なわれることにな
る。
また、原稿画像における印字状態としてもレーザプリン
タによる印字画像、ワイヤドツトプリンタ或いはサーマ
ルプリンタによる印字画像、活字印刷画像、手書き画像
、コピー画像等、種々のものがある。そこで、請求項2
記載の発明のように、画像特性から印字状態の種類をも
推定し、それに応じて認識辞書を自動的に切替えること
により、その文字種にあった認識辞書を用いた文字認識
となり、認識率が向上する。
タによる印字画像、ワイヤドツトプリンタ或いはサーマ
ルプリンタによる印字画像、活字印刷画像、手書き画像
、コピー画像等、種々のものがある。そこで、請求項2
記載の発明のように、画像特性から印字状態の種類をも
推定し、それに応じて認識辞書を自動的に切替えること
により、その文字種にあった認識辞書を用いた文字認識
となり、認識率が向上する。
実施例
請求項1記載の発明の一実施例を第1図及び第2図に基
づいて説明する。第2図に本実施例を実施するブロック
図構成を示す。本実施例は、多値画像読取り部1から2
値画像出力部2までの処理に関する。概略的には、まず
、多値画像読取り部1にてスキャナ3から多値量子化さ
れた画像を読取り、多値イメージメモリ4に保有する。
づいて説明する。第2図に本実施例を実施するブロック
図構成を示す。本実施例は、多値画像読取り部1から2
値画像出力部2までの処理に関する。概略的には、まず
、多値画像読取り部1にてスキャナ3から多値量子化さ
れた画像を読取り、多値イメージメモリ4に保有する。
このように読取られた多値画像を画素ヒストグラム計数
部5において、各濃度レベル毎の画素数を計数する。次
に、分散値計算部6においてヒストグラムの分散値、即
ち、最も淡いレベルの画素を除いた濃度レベルと画素数
との分散値を求める。そして、画像特性識別11i17
において、求められた分散値により画像特性を識別する
。そして、2値化部8では識別された画像特性にあった
手法の2値化方式により多値画像を2値化し、その2値
画像を2値イメージメモリ9に保有する。その後、2値
イメージメモリ9に保有された2値画像を2値画像出力
部2を通して、文字認識部10などに送出し文字認識等
の処理に供する。
部5において、各濃度レベル毎の画素数を計数する。次
に、分散値計算部6においてヒストグラムの分散値、即
ち、最も淡いレベルの画素を除いた濃度レベルと画素数
との分散値を求める。そして、画像特性識別11i17
において、求められた分散値により画像特性を識別する
。そして、2値化部8では識別された画像特性にあった
手法の2値化方式により多値画像を2値化し、その2値
画像を2値イメージメモリ9に保有する。その後、2値
イメージメモリ9に保有された2値画像を2値画像出力
部2を通して、文字認識部10などに送出し文字認識等
の処理に供する。
ここに、前記画素ヒストグラム計数部5と分散値計算部
6とには画素ヒストグラムメモリ11が接続され、分散
値計算部6と画像特性識別部7とには分散値メモリ12
が接続され、画像特性識別部7には分散値テーブル13
が接続されている。
6とには画素ヒストグラムメモリ11が接続され、分散
値計算部6と画像特性識別部7とには分散値メモリ12
が接続され、画像特性識別部7には分散値テーブル13
が接続されている。
このような構成において、本実施例による処理を、第1
図のフローチャートを参照し、スキャナ3から読込む画
像を16値に量子化されたものを扱う例で説明する。ま
ず、スキャナ3から多値画像を読取り、多値イメージメ
モリ4に保有する。
図のフローチャートを参照し、スキャナ3から読込む画
像を16値に量子化されたものを扱う例で説明する。ま
ず、スキャナ3から多値画像を読取り、多値イメージメ
モリ4に保有する。
多値イメージメモリ4から16階調の多値画像(濃度レ
ベルOから15)を読込み、各濃度レベル毎の画素数を
画素ヒストグラム計数部5により計数し、画素ヒストグ
ラムメモリ11に保有する。
ベルOから15)を読込み、各濃度レベル毎の画素数を
画素ヒストグラム計数部5により計数し、画素ヒストグ
ラムメモリ11に保有する。
第1図中、lIc0nI+ は濃度レベルを示し、u
Q VI+は濃度ヒストグラムを示す。
Q VI+は濃度ヒストグラムを示す。
次に、分散値計算部6において、画素ヒストグラムの平
均及び分散値を次式により求める。
均及び分散値を次式により求める。
匹
このように求められた分散値は、分散値メモリ12に保
有する。そして、画像特性識別部7において、分散値メ
モリ12に保有された分散値と分数値テーブル13上の
データとを用いて、画像の特性を識別する。ここに、画
像特性の識別とは、例えばレーザプリンタにより印字さ
れたシャープな画像や、ワイヤドツトプリンタにより印
字されたぼやけた画像などを、識別することを意味する
。
有する。そして、画像特性識別部7において、分散値メ
モリ12に保有された分散値と分数値テーブル13上の
データとを用いて、画像の特性を識別する。ここに、画
像特性の識別とは、例えばレーザプリンタにより印字さ
れたシャープな画像や、ワイヤドツトプリンタにより印
字されたぼやけた画像などを、識別することを意味する
。
この識別された画像特性に応じて、その特性にあった2
値化方式を選ぶ。即ち、2値化部8には画像特性に応じ
て異なる手法の2値化方式が予め用意されており、シャ
ープな画像やぼやけた画像を同一の方法で2値化するの
ではなく、特性により別の2値化処理(例えば、2値化
のための閾値を異ならせる)を行なわせるものである。
値化方式を選ぶ。即ち、2値化部8には画像特性に応じ
て異なる手法の2値化方式が予め用意されており、シャ
ープな画像やぼやけた画像を同一の方法で2値化するの
ではなく、特性により別の2値化処理(例えば、2値化
のための閾値を異ならせる)を行なわせるものである。
このように選択された2値化方式により、多値イメージ
メモリ4に保有されている多値画像を2値化部8により
2値化し、2値イメージメモリ9に保有し、必要に応じ
てこの2値画像を2値画像出力部2を通して、文字認識
部10などに送出し文字認識等の処理に供する。
メモリ4に保有されている多値画像を2値化部8により
2値化し、2値イメージメモリ9に保有し、必要に応じ
てこの2値画像を2値画像出力部2を通して、文字認識
部10などに送出し文字認識等の処理に供する。
このように、本実施例によれば、シャープな画像、ぼや
けた画像等の画像特性を識別し、その画像特性にあった
方式の2値化方式により2値化処理を行うので、種々の
印字状態の種類を持つ原稿の場合であっても、各々の原
稿画像について最適なる2値化処理を行うことができる
。
けた画像等の画像特性を識別し、その画像特性にあった
方式の2値化方式により2値化処理を行うので、種々の
印字状態の種類を持つ原稿の場合であっても、各々の原
稿画像について最適なる2値化処理を行うことができる
。
つづいて、請求項2記載の発明の一実施例を第3図及び
第4図により説明する。前記実施例で示した部分と同一
部分は同一符号を用いて示す。本実施例では、まず、(
1)(2)〜(n)で示すような認識辞書としての辞書
ファイル14が用意されている。これらの辞書ファイル
14は印字状態の種類に応じて異なるものである。しか
して、前記実施例と同様にして画像特性を識別した後、
画像特性に適した手法の2値化方式により2値化を行う
とともに、識別された画像特性に基づき画像の印字状態
の種類をも推定し、この推定による印字状態の種類に応
じて辞書切替え部15を制御して、認識に使用する辞書
ファイル14を自動的に切替えるようにしたものである
。
第4図により説明する。前記実施例で示した部分と同一
部分は同一符号を用いて示す。本実施例では、まず、(
1)(2)〜(n)で示すような認識辞書としての辞書
ファイル14が用意されている。これらの辞書ファイル
14は印字状態の種類に応じて異なるものである。しか
して、前記実施例と同様にして画像特性を識別した後、
画像特性に適した手法の2値化方式により2値化を行う
とともに、識別された画像特性に基づき画像の印字状態
の種類をも推定し、この推定による印字状態の種類に応
じて辞書切替え部15を制御して、認識に使用する辞書
ファイル14を自動的に切替えるようにしたものである
。
まず、画像特性の識別処理までは、前記実施例と同様に
行われる。しかして、この画像特性識別後の、2値化部
8による2値化処理を行う前に、本実施例では、識別さ
れた画像特性に基づき印字状態の種類を推定する。ここ
に、印字状態の種類とは、例えばレーザプリンタによる
印字画像、ワイヤドツトプリンタ或いはサーマルプリン
タによる印字画像、活字印刷画像、手書き画像、コピー
画像等の種類をいう。次に、辞書切替え部15ではこの
ように推定された印字状態の種類に応じて、その文字種
に最適な辞書ファイル14を選択し、辞書メモリにロー
ドする。一方、2値化方式については、前記実施例と同
様に画像特性にあった2値化方式を選択する。
行われる。しかして、この画像特性識別後の、2値化部
8による2値化処理を行う前に、本実施例では、識別さ
れた画像特性に基づき印字状態の種類を推定する。ここ
に、印字状態の種類とは、例えばレーザプリンタによる
印字画像、ワイヤドツトプリンタ或いはサーマルプリン
タによる印字画像、活字印刷画像、手書き画像、コピー
画像等の種類をいう。次に、辞書切替え部15ではこの
ように推定された印字状態の種類に応じて、その文字種
に最適な辞書ファイル14を選択し、辞書メモリにロー
ドする。一方、2値化方式については、前記実施例と同
様に画像特性にあった2値化方式を選択する。
この後、多値イメージメモリ4に保有されている多値画
像を選択された2値化方式により2値化し、2値イメー
ジメモリ9に保有し、必要に応じてこの2値画像を2値
画像出力部2を通して、文字認識部10などに送出し文
字認識等の処理に供する。また、選択された辞書ファイ
ル14はこの文字認識部10における文字認識処理等に
際して用いられる。
像を選択された2値化方式により2値化し、2値イメー
ジメモリ9に保有し、必要に応じてこの2値画像を2値
画像出力部2を通して、文字認識部10などに送出し文
字認識等の処理に供する。また、選択された辞書ファイ
ル14はこの文字認識部10における文字認識処理等に
際して用いられる。
本実施例によれば、画像特性から印字状態の種類をも推
定し、それに応じて辞書ファイル14を自動的に切替え
るので、その文字種にあった辞書ファイルによる文字認
識となり、認識率を向−4ニさせることができる。
定し、それに応じて辞書ファイル14を自動的に切替え
るので、その文字種にあった辞書ファイルによる文字認
識となり、認識率を向−4ニさせることができる。
発明の効果
本発明は、上述したように構成したので、原稿画像には
例えばレーザプリンタのようにシャープな画像、ワイヤ
ドツトプリンタのようにぼやけた画像等があるが、請求
項1記載の発明によれば、多値画像の各濃度レベル毎の
画素数の計数結果に基づき最も淡いレベルの画素を除い
た濃度レベルと画素数との分散値により、このような画
像特性を識別し、その画像特性にあった方式の2値化方
式により2値化処理を行うので、種々の画像特性を持つ
原稿の場合であっても、各々の原稿画像について最適な
る2値化処理を行なわせることができ、また、原稿画像
における印字状態としてもレーザプリンタによる印字画
像、ワイヤドツトプリンタ或いはサーマルプリンタによ
る印字画像、活字印刷画像、手書き画像、コピー画像等
、種々のものがあるが、請求項2記載の発明によれば、
画像特性から印字状態の種類をも推定し、それに応じて
認識辞書を自動的に切替えるので、その文字種にあった
認識辞書を用いた文字認識とし、認識率を向上させるこ
とができる。
例えばレーザプリンタのようにシャープな画像、ワイヤ
ドツトプリンタのようにぼやけた画像等があるが、請求
項1記載の発明によれば、多値画像の各濃度レベル毎の
画素数の計数結果に基づき最も淡いレベルの画素を除い
た濃度レベルと画素数との分散値により、このような画
像特性を識別し、その画像特性にあった方式の2値化方
式により2値化処理を行うので、種々の画像特性を持つ
原稿の場合であっても、各々の原稿画像について最適な
る2値化処理を行なわせることができ、また、原稿画像
における印字状態としてもレーザプリンタによる印字画
像、ワイヤドツトプリンタ或いはサーマルプリンタによ
る印字画像、活字印刷画像、手書き画像、コピー画像等
、種々のものがあるが、請求項2記載の発明によれば、
画像特性から印字状態の種類をも推定し、それに応じて
認識辞書を自動的に切替えるので、その文字種にあった
認識辞書を用いた文字認識とし、認識率を向上させるこ
とができる。
請求項2記載の発明の一実施例を示すブロック図、第4
図はフローチャートである。
図はフローチャートである。
Claims (1)
- 【特許請求の範囲】 1、多値量子化された画像に対して白黒2値の画像に変
換し、認識辞書を用いて文字を認識するパターン認識装
置における最適2値化方法において、画像特性に応じて
異なる2値化方式を用意し、多値画像の各濃度レベル毎
の画素数を計数し、最も淡いレベルの画素を除いた濃度
レベルと画素数との分散値を求め、求められた分散値に
より画像特性を識別し、識別された画像特性に応じて2
値化方式を切替え、切替えられた2値化方式により多値
画像を2値化するようにしたことを特徴とする画像2値
化識別方法。 2、印字種類に応じて異なる認識辞書を用意し、求めら
れた分散値により画像特性を識別し、識別された画像特
性に基づき画像の印字状態の種類を推定し、推定された
印字状態の種類に応じて認識辞書を切替えるようにした
ことを特徴とする画像2値化識別方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1011479A JPH02191085A (ja) | 1989-01-20 | 1989-01-20 | 画像2値化識別方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1011479A JPH02191085A (ja) | 1989-01-20 | 1989-01-20 | 画像2値化識別方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02191085A true JPH02191085A (ja) | 1990-07-26 |
Family
ID=11779196
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1011479A Pending JPH02191085A (ja) | 1989-01-20 | 1989-01-20 | 画像2値化識別方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02191085A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017141802A1 (ja) * | 2016-02-15 | 2017-08-24 | 日本電気株式会社 | 画像処理装置、文字認識装置、画像処理方法及びプログラム記録媒体 |
-
1989
- 1989-01-20 JP JP1011479A patent/JPH02191085A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017141802A1 (ja) * | 2016-02-15 | 2017-08-24 | 日本電気株式会社 | 画像処理装置、文字認識装置、画像処理方法及びプログラム記録媒体 |
| US11341739B2 (en) | 2016-02-15 | 2022-05-24 | Nec Corporation | Image processing device, image processing method, and program recording medium |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN100505822C (zh) | 影像处理装置、影像形成装置和影像处理方法 | |
| JP3276985B2 (ja) | イメージピクセル処理方法 | |
| US7292375B2 (en) | Method and apparatus for color image processing, and a computer product | |
| JP2004173276A (ja) | デシジョン面生成方法、画像データ画素区分方法及びカラードキュメント区分方法 | |
| RU2737001C1 (ru) | Устройство и способ обработки изображений и носитель данных | |
| JPH02191085A (ja) | 画像2値化識別方法 | |
| EP1202553A3 (en) | Image processing apparatus | |
| JP3841494B2 (ja) | 画像処理装置 | |
| JPH06284281A (ja) | 画像処理装置 | |
| JPH11103388A (ja) | 画像出力装置 | |
| JP2507927B2 (ja) | 画像処理装置 | |
| JPH06103399A (ja) | 画像処理装置 | |
| JP3326309B2 (ja) | 画像処理装置 | |
| JP2859936B2 (ja) | 画情報処理装置 | |
| JPH05292312A (ja) | 網点領域分離装置 | |
| JPH07121063B2 (ja) | 画像処理装置 | |
| JPH01137378A (ja) | 画像処理方式 | |
| JPH0548891A (ja) | 画像領域分離装置 | |
| JPH08221515A (ja) | 画像処理装置 | |
| JPH03219774A (ja) | 画像処理方法および装置 | |
| JPH01222964A (ja) | 画像処理装置 | |
| JPH0486156A (ja) | 画像2値化方法 | |
| JPS60149260A (ja) | 画像情報二値化回路 | |
| JPH01212176A (ja) | カラー画像形成装置 | |
| JPH0382269A (ja) | 画像処理装置 |