JPH10232926A - 画像処理装置及びその方法 - Google Patents
画像処理装置及びその方法Info
- Publication number
- JPH10232926A JPH10232926A JP9335995A JP33599597A JPH10232926A JP H10232926 A JPH10232926 A JP H10232926A JP 9335995 A JP9335995 A JP 9335995A JP 33599597 A JP33599597 A JP 33599597A JP H10232926 A JPH10232926 A JP H10232926A
- Authority
- JP
- Japan
- Prior art keywords
- image
- area
- quantization
- image processing
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Image Input (AREA)
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
(57)【要約】
【課題】 入力画像内の対象物濃度と背景濃度との間に
適切な量子化閾値を設定して画像処理を行なう画像処理
装置及びその方法を提供する。 【解決手段】 多値画像を量子化して画像処理を行う際
に、輝度頻度累計部103にて多値画像の輝度頻度を算
出し、算出された輝度頻度に基づき、量子化閾値算出部
104にて量子化の量子化閾値を特定し、特定された量
子化閾値と輝度頻度とに基づき、量子化部105にて多
値画像の量子化に用いる代表値を算出し、算出された代
表値を用いて多値画像を量子化する。
適切な量子化閾値を設定して画像処理を行なう画像処理
装置及びその方法を提供する。 【解決手段】 多値画像を量子化して画像処理を行う際
に、輝度頻度累計部103にて多値画像の輝度頻度を算
出し、算出された輝度頻度に基づき、量子化閾値算出部
104にて量子化の量子化閾値を特定し、特定された量
子化閾値と輝度頻度とに基づき、量子化部105にて多
値画像の量子化に用いる代表値を算出し、算出された代
表値を用いて多値画像を量子化する。
Description
【0001】
【発明の属する技術分野】本発明は、例えば、多値画像
の量子化閾値を決定して量子化を行なう画像処理装置及
びその方法に関するものである。
の量子化閾値を決定して量子化を行なう画像処理装置及
びその方法に関するものである。
【0002】
【従来の技術】近年の画像処理技術の発展はめざまし
く、フルカラー画像等の多値画像の処理や、多値画像内
の文字認識処理等が可能な画像処理装置も普及してきて
いる。このような画像処理技術において、多値画像の2
値化処理は不可欠な技術となっている。
く、フルカラー画像等の多値画像の処理や、多値画像内
の文字認識処理等が可能な画像処理装置も普及してきて
いる。このような画像処理技術において、多値画像の2
値化処理は不可欠な技術となっている。
【0003】従来の2値化手法としては、あらかじめ設
定してある固定閾値による単純2値化法をはじめとし
て、ある閾値でヒストグラムを2クラスに分割した場合
のクラス間分散が最大になるときの閾値を2値化閾値と
する大津法(「判別および最小2乗規準に基づく自動し
きい値選定法」(大津)、電子通信学会論文誌、Vo
l.J63−D,No.4.pp.349−356,1
980)、あるいは、階調を持つ画像に対して、局所的
濃度に応じて閾値を設定する2値化法等がある。
定してある固定閾値による単純2値化法をはじめとし
て、ある閾値でヒストグラムを2クラスに分割した場合
のクラス間分散が最大になるときの閾値を2値化閾値と
する大津法(「判別および最小2乗規準に基づく自動し
きい値選定法」(大津)、電子通信学会論文誌、Vo
l.J63−D,No.4.pp.349−356,1
980)、あるいは、階調を持つ画像に対して、局所的
濃度に応じて閾値を設定する2値化法等がある。
【0004】
【発明が解決しようとする課題】しかしながら、上述し
た従来の画像処理装置における2値化方法では、以下の
ような問題がある。
た従来の画像処理装置における2値化方法では、以下の
ような問題がある。
【0005】すなわち、固定閾値による単純2値化法で
は、画像内の対象物濃度と背景濃度の間に適切な閾値を
設定することが難しく、その結果、画像一面が黒く潰れ
てしまったり、逆に白くなってしまう。また、大津法で
は、2クラスの分布が極端に異なる場合においては、大
さい方のクラスに閾値が寄ってしまうという性質があ
り、ノイズの多い2値画像が生成されてしまう。さら
に、局所的濃度に応じて閾値を設定する2値化法では、
画像を局所に分割しているため、ブロック歪が発生しや
すい。また、仮に最適な閾値を特定できても、2値化に
よって原画の下地や文字等のグレイスケール惜報が失わ
れてしまう等の問題がある。
は、画像内の対象物濃度と背景濃度の間に適切な閾値を
設定することが難しく、その結果、画像一面が黒く潰れ
てしまったり、逆に白くなってしまう。また、大津法で
は、2クラスの分布が極端に異なる場合においては、大
さい方のクラスに閾値が寄ってしまうという性質があ
り、ノイズの多い2値画像が生成されてしまう。さら
に、局所的濃度に応じて閾値を設定する2値化法では、
画像を局所に分割しているため、ブロック歪が発生しや
すい。また、仮に最適な閾値を特定できても、2値化に
よって原画の下地や文字等のグレイスケール惜報が失わ
れてしまう等の問題がある。
【0006】本発明は、上記課題を解決するためにされ
たもので、入力画像内の対象物濃度と背景濃度との間に
適切な量子化閾値を設定して画像処理を行なう画像処理
装置及びその方法を提供することを目的とする。
たもので、入力画像内の対象物濃度と背景濃度との間に
適切な量子化閾値を設定して画像処理を行なう画像処理
装置及びその方法を提供することを目的とする。
【0007】また、上記課題を解決するために、本発明
は最適な量子化閾値を特定し、原画の下地や文字等のグ
レースケール情報を失うことなく領域分離を行える画像
処理装置及びその方法を提供することを目的とする。
は最適な量子化閾値を特定し、原画の下地や文字等のグ
レースケール情報を失うことなく領域分離を行える画像
処理装置及びその方法を提供することを目的とする。
【0008】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、多値画像を量子化して画像処理を行う画
像処理装置において、前記多値画像の輝度頻度を算出す
る第1の算出手段と、前記算出された輝度頻度に基づ
き、量子化の量子化閾値を特定する特定手段と、前記特
定された量子化閾値と前記輝度頻度とに基づき、前記多
値画像の量子化に用いる代表値を算出する第2の算出手
段と、前記算出された代表値を用いて前記多値画像を量
子化する量子化手段とを有することを特徴とする。
に、本発明は、多値画像を量子化して画像処理を行う画
像処理装置において、前記多値画像の輝度頻度を算出す
る第1の算出手段と、前記算出された輝度頻度に基づ
き、量子化の量子化閾値を特定する特定手段と、前記特
定された量子化閾値と前記輝度頻度とに基づき、前記多
値画像の量子化に用いる代表値を算出する第2の算出手
段と、前記算出された代表値を用いて前記多値画像を量
子化する量子化手段とを有することを特徴とする。
【0009】また、上記目的を達成するために、本発明
は、多値画像を量子化して画像処理を行う画像処理方法
において、前記多値画像の輝度頻度を算出し、前記算出
された輝度頻度に基づき、量子化の量子化閾値を特定
し、前記特定された量子化閾値と前記輝度頻度とに基づ
き、前記多値画像の量子化に用いる代表値を算出し、前
記算出された代表値を用いて前記多値画像を量子化する
ことを特徴とする。
は、多値画像を量子化して画像処理を行う画像処理方法
において、前記多値画像の輝度頻度を算出し、前記算出
された輝度頻度に基づき、量子化の量子化閾値を特定
し、前記特定された量子化閾値と前記輝度頻度とに基づ
き、前記多値画像の量子化に用いる代表値を算出し、前
記算出された代表値を用いて前記多値画像を量子化する
ことを特徴とする。
【0010】
【発明の実施の形態】以下、添付図面を参照して、本発
明に係る実施の形態を詳細に説明する。
明に係る実施の形態を詳細に説明する。
【0011】図1は、本発明の実施の形態に係る量子化
処理を実行する画像処理システムの構成を示すブロック
図である。同図において、1は、文字認識処理を行なう
画像処理装置、2は画像を入力するための、例えば、ス
キャナ等の画像入力装置、3は、処理後の画像を表示す
る画像表示装置である。
処理を実行する画像処理システムの構成を示すブロック
図である。同図において、1は、文字認識処理を行なう
画像処理装置、2は画像を入力するための、例えば、ス
キャナ等の画像入力装置、3は、処理後の画像を表示す
る画像表示装置である。
【0012】上記の画像処理装置1において、101は
画像入力装置2とのインターフェースとなる入力部、1
02は処理中のデータを記憶するメモリ等の記憶部、1
03は入力画像の輝度頻度(ヒストグラム)を累計する
輝度頻度累計部ある。また、104は入力画像の量子化
閾値を算出する量子化閾値算出部、105は量子化閾値
算出部104において算出された閾値を用いて量子化画
像を作成する量子化部である。
画像入力装置2とのインターフェースとなる入力部、1
02は処理中のデータを記憶するメモリ等の記憶部、1
03は入力画像の輝度頻度(ヒストグラム)を累計する
輝度頻度累計部ある。また、104は入力画像の量子化
閾値を算出する量子化閾値算出部、105は量子化閾値
算出部104において算出された閾値を用いて量子化画
像を作成する量子化部である。
【0013】106は画像を属性毎の領域に分離する領
域分離部、107はこの領域分離により文字領域として
抽出された領域に対する文字認識処理を行なう文字認識
部、108は文字領域以外として分離された領域に対す
る各種画像処理を行なう画像処理部、109は画像表示
装置3とのインターフェースとなる出力部である。な
お、これらの各構成要素は、本装置1全体を制御するC
PU、そのCPUのプログラム等を格納しているRO
M、CPUが処理を実行時に使用するワークエリアやテ
ーブル等が定義されているRAMで構成される不図示の
制御部により統括的に制御されている。
域分離部、107はこの領域分離により文字領域として
抽出された領域に対する文字認識処理を行なう文字認識
部、108は文字領域以外として分離された領域に対す
る各種画像処理を行なう画像処理部、109は画像表示
装置3とのインターフェースとなる出力部である。な
お、これらの各構成要素は、本装置1全体を制御するC
PU、そのCPUのプログラム等を格納しているRO
M、CPUが処理を実行時に使用するワークエリアやテ
ーブル等が定義されているRAMで構成される不図示の
制御部により統括的に制御されている。
【0014】以下、上述した構成をとる本実施の形態に
係る画像処理装置において実行されるOCR処理につい
て説明する。
係る画像処理装置において実行されるOCR処理につい
て説明する。
【0015】図2は、本実施の形態に係る量子化閾値決
定方法を利用した像域分離OCR処理を示すフローチャ
ートである。
定方法を利用した像域分離OCR処理を示すフローチャ
ートである。
【0016】まず、ステップS201では、スキャナな
どの画像入力装置2より、入力部101が画像データを
入力し、記憶部102に格納する。ここでの画像データ
の入力は、8ビットの多値画像データとして行なわれ
る。続いて、ステップS202においては、ステップS
201で入力された多値画像に対して、量子化閾値算出
部104が後述する像域分離に最適な量子化閾値を決定
して、この量子化閾値により量子化部105が量子化画
像を生成する。そして、ステップS203では、領域分
離部106がステップS202で生成された量子化画像
の像域分離を行ない、その属性を付加した領域データを
画像処理部108へ出力する。続くステップS204で
は、ステップS203において分離された領域データに
ついて画像処理部108が「テキスト」と指定された領
域を2値化し、その後、2値画像から切り出す。そし
て、この2値画像に対して文字認識部107がOCR処
理を行なって、認識された文字コードを出力する。
どの画像入力装置2より、入力部101が画像データを
入力し、記憶部102に格納する。ここでの画像データ
の入力は、8ビットの多値画像データとして行なわれ
る。続いて、ステップS202においては、ステップS
201で入力された多値画像に対して、量子化閾値算出
部104が後述する像域分離に最適な量子化閾値を決定
して、この量子化閾値により量子化部105が量子化画
像を生成する。そして、ステップS203では、領域分
離部106がステップS202で生成された量子化画像
の像域分離を行ない、その属性を付加した領域データを
画像処理部108へ出力する。続くステップS204で
は、ステップS203において分離された領域データに
ついて画像処理部108が「テキスト」と指定された領
域を2値化し、その後、2値画像から切り出す。そし
て、この2値画像に対して文字認識部107がOCR処
理を行なって、認識された文字コードを出力する。
【0017】<量子化処理の説明>本実施の形態におけ
る量子化処理について説明する。
る量子化処理について説明する。
【0018】図3は、本実施の形態における量子化処理
の手順を示すフローチャートである。同図において、ま
ず、ステップS301で、8ビットの多値画像を、画像
処理装置1内の記憶部102から不図示のメモリ等に入
力し、ステップS302で処理ブロックの単位(64×
64画素)ごとに抽出する。なお、この多値画像は、ス
キャナなどの画像入力装置2により読み込まれ、あらか
じめ記憶部102に格納されているものとする。そし
て、ステップS303において、輝度頻度累計部103
が処理ブロックごとのヒストグラムを算出する。ここで
は、処理ブロック全画素を用い、8ビット、すなわち
「0」から「255」までの各デジタル値に対する頻度
を計算する。これにより、例えば、図6に示すようなヒ
ストグラムが得られる。
の手順を示すフローチャートである。同図において、ま
ず、ステップS301で、8ビットの多値画像を、画像
処理装置1内の記憶部102から不図示のメモリ等に入
力し、ステップS302で処理ブロックの単位(64×
64画素)ごとに抽出する。なお、この多値画像は、ス
キャナなどの画像入力装置2により読み込まれ、あらか
じめ記憶部102に格納されているものとする。そし
て、ステップS303において、輝度頻度累計部103
が処理ブロックごとのヒストグラムを算出する。ここで
は、処理ブロック全画素を用い、8ビット、すなわち
「0」から「255」までの各デジタル値に対する頻度
を計算する。これにより、例えば、図6に示すようなヒ
ストグラムが得られる。
【0019】次に、ステップS304において、パラメ
ータSTART,ENDに、それぞれ「0」,「25
5」とセットする。これらのパラメータSTAET,E
NDは、それぞれ、後段のステップS305やステップ
S306で求める輝度値の統計量の始点及び終点に対応
する。
ータSTART,ENDに、それぞれ「0」,「25
5」とセットする。これらのパラメータSTAET,E
NDは、それぞれ、後段のステップS305やステップ
S306で求める輝度値の統計量の始点及び終点に対応
する。
【0020】ステップS305では、STARTからE
NDまでのデジタル値に対応する画素の平均値AVを算
出する。例えば、START=0,END=255であ
れば、「0」から「255」の値を持つ画素(この場
合、全画素)の平均値AVを算出し、START=0,
END=177であれば、「0」から「177」の値を
持つ画素の平均値AVを算出する。
NDまでのデジタル値に対応する画素の平均値AVを算
出する。例えば、START=0,END=255であ
れば、「0」から「255」の値を持つ画素(この場
合、全画素)の平均値AVを算出し、START=0,
END=177であれば、「0」から「177」の値を
持つ画素の平均値AVを算出する。
【0021】ステップS306では、STARTからE
NDまでの輝度値に対応する画素のスキュー値Skを算
出する。ここで、スキュー値とは、ヒストグラム分布の
偏りを示す統計量である。このスキュー算出には、以下
に示す式(1)を用いる。
NDまでの輝度値に対応する画素のスキュー値Skを算
出する。ここで、スキュー値とは、ヒストグラム分布の
偏りを示す統計量である。このスキュー算出には、以下
に示す式(1)を用いる。
【0022】 Sk=(Σ(Xi−AV)^3)/D …(1) ここで、“^”は、べき乗を意味し、Xiは、画素の輝
度値である。また、Dは画像全体の分散値であり、以下
の式(2)により算出される。
度値である。また、Dは画像全体の分散値であり、以下
の式(2)により算出される。
【0023】 D=Σ(Xi−AV)^2 …(2) 上記の式(1)において、スキュー値は、各画素の輝度
値とその平均値との差分を3乗することにより算出され
るが、奇数乗であれば3乗に限定されるものではない。
値とその平均値との差分を3乗することにより算出され
るが、奇数乗であれば3乗に限定されるものではない。
【0024】続くステップS307,S308では、ヒ
ストグラムの偏りの方向を判断する。まず、ステップS
307では、以下の式(3)により、ヒストグラムの偏
りの方向を判断する。これは、ヒストグラムの偏りが、
平均値AVよりも小さい値の範囲にあるか否かの判断と
なる。
ストグラムの偏りの方向を判断する。まず、ステップS
307では、以下の式(3)により、ヒストグラムの偏
りの方向を判断する。これは、ヒストグラムの偏りが、
平均値AVよりも小さい値の範囲にあるか否かの判断と
なる。
【0025】 Sk<−1.0 …(3) ステップS307において、算出したスキュー値につい
て、式(3)が「真」ならば、ステップ312へすす
み、また、式(3)が「偽」ならば、ステップS308
へ進む。このステップS312では、STARTは変化
させず、ENDに平均値AVをセットする。そして、ス
テップS305に戻り、再び、START値からEND
値までの平均値AVを算出する。
て、式(3)が「真」ならば、ステップ312へすす
み、また、式(3)が「偽」ならば、ステップS308
へ進む。このステップS312では、STARTは変化
させず、ENDに平均値AVをセットする。そして、ス
テップS305に戻り、再び、START値からEND
値までの平均値AVを算出する。
【0026】一方、ステップS308では、以下に示す
式(4)により、ヒストグラムの偏り方向を判断する。
これは、ヒストグラムの偏りが、平均値AVより大きい
値の範囲にあるか否かの判断となる。
式(4)により、ヒストグラムの偏り方向を判断する。
これは、ヒストグラムの偏りが、平均値AVより大きい
値の範囲にあるか否かの判断となる。
【0027】 Sk>1.0 …(4) ステップS308において、求めたスキュー値に関して
式(4)が「真」ならば、処理をステップS313へ進
め、また、それが「偽」ならば、ステップS309へ進
む。ステップS313では、STARTに平均値AVを
セットし、ENDは変化させない。そして、ステップS
305に戻り、再び、START値からEND値までの
平均値AVを算出する。
式(4)が「真」ならば、処理をステップS313へ進
め、また、それが「偽」ならば、ステップS309へ進
む。ステップS313では、STARTに平均値AVを
セットし、ENDは変化させない。そして、ステップS
305に戻り、再び、START値からEND値までの
平均値AVを算出する。
【0028】一方、ステップS309では、ステップS
307,S308における条件が共に「偽」である場合
の平均値AVを、量子化閾値THとして設定する。そし
て、ステップS310で、量子化閾値THを用いた量子
化処理を行なう。
307,S308における条件が共に「偽」である場合
の平均値AVを、量子化閾値THとして設定する。そし
て、ステップS310で、量子化閾値THを用いた量子
化処理を行なう。
【0029】そして、ステップS311では、入力画像
の最後の処理ブロック(64×64画素)かどうかの判
断をし、最後の処理ブロックであるならば、処理を終了
し、未処理ブロックがあればステップS302に戻る。
の最後の処理ブロック(64×64画素)かどうかの判
断をし、最後の処理ブロックであるならば、処理を終了
し、未処理ブロックがあればステップS302に戻る。
【0030】この量子化の様子を、図4を参照して説明
する。
する。
【0031】上記のステップS303で算出されたヒス
トグラム中、ステップS309にて算出された量子化閾
値THの値よりも小さい領域をBB、これとは逆に、T
Hよりも大きい領域をWBとする。通常は、BB領域の
代表値を0、WB領域の代表値を1に設定して2値化を
行なう。但し、この場合、グレイ情報は失われてしま
う。
トグラム中、ステップS309にて算出された量子化閾
値THの値よりも小さい領域をBB、これとは逆に、T
Hよりも大きい領域をWBとする。通常は、BB領域の
代表値を0、WB領域の代表値を1に設定して2値化を
行なう。但し、この場合、グレイ情報は失われてしま
う。
【0032】そこで、本実施の形態では、BB領域の平
均値BBVと、WB領域の平均値WBVを算出し、これ
ら2つの平均値BBV,WBVによって画像の量子化を
行なう。
均値BBVと、WB領域の平均値WBVを算出し、これ
ら2つの平均値BBV,WBVによって画像の量子化を
行なう。
【0033】この結果、図5の501に示すように、画
像領域の多値情報が、わずか2種類の多値情報で表現さ
れることになる。なお、量子化後のデータは、図5の5
02に示すように、BBVで表わされる領域を0にて置
き換え、同様にWBVで表わされる領域を1にて置き換
えたビットマップに、BBV,WBVによるヘッダー情
報503を添付するようにしてもよい。また、BBV,
WBVは、平均値に限定されるものではなく、BB領域
とWB領域の各々の中央値としてもよい。
像領域の多値情報が、わずか2種類の多値情報で表現さ
れることになる。なお、量子化後のデータは、図5の5
02に示すように、BBVで表わされる領域を0にて置
き換え、同様にWBVで表わされる領域を1にて置き換
えたビットマップに、BBV,WBVによるヘッダー情
報503を添付するようにしてもよい。また、BBV,
WBVは、平均値に限定されるものではなく、BB領域
とWB領域の各々の中央値としてもよい。
【0034】以上説明したように、本実施の形態におけ
る量子化処理が行なわれるが、式(3),(4)で示し
た範囲は、これに限定されるものではない。
る量子化処理が行なわれるが、式(3),(4)で示し
た範囲は、これに限定されるものではない。
【0035】以下、具体的な画像の例を参照して、本実
施の形態に係る量子化処理について、更に詳細に説明す
る。図6に示すヒストグラムの例を用いて、本実施の形
態における量子化閾値THの決定処理について説明す
る。
施の形態に係る量子化処理について、更に詳細に説明す
る。図6に示すヒストグラムの例を用いて、本実施の形
態における量子化閾値THの決定処理について説明す
る。
【0036】図6は、ある画像(8ビット入力)のヒス
トグラムを示したものである。同図において、横軸は、
その左端が「0」、すなわち黒、右端が「255」、す
なわち白を表わす輝度のデジタル値であり、縦軸は、各
デジタル値の頻度を表わしている。
トグラムを示したものである。同図において、横軸は、
その左端が「0」、すなわち黒、右端が「255」、す
なわち白を表わす輝度のデジタル値であり、縦軸は、各
デジタル値の頻度を表わしている。
【0037】図7は、図6に示すようなヒストグラムを
有する画像に対して、図3に示す量子化処理において、
ステップ305とステップS306での処理の際の、各
パラメータの値の変化を示す図である。なお、図7の各
パラメータ値は、図3のステップS305及びステップ
S306を通過する回数によって、それぞれ示されてい
る。
有する画像に対して、図3に示す量子化処理において、
ステップ305とステップS306での処理の際の、各
パラメータの値の変化を示す図である。なお、図7の各
パラメータ値は、図3のステップS305及びステップ
S306を通過する回数によって、それぞれ示されてい
る。
【0038】まず、ステップS305,S306を通過
する1回目の処理では、START=0,END=25
5で平均値AV,スキュー値Skを計算し、それぞれが
「177」,「−78.9」という値を得る。この場
合、スキュー値Skが[−1.0」未満であるため、図
3のステップS312において、START=0,EN
D=177が設定される。続いて、2回目の処理では、
START=0,END=177における平均値AV、
スキュー値Skを計算し、それぞれが「91」,「−
8.6」という値を得る。これについても、そのスキュ
ー値Skが「−1.0」未満であるため、図3のステッ
プS312において、START=0,END=91が
設定される。
する1回目の処理では、START=0,END=25
5で平均値AV,スキュー値Skを計算し、それぞれが
「177」,「−78.9」という値を得る。この場
合、スキュー値Skが[−1.0」未満であるため、図
3のステップS312において、START=0,EN
D=177が設定される。続いて、2回目の処理では、
START=0,END=177における平均値AV、
スキュー値Skを計算し、それぞれが「91」,「−
8.6」という値を得る。これについても、そのスキュ
ー値Skが「−1.0」未満であるため、図3のステッ
プS312において、START=0,END=91が
設定される。
【0039】3回目の処理では、START=0,EN
D=91における平均値AV、スキュー値Skを計算
し、それぞれが「43」,「9.6」という値を得る。
この場合はスキュー値Skが「1.0」を超えるため、
図3のステップS313において、START=43,
END=91が設定される。続く4回目の処理では、S
TART=43,END=91における平均値AV、ス
キュー値Skを計算し、それぞれが「72」,「−7.
0」という値を得る。この値についてもスキュー値Sk
が「−1.0」未満であるため、図3のステップS31
2において、START=43,END=72が設定さ
れる。
D=91における平均値AV、スキュー値Skを計算
し、それぞれが「43」,「9.6」という値を得る。
この場合はスキュー値Skが「1.0」を超えるため、
図3のステップS313において、START=43,
END=91が設定される。続く4回目の処理では、S
TART=43,END=91における平均値AV、ス
キュー値Skを計算し、それぞれが「72」,「−7.
0」という値を得る。この値についてもスキュー値Sk
が「−1.0」未満であるため、図3のステップS31
2において、START=43,END=72が設定さ
れる。
【0040】5回目の処理では、START=43,E
ND=72における平均値AV、スキュー値Skを計算
し、それぞれが「58」,「−2.2」という値を得
る。これもそのスキュー値Skが「−1.0」未満であ
るため、図3のステップS312において、START
=43,END=58が設定される。そして、6回目の
処理ではSTART=43,END=58における平均
値AV、スキュー値Skを計算し、それぞれが「5
0」,「−0.4」という値を得る。
ND=72における平均値AV、スキュー値Skを計算
し、それぞれが「58」,「−2.2」という値を得
る。これもそのスキュー値Skが「−1.0」未満であ
るため、図3のステップS312において、START
=43,END=58が設定される。そして、6回目の
処理ではSTART=43,END=58における平均
値AV、スキュー値Skを計算し、それぞれが「5
0」,「−0.4」という値を得る。
【0041】ここで、スキューとSkが「−1.0」以
上、かつ「1.0」以下となり、図3のステップS30
7,S308の条件を満たさない(そこでの判定がN
O)ことになるので、処理をステップS309へ進め
て、量子化閾値THとして「50」が設定される。そし
て、続くステップS310において、この量子化閾値T
Hを用いた量子化処理が行なわれ、量子化された画像
は、画像処理装置l内の記憶部102に格納される。
上、かつ「1.0」以下となり、図3のステップS30
7,S308の条件を満たさない(そこでの判定がN
O)ことになるので、処理をステップS309へ進め
て、量子化閾値THとして「50」が設定される。そし
て、続くステップS310において、この量子化閾値T
Hを用いた量子化処理が行なわれ、量子化された画像
は、画像処理装置l内の記憶部102に格納される。
【0042】この量子化は、量子化閾値THよりも小さ
な領域頻度の平均値を代表値1とし、量子化閾値THよ
りも大さな領域頻度の平均値を代表値2とし、この2つ
の値で量子化を行なうものである。ただし、代表値とし
ては、量子化閾値THよりも小さな領域頻度と、量子化
閾値THよりも大きな領域頻度の特徴量を表わすものな
らば何でもよく、例えば、平均値の代わりに中央値であ
っても構わない。
な領域頻度の平均値を代表値1とし、量子化閾値THよ
りも大さな領域頻度の平均値を代表値2とし、この2つ
の値で量子化を行なうものである。ただし、代表値とし
ては、量子化閾値THよりも小さな領域頻度と、量子化
閾値THよりも大きな領域頻度の特徴量を表わすものな
らば何でもよく、例えば、平均値の代わりに中央値であ
っても構わない。
【0043】<像域分離処理の説明>以下、本量子化結
果を用いた像域分離処理(図2のステップS203)を
図8に示すフローチャートを参照して詳細に説明する。
果を用いた像域分離処理(図2のステップS203)を
図8に示すフローチャートを参照して詳細に説明する。
【0044】まず、図8のステップS801において、
量子化画像を入力して、それを記憶部102に格納す
る。ステップS802では、m×n画素が1画素となる
ように入力画像を間引き、像域分離用画像を生成する。
このとき、m×n画素中に1つでも黒画素が存在してい
れば、この画素を黒の1画素とする。そして、ステップ
S803では、像域分離用画像の全画素について、黒画
素が、上下、左右、斜め方向に所定数、連続している領
域を一つの領域として、領域分割を行なう。その際、領
域の検出順に番号を付すことにより、各領域に対するラ
ベル付けを行なう。
量子化画像を入力して、それを記憶部102に格納す
る。ステップS802では、m×n画素が1画素となる
ように入力画像を間引き、像域分離用画像を生成する。
このとき、m×n画素中に1つでも黒画素が存在してい
れば、この画素を黒の1画素とする。そして、ステップ
S803では、像域分離用画像の全画素について、黒画
素が、上下、左右、斜め方向に所定数、連続している領
域を一つの領域として、領域分割を行なう。その際、領
域の検出順に番号を付すことにより、各領域に対するラ
ベル付けを行なう。
【0045】次に、ステップS804において、各領域
の幅、高さ、面積領域内の黒画素密度により領域を分類
し、属性のラベル付けを行なう。領域の属性には、例え
ば、「テーブル」、「外枠領域」、「テキスト」等があ
る。そして、ステップS805では、「テキスト」とラ
ベル付けされた全ての領域の幅と高さの平均を算出し、
得られた平均幅が平均高さより大きい場合には、処理画
像は横書きであるとみなし、逆の場合は縦下記とみなす
ことにより、文字組を判断する。同時に、横書きならば
平均高さを、横書きならば平均幅をもって、一文字の文
字サイズとする。
の幅、高さ、面積領域内の黒画素密度により領域を分類
し、属性のラベル付けを行なう。領域の属性には、例え
ば、「テーブル」、「外枠領域」、「テキスト」等があ
る。そして、ステップS805では、「テキスト」とラ
ベル付けされた全ての領域の幅と高さの平均を算出し、
得られた平均幅が平均高さより大きい場合には、処理画
像は横書きであるとみなし、逆の場合は縦下記とみなす
ことにより、文字組を判断する。同時に、横書きならば
平均高さを、横書きならば平均幅をもって、一文字の文
字サイズとする。
【0046】また、像域分離用画像上の縦方向(横書き
のとき)、または横方向(縦書きのとき)の「テキス
ト」領域全てのヒストグラムから、文章の段組み、行間
隔が検出される。ステップS806では、「テキスト」
領域において、文字サイズが大きい領域については「タ
イトル」とする。
のとき)、または横方向(縦書きのとき)の「テキス
ト」領域全てのヒストグラムから、文章の段組み、行間
隔が検出される。ステップS806では、「テキスト」
領域において、文字サイズが大きい領域については「タ
イトル」とする。
【0047】ところが、従来の2値化画像による領域判
定では、タイトルと判別された領域の背景にタイトル強
調を意味する帯が存在していても背景情報が失われてい
るため、その存在を理解することは出来ない。同様の理
由で、タイトル文字自身に色付けされていても単に「黒
文字」として判定されてしまう。しかしながら、タイト
ルの背景に帯を入れたり、タイトル文字に色を付けるの
はドキュメント作成者がそのタイトルを他のタイトルと
差別化したい意図の現れにもかかわらず、全て同じ「タ
イトル」と判定してしまうが従来法の弱点であった。
定では、タイトルと判別された領域の背景にタイトル強
調を意味する帯が存在していても背景情報が失われてい
るため、その存在を理解することは出来ない。同様の理
由で、タイトル文字自身に色付けされていても単に「黒
文字」として判定されてしまう。しかしながら、タイト
ルの背景に帯を入れたり、タイトル文字に色を付けるの
はドキュメント作成者がそのタイトルを他のタイトルと
差別化したい意図の現れにもかかわらず、全て同じ「タ
イトル」と判定してしまうが従来法の弱点であった。
【0048】本量子化画像を領域分離用画像に用いる最
大の利点は正にこの点の改善にある。例えば原画中のタ
イトルが図9の901のように、タイトル文字が8ビッ
ト表現で200のグレー文字、背景が64のグレー帯で
表現されていた場合、従来の2値化画像では、タイトル
文字色と背景色の有無に関わらず図9の902のように
2値化されるため文字色ならびに背景色情報が2値化の
時点で欠落してしまう。
大の利点は正にこの点の改善にある。例えば原画中のタ
イトルが図9の901のように、タイトル文字が8ビッ
ト表現で200のグレー文字、背景が64のグレー帯で
表現されていた場合、従来の2値化画像では、タイトル
文字色と背景色の有無に関わらず図9の902のように
2値化されるため文字色ならびに背景色情報が2値化の
時点で欠落してしまう。
【0049】一方、本量子化では、図9の903のよう
に、例えば64×64画素ブロック単位の左ブロックで
算出された量子化閾値THの値よりも小さい領域、この
場合“TITLE”という文字の“T”文字領域の画素
平均値BBVは64と算出されてる。同様に同ブロック
中、量子化閾値THの値よりも大きい領域の平均値、こ
の場合背景色に相当する領域の平均値WBVは200と
算出され、このBBVおよぴWBVを通常の2値化画像
に加え64×64画素ブロック単位ごと添付するため、
タイトル文字色と背景色がかなり判別出来るようになっ
ている。
に、例えば64×64画素ブロック単位の左ブロックで
算出された量子化閾値THの値よりも小さい領域、この
場合“TITLE”という文字の“T”文字領域の画素
平均値BBVは64と算出されてる。同様に同ブロック
中、量子化閾値THの値よりも大きい領域の平均値、こ
の場合背景色に相当する領域の平均値WBVは200と
算出され、このBBVおよぴWBVを通常の2値化画像
に加え64×64画素ブロック単位ごと添付するため、
タイトル文字色と背景色がかなり判別出来るようになっ
ている。
【0050】本実施形態では、タイトルと判定された領
域に対し、図10に示す処理を施す。まず、ステップS
1001では、上述のように量子化された画像情報のみ
使用して領域判定を行なう。ここで「タイトル」と判定
された領域に対しステップS1002の処理を実行す
る。尚、図中の記号WBV,BBV,PW,PBは以下
を表わしている。
域に対し、図10に示す処理を施す。まず、ステップS
1001では、上述のように量子化された画像情報のみ
使用して領域判定を行なう。ここで「タイトル」と判定
された領域に対しステップS1002の処理を実行す
る。尚、図中の記号WBV,BBV,PW,PBは以下
を表わしている。
【0051】WBV:ブロック単位で算出された量子化
閾値THの値よりも大きい領域の平均値 BBV:ブロック単位で算出された量子化閾値THの値
よりも小さい領域の平均値 PW :原画の下地領域の代表値 PB :原画の文字領域の代表値 WBVとBBVは本量子化の際、例えば64×64画素
寮ブロック単位ごと2値化情報に加え添付されている。
一方、PWは原画の下地の代表値で、スキャナで読み込
んだ際の紙の白色濃度を意味する。PWはスキャナの機
器間差や、紙種によって多少ばらつきがあるため前もっ
て何種類かのサンプルを基にセッティングしておく。P
Bは原画の文字領域の代表値で、スキャナで読み込んだ
際の紙上に印刷された文字濃度を意味する。PBもPW
同様スキャナの機器間差や、紙種によって多少ばらつき
があるため前もって何種類かのサンプルを基にセッティ
ングしておく。
閾値THの値よりも大きい領域の平均値 BBV:ブロック単位で算出された量子化閾値THの値
よりも小さい領域の平均値 PW :原画の下地領域の代表値 PB :原画の文字領域の代表値 WBVとBBVは本量子化の際、例えば64×64画素
寮ブロック単位ごと2値化情報に加え添付されている。
一方、PWは原画の下地の代表値で、スキャナで読み込
んだ際の紙の白色濃度を意味する。PWはスキャナの機
器間差や、紙種によって多少ばらつきがあるため前もっ
て何種類かのサンプルを基にセッティングしておく。P
Bは原画の文字領域の代表値で、スキャナで読み込んだ
際の紙上に印刷された文字濃度を意味する。PBもPW
同様スキャナの機器間差や、紙種によって多少ばらつき
があるため前もって何種類かのサンプルを基にセッティ
ングしておく。
【0052】先ず、WBVとPWを比較し、WBVがP
Wより小さい場合、このブロックの背景色は紙に下地よ
りも濃い背景色が存在すると推測する。次にBBVとP
Bとを比較し、BBVがPBよりも大きい場合、このブ
ロックに印刷された文字濃度は通常の黒文字濃度よりも
薄い色文字と推測する。従って、WBVがPWより小さ
い、もしくはWBBがPBよりも大きい場合、この領域
のタイトルにはタイトルを強調する背景色か文字色が存
在すると判定し、ステップS1003に分岐し、それ以
外はステップS1004に進む。これに対してステップ
S1003では「強調タイトル」としてラベル付けを行
い、ステップS1004では「通常タイトル」としてラ
ベル付けを行う。
Wより小さい場合、このブロックの背景色は紙に下地よ
りも濃い背景色が存在すると推測する。次にBBVとP
Bとを比較し、BBVがPBよりも大きい場合、このブ
ロックに印刷された文字濃度は通常の黒文字濃度よりも
薄い色文字と推測する。従って、WBVがPWより小さ
い、もしくはWBBがPBよりも大きい場合、この領域
のタイトルにはタイトルを強調する背景色か文字色が存
在すると判定し、ステップS1003に分岐し、それ以
外はステップS1004に進む。これに対してステップ
S1003では「強調タイトル」としてラベル付けを行
い、ステップS1004では「通常タイトル」としてラ
ベル付けを行う。
【0053】そして、ステップS807では、何の関連
もなく、ばらばらに存在したままの「タイトル」領域、
「テキスト」領域を、周りの領域との間隔に応じて併合
し、一つのまとまった領域とする。
もなく、ばらばらに存在したままの「タイトル」領域、
「テキスト」領域を、周りの領域との間隔に応じて併合
し、一つのまとまった領域とする。
【0054】次に、ステップS808において、各領域
毎に属性、原画像における座標や大きさ等の領域データ
を出力する。以上の処理を行なうことにより、量子化画
像の像域分離処理を行ない、領域データが得られる。
毎に属性、原画像における座標や大きさ等の領域データ
を出力する。以上の処理を行なうことにより、量子化画
像の像域分離処理を行ない、領域データが得られる。
【0055】図11は、上述した領域データの例を示す
図である。同図に示す各領域データ項目について、以下
説明する。 ・「番号」:領域の検出順序を示す。 ・「属性」:領域の属性情報を示し、以下に示す9通り
が用意されている。
図である。同図に示す各領域データ項目について、以下
説明する。 ・「番号」:領域の検出順序を示す。 ・「属性」:領域の属性情報を示し、以下に示す9通り
が用意されている。
【0056】「ルート」 入力画像そのものである
ことを示す。
ことを示す。
【0057】「テキスト」 文字であることを示す。
【0058】「強調タイトル」強調された見出し領域で
あることを示す。
あることを示す。
【0059】「通常タイトル」通常の見出し領域である
ことを示す。
ことを示す。
【0060】「テーブル」 表領域であることを示
す。
す。
【0061】「ノイズ領域」 文字とも画像とも判断で
きなかった領域であることを示す。 「外枠領域」 罫線などの領域であることを示す。
きなかった領域であることを示す。 「外枠領域」 罫線などの領域であることを示す。
【0062】「写真画像」 写真領域であることを示
す。
す。
【0063】「線画像」 線画像領域であることを
示す。 ・「始点座標」:原画像における領域開始のX,Y座標
を示す。 ・「終点座標」:原画像における領域終了のX,Y座標
を示す。 ・「画素数」:領域内の全画素数を示す。 ・「文字組情報」:縦書き、横書き、不明の3通りの文
字組情報を示す。
示す。 ・「始点座標」:原画像における領域開始のX,Y座標
を示す。 ・「終点座標」:原画像における領域終了のX,Y座標
を示す。 ・「画素数」:領域内の全画素数を示す。 ・「文字組情報」:縦書き、横書き、不明の3通りの文
字組情報を示す。
【0064】図11に示す領域データについて、その
「属性」が「テキスト」で示される領域のみ、図8のス
テップS807における併合前の、行に関する領域デー
タ(行領域データ)を階層的に保持している。
「属性」が「テキスト」で示される領域のみ、図8のス
テップS807における併合前の、行に関する領域デー
タ(行領域データ)を階層的に保持している。
【0065】ここでは、上述のように像域分離処理が行
なわれるが、図11に示した領域データは、本実施の形
態を適用した一例に過ぎず、画像処理装置に応じて、例
えば他の情報を適宜追加しても良いし、あるいは減らし
ても良い。
なわれるが、図11に示した領域データは、本実施の形
態を適用した一例に過ぎず、画像処理装置に応じて、例
えば他の情報を適宜追加しても良いし、あるいは減らし
ても良い。
【0066】以上説明したように、本実施の形態によれ
ば、入力された多値画像の輝度頻度とその偏りを示すス
キュー値が、所定値まで収束するようにして量子化閾値
を決定し、その量子化閾値をもとに量子化を行なうこと
で、画像内の背景と対象物とを分離するために最も適し
た閾値が存在する領域を特定した後、この特定領域の平
均輝度値をもって量子化処理ができ、これにより、多値
入力画像上の領域内における各画素の輝度値を背景と対
象物との2つのクラスに分類する際の最適値を容易に求
めることができるとともに、高精細なOCR処理が実行
可能となる。
ば、入力された多値画像の輝度頻度とその偏りを示すス
キュー値が、所定値まで収束するようにして量子化閾値
を決定し、その量子化閾値をもとに量子化を行なうこと
で、画像内の背景と対象物とを分離するために最も適し
た閾値が存在する領域を特定した後、この特定領域の平
均輝度値をもって量子化処理ができ、これにより、多値
入力画像上の領域内における各画素の輝度値を背景と対
象物との2つのクラスに分類する際の最適値を容易に求
めることができるとともに、高精細なOCR処理が実行
可能となる。
【0067】なお、上述の実施の形態において、入力さ
れる画像は、8ビットの多値画像データとしたが、本発
明はこれに限定されるものではなく、例えば、カラー画
像等、量子化するために画像情報として複数ビットの情
報があれば良い。また、統計量であるスキュー値Skの
収束条件を±1.0としたが、これに限定されるもので
はない。換言すれば、スキュー値Skを用いて2値化の
閾値を決定するように構成されていれば良い。
れる画像は、8ビットの多値画像データとしたが、本発
明はこれに限定されるものではなく、例えば、カラー画
像等、量子化するために画像情報として複数ビットの情
報があれば良い。また、統計量であるスキュー値Skの
収束条件を±1.0としたが、これに限定されるもので
はない。換言すれば、スキュー値Skを用いて2値化の
閾値を決定するように構成されていれば良い。
【0068】本発明は、複数の機器(例えば、ホストコ
ンピュータ,インタフェイス機器,リーダ,プリンタな
ど)から構成されるシステムに適用しても、一つの機器
からなる装置(例えば、複写機,ファクシミリ装置な
ど)に適用してもよい。
ンピュータ,インタフェイス機器,リーダ,プリンタな
ど)から構成されるシステムに適用しても、一つの機器
からなる装置(例えば、複写機,ファクシミリ装置な
ど)に適用してもよい。
【0069】また、本発明の目的は前述した実施形態の
機能を実現するソフトウェアのプログラムコードを記録
した記憶媒体を、システム或いは装置に供給し、そのシ
ステム或いは装置のコンピュータ(CPU若しくはMP
U)が記憶媒体に格納されたプログラムコードを読出し
実行することによっても、達成されることは言うまでも
ない。
機能を実現するソフトウェアのプログラムコードを記録
した記憶媒体を、システム或いは装置に供給し、そのシ
ステム或いは装置のコンピュータ(CPU若しくはMP
U)が記憶媒体に格納されたプログラムコードを読出し
実行することによっても、達成されることは言うまでも
ない。
【0070】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0071】プログラムコードを供給するための記憶媒
体としては、例えばフロッピーディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
体としては、例えばフロッピーディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
【0072】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部又は全部
を行い、その処理によって前述した実施形態の機能が実
現される場合も含まれることは言うまでもない。
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部又は全部
を行い、その処理によって前述した実施形態の機能が実
現される場合も含まれることは言うまでもない。
【0073】更に、記憶媒体から読出されたプログラム
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書込まれた後、そのプログラムコードの指示に基
づき、その機能拡張ボードや機能拡張ユニットに備わる
CPUなどが実際の処理の一部又は全部を行い、その処
理によって前述した実施形態の機能が実現される場合も
含まれることは言うまでもない。
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書込まれた後、そのプログラムコードの指示に基
づき、その機能拡張ボードや機能拡張ユニットに備わる
CPUなどが実際の処理の一部又は全部を行い、その処
理によって前述した実施形態の機能が実現される場合も
含まれることは言うまでもない。
【0074】
【発明の効果】以上説明したように、本発明によれば、
多値入力画像の輝度頻度とその分布の偏りとに基づい
て、輝度頻度が極小となる領域を特定し、特定された領
域の平均輝度値を量子化閾値として量子化を行なうこと
により、画像内の対象物と背景濃度の間に適切な閾値を
設定でき、ブロック歪みの発生を抑えた画像を得ること
ができる。
多値入力画像の輝度頻度とその分布の偏りとに基づい
て、輝度頻度が極小となる領域を特定し、特定された領
域の平均輝度値を量子化閾値として量子化を行なうこと
により、画像内の対象物と背景濃度の間に適切な閾値を
設定でき、ブロック歪みの発生を抑えた画像を得ること
ができる。
【0075】
【図1】本実施例における画像処理システムの構成を示
すブロック図である。
すブロック図である。
【図2】本実施例における像域分離OCR処理を示すフ
ローチャートである。
ローチャートである。
【図3】本実施例における2値化処理を示すフローチャ
ートである。
ートである。
【図4】図3に示すステップS9での量子化処理を説明
するための図である。
するための図である。
【図5】量子化結果を説明するための図である。
【図6】本実施例における画像のヒストグラムの例を示
す図である。
す図である。
【図7】本実施例における2値化処理の各変数値の変換
例を示す図である。
例を示す図である。
【図8】本実施例における像域分離処理を示すフローチ
ャートである。
ャートである。
【図9】本実施例における強調タイトルを説明するため
の図である。
の図である。
【図10】本実施例におけるタイトル判定処理を示すフ
ローチャートである。
ローチャートである。
【図11】本実施例における領域データの例を示す図で
ある。
ある。
1 画像処理装置 2 画像入力装置 3 画像表示装置 101 入力部 102 記憶部 103 輝度頻度累計部 104 量子化閾値算出部 105 量子化部 106 領域分離部 107 文字認識部 108 画像処理部 109 出力部
Claims (13)
- 【請求項1】 多値画像を量子化して画像処理を行う画
像処理装置において、 前記多値画像の輝度頻度を算出する第1の算出手段と、 前記算出された輝度頻度に基づき、量子化の量子化閾値
を特定する特定手段と、 前記特定された量子化閾値と前記輝度頻度とに基づき、
前記多値画像の量子化に用いる代表値を算出する第2の
算出手段と、 前記算出された代表値を用いて前記多値画像を量子化す
る量子化手段とを有することを特徴とする画像処理装
置。 - 【請求項2】 前記量子化閾値は、前記輝度頻度のヒス
トグラム分布の偏りが所定範囲内になるように、前記ヒ
ストグラム分布を収束させたときの平均輝度値であるこ
とを特徴とする請求項1記載の画像処理装置。 - 【請求項3】 前記代表値は、前記量子化閾値により分
割される輝度頻度のヒストグラム分布の各々の分布領域
における平均輝度値であることを特徴とする請求項1記
載の画像処理装置。 - 【請求項4】 前記代表値は、前記量子化閾値により分
割される輝度頻度のヒストグラム分布の各々の分布領域
における中央の輝度値であることを特徴とする請求項1
記載の画像処理装置。 - 【請求項5】 更に、前記量子化手段により量子化され
た画像の像域分離を行い、像域分離された領域の属性を
含む領域データを出力する手段を有することを特徴とす
る請求項1記載の画像処理装置。 - 【請求項6】 更に、前記領域の属性がタイトルの場
合、強調タイトルか否かを判定する手段を有することを
特徴とする請求項5記載の画像処理装置。 - 【請求項7】 多値画像を量子化して画像処理を行う画
像処理方法であって、 前記多値画像の輝度頻度を算出し、 前記算出された輝度頻度に基づき、量子化の量子化閾値
を特定し、 前記特定された量子化閾値と前記輝度頻度とに基づき、
前記多値画像の量子化に用いる代表値を算出し、 前記算出された代表値を用いて前記多値画像を量子化す
る各ステップを有することを特徴とする画像処理方法。 - 【請求項8】 前記量子化閾値は、前記輝度頻度のヒス
トグラム分布の偏りが所定範囲内になるように、前記ヒ
ストグラム分布を収束させたときの平均輝度値であるこ
とを特徴とする請求項7記載の画像処理方法。 - 【請求項9】 前記代表値は、前記量子化閾値により分
割される輝度頻度のヒストグラム分布の各々の分布領域
における平均輝度値であることを特徴とする請求項7記
載の画像処理方法。 - 【請求項10】 前記代表値は、前記量子化閾値により
分割される輝度頻度のヒストグラム分布の各々の分布領
域における中央の輝度値であることを特徴とする請求項
7記載の画像処理方法。 - 【請求項11】 更に、前記量子化工程により量子化さ
れた画像の像域分離を行い、像域分離された領域の属性
を含む領域データを出力するステップを有することを特
徴とする請求項7記載の画像処理方法。 - 【請求項12】 更に、前記鋲域の属性がタイトルの場
合、強調タイトルか否かを判定するステップを有するこ
とを特徴とする請求項11記載の画像処理方法。 - 【請求項13】 画像処理方法のプログラムコードが格
納されたコンピュータ可読記憶媒体であって、 前記多値画像の輝度頻度を算出するステップのコード
と、 前記算出された輝度頻度に基づき、量子化の量子化閾値
を特定するステップのコードと、 前記特定された量子化閾値と前記輝度頻度とに基づき、
前記多値画像の量子化に用いる代表値を算出するステッ
プのコードと、 前記算出された代表値を用いて前記多値画像を量子化す
るステップのコードとを有することを特徴とする記憶媒
体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9335995A JPH10232926A (ja) | 1996-12-20 | 1997-12-05 | 画像処理装置及びその方法 |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP34136096 | 1996-12-20 | ||
| JP8-341360 | 1996-12-20 | ||
| JP9335995A JPH10232926A (ja) | 1996-12-20 | 1997-12-05 | 画像処理装置及びその方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH10232926A true JPH10232926A (ja) | 1998-09-02 |
Family
ID=26575325
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9335995A Withdrawn JPH10232926A (ja) | 1996-12-20 | 1997-12-05 | 画像処理装置及びその方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH10232926A (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000052645A1 (en) * | 1999-03-01 | 2000-09-08 | Matsushita Electric Industrial Co., Ltd. | Document image processor, method for extracting document title, and method for imparting document tag information |
| US7330600B2 (en) | 2002-09-05 | 2008-02-12 | Ricoh Company, Ltd. | Image processing device estimating black character color and ground color according to character-area pixels classified into two classes |
| JP2008148213A (ja) * | 2006-12-13 | 2008-06-26 | Oki Electric Ind Co Ltd | 画像処理装置、画像処理方法およびコンピュータプログラム |
| JP2009027715A (ja) * | 2007-07-20 | 2009-02-05 | Sharp Corp | 画像データの色補正方法及びシステム |
| JP2010225047A (ja) * | 2009-03-25 | 2010-10-07 | Seiko Epson Corp | ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体 |
| JP2013025319A (ja) * | 2011-07-14 | 2013-02-04 | Toshiba Tec Corp | 二値化しきい値決定装置及び方法並びにプログラム |
-
1997
- 1997-12-05 JP JP9335995A patent/JPH10232926A/ja not_active Withdrawn
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000052645A1 (en) * | 1999-03-01 | 2000-09-08 | Matsushita Electric Industrial Co., Ltd. | Document image processor, method for extracting document title, and method for imparting document tag information |
| US7035463B1 (en) | 1999-03-01 | 2006-04-25 | Matsushita Electric Industrial Co., Ltd. | Document image processor, method for extracting document title, and method for imparting document tag information |
| US7330600B2 (en) | 2002-09-05 | 2008-02-12 | Ricoh Company, Ltd. | Image processing device estimating black character color and ground color according to character-area pixels classified into two classes |
| JP2008148213A (ja) * | 2006-12-13 | 2008-06-26 | Oki Electric Ind Co Ltd | 画像処理装置、画像処理方法およびコンピュータプログラム |
| JP2009027715A (ja) * | 2007-07-20 | 2009-02-05 | Sharp Corp | 画像データの色補正方法及びシステム |
| US8223395B2 (en) | 2007-07-20 | 2012-07-17 | Sharp Laboratories Of America, Inc. | Methods and systems for refining text color in a digital image |
| JP2010225047A (ja) * | 2009-03-25 | 2010-10-07 | Seiko Epson Corp | ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体 |
| JP2013025319A (ja) * | 2011-07-14 | 2013-02-04 | Toshiba Tec Corp | 二値化しきい値決定装置及び方法並びにプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7813554B2 (en) | Method and apparatus of extracting text from document image with complex background, computer program and storage medium thereof | |
| US7961948B2 (en) | Computer-readable record medium in which a telop character extraction program is recorded, telop character extraction method and telop character extraction apparatus | |
| US7454060B2 (en) | Image processor for character recognition | |
| JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
| US7738734B2 (en) | Image processing method | |
| CN102479332B (zh) | 图像处理装置和图像处理方法 | |
| CN101453575A (zh) | 一种视频字幕信息提取方法 | |
| US7751648B2 (en) | Image processing apparatus, image processing method, and computer program | |
| JP2005071088A (ja) | 画像処理装置、画像処理方法ならびにプログラム、記憶媒体 | |
| EP1300779A2 (en) | Form recognition system, form recognition method, program and storage medium | |
| US6269186B1 (en) | Image processing apparatus and method | |
| JP2000207489A (ja) | 文字抽出方法、装置および記録媒体 | |
| JPH10232926A (ja) | 画像処理装置及びその方法 | |
| JP2002015280A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
| JP3215163B2 (ja) | 罫線識別方法及び領域識別方法 | |
| JP4409713B2 (ja) | 文書画像認識装置及び記録媒体 | |
| JP2001076094A (ja) | 文字列情報抽出装置及び方法及びその方法を記録した記録媒体 | |
| JP4162195B2 (ja) | 画像処理装置、及び画像処理プログラム | |
| JP2002279345A (ja) | 画像処理装置、画像処理方法及び該方法を実行するためのプログラムを格納したコンピュータ読み取り可能な記憶媒体 | |
| JP2894111B2 (ja) | 光学式活字文字認識装置における認識結果の総合判定方式 | |
| JP3106080B2 (ja) | 画像処理装置及びその方法 | |
| JP3086277B2 (ja) | 文書画像処理装置 | |
| JP3220226B2 (ja) | 文字列方向判別方法 | |
| JP2002049890A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
| JPH0535914A (ja) | 画像傾き検出方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20050301 |