JP2004128643A - 画像の傾き補正方法 - Google Patents
画像の傾き補正方法 Download PDFInfo
- Publication number
- JP2004128643A JP2004128643A JP2002286765A JP2002286765A JP2004128643A JP 2004128643 A JP2004128643 A JP 2004128643A JP 2002286765 A JP2002286765 A JP 2002286765A JP 2002286765 A JP2002286765 A JP 2002286765A JP 2004128643 A JP2004128643 A JP 2004128643A
- Authority
- JP
- Japan
- Prior art keywords
- image
- pixel
- value
- pixels
- luminance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Editing Of Facsimile Originals (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Image Processing (AREA)
Abstract
【課題】読み取るべき原稿上の汚れや傷み等によるノイズ情報が画像上にある場合にも、その影響を除去することのできる画像の傾き補正方法を提供する。
【解決手段】2次元に配置された画素の集合体からなる第1の画像の輪郭を抽出して第2の画像を作成する第1のステップと、第2の画像を、第1の画像の水平方向に対してあらかじめ決めておいた角度毎に回転させて、第1の画像の水平方向に、第2の画像の画素毎の輝度値を累積して、回転させた角度毎のヒストグラムを作成する第2のステップと、ヒストグラムそれぞれの分散値を算出し、最も分散値の大きなヒストグラムを作成したときの角度で第1の画像を回転させる第3のステップとを備えた。
【選択図】 図1
【解決手段】2次元に配置された画素の集合体からなる第1の画像の輪郭を抽出して第2の画像を作成する第1のステップと、第2の画像を、第1の画像の水平方向に対してあらかじめ決めておいた角度毎に回転させて、第1の画像の水平方向に、第2の画像の画素毎の輝度値を累積して、回転させた角度毎のヒストグラムを作成する第2のステップと、ヒストグラムそれぞれの分散値を算出し、最も分散値の大きなヒストグラムを作成したときの角度で第1の画像を回転させる第3のステップとを備えた。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、文書等の原稿をハンドスキャナ等で撮影した画像において生じた傾きを補正する画像の傾き補正方法に関する。
【0002】
【従来の技術】
従来から、文書等の原稿をスキャナ等で撮影し、撮影された画像を用いてOCR(Optical Character Recognition)処理を行って文字認識を行うための様々な技術が提案されている。
【0003】
特にハンドスキャナ等の比較的小型のスキャナを用いて使用者が原稿上をなぞって画像を撮影するという方式の装置においては、使用者の違いや使い方の違い等によって、撮影する際の走査方向が原稿の文字等の配列方向に対して傾くことがあり、その傾きが大きい場合には、文字を正確に切出せず文字認識率が低下するという課題があった。
【0004】
このような画像の傾きを補正する方法としては、例えば、文字画像を、2次元に配置された画素(ピクセル)の集合体からなる画像データとして、画素毎の輝度値を2値化して2次元の2値化画像データとし、各画素に対して互いに平行な多数の走査線を設定して走査を行い、2値化画像データの文字画像を示すデータを走査線毎に累積させて、その累積値につき走査線と直交する方向の分布を求めることにより投影プロフィールを作成し、この投影プロフィールの分散値にもとづいて回転補正量を求める方法が提案されてきた(例えば、特許文献1参照。)。
【0005】
【特許文献1】
特開平7−282195号公報
【0006】
【発明が解決しようとする課題】
しかしながら、前述のような画像の傾き補正方法においては、傾き補正を行う際に、まず取得された画像の2値化を行う。このため、原稿を撮影する際に、原稿上の汚れや傷み、光源のバラツキによる照度ムラがある場合、読み取り画像上に残る情報(以下、ノイズ情報と記す)が、2値化した画像上にそのまま残ってしまい、ノイズであるべき情報が文字であるとみなされ、正確な傾き検出および以後の処理における適切な文字認識ができないという課題があった。また、2値化した画像をそのまま回転するために、処理時間がかかる、という課題もあった。
【0007】
本発明は、このような課題に鑑み、読み取るべき原稿上のノイズ情報が画像上にある場合にも、その影響を除去して、正確に傾きを検出できる、かつ、処理を迅速に行うことのできる画像の傾き補正方法を提供することを目的とする。
【0008】
【課題を解決するための手段】
本発明の画像の傾き補正方法は、2次元に配置された画素の集合体からなる第1の画像の輪郭を抽出して第2の画像を作成する第1のステップと、第2の画像を、第1の画像の水平方向に対してあらかじめ決めておいた角度毎に回転させて、第1の画像の水平方向に、第2の画像の画素毎の輝度値を累積して、回転させた角度毎のヒストグラムを作成する第2のステップと、ヒストグラムそれぞれの分散値を算出し、最も分散値の大きなヒストグラムを作成したときの角度で第1の画像を回転させる第3のステップを備えたことを特徴としている。
【0009】
このような構成により、第1の画像である元画像を輪郭抽出してからヒストグラムの算出を行うので、処理スピードの向上およびノイズ情報、特に輝度変化の緩やかなノイズ情報の悪影響の除去を行うことが可能である。
【0010】
さらに、第1のステップにおいて、第1の画像の注目画素に対して隣接する2つの画素の輝度値の差を、第2の画像における注目画素の輝度値とすることによって、第2の画像を作成する構成であることにより、簡易な処理内容で、輪郭抽出を行うことが可能である。
【0011】
また、第1の画像の注目画素に対して隣接する2つの画素の輝度値の差が所定の基準値以下である注目画素について、第2の画像における注目画素の輝度値を0として第2の画像を作成する構成であることにより、ノイズ情報、特に輝度の絶対値が小さいノイズ情報の悪影響を除去することが可能である。
【0012】
また、第2のステップにおいて、ヒストグラムを、第2の画像の画素毎の輝度値を累積する代わりに、輝度値が所定の基準値以上の画素の数をカウントすることによって作成する構成により、処理を簡素化し、演算部への負荷の小さい画像の傾き補正方法を提供することが可能である。
【0013】
さらに、第1のステップにおける第2の画像の作成が、第1の画像を構成する画素のうち、一部の画素を注目画素として行われる構成であることにより、間引きによる処理スピードの向上を図ることが可能である。
【0014】
【発明の実施の形態】
以下、本発明の実施の形態について図面を用いて説明する。
【0015】
本発明の実施の形態として、本発明の画像の傾き補正方法について説明する。
【0016】
図1は、本発明の実施の形態における画像の傾き補正方法の処理ステップを示すフローチャートである。また、図2は、本発明の画像の傾き補正方法を実行するための装置の構成の一例を示す。
【0017】
図2に示したように、本発明の実施の形態における傾き補正装置30は、文字や図形等の原稿を読み取って、その画像の撮影を行う画像入力部1と、画像入力部1に接続され、画像入力部1によって撮影された画像にもとづいて以降に説明する各種の処理を行うCPU2、画像入力部1によって撮影された画像の記憶を行う、フレームメモリである第1の記憶手段3、CPU2によって各種処理演算された結果画像を格納、記憶するフレームメモリである第2の記憶手段4、さらに、CPU2に接続され、各種の演算された結果情報や必要な情報を使用者に対して表示する表示部5から構成されている。
【0018】
画像入力部1としては、光学的なデバイス等、公知のハンドスキャナに用いられるデバイスを用いることができる。
【0019】
第1の記憶手段3および第2の記憶手段4は、それぞれCPU2に接続されており、その記憶媒体としては、公知のフラッシュメモリ等を用いることができる。
【0020】
表示部5は、公知のディスプレイデバイス、例えば、LCD(Liquid Crystal Display)、EL(Electro−Luminescent)およびCRT(Cathode Ray Tube)等の公知のデバイスから任意に選ぶことができる。
【0021】
次に、本発明の実施の形態における、画像の傾き補正方法の処理ステップについて、図1に従って説明する。
【0022】
まず、画像入力部1で撮影された第1の画像(以下、元画像と記す)が、CPU2を介して第1の記憶手段3にロードされる(ステップS19)。この元画像の例を図3に示す。図3に示した元画像11は、ハンドスキャナで撮影された、部分画像を合成して得られた画像であり、ハンドスキャナを手動でスキャンした際の、スキャン方向と、文字の連なり(以下、文字行と記す)方向との差が大きく影響して、文字行が傾斜してしまっていることが分かる。本実施の形態において、元画像11は、2次元に配置された画素の集合体であり、それぞれの画素の輝度値は多値(256階調)の白黒画像である。
【0023】
また、本実施の形態においては、画像入力部1の撮影手段として、256×16画素のCCDを用い、画像を展開するための、第1の記憶手段3および第2の記憶手段4としては、図3において横×縦=1000×400画素のフレームメモリをそれぞれ用いた。
【0024】
次に、CPU2は、第1の記憶手段3に記憶された元画像11を図3における水平方向(X軸方向)に、画素毎に後述する輪郭抽出(以下、エッジ抽出と記す)処理して、図4に示すような第2の画像であるエッジ抽出画像12を得て、第2の記憶手段4に書き込む(ステップS20)。
【0025】
このエッジ抽出の方法について、図5を用いて説明する。図5は本発明の実施の形態におけるエッジ抽出方法を説明するための図であり、説明を簡単にするために、画像を構成する画素のうち任意の一行を取り出し、その処理を行うべき注目画素Aの前後の画素について模式的に示した図である。
【0026】
図5において、処理方向を図中X軸方向(このX軸方向は、元画像11を構成する画像データにおける水平方向である)とし、処理を行うべき注目画素を画素Aとすると、本発明におけるエッジ抽出方法では、注目画素Aの輝度LAの値を、両隣の画素、すなわち画素A−1と画素A+1の輝度をそれぞれ、L1、L2としたときの、L1とL2との差の絶対値であるとみなす。すなわち、
LA=|L1−L2|
と定義して演算を行い、第2の記憶手段4において、注目画素Aの輝度については、LAの値を記憶させる。
【0027】
さらに、この際、基準値Rを設けて、注目画素Aの輝度LAの値が所定の基準値Rを超える場合にはLAの値を注目画素Aの輝度値として記憶させ、注目画素Aの輝度LAの値が所定の基準値R以下である場合には、LA=0として、第2の記憶手段4の画素Aに相当する画素に輝度値として0の値を書き込む。撮影条件や原稿の状態にもよるが、実用的には、画素の輝度値が0〜255階調の256階調で表わされるとき、この所定の基準値Rの値は20程度が望ましい。
【0028】
以下、このようにして、処理方向(X軸方向)に沿って、第1の記憶手段3上の全画素について、順次エッジ抽出処理を行い、その結果を第2の記憶手段4に書き込む。
【0029】
この第2の記憶手段4に書き込まれた第2の画像であるエッジ抽出画像12の一例を図4に示す。図4に示したエッジ抽出画像12は、図3に示した元画像11を水平方向にエッジ抽出処理した結果を示している。
【0030】
元画像11とエッジ抽出画像12とを比較すると、処理方向に、文字の情報が立ち上がる部分および文字情報が失われる部分、すなわち、隣接する画素との輝度変化が大きな部分が白く(輝度が高く)抽出されていることが分かる。
【0031】
このようなエッジ抽出方法を用いることにより、元画像11の画素の輝度値を用いてエッジ抽出画像12における注目画素Aの輝度LAを算出する際に、所定の基準値R以下の輝度値が算出された場合には、その情報を無視してLA=0であるとみなして注目画素Aの輝度値として第2の記憶手段4に書き込んでエッジ抽出画像12を作成するので、原稿を読み取る際の原稿上の汚れや傷み等の比較的輝度変化の小さなノイズ情報については、エッジ抽出画像12に反映されない。
【0032】
例えば、図3の元画像11のうち、左下部分のBで示した部分のノイズ情報(名刺の端部が撮影されている)は、図4に示したエッジ抽出画像12においては、全く現われていないことが分かる。
【0033】
次に、CPU2は、第2の記憶手段4に蓄積されたエッジ抽出画像12を、元画像11の水平方向に対して、あらかじめ決められた各方向に回転させて(ステップS21)、回転させたエッジ抽出画像12それぞれのエッジヒストグラムを算出する(ステップS22)。
【0034】
このエッジヒストグラムの算出方法について、次に説明する。図6は本実施の形態の画像の傾き補正方法におけるエッジヒストグラムの一例である。本実施の形態においては、エッジ抽出画像12の回転角度を、元画像11の水平方向を0°として、0°から1°ずつ回転させた場合の、元画像11の水平方向のエッジヒストグラムを算出した。図6には、回転角度を0°から左側に1°ずつ5°まで変化させた場合のそれぞれの元画像11の水平方向のエッジヒストグラムを示している。
【0035】
ここで、エッジヒストグラムの算出は、第2の記憶手段4上で、水平方向(図4におけるX軸方向)に、輝度値を画素毎に加算することによって算出してもよいし、処理の簡素化を図るためには、輝度値が基準値Rを超える画素についてその画素数をカウントして算出してもよい。図6に示した例は、後者の処理を行った結果である。
【0036】
再度図1に戻って、各回転角度毎に算出されたエッジヒストグラムそれぞれについて、分散値σを算出し、最も分散値σが大きくなる回転角度を画像の傾き補正角度として決定する(ステップS23)。
【0037】
図7は、回転角度毎にエッジヒストグラムの分散値σを算出したものをグラフ化したものである。図7に示したように、本実施の形態においては、回転角度=左に4°のときに、最も分散値σが大きくなるので、画像の傾き補正角度を左に4°と決定する。
【0038】
そして、算出された画像の傾き補正角度分だけ、第1の記憶手段3に記憶された元画像11を回転させて、処理を終了する(ステップS24)。元画像11の回転には、公知の方法、例えば、アフィン変換等を用いることができる。
【0039】
図8に、本実施の形態の画像の傾き補正方法によって傾き補正された画像13の一例を示す。図8に示された傾き補正された画像13は、図3に示した元画像11と比較して、原稿の傾きが補正されていることが分かる。なお、このようにして得られた補正された画像13を表示部5に表示して、使用者に確認を促す構成であってもよい。
【0040】
次に、本実施の形態の画像の傾き補正方法を用いることにより、原稿の文字認識精度が向上したことを、名刺読み取りの正読率を用いて示す。
【0041】
この正読率の算出は、第1の記憶手段3に記憶された画像にもとづいて、CPU2でOCR処理を行い、その結果正しく認識された文字の割合を算出することによって行う。サンプルとしては、ランダムに名刺20枚を用いて認識を行った。撮影し、OCRに供した文字数は、電話番号390文字、メールアドレスおよびURLは1026文字である。
【0042】
まず名刺中の電話番号の場合、画像の傾き補正を行わない場合の正読率に対して、本実施の形態の画像の傾き補正を行った場合には、約18%正読率が向上することが分かった。
【0043】
また、名刺中のメールアドレスおよびURLについても、画像の傾き補正を行わない場合の正読率に対して、本実施の形態の画像の傾き補正を行った場合には、約20%正読率が向上し、より高い正読率を得ることができた。
【0044】
また、電話番号、メールアドレス、URL全体においても、画像の傾き補正を行わない場合と比較して、本実施の形態の画像の傾き補正方法を用いれば、約19%正読率を向上することができた。
【0045】
なお、本実施の形態においては、元画像11の全画素について演算を行うことにより、エッジ抽出画像12を算出する例を示したが、例えば、さらに演算スピードの高速化およびCPUの負担軽減を図るために、元画像11のうち、エッジ抽出処理を、全画素について行わずに、所定の画素毎に間引いて行う構成であってもよい。実用的には、元画像11のうち、縦横それぞれ4画素毎にエッジ抽出処理を行っても、正読率にはほとんど悪影響がないことが確認されている。
【0046】
例えばこのような4画素毎にエッジ抽出処理を行うことにより、従来のエッジ抽出を行わないで画像の傾き補正を行う場合と比較して、回転処理を行う画像のサイズが16分の1になるので、大幅な演算量の削減および演算スピードの向上を図ることができる。携帯電話装置等の携帯型情報装置での処理を考慮した場合、演算スピードが速い、すなわち、CPUに負担の少ない処理方法が望ましく、本発明の画像の傾き補正方法は、携帯型情報装置での処理に適しているということができる。
【0047】
なお、本実施の形態においては、元画像からエッジ抽出を行う方向を、元画像の画像データにおける水平方向であるとして説明を行ったが、本発明の画像の傾き補正方法はこれに限定されるものではない。元画像に対して垂直方向にエッジ抽出を行ったり、他の任意の方向にエッジ抽出を行っても同様の効果が得られることはいうまでもない。
【0048】
【発明の効果】
以上述べたように、本発明の画像の傾き補正方法を用いれば、エッジ抽出処理を行うので、演算スピードが向上し、CPUの負担が軽減するとともに、エッジ抽出の際に閾値を設けることにより、ノイズ情報等の影響の少ない画像の傾き補正方法を実現することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態における画像の傾き補正方法の処理ステップを示すフローチャート
【図2】本発明の実施の形態における画像の傾き補正装置の構成の一例を示すブロック図
【図3】本発明の実施の形態における元画像の一例を示す図
【図4】本発明の実施の形態におけるエッジ抽出画像の一例を示す図
【図5】本発明の実施の形態におけるエッジ抽出方法を説明するための図
【図6】本発明の実施の形態におけるエッジヒストグラムの一例を示す図
【図7】本発明の実施の形態における傾きと分散値との相関を示す図
【図8】本発明の実施の形態における画像の傾き補正後の画像の一例を示す図
【符号の説明】
1 画像入力部
2 CPU(演算部)
3 第1の記憶手段
4 第2の記憶手段
5 表示部
11 元画像
12 エッジ抽出画像
13 補正された画像
30 傾き補正装置
【発明の属する技術分野】
本発明は、文書等の原稿をハンドスキャナ等で撮影した画像において生じた傾きを補正する画像の傾き補正方法に関する。
【0002】
【従来の技術】
従来から、文書等の原稿をスキャナ等で撮影し、撮影された画像を用いてOCR(Optical Character Recognition)処理を行って文字認識を行うための様々な技術が提案されている。
【0003】
特にハンドスキャナ等の比較的小型のスキャナを用いて使用者が原稿上をなぞって画像を撮影するという方式の装置においては、使用者の違いや使い方の違い等によって、撮影する際の走査方向が原稿の文字等の配列方向に対して傾くことがあり、その傾きが大きい場合には、文字を正確に切出せず文字認識率が低下するという課題があった。
【0004】
このような画像の傾きを補正する方法としては、例えば、文字画像を、2次元に配置された画素(ピクセル)の集合体からなる画像データとして、画素毎の輝度値を2値化して2次元の2値化画像データとし、各画素に対して互いに平行な多数の走査線を設定して走査を行い、2値化画像データの文字画像を示すデータを走査線毎に累積させて、その累積値につき走査線と直交する方向の分布を求めることにより投影プロフィールを作成し、この投影プロフィールの分散値にもとづいて回転補正量を求める方法が提案されてきた(例えば、特許文献1参照。)。
【0005】
【特許文献1】
特開平7−282195号公報
【0006】
【発明が解決しようとする課題】
しかしながら、前述のような画像の傾き補正方法においては、傾き補正を行う際に、まず取得された画像の2値化を行う。このため、原稿を撮影する際に、原稿上の汚れや傷み、光源のバラツキによる照度ムラがある場合、読み取り画像上に残る情報(以下、ノイズ情報と記す)が、2値化した画像上にそのまま残ってしまい、ノイズであるべき情報が文字であるとみなされ、正確な傾き検出および以後の処理における適切な文字認識ができないという課題があった。また、2値化した画像をそのまま回転するために、処理時間がかかる、という課題もあった。
【0007】
本発明は、このような課題に鑑み、読み取るべき原稿上のノイズ情報が画像上にある場合にも、その影響を除去して、正確に傾きを検出できる、かつ、処理を迅速に行うことのできる画像の傾き補正方法を提供することを目的とする。
【0008】
【課題を解決するための手段】
本発明の画像の傾き補正方法は、2次元に配置された画素の集合体からなる第1の画像の輪郭を抽出して第2の画像を作成する第1のステップと、第2の画像を、第1の画像の水平方向に対してあらかじめ決めておいた角度毎に回転させて、第1の画像の水平方向に、第2の画像の画素毎の輝度値を累積して、回転させた角度毎のヒストグラムを作成する第2のステップと、ヒストグラムそれぞれの分散値を算出し、最も分散値の大きなヒストグラムを作成したときの角度で第1の画像を回転させる第3のステップを備えたことを特徴としている。
【0009】
このような構成により、第1の画像である元画像を輪郭抽出してからヒストグラムの算出を行うので、処理スピードの向上およびノイズ情報、特に輝度変化の緩やかなノイズ情報の悪影響の除去を行うことが可能である。
【0010】
さらに、第1のステップにおいて、第1の画像の注目画素に対して隣接する2つの画素の輝度値の差を、第2の画像における注目画素の輝度値とすることによって、第2の画像を作成する構成であることにより、簡易な処理内容で、輪郭抽出を行うことが可能である。
【0011】
また、第1の画像の注目画素に対して隣接する2つの画素の輝度値の差が所定の基準値以下である注目画素について、第2の画像における注目画素の輝度値を0として第2の画像を作成する構成であることにより、ノイズ情報、特に輝度の絶対値が小さいノイズ情報の悪影響を除去することが可能である。
【0012】
また、第2のステップにおいて、ヒストグラムを、第2の画像の画素毎の輝度値を累積する代わりに、輝度値が所定の基準値以上の画素の数をカウントすることによって作成する構成により、処理を簡素化し、演算部への負荷の小さい画像の傾き補正方法を提供することが可能である。
【0013】
さらに、第1のステップにおける第2の画像の作成が、第1の画像を構成する画素のうち、一部の画素を注目画素として行われる構成であることにより、間引きによる処理スピードの向上を図ることが可能である。
【0014】
【発明の実施の形態】
以下、本発明の実施の形態について図面を用いて説明する。
【0015】
本発明の実施の形態として、本発明の画像の傾き補正方法について説明する。
【0016】
図1は、本発明の実施の形態における画像の傾き補正方法の処理ステップを示すフローチャートである。また、図2は、本発明の画像の傾き補正方法を実行するための装置の構成の一例を示す。
【0017】
図2に示したように、本発明の実施の形態における傾き補正装置30は、文字や図形等の原稿を読み取って、その画像の撮影を行う画像入力部1と、画像入力部1に接続され、画像入力部1によって撮影された画像にもとづいて以降に説明する各種の処理を行うCPU2、画像入力部1によって撮影された画像の記憶を行う、フレームメモリである第1の記憶手段3、CPU2によって各種処理演算された結果画像を格納、記憶するフレームメモリである第2の記憶手段4、さらに、CPU2に接続され、各種の演算された結果情報や必要な情報を使用者に対して表示する表示部5から構成されている。
【0018】
画像入力部1としては、光学的なデバイス等、公知のハンドスキャナに用いられるデバイスを用いることができる。
【0019】
第1の記憶手段3および第2の記憶手段4は、それぞれCPU2に接続されており、その記憶媒体としては、公知のフラッシュメモリ等を用いることができる。
【0020】
表示部5は、公知のディスプレイデバイス、例えば、LCD(Liquid Crystal Display)、EL(Electro−Luminescent)およびCRT(Cathode Ray Tube)等の公知のデバイスから任意に選ぶことができる。
【0021】
次に、本発明の実施の形態における、画像の傾き補正方法の処理ステップについて、図1に従って説明する。
【0022】
まず、画像入力部1で撮影された第1の画像(以下、元画像と記す)が、CPU2を介して第1の記憶手段3にロードされる(ステップS19)。この元画像の例を図3に示す。図3に示した元画像11は、ハンドスキャナで撮影された、部分画像を合成して得られた画像であり、ハンドスキャナを手動でスキャンした際の、スキャン方向と、文字の連なり(以下、文字行と記す)方向との差が大きく影響して、文字行が傾斜してしまっていることが分かる。本実施の形態において、元画像11は、2次元に配置された画素の集合体であり、それぞれの画素の輝度値は多値(256階調)の白黒画像である。
【0023】
また、本実施の形態においては、画像入力部1の撮影手段として、256×16画素のCCDを用い、画像を展開するための、第1の記憶手段3および第2の記憶手段4としては、図3において横×縦=1000×400画素のフレームメモリをそれぞれ用いた。
【0024】
次に、CPU2は、第1の記憶手段3に記憶された元画像11を図3における水平方向(X軸方向)に、画素毎に後述する輪郭抽出(以下、エッジ抽出と記す)処理して、図4に示すような第2の画像であるエッジ抽出画像12を得て、第2の記憶手段4に書き込む(ステップS20)。
【0025】
このエッジ抽出の方法について、図5を用いて説明する。図5は本発明の実施の形態におけるエッジ抽出方法を説明するための図であり、説明を簡単にするために、画像を構成する画素のうち任意の一行を取り出し、その処理を行うべき注目画素Aの前後の画素について模式的に示した図である。
【0026】
図5において、処理方向を図中X軸方向(このX軸方向は、元画像11を構成する画像データにおける水平方向である)とし、処理を行うべき注目画素を画素Aとすると、本発明におけるエッジ抽出方法では、注目画素Aの輝度LAの値を、両隣の画素、すなわち画素A−1と画素A+1の輝度をそれぞれ、L1、L2としたときの、L1とL2との差の絶対値であるとみなす。すなわち、
LA=|L1−L2|
と定義して演算を行い、第2の記憶手段4において、注目画素Aの輝度については、LAの値を記憶させる。
【0027】
さらに、この際、基準値Rを設けて、注目画素Aの輝度LAの値が所定の基準値Rを超える場合にはLAの値を注目画素Aの輝度値として記憶させ、注目画素Aの輝度LAの値が所定の基準値R以下である場合には、LA=0として、第2の記憶手段4の画素Aに相当する画素に輝度値として0の値を書き込む。撮影条件や原稿の状態にもよるが、実用的には、画素の輝度値が0〜255階調の256階調で表わされるとき、この所定の基準値Rの値は20程度が望ましい。
【0028】
以下、このようにして、処理方向(X軸方向)に沿って、第1の記憶手段3上の全画素について、順次エッジ抽出処理を行い、その結果を第2の記憶手段4に書き込む。
【0029】
この第2の記憶手段4に書き込まれた第2の画像であるエッジ抽出画像12の一例を図4に示す。図4に示したエッジ抽出画像12は、図3に示した元画像11を水平方向にエッジ抽出処理した結果を示している。
【0030】
元画像11とエッジ抽出画像12とを比較すると、処理方向に、文字の情報が立ち上がる部分および文字情報が失われる部分、すなわち、隣接する画素との輝度変化が大きな部分が白く(輝度が高く)抽出されていることが分かる。
【0031】
このようなエッジ抽出方法を用いることにより、元画像11の画素の輝度値を用いてエッジ抽出画像12における注目画素Aの輝度LAを算出する際に、所定の基準値R以下の輝度値が算出された場合には、その情報を無視してLA=0であるとみなして注目画素Aの輝度値として第2の記憶手段4に書き込んでエッジ抽出画像12を作成するので、原稿を読み取る際の原稿上の汚れや傷み等の比較的輝度変化の小さなノイズ情報については、エッジ抽出画像12に反映されない。
【0032】
例えば、図3の元画像11のうち、左下部分のBで示した部分のノイズ情報(名刺の端部が撮影されている)は、図4に示したエッジ抽出画像12においては、全く現われていないことが分かる。
【0033】
次に、CPU2は、第2の記憶手段4に蓄積されたエッジ抽出画像12を、元画像11の水平方向に対して、あらかじめ決められた各方向に回転させて(ステップS21)、回転させたエッジ抽出画像12それぞれのエッジヒストグラムを算出する(ステップS22)。
【0034】
このエッジヒストグラムの算出方法について、次に説明する。図6は本実施の形態の画像の傾き補正方法におけるエッジヒストグラムの一例である。本実施の形態においては、エッジ抽出画像12の回転角度を、元画像11の水平方向を0°として、0°から1°ずつ回転させた場合の、元画像11の水平方向のエッジヒストグラムを算出した。図6には、回転角度を0°から左側に1°ずつ5°まで変化させた場合のそれぞれの元画像11の水平方向のエッジヒストグラムを示している。
【0035】
ここで、エッジヒストグラムの算出は、第2の記憶手段4上で、水平方向(図4におけるX軸方向)に、輝度値を画素毎に加算することによって算出してもよいし、処理の簡素化を図るためには、輝度値が基準値Rを超える画素についてその画素数をカウントして算出してもよい。図6に示した例は、後者の処理を行った結果である。
【0036】
再度図1に戻って、各回転角度毎に算出されたエッジヒストグラムそれぞれについて、分散値σを算出し、最も分散値σが大きくなる回転角度を画像の傾き補正角度として決定する(ステップS23)。
【0037】
図7は、回転角度毎にエッジヒストグラムの分散値σを算出したものをグラフ化したものである。図7に示したように、本実施の形態においては、回転角度=左に4°のときに、最も分散値σが大きくなるので、画像の傾き補正角度を左に4°と決定する。
【0038】
そして、算出された画像の傾き補正角度分だけ、第1の記憶手段3に記憶された元画像11を回転させて、処理を終了する(ステップS24)。元画像11の回転には、公知の方法、例えば、アフィン変換等を用いることができる。
【0039】
図8に、本実施の形態の画像の傾き補正方法によって傾き補正された画像13の一例を示す。図8に示された傾き補正された画像13は、図3に示した元画像11と比較して、原稿の傾きが補正されていることが分かる。なお、このようにして得られた補正された画像13を表示部5に表示して、使用者に確認を促す構成であってもよい。
【0040】
次に、本実施の形態の画像の傾き補正方法を用いることにより、原稿の文字認識精度が向上したことを、名刺読み取りの正読率を用いて示す。
【0041】
この正読率の算出は、第1の記憶手段3に記憶された画像にもとづいて、CPU2でOCR処理を行い、その結果正しく認識された文字の割合を算出することによって行う。サンプルとしては、ランダムに名刺20枚を用いて認識を行った。撮影し、OCRに供した文字数は、電話番号390文字、メールアドレスおよびURLは1026文字である。
【0042】
まず名刺中の電話番号の場合、画像の傾き補正を行わない場合の正読率に対して、本実施の形態の画像の傾き補正を行った場合には、約18%正読率が向上することが分かった。
【0043】
また、名刺中のメールアドレスおよびURLについても、画像の傾き補正を行わない場合の正読率に対して、本実施の形態の画像の傾き補正を行った場合には、約20%正読率が向上し、より高い正読率を得ることができた。
【0044】
また、電話番号、メールアドレス、URL全体においても、画像の傾き補正を行わない場合と比較して、本実施の形態の画像の傾き補正方法を用いれば、約19%正読率を向上することができた。
【0045】
なお、本実施の形態においては、元画像11の全画素について演算を行うことにより、エッジ抽出画像12を算出する例を示したが、例えば、さらに演算スピードの高速化およびCPUの負担軽減を図るために、元画像11のうち、エッジ抽出処理を、全画素について行わずに、所定の画素毎に間引いて行う構成であってもよい。実用的には、元画像11のうち、縦横それぞれ4画素毎にエッジ抽出処理を行っても、正読率にはほとんど悪影響がないことが確認されている。
【0046】
例えばこのような4画素毎にエッジ抽出処理を行うことにより、従来のエッジ抽出を行わないで画像の傾き補正を行う場合と比較して、回転処理を行う画像のサイズが16分の1になるので、大幅な演算量の削減および演算スピードの向上を図ることができる。携帯電話装置等の携帯型情報装置での処理を考慮した場合、演算スピードが速い、すなわち、CPUに負担の少ない処理方法が望ましく、本発明の画像の傾き補正方法は、携帯型情報装置での処理に適しているということができる。
【0047】
なお、本実施の形態においては、元画像からエッジ抽出を行う方向を、元画像の画像データにおける水平方向であるとして説明を行ったが、本発明の画像の傾き補正方法はこれに限定されるものではない。元画像に対して垂直方向にエッジ抽出を行ったり、他の任意の方向にエッジ抽出を行っても同様の効果が得られることはいうまでもない。
【0048】
【発明の効果】
以上述べたように、本発明の画像の傾き補正方法を用いれば、エッジ抽出処理を行うので、演算スピードが向上し、CPUの負担が軽減するとともに、エッジ抽出の際に閾値を設けることにより、ノイズ情報等の影響の少ない画像の傾き補正方法を実現することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態における画像の傾き補正方法の処理ステップを示すフローチャート
【図2】本発明の実施の形態における画像の傾き補正装置の構成の一例を示すブロック図
【図3】本発明の実施の形態における元画像の一例を示す図
【図4】本発明の実施の形態におけるエッジ抽出画像の一例を示す図
【図5】本発明の実施の形態におけるエッジ抽出方法を説明するための図
【図6】本発明の実施の形態におけるエッジヒストグラムの一例を示す図
【図7】本発明の実施の形態における傾きと分散値との相関を示す図
【図8】本発明の実施の形態における画像の傾き補正後の画像の一例を示す図
【符号の説明】
1 画像入力部
2 CPU(演算部)
3 第1の記憶手段
4 第2の記憶手段
5 表示部
11 元画像
12 エッジ抽出画像
13 補正された画像
30 傾き補正装置
Claims (5)
- 2次元に配置された画素の集合体からなる第1の画像の輪郭を抽出して第2の画像を作成する第1のステップと、
前記第2の画像を、前記第1の画像の水平方向に対してあらかじめ決めておいた角度毎に回転させて、前記第1の画像の水平方向に、前記第2の画像の画素毎の輝度値を累積して、回転させた角度毎のヒストグラムを作成する第2のステップと、
前記ヒストグラムそれぞれの分散値を算出し、最も分散値の大きなヒストグラムを作成したときの角度で前記第1の画像を回転させる第3のステップとを備えたことを特徴とする画像の傾き補正方法。 - 前記第1のステップにおいて、前記第1の画像の注目画素に対して隣接する2つの画素の輝度値の差を、前記第2の画像における注目画素の輝度値とすることによって、前記第2の画像を作成することを特徴とする請求項1に記載の画像の傾き補正方法。
- 前記第1の画像の注目画素に対して隣接する2つの画素の輝度値の差が所定の基準値以下である前記注目画素について、前記第2の画像における前記注目画素の輝度値を0として前記第2の画像を作成することを特徴とする請求項2に記載の画像の傾き補正方法。
- 前記第2のステップにおいて、前記ヒストグラムを、前記第2の画像の画素毎の輝度値を累積する代わりに、輝度値が所定の基準値以上の画素の数をカウントすることによって作成することを特徴とする請求項1から請求項3までのいずれか1項に記載の画像の傾き補正方法。
- 前記第1のステップにおける前記第2の画像の作成が、前記第1の画像を構成する画素のうち、一部の画素を前記注目画素として行われることを特徴とする請求項1から請求項4までのいずれか1項に記載の画像の傾き補正方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002286765A JP2004128643A (ja) | 2002-09-30 | 2002-09-30 | 画像の傾き補正方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002286765A JP2004128643A (ja) | 2002-09-30 | 2002-09-30 | 画像の傾き補正方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2004128643A true JP2004128643A (ja) | 2004-04-22 |
Family
ID=32279748
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002286765A Pending JP2004128643A (ja) | 2002-09-30 | 2002-09-30 | 画像の傾き補正方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2004128643A (ja) |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008061163A (ja) * | 2006-09-04 | 2008-03-13 | Samsung Techwin Co Ltd | 撮像装置および撮像方法 |
| US7430021B2 (en) | 2004-06-24 | 2008-09-30 | Hitachi, Ltd. | Video display apparatus having contour correction function |
| JP2010200288A (ja) * | 2009-02-20 | 2010-09-09 | Avermedia Information Inc | 傾斜画像データを検出及び補正するための方法及び装置 |
| JP2010224987A (ja) * | 2009-03-24 | 2010-10-07 | Sharp Corp | 画像処理装置、画像処理方法、プログラム、および記録媒体 |
| KR101561443B1 (ko) * | 2014-03-21 | 2015-10-19 | 주식회사 인프라웨어 | 히스토그램을 이용한 문서 이미지 보정 방법 및 장치 |
| JP2021006853A (ja) * | 2019-06-28 | 2021-01-21 | 京セラドキュメントソリューションズ株式会社 | ベルト検査システムおよびベルト検査プログラム |
| CN117237960A (zh) * | 2023-08-08 | 2023-12-15 | 深圳市华汉伟业科技有限公司 | 一种文本校正方法、计算机可读存储介质 |
-
2002
- 2002-09-30 JP JP2002286765A patent/JP2004128643A/ja active Pending
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7430021B2 (en) | 2004-06-24 | 2008-09-30 | Hitachi, Ltd. | Video display apparatus having contour correction function |
| JP2008061163A (ja) * | 2006-09-04 | 2008-03-13 | Samsung Techwin Co Ltd | 撮像装置および撮像方法 |
| JP2010200288A (ja) * | 2009-02-20 | 2010-09-09 | Avermedia Information Inc | 傾斜画像データを検出及び補正するための方法及び装置 |
| US8358871B2 (en) | 2009-02-20 | 2013-01-22 | Avermedia Information, Inc. | Method and device for detecting and correcting skewed image data |
| JP2010224987A (ja) * | 2009-03-24 | 2010-10-07 | Sharp Corp | 画像処理装置、画像処理方法、プログラム、および記録媒体 |
| KR101561443B1 (ko) * | 2014-03-21 | 2015-10-19 | 주식회사 인프라웨어 | 히스토그램을 이용한 문서 이미지 보정 방법 및 장치 |
| JP2021006853A (ja) * | 2019-06-28 | 2021-01-21 | 京セラドキュメントソリューションズ株式会社 | ベルト検査システムおよびベルト検査プログラム |
| CN117237960A (zh) * | 2023-08-08 | 2023-12-15 | 深圳市华汉伟业科技有限公司 | 一种文本校正方法、计算机可读存储介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6577762B1 (en) | Background surface thresholding | |
| US8229172B2 (en) | Algorithms for estimating precise and relative object distances in a scene | |
| US11156564B2 (en) | Dirt detection on screen | |
| US7606439B2 (en) | Method for extracting raw data from an image resulting from a camera shot | |
| US7634151B2 (en) | Imaging systems, articles of manufacture, and imaging methods | |
| US8116521B2 (en) | Moving body image extraction apparatus and computer readable storage medium storing program | |
| US20060045372A1 (en) | Image-capturing device and method for removing strangers from an image | |
| US8068697B2 (en) | Real time video stabilizer | |
| US20100246972A1 (en) | Image processing apparatus, image processing method, and recording medium | |
| CN114202519B (zh) | 视频闪烁确定方法、装置、设备及存储介质 | |
| US8780215B2 (en) | Apparatus and method for processing an image to correct image distortion caused by a hand shake | |
| US20130120438A1 (en) | Methods and Apparatuses for Generating Co-Salient Thumbnails for Digital Images | |
| JP2004199679A (ja) | 画像データ処理方法 | |
| US8538191B2 (en) | Image correction apparatus and method for eliminating lighting component | |
| JP5870745B2 (ja) | 画像処理装置、二値化閾値算出方法及びコンピュータプログラム | |
| EP2536123B1 (en) | Image processing method and image processing apparatus | |
| JP2004128643A (ja) | 画像の傾き補正方法 | |
| US20050129333A1 (en) | Image correction device and image correction method | |
| US20210281742A1 (en) | Document detections from video images | |
| JP4966080B2 (ja) | 対象物検出装置 | |
| EP1453299A3 (en) | Image processing method and apparatus for recovering from reading faults | |
| Nagalakshmi et al. | Image acquisition, noise removal, edge detection methods in image processing using Matlab for prawn species identification | |
| JP3881455B2 (ja) | 画像補正装置及び画像補正方法並びに画像補正方法を記録した媒体 | |
| CN120031740B (zh) | 一种去除图像大型锯齿的方法、系统、终端及存储介质 | |
| JP3949954B2 (ja) | ドロップアウトカラー識別処理プログラム、方法、および装置 |