JP5968098B2 - 画像処理装置、画像処理方法、プログラム、及び記憶媒体 - Google Patents

画像処理装置、画像処理方法、プログラム、及び記憶媒体 Download PDF

Info

Publication number
JP5968098B2
JP5968098B2 JP2012135124A JP2012135124A JP5968098B2 JP 5968098 B2 JP5968098 B2 JP 5968098B2 JP 2012135124 A JP2012135124 A JP 2012135124A JP 2012135124 A JP2012135124 A JP 2012135124A JP 5968098 B2 JP5968098 B2 JP 5968098B2
Authority
JP
Japan
Prior art keywords
cluster
pixel
foreground
color
background
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012135124A
Other languages
English (en)
Other versions
JP2013257843A (ja
Inventor
暁艶 戴
暁艶 戴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2012135124A priority Critical patent/JP5968098B2/ja
Priority to US13/910,528 priority patent/US9152878B2/en
Publication of JP2013257843A publication Critical patent/JP2013257843A/ja
Application granted granted Critical
Publication of JP5968098B2 publication Critical patent/JP5968098B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Description

本発明は画像処理装置、画像処理方法、プログラム、及び記憶媒体に関し、特に背景領域と被写体領域とを含む画像から被写体領域を抽出する技術に関する。
従来から、画像における被写体抽出技術、(以下、セグメンテーション技術とも呼ぶ)が研究されて、映像編集における画像合成や被写体のリフォーカス等の目的で応用されている。被写体を、以下、前景とも呼び、被写体抽出は、以下、前景背景分離とも呼ぶ。
被写体抽出技術として、背景差分法やクロマキー法が良く知られている。背景差分法は、被写体を含まない背景のみの画像を予め撮影しておき、被写体を含む画像と背景のみの画像とを比較して、その差分を計算することにより被写体を抽出する手法である。クロマキー法は映画業界で標準的に用いられている手法で、背景領域を一定の色にして、被写体の色に背景色が含まれないことを仮定して被写体を抽出する手法である。
しかしながら、背景差分法もクロマキー法も背景の制御が容易な環境のみで使われ、被写体に背景と近い色の部分がある場合などにおいて、被写体領域が背景領域として誤判定されやすいという問題がある。
近年、特定の背景を必要としない被写体抽出方法として、画像中の被写体領域を含む情報を大まかに予め手動で与え、任意の背景を有する画像から被写体を分離する方法が提案されている(非特許文献1)。非特許文献1に記載の方法(以下、グラブカット処理と呼ぶ)は、エネルギー関数の最小化に基づいてグローバルな最優解を解くものである。グラブカットは精度良く被写体の抽出が出来、また、手動指定も簡単なため、セグメンテーションの研究分野では注目が集められている。
ROTHER et al., Grabcut - Interactive foreground extraction using iterated graph cuts, ACM Trans. Graph., vol. 23, No. 3, 2004, pp. 309-314
しかしながら、非特許文献1に記載のグラブカット処理方法を用いる場合、背景の一部が被写体(前景)として誤抽出されることがある。以下、この課題について説明する。
グラブカット処理は、以下のように行われる。まずステップS1において、被写体が含まれる領域が指定される。通常、この領域指定はユーザによって行われ、被写体を包含する矩形領域が指定される。図1は入力画像の例を示し、図1にはまたユーザによって指定された矩形領域が示されている。
ここで、ユーザによって指定されなかった領域は背景として扱われる。以下、ユーザによって指定されなかった領域のことを確定背景領域と呼ぶ。確定背景領域内の画素は背景を表す画素(背景画素)であり、確定背景領域内の画素のことを確定背景画素と呼ぶ。一方で、ユーザによって指定された領域には、通常は前景と背景との双方が含まれている。以下、ユーザによって指定された領域のことを前景候補領域と呼び、前景候補領域内の画素を前景候補画素と呼ぶ。以下の処理によって、前景候補領域内の画素が前景を表す画素(前景画素)であるか、背景を表す画素(背景画素)であるかが判定される。
次にステップS2において、前景候補領域内の画素群と、確定背景領域内の画素群とのそれぞれについて、クラスタリング処理が行われる。クラスタリングは画素値に基づいて行われる。すなわち、類似の画素値を有する画素が同じクラスタに含まれるように、クラスタリングは行われる。このクラスタリングは、前景候補領域内の画素群と、確定背景領域内の画素群とのそれぞれについて、独立に行われる。すなわち、確定背景領域内の画素は、それぞれ異なる色特性を有するいくつかの背景クラスタへと分類される。また同様に、前景候補領域内の画素は、それぞれ異なる色特性を有するいくつかの前景クラスタへと分類される。
次にステップS3において、グラフについてのエネルギー関数のパラメータが設定される。具体的には、それぞれの画素mについて、隣接画素nとの類似度を表す指標N(m,n)と、前景らしさを表す指標DFore(m)と、背景らしさを表す指標Dback(m)が算出される。
指標N(m,n)は、画素mと画素nとの色の類似度を表すパラメータであって、色が類似しているほど大きい値をとる。指標N(m,n)は、例えば以下の式(1)に従って算出されうる。
ここで、γは予め設定されている値であり、dist(m,n)は画素mと隣接画素nとの間の物理距離(画像上の画素間の距離)であり、
は画素mと隣接画素nとの間の色距離(色の違いの大きさ)である。指標N(m,n)は、互いに隣接する画素m,nの全ての組み合わせについて算出される。もっとも、指標N(m,n)は2つの画素m,nの全ての組み合わせについて、又は互いに近接する画素m,nの全ての組み合わせについて算出されてもよい。この指標N(m,n)を考慮することにより、互いに色が類似している画素の間よりも、互いに色が類似していない画素の間に、前景と背景との間の境界が設定されやすくなる。
指標DBack(m)は、画素mの背景らしさを示すパラメータである。同様に指標DFore(m)は、画素mの前景らしさを示すパラメータである。指標DBack(m)及び指標DFore(m)は、ステップS2におけるクラスタリング処理の結果に依存して、それぞれの画素について算出される。
ステップS1においてそれぞれの画素は確定背景画素又は前景候補画素に分類されている。確定背景画素については、指標DBack(m)はL(m)であり、指標DFore(m)は0である。ここでL(m)は予め定められた任意の値であり、前景らしさ又は背景らしさを示す指標Dの最大値を示す。ステップS1での処理に加えて、確定背景画素と同様に、確定前景画素としていくつかの画素がユーザによって特定されてもよい。この場合確定前景画素については、指標DBack(m)は0であり、指標DFore(m)はL(m)である。
前景候補画素mについては、指標DBack(m)は以下の式(2a)に従って算出される。
式(2a)において、zは画素mの色ベクトルである。μは確定背景領域についてのクラスタiに属する画素の平均色ベクトルである。Σはクラスタiの固有ベクトルである。πは画素についての加重係数である。Kは確定背景領域についてのクラスタ番号の最大値であり、通常はクラスタの数を示す。
一方で、前景候補画素mについての指標DFore(m)は以下の式(2b)に従って算出される。
式(2b)において、zは画素mの色ベクトルである。μは前景候補領域についてのクラスタiに属する画素の平均色ベクトルである。Σはクラスタiの固有ベクトルである。πは画素についての加重係数である。Kは前景候補領域についてのクラスタ番号の最大値であり、通常はクラスタの数を示す。
このように、画素mの画素値が確定背景領域についてのクラスタの色に近いほど、画素mの背景らしさは大きくなる。一方で画素mの画素値が前景候補領域についてのクラスタの色に近いほど、画素mの前景らしさは大きくなる。
次にステップS4において、非特許文献1に記載されているように、ステップS3で算出された各画素についてのパラメータを用いて、エネルギー関数の最小化問題を解くことにより、前景候補画素が前景画素と背景画素とに分類される。
以上のステップS2〜S4の処理を繰り返すことにより、各画素が前景であるか背景であるかを示す2値のデータが得られる。すなわち2回目以降のステップS2においては、直前のステップS4で前景画素に分類された画素が新たな前景候補画素となり、この前景候補画素についてクラスタリングが行われる。また、直前のステップS4で背景画素に分類された画素と、既に確定背景画素として特定されている画素との双方が確定背景画素となり、この確定背景画素についてクラスタリングが行われる。そして、ステップS3においてはこのクラスタリング結果に従ってパラメータが算出され、ステップS4においてこのパラメータに従って前景候補画素が前景画素と背景画素とにさらに分類される。
以下に、図1に示される入力画像をグラブカット処理する場合を例として用いながら、上述したグラブカット処理についてより詳しく説明する。図2は、グラブカット処理における中間結果を示す。図1の入力画像は、黒色領域、ダークグレー領域、ライトグレー領域、及び白色領域を含む。上述のように入力画像中にはユーザによって前景候補領域が指定されており、この前景候補領域は黒色領域、ダークグレー領域、ライトグレー領域、及び白色領域を含む。一方で確定背景領域は、ライトグレー領域、及び白色領域を含む。
図2(A)は、1回目のステップS2におけるクラスタリング処理の結果を示す。図2(A)には、前景候補領域についてのクラスタと、確定背景領域についてのクラスタとのそれぞれについての色分布を示す。図2(A)で表される色分布は、それぞれのクラスタに含まれる画素について、3次元のRGB色情報を2次元へと投影することにより得られている。
1回目のステップS2において処理される前景候補領域(図1のように指定された前景候補領域)はライトグレー色の領域を含んでいる。したがって図2(A)に示すように、前景候補領域についてのクラスタにはライトグレー色のクラスタがあり、このクラスタは確定背景領域についてのライトグレー色のクラスタと重なる。このクラスタリング結果を使ったエネルギー関数の最小化問題を解くことにより、図2(B)に示す分離結果が得られる。
図2(B)には、1回目の処理後の前景領域と背景領域とが示されている。2回目のステップS2においては、図2(B)に示される前景領域を新たな前景候補領域として扱ってクラスタリング処理を行い、背景領域を新たな確定背景領域として扱ってクラスタリング処理を行う。
このように、クラスタリング処理とエネルギー関数の最小化問題の解決とが繰り返し実行される。図2(C)は、n回目の繰り返し処理における、前景候補領域と確定背景領域についてのクラスタリング結果を示す。また図2(D)は、n回の繰り返し処理後における前景と背景の分離結果を示す。前景候補領域及び確定背景領域が毎回更新されるため、それぞれの領域についての各クラスタの色情報も更新される。このような処理を繰り返すことにより、一部が重なっている前景候補領域についてのクラスタと確定背景領域についてのクラスタとがだんだん離れていき、その結果、前景背景の分離結果が向上する。このように、クラスタリング処理とエネルギー関数の最小化処理とは相乗効果を示す。
しかしながら本願発明者は、グラブカット処理によっても被写体が抽出できない場合があることを発見した。図3は、このような場合の一例を示す。図4は、図3の画像についてのグラブカット処理の過程を示す図である。図4(A)は、図2と同様に、図3に示されるように指定された前景候補領域と確定背景領域とのそれぞれについてクラスタリング処理を行うことにより得られるクラスタの分布を示す。図4(B)は、図4(A)のクラスタリング結果に従ってエネルギー関数の最小化問題を解くことにより得られた前景と背景との分離結果を示す。図4(C)は、n回目の繰り返し処理における前景候補領域と確定背景領域とについてのクラスタリング結果を示す。図4(D)は、n回の繰り返し処理による前景と背景との分離結果を示す。
図4(A)と図4(C)とを比較すると分かるように、前景候補領域と確定背景領域とが更新されることにより、前景候補領域についてのクラスタと確定背景領域についてのクラスタとは、少し分離される。しかしながら完全には分離されないため、図4(D)に示されるように、背景の一部が被写体として誤抽出されることとなる。
本発明は、グラブカット処理において、より正確に被写体領域を抽出することを目的とする。
本発明の目的を達成するために、例えば、本発明の画像処理装置は以下の構成を備える。すなわち、
入力画像を取得する第1の取得手段と、
前記入力画像について、前景部分を包含する前景候補領域を指定する情報を取得する第2の取得手段と、
前記前景候補領域内の各画素を該画素の色情報に従って複数の第1のクラスタ群の何れかへと分類し、さらに前記前景候補領域外の各画素を該画素の色情報に従って複数の第2のクラスタ群の何れかへと分類する分類手段と、
前記入力画像の各画素について前景らしさ又は背景らしさを示すパラメータを設定する設定手段と、
前記第1のクラスタ群から、第1のクラスタについての色情報が示す色が、前記第2のクラスタ群のうちの何れかについての色情報が示す色と類似している該第1のクラスタを選択する選択手段と、
前記選択された第1のクラスタに属する各画素について、前記パラメータを調整する調整手段と、
前記調整手段による前記パラメータの調整後に、各画素についての前記パラメータを用いて前記前景部分に対応する領域を推定する推定手段と、
前記前景部分に対応する領域を特定する情報を出力する出力手段と、
を備えることを特徴とする。
グラブカット処理において、より正確に被写体領域を抽出することができる。
入力画像の例及び前景候補領域の指定例を示す図。 図1の入力画像に対するグラブカット処理結果を示す図。 入力画像の一例を示す図。 図3の入力画像に対する従来のグラブカット処理結果を示す図。 実施例1に係る画像処理装置の機能構成を示すブロック図。 実施例1に係る画像処理装置の主要部の構成を示すブロック図。 実施例1に係る画像処理方法を示すフローチャート。 実施例1に係るステップS12の詳細なフローチャート。 実施例1に係るステップS15の詳細なフローチャート。 図3の入力画像に対する実施例1でのグラブカット処理結果を示す図。 実施例4に係る画像処理方法を示すフローチャート。 実施例3に係る画像処理装置の機能構成を示すブロック図。 実施例3に係る画像処理方法を示すフローチャート。 実施例1に係るステップS314の詳細なフローチャート。
以下、図面を参照して、本発明の実施例について詳細に説明する。ただし、以下の実施例に記載されている構成要素はあくまで例示であり、本発明の技術の範囲は、特許請求の範囲によって確定されるものであって、以下の個別の実施例によって限定されるわけではない。
本願発明者は、被写体が背景と同じ色の領域を含んでいる場合に、背景の一部が被写体として誤抽出されやすいことを発見した。例えば、図3の画像に含まれる被写体はライトグレーの部分を含む一方で、背景もライトグレーの部分を含んでいる。前景候補領域内に確定背景領域と近い色の部分があるので、クラスタリング処理及びエネルギー関数の最小化処理を行っても、色の近いクラスタを分離することは困難である。そのため、前景と近い色を持つ背景の一部は被写体として誤抽出されることになるものと考えられる。
グラブカット処理の基本は、前景候補領域と確定背景領域とについてのクラスタリングと、エネルギー関数の最小化問題の解決とは、それぞれ独立に行われる。このため、前景候補領域と確定背景領域とについて独立にクラスタリング処理を行うだけでは、前景候補領域に含まれる背景部分と、前景候補領域に含まれる背景と色が似た被写体部分とは区別されない。その結果、分離後に被写体の一部と背景の一部とが混ざってしまうものと考えられる。
<画像処理装置の構成>
図5は、本発明の実施例1に係る画像処理装置100の機能構成を示すブロック図である。画像処理装置100は、領域指定部10、色処理部20、被写体分離部30、処理制御部40、画像取得部50、及び出力部60を備える。
領域指定部10は、入力画像中の前景候補領域及び確定背景領域を指定する。上述のように、前景候補領域内の画素は前景画素又は背景画素に分類される。また、確定背景領域内の画素は背景画素に分類される。領域指定部10は、この指定を含む情報を外部から受け取ることができる(第2の取得)。例えば領域指定部10は、この指定をユーザ入力に従って行うことができる。すなわち領域指定部10は入力画像中の所定領域を特定するユーザ入力を受け取り、特定された領域を前景候補領域として分類し、特定されなかった領域を確定背景領域として分類することができる。より具体的な例としては、ユーザは、入力画像中の矩形領域を前景候補領域として特定することができる。通常ユーザは、被写体(前景部分)が包含される領域を、前景候補領域として特定する。また領域指定部10は、画像処理装置100が有する他の処理部から受け取った指示に従ってこの指定を行うこともできる。
色処理部20は、前景候補領域及び確定背景領域のそれぞれについてクラスタリング処理を行う。ここで、前景候補領域及び確定背景領域は、領域指定部10によって指定された前景候補領域及び確定背景領域、又は被写体分離部30の処理によって決定された前景候補領域及び確定背景領域を指す。詳しくは図7のフローチャートを参照して後に説明する。
色処理部20は、クラスタリング処理部21、及びクラスタ関係判定部22を備える。クラスタリング処理部21は、前景候補領域と確定背景領域とのそれぞれを、色特徴に基づいてクラスタリング(分類)する。すなわち、前景候補領域内の各画素は複数のクラスタ群(第1のクラスタ群)のいずれかへと分類され、確定背景領域内(前景候補領域外)の各画素は複数のクラスタ群(第2のクラスタ群)のいずれかへと分類される。クラスタ関係判定部22は、クラスタリング処理部21によって分類された各クラスタ間の色関係を分析する。より具体的にはクラスタ関係判定部22は、前景候補領域についてのクラスタの中に、色特徴に関して、確定背景領域についてのクラスタと類似しているクラスタがあるか否かを判定する。
被写体分離部30は、色処理部20による処理結果を参照して、前景候補領域を前景領域と背景領域とに分離する。より詳細には、被写体分離部は、パラメータ設定部31と、パラメータ調整部32と、最小化部33とを備える。
パラメータ設定部31は、入力画像の各画素について、上述の式(1)を用いて類似度を表す指標Nを算出する。またパラメータ設定部31は、入力画像の各画素について、上述の式(2a)(2b)及び表1を用いて、前景らしさを表す指標DForeと、背景らしさを表す指標DBackとを算出する。本実施例においては、前景らしさ又は背景らしさを示すパラメータとして、これら2つの指標が用いられる。パラメータ設定部31の処理は、クラスタリング処理部21によるクラスタリング結果に従って行われる。
パラメータ調整部32は、クラスタ関係判定部22が判定したクラスタ間の色の類似性に基づき、背景らしさを表す指標DBackを調整する。より具体的には、パラメータ調整部32は、前景候補領域についての1つのクラスタが、確定背景領域についての任意のクラスタと色特徴に関して類似している場合、このクラスタに属する画素の指標をより背景らしいことを示すように調整する。
最小化部33は、パラメータ設定部31によって設定された、パラメータ調整部32による調整後の指標によって決定されるエネルギー関数の値がより小さくなるように、前景候補領域を前景領域と背景領域とに分離する。
処理制御部40は、色処理部20及び被写体分離部30による処理を繰り返すか否かを判定する。画像取得部50は、入力画像データを取得する(第1の取得)。出力部60は、被写体部分(前景部分)に対応する領域を特定する情報を出力する。例えば出力部60は、直近の最小化部33による分離結果に従って、各画素が前景領域にあるか背景領域にあるかを示す情報、すなわち被写体の抽出結果を出力することができる。
<システム構成>
図6は、本実施例に係る画像処理装置100の主要部の構成を示す。本実施例に係る画像処理装置は、撮像装置である。101は中央処理装置CPUであり、以下の各部を制御する。102は撮影部であり、画像データを取得する。103はバスであり、各種データの転送経路である。例えば、撮像部102によって取得された画像データは、このバス103を介して所定の処理部に送られる。104は撮影画像や文字の表示を行う表示部である。表示部は例えば、液晶ディスプレイでありうる。表示部104はタッチスクリーン機能を有していてもよい。105は表示制御部であり、表示部104での表示を制御する。106はユーザの指示を受け取る操作部である。操作部106は、ボタン又は撮影モードダイヤルでありうる。操作部106を介して入力された設定に従って、CPU101は、所定の処理を制御することができる。上述の領域指定部10は、表示制御部105と操作部106を介してユーザが領域指定を取得しうる。
107は撮影制御部であり、CPU201からの指示に基づいて撮影部102の撮像系を制御する。撮像系の制御には、フォーカスを合わせること、シャッターを開く・閉じること、絞りを調節することなどが含まれる。108はデジタル信号処理部であり、バス103を介して受け取った画像データに対し、ホワイトバランス処理、ガンマ処理、ノイズ低減処理などの各種画像処理を行う。109は画像処理部であり、撮像部102又はデジタル信号処理部108から出力された画像データに対して、ユーザの指定に応じて画像処理を行う。110は圧縮/伸長部であり、画像データの圧縮を行う。例えば圧縮/伸長部110は、JPEGやMPEGなどのファイルフォーマットへの画像データの変換、画像データのベクトル化、又は符号化制御などを行うことができる。
111は内部メモリであり、CPU101の主メモリ又はワークエリア等として機能しうる。また内部メモリ111は、CPU101で実行される制御プログラム等を格納することができる。112は外部メモリ制御部であり、画像処理装置100をPC又はメディアに接続するためのインタフェースとして働く。メディアとしては例えば、ハードディスク、メモリカード、CFカード、SDカード、及びUSBメモリなどが挙げられる。
画像処理装置100の画像取得部50は、撮影部102で撮影された画像データ、又は内部メモリ111若しくは外部メモリ112に蓄積された画像データを、入力画像データとして取得する。そして画像処理装置100は、CPU101による制御の下、入力画像から被写体を抽出する。さらに画像処理装置100の出力部60は、被写体の抽出結果を、圧縮/伸長部110、内部メモリ111、外部メモリ112、又はさらなる画像処理を行う非図示の処理部に出力する。この場合圧縮/伸長部110は、被写体の抽出結果を符号化して格納又は出力することができる。
撮像装置である本実施例の画像処理装置100においては、図5に示される各部の機能は、CPU101が、内部メモリ111又は外部メモリ112に記録されたコンピュータプログラムに従って動作することにより、実現されうる。もっとも、画像処理装置100は撮像装置に限られるわけではなく、コンピュータプログラムに従って動作するCPUと、コンピュータプログラムを記録するメモリとを有するコンピュータによっても実現されうる。また、本実施例において図5に示される各部の機能はCPU101の動作によって実現されるが、画像処理装置100は、図5に示される各部の機能を実現する専用のハードウェアを有していてもよい。
<画像処理方法の流れ>
図7は、本実施例に係る処理を示すフローチャートである。ステップS5において画像取得部50は、入力画像を取得する。ステップS10において領域指定部は、入力画像中に前景候補領域を設定する。上述のように画像取得部50は、操作部106から取得したユーザ指示に従って、この領域設定を行うことができる。入力画像のうち前景候補領域ではない部分は、確定背景領域として扱われる。
ステップS11においてクラスタリング処理部21は、前景候補領域と確定背景領域とのそれぞれについて、画素を複数のクラスタに分類する。上述のステップS2のように、類似の画素値を有する画素が同じクラスタに含まれるように、クラスタリングは行われる。また、クラスタリングは前景候補領域と確定背景領域とについて独立に行われる。このクラスタリング処理においては、公知の混合ガウス分布の推定手法を利用することが可能である。クラスタリング処理部21は、前景候補領域と確定背景領域とのそれぞれの画素について、画素が属するクラスタの番号を記録する。
ステップS12においてクラスタ関係判定部22は、前景候補領域についての各クラスタと確定背景領域についての各クラスタとの間の色類似度を計算する。本実施例においてクラスタ関係判定部22は、色類似度として色距離を用いる。色距離は、クラスタ間の色のユークリッド距離でもいいし、その他の距離でもよい。クラスタの色値としては、クラスタに属する画素の色値の代表値、例えば平均値を用いることができる。ステップS12における処理の詳細は、図8を参照して後に詳しく述べる。
ステップS13でパラメータ設定部31は、前景候補領域についてのクラスタの中に、確定背景領域についてのクラスタと色が類似しているクラスタが存在するか否かを判定する。例えばパラメータ設定部31は、ステップS129においてマークが付けられたクラスタが存在する場合に、色が類似しているクラスタが存在すると判定すればよい。色が類似しているクラスタが存在しない場合、処理はステップS14に進む。色が類似しているクラスタが存在する場合、処理はステップS15に進む。
ステップS14においてパラメータ設定部31は、各画素についてエネルギー関数のパラメータを算出する。本実施例においてパラメータ設定部31は、上述のように類似度を表す指標N、前景らしさを表す指標DFore、及び背景らしさを表す指標DBackを算出する。
ステップS15においてパラメータ設定部31及びパラメータ調整部32は、各画素についてエネルギー関数のパラメータを算出する。本実施例においてパラメータ設定部31及びパラメータ調整部32は、類似度を表す指標N、前景らしさを表す指標DFore、及び背景らしさを表す指標DBackを算出する。確定背景領域についてのクラスタと色が類似している前景候補領域についてのクラスタは、背景領域の一部である可能性が比較的高い。そこで本実施例においてパラメータ調整部32は、確定背景領域についてのクラスタと色が類似している前景候補領域についてのクラスタに属する画素の背景らしさを高くする。ステップS15における処理については図9を参照して後に詳しく述べる。
ステップS16において最小化部33は、ステップS14又はステップS15において設定されたパラメータに従って求められるエネルギー関数の値が最小となるように、前景候補領域の各画素を前景領域の画素と背景領域の画素とに分類する。最小化部33がエネルギー関数の最小化問題を解くことにより、この処理は行われうる。このエネルギー関数の最小化処理は、公知のグラフ理論でのネットワーク流問題の解法を利用することが可能である。
ステップS17で処理制御部40は、エネルギー関数の流量が小さくなるか否か、及び繰り返し回数が所定回数に到達したか否か、を判定する。そして処理制御部40は、判定結果に従って、繰り返し処理を終了するか否かを判定する。例えば、処理が所定回数繰り返された場合に、処理制御部40は繰り返し処理を終了することができる。また、最小化部33が算出したエネルギー関数の値が収束している場合に、処理制御部40は繰り返し処理を終了することができる。例えば直近に最小化部33が算出したエネルギー関数の値と、その前の繰り返しにおいて最小化部33が算出したエネルギー関数の値との差が所定値以下である場合に、処理制御部40はエネルギー関数の値が収束していると判断することができる。処理制御部40は、これらの条件のうち一方が満たされた場合に繰り返し処理を終了してもよいし、双方が満たされた場合に繰り返し処理を終了してもよい。繰り返し処理を終了する場合、処理はステップS19に進む。繰り返し処理を終了しない場合、処理はステップS18に進む。
ステップS18で処理制御部40は、ステップS16で決定された前景領域を新たな前景候補領域として指定する。また処理制御部40は、ステップS16で決定された背景領域を確定背景領域に追加する。その後処理はステップS11に戻る。ステップS19で出力部60は、上述のように被写体の抽出結果を出力する。
<ステップS12の処理の詳細>
ここで、ステップS12の詳細について図8を参照して説明する。ステップS121においてクラスタ関係判定部22は、変数iに1をセットする。変数iは、処理対象とする、前景候補領域についてのクラスタ番号を示す。ステップS122においてクラスタ関係判定部22は、変数jに1をセットする。変数jは、処理対象とする、確定背景領域についてのクラスタ番号を示す。
ステップS123においてクラスタ関係判定部22は、前景候補領域についてのi番目のクラスタと、確定背景領域についてのj番目のクラスタとについて、色距離を算出する。そして、算出された色距離と、変数Mを比較する。この変数Mは、ステップS123において算出された色距離のうちの最小値を示す変数である。変数Mはメモリ111に格納されており、ステップS12を開始する際に初期化される。ステップS123で算出された色距離が変数Mよりも小さい場合、処理はステップS124に進む。この場合、ステップS123で算出された色距離は今まで算出された色距離の中で最も小さい。一方でステップS123で算出された色距離が変数M以上である場合、処理はステップS125に進む。
ステップS124においてクラスタ関係判定部22は、ステップS123で算出された色距離を新たな変数Mとして記録する。またクラスタ関係判定部22は、現在の変数i及び変数jを、変数Mに対応する変数i及び変数jとしてメモリ111に記録する。
ステップS125においてクラスタ関係判定部22は、変数jが確定背景領域についてのクラスタの数に一致するか否かを判定する。一致しない場合、処理はステップS126に進む。一致する場合、処理はステップS127に進む。ステップS126においてクラスタ関係判定部22は変数jに1を加え、その後処理はステップS123に戻る。
ステップS127においてクラスタ関係判定部22は、変数iが前景候補領域についてのクラスタの数に一致するか否かを判定する。一致しない場合、処理はステップS128に進む。一致する場合、処理はステップS129に進む。ステップS126においてクラスタ関係判定部22は変数iに1を加え、その後処理はステップS123に戻る。
ステップS129においてクラスタ関係判定部22は、ステップS123においてメモリ111に記録された、変数Mに対応する変数iを取得する。そしてクラスタ関係判定部22は、前景候補領域についてのi番目のクラスタにマークを付加する。具体的にはクラスタ関係判定部22は、i番目のクラスタにマークが付加されたという情報をメモリ111に記録すればよい。このi番目のクラスタは、確定背景領域についてのクラスタのうち任意の1つとの色距離が最も小さい、前景候補領域についてのクラスタである。このようにして、クラスタ関係判定部22は、前景候補領域についてのクラスタ群の中から、確定背景領域についてのクラスタの色と類似した色を持つクラスタを選択し、選択したクラスタにマークを付加する。
<ステップS15の処理の詳細>
次にステップS15の処理について、図9のフローチャートを参照して説明する。ステップS151でパラメータ設定部31は、ステップS14と同様に各画素についてエネルギー関数のパラメータを算出する。ステップS152においてパラメータ調整部32は、前景候補領域の各画素の背景らしさの平均値Tを算出する。
次に、ステップS153〜S155でパラメータ調整部32は、前景候補領域の各画素の背景らしさを調整する。ステップS153〜S155の具体的な処理についてこれから説明する。ステップS153でパラメータ調整部32は、前景候補領域の画素を1つ選択する。例えばパラメータ調整部32は、ラスタ順に画素を順次選択すればよい。そしてパラメータ調整部32は、選択された画素が属するクラスタが、ステップS129においてマークを付加されているか否かを判定する。マークが付加されている場合、処理はステップS154に進む。マークが付加されていない場合、処理はステップS155に進む。
ステップS154においてパラメータ調整部32は、ステップS153で選択された画素の背景らしさを調整する。具体的にはパラメータ調整部32は、ステップS153で選択された画素についての背景らしさを示す指標DBackに、ステップS152で算出されたTを加える。
ステップS155でパラメータ調整部32は、ステップS153において前景候補領域の全ての画素が選択されたか否かを判定する。前景候補領域の全ての画素が選択されていない場合、処理はステップS153に戻る。前景候補領域の全ての画素が選択されている場合、処理はステップS15の処理は終了する。
<処理結果例>
図10は、図3に示される入力画像を実施例1に従って処理した結果を示す。従来のグラブカット処理では、前景候補領域と確定背景領域とのそれぞれについて独立にクラスタリング処理が行われる。そして、クラスタリング処理の結果に従ってエネルギー関数のパラメータが設定され、エネルギー関数の最小化問題が解かれる。一方で本発明においては、前景候補領域と確定背景領域とのそれぞれについてクラスタリング処理を行った後、クラスタ間の色の関係が検出される。そして、クラスタリング結果とクラスタ間の関係に従って、エネルギー関数のパラメータが設定及び調整され、調整後のパラメータを使ってエネルギー関数の最小化問題が解かれる。その結果、被写体の一部が背景と近い色を持つ場合であっても、被写体の抽出をより正確に行うことができる。
例えば、それぞれの画素についての前景らしさ及び背景らしさについてのパラメータは、その画素の色が前景候補領域についてのクラスタの色に近いか、及びその画素の色が確定背景領域についてのクラスタの色に近いか、によって決定される。したがって、前景候補領域に含まれる背景部分の画素についての前景らしさ及び背景らしさと、前景候補領域に含まれる背景と色が似た被写体部分についての前景らしさ及び背景らしさは、類似の値を持つことになる。一方で本実施例の処理によれば、確定背景領域についてのクラスタと色が類似している前景候補領域についてのクラスタに属する画素に対して、背景らしさを高くする処理が行われる。この結果として、前景候補領域に含まれる背景部分の画素が、被写体部分として誤検出される可能性を減らすことができる。
実施例1においては、ステップS154について説明したように、背景らしさを調整するために、調整される画素についての指標DBackに平均値Tが加えられた。しかしながら、背景らしさの調整方法はこの方法に限定されず、他の方法を用いて画素についての背景らしさを高くすることができる。例えば、指標DBackに予め定められた所定値が加えられてもよい。
さらには、画素の背景らしさを調整する代わりに、画素の前景らしさを調整してもよい。具体的にはステップS154において、選択された画素の前景らしさを示す指標DForeを、より低い前景らしさを示すように調整してもよい。例えば、調整される画素についての指標DForeから所定値を減じることにより、この調整を行うことができる。さらにはステップS154において、選択された画素の背景らしさを高くすることと、選択された画素の前景らしさを低くすることとの双方を行ってもよい。
本実施例のステップS12においては、確定背景領域についてのクラスタのうち任意の1つとの色距離が最も小さい、前景候補領域についてのクラスタにマークを付加した。そして、マークが付加されたクラスタに属する画素について、背景らしさを調整する処理が行われた。しかしながら、マークが付加されるクラスタの決定方法は、この方法には限られない。例えば本実施例においては、前景候補領域についてのクラスタのうち1つにマークが付加された。しかしながら、2つ以上のクラスタにマークが付加されてもよいし、どのクラスタにもマークが付加されなくてもよい。例えば、確定背景領域についてのクラスタのうち任意の1つとの色距離が最も小さくかつ色距離が所定値以下であるような、前景候補領域についてのクラスタにマークを付加してもよい。具体的にはステップS129において、変数Mが所定値より小さい場合にのみ、i番目のクラスタにマークを付加してもよい。
また、確定背景領域についてのクラスタのうちいずれか1つとの色距離が所定値以下である、前景候補領域についてのクラスタに、マークが付加されてもよい。例えばステップS123においては、前景候補領域についてのi番目のクラスタと確定背景領域についてのj番目のクラスタとの間の色距離が所定値以下であるか否かを判定してもよい。そして、色距離が所定値以下である場合に、前景候補領域についてのi番目のクラスタにマークを付加してもよい。
さらには、本実施例においては、クラスタの色値の代表値が類似している場合に、クラスタの色が類似しているものとした。しかしながら、色空間上でクラスタを構成する画素の画素値の分布が重なる場合に、クラスタの色が類似していると判定することもできる。すなわち、前景候補領域についてのクラスタと確定背景領域についてのクラスタとについて、各クラスタを構成する画素の画素値の分布が重なる場合に、この前景候補領域についてのクラスタに属する画素の背景らしさを調整してもよい。さらには、色特徴空間上でクラスタの類似を判定するのではなく、前景候補領域のクラスタと確定背景領域のクラスタの中に重なる分布になるクラスタがあるかどうかについての特徴空間上で、クラスタの類似を判定してもよい。このように、確定背景領域についてのクラスタと色が類似している前景候補領域についてのクラスタの決定方法としては、様々な方法を採用することができる。
実施例1においては、類似度を表す指標N、前景らしさを表す指標DFore、及び背景らしさを表す指標DBackを、式(1)、式(2a)、及び式(2b)に従って算出した。しかしながらこれらのパラメータは、別の方法にしたがって算出されてもよい。さらには実施例1においては、前景背景を分離するために、エネルギー関数のパラメータに基づき、エネルギー関数の最小化を解く方法を利用した。しかしながら、クラスタ情報に基づき画素の情報量を求め、取得した画素の情報量を用いる他の前景背景分離処理法を利用してもよい。
実施例1では、クラスタ間の色類似度に基づいて、背景らしさが調整される前景候補領域のクラスタを選択した。実施例2では、さらにクラスタの画素数を考慮に入れて、背景らしさが調整される前景候補領域のクラスタを選択する。
本実施例に係る処理は、図7に示される実施例1に係る処理と同様であるが、ステップS13及びステップS153における処理が異なる。以下、本実施例におけるステップS13及びステップS153の処理について説明する。その他の処理については実施例1と同様に行うことができ、したがって説明は省略する。本実施例に係る処理は、実施例1と同様に、図5及び図6に示される画像処理装置100を用いて行うことができる。
ステップS13においてパラメータ設定部31は、前景候補領域についてのクラスタの中に、確定背景領域についてのクラスタと色が類似しているクラスタが存在するか否かを判定する。この判定は、実施例1と同様に行うことができる。ここで、確定背景領域についてのクラスタと色が類似している前景候補領域についてのクラスタのことを、着目クラスタと呼ぶ。
ステップS13においてパラメータ設定部31はさらに、着目クラスタに属する画素数が所定数又は所定割合以上であるか否かを判定する。着目クラスタが複数存在する実施例においては、少なくとも1つの着目クラスタに属する画素数が所定値又は所定割合以上であるか否かを判定すればよい。具体的な例として、パラメータ設定部31は、前景候補領域の画素数に対する着目クラスタに属する画素数の割合が、所定数以上であるか否かを判定してもよい。別の例としてパラメータ設定部31は、入力画像の画素数に対する着目クラスタに属する画素数の割合が、所定値以上であるか否かを判定してもよい。
前景候補領域についてのクラスタの中に、確定背景領域についてのクラスタと色が類似しているクラスタが存在し、かつ着目クラスタに属する画素数が所定数又は所定割合以上である場合、処理はステップS15に進む。そうではない場合、処理はステップS14に進む。
ステップS153においてパラメータ調整部32は、実施例1と同様に前景候補領域の画素を1つ選択し、選択された画素が属するクラスタが、ステップS129においてマークを付加されているか否かを判定する。ステップS153においてパラメータ調整部32はさらに、選択された画素が属するクラスタに属する画素数が所定数又は所定割合以上であるか否かを判定する。この判定は、ステップS13と同様に行うことができる。選択された画素が属するクラスタにマークが付加されており、かつこのクラスタに属する画素数が所定数又は所定割合以上である場合に、処理はステップS154に進む。そうではない場合、処理はステップS155に進む。
前景候補領域についてのクラスタの色が、確定背景領域についてのクラスタの色と類似しており、かつこの前景候補領域についてのクラスタに属する画素数が多い場合、この前景候補領域についてのクラスタに属する画素は背景領域の一部である可能性が高い。そこで本実施例においては、このような前景候補領域についてのクラスタに属する画素について、背景らしさが高くなるように、エネルギー関数のパラメータが調整される。
実施例1及び実施例2においては、背景を示す画素が属している可能性がある前景候補領域についてのクラスタが特定され、このクラスタに属する画素についてのエネルギー関数のパラメータが調整された。実施例3においては、前景候補領域についてのクラスタが、確定背景領域についての色が類似しているクラスタへと統合される。そして、統合後のクラスタリング結果に従って、エネルギー関数のパラメータが設定される。
図12は、実施例3に係る画像処理装置300の機能構成を示すブロック図である。画像処理装置300の機能は、図6に示される装置を用いて実現することができる。画像処理装置300は、領域指定部310、色処理部320、被写体分離部330、処理制御部340、画像取得部350、及び出力部360を備える。領域指定部310、処理制御部340、画像取得部350、及び出力部360の動作は実施例1に係る領域指定部10、処理制御部40、画像取得部50、及び出力部60と同様であり、詳細な説明は省略する。
色処理部320は、クラスタリング処理部321、クラスタ関係判定部322、及びクラスタ統合部323を備える。クラスタリング処理部321及びクラスタ関係判定部322の動作は実施例1に係るクラスタリング処理部21及びクラスタ関係判定部22の動作と同様であり、詳細な説明は省略する。クラスタ統合部323は、クラスタ関係判定部322によって選択された、色が類似している前景候補領域についてのクラスタと確定背景領域についてのクラスタのペアを統合する。
被写体分離部330は、パラメータ設定部331及び最小化部332を備える。それぞれの動作は実施例1に係るパラメータ設定部31及び最小化部33と同様であり、詳細な説明は省略する。
図13は、実施例3に係る処理のフローチャートを示す。ステップS305〜S312の動作は実施例1におけるステップS5〜S12と同様であり、詳細な説明は省略する。ステップS313においてパラメータ設定部331は、前景候補領域についてのクラスタの中に、確定背景領域についてのクラスタと色が類似しているクラスタが存在するか否かを、実施例1と同様に判定する。色が類似しているクラスタが存在しない場合、処理はステップS315に進む。色が類似しているクラスタが存在する場合、処理はステップS314に進む。ステップS314でクラスタ統合部323は、前景候補領域についてのクラスタを確定背景領域についてのクラスタに統合する。ステップS314の処理については、後に詳しく説明する。
ステップS315の処理は、実施例1におけるステップS14と同様である。しかしながらステップS314の処理が行われている場合、パラメータ設定部331は、ステップS314における処理後のクラスタリング結果を用いてエネルギー関数のパラメータが設定される。
S316〜S319の処理は、実施例1におけるステップS16〜19の処理と同様であり、詳しい説明は省略する。
<ステップS314の処理>
以下に、ステップS314の処理について、図14を参照して詳しく説明する。ステップS3141〜ステップS3148の処理は、実施例1におけるステップS121〜ステップS128の処理と同様であり、詳細な説明を省略する。
ステップS3149においてクラスタ統合部323は、ステップS3143においてメモリ111に記録された変数Mを取得する。そしてクラスタ統合部323は、変数Mが閾値以下であるか否かを判定する。閾値以下である場合、ステップS314の処理は終了する。閾値以下ではない場合、処理はステップS3150に進む。
ステップS3150においてクラスタ統合部323は、ステップS3143においてメモリ111に記録された、変数Mに対応する変数i及び変数jを取得する。そしてクラスタ統合部323は、前景候補領域についてのi番目のクラスタを、確定背景領域についてのj番目のクラスタへと統合する。本実施例においては、統合後の確定背景領域についてのj番目のクラスタは、統合前の前景候補領域についてのi番目のクラスタに属する画素と、統合前の確定背景領域についてのj番目のクラスタに属する画素とによって構成される。そしてクラスタ統合部323は、前景候補領域についてのi番目のクラスタの色情報を用いて、確定背景領域についてのj番目のクラスタの色情報を更新する。また、クラスタ統合部323は、前景候補領域についてのi番目のクラスタの情報を削除し、前景候補領域についてのクラスタ数を1つ減らす。
本実施例のステップS3149及びS3150においては、前景候補領域についてのi番目のクラスタの色と、確定背景領域についてのj番目のクラスタの色との色距離が閾値以下である場合に、これらのクラスタが統合された。しかしながら、色距離に関わらず、前景候補領域についてのi番目のクラスタと、確定背景領域についてのj番目のクラスタとを統合してもよい。このような構成は、ステップS3148の後に、ステップS3149を省略しながら、ステップS3150を実行することにより実現できる。
本実施例においては、前景候補領域についてのクラスタが、確定背景領域についての色が類似しているクラスタへと統合される。統合後のクラスタリング結果に従って各画素の背景らしさを算出すると、統合された前景候補領域についての属していた画素の背景らしさは、統合を行わなかった場合と比較して高くなる。この結果として実施例1と同様に、前景候補領域に含まれる背景部分の画素が、被写体部分として誤検出される可能性を減らすことができる。
以下で、実施例1〜3として説明した被写体抽出処理の応用例について説明する。実施例4では、被写体抽出結果に従って入力画像の符号化を行う。
実施例4の処理について、図11のフローチャートを参照して説明する。実施例4に係る処理は、例えば図6に示される画像処理装置を用いて行うことができる。ステップS40においてCPU101は、上述の実施例1〜3のいずれかに従って、入力画像から被写体を抽出する。具体的にはステップS40においては、入力画像を構成するそれぞれの画素について、前景領域に属するか背景領域に属するかを示す情報が得られる。
ステップS50において圧縮/伸長部110は、ステップS40における抽出結果に従って、前景と背景とを別々のレイヤとして記録する。例えば圧縮/伸長部110は、前景レイヤに前景領域に属する各画素の色情報を記録し、背景レイヤに背景領域に属する各画素の色情報を記録すればよい。
ステップS60において圧縮/伸長部110は、前景レイヤと背景レイヤとのそれぞれを符号化する。ここで圧縮/伸長部110は、前景レイヤと背景レイヤとをそれぞれ異なる圧縮率で符号化する。具体的な一例として、圧縮/伸長部110は、前景レイヤをより低い圧縮率で圧縮し(第1の処理)、背景レイヤを前景レイヤよりも高い圧縮率で圧縮する(第2の処理)。この場合、被写体を示す前景領域の画質をよりよく維持しながら、画像全体についての圧縮率を高めることができる。
本実施例のステップS60においては、前景レイヤと背景レイヤとのそれぞれを符号化した。しかしながら圧縮/伸長部110は、入力画像を構成するそれぞれの画素について前景領域に属するか背景領域に属するかを示す2値のマスク画像を符号化してもよい。また圧縮/伸長部110は、前景領域と背景領域との境界を示す情報、例えば前景領域と背景領域との境界に位置する境界画素の位置情報を記録してもよい。
また、その他の応用例として、実施例1〜3における被写体抽出結果に従ってリフォーカス処理を行うこともできる。例えば、背景領域内の画像についてぼかし処理を行うことができるし、前景領域内の画像についてぼかし処理を行うこともできる。さらなる応用例としては、多眼撮影装置から取得した複数の画像のセグメンテーションや、深度画像の高精度化、なども挙げられる。
(その他の実施例)
上述の各実施例においては、色情報に従って被写体の抽出が行われた。しかしながら、各画素についての奥行き情報を用いて、同様の方法で被写体を抽出することもできる。このことは例えば、色情報の代わりに奥行き情報を用いてクラスタリング処理を行い、色情報の代わりに奥行き情報に従ってエネルギー関数のパラメータを求めることにより実現できる。また、色情報と奥行き情報との双方を用いて、被写体を抽出してもよい。
また、上述の各実施例においては、入力画像が前景と背景とに分離された。この分離結果に基づき、さらに各画素、特に被写体と背景との境界付近の画素について、アルファ、すなわち透明度を計算してもよい。
上述の各実施例においては、確定背景領域についてのクラスタと色が類似している前景候補領域についてのクラスタに属する画素に対して、背景らしさを高くする処理が行われた。この結果として、前景候補領域に含まれる背景部分の画素が、被写体部分として誤検出される可能性を減らすことができた。しかしながら、前景候補領域に含まれる被写体部分の画素が、背景部分として誤検出されるような場合にも、本発明の方法を適用することができる。すなわち、確定背景領域についてのクラスタと色が類似している前景候補領域についてのクラスタに属する画素に対して、背景らしさを低くする処理を行うこともできる。この場合、前景候補領域に含まれる被写体部分の画素が、背景部分として誤検出される可能性を減らすことができる。このように本発明によれば、確定背景領域についてのクラスタと色が類似している前景候補領域についてのクラスタに属する画素について、前景らしさ又は背景らしさを調整することにより、前景候補領域から被写体部分をより正確に抽出することができる。概して言えば、背景らしさを高くする処理を行う場合に良好な分離結果を得られる傾向がある。しかしながら、背景らしさを高くするか低くするか、及び背景らしさをどの程度高く又は低くするかは、被写体抽出結果を確認しながら適宜ユーザが設定することができる。
本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)をネットワーク又は各種記憶媒体を介してシステム或いは装置に供給する。そして、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムコードを読み出して実行する。この場合、そのプログラム、及び該プログラムを記憶した記憶媒体は本発明を構成することになる。

Claims (12)

  1. 入力画像を取得する第1の取得手段と、
    前記入力画像について、前景部分を包含する前景候補領域を指定する情報を取得する第2の取得手段と、
    前記前景候補領域内の各画素を該画素の色情報に従って複数の第1のクラスタ群の何れかへと分類し、さらに前記前景候補領域外の各画素を該画素の色情報に従って複数の第2のクラスタ群の何れかへと分類する分類手段と、
    前記入力画像の各画素について前景らしさ又は背景らしさを示すパラメータを設定する設定手段と、
    前記第1のクラスタ群から、第1のクラスタについての色情報が示す色が、前記第2のクラスタ群のうちの何れかについての色情報が示す色と類似している該第1のクラスタを選択する選択手段と、
    前記選択された第1のクラスタに属する各画素について、前記パラメータを調整する調整手段と、
    前記調整手段による前記パラメータの調整後に、各画素についての前記パラメータを用いて前記前景部分に対応する領域を推定する推定手段と、
    前記前景部分に対応する領域を特定する情報を出力する出力手段と、
    を備えることを特徴とする画像処理装置。
  2. 前記設定手段は、前記入力画像の各画素について、該画素が示す色が前記第1のクラスタについての色情報が示す色に近いほど前景らしさが高くなり、該画素が示す色が前記第2のクラスタについての色情報が示す色に近いほど背景らしさが高くなるように、前記前景らしさ又は背景らしさを示すパラメータを設定することを特徴とする、請求項1に記載の画像処理装置。
  3. 前記調整手段は、前記選択された第1のクラスタに属する画素数が所定数以上である場合に、当該選択された第1のクラスタに属する各画素について前記パラメータを調整することを特徴とする、請求項1又は2に記載の画像処理装置。
  4. 前記調整手段は、背景らしさがより高くなるように前記パラメータを調整することを特徴とする、請求項1乃至3の何れか1項に記載の画像処理装置。
  5. 前記推定手段が推定した前記前景部分に対応する領域を新たな前景候補領域として指定し、前記分類手段、前記設定手段、前記選択手段、前記調整手段、及び前記推定手段に繰り返し処理を行わせる制御手段をさらに備えることを特徴とする、請求項1乃至4の何れか1項に記載の画像処理装置。
  6. 入力画像を取得する第1の取得手段と、
    前記入力画像について、前景部分を包含する前景候補領域を指定する情報を取得する第2の取得手段と、
    前記前景候補領域内の各画素を該画素の色情報に従って複数の第1のクラスタ群の何れかへと分類し、さらに前記前景候補領域外の各画素を該画素の色情報に従って複数の第2のクラスタ群の何れかへと分類する分類手段と、
    前記第1のクラスタ群から、第1のクラスタについての色情報が示す色が、前記第2のクラスタ群のうちの何れかについての色情報が示す色と類似している該第1のクラスタを選択する選択手段と、
    前記選択された第1のクラスタに含まれる画素が、該第1のクラスタと色情報が示す色が類似している第2のクラスタに含まれるように、該選択された第1のクラスタを該第2のクラスタへと統合する統合手段と、
    前記入力画像の各画素について前景らしさ又は背景らしさを示すパラメータを設定する設定手段と、
    各画素についての前記パラメータを用いて前記前景部分の位置を推定する推定手段と、
    前記前景部分に対応する領域を特定する情報を出力する出力手段と、
    を備えることを特徴とする画像処理装置。
  7. 前記設定手段は、前記入力画像の各画素について、該画素が示す色が前記第1のクラスタについての色情報が示す色に近いほど前景らしさが高くなり、該画素が示す色が前記第2のクラスタについての色情報が示す色に近いほど背景らしさが高くなるように、前記前景らしさ又は背景らしさを示すパラメータを設定することを特徴とする、請求項6に記載の画像処理装置。
  8. 前記入力画像のうち、前記前景部分に対応する領域に対して第1の処理を行う第1の処理手段と、
    前記入力画像のうち、前記前景部分に対応しない領域に対して前記第1の処理とは異なる第2の処理を行う第2の処理手段と、
    をさらに備えることを特徴とする請求項1乃至7の何れか1項に記載の画像処理装置。
  9. 画像処理装置が行う画像処理方法であって、
    第1の取得手段が、入力画像を取得する第1の取得工程と、
    第2の取得手段が、前記入力画像について、前景部分を包含する前景候補領域を指定する情報を取得する第2の取得工程と、
    分類手段が、前記前景候補領域内の各画素を該画素の色情報に従って複数の第1のクラスタ群の何れかへと分類し、さらに前記前景候補領域外の各画素を該画素の色情報に従って複数の第2のクラスタ群の何れかへと分類する分類工程と、
    設定手段が、前記入力画像の各画素について前景らしさ又は背景らしさを示すパラメータを設定する設定工程と、
    選択手段が、前記第1のクラスタ群から、第1のクラスタについての色情報が示す色が、前記第2のクラスタ群のうちの何れかについての色情報が示す色と類似している該第1のクラスタを選択する選択工程と、
    調整手段が、前記選択された第1のクラスタに属する各画素について、前記パラメータを調整する調整工程と、
    推定手段が、前記調整工程における前記パラメータの調整後に、各画素についての前記パラメータを用いて前記前景部分に対応する領域を推定する推定工程と、
    出力手段が、前記前景部分に対応する領域を特定する情報を出力する出力工程と、
    を備えることを特徴とする画像処理方法。
  10. 画像処理装置が行う画像処理方法であって、
    第1の取得手段が、入力画像を取得する第1の取得工程と、
    第2の取得手段が、前記入力画像について、前景部分を包含する前景候補領域を指定する情報を取得する第2の取得工程と、
    分類手段が、前記前景候補領域内の各画素を該画素の色情報に従って複数の第1のクラスタ群の何れかへと分類し、さらに前記前景候補領域外の各画素を該画素の色情報に従って複数の第2のクラスタ群の何れかへと分類する分類工程と、
    選択手段が、前記第1のクラスタ群から、第1のクラスタについての色情報が示す色が、前記第2のクラスタ群のうちの何れかについての色情報が示す色と類似している該第1のクラスタを選択する選択工程と、
    統合手段が、前記選択された第1のクラスタに含まれる画素が、該第1のクラスタと色情報が示す色が類似している第2のクラスタに含まれるように、該選択された第1のクラスタを該第2のクラスタへと統合する統合工程と、
    設定手段が、前記入力画像の各画素について前景らしさ又は背景らしさを示すパラメータを設定する設定工程と、
    推定手段が、各画素についての前記パラメータを用いて前記前景部分の位置を推定する推定工程と、
    出力手段が、前記前景部分に対応する領域を特定する情報を出力する出力工程と、
    を備えることを特徴とする画像処理方法。
  11. コンピュータを、請求項1乃至8の何れか1項に記載の画像処理装置の各手段として機能させるための、コンピュータプログラム。
  12. 請求項11に記載のコンピュータプログラムを格納した、コンピュータが読み取り可能な記憶媒体。
JP2012135124A 2012-06-14 2012-06-14 画像処理装置、画像処理方法、プログラム、及び記憶媒体 Expired - Fee Related JP5968098B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012135124A JP5968098B2 (ja) 2012-06-14 2012-06-14 画像処理装置、画像処理方法、プログラム、及び記憶媒体
US13/910,528 US9152878B2 (en) 2012-06-14 2013-06-05 Image processing apparatus, image processing method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012135124A JP5968098B2 (ja) 2012-06-14 2012-06-14 画像処理装置、画像処理方法、プログラム、及び記憶媒体

Publications (2)

Publication Number Publication Date
JP2013257843A JP2013257843A (ja) 2013-12-26
JP5968098B2 true JP5968098B2 (ja) 2016-08-10

Family

ID=49755983

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012135124A Expired - Fee Related JP5968098B2 (ja) 2012-06-14 2012-06-14 画像処理装置、画像処理方法、プログラム、及び記憶媒体

Country Status (2)

Country Link
US (1) US9152878B2 (ja)
JP (1) JP5968098B2 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014125319A1 (en) * 2013-02-12 2014-08-21 Freescale Semiconductor, Inc. Display processor and method for display processing
JP6136537B2 (ja) * 2013-04-26 2017-05-31 オムロン株式会社 画像処理装置、画像処理方法、画像処理制御プログラム、および記録媒体
GB2522663B (en) * 2014-01-31 2020-02-12 Apical Ltd A method of selecting a region of interest
JP6364958B2 (ja) * 2014-05-26 2018-08-01 富士ゼロックス株式会社 画像処理装置、画像形成装置及びプログラム
JP6161575B2 (ja) * 2014-06-24 2017-07-12 日本電信電話株式会社 画像分割装置、方法、及びプログラム
US9774793B2 (en) * 2014-08-01 2017-09-26 Adobe Systems Incorporated Image segmentation for a live camera feed
CN106575362A (zh) 2014-08-28 2017-04-19 高通股份有限公司 基于关注区融合的对象选择
US9443162B2 (en) * 2014-09-25 2016-09-13 Aricent Holdings Luxembourg S.A.R.L. Intelligent background selection and image segmentation
US9542751B2 (en) * 2015-05-08 2017-01-10 Qualcomm Incorporated Systems and methods for reducing a plurality of bounding regions
JP6530323B2 (ja) * 2016-01-26 2019-06-12 国立大学法人 東京大学 物体領域切出装置
US10810744B2 (en) * 2016-05-27 2020-10-20 Rakuten, Inc. Image processing device, image processing method and image processing program
JP7026456B2 (ja) 2017-07-05 2022-02-28 キヤノン株式会社 画像処理装置、学習装置、フォーカス制御装置、露出制御装置、画像処理方法、学習方法、及びプログラム
JP7300027B2 (ja) * 2017-07-05 2023-06-28 キヤノン株式会社 画像処理装置、画像処理方法、学習装置、学習方法、及びプログラム
US10909369B2 (en) * 2017-07-14 2021-02-02 Mitsubishi Electric Research Laboratories, Inc Imaging system and method for object detection and localization
CN108428240B (zh) * 2018-03-08 2022-03-25 南京大学 一种对输入信息自适应的显著物体分割方法
CN108846397B (zh) * 2018-05-31 2021-01-15 浙江科技学院 一种基于图像处理的电缆半导电层自动检测方法
CN109255790A (zh) * 2018-07-27 2019-01-22 北京工业大学 一种弱监督语义分割的自动图像标注方法
US11922649B2 (en) 2018-11-30 2024-03-05 Arithmer Inc. Measurement data calculation apparatus, product manufacturing apparatus, information processing apparatus, silhouette image generating apparatus, and terminal apparatus
JP6531273B1 (ja) * 2018-11-30 2019-06-19 Arithmer株式会社 寸法データ算出装置、プログラム、方法、製品製造装置、及び製品製造システム
US11076111B1 (en) * 2019-11-13 2021-07-27 Twitch Interactive, Inc. Smart color-based background replacement
CN110992384B (zh) 2019-11-15 2023-04-11 五邑大学 半自动化图像数据标注方法、电子装置及存储介质
WO2021127419A1 (en) 2019-12-19 2021-06-24 Interdigital Vc Holdings, Inc. Methods and apparatuses for encoding, decoding and rendering 6dof content from 3dof+ composed elements
JP7746006B2 (ja) * 2020-11-27 2025-09-30 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
KR20220115706A (ko) * 2021-02-09 2022-08-18 삼성디스플레이 주식회사 영상 프로세서, 그것을 포함하는 표시 장치 및 표시 장치의 동작 방법
JP7607503B2 (ja) * 2021-04-19 2024-12-27 三井化学株式会社 強化繊維束の解析方法および解析装置
JP7480088B2 (ja) * 2021-04-27 2024-05-09 キヤノン株式会社 画像処理装置、画像処理方法、プログラム
JP2023117906A (ja) * 2022-02-14 2023-08-24 株式会社Subaru 検査装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7386166B2 (en) * 2004-02-12 2008-06-10 Xerox Corporation Systems and methods for connecting regions image data having similar characteristics
US7660463B2 (en) * 2004-06-03 2010-02-09 Microsoft Corporation Foreground extraction using iterated graph cuts
US8675995B2 (en) * 2004-07-09 2014-03-18 Terrago Technologies, Inc. Precisely locating features on geospatial imagery
US7623712B2 (en) 2005-06-09 2009-11-24 Canon Kabushiki Kaisha Image processing method and apparatus
US7831107B2 (en) 2005-10-17 2010-11-09 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and program
US20070174268A1 (en) * 2006-01-13 2007-07-26 Battelle Memorial Institute Object clustering methods, ensemble clustering methods, data processing apparatus, and articles of manufacture
JP5067882B2 (ja) 2008-07-18 2012-11-07 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
JP4963306B2 (ja) * 2008-09-25 2012-06-27 楽天株式会社 前景領域抽出プログラム、前景領域抽出装置、及び前景領域抽出方法
JP5335581B2 (ja) 2009-07-01 2013-11-06 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
US8422769B2 (en) * 2010-03-05 2013-04-16 Microsoft Corporation Image segmentation using reduced foreground training data
US8655069B2 (en) * 2010-03-05 2014-02-18 Microsoft Corporation Updating image segmentation following user input

Also Published As

Publication number Publication date
US9152878B2 (en) 2015-10-06
US20130336582A1 (en) 2013-12-19
JP2013257843A (ja) 2013-12-26

Similar Documents

Publication Publication Date Title
JP5968098B2 (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP7043191B2 (ja) 画像認識装置、学習装置、画像認識方法、学習方法及びプログラム
Friedland et al. SIOX: Simple interactive object extraction in still images
US10303983B2 (en) Image recognition apparatus, image recognition method, and recording medium
US9344642B2 (en) Method and apparatus for capturing a first image using a first configuration of a camera and capturing a second image using a second configuration of a camera
KR101731771B1 (ko) 버스트 포토 캡처된 세트로부터 키퍼 이미지의 자동 선택
CN102542568B (zh) 图像处理装置及图像处理方法
US8805065B2 (en) Image processing apparatus and image processing method
US8081844B2 (en) Detecting orientation of digital images using face detection information
JP2014016824A (ja) 情報処理装置及びその制御方法及びプログラム
JP2013114518A (ja) 画像処理装置、および画像処理方法、並びにプログラム
CN113744167B (zh) 一种图像数据转换方法及装置
JP2015141633A (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
CN114494775A (zh) 视频切分方法、装置、设备及存储介质
CN105701813A (zh) 一种光场图像的显著性检测方法
JP2011054080A (ja) 画像処理装置および方法、並びにプログラム
US10296539B2 (en) Image extraction system, image extraction method, image extraction program, and recording medium storing program
CN105516735B (zh) 代表帧获取方法和装置
US8670609B2 (en) Systems and methods for evaluating images
JP5914046B2 (ja) 画像処理装置および画像処理方法
KR102121534B1 (ko) 시퀀스 간의 유사성을 결정하는 방법 및 디바이스
JP2014229092A (ja) 画像処理装置、画像処理方法、および、そのプログラム
JP4080276B2 (ja) オブジェクト抽出方法および装置ならびにプログラム
JP5786838B2 (ja) 画像領域分割装置、方法、およびプログラム
CN104981841B (zh) 3d图像数据分割的方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150615

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160526

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160705

R151 Written notification of patent or utility model registration

Ref document number: 5968098

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees