JP5751679B2 - 圧縮アーチファクトをマスクするためのフィルムグレインの利用 - Google Patents

圧縮アーチファクトをマスクするためのフィルムグレインの利用 Download PDF

Info

Publication number
JP5751679B2
JP5751679B2 JP2012549111A JP2012549111A JP5751679B2 JP 5751679 B2 JP5751679 B2 JP 5751679B2 JP 2012549111 A JP2012549111 A JP 2012549111A JP 2012549111 A JP2012549111 A JP 2012549111A JP 5751679 B2 JP5751679 B2 JP 5751679B2
Authority
JP
Japan
Prior art keywords
face
film grain
digital
image
skin color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012549111A
Other languages
English (en)
Other versions
JP2013517704A (ja
Inventor
ビスワズ、マイナク
バルラム、ニクヒル
Original Assignee
マーベル ワールド トレード リミテッド
マーベル ワールド トレード リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マーベル ワールド トレード リミテッド, マーベル ワールド トレード リミテッド filed Critical マーベル ワールド トレード リミテッド
Publication of JP2013517704A publication Critical patent/JP2013517704A/ja
Application granted granted Critical
Publication of JP5751679B2 publication Critical patent/JP5751679B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20204Removing film grain; Adding simulated film grain
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本願は、2010年1月15日提出の米国仮特許出願第61/295,340号明細書の恩恵を請求しており、この全体を参照としてここに組み込む。
格納デバイスおよび/または通信チャネルにおける帯域幅制限によって、ビデオデータを圧縮する必要がある。ビデオデータを圧縮することで、画像の詳細およびテクスチャが失われることがある。圧縮率が高くなるにつれ、ビデオから失われる内容も多くなる。例えば、非圧縮の90分の長さの映画の格納には90ギガバイト程度のメモリ量が必要となる。しかし、DVD媒体の通常の容量は4.7ギガバイトである。従って、単一のDVDに映画の全体を格納するためには、20:1のオーダの高い圧縮率が必要となる。同じ格納媒体に音声を格納するためにはさらにデータ圧縮が必要となる。例えばMPEG2圧縮規格を利用すると、比較的高い圧縮率を達成することができる。しかし映画を復号して再生すると、ブロックノイズおよびモスキートノイズ等の圧縮アーチファクトが現れる場合がある。変換圧縮されたデジタルビデオ(MPEG−2、MPEG−4、VC−1、WM9、DIVX等)は、数多くの種類の空間アーチファクトおよび時間アーチファクトが顕著であるという特徴を有する。アーチファクトには、コンツアーリング(contouring)(特に輝度およびクロミナンスがスムーズな領域で顕著である)、ブロックノイズ、モスキートノイズ、動き補償および予測アーチファクト、時間的ビーティング(temporal beating)、および、リンギングアーチファクトが含まれる。
伸長した後で、一定の復号ブロックの出力により、周囲の画素も共に平均化されて、より大きなブロックに見える。表示デバイスおよびテレビ受像機が大きくなると、ブロッキングその他のアーチファクトもまた目立ちやすくなる。
一実施形態では、デバイスは、デジタルビデオストリームの画像内の顔の境界を少なくとも特定することで、デジタルビデオストリームを処理するビデオプロセッサを含む。デバイスはさらに、顔の境界に基づいて画像にデジタルフィルムグレインを選択的に適用する結合器を含む。
一実施形態では、装置は、デジタルフィルムグレインを生成するフィルムグレイン生成器を含む。顔検知器は、ビデオデータストリームを受信して、ビデオデータストリームにおける画像から顔領域を判断する。結合器は、顔領域内のビデオデータストリーム内の画像にデジタルフィルムグレインを適用する。
別の実施形態では、方法は、デジタルビデオストリームの画像内の顔領域を少なくとも画定することで、デジタルビデオストリームを処理する段階と、顔領域に少なくとも一部基づいてデジタルフィルムグレインを適用することで、デジタルビデオストリームを修正する段階を備える。
添付図面は、明細書の一部として組み込まれ、明細書の一部を構成し、本開示の様々なシステム、方法、その他の実施形態を例示している。図示されているエレメントの境界(例えばボックス、ボックス群、またはその他の形状)は、境界の例である。一部の例では、1つのエレメントを複数のエレメントとして指定してもよく、複数のエレメントを1つのエレメントとして指定してもよい。一部の実施形態では、別のエレメントの内部にあるコンポーネントとして示されているエレメントを、外部コンポーネントとして実装することもできる。さらに、エレメントは実際の縮尺で描かれていない場合もある。
デジタルビデオデータの処理に関する装置の一実施形態である。
図1の装置の別の実施形態を示す。
デジタルビデオデータの処理に関する方法の一実施形態である。
ビデオ圧縮、伸長、および圧縮アーチファクトの除去といったプロセスの結果、ビデオストリームが、自然に見えなくなり、つぎはぎしたように見えてしまうことがある。一定量のフィルムグレイン(例えばノイズ)を追加することで、ビデオストリームは、人の目に、より自然で見やすくなる。フィルムグレインを追加することで、さらには、つぎはぎに見える領域に、テクスチャの多い外観を提供することもできる。ビデオストリームが大幅に圧縮されると、人間の顔といったテクスチャが必要となる箇所の詳細を失うことがある。通常は、圧縮プロセスにより、顔領域の画像は、平らで不自然に見える場合が多い。フィルムグレインを顔領域に適用することで、あまり不自然に見えないようにすることができる。
図1は、ビデオ信号を処理するときのフィルムグレインの利用に関する装置100の一実施形態を示す。大まかにいうと、装置100は、デジタルビデオストリーム(ビデオ入力)を処理するビデオプロセッサ105を含む。この例では、ビデオストリームは、ビデオプロセッサに到着する前に圧縮、伸長されていることが想定されている。顔検知器110は、ビデオストリームを分析して、ビデオの画像内の顔領域を特定する。例えば、顔領域は、人間の顔に対応する、画像内の領域である。顔領域の周囲を画定する、顔の境界も決定されてよい。一実施形態では、周囲は、顔領域の端部に沿って位置する画素群により確定されてよい。次いで、結合器115が、顔領域に基づいて、ビデオストリームにフィルムグレインを選択的に適用する。言い換えると、フィルムグレインは、顔の境界内の画素に対して適用される(例えば、顔領域内の画素に適用される)。フィルムグレインを追加すると、顔領域は、圧縮アーチファクトによる不自然に平坦な外観から、より自然に見えるようになる。一実施形態では、特定された顔の境界/領域により決定される他の領域にフィルムグレインを適用しないように、顔領域のみを対象として、フィルムグレインを選択的に適用することができる。
一部の実施形態では、装置100は、テレビ受像機、ブルーレイプレーヤ、その他のビデオディスプレイデバイスにおいて利用することができるビデオフォーマットコンバータ内に実装することができる。装置100はさらに、ネットワークからダウンロードされたビデオを見るために、コンピューティングデバイスにおいてビデオを再生するためのビデオデコーダの一部として実装することもできる。一部の実施形態では、装置100は、集積回路として実装される。
図2を参照すると、ビデオプロセッサ105を含む装置200の別の実施形態が示されている。入力ビデオストリームは先ず、圧縮アーチファクト低減器210による処理を受けて、ビデオ画像に現れる圧縮アーチファクトを低減させる。前述したように、ビデオストリームは、予め圧縮、伸長されているものとして想定する。ビデオストリームは、信号経路211、212、および213を通り、ビデオプロセッサ105、結合器115、および、フィルムグレイン生成器215にそれぞれ出力される。上述したように、ビデオプロセッサ105が生成する顔の境界により、フィルムグレイン生成器215からのフィルムグレインを、顔の境界内のビデオストリームの領域に対して適用するよう、結合器115を制御することができる。もちろん、複数の顔を含む複数の画像に対しては、複数の顔の領域を特定することができる。
一実施形態の圧縮アーチファクト低減器210は、非圧縮状態のビデオデータストリームを受信して、このビデオデータストリームを修正して、少なくとも一種類の圧縮アーチファクトを低減するようにする。例えば、一定のインループおよび後処理アルゴリズムを利用して、ブロックノイズ、モスキートノイズ、および/または、その他の種類の圧縮アーチファクトを低減することができる。ブロックアーチファクトは、圧縮ビデオ信号において異常に大きな画素ブロックとして見える歪みのことを指す。「マクロブロック」と称されることもあり、ビデオエンコーダが割り当てられている帯域幅についていけないときに生じうる。通常は、動きの速いシーケンスまたはシーンがすばやく変わるときに見える。JPEG圧縮された画像等で利用されるような、ブロックごとに量子化して符号化する場合には、複数の種類のアーチファクト(例えばリンギング、コンツアーリング、曲線端部沿いの階段状のノイズ、「ビジーな」領域におけるブロックノイズ(キルティングまたは市松模様(quilting or checkerboarding))とも称される)等が見える場合がある。従って1以上のアーチファクト低減アルゴリズムを実装することができる。圧縮アーチファクト低減器210とともに実装されるアーチファクト低減アルゴリズムの具体的な詳細は、本開示の範囲外なので、省略する。
図2を引き続き参照すると、ビデオプロセッサ105は、顔検知器110とともに肌色検知器220を含む。一般的には、顔検知器110は、人間の顔に関する領域を特定するよう構成されている。例えば、可能であれば、目、耳、および/または口等の特定の顔の特徴を発見できると、顔の領域の特定に役立つ。顔があるはずの、顔の境界を画定する境界ボックスを生成する。一実施形態では、予め選択される公差を利用して、通常の人間の頭のサイズから予想される、特定された顔の特徴から、境界ボックスを一定の距離だけ拡張することができる。境界ボックスは、必ずしもボックス形状である必要はなく、多角形、円形、楕円形等であってよく、その他、端部が曲線であっても角度をもっていてもよい。
肌色検知器220は、境界ボックス内の肌色に似た画素値を特定するべく画素値を比較する。例えば、既知の肌色値に関する予め選択された色度および彩度の値(hue and saturation values)を利用して、肌境界ボックスの領域内またはその周りの肌色を特定することができる。一実施形態では、境界ボックスの周辺に画素値比較を複数回繰り返すことで、より正確に顔の境界を発見するために端部を修正することができる。従って肌色検知器220の結果を、顔検知器110の結果と組み合わせて、顔の領域の境界ボックスを修正/調節することができる。組み合わせられた結果により、画像内で顔があるべき箇所のより良い分類器(classifier)を提供することができる。
一実施形態では、結合器115が、顔境界ボックスが画定する領域内のビデオストリームにデジタルフィルムグレインを利用する。例えば、結合器115は、顔の境界ボックス内の画素値と組み合わせられたフィルムグレインを利用してマスク値を生成する。一実施形態では、結合器115は、ビデオデータストリームの赤色、緑色、および青色のチャネルに、デジタルフィルムグレインを適用する。顔の境界ボックス外の領域はバイパスすることができる(例えば、フィルムグレインを適用しない)。このようにして、ビデオにおける顔の見え方がより自然で、テクスチャが豊富にみえるようになる。
図2を引き続き参照すると、フィルムグレイン生成器215は、ビデオストリームに適用するためのデジタルフィルムグレインを生成する。一実施形態では、顔の領域に見つかる現在の画素値に基づいて、フィルムグレインを動的に(オンザフライで)生成することもできる。フィルムグレインは、顔の領域の内容と関連性があり、カラーである(例えば肌色フィルムグレイン)。例えば、フィルムグレインは、顔の領域から赤色、緑色、および青色(RGB)パラメータを利用して生成され、その後で、ノイズ値を生成するべく修正、調節、および/またはスケーリングが行われる。
一実施形態では、フィルムグレイン生成器215は、追加する粒径とフィルムグレイン量とを制御するよう構成されている。例えば、2以上の画素幅を持ち、特定の色の値を有するデジタルフィルムグレインを生成する。色の値は正の値であっても負の値であってもよい。一般には、フィルムグレイン生成器215は、肌色値のノイズを表し、顔領域内のビデオデータストリームに適用するための値を生成する。
別の実施形態では、フィルムグレインは、ビデオデータストリームからは独立して(無作為に)生成されてよい(例えば、ビデオストリームの現在の画素値に依存せずに生成されてよい)。例えば、予め生成された肌色値をノイズとして利用したりフィルムグレインに適用したりすることができる。
一実施形態では、フィルムグレインをノイズとして生成して、ビデオアーチファクトを目に見えないようマスクする(または隠す)ことができる。この場合には、ノイズは、顔検知器110が決定する顔境界ボックスの制御のもとで、画像の顔領域に利用される。一定の種類のノイズを表示用ビデオに加えるのは、デジタル符号化アーチファクトをマスクすること、および/または、フィルムグレインを、芸術的効果を生じさせるために表示すること、という2つの理由が考えられる。
フィルムグレインノイズは、デジタルビデオの特徴である構造化されたノイズに比較して、構造化の度合いが低い。一定量のフィルムグレインノイズを加えることで、デジタルビデオは、観察者にとって、より自然で見やすくなる。デジタルフィルムグレインを利用して、デジタルビデオの、不自然にスムーズなアーチファクトをマスクすることができる。
図3を参照すると、上述したビデオデータ処理に関する方法300の一実施形態が示されている。305で、方法300はデジタルストリームを処理する。310で、ビデオから1以上の顔領域を判断する。一実施形態では、1または複数の画像内の各顔について顔の境界を特定して画定して、対応する顔領域を画定する。315では、画定された顔領域(または境界)に少なくとも一部基づいて、ビデオデータにフィルムグレインを適用することで、デジタルビデオストリームを修正する。例えば、顔領域および/または特定された顔の境界を入力として利用して、顔領域内の画素値にフィルムグレインを利用する。前述したように、フィルムグレイン、そのサイズ、および色を生成するためには様々な方法がある。別の実施形態では、これも前述したように肌色分析を行って、顔の境界を調節する。このようにすることで、顔領域を画定する領域をフィルムグレインで調節することができる。
このようにして、ここで記載したシステムおよび方法は、フィルムグレインの視覚特性を有するノイズ値を利用して、このノイズをデジタルビデオの顔領域に適用することができる。ノイズにより、圧縮ビデオで見えてしまいかねない「ブロックノイズ」および「コンツアーリング」等の不自然にスムーズなアーチファクトがマスクされる。一般的な従来のフィルムは、非常に高い解像度のデジタルセンサーを利用した場合であっても、デジタルビデオよりも美しく見やすい外観を呈していた。この「フィルムのような外観」は、デジタルビデオの、よりきつく、平坦な見え方と比較して、「クリーミーで柔和」等の表現をされる場合がある。この、フィルムが持つ美しく見やすい外観は(少なくとも一部には)、デジタルセンサーの固定された画素格子と比較して、より無作為に生じ、継続して動く、高い周波数のフィルムグレインのおかげで生じている。
以下に、ここで利用された用語の一部の定義を述べる。定義には、その用語の範囲内であり、実装に利用可能なコンポーネントの様々な例および/または形態が含まれている。これら例は限定を意図していない。用語の単数形および複数形が両方とも定義の範囲内である。
「一実施形態」「1つの実施形態」「一例」「1つの例」といった言い回しは、これら実施形態または例が、特定の特徴、構造、特性、特徴、エレメント、または限定を含むことができることを示してはいるが、必ずしも全ての実施形態または例がこれらの特徴、構造、特性、特徴、エレメント、または限定を含まねばならないというわけではない。さらに、「一実施形態」等のフレーズが繰り返し利用されていても、これらが必ずしも同じ実施形態を示していないが、示している場合もある。
ここで利用する「論理」という用語は、持続性の媒体に格納され、または、機械上で実行中であるハードウェア、ファームウェア、命令、および/またはこれらそれぞれの組み合わせを含むがこれらに限定はされず、機能または動作を実行させたり、および/または、別の論理、方法、および/または、システムから機能または動作を実行させたりする。論理は、ソフトウェア制御されたマイクロプロセッサ、離散論理(例えば、ASIC)、アナログ回路、デジタル回路、プログラミングされた論理デバイス、命令を含むメモリデバイス等を含んでよい。論理は、1以上のゲート、ゲートの組み合わせ、または、その他の回路コンポーネントを含んでよい。複数の論理が記述されている場合には、これら複数の論理を1つの物理論理に組み込むこともできる。同様に、1つの論理が記載されている場合であっても、この1つの論理を複数の論理間に分散させることもできる。ここで記載するコンポーネントおよび機能の1以上は、1以上の論理エレメントを用いて実装することができる。
例示を簡潔にしようという意図から、図示された方法は、一連のブロックとして図示、例示されている。しかし方法は、ブロックの順序に限定されず、ブロックの一部が異なる順序であっても、および/または、図示、例示されているものとは異なるブロックと同時に起こってもよい。さらに、例示されているブロックが全て、方法例を実施するために利用されなくてもよい。ブロックは、複数のコンポーネントに組み合わせられたり、複数のコンポーネントに分割されたりすることができる。さらに、追加として設けられる方法および/または別の代替方法であれば、例示されていない、追加ブロックを利用することもできる。
「含む」という用語の明細書または請求項における範囲は、請求項で従来から利用されている「備える」に関する意味と同じ、包括的な意味合いで捉えられるべきである。
例を示してシステム、方法例を示してきた。例にはかなり詳しい詳細が述べられているが、出願人は、添付請求項の範囲をこのように限定する意図はない。ここで記載するシステム、方法を説明するために、思いつく限り全てのコンポーネントまたは方法の組み合わせを記載することは無理である点は理解されよう。従って、開示は、特定の詳細、代表的な装置、および例示および図示された例に限定はされない。このように本願は、添付請求項の範囲内の変更例、修正例、および、変形例を含むことを意図している。
[項目1]
デジタルビデオストリームの画像内の顔の境界を少なくとも特定することで、前記デジタルビデオストリームを処理するビデオプロセッサと、
前記顔の境界に基づいて前記画像にデジタルフィルムグレインを選択的に適用する結合器と、
を備えるデバイス。
[項目2]
前記結合器は、前記デジタルフィルムグレインを、前記デジタルビデオストリームの赤色、緑色、および青色チャネルに適用する項目1に記載のデバイス。
[項目3]
前記顔の境界内の画素値の色に関連性を有する前記デジタルフィルムグレインを生成するフィルムグレイン生成器をさらに備える項目1に記載のデバイス。
[項目4]
前記結合器は、前記顔の境界外の領域には前記デジタルフィルムグレインを適用せずに、前記顔の境界内の画素値と前記デジタルフィルムグレインとを組み合わせることで、前記画像を修正する項目1に記載のデバイス。
[項目5]
前記デジタルフィルムグレインを、1画素幅を超えるサイズで生成するフィルムグレイン生成器をさらに備える項目1に記載のデバイス。
[項目6]
前記ビデオプロセッサは、
顔領域に関する顔の部分を特定するべく、前記画像内の画素から肌色値を判断する肌色検知器と、
前記顔領域の境界であり、前記肌色値に少なくとも一部基づいて調節される前記顔の境界を決定する顔検知器と、
を有する項目1に記載のデバイス。
[項目7]
デジタルフィルムグレインを生成するフィルムグレイン生成器と、
ビデオデータストリームを受信して、前記ビデオデータストリームにおける画像から顔領域を判断する顔検知器と、
前記顔領域内の前記ビデオデータストリーム内の前記画像に前記デジタルフィルムグレインを適用する結合器と、
を備える装置。
[項目8]
前記フィルムグレインを、前記ビデオデータストリーム内の赤色、緑色、および青色チャネルに適用する項目7に記載の装置。
[項目9]
前記フィルムグレイン生成器は、前記ビデオデータストリームからの、赤色、緑色、および青色パラメータを利用して前記デジタルフィルムグレインを生成する項目7に記載の装置。
[項目10]
前記フィルムグレイン生成器は、前記ビデオデータストリームの画素値に関連性を有するノイズ値のマスクを生成し、前記マスクは、前記デジタルフィルムグレインを表す項目7に記載の装置。
[項目11]
前記顔検知器は、画像内の前記顔領域の境界を表す境界ボックスを生成し、
前記結合器は、前記境界ボックスに基づいて前記デジタルフィルムグレインを適用する項目7に記載の装置。
[項目12]
前記顔検知器は、
顔の複数の部分を特定するべく、前記画像内の画素から肌色値を判断する肌色検知器を有し、
前記顔検知器は、前記肌色値に少なくとも一部基づいて調節される、前記顔領域の境界を判断する項目7に記載の装置。
[項目13]
前記結合器は、前記顔領域外の領域には前記デジタルフィルムグレインを適用せずに、前記顔領域内の前記画像に前記デジタルフィルムグレインを適用する項目7に記載の装置。
[項目14]
非圧縮形式の前記ビデオデータストリームを受信して、少なくとも一種類の圧縮アーチファクトを低減させるように前記ビデオデータストリームを修正する圧縮アーチファクト低減器をさらに備え、
前記装置は、前記修正されたビデオストリームを前記フィルムグレイン生成器、前記顔検知器、および前記結合器にそれぞれ出力する信号経路を含む項目7に記載の装置。
[項目15]
デジタルビデオストリームの画像内の顔領域を少なくとも画定することで、前記デジタルビデオストリームを処理する段階と、
前記顔領域に少なくとも一部基づいてデジタルフィルムグレインを適用することで、前記デジタルビデオストリームを修正する段階と、
を備える方法。
[項目16]
前記デジタルフィルムグレインは、前記デジタルビデオストリームの赤色、緑色、および青色チャネルに適用される色の値を持つ項目15に記載の方法。
[項目17]
前記顔領域内のビデオデータストリームからの画素値からの肌色値を利用して、前記デジタルフィルムグレインを生成する段階をさらに備える項目15に記載の方法。
[項目18]
前記デジタルフィルムグレインは、前記顔領域外の領域には適用されず、前記顔領域内の画像に適用される項目15に記載の方法。
[項目19]
肌色値から前記デジタルフィルムグレインを生成する段階をさらに備える項目15に記載の方法。
[項目20]
前記顔領域を画定する段階は、
顔の複数の部分を特定するべく、前記画像内の画素から肌色値を判断する段階と、
前記肌色値に少なくとも一部基づいて、前記顔領域の境界を調節する段階と、
を有する項目15に記載の方法。

Claims (24)

  1. デジタルビデオストリームの画像内の顔の境界を少なくとも特定することで、前記デジタルビデオストリームを処理するビデオプロセッサと、
    前記画像内の顔領域における、赤色、緑色及び青色の画素値に基づいて、デジタルフィルムグレインを動的に生成するフィルムグレイン生成器と、
    前記顔の境界に基づいて前記画像内の前記顔領域、前記生成されたデジタルフィルムグレインを選択的に適用する結合器と
    を備えるデバイス。
  2. 前記結合器は、前記デジタルフィルムグレインを、前記デジタルビデオストリームの赤色、緑色、および青色チャネルに適用する請求項1に記載のデバイス。
  3. 前記結合器は、前記顔の境界外の領域には前記デジタルフィルムグレインを適用せずに、前記顔の境界内の画素値と前記デジタルフィルムグレインとを組み合わせることで、前記画像を修正する請求項1又は2に記載のデバイス。
  4. 前記フィルムグレイン生成器は、前記デジタルフィルムグレインを、1画素幅を超えるサイズで生成する請求項1から3のいずれか一項に記載のデバイス。
  5. 前記ビデオプロセッサは、
    顔領域に関する顔の部分を特定するべく、前記画像内の画素から肌色値を判断する肌色検知器と、
    前記顔領域の境界であり、前記肌色値に少なくとも一部基づいて調節される前記顔の境界を決定する顔検知器と
    を有する請求項1から4のいずれか一項に記載のデバイス。
  6. 前記顔検知器は、目、耳および口のうち少なくとも一つの顔の特徴に基づいて、前記顔の境界を確定する境界ボックスを生成し、頭のサイズから予想される顔の特徴に基づいて前記境界ボックスを拡張する請求項5に記載のデバイス。
  7. 前記肌色検知器は、前記境界ボックス内の肌色に対応する画素値を特定すべく画素値の比較を行い、前記境界ボックスの端部を修正する請求項6に記載のデバイス。
  8. ビデオデータストリームの画像内の顔領域における、赤色、緑色及び青色の画素値に基づいて、デジタルフィルムグレインを動的に生成するフィルムグレイン生成器と、
    前記ビデオデータストリームを受信して、前記ビデオデータストリームにおける画像から前記顔領域を判断する顔検知器と、
    記ビデオデータストリームの前記画像内の前記顔領域に前記生成されたデジタルフィルムグレインを適用する結合器と
    を備える装置。
  9. 前記フィルムグレインを、前記ビデオデータストリーム内の赤色、緑色、および青色チャネルに適用する請求項に記載の装置。
  10. 前記フィルムグレイン生成器は、前記ビデオデータストリームの画素値に関連性を有するノイズ値のマスクを生成し、前記マスクは、前記デジタルフィルムグレインを表す請求項8又は9に記載の装置。
  11. 前記顔検知器は、画像内の前記顔領域の境界を表す境界ボックスを生成し、
    前記結合器は、前記境界ボックスに基づいて前記デジタルフィルムグレインを適用する請求項8から10のいずれか一項に記載の装置。
  12. 前記顔検知器は、目、耳および口のうち少なくとも一つの顔の特徴に基づいて、前記境界ボックスを生成し、頭のサイズから予想される顔の特徴に基づいて前記境界ボックスを拡張する請求項11に記載の装置。
  13. 前記顔検知器は、
    顔の複数の部分を特定するべく、前記画像内の画素から肌色値を判断する肌色検知器を有し、
    前記顔検知器は、前記肌色値に少なくとも一部基づいて調節される、前記顔領域の境界を判断する請求項8から12のいずれか一項に記載の装置。
  14. 前記肌色検知器は、前記顔検知器により生成された、前記顔領域の境界を表す境界ボックス内の肌色に対応する画素値を特定すべく画素値の比較を行い、前記境界ボックスの端部を修正する請求項13に記載の装置。
  15. 前記結合器は、前記顔領域外の領域には前記デジタルフィルムグレインを適用せずに、前記顔領域内の前記画像に前記デジタルフィルムグレインを適用する請求項8から14のいずれか一項に記載の装置。
  16. 非圧縮形式の前記ビデオデータストリームを受信して、少なくとも一種類の圧縮アーチファクトを低減させるように前記ビデオデータストリームを修正する圧縮アーチファクト低減器をさらに備え、
    前記装置は、前記修正されたビデオストリームを前記フィルムグレイン生成器、前記顔検知器、および前記結合器にそれぞれ出力する信号経路を含む請求項8から15のいずれか一項に記載の装置。
  17. デジタルビデオストリームの画像内の顔領域を少なくとも画定することで、前記デジタルビデオストリームを処理する段階と、
    前記画像内の顔領域における、赤色、緑色及び青色の画素値に基づいて、デジタルフィルムグレインを動的に生成する段階と、
    前記顔領域に少なくとも一部基づいて、前記生成されたデジタルフィルムグレインを適用することで、前記デジタルビデオストリームを修正する段階と
    を備える方法。
  18. 前記デジタルビデオストリームを処理する段階は、
    目、耳および口のうち少なくとも一つの顔の特徴に基づいて、前記画像内の顔の境界を確定する境界ボックスを生成する段階と、
    頭のサイズから予想される顔の特徴に基づいて前記境界ボックスを拡張する段階と
    を含む、請求項17に記載の方法。
  19. 前記デジタルビデオストリームを処理する段階は、
    前記境界ボックス内の肌色に対応する画素値を特定すべく画素値の比較を行い、前記境界ボックスの端部を修正する段階を含む、請求項18に記載の方法。
  20. 前記デジタルフィルムグレインは、前記デジタルビデオストリームの赤色、緑色、および青色チャネルに適用される色の値を持つ請求項17から19のいずれか一項に記載の方法。
  21. 前記顔領域内のビデオデータストリームからの画素値からの肌色値を利用して、前記デジタルフィルムグレインを生成する段階をさらに備える請求項17から20のいずれか一項に記載の方法。
  22. 前記デジタルフィルムグレインは、前記顔領域外の領域には適用されず、前記顔領域内の画像に適用される請求項17から21のいずれか一項に記載の方法。
  23. 肌色値から前記デジタルフィルムグレインを生成する段階をさらに備える請求項17から22のいずれか一項に記載の方法。
  24. 前記顔領域を画定する段階は、
    顔の複数の部分を特定するべく、前記画像内の画素から肌色値を判断する段階と、
    前記肌色値に少なくとも一部基づいて、前記顔領域の境界を調節する段階と
    を有する請求項17から23のいずれか一項に記載の方法。
JP2012549111A 2010-01-15 2011-01-14 圧縮アーチファクトをマスクするためのフィルムグレインの利用 Expired - Fee Related JP5751679B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US29534010P 2010-01-15 2010-01-15
US61/295,340 2010-01-15
PCT/US2011/021299 WO2011088321A1 (en) 2010-01-15 2011-01-14 Use of film grain to mask compression artifacts

Publications (2)

Publication Number Publication Date
JP2013517704A JP2013517704A (ja) 2013-05-16
JP5751679B2 true JP5751679B2 (ja) 2015-07-22

Family

ID=43754767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012549111A Expired - Fee Related JP5751679B2 (ja) 2010-01-15 2011-01-14 圧縮アーチファクトをマスクするためのフィルムグレインの利用

Country Status (4)

Country Link
US (1) US20110176058A1 (ja)
JP (1) JP5751679B2 (ja)
CN (1) CN102714723B (ja)
WO (1) WO2011088321A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230179805A1 (en) * 2021-12-07 2023-06-08 Qualcomm Incorporated Adaptive film grain synthesis

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170272778A9 (en) * 2014-01-06 2017-09-21 Samsung Electronics Co., Ltd. Image encoding and decoding methods for preserving film grain noise, and image encoding and decoding apparatuses for preserving film grain noise
US9614724B2 (en) 2014-04-21 2017-04-04 Microsoft Technology Licensing, Llc Session-based device configuration
US9639742B2 (en) 2014-04-28 2017-05-02 Microsoft Technology Licensing, Llc Creation of representative content based on facial analysis
US9773156B2 (en) 2014-04-29 2017-09-26 Microsoft Technology Licensing, Llc Grouping and ranking images based on facial recognition data
US10111099B2 (en) 2014-05-12 2018-10-23 Microsoft Technology Licensing, Llc Distributing content in managed wireless distribution networks
US9430667B2 (en) 2014-05-12 2016-08-30 Microsoft Technology Licensing, Llc Managed wireless distribution network
US9384335B2 (en) 2014-05-12 2016-07-05 Microsoft Technology Licensing, Llc Content delivery prioritization in managed wireless distribution networks
US9384334B2 (en) 2014-05-12 2016-07-05 Microsoft Technology Licensing, Llc Content discovery in managed wireless distribution networks
US9874914B2 (en) 2014-05-19 2018-01-23 Microsoft Technology Licensing, Llc Power management contracts for accessory devices
US10037202B2 (en) 2014-06-03 2018-07-31 Microsoft Technology Licensing, Llc Techniques to isolating a portion of an online computing service
US9367490B2 (en) 2014-06-13 2016-06-14 Microsoft Technology Licensing, Llc Reversible connector for accessory devices
US9460493B2 (en) 2014-06-14 2016-10-04 Microsoft Technology Licensing, Llc Automatic video quality enhancement with temporal smoothing and user override
US9373179B2 (en) 2014-06-23 2016-06-21 Microsoft Technology Licensing, Llc Saliency-preserving distinctive low-footprint photograph aging effect
KR102604919B1 (ko) 2016-07-14 2023-11-23 인튜어티브 서지컬 오퍼레이션즈 인코포레이티드 컴퓨터 보조 원격조작 시스템에서의 2차 기구 제어
US11094099B1 (en) 2018-11-08 2021-08-17 Trioscope Studios, LLC Enhanced hybrid animation
CA3156314A1 (en) * 2021-04-19 2022-10-19 Comcast Cable Communications, Llc Methods, systems, and apparatuses for adaptive processing of video content with film grain
CN116129511A (zh) * 2021-11-11 2023-05-16 富士通株式会社 图像处理装置、图像处理方法和机器可读存储介质

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5150432A (en) * 1990-03-26 1992-09-22 Kabushiki Kaisha Toshiba Apparatus for encoding/decoding video signals to improve quality of a specific region
US6798834B1 (en) * 1996-08-15 2004-09-28 Mitsubishi Denki Kabushiki Kaisha Image coding apparatus with segment classification and segmentation-type motion prediction circuit
AUPP400998A0 (en) * 1998-06-10 1998-07-02 Canon Kabushiki Kaisha Face detection in digital images
JP2002204357A (ja) * 2000-12-28 2002-07-19 Nikon Corp 画像復号化装置、画像符号化装置、および記録媒体
US6564851B1 (en) * 2001-12-04 2003-05-20 Yu Hua Liao Detachable drapery hanger assembly for emergency use
AUPS170902A0 (en) * 2002-04-12 2002-05-16 Canon Kabushiki Kaisha Face detection and tracking in a video sequence
US7269292B2 (en) * 2003-06-26 2007-09-11 Fotonation Vision Limited Digital image adjustable compression and resolution using face detection information
EP1665803A1 (en) * 2003-08-20 2006-06-07 THOMSON Licensing Video comfort noise addition technique
KR100682889B1 (ko) * 2003-08-29 2007-02-15 삼성전자주식회사 영상에 기반한 사실감 있는 3차원 얼굴 모델링 방법 및 장치
CA2538785C (en) * 2003-09-23 2013-10-29 Thomson Licensing S.A. Method for simulating film grain by mosaicing pre-computed samples
RU2342703C2 (ru) * 2003-09-23 2008-12-27 Томсон Лайсенсинг Методика имитации зернистости пленки с помощью частотной фильтрации
ES2363772T3 (es) * 2003-09-23 2011-08-16 Thomson Licensing Técnica de adición de ruido de confort video.
US7593465B2 (en) * 2004-09-27 2009-09-22 Lsi Corporation Method for video coding artifacts concealment
JP4543873B2 (ja) * 2004-10-18 2010-09-15 ソニー株式会社 画像処理装置および処理方法
US7432986B2 (en) * 2005-02-16 2008-10-07 Lsi Corporation Method and apparatus for masking of video artifacts and/or insertion of film grain in a video decoder
TWI279143B (en) * 2005-07-11 2007-04-11 Softfoundry Internat Ptd Ltd Integrated compensation method of video code flow
KR100738075B1 (ko) * 2005-09-09 2007-07-12 삼성전자주식회사 영상 부호화/복호화 장치 및 방법
US7664337B2 (en) * 2005-12-20 2010-02-16 Marvell International Ltd. Film grain generation and addition
US7821578B2 (en) * 2006-04-07 2010-10-26 Marvell World Trade Ltd. Reconfigurable self-calibrating adaptive noise reducer
US20080204598A1 (en) * 2006-12-11 2008-08-28 Lance Maurer Real-time film effects processing for digital video
US8213500B2 (en) * 2006-12-21 2012-07-03 Sharp Laboratories Of America, Inc. Methods and systems for processing film grain noise
US8879001B2 (en) * 2006-12-28 2014-11-04 Thomson Licensing Detecting block artifacts in coded images and video
US7873210B2 (en) * 2007-03-14 2011-01-18 Autodesk, Inc. Automatic film grain reproduction
US8483283B2 (en) * 2007-03-26 2013-07-09 Cisco Technology, Inc. Real-time face detection
US20100110287A1 (en) * 2008-10-31 2010-05-06 Hong Kong Applied Science And Technology Research Institute Co. Ltd. Method and apparatus for modeling film grain noise
US8548257B2 (en) * 2009-01-05 2013-10-01 Apple Inc. Distinguishing between faces and non-faces
US8385638B2 (en) * 2009-01-05 2013-02-26 Apple Inc. Detecting skin tone in images

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230179805A1 (en) * 2021-12-07 2023-06-08 Qualcomm Incorporated Adaptive film grain synthesis
US12375734B2 (en) * 2021-12-07 2025-07-29 Qualcomm Incorporated Adaptive film grain synthesis

Also Published As

Publication number Publication date
WO2011088321A1 (en) 2011-07-21
JP2013517704A (ja) 2013-05-16
CN102714723B (zh) 2016-02-03
US20110176058A1 (en) 2011-07-21
CN102714723A (zh) 2012-10-03

Similar Documents

Publication Publication Date Title
JP5751679B2 (ja) 圧縮アーチファクトをマスクするためのフィルムグレインの利用
CN112889283B (zh) 编码方法及其设备以及解码方法及其设备
JP5596302B2 (ja) 空間周波数解析を使用して圧縮イメージをガモットマップイメージに処理する方法
JP5301716B2 (ja) デジタル画像フレームにフィルムグレインを与える方法、およびシステム
EP3280138A2 (en) Image processing apparatus, image projection apparatus, and image processing method
JP5514338B2 (ja) 映像処理装置、映像処理方法、テレビジョン受像機、プログラム、及び記録媒体
US6477201B1 (en) Content-adaptive compression encoding
JP5514344B2 (ja) 映像処理装置、映像処理方法、テレビジョン受像機、プログラム、及び記録媒体
WO2013172149A1 (ja) 画像処理装置、動画像処理装置、映像処理装置、画像処理方法、映像処理方法、テレビジョン受像機、プログラム、及び記録媒体
WO2021193648A1 (ja) 画像処理装置およびサーバ
US8659684B2 (en) Image processing apparatus, program, method and image capturing system
CN102106148A (zh) 通过选择性保留相关的视觉细节以高效视频压缩的系统和方法
US11544830B2 (en) Enhancing image data with appearance controls
JP3081658B2 (ja) 画像信号符号化装置及び画像信号復号化装置
GB2489233A (en) Image Noise Reduction Resulting in Higher Noise and/or Texture in Image Parts Representing Human Skin
JP2005295371A (ja) ブロックノイズ除去装置
JP2019004304A (ja) 画像符号化装置、画像符号化方法、及び画像符号化プログラム
JP6606660B2 (ja) 画像データ符号化装置
JP2004336478A (ja) 画像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140109

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150303

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150421

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150515

R150 Certificate of patent or registration of utility model

Ref document number: 5751679

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20180608

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees