JP2004248285A - 画像通話時における話者の映像の差動的符号化可能のビデオエンコーダ及びこれを利用したビデオ信号圧縮方法 - Google Patents
画像通話時における話者の映像の差動的符号化可能のビデオエンコーダ及びこれを利用したビデオ信号圧縮方法 Download PDFInfo
- Publication number
- JP2004248285A JP2004248285A JP2004034105A JP2004034105A JP2004248285A JP 2004248285 A JP2004248285 A JP 2004248285A JP 2004034105 A JP2004034105 A JP 2004034105A JP 2004034105 A JP2004034105 A JP 2004034105A JP 2004248285 A JP2004248285 A JP 2004248285A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- discrete cosine
- motion
- cosine transform
- video signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】 画像通話時、話者の映像を区分して差動的符号化できるビデオエンコーダを提供する。
【解決手段】 入力されるビデオ信号から個体の動きを推定し、個体の動きベクトルを算出する動き推定部と、動きベクトルから話者の輪郭を示す話者領域を検出する話者領域検出部と、動き推定部から出力されたビデオ信号を離散コサイン変換によって離散コサイン変換係数を算出する離散コサイン変換部と、離散コサイン変換係数を利用して話者領域から話者の顔領域を検出し、検出された顔領域と非顔領域を区分することによって、差別量子化テーブルを生成する顔領域検出部と、話者領域に基づいて量子化のための量子化ステップサイズを可変的に設定する適応的ビット率制御部と、量子化ステップサイズ及び差別量子化テーブルによって離散コサイン変換係数を量子化する量子化部と、を含む。
【選択図】 図3
【解決手段】 入力されるビデオ信号から個体の動きを推定し、個体の動きベクトルを算出する動き推定部と、動きベクトルから話者の輪郭を示す話者領域を検出する話者領域検出部と、動き推定部から出力されたビデオ信号を離散コサイン変換によって離散コサイン変換係数を算出する離散コサイン変換部と、離散コサイン変換係数を利用して話者領域から話者の顔領域を検出し、検出された顔領域と非顔領域を区分することによって、差別量子化テーブルを生成する顔領域検出部と、話者領域に基づいて量子化のための量子化ステップサイズを可変的に設定する適応的ビット率制御部と、量子化ステップサイズ及び差別量子化テーブルによって離散コサイン変換係数を量子化する量子化部と、を含む。
【選択図】 図3
Description
本発明は、画像通信用のビデオエンコーダ及びこれを利用した映像圧縮方法に関し、より詳細には、話者の顔部分及びその他の部分を区分して映像の質を差動的に適用することができる画像通信用のビデオエンコーダ及びこれを利用した映像圧縮方法に関する。
通信技術の発達に伴い映像圧縮技術及びマルチメディア伝送技術などが急速に進歩している。さらに、デジタルカメラのような撮像装置の普及によって、撮像装置と外部ディバイスとの間の映像データの交換ができる技術が要求されている。また、携帯電話を利用して通話する時、使用者は、音声通信だけでなく相手の顔を見ながら画像通信をすることを希望するようになっている。
このような使用者の希望を満足させるために、MPEG1(Motion Picture Expert Group 1)、MPEG2、MPEG4、及びH.263のような映像圧縮技術が提案され、この映像圧縮技術を通じて携帯電話を利用した画像通信が現実化及び常用化されている。
MPEG4は、国際標準化委員会(International Standardization Organization: ISO)及び国際電気学会(International Electrotechnical Commission: IEC)によって共通設立された技術諮問委員会(Joint Technical Committee: JTC)傘下のマルチメディア関連の符号化技術の国際標準規格を制定する組織であるSC29(Sub Committee 29)においてWG11(Working Group 11)という名で活動している動映像及び関連オーディオ信号圧縮及び復元に関する技術標準組織である。MPEG1及びMPEG2は、予め決定されたデータ処理量によって任意のサイズで入力される動映像及び音声情報をビットストリーム(bit stream)に圧縮し、前記ビットストリームを伝送する技術である。MPEG2によって圧縮されたビットストリームを受信する受信段は、前記受信されたビットストリームをデコーディング(decoding)し、前記デコーディングされたビットストリームを画面やスピーカを通じて出力する。
MPEG4は、国際標準化委員会(International Standardization Organization: ISO)及び国際電気学会(International Electrotechnical Commission: IEC)によって共通設立された技術諮問委員会(Joint Technical Committee: JTC)傘下のマルチメディア関連の符号化技術の国際標準規格を制定する組織であるSC29(Sub Committee 29)においてWG11(Working Group 11)という名で活動している動映像及び関連オーディオ信号圧縮及び復元に関する技術標準組織である。MPEG1及びMPEG2は、予め決定されたデータ処理量によって任意のサイズで入力される動映像及び音声情報をビットストリーム(bit stream)に圧縮し、前記ビットストリームを伝送する技術である。MPEG2によって圧縮されたビットストリームを受信する受信段は、前記受信されたビットストリームをデコーディング(decoding)し、前記デコーディングされたビットストリームを画面やスピーカを通じて出力する。
H.263は、低伝送率を有する通信線路(64kbps以下)を通じる映像会議またはビデオ電話などのために、ITU−T(International Telecommunications Union - Telecommunication Standardization Sector)によって提案された動映像圧縮技術である。
現在常用化進行中のCDMA(Code Division Multiple Access)EVDO及びUMTS(Universal Mobile Telecommunications System)ネットワークを通じた両方向画像通話が支援できる携帯電話に内蔵されるH.263/MPEG4ビデオエンコーダは、携帯電話に装着されたカメラから映像を受信し、前記受信された映像を効率的な圧縮方法によって圧縮し、前記圧縮された映像を伝送プロトコル階層に伝達する。このH.263/MPEG4ビデオエンコーダは、携帯電話という制限されたリソース及び計算能力を有する環境に適合するように最適化され、128kbps以下の狭帯域通信環境に合うように画質及びビットストリームサイズを適切に調節する。
現在常用化進行中のCDMA(Code Division Multiple Access)EVDO及びUMTS(Universal Mobile Telecommunications System)ネットワークを通じた両方向画像通話が支援できる携帯電話に内蔵されるH.263/MPEG4ビデオエンコーダは、携帯電話に装着されたカメラから映像を受信し、前記受信された映像を効率的な圧縮方法によって圧縮し、前記圧縮された映像を伝送プロトコル階層に伝達する。このH.263/MPEG4ビデオエンコーダは、携帯電話という制限されたリソース及び計算能力を有する環境に適合するように最適化され、128kbps以下の狭帯域通信環境に合うように画質及びビットストリームサイズを適切に調節する。
図1は、従来のデジタルビデオ信号を圧縮するためのビデオエンコーダ、例えば、MPEG2方式のイメージ符号化システムを示すブロック図である。
図1を参照すると、フレーム形式のビデオ信号は、第1フレームメモリ10に入力される。前記フレームは、ブロック単位で処理できるように画素データの連続的なブロックとして第1フレームメモリ10に貯蔵される。フレームのブロックは、通常的に8×8または16×16の画素サイズを有する。
離散コサイン変換(Discrete Cosine Transform: DCT)部12は、第1フレームメモリ10からブロック単位で読み取られるビデオ信号をDCT変換し、DCT係数を発生する。ビット率制御部30は、目標伝送ビット率を合わせるために量子化部(quantizer)14によって量子化のために使用される量子化テーブルを決定するための量子化ステップサイズ情報を量子化部14に提供する。量子化部14は、前記量子化ステップサイズ情報に基づいて量子化テーブルを決定し、前記決定された量子化テーブルによってDCT係数を量子化する。
前記量子化されたDCT係数は、ジグザグパターンでスキャニングされて可変長符号化部(Variable Length Coder)16に入力される。可変長符号化部16は、前記スキャニングされたDCT係数を可変長符号化されたデータに変換する。前記可変長符号化されたDCT係数は、ビットストリーム発生部(図示せず)によって連続的なビットストリームに変換される。前記ビットストリームは、所定の時間の間にバッファ18に貯蔵され、入力信号によって出力される。バッファ18は、いくらのビットストリームを貯蔵することができるかを示すバッファ状態情報をビット率制御部30に提供する。ビット率制御部30は、前記バッファ状態情報に基づいて量子化ステップサイズを決定し、前記決定された量子化ステップサイズ情報を量子化部14及び可変長符号化部16に提供する。その結果、量子化部14は、前記量子化ステップサイズ情報に基づいてDCT係数を量子化し、可変長符号化部16は、前記量子化ステップサイズ情報に基づいて前記量子化されたDCT係数を可変的に符号化する。
量子化部14によって量子化されたDCT係数は、逆量子化(dequantizer)部20に入力されて逆量子化される。逆量子化部20によって逆量子化されたDCT係数は、逆離散コサイン変換(Inverse Discrete Cosine Transform: IDCT)部22によってブロック単位の画素データにIDCT変換される。前記ブロック単位の画素データは、第2フレームメモリ24に貯蔵される。1つのビデオフレームの全体ブロックが順次に再生されて第2フレームメモリ24に貯蔵される。第2フレームメモリ24に貯蔵された前記再生されたイメージフレームは、動き推定部(Motion Estimation)26によって前記再生されたイメージから動きの客体を推定するための参照フレームとして使用される。
1番目のビデオフレームの全体ブロックが図1のビデオエンコーダによって符号化された後、2番目のビデオフレームが前記ビデオエンコーダに入力される。動き推定部26は、第2フレームメモリ24に貯蔵された参照フレームの探索領域から前記2番目のフレームの1番目のマクロブロック(Macro Block: MB)と最も類似た領域を探索する。通常的に、探索領域は、複数の候補マクロブロックから構成される。動き推定部26は、マクロブロックと同一の画素サイズを有する参照領域を探索領域内で上下左右に半(0.5)画素(Half Pixel)単位で移動しながら、マクロブロックと参照領域とのそれぞれの画素対画素を比較する。マクロブロックは、通常的に、8×8または16×16のサイズを有する。ここで、動き推定のためにFBMA(Full Searching Block Matching Algorithm)、TSS(Three Step Search)、ダイアモンド探索(Diamond Search)及び階層的動き推定(Hierarchical Motion Estimation)のような通常の多様な探索アルゴリズム(Searching Algorithm)またはブロックマッチング(Block Matching)技法が使用される。この比較過程を通じて動き推定部26によって比較された前記参照フレームの最も類似した参照領域と2番目のイメージフレームのマクロブロックとの間の位置関係を示す動きベクトル(Motion Vector: MV)が決定される。
加算部28は、2番目のフレームの1番目のマクロブロックと参照フレームの最も類似した参照領域とを加算し、2番目のフレームの1番目のマクロブロックと参照フレームの最も類似した参照領域との間の差分を算出する。前記差分は、動きベクトル(MV)と共にDCT部12、量子化部14及び可変長符号化部16を通じて符号化される。前記差分及び動きベクトルが別のモジュールによって別の過程を通じて算出されると説明したが、前記差分及び前記動きベクトルは1つのモジュールを通じて算出されることもできる。差分は、逆量子化部20及びIDCT部22に入力され、次のフレームの動き推定のために、再生された画素データとして第2フレームメモリ24に貯蔵される。前記過程は、2番目のフレームの全体ブロックに対して順次に適用される。
前記動き推定のために使用される参照フレームは、原のイメージフレームでなく、予め符号化された、つまり、量子化されたDCT係数を復号化することによって再生されたフレームである。これは、ビデオエンコーダによって符号化されたイメージデータを受信して復号化時の過程と同一の過程を遂行することによって、ビデオエンコーダとビデオデコーダとの間の誤差を最小化するためである。
前述したビデオエンコーダ及びデコーダが適用された携帯電話を利用した画像通信用ビデオコーデック(CODEC)の場合、遅延時間及び演算量を考慮してIピクチャ(Intra-Picture)及びPピクチャ(Predictive-Picture)のフレームのみを使用する。前記ビデオエンコーダは、通信帯域幅を合わせるために、映像の内容によって量子化値を動的に適用することによって画質を調節しながら一定サイズのビットストリームを生成する。
前記Iピクチャは、イントラ(intra)符号化映像、つまり、フレーム内の符号化映像である。Iピクチャの役割は、GOP(Group of Picture)の独立性を確保し、画面上の全てをイントラ符号化することである。前記Iピクチャは、原の映像と同一の順序で符号化される。前記Pピクチャは、フレーム間順方向予測符号化映像である。前記Pピクチャは、画面上のサブブロック単位の部分でイントラ符号化を含む場合もある。前記Pピクチャは、原の映像と同一の順序で符号化される。
従って、映像の動きが多いか、画面が複雑である場合、ビット量が増加する。このビット量の増加は、量子化値を増加させ、この量子化値の増加は、画質を低下させるが、圧縮率を向上させる。逆に、映像の動きが少なく、画面が単純である場合、減少された量子化値を適用して原の映像の画質を維持することができる。
一般的に、画像通話の場合、全体映像内に背景を除いた個体の数が制限される可能性が高く、前記個体の一部分は、話者にとって重要な意味を有する。つまり、画像通話の間には、背景の重要度が最も低く、話者周辺の人や話者に近接した個体が次の重要度を有し、話者自身が最高の重要度を有する。特に、話者の顔部分は、画像通話時に最高の重要度を有する。
しかしながら、現在使用されている画像通信用ビデオエンコーダ装置は、個体に対する概念を考慮せずに全体映像に対する圧縮を遂行する。つまり、従来の画像通信用ビデオエンコーダは、全体映像に対して同一に圧縮率を適用する。
図2(a)及び図2(b)は、全体映像に同一の圧縮率または同一の量子化ステップサイズを適用による画質変化の例を示す。図示されたように、全体映像に対して同一の量子化ステップサイズを適用する場合、圧縮された画面に表示される映像の画質が全体的に低下する。つまり、従来の画像通信用ビデオエンコーダ装置は、全体映像のうち高画質を維持する必要がある部分と、高画質を維持する必要のない部分とを区分することができない。
現在、MPEGは、個体を分離して符号化する技術が提案されている。しかしながら、前記個体を精密に分離する目的は、多様な背景で対応する個体を使用することである。従って、このような技術は、実時間及び移動通信環境では具現することが困難である。従って、3GPP/3GPP2によって提案される画像通信用標準ビデオコーデックは、個体を区分することを考慮していない。
前述したような問題点を解決するための本発明の目的は、話者の顔として推定される領域を他の領域に比べて適応的に高画質に維持することのできる画像通信用ビデオエンコーダ及びこれを利用して映像圧縮方法を提供することにある。
本発明の他の目的は、話者の顔として推定される領域を他の領域に比べて適応的に高画質に維持するために標準画像通信用ビデオエンコーダに容易に適用できる画像通信用ビデオエンコーダ及びこれを利用した映像圧縮方法を提供することにある。
また、本発明の他の目的は、動映像の動きベクトル情報及び話者の顔領域の色情報を利用して顔色領域が検出される場合、他の領域に比べて高画質の話者の顔領域を表示することのできる画像通信用ビデオエンコーダ及びこれを利用した映像圧縮方法を提供することにある。
このような目的を達成するための本発明による離散コサイン変換及び動き推定を通じてビデオ信号を符号化するビデオエンコーダは、入力されるビデオ信号から個体の動きを推定し、前記個体の動きベクトルを算出する動き推定部と、前記動きベクトルから話者の輪郭を示す話者領域を検出する話者領域検出部と、前記動き推定部から出力されたビデオ信号を離散コサイン変換することによって離散コサイン変換係数を算出する離散コサイン変換部と、前記離散コサイン変換係数を利用して前記話者領域から前記話者の顔領域を検出し、前記検出された前記顔領域と非顔領域を区分することによって、差別量子化テーブルを生成する顔領域検出部と、前記話者領域に基づいて量子化のための量子化ステップサイズを可変的に設定する適応的ビット率制御部と、前記量子化ステップサイズ及び前記差別量子化テーブルによって前記離散コサイン変換係数を量子化する量子化部と、を含む。
望ましくは、前記適応的ビット率制御部は、前記話者領域及び前記顔領域のうち少なくとも1つに基づいて前記量子化ステップサイズを可変的に設定する。さらに、前記動き推定部は、前記ビデオ信号の現在フレームと、前記ビデオ信号の以前のフレームを符号化及び復号化し、前記符号化及び復号化された以前フレームの動きを補償することによって得られた参照フレームとを一定の画素間隔でそれぞれの画素対画素を比較して最も類似した画素を検出して前記個体の動きを推定し、前記個体の動き推定に対応する動きベクトルを算出する。
また、前記話者領域検出部は、前記動きベクトルから前記動きベクトルのサイズ及び方向によって背景イメージベクトル及び前景イメージベクトルを算出し、前記背景イメージベクトル及び前記前景イメージベクトルから話者領域を検出する。
前記顔領域検出部は、前記離散コサイン変換部によって発生した離散コサイン変換係数のうち前記話者領域検出部によって検出された話者領域に対応する離散コサイン変換係数から同一領域に対して赤色成分のDC値と青色成分のDC値とを比較し、前記赤色成分が大きく、また設定されたしきい値より大きい場合、前記話者領域のうち前記比較された離散コサイン変換係数に対応する領域を前記話者の顔領域として判断する。
本発明によるビデオエンコーダは、前記量子化部によって差別量子化された離散コサイン変換係数に対して逆量子化を遂行する逆量子化部と、前記逆量子化された離散コサイン変換係数に対して逆離散コサイン変換を遂行する逆離散コサイン変換部と、予め入力された逆離散コサイン変換されたビデオ信号と入力される逆離散コサイン変換されたビデオ信号とを比較することによって前記個体の動きを補償する動き補償部と、をさらに含む。前記動き補償部は、前記動き補償部から動きが補償されたビデオ信号に基づいて外部から入力されるビデオ信号に対する前記動きベクトルを算出する。
前述したような目的を達成するための本発明による離散コサイン変換及び動き推定を通じてビデオ信号を符号化するビデオエンコーダを利用した画像通信のためのビデオ信号圧縮方法は、入力されるビデオ信号から個体の動きを推定して前記個体の動きベクトルを算出する段階と、前記動きベクトルから話者の輪郭を示す話者領域を検出する段階と、前記ビデオ信号を離散コサイン変換することによって離散コサイン変換係数を算出する段階と、前記離散コサイン変換係数に基づいて前記話者領域から前記話者の顔領域を検出し、前記検出された顔領域と非顔領域とを区分することによって差別量子化テーブルを生成する段階と、前記話者領域に基づいて量子化のための量子化ステップサイズを可変的に設定する段階と、前記量子化ステップサイズ及び前記差別量子化テーブルによって前記離散コサイン変換係数を量子化する段階と、を含む。
望ましくは、前記量子化ステップサイズ設定段階は、前記話者領域及び前記顔領域のうち少なくとも1つに基づいて前記量子化ステップサイズを可変的に設定する。さらに、前記動き推定段階は、前記ビデオ信号の現在フレームと、前記ビデオ信号の以前のフレームを符号化及び復号化し、前記符号化及び復号化された以前フレームの動きを補償することによって得られた参照フレームとを一定の画素間隔でそれぞれの画素対画素を比較して最も類似した画素を検出して前記個体の動きを推定し、前記個体の動き推定に対応する前記動きベクトルを算出する。
前記話者領域検出段階は、前記動きベクトルから前記動きベクトルのサイズ及び方向によって背景イメージベクトル及び前景イメージベクトルを算出し、前記背景イメージベクトル及び前記前景イメージベクトルから話者領域を検出する。
前記顔領域検出段階は、前記離散コサイン変換係数のうち前記話者領域に対応する離散コサイン変換係数から同一領域に対して赤色成分のDC値と青色成分のDC値とを比較し、前記赤色成分が前記青色成分より大きく、また設定されたしきい値より大きい場合は、話者領域のうち前記比較された離散コサイン変換係数に対応する領域を前記話者の顔領域として判断する。
本発明は、話者の顔領域と非顔領域とを区分し、顔領域は小さい量子化ステップサイズで、非顔領域は大きい量子化ステップサイズで、それぞれ差別的に量子化を遂行することによって、画像通信時にビデオエンコーダの動作による負荷及び話者の顔領域の映像の画質低下を防止することができる。その結果、動きのある顔領域だけでなく赤いブロックの画質低下が他のブロックに比べて小さくなる。
以下、本発明の好適な一実施形態について添付図を参照しつつ詳細に説明する。下記の説明において、本発明の要旨のみを明確にする目的で、関連した公知機能又は構成に関する具体的な説明は省略する。
図3は、本発明の好適な実施形態による画像通話時に話者の映像を差動的符号化するビデオエンコーダを示すブロック図である。
図示されたように、ビデオエンコーダは、動き推定部100、話者領域検出部120、DCT(Discrete Cosine Transform)部140、顔領域検出部160、適応的ビット率制御部180、量子化部200、可変長符号化部220、逆量子化部240、IDCT(Inverse Discrete Cosine Transform)部260、及び動き補償部280を含む。
動き推定部100は、入力されるビデオ信号の現在フレームと、前記入力されたビデオ信号の以前フレームを符号化及び復号化されした後、前記符号化及び復号化された以前フレームの動きを補償することによって得られた参照フレームとを、一定の画素間隔でそれぞれの画素対画素を比較することによって、最も類似した画素を検出する。動き推定部100は、前記検出された参照フレームの最も類似した参照領域と前記現在フレームのマクロブロックとの間の位置関係を示す動きベクトル(Motion Vector: MV)を決定する。
話者領域検出部120は、動き推定部100によって決定された動きベクトルのうち、ビデオ信号の中心から所定の領域を除いた周辺領域の動きベクトルのサイズ及び方向の一貫性を検出する。話者領域検出部120は、前記検出された周辺領域の動きベクトルのサイズに対する平均値を算出する。この時、話者領域検出部120は、前記算出された平均値のうち設定された偏差値の範囲内に含まれる平均値の平均値を算出する。前記算出された平均値の平均値は、ビデオ信号に対する背景イメージベクトル(background image vector)として決定される。話者領域検出部120は、動き推定部100によって決定された動きベクトルから背景イメージベクトルを減算することによってビデオ信号の周辺領域を除いた中心領域に対して前景イメージベクトル(foreground image vector)を算出する。さらに、話者領域検出部120は、前景イメージベクトルのうち所定の範囲内に含まれたサイズ及び方向を有する前景イメージベクトルを集めることによって話者領域の境界を決定する。話者領域検出部120は、前記決定された話者領域内の領域に対して水平及び垂直指向スキャニング(horizontal and vertical directional scanning)を遂行することによって直角形の話者領域を検出する。
DCT部140は、動き推定部100から提供されたビデオ信号をDTC変換してDCT係数を発生する。
顔領域検出部160は、DCT部140によって発生したDCT係数のうち話者領域検出部120によって検出された話者領域に対応するDCT係数から同一領域に対して赤色成分のDC値と青色成分のDC値とを比較する。その比較の結果、赤色成分が青色成分より大きく、設定されたしきい値より大きい場合、顔領域検出部160は、話者領域のうち前記比較されたDCT係数に対応する領域を話者の顔領域として判断する。前記しきい値は、使用者によって任意で設定されることができ、または、実験値によって得られた最適値として定義されることもできる。顔領域検出部160は、話者領域から顔領域の判断結果に基づいて、DCT係数が差別的に量子化されるか否かを示す情報である差別量子化テーブルを生成する。
適応的ビット率制御部180は、話者領域検出部120によって検出された話者領域情報及び顔領域検出部160によって検出された顔領域情報を利用して量子化ステップサイズの調整に使用される加重テーブルを生成する。望ましくは、適応的ビット率制御部180は、対応するビデオ信号の所定の領域が話者領域における顔領域である場合、量子化ステップサイズを基準値より小さく設定し、そうでない場合は、量子化ステップサイズを基準値より大きく設定する。
量子化部200は、顔領域検出部160によって生成された差別量子化テーブル及び適応的ビット率制御部180から出力された量子化ステップサイズによって、DCT部140から出力されたDCT係数を可変的に量子化する。
可変長符号化部220は、量子化されたDCT係数を可変長符号化されたデータに変換する。前記可変長符号化されたDCT係数は、ビットストリーム発生部(図示せず)によってビットストリームに変換される。
逆量子化部240は、量子化部200によって量子化されたDCT係数を逆量子化する。IDCT部260は、逆量子化されたDCT係数をIDCT変換によってブロック単位の再生された画素データに変換する。
動き補償部280は、IDCT部260によって再生された画素データの動きを補償する。動き補償部280によって補償された画素データは、動き推定部100によって再生されるイメージから動き客体を推定するための参照フレームとして使用される。
従って、本発明によるビデオエンコーダは、入力されるビデオ信号に同一の量子化ステップサイズを適用せずに、話者の顔領域と非顔領域とを区分して、前記顔領域及び前記非顔領域を異なる量子化ステップサイズによって量子化する。そうすることによって、顔領域に対する基準解像度を維持することができる。その結果、動きのある顔領域だけでなく、赤いブロックの画質低下が他のブロックより小さくなる。
本実施形態においては、赤色成分と青色成分を区分し、前記赤色成分の値と前記青色成分の値を比較することによって顔領域を決定し、前記決定された顔領域を差別量子化して、顔領域の画質低下を防止する。しかしながら、前記ビデオエンコーダは、使用者インターフェースによって顔領域の大略の特徴を得ることができ、前記大略の特徴によって赤色成分の範囲をしきい値として指定することができる。
図4(a)ないし図4(d)は、図3のビデオエンコーダで受信されるビデオ信号から顔領域及び非顔領域を差別量子化する過程を示す。図4(a)は、動き推定部100によって受信される原のビデオ信号を再生して画面に表示される場合の画質の映像である。図4(b)は、話者領域検出部120によって検出された話者領域120aが画面の中央領域に位置した状態を示す。図4(c)は、顔領域検出部160によって検出された話者の顔領域160aが画面に表示された状態を示す。図4(d)は、量子化部200によって顔領域160a及び非顔領域を差別的に量子化することによって表示されるビデオ信号の映像を示す。
図5(a)及び図5(b)は、図3の量子化部200が全体映像に対して顔領域及び非顔領域に差別量子化ステップを適用することによって画面上に表示された映像の例を示す。図示されたように、量子化部200は、全体映像のうち顔領域に対して基準値より小さい量子化ステップサイズを適用し、非顔領域に対しては基準値より大きい量子化ステップサイズを適用して該当領域を量子化することによって、顔領域に対して基準値以上の画質の維持を保障することができる。
図6は、本発明の好適の実施形態によるビデオエンコーダを利用したビデオ信号の圧縮方法を示す。
図6を参照すると、動き推定部100は、入力されるビデオ信号の現在フレームと、前記入力された信号の以前フレームを符号化及び復号化した後に前記符号化及び復号化された以前フレームの動きを補償することによって決定された参照フレームとを、一定の画素間隔で対応するそれぞれの画素対画素を比較することによって、最も類似した画素を検出し、前記検出された最も類似した画素と前記現在のフレームのマクロブロックとの間の位置関係を示す動きベクトル(MV)を算出する(段階100)。話者領域検出部120は、動き推定部100によって決定された動きベクトルのうちビデオ信号の中心から所定の領域を除いた周辺領域の動きベクトルのサイズ及び方向の一貫性を検出することによって、ビデオ信号の話者領域を検出する(段階120)。DCT部140は、動き推定部100から提供されたビデオ信号をDCT変換してDCT係数を発生する(段階140)。
顔領域検出部160は、DCT部140によって発生したDCT係数のうち話者領域検出部120によって検出された話者領域に対応するDCT係数を利用して前記話者の顔領域を検出する(段階160)。望ましくは、顔領域検出部160は、DCT部140によって発生したDCT係数のうち話者領域検出部120によって検出された話者領域に対応するDCT係数から同一領域に対して赤色成分のDC値と青色成分のDC値とを比較する。その比較の結果、赤色成分が青色成分より大きく、また設定されたしきい値より大きい場合、顔領域検出部160は、話者領域のうち前記比較されたDCT係数に対応する領域を話者の顔領域として判断する。前記しきい値の設定は、使用者によって任意で設定されることができ、または、実験値によって得られた最適値として定義されることができる。顔領域検出部160は、話者領域から顔領域の判断結果に基づいて、DCT係数が差別的に量子化されるか否かを示す情報である差別量子化テーブルを生成する。
適応的ビット率制御部180は、話者領域検出部120によって検出された話者領域情報及び顔領域検出部160によって検出された顔領域情報を利用して量子化ステップサイズを可変的に設定する(段階180)。望ましくは、適応的ビット率制御部180は、対応するビデオ信号の所定領域が話者領域の顔領域である場合、量子化ステップサイズを基準値より小さく設定し、そうでない場合は、量子化ステップサイズを基準値より大きく設定する。
量子化部200は、顔領域検出部160によって生成された差別量子化テーブル及び適応的ビット率制御部180から出力された量子化ステップサイズによってDCT部140から出力されたDCT係数を可変的に量子化する(段階200)。可変長符号化部220は、顔領域と非顔領域を区分して可変的に量子化されたDCT係数を可変長符号化されたデータに変換する(段階220)。前記可変長符号化されたDCT係数は、ビットストリーム発生部(図示せず)によってビットストリームに変換される。
従って、入力されるビデオ信号に同一の量子化ステップサイズを適用せず、話者の顔領域と非顔領域とを区分して、異なる量子化ステップサイズによって前記顔領域及び前記非顔領域を量子化する。そうすることによって、顔領域に対する基準解像度を維持することができる。その結果、動きのある顔領域だけでなく赤いブロックの画質低下が他のブロックに比べて小さくなる。
本実施形態においては、赤色成分と青色成分を区分し、前記赤色成分の値と前記 青色成分の値を比較することによって顔領域を決定し、前記決定された顔領域を差別量子化して、顔領域の画質低下を防止する。しかしながら、使用者インターフェースによって顔領域の大略の特徴を得ることができ。前記大略の特徴によって赤色成分の範囲をしきい値として指定することができる。
前述の如く、本発明を具体的な一実施形態を参照して詳細に説明してきたが、本発明の範囲は前述の一実施形態によって限られるべきではなく、本発明の範囲内で様々な変形が可能であるということは、当該技術分野における通常の知識を持つ者には明らかである。
100 動き推定部
120 話者領域検出部
140 DCT部
160 顔領域検出部
180 適応的ビット率制御部
200 量子化部
220 可変長符号化部
240 逆量子化部
260 IDCT部
280 動き補償部
120 話者領域検出部
140 DCT部
160 顔領域検出部
180 適応的ビット率制御部
200 量子化部
220 可変長符号化部
240 逆量子化部
260 IDCT部
280 動き補償部
Claims (16)
- 離散コサイン変換及び動き推定を通じてビデオ信号を符号化するビデオエンコーダにおいて、
入力されるビデオ信号から個体の動きを推定し、前記個体の動きベクトルを算出する動き推定部と、
前記動きベクトルから話者の輪郭を示す話者領域を検出する話者領域検出部と、
前記動き推定部から出力されたビデオ信号を離散コサイン変換することによって離散コサイン変換係数を算出する離散コサイン変換部と、
前記離散コサイン変換係数を利用して前記話者領域から前記話者の顔領域を検出し、前記検出された前記顔領域と非顔領域を区分することによって、差別量子化テーブルを生成する顔領域検出部と、
前記話者領域に基づいて量子化のための量子化ステップサイズを可変的に設定する適応的ビット率制御部と、
前記量子化ステップサイズ及び前記差別量子化テーブルによって前記離散コサイン変換係数を量子化する量子化部と
を含むことを特徴とするビデオエンコーダ。 - 前記適応的ビット率制御部は、前記話者領域及び前記顔領域のうち少なくとも1つに基づいて前記量子化ステップサイズを可変的に設定することを特徴とする請求項1に記載のビデオエンコーダ。
- 前記動き推定部は、前記ビデオ信号の現在フレームと、前記ビデオ信号の以前のフレームを符号化及び復号化し、前記符号化及び復号化された以前フレームの動きを補償することによって得られた参照フレームとを一定の画素間隔でそれぞれの画素対画素を比較して最も類似した画素を検出して前記個体の動きを推定し、前記個体の動き推定に対応する動きベクトルを算出することを特徴とする請求項2に記載のビデオエンコーダ。
- 前記話者領域検出部は、前記動きベクトルから前記動きベクトルのサイズ及び方向によって背景イメージベクトル及び前景イメージベクトルを算出し、前記背景イメージベクトル及び前記前景イメージベクトルから話者領域を検出することを特徴とする請求項3に記載のビデオエンコーダ。
- 前記顔領域検出部は、前記離散コサイン変換部によって発生した離散コサイン変換係数のうち前記話者領域検出部によって検出された話者領域に対応する離散コサイン変換係数から同一領域に対して赤色成分のDC値と青色成分のDC値とを比較し、前記赤色成分が大きく、また設定されたしきい値より大きい場合、前記話者領域のうち前記比較された離散コサイン変換係数に対応する領域を前記話者の顔領域として判断することを特徴とする請求項4に記載のビデオエンコーダ。
- 前記量子化部によって差別量子化された離散コサイン変換係数に対して可変長符号化を遂行する可変長符号化部をさらに含むことを特徴とする請求項5に記載のビデオエンコーダ。
- 前記量子化部によって差別量子化された離散コサイン変換係数に対して逆量子化を遂行する逆量子化部と、
前記逆量子化された離散コサイン変換係数に対して逆離散コサイン変換を遂行する逆離散コサイン変換部と、
予め入力された逆離散コサイン変換されたビデオ信号と入力される逆離散コサイン変換されたビデオ信号とを比較することによって前記個体の動きを補償する動き補償部と、をさらに含むことを特徴とする請求項6に記載のビデオエンコーダ。 - 前記動き補償部は、前記動き補償部から動きが補償されたビデオ信号に基づいて外部から入力されるビデオ信号に対する前記動きベクトルを算出することを特徴とする請求項7に記載のビデオエンコーダ。
- 離散コサイン変換及び動き推定を通じてビデオ信号を符号化するビデオエンコーダを利用した画像通信のためのビデオ信号圧縮方法において、
入力されるビデオ信号から個体の動きを推定して前記個体の動きベクトルを算出する段階と、
前記動きベクトルから話者の輪郭を示す話者領域を検出する段階と、
前記ビデオ信号を離散コサイン変換することによって離散コサイン変換係数を算出する段階と、
前記離散コサイン変換係数に基づいて前記話者領域から前記話者の顔領域を検出し、前記検出された顔領域と非顔領域とを区分することによって差別量子化テーブルを生成する段階と、
前記話者領域に基づいて量子化のための量子化ステップサイズを可変的に設定する段階と、
前記量子化ステップサイズ及び前記差別量子化テーブルによって前記離散コサイン変換係数を量子化する段階と
を含むことを特徴とするビデオエンコーダを利用した画像通信のためのビデオ信号圧縮方法。 - 前記量子化ステップサイズ設定段階は、前記話者領域及び前記顔領域のうち少なくとも1つに基づいて前記量子化ステップサイズを可変的に設定する段階からなることを特徴とする請求項9に記載のビデオエンコーダを利用した画像通信のためのビデオ信号圧縮方法。
- 前記動き推定段階は、前記ビデオ信号の現在フレームと、前記ビデオ信号の以前のフレームを符号化及び復号化し、前記符号化及び復号化された以前フレームの動きを補償することによって得られた参照フレームとを一定の画素間隔でそれぞれの画素対画素を比較して最も類似した画素を検出して前記個体の動きを推定し、前記個体の動き推定に対応する前記動きベクトルを算出することを特徴とする請求項10に記載のビデオエンコーダを利用した画像通信のためのビデオ信号圧縮方法。
- 前記話者領域検出段階は、前記動きベクトルから前記動きベクトルのサイズ及び方向によって背景イメージベクトル及び前景イメージベクトルを算出し、前記背景イメージベクトル及び前記前景イメージベクトルから話者領域を検出する段階からなることを特徴とする請求項11に記載のビデオエンコーダを利用した画像通信のためのビデオ信号圧縮方法。
- 前記顔領域検出段階は、前記離散コサイン変換係数のうち前記話者領域に対応する離散コサイン変換係数から同一領域に対して赤色成分のDC値と青色成分のDC値とを比較し、前記赤色成分が前記青色成分より大きく、また設定されたしきい値より大きい場合は、話者領域のうち前記比較された離散コサイン変換係数に対応する領域を前記話者の顔領域として判断する段階からなることを特徴とする請求項12に記載のビデオエンコーダを利用した画像通信のためのビデオ信号圧縮方法。
- 前記量子化段階において差別量子化された離散コサイン変換係数に対して可変長符号化を遂行する段階をさらに含むことを特徴とする請求項13に記載のビデオエンコーダを利用した画像通信のためのビデオ信号圧縮方法。
- 前記量子化段階において差別量子化された離散コサイン変換係数に対して逆量子化を遂行する段階と、
前記逆量子化された離散コサイン変換係数に対して逆離散コサイン変換を遂行する段階と、
予め入力された逆離散コサイン変換されたビデオ信号と入力される逆離散コサイン変換されたビデオ信号とを比較することによって前記個体の動きを補償する段階と、をさらに含むことを特徴とする請求項14に記載のビデオエンコーダを利用した画像通信のためのビデオ信号圧縮方法。 - 前記動き推定段階は、前記動き補償段階において動きが補償されたビデオ信号に基づいて外部から入力されるビデオ信号に対する前記動きベクトルを算出する段階からなることを特徴とする請求項15に記載のビデオエンコーダを利用した画像通信のためのビデオ信号圧縮方法。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR10-2003-0008255A KR100539923B1 (ko) | 2003-02-10 | 2003-02-10 | 화상통화시 화자의 영상을 구분하여 차등적 부호화할 수있는 비디오 엔코더 및 이를 이용한 비디오신호의 압축방법 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2004248285A true JP2004248285A (ja) | 2004-09-02 |
Family
ID=32768601
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004034105A Pending JP2004248285A (ja) | 2003-02-10 | 2004-02-10 | 画像通話時における話者の映像の差動的符号化可能のビデオエンコーダ及びこれを利用したビデオ信号圧縮方法 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US20040158719A1 (ja) |
| EP (1) | EP1453321A3 (ja) |
| JP (1) | JP2004248285A (ja) |
| KR (1) | KR100539923B1 (ja) |
| CN (1) | CN1225914C (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012527801A (ja) * | 2009-05-19 | 2012-11-08 | ソニーモバイルコミュニケーションズ, エービー | デジタル画像を撮像する方法及び撮像装置 |
| JP2017532858A (ja) * | 2014-09-11 | 2017-11-02 | ユークリッド・ディスカバリーズ・エルエルシーEuclid Discoveries,Llc | モデルベースの映像符号化用の知覚的最適化 |
| WO2018012366A1 (ja) * | 2016-07-13 | 2018-01-18 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 復号装置、符号化装置、復号方法及び符号化方法 |
Families Citing this family (44)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8422546B2 (en) * | 2005-05-25 | 2013-04-16 | Microsoft Corporation | Adaptive video encoding using a perceptual model |
| KR100792247B1 (ko) * | 2006-02-28 | 2008-01-07 | 주식회사 팬택앤큐리텔 | 이미지 데이터 처리 시스템 및 그 방법 |
| US8599841B1 (en) | 2006-03-28 | 2013-12-03 | Nvidia Corporation | Multi-format bitstream decoding engine |
| US8593469B2 (en) * | 2006-03-29 | 2013-11-26 | Nvidia Corporation | Method and circuit for efficient caching of reference video data |
| US8059721B2 (en) | 2006-04-07 | 2011-11-15 | Microsoft Corporation | Estimating sample-domain distortion in the transform domain with rounding compensation |
| US7995649B2 (en) * | 2006-04-07 | 2011-08-09 | Microsoft Corporation | Quantization adjustment based on texture level |
| US8130828B2 (en) * | 2006-04-07 | 2012-03-06 | Microsoft Corporation | Adjusting quantization to preserve non-zero AC coefficients |
| US7974340B2 (en) | 2006-04-07 | 2011-07-05 | Microsoft Corporation | Adaptive B-picture quantization control |
| US8503536B2 (en) | 2006-04-07 | 2013-08-06 | Microsoft Corporation | Quantization adjustments for DC shift artifacts |
| US8019171B2 (en) * | 2006-04-19 | 2011-09-13 | Microsoft Corporation | Vision-based compression |
| US8711925B2 (en) | 2006-05-05 | 2014-04-29 | Microsoft Corporation | Flexible quantization |
| KR100786413B1 (ko) * | 2006-06-13 | 2007-12-17 | 주식회사 팬택앤큐리텔 | 이미지 데이터 처리 시스템 |
| US7653130B2 (en) * | 2006-12-27 | 2010-01-26 | General Instrument Corporation | Method and apparatus for bit rate reduction in video telephony |
| US8238424B2 (en) | 2007-02-09 | 2012-08-07 | Microsoft Corporation | Complexity-based adaptive preprocessing for multiple-pass video compression |
| US8498335B2 (en) | 2007-03-26 | 2013-07-30 | Microsoft Corporation | Adaptive deadzone size adjustment in quantization |
| US8243797B2 (en) | 2007-03-30 | 2012-08-14 | Microsoft Corporation | Regions of interest for quality adjustments |
| KR100843257B1 (ko) * | 2007-04-11 | 2008-07-02 | 인하대학교 산학협력단 | 윤곽선 복원을 이용한 얼굴검출 장치 및 방법 |
| US8442337B2 (en) | 2007-04-18 | 2013-05-14 | Microsoft Corporation | Encoding adjustments for animation content |
| US8331438B2 (en) | 2007-06-05 | 2012-12-11 | Microsoft Corporation | Adaptive selection of picture-level quantization parameters for predicted video pictures |
| US8477852B2 (en) * | 2007-06-20 | 2013-07-02 | Nvidia Corporation | Uniform video decoding and display |
| US8548049B2 (en) | 2007-07-02 | 2013-10-01 | Vixs Systems, Inc | Pattern detection module, video encoding system and method for use therewith |
| CN101621684B (zh) * | 2008-07-02 | 2013-05-29 | Vixs系统公司 | 模式检测模块、视频编码系统及其使用的方法 |
| US9313504B2 (en) | 2007-07-02 | 2016-04-12 | Vixs Systems, Inc. | Pattern detection module with region detection, video encoding system and method for use therewith |
| CN101374220B (zh) * | 2007-08-23 | 2010-06-16 | 凌阳科技股份有限公司 | 视频画面传送方法与系统 |
| US8849051B2 (en) * | 2007-09-17 | 2014-09-30 | Nvidia Corporation | Decoding variable length codes in JPEG applications |
| US8502709B2 (en) * | 2007-09-17 | 2013-08-06 | Nvidia Corporation | Decoding variable length codes in media applications |
| CN101472131B (zh) * | 2007-12-28 | 2012-07-04 | 希姆通信息技术(上海)有限公司 | 带有运动感知功能的视频电话的图像质量增强方法 |
| US8189933B2 (en) | 2008-03-31 | 2012-05-29 | Microsoft Corporation | Classifying and controlling encoding quality for textured, dark smooth and smooth video content |
| US8897359B2 (en) | 2008-06-03 | 2014-11-25 | Microsoft Corporation | Adaptive quantization for enhancement layer video coding |
| US9307267B2 (en) * | 2008-12-11 | 2016-04-05 | Nvidia Corporation | Techniques for scalable dynamic data encoding and decoding |
| CN101494718B (zh) * | 2009-01-23 | 2011-02-09 | 逐点半导体(上海)有限公司 | 图像编码方法和装置 |
| CN101867799B (zh) * | 2009-04-17 | 2011-11-16 | 北京大学 | 一种视频帧处理方法和视频编码器 |
| US10375287B2 (en) * | 2009-10-21 | 2019-08-06 | Disney Enterprises, Inc. | Object trail-based analysis and control of video |
| US20110158310A1 (en) * | 2009-12-30 | 2011-06-30 | Nvidia Corporation | Decoding data using lookup tables |
| CN102118617A (zh) * | 2011-03-22 | 2011-07-06 | 成都市华为赛门铁克科技有限公司 | 运动搜索方法和装置 |
| US9019340B2 (en) * | 2012-03-28 | 2015-04-28 | Intel Corporation | Content aware selective adjusting of motion estimation |
| CN104782121A (zh) * | 2012-12-18 | 2015-07-15 | 英特尔公司 | 多区域视频会议编码 |
| GB2514540B (en) * | 2013-04-10 | 2020-01-08 | Microsoft Technology Licensing Llc | Resource for encoding a video signal |
| GB201312382D0 (en) | 2013-07-10 | 2013-08-21 | Microsoft Corp | Region-of-interest aware video coding |
| JP2017103744A (ja) * | 2015-12-04 | 2017-06-08 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置、及び画像符号化復号装置 |
| US11166080B2 (en) | 2017-12-21 | 2021-11-02 | Facebook, Inc. | Systems and methods for presenting content |
| CN109324778B (zh) * | 2018-12-04 | 2020-03-27 | 深圳市华星光电半导体显示技术有限公司 | 补偿表压缩方法 |
| CN114616834B (zh) * | 2019-08-16 | 2024-04-02 | 谷歌有限责任公司 | 用于视频通话的基于面容的帧封装 |
| WO2022088033A1 (zh) * | 2020-10-30 | 2022-05-05 | 深圳市大疆创新科技有限公司 | 数据处理方法和装置、图像信号处理器、可移动平台 |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR940011605B1 (ko) * | 1991-12-20 | 1994-12-22 | 삼성전자 주식회사 | 고정비트율 설정에 의한 영상압축방식 |
| US5852669A (en) * | 1994-04-06 | 1998-12-22 | Lucent Technologies Inc. | Automatic face and facial feature location detection for low bit rate model-assisted H.261 compatible coding of video |
| US6456655B1 (en) * | 1994-09-30 | 2002-09-24 | Canon Kabushiki Kaisha | Image encoding using activity discrimination and color detection to control quantizing characteristics |
| JP3258840B2 (ja) * | 1994-12-27 | 2002-02-18 | シャープ株式会社 | 動画像符号化装置および領域抽出装置 |
| US5764803A (en) * | 1996-04-03 | 1998-06-09 | Lucent Technologies Inc. | Motion-adaptive modelling of scene content for very low bit rate model-assisted coding of video sequences |
| WO1999023600A1 (en) * | 1997-11-04 | 1999-05-14 | The Trustees Of Columbia University In The City Of New York | Video signal face region detection |
| US6496607B1 (en) * | 1998-06-26 | 2002-12-17 | Sarnoff Corporation | Method and apparatus for region-based allocation of processing resources and control of input image formation |
| US6330533B2 (en) * | 1998-08-24 | 2001-12-11 | Conexant Systems, Inc. | Speech encoder adaptively applying pitch preprocessing with warping of target signal |
| JP4208315B2 (ja) * | 1998-12-25 | 2009-01-14 | キヤノン株式会社 | データ通信制御装置及びその制御方法、データ通信システム、記録媒体 |
| AU2001291229A1 (en) * | 2000-09-27 | 2002-04-08 | David N Levin | Self-referential method and apparatus for creating stimulus representations thatare invariant under systematic transformations of sensor states |
| US6944346B2 (en) * | 2002-05-28 | 2005-09-13 | Koninklijke Philips Electronics N.V. | Efficiency FGST framework employing higher quality reference frames |
-
2003
- 2003-02-10 KR KR10-2003-0008255A patent/KR100539923B1/ko not_active Expired - Fee Related
- 2003-08-11 CN CNB031278256A patent/CN1225914C/zh not_active Expired - Fee Related
- 2003-08-19 US US10/643,536 patent/US20040158719A1/en not_active Abandoned
-
2004
- 2004-01-28 EP EP20040001823 patent/EP1453321A3/en not_active Withdrawn
- 2004-02-10 JP JP2004034105A patent/JP2004248285A/ja active Pending
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012527801A (ja) * | 2009-05-19 | 2012-11-08 | ソニーモバイルコミュニケーションズ, エービー | デジタル画像を撮像する方法及び撮像装置 |
| JP2017532858A (ja) * | 2014-09-11 | 2017-11-02 | ユークリッド・ディスカバリーズ・エルエルシーEuclid Discoveries,Llc | モデルベースの映像符号化用の知覚的最適化 |
| WO2018012366A1 (ja) * | 2016-07-13 | 2018-01-18 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 復号装置、符号化装置、復号方法及び符号化方法 |
| US11109031B2 (en) | 2016-07-13 | 2021-08-31 | Panasonic Intellectual Property Corporation Of America | Decoder, encoder, decoding method, and encoding method |
Also Published As
| Publication number | Publication date |
|---|---|
| EP1453321A2 (en) | 2004-09-01 |
| US20040158719A1 (en) | 2004-08-12 |
| KR20040072259A (ko) | 2004-08-18 |
| EP1453321A3 (en) | 2006-12-06 |
| CN1225914C (zh) | 2005-11-02 |
| KR100539923B1 (ko) | 2005-12-28 |
| CN1522073A (zh) | 2004-08-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100539923B1 (ko) | 화상통화시 화자의 영상을 구분하여 차등적 부호화할 수있는 비디오 엔코더 및 이를 이용한 비디오신호의 압축방법 | |
| JP3133517B2 (ja) | 画像領域検出装置、該画像検出装置を用いた画像符号化装置 | |
| CN100581232C (zh) | 用于在视频序列中对运动进行编码的方法 | |
| US9838699B2 (en) | Video encoding method and apparatus, and video decoding apparatus | |
| US6917719B2 (en) | Method and apparatus for region-based allocation of processing resources and control of input image formation | |
| US20100027663A1 (en) | Intellegent frame skipping in video coding based on similarity metric in compressed domain | |
| EP1867173A2 (en) | Content adaptive multimedia processing | |
| JPH08181992A (ja) | 動画像符号化装置および領域抽出装置 | |
| JP2000078588A (ja) | 動画像符号化装置 | |
| JPH04196976A (ja) | 画像符号化装置 | |
| KR100211916B1 (ko) | 물체 모양정보 부호화에서의 부호화타입과 모드의 결정방법 | |
| JP2004080786A (ja) | 離散コサイン変換係数を参照する動き推定方法及び装置 | |
| EP1227684A2 (en) | Encoding of video signals | |
| JPH07312756A (ja) | 圧縮動画像符号信号の情報量変換回路、装置、及び方法 | |
| KR100584422B1 (ko) | 영상데이터의 압축 장치 및 방법 | |
| JP2914607B2 (ja) | 画像信号復号化装置 | |
| KR100586103B1 (ko) | 동영상 부호화 방법 | |
| JPH06233292A (ja) | 画像信号伝送装置 | |
| KR100770873B1 (ko) | 영상 부호화시 비트율 제어 방법 및 장치 | |
| KR100351568B1 (ko) | 움직임 보상 예측 블록의 경계 방향성을 고려한 고압축장치 및 그 방법 | |
| JPH09275550A (ja) | テレビ会議システム | |
| JPH07236138A (ja) | 動画像符号化装置 | |
| JPH0646411A (ja) | 画像符号化装置 | |
| KR20040039809A (ko) | 동영상 부호화기 및 이를 이용한 부호화 방법 | |
| JPH03124181A (ja) | 動画像符号化方式 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060926 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20061226 |
|
| A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070104 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070529 |