WO2003088676A1

WO2003088676A1 - Procede et dispositif de conversion de donnees video

Info

Publication number: WO2003088676A1
Application number: PCT/JP2003/004529
Authority: WO
Inventors: Shunichi Sekiguchi; Yoshihisa Yamada; Fuminobu Ogawa; Kohtaro Asai
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2002-04-16
Filing date: 2003-04-09
Publication date: 2003-10-23
Anticipated expiration: 2004-10-16
Also published as: JP4193406B2; EP1475971A1; KR100719647B1; US20050041740A1; US7526027B2; KR20040105872A; EP1475971A4; CN1640149A; CN100353769C; JP2003309851A

Description

4

Biological Chemistry)」、 2001年、第 276巻、第 37号、 p. 35 123-35132

(特許文献 1 )

特開平 5— 310526号公報

(特許文献 2 )

国際公開第 01/57085号パンフレツト

(特許文献 3 )

国際公開第 01Z07609号パンフレツト発明の開示

本発明は、上記従来技術の有する課題に鑑みてなされたものであり、新規な G PCRタンパク質、当該タンパク質をコードする核酸、さらには、本発明の遺伝子が発現する部位を特定することにより、 ^位特異的に発現する当該遺伝子及びそれによつてコードされるタンパク質の新たな用途を提供することを目的とする。

本発明者らは、上記の課題を解決するために鋭意研究を行った結果、特許文献 2及び特許文献 3に記載の夕ンパク質とはァミノ酸配列が異なる新規夕ンパク質及び当該タンパク質をコードする核酸をマウス及びヒトより見いだすとともに、かかる核酸が特定の細胞に発現していることを見いだし本発明を完成した。

すなわち、まず、本発明者らは新規 GPCR候補遺伝子の探索を目的に、 Biochemical and Bior>hysica丄 Research Communication (vol.268,No.553-561) に記載の新規 GPCR配列（GenBank Ac c e s s i on No. AB 030198) を用いて、類似性検索を行った。検索の結果、類似性の高い GP CR候補配列としてマウス ESTの d a t a b a s eより、 GenB ank A c c e s s i on No. AA 164122、 AA 562774、 AA8641 16、 AA 068008、 AA 821407、 AA 795969、 AA 7990 21、 AA 756761、 AA 168673、 AA 791779の部分配列を見出し、当該新規 GPCR候補遺伝子を「BG8」と命名した。

次に本発明者らは、 I MAGEクローンとして、 AA164122 ( I MAG E： 607331 KURABO社製）をプローブとしてマウス皮膚 c DNAラ映像データ変換装置及び映像データ変換方法技術分野

この発明は、各種国際標準の映像圧縮 · 伸長方式に準拠したビデオ圧縮データの各種変換を行う映像明データ変換装置及び映像データ変換方法に関するものである。細

背景技術

現在、デジタル放送（衛星、地上波、ケ一プル）、 DVD、ビデオ C D 、イン夕一ネット、モパイルなど、放送 ■ 通信 · ノヅケージにまたがる多様なアプリケーションにおいて、 MPEG や ITU- T H.26x などの国際標準映像符号化方式が活用されている。

これらの符号化方式で圧縮された映像コンテンヅを、サポートする符号化方式、伝送ビットレート、空間解像度（フレームサイズ）、時間解像度（フレームレート）などの条件が異なるブラットフオームで再利用する要求が高まっており、これを背景として映像トランスコーディング技術の研究開発が盛んに行われている。

特に、 MPEG や ITU- T H.26x などの標準映像符号化方式は、一貫して、動き補償予測（Motion Compensation, 以下 M C ) による時間方向の信号冗長度削減、離散コサイン変換（Discrete Cosine Transform, 以下 D C T ) による空間方向の信号冗長度削減を基本としているため、符号化データの構文（シンタックス）がある程度共通化されている。このことを利用したビヅトストリームレベルでの変換を考えることにより、上記標準映像符号化方式を対象として演算負荷を低減したトランスコー 2 ディング技術が主に検討されてきている。

その中でも、 NTSC 解像度（ 704x480 画素フレーム、 30f rames/sec) の MPEG-2 ビデオを、 SIF ( 352x240 画素）の低フレームレ一ト MPEG- 4 もしくは H.263 ビデオへ変換する問題は、既存 MPEG- 2 コンテンヅの有効活用の観点から実用化要求が高く、ホットトピックとなっている (例えば、 Wang Xing Guo, Zheng Wei Guo, and Ishfaq Ahmad, "MPEG - 2 To MPEG - 4 Transcoding", Workshop and Exhibition on MPEG- 4 (WEMP) 2001.など）。

このような映像トランスコ一ディング技術においては、トランスコ一ダ入力の MPEG- 2 ビデオストリームに含まれる動きべクトルを、 MPEG - 4 符号化に利用可能な動きべクトルへ変換する処理が重要となる。

縦横 1/2 の解像度変換が行われるため、入力 MPEG- 2 ストリームの 4 つのマクロブロック領域が、ちょうど MPEG- 4 符号化時の 1マクロブロックの領域に対応する。この問題は、もとの最大 4本の動きベクトルから、解像度変換後の動きベクトルを推定する問題であり、これまで多くの検討報告がなされている。例えば、 B.Shen 他、 "Adaptive Motion- Vector Resampling ior Compressed Video Downsampling" , IEEE Transactions on Circuits And Systems for Video Technology, vol.9， no.6, Sep.1999 では、入力圧縮データにおいて、予測残差が大きい動きべクトルに大きな重みをかけて 4つの動きべクトルの重み付け平均をとる手法を報告している。

これはいわば、入力圧縮データ中の予測残差信号を判断基準として、そのァクティビティ値に基づいて変換すべき動きべクトルの値を決定する手法であり、 M.R.Hashemi 他、 "Compressed Domain Motion Vector Resampling for Downscaling of MPEG Video", IEEE International Conference on Image Processing, Kobe, Japan, Oct.1999 においても 3 その変形が報告されている。

従来の映像データ変換方法は以上のように構成されているので、変換すべき動きべクトルが 1本のケースに適用が限定される他、変換後の動きべクトルの符号化性能の意味での最適性を保証するものではないという課題があった。

この発明は上記のような課題を解決するためになされたもので、第 2 の映像符号化方式における符号化性能のィンパクトを考慮した動きべクトル等を変換することができる映像データ変換装置及び映像デ一夕変換方法を得ることを目的とする。発明の開示

この発明に係る映像データ変換装置は、映像信号の各フレームを所定部分領域に分割し、その単位で動きべクトル等の符号化パラメ一夕を選択して符号化を行う第 1の映像符号化方式に従う映像符号化データを入力として、映像信号の各フレームを所定部分領域に分割し、その単位で符号化パラメ一夕を選択して符号化を行う第 2の映像符号化方式に従う映像符号化データへの変換を行うものであって、前記第 1の映像符号化方式における所定部分領域単位の符号化パラメ一夕である動きべクトルから、前記第 2の映像符号化方式における所定の部分領域の単位で用いる動きべクトルの候補を生成する動きべクトルマッピング部と、前記生成された第 2の映像符号化方式における動きべクトルの候補のうち、該動きべクトル候補を用いた場合の予測効率を評価する予測誤差評価値と、該動きぺクトル候補を用いることによる動きべクトル符号量を評価する値とに基づいて、第 2の映像符号化方式において使用する動きべクトルを決定する符号化パラメ一夕判定部とを備えるようにしたものである 4 このことによって、第 2の映像符号化方式における符号化性能のィンパクトを考慮した動きべクトル等を変換することが可能になる効果がある。図面の簡単な説明

第 1図はこの発明の実施の形態 1 による映像トランスコーダ（映像デ —夕変換装置）を示す構成図である。

第 2図は映像トランスコーダにおける動きぺクトルマッピングと符号化モード判定処理を示すフローチャートである。

第 3図は解像度変換を伴うトランスコ一ディング単位を示す説明図である。

第 4図は MPEG- 2 ビデオ符号化における動き予測モードの種別を説明する説明図である。

第 5図はこの発明の実施の形態 2 による映像トランスコーダ（映像デ一夕変換装置）を示す構成図である。

第 6図は映像トランスコーダにおける動きべクトルマッピングと符号化モード判定処理を示すフローチャートである。

第 7図は符号化モード推定部 8の MPEG-2 符号化モ一ドの監視動作を示す説明図である。

第 8図は動きべクトルマッピング部 7の MPEG- 2 動きべクトルの監視動作を示す説明図である。発明を実施するための最良の形態

以下、この発明をより詳細に説明するために、この発明を実施するための最良の形態について、添付の図面に従って説明する。

実施の形態 1 . 5 この実施の形態 1では、 MPEG- 2 ビデオデ一夕を入力とし、空間解像度が縦横 1/2 にダウンサンプリングされた MPE G- 4 ビデオデータを出力する映像トランスコーダについて説明する。以下の説明では、 MPEG- 4 は MPE G- 4シンプルプロファイルに準拠する符号化方式とする。

第 1図はこの発明の実施の形態 1 による映像トランスコーダ（映像デ —夕変換装置）を示す構成図であり、図において、 MPEG-2 デコーダ部 2は MPE G- 2 準拠の符号化方式で圧縮された入力圧縮デ一夕 1を入力し、その入力圧縮デ一夕 1 から復号画像 5 を生成する。可変長復号部 2 A は MPEG-2 規格にしたがって入力圧縮デ一夕 1のシンタツクス解析を実施し、予測残差信号符号化データ 2 B、符号化モード情報 3及び動きべクトル倩報 4を生成する。逆量子化部 2 Cは可変長復号部 2 Aにより生成された予測残差信号符号化データ 2 Bの逆量子化を実施し、逆 D C T 部 2 Dは逆量子化後の予測残差信号符号化データに対する逆！） C Tを実施して予測残差信号復号値 2 Eを出力する。

動き補償部 2 Fは可変長復号部 2 Aにより生成された動きべクトル情報 4 とフレームメモリ 2 Gに格納されている参照画像データ 2 Hとにしたがって予測画像 2 I を生成する。加算器 2 Jは逆 D C T部 2 Dから出力された予測残差信号復号値 2 E と動き補償部 2 Fにより生成された予測画像 2 1 を加算して復号画像 5を生成する。なお、フレームメモリ 2 Gには復号画像 5が参照画像データ 2 Hとして格納される。

解像度変換部 6は MPEG- 2 デコーダ部 2 により生成された復号画像 5 の解像度を、画素領域で縦横 1 /2のサイズの解像度に変換する。動きべクトルマッピング部 7は可変長復号部 2 Aにより生成された動きべクトル情報 4から MPEG- 4 符号化に利用可能な動きべクトルマッピング情報 1 1 (動きベクトルの候補）を生成する。符号化モ一ド推定部 8は可変長復号部 2 Aにより生成された符号化モード情報 3から MPEG-4 符号化 6 で利用すべき符号化モード設定情報 1 2を決定する。

MPEG- エンコーダ部 1 0は解像度変換部 6 により解像度が変換された復号画像 9 を MPEG- 4 で符号化する。動き補償部 1 0 Aは動きべクトルマッピング情報 1 1 とフレームメモリ 1 0 Mに格納されている参照画像データとにしたがって予測画像 1 0 Cを生成する。減算器 1 0 Pは解像度変換部 6 により解像度が変換された復号画像である入力信号 9 と動き補償部 1 0 Aにより生成された予測画像 1 0 Cとの差分をとつて予測残差信号を生成する。符号化パラメ一夕判定部 1 0 Bは符号化モード設定情報 1 2等にしたがって MPEG-4 の各マク口プロック単位に符号化に用いる符号化モードゃ動きべクトルを決定する。

D C T部 1 0 Dは符号化パラメ一夕判定部 1 0 Bにより決定された符号化モ一ドが INTERモード又は INTEMVモ一ドの場合、減算器 1 0 Pにより生成された予測残差信号に対する D C Tを実施し、その符号化モードが INTRAモードの場合、入力信号 9 に対する D C Tを実施する。量子化部 1 0 Eは D C T部 1 0 Dの出力信号を量子化する。逆量子化部 1 0 Fは量子化部 1 0 Eの出力信号を逆量子化し、逆 D C T部 1 0 Gは逆量子化部 1 0 Fの出力信号に対する逆 D C Tを実施して予測残差信号復号値 1 0 Hを出力する。加算器 1 0 Qは逆 D C T部 1 0 Gから出力された予測残差信号復号値 1 0 Hと動き補償部 1 0 Aにより生成された予測画像 1 0 Cを加算する。なお、その加算結果 1 0 Iは、以降のフレームの M Cに用いるためにフレームメモリ 1 0 Mに格納される。

可変長符号化部 1 0 Jは量子化部 1 0 Eの出力信号を MPEG- 4 ビデオストリームの形式に配列する。符号化制御部 1 0 Lは符号化モード判定部 1 0 B、量子化部 1 0 Eや逆量子化部 1 0 F等を制御する。

次に動作について説明する。

①. 入力 MPEG-2 ビデオストリームの復号処理 7 まず、 MPEG- 2 準拠の符号化方式で圧縮された入力圧縮データ 1 が MPEG-2デコーダ部 2 に入力される。

MPEG- 2 デコーダ部 2の可変長復号部 2 Aは、 MPEG-2 規格にしたがつて入力圧縮データ 1のシン夕ックス解析を実施し、予測残差信号符号化データ 2 B、符号化モ一ド情報 3及び動きべクトル情報 4を生成する。逆量子化部 2 Cは、可変長復号部 2 Aから予測残差信号符号化データ 2 Bを受けると、その予測残差信号符号化データ 2 Bの逆量子化を実施する。

逆 D C T部 2 Dは、逆量子化部 2 Cから逆量子化後の予測残差信号符号化データを受けると、その予測残差信号符号化データに対する逆 D C Tを実施して予測残差信号復号値 2 Eを出力する。

動き補償部 2 Fは、可変長復号部 2 Aから動きべクトル情報 4を受けると、その動きベクトル情報 4 とフレームメモリ 2 Gに格納されている参照画像デ一夕 2 Hとにしたがって予測画像 2 I を生成する。なお、動きベクトル情報 4 には、動きベクトル値の他に、フレーム予測かフィ一ルド予測かを示すフラグなど、 M Cに関わるすべての情報を含んでいるものとする。

加算器 2 Jは、動ぎ補償部 2 Fが予測画像 2 I を生成すると、その予測画像 2 I と逆 D C T部 2 Dから出力された予測残差信号復号値 2 E とを加算して復号画像 5 を生成する。なお、復号画像 5は、以後のフレームの動き補償に用いるため、参照画像デ一夕 2 Hとしてフレームメモリ 2 Gに格納される。

②. 解像度変換処理

MPEG- 2 デコーダ部 2 により生成された MPEG- 2復号画像 5は、空間解像度変換部としての解像度変換部 6に入力される。

解像度変換部 6は、所定のダウンサンプルフィル夕に基づいた画素間 8 引きを実施することにより、 MPEG- 2 復号画像 5の解像度を例えば縦横 1/2 の空間解像度に縮小する。この結果が MPEG- 4 エンコーダ部 1 0への入力信号 9 となる。

なお、時間方向の解像度変換は、例えば、 S . J . Wee 他， " F i e l d- to - frame Transcoding with Spatial And Temporal Do龍 sampl ing" , IEEE Internat ional Conference on Image Process ing, Kobe , Japan, Oct . 1999で閧示されているように、 MPEG- 2ストリ一ム中に Bフレーム（両方向予測フレーム）が存在する場合に、 Bフレームを間引くことでフレームレートを削減する処理のみを許容する。これは、 Bフレームは、 I (イントラ）または P (片方向予測）フレームとは異なり、それ自身を別のフレームの予測に使用されないため、これを間引くことによって他のフレームの品質に影響が及ぶことがないからである。

例えば、 I (イントラ）または P (片方向予測）フレームの間に Bフレームを 2 フレーム揷入する符号化パターンがよく用いられているが、この場合、 Bフレームをすベて間引くことによって、フレームレ一トを 1/3 に低減することが可能である。また、この実施の形態 1 では、 MPEG-2 の 1 (イントラ）フレームは MPEG-4 でも 1 (イントラ）フレームのままとし、同じく MPEG- 2 の P (片方向予測）フレームは MPEG- 4 でも P (片方向予測）フレームとして変換を行うものとする。

③. 動きべクトルマツビング及び符号化モード選択処理

以下、本発明のポイントである動きべクトルマッピング処理並びに符号化モード選択処理について説明する。なお、本プロセスは、第 1 図における動きベクトルマッピング部 7、符号化モード推定部 8、及び MPEG-4 エンコーダ部 1 0の符号化パラメ一夕判定部 1 0 Bとの連携によって実行される。

第 2図は映像トランスコーダにおける動きべクトルマッピングと符号 9 化モード判定処理を示すフローチャートである。

MPEG-2 復号画像 5 と、 MPEG- 4 エンコーダ部 1 0の入力信号 9 とは、空間解像度が縦横 1/2 であるので、以下説明する処理手順は、 MPEG-2 の 2 X 2個のマクロブロヅク、即ち、 MPEG-4 の 1マクロブロックを単位として実行されるものとする。第 3図は解像度変換を伴うトランスコ一ディング単位を示す説明図である。

MPEG- 4 では、マクロブロックに対して 1本もしくは 4本の動きべクトルが割り当てられるため、動きべクトルのマッピングの方法としては、第 3図（A )のように、 4本の MPEG- 2 動きべクトルから 1本の MPEG - 4 動きベクトルに変換する場合と、第 3図（B )のように、 4本の MPEG- 2 動きベクトルから 4本の MPEG- 4 動きべクトルに変換する場合の 2通りがある。

1 ) 事前の強制符号化モード判定（ステップ ST0 )

まず、符号化モード推定部 8が、第 3図に示す MPEG- 2 の 2 x 2 マクロブロック内の符号化モード分布の様子を調べる。 4つのマクロブロックのすべてが INTRAモードである場合、及び 4つのマクロブロックのすぺてが SKIPモ一ドである場合は、それぞれ MPEG- 4符号化で用いるべき変換後の符号化モードは強制的に INTRA、 SK IP とする。この場合には、動きべクトルはすべてゼロとし、以降のステップをスキップする。

なお、 INTRA モードとは、動き予測を用いずにフレーム内で符号化するモードであり、 SK IP モードとは、参照画像中の同一位置の画像デー夕をそのままコピーするモードであって、符号化情報を伝送しないモードである。

この結果、 4つのマクロプロックのいずれかに動き予測モードを含んでいるケースについてのみ INTERモード、即ち、動きベクトルを用いて動き予測を行うモードを採用することで、符号化効率がよくなる可能性 10 が含まれるケースとみなされる。ただし、この場合、以下の手順 2 )以降のプロセスに従い、取り得る MPE G-4 符号化モードのうち、符号化効率の意味で最適なモードを再度決定する。

したがって、符号化モード推定部 8から出力される符号化モード設定情報 1 2 には、強制的に INTRA モード、強制的に SK I P モード、もしくは INTERモードの可能性がある、という 3ケースの選択肢が含まれる。 2 ) 動きべクトル候補の選定

上記 1 )において INTER モードの利用価値があると判断された場合は、 MPEG- 2 デコーダ部 2の可変長復号部 2 Aから出力される 2 x 2マクロブロック分の MPEG- 2 の動きべクトルから、 MPEG- 4エンコーダ部 1 0にて用いる動きべクトルの候補を定める。

本プロセスは、動きべクトルマッピング部 7において実施される。

MPEG- 2 はイン夕レース信号の圧縮符号化をサポートし、フレームを符号化単位とするフレーム構造符号化と、フィールドを符号化単位とするフィールド構造符号化との、 2 つの符号化モードのいずれかを選択できる。

フレーム構造符号化では、 1 6 x 1 6画素からなるマクロブロックをフレーム画像領域で構成し、フィールド構造符号化ではフィ一ルド画像領域でマクロブロックを構成する。フレームは、トップフィールド（上部ラインを構成するフィールド）と、ボトムフィールド（下部ラインを構成するフィールド）をくし状に組合せた画像デ一夕として定義されるため、フィールド構造符号化におけるマクロブロックは、フレーム画像領域におけるマクロブロックに対して、垂直方向をカバーする領域が 2倍なる。

第 4図は MPEG- 2 ビデオ符号化における動き予測モードの種別を説明する説明図である。 11 第 4図（A )はフレーム構造符号化時に利用可能な動き予測モードであり、同図（B )はフィールド構造符号化時に利用可能な動き予測モードである。第 4図（ A )において、フレーム予測は、フレーム画像からなるマクロブロックを 1本の軌きベクトル v_frで予測する。フィールド予測は、フレーム画像からなるマクロブロックの個々のフィ一ルド領域に対して、個別の動きベクトル v_tf および v_bf で予測を行う。

このとき、参照するフィールドがトップフィールドか、ボトムフィールドかを選択することが可能である。デュアルプライム予測は、 1本のフィ一ルドぺクトル V で、同一フィ一ルド位置から第 1 の予測画像を生成する（トップフィールドの予測はトップフィ一ルドを参照、ボトムフィ一ルドの予測はボトムフィールドを参照）とともに、別フィールド位置からは、べクトル V をフィールド間距離に基づいてスケ一リングした結果に、微小べクトル dnivを加算した動きべクトルで第 2の予測画像を生成し、第 1及び第 2の予測画像の加算平均を個々のフィールドの予測画像として用いる。

第 4図（B ) において、フィールド予測は、フィールド画像からなるマクロブロックを 1本の動きべクトル v_f ^ で予測する。 1 6 X 8予測は、フィールド画像からなるマクロブロックを上下 1 6 x 8の 2つの領域に分割し、それそれを個別の動きベクトル V_{f i} , _{upp e r}および Vn . ^erで予測する。デュアルプライム予測は、フレーム構造符号化の場合のルールをフィールドに適用した予測を行う。

動きベクトルマッピング部 7では、以上の MPEG- 2 動き予測モードに対応して、 MPEG- 4 符号化のための動きべクトルを生成する。この実施の形態 1では、 MPEG-4 符号化に利用する動きベクトルは、以下の手順で選定する。

2-1 ) INTER4Vモード用動きべクトル候補の選定（ステップ ST1 ) 12

MPEG- 2 のマクロブロックの単位に定義される動きべクトルを、その予測の性質に応じて解像度変換後の動きべクトルのスケールにダウンスケールして、 MPE G-2 の 2 X 2マクロブロヅクの領域に対応する 4本の動きべクトルを一意に定め、それら動きべクトルを、 MPE G- 4 の I NTER4V モードのための動きべクトル候補とする。

I NTER4V モ一ドとは、フレーム画像領域で定義きれる 1 6 x 1 6画素からなるマクロブロック領域を 4つの 8 X 8画素ブロヅクに分割し、それそれ個別の動きべクトルで予測するモードのことである。第 3図（ B ) のケースが該当する。本ステップについては、以下のルールに基づいて INTER4Vモードのための動きべクトル候補を選定する。

〇フレーム構造符号化の場合

[フレーム予測の場合]

動きべクトル v_{f r}を水平方向と垂直方向で 1 /2 した動きべクトルを候補とする。

[フィ一ルド予測の場合]

トップフィールドの動きベクトル v_tf を、水平方向で 1 /2 した動きべクトルを候補とする。

[デュアルプライム予測の場合]

トップフィールドのための動きべクトル V および αν +dmv の平均値を、水平方向で 1/2 した動きべクトルを候補とする。

〇フィ一ルド構造符号化の場合

以下、トップフィールドの予測に用いるべクトルについてのみ抽出を行う。

[フィ一ルド予測の場合]

動きべクトル v_{f i} を水平方向に 1 /2、垂直方向に 1 /4 した動きべクトルを候補とする。 13

[ 1 6 χ8予測の場合]

動きべクトル v_fi,_upperと v_fi,i。_werを平均し、水平方向と垂直方向で 1/2 した動きべクトルを候補とする。

[デュアルプライム予測の場合]

動きべクトル V および ν+dmv の平均値を、水平方向に 1/2、垂直方向に 1/4した動きべクトルを候補とする。

2-2) INTERモ一ド対応動きべクトル候補の選定（ステップ ST2)

上記定められた 4本の動きべクトルから、 MPEG- 4 の INTER モードのための動きべクトルを定める。 INTER モードとは、フレーム画像領域で定義される 1 6 x1 6画素からなるマクロブロック領域を 1本の動きべクトルで予測するモードのことである。第 3図の（ A )のケースが該当する。

これは、例えば、 B. Shen 他、 "Adaptive Motion-Vector Resampling for Compressed Video Downsampl mg" , IEEE Transactions on Circuits And Systems for Video Technology, vol .9, no.6, Sep.1999 に開示される方法で決定することが考えられる。

以上 1-1)， 1-2)で選定される INTER用、 INTER4V用動きベクトル候補は、動きべクトルマッピング情報 1 1 として、 MPEG- 4 エンコーダ部 1 0へ入力される。

3) 符号化モード判定

上記 2)により、 MPEG- 4の INTER及び INTER4Vで利用すべき動きべクトルの候補が選定されるため、残る符号化モードの可能性として INTRA モード又は SKIP モードのうち、最も符号化効率のよいモードを選択する。この結果として、最終的な符号化モードと動きベクトルが決定される。この処理は、符号化パラメ一夕判定部 1 0 Bで実行される。

このモード判定処理に、判定基準として、下式に示すレート歪コスト 14

J_mを用いる。

v *j= arg min J

m ！ m

J = E + R

m m m vm 同式において、 m は符号化モード種別、 v_mはモード mの場合の動きべクトル、 M はモード種別の集合（M=(INTRA，SKIP，INTER，INTEMV))、 _B はモード mに応じて定まる定数、 E_mはモ一ド m使用時の予測誤差評価値、 R_vmは動きべクトルが v_nの場合の動きべクトル符号量、 λは正の定数、 m*, v_B*は本評価の結果選定される符号化モードと動きベクトルである。なお、この 3)の符号化モード判定の際、予測誤差評価値と、動きべクトル符号量とのどちらか一方のみに基づくようにしても良い。

E_m としては、 SKIP, INTER, INTER4V モードに関しては、例えば、入力信号 9 と、動きベクトル v_n を用いて動き補償部 1 O Aから得られる予測画像候補との間の差分絶対値和などで定義することができる。なお、 SKIP の場合の動きべクトル v_mはゼロであり、 R_vmもゼロであるとする。同じ評価式で INTRAモードも評価を行うために、 INTRAモードの E_fflとしては、入力信号 9 におけるマクロプロック内の輝度信号平均値を予測画像候補とみなし、それを入力信号 9から差し引いた差分の絶対値和を用いることができる。なお、 E_n は輝度信号のみでなく、色差成分（Cb、 Cr 成分）を加味して定義するように構成してもよい。

MPEG- 2 及び MPEG- 4 の符号化対象映像の色成分サンプル比は、多くの場合、 Y:Cb:Cr=4:2:0(輝度成分 1 6 x 1 6画素領域に対して、 8 x 8画素領域の Cb、 Cr成分が対応するケース）を用いることが多いので、例えば、 Cb、 Cr のそれそれの 8 χ8領域の平均値（DC 成分）を上記 INTRA モ 15 ードの輝度成分のケースと同様、予測画像候補とみなし、入力信号 9の Cb、 Cr 各成分から該平均値を差し引いた差分絶対値和を加味するように構成できる。これによつて、輝度パターンの類似度だけでなく、色の類似度も考慮した動きべクトルを評価することが可能となり、視覚的に目立ちやすい色ずれによる劣化を抑制することができる。

また、 INTRA モードでは、動きベクトルの符号量 R„がゼロである一方、符号化すべき D C T係数が多くなるため、重み o:_ffl によって予め E_n に対する評価の重みを変更しておく。これによつて、擬似的に INTRAモードの D C T係数符号量の加算分を考慮したモード判定を行うことが可能となる。

なお、 E_n に対する評価の重み付けは重み _m の乗算でなく、オフセット値 0_nの加算で実現してもよい。

また、えの値としては、例えば、 Gary J. Sullivan and Thomas Wiegand, "Rate-Distortion Optimization for Video Compression", IEEE Signal Processing Magazine, vol . 15, no. 6, pp. 74-90, Nov. 1998.に開示される以下の値を用いることができる。ただし、 Qp は、符号化対象マク口ブ口ックの量子化ステップパラメ一夕である。

第 2図では、便宜上、 m をカウン夕として定義し、 m のループ処理の形式で上記プロセスを記述している。符号化モード推定部 8から出力される符号化モード設定情報 1 2より、 INTER モードの評価価値があると判断される場合に、 m及びコスト評価値 min_J を初期化して処理を開始する（ステップ ST3)。

m =3(INTRA)か否かの判定を経て（ステップ ST4)、 INTRAである場合は 16

、当該マクロブロック内の輝度値の平均値を算出する（ステップ ST5 )。さもなくば、動きベクトルマッピング情報 1 1から定まる動きベクトル v_m を用いて動き補償部 1 0 Bを利用して予測画像候補を得る（ステップ ST6 )。ステップ ST5 またはステップ ST6の結果は、入力信号 9で表される符号化対象マクロブロックの輝度信号との間で差分絶対値和が計算され、それを上記 Ε_π としてコストを算出する（ステップ ST7 )。ステツプ ST8 , ST9 において、コスト最小となるモード mへの候補更新が行なわれ、ステップ ST10で mをインクリメントし、ステップ ST11でループが終了するまで上記処理を継続する。

以上の手順により、ステップ ST0で I NTERモードの利用価値があると判断されるケースでは、 MPEG- 4 符号化において、取り得るすべての符号化モードを対象として最適なモード選択、並びに、それに付随する動きべクトルを選定することが可能となる。

従来技術では、上記 1 )に記載したような動きベクトル候補の選定は開示しているが、その結果得られる動きべクトル自身の符号量コスト、 MPEG-4 符号化へのインパクトまでは評価されない。特に低レートの MPEG- 4 符号化を行うような場合には、動きべクトルの符号量の大きさを無視し難くなるが、上記判定規範を用いることで、 I NTER、 INTER4V の動きべクトル候補のうち、符号量と予測精度の最適なトレードオフを与えるものを選択することができる。

また、 INTRA、 SK IP も同様の評価尺度で判定を行うようにすることで、同一の判定規範で MPEG-4 符号化に用いるべき動きベクトルと符号化モードを一括して決定することができる。

④. MPEG-4符号化処理

以上の結果、 MPEG-4 エンコーダ 1 0 には、入力圧縮データ 1から抽出された動きベクトル倩報、符号化モード情報を再利用する形で、動き 17 べクトルマツピング情報 1 1、符号化モード設定情報 1 2が入力され、解像度変換後の MPEG- 2 復号画像である入力信号 9の符号化に用いられる。これらの情報は、符号化パラメ一夕判定部 1 0 Bにおいて、 MPEG-4 の各マクロブロック単位に符号化に用いる符号化モード及び動きべクトルの決定に利用される。

その結果、 INTEI INTER4V のいずれかのモードの場合は、動き補償部 1 0 Aで予測画像 1 0 Cが生成され、入力信号 9 との差分をとつて予測残差信号が生成され、それが D C T部 1 0 D、量子化部 1 0 Eを経て可変長符号化部 1 0 Jによって MPEG- 4 ビデオストリームの形式に配列される。

INTRA モードの場合は、入力信号 9そのものが！） C T、量子化されたのち可変長符号化される。 SK IP モードの場合は、当該マクロプロヅクが SKIPであることを示すフラグ（not_coded )のみをビットストリームに多重することで符号化される。

量子化後の予測残差信号は、逆量子化部 1 0 F、逆 D C T部 1 0 Gを経て予測残差信号復号値 1 0 Hに戻され、予測画像 1 0 Cと加算されたのち、以降のフレームの M Cに用いるためにフレームメモリ 1 0 Mに格納される。

なお、可変長符号化部 1 0 Jは、その内部に A C、 D C成分の予測処理、 D C T係数のランレングス符号化のためのスキャニング処理を含んでいる。

また、可変長符号化部 1 0 Jの出力は、バッファリングされた後、伝送もしくは記録されることから、符号化制御部 1 0 Lがバッファ占有量 1 0 Kに基づいた符号化制御を実施する。ここでは、主として、マクロプロヅクをラスタスキヤン順に複数個グルーピングした単位で、フレーム内での周辺画像領域との依存関係を断ち切ることで誤りからの早期復 18 帰に用いられるビデオパケット、マクロブロックなどの単位で、量子化ステップパラメ一夕（Qp ) 1 0 Nを決定する処理を行う。決定された量子化ステップパラメータ 1 0 Nは、量子化部 1 0 E、逆量子化部 1 0 Fへ入力されるとともに、上記の算出のため符号化パラメ一夕判定部 1 0 Bにも入力される。

以上で明らかなように、この実施の形態 1 によれば、 MPEG- 2 映像デ —夕から MPEG- 4 映像デ一夕への変換動作を行うトランスコーダにより、 MPEG- 2 データ中の動きべクトルや符号化モードの情報を再利用しながら MPEG-4 符号化における最適な符号化モ一ド並びに動きべクトルの決定を行うので、少ない演算量でトランスコ一ド映像の品質を向上させることが可能である。

特に、この実施の形態 1では、演算負荷の大きい動きベクトル検出処理を簡略化したので、従来の単純動きべクトル再利用手法に比べて MPEG- 2 から MPEG- 4 への映像トランスコ一ティング品質を向上させることができる。

なお、詳しくは述べなかったが、本構成によれば、符号化制御部 1 0 Lにおける量子化ステップパラメ一夕（Qp ) l 0 Nの決定プロセス、もしくは、フレームやビデオパケット、マクロブロック等の設定単位と、上記③に述べた MPEG-2 の動きベクトル · 符号化モード情報再利用の方針とを密に連携させることで、さらに符号化効率の改善を行うことができる。

また、上記では、 MPEG- 4 シンプルプロファイルを前提として記載したが、本構成のトランスコーダは、 MPE G- 4 ァドバンスドシンプルプ口ファイルや、 I TU- T H . 263 において Annex F に記載される動き予測ォプションをサボ一卜するケースなど、 MPEG-4 シンプルプロファイルに準ずるあらゆる多モード符号化方式に適用可能である。 19

実施の形態 2 .

この実施の形態 2では、解像度変換部 6が空間解像度変換部としてだけでなく、さらに時間解像度変換部として機能して、動き予測の影響が伝播する Pフレームを間引くことによる時間解像度（フレームレート）の変換を行う実施の形態について説明する。なお、解像度変換部 6は、空間解像度変換部及び時間解像度変換部として機能しても良いし、空間解像度変換部としては機能せず時間解像度変換部としてのみ機能するようにしても勿論よい。

第 5図はこの発明の実施の形態 2による映像トランスコーダ（映像デ一夕変換装置）を示す構成図である。なお、この実施の形態 2のトランスコーダの構成は、第 1 図に示す実施の形態 1 のトランスコーダの内部構成と同じであり、解像度変換部 6及び動きべクトルマツピング部 Ίの動作が上記実施の形態 1 と異なるため、上記実施の形態 1 と異なる動作については詳細に説明する。

次に動作について説明する。

① . 入力 MPEG-2 ビデオストリームの復号処理

上記実施の形態 1 と同じ動作である。

② . 解像度変換処理

MPEG- 2 復号画像 5は、解像度変換部 6 において、所定のダウンサンプルフィル夕に基づいた画素間引きにより、縦横 1 /2の空間解像度へ縮小される。さらに、 MPEG- 4 エンコーダ部 1 0から通知される符号化フレーム指示情報 1 3に基づいて、 MPEG- 4 エンコーダ部 1 0への入力信号 9の入力フレームレ一トを制御する。

この実施の形態 2では、上記実施の形態 1 に述べた： Bフレームの間引き処理だけでなく、符号化フレーム指示情報 1 3の指示次第で Pフレー 20 ムの間引きも行う構成とする。

符号化フレーム指示情報 1 3は、 MPE G- 4 エンコーダ部 1 0が固定フレームレートで符号化を行う場合には、その符号化フレームレート値を示し、 MPE G- 4 ェンコーダ部 1 0が可変フレームレー卜で符号化を行う場合には、符号化対象となるフレームの表示時刻情報、あるいは、直前の MPE G- 4 符号化フレームからのフレーム数オフセヅト情報などを示している。

③. 動きベクトルマツビングおよび符号化モード選択処理

以下、この実施の形態 2のポイントである動きべクトルマッピング処理並びに符号化モード選択処理について説明する。

本プロセスは、第 5図における動きベクトルマッピング部 7、符号化モ一ド推定部 8、及び MPEG- 4 エンコーダ部 1 0の構成要素である符号化パラメ一夕判定部 1 0 Bとの連携によって実行される。

第 6図は映像トランスコーダにおける動きベクトルマッピングと符号化モード判定処理を示すフローチヤ一トである。

MPE G- 2復号画像 5 と MPE G- 4エンコーダ部入力信号 9 とは、空間解像度が縦横 1 /2 であるので、以下説明する処理手順は、 MPE G- 2 の 2 x 2個のマクロブロック、即ち、 MPEG-4 の 1マクロブロックを単位として実行されるものとする（第 3図を参照）。

1 ) 事前の強制符号化モード判定

まず、符号化モ一ド推定部 8 において、第 3図に示す MPE G- 2 の 2 X 2マクロブロック内の符号化モード分布の様子を調べる。

第 7図は符号化モード推定部 8 の MPE G- 2 符号化モードの監視動作を示す説明図である。

第 7図に示すように、この実施の形態 2では、符号化フレーム指示情報 1 3 に基づき、直前に MP EG- 4 符号化の対象となったフレーム以降、 21 現在符号化対象となるフレームに至るまでのフレーム間引きの間、

MPEG- 2 符号化モードの監視を行う（ステップ ST12、 ST13 )。 MPEG- 2 の 4 つのマクロプロックのすべてが INTRAモードになる場合が 1回でもあれば、 MPEG- 4符号化で用いるべき変換後の符号化モードは強制的に INTRA モードとする。

一方、 4つのマクロブロックのすべてが SK IP モードになる場合については、直前に MPEG- 4 符号化の対象となったフレーム以降、現在符号化対象となるフレームに至るまで、フレーム間引きの間、常に SK IP が継続する場合については MPEG- 4 符号化で用いるべき符号化モードは強制的に SK IP とし、一回でも SK IPでないケースがある場合は INTERモードの可能性を検討するものとする。ただし、フレーム間引きを行っている間の MPEG-2 符号化モードの監視は Pフレームについてのみ行うものとし、 I フレームはそのまま I フレームとして間引きを行わずに MPEG- 4 符号化を行い、 MPEG-2 符号化モードの監視をリセットする（ステップ ST14、 ST15 )。強制的に INTRAまたは SK IP となる場合については、動きべクトルはすぺてゼロとし、以降のステップをスキップする。

したがって、符号化モード推定部 8から出力される符号化モード設定情報 1 2 には、強制的に INTM、強制的に SK IP、もしくは INTERモードの可能性がある、という 3ケースの選択肢が出力される（ステップ ST0 ) この結果、 INTER モードの可能性を検討すると判断されたケースについてのみ、以下の手順 2 )以降のプロセスに従い、取り得る MPEG- 4符号化モードのうち符号化効率の意味で最適なモードを再度決定する。

2 ) 動きべクトル候補の選定

上記 1 )において INTER モードの利用価値があると判断された場合は、第 8図に示すように、符号化フレーム指示情報 1 3 に基づき、直前に 22

MPEG- 4 符号化の対象となったフレーム以降、現在符号化対象となるフレームに至るまでのフレーム間引きの間、 MPEG- 2 動きべクトルの監視を行う（ステップ ST12、 ST13 )。監視の結果得られる MPEG-2 動きべクトルから、 MPEG- 4 エンコーダ部 1 0 にて用いる動きべクトルの候補を定める。

本プロセスは、動きベクトルマッピング部 7において実施される。上記 1 )の結果から、本プロセスでは、原則、フレーム間引きが行なわれる間の MPEG- 2の符号化モードとして SK IPモードもしくは INTERモードが発生するケースを考慮することになる。そこで、以下のルールを適用する。

ルール 1 ：符号化対象マク口プロックの動きべクトル候補は、フレームレ一ト変換の結果、間引かれるフレームの同一空間位置に存在するマクロブロックの動きベクトルを下式により累積することで求める。

^V G4 = > 5(- MPEG2

ここで、 v_MPEG4 は、 MPEG-4 符号化対象マクロブロックの動きベクトル候補、 k はフレームレート変換の結果間引かれるフレームのカウン夕、は解像度にあわせた動きべクトルのスケ一リング、 v^k _MPEG2は MPEG- 4 符号化対象マク口プロック領域に対応する MPEG-2 の動きべクトルを表している。ただし、 v_MPEG4には INTER、 INTER4Vの 2種類があり、上記実施の形態 1の 2- 2 )に述べたように、まず INTEMV の動きべクトル候補を求めたのち、 INTER動きベクトル候補を定める。（ステップ ST1、 ST2 ) ルール 2 ： S ( v^k _MPEG2 )は、インタレース符号化に伴うフレーム · フィ —ルドベクトルの違いを考慮して、上記実施の形態 1 における 2-1 )の 23 ルールに従うスケーリング処理を行う。

ルール 3 ：フレームカウン夕 kのいずれかの時点で、 SK IP モードが発生する場合は、累積すべき動きべクトル v^k _{MPE G2}はゼロとする。

ルール 4 ： I フレームでは MPEG- 2 動きべクトルの監視ならびに上記動きべクトル累積をリセヅ卜する（ステップ ST 14、 ST 15 ) o

3 ) 符号化モード判定

上記 2 )により、 MPEG- 4 の I NTER及び I NTER4Vで利用すべき動きべクトルの候補が選定されたため、残る符号化モードの可能性として INTRA 、 SK IP のうち、最も符号化効率のよいモードを選択する（ステップ ST3 ~ ST 1 1 )。この結果として、最終的な符号化モードと動きベクトルが決定される。この処理は、符号化パラメ一夕判定部 1 0 Bで実行される。以下、符号化パラメ一夕判定部 1 0 Bにおける処理は上記実施の形態 1 の 3 )に準ずる。ただし、動き予測に用いる参照画像は、現在符号化対象となるフレームの直前に MPEG- 4 符号化されたフレームの局所復号画像を用いることになる。

以上の手順により、この実施の形態 2によれば、 Pフレームの間引きを伴う時間解像度（フレームレート変換）を実行するトランスコーディングに際しても、 MPEG- 4 符号化において取り得るすべての符号化モードを対象として最適なモード選択並びにそれに付随する動きベクトルを選定することが可能となる。

特に、この実施の形態 2では、 Pフレームの間引きを行うトランスコーダにおいても、演算負荷の大きい動きべクトル検出処理を簡略化したので、従来の単純動きべクトル再利用手法に比べて MPEG-2 から MPEG - 4 への映像トランスコーティング品質を向上させることができる。

なお、上記では、 MPEG-4 シンプルプロファイルを前提として記載したが、本構成のトランスコーダは、 MPEG-4 ァドバンスドシンプルプ口 24 ファイルや、 I TU- T Η. 263 において Annex F に記載される動き予測ォプションをサボ一トするケースなど、 MPEG- 4 シンプルプロファイルに準ずるあらゆる多モード符号化方式に適用可能であり、本発明は、 M C + D C T映像符号化方式を対象とするトランスコ一ディング全般について適用可能である。産業上の利用可能性

以上のように、この発明に係る映像データ変換装置及び映像データ変換方法は、各種国際標準の映像圧縮 ·伸長方式に準拠したビデオ圧縮デ一夕の各種変換を行う際、少ない演算量でトランスコード映像の品質を向上させる必要があるものに適している。

Claims

25 請求の範囲

1 . 映像信号の各フレームを所定部分領域に分割し、その単位で動きべクトル等の符号化パラメ一夕を選択して符号化を行う第 1の映像符号化方式に従う映像符号化データを入力として、映像信号の各フレームを所定部分領域に分割し、その単位で符号化パラメ一夕を選択して符号化を行う第 2の映像符号化方式に従う映像符号化データへの変換を行う映像デ一夕変換装置であって、前記第 1の映像符号化方式における所定部分領域単位の符号化パラメ一夕である動きべクトルから、前記第 2の映像符号化方式における所定の部分領域の単位で用いる動きぺクトルの候補を生成する動きベクトルマツビング部と、前記生成された第 2の映像符号化方式における動きべクトルの候補のうち、該動きべクトル候補を用いた場合の予測効率を評価する予測誤差評価値と、該動きべクトル候補を用いることによる動きべクトル符号量を評価する値とに基づいて、第 2の映像符号化方式において使用する動きべクトルを決定する符号化パラメ一夕判定部とを備えることを特徴とする映像デ一夕変換装置。

2 . 前記動きベクトルマッピング部は、前記第 2の映像符号化方式がとりうる動き予測の種類の分だけ動きべクトル候補を生成することを特徴とする請求の範囲第 1項記載の映像データ変換装置。

3 . さらに、前記第 1の映像符号化方式における所定部分領域単位の符号化パラメ一夕である符号化モードに基づき、前記第 2の映像符号化方式における所定の部分領域の単位の符号化モードを推定する符号化モード推定部を備え、前記符号化パラメ一夕判定部は、符号化モードを決定する際、前記符号化モ一ド推定部によって推定された符号化モードに基 26 づいて前記第 2の映像符号化方式における所定部分領域単位で用いるベき符号化モードを強制的に決定するか、あるいは前記予測誤差評価値と前記動きべクトル符号量の評価値とに基づいて前記第 2の映像符号化方式における所定の部分領域の単位で用いるべき符号化モードを決定するかを選択して、第 2の映像符号化方式において使用すべき符号化モードを判定することを特徴とする請求の範囲第 1項記載の映像データ変換装

4 . さらに、前記第 1の映像符号化方式によって符号化された映像デー夕の空間解像度を、水平および垂直方向に各半分の解像度に変換する空間解像度変換部を備えることを特徴とする請求の範囲第 1項記載の映像データ変換装置。

5 . さらに、前記第 1の映像符号化方式によって符号化された映像デ一夕の時間解像度を、フレーム間動き予測に使用しないフレームを間引くことで実現する時間解像度変換部を備えることを特徴とする請求の範囲第 1項記載の映像データ変換装置。

6 . さらに、前記第 1の映像符号化方式によって符号化された映像デー夕の時間解像度を、フレーム間動き予測に使用するフレームを含めて間引くことで実現する時間解像度変換部を備え、前記動きべクトルマツピング部は、フレーム間動き予測に使用するフレームが間引かれる場合は、間引かれたフレームにおける動きベクトルを利用して、第 2の映像符号化方式で用いるべき動きべクトル候補を決定し、前記符号化モード判定手段は、フレーム間動き予測に使用するフレームが間引かれる場合は、間引かれたフレームにおける符号化モードを利用して、第 2の映像符 27 号化方式で用いるべき符号化モードを決定することを特徴とする請求の範囲第 3項記載の映像データ変換装置。

7 . 前記第 1 の映像符号化方式は、 I S(V IEC 13818-2 に規定される MPEG- 2 映像符号化方式であり、前記第 2の映像符号化方式は、 I S0/ IEC 14496-2 に規定される MPEG- 4 映像符号化方式であることを特徴とする請求の範囲第 1項記載の記載の映像データ変換装置。

8 . 映像信号の各フレームを所定部分領域に分割し、その単位で一部の符号化パラメ一夕を選択して符号化を行う第 1の映像符号化方式に従う映像符号化データを入力として、映像信号の各フレームを所定部分領域に分割し、その単位で一部の符号化パラメ一夕を選択して符号化を行う第 2の映像符号化方式に従う映像符号化データへの変換を行う際の映像デ一夕変換方法であって、前記第 1の映像符号化方式における所定部分領域単位の符号化パラメ一夕である動きべクトルから、前記第 2の映像符号化方式における所定の部分領域の単位で用いる動きぺクトルの候補を生成し、生成した第 2の映像符号化方式における動きべクトルの候補のうち、該動きべクトル候補を用いた場合の予測効率を評価する予測誤差評価値と、該動きべクトル候補を用いることによる動きべクトル符号量を評価する値とのうち少なくとも一方に基づいて、第 2の映像符号化方式において使用する動きべクトルを決定することを特徴とする映像デ一夕変換方法。