WO2023190053A1

WO2023190053A1 - 画像符号化装置、画像復号装置、画像符号化方法、及び画像復号方法

Info

Publication number: WO2023190053A1
Application number: PCT/JP2023/011563
Authority: WO
Inventors: ジンインガオ; ハンブンテオ; チョンスンリム; プラビーンクマールヤーダブ; 清史安倍; 孝啓西; 正真遠間
Original assignee: Panasonic Intellectual Property Corp of America
Current assignee: Panasonic Intellectual Property Corp of America
Priority date: 2022-03-31
Filing date: 2023-03-23
Publication date: 2023-10-05
Anticipated expiration: 2024-09-30
Also published as: EP4485923A1; EP4485923A4; CN118947114A; US20250024033A1

Abstract

画像符号化装置は、入力画像に対してフィルタ処理を行うことによって第１画像を生成するフィルタ処理部と、前記第１画像に対して符号化処理を行うことによってビットストリームを生成し、当該ビットストリームを画像復号装置に送信する符号化処理部と、を備え、前記フィルタ処理部は、種類が異なる複数のフィルタを有し、前記画像復号装置側での画像用途を示す用途情報に基づいて、前記複数のフィルタから一のフィルタを選択して前記入力画像に適用する。

Description

画像符号化装置、画像復号装置、画像符号化方法、及び画像復号方法

　本開示は、画像符号化装置、画像復号装置、画像符号化方法、及び画像復号方法に関する。

　特許文献１には、適応型結合プレフィルタ及びポストフィルタを用いた、ビデオ符号化及び復号化方法が開示されている。

　特許文献２には、人工知能（ＡＩ）集積回路にロードするための、画像データの符号化方法が開示されている。

米国特許第９８８３２０７号明細書米国特許第１０４５２９５５号明細書

　本開示は、画像符号化装置から画像復号装置へ伝送されるビットストリームのビット効率を向上することを目的とする。

　本開示の一態様に係る画像符号化装置は、入力画像に対してフィルタ処理を行うことによって第１画像を生成するフィルタ処理部と、前記第１画像に対して符号化処理を行うことによってビットストリームを生成し、当該ビットストリームを画像復号装置に送信する符号化処理部と、を備え、前記フィルタ処理部は、種類が異なる複数のフィルタを有し、前記画像復号装置側での画像用途を示す用途情報に基づいて、前記複数のフィルタから一のフィルタを選択して前記入力画像に適用する。

本開示の実施形態に係る画像処理システムの構成を簡略化して示す図である。タスク処理部の構成を簡略化して示す図である。マシンタスクの一例として、オブジェクト検出及びオブジェクトセグメンテーションを示す図である。マシンタスクの一例として、オブジェクトトラッキング、アクション認識、及びポーズ推定を示す図である。フィルタ処理部の構成を簡略化して示す図である。種類が異なる複数のフィルタの例を示す図である。種類が異なる複数のフィルタの例を示す図である。種類が異なる複数のフィルタの例を示す図である。種類が異なる複数のフィルタの例を示す図である。種類が異なる複数のフィルタの例を示す図である。種類が異なる複数のフィルタの例を示す図である。種類が異なる複数のフィルタの例を示す図である。種類が異なる複数のフィルタの例を示す図である。種類が異なる複数のフィルタの例を示す図である。用途情報に基づくフィルタの選択を規定するルックアップテーブルの例を示す図である。フィルタの第１の構成例を示す図である。フィルタの第２の構成例を示す図である。フィルタの第３の構成例を示す図である。フィルタの第４の構成例を示す図である。ビットストリームのデータ構造の第１の例を示す図である。ビットストリームのデータ構造の第２の例を示す図である。フィルタ情報に関するＳＥＩメッセージシンタックスの第１の例を示す図である。フィルタ情報に関するＳＥＩメッセージシンタックスの第２の例を示す図である。設定部がＩＯＵに関するしきい値を設定する場合の例を説明するための図である。画像符号化装置が実行する処理の流れを示すフローチャートである。画像復号装置が実行する処理の流れを示すフローチャートである。

　（本開示の基礎となった知見）
　従来の符号化方式は、ヒューマンビジョンのために、ビットレート制約の条件下で最適な映像の提供を目指すものであった。

　豊富なセンサとともに機械学習又はニューラルネットワークベースのアプリケーションの進展により、コネクテッドカー、ビデオ監視、又はスマートシティ等を含む、大量のデータを扱う多くのインテリジェントプラットフォームが実現されてきた。大量のデータが常に生成されるため、パイプラインに人間を含む従来の方法は、レイテンシ及びスケールの点で非効率的かつ非現実的なものとなっている。

　さらに、伝送及びアーカイブシステムにおいては、よりコンパクトなデータ表現及び低遅延のソリューションが求められるという懸念があり、そのためにＶＣＭ（Video Coding for Machines）が導入された。

　あるケースでは、マシン同士が通信をして人間の介在なしでタスクを実行できる場合もあるし、あるいは、解凍された特定のストリームに対して人間による追加の処理が必要な場合もある。例えば監視カメラにおいて人間の「監督者」が映像内の特定の人物又はシーンを検索する場合等である。

　他のケースでは、対応するビットストリームを人間及びマシンの双方が使用する場合もある。コネクテッドカーの場合、人間に対しては画像補正機能に、マシンに対してはオブジェクトの検出及びセグメンテーションに、特徴を利用することができる。

　一般的なシステムアーキテクチャは、画像符号化装置及び画像復号装置のペアを含んでいる。システムの入力は、動画、静止画、又は特徴量である。マシンタスクの例としては、オブジェクト検出、オブジェクトセグメンテーション、オブジェクトトラッキング、アクション認識、ポーズ推定、又はそれらの任意の組み合わせが挙げられる。ヒューマンビジョンは、マシンタスクとともに利用可能なユースケースの一つである可能性がある。

　従来技術によると、画像符号化装置から画像復号装置へ、常にヒューマンビジョンを想定した最高画質のビットストリームが伝送されるため、伝送符号量が増大し、ビット効率が悪いという問題がある。

　かかる問題を解決するために、本発明者は、画像復号装置側の画像用途を示す用途情報に基づいて画像符号化装置側で入力画像に対して適切なフィルタ処理を行うことによって、画像符号化装置から画像復号装置へのビットストリームの伝送においてビット効率を向上できるとの知見を得て、本開示を想到するに至った。

　次に、本開示の各態様について説明する。

　本開示の第１態様に係る画像符号化装置は、入力画像に対してフィルタ処理を行うことによって第１画像を生成するフィルタ処理部と、前記第１画像に対して符号化処理を行うことによってビットストリームを生成し、当該ビットストリームを画像復号装置に送信する符号化処理部と、を備え、前記フィルタ処理部は、種類が異なる複数のフィルタを有し、前記画像復号装置側での画像用途を示す用途情報に基づいて、前記複数のフィルタから一のフィルタを選択して前記入力画像に適用する。

　第１態様によれば、フィルタ処理部は、種類が異なる複数のフィルタを有し、画像復号装置側での画像用途を示す用途情報に基づいて、複数のフィルタから一のフィルタを選択して入力画像に適用する。その結果、画像符号化装置から画像復号装置へのビットストリームの伝送においてビット効率を向上することが可能となる。

　本開示の第２態様に係る画像符号化装置は、第１態様において、前記複数のフィルタは、ノイズ除去フィルタ、鮮鋭化フィルタ、ビット深度変換フィルタ、色空間変換フィルタ、解像度変換フィルタ、及び、ニューラルネットワークを用いたフィルタの少なくとも一つを含むと良い。

　第２態様によれば、フィルタ処理部は、画像復号装置側での画像用途に応じて適切なフィルタを入力画像に適用することが可能となる。

　本開示の第３態様に係る画像符号化装置は、第２態様において、前記ノイズ除去フィルタは、ローパスフィルタ、ガウシアンフィルタ、平滑化フィルタ、平均化フィルタ、バイラテラルフィルタ、及び、メディアンフィルタの少なくとも一つを含むと良い。

　第３態様によれば、ローパスフィルタ、ガウシアンフィルタ、平滑化フィルタ、平均化フィルタ、バイラテラルフィルタ、及び、メディアンフィルタの少なくとも一つを入力画像に適用することにより、入力画像のノイズを除去することができる。

　本開示の第４態様に係る画像符号化装置は、第２態様において、前記解像度変換フィルタは、前記第１画像の解像度を前記入力画像の解像度より削減するダウンサンプリングフィルタを含むと良い。

　第４態様によれば、ダウンサンプリングフィルタを入力画像に適用することにより、符号量を削減することが可能となる。

　本開示の第５態様に係る画像符号化装置は、第１～第４態様のいずれか一つにおいて、前記画像用途は、少なくとも一つのマシンタスクと、ヒューマンビジョンとを含むと良い。

　第５態様によれば、画像用途がマシンタスクである場合には符号量を削減するフィルタを適用し、画像用途がヒューマンビジョンである場合にはマシンタスクの場合より符号量を削減しないフィルタを適用するという選択が可能となる。

　本開示の第６態様に係る画像符号化装置は、第５態様において、前記画像用途が前記マシンタスクである場合、前記フィルタ処理部は、前記フィルタ処理によって前記第１画像の符号量を前記入力画像の符号量より削減すると良い。

　第６態様によれば、画像用途がマシンタスクである場合には符号量を削減するフィルタを適用することにより、画像符号化装置から画像復号装置へのビットストリームの伝送においてビット効率を向上することが可能となる。

　本開示の第７態様に係る画像符号化装置は、第６態様において、前記フィルタ処理部は、前記マシンタスクにとって重要でない非重要領域を前記入力画像内に規定し、前記非重要領域の細部の情報を削除することによって、前記第１画像の符号量を前記入力画像の符号量より削減すると良い。

　第７態様によれば、非重要領域の細部情報の削除によって第１画像の符号量を削減することにより、マシンタスクにとって重要である重要領域の符号量を削減する必要がないため、画像復号装置側でマシンタスクを適切に実行することが可能となる。

　本開示の第８態様に係る画像符号化装置は、第６又は第７態様において、前記フィルタ処理部は、前記マシンタスクにとって重要である重要領域を前記入力画像内に規定し、前記フィルタ処理によって前記重要領域を強調すると良い。

　第８態様によれば、フィルタ処理部はフィルタ処理によって重要領域を強調するため、画像復号装置側でマシンタスクを適切に実行することが可能となる。

　本開示の第９態様に係る画像符号化装置は、第５態様において、前記画像用途が前記ヒューマンビジョンである場合、前記フィルタ処理部は、前記画像用途が前記マシンタスクである場合と比較して、前記フィルタ処理によって前記第１画像の符号量を削減しないと良い。

　第９態様によれば、画像用途がヒューマンビジョンである場合にはマシンタスクの場合より符号量を削減しないフィルタを適用することにより、画像復号装置側でヒューマンビジョンを適切に実行することが可能となる。

　本開示の第１０態様に係る画像符号化装置は、第１～第９態様のいずれか一つにおいて、前記符号化処理部は、前記フィルタ処理部が前記入力画像に適用した前記フィルタに関するフィルタ情報を、前記ビットストリーム内に格納すると良い。

　第１０態様によれば、入力画像に適用したフィルタに関するフィルタ情報をビットストリーム内に格納することにより、画像復号装置側でのマシンタスクにおいてフィルタ情報を活用することが可能となる。

　本開示の第１１態様に係る画像符号化装置は、第１０態様において、前記符号化処理部は、前記フィルタ情報を前記ビットストリームのヘッダ内に格納すると良い。

　第１１態様によれば、フィルタ情報をビットストリームのヘッダ内に格納することにより、画像復号装置はフィルタ情報をビットストリームから容易に抽出することが可能となる。

　本開示の第１２態様に係る画像符号化装置は、第１１態様において、前記ヘッダはＳＥＩ領域を有し、前記符号化処理部は、前記フィルタ情報を前記ＳＥＩ領域内に格納すると良い。

　第１２態様によれば、フィルタ情報をＳＥＩ領域内に格納することにより、フィルタ情報を付加情報として簡易に取り扱うことが可能となる。

　本開示の第１３態様に係る画像復号装置は、符号化された画像を含むビットストリームを画像符号化装置から受信し、当該ビットストリームを復号することによって復号画像を生成する復号処理部と、前記復号画像に基づいてマシンタスクを実行するタスク処理部と、前記ビットストリームは、前記マシンタスクに応じて前記画像符号化装置が入力画像に適用したフィルタに関するフィルタ情報をさらに含み、前記ビットストリームから前記フィルタ情報を抽出し、当該フィルタ情報に基づいて、前記タスク処理部が前記マシンタスクを実行する際に使用するパラメータ値を設定する設定部と、を備える。

　第１３態様によれば、設定部は、ビットストリームからフィルタ情報を抽出し、当該フィルタ情報に基づいて、タスク処理部がマシンタスクを実行する際に使用するパラメータ値を設定する。その結果、画像符号化装置が入力画像に適用したフィルタに応じて、タスク処理部によって適切なタスク処理を実行することが可能となる。

　本開示の第１４態様に係る画像符号化方法は、画像符号化装置が、入力画像に対してフィルタ処理を行うことによって第１画像を生成し、前記第１画像に対して符号化処理を行うことによってビットストリームを生成し、当該ビットストリームを画像復号装置に送信し、前記フィルタ処理において、前記画像復号装置側での画像用途を示す用途情報に基づいて、種類が異なる複数のフィルタから一のフィルタを選択して前記入力画像に適用する。

　第１４態様によれば、フィルタ処理において、画像復号装置側での画像用途を示す用途情報に基づいて、種類が異なる複数のフィルタから一のフィルタを選択して入力画像に適用する。その結果、画像符号化装置から画像復号装置へのビットストリームの伝送においてビット効率を向上することが可能となる。

　本開示の第１５態様に係る画像復号方法は、画像復号装置が、符号化された画像を含むビットストリームを画像符号化装置から受信し、当該ビットストリームを復号することによって復号画像を生成し、前記復号画像に基づいてマシンタスクを実行し、前記ビットストリームは、前記マシンタスクに応じて前記画像符号化装置が入力画像に適用したフィルタに関するフィルタ情報をさらに含み、前記ビットストリームから前記フィルタ情報を抽出し、当該フィルタ情報に基づいて、前記マシンタスクを実行する際に使用するパラメータ値を設定する。

　第１２態様によれば、ビットストリームからフィルタ情報を抽出し、当該フィルタ情報に基づいて、マシンタスクを実行する際に使用するパラメータ値を設定する。その結果、画像符号化装置が入力画像に適用したフィルタに応じて、適切なタスク処理を実行することが可能となる。

　（本開示の実施形態）
　以下、本開示の実施形態について、図面を用いて詳細に説明する。なお、異なる図面において同一の符号を付した要素は、同一又は相応する要素を示すものとする。

　なお、以下で説明する実施形態は、いずれも本開示の一具体例を示すものである。以下の実施形態で示される数値、形状、構成要素、ステップ、ステップの順序等は、一例であり、本開示を限定する主旨ではない。また、以下の実施形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また、全ての実施形態において、各々の内容を組み合わせることもできる。

　図１は、本開示の実施形態に係る画像処理システムの構成を簡略化して示す図である。画像処理システムは、画像符号化装置１０と、ネットワークＮｗと、画像復号装置２０とを備える。

　画像符号化装置１０は、フィルタ処理部１１及び符号化処理部１２を備える。フィルタ処理部１１には、入力画像の画像データＤ１と、画像復号装置２０側での画像用途を示す用途情報Ｄ２とが入力される。入力画像には、動画、静止画、又は特徴量が含まれる。フィルタ処理部１１は、種類が異なる複数のフィルタを有している。フィルタ処理部１１は、用途情報Ｄ２に基づいて複数のフィルタから一のフィルタを選択して入力画像に適用する。フィルタ処理部１１は、入力画像に対して選択したフィルタを用いたフィルタ処理を行うことによって第１画像を生成し、第１画像の画像データＤ３を出力する。符号化処理部１２は、第１画像に対して符号化処理を行うことによって符号化画像に関するビットストリームＤ４を生成し、当該ビットストリームＤ４を、ネットワークＮｗを介して画像復号装置２０に送信する。

　ネットワークＮｗは、インターネット、ＷＡＮ（Wide Area Network）、ＬＡＮ（Local Area Network）、又はこれらの任意の組合せである。また、ネットワークＮｗは、必ずしも双方向通信網に限定されず、地上デジタル放送又は衛星放送等の放送波を送信する一方向通信網であっても良い。また、ネットワークＮｗは、ビットストリームＤ４が記録されたＤＶＤ（Digital Versatile Disc）又はＢＤ（Blue-Ray Disc）等の記録媒体であっても良い。

　画像復号装置２０は、復号処理部２１、設定部２２、及びタスク処理部２３を備えている。復号処理部２１は、ビットストリームＤ４を画像符号化装置１０からネットワークＮｗを介して受信し、当該ビットストリームＤ４を復号することによって復号画像を生成し、復号画像の画像データＤ５を出力する。タスク処理部２３は、復号画像を用いて、画像用途を示す用途情報Ｄ８に応じたマシンタスクを実行する。ビットストリームＤ４には、マシンタスクに応じて画像符号化装置１０が入力画像に適用したフィルタを示すフィルタ情報Ｄ６を含まれている。設定部２２は、ビットストリームＤ４からフィルタ情報Ｄ６を抽出し、当該フィルタ情報Ｄ６に基づいて、タスク処理部２３がマシンタスクを実行する際に使用するパラメータ値を設定し、その設定情報Ｄ７を出力する。パラメータ値は、マシンタスク解析のための信頼スコアに関するしきい値又はＩＯＵ（Intersection Over Union）に関するしきい値を含む。タスク処理部２３は、設定情報Ｄ７で示されるパラメータ値を用いてマシンタスクを実行し、推論結果等の結果データＤ９を出力する。なお、図１に示した画像復号装置２０の構成は一例であり、この例に限定されない。例えば、設定部２２を省略し、設定部２２の機能を復号処理部２１又はタスク処理部２３に実装しても良い。

　図２は、タスク処理部２３の構成を簡略化して示す図である。画像復号装置２０側での画像用途には、少なくとも一つのマシンタスクと、ヒューマンビジョンとが含まれる。図２の例では、画像用途には、複数のマシンタスク３０Ａ～３０Ｃと、ヒューマンビジョン３０Ｘとが含まれる。用途情報Ｄ８が例えばマシンタスク３０Ｂを選択している場合、設定部２２は、タスク処理部２３がマシンタスク３０Ｂを実行する際に使用するパラメータ値の設定情報Ｄ７Ｂを出力する。タスク処理部２３は、設定情報Ｄ７Ｂで示されるパラメータ値を用いて画像データＤ５に基づいてマシンタスク３０Ｂを実行し、推論結果等の結果データＤ９Ｂを出力する。

　図３は、マシンタスクの一例として、オブジェクト検出及びオブジェクトセグメンテーションを示す図である。オブジェクト検出では、入力画像に含まれるオブジェクトの属性（この例ではテレビ及び人物）が検出される。入力画像に含まれるオブジェクトの属性に加え、入力画像中のオブジェクトの位置や個数が検出されても良い。これにより、例えば、認識対象のオブジェクトの位置を絞り込んだり、認識対象以外のオブジェクトを排除したりしても良い。具体的な用途としては、例えば、カメラにおける顔の検出や、自動運転での歩行者等の検出が考えられる。オブジェクトセグメンテーションでは、オブジェクトに対応する領域の画素がセグメント化（つまり区分け）される。これにより、例えば、自動運転において障害物と道路を分離し、自動車の安全な走行の援助を行ったり、工場における製品の欠陥を検出したり、衛星画像中の地形の識別を行う等の用途が考えられる。

　図４は、マシンタスクの一例として、オブジェクトトラッキング、アクション認識、及びポーズ推定を示す図である。オブジェクトトラッキングでは、識別番号ＩＤが割り当てられたオブジェクトの移動が追跡される。用途としては、例えば、店舗等の施設の利用者数の計数やスポーツ選手の動きの分析といったものが考えられる。更に処理を高速化すれば、リアルタイムにオブジェクトの追跡が可能となり、オートフォーカス等のカメラ処理への応用も可能となる。アクション認識では、オブジェクトの動作の種別（この例では「自転車に乗っている」「歩行している」）が検出される。例えば、防犯カメラに利用することで、強盗や万引き等の犯罪行動の防止及び検出、工場での作業忘れ防止といった用途に適用できる。ポーズ推定では、キーポイント及びジョイントの検出によってオブジェクトの姿勢が検出される。例えば、工場における作業効率の改善等の産業分野や、異常行動の検知といったセキュリティ分野、ヘルスケア及びスポーツといった分野での活用が考えられる。

　図５は、フィルタ処理部１１の構成を簡略化して示す図である。フィルタ処理部１１は、画像復号装置２０側での画像用途に応じて選択可能な、種類が異なる複数のフィルタ４０を有する。種類は、フィルタの形状、サイズ、及び係数値の少なくとも一つを含む。図５の例では、フィルタ処理部１１は、マシンタスク３０Ａ～３０Ｃに対応するフィルタ４０Ａ～４０Ｃと、ヒューマンビジョン３０Ｘに対応するフィルタ４０Ｘとを有する。用途情報Ｄ８が例えばマシンタスク３０Ｂを選択している場合、用途情報Ｄ２はマシンタスク３０Ｂに対応するフィルタ４０Ｂを選択する。この場合、フィルタ処理部１１は、入力画像に対してフィルタ４０Ｂを用いたフィルタ処理を行うことによって第１画像を生成し、第１画像の画像データＤ３Ｂを出力する。

　マシンタスクに対応するフィルタ４０Ａ～４０Ｃは、フィルタ処理によって第１画像の符号量を入力画像の符号量より削減するフィルタである。後述するように、フィルタ４０Ａ～４０Ｃは、マシンタスクにとって重要でない非重要領域の符号量を削減しつつ、マシンタスクにとって重要な特徴を示す重要領域を強調するフィルタであっても良い。マシンタスクに対応するフィルタ４０Ａ～４０Ｃは、ノイズ除去フィルタ、鮮鋭化フィルタ、ビット深度変換フィルタ、色空間変換フィルタ、解像度変換フィルタ、及び、ニューラルネットワークを用いたフィルタの少なくとも一つを含む。ノイズ除去フィルタは、入力画像の細部の情報を削減することによってノイズを除去する、ローパスフィルタ、ガウシアンフィルタ、平滑化フィルタ、平均化フィルタ、バイラテラルフィルタ、及び、メディアンフィルタの少なくとも一つを含む。鮮鋭化フィルタは、エッジ検出フィルタ又はエッジ強調フィルタを含み、具体的には、ラプラシアンフィルタ、ガウシアン・ラプラシアンフィルタ、ソーベルフィルタ、プリウィットフィルタ、又はカニーエッジ検出フィルタを含む。ビット深度変換フィルタは、入力画像と第１画像との間で輝度信号及び／又は色信号のビット深度を変換する。例えば、第１画像の色信号の下位ビットを切り捨てて第１画像のビット深度を入力画像のビット深度より小さく変換することによって、符号量を削減する。色空間変換フィルタは、入力画像と第１画像との間で色空間を変換する。例えば、入力画像におけるＹＵＶ４４４の色空間を、第１画像においてＹＵＶ４２２、ＹＵＶ４２０、又はＹＵＶ４００の色空間に変換することによって、符号量を削減する。解像度変換フィルタは、入力画像と第１画像との間で画像の解像度を変換する。解像度変換フィルタは、第１画像の解像度を入力画像の解像度より削減するダウンサンプリングフィルタを含む。解像度変換フィルタは、第１画像の解像度を入力画像の解像度より増大するアップサンプリングフィルタを含んでも良い。なお、マシンタスクに対応するフィルタ４０Ａ～４０Ｃは、例えば、Ｈ．２６６／ＶＶＣ（Versatile Video Codec）で規定されている、デブロッキングフィルタ、ＡＬＦフィルタ、ＣＣＡＬＦフィルタ、ＳＡＯフィルタ、ＬＭＣＳフィルタ、又はそれらの任意の組合せであっても良い。

　ヒューマンビジョンに対応するフィルタ４０Ｘは、フィルタ処理によって第１画像の符号量を入力画像の符号量より削減しないフィルタである。ヒューマンビジョンに対応するフィルタ４０Ｘは、入力画像をそのまま第１画像として出力するバイパス用のフィルタを含む。フィルタ４０Ｘは、フィルタ処理によって第１画像の符号量を入力画像の符号量より削減するフィルタであっても良いが、符号量の削減効果はフィルタ４０Ａ～４０Ｃよりも抑制される。また、フィルタ４０Ｘは、入力画像の重要領域を強調するフィルタであっても良いが、強調効果はフィルタ４０Ａ～４０Ｃよりも抑制される。

　図６Ａ～６Ｉは、種類が異なる複数のフィルタ４０の例を示す図である。図６Ａは、Ｎ＝５の一次元水平フィルタを示している。Ｎは、フィルタ係数値の数に相当するフィルタのサイズである。図６Ｂは、Ｎ＝７の一次元垂直フィルタを示している。図６Ｃは、Ｎ＝９の二次元十字形フィルタを示している。図６Ｄは、Ｎ＝２５の二次元正方形フィルタを示している。図６Ｅは、Ｎ＝２５の二次元菱形フィルタを示している。図６Ｆ及び図６Ｇは、５×５のガウシアンフィルタを用いたノイズ除去フィルタを示しており、図６Ｆのフィルタはフィルタ強度が比較的強く、図６Ｇのフィルタはフィルタ強度が比較的弱い。図６Ｈは、７×７のガウシアン・ラプラシアンフィルタを用いたエッジ検出フィルタを示している。このように、種類が異なる複数のフィルタ４０は、フィルタの形状が異なっていても良いし、フィルタのサイズが異なっていても良いし、フィルタの係数値が異なっていても良い。図６Ｉは、ニューラルネットワークを用いたフィルタを示している。ニューラルネットワークは、畳み込み層Ｌ１、プーリング層Ｌ２、及び全結合層Ｌ３を有する。入力画像の画像データＤ１に対して畳み込みフィルタＦ１が適用されることによって畳み込み層Ｌ１の画像データが生成され、畳み込み層Ｌ１の画像データに対してプーリングフィルタＦ２が適用されることによってプーリング層Ｌ２の画像データが生成される。全結合層Ｌ３からは予測残差の画像データＤ０が出力され、画像データＤ１と画像データＤ０とが加算されることによって、第１画像の画像データＤ３が出力される。

　図７は、用途情報Ｄ２に基づくフィルタの選択を規定するルックアップテーブルの例を示す図である。当該ルックアップテーブルはフィルタ処理部１１によって保持されている。用途情報Ｄ２で示される画像用途がオブジェクト検出のマシンタスクである場合には、オブジェクトの詳細情報が重要であるため、フィルタ処理部１１は、弱いノイズ除去フィルタ及び弱い鮮鋭化フィルタを選択する。用途情報Ｄ２で示される画像用途がオブジェクトセグメンテーションのマシンタスクである場合には、画素レベルの予測を行うオブジェクトセグメンテーションモデル（Ｍａｓｋ　Ｒ－ＣＮＮ）では画像の詳細が重要であるため、フィルタ処理部１１は、弱いノイズ除去フィルタを選択する。用途情報Ｄ２で示される画像用途がオブジェクトトラッキングのマシンタスクである場合には、オブジェクトの詳細情報は重要でないため、フィルタ処理部１１は、強いノイズ除去フィルタ及び弱い鮮鋭化フィルタを選択する。用途情報Ｄ２で示される画像用途がアクション認識のマシンタスクである場合には、フィルタ処理部１１は、背景等の静的コンテンツの冗長情報を除去しつつオブジェクトのエッジ等の動的コンテンツを強調すべく、強いノイズ除去フィルタ及び強い鮮鋭化フィルタを選択する。用途情報Ｄ２で示される画像用途がポーズ推定のマシンタスクである場合には、耳又は目等の人間のキーポイントを検出すべくポーズ推定モデル（ＨＲＮｅｔ）が高解像度の画像を学習するため、フィルタ処理部１１は、強い鮮鋭化フィルタを選択することによって画像の細部を強調する。

　一例として、フィルタ処理部１１は、オブジェクトトラッキングのマシンタスクでは強いノイズ除去フィルタを選択し、オブジェクト検出のマシンタスクでは弱いノイズ除去フィルタを選択する。オブジェクト検出は画像中の対象オブジェクトを検出する処理であり、オブジェクトトラッキングは映像中の連続フレームにおけるオブジェクトの軌跡を追跡する処理である。この場合、オブジェクトトラッキングではオブジェクトのエッジ及び形状が不可欠となり、オブジェクト検出ではオブジェクトの詳細情報が不可欠となる。そこで、オブジェクトトラッキングでは強いノイズ除去フィルタを適用して詳細情報を除去し、オブジェクト検出では弱いノイズ除去フィルタを適用して不要な情報のみを除去する。

　他の例では、フィルタ処理部１１は、オブジェクトトラッキングのマシンタスクでは大きなサイズのノイズ除去フィルタを選択し、オブジェクト検出のマシンタスクでは小さなサイズのノイズ除去フィルタを選択する。小さなサイズのノイズ除去フィルタは周波数成分に対しての制御性能が低いため広い範囲の周波数成分のノイズが除去され、大きなサイズのノイズ除去フィルタは周波数成分に対しての制御性能が高いため特定の範囲の周波数成分のノイズを除去できる。あるケースでは、小さなサイズのフィルタは大きなサイズのフィルタよりも符号量の削減効果が小さく、別のケースでは、小さなサイズのフィルタは大きなサイズのフィルタよりも符号量の削減効果が大きい。

　他の例では、フィルタ処理部１１は、オブジェクトトラッキングのマシンタスクでは、出力のカラーレンジが広い、大きいビット深度のフィルタを選択し、オブジェクト検出のマシンタスクでは、出力のカラーレンジが狭い、小さいビット深度のフィルタを選択する。小さいビット深度のフィルタを適用することにより、符号量の削減効果を高めることができる。

　他の例では、フィルタ処理部１１は、オブジェクトトラッキングのマシンタスクとオブジェクト検出のマシンタスクとで、異なる色空間フィルタを選択する。

　他の例では、フィルタ処理部１１は、オブジェクトトラッキングのマシンタスクでは、出力の解像度が大きい、小さいスケールファクタのダウンサンプリングフィルタを選択し、オブジェクト検出のマシンタスクでは、出力の解像度が小さい、大きいスケールファクタのダウンサンプリングフィルタを選択する。

　図５に示した各フィルタ４０は、一つのフィルタで構成されても良いし、複数のフィルタで構成されても良いし、少なくとも一つのフィルタと少なくとも一つの画像処理部とによって構成されても良い。

　図８は、フィルタ４０の第１の構成例を示す図である。フィルタ４０は、一つのフィルタ５１によって構成されている。フィルタ５１は例えばガウシアンフィルタである。フィルタ５１は、画像データＤ１に対してガウシアンフィルタを適用することによって、ノイズが除去された画像データＤ３を出力する。

　図９は、フィルタ４０の第２の構成例を示す図である。フィルタ４０は、二つのフィルタ５２，５３と二つの画像処理部６１，６２と加算処理部６３とによって構成されている。フィルタ５２は例えばガウシアン・ラプラシアンフィルタであり、フィルタ５３は例えばガウシアンフィルタであり、画像処理部６１は例えばエッジ抽出処理部であり、画像処理部６２は例えば背景抽出処理部である。フィルタ５２は、入力画像の画像データＤ１に対してガウシアン・ラプラシアンフィルタを適用することによって、画像内におけるエッジの場所を示すエッジマップを出力する。フィルタ５３は、入力画像の画像データＤ１に対してガウシアンフィルタを適用することによって、ノイズが除去された画像データを出力する。画像処理部６１は、画像データＤ１とエッジマップとに基づいて入力画像からエッジを抽出することにより、エッジ画像を出力する。画像処理部６２は、ノイズが除去された画像データとエッジマップとに基づいて入力画像から背景を抽出することにより、背景画像を出力する。加算処理部６３は、エッジ画像と背景画像とを加算することによって、第１画像の画像データＤ３を出力する。図９の例において、フィルタ処理部１１は、マシンタスクにとって重要でない非重要領域として背景領域を入力画像内に規定し、背景領域の細部（つまり高周波数域）の情報をフィルタ５３によって削除することによって、第１画像の符号量を入力画像の符号量より削減する。

　図１０は、フィルタ４０の第３の構成例を示す図である。フィルタ４０は、二つのフィルタ５４，５５と一つの画像処理部６４と加算処理部６５とによって構成されている。フィルタ５４は例えばニューラルネットワークを用いた顔検出フィルタであり、フィルタ５５は例えば平均化フィルタであり、画像処理部６４は例えば領域分割処理部である。フィルタ５４は、入力画像の画像データＤ１に含まれる人物の顔を検出し、顔の位置座標を規定する顔のバウンディングボックスを出力する。画像処理部６４は、画像データＤ１と顔のバウンディングボックスとに基づいて、入力画像を顔以外の領域と顔の領域とに分離する。フィルタ５５は、顔の領域に対して平均化を行うことによって、ぼかした顔の画像を出力する。加算処理部６５は、顔以外の領域の画像とぼかした顔の画像とを加算することによって、第１画像の画像データＤ３を出力する。例えばオブジェクトトラッキングのマシンタスクにおいては顔の詳細は重要でないため、顔をぼかすことによって、符号量を削減できるとともにプライバシを保護することができる。図１０の例において、フィルタ処理部１１は、マシンタスクにとって重要でない非重要領域として顔の領域を入力画像内に規定し、顔の領域の細部（つまり高周波数域）の情報をフィルタ５５によって削除することによって、第１画像の符号量を入力画像の符号量より削減する。

　図１１は、フィルタ４０の第４の構成例を示す図である。フィルタ４０は、三つのフィルタ５６～５８と一つの画像処理部６６と加算処理部６７とによって構成されている。フィルタ５６は例えばニューラルネットワークを用いた前景検出フィルタであり、フィルタ５７は例えば鮮鋭化フィルタであり、フィルタ５８は例えばノイズ除去フィルタであり、画像処理部６６は例えば領域分割処理部である。フィルタ５６は、入力画像の画像データＤ１に含まれる重要な被写体に相当する前景を検出し、前景の位置座標を規定する前景のバウンディングボックスを出力する。画像処理部６６は、画像データＤ１と前景のバウンディングボックスとに基づいて、入力画像を前景領域とそれ以外の背景領域とに分離する。フィルタ５７は、前景領域に対して鮮鋭化を行うことによって、エッジ強調等によって鮮鋭化された前景画像を出力する。フィルタ５８は、背景領域に対してノイズ除去処理を行うことによって、ノイズが除去された背景画像を出力する。加算処理部６７は、鮮鋭化された前景画像とノイズが除去された背景画像とを加算することによって、第１画像の画像データＤ３を出力する。図１１の例において、フィルタ処理部１１は、マシンタスクにとって重要でない非重要領域として背景領域を入力画像内に規定し、背景領域の細部（つまり高周波数域）の情報をフィルタ５８によって削除することによって、第１画像の符号量を入力画像の符号量より削減する。また、図１１の例において、フィルタ処理部１１は、マシンタスクにとって重要な特徴を示す重要領域として前景領域を入力画像内に規定し、前景領域をフィルタ５７によって強調することによって、アクション認識又はポーズ推定等のマシンタスクの精度を向上させる。

　図１２は、ビットストリームＤ４のデータ構造の第１の例を示す図である。ビットストリームＤ４は、管理情報等が格納されるヘッダＨと、画像データが格納されるペイロードＰとを有する。符号化処理部１２は、マシンタスクに応じて画像符号化装置１０が入力画像に適用したフィルタを示すフィルタ情報Ｄ６の符号化データ７０を、ペイロードＰの所定の箇所に格納する。

　図１３は、ビットストリームＤ４のデータ構造の第２の例を示す図である。図１２と同様に、ビットストリームＤ４はヘッダＨとペイロードＰとを有する。符号化処理部１２は、フィルタ情報Ｄ６の符号化データ７０を、ヘッダＨの所定の箇所に格納する。所定の箇所は、例えば、付加情報を格納するためのＳＥＩ（Supplemental Enhancement Information）領域である。所定の箇所は、ＶＰＳ、ＳＰＳ、ＰＰＳ、ＰＨ、ＳＨ、ＡＰＳ、又はタイルヘッダ等であっても良い。

　図１４は、フィルタ情報Ｄ６に関するＳＥＩメッセージシンタックスの第１の例を示す図である。

　prefilter_type_idcは、例えば３ビットのフラグ情報によってフィルタのタイプを指定し、例えば、その値が「０」の場合はノイズ除去フィルタを、「１」の場合は鮮鋭化フィルタを、「２」の場合はビット深度変換フィルタを、「３」の場合は色空間変換フィルタを、「４」の場合は解像度変換フィルタを、「５」の場合はその他のフィルタを表す。

　filter_strength_level_idcは、例えば３ビットのフラグ情報によってフィルタの強度を指定し、その値が「０」の場合は最弱のフィルタ強度を表し、その値が大きいほど強いフィルタ強度を表す。フィルタ強度の最大値は「７」又は任意の整数である。

　input_bit_depth_minus8は、例えば３ビットのフラグ情報によってフィルタ処理を適用する前の入力画像のビット深度を指定し、入力画像のビット深度は「８」「１０」「１２」又は任意の整数である。

　input_color_format_idcは、例えば３ビットのフラグ情報によってフィルタ処理を適用する前の入力画像の色空間を指定する。指定可能な色空間は、モノクロ、ＹＵＶ４４４、ＹＵＶ４２２、ＹＵＶ４２０、ＹＵＶ４００、又は任意の色空間である。

　scale_factorは、入力画像の解像度と第１画像の解像度との比を指定する。例えば、入力画像の解像度が１９２０×１０８０であり、第１画像の解像度が９６０×５４０である場合は、縦方向及び横方向の解像度が１／２となるため、scale_factor_nominatorは「１」となり、scale_factor_denominatorは「２」となる。scale_factor_nominator及びscale_factor_denominatorはそれぞれ例えば３ビットのフラグ情報であり、任意の整数を指定可能である。

　図１５は、フィルタ情報Ｄ６に関するＳＥＩメッセージシンタックスの第２の例を示す図である。

　prefilter_hint_size_yは、フィルタ係数又は相関配列の垂直方向のサイズを指定し、例えば「１」から「１５」までの任意の整数である。

　prefilter_hint_size_xは、フィルタ係数又は相関配列の水平方向のサイズを指定し、例えば「１」から「１５」までの任意の整数である。

　prefilter_hint_typeは、例えば２ビットのフラグ情報によってフィルタのタイプを指定し、例えば、その値が「０」の場合は二次元ＦＩＲフィルタを、「１」の場合は二つの一次元ＦＩＲフィルタを、「２」の場合は相互相関行列を表す。

　prefilter_hint_valueは、フィルタ係数又は相互相関行列の要素を指定する。

　図１６は、マシンタスクを実行する際に使用されるパラメータ値として、設定部２２がＩＯＵに関するしきい値を設定する場合の例を説明するための図である。ＩＯＵは、オブジェクトの検出において、予測されたバウンディングボックスと真のバウンディングボックスとの重なりの程度を表現するために使用される値である。図１６において、予測されたバウンディングボックスを破線で示し、真のバウンディングボックスを一点鎖線で示している。少なくとも一方のバウンディングボックスを含む領域の面積（分母）に対する、双方のバウンディングボックスを含む領域の面積（分子）の割合として、ＩＯＵが算出される。ＩＯＵに関するしきい値が「１」近くに設定された場合には、双方のバウンディングボックスがほぼ重なった場合にのみ検出結果が「真」となり、ＩＯＵに関するしきい値が「０」近くに設定された場合には、双方のバウンディングボックスがわずかに重なっている場合でも検出結果が「真」となる。設定部２２は、ビットストリームＤ４からフィルタ情報Ｄ６を抽出し、当該フィルタ情報Ｄ６に基づいてＩＯＵに関するしきい値を設定し、その設定情報Ｄ７をタスク処理部２３に入力する。タスク処理部２３は、設定情報Ｄ７で示されるＩＯＵに関するしきい値を用いてマシンタスクを実行する。

　図１７は、画像符号化装置１０が実行する処理の流れを示すフローチャートである。

　まずステップＳＰ１０１においてフィルタ処理部１１は、用途情報Ｄ２に基づいて複数のフィルタから一のフィルタを選択する。

　次にステップＳＰ１０２においてフィルタ処理部１１は、ステップＳＰ１０１で選択したフィルタを入力画像に適用してフィルタ処理を実行することによって、第１画像を生成する。

　次にステップＳＰ１０３において符号化処理部１２は、第１画像に対して符号化処理を行うことによってビットストリームを生成する。その際、符号化処理部１２は、フィルタ処理部１１が入力画像に適用したフィルタを示すフィルタ情報Ｄ６を符号化し、フィルタ情報Ｄ６の符号化データ７０をビットストリームＤ４内に格納する。符号化処理部１２は、生成したビットストリームＤ４を、ネットワークＮｗを介して画像復号装置２０に送信する。

　図１８は、画像復号装置２０が実行する処理の流れを示すフローチャートである。

　まずステップＳＰ２０１において復号処理部２１は、ビットストリームＤ４を画像符号化装置１０からネットワークＮｗを介して受信し、当該ビットストリームＤ４を復号することによって復号画像を生成する。

　次にステップＳＰ２０２において設定部２２は、復号されたビットストリームＤ４からフィルタ情報Ｄ６を抽出し、当該フィルタ情報Ｄ６に基づいて、タスク処理部２３がマシンタスクを実行する際に使用するパラメータ値を設定する。

　次にステップＳＰ２０３においてタスク処理部２３は、ステップＳＰ２０１で復号された復号画像とステップＳＰ２０２で設定されたパラメータ値とを用いてマシンタスクを実行し、推論結果等の結果データＤ９を出力する。

　本実施形態によれば、フィルタ処理部１１は、種類が異なる複数のフィルタを有し、画像復号装置２０側での画像用途を示す用途情報に基づいて、複数のフィルタから一のフィルタを選択して入力画像に適用する。その結果、画像符号化装置１０から画像復号装置２０へのビットストリームＤ４の伝送においてビット効率を向上することが可能となる。

　また、本実施形態によれば、フィルタ処理部１１は、画像復号装置２０側での画像用途に応じて適切なフィルタを入力画像に適用することが可能となる。

　また、本実施形態によれば、ノイズ除去フィルタとして、ローパスフィルタ、ガウシアンフィルタ、平滑化フィルタ、平均化フィルタ、バイラテラルフィルタ、及び、メディアンフィルタの少なくとも一つを入力画像に適用することにより、入力画像のノイズを除去することができる。

　また、本実施形態によれば、ダウンサンプリングフィルタを入力画像に適用することにより、符号量を削減することが可能となる。

　また、本実施形態によれば、画像用途がマシンタスクである場合には符号量を削減するフィルタを適用し、画像用途がヒューマンビジョンである場合にはマシンタスクの場合より符号量を削減しないフィルタを適用するという選択が可能となる。

　また、本実施形態によれば、画像用途がマシンタスクである場合には符号量を削減するフィルタを適用することにより、画像符号化装置１０から画像復号装置２０へのビットストリームＤ４の伝送においてビット効率を向上することが可能となる。

　また、本実施形態によれば、非重要領域の細部情報の削除によって第１画像の符号量を削減することにより、マシンタスクにとって重要である重要領域の符号量を削減する必要がないため、画像復号装置２０側でマシンタスクを適切に実行することが可能となる。

　また、本実施形態によれば、フィルタ処理部１１はフィルタ処理によって重要領域を強調するため、画像復号装置２０側でマシンタスクを適切に実行することが可能となる。

　また、本実施形態によれば、画像用途がヒューマンビジョンである場合にはマシンタスクの場合より符号量を削減しないフィルタを適用することにより、画像復号装置２０側でヒューマンビジョンを適切に実行することが可能となる。

　また、本実施形態によれば、入力画像に適用したフィルタに関するフィルタ情報Ｄ６をビットストリームＤ４内に格納することにより、画像復号装置２０側でのマシンタスクにおいてフィルタ情報Ｄ６を活用することが可能となる。

　また、本実施形態によれば、フィルタ情報Ｄ６をビットストリームＤ４のヘッダＨ内に格納することにより、画像復号装置２０はフィルタ情報Ｄ６をビットストリームＤ４から容易に抽出することが可能となる。

　また、本実施形態によれば、フィルタ情報Ｄ６をＳＥＩ領域内に格納することにより、フィルタ情報Ｄ６を付加情報として簡易に取り扱うことが可能となる。

　また、本実施形態によれば、設定部２２は、ビットストリームＤ４からフィルタ情報Ｄ６を抽出し、当該フィルタ情報Ｄ６に基づいて、タスク処理部２３がマシンタスクを実行する際に使用するパラメータ値を設定する。その結果、画像符号化装置１０が入力画像に適用したフィルタに応じて、タスク処理部２３によって適切なタスク処理を実行することが可能となる。

　本開示は、画像を送信する画像符号化装置と画像を受信する画像復号装置とを備える画像処理システムへの適用が特に有用である。

Claims

　入力画像に対してフィルタ処理を行うことによって第１画像を生成するフィルタ処理部と、
　前記第１画像に対して符号化処理を行うことによってビットストリームを生成し、当該ビットストリームを画像復号装置に送信する符号化処理部と、
を備え、
　前記フィルタ処理部は、
　種類が異なる複数のフィルタを有し、
　前記画像復号装置側での画像用途を示す用途情報に基づいて、前記複数のフィルタから一のフィルタを選択して前記入力画像に適用する、画像符号化装置。
　前記複数のフィルタは、ノイズ除去フィルタ、鮮鋭化フィルタ、ビット深度変換フィルタ、色空間変換フィルタ、解像度変換フィルタ、及び、ニューラルネットワークを用いたフィルタの少なくとも一つを含む、請求項１に記載の画像符号化装置。
　前記ノイズ除去フィルタは、ローパスフィルタ、ガウシアンフィルタ、平滑化フィルタ、平均化フィルタ、バイラテラルフィルタ、及び、メディアンフィルタの少なくとも一つを含む、請求項２に記載の画像符号化装置。
　前記解像度変換フィルタは、前記第１画像の解像度を前記入力画像の解像度より削減するダウンサンプリングフィルタを含む、請求項２に記載の画像符号化装置。
　前記画像用途は、少なくとも一つのマシンタスクと、ヒューマンビジョンとを含む、請求項１に記載の画像符号化装置。
　前記画像用途が前記マシンタスクである場合、前記フィルタ処理部は、前記フィルタ処理によって前記第１画像の符号量を前記入力画像の符号量より削減する、請求項５に記載の画像符号化装置。
　前記フィルタ処理部は、
　前記マシンタスクにとって重要でない非重要領域を前記入力画像内に規定し、
　前記非重要領域の細部の情報を削除することによって、前記第１画像の符号量を前記入力画像の符号量より削減する、請求項６に記載の画像符号化装置。
　前記フィルタ処理部は、
　前記マシンタスクにとって重要である重要領域を前記入力画像内に規定し、
　前記フィルタ処理によって前記重要領域を強調する、請求項６に記載の画像符号化装置。
　前記画像用途が前記ヒューマンビジョンである場合、前記フィルタ処理部は、前記画像用途が前記マシンタスクである場合と比較して、前記フィルタ処理によって前記第１画像の符号量を削減しない、請求項５に記載の画像符号化装置。
　前記符号化処理部は、前記フィルタ処理部が前記入力画像に適用した前記フィルタに関するフィルタ情報を、前記ビットストリーム内に格納する、請求項１に記載の画像符号化装置。
　前記符号化処理部は、前記フィルタ情報を前記ビットストリームのヘッダ内に格納する、請求項１０に記載の画像符号化装置。
　前記ヘッダはＳＥＩ（Supplemental Enhancement Information）領域を有し、
　前記符号化処理部は、前記フィルタ情報を前記ＳＥＩ領域内に格納する、請求項１１に記載の画像符号化装置。
　符号化された画像を含むビットストリームを画像符号化装置から受信し、当該ビットストリームを復号することによって復号画像を生成する復号処理部と、
　前記復号画像に基づいてマシンタスクを実行するタスク処理部と、
　　前記ビットストリームは、前記マシンタスクに応じて前記画像符号化装置が入力画像に適用したフィルタに関するフィルタ情報をさらに含み、
　前記ビットストリームから前記フィルタ情報を抽出し、当該フィルタ情報に基づいて、前記タスク処理部が前記マシンタスクを実行する際に使用するパラメータ値を設定する設定部と、
を備える、画像復号装置。
　画像符号化装置が、
　入力画像に対してフィルタ処理を行うことによって第１画像を生成し、
　前記第１画像に対して符号化処理を行うことによってビットストリームを生成し、当該ビットストリームを画像復号装置に送信し、
　前記フィルタ処理において、前記画像復号装置側での画像用途を示す用途情報に基づいて、種類が異なる複数のフィルタから一のフィルタを選択して前記入力画像に適用する、画像符号化方法。
　画像復号装置が、
　符号化された画像を含むビットストリームを画像符号化装置から受信し、当該ビットストリームを復号することによって復号画像を生成し、
　前記復号画像に基づいてマシンタスクを実行し、
　　前記ビットストリームは、前記マシンタスクに応じて前記画像符号化装置が入力画像に適用したフィルタに関するフィルタ情報をさらに含み、
　前記ビットストリームから前記フィルタ情報を抽出し、当該フィルタ情報に基づいて、前記マシンタスクを実行する際に使用するパラメータ値を設定する、画像復号方法。