JP4973729B2 - 動画像類似判定装置、および動画像類似判定方法 - Google Patents

動画像類似判定装置、および動画像類似判定方法 Download PDF

Info

Publication number
JP4973729B2
JP4973729B2 JP2009517664A JP2009517664A JP4973729B2 JP 4973729 B2 JP4973729 B2 JP 4973729B2 JP 2009517664 A JP2009517664 A JP 2009517664A JP 2009517664 A JP2009517664 A JP 2009517664A JP 4973729 B2 JP4973729 B2 JP 4973729B2
Authority
JP
Japan
Prior art keywords
moving image
frame
similarity determination
data
quantization step
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009517664A
Other languages
English (en)
Other versions
JPWO2008149448A1 (ja
Inventor
厚子 多田
崇 浜野
竜太 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2008149448A1 publication Critical patent/JPWO2008149448A1/ja
Application granted granted Critical
Publication of JP4973729B2 publication Critical patent/JP4973729B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本発明は、動画像類似判定装置、符号化装置、および特徴量算出方法に関し、特に、動画データの特徴量を容易に算出し、特徴量の比較による動画像の類似判定を効率良く短時間で実行することができる動画像類似判定装置、符号化装置、および特徴量算出方法に関する。
一般に、コンピュータなどで視聴可能な動画データは、例えばMPEG(Moving Picture Experts Group)と呼ばれる方式などで符号化・圧縮されている。MPEG方式においては、動画像を構成する個々の画像を離散コサイン変換(Discrete Cosine Transform:以下「DCT変換」という)し、得られたDCT係数を量子化することによって符号化された動画データが得られる。
具体的には、図8に示すように、符号化装置によって、動画像を構成する個々の画像が順次DCT変換されることにより、左上部分に低周波成分が集められ、右下部分に高周波成分が集められたDCT係数の画像が生成される。このDCT係数の画像は、動画像を構成する個々の画像に対応しており、各画素に各周波数成分のDCT係数を格納している。
そして、DCT係数の画像は、量子化マトリクスおよび所定の量子化ステップから求められる量子化係数によって量子化され、動画データが得られる。こうして得られる動画データにおいては、高周波成分を格納する画素の大部分が0となるため、動画データの情報量は元の動画像より少なくなり、情報量の削減が可能となっている。
また、このように画像全体が符号化されるのは、元の動画像を構成する画像のうち一部の画像のみであり、符号化された結果はIフレームと呼ばれるフレームになる。そして、Iフレーム以外のPフレームおよびBフレームは、Iフレームとの差分が符号化されたフレームである。したがって、PフレームやBフレームにおいては、Iフレームからの動きがない画素が0となり、最終的に得られる動画データ全体としては、元の動画像から大幅に情報量の削減をすることができる。
ところで、例えば特許文献1などには、上記のように符号化された2つの動画データを比較して、両者が互いに類似しているか否かを判定する技術が開示されている。特許文献1においては、動画データを部分的に復号化して、画素ごとの平均輝度、色情報、またはDCT係数などの特徴量を時系列で蓄積し、2つの動画データに関するこれらの特徴量が比較されることにより、2つの動画データが類似しているか否かが判定される。
特開2006−18831号公報
しかしながら、2つの動画データが類似しているか否かを判定する際に、それぞれの動画データから画素ごとの特徴量を取得するのは処理負荷が大きく、効率的ではないという問題がある。具体的には、上述した特許文献1に記載された方法を用いて動画データの類似判定を行う際には、まず、量子化マトリクスと量子化ステップから量子化係数を求める必要がある。そして、求められた量子化係数によって、動画データを逆量子化してDCT係数を得る。こうして得られるDCT係数は、画素ごとの特徴量であり、特許文献1に記載の技術では、DCT係数を時系列で蓄積し、2つの動画データについて比較するため、類似判定に要する処理量が多くなり、多大な時間を要してしまう。
特に、MPEGにおいては、1つのIフレームがマクロブロックと呼ばれる複数の部分からなっており、それぞれのマクロブロックが異なる量子化ステップで量子化されるため、マクロブロックごとに個別に量子化係数を求めなくてはならない。そして、それぞれのマクロブロックごとに量子化係数を用いた逆量子化を行って、特徴量のDCT係数を算出する必要がある。このため、たとえ一部のマクロブロックのみに関して比較を行う場合でも、量子化係数の算出やDCT係数の算出の処理量は多く、短時間での類似判定は困難である。
加えて、近年では、例えばユーザがインターネットに動画データを投稿するサイトなどが開設されており、動画データの利用が活発化している。一方、このようなサイトに著作権で保護されるべき動画データが投稿されるなど、動画像の不正な使用も頻発している。そこで、短時間で多くの動画像が類似しているか否かを判定し、不正な動画像の公開を未然に防止することが強く望まれている。
本発明はかかる点に鑑みてなされたものであり、動画データの特徴量を容易に算出し、特徴量の比較による動画像の類似判定を効率良く短時間で実行することができる動画像類似判定装置、符号化装置、および特徴量算出方法を提供することを目的とする。
上記課題を解決するために、本発明は、各々複数の画像から構成される2つの動画像が類似しているか否かを判定する動画像類似判定装置であって、動画像が符号化されて得られる動画データに含まれ、動画像を構成する個々の画像に対応するフレームを取得する取得手段と、前記取得手段によって取得されたフレームのデータ量および符号化時に適用された量子化ステップに基づいてフレームの元となる画像の複雑さを示す特徴量を算出する算出手段と、前記算出手段によって算出された画像ごとの特徴量を蓄積する蓄積手段と、前記蓄積手段によって蓄積された特徴量を比較することにより2つの動画像が類似しているか否かを判定する判定手段とを有する構成を採る。
この構成によれば、フレームのデータ量と量子化ステップから画像の特徴量を算出するため、特徴量を算出する際に動画データの画素ごとの演算をする必要がなく、動画データの特徴量を容易に算出し、特徴量の比較による動画像の類似判定を効率良く短時間で実行することができる。
また、本発明は、上記構成において、前記算出手段は、前記取得手段によって取得されたフレームのデータ量を取得するデータ量取得手段と、前記取得手段によって取得されたフレームの符号化時に適用された量子化ステップを取得する量子化ステップ取得手段と、前記データ量取得手段によって取得されたデータ量と前記量子化ステップ取得手段によって取得された量子化ステップとを乗算する乗算手段とを含む構成を採る。
この構成によれば、フレームのデータ量と量子化ステップを乗算して特徴量を算出するため、一方を固定した場合に、画像が複雑になるほど他方が大きくなるデータ量と量子化ステップの2つの値から、画像が複雑になるほど大きくなる特徴量を算出することができる。
また、本発明は、上記構成において、前記データ量取得手段は、前記取得手段によって取得されたフレームのヘッダ情報から当該フレームのデータ量の情報を取得する構成を採る。
この構成によれば、フレームのヘッダ情報からデータ量の情報を取得するため、ピクチャ層のヘッダから特徴量の算出に必要な情報を得ることができ、短時間で特徴量を算出することができる。
また、本発明は、上記構成において、前記量子化ステップ取得手段は、前記取得手段によって取得されたフレームを構成する複数のマクロブロックからマクロブロックごとに異なる量子化ステップを取得し、前記乗算手段は、前記データ量取得手段によって取得されたデータ量と前記量子化ステップ取得手段によって取得されたマクロブロックごとの量子化ステップの平均値とを乗算する構成を採る。
この構成によれば、マクロブロックごとの量子化ステップの平均値を用いて特徴量を算出するため、1フレーム内の複数のマクロブロックの量子化ステップが異なる場合でも、フレームに対応する個々の画像の特徴量を算出することができる。
また、本発明は、上記構成において、前記量子化ステップ取得手段は、マクロブロックごとのヘッダ情報から各マクロブロックの量子化ステップの情報を取得する構成を採る。
この構成によれば、マクロブロックのヘッダ情報から量子化ステップの情報を取得するため、マクロブロック層のヘッダから特徴量の算出に必要な情報を得ることができ、短時間で特徴量を算出することができる。
また、本発明は、上記構成において、前記判定手段は、前記蓄積手段によって蓄積された特徴量と比較対象の動画像の特徴量との差分が所定の閾値未満である場合に、2つの動画像が類似していると判定する構成を採る。
この構成によれば、画像の複雑さを示す特徴量が同程度である場合に2つの動画像が類似していると判定するため、2つの動画像の特徴量が算出された後は、容易な処理で類似判定を実行することができる。
また、本発明は、上記構成において、前記判定手段は、前記蓄積手段によって蓄積された特徴量から算出される統計量と比較対象の動画像の特徴量から算出される統計量とを比較して、2つの動画像が類似しているか否かを判定する構成を採る。
この構成によれば、特徴量から算出される統計量の比較により類似判定処理を行うため、例えば特徴量の時系列変化における平均値、最小値、最大値、および標準偏差の一部または全部を比較する容易な処理で類似判定を実行することができる。
また、本発明は、動画像を符号化して動画データを生成する符号化装置であって、動画像を構成する画像であって複数の画素が二次元配列されて構成される画像を離散コサイン変換する変換手段と、前記変換手段によって離散コサイン変換されて得られた係数の画像を量子化する量子化手段と、前記量子化手段による量子化によって得られるフレームのデータ量および量子化時に適用された量子化ステップに基づいて画像の複雑さを示す特徴量を算出する算出手段と、前記算出手段によって算出された画像ごとの特徴量を蓄積する蓄積手段とを有する構成を採る。
この構成によれば、動画像の符号化時に得られるフレームのデータ量と量子化ステップから画像の特徴量を算出して蓄積するため、蓄積された特徴量を他の動画データの特徴量との類似判定などの際に用いて、処理の効率を向上させることができる。
また、本発明は、複数の画像から構成される動画像の特徴量を算出する特徴量算出方法であって、動画像が符号化されて得られる動画データに含まれ、動画像を構成する個々の画像に対応するフレームのデータ量を取得する第1取得工程と、前記フレームの符号化時に適用された量子化ステップを取得する第2取得工程と、前記第1取得工程にて取得されたデータ量および前記第2取得工程にて取得された量子化ステップに基づいてフレームの元となる画像の複雑さを示す特徴量を算出する算出工程とを有するようにした。
この方法によれば、フレームのデータ量と量子化ステップから画像の特徴量を算出するため、特徴量を算出する際に動画データの画素ごとの演算をする必要がなく、動画データの特徴量を容易に算出し、特徴量の比較による動画像の類似判定を効率良く短時間で実行することができる。
本発明によれば、動画データの特徴量を容易に算出し、特徴量の比較による動画像の類似判定を効率良く短時間で実行することができる。
図1は、実施の形態1に係る類似判定装置の要部構成を示すブロック図である。 図2は、実施の形態1に係る動画データの階層構造を示す図である。 図3は、実施の形態1に係る類似判定装置の動作を示すフロー図である。 図4は、実施の形態1に係る特徴量の時系列変化の例を示す図である。 図5は、実施の形態1に係る類似判定処理を示すフロー図である。 図6は、実施の形態1に係る類似判定処理の具体例を示す図である。 図7は、実施の形態2に係る符号化装置の要部構成を示すブロック図である。 図8は、MPEGによる動画像の符号化を模式的に示す図である。
符号の説明
100 類似判定装置
110 Iフレーム抽出部
120 特徴量算出部
121 データ量取得部
122 量子化ステップ取得部
123 乗算部
130 特徴量蓄積部
140 類似判定部
300 符号化装置
310 DCT変換部
320 量子化部
本発明の骨子は、動画データのフレームごとのデータ量とフレームの量子化に用いられた量子化ステップとから元の画像の複雑さを示す特徴量を算出し、この特徴量を比較して動画像の類似判定を行うことである。以下、本発明の実施の形態について、図面を参照して詳細に説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係る類似判定装置100の要部構成を示すブロック図である。図1に示す類似判定装置100は、Iフレーム抽出部110、特徴量算出部120、特徴量蓄積部130、および類似判定部140を有している。
Iフレーム抽出部110は、類似しているか否かを判定する判定対象の動画データが入力されると、入力された動画データから1つの画像全体が符号化されて得られたIフレームを抽出する。すなわち、Iフレーム抽出部110は、動画データに含まれるIフレーム、Pフレーム、およびBフレームのうちPフレームおよびBフレームを無視して、類似判定に用いるIフレームのみを抽出する。Iフレームは、画像全体が符号化されて得られたものであるため、1つのフレーム単独で画像の特徴を最も良く表している。
特徴量算出部120は、Iフレームに関する情報から動画データの特徴量を算出する。このとき、特徴量算出部120は、例えば逆量子化などの画素ごとの係数を算出する演算を行わず、動画データを構成する各階層のヘッダ情報などを用いて元の画像の複雑さを示す特徴量を算出する。具体的には、特徴量算出部120は、データ量取得部121、量子化ステップ取得部122、および乗算部123を有している。
データ量取得部121は、Iフレームのヘッダ情報からIフレームのデータ量を取得する。後述するように、動画データは、複数の階層を有する階層構造を採っており、それぞれの階層においてヘッダ情報が付加されている。そして、データ量取得部121は、ピクチャ層に属するIフレームのヘッダ情報からデータ量を取得する。なお、画像の量子化に関する条件が一定であれば、元の画像が複雑であればあるほど符号化後のフレームのデータ量は増加する。
量子化ステップ取得部122は、Iフレームを構成するマクロブロックのヘッダ情報からマクロブロックごとの量子化ステップを取得する。そして、量子化ステップ取得部122は、マクロブロックごとの量子化ステップの平均値を算出し、乗算部123へ出力する。すなわち、量子化ステップ取得部122は、マクロブロック層のヘッダ情報から各マクロブロックの符号化に用いられた量子化ステップの平均値を求める。なお、マクロブロックのデータ量が一定であれば、元の画像が複雑であればあるほど粗い量子化が行われていることになり、量子化ステップが大きい。
乗算部123は、Iフレームのデータ量とマクロブロックごとの量子化ステップの平均値とを乗算して、Iフレームの特徴量を算出する。既に述べたように、データ量と量子化ステップは、一方を固定すると複雑な画像ほど他方が大きくなる値であるため、これらを乗算して得られる特徴量が大きいほど、Iフレームの元になっている画像が複雑であるといえる。
特徴量蓄積部130は、特徴量算出部120によって算出されたIフレームごとの特徴量にこのIフレームの時刻情報を対応付けて蓄積する。Iフレームの時刻情報は、例えば動画データの開始時刻から当該Iフレームまでの経過時間を示している。
また、特徴量蓄積部130は、比較対象となる動画データ(以下「比較データ」という)におけるIフレームごとの特徴量と時刻情報をあらかじめ記憶している。比較データの特徴量は、他装置における符号化時に算出されたものが特徴量蓄積部130に記憶されていても良く、動画データと同様に特徴量算出部120によって算出されたものがあらかじめ特徴量蓄積部130に記憶されていても良い。
類似判定部140は、動画データの特徴量と比較データの特徴量とを比較し、両者の元の動画像が類似しているか否かを判定する。具体的には、類似判定部140は、動画データの特徴量の時系列変化と比較データの特徴量の時系列変化とを比較し、所定の範囲内のすべての時刻のフレームにおいて特徴量の差が所定の閾値未満であるか否かを判定する。そして、類似判定部140は、すべての時刻のフレームにおいて特徴量の差が所定の閾値未満である場合に、動画データと比較データの元の動画像が類似していると判定し、特徴量の差が所定の閾値以上であるフレームが1つでもある場合に、動画データと比較データの元の動画像が類似していないと判定する。
ここで、本実施の形態に係る動画データの階層構造について、図2を参照しながら説明する。シーケンス層に属する動画データは、図2の上段に示すように、ピクチャ層に属する複数のフレームから構成されている。フレームには、Iフレーム、Pフレーム、およびBフレームの3種類があり、本実施の形態においては、Iフレーム抽出部110は、Iフレーム201を動画データから抽出する。
Iフレーム201のヘッダ情報には、Iフレーム201のデータ量や量子化に用いられる量子化マトリクスなどの情報が格納されている。したがって、データ量取得部121は、Iフレーム201のヘッダ情報からIフレーム201のデータ量を取得する。なお、シーケンス層とピクチャ層の間には、GOP(Group Of Pictures)層が設けられており、1つのGOP層には1つのIフレームを含む複数のフレームが属している。
ピクチャ層に属するIフレーム201は、図2の中段に示すように、マクロブロック層に属する複数のマクロブロック202から構成されている。マクロブロック202のヘッダ情報には、マクロブロック202を量子化する際に適用された量子化ステップの情報などが格納されている。したがって、量子化ステップ取得部122は、各マクロブロック202のヘッダ情報からマクロブロック202ごとの量子化ステップを取得する。なお、ピクチャ層とマクロブロック層の間には、スライス層が設けられており、例えば1行分のマクロブロック202が属している。
マクロブロック層に属するマクロブロック202は、図2の下段に示すように、ブロック層に属する複数のブロック203から構成されている。それぞれのブロック203は、例えば輝度信号のブロック(Y)、輝度信号と青色成分の差のブロック(U)、および輝度信号と赤色成分の差のブロック(V)などであり、例えば8×8画素の大きさのブロックである。各ブロック203の画素には、それぞれ係数が格納されているが、本実施の形態においては、画素に格納された係数を類似判定に用いることはない。
次いで、上記のように構成された類似判定装置100の動作について、図3に示すフロー図を参照しながら説明する。
まず、動画データが類似判定装置100へ入力されると(ステップS101)、Iフレーム抽出部110によって、動画データを構成する個々のフレームが取得される(ステップS102)。そして、Iフレーム抽出部110によって、取得されたフレームがIフレームであるか否か判断され(ステップS103)、Iフレーム以外のPフレームまたはBフレームである場合には(ステップS103No)、次のフレームが取得される。
また、Iフレーム抽出部110によって取得されたフレームがIフレームである場合には(ステップS103Yes)、このIフレームがデータ量取得部121および量子化ステップ取得部122へ出力される。そして、データ量取得部121によって、Iフレームのヘッダ情報が参照され、フレームのデータ量が取得される(ステップS104)。
一方、量子化ステップ取得部122によって、Iフレームを構成する複数のマクロブロックのヘッダ情報が参照され、各マクロブロックの量子化に用いられた量子化ステップが取得される(ステップS105)。そして、量子化ステップ取得部122によって、Iフレームを構成するすべてのマクロブロックに関する量子化ステップが取得されたか否かが判断され(ステップS106)、すべてのマクロブロックのヘッダ情報から量子化ステップが取得されると(ステップS106Yes)、量子化ステップの平均値が算出される(ステップS107)。
Iフレームのデータ量および量子化ステップの平均値は、いずれも乗算部123へ出力され、乗算部123によって乗算され、特徴量が算出される(ステップS108)。この特徴量は、フレームのデータ量および量子化ステップのみから算出されるため、画素ごとの情報を用いた演算などは一切不要である。すなわち、ピクチャ層のヘッダ情報およびマクロブロック層のヘッダ情報のみが参照されて特徴量が算出されるため、特徴量の算出に要する処理量および処理時間は少量で済む。
また、データ量および量子化ステップは、一方を固定すると元の画像が複雑になるほど他方が大きくなる関係にあるため、特徴量は、元の画像の複雑さを示す値となる。すなわち、データ量を固定すると、複雑な画像ほど量子化を粗くして0の画素を増やす必要があるため、量子化ステップは大きくなる一方、量子化ステップを固定すると、複雑な画像ほど0以外の画素が増加するため、データ量が大きくなる。このため、データ量と量子化ステップを乗算して得られる特徴量は、元の画像が複雑なほど大きくなる値となる。同時に、この特徴量は、各フレームを代表する特徴であり、類似した画像のフレームから得られる特徴量は、互いに近い値になる。
乗算部123によって算出された特徴量は、特徴量蓄積部130へ出力され、Iフレームの時刻情報と対応付けられて蓄積される(ステップS109)。このような特徴量の算出・蓄積が実行される間、Iフレーム抽出部110によって、動画データから所定数のフレームに関して特徴量が蓄積されたか否かが判断され(ステップS110)、所定数のフレームに関する特徴量が未蓄積である場合には(ステップS110No)、引き続き、動画データからフレームが取得される(ステップS102)。ここで、所定数のフレームは、動画データに含まれるすべてのフレームであっても良い。すなわち、Iフレーム抽出部110によって、動画データに含まれるすべてのIフレームが抽出され、すべてのIフレームから特徴量が算出されるようにしても良い。
一方、所定数のフレームに関する特徴量が蓄積されると(ステップS110Yes)、類似判定部140によって、動画データと比較データの特徴量が比較され、類似判定処理が行われる(ステップS111)。ここでの類似判定処理は、例えば図4に示すような動画データの特徴量の時系列変化が比較データの特徴量の時系列変化に類似しているか否かが判定されることにより行われる。比較データの特徴量については、他の装置において求められたものが特徴量蓄積部130にあらかじめ記憶されていても良く、動画データと同様に特徴量算出部120によって算出されたものが特徴量蓄積部130にあらかじめ記憶されていても良い。
以下、比較データの特徴量の時系列変化があらかじめ特徴量蓄積部130に記憶されているものとして、本実施の形態に係る類似判定処理について図5に示すフロー図を参照しながら説明する。
類似判定装置100に入力された動画データの所定数のフレーム(例えば動画データのすべてのIフレーム)の特徴量が特徴量蓄積部130に蓄積されると、類似判定部140によって、動画データのnフレーム分(nは1以上の整数)の特徴量が特徴量蓄積部130から取得される(ステップS201)。ここでは、動画データのすべてのIフレームの特徴量が特徴量蓄積部130から取得されるようにしても良い。また、動画データと比較される比較データは、n個以上のIフレームを有しており、特徴量蓄積部130には、これらのIフレームの特徴量が蓄積されているものとする。
そして、類似判定部140によって、取得されたnフレームと比較される比較データの比較対象部分の開始フレームを示す変数iが1に初期化される(ステップS202)。すなわち、変数iの初期化によって、比較データの1〜n番目のnフレームが比較対象部分となる。そこで、類似判定部140によって、比較データのi〜(i+n−1)番目(ここでは1〜n番目)のnフレーム分の特徴量が特徴量蓄積部130から取得される(ステップS203)。
こうして比較される2種類の特徴量が取得されると、類似判定部140によって、比較対象部分内でのフレームの位置を示す変数kが1に初期化される(ステップS204)。すなわち、変数kの初期化によって、nフレームの最初の(1番目の)フレームから特徴量が比較されることになる。具体的には、類似判定部140によって、動画データのnフレームのうちk番目(ここでは1番目)のフレームの特徴量と比較データの比較対象部分のうちk番目(ここでは1番目)のフレームの特徴量との差分が算出される(ステップS205)。ただし、動画データのnフレームのk番目のフレームと比較対象部分のk番目のフレームとは、それぞれの開始フレームからの経過時間が等しいフレームであるものとする。
そして、類似判定部140によって、特徴量の差分が所定の閾値未満であるか否かが判定される(ステップS206)。この結果、特徴量の差分が所定の閾値未満である場合は(ステップS206Yes)、nフレームのうちk番目のフレームの特徴が類似していることを意味するため、類似判定部140によって変数kがnに等しくなって、nフレームすべての特徴が類似していたことになるか否かが判定される(ステップS207)。後述するように、nフレームのうち1フレームでも特徴量が類似していないと判定されれば、その時点で動画データ由来のnフレームと比較対象部分が類似していないと判断されるため、n番目のフレームの特徴が類似していると判定された時点で、nフレームのすべての特徴が類似していたことになる。
したがって、変数kとnの比較の結果、変数kがnに等しければ(ステップS207Yes)、動画データ由来のnフレームと比較対象部分が類似していることになり、類似判定部140によって、動画データと比較データが類似していると判定される(ステップS208)。一方、変数kがnに等しくなければ(ステップS207No)、変数kが1インクリメントされ(ステップS209)、類似判定部140によって、次のフレームの特徴量の差分が算出され、所定の閾値未満であるか否かが判定される(ステップS205、S206)。
そして、特徴量の差分と所定の閾値との比較の結果、特徴量の差分が所定の閾値以上である場合は(ステップS206No)、nフレームのうちk番目のフレームの特徴が類似していないことを意味するため、類似判定部140によって、動画データ由来のnフレームと比較対象部分が類似していないと判断される。このように、特徴が類似していないフレームが出現した時点で、動画データ由来のnフレームと比較対象部分が類似していないと判断されるため、nフレームの残りのフレームに関する特徴量の比較を行う必要がなく、類似判定に要する時間の短縮を図ることができる。
また、動画データ由来のnフレームと比較対象部分が類似していないと判断された際、比較データの開始フレームから最終フレームまでのすべてのフレームが既に比較対象部分となっていれば、動画データ由来のnフレームに類似した比較対象部分が比較データから検出されなかったと判断できるため、類似判定部140によって、変数iが比較データの最終フレームに対応する値になっているか否かが判定される(ステップS210)。換言すれば、比較対象部分の最後のフレームである(i+n−1)番目のフレームが比較データの最終フレームであるか否かが判定される。
この判定の結果、変数iが比較データの最終フレームに対応する値になっていれば(ステップS210Yes)、動画データ由来のnフレームに類似した比較対象部分が比較データに含まれていなかったことになり、類似判定部140によって、動画データと比較データが類似していないと判定される(ステップS211)。一方、変数iが比較データの最終フレームに対応する値になっていなければ(ステップS210No)、変数iが1インクリメントされ(ステップS212)、類似判定部140によって、比較データにおける次の比較対象部分のnフレームが決定され、この比較対象部分の特徴量が取得される(ステップS203)。
このように、本実施の形態においては、比較データ内の連続するnフレームが順次比較対象部分となり、動画データ由来のnフレームと特徴量が比較され、nフレームすべてについて特徴量の差分が所定の閾値未満となる比較対象部分が比較データ内にある場合には、動画データと比較データが類似していると判定することができる。そして、比較に用いられる特徴量は、ピクチャ層およびマクロブロック層のヘッダ情報から得られるとともに、比較対象部分に含まれるフレームが1つでも動画データ由来のフレームに類似していないと判断された時点で、比較対象部分を変更するため、比較的長時間の比較データであっても、動画データとの類似判定を迅速に実行することができる。
次に、類似判定部140による類似判定処理の具体例について、図6を参照しながら説明する。
本実施の形態においては、比較データの特徴量が特徴量蓄積部130にあらかじめ記憶されており、この特徴量の時系列変化の中に動画データの特徴量の時系列変化に類似したパターンが含まれているか否かによって動画データと比較データの類似判定が行われる。すなわち、比較データの特徴量が図6に示すように時系列変化している場合に、動画データのnフレーム分の特徴量の時系列変化パターンを比較データ内の連続するnフレーム分の特徴量の時系列変化パターンと比較していき、動画データ由来のnフレームに類似した時系列変化パターンが比較データ内に含まれる場合に、動画データと比較データが類似していると判定される。
図6に示した例では、動画データ由来のnフレームと比較データの1〜n番目のフレームとの特徴量の時系列変化パターンが比較された後、動画データ由来のnフレームと比較される比較対象部分を徐々にスライドさせている。そして、比較データのi〜(i+n−1)番目のフレームの特徴量の時系列変化パターンが動画データ由来のnフレームの特徴量の時系列変化パターンと類似しているため、動画データと比較データは類似していると判定されることになる。
以上のように、本実施の形態によれば、動画データのIフレームに含まれるヘッダ情報からIフレームのデータ量とマクロブロックごとの量子化ステップとを取得し、データ量と量子化ステップの平均値とを乗算してIフレームの元となる画像の複雑さを示す特徴量を算出する。そして、この特徴量の時系列変化を比較することにより、複数の画像が類似しているか否かを判定する。このため、例えば逆量子化などを行って、動画データの画素ごとの値を演算して元の画像の特徴量を求める必要がなく、特徴量を容易に算出することができる。そして、特徴量の算出が容易であるため、この特徴量を用いた動画像の類似判定を短時間で効率良く実行することができる。
なお、上記実施の形態1においては、類似判定処理の際に、動画データ由来のnフレームと比較対象部分との各フレームの特徴量を比較し、特徴量の差分が所定の閾値以上となるフレームが出現した時点で、動画データ由来のnフレームと比較対象部分が類似していないと判断するものとした。しかし、特徴量の差分が所定の閾値以上となるフレームが出現しても、nフレームすべてについて特徴量を比較し、最終的に特徴量の差分が所定の閾値以上となるフレームがnフレームに占める割合によって動画データ由来のnフレームと比較対象部分の類似判定を行っても良い。こうすることにより、類似判定に要する時間が長くなるものの、類似とされる範囲を広げることができ、より厳しい類似判定を実行することができる。
また、上記実施の形態1においては、フレームごとの特徴量の差分を所定の閾値と比較することにより類似判定処理を行うものとしたが、動画データおよび比較データの所定数のフレームの特徴量の時系列変化における平均値、最大値、最小値、または標準偏差などの統計量を算出し、算出された統計量を比較することにより類似判定処理を行っても良い。すなわち、例えば算出された統計量の差分が所定の閾値未満である場合に、動画データおよび比較データが類似していると判断するなどとしても良い。
(実施の形態2)
本発明の実施の形態2の特徴は、動画データを生成する符号化時に元の動画像の特徴量を蓄積しておく点である。
図7は、本実施の形態に係る符号化装置300の要部構成を示すブロック図である。同図において、図1と同じ部分には同じ符号を付し、その説明を省略する。図7に示す符号化装置300は、DCT変換部310、量子化部320、特徴量算出部120、および特徴量蓄積部130を有している。
DCT変換部310は、動画像を構成する個々の画像をDCT変換し、低周波成分が左上方向の画素に格納され、高周波成分が右下方向の画素に格納されたDCT係数の画像を生成する。このとき、DCT変換部310は、例えば輝度信号の画像、輝度信号と青色成分の差の画像、および輝度信号と赤色成分の差の画像など、ブロック層に属する各ブロックに対応する複数の画像に対してDCT変換を施す。こうして得られる複数のブロックの画像は、一組でマクロブロック層に属するマクロブロックとなる。
量子化部320は、DCT変換部310によって生成されたDCT係数の画像に対して量子化マトリクスおよび量子化ステップを適用して量子化する。このとき、量子化部320は、マクロブロックごとに量子化ステップを調整し、Iフレームごとのデータ量がほぼ一定になるようにする。そして、量子化部320は、マクロブロックごとの量子化ステップの情報をマクロブロック層のヘッダに格納し、Iフレームのデータ量の情報をピクチャ層のヘッダに格納する。
本実施の形態においては、特徴量算出部120は、動画像を構成する個々の画像が符号化されて動画データとなる際に、画像ごとのデータ量およびマクロブロックごとの量子化ステップを取得して画像ごとの特徴量を算出する。すなわち、データ量取得部121は、量子化部320からIフレームのデータ量を取得し、量子化ステップ取得部122は、量子化部320からマクロブロックごとの量子化ステップを取得し、乗算部123は、データ量と量子化ステップの平均値とを乗算する。
このようにして算出された特徴量は、実施の形態1と同様に、特徴量蓄積部130にIフレームの時刻情報と対応付けられて蓄積される。こうして蓄積される特徴量は、符号化装置300によって符号化された動画像に類似している動画像があるか否かを判定する際などに用いることができる。具体的には、例えば動画像が符号化される際に特徴量蓄積部130に蓄積される特徴量を実施の形態1における比較データの特徴量として用いることなどが可能である。すなわち、実施の形態1の類似判定装置100と本実施の形態に係る符号化装置300とを組み合わせることにより、動画像から動画データを生成する際に比較データの特徴量を蓄積しておくことができ、比較データと他の動画データとの類似判定を行う際に、比較データの特徴量を改めて算出する必要がなくなる。
以上のように、本実施の形態によれば、動画像が符号化されて動画データが生成される際にIフレームのデータ量とマクロブロックごとの量子化ステップとを取得し、データ量と量子化ステップの平均値とを乗算してIフレームの元となる画像の複雑さを示す特徴量を算出する。このため、動画像の特徴量を符号化時に算出して蓄積しておくことができ、蓄積された特徴量を他の動画データの特徴量との類似判定などの際に用いて、処理の効率を向上させることができる。
なお、上記各実施の形態においては、Iフレームのデータ量とマクロブロックごとの量子化ステップの平均値とを乗算することによって特徴量を求めるものとしたが、乗算以外の演算によって特徴量を求めても良い。すなわち、データ量と量子化ステップは、一方を固定した場合に、元の画像が複雑になるほど他方が大きくなる関係であるため、データ量と量子化ステップの2つの情報が総合的にどの程度大きいかが分かるような演算を実行すれば良い。また、乗算を行う場合にも、それぞれの情報に重み付けをするなどとしても良い。
さらに、上記各実施の形態においては、量子化ステップ取得部122がIフレームのすべてのマクロブロックの量子化ステップを取得して平均値を算出するものとしたが、一部のマクロブロックのみの量子化ステップを取得して平均値を算出しても良い。こうすることにより、特徴量を算出する処理時間がさらに短縮され、類似判定などをより効率的に実行することができる。
本発明は、動画データの特徴量を容易に算出し、特徴量の比較による動画像の類似判定を効率良く短時間で実行する場合に適用することができる。

Claims (8)

  1. 各々複数の画像から構成される2つの動画像が類似しているか否かを判定する動画像類似判定装置であって、
    2つの動画像が符号化されて得られる2つの動画データのそれぞれに含まれ、動画像を構成する個々の画像に対応するIフレームを取得する取得手段と、
    前記取得手段によって取得されたフレームのデータ量および符号化時に適用された量子化ステップに基づいてフレームの元となる画像の複雑さを示す特徴量を前記2つの動画像ごとに算出する算出手段と、
    前記算出手段によって算出された画像ごとの特徴量を前記2つの動画像ごとに蓄積する蓄積手段と、
    前記蓄積手段によって蓄積された前記2つの動画像の特徴量の差分が所定の閾値未満である場合に、2つの動画像が類似していると判定する判定手段と
    を有することを特徴とする動画像類似判定装置。
  2. 前記算出手段は、
    前記取得手段によって取得されたフレームのデータ量を取得するデータ量取得手段と、
    前記取得手段によって取得されたフレームの符号化時に適用された量子化ステップを取得する量子化ステップ取得手段と、
    前記データ量取得手段によって取得されたデータ量と前記量子化ステップ取得手段によって取得された量子化ステップとを前記2つの動画像ごとに乗算する乗算手段と
    を含むことを特徴とする請求項1記載の動画像類似判定装置。
  3. 前記データ量取得手段は、
    前記取得手段によって取得されたフレームのヘッダ情報から当該フレームのデータ量の情報を取得することを特徴とする請求項2記載の動画像類似判定装置。
  4. 前記量子化ステップ取得手段は、
    前記取得手段によって取得されたフレームを構成する複数のマクロブロックからマクロブロックごとに異なる量子化ステップを取得し、
    前記乗算手段は、
    前記データ量取得手段によって取得されたデータ量と前記量子化ステップ取得手段によって取得されたマクロブロックごとの量子化ステップの平均値とを前記2つの動画像ごとに乗算することを特徴とする請求項2記載の動画像類似判定装置。
  5. 前記量子化ステップ取得手段は、
    マクロブロックごとのヘッダ情報から各マクロブロックの量子化ステップの情報を取得することを特徴とする請求項4記載の動画像類似判定装置。
  6. 前記判定手段は、
    前記蓄積手段によって蓄積された特徴量と比較対象の動画像の特徴量との差分が所定の閾値未満である場合に、2つの動画像が類似していると判定することを特徴とする請求項1記載の動画像類似判定装置。
  7. 前記判定手段は、
    前記蓄積手段によって蓄積された特徴量から算出される統計量と比較対象の動画像の特徴量から算出される統計量とを比較して、2つの動画像が類似しているか否かを判定することを特徴とする請求項1記載の動画像類似判定装置。
  8. 各々複数の画像から構成される2つの動画像が類似しているか否かを判定する動画像類似判定方法であって、
    2つの動画像が符号化されて得られる2つの動画データのそれぞれに含まれ、動画像を構成する個々の画像に対応するIフレームを取得し、
    取得されたIフレームのデータ量および符号化時に適用された量子化ステップに基づいてIフレームの元となる画像の複雑さを示す特徴量を前記2つの動画像ごとに算出し、
    算出された前記2つの動画像の特徴量の差分が所定の閾値未満である場合に、2つの動画像が類似していると判定する
    ことを特徴とする動画像類似判定方法。
JP2009517664A 2007-06-07 2007-06-07 動画像類似判定装置、および動画像類似判定方法 Expired - Fee Related JP4973729B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2007/061580 WO2008149448A1 (ja) 2007-06-07 2007-06-07 動画像類似判定装置、符号化装置、および特徴量算出方法

Publications (2)

Publication Number Publication Date
JPWO2008149448A1 JPWO2008149448A1 (ja) 2010-08-19
JP4973729B2 true JP4973729B2 (ja) 2012-07-11

Family

ID=40093283

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009517664A Expired - Fee Related JP4973729B2 (ja) 2007-06-07 2007-06-07 動画像類似判定装置、および動画像類似判定方法

Country Status (3)

Country Link
US (1) US20100091864A1 (ja)
JP (1) JP4973729B2 (ja)
WO (1) WO2008149448A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8451896B2 (en) * 2009-10-19 2013-05-28 Hong Kong Applied Science and Technology Research Institute Company Limited Method and apparatus for adaptive quantization in digital video coding
JP2013070158A (ja) * 2011-09-21 2013-04-18 Kddi Corp 映像検索装置およびプログラム
WO2013042766A1 (ja) * 2011-09-22 2013-03-28 オリンパス株式会社 画像処理装置、画像処理システム、及び画像読出し装置
US9865103B2 (en) * 2014-02-17 2018-01-09 General Electric Company Imaging system and method
DE112016006940T5 (de) * 2016-07-11 2019-03-14 Mitsubishi Electric Corporation Bewegtbildverarbeitungseinrichtung, Bewegtbildverarbeitungsverfahren und Bewegtbildverarbeitungsprogramm
CN107786320B (zh) * 2016-08-25 2021-06-22 华为技术有限公司 一种发送和接收业务的方法、装置和网络系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0818979A (ja) * 1994-06-27 1996-01-19 Canon Inc 画像処理装置
JP3496907B2 (ja) * 1996-05-24 2004-02-16 株式会社日立国際電気 音声・動画像符号化データ検索方法及び検索装置
JP3780623B2 (ja) * 1997-05-16 2006-05-31 株式会社日立製作所 動画像の記述方法
JP3738631B2 (ja) * 1999-09-27 2006-01-25 三菱電機株式会社 画像検索システムおよび画像検索方法
KR100422697B1 (ko) * 1999-12-27 2004-03-12 엘지전자 주식회사 색공간 양자화 묘사자
JP2002117037A (ja) * 2000-10-06 2002-04-19 Nec Corp 画像検索装置、並びに画像検索方法及びこれが書き込まれた記録媒体
JP3844446B2 (ja) * 2002-04-19 2006-11-15 日本電信電話株式会社 映像管理方法、装置、映像管理プログラム、および同プログラムを記録した記録媒体
JP4359085B2 (ja) * 2003-06-30 2009-11-04 日本放送協会 コンテンツ特徴量抽出装置
JP3846488B2 (ja) * 2004-05-10 2006-11-15 セイコーエプソン株式会社 画像データ圧縮装置、エンコーダ、電子機器及び画像データ圧縮方法

Also Published As

Publication number Publication date
US20100091864A1 (en) 2010-04-15
WO2008149448A1 (ja) 2008-12-11
JPWO2008149448A1 (ja) 2010-08-19

Similar Documents

Publication Publication Date Title
JP4529919B2 (ja) 適応量子化装置及び適応量子化プログラム
CN100364338C (zh) 估计图像噪声的方法和设备和消除噪声的方法
JP5133290B2 (ja) 動画像符号化装置および復号装置
JP4973729B2 (ja) 動画像類似判定装置、および動画像類似判定方法
Shahid et al. Considering the reconstruction loop for data hiding of intra-and inter-frames of H. 264/AVC
US20120219057A1 (en) Video encoding apparatus and video encoding method
US20100111180A1 (en) Scene change detection
CN1659890A (zh) 用于在编码期间优化图像清晰度的方法和系统
JP4775756B2 (ja) 復号化装置及びそのプログラム
JP4804107B2 (ja) 画像符号化装置、画像符号化方法及びそのプログラム
Philips et al. State-of-the-art techniques for lossless compression of 3D medical image sets
JP6248783B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
EP1755341A1 (en) Method of quantization of transform coefficients
JP2006340345A (ja) ビデオから抽出された画像を強調する方法
JP2003209842A (ja) 2次元直交変換と量子化方法及びその装置並びにプログラム
CN112911298A (zh) 一种基于边界效应的hevc视频双压缩检测方法及系统
KR100845303B1 (ko) 고속 부호화를 위한 되먹임 구조를 가진 동영상 압축부호화 장치 및 최적 모드 결정 방법
JP5698629B2 (ja) 画像処理装置、フィルタ処理方法及びプログラム
US8811474B2 (en) Encoder and encoding method using coded block pattern estimation
JP4268377B2 (ja) 電子透かし埋込装置、その検出装置および電子透かし埋込プログラム
Sagheer et al. Fast intra-frame compression for video conferencing using adaptive shift coding
US7574066B2 (en) Method for image compression, related system and computer product therefor
US7209591B2 (en) Motion compensation method for video sequence encoding in low bit rate systems
JP6270293B1 (ja) 動画像符号化装置および動画像符号化方法
WO2014189981A1 (en) Transform system and method in video and image compression

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120313

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120326

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150420

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees