JP5051237B2 - 不適切コンテンツ検出方法および装置、そのコンピュータプログラム、ならびにコンテンツ公開システム - Google Patents
不適切コンテンツ検出方法および装置、そのコンピュータプログラム、ならびにコンテンツ公開システム Download PDFInfo
- Publication number
- JP5051237B2 JP5051237B2 JP2009537912A JP2009537912A JP5051237B2 JP 5051237 B2 JP5051237 B2 JP 5051237B2 JP 2009537912 A JP2009537912 A JP 2009537912A JP 2009537912 A JP2009537912 A JP 2009537912A JP 5051237 B2 JP5051237 B2 JP 5051237B2
- Authority
- JP
- Japan
- Prior art keywords
- content
- inappropriate
- posted
- similarity
- inappropriate content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Technology Law (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Storage Device Security (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【0001】
本発明は、投稿サイトにおける不適切コンテンツ検出方法、不適切コンテンツ検出装置、そのコンピュータプログラム、およびコンテンツ公開システムに関する。
【背景技術】
【0002】
インターネットなどにて展開されるサービスの一つに、掲示板サービスあるいは動画または静止画投稿サービスがある。掲示板等のこれらのサービスでは、不特定多数の利用者が、画像、音声、テキスト等のデータ(コンテンツ)をアップロードしたり、他人のアップロードしたコンテンツを自由に閲覧したりすることができる。
【0003】
このような掲示板等への投稿を、投稿する利用者の自由に任せると、他人の著作権物をコピーまたは模造したいわゆる不正コンテンツや不法コンテンツが大量に出回ってしまう危険性がある。現在不正コンテンツは、サービス提供者が定期的に監視を行うか、または著作権者がサービス提供者にクレームして該コンテンツを削除するといった枠組みで運用されているが、掲載されるコンテンツが大量になった場合、そのすべてを人手でチェックすることは困難である。
【0004】
投稿されたコンテンツの中から不適切なデータを検出するシステムの一例が特許文献1に記載されている。同文献に記載されたシステムは、予め不適切なコンテンツ(画像、音声、テキスト等)をみつけるためのベースとなるコンテンツのサンプルを蓄えておき、新規にコンテンツ(画像、音声、テキスト等)が投稿されるたびに、前記蓄えられた不適切なコンテンツをみつけるためのベースとなるサンプルとの類似性を評価し、類似していると評価された場合に不適切なコンテンツであるとして抽出する。
【特許文献1】
特開2006−293455号公報
【特許文献2】
特開平8−180176号公報
【特許文献3】
特開2000−259832号公報
【特許文献4】
特開2000−339474号公報
【発明の開示】
【0005】
しかしながら、上記特許文献1に記載されている方法は、不適切なコンテンツをみつけるためのベースとなるコンテンツのサンプルとの類似度に基づくものであり、不適切コンテンツを抽出するために、不適切コンテンツをみつけるためのベースとなるコンテンツをサンプルとして用意する必要がある点で改善の余地を有していた。
【0006】
特に、掲示板などのサービスで不特定多数の利用者が投稿する、画像、音声、テキスト等のデータ(コンテンツ)に対して、他人の著作権物をコピーまたは模造したいわゆる不正コンテンツまたは不法コンテンツを検出するために、予め不正画像データをサンプルとして用意し、日々掲示板などインターネットにアップされるすべての不正画像データに対応することは困難であった。
【0007】
日々、多種多様なコンテンツが生成、流通する中で、著作権的に保護すべきコンテンツをすべて、予め不適切コンテンツのベースとなるコンテンツのサンプルとして用意しておくのはきわめて困難である。掲示板などのサービス母体が、コンテンツを作成していることは少ないため、事前に保護すべきコンテンツを入手することは困難であることに加え、掲示板などに投稿されるコンテンツの範囲は非常に多岐にわたっており、すべての投稿に対してもれなく不適切コンテンツをみつけるためのベースとなるサンプルとして用意することは非常に困難であるといえる。
【0008】
本発明の目的は、上述した課題である、不正コンテンツサンプルや辞書データを予め用意する困難さを解決する不適切コンテンツ検出方法、不適切コンテンツ検出装置、そのコンピュータプログラム、およびコンテンツ公開システムを提供することにある。
【0009】
本発明の第1の不適切コンテンツ検出方法は、不適切コンテンツ検出装置が、
個々の利用者から投稿されたコンテンツを受け付け、
受け付けた複数の前記投稿されたコンテンツを用いて、複数の前記投稿されたコンテンツの相互の類似度を算出し、
前記相互の類似度に基づき、前記投稿されたコンテンツが著作権的に適切であるか否かの判定を行う。
【0010】
本発明の第2の不適切コンテンツ検出方法は、不適切コンテンツ検出装置が、
個々の利用者から投稿されたコンテンツを受け付け、
受け付けた複数の前記投稿されたコンテンツを用いて、複数の前記投稿されたコンテンツ間で算出された相互の類似度に基づき、複数の前記投稿されたコンテンツが相互に類似しているか否かを判定し、類似していた場合に、相互に類似しているコンテンツ群を著作権的に不適切なコンテンツとして検出する。
[0011]
本発明の不適切コンテンツ検出装置は、個々の利用者から投稿されたコンテンツの入力を受け付けるコンテンツ受付手段と、
受け付けた複数の前記投稿されたコンテンツを用いて、複数の前記投稿されたコンテンツの相互の類似度を算出し、前記類似度に基づき、相互に類似するコンテンツ群を検出する類似コンテンツ検出手段と、
検出された前記類似するコンテンツ群に基づき、著作権的に不適切なコンテンツを判定する不正判定手段と、を備える。
[0012]
本発明のコンピュータプログラムは、コンピュータに、個々の利用者から投稿されたコンテンツから著作権的に不適切なコンテンツを検出する不適切コンテンツ検出装置を実現させるためのコンピュータプログラムであって、
前記コンピュータに、
個々の利用者から投稿されたコンテンツの入力を受け付ける手順と、
受け付けた複数の前記投稿されたコンテンツを用いて、複数の前記投稿されたコンテンツの相互の類似度を算出し、前記類似度に基づき、相互に類似するコンテンツ群を検出する手順、
検出された前記類似するコンテンツ群に基づき、著作権的に不適切なコンテンツを判定する手順、を実行させる。
[0013]
本発明の第1のコンテンツ公開システムは、投稿されたコンテンツを利用者が閲覧できるように公開するコンテンツ公開システムであって、
上記不適切コンテンツ検出装置によって検出された前記不適切なコンテンツをシステム管理者に提示する提示手段と、
前記システム管理者が確認した後、前記システム管理者から削除指示を受け付ける受付手段と、
前記削除指示に従い、前記不適切なコンテンツの削除を行う削除手段と、を備える。
【0014】
本発明の第2のコンテンツ公開システムは、投稿されたコンテンツを利用者が閲覧できるように公開するコンテンツ公開システムであって、
上記不適切コンテンツ検出装置によって相互に類似していると判定されたコンテンツ数が、所定数より多いか否かを判定する判定手段と、
相互に類似していると判定されたコンテンツ数が所定数より多い場合に、当該コンテンツへの利用者のアクセスを自動的に停止する制御手段と、を備える。
【0015】
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
【0016】
また、本発明の各種の構成要素は、必ずしも個々に独立した存在である必要はなく、複数の構成要素が一個の部材として形成されていること、一つの構成要素が複数の部材で形成されていること、ある構成要素が他の構成要素の一部であること、ある構成要素の一部と他の構成要素の一部とが重複していること、等でもよい。
【0017】
また、本発明の不適切コンテンツ検出方法およびコンピュータプログラムには複数の手順を順番に記載してあるが、その記載の順番は複数の手順を実行する順番を限定するものではない。このため、本発明の不適切コンテンツ検出方法およびコンピュータプログラムを実施するときには、その複数の手順の順番は内容的に支障しない範囲で変更することができる。
【0018】
さらに、本発明の不適切コンテンツ検出方法およびコンピュータプログラムの複数の手順は個々に相違するタイミングで実行されることに限定されない。このため、ある手順の実行中に他の手順が発生すること、ある手順の実行タイミングと他の手順の実行タイミングとの一部ないし全部が重複していること、等でもよい。
【0019】
本発明によれば、不正コンテンツサンプルや辞書データを予め用意することなく、投稿されるコンテンツの中から不適切なコンテンツを効率よく検出できる不適切コンテンツ検出方法、不適切コンテンツ検出装置、そのコンピュータプログラム、およびコンテンツ公開システムが提供される。
【図面の簡単な説明】
【0020】
上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。
【0021】
【図1】本発明の実施の形態に係る不適切コンテンツ検出装置の構成を示すブロック図である。
【図2】本発明の実施の形態における不適切コンテンツ検出の手順の一例を示すフローチャートである。
【図3】本発明の実施の形態に係る不適切コンテンツ検出装置の構成を示すブロック図である。
【図4】本発明の実施の形態における不適切コンテンツ検出の手順の一例を示すフローチャートである。
【図5】本発明の実施の形態に係る不適切コンテンツ検出装置の構成を示すブロック図である。
【図6】本発明の実施の形態における不適切コンテンツ検出の手順の一例を示すフローチャートである。
【図7】本発明の実施の形態に係る確認サーバの構成を示すブロック図である。
【図8】本発明の実施の形態に係るコンテンツ公開システムの構成を示す図である。
【図9】本発明の不適切コンテンツ検出方法の実施例を模式的に示した図である。
【図10】図9で投稿されたコンテンツの類似の状況を模式的に示した図である。
【図11】動画の類似例を模式的に示した図である。
【図12】静止画の類似例を模式的に示した図である。
【発明を実施するための最良の形態】
【0022】
以下、本発明の実施の形態について、図面を用いて説明する。なお、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
【0023】
(第一の実施の形態)
図1は、本発明の実施の形態に係る不適切コンテンツ検出装置100の構成を示す機能ブロック図である。本実施形態の不適切コンテンツ検出装置100は、複数の投稿されたコンテンツの相互の類似度を算出し、相互の類似度に基づき、投稿されたコンテンツが著作権的に適切であるか否かの判定を行うものである。また、本実施形態において、不適切コンテンツ検出装置100は、投稿された複数のコンテンツの相互の類似度に基づき、複数の投稿されたコンテンツが相互に類似しているか否かを判定し、類似していた場合に、相互に類似しているコンテンツ群を著作権的に不適切なコンテンツとして検出する。
【0024】
ここで、類似度とは、少なくとも二つのコンテンツ間が相互に類似しているか否かを示す尺度であり、たとえば、特許文献1の段落0010および0011、または特許文献4に記載されているような公知の技術により算出できる。
【0025】
本実施形態の不適切コンテンツ検出装置100は、投稿されたコンテンツの入力を受け付けるコンテンツ入力受付部110と、複数の投稿されたコンテンツの相互の類似度を算出し、類似度に基づき、相互に類似するコンテンツ群を検出する類似コンテンツ検出部134と、検出された類似するコンテンツ群に基づき、著作権的に不適切なコンテンツを判定する不正判定部136と、を備える。
【0026】
また、本実施形態の不適切コンテンツ検出装置100は、投稿されたコンテンツからその特徴量を抽出する特徴量抽出部132をさらに備え、類似コンテンツ検出部134は、複数の投稿されたコンテンツの特徴量を相互に照合して、特徴量の相互の類似度を算出し、相互に類似するコンテンツ群を検出する。
【0027】
より詳細には、不適切コンテンツ検出装置100は、コンテンツ入力受付部110と、コンテンツ記憶部120と、特徴量抽出部132と、類似コンテンツ検出部134と、不正判定部136と、不適切コンテンツ出力部140と、を備えている。
【0028】
なお、以下の各図において、本発明の本質に関わらない部分の構成については省略してある。
また、不適切コンテンツ検出装置100の各構成要素は、任意のコンピュータのCPU、メモリ、メモリにロードされた本図の構成要素を実現するプログラム、そのプログラムを格納するハードディスクなどの記憶ユニット、ネットワーク接続用インタフェースを中心にハードウエアとソフトウエアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。以下説明する各図は、ハードウエア単位の構成ではなく、機能単位のブロックを示している。
【0029】
コンテンツ入力受付部110は、個々の利用者から次々に投稿されるコンテンツの入力を受け付ける。一例として、コンテンツ入力受付部110は、インターネット経由で利用者より投稿されたメッセージをキャプチャして、コンテンツ部分を切り出すプログラムを搭載したCPU(Central Processing Unit)である。入力されるコンテンツとは、たとえば、掲示板などに投稿された、画像(動画像、静止画)、音声(音響、音楽)、テキストデータなどであり、著作権的に保護すべきコンテンツである。
【0030】
入力されるコンテンツは、利用者からの投稿を直接キャプチャする形で実現されてもよいし、一度外部のサーバ(不図示)等に蓄えられた後に逐次または一括して入力するような形であってもよい。投稿の形態は、WWWブラウザを使ってアップロードする形態であってもよいし、e−mail等にコンテンツを添付して送付するような形態であってもよい。また特定のFTPサイトに登録するような形態であってもかまわない。
【0031】
コンテンツ記憶部120は、コンテンツ入力受付部110が受け付けたコンテンツを蓄積する。一例として、コンテンツ記憶部120は、ハードディスク、フラッシュメモリなどの記憶装置であり、専用の蓄積装置であっても、他の蓄積装置との兼用であってもよい。
【0032】
特徴量抽出部132は、コンテンツ間の一致の検出、または類似度を効果的に算出するための特徴量を、コンテンツ入力受付部110が受け付けた各コンテンツから抽出する。一例として、特徴量抽出部132は、予め定められたルールにて動作するプログラムを搭載したCPUである。たとえば、コンテンツが映像情報の場合、映像中の各フレームで観測される色情報のヒストグラムを抽出するように動作してもよいし、音楽情報の場合、各時刻における周波数成分を抽出するように動作してもよい。
【0033】
一例として、特徴量抽出部132は、上記特許文献2に記載された画像インデックス生成や、上記特許文献3に記載された、代表レイアウト特徴量抽出のような手順で特徴量の抽出を行う。特徴量抽出に関しては、画像や映像または音響情報などのコンテンツの相互の類似度または一致度が算出できれば、特許文献2や特許文献3に記載された特徴量でなくてもかまわない。
また、特徴量抽出部132で抽出された特徴量は、特徴量蓄積部(不図示)に蓄積してもよいし、類似度算出毎にコンテンツ記憶部120に記憶されているコンテンツから抽出してもよい。
【0034】
類似コンテンツ検出部134は、コンテンツ間の類似度判定または一致検出を行うために、特徴量抽出部132により抽出された特徴量の相互の類似度を算出し、予め定められた特定閾値以上の類似度を持つコンテンツ群を検出する。検出した結果は類似コンテンツ情報として一時記憶部(不図示)に記憶し、後述する不正判定部136に出力する。一例として、類似コンテンツ検出部134は、予め定められたルールにて動作するプログラムを搭載したCPUである。専用のCPUであってもよいし、他のCPUとの兼用であってもよい。
【0035】
類似するコンテンツの検出方法として、たとえば、特許文献3に記載された、代表レイアウト特徴量に基づく類似コンテンツ検出を用いる。コンテンツの一致に際しては、映像中の一部または全部のフレームの一致または類似や、静止画像の一部または全体の一致または類似、音響の一部または全体の一致または類似を検出できれば、特許文献3以外の方法で検出を行ってもよい。
【0036】
すなわち、本実施形態の不適切コンテンツ検出装置100において、類似コンテンツ検出部134は、投稿されたコンテンツが映像であった際に、映像に含まれる一部または全部のフレーム群が相互に類似しているときに、コンテンツ間の類似度が閾値より高いとすることができる。また、類似コンテンツ検出部134は、投稿されたコンテンツが静止画像であった際に、静止画像の一部または全体が類似しているときに、コンテンツ間の類似度が閾値より高いとすることができる。さらに、類似コンテンツ検出部134は、投稿されたコンテンツが音響または音楽を含む際に、音響または音楽の一部または全体のフレーズが類似しているときに、コンテンツ間の類似度が閾値より高いとすることができる。
【0037】
不正判定部136は、類似コンテンツ検出部134にて検出された類似コンテンツ情報に基づいて、コンテンツの不正を判定する。一例として、不正判定部136は、予め定められたルールにて動作するプログラムを搭載したCPUである。専用のCPUであってもよいし、他のCPUとの兼用であってもよい。
【0038】
不適切コンテンツ出力部140は、不正判定部136における不正判定結果をうけて、不適切なコンテンツを出力する。一例として、不適切コンテンツ出力部140は、予め定められたルールにて動作するプログラムを搭載したCPUである。専用のCPUであってもよいし、他のCPUとの兼用であってもよい。例として、不適切コンテンツ出力部140は、不正判定部136で不適切なコンテンツと判定された不適切なコンテンツをリストアップした不適切コンテンツリストを作成し、出力するリスト作成部(不図示)を含むこともできる。
【0039】
上記不適切コンテンツ検出装置100の各種ユニット(コンテンツ入力受付部110〜不適切コンテンツ出力部140)を各種機能として実現させるためのコンピュータプログラムは、上述のCPUが利用するメモリ(不図示)に記憶され、CPUにより実行される。
【0040】
本実施形態のコンピュータプログラムは、コンピュータに、投稿されたコンテンツから著作権的に不適切なコンテンツを検出する不適切コンテンツ検出装置100を実現させるためのコンピュータプログラムであって、コンピュータに、投稿されたコンテンツの入力を受け付ける手順と、投稿されたコンテンツからその特徴量を抽出する手順、複数の投稿されたコンテンツの特徴量を相互に照合して、特徴量の相互の類似度を算出する手順、算出された類似度に基づいて、相互に類似するコンテンツ群を検出する手順、検出された類似するコンテンツ群に基づき、著作権的に不適切なコンテンツを判定する手順、を実行させるように記述されている。
【0041】
コンピュータプログラムは、たとえば、コンピュータ(CPU)が読取可能な記録媒体(メモリ)に格納される。例として、記録媒体は、PROM(Programmable Read Only Memory)、ハードディスク、DVD−ROM、CD−ROM、FDなどである。
【0042】
このように構成された本実施形態の不適切コンテンツ検出装置100の動作について、以下に説明する。図2は、本実施形態の不適切コンテンツ検出装置100の動作の一例を示すフローチャートである。以下、図1および図2を用いて説明する。
【0043】
はじめに、コンテンツ入力受付部110により利用者により投稿された複数のコンテンツの入力が受け付けられる(S11)。コンテンツは、逐次入力されてもよいし、複数まとめて入力されてもよい。受け付けられたコンテンツがコンテンツ記憶部120に記憶され(S13)、特徴量抽出部132が、コンテンツ入力受付部110が受け付けた各コンテンツから類似度算出のための特徴量を抽出する(S15)。
【0044】
そして、類似コンテンツ検出部134が、受け付けたコンテンツの中から順次コンテンツ対を選択し、(S17)、選択されたコンテンツ対の類似度を算出し(S19)、類似度が予め定めた閾値以上であかる否かを判定する(S21)。類似度が予め定めた閾値以上であった場合に(S21のYes)、類似コンテンツとして検出し、検出されたコンテンツ対を相互類似コンテンツ情報として一時記憶部に記憶する(S23)。
【0045】
ステップS17からステップS23までを、入力コンテンツのすべての組合せに対して行い(S25)、それぞれ相互に類似するコンテンツを検出する。
【0046】
そして、すべての組み合わせについて類似コンテンツの検出が終了したとき(S25のYes)、不正判定部136により、ステップS23で記憶した相互類似コンテンツ情報に基づいて不正判定が行われる(S27)。一例として、特定の相互に類似するコンテンツが予め定められた件数以上検出された場合、それらの類似するコンテンツ群に対して不正と判定する。一例として、予め定められた件数が2件の場合、ステップS23にて記憶されたコンテンツはすべて、不適切コンテンツと判定される。予め定められた件数がN件の場合、ステップS21で検出されたコンテンツ対の接続関係に基づき、N件以上の相互接続を検出して検出されたコンテンツを不適切コンテンツと判定する。
【0047】
そして、不適切コンテンツ出力部140により、不正と判定されたコンテンツの出力が行われる(S29)。
【0048】
以上説明したように、本実施形態の不適切コンテンツ検出装置100によれば、不適切なコンテンツをみつけるためのベースとなるサンプルコンテンツ(辞書データ)を用意することなく、著作権的に不適切なコンテンツを効率よく自動的に検出するという、発明の目的を達成することができる。
また、著作権的な適切度の判定を効率よく行うことができる。そして、掲示板などに不適切なコンテンツが公開されるのを防ぐことが可能となる。
【0049】
権利侵害をしている不適切コンテンツでは、テレビ録画、雑誌、CD、DVDなどのオリジナルコンテンツが存在し、オリジナルコンテンツを一部またはそのまま投稿したり、他者が投稿したコンテンツをダウンロードしてそのまま転用したりするという特性をもつため重複が多い。投稿されたコンテンツ間で類似度評価を行い、投稿された動画、静止画、音響の一致または重複を検知し、重複の多いコンテンツを著作権的に不適切なコンテンツとして検出することにより、不適切コンテンツのサンプルを予め用意することなく、著作権的な適切度の判定および不適切なコンテンツの検出ができるようになり、本発明の目的を達成することができる。
【0050】
(第二の実施の形態)
図3は、本発明の実施の形態に係る不適切コンテンツ検出装置200の構成を示す機能ブロック図である。本実施形態の不適切コンテンツ検出装置200は、上記実施形態の不適切コンテンツ検出装置100とは、コンテンツを所定の条件で選択し、選択されたコンテンツについて類似度評価を行う点で相違する。
【0051】
本実施形態の不適切コンテンツ検出装置200において、類似コンテンツ検出部234は、所定の期間内に投稿されたコンテンツのうち、所定数以上の投稿されたコンテンツ間で相互に類似度が閾値より高いコンテンツを相互に類似するコンテンツ群として検出し、不正判定部236は、検出された類似するコンテンツ群を不適切なコンテンツと判定する。
【0052】
また、本実施形態の不適切コンテンツ検出装置200において、類似コンテンツ検出部234は、複数の投稿されたコンテンツから、所定の基準でコンテンツを選択した後に、選択されたコンテンツ間で相互に類似度を算出し、所定数以上のコンテンツ間で、相互に類似度が閾値より高いコンテンツ群を検出し、不正判定部236は、検出された前記コンテンツ群を、不適切なコンテンツと判定する。本実施形態の不適切コンテンツ検出装置200は、たとえば、所定期間に投稿されたコンテンツについて類似度評価を行う。
【0053】
ここで、所定の基準とは、コンテンツが投稿された日時、コンテンツを投稿した投稿者の国籍、投稿されたコンテンツのサイズなどを含む。これらの情報は、コンテンツ投稿記録などに記録されており、コンテンツ投稿記録、すなわち、投稿時刻、投稿者の国籍、コンテンツのサイズなどに基づいてコンテンツを選択し、選択されたコンテンツ間で類似度を算出し、不適切コンテンツを検出することができる。
【0054】
本実施形態の不適切コンテンツ検出装置200は、特徴量抽出部232によって抽出された特徴量を記憶する特徴量蓄積部252と、特徴量蓄積部252から、所定の基準で選択されたコンテンツの特徴量を取得する蓄積特徴量選択部254と、を備え、類似コンテンツ検出部234は、蓄積特徴量選択部254によって選択されたコンテンツの特徴量の相互の類似度を算出し、相互に類似するコンテンツを検出する。
【0055】
さらに、本実施形態の不適切コンテンツ検出装置200において、特徴量蓄積部252は、投稿毎に投稿されたコンテンツの特徴量を蓄積しておき、類似コンテンツ検出部234は、新たに投稿された新規コンテンツと複数の蓄積されたコンテンツの特徴量に基づいて、複数の蓄積されたコンテンツ毎に、新規コンテンツとの類似度を算出し、新規コンテンツとの類似度が閾値より高いコンテンツが存在した場合に、新規コンテンツおよび、新規コンテンツとの類似度が閾値より高いコンテンツのコンテンツ群を検出し、不正判定部236は、検出されたコンテンツ群を不適切なコンテンツと判定する。
【0056】
詳細には、本実施形態の不適切コンテンツ検出装置200は、上記実施形態の不適切コンテンツ検出装置100と同じコンテンツ入力受付部110と、コンテンツ記憶部120と、不適切コンテンツ出力部140と、に加え、特徴量抽出部232と、類似コンテンツ検出部234と、不正判定部236と、特徴量蓄積部252と、蓄積特徴量選択部254と、を備えている。
【0057】
特徴量抽出部232は、コンテンツ間の一致または類似度を効果的に算出するための特徴量をコンテンツから抽出する。抽出された特徴量は特徴量蓄積部252に蓄積される。特徴量抽出部232は、たとえば、コンテンツが映像情報の場合、映像中の各フレームで観測される色情報のヒストグラムを抽出するように動作してもよいし、音楽情報の場合、各時刻における周波数成分を抽出するように動作してもよい。
【0058】
一例として、特徴量抽出部232は、上記実施形態で記載した特許文献2に記載された画像インデックス生成や、特許文献3に記載された、代表レイアウト特徴量抽出のような手順で特徴量の抽出を行う。特徴量抽出に関しては、画像や映像または音響情報などのコンテンツの相互の類似度または一致度が算出できれば、特許文献2や特許文献3に記載された特徴量でなくてもかまわない。
【0059】
特徴量蓄積部252は、特徴量抽出部232にて抽出された特徴量を蓄積する。一例として、ハードディスクやフラッシュメモリなどの記憶装置があり、専用の蓄積装置であっても、他の蓄積装置との兼用であってもよい。
【0060】
蓄積特徴量選択部254は、特徴量蓄積部252から類似度を算出すべき特徴量を選択する。一例として、予め定められたルールにて動作するプログラムを搭載したCPUである。専用のCPUであってもよいし、他のCPUとの兼用であってもよい。一例として、蓄積特徴量選択部254は、特徴量蓄積部252に蓄積された特徴量のうち、予め定められた期間に投稿されたコンテンツの特徴量を、投稿記録の投稿日時に基づき選択する。このほか、投稿記録に記録されているコンテンツの投稿者や投稿者の国籍、投稿されたコンテンツのサイズなどに応じて、類似度評価するコンテンツを選択してもかまわない。
【0061】
類似コンテンツ検出部234は、受け付けたコンテンツの特徴量または蓄積されたコンテンツの特徴量を相互に照合することで、相互の類似度を算出し、類似度に基づいて類似コンテンツを検出する。一例として、予め定められたルールにて動作するプログラムを搭載したCPUである。専用のCPUであってもよいし、他のCPUとの兼用であってもよい。類似コンテンツグループ(コンテンツ群)検出に際しては、上記実施形態で述べたようにすべての特徴量対の類似度を総当り的にもとめる方法(図2のステップS17〜S25)を用いてもよいし、まず、第一に、新規に投稿された入力コンテンツの特徴量と、蓄積された特徴量との類似度の算出を行い、類似コンテンツが検出されたときのみ、相互に類似度算出を行うという方法を用いてもよい。
【0062】
すなわち、本実施形態の不適切コンテンツ検出装置200において、特徴量蓄積部252は、これまでに投稿されたコンテンツの特徴量を蓄積しておき、類似コンテンツ検出部234は、新たに投稿された新規コンテンツと複数の蓄積されたコンテンツの特徴量に基づいて、複数の蓄積されたコンテンツ毎に、新規コンテンツとの類似度を算出し、新規コンテンツとの類似度が閾値より高いコンテンツが存在した場合に、蓄積されたコンテンツに新規コンテンツを加えて、相互の類似度を算出し、所定数以上のコンテンツ間で相互に類似度が閾値より高いコンテンツ群を検出してもよい。
すなわち、新規コンテンツとの類似度が閾値より高いコンテンツが存在しない場合は、コンテンツ群の検出を行わなくてよい。
【0063】
また、このとき、類似コンテンツ検出部234は、新規コンテンツと比較する蓄積されたコンテンツとして、所定期間に投稿されたコンテンツのみを用いてもよい。
【0064】
不正判定部236は、類似コンテンツ検出部234にて検出された類似コンテンツ情報をもとにコンテンツの不正を判定する。本実施形態において、不正判定部236は、類似コンテンツ検出部234にて検出された類似コンテンツグループが予め定めた数以上であった場合、検出された類似コンテンツグループを不適切なコンテンツと判定する。一例として、不正判定部236は、予め定められたルールにて動作するプログラムを搭載したCPUである。専用のCPUであってもよいし、他のCPUとの兼用であってもよい。
【0065】
上記不適切コンテンツ検出装置200の各種ユニット(コンテンツ入力受付部110〜不適切コンテンツ出力部140、特徴量抽出部232〜蓄積特徴量選択部254)を各種機能として実現させるためのコンピュータプログラムは、上述のCPUが利用するメモリ(不図示)に記憶され、CPUにより実行される。
【0066】
本実施形態のコンピュータプログラムは、上記実施形態のコンピュータプログラムの手順に加え、コンピュータに、所定の期間内に投稿されたコンテンツのうち、所定数以上の投稿されたコンテンツ間で相互に類似度が閾値より高いコンテンツを相互に類似するコンテンツ群として検出する手順をさらに実行させるように記述されている。
【0067】
このように構成された本実施形態の不適切コンテンツ検出装置200の動作について以下に説明する。図4は、本実施形態の不適切コンテンツ検出装置200の動作の一例を示すフローチャートである。以下、図3および図4を用いて説明する。
【0068】
なお、本実施形態の不適切コンテンツ検出装置200の動作において、図2のフローチャートのステップS11、S13、およびS29は同じであるので、説明は省略する。
【0069】
特徴量抽出部232により、ステップS11で入力された各コンテンツから類似度算出のための特徴量が抽出される(S31)。抽出された特徴量は、特徴量蓄積部252に蓄積される。そして、蓄積特徴量選択部254により、予め特徴量蓄積部252に記憶された特徴量から相互類似度評価用に利用すべき参照コンテンツの特徴量が選択される(S33)。たとえば、上述したように投稿記録に基づき、所定期間に投稿されたコンテンツの特徴量を選択する。
【0070】
そして、類似コンテンツ検出部234により、ステップS33で選択された特徴量に、新規に入力されたコンテンツの特徴量を加えた特徴量間で相互に類似度を算出して、類似コンテンツグループの検出を行う(S35)。
【0071】
ステップS35にて検出された類似コンテンツグループが予め定めた数以上であった場合、不正判定部236により、検出された類似コンテンツグループが不正コンテンツと判定され(S37)、不適切コンテンツ出力部140により不正と判定したコンテンツが出力される(S29)。
【0072】
以上説明したように、本実施形態の不適切コンテンツ検出装置200によれば、特定期間内に数多く重複して投稿された、オリジナルコンテンツの存在する、コピーとおぼしき投稿を検出することができ、不適切なコンテンツをみつけるためのベースとなるサンプルコンテンツ(辞書データ)を用意することなく、著作権的に不適切なコンテンツを自動的に検出するという、発明の目的を達成することができる。
【0073】
(第三の実施の形態)
図5は、本発明の実施の形態に係る不適切コンテンツ検出装置300の構成を示す機能ブロック図である。本実施形態の不適切コンテンツ検出装置300は、上記実施形態の不適切コンテンツ検出装置100および不適切コンテンツ検出装置200とは、検出された不適切なコンテンツを辞書として登録し、辞書との照合を行うことで不適切なコンテンツの検出を行う点、および不適切なコンテンツが検出された場合、管理者などにアラーム提示する点で相違する。
【0074】
本実施形態の不適切コンテンツ検出装置300は、不正判定部236で不適切と判定された不適切なコンテンツまたは該不適切なコンテンツの特徴量を不適切コンテンツ辞書データとして不適切コンテンツ特徴量蓄積部312に記憶する不適切コンテンツ特徴量登録部314と、新規に投稿されたコンテンツに対して、不適切コンテンツ辞書データと照合を行うことにより不適切なコンテンツの検出を行う類似コンテンツ検出部334と、をさらに備える。
【0075】
詳細には、本実施形態の不適切コンテンツ検出装置300は、上記実施形態の不適切コンテンツ検出装置100と同じコンテンツ入力受付部110と、コンテンツ記憶部120と、不適切コンテンツ出力部140と、ならびに、上記実施形態の不適切コンテンツ検出装置200と同じ特徴量抽出部232と、不正判定部236と、特徴量蓄積部252と、に加え、類似コンテンツ検出部334と、不適切コンテンツ特徴量蓄積部312と、不適切コンテンツ特徴量登録部314と、アラーム提示部320と、を備えている。
【0076】
不適切コンテンツ特徴量蓄積部312は、既に不適切なコンテンツであると判定されたコンテンツの特徴量を蓄積する。一例として、ハードディスクやフラッシュメモリなどの記憶装置があり、専用の蓄積装置であっても、他の蓄積装置との兼用であってもよい。
【0077】
不適切コンテンツ特徴量登録部314は、不適切なコンテンツであると判定されたコンテンツの特徴量を不適切コンテンツ特徴量蓄積部312に登録する。一例として予め定められたルールにて動作するプログラムを搭載したCPUである。たとえば、不正コンテンツと判定されたコンテンツの特徴量を特徴量蓄積部252から、不適切コンテンツ特徴量蓄積部312に変更するという動作を行う。また、放送局などから提供された著作物コンテンツの特徴量を新たに登録するように動作してもよい。
【0078】
類似コンテンツ検出部334は、入力されたコンテンツの特徴量または蓄積されたコンテンツの特徴量の相互の類似度を算出し、類似コンテンツを検出する。一例として、予め定められたルールにて動作するプログラムを搭載したCPUである。専用のCPUであってもよいし、他のCPUとの兼用であってもよい。特徴量間の類似度の算出方法として、たとえば上記実施形態にて記述した特許文献3に記載された、代表レイアウト特徴量に基づく類似コンテンツ検出を用いる。コンテンツの一致に際しては、映像中の一部または全部のフレームの一致または類似や、静止画像の一部または全体の一致または類似、音響の一部または全体の一致または類似を検出できれば、特許文献3以外の方法で検出を行ってもよい。
【0079】
アラーム提示部320は、不適切なコンテンツが検出された際にコンテンツ管理者などに対してアラームを提示する。一例として、アラーム用のテキストまたは映像を提示するためのモニタ、音響を出力するためのスピーカなどが上げられる。
【0080】
上記不適切コンテンツ検出装置300の各種ユニット(コンテンツ入力受付部110〜不適切コンテンツ出力部140、特徴量抽出部232〜特徴量蓄積部252、不適切コンテンツ特徴量蓄積部312〜類似コンテンツ検出部334)を各種機能として実現させるためのコンピュータプログラムは、上述のCPUが利用するメモリ(不図示)に記憶され、CPUにより実行される。
【0081】
本実施形態のコンピュータプログラムは、上記実施形態のコンピュータプログラムの手順に加え、コンピュータに、不適切なコンテンツを判定する手順で不適切と判定された不適切なコンテンツまたは該不適切なコンテンツの特徴量を不適切コンテンツ辞書データとして不適切コンテンツ特徴量蓄積部312に記憶する手順、新規に投稿されたコンテンツに対して、不適切コンテンツ辞書データと照合を行うことにより不適切なコンテンツの検出を行う手順、をさらに実行させるように記述されている。
【0082】
このように構成された本実施形態の不適切コンテンツ検出装置300の動作について、以下に説明する。図6は、本実施形態の不適切コンテンツ検出装置300の動作の一例を示すフローチャートである。以下、図5および図6を用いて説明する。
【0083】
なお、本実施形態の不適切コンテンツ検出装置300の動作において、図2のフローチャートのステップS11およびS13は同じであるので、説明は省略する。
【0084】
特徴量抽出部232により、ステップS11で入力された各コンテンツから類似度算出のための特徴量が抽出される(S41)。抽出された特徴量は、特徴量蓄積部252に蓄積される。そして、類似コンテンツ検出部334により、入力コンテンツの特徴量と、不適切コンテンツ特徴量蓄積部312に蓄積された各コンテンツの特徴量との間の類似度が算出される(S43)。
【0085】
ステップS43にて算出された類似度が予め定めた閾値以上であった場合(S45のYes)、不正判定部236により、類似度が閾値以上の特徴量の入力コンテンツが不適切なコンテンツと判定され(S51)、不適切コンテンツ出力部140により不正と判定したコンテンツが出力される(S53)。そして、アラーム提示部320が、情報管理者に不適切コンテンツ検出のアラームをあげる(S55)。そして、不適切コンテンツ特徴量登録部314により、新たに不適切コンテンツと判定されたコンテンツの特徴量が不適切コンテンツ特徴量蓄積部312に登録される(S57)。
【0086】
ステップS43にて算出されたコンテンツが、不適切コンテンツ特徴量蓄積部312に蓄積されたすべてのコンテンツに対して予め定めた閾値未満であった場合(S45のNo)は、類似コンテンツ検出部334により、入力されたコンテンツの特徴量ならびに、特徴量蓄積部252に蓄積された特徴量で特徴量対が選択され(S61)、選択された特徴量間の類似度が算出される(S63)。そして、類似コンテンツ検出部334により、類似度が予め定めた閾値以上か否かが判定される(S65)。類似度が予め定めた閾値以上であった場合(S65のYes)に、類似コンテンツ検出部334により類似特徴量対として検出され、類似情報として一時記憶部に記憶する(S67)。これを入力コンテンツからの特徴量と、特徴量蓄積部252に蓄積された特徴量をあわせたすべての特徴量の組合せに対して行い(S69)、それぞれ相互に類似するコンテンツの特徴量を抽出する。
【0087】
そして、すべての組み合わせについて類似判定が終了したとき(S69のYes)、不正判定部236により、特徴量の間の類似情報から不正判定が行われる(S71)。一例として、特定の相互に類似するコンテンツの特徴量が、入力コンテンツの特徴量が加わることにより、予め定められた件数以上検出された場合、入力コンテンツならびに、入力コンテンツと相互に類似する特徴量蓄積部252に蓄積された特徴量に対応するコンテンツ記憶部120に蓄積されたコンテンツを不正と判定する。一例として、予め定められた件数が2件の場合、ステップS65にて新たに検出された入力コンテンツを含むコンテンツはすべて、不適切コンテンツと判定される。予め定められた件数がN件の場合、ステップS65で検出されたコンテンツの特徴量対の接続関係に基づき、N件以上の相互接続を検出して検出された特徴量に対応するコンテンツが不適切コンテンツと判定される。
【0088】
そして、不適切コンテンツ出力部140により、不正と判定されたコンテンツの出力が行われる(S73)。さらに、アラーム提示部320が、情報管理者に不適切コンテンツ検出のアラームをあげる(S75)。そして、不適切コンテンツ特徴量登録部314により、新たに不適切コンテンツと判定されたコンテンツの特徴量が、特徴量蓄積部252から消去され、入力コンテンツの特徴量ならびに新たに不適切コンテンツと判定したコンテンツの特徴量が不適切コンテンツ特徴量蓄積部312に登録される(S77)。
【0089】
なお、不適切コンテンツ検出装置300において、所定期間または所定の利用者または所定のコンテンツに対する相互の類似度の算出により不適切コンテンツ辞書データを生成する生成部(類似コンテンツ検出部334、不正判定部236)をさらに備えてもよい。これにより、所定期間または所定の利用者など、特定のグループ毎に辞書データを生成することができる。
また、この生成部は、相互の類似度の算出による不適切コンテンツ検出を定期的に行い、不適切コンテンツ辞書データの生成または更新を行ってもよい。
【0090】
また、特徴量蓄積部252に蓄積する特徴量を、特定期間において投稿されたコンテンツの特徴量に制限するようにすることにより、特定期間内に投稿されたコンテンツの相互類似度を算出するようにすることもできる。また、不適切コンテンツ特徴量蓄積部312に、既に不適切コンテンツとして検出対象である、著作権保護コンテンツの特徴量を合わせて登録してもよい。
【0091】
また、不適切コンテンツ特徴量登録部314は、特徴量蓄積部252からの消去や不適切コンテンツ特徴量蓄積部312への登録を自動的に行う代わりに、コンテンツ管理者等が確認をしてから登録を行うように変更してもよい。
【0092】
すなわち、上記不適切コンテンツ検出装置300において、不適切コンテンツ特徴量登録部314によって生成された不適切コンテンツ辞書データを情報管理者に提示し、該情報管理者が不適切コンテンツ辞書データを確認し、保持する不適切コンテンツ辞書データの指示を受け付け、指示された不適切コンテンツ辞書データのみを不適切コンテンツ特徴量蓄積部312に記憶してもよい。
【0093】
相互類似性を判定する類似度の閾値や類似コンテンツは判定する場合の件数、または使用する特徴量をジャンルや時期、投稿者などの状況に応じて適応的に変更したり、情報管理者が手動で調整したりできるような機構があってもかまわない。
【0094】
また、不適切コンテンツ検出装置300は、所定の利用者または所定のコンテンツを予め登録する登録部(不図示)を備えてもよい。このとき、不正判定部236は、所定の利用者により投稿されたコンテンツまたは所定のコンテンツは不適切なコンテンツと判定しなくてもよい。
【0095】
以上説明したように、本実施形態の不適切コンテンツ検出装置300によれば、所定の期間内に投稿されたコンテンツ内で、類似度の高いコンテンツが所定数以上検出されたときにそれらのコンテンツ群を不適切コンテンツとするので、特定期間内に数多く重複して投稿された、オリジナルコンテンツの存在する、コピーとおぼしき投稿を検出することができ、不適切なコンテンツをみつけるためのベースとなるサンプルコンテンツ(辞書データ)を用意することなく、著作権的に不適切なコンテンツを自動的に効率よく検出するという、発明の目的を達成することができる。
【0096】
権利侵害をしている不適切コンテンツでは、テレビ録画、雑誌、CD、DVDなどのオリジナルコンテンツが存在し、オリジナルコンテンツを一部またはそのまま投稿したり、他者が投稿したコンテンツをダウンロードしてそのまま転用したり、短期間に連続的に投稿されるという特性をもつため短期間での重複が多い。本実施形態によれば、予め定めた特定期間に投稿されたコンテンツ間で類似度評価を行い、投稿された動画、静止画、音響の一致または重複を検知し、予め定めた数以上の重複の多いコンテンツを著作権的に不適切なコンテンツとして検出することにより、不適切コンテンツのサンプルを予め用意することなく、不適切なコンテンツを検出できるようになり、本発明の目的を達成することができる。
【0097】
なお、本実施形態では、不適切コンテンツ特徴量蓄積部312に不適切なコンテンツの特徴量のみを蓄積し、辞書データとして準備するので、辞書データとして不正コンテンツのサンプルを用意する場合に比べて、その容量は非常に小さくて済む。
【0098】
さらに、本実施形態の不適切コンテンツ検出装置300によれば、不適切なコンテンツが検出されたとき、アラームをあげることで情報管理者の確認を促すことができ、これにより不適切なコンテンツが公開されることを防ぐことができる。
【0099】
(第四の実施の形態)
図7は、本発明の実施の形態に係る確認サーバ400の構成を示す機能ブロック図である。
本実施形態の確認サーバ400は、通信部410と、アラーム提示部420と、管理者確認および登録部430と、蓄積部440と、制御部450と、を備えている。
【0100】
通信部410は、ネットワーク402を通じて端末(不図示)や他の管理装置(不図示)とコンテンツや伝達情報のやり取りを行う。通信部410は、一例として、ネットワーク402を介した通信を行う専用ボードなどがあげられる。
【0101】
アラーム提示部420は、コンテンツ管理者に不適切コンテンツ検出のアラーム情報を提示する。アラーム提示部420は、一例として、アラーム用のテキストまたは映像を提示するためのモニタ、音情報を出力するためのスピーカなどがあげられる。あるいは、アラーム情報をリストアップしたリストを作成し、印字出力するプリンタなどでもよい。
【0102】
管理者確認および登録部430は、管理者が、不適切コンテンツ検出結果を確認したり、不適切コンテンツを新たに登録するためのものである。管理者確認および登録部430は、一例として結果を表示するモニタとキーボード、タッチパネルなどの入力機器の組合せがあげられる。あるいは、不適切コンテンツ検出結果をリストアップしたリストを作成し、印字出力するプリンタなどでもよい。
【0103】
蓄積部440は、コンテンツや抽出した特徴量、不適切コンテンツの特徴量などを蓄積する。蓄積部440は、一例として、ハードディスクやフラッシュメモリなどの記憶装置があり、専用の蓄積装置であっても、他の蓄積装置との兼用であってもかまわない。
【0104】
制御部450は、確認サーバ400の各要素および装置全体を制御するとともに、コンテンツ特徴量の抽出や照合など、不適切コンテンツの抽出を行う。制御部450は、一例として、プログラムを搭載したCPUである。
【0105】
上記通信部410、アラーム提示部420、管理者確認および登録部430、蓄積部440、制御部450をあわせて、通信機能、蓄積機能、モニタ機能、入力機能を備えたコンピュータにて構築可能である。
【0106】
制御部450は、通信部410からコンテンツをうけとり入力するコンテンツ入力受付部452と、不適切コンテンツ検出結果を出力する不適切コンテンツ出力部454と、不適切コンテンツであると判定されたコンテンツの特徴量を不適切コンテンツ特徴量蓄積部444に登録する不適切コンテンツ特徴量登録部456と、蓄積部440に格納されているコンテンツ、特徴量、不適切コンテンツ特徴量を管理する蓄積管理部460と、コンテンツの特徴量をコンテンツから抽出する特徴量抽出部462と、特徴量間の類似度算出により類似コンテンツを抽出する類似コンテンツ検出部464と、類似コンテンツ検出部464の検出結果を基に不適切なコンテンツを判定する不正判定部466を含む。
【0107】
蓄積部440は、入力されたコンテンツを蓄積するコンテンツ記憶部442と、抽出されたコンテンツ特徴量を蓄積する特徴量蓄積部444と、不適切コンテンツと判定されたコンテンツの特徴量を蓄積する不適切コンテンツ特徴量蓄積部446と、を含む。
【0108】
このように構成された本実施形態の確認サーバ400の動作については、上記実施形態の不適切コンテンツ検出装置300と同様であるので説明は省略する。
【0109】
本実施形態の確認サーバ400によれば、上記実施形態の不適切コンテンツ検出装置300と同様な効果を奏する。
【0110】
(第五の実施の形態)
図8は、本発明の実施の形態に係るコンテンツ公開システム500の構成を示す図である。
本実施形態のコンテンツ公開システム500は、映像公開サービスを提供するシステムであり、ネットワーク502と、ネットワーク502上に接続された複数の端末装置510と、不適切なコンテンツの検出および確認を行う確認サーバ520と、利用者により投稿された公開データを記憶する公開データ記憶部530と、公開データを公開するための公開サーバ540と、確認サーバ520が不適切なコンテンツを検出した際に、公開データ記憶部530から公開データを削除する公開データ削除部550と、を備える。
【0111】
端末装置510は、ネットワーク502へのアクセス機能を有する端末装置であり、汎用のコンピュータで実現可能である。
ネットワーク502は、データの送受信が可能なインターネット等の通信網である。
【0112】
確認サーバ520は、ネットワーク502を解して端末装置510から送信された投稿データを受け付けて、公開データ記憶部530に格納する機能を有するとともに、公開データ記憶部530に記憶された投稿データのうちで、不適切なものを検出して、削除する機能を有するサーバコンピュータである。確認サーバ520は、図7の上記実施形態で述べた確認サーバ400により実現可能である。不適切コンテンツ出力部522は、図7における確認サーバ400の不適切コンテンツ出力部454と同様な構成により実現可能である。
【0113】
公開サーバ540は、公開データ記憶部530に記憶されているデータを、ネットワーク502を通じて公開する機能を有するサーバコンピュータであり、通常のWWWサーバとしての機能を有するコンピュータにより実現可能である。
【0114】
公開データ削除部550は、確認サーバ520の検出結果を受けて、公開データ記憶部530中の公開データを削除する。一例として、予め定められたルールにて動作するプログラムを搭載したCPUである。専用のCPUであってもよいし、他のCPUとの兼用であってもよい。
【0115】
以上説明したように本実施形態のコンテンツ公開システム500によれば、不適切コンテンツが検出された際に、公開データを削除する機構が実現できるため、ネットワーク502を介してアクセスしてきた閲覧者は、不適切なデータが削除された公開データ記憶部530に格納されたデータのみ入手可能になるので、不適切なデータが一般に公開されることはない。したがって、本実施形態のコンテンツ公開システム500によれば、特定期間内に数多く重複して投稿された、オリジナルコンテンツの存在する、コピーとおぼしき投稿を検出することができ、不適切なコンテンツをみつけるためのベースとなるサンプルコンテンツ(辞書データ)を用意することなく、著作権的に不適切なコンテンツを自動的に検出するという、発明の目的を達成することができる。
【0116】
また、本実施形態のコンテンツ公開システム500によれば、不適切なコンテンツが検出されたとき、アップロードされたコンテンツを削除することにより、不適切なコンテンツが公開されることを防ぐことができる。
【0117】
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
【0118】
たとえば、上記実施形態のコンテンツ公開システム500は、投稿されたコンテンツを利用者が閲覧できるように公開するコンテンツ公開システムであって、上記実施形態の不適切コンテンツ検出装置(100〜300)によって検出された不適切なコンテンツをシステム管理者に提示する提示部(不図示)と、システム管理者が確認した後、システム管理者から削除指示を受け付ける受付部(不図示)と、削除指示に従い、不適切なコンテンツの削除を行う削除部(不図示)と、を有してもよい。
【0119】
また、上記実施形態のコンテンツ公開システム500は、投稿されたコンテンツを利用者が閲覧できるように公開するコンテンツ公開システムであって、上記実施形態の不適切コンテンツ検出装置(100〜300)によって相互に類似していると判定されたコンテンツ数が、所定数より多いか否かを判定する判定部(不図示)と、相互に類似していると判定されたコンテンツ数が所定数より多い場合に、当該コンテンツへの利用者のアクセスを自動的に停止する制御部(不図示)と、を有することもできる。
【実施例1】
【0120】
次に、具体的な実施例を用いて本発明を実施するための最良の形態の動作の例を説明する。
図9は、本発明の不適切コンテンツ検出装置の利用のおおまかなイメージを模式的に示した図である。図9において、放送局610は、番組1の放送を行う。ユーザA、B、C、D、Eはそれぞれテレビ放送を端末装置620で受信して、番組1を視聴する(ステップS101、S111、S121、S131、S141)。ユーザA、B、Eは番組を録画して、一部を切り出し、動画V1、V2、V5をそれぞれ投稿サイトにアップロードしたとする(ステップS103、S113、S143)。ユーザC、Dは利用者所有のハンディカム等で撮影した独自コンテンツ(動画V3、V4)をそれぞれ投稿サイトに投稿したとする(ステップS123、S133)。投稿された動画はそれぞれネットワーク602を介して確認サーバ630が受け付ける。確認サーバ630で投稿された動画はそれぞれ不正判定が行われ、適切なコンテンツのみが公開サーバ640にて公開されることとなる。
【0121】
図9で、動画V1、動画V2、動画V5は同一のオリジナルコンテンツの一部を切り出したものであり、その中で同一フレームを含む場合、類似映像として検知可能である。一方、動画V3および動画V4はまったくの独自コンテンツであるため、他のどの動画とも類似しない(図中、動画V3と他の動画との非類似関係を点線の矢印で示し、動画V4の非類似関係については図示していない。)。この結果、図10のようになり、相互類似が確認された、動画V1、V2、V5(図中、実線の矢印で類似関係を示す。)は、不正コンテンツ候補として判定される。
【0122】
図11は代表的な類似のパタンをいくつか示している。
図11ではオリジナル動画Voの特定の部分を切り出している。図11中横軸は、時間軸を示しており、動画Va、Vb、Vc、Vdはオリジナルコンテンツの部分フレームを切り出した形(クリップ)になっている。
【0123】
たとえば、動画VaのVa1と動画VbのVb1は同一フレームを含み、動画VbのVb2と動画VcのVc1は同一フレームを含み、動画VcのVc2と動画VdのVd1は同一フレームを含む。このように同一フレームを含むため、動画VaとVb、VbとVc、VcとVdは相互に類似しているといえる。動画VaとVdは同一フレームが含まれておらず相互に類似しているとはいえないが、動画Va、Vb、Vc、Vdの相互の接続関係から、動画VaとVbとVcとVdで相互に類似していると判定可能である。
【0124】
図12は静止画の場合の例である。たとえば、オリジナル書籍702などをスキャナ等で取り込んだ後に投稿した場合(ステップS202)、図12のように多少は異なるが相互に類似したコンテンツ(画像710、720、730)が多数投稿される。なお、一致する画像もかなり含まれる。たとえば、画像710はオリジナル書籍702の画像712が傾いて含まれている。また、画像720はオリジナル書籍702の画像722の周囲にのりしろ724が含まれている。さらに、画像730は、オリジナル書籍702の画像の一部が切り取られた画像732が含まれている。
【0125】
これらのような画像も、特許文献2、特許文献3を初めとする各類似度照合エンジンにより、相互の類似コンテンツとして検出することは可能であるため、このような不正コンテンツを削除することが可能になる。音楽データほかでも同様である。
【0126】
この出願は、2007年10月19日に出願された日本出願特願2007−272968号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
【0127】
以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
Claims (50)
- 不適切コンテンツ検出装置が、
個々の利用者から投稿されたコンテンツを受け付け、
受け付けた複数の前記投稿されたコンテンツを用いて、複数の前記投稿されたコンテンツの相互の類似度を算出し、
前記相互の類似度に基づき、前記投稿されたコンテンツが著作権的に適切であるか否かの判定を行う不適切コンテンツ検出方法。 - 不適切コンテンツ検出装置が、
個々の利用者から投稿されたコンテンツを受け付け、
受け付けた複数の前記投稿されたコンテンツを用いて、複数の前記投稿されたコンテンツ間で算出された相互の類似度に基づき、複数の前記投稿されたコンテンツが相互に類似しているか否かを判定し、類似していた場合に、相互に類似しているコンテンツ群を著作権的に不適切なコンテンツとして検出する不適切コンテンツ検出方法。 - 請求項1または2に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、
所定の期間内に投稿されたコンテンツのうち、所定数以上の前記投稿されたコンテンツ間で相互に前記類似度が閾値より高いと判定されたコンテンツ群を、前記不適切なコンテンツとして検出する不適切コンテンツ検出方法。 - 請求項1乃至3いずれか一項に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、
複数の前記投稿されたコンテンツから、所定の基準でコンテンツを選択した後に、前記選択されたコンテンツ間で相互に類似度を算出し、所定数以上のコンテンツ間で、相互に類似度が閾値より高いと判定されたコンテンツ群を、前記不適切なコンテンツとして検出する不適切コンテンツ検出方法。 - 請求項1乃至4いずれか一項に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、
前記投稿されたコンテンツから特徴量を抽出し、
前記投稿されたコンテンツの前記特徴量を、相互に照合することでコンテンツ相互の類似度を算出する不適切コンテンツ検出方法。 - 請求項1乃至5いずれか一項に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、
前記投稿されたコンテンツが映像であった際に、映像に含まれる一部または全部のフレーム群が相互に類似しているときに、コンテンツ間の類似度が閾値より高いとする不適切コンテンツ検出方法。 - 請求項1乃至6いずれか一項に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、
前記投稿されたコンテンツが静止画像であった際に、静止画像の一部または全体が類似しているときに、コンテンツ間の類似度が閾値より高いとする不適切コンテンツ検出方法。 - 請求項1乃至7いずれか一項に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、
前記投稿されたコンテンツが音響または音楽を含む際に、音響または音楽の一部または全体のフレーズが類似しているときに、コンテンツ間の類似度が閾値より高いとする不適切コンテンツ検出方法。 - 請求項1乃至8いずれか一項に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、特徴量蓄積部を備え、
前記不適切コンテンツ検出装置が、
投稿毎に前記投稿されたコンテンツの特徴量を抽出して前記特徴量蓄積部に蓄積しておき、新たに投稿された新規コンテンツと複数の前記蓄積されたコンテンツの前記特徴量に基づいて、複数の前記蓄積されたコンテンツ毎に、前記新規コンテンツとの類似度を算出し、前記新規コンテンツとの前記類似度が閾値より高いコンテンツが存在した場合に、前記新規コンテンツおよび、前記新規コンテンツとの前記類似度が閾値より高いと判定されたコンテンツのコンテンツ群を前記不適切なコンテンツと判定する不適切コンテンツ検出方法。 - 請求項1乃至8いずれか一項に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、特徴量蓄積部を備え、
前記不適切コンテンツ検出装置が、
これまでに投稿されたコンテンツの特徴量を抽出して前記特徴量蓄積部に蓄積しておき、新たに投稿された新規コンテンツと複数の前記蓄積されたコンテンツの前記特徴量に基づいて、複数の前記蓄積されたコンテンツ毎に、前記新規コンテンツとの類似度を算出し、前記新規コンテンツとの前記類似度が閾値より高いコンテンツが存在した場合に、前記蓄積されたコンテンツに前記新規コンテンツを加えて、相互の前記類似度を算出し、所定数以上のコンテンツ間で相互に前記類似度が閾値より高いと判定されたコンテンツ群を、前記不適切なコンテンツとして検出する不適切コンテンツ検出方法。 - 請求項10に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、
前記新規コンテンツと比較する前記蓄積されたコンテンツとして、所定期間に投稿されたコンテンツのみを用いる不適切コンテンツ検出方法。 - 請求項1乃至11いずれか一項に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、辞書記憶部を備え、
前記不適切コンテンツ検出装置が、
前記不適切と判定された投稿コンテンツまたは該コンテンツの特徴量を不適切コンテンツ辞書データとして前記辞書記憶部に記憶し、新規に投稿されたコンテンツに対して、前記記憶された不適切コンテンツ辞書データと照合を行うことにより前記不適切なコンテンツの検出を行う不適切コンテンツ検出方法。 - 請求項12に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、
所定期間または利用者またはコンテンツに対する相互の類似度の算出により前記不適切コンテンツ辞書データを生成する不適切コンテンツ検出方法。 - 請求項12または13に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、
前記相互の類似度算出による不適切コンテンツ検出を定期的に行い前記不適切コンテンツ辞書データの生成または更新を行う不適切コンテンツ検出方法。 - 請求項12乃至14いずれか一項に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、
前記不適切コンテンツ辞書データを情報管理者が確認し、前記情報管理者が指示した不適切コンテンツのみを保持するよう修正する不適切コンテンツ検出方法。 - 請求項1乃至15いずれか一項に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、登録部を備え、
前記不適切コンテンツ検出装置が、
所定の利用者または所定のコンテンツを前記登録部に予め登録しておき、前記所定の利用者により投稿されたコンテンツまたは前記所定のコンテンツは前記不適切コンテンツとして検出しない不適切コンテンツ検出方法。 - 個々の利用者から投稿されたコンテンツの入力を受け付けるコンテンツ受付手段と、
受け付けた複数の前記投稿されたコンテンツを用いて、複数の前記投稿されたコンテンツの相互の類似度を算出し、前記類似度に基づき、相互に類似するコンテンツ群を検出する類似コンテンツ検出手段と、
検出された前記類似するコンテンツ群に基づき、著作権的に不適切なコンテンツを判定する不正判定手段と、を備える不適切コンテンツ検出装置。 - 請求項17に記載の不適切コンテンツ検出装置において、
前記類似コンテンツ検出手段は、所定の期間内に投稿されたコンテンツのうち、所定数以上の前記投稿されたコンテンツ間で相互に前記類似度が閾値より高いコンテンツを前記相互に類似するコンテンツ群として検出し、
前記不正判定手段は、検出された前記類似するコンテンツ群を前記不適切なコンテンツと判定する不適切コンテンツ検出装置。 - 請求項17または18に記載の不適切コンテンツ検出装置において、
前記類似コンテンツ検出手段は、複数の前記投稿されたコンテンツから、所定の基準でコンテンツを選択した後に、前記選択されたコンテンツ間で相互に類似度を算出し、所定数以上のコンテンツ間で、相互に類似度が閾値より高いコンテンツ群を検出し、
前記不正判定手段は、検出された前記コンテンツ群を、前記不適切なコンテンツと判定する不適切コンテンツ検出装置。 - 請求項17乃至19いずれか一項に記載の不適切コンテンツ検出装置において、
前記投稿されたコンテンツからその特徴量を抽出する特徴量抽出手段を備え、
前記類似コンテンツ検出手段は、複数の前記投稿されたコンテンツの前記特徴量を相互に照合して、前記特徴量の相互の類似度を算出し、前記類似度に基づいて、相互に類似するコンテンツ群を検出する不適切コンテンツ検出装置。 - 請求項20に記載の不適切コンテンツ検出装置において、
前記特徴量抽出手段によって抽出された前記特徴量を記憶する特徴量蓄積手段と、
前記特徴量蓄積手段から、所定の基準で選択されたコンテンツの特徴量を取得する蓄積特徴量選択手段と、を備え、
前記類似コンテンツ検出手段は、前記蓄積特徴量選択手段によって選択されたコンテンツの前記特徴量の相互の類似度を算出し、相互に類似するコンテンツを検出する不適切コンテンツ検出装置。 - 請求項17乃至21いずれか一項に記載の不適切コンテンツ検出装置において、
前記類似コンテンツ検出手段は、前記投稿されたコンテンツが映像であった際に、映像に含まれる一部または全部のフレーム群が相互に類似しているときに、コンテンツ間の類似度が閾値より高いとする不適切コンテンツ検出装置。 - 請求項17乃至22いずれか一項に記載の不適切コンテンツ検出装置において、
前記類似コンテンツ検出手段は、前記投稿されたコンテンツが静止画像であった際に、静止画像の一部または全体が類似しているときに、コンテンツ間の類似度が閾値より高いとする不適切コンテンツ検出装置。 - 請求項17乃至23いずれか一項に記載の不適切コンテンツ検出装置において、
前記類似コンテンツ検出手段は、前記投稿されたコンテンツが音響または音楽を含む際に、音響または音楽の一部または全体のフレーズが類似しているときに、コンテンツ間の類似度が閾値より高いとする不適切コンテンツ検出装置。 - 請求項21に記載の不適切コンテンツ検出装置において、
前記特徴量蓄積手段は、投稿毎に前記投稿されたコンテンツの前記特徴量を蓄積しておき、
前記類似コンテンツ検出手段は、新たに投稿された新規コンテンツと複数の前記蓄積されたコンテンツの前記特徴量に基づいて、複数の前記蓄積されたコンテンツ毎に、前記新規コンテンツとの類似度を算出し、前記新規コンテンツとの前記類似度が閾値より高いコンテンツが存在した場合に、前記新規コンテンツおよび、前記新規コンテンツとの前記類似度が閾値より高いコンテンツのコンテンツ群を検出し、
前記不正判定手段は、検出された前記コンテンツ群を前記不適切なコンテンツと判定する不適切コンテンツ検出装置。 - 請求項21に記載の不適切コンテンツ検出装置において、
前記特徴量蓄積手段は、これまでに投稿されたコンテンツの前記特徴量を蓄積しておき、
前記類似コンテンツ検出手段は、新たに投稿された新規コンテンツと複数の前記蓄積されたコンテンツの前記特徴量に基づいて、複数の前記蓄積されたコンテンツ毎に、前記新規コンテンツとの類似度を算出し、前記新規コンテンツとの前記類似度が閾値より高いコンテンツが存在した場合に、前記蓄積されたコンテンツに前記新規コンテンツを加えて、相互の前記類似度を算出し、所定数以上のコンテンツ間で相互に前記類似度が閾値より高いコンテンツ群を検出し、
前記不正判定手段は、検出された前記コンテンツ群を前記不適切なコンテンツと判定する不適切コンテンツ検出装置。 - 請求項26に記載の不適切コンテンツ検出装置において、
前記類似コンテンツ検出手段は、前記新規コンテンツと比較する前記蓄積されたコンテンツとして、所定期間に投稿されたコンテンツのみを用いる不適切コンテンツ検出装置。 - 請求項17乃至27いずれか一項に記載の不適切コンテンツ検出装置において、
前記不正判定手段で不適切と判定された前記不適切なコンテンツまたは該不適切なコンテンツの特徴量を不適切コンテンツ辞書データとして記憶する辞書記憶手段と、
新規に投稿されたコンテンツに対して、前記不適切コンテンツ辞書データと照合を行うことにより前記不適切なコンテンツの検出を行う不適切コンテンツ検出手段と、をさらに備える不適切コンテンツ検出装置。 - 請求項28に記載の不適切コンテンツ検出装置において、
所定期間または所定の利用者または所定のコンテンツに対する相互の類似度の算出により前記不適切コンテンツ辞書データを生成する生成手段をさらに備える不適切コンテンツ検出装置。 - 請求項29に記載の不適切コンテンツ検出装置において、
前記生成手段は、前記相互の類似度の算出による不適切コンテンツ検出を定期的に行い、前記不適切コンテンツ辞書データの生成または更新を行う不適切コンテンツ検出装置。 - 請求項28乃至30いずれか一項に記載の不適切コンテンツ検出装置において、
前記不適切コンテンツ辞書データを情報管理者に提示し、該情報管理者が前記不適切コンテンツ辞書データを確認し、保持する不適切コンテンツ辞書データの指示を受け付け、指示された不適切コンテンツ辞書データのみを前記辞書記憶手段に記憶する不適切コンテンツ検出装置。 - 請求項17乃至31いずれか一項に記載の不適切コンテンツ検出装置において、
所定の利用者または所定のコンテンツを予め登録する登録手段を備え、
前記不正判定手段は、前記所定の利用者により投稿されたコンテンツまたは前記所定のコンテンツは前記不適切なコンテンツと判定しない不適切コンテンツ検出装置。 - コンピュータに、個々の利用者から投稿されたコンテンツから著作権的に不適切なコンテンツを検出する不適切コンテンツ検出装置を実現させるためのコンピュータプログラムであって、
前記コンピュータに、
個々の利用者から投稿されたコンテンツの入力を受け付ける手順と、
受け付けた複数の前記投稿されたコンテンツを用いて、複数の前記投稿されたコンテンツの相互の類似度を算出し、前記類似度に基づき、相互に類似するコンテンツ群を検出する手順、
検出された前記類似するコンテンツ群に基づき、著作権的に不適切なコンテンツを判定する手順、を実行させるためのコンピュータプログラム。 - 請求項33に記載のコンピュータプログラムにおいて、
前記コンピュータに、
所定の期間内に投稿されたコンテンツのうち、所定数以上の前記投稿されたコンテンツ間で相互に前記類似度が閾値より高いコンテンツを前記相互に類似するコンテンツ群として検出する手順をさらに実行させるためのコンピュータプログラム。 - 請求項33または34に記載のコンピュータプログラムにおいて、
前記コンピュータに、
前記投稿されたコンテンツからその特徴量を抽出する手順、
複数の前記投稿されたコンテンツの前記特徴量を相互に照合して、前記特徴量の相互の類似度を算出する手順、
算出された前記類似度に基づいて、前記相互に類似するコンテンツ群を検出する手順、をさらに実行させるためのコンピュータプログラム。 - 請求項33乃至35いずれか一項に記載のコンピュータプログラムにおいて、
前記コンピュータは、不適切コンテンツ辞書データを記憶する辞書記憶装置を備え、
前記コンピュータに、
前記不適切なコンテンツを判定する手順で不適切と判定された前記不適切なコンテンツまたは該不適切なコンテンツの特徴量を前記不適切コンテンツ辞書データとして前記辞書記憶装置に記憶する手順、
新規に投稿されたコンテンツに対して、前記不適切コンテンツ辞書データと照合を行うことにより前記不適切なコンテンツの検出を行う手順、をさらに実行させるためのコンピュータプログラム。 - 投稿されたコンテンツを利用者が閲覧できるように公開するコンテンツ公開システムであって、
請求項17乃至32いずれか一項に記載の不適切コンテンツ検出装置によって検出された前記不適切なコンテンツをシステム管理者に提示する提示手段と、
前記システム管理者が確認した後、前記システム管理者から削除指示を受け付ける受付手段と、
前記削除指示に従い、前記不適切なコンテンツの削除を行う削除手段と、を備えるコンテンツ公開システム。 - 投稿されたコンテンツを利用者が閲覧できるように公開するコンテンツ公開システムであって、
請求項17乃至32いずれか一項に記載の不適切コンテンツ検出装置によって相互に類似していると判定されたコンテンツ数が、所定数より多いか否かを判定する判定手段と、
相互に類似していると判定されたコンテンツ数が所定数より多い場合に、当該コンテンツへの利用者のアクセスを自動的に停止する制御手段と、を備えるコンテンツ公開システム。 - 請求項1乃至16いずれか一項に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、
前記相互の類似度を算出するコンテンツは、著作権的に適切であるか否かが未確認の複数の投稿されたコンテンツである不適切コンテンツ検出方法。 - 請求項12乃至15いずれか一項に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、
前記不適切コンテンツ辞書データとして、著作権コンテンツを前記辞書記憶部に記憶する不適切コンテンツ検出方法。 - 請求項1乃至16、39、および40いずれか一項に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、
受け付けた複数の前記投稿されたコンテンツの中から順次コンテンツ対を選択し、
選択された前記コンテンツ対の類似度を算出し、
算出された前記類似度が予め定められた閾値以上のコンテンツの件数を求め、
前記コンテンツの前記件数に基づいて、前記コンテンツが著作権的に適切であるか否かの判定を行う不適切コンテンツ検出方法。 - 請求項41に記載の不適切コンテンツ検出方法において、
前記不適切コンテンツ検出装置が、
算出された前記類似度が予め定められた閾値以上のコンテンツが、予め定められた件数以上検出された場合、検出されたコンテンツ対を類似コンテンツとして検出し、それらの類似コンテンツ群に対して、著作権的に不適切なコンテンツと判定する不適切コンテンツ検出方法。 - 請求項17乃至32いずれか一項に記載の不適切コンテンツ検出装置において、
前記類似コンテンツ検出手段が前記相互の類似度を算出するコンテンツは、著作権的に適切であるか否かが未確認の複数の投稿されたコンテンツである不適切コンテンツ検出装置。 - 請求項28乃至31いずれか一項に記載の不適切コンテンツ検出装置において、
前記辞書記憶手段は、前記不適切コンテンツ辞書データとして、著作権コンテンツを記憶する不適切コンテンツ検出装置。 - 請求項17乃至32、43、および44いずれか一項に記載の不適切コンテンツ検出装置において、
前記類似コンテンツ検出手段は、
前記受け付けた複数の前記投稿されたコンテンツの中から順次コンテンツ対を選択し、
選択された前記コンテンツ対の類似度を算出し、
算出された前記類似度が予め定められた閾値以上のコンテンツの件数を求め、
前記不正判定手段は、
前記コンテンツの前記件数に基づいて、前記コンテンツが著作権的に適切であるか否かの判定を行う不適切コンテンツ検出装置。 - 請求項45に記載の不適切コンテンツ検出装置において、
前記類似コンテンツ検出手段は、算出された前記類似度が予め定められた閾値以上のコンテンツが、予め定められた件数以上検出された場合、検出されたコンテンツ対を類似コンテンツとして検出し、
前記不正判定手段は、それらの類似コンテンツ群に対して、著作権的に不適切なコンテンツと判定する不適切コンテンツ検出装置。 - 請求項33乃至36いずれか一項に記載のコンピュータプログラムにおいて、
前記相互に類似するコンテンツ群を検出する手順で、前記相互の類似度を算出するコンテンツは、著作権的に適切であるか否かが未確認の複数の投稿されたコンテンツであるコンピュータプログラム。 - 請求項36に記載のコンピュータプログラムにおいて、
前記コンピュータに、
前記不適切コンテンツ辞書データとして、著作権コンテンツを前記辞書記憶装置に記憶する手順をさらに実行させるためのコンピュータプログラム。 - 請求項33乃至36、47、および48いずれか一項に記載のコンピュータプログラムにおいて、
前記コンピュータに、
受け付けた複数の前記投稿されたコンテンツの中から順次コンテンツ対を選択する手順、
選択された前記コンテンツ対の類似度を算出する手順、
算出された前記類似度が予め定められた閾値以上のコンテンツの件数を求める手順、
前記コンテンツの前記件数に基づいて、前記コンテンツが著作権的に適切であるか否かの判定を行う手順をさらに実行させるためのコンピュータプログラム。 - 請求項49に記載のコンピュータプログラムにおいて、
前記コンピュータに、
算出された前記類似度が予め定められた閾値以上のコンテンツが、予め定められた件数以上検出された場合、検出されたコンテンツ対を類似コンテンツとして検出する手順、
それらの類似コンテンツ群に対して、著作権的に不適切なコンテンツと判定する手順をさらに実行させるためのコンピュータプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009537912A JP5051237B2 (ja) | 2007-10-19 | 2008-10-14 | 不適切コンテンツ検出方法および装置、そのコンピュータプログラム、ならびにコンテンツ公開システム |
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007272968 | 2007-10-19 | ||
| JP2007272968 | 2007-10-19 | ||
| JP2009537912A JP5051237B2 (ja) | 2007-10-19 | 2008-10-14 | 不適切コンテンツ検出方法および装置、そのコンピュータプログラム、ならびにコンテンツ公開システム |
| PCT/JP2008/002899 WO2009050877A1 (ja) | 2007-10-19 | 2008-10-14 | 不適切コンテンツ検出方法および装置、そのコンピュータプログラム、ならびにコンテンツ公開システム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2009050877A1 JPWO2009050877A1 (ja) | 2011-02-24 |
| JP5051237B2 true JP5051237B2 (ja) | 2012-10-17 |
Family
ID=40567164
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009537912A Active JP5051237B2 (ja) | 2007-10-19 | 2008-10-14 | 不適切コンテンツ検出方法および装置、そのコンピュータプログラム、ならびにコンテンツ公開システム |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP5051237B2 (ja) |
| WO (1) | WO2009050877A1 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021235846A1 (ko) * | 2020-05-19 | 2021-11-25 | 주식회사 코클리어닷에이아이 | 비디오 컨텐츠로부터 음악 데이터를 검출하는 장치 및 그의 제어방법 |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102449636A (zh) * | 2009-05-29 | 2012-05-09 | 牧乐咖股份有限公司 | 使用遗传信息的多媒体内容文件管理系统及方法 |
| JP5207402B2 (ja) * | 2009-09-30 | 2013-06-12 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法及びプログラム |
| JP5780898B2 (ja) * | 2011-09-22 | 2015-09-16 | 株式会社電通 | 情報提供装置、情報提供方法及び情報提供プログラム |
| JP5459422B2 (ja) * | 2013-02-14 | 2014-04-02 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、制御方法及びプログラム |
| CN110321931A (zh) * | 2019-06-05 | 2019-10-11 | 上海易点时空网络有限公司 | 原创内容仲裁方法及装置 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08180176A (ja) * | 1994-10-27 | 1996-07-12 | Nec Corp | 画像蓄積・管理装置、画像インデックス生成方法及び画像インデックス生成装置 |
| JP2000259832A (ja) * | 1999-01-06 | 2000-09-22 | Nec Corp | 画像特徴量生成装置、画像検索装置、並びにその生成方法及び検索方法 |
| JP2000339474A (ja) * | 1999-05-27 | 2000-12-08 | Nec Corp | 動画像類似度算出装置および方法 |
| JP2003242281A (ja) * | 2002-02-19 | 2003-08-29 | Sony Corp | 利用権管理システム、利用権管理装置、利用権の管理を実行する方法、これらのプログラム並びにプログラム記録媒体 |
| JP2006293455A (ja) * | 2005-04-06 | 2006-10-26 | Dainippon Printing Co Ltd | 不適正データ確認システム |
| JP2007096608A (ja) * | 2005-09-28 | 2007-04-12 | Yafoo Japan Corp | 不正画像検出装置、方法、プログラム |
-
2008
- 2008-10-14 JP JP2009537912A patent/JP5051237B2/ja active Active
- 2008-10-14 WO PCT/JP2008/002899 patent/WO2009050877A1/ja not_active Ceased
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08180176A (ja) * | 1994-10-27 | 1996-07-12 | Nec Corp | 画像蓄積・管理装置、画像インデックス生成方法及び画像インデックス生成装置 |
| JP2000259832A (ja) * | 1999-01-06 | 2000-09-22 | Nec Corp | 画像特徴量生成装置、画像検索装置、並びにその生成方法及び検索方法 |
| JP2000339474A (ja) * | 1999-05-27 | 2000-12-08 | Nec Corp | 動画像類似度算出装置および方法 |
| JP2003242281A (ja) * | 2002-02-19 | 2003-08-29 | Sony Corp | 利用権管理システム、利用権管理装置、利用権の管理を実行する方法、これらのプログラム並びにプログラム記録媒体 |
| JP2006293455A (ja) * | 2005-04-06 | 2006-10-26 | Dainippon Printing Co Ltd | 不適正データ確認システム |
| JP2007096608A (ja) * | 2005-09-28 | 2007-04-12 | Yafoo Japan Corp | 不正画像検出装置、方法、プログラム |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021235846A1 (ko) * | 2020-05-19 | 2021-11-25 | 주식회사 코클리어닷에이아이 | 비디오 컨텐츠로부터 음악 데이터를 검출하는 장치 및 그의 제어방법 |
| US12267556B2 (en) | 2020-05-19 | 2025-04-01 | Cochl Inc | Device for detecting music data from video contents, and method for controlling same |
Also Published As
| Publication number | Publication date |
|---|---|
| JPWO2009050877A1 (ja) | 2011-02-24 |
| WO2009050877A1 (ja) | 2009-04-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP2732383B1 (en) | Methods and systems of providing visual content editing functions | |
| JP6903751B2 (ja) | 一致するコンテンツを特定するためのシステムおよび方法 | |
| JP5819456B2 (ja) | 広告タグを介したウェブベースのメディアにおけるコンテンツシンジケーション | |
| US20080319844A1 (en) | Image Advertising System | |
| US20110246471A1 (en) | Retrieving video annotation metadata using a p2p network | |
| JP5051237B2 (ja) | 不適切コンテンツ検出方法および装置、そのコンピュータプログラム、ならびにコンテンツ公開システム | |
| US20150046537A1 (en) | Retrieving video annotation metadata using a p2p network and copyright free indexes | |
| US9325691B2 (en) | Video management method and video management system | |
| KR20190042984A (ko) | 디지털 저작물 유통 모니터링 시스템 | |
| JP2011150485A (ja) | 携帯端末、素材バンク管理システム及び素材バンク管理方法 | |
| US20100205276A1 (en) | System and method for exploiting a media object by a fruition device | |
| US9152707B2 (en) | System and method for creating and providing media objects in a navigable environment | |
| CN107172178B (zh) | 一种内容发送方法及装置 | |
| JP5401654B2 (ja) | 情報検閲システム、情報公開サーバ、情報検閲装置、情報検閲方法、及び情報検閲プログラム | |
| KR20140012512A (ko) | 멀티미디어 컨텐츠 서비스에 대한 통합관리 시스템 및 방법, 그리고 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체 | |
| US20070219912A1 (en) | Information distribution system, information distribution method, and program product for information distribution | |
| KR102213373B1 (ko) | 메타데이터를 이용한 유해 컨텐츠 관리 장치 및 방법 | |
| JP2005039359A (ja) | 画像再生装置及びプログラム | |
| KR100861243B1 (ko) | 저작권 표시된 동영상 데이터 서비스 시스템 및 그 방법 | |
| CN110490162A (zh) | 基于人脸识别解锁功能显示人脸变化的方法、装置和系统 | |
| JP5264643B2 (ja) | コンテンツ流通監視方法及びシステムと、このシステムで使用される装置及びそのプログラム | |
| Yu et al. | Interactive broadcast services for live soccer video based on instant semantics acquisition | |
| JP2006259893A (ja) | 物体認識システム,コンピュータプログラム,および端末装置 | |
| KR101821602B1 (ko) | 동영상 콘텐츠 맞춤형 정보 삽입시스템 | |
| KR102348756B1 (ko) | 라이브 공연 영상에 대한 중계 서비스 제공 시스템 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110906 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120410 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120531 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120626 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120709 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5051237 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150803 Year of fee payment: 3 |