JP2000516006A - 複数のキーフレームを並列に表示することによりビデオ内容を案内する方法及び装置 - Google Patents

複数のキーフレームを並列に表示することによりビデオ内容を案内する方法及び装置

Info

Publication number
JP2000516006A
JP2000516006A JP10529208A JP52920898A JP2000516006A JP 2000516006 A JP2000516006 A JP 2000516006A JP 10529208 A JP10529208 A JP 10529208A JP 52920898 A JP52920898 A JP 52920898A JP 2000516006 A JP2000516006 A JP 2000516006A
Authority
JP
Japan
Prior art keywords
keyframes
video
keyframe
displayed
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10529208A
Other languages
English (en)
Inventor
マルコ ポーロ セッカレリ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Priority claimed from PCT/IB1998/000091 external-priority patent/WO1998034182A2/en
Publication of JP2000516006A publication Critical patent/JP2000516006A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/107Programmed access in sequence to addressed parts of tracks of operating record carriers of operating tapes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • H04N21/4316Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for displaying supplemental content in a region of the screen, e.g. an advertisement in a separate window
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47217End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for programme selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/445Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/50Tuning indicators; Automatic tuning control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/40Combinations of multiple record carriers
    • G11B2220/45Hierarchical combination of record carriers, e.g. HDD for fast access, optical discs for long term storage or tapes for backup
    • G11B2220/455Hierarchical combination of record carriers, e.g. HDD for fast access, optical discs for long term storage or tapes for backup said record carriers being in one device and being used as primary and secondary/backup media, e.g. HDD-DVD combo device, or as source and target media, e.g. PC and portable player
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/90Tape-like record carriers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/426Internal components of the client ; Characteristics thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4331Caching operations, e.g. of an advertisement for later insertion during playback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/445Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information
    • H04N5/45Picture in picture, e.g. displaying simultaneously another television channel in a region of the screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Databases & Information Systems (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Circuits (AREA)

Abstract

(57)【要約】 1列以上の複数のキーフレームを並列に表示することによりビデオ内容を案内するとともに、表示されたキーフレームの選択的アクセスにより前記ビデオ内容への実際のアクセスをこのようにアクセスしたキーフレームのマッピングを表しながら制御し得る方法である。この方法は、単一のユーザインターフェース編成内において、キーフレームをスクリーン上に時間的に整列した順序に配列する第1動作モードと、表示される連続キーフレーム間に多数の選択可能なグラニュラリティを有するキーフレームを配列する第2動作モードとの間で選択を行うことができる特徴を有する。

Description

【発明の詳細な説明】 複数のキーフレームを並列に表示することによりビデオ内容を案内する方法及び 装置発明の背景 本発明は、1列以上の複数のキーフレームを並列に表示することによりビデオ 内容を案内するとともに、表示されたキーフレームの選択的アクセスにより前記 ビデオ内容への実際のアクセスをこのようにアクセスしたキーフレームのマッピ ングを表しながら制御し得る方法に関するものである。後の選択的再生のために 記録されるビデオプレゼンテーションの代表的部分をキーフレームとして使用す ることが提案されている。連続ビデオストリームとはビデオが“オン”のままで あることを意味し、このストリームにはアニメーション、一連の静止画、又は画 像のインタラクティブシーケンスを含めることができる。そのキャラクタは種々 のもの、例えば映画、ニュース、又はショッピングリストとすることができる。 この技術はS.W.Smolalr及びH.J.Zhangの論文”Content-Based Video Indexi ng and Retrieval”、IEEE Multimedia、Summer 1994、pp.62-72に開示されてい る。 キーフレームはユーザ宅においてビデオ材料の受信時にこの材料から導出アル ゴリズムにより取り出すことができ、或いは例えばビデオプロバイダにより、各 ビデオショットがキーフレームで開始するようにキーフレームにラベルを付ける ことができる。第3の方法は、これらのフレームを標準ビデオ速度に関連する均 一の時間インターバルで互いに連続させる。本発明は、キーフレーム使用してビ デオプレゼンテーションのダイナミックなオーバビューを有用なファシリティと ともにユーザに与え、ビデオ材料へのアクセス、次の表示の選択又は選択解除、 又は編集を一層容にする必要があるという認識に基づくものである。 ビデオ画像のディジタル及び圧縮符号化に対する現在のプロジェクトに対する 特定の問題は、大容量媒体へのその記憶は一般に即時アクセスを許容せず、特に 単位記憶サイズ当たりのフレーム数で表せるリニア記憶密度が不均一である点に ある。テープのような高容量主記憶媒体に、小容量であるが高いアクセス速度を 有する補助記憶媒体を付加することが提案されている。この場合には、高速順送 り及び高速逆送りのようなトリックモードの実行、並びに次の表示ためにビデオ 材料を要約形、変更形、又は再配列形に編集する処理がユーザインターフェース の点及び記憶技術の点の双方から見てかなりの難点を生ずる。発明の概要 従って、本発明の目的は、特に、ユーザインターフェース編成に一層高いフレ キシビリティを導入するとともに、ユーザに記憶編成並びにビデオ材料の一層自 然なフィーリングを与えることにある。この目的のために、本発明の特徴は、単 一のユーザインターフェース編成内において、キーフレームをスクリーン上に時 間的に整列した順序に配列する第1動作モードと、表示される連続キーフレーム 間に複数の不均一の選択可能なグラニュラリティを有するキーフレームを配列す る第2動作モードとの間で選択を行うことができることにある。キーフレームを 時間的に整列した順序で提示すると、例えばこれらのフレームが標準ビデオ速度 に関連する均一の時間インターバルで互いに連続する場合には、高速順送り及び 高速逆送りを簡単に実行することができる。更に、フレーム間における可変グラ ニュラリティを有する階層レベルの簡単容易な変化により簡単容易なアクセス及 び編集を行うことができる。キーフレーム又は少なくともその一部分を映画ショ ットの開始部から取り出す場合、又はオリジナルフィルムエディタにより発生さ れた他の関連するイベントから取り出す場合にも同じことがいえる。このように して、クラスタリング処理を自動的に実行することができる。 本発明方法においては、現在選択されているキーフレームを他のキーフレーム に対し多数倍のフォーマットで拡大することによりこのフレームをハイライト表 示するとともに、有害なビデオインターレス効果を検出し、もしそうであれば、 垂直デシメーションによりこの効果を低減させ、且つ又表示前に画像にアップサ ンプリングフィルタ処理を施す。比較的小さいキーフレームのビデオ歪みは許容 し得ることが経験上解っているが、特定のキーフレームを拡大する場合には、画 像改善のために追加の手段を講ずる必要がある。本発明者は、このアップグレー ディングは、標準状態下の画質に必ずしも達しないが、画質の快適で有益な向上 をもたらすことを確かめた。 本発明は上述した方法を実施するよう構成した装置にも関するものである。本 発明の他の特徴は従属請求項に記載されている。図面の簡単な説明 本発明のこれらの特徴及び他の特徴及び利点を図面を参照して好適実施例につ いて以下に詳細に説明する。図面において、 図1はTV−レコーダ組合せ装置のブロック図であり、 図2はビデオ記録の代表的構造を示し、 図3はスクローリングモザイクユーザインターフェースの設計例を示し、 図4はスクローリングリストユーザインターフェースの設計例を示し、 図5はもっと広範なグラフィカルユーザインターフェースの設計例を示し、 図6はサブタイトルの表示を示し、 図7はシステム動作の状態図を示す。好適実施例の詳細な説明 特に、通常のカスタマ及びプライベートな家庭の使用に関係するが、このよう な使用に関係するものに限定されるものではない種々の利点は次のとおりである 。 ・キーフレームは代表的なTV観察距離に位置するユーザがこれらを互いに識別 し得るように提示させなければならない。 ・同時に提示するキーフレームの数はユーザにディジタルビデオ材料のコンテン ツの有意部分のオーバビューを与えるのに十分とすべきである。 ・キーフレームは、例えばアスペクト比を保持することにより無歪みの形で表示 すべきである。 ・TVセットのリモートコントロール装置自体がユーザコントロール装置として 動作するようにするのが好ましい。 ・フィードバック情報は代表的観察距離から認知できなければならない。 ・“ドラッグ”及び“ドロップ”のようなコンピュータコンセプトは一般に不要 にする。・種々の機能は連続的ではなく時折使用されるだけとなるように実現し なければならない。 ・ユーザインターフェースはビデオプレゼンテーションの良く知られたリニアモ デルを表すべきである。特定の実施例の説明 図1は本発明によるTV−レコーダ組合せ装置を示す構成図である。要素20 はTVセットディスプレイ及び関連する即時制御兼電源部を示す。要素22はア ンテナ、又はケーブル配信のような他のタイプの信号分配エンティティを有する 接続部を示す。この要素には受信信号からディジタルビデオ情報又はディジタル 信号部分を取り出すエンティティも適宜含めることができる。要素34は図1の 種々のサブシステム間のビデオストリーム及び関連する情報の経路指定部を示す 。経路指定は制御ボックス28によってライン35を介して制御信号により制御 することができる。ライン35は単一の双方向相互接続ラインとして示されてい るが、実際には任意の数の単方向又は双方向ラインからなるものとすることがで きる。制御ボックス28はディスプレイ20からライン30を経て検出信号を受 信するとともに他のサブシステム38、40から検出信号を受信し、これらのサ ブシステムを制御する。ブロック38はマルチギガバイト領域の極めて高い記憶 容量を有するリニアテープレコーダである。ブロック40は高い記憶容量を有す る磁気ディスクレコーダであり、このレコーダはレコーダ38の記憶容量の一部 分を有するにすぎないが、このレコーダのアクセス速度はクロストラックジャン プアクセスによりレコーダ38よりはるかに速い。ブロック38とブロック40 が一緒にコンピュータメモリキャッシュシステムに類似の2レベル記憶編成を構 成し、ビデオプレゼンテーションのすべてのアイテムを少なくとも1度記憶する 。要素24はディスプレイ装置20とワイヤレスパス26を介して通信するとと もにサブシステム28及び他のサブシステム38及び40と間接的に通信するリ モートコントロール装置を示す。 図2はビデオプレゼンテーションの代表的な構成を示す。ビデオ内容を機能的 にするために、バー60はビデオ自体を、フレームの形で、又はMPEG符号の ような圧縮ビデオ内容のストリングとして含む。情報はバーに沿ってビデオ時間 の進行とともに記憶されるが、実際の記憶要件は再生時間に亘って均一にする必 要はない。点在するキーフレームが68のような黒垂直ストライプで示されてい る。各キーフレームは次のキーフレームまでのインターバル内の全ビデオを表す もの、又はこれを代表するものとして使用される。キーフレームは、ビデオプロ バイダがラベルを付ける又は”テーブル・オブ・コンテンツ“(TOC)を挿入 することにより各新ショットの第1フレームとして選択することができる。或い は又、レシーバが、あるアルゴリズムにより、ビデオコンテントが一つのフレー ムから次のフレームヘ急激に変化することを検出することができる。本発明はこ のアルゴリズムが正しいものと仮定する。図に示すように、キーフレームの分布 は不均一にすることができる。他のメカニズムは、連続するキーフレームを規定 のインターバル、例えば2−3秒ごとに互いに連続させることにある。本例では 、表示部62にキーフレームのみを示す。更に、キーフレームは幾分階層構造に 編成され、表示部64は限定された一組の高レベルのキーフレームのみを示す。 この階層構造は多レベルにすることができ、表示部66はビデオプレゼンテーシ ョン60の全体に対する単一のキーフレームのみと関連するものとすることがで きる。キーフレームの種々のレベルは上述した編成と異なる編成内で定めること ができ、並べることもできる。 図1において記憶マッピングを、ビデオプレゼンテーションの本体をテープレ コーダ38に記憶するとともに、少なくともキーフレームをできれば関連するキ ーフレームの直後の短いビデオ及び/又はオーディオインターバルと一緒にディ スクレコーダ40で再生するように行うことができる。このようなインターバル の長さはリニアテープレコーダ38の待ち時間に対応させて、リアルタイムアク セスを達成することができる。ビデオプレゼンテーションは映画のように本質的 にリニアなものとし得る。他の使用では、所定の記憶インターバルにアニメーシ ョン、静止画、又はコンシューマに使用される他の画像を含めることができる。 あるキーフレームはこれを抑圧することができる。これは、当該キーフレームの 前の時間インターバルをその後の時間インターバルと有効に結合する。リセット 機能によりインターバルを再び分離することができる。また、種々のクラスのキ ーフレーム、例えば一定の時間インターバルで互いに分離されたクラスのキーフ レームを抑圧することができる。種々の異なるクラスのキーフレーム、例えば受 信時にローカルアルゴリズムにより発生されるキーフレームに対しプロバイダに より導入されるキーフレームを1つのプレゼンテーションに使用することができ る。 図3はスクローリングモザイクユーザインターフェースの設計例を示す。どの スクリーンも左上から出発して右下まで20個のキーフレームを提示する。各キ ーフレームは図示のキーフレームの総合順位の番号を有している。実際には、キ ーフレーム144が矩形の制御カーソルによりハイライト表示されている。ユー ザはリモートコントロールを駆動し、カーソル装置のナビゲーション制御部によ ってカーソルを表示されたキーフレーム上及び上部及び底部に表示されたバーに 表示されたボタン上を自由に移動させることができる。ユーザが制御カーソルを 左上コーナにおいて左に移動させると、表示が20キーフレームだけ後ろにジャ ンプする。右下コーナにおいて右に移動させると、表示が20フレームだけ前に ジャンプする。スクリーンの上部バーをアクセスすることにより5つの等しい長 さの部分に分割されたプレゼンテーションの他の部分のアクセスを制御すること ができ、黒い水平バーが全プレゼンテーションのうちの、ここに表示された20 個のキーフレームによりカバーされる全時間を示す。 最初に特定のキーフレームを選択し、次いで底部ボタンの1っを選択すること により他の機能を開始させることができる。"view program"(プログラムビュー) ボタンはカーソルでアクセスしたキーフレームでの開始を制御する。"View segm ent"(セグメントビュー)ボタンはビュープログラムと同一であるが、次のキーフ レームで終了する単一セグメントのみを再生する。"view from x to y"(xから yまでビュー)ボタンはカーソルでアクセスした2つのキーフレームのうちの時 間的に早い方のフレームでの開始と、時間的に遅い方のフレームでの停止を制御 する。他のモードをキーフレーム選択機能とともに実現することができる。例え ば、ユーザが特定のインターバルの発生をチェックできるようにするFast-forwa rd(高速順送り)又はslow-forward(低速順送り)、又は所定のビデオ効果を達成 するfast/slow reverse(高速/低速逆送り)を達成することができる。表示中に 、特定のキーフレームに関連する瞬時の通過時に、このキーフレームがアクティ ブになり、次のキーフレームと関連する瞬時に到達するまでビデオストリームを 有効に表示する。次のキーフレームの到達時に、このフレームがアクティブフレ ームになる。このような機能によって、ユーザはビデオレコーダをインタ ーバル表示シーケンスに対し、例えばコマーシャルのような所定のセグメントを 削除することにより、低速順送りによって所定のディテールに注意が向くように ストレートフォワードにプログラムすることが可能になる。表示中に、図示して ない制御ボタンによりオーディオをアクティブにしたり、抑圧したりするするこ とができる。或いは又、オーディオを制御し続けるが、ビデオカーソルはディス クリートにして、適切なハイライト指示によりインターバルからインターバルに ステップするのみとすることもできる。 図4はスクローリングリストユーザインターフェースの代表的な設計例を示す 。本例では、全スクリーンはその底部に表示された5つのキーフレームを有し、 キーフレーム145がそのエッジに沿って移動する矩形の制御カーソルによりハ イライト表示されている。キーフレーム145は大きな倍率でバックグラウンド 内にも表示される。この制御インターフェースは図3のものと同一であるが、ボ タンの位置が相違している。拡大キーフレームはマルチキーフレームバー内に抑 圧することもできる。 図5はもっと広範なグラフィカルユーザインターフェースを示す。第1に、左 右のコラムは、play(再生)、stop(停止)、select(選択)、cut(切り取り )、paste(張り付け)、fast reverse(高速逆送り)、zoom+(ズーム+)、zo om-(ズームー)、fast forward(高速順送り)のための制御ボタンのコラムであ る。底部の行はほとんど相関を有しないそれぞれ異なるシーン又はショットに関 連する9つのキーフレームのシーケンスを有する。キーフレームの階層構造内の ステップ移動により、シーンからシーンへダイナミックな良好なオーバビューを 集めることができる。キーフレーム間隔は、例えば10秒にすることができるが 、これより大きい又は小さい間隔を使用することもできる。特に連続するキーフ レーム間の間隔が小さい場合には、高速順送りのような機能が実現される。他方 、同一の大きさの間隔を全オーディオのフル再生のために使用することができる が、ビデオは1つのキーフレームから次のキーフレームへジャンプするのみであ る。この場合、更に中心キーフレームが拡大表示される。十分に低いグラニュラ リティを有する小間隔のキーフレームを再生すると、拡大キーフレームをダイナ ミックに提示することができ、高速順送り(又は逆送り)モードを実行すること がで きる。本例では帆船を示す次のキーフレームの材料に到達すると、底部の行が1 位置だけ左にシフトし、左端の“太陽”が消え、新しいキーフレームが右端から 現れる。このような表示は特に背景記憶媒体からプレゼンテーション上にマップ され、標準ビデオより速いフレームレートで行うことができる。 図6は図5につき述べた汎用フォーマット内のサブタイトルのプレゼンテーシ ョンを示す。中央領域内のスペース50が実際のフレームに割り当てられ、スぺ ース52がビデオプレゼンテーションから取り出された、又は他の関連情報、例 えば聴覚障害者用に変換されたスピーチ−テキスト又は実際に使用されている言 語とは別の言語への翻訳に関連するサブタイトルの表示に割当てられている。サ ブタイトルはスクリーン底部の7つのキーフレームに関連する範囲からのみ取り 出す必要はない。それらの関連性はもっと広げることができる。更に、各キーフ レームはタイムコード54又はその上に置かれる他の関連データを有する。制御 ボタンの2つの列56、58が左側にアプリケーション操作用に、右側にイント ラプログラムオペレータ用に割り当てられている。スクリーンの上部は表示され ている実際のビデオ番組のタイトル60を有する。 実際にアクティブなキーフレーム領域内を時間とともに移動するビデオカーソ ルのダイナミックリプレゼンテーションを有するように構成する理由は、キーフ レームのスタティック提示だけではビデオプレゼンテーションを全体としてダイ ナミックにしてユーザにイベントの展開を良好に理解せしめるには不十分である からである。このためにセマンティクスを次のように向上させる。システムは、 所定の時間の休止後に、関連するオーディオ及び他の効果を含むディジタルビデ オ材料を縮小して表示することを開始するため、カーソルが“内包する”キーフ レームが“アライブ”になる。再生中に、次のキーフレームに到達すると、カー ソルはユーザインターフェース内に提示されている次のキーフレームに自動的に “ジャンプ”し、これはユーザがシステムとのインタラクションを(再び)開始す るまで続く。一般に、ここに記載する編成は全ビデオストリングと異なるこれと は別の情報の走査検索を可能にする。任意のキーフレームから次のキーフレーム へのジャンプとともにオーディオのみをダイナミックに再生する場合でも、ユー ザは特定の低い記憶要件において提示ビデオの良好な印象を得ることができる。 この点において、図7はシステム動作の状態図である。状態100において、 システムは多数のキーフレームを表示しながらユーザからの入力を待つ。このよ うな入力は表示されている多数のキーフレーム間のジャンプ、別の組のキーフレ ームへのジャンプ、関連するインターバルを表示するキーフレームの選択を含む ことができる。任意のこのような入力は矢104を駆動し、新しい時間インター バルを開始させる。このような入力がn秒(例えば20秒)間ないと、矢108が 駆動され、状態102に到達する。この状態において、システムはダイナミック なビデオカーソルフレームを実行する。ユーザ入力が受信されない限り、矢11 0が駆動され、システムは表示可能なビデオ材料を入手し得る限り表示しつづけ る。しかしユーザ入力が受信されると、矢106が駆動され、システムはダイナ ミックなビデオカーソルフレームの実際のコンテントの位置、又は実際のインタ ーバルの開始位置に留まる。“インタレーシング”効果により影響されたキーフレームの検出及びフィルタリ ング ビデオプログラムのコンテントを走査検索するのに使用するキーフレームのい くつかは高い動きを有するシーケンスから抽出されたものであることがある。こ れは、ビデオシーケンスが通常の如くインタレース符号化モードで符号化され、 フレームが完全なフレームの構成に起用する2つのフィールドからなり、偶数ラ インが一方のフィールドに属し、奇数ラインが他方のフィールドに属する場合に は、わずらわしいジグザグ効果を発生する。この問題は小さいキーフレームにお いて一層顕著になり、わずらわしくなり、この場合には画像が拡大され、ライン が太いブロックになると、この効果が一層目につくことになる。 最初に、このようなインタレーシング効果により影響されたキーフレームを検 出する必要がある。この効果は画像の行上に観察され、輝度変化が高い周波数値 を発生する。この点を利用して、空間周波数スペクトルを多数のサブバンドに分 割し、高い周波数成分のみを考慮する。実際には、検出しようとする効果は偶数 ラインと奇数ラインとの間で交互の輝度値を示すはずであり、従ってこの画像は 高いサンプリング周波数を有するはずである。列上の周波数変換(FFT又は好 ましくはDCT)の最高周波数成分である係数のみを計算する必要がある。画像 がジグザグ効果により影響されると、この成分が高い値を有する。 しかし、この効果は動きを有する物体、特に水平方向に動き成分を有する物体 にも対応して見える。従って、係数の総和は考慮すべきでない。その理由は、係 数の総和は詳細且つ高コントラストのパターンを有する画像において高い値を発 生し、最終的に誤りを発生するからである。画像をいくつかの小部分に分割し、 最大値/区域を考慮することにより一層良好な結果を得ることができる。例えば 、各区域の2つの最高値を加算することにより総和が高度に詳細な画像に影響さ れなくなる。 最後に、低い垂直解像度はジグザグ効果よりわずらわしくないので、この画像 をフィルタリングする最も簡単な方法は1つのィールドのみを考慮し、これを垂 直方向に2倍にアップサンプリングするものである。次のセクションで述べる補 間フィルタを得られた画像を表示する前に適用することができる。 従って、検出及び補正は次のように行われる。第1ステップは行の半分、偶数 行又は奇数行、を除去することにより1つのフィールドを捨て、次にキーフレー ムの元のサイズを復元するために2倍のアップサンプリングを行い、その後に補 間フィルタ処理を行う。この場合には、補間フィルタは簡単なリニア補間を行う 。アップサンプリング及び補間 TV観察距離から容易に見えるようにするために、キーフレームは補間フィル タが後続するアップサンプリングによりほぼフルスクリーンサイズに拡大する必 要がある。一般にキーフレームは低い解像度を有するので、高い倍率で拡大する 必要がある。これは、更に処理すると、画素が大きなブロックになるので、結果 は見やすいものにならないことを意味する。従って、画像をフィルタ処理する必 要があるが、良好な画質の画像を発生させ、高い解像度で表示させる必要がある 一方、短い応答時間を有するように高速処理する必要があるため、トレードオフ を見出す必要がある。問題は、拡大を画像の飛行中に行う必要がある点にある。 即ち、このことは、ハードディスクに記憶するためには必要とされる記憶スペー スが大きくなりすぎるため画像を一度も拡大及びフィルタ処理することができな いことを意味する。これがため、アップサンプリング及びフィルタリング処理は 、同時に許容し得る結果を維持しなからできるだけ高速にする必要がある。一般 に、 通常の補間フィルタを使用することができる(ディジタル信号処理に関する任意 の本:例えばH.C.Andrews,C.L.Pattersonの論文"Digital Interpolation of Di screte Image",IEEE Trans.Comput.196,v25,pp.196-202参照)。 画質を向上させる他の技術を使用することもできる。特に、ウェーブレット法 及びフラクタル法は高い計算負担を導くが視覚品質において顕著な結果を示す。 実際上、フラクタル圧縮技術は公知であり、同一の復号処理を反復することによ りディテールを高解像度で再構成する又はシミュレートすることができる。この 場合には、記憶する画像を高い圧縮率を発生するフラクタル圧縮画像とする。同 様に、ウェーブレット変換を使用することにより、一層高いスケールで高周波数 成分を予測して、ボケ効果のない高解像度画像を得ることができる。サブタイトルに基づくビデオプログラムのテキストサーチ 現在のビデオ伝送においては、番組と一緒にサブタイトルがしばしば伝送され る(多くの場合、アナログシステムでは垂直ブランキング期間内に挿入され、デ ィジタル伝送では個々のエレメンタリストリーム内に挿入される)。これは通常 外国語で配信される番組に対し使用され、或いは聴覚障害者のために使用される 。このような情報は通常スクリーン上に重畳されるが、記憶媒体に記録すること もできる。このようにすると、番組の音声及び時には聴覚障害者のための音声の 記述をサーチ処理に利用することができる。 この種の情報の抽出はプログラムを記録しながらリアルタイムで行う必要があ る。この技術をキーフレーム抽出ルーチンに結合すると、画像を関連するテキス ト、即ちキーフレームが抽出された番組部分に生ずるダイアログに結合すること ができる。このように、現在のテキスト検索技術を用いて特定のキーワードに基 づくテキスト検索を実行することができる。アプリケーションの特定のツールが 、現在“Web”サーチエンジンにおいて慣用されているように、キーワードに基 づく簡単な問合せを実行することができる。 一例として、ニュース番組が記録されたものとする。フランスに関するニュー スを検索したい場合には、キーワード“フランス”を挿入すると、システムは自 動的に番組のテキスト内のこのワードを探す。結果がイエスなら、ユーザにキー ワードが見つけ出された番組の部分及びサブタイトルの特定部分に関するキーフ レームが提示される。次いでユーザは番組を特定の点から見ることができる。問 合せの結果として多数のキーフレームが検出される場合には、これらのキーフレ ームのすべてが図5に示すようにスクリーンの底部に表示されるため、ユーザは 関連するテキストを1つづつ大きなウィンドウ上で分析することができる。結果 がノーの場合には、同種のキーワード(フランス、パリ)を使用することができ る。このシステムはスポーツ番組において特定のチーム又は特定のスポーツをカ バーするレポートを検索するのにも有用である。 多くの他の用途が可能であり、例えば映画が子供が見てもよいものか否かの検 査、会話に使用されている言葉が“不道徳言語”のリストに含まれているか否か の検査に使用することができる。 このようなシステムの可能な拡張として、 ・テキストがビデオから分離して得られない場合には、スクリーンの静止画から 、例えばOCR技術により抽出すること、 ・音声認識技術を用いて番組から会話を抽出すること、 がある。この場合には、システムは放送業者により提供されるサービスと常に無 関係に動作し、サブタイトルが設けられていない場合には、システムを学習させ て少なくともいくつかのキーワードに基づいてテキスト検索を常に実行し得るよ うにすることができる。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),JP,KR

Claims (1)

  1. 【特許請求の範囲】 1.1列以上の複数のキーフレームを並列に表示することによりビデオ内容を案 内するとともに、表示されたキーフレームの選択的アクセスにより前記ビデオ 内容への実際のアクセスをこのようにアクセスしたキーフレームのマッピング を表しながら制御し得る方法において、 単一のユーザインターフェース編成内において、キーフレームをスクリーン 上に時間的に整列した順序に配列する第1動作モードと、表示される連続キー フレーム間に不均一の選択可能なグラニュラリティを有するキーフレームを配 列する第2動作モードとの間で選択を行うことができることを特徴とするビデ オ内容案内方法。 2.前記時間的に整列した順番において時間的に中心に位置するキーフレームに 関連するオーディオインターバルを順次に再生することを特徴とする請求項1 記載の方法。 3.順次のオーディオインターバルが離散分離したキーフレームのシーケンスに 対しほぼ連続したオーディオ表現を構成することを特徴とする請求項2記載の 方法。 4.第2動作モードにおいて、実際にアクセスされたキーフレームに関連するオ ーディオインターバルを再生することを特徴とする請求項1記載の方法。 5.現在選択されているキーフレームをハイライト表示すると同時に、このキー フレームを他のキーフレームに対し多数倍の大きさのフォーマットに拡大し、 更に、有害なビデオインタレーシング効果を検出し、このような効果が検出さ れる場合には、このような効果を垂直デシメーションにより軽減させることを 特徴とする請求項1記載の方法。 6.現在選択されているキーフレームをハイライト表示すると同時に、このキー フレームを他のキーフレームに対し多数倍の大きさのフォーマットに拡大し、 更に、画像を表示する前に画像にアップサンプリングフィルタ処理を施すこと を特徴とする請求項1記載の方法。 7.関連するキーフレーム又はキーフレームのシーケンスに対し抽出されたサブ タイトル又は他の関連情報を表示することを特徴とする請求項1記載の方法。 8.請求項1に記載された方法を実行するよう構成された装置。
JP10529208A 1997-02-03 1998-01-22 複数のキーフレームを並列に表示することによりビデオ内容を案内する方法及び装置 Pending JP2000516006A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP97200286.9 1997-02-03
EP97200286 1997-02-03
EP97201802.2 1997-06-16
EP97201802 1997-06-16
PCT/IB1998/000091 WO1998034182A2 (en) 1997-02-03 1998-01-22 A method and device for navigating through video matter by means of displaying a plurality of key-frames in parallel

Publications (1)

Publication Number Publication Date
JP2000516006A true JP2000516006A (ja) 2000-11-28

Family

ID=27238396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10529208A Pending JP2000516006A (ja) 1997-02-03 1998-01-22 複数のキーフレームを並列に表示することによりビデオ内容を案内する方法及び装置

Country Status (3)

Country Link
EP (1) EP0914638A2 (ja)
JP (1) JP2000516006A (ja)
KR (1) KR100552248B1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7495795B2 (en) 2002-02-21 2009-02-24 Ricoh Company, Ltd. Interface for printing multimedia information
US7596755B2 (en) 1997-12-22 2009-09-29 Ricoh Company, Ltd. Multimedia visualization and integration environment
US7747655B2 (en) 2001-11-19 2010-06-29 Ricoh Co. Ltd. Printable representations for time-based media
US7861169B2 (en) 2001-11-19 2010-12-28 Ricoh Co. Ltd. Multimedia print driver dialog interfaces
US7954056B2 (en) 1997-12-22 2011-05-31 Ricoh Company, Ltd. Television-based visualization and navigation interface
US8635531B2 (en) 2002-02-21 2014-01-21 Ricoh Company, Ltd. Techniques for displaying information stored in multiple multimedia documents

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8249423B2 (en) * 2008-05-08 2012-08-21 Sony Ericsson Mobile Communications Ab Electronic devices and methods that insert addressable chapter marks relative to advertising content in video streams
KR101537592B1 (ko) 2008-09-03 2015-07-22 엘지전자 주식회사 이동단말기 및 그 제어 방법
GB2477800A (en) 2010-02-16 2011-08-17 Nds Ltd Video trick mode playback
CN116150428B (zh) * 2021-11-16 2024-06-07 腾讯科技(深圳)有限公司 视频标签获取方法、装置、电子设备及存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7596755B2 (en) 1997-12-22 2009-09-29 Ricoh Company, Ltd. Multimedia visualization and integration environment
US7954056B2 (en) 1997-12-22 2011-05-31 Ricoh Company, Ltd. Television-based visualization and navigation interface
US8739040B2 (en) 1997-12-22 2014-05-27 Ricoh Company, Ltd. Multimedia visualization and integration environment
US8995767B2 (en) 1997-12-22 2015-03-31 Ricoh Company, Ltd. Multimedia visualization and integration environment
US7747655B2 (en) 2001-11-19 2010-06-29 Ricoh Co. Ltd. Printable representations for time-based media
US7861169B2 (en) 2001-11-19 2010-12-28 Ricoh Co. Ltd. Multimedia print driver dialog interfaces
US7495795B2 (en) 2002-02-21 2009-02-24 Ricoh Company, Ltd. Interface for printing multimedia information
US8635531B2 (en) 2002-02-21 2014-01-21 Ricoh Company, Ltd. Techniques for displaying information stored in multiple multimedia documents

Also Published As

Publication number Publication date
KR20000064909A (ko) 2000-11-06
KR100552248B1 (ko) 2006-06-15
EP0914638A2 (en) 1999-05-12

Similar Documents

Publication Publication Date Title
US6222532B1 (en) Method and device for navigating through video matter by means of displaying a plurality of key-frames in parallel
JP3667262B2 (ja) ビデオスキミング方法及び装置
EP2127368B1 (en) Concurrent presentation of video segments enabling rapid video file comprehension
Yeung et al. Video visualization for compact presentation and fast browsing of pictorial content
EP1024444B1 (en) Image information describing method, video retrieval method, video reproducing method, and video reproducing apparatus
WO1998034182A2 (en) A method and device for navigating through video matter by means of displaying a plurality of key-frames in parallel
US6154771A (en) Real-time receipt, decompression and play of compressed streaming video/hypervideo; with thumbnail display of past scenes and with replay, hyperlinking and/or recording permissively intiated retrospectively
KR100252538B1 (ko) 부호하된 영상 데이터로부터 직접 얻은 아이콘을사용하는 영상 편집 기술
US8627206B2 (en) Image processing device and image processing method for displaying images in a spiral form
EP1227417A2 (en) Selective viewing of video based on one or more themes
US20030086692A1 (en) Special reproduction control information describing method, special reproduction control information creating apparatus and method therefor, and video reproduction apparatus and method therefor
KR20020026099A (ko) 비디오의 지능형 빨리 보기 시스템
KR20040108726A (ko) 메타데이터 편집 장치, 메타데이터 재생 장치, 메타데이터 배신 장치, 메타데이터 검색 장치, 메타데이터 재생성 조건 설정 장치, 메타데이터 배신 방법 및 힌트 정보 기술 방법
JP2000516006A (ja) 複数のキーフレームを並列に表示することによりビデオ内容を案内する方法及び装置
JPH11220689A (ja) 映像ソフト処理装置及び同処理プログラム記録記憶媒体
WO1998034181A2 (en) A method and device for keyframe-based video displaying using a video cursor frame in a multikeyframe screen
JP2002281433A (ja) 動画像検索閲覧編集装置および記録媒体
JP2000287165A (ja) 画像情報記述方法、映像検索方法、映像再生方法、映像検索装置、及び映像再生装置
KR20010035099A (ko) 장면 전환 자동 검출을 이용한 스트리밍 하이퍼비디오시스템 및 그 제어 방법
KR20020023063A (ko) 비디오 콘텐트의 구조적 정보를 이용한 비디오 스키밍방법과 장치
KR100370249B1 (ko) 샷 세그멘테이션 정보를 이용한 비디오 스키밍 시스템
JP4667356B2 (ja) 映像表示装置及びその制御方法、プログラム、記録媒体
JPH11260041A (ja) マンガ型映像編集方法及び装置ならびに該編集方法を記録した記録媒体
Akutsu et al. Video interface for spatiotemporal interactions based on multi-dimensional video computing
KR100678895B1 (ko) 모델 기반 세그먼트 메타데이터를 생성하는 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071225

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080307

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080414

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080826

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20081031

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20081126

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090225

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090512