JP3579111B2 - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP3579111B2 JP3579111B2 JP08345695A JP8345695A JP3579111B2 JP 3579111 B2 JP3579111 B2 JP 3579111B2 JP 08345695 A JP08345695 A JP 08345695A JP 8345695 A JP8345695 A JP 8345695A JP 3579111 B2 JP3579111 B2 JP 3579111B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- importance level
- time
- evaluation value
- importance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
【産業上の利用分野】
本発明は、例えば映像、音声、文書等の情報を統合的に表示、記録、再生、編集するマルチメディア情報処理装置に関する。
【0002】
【従来の技術】
パーソナルコンピュータ(PC)などに搭載されるマイクロプロセッサの性能向上はめざましく、普及型のPCで大量の情報を高速に処理できる環境が整いつつあることは周知である。また、近年の光通信技術や通信制御技術、及び光磁気ディスクや高密度集積回路によるメモリ素子等の発展により前者において情報伝送路が大容量化し、後者において情報蓄積装置が大容量化していることも作用して、家庭やオフィスでも安価な装置で大量の情報を電子的に入手することができるといったことが実現しつつある。
【0003】
また、同様に簡単な操作で情報を発信することができるため、これまで放送局や新聞社などに限られていた情報発信の特権が、一般の利用者へと広がり、さらに大量の情報が行き交うようになりつつある。このことは、現在のパソコン通信や電子メールや電子ニュース等の普及からもうかがい知ることができる。また、PCに限らずこのように情報をやり取りできる端末は、電子手帳、携帯電話、ファクシミリ等、あらゆる装置の形で浸透している。そして、それらが扱うことのできる情報の種類も、従来の文字情報(テキストデータ)のみから、音声・音楽情報、静止画像情報、動画像情報へと広がり、その品質もそれぞれ飛躍的に向上している。
【0004】
しかし、情報分類の手法に関しては、旧来の方法がとられている場面が多く、例えば電子ニュースの世界を例にとれば、ニュースグループ(=話題ごとの「くくり」)が何百と存在し、かつ各ニュースグループには1日数十もの投稿がなされる。そして、ユーザは、その中から自分が必要とする、又は関心のあるニュースを探すために少なからず時間を費やさなければならない。これは各ニュースが、「ニュースグループ→ニュース」という、ごく単純な、かつユーザが通常自分では定義できない層構造で取り扱われているためである。音楽テープやビデオテープにおいても、楽曲・番組ごとの開始位置は、無音部分や録画開始のインデックス信号を検出すること等で判定できるが、その楽曲・番組の内容、又は特に関心のある場面や部分を指し示す情報は記録できないため、ユーザは、それらのラベル等に自らそれらを示す情報を書き込む等より他に方法がない。
【0005】
これらの情報の分類、又は複数の情報の中から特徴となる部分を抽出する作業を自動化しようとする開発は、現在も盛んに行われている。しかし、それらの中の多くは人間の判断機構を代替することを目標としており、高度な人工知能を必要とし、開発の時間の面からも、また費用の面からも、現時点ではコストがかかりすぎるといわざるを得ない。また、そのような自動分類システムには、ユーザは自分が望むものを指示してやる必要があり、何が見たい、どのような情報を得たい、といったビジョンのはっきりしないユーザには扱いづらい。このような不案内なユーザは、情報があふれる時代にこそ激増するものと想定できる。
【0006】
むしろ必要とされるのは、「おもしろい(=interesting )と感じる場所がここである」と示す情報であり、必ずしもその内容を記述することを必要としているわけではない。たとえば映画の中で1場面だけ魅力的な俳優が出演していたとき、その俳優が誰なのか、男なのか女なのか、さらにそのオブジェクト(被写体)が人間なのか、という情報は常に必要ではなく、ただその場面を指し示してくれる装置であれば十分要件は満たされる場合が多い。にも関わらず、現在の情報分類の流れでは、「情報を装置が精査する→特徴となる部分を候補として抽出する→ユーザが入力した要求情報と照合する→分類・提示を行う」という手順であるため、いったん情報内容の解析を入念に行わなくてはならなくなる。
【0007】
一方、一般の利用者が情報発信源となりつつある現在、情報加工ツールの要求も高まっている。これまでの加工ツールとしては文書情報のためのワードプロセッサ、図形情報のためのCAD(Computer Aided Design )や描画ソフトウェア等がある。しかし、とりわけビデオや音声に関しては操作性のよい一般向けのツールはきわめて少ないといわざるをえない。利用者は、2台のデッキを接続して、一方のデッキでは目的となる場所を探して再生し、他方のデッキでそれを録画するという作業により「切り張り」編集を行っている。「切り張り」編集を行うためには最低でも2台のデッキが必要であり、また操作も繁雑であるために、一般の利用者は編集作業を敬遠しがちである。現在提案されている編集方法の中には、コンピュータのメモリやハードディスクなどの記憶媒体にビデオ・音声情報をいったん蓄積して、コンピュータの編集環境で情報加工するものもあるが、このためには大容量の記憶媒体を必要とするうえにコストが高く、根本的には「切り張り」の編集であるために操作性の特段の向上は期待できない。
【0008】
以上のように、簡便で効率的な情報自動分類機構や情報加工手段がないことは、今後のマルチメディア統合環境が普及することへの大きな妨げになる恐れがある。
【0009】
【本発明が解決する課題】
以上詳述したように、従来の情報処理装置では、多種多様の情報を、情報の種類を越えて効率よく、かつ利用者の意図を反映して分類・整理などを行う手段がなかった。このために、利用者は、その情報の処理作業に時間と労力を割かなければならず、これを装置として自動で行う場合にも、必ずしも個々の利用者に適応して処理できないという欠点があった。また従来は情報の加工方法も繁雑で、その実現のためには高コストとなりやすいという欠点もあった。
【0010】
本発明は、上記実情に鑑みなされたものであり、多種多量の情報から簡便な操作で効率よく利用者が必要とする情報を加工、提示することのできる情報処理装置を提供することを目的とする。
【0011】
【課題を解決するための手段】
前述した目的を達成するために、この発明の情報処理装置は、画像情報及び音声情報の少なくとも一方を利用者に提示する提示手段と、前記提示手段により提示されている前記情報の任意の区間に対して連続的に評価値を入力、修正する入力修正手段と、画像情報におけるカットまたは音声情報におけるフレーズの区切りを示す前記情報の意味的区切り間における前記評価値に基づいて、該意味的区切り間の時間区間の評価値を算出する算出手段と、前記算出手段により算出された評価値がしきい値を越える時間区間の合計が所望の時間内で最大となるしきい値を求め、このしきい値を越える評価値の時間区間からなる所望の時間分の時間区間単位の要約を作成する要約作成手段とを具備することを特徴とする。
【0012】
また、この発明の情報処理装置は、前記算出手段が、前記情報の意味的区切り間における前記評価値の最大値を該意味的区切り間の時間区間の評価値とすることを特徴とする。
【0013】
また、この発明の情報処理装置は、前記算出手段が、前記情報の意味的区切り間における前記評価値の平均値を該意味的区切り間の時間区間の評価値とすることを特徴とする。
【0015】
また、この発明の情報処理装置は、画像情報を利用者に提示する提示手段と、前記提示手段により提示されている前記画像情報の任意の区間に対して連続的に評価値を入力、修正する入力修正手段と、前記画像情報のシーンチェンジ間における前記評価値に基づいて、該シーンチェンジ間のカットの評価値を算出する算出手段と、前記算出手段により算出された評価値がしきい値を越えるカットの合計が所望の時間内で最大となるしきい値を求め、このしきい値を越える評価値のカットからなる所望の時間分のカット単位の要約を作成する要約作成手段とを具備することを特徴とする。
【0019】
【作用】
本発明に係る情報処理装置によれば、例えば動画像を見ながら逐次入力した評価値からいわゆるカット単位の評価値が算出されるので、その結果、該動画像から所望の時間分の動画像を評価値の高い順にカット単位で抽出することが簡単に行えるようになる等、簡便な操作で効率よく利用者が必要とする情報を加工、提示することが可能となる。
【0022】
【実施例】
以下、図面を参照して本発明の実施例を説明する。
【0023】
(第1実施例)
図1は第1実施例に係る情報処理装置の構成を示すブロック図である。
【0024】
同実施例では、利用者の「重要である/ない」についての評価値を入力する方法として、利用者の視線を検出し、その視点の移動の様子から上記評価値(以下、重要度レベルという)を自動判定する場合について説明する。なお、視点の移動から重要度レベルを算出する方法については第3実施例において詳述する。
【0025】
記録媒体107から読み出し制御部105を介して読み取られた情報は、提示部106に表示されるが、そのときの利用者の視点は検出器101によって位置検出される。判定部102内では上記視点情報が一定時間分記録されて処理される。この処理は、例えば5秒分の利用者の視点を1/30秒ごとに検出し、150個データが集まるごとに重要度推定計算を行うなどというように行われる。判定部102では、送られてきた視点データから、その記録時間内での重要度レベルを算出する。この例では、5秒ごとに、前5秒の重要度レベルが出力されるというように行われる。ここで、重要度レベル算出は、記録間隔と同じ周期で行われる場合に限らない。例えば、今回送られてきた5秒分のデータのうち過去側2.5秒の視点データと、前回送られてきた5秒分のデータのうち現在側2.5秒のデータとを併せて重要度レベル算出を行う、という過程を間に入れることによって、2.5秒間隔で重要度レベル出力が可能になる。当然、同様の方法で出力間隔をさらに短くすることも可能である。
【0026】
判定部102より一定の出力間隔で送られる重要度レベルは、提示情報全体にわたって重要度情報一時記憶部110に記憶され、記録媒体107に記録される。ここでいう提示情報全体とは、1番組分、映画1本分、写真アルバムの1旅行分等のストーリーの1まとまりに対応する区間等で、通常これらは従来の方法で既に区切りがはっきりしている(VTRのインデックス信号、映画ソフトの1巻、アルバムの見出し、あるいはコンピュータデータの1ファイル等)。記録媒体107は、提示情報が記録されていたものと同一の媒体でも異なる媒体でも構わない。例えば、光磁気ディスクから読み出して提示した画像情報に関する重要度レベル情報は、もとの光磁気ディスクに保存してもよいし、重要度レベル保存用のメモリICを用いてもよい。あるいは通信ネットワークで結ばれた遠隔の記録装置から読み出して提示した情報(たとえばビデオ・オン・デマンド等)に関する重要度レベル情報を、ネットワークを介して元の記録装置に戻して記録してもよいし、利用者が端末として利用しているコンピュータ側で記録しておいてもよい。この例では、提示情報全体にわたって重要度情報を重要度情報一時記憶部110に一時記憶する場合を述べたが、情報提示中でも判定部102が、逐次、重要度判定を行い、記録媒体107において原情報提示と重要度情報記録が同時に行えるような条件下では、情報提示と並行して重要度情報を記録媒体107に記録してもよい。
【0027】
次に、重要度情報を変更したい際、記録された重要度レベルは、記録媒体107から読み出され、提示情報全体に関して修正が施される。この修正は、修正演算部104によって装置が自動的に行うものと、利用者の操作に従って行われるものとがある。まず修正演算部104によって自動的に行われる修正について説明する。
【0028】
重要度レベルを逐次入力していく場合、時間的に後に入力したレベルほど自由度が低い。たとえば、2時間の映画を見ながら0から100までの重要度レベルを入力する場合、55分経過時に最も高い関心をおぼえてレベル100を付与したとする。しかしその後、1時間40分経過時に前よりも高い関心をもったと感じても、前を上回る最高のレベルを付与することはもはやできない。そこで以下の方法により、入力限度最高のレベルが持続した場合、実際には入力限度を上回るレベルに達していたと考え、実際の最高レベルを推定する。
【0029】
図2は同実施例に係る情報処理装置において重要度レベルを修正するアルゴリズムを示すフローチャートである。
【0030】
この動作は、実際には図1中の修正演算部104が、重要度情報一時記憶部110と重要度レベル情報をやり取りしながら行われる。以下の説明、及び図2中で、DATAは修正すべきデータ数、tn はn番目(nは0から始まる)のサンプリング時刻、In は時刻tn での重要度レベルである。また(tave,k ,Iave,k )は、(tn ,In )を平滑化したときのk番目の座標である。thold,Ihold,n,kはこのアルゴリズム内でのみ使用する仮の変数である。Imax は許容される重要度レベルの最高値で、例えば0から100の範囲で重要度の高さを入力しようという場合にはImax は100となる。
【0031】
図2に示すフローチャートでは、重要度レベルの時間推移を平滑化する部分だけを示している。平滑後レベルIave はステップS201、ステップS218に示すように、元の重要度レベルIと同じ初期値、終了値を持つ。また、重要度レベルが最大値Imax である状態が3サンプル続いたとき、この区間(以下でオーバーフロー区間という)にImax を越えるレベルが存在しえたと推定し(ステップS206、ステップS211)、オーバーフロー区間の入口と出口を元の重要度レベルと一致させる(ステップS213〜ステップS217)。後処理でオーバーフロー区間を検出し、区間内の仮想的な最高レベルを推定する。それ以外の区間では、極大値と極小値の中点を平滑後レベルの座標点としている(ステップS207、ステップS212)。
【0032】
次に、平滑後レベル(tave,k ,Iave,k )を利用してオーバーフロー区間の重要度レベルの変化を推定するが、これについて図3を用いて説明する。
【0033】
オーバーフロー区間301内では、区間の入口302および出口303で区間外の変化と同じ値、同じ傾きを持つような2次又は3次関数と推定する(境界条件)。例えばオーバーフロー区間301の入口302、出口303の時刻がそれぞれts ,te 、入口での平滑後レベルの傾きがA、出口での傾きが(−B)であったとすると、オーバーフロー区間301内で推定される時刻tでの重要度レベルI´(304)の式は
【0034】
【数1】
となる。
【0035】
次に、このように描かれた連続曲線304上で、元の時刻ti にあるものを新しいIi として置き換える。以上の過程は、それぞれ必要なデータが揃い次第逐次行うことができるので、重要度レベルデータの入力と平行して処理し、入力の終了時にはオーバーフロー区間を推定したIi を確定させることができる。
【0036】
さて、ここまでで確定したIi ではオーバーフロー区間においてデータはImax 以上の値となっていることがありうるため、全体を0からImax の範囲内に圧縮する必要がある。そこで、以下の式をもってIi を変換する。
【0037】
【数2】
ここでWmax は全体の重要度レベルデータの中での最高値である。ただし、Wmax がImax を越えていない場合にはこの変換は行わない。この変換は、大きな値ほど強く圧縮されるため、元からImax の範囲内にあったデータが受ける影響が少なくて済むという特徴を持つ。また、この変換によって元のデータの大小関係が失われることはない。さらに、平滑化したデータをもとにオーバーフロー区間の推定を行っているために、オーバーフロー区間の入口直前、出口直後の局所的なIi の急峻/緩慢な立ち上がりの影響が小さい。
【0038】
以上では、重要度レベルが規定値の範囲の最大に達している場合の修正について説明したが、重要度レベルの規定値の最小に達している場合についても同様の方法で修正を施してもよい。
【0039】
次に、利用者の操作によって重要度レベルの変更・修正を行う場合の例について図4を用いて説明する。
【0040】
この操作は図1中では以下のようにして処理される。まず利用者は、マウス等の入力装置、又は先に用いた視線検出器をポインティングデバイスとして転用することによって、同実施例の情報処理装置に指示を与える。この指示は、操作インタフェース109によって受け止められ、操作インタフェース109は利用者の入力に応じた画面/音声変化(これに関しては後で説明する)を出力すべくアドレス生成部112に信号を送る。アドレス生成部112では、表示すべき原情報の位置を記録媒体107上の格納場所(アドレス)として出力し、読み出し制御部105へと送る。読み出し制御部105は、記録媒体107を機械的にコントロールし、媒体上のしかるべき位置から原情報をとりだす。取り出された原情報は原情報一時記憶部113へ送られ、既に入力されている重要度情報とともに画面作成部114においてグラフィカル・ユーザインタフェースとなり、画像提示部106及び音声提示部116を介して利用者に提示される。
【0041】
一方、利用者は、この画面を見ながら重要度レベルを修正するわけだが、この操作に伴う重要度レベルの変更は、修正演算部104を介して行われる。既に入力されている重要度レベルは重要度情報一時記憶部110に蓄積され、この操作によって修正演算部104で修正され、再び重要度情報一時記憶部110に帰還する。修正が終了すると、一時記憶された重要度レベル情報は、記録制御部103へ出力され、記録媒体107上でアドレス生成部112によって指定されたしかるべき格納場所へ記録される。当然ながら、重要度情報をいくつかに分割して、分割の一つを重要度情報一時記憶部110に蓄積し、修正→帰還→記録→次の分割を一時蓄積、という動作を繰り返してもよい。
【0042】
ここで、図4に戻り実際の処理について述べる。
【0043】
上述の方法で重要度レベルを入力した後、本発明の情報処理装置は重要度レベルの極大値、極小値と、それぞれを記録した時刻を列挙する。そして極大値の大きなものから順に、極大値を記録した画像402を画面上に提示する(図4の(a))。ここで提示する画像の数は、3枚、5枚、10枚等、任意に設定することができる(図4では3枚の例を示す)。また、提示する画像402は、必ずしも極大値を示した瞬間の画像でなくてもよく、その極大値を含むカット(2つの連続したシーンチェンジの間)の先頭画面でもよく、また、提示された画面をマウスでクリックすることで、その最大値を含むカット全体にわたって再生を行うようなものであってもよい。
【0044】
この提示された画面402から、利用者は本装置が利用者自身の重要度レベルをどう推定したかを知ることができる。提示された推定重要度レベルに違和感があるとき、利用者は、この画像を並べ替えることによって、本装置に順位の訂正を指示する。例えば、本装置が2位と推定した場面403が、実は1位と推定した場面404よりも「重要である」と利用者が感じた場合、利用者は2位の画面403を1位の画面の上へと変更する指示を行う。並べ替えの操作は、図1中の入力装置108により行うが、キーボード、ボタン又はリモートコントローラのキーパッド等で訂正したい画像(上の例では2位の画面403)を選び、次に新しい順位の場所(1位の画像の上の位置405)を選ぶ。あるいは、同様の操作をマウスを用いて行ってもよい。また、視線検出装置101を利用して、該画面を注視することによって選択を行ってもよい。
【0045】
順位の訂正が指示されると、本装置は指示された画面前後での重要度レベルをどの値に変更すべきかを決定する。例えば、2位と3位の中間へと訂正を行った場合、2位の重要度レベルと3位の重要度レベルの中間値等となる。あるいは、1位を上回るレベルへの訂正を行った場合、1位と2位の重要度レベルの差と同じだけ1位の重要度レベルより高い値等となる。例えば、1位のレベルが80、2位のレベルが78、3位のレベルが70であるようなとき、1位の部分を2位と3位の間に訂正すると、1位の部分の変更先の重要度レベルは74となる。また、同じ例で、2位の部分を1位の上に訂正すると、変更先の重要度レベルは90となる(移動対象となっている2位=78は計算に用いないので、82とはならない)。この訂正の結果は改めて画面に(例えば図4の(b)のように)表示され、利用者は自分の訂正の結果を知ることができる。
【0046】
以上のように、変更先の重要度レベルが決定されたときの変更手続きを、図5を用いて以下で説明する。
【0047】
まず、重要度レベルを下方に変更する場合(図5の(a))、変更したい極大値503をはさんで、その前後の極大値(504、505)の間の範囲を変更する。変更前の極大値をIp 、変更先の重要度レベルをIadj とすると、変更したい極大値の前後の極大値(504、505)から、前後の極小値(506、507)の間(504から506までと、507から505まで)は、IからIadj /Ip の間を線形に変化する関数を、もとの重要度レベルにかけ合わせる。前後の極小値にはさまれた区間(506から507まで)では、一定値Iadj /Ip をかけ合わせて、新たな重要度レベルとする。図5の(a)の下部に示したのは、そのかけ合わせる関数の概形である。一方、重要度レベルを上方に変更する場合(図5の(b))、変更したい極大値508をはさんで、その前後の極小値(509、510)の間を変更する。下方に変更する場合と同様にIp 、Iadj を定義すると、前後の極小値(509、510)から変更する極大値508まで、IからIadj /Ip の間で線形に変化する関数を、もとの重要度レベルにかけ合わせる。同様に図5の(b)の下部に示したのは、そのかけ合わせる関数の概形である。
【0048】
もし、この変更の結果、重要度レベルが予め設定された重要度レベルの最大値Imax を越えた場合、図3をもちいて上述したのと同様の方法で、Imax に収まる範囲へと補正する。この補正は、すべての順位変更が終わってから行ってもよいし、必要に応じて順位変更ごとに行ってもよい。
【0049】
最後に、以上のようにして入力・補正された重要度レベルを用いて、自動的にもとの情報を加工・提示する方法について説明する。
【0050】
この場合、図1においては原情報と重要度レベル情報との両者が記録媒体107から読み出し制御部105を介して読み出され、それぞれ原情報一時記憶部113、重要度情報一時記憶部110に蓄積されるが、重要度情報一時記憶部110の重要度レベル情報に基づいて原情報のうちの提示すべき部分が提示部分選択部111によって選択される。これについては後で詳しく述べる。アドレス生成部112では、選択された部分に関する情報を提示部分選択部111より受け、記録媒体107上で提示すべき情報が記録されている場所をアドレスとして出力する。読み出し制御部105では、このアドレス情報に基づいて選択的に記録媒体107にアクセスし、原情報の部分を原情報一時記憶部113に送る。以降の過程はすでに説明した画面表示方法と同じである。
【0051】
ここでもちろん、アドレス生成部112では記録媒体からの読み出し場所を制御する代わりに、原情報一時記憶部113からの読み出し場所を制御してもよい。この場合、一般的に読み出しスピードの向上を望むことができる(現状では一般に記録媒体107に用いられる光磁気ディスクなどのアクセススピードよりも、原情報一時記憶部113に用いられる半導体メモリ素子の方が早い)。以下では提示部分選択部111で原情報の部分選択を行う過程を具体的に説明する。
【0052】
ここで説明する加工・提示の方法は、情報の意味的区切り(動画像のシーンチェンジ、音声・文書の文章単位や段落単位、音楽のフレーズ=4〜16小節程度で構成される展開のパターン)を、既存の画像認識、音声認識など別の方法で検出し、その区切りを利用する場合と、しない場合の2通りがある。
【0053】
まず、区切りを利用しない場合について図6を用いて説明する。
【0054】
利用者は、情報加工の結果として生成される提示情報に希望する時間的長さを入力する。これはボリュームつまみのようなものによってもよいし、キーボードを用いて直接「何分何秒」と入力してもよい。即ち、時間長を入力する方法であれば、一般に用いられているいかなる方法でも構わない。本装置では、しきい値601を、規定の重要度レベル最大値Imax 602より徐々に下げてゆき、重要度レベルの時間推移603の中で、しきい値601を越える時間区間604の合計を計算する。この計算結果が入力された提示希望時間を越えるまで、しきい値601を下げる過程を続ける。このようにして提示希望時間を越える直前のしきい値601が決定したとき、本装置はしきい値601を越える時間区間604だけを順次提示する。あるいは、重要度レベルのしきい値以上の極大値605の瞬間の情報を画面に列挙しておき、その画面をマウスまたは注視などで選択したときには、この極大値を含んでしきい値を越える時間区間を提示するという方法もある。これによって、利用者は情報の全時間のうち、特に重要度の高い部分だけを選択的に見ることができる。
【0055】
次に、情報の意味的区切りが既知で、それを利用する場合について図7を用いて説明する。
【0056】
まず情報が動画像である場合について説明する。
【0057】
動画像に対応して重要度レベル701が付与されており、動画像の意味的区切りであるシーンチェンジ702がわかっているとする。時間的にとなりあう2つのシーンチェンジ702間の時間区間をカット703と呼ぶことにする。1つのカット703内では、重要度レベルはそのカット703での最大の値704に一致させる。こうすることによって、上記の情報の区切りを利用しない場合と同じ方法が利用できる。
【0058】
即ち、しきい値705を徐々に下げ、しきい値705を越える時間区間の合計が設定された提示希望時間を越える直前のしきい値705を求める。このとき、しきい値705を越える時間区間、即ちカットを順次提示することによって、カット単位で要約を作成することができる。
【0059】
また、カット703内の重要度レベルを、そのカットでの最大の極大値を用いるかわりに、カット703内の重要度レベルの積分値をカット703の長さで割った「重要度レベル密度」706に一致させて、上記と同様のカット選択を行うこともできる。
【0060】
この2つの選択方法が持つ意味の違いは、前者(カット703内の重要度レベルは最大の極大値704)が、瞬間的な最大の印象の強さでカット703を評価するのに対して、後者(カット703内の重要度レベルはカット703内での平均値706)は、カット703全体が与えた印象の強さで評価していることである。
【0061】
以上の中で「順次提示」を行う際のアドレス生成部112の動作の例を図8を用いて説明する。
【0062】
図8中の折れ線グラフのうち、右にあるもの((b))は図6のグラフを90度回転したものである。図6を用いて説明した方法で選択された部分がハッチングして示してある。この様な場合、選択された部分を順次提示する時には、アドレス生成部112は、図8の左((a))に示すようなアドレスを出力する(ただしこれは記録媒体107上に原情報の時間経過と線形に記録がなされた場合である。時間経過と因果関係のない配置で原情報が記録されている場合、図8左のグラフの縦軸はアドレスの代わりに提示すべき時刻位置を示す)。即ち、要約提示の際、選択された時間区間では正常な動作速度で再生され、そうでない場所はスキップされる。選択された部分が上述のようにカット単位の場合でも動作は同じである。
【0063】
上記のようにして選択されたカットは、選ばれたカットを時間的に前にあるものから順次提示する方法の他に、カットの重要度レベルが高いものから順に提示する方法がある。その他にも、選択されたカットの先頭画面だけを小画面として画面に列挙し、利用者がその小画面をマウスや視線などで選択すると、そのカットの動画像が提示されるという方法もある。ここで、カットを代表させる画面はカットの先頭画面である必要はなく、そのカット中で最も高い重要度レベルを示した瞬間の画面を表示してもよい。あるいは、上で述べてきたような方法で提示すべき場所だけを選定しておき、それぞれの区間の提示時間の早さや方向、順序などは利用者の操作によって自由に変化させられるようになっていてもよい。このようにすると、例えば10秒ずつ30枚提示される静止画が原情報であるような場合、特に重要な画像10枚だけを重要度レベルのしきい値をもちいて選択しておき、その10枚中の1枚1枚は好きな時間だけ見る、といったことが可能になる。
【0064】
次に、情報が音楽(曲)であって、情報の区切りがわかっている場合の例を図9を用いて説明する。
【0065】
図9にあるように、例に示す曲801は10のフレーズで構成されている。ダッシュ(´)のつけられた部分は、同じ記号でダッシュのない部分の変形である。Aは前奏(イントロ)、Dは間奏、Fは後奏(エンディング)と一般にいわれる部分で、歌の部分がBB´C(1番=1コーラス目)、B´CEC´(2番=2コーラス目)である。A、B、などというフレーズを図7を用いた説明でのカット703に置き換えて同様の処理を行い、重要度レベルの高いフレーズ802を抜き出せば、その曲全体を聞くことなく、もっとも印象深い部分だけを聞くことができる。目的の曲を探すような場合に、こうして作られた曲の要約だけを次々に聞いていけば、印象に残った部分に達するまでの時間を節約できるので、検索に要する時間が短くなることが期待できる。
【0066】
(第2実施例)
次に第2実施例として、本発明の情報処理装置においてユーザが行う処理、及び提示部での表示について図を用いてより詳細に説明する。
【0067】
同実施例では入力のためのポインティングデバイスにマウスを使用することを仮定しているが、本発明に係る情報処理装置においては、いかなるポインティングデバイスでも使用可能である。
【0068】
まず、ユーザが重要度レベルを利用して動画像の提示を行う場合のユーザの操作、及び提示部での表示について説明する。
【0069】
ユーザが動画像を提示させるときには、提示部にはたとえば図10又は図11のような表示を行う。図10は表示させる動画像を大きく表示させており、一方図11では動画像に付与された重要度レベルを同一画面内で明示している。これらの表示方法は、用途によってユーザが選べるようにしておく。ここで、1000は重要度レベルを利用して動画の表示を行うときに重要度レベルのしきい値を調節するためのレバーで、レバーを上に上げれば動画像の重要度レベルの高い部分のみが提示されるようになり、逆に下に下げれば重要度レベルの低い部分までも提示されるようになる。これは、第1実施例で図6や図7を用いて説明したのと同様である。
【0070】
1001は、提示時間表示窓であり、レバー1000によって重要度レベルのしきい値が設定されたときに、一つの動画の中でしきい値を上回る重要度レベルが付与された部分の合計がどの程度の時間になるかを表示するものである。この図の例では12分41秒となっている。ユーザは動画の大まかな内容をある時間内で見てしまいたいときには、窓1001の中の時間を見ながらレバー1000を調整すればよい。もちろん、第1実施例で説明したように、直接窓1001の中に時間を打ち込むことにより、重要度レベルのしきい値を設定することも可能である。この際には、窓1001にマウスカーソルをあわせてクリックし、次にキーボード等の入力装置から時間を入力する。希望の時間に設定ができたら、1008の操作ボタンのうち、「はじめから再生する」ボタンを押すことにより、動画の中の重要度レベルの高い部分だけを希望の時間内で見ることができる。この際には、第1実施例で説明した情報の意味的区切りを利用する場合、及び利用しない場合のどちらでも場合においても同様の手続きによって動画の提示を行うことができる。
【0071】
1003は、重要度レベル表示窓であり、この中には動画の時間軸に対応して付与された重要度レベル1004が表示されている。また、1009は、重要度レベルしきい値設定レバー1000によって設定されたしきい値のレベルを示している。窓1003の中には通常、動画全体のうちの一部分が表示されており、動画全体の中のどの部分であるかは1006の窓内に表示される。図11の例では、動画全体が65分であるのに対し、重要度レベル設定窓内に表示されているのは約20分から35分までの間の15分程度である。ユーザは窓1003の中に表示された重要度レベルを見ながら、レバー1000を動かすことにより重要度レベルのしきい値を調整することができる。たとえば、動画の中の現在表示されているフレーム付近に大変興味があり、その周辺をもっと見てみたいと感じたときには、一時的に(再生を一時停止するなどして)重要度レベルのしきい値を下げてから動画の再生を行い、興味のある部分を見てしまったら再び重要度レベルのしきい値を元のレベルに戻す、といったことができる。
【0072】
以上の操作は、動画だけではなく静止画群や音声に対しても行うことができる。ここでいう静止画群は、何らかの順序を持った静止画の集まりである。例えば、旅行に行ったときに撮った写真は、撮影した順番を持った静止画の集合であるから、ここで言う静止画群である。静止画群を提示する際には、窓1003の横軸は時間ではなく、静止画の何番目という順序を表すことになる。また、映像を持たない音声は、1002の表示窓に音声の波形を表示したり、または特定の音のオン・オフの情報をバーチャート形式で表示するようにしてもよい。波形の場合には1003上のカーソルの位置に対応した時間を中心にその前後の時間にわたる波形が表示される。音のオン・オフの情報を表示する場合には、マウスカーソルの位置に対応した一瞬の状態の表示、又は波形の場合と同じく前後の時間にわたるオン・オフ状態の表示を行う。
【0073】
また、動画像、静止画群、音声のどの場合も、ユーザの設定した重要度レベルのしきい値により選択された部分を再生する際に、再生速度、もしくは再生時間はユーザによって自由に選択できるようにしてもよい。例えば、動画や音声の場合は、通常の再生速度で表示するほか、再生速度をその部分の重要度によって決められた倍率だけ変化させて提示する方法や、カットで区切られた一つのシーン(音声の場合は、一小節などの区切り)は同一の時間で表示させるように再生速度をコントロールするなどの方法から選んで再生する。静止画群の場合は、ユーザの指示があるまで次の静止画を表示させない方法、一枚の静止画につき一定の時間だけ表示させる方法、または重要度によって決められた時間だけ表示させる方法などから選択できる。
【0074】
ここまで重要度レベルは動画一つにつき一種類しか付与されていないことを前提に説明してきたが、重要度レベルは複数付与することも可能である。例えば、一つの動画や音声、静止画群に対しても利用者ごとに重要度レベルを用意することもできるし、また、目的別によっていくつかの重要度レベルを付与することも可能である。具体的には、例えば動画がドラマであったときに、アクションシーンを見るといった目的や、泣かせるシーンを見たいといった目的でそれぞれ別の重要度レベルを付与することができる。
【0075】
1005は、重要度レベル選択ボタンで、それぞれのボタンに用意されている重要度レベルの名前が表示されている。例えば、利用者の名前であったり、アクションシーン、泣かせるシーンといった目的別の名前などが表示されている。他の重要度レベルを使って動画の提示を行うためには、ボタン1005を選択し直せばよい。窓1003の中では他の重要度レベルを選択すると、それに応じて指定されたボタンに対応する重要度レベルを表示するよう変更される。
【0076】
重要度レベルの種類として、ユーザの履歴を設けることもできる。これは、動画の中でユーザが既に見てしまった部分とまだ見ていない部分とを重要度レベルとして明示させるためのものである。まだ見ていない部分には高い重要度レベル、そして既に見てしまった部分については低い重要度レベルを付与しておけば、重要度レベルのグラフを見ることによってそれぞれの分類が一目瞭然になる。むろん、重要度レベルのしきい値設定レバー1000を調整してまだ見ていない部分のみを選択して提示させることも可能になる。この場合、重要度レベルはユーザが動画を見るたびに更新されなければならない。
【0077】
複数の重要度レベルの中から一つの重要度レベルを選択して動画の再生時に利用するほかに、複数の重要度レベルを選択し、選択された重要度レベルに所定の演算を施して新たな重要度レベルを定義し、利用することもできる。例えば、二つの重要度レベルを選択し、どちらかつ重要度レベルがユーザの設定したしきい値を上回る部分を選択して表示させたい場合には、二つの重要度レベルの論理和をとればよい。より具体的には、「スリル」という重要度レベルと「美女」という重要度レベルが用意されているときに、スリルがある、又は美女が登場しているシーンだけを選択して見たいものとする。そして、「スリル」の重要度レベルが図12の(a)、「美女」の重要度レベルが図12の(b)のごとくであったものとする。ユーザは「スリル」と「美女」の重要度レベルを選択し、さらに「どちらかがしきい値を上回る部分の提示」を行う旨を指示し、重要度レベルのしきい値を入力する。これらの重要度情報はユーザが重要度レベルの選択を行ったとき、又は動画、音声、制止画群など源情報を選択したときに、記録媒体107から読み出され、重要度情報一時記憶部110に保存される。そして、二つの重要度情報の演算を行うためにそれぞれの重要度情報は修正演算部104に送られる。
【0078】
修正演算部104では、「スリル」がある、又は「美女」が出ている場面を選択して提示するために、まずそれぞれの重要度レベルについて、操作インタフェース109より入力された重要度レベルのしきい値を上回る部分に1、下回る部分に0を割り当て、2値化する(図12の(c)、(d))。そして、対応するフレームごとに2値化された重要度レベルの論理和をとる(図12の(e))。
【0079】
このとき、演算結果として1が得られたフレームが提示されるフレームである。このようにして二つの重要度レベルの演算により新たに作られた重要度レベルは重要度情報一時記憶部110に送られる。必要であれば、新たに作られた重要度レベルは記録制御部103を介して記録媒体107に記録される。重要度情報一時記憶部110に記録された新たな重要度レベルは、実際にユーザに提示される部分を決定するため、提示部分選択部に送られ、しきい値との比較の結果、提示部分が決定される。
【0080】
二つの重要度レベルの間の演算としては、上記の論理和のほか、論理積を使うこともできる。これは、二つの重要度レベルの両方が指定したしきい値を越えている場面だけを見たい場合に利用することができる。上記の例では、「スリル」があってなおかつ「美女」も登場している場面を見たいときに利用できる。二つの重要度レベルの論理和を求めるには、修正演算部104に送られた二つの重要度レベルを先程と同様にしきい値と比較をして2値化する。そして、2値化された重要度レベルの論理積をとって新たな重要度レベルとし、重要度情報一時記憶部110に送る。その後の処理は論理和の時と同様である。
【0081】
また、その他の演算として二つの重要度レベルの平均(和)も利用できる。これは、例えば複数の人が同一の映像に対して重要度レベルを付与した場合に、利用者がなるべく客観的な重要度レベルを利用したいと思っている場合や、様々な目的別の重要度レベルが付与されている映像に対して、全体的な重要度レベルを利用したいときなどに便利である。平均重要度レベルを求めるため、まず論理和を行うときと同様に二つの重要度レベルが重要度情報一時記憶部110から修正演算部104に送られる。修正演算部では二つの重要度レベルの平均を計算し、新たな重要度レベルとする。新たな平均重要度レベルは重要度情報一時記憶部110に送り返され、先程と同様、必要があれば記録媒体107に記録される。そして提示部分を決定するため、新たな平均重要度レベルは提示部分選択部へ送られ、操作インタフェース109に入力されたしきい値との比較により提示部分の選択が行われる。
【0082】
重要度レベル間の演算を行って新たな重要度レベルを求める方法は、二つの重要度レベルだけに限られるものではない。もっと多くの重要度レベルを選択し、それらの間の複数の演算を組み合わせて新たな重要度レベルを求め、利用することも可能である。
【0083】
また、図10や図11のような提示の他に、図13や図14のような提示の方法を選択できるようにしておく。
【0084】
図13では重要度レベルの設定レバー1000や時間表示窓1001は図10や図11と同様である。しかし、レバー1000が設定されると、付与された重要度レベルがしきい値を上回る部分の中から代表的なフレームが選ばれ、提示される点が異なる(1100)。代表フレームは重要度レベルの高いフレームを表示可能な枚数だけ選択するのがよいが、時間的に隣接したフレームばかりが表示されないように所定の時間幅を設けて、その時間幅内では一つのフレームしか表示されないようにすると、動画全体から代表フレームが選ばれて都合がよい。また、重要度レベルのしきい値を低く設定すると提示される動画の時間が長くなり、これに伴って表示する代表フレーム数も多くなってしまう。このような場合は複数のページにまたがって代表フレームの表示を行うようにするとよい。
【0085】
代表フレームにマウスカーソルを合わせ、クリックして指定すると、図15のように動画を表示する窓1101が表示され、指定されたフレームから動画が再生される。
【0086】
図14の表示は図13のような代表フレームの表示と重要度レベルのグラフとを同時に表示させたものである。代表フレームが動画像のどの部分に対応しているかを明示させているので、このような表示を行うことによりユーザは自分で動画のどの部分を見るのかが明らかになる。
【0087】
静止画群の場合には、表示窓1100にはやはり重要度レベルによって選ばれた静止画が表示される。ただし、重要度レベル表示窓1003の横軸は時間ではなく、静止画の順序を表している。音声の場合には、表示窓1100には表示窓1002と同様に音声波形や特定の音のオン・オフの状態を示すバーチャートが表示される。
【0088】
以上のような手続きでユーザはすでに付与されている重要度レベルを利用して、動画の中の興味のありそうな部分だけを選択的に提示することができる。
【0089】
次に、ユーザが手入力で動画、静止画群または音声に重要度レベルを付与する場合、及び既に付与されている重要度レベルを修正する(第1実施例とは異なる)場合のユーザの手続き、及び提示部への提示について説明する。
【0090】
図16は手入力により動画の重要度レベルの付与、もしくはすでに付与されている動画の重要度レベルの手入力による修正を行う場合の、提示部に提示される画面の例である。
【0091】
重要度レベル入力もしくは修正に先立って、入力もしくは修正したい重要度レベルを重要度レベル選択ボタン1005で選択しておく。1200は重要度レベル設定窓で、この中で重要度レベルの入力もしくは修正を行う。1006は重要度レベル設定窓1003に表示されている時間部分を表示したものであり、窓全体が動画像全体、そして斜線部分が窓1002に表示されている時間部分に相当する。1201は現在1002に表示されているフレームがどの部分であるかを表示するための表示フレーム位置マークである。
【0092】
重要度レベル設定窓1200は、左右方向に動画の時間が対応しており、重要度レベル設定窓の上部には時間の目盛りが表示されている。重要度レベル設定窓内にマウスカーソル1007が入ると、マウスカーソルの位置に対応した時間のフレームが自動的に1002に表示される。また、重要度レベル設定窓1200内からマウスカーソルが外に出るときには、マウスカーソルが出る瞬間のカーソル位置に対応した時刻の映像を表示したままになる。静止画群に対して付与された重要度レベルの編集を行っているときには、静止画群の再生の際と同じように重要度レベル設定窓1200の横軸は静止画の何枚目という順番を表す。マウスカーソルが重要度レベル設定窓内にあるときには、マウスカーソルの横方向の位置に対応した順番の静止画が常に表示窓1002に表示される。一方、音声に付与された重要度レベルの編集を行うときには、表示窓1002には重要度レベル設定窓1200内のカーソルの横方向の位置に対応した時間を中心とするその前後にわたる区間の波形が表示される。波形ではなく、特定の音のオン・オフを示すバーチャートの表示でもよい。そして、重要度レベル設定窓1200内でマウスカーソルを移動させると、移動させた速度に合わせて対応した時間の音を出力する。マウスカーソルをゆっくり動かせばゆっくりとした音が出力され、すばやく動かせば早い音が出力される。このとき、マウスカーソルを動かした速度によって音の高低が変化してしまうので、これを抑制する処理を行うようにしてもよい。重要度レベルの設定を行うには、図17乃至図19のような操作を行うので、以下で説明する。
【0093】
まだ重要度レベルが付与されていないときには、全ての部分で基準レベルの重要度レベルが付与されている。従って、重要度レベル設定窓内の重要度レベル表示は基準レベルだけの平坦なものである。まず、重要度レベルを付与したい部分の最初のフレームを表示させるように重要度レベル設定窓内でマウスカーソルを動かす。最初のフレームが1002の表示窓に表示されたらマウスボタンを押す(図17)。マウスボタンは押したままマウスカーソルを移動させ(ドラッグ)、重要度レベルを付与したい最後のフレームを表示させるようにマウスカーソルを移動させる。このとき、重要度レベル設定窓内でのマウスカーソルの動きは、左右方向は動画の時間に対応し、上下方向は重要度レベルに対応している。従って、重要度レベルを付与する部分の最後のフレームを表示させるように左右にマウスカーソルを移動させつつ、マウスカーソルを上下方向にも移動して希望の重要度レベルに合わせる(図18)。目的のフレームの表示と付与したいい重要度レベルが同時に得られたならば、マウスボタンを離す(図19)。以上の操作により、はじめは平坦であった重要度レベルが図19のように指定した部分だけ変更される。
【0094】
一度の操作で複数の重要度レベルを設定された部分には、同じ重要度レベルの値が付与される。また、ここでは、はじめに重要度レベルを付与したい区間のはじめのフレームを指定し、次に最後のフレームをマウスで指定したが、はじめに重要度レベルを付与したい区間の最後のフレームを指定し、次にはじめのフレームと重要度レベルを同時に指定することも可能である。
【0095】
図17から図19では、重要度レベルは基準レベルよりも上に設定されたが、基準レベルよりも下側の重要度レベルを指定し、負の重要度レベルを設定することも可能である。動画の中にあまり表示させたくない部分が含まれるような場合には、負の重要度レベルを設定するとよい。重要度レベルが設定されていない部分に重要度レベルを付与するには、以上のような操作を繰り返し行えばよい。
【0096】
一度設定された重要度レベルに変更を加える(指定した範囲内の重要度レベルを一定倍率で拡大/縮小する)ときには、まずマウスカーソルを重要度レベル設定窓内の変更したい部分のはじめの部分にマウスカーソルを合わせる。表示窓1002に表示されたフレームが修正開始部分のはじめのフレームであることを確認した後、マウスボタンを押す(図21、図21)。マウスボタンを押したままマウスカーソルを移動させると、左右方向の移動で重要度レベルを変更する範囲を、そして上下方向の移動で変更範囲内の重要度レベルの拡大/縮小レベルを指定する(図22)。このとき、拡大/縮小の倍率は変更範囲内の最大の重要度レベルがマウスカーソルの上下方向の位置に対応するように設定される。即ち、変更区間の重要度レベルの最高値がImax 、マウスカーソルの上下方向の位置に対応する重要度レベルがIc であるとき、変更範囲内の重要度レベルは全てIc /Imax 倍される。変更範囲と変更値が決定したらマウスボタンを離し、変更を確定させる(図23)。このとき、マウスをドラッグしたまま重要度レベルの基準値よりも低い位置にマウスカーソルを合わせて確定すると、変更範囲内の正の重要度レベルを負の重要度レベルに変更することができる。もちろん同様の操作で負の重要度レベルを正に変更することもできる(図24の(a)〜(c))。
【0097】
また、最後に基準レベルの位置に合わせてマウスボタンをはなせば、変更範囲が全て基準レベルに設定し直されるので、重要度レベルをキャンセルする際に利用することができる。
【0098】
以上の説明では、重要度レベルを新たに設定する手続きと、設定されている重要度レベルを修正する手続きとは同じものである。新たな設定と修正のどちらが行われるかは、マウスをドラッグして左右に動かすことによって指定する時間範囲に、既に設定された重要度レベルが存在するか否かによって決定される。指定時間範囲内の重要度レベルが全て基準レベルであれば新たな重要度レベルの設定になり、指定時間範囲内に基準レベル以外の重要度レベルが含まれていれば修正が行われる。
【0099】
また、重要度レベルの設定及び修正は、重要度レベル設定窓1200内に表示された時間範囲内でしか行えない。重要度レベル設定窓内の時間範囲を変更するには、表示範囲指定窓1006を使う(図25〜図27)。表示範囲指定窓全体は動画全体を表し、そのうち斜線部分が重要度レベル設定窓内に表示されている時間範囲である。表示範囲指定窓の上部には対応する時間が表示されている。重要度レベル設定窓内の表示時間範囲を変更するには、表示範囲指定窓内の斜線部分にマウスカーソルを合わせ、ドラッグしたまま左右に移動させ、適当なところでマウスボタンを離して移動先を確定させる。このように斜線部分を移動させると、表示される範囲の長さを変更せずに、表示時間範囲を移動することができる。一方、斜線部分の先頭、もしくは終端部分をドラッグして移動させると、ドラッグされた先頭、もしくは終端部分がマウスカーソルとともに移動する。このとき、表示範囲指定窓内の斜線部分の大きさはマウスカーソルの動きに伴って変化し、従って重要度レベル設定窓内に表示される時間範囲の長さも変化する。
【0100】
重要度レベル設定窓に表示される時間範囲(静止画群の場合は何番目から何番目という順番の範囲になる)の変更は、表示範囲指定窓内で行うほか、図16の1202や1203のボタンをマウスでクリックすることによっても行うことができる。1202は左右へのスクロールボタンで、マウスカーソルをこのボタンに合わせてマウスボタンを押すことによって、重要度レベル設定窓に表示される時間範囲がボタンに表示されている方向に移動する。表示時間範囲の移動に伴って、表示範囲指定窓1006の中の斜線部分も移動する。図25は右(時間の順方向)へのスクロールボタンを押しているときの表示例である。スクロールを行っているときには、重要度レベル指定窓に対して表示フレーム位置マーク1201は動かない。従って、スクロールボタンを押してスクロールを行っている最中は、画像表示窓1002に表示されるフレームは表示フレーム位置マーク1201の指し示す時刻に対応して刻々と変化する。従って、スクロールボタンは図16のように重要度レベル設定窓の右端と左端に配置するのが好ましい。なぜならば、まず右にスクロールする際には、重要度レベル表示窓内の右端の映像を表示させておくとどこまでスクロールすべきかが決定しやすい。そこで右のスクロールボタンを重要度レベル設定窓の右端に設定しておくと、マウスカーソルが重要度レベル設定窓内を出る位置が自然に右端に近い位置になる。その結果として表示フレーム位置マークも右端に固定されて、表示されるフレームも重要度レベル設定窓の右端の部分になるためである。左(時間をさかのぼる方向)へのスクロールボタンは同様の理由で重要度レベル設定窓の左端が望ましい。
【0101】
1203は表示時間範囲の倍率変更ボタンで、ボタンに「2」と表示されているボタンをクリックすると、重要度レベル設定窓内に表示されている時間区間内の表示の詳細さが2倍になる。すなわち、重要度レベル設定窓内に表示される範囲は半分になるが、その分大きく、詳しく表示されるようになる。このとき、表示フレーム位置マーク1201に対応しているフレームが重要度レベル設定窓内で位置を変えないように表示される。図26は倍率変更ボタン1203を押す前の表示例で、倍率変更ボタンの「2」を押した後は図27の表示に変わる。倍率変更ボタン1203の「2」を押した後では、表示フレーム位置マークの左右の表示時間範囲が半分になっている。表示倍率変更ボタン1203の「1/2」は、「2」とは逆に表示の詳細さを半分にして、表示される時間範囲を2倍にするボタンである。やはり倍率を変えたときには表示フレーム位置マークのフレームが重要度レベル設定窓内で位置を変えないように表示される。また、いずれの表示倍率の変更も、変更を指定した後には表示位置指定窓1006内の斜線部分の大きさが、2倍もしくは1/2になる。表示倍率変更ボタン1203は、重要度レベル設定窓1200の中心付近に配置することが望ましい。これはスクロールボタンの配置と同様の理由による。即ち、表示の倍率を変更する際には、倍率変更後でも重要度レベル設定窓1200内の中心部分を表示させておきたい場合が多い。そのためには表示フレーム位置マークを重要度レベル設定窓1200内の中心部分においておく必要がある。従って、マウスカーソルが重要度レベル設定窓1200内から出る位置を中心部分にしなければならず、結局、倍率変更ボタン1203を中心部分に設定しておけば自然にこのような操作が行えることになるからである。
【0102】
なお、同実施例では変更できる倍率が2倍と1/2倍の2種類のみであるが、もっと多くの倍率を用意したり、ユーザが倍率を指定できるようにしておいてもよい。
【0103】
以上のような重要度レベルの選択、新規設定、変更、及び重要度レベルを付与する範囲の変更を行えば、動画や音声、静止画群に対する重要度レベルの設定が行える。
【0104】
次に、いったん重要度レベルを付与した後に、もう一度変更がないかどうか確かめるプレビュー操作について説明する。
【0105】
重要度レベルを付与した後に、妥当なレベル付けを行ったかどうかを確かめる操作がプレビューである。プレビューは図28のような表示のもとで行う。図28の表示は右側の一部分を除いて図11の表示と同じである。従って、図11と同一の部分を利用すれば、通常の再生と全く同様の操作が行える。ここで、何回か異なる重要度レベルのしきい値設定を行って動画の再生を行い、もしも重要度レベルの設定が満足のいくものであれば変更を加えることなく重要度レベルの設定を終了すればよい。
【0106】
しかしながら、満足のいかない重要度レベルが付与されている部分や、修正したい部分がいくつか見つかり、修正を行う必要が生じることがある。このような場合には、マーキングボタン1300やジャンプボタン1301を使う。マーキングボタンは修正したいところをマーキングしておき、後でまとめて修正する場合に有効である。プレビューで再生を行い、修正したいところが見つかるたびにマーキングボタン1300を押しておく。一通りプレビューによる再生が終わったら、再び手入力による重要度レベルの付与、修正を行う画面の表示に戻る(図29)。このとき、マーキングされた位置にはマーキングを示す印1302が表示されている。従ってこの部分を見つけて重要度レベルの修正を行えばよい。修正の操作は上述したとおりであるが、マーキングされた位置の重要度レベルが変更されたときには、マーキングは自動的に消えるようにしておく。また、動画中にマーキングされた部分が存在するときには、マーキングへのジャンプボタン1303が表示される。このボタンを押すと、現在表示されているフレーム位置よりも時間的に先の部分でマーキングされているところを探して、その部分が表示されるように重要度レベル指定窓内の時間範囲が変更される。このボタンの利用により、次々にマーキングポイントにジャンプして効率的に修正が行える。
【0107】
ジャンプボタン1301は、プレビュー中に直ちに重要度レベルの修正を行いたい場合に利用する。プレビュー中にジャンプボタンを押すと、直ちに図16の手入力による重要度レベルの付与、修正の表示が行われる。重要度レベル設定窓内の範囲はジャンプボタンを押したときにプレビューで表示されていたフレームを中心とするように設定されている。従って、ジャンプボタンを押したときのフレーム付近の重要度レベルが直ちに修正できる。
【0108】
以上のようなプレビュー及び修正を繰り返し、修正する部分がなくなれば、重要度レベルの付与、修正作業は終了する。
【0109】
(第3実施例)
次に、本発明に係る情報処理装置で、重要度レベルを推定する方法として眼球運動観察を利用した例について、図面を参照して説明する。
【0110】
図30は第3実施例に係る情報処理装置において、視点移動の様子から重要度レベルを推定する方法を示すグラフである。
【0111】
以下で説明する重要度レベル推定の過程は、上述した第1実施例において説明した判定部102の内部処理に相当する部分である。眼球運動測定装置から出力されるデータは、適切な補正と演算処理を施して画面上で利用者が実際に見ている視点データへと変換される。眼球運動測定装置から視点データを出力するまでの過程は任意の方法でよい。眼球運動測定装置には現在のところ、眼球に赤外線を照射して強膜からの反射光強度を観測するもの、目の周辺に電極を取り付けて眼球内の電位差を観測するもの、電磁石を内蔵したコンタクトレンズを装着して磁界を検出するもの、あるいは目の画像を撮影して画像処理によって視点を計算するもの等が知られている。
【0112】
以上のようにして得られた視点データの時間差分(微分)をとり、時刻ごとの視点移動速度901を求める。人間の眼球運動の中で最も早い運動であるサッケードは、主に視対象を20〜50ミリ秒の間に移すときに起こるが、同実施例の情報処理装置では、上記視点移動速度901がしきい値902を越える部分をサッケード期間903とみなす。サッケード中は速い眼球運動のため、視覚に入力される解像度は低いことが知られているが、サッケードの前(904)数十ミリ秒から、サッケードの後(905)200ミリ秒程度までの間、不鮮明な像となることが解明されている。したがって、一連のサッケード前904、サッケード期間903、サッケード後905の間は利用者が画面から得ている情報量は少ないものとみなすことができる。従って、重要度レベルを得たい期間906に対し、「利用者が画像から情報を効率よく得た時間」すなわち高情報密度時間907の合計の、重要度レベル測定期間906に対する比をもって重要度の高さの指標とすることができる。重要度レベル測定期間906は、第1実施例の中では5秒単位、カット単位などとして説明した。ここで、しきい値902は、10〜50[度/秒]程度の値である。
【0113】
図31に同実施例の方法により視線解析から重要度レベルを推定した実験の結果を示す。この実験においては、被験者は静止画像を15枚提示され、1枚ごとに自由な時間だけ見ることを許されている。従って、被験者が視察を終えるまでの時間を被験者自身の重要度の高さを評価する一つの尺度としてよい。図中で横軸は視察時間、縦軸は本発明の方法で推定した重要度レベルである。両者の間には、約80%の相関関係が見られた。もしもサッケードが画像内容に関わらず一定頻度で起こるものであるならば、提示時間と比例してサッケード回数も増加するために重要度レベルは一定となる。つまり、図中では水平線上に点が並ぶはずであるが、図31に見られるように長く見た(=重要度が高かったと考えられる)画像では比較的高い重要度レベルを推定しており、同実施例の方法の可能性を裏付けるものである。
【0114】
以上により、画像を見ている際の利用者の無意識で自然な反応である眼球運動から、利用者の重要度レベルを推定することができる。
【0115】
【発明の効果】
以上詳述したように、本発明に係る情報処理装置によれば、マルチメディア情報に例えば重要度レベルという付加情報を付与、修正することが可能になり、その重要度レベルを用いた情報の特徴抽出が、利用者の意図を反映した形式で、かつ高度な知識処理を必要とせず実現することができる。
【0116】
このように、情報の特徴抽出が容易になることで、利用者が情報にアクセスする時間の短縮が可能になり、ネットワークへの負担軽減に寄与するとともに利用者に専門的な知識を強要することのない使いやすい情報アクセスのインタフェースを提供できる。
【図面の簡単な説明】
【図1】本発明の実施例に係る情報処理装置の構成を示すブロック図。
【図2】第1実施例に係る情報処理装置の重要度レベルを修正するアルゴリズムを示すフローチャート。
【図3】第1実施例に係る情報処理装置のオーバーフロー区間の重要度レベルの変化を推定する方法を説明するための概念図。
【図4】第1実施例に係る情報処理装置の重要度レベルの変更・修正を行う際の操作方法を説明するための概念図。
【図5】第1実施例に係る情報処理装置の変更先の重要度レベルが決定されたときの変更手続き方法を説明するための概念図。
【図6】第1実施例に係る情報処理装置の情報の意味的区切りを利用しない加工・提示の方法を説明するための概念図。
【図7】第1実施例に係る情報処理装置の情報の意味的区切りを利用した加工・提示の方法を説明するための概念図。
【図8】第1実施例に係る情報処理装置の「順次提示」を行う際のアドレス生成部の動作原理を説明するための概念図。
【図9】第1実施例に係る情報処理装置の情報が音楽(曲)であって、情報の区切りがわかっている場合の動作原理を説明するための概念図。
【図10】第2実施例に係る情報処理装置の提示部の表示例を示した図。
【図11】第2実施例に係る情報処理装置の提示部の表示例を示した図。
【図12】第2実施例に係る情報処理装置の複数の重要度レベルを利用した処理方法を説明するための概念図。
【図13】第2実施例に係る情報処理装置の提示部の表示例を示した図。
【図14】第2実施例に係る情報処理装置の提示部の表示例を示した図。
【図15】第2実施例に係る情報処理装置の提示部の表示例を示した図。
【図16】第2実施例に係る情報処理装置の提示部の表示例を示した図。
【図17】第2実施例に係る情報処理装置の重要度レベルを設定する際の操作方法を説明するための概念図。
【図18】第2実施例に係る情報処理装置の重要度レベルを設定する際の操作方法を説明するための概念図。
【図19】第2実施例に係る情報処理装置の重要度レベルを設定する際の操作方法を説明するための概念図。
【図20】第2実施例に係る情報処理装置の重要度レベルに変更を加える際の操作方法を説明するための概念図。
【図21】第2実施例に係る情報処理装置の重要度レベルに変更を加える際の操作方法を説明するための概念図。
【図22】第2実施例に係る情報処理装置の重要度レベルに変更を加える際の操作方法を説明するための概念図。
【図23】第2実施例に係る情報処理装置の重要度レベルに変更を加える際の操作方法を説明するための概念図。
【図24】第2実施例に係る情報処理装置の重要度レベルに変更を加える際の操作方法を説明するための概念図。
【図25】第2実施例に係る情報処理装置の重要度レベルの設定及び修正を行う際の操作方法を説明するための概念図。
【図26】第2実施例に係る情報処理装置の重要度レベルの設定及び修正を行う際の操作方法を説明するための概念図。
【図27】第2実施例に係る情報処理装置の重要度レベルの設定及び修正を行う際の操作方法を説明するための概念図。
【図28】第2実施例に係る情報処理装置のプレビュー操作を説明するための概念図。
【図29】第2実施例に係る情報処理装置のプレビュー操作を説明するための概念図。
【図30】第3実施例に係る情報処理装置の視点移動の様子から重要度レベルを推定する方法を示すグラフ。
【図31】第3実施例で示した方法により視線解析から重要度レベルを推定した実験の結果を示す図。
【符号の説明】
101…検出器、102…判定部、103…記録制御部、104…修正演算部、105…読み出し制御部、106…画像提示部、107…記録媒体、108…入力装置、109…操作インタフェース、110…重要度情報一時記憶部、111…提示部分選択部、112…アドレス生成部、113…原情報一時記憶部、114…画面作成部、115…音声作成部、116…音声提示部、301…オーバーフロー区間、302…オーバーフロー区間の入口、303…オーバーフロー区間の出口、304…推定される重要度レベル、402…重要度レベルが極大値を記録した画面、403…順位変更を行いたい画面、405…順位変更先の位置、601…しきい値、603…重要度レベルの時間推移、604…選択される時間区間、605…選択される時間区間内での極大値、702…シーンチェンジ、703…カット、704…カットごとの最大値、705…しきい値、706…重要度レベル密度、802…重要度レベルの高いフレーズ、902…サッケードのしきい値、904…サッケード前の低情報期間、905…サッケード後の低情報期間。
Claims (6)
- 画像情報及び音声情報の少なくとも一方を利用者に提示する提示手段と、
前記提示手段により提示されている前記情報の任意の区間に対して連続的に評価値を入力、修正する入力修正手段と、
画像情報におけるカットまたは音声情報におけるフレーズの区切りを示す前記情報の意味的区切り間における前記評価値に基づいて、該意味的区切り間の時間区間の評価値を算出する算出手段と、
前記算出手段により算出された評価値がしきい値を越える時間区間の合計が所望の時間内で最大となるしきい値を求め、このしきい値を越える評価値の時間区間からなる所望の時間分の時間区間単位の要約を作成する要約作成手段と
を具備することを特徴とする情報処理装置。 - 前記算出手段は、前記情報の意味的区切り間における前記評価値の最大値を該意味的区切り間の時間区間の評価値とすることを特徴とする請求項1記載の情報処理装置。
- 前記算出手段は、前記情報の意味的区切り間における前記評価値の平均値を該意味的区切り間の時間区間の評価値とすることを特徴とする請求項1記載の情報処理装置。
- 画像情報を利用者に提示する提示手段と、
前記提示手段により提示されている前記画像情報の任意の区間に対して連続的に評価値を入力、修正する入力修正手段と、
前記画像情報のシーンチェンジ間における前記評価値に基づいて、該シーンチェンジ間のカットの評価値を算出する算出手段と、
前記算出手段により算出された評価値がしきい値を越えるカットの合計が所望の時間内で最大となるしきい値を求め、このしきい値を越える評価値のカットからなる所望の時間分のカット単位の要約を作成する要約作成手段と
を具備することを特徴とする情報処理装置。 - 画像情報及び音声情報の少なくとも一方を利用者に提示する提示手段と、
前記提示手段により提示されている前記情報の任意の区間に対して連続的に評価値を入力、修正する入力修正手段と、
画像情報におけるカットまたは音声情報におけるフレーズの区切りを示す前記情報の意味的区切り間における前記評価値に基づいて、該意味的区切り間の時間区間の評価値を算出する算出手段と、
前記算出手段により算出された評価値がしきい値を越える時間区間の合計が所望の時間内で最大となるしきい値を求め、このしきい値を越える評価値の時間区間を順次提示する要約提示手段と
を具備することを特徴とする情報処理装置。 - 画像情報を利用者に提示する提示手段と、
前記提示手段により提示されている前記画像情報の任意の区間に対して連続的に評価値を入力、修正する入力修正手段と、
前記画像情報のシーンチェンジ間における前記評価値に基づいて、該シーンチェンジ間のカットの評価値を算出する算出手段と、
前記算出手段により算出された評価値がしきい値を越えるカットの合計が所望の時間内で最大となるしきい値を求め、このしきい値を越える評価値のカットを順次提示する要約提示手段と
を具備することを特徴とする情報処理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP08345695A JP3579111B2 (ja) | 1995-03-16 | 1995-03-16 | 情報処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP08345695A JP3579111B2 (ja) | 1995-03-16 | 1995-03-16 | 情報処理装置 |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004064414A Division JP2004234683A (ja) | 2004-03-08 | 2004-03-08 | 情報処理装置および情報処理方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH08255171A JPH08255171A (ja) | 1996-10-01 |
| JP3579111B2 true JP3579111B2 (ja) | 2004-10-20 |
Family
ID=13802968
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP08345695A Expired - Fee Related JP3579111B2 (ja) | 1995-03-16 | 1995-03-16 | 情報処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3579111B2 (ja) |
Families Citing this family (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008310820A (ja) * | 1998-12-25 | 2008-12-25 | Panasonic Corp | データ処理装置、データ処理方法および記録媒体 |
| JP2001160066A (ja) | 1998-12-25 | 2001-06-12 | Matsushita Electric Ind Co Ltd | データ処理装置、データ処理方法および記録媒体、並びに該データ処理方法をコンピュータに実行させるためのプログラム |
| JP2001333353A (ja) * | 2000-03-16 | 2001-11-30 | Matsushita Electric Ind Co Ltd | データ処理方法および記録媒体、並びに該データ処理方法をコンピュータに実行させるためのプログラム |
| US7134074B2 (en) | 1998-12-25 | 2006-11-07 | Matsushita Electric Industrial Co., Ltd. | Data processing method and storage medium, and program for causing computer to execute the data processing method |
| US7904813B1 (en) | 1998-12-28 | 2011-03-08 | Sony Corporation | Method for editing video information and editing device |
| EP1028583A1 (en) * | 1999-02-12 | 2000-08-16 | Hewlett-Packard Company | Digital camera with sound recording |
| JP3850289B2 (ja) * | 2001-12-26 | 2006-11-29 | シャープ株式会社 | サーバおよび受信端末 |
| US20030237091A1 (en) * | 2002-06-19 | 2003-12-25 | Kentaro Toyama | Computer user interface for viewing video compositions generated from a video composition authoring system using video cliplets |
| TWI259719B (en) * | 2004-01-14 | 2006-08-01 | Mitsubishi Electric Corp | Apparatus and method for reproducing summary |
| JP4827738B2 (ja) * | 2004-09-28 | 2011-11-30 | 株式会社Ptp | リモートコントローラ |
| JP4610543B2 (ja) * | 2006-11-02 | 2011-01-12 | 日本電信電話株式会社 | 期間抽出装置,期間抽出方法,その方法を実装した期間抽出プログラム及びそのプログラムを格納した記録媒体 |
| JP2010288015A (ja) | 2009-06-10 | 2010-12-24 | Sony Corp | 情報処理装置、情報処理方法及び情報処理プログラム |
| JP2011109675A (ja) * | 2010-12-13 | 2011-06-02 | Hitachi Ltd | 動画再生装置 |
| JP6117621B2 (ja) * | 2013-06-05 | 2017-04-19 | ソニー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
-
1995
- 1995-03-16 JP JP08345695A patent/JP3579111B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH08255171A (ja) | 1996-10-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5552769B2 (ja) | 画像編集装置、画像編集方法及びプログラム | |
| US5963203A (en) | Interactive video icon with designated viewing position | |
| US10031649B2 (en) | Automated content detection, analysis, visual synthesis and repurposing | |
| USRE38401E1 (en) | Interactive video icon with designated viewing position | |
| Casares et al. | Simplifying video editing using metadata | |
| US6571054B1 (en) | Method for creating and utilizing electronic image book and recording medium having recorded therein a program for implementing the method | |
| CN101783886B (zh) | 信息处理设备、信息处理方法和程序 | |
| JP3579111B2 (ja) | 情報処理装置 | |
| US7873258B2 (en) | Method and apparatus for reviewing video | |
| JP2000090121A (ja) | メディアブラウザ、メディアファイルブラウジング方法、及びグラフィカルユ―ザインタフェ―ス | |
| US20100141655A1 (en) | Method and System for Navigation of Audio and Video Files | |
| JP2004080769A (ja) | マルチメディア又はビデオストリームの注釈の共同インデックスをフィルタリングして、見るための方法、システム、ユーザインタフェース、及び実行させるためのプログラム | |
| JP2007535018A (ja) | マルチメディアデジタルコンテンツの視覚化及び制御技術 | |
| KR20070090751A (ko) | 화상 표시방법 및 동영상 재생장치 | |
| JP2004228779A (ja) | 情報処理装置 | |
| JP2002084488A (ja) | ビデオ生成システム及びカスタムビデオ生成方法 | |
| JP2001028722A (ja) | 動画像管理装置及び動画像管理システム | |
| JP2005267279A (ja) | 情報処理システム及び情報処理方法、並びにコンピュータ・プログラム | |
| JP4370792B2 (ja) | ビデオシーケンスの階層形成方法及びプログラム | |
| JP3096280B2 (ja) | 電子映像文書作成利用方法及びプログラム格納媒体 | |
| JP2007528063A (ja) | チュートリアル生成ユニット | |
| Roy et al. | NewsComm: a hand-held interface for interactive access to structured audio | |
| JP3629047B2 (ja) | 情報処理装置 | |
| CN120935414A (zh) | 视频的关键点提取、播放方法、设备、介质和程序产品 | |
| JP2004234683A (ja) | 情報処理装置および情報処理方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040106 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040308 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040525 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040611 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040713 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040715 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080723 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090723 Year of fee payment: 5 |
|
| LAPS | Cancellation because of no payment of annual fees |
