JP2004180197A - 情報処理装置、情報処理方法および記録媒体 - Google Patents

情報処理装置、情報処理方法および記録媒体 Download PDF

Info

Publication number
JP2004180197A
JP2004180197A JP2002346838A JP2002346838A JP2004180197A JP 2004180197 A JP2004180197 A JP 2004180197A JP 2002346838 A JP2002346838 A JP 2002346838A JP 2002346838 A JP2002346838 A JP 2002346838A JP 2004180197 A JP2004180197 A JP 2004180197A
Authority
JP
Japan
Prior art keywords
information processing
focus
recording medium
information
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002346838A
Other languages
English (en)
Inventor
Tetsuo Kosaka
哲夫 小坂
Yasuhiro Komori
康弘 小森
Tsuyoshi Yagisawa
津義 八木沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2002346838A priority Critical patent/JP2004180197A/ja
Publication of JP2004180197A publication Critical patent/JP2004180197A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Details Of Audible-Bandwidth Transducers (AREA)
  • Studio Devices (AREA)

Abstract

【課題】複数マイク(ステレオ)で録音録画を行なったデータを再生する際、再生画像の注目する点を指示することにより、その方向の音の焦点を当てた再生を行う。音へのフォーカシングはマイクロフォンアレーの技術を用いる。これにより、画像が注目する方向とは別で、かつ任意な方向にフォーカスを当てることができる。
【解決手段】複数のマイクからなるマイクロホンアレーと、前記マイクロホンアレーを構成する個々のマイクロホンからの入力音響信号を、マイクロホンごと保持する複数の保持手段と、位置情報を入力する入力手段と、前記保持された複数チャンネルの音響信号を用い前記取得位置方向へ音響的なフォーカスを行うフォーカス手段を持つ。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
音情報および画像情報の両方を収録可能な情報記録装置一般に利用可能である。
【0002】
特にマイクロホンアレーを収音に利用した情報記録装置に関する。
【0003】
【従来の技術】
近年マイクロホンアレーを利用し、音の収集時に指向特性を制御できる技術の開発が行われている。従来も単一指向性マイクロホンなど音圧傾度を利用した指向性マイクなどアナログによる処理によるものが存在したが、近年デジタル信号処理が高速化したことにより、デジタル制御技術を導入した指向性制御が行われるようになってきた。具体的なデジタル制御技術による指向性制御については例えば日本音響学会誌51巻第5号、 pp。390−394「マイクロホンアレーによる指向性制御」に詳しい。
【0004】
またマイクロホンアレーをビデオカメラに利用した場合の発明も種々提案されている。例えば「特開平5−308553」においては、指向特性を制御できるマイクロホンと、ビデオカメラの被写体へのフォーカシングに同期して指向性マイクロホンの指向特性を被写体にフォーカシングする音声信号フォーカス処理部を備えることを特徴とするビデオカメラについて開示されている。この技術によればある被写体に対し、画像的にフォーカスすれば、音もフォーカスされるという効果が得られる。
【0005】
また「特開2000−196941」によれば、ビデオカメラとマイクを備えるシステムにおいて、録画中にモニター用画面上で音のフォーカスを行いたい点をユーザが示せば、その点へ音のフォーカスをするという技術が開示されている。
【0006】
【発明が解決しようとする課題】
上記、特開平5−308553では、カメラが向く方向にたいし音もフォーカスすることは出来るが、カメラの向く方向と別方向に音のフォーカスを当てることはできない。また特開2000−196941においては、ユーザは収録時にモニターに出力された画像に対して操作することにより、カメラ方向とは別の方向に音のフォーカスを向けることは可能であるが、収録後の再生時にユーザが指示する任意の点へ、音のフォーカスを行うことは不可能であった。
【0007】
本発明では上記の点を可能とすることを目的とする。すなわち、収録時ではなく、再生時に事後的にユーザが指示する任意の方向に対し音のフォーカスができる装置を提供する。
【0008】
【課題を解決するための手段】
上記の目的を達成するための本発明による情報処理装置は以下の構成を備える。
【0009】
すなわち、
請求項1にかかる情報処理装置は、
複数のマイクからなるマイクロホンアレーと、前記マイクロホンアレーを構成する個々のマイクロホンからの入力音響信号を、マイクロホンごと保持する複数の保持手段と、位置情報を入力する入力手段と、前記保持された複数チャネルの音響信号を用い前記取得位置方向へ音響的なフォーカスを行うフォーカス手段を持つ。
【0010】
請求項2にかかる情報処理装置は、
第1の装置において、音響的なフォーカスを行った信号をフィードバックするフィードバック手段と、フォーカス方向を変動させ、前記フィードバック信号から最大出力が得られる方向を定める方向決定手段と、前記決定された方向に基づき、音のフォーカス方向を変更するフォーカス変更手段を持つ。
【0011】
請求項3にかかる情報処理装置は、
第2の装置において、前記最大出力を求めるためにフォーカス方向を変動させる変動範囲を、前記位置情報入力手段により取得された位置情報の近傍に制限する制限手段を持つ。
【0012】
請求項4にかかる情報処理装置は、
第1ないし第3の装置において、フォーカス後の音響信号に対し、音響効果を与えるために音響信号を加工する加工手段を持つ。
【0013】
請求項5にかかる情報処理装置は、
第1ないし第3の装置において、フォーカス後の音響信号を認識するための音声認識手段を持つ。
【0014】
請求項6にかかる情報処理装置は、
第1ないし第5の装置において、位置情報を入力する手段で位置を入力した場合、前記入力位置をディスプレィに表示する表示手段を持つ。
【0015】
請求項7にかかる情報処理装置は、
第1ないし第6において、ビデオカメラもしくはデジタルカメラとして動作する。
【0016】
【発明の実施の形態】
以下、本発明の好適な実施の形態について、添付図面を参照して説明する。
【0017】
(実施形態1)
図1は、本発明の一実施形態に係る情報出力装置の構成図を示した図である。
【0018】
また動作の流れをフローチャート図2および図3に示す。これらの図を使い実施形態の説明を以下で行う。
【0019】
図1において100は音響信号を収集するためのマイクロホンアレーであり、101から10nに示される、n個の特性の同等なマイクの集合からなる。150はAD変換部であり151から15nの各々のAD変換器の集合からなる。ここではマイクから収録された音響信号をデジタル信号に変換する。110はメモリ部であり、111から11nに至るn個のメモリからなる。
【0020】
おのおののメモリはマイクロホンアレーを構成するマイクおよび個々のAD変換器と一対一に対応し、マイク、AD変換器、メモリの順で接続される。120はn個のスイッチが連動してオン・オフする連動スイッチである。130は電気的に遅延を発生させる遅延器である。140は遅延された情報を加算する加算器である。
【0021】
142は音響信号をDAしたのちに増幅するDA/アンプである。145は音を出力するスピーカーである。
【0022】
170はユーザが位置を入力するためのポインティングデバイスと映像情報を表示するためのディスプレーであり、本実施例ではLCDのようなディスプレーとディスプレー上のタッチパネルで実現される。180は130の遅延量を制御する遅延制御部である。190は動画や静止画を撮像するためのカメラである。192はカメラにより取得された映像情報をデジタル信号に変換するAD変換器である。195は192でデジタル信号に変換した映像情報を記録するためのメモリである。197はスイッチであり120と連動してもよい。
【0023】
次に図2および図3の流れ図を用いて動作の説明を行う。図2は映像および音響信号の収録時の動作を示し、図3は収録した映像・音響信号を再生する場合の動作を示す。
【0024】
まず収録時の動作について説明する。S100で動画および音響信号の取得を行う。
【0025】
動画の取得は190のカメラで行い、音響信号の取得は100のマイクロホンアレーで行う。S101では動画および音響信号をそれぞれアナログ信号からデジタル信号へ変換する。音響信号については150のAD変換部にて、動画信号については192のAD変換器にてそれぞれ行う。S102では動画や音響信号のデジタル変換後の情報の記憶が行われる。音響信号のデジタル変換後の情報はメモリ集合110に属する各々のメモリ111から11nに記憶される。動画のデジタル変換後の情報は195のメモリに記憶される。メモリの形態は磁気テープ、RAM、ハードディスクなど一般にコンピュータで使用される記憶装置ならいずれでも使用可能である。
【0026】
次に再生時の動作について説明する。S200では197の動画情報のスイッチおよび、120の音響情報のスイッチを入れ動画および音響信号をそれぞれ、ディスプレー170および遅延器の集合130に入力する。S201では170のポインティングデバイス情報の取得を行う。ここでは再生を表示するディスプレー表面がタッチパネルとして、ユーザの指示する画面上の位置情報が取れるポインティングデバイスであると想定して説明する。この場合例えば図4のように映像情報が表示されるものとする。ここで200がディスプレーを示す。ユーザはディスプレー200上のあるポイントを押すことにより位置を示す。このポイントを210で示す。S201では210の位置を例えばX、Y座標の形で取得する。
【0027】
以下のステップのうちS202およびS203は遅延制御部180で行う。まずS202では取得した位置情報を用いて方向情報の算出を行う。本実施例では簡単のためにマイクロホンアレーが横一列の2次元に配置された場合について説明する。同様に3次元にマイクが配置されている場合も実現は可能であるが説明は省略する。
【0028】
まず210の座標情報から図4のxの値、すなわち撮像の中心方向からの距離を求める。また撮像装置の焦点距離からdが求まる。これらの値よりsinθを求める。次にS203では遅延時間の制御を行う。本実施例では音響情報の指向性制御法として遅延和アレーを例に説明するが、音響情報の指向性制御として利用できる技術であれば必ずしも遅延和アレーである必要はない。
【0029】
遅延和アレーでは複数の遅延器に対しある遅延時間を与えることにより、目的信号に関して同相化した後、加算をして目的信号を強調することができる。本技術に関しては日本音響学会誌51巻第5号、 pp。390−394「マイクロホンアレーによる指向性制御」に記述されている。この方式では音速c、 マイクロホン間隔をs、音波の入射角をθとすると遅延時間τは以下で計算できる。
【0030】
τ = s・(sinθ)/c
以上の遅延を与えることにより目的信号は同相化される。S203ではS202で求めた角度情報(sinθ)を元に遅延時間を計算し、遅延器の集合130に属する各遅延器に対し遅延時間を与える。
【0031】
S204では加算器140にて、遅延器の集合130で同相化された音響信号を加算し目的信号の強調を行う。同相化された目的信号は値が加算されるので出力が大きくなるが、その他の信号は相対的に出力は小さくなり、目的方向の信号、すなわちsinθ方向からの信号のみ強調される。
【0032】
S205では加算器140で加算された信号を142にてアナログ信号に変換した後アンプで増幅し、スピーカー145で音響信号として出力する。以上により再生時にユーザがポインティングデバイスにより指示した方向に対し音のフォーカスを当てることが可能になる。またメモリにチャネルごとに音響信号を記憶しているため、ユーザが指示方向を変えても、その都度フォーカスの方向を変えることが可能となる。
【0033】
(実施形態2)
実施形態1ではユーザが音のフォーカスを当てたい位置を指定する方法を開示したが、必ずしも正確に音源位置を指定できない場合がある。そこでシステム側が、正確な位置を探索しフォーカスを当てる方法について開示する。図5に本実施例にかかる探索範囲の説明図を示す。ディスプレィ300においてユーザは310の位置を指定するのは実施形態1と同様である。しかし、何らかの音源がこの近傍に存在する場合、ユーザの指定位置と音源位置にずれが生じる可能性もある。
【0034】
そこで本実施例では320に示すユーザの指定位置の近傍を探索し、音源位置に正確にフォーカスする方法について述べる。
【0035】
図6が本実施例にかかる構成図である。440にて加算するまでは実施例1と同様の動作であるため説明は省略する。440にて求められた信号は遅延偏移部497にフィードバックされる。497では320の範囲を探索するためにsinθ±αの範囲の値を再設定し、再度遅延および加算を行って同相化する。これを繰り返しsinθ±αの範囲で同相信号が最大となる点を音源方向と定め、442や445を通じて出力する。ユーザにより指定する点が再度設定された場合は、再度同様の方法で最大値を探索し出力を定める。
【0036】
(実施形態3)
実施形態1や3において、140または440にて、音に対しフォーカスした後に、音響的な加工を行う。加工は142や442のDAする前、デジタル信号の段階で行ってもよいし、アナログに変換した後に行っても構わない。加工の種類としては、エコー、ビブラート、ディストーションなど、一般に用いられる音響的な処理であればいずれでも選択できる。
【0037】
(実施形態4)
実施形態1や3において、フォーカスした音響信号が音声であった場合、140または440にて、音声に対しフォーカスした後に、音声認識技術を使用して認識を行い、認識結果をディスプレーに表示したり、認識結果に基づきアプリケーションなどの動作をさせてもよい。この場合他の方向から到来する雑音を抑圧するという抑圧効果が得られる。
【0038】
【発明の効果】
以上説明したように、本発明によれば再生時にユーザが示す任意の点に対し音をフォーカスすることができる。音のフォーカスは事後的に処理しているため、再生中にユーザが別の点にフォーカスしたいと思えば、その時点でフォーカス点を変更することができる。また実施形態2によれば、ある音源に対しフォーカスしようとユーザが考え指示した場合、多少のずれがあっても自動補正し、音源に対しフォーカスが向けることができるため、ユーザは大まかな位置を指定するだけでよいという効果が得られる。また実施形態3によれば、得られた音を加工することにより、種々の効果音が得られるという特徴を持つ。
【0039】
さらに実施形態4によれば、フォーカスした音響信号が音声の場合、音声認識を行いアプリケーションを動作することができる。フォーカスした位置以外の音が抑圧されるため、雑音下の音声認識の誤動作を防ぐという効果が得られる。さらに複数人が発声している場合、ユーザがどの話者の音声を認識するか任意に指定できるという効果が得られる。
【図面の簡単な説明】
【図1】本発明の実施形態1における情報出力装置の構成を示した図である。
【図2】本発明の実施形態1における情報出力装置の収録時の動作を表す流れ図である。
【図3】本発明の実施形態1における情報出力装置の再生時の動作を表す流れ図である。
【図4】本発明の実施形態1におけるディスプレーとポインティングデバイスの操作を説明する図である。
【図5】本発明の実施形態2におけるディスプレーとポインティングデバイスの例と、音源探索範囲を説明する図である。
【図6】本発明の実施形態2における情報出力装置の構成を示した図である。
【符号の説明】
100 マイクロホンアレー
110 メモリ部
120 連動スイッチ
130 遅延器

Claims (7)

  1. 複数のマイクからなるマイクロホンアレーと、前記マイクロホンアレーを構成する個々のマイクロホンからの入力音響信号を、マイクロホンごと保持する複数の保持手段と、位置情報を入力する入力手段と、前記保持された複数チャネルの音響信号を用い前記取得位置方向へ音響的なフォーカスを行うフォーカス手段を持つ情報処理装置、情報処理方法および記録媒体。
  2. 請求項1において、音響的なフォーカスを行った信号をフィードバックするフィードバック手段と、フォーカス方向を変動させ、前記フィードバック信号から最大出力が得られる方向を定める方向決定手段と、前記決定された方向に基づき、音のフォーカス方向を変更するフォーカス変更手段を持つ請求項1にかかる情報処理装置、情報処理方法および記録媒体。
  3. 請求項2において、前記最大出力を求めるためにフォーカス方向を変動させる変動範囲を、前記位置情報入力手段により取得された位置情報の近傍に制限する制限手段を持つことを特徴とする請求項2にかかる情報処理装置、情報処理方法および記録媒体。
  4. 請求項1ないし3のいずれか1項に記載の、フォーカス後の音響信号に対し、音響効果を与えるために音響信号を加工する加工手段を持つことを特徴とする、請求項1ないし3のいずれか1項に記載の、情報処理装置、情報処理方法および記録媒体。
  5. 請求項1ないし3のいずれかイ1項に記載の、フォーカス後の音響信号を認識するための音声認識手段を持つことを特徴とする、請求項1ないし3にかかる、情報処理装置、情報処理方法および記録媒体。
  6. 請求項1ないし5のいずれか1項に記載の、位置情報を入力する手段で位置を入力した場合、前記入力位置をディスプレィに表示する表示手段を持つことを特徴とする請求項1ないし5のいずれか1項に記載の、情報処理装置、情報処理方法および記録媒体。
  7. 請求項1ないし6のいずれか1項に記載の、本情報処理装置はビデオカメラもしくはデジタルカメラであることを特徴とする請求項1ないし6のいずれか1項に記載のビデオカメラもしくはデジタルカメラ。
JP2002346838A 2002-11-29 2002-11-29 情報処理装置、情報処理方法および記録媒体 Pending JP2004180197A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002346838A JP2004180197A (ja) 2002-11-29 2002-11-29 情報処理装置、情報処理方法および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002346838A JP2004180197A (ja) 2002-11-29 2002-11-29 情報処理装置、情報処理方法および記録媒体

Publications (1)

Publication Number Publication Date
JP2004180197A true JP2004180197A (ja) 2004-06-24

Family

ID=32707606

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002346838A Pending JP2004180197A (ja) 2002-11-29 2002-11-29 情報処理装置、情報処理方法および記録媒体

Country Status (1)

Country Link
JP (1) JP2004180197A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010021154A1 (ja) * 2008-08-22 2010-02-25 ヤマハ株式会社 録音再生装置
WO2011088796A1 (zh) * 2010-01-22 2011-07-28 华为终端有限公司 拾音控制方法和装置
WO2014103331A1 (ja) * 2012-12-27 2014-07-03 パナソニック株式会社 音声処理システム及び音声処理方法
JP2015019371A (ja) * 2013-07-09 2015-01-29 ノキア コーポレイション オーディオ処理装置
JP2015100125A (ja) * 2012-12-27 2015-05-28 パナソニックIpマネジメント株式会社 音声処理システム及び音声処理方法
DE102015214124A1 (de) 2014-08-05 2016-02-11 Panasonic Intellectual Property Management Co., Ltd. Audioverarbeitungssystem und Audioverarbeitungsverfahren
US10909384B2 (en) 2015-07-14 2021-02-02 Panasonic Intellectual Property Management Co., Ltd. Monitoring system and monitoring method
EP3843423A1 (en) 2019-12-23 2021-06-30 TEAC Corporation Recording and playback device

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8811626B2 (en) 2008-08-22 2014-08-19 Yamaha Corporation Recording/reproducing apparatus
JP2010074827A (ja) * 2008-08-22 2010-04-02 Yamaha Corp 録音再生装置
CN102124754A (zh) * 2008-08-22 2011-07-13 雅马哈株式会社 记录/再现设备
WO2010021154A1 (ja) * 2008-08-22 2010-02-25 ヤマハ株式会社 録音再生装置
CN102124754B (zh) * 2008-08-22 2014-07-16 雅马哈株式会社 记录/再现设备
WO2011088796A1 (zh) * 2010-01-22 2011-07-28 华为终端有限公司 拾音控制方法和装置
CN104904236A (zh) * 2012-12-27 2015-09-09 松下知识产权经营株式会社 声音处理系统以及声音处理方法
US10536681B2 (en) 2012-12-27 2020-01-14 Panasonic Intellectual Property Management Co., Ltd. Sound processing system and sound processing method that emphasize sound from position designated in displayed video image
JP2014143678A (ja) * 2012-12-27 2014-08-07 Panasonic Corp 音声処理システム及び音声処理方法
JP2015100125A (ja) * 2012-12-27 2015-05-28 パナソニックIpマネジメント株式会社 音声処理システム及び音声処理方法
JP2015118386A (ja) * 2012-12-27 2015-06-25 パナソニックIpマネジメント株式会社 音声処理システム及び音声処理方法
JP2015122756A (ja) * 2012-12-27 2015-07-02 パナソニックIpマネジメント株式会社 音声処理システム及び音声処理方法
WO2014103331A1 (ja) * 2012-12-27 2014-07-03 パナソニック株式会社 音声処理システム及び音声処理方法
EP2941013A4 (en) * 2012-12-27 2015-11-04 Panasonic Ip Man Co Ltd SOUND PROCESSING SYSTEM AND SOUND PROCESSING METHOD
US10244219B2 (en) 2012-12-27 2019-03-26 Panasonic Intellectual Property Management Co., Ltd. Sound processing system and sound processing method that emphasize sound from position designated in displayed video image
CN104904236B (zh) * 2012-12-27 2018-09-14 松下知识产权经营株式会社 声音处理系统以及声音处理方法
US9826211B2 (en) 2012-12-27 2017-11-21 Panasonic Intellectual Property Management Co., Ltd. Sound processing system and processing method that emphasize sound from position designated in displayed video image
JP2015019371A (ja) * 2013-07-09 2015-01-29 ノキア コーポレイション オーディオ処理装置
US9578413B2 (en) 2014-08-05 2017-02-21 Panasonic Intellectual Property Management Co., Ltd. Audio processing system and audio processing method
DE102015214124A1 (de) 2014-08-05 2016-02-11 Panasonic Intellectual Property Management Co., Ltd. Audioverarbeitungssystem und Audioverarbeitungsverfahren
US10909384B2 (en) 2015-07-14 2021-02-02 Panasonic Intellectual Property Management Co., Ltd. Monitoring system and monitoring method
EP3843423A1 (en) 2019-12-23 2021-06-30 TEAC Corporation Recording and playback device
JP2021100209A (ja) * 2019-12-23 2021-07-01 ティアック株式会社 録音再生装置
US11418872B2 (en) 2019-12-23 2022-08-16 Teac Corporation Recording and playback device
JP7396029B2 (ja) 2019-12-23 2023-12-12 ティアック株式会社 録音再生装置

Similar Documents

Publication Publication Date Title
JP4269883B2 (ja) マイクロホン装置、再生装置及び撮像装置
CN104756526B (zh) 信号处理装置、信号处理方法、测量方法及测量装置
JP2010187363A (ja) 音響信号処理装置及び再生装置
JP2016146547A (ja) 収音システム及び収音方法
CN101278596B (zh) 定向音频捕获
US8175317B2 (en) Audio reproducing apparatus and audio reproducing method
JP5939444B2 (ja) 撮像装置
US12022267B2 (en) Apparatus, method and computer-readable storage medium for mixing collected sound signals of microphones
JP2004180197A (ja) 情報処理装置、情報処理方法および記録媒体
WO2006057131A1 (ja) 音響再生装置、音響再生システム
JP6835205B2 (ja) 撮影収音装置、収音制御システム、撮影収音装置の制御方法、及び収音制御システムの制御方法
JP5949398B2 (ja) 映像音声記録再生装置
JP2001313992A (ja) 収音装置および収音方法
JPH05244683A (ja) 収録方式および再生方式
JP2006287544A (ja) 映像音声記録再生装置
JPH05308553A (ja) ビデオカメラの録音装置
JP7111202B2 (ja) 収音制御システム及び収音制御システムの制御方法
JP2009065319A (ja) 画像音声記録装置及び画像音声再生装置
JP6274251B2 (ja) 画像データ発生装置及び画像データ発生方法
JP2001086588A (ja) 音声信号処理装置及び方法、並びに電子機器
JP2015119393A (ja) 音響信号受聴装置
JPH1118187A (ja) 発言者追随型場内拡声装置と音声入力方法
JP4751974B2 (ja) 携帯型音源捜索装置
JP2012050044A (ja) 収音マイクロホン及び収音再生装置
JP3104349B2 (ja) 収録装置、再生装置、収録方法および再生方法、および、信号処理装置