JP2012118464A - 音声処理装置、撮像装置、音声処理方法、及び音声処理プログラム - Google Patents
音声処理装置、撮像装置、音声処理方法、及び音声処理プログラム Download PDFInfo
- Publication number
- JP2012118464A JP2012118464A JP2010270668A JP2010270668A JP2012118464A JP 2012118464 A JP2012118464 A JP 2012118464A JP 2010270668 A JP2010270668 A JP 2010270668A JP 2010270668 A JP2010270668 A JP 2010270668A JP 2012118464 A JP2012118464 A JP 2012118464A
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- noise
- speech
- unit
- noise removal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Studio Devices (AREA)
Abstract
【解決手段】雑音含有スペクトル抽出部306は、雑音の発生タイミングにおける入力音声のスペクトルを取得することで、雑音含有スペクトルを抽出する。次に、雑音除去用スペクトル生成部308は、当該雑音含有スペクトルに基づいて雑音除去用スペクトルを生成する。次に、雑音除去部310は、雑音除去用スペクトルに基づいて、入力音声スペクトルから雑音成分を除去し、逆フーリエ変換部311は、雑音成分を除去したスペクトルを音声信号に変換する。
【選択図】図2
Description
以下、図面を参照しながら本発明の実施形態について詳しく説明する。
図1は、本発明の一実施形態による撮像装置の構成を示す概略ブロック図である。
撮像装置1は、操作部10、光学系制御部20、音声処理部30、動画像処理部40、マイク50、動画像記憶部60を備える。また、撮像装置1には、光学系2が着脱自由に取り付けられる。光学系2は、光学素子、当該光学素子を移動させるモータ、当該モータの制御を行うモータドライバ、ヘリコイド環の回転に応じてズーム位置を検出するズームエンコーダ等を備える。
光学系制御部20は、撮像装置1に装着された光学系2の識別情報を取得し、ズームやフォーカスなどの制御信号を光学系2のモータドライバに入力することで、光学系2の制御を行う。
音声処理部30は、動画像の録画時における音声を録音し、動画像記憶部60に登録する。なお、ここで「登録する」とは、記憶部に情報を記憶させることを意味する。以下、本明細書中で「登録する」という文言は、同様の意味として用いる。
動画像処理部40は、動画像を録画し、動画像記憶部60に登録する。
マイク50は、外部の音声を集音し、音声処理部30に入力する。
音声処理部30は、録音部301、フーリエ変換部302、入力音声スペクトル記憶部303、検出部304、検出時刻記憶部305、雑音含有スペクトル抽出部306、雑音含有スペクトル記憶部307、雑音除去用スペクトル生成部308、雑音除去用スペクトル記憶部309、雑音除去部310、逆フーリエ変換部311、雑音含有スペクトル削除部312を備える。
フーリエ変換部302は、録音部301が入力を受け付けた音声信号を所定のフレーム時間毎にフーリエ変換を行い、周波数毎のパワーを示す入力音声スペクトルに変換する。
入力音声スペクトル記憶部303は、フーリエ変換部302が変換した音声スペクトルを記憶する。
雑音含有スペクトル抽出部306は、検出部304から検出信号を取得した時刻においてフーリエ変換部302が生成した入力音声スペクトルを雑音含有スペクトルとして取得する。
雑音含有スペクトル記憶部307は、雑音含有スペクトル抽出部306が取得した雑音含有スペクトルを検出部304が検出した信号の種別の情報に対応付けて記憶する。
雑音除去用スペクトル記憶部309は、雑音除去用スペクトルを信号の種別の情報毎に記憶する。なお、雑音除去用スペクトル記憶部309は、雑音除去用スペクトルを予め記憶し、雑音除去用スペクトル記憶部309が記憶する雑音除去用スペクトルは、雑音除去用スペクトル生成部308によって更新される。
雑音除去部310は、雑音除去用スペクトル記憶部309が記憶する雑音除去用スペクトルに基づいて、入力音声スペクトルから雑音を除去した音声スペクトルを出力する。
逆フーリエ変換部311は、雑音除去部310が雑音を除去した音声スペクトルを逆フーリエ変換して生成した音声信号を、撮像装置1の動画像記憶部60に登録する。
これにより、音声処理部30は、雑音のスペクトルが変化した場合にも適切に雑音の除去を行う。
図3は、第1の実施形態による音声処理部の動作を示すフローチャートである。
ユーザが録画開始ボタンを押下することなどにより、撮像装置1が録画動作を開始すると、音声処理部30の録音部301は、マイク50から入力される音声信号の録音を開始する(ステップS1)。次に、フーリエ変換部302は、録音部301が録音した音声信号を所定のフレーム時間(例えば10ミリ秒)で音声信号をフーリエ変換することで、入力音声スペクトルを生成する(ステップS2)。フーリエ変換部302は、入力音声スペクトルを生成すると、生成した入力音声スペクトルを、入力音声スペクトル記憶部303に逐次蓄積させる(ステップS3)。
ここで、雑音含有スペクトルの各周波数の値の最小値を各周波数の値とするスペクトルを生成する理由を説明する。雑音含有スペクトルは、マイク50から入力される音声信号をフーリエ変換したものであるため、モータ音等の雑音のスペクトルと、背景音のスペクトルとが混在している。音声信号に含まれる音のうち、モータ音等の雑音の音量は大きく変わらないため、背景音の音量が小さいほど、音声信号の全体の音量に対する雑音の音量の比が高くなる。そこで、雑音含有スペクトルの各周波数の値の最小値を各周波数の値とすることで、雑音を含む割合が高いスペクトルを生成することができる。
まず、雑音除去部310は、入力音声スペクトル記憶部303から入力音声スペクトルを取得し、当該入力音声スペクトルを生成した時刻が、検出時刻記憶部305に記憶されているか否かを判定する(ステップS14)。これにより、当該入力音声スペクトルが雑音を含んでいるか否かを判定することができる。雑音除去部310が、入力音声スペクトルを生成した時刻が検出時刻記憶部305に記憶されていないと判定した場合(ステップS14:NO)、逆フーリエ変換部311は、入力音声スペクトルを逆フーリエ変換することにより、音声信号を取得し、動画像記憶部60に登録する(ステップS15)。
また、この処理を終了した後に再度録画を開始する際に、光学系制御部20が、撮像装置に装着された光学系2が交換されたことを検出すると、雑音含有スペクトル削除部312は、雑音含有スペクトル記憶部307が記憶する雑音含有スペクトルを削除する。これは、光学系2の種類によって雑音のスペクトルが変わるため、交換前の光学系2による雑音含有スペクトルの影響で、光学系2の交換後に生成する雑音除去用スペクトルの精度が悪化することを防ぐためである。なお、光学系制御部20による光学系2の交換の検出は、例えば、光学系制御部20が光学系2の識別情報を取得し、取得した識別番号が、前回の録画時と同じ識別番号の光学系であるか否かを判定することで行うことができる。
例えば、本実施形態では、検出時刻記憶部305が、検出部304が信号を検出した時刻を記憶する場合を説明したが、これに限られず、例えば、撮像装置1及び光学系2の動作を示す動作データを記憶しても良い。この場合、雑音除去部310は、検出時刻記憶部305が記憶する動作データにおいて、撮像装置1または光学系2が動作している時刻に対応する入力音声スペクトルに対して、ステップS16による減算処理を行う。
録音部301が録音した入力音声に含まれる背景音が、雑音の逆位相となる場合、雑音のみのスペクトルより、逆位相で打ち消された入力音声のスペクトルのほうが、ある周波数の値が小さくなることがある。そのため、周波数の値が最小値となるスペクトルは、必ずしも雑音の含有率が高いとは言えない。このような場合を鑑みると、最小値に基づいて雑音除去用スペクトルを生成せずに、中央値や最頻値など、ノイズ成分に影響されない統計量を選択する利点がある。
次に、本発明の第2の実施形態について説明する。
図4は、本発明の第2の実施形態による音声処理部の構成を示す概略ブロック図である。
第2の実施形態による音声処理部30は、第1の実施形態による音声処理部30から、検出時刻記憶部305、雑音含有スペクトル記憶部307、雑音除去用スペクトル記憶部309、雑音含有スペクトル削除部312を除き、背景音スペクトル抽出部313を備える構成とする。
背景音スペクトル抽出部313は、検出部304が操作信号または制御信号を検出した時刻の前、または操作が終了した時刻の後において、フーリエ変換部302が生成した入力音声スペクトルを雑音含有スペクトルとして取得する。
また、操作が終了した時刻の後に生成された入力音声スペクトルとは、ユーザの操作や光学系2の制御等(モータの駆動)による操作音の発生が終了した時刻より後の時刻に生成された入力音声スペクトルを示し、例えば、検出部304が出力する検出信号がオフとなった時刻の1フレーム時間後に生成された入力音声スペクトルを用いるとよい。
ユーザが録画開始ボタンを押下することなどにより、撮像装置1が録画動作を開始すると、音声処理部30の録音部301は、マイク50から入力される音声信号の録音を開始する(ステップS21)。次に、フーリエ変換部302は、録音部301が録音した音声信号を所定のフレーム時間で音声信号をフーリエ変換することで、入力音声スペクトルを生成する(ステップS22)。フーリエ変換部302は、入力音声スペクトルを生成すると、生成した入力音声スペクトルを、入力音声スペクトル記憶部303に登録する(ステップS23)。
例えば、本実施形態では、録音中に逐次雑音除去処理を行う場合を説明したが、これに限られず、例えば第1の実施形態のように、録音終了後にまとめて雑音除去処理を行っても良い。
Claims (12)
- 入力される音声信号より音声スペクトルを生成する生成手段と、
前記音声信号中に含まれる雑音の発生タイミングを検出し、前記生成手段により生成された前記音声スペクトルより前記雑音に対応する部分のスペクトルである雑音含有スペクトルを抽出する抽出手段と、
前記雑音含有スペクトルに基づいて前記雑音を除去するための雑音除去用スペクトルを生成し、前記雑音の発生タイミングにおける音声スペクトルから雑音を除去した音声スペクトルを生成する雑音除去手段と、
前記雑音除去手段により生成された音声スペクトルより音声信号を生成し出力する出力手段と
を備えることを特徴とする音声処理装置。 - 請求項1に記載の音声処理装置において、
前記抽出手段が前記雑音含有スペクトルを抽出する毎に当該雑音含有スペクトルを雑音含有スペクトル記憶手段に蓄積させる登録手段を更に備え、
前記雑音除去手段は、
前記雑音含有スペクトル記憶手段に蓄積された複数の雑音含有スペクトルの各周波数の値の統計量を各周波数の値とすることにより前記雑音除去用スペクトルを生成し、前記雑音の発生タイミングにおける音声スペクトルから雑音を除去した音声スペクトルを生成する、
ことを特徴とする音声処理装置。 - 請求項1または請求項2の何れか1項に記載の音声処理装置において、
前記雑音含有スペクトルの抽出位置の前または後に前記生成手段が生成する音声スペクトルを、雑音を含まない部分のスペクトルである背景音スペクトルとして抽出する背景音スペクトル抽出手段を更に備え、
前記雑音除去手段は、
前記雑音含有スペクトルから、前記背景音スペクトル抽出手段が抽出した背景音スペクトルを減算することにより、前記雑音除去用スペクトルを生成し、前記雑音の発生タイミングにおける音声スペクトルから雑音を除去した音声スペクトルを生成する、
ことを特徴とする音声処理装置。 - 請求項1から請求項3の何れか1項に記載の音声処理装置において、
予め前記雑音除去用スペクトルを記憶する雑音除去用スペクトル記憶手段を更に備え、
前記雑音除去手段は、
前記抽出手段が前記雑音含有スペクトルを抽出する毎に、当該雑音含有スペクトルに基づいて前記雑音除去用スペクトル記憶手段が記憶する雑音除去用スペクトルを更新することにより、雑音除去用スペクトルを生成し、前記雑音の発生タイミングにおける音声スペクトルから雑音を除去した音声スペクトルを生成する、
ことを特徴とする音声処理装置。 - 請求項1から請求項4の何れか1項に記載の音声処理装置において、
前記雑音除去手段は、
前記雑音含有スペクトルに基づいて前記雑音除去用スペクトルを生成し、前記雑音の発生タイミングにおける音声スペクトルから、前記雑音除去用スペクトルに所定の係数を乗じた信号を減算することで雑音を除去した音声スペクトルを生成する、
ことを特徴とする音声処理装置。 - 請求項1から請求項4の何れか1項に記載の音声処理装置において、
前記雑音除去手段は、
前記雑音含有スペクトルに基づいて前記雑音除去用スペクトルを生成し、前記雑音の発生タイミングにおける音声スペクトルのうち、前記雑音除去用スペクトルに所定の係数を乗じた信号の各周波数の値より、値が小さい周波数部分を除去することで雑音を除去した音声スペクトルを生成する、
ことを特徴とする音声処理装置。 - 請求項1から請求項6の何れか1項に記載の音声処理装置を備えることを特徴とする撮像装置。
- 請求項7に記載の撮像装置において、
前記音声処理装置は、光学系の識別情報に対応付けて、当該光学系が発生させる雑音の前記雑音除去用スペクトルを雑音除去用スペクトル記憶手段に登録する雑音除去用スペクトル登録手段を更に備え、
前記音声処理装置の雑音除去手段は、装着している光学系の識別情報に対応付けて前記雑音除去用スペクトル記憶手段が記憶する雑音除去用スペクトルに基づいて雑音を除去した音声スペクトルを出力する、
ことを特徴とする撮像装置。 - 請求項2に記載の音声処理装置を備える撮像装置において、
前記音声処理装置は、光学系が交換されたときに、前記音声処理装置の雑音含有スペクトル記憶手段が記憶する前記雑音含有スペクトルを削除する雑音含有スペクトル削除手段を備える、
ことを特徴とする撮像装置。 - 請求項2に記載の音声処理装置を備える撮像装置において、
前記音声処理装置の登録手段は、
光学系の識別情報に対応付けて、当該光学系が発生させる雑音の前記雑音含有スペクトルを前記雑音含有スペクトル記憶手段に登録し、
前記音声処理装置の雑音除去手段は、装着している光学系の識別情報に対応付けて前記雑音含有スペクトル記憶手段が記憶する雑音含有スペクトルに基づいて前記雑音除去用スペクトルを生成し、前記雑音の発生タイミングにおける音声スペクトルから雑音を除去した音声スペクトルを生成する、
ことを特徴とする撮像装置。 - 入力される音声信号より音声スペクトルを生成し、
前記音声信号中に含まれる雑音の発生タイミングを検出し、
生成された前記音声スペクトルより前記雑音に対応する部分のスペクトルである雑音含有スペクトルを抽出し、
前記雑音含有スペクトルに基づいて前記雑音を除去するための雑音除去用スペクトルを生成し、
前記雑音の発生タイミングにおける音声スペクトルから雑音を除去した音声スペクトルを生成し、
雑音を除去した音声スペクトルより音声信号を生成し出力する
ことを特徴とする音声処理方法。 - コンピュータに、
入力される音声信号より音声スペクトルを生成するステップと、
前記音声信号中に含まれる雑音の発生タイミングを検出するステップと、
生成された前記音声スペクトルより前記雑音に対応する部分のスペクトルである雑音含有スペクトルを抽出するステップと、
前記雑音含有スペクトルに基づいて前記雑音を除去するための雑音除去用スペクトルを生成するステップと、
前記雑音の発生タイミングにおける音声スペクトルから雑音を除去した音声スペクトルを生成するステップと、
雑音を除去した音声スペクトルより音声信号を生成し出力するするステップと、
を実行させる音声処理プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010270668A JP2012118464A (ja) | 2010-12-03 | 2010-12-03 | 音声処理装置、撮像装置、音声処理方法、及び音声処理プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010270668A JP2012118464A (ja) | 2010-12-03 | 2010-12-03 | 音声処理装置、撮像装置、音声処理方法、及び音声処理プログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2012118464A true JP2012118464A (ja) | 2012-06-21 |
Family
ID=46501306
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010270668A Pending JP2012118464A (ja) | 2010-12-03 | 2010-12-03 | 音声処理装置、撮像装置、音声処理方法、及び音声処理プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2012118464A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2016054462A (ja) * | 2014-09-04 | 2016-04-14 | キヤノン株式会社 | 電子機器及び制御方法 |
| JP2017187725A (ja) * | 2016-04-08 | 2017-10-12 | キヤノン株式会社 | 電子機器及び制御方法 |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003044086A (ja) * | 2001-08-03 | 2003-02-14 | Nippon Hoso Kyokai <Nhk> | 雑音除去方法および装置 |
| JP2006270591A (ja) * | 2005-03-24 | 2006-10-05 | Nikon Corp | 電子カメラ、データ再生装置およびプログラム |
| JP2006279185A (ja) * | 2005-03-28 | 2006-10-12 | Casio Comput Co Ltd | 撮像装置、音声記録方法及びプログラム |
| WO2009038136A1 (ja) * | 2007-09-19 | 2009-03-26 | Nec Corporation | 雑音抑圧装置、その方法及びプログラム |
| JP2009260603A (ja) * | 2008-04-16 | 2009-11-05 | Nikon Corp | 電子カメラ |
| JP2010157965A (ja) * | 2009-01-05 | 2010-07-15 | Canon Inc | 撮像装置 |
| JP2010193053A (ja) * | 2009-02-17 | 2010-09-02 | Ricoh Co Ltd | 撮像装置及びノイズ低減方法 |
-
2010
- 2010-12-03 JP JP2010270668A patent/JP2012118464A/ja active Pending
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003044086A (ja) * | 2001-08-03 | 2003-02-14 | Nippon Hoso Kyokai <Nhk> | 雑音除去方法および装置 |
| JP2006270591A (ja) * | 2005-03-24 | 2006-10-05 | Nikon Corp | 電子カメラ、データ再生装置およびプログラム |
| JP2006279185A (ja) * | 2005-03-28 | 2006-10-12 | Casio Comput Co Ltd | 撮像装置、音声記録方法及びプログラム |
| WO2009038136A1 (ja) * | 2007-09-19 | 2009-03-26 | Nec Corporation | 雑音抑圧装置、その方法及びプログラム |
| JP2009260603A (ja) * | 2008-04-16 | 2009-11-05 | Nikon Corp | 電子カメラ |
| JP2010157965A (ja) * | 2009-01-05 | 2010-07-15 | Canon Inc | 撮像装置 |
| JP2010193053A (ja) * | 2009-02-17 | 2010-09-02 | Ricoh Co Ltd | 撮像装置及びノイズ低減方法 |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2016054462A (ja) * | 2014-09-04 | 2016-04-14 | キヤノン株式会社 | 電子機器及び制御方法 |
| JP2017187725A (ja) * | 2016-04-08 | 2017-10-12 | キヤノン株式会社 | 電子機器及び制御方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5741281B2 (ja) | 音声信号処理装置、撮像装置、音声信号処理方法、プログラム及び記録媒体 | |
| KR101739942B1 (ko) | 오디오 노이즈 제거 방법 및 이를 적용한 영상 촬영 장치 | |
| US8687076B2 (en) | Moving image photographing method and moving image photographing apparatus | |
| JP2005303802A (ja) | 撮像装置および画像処理プログラム | |
| WO2017080241A1 (zh) | 延时摄影方法和装置 | |
| JP2012118464A (ja) | 音声処理装置、撮像装置、音声処理方法、及び音声処理プログラム | |
| JP2011077604A (ja) | ノイズ除去装置、レンズ装置、撮像装置、ノイズ除去方法 | |
| JP2011229142A (ja) | 撮影装置、信号処理装置及び記録媒体 | |
| JP5764982B2 (ja) | 再生処理装置、撮像装置、再生処理方法、及びプログラム | |
| JP2012080251A (ja) | 画像処理装置、画像処理方法及びプログラム | |
| US20080232719A1 (en) | Image storage apparatus having continuous-shooting function | |
| JP5158054B2 (ja) | 録音装置、撮像装置、および、プログラム | |
| JP5262801B2 (ja) | 撮像装置および画像再生プログラム | |
| JPWO2021220961A5 (ja) | ||
| JP5470688B2 (ja) | 撮影装置及びそのプログラム並びに画像表示装置。 | |
| JP4804417B2 (ja) | 動画撮像装置及び動画撮像方法 | |
| JP2012118316A (ja) | 信号処理装置、撮像装置および信号処理プログラム | |
| JP5736839B2 (ja) | 信号処理装置、撮像装置、及びプログラム | |
| JP2013160781A (ja) | 撮像録音装置 | |
| JP2003284181A (ja) | 集音装置 | |
| US20180288328A1 (en) | Image processing apparatus, image processing method, and storage medium | |
| JP5020705B2 (ja) | 動画撮像装置及び動画撮像方法 | |
| JP2017098637A (ja) | 画像特定装置、画像特定方法及びプログラム | |
| JP2008140527A (ja) | 音楽再生装置、およびこれを備えたカメラ | |
| JP2013178458A (ja) | 信号処理装置及び信号処理プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131118 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140729 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140805 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141006 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150324 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150929 |