JP6048596B2 - 集音装置、集音装置の入力信号補正方法および移動機器情報システム - Google Patents

集音装置、集音装置の入力信号補正方法および移動機器情報システム Download PDF

Info

Publication number
JP6048596B2
JP6048596B2 JP2015559605A JP2015559605A JP6048596B2 JP 6048596 B2 JP6048596 B2 JP 6048596B2 JP 2015559605 A JP2015559605 A JP 2015559605A JP 2015559605 A JP2015559605 A JP 2015559605A JP 6048596 B2 JP6048596 B2 JP 6048596B2
Authority
JP
Japan
Prior art keywords
input signal
signal
power
input
small
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015559605A
Other languages
English (en)
Other versions
JPWO2015114674A1 (ja
Inventor
訓 古田
訓 古田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Application granted granted Critical
Publication of JP6048596B2 publication Critical patent/JP6048596B2/ja
Publication of JPWO2015114674A1 publication Critical patent/JPWO2015114674A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers
    • H04R3/005Circuits for transducers for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/004Monitoring arrangements; Testing arrangements for microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Description

本発明は、音声などの音を複数の収音機器を用いて集音する集音装置に関する。
音声や音楽などの音を効率よく収音するために、複数のマイクロホン(マイクロホンアレー)を使用して集音するマイクロホンアレー処理が考案され広く用いられている。一般的にマイクロホンの周波数特性やゲイン特性は、製造時の個体差、経年変化あるいは設置環境などの要因により均一ではなく、個体によりばらつきがある。マイクロホンアレー処理では、使用するマイクロホンの周波数特性やゲイン特性にばらつきがあると集音の性能が劣化してしまうため、マイクロホン間の特性の差がなくなるようにマイクロホンで取得した信号を補正することが行われる。
校正用の音(校正音)をスピーカ等の音源装置で発生し、マイクロホンで取得した校正音の信号に基づいてマイクロホン間の特性のばらつきが無くなるように取得した信号を補正する方法があるが、この方法では校正音を発生する音源装置が必要になる。これに対し音源装置を必要とせずに、マイクロホンに到来する音、また特に音声などの集音対象の音(以降、目的音と称す)をマイクロホンで取得した信号を用いてマイクロホン間の特性の差が無くなるように信号を逐次修正する方法が提案されている(特許文献1)。
特開2009−55343号公報(図7)
しかしながら、マイクロホンに到来する音をマイクロホンで取得した信号に基づいて補正した場合、取得した音の音源と目的音の音源の位置が異なるなどの要因により、行った補正が目的音の集音に対して適切な補正であるとは限らない。また、目的音を取得した信号に基づいて補正を行おうとしても、誤って目的音ではない音を取得した信号に基づいて補正を行ってしまう可能性があり、このような場合にはやはり目的音の集音に対して適切な補正が行えるとは限らない。
このように従来のマイクロホンアレーを用いた集音装置は、集音対象の目的音に適さない補正をしてしまう可能性があるという問題があった。
この発明は、上述のような問題を解決するためになされたものであり、マイクロホンアレーの複数のマイクロホンで取得した信号の補正をマイクロホンに到来する音を用いて行う、集音対象の音に対して適切でない補正をする可能性を低減した集音装置を得ることを目的とする。
この発明の集音装置は、複数のマイクロホンで取得された複数の入力信号のそれぞれについて、規定される第1のしきい値よりも値の小さい入力信号のパワーをその入力信号の小信号パワーとする小信号パワー取得部と、複数の入力信号を補正するためのそれぞれの補正量をそれぞれの前記小信号パワーに基づいて求める補正量設定部と、複数の入力信号を補正するためのそれぞれの補正量に基づいて対応する入力信号をそれぞれ補正する補正部と、を備えるようにしたものである。
この発明の集音装置の入力信号補正方法は、複数のマイクロホンで取得された複数の入力信号から集音する対象の音の信号を生成する集音装置における入力信号の補正方法であって、規定されたしきい値よりも小さい入力信号のパワーをその入力信号の小信号パワーとするステップと、入力信号を補正するためのそれぞれの補正量を当該入力信号の小信号パワーに基づいて求めるステップと、入力信号のそれぞれをその入力信号を補正するための補正量に基づいて補正するステップと、を備えるようにしたものである。
この発明の移動機器情報システムは、複数のマイクロホンで取得された複数の入力信号のそれぞれについて、規定されるしきい値よりも値の小さい入力信号のパワーをその入力信号の小信号パワーとし、それぞれのこの小信号パワーに基づいて求めたその小信号パワーに対応する入力信号を補正するための補正量を求め、それぞれのこの補正量に基づいて前記複数の入力信号をそれぞれ補正した信号を用いて集音対象の音を強調した出力信号を生成する集音装置と、その集音装置が出力した出力信号の音声認識結果に基づいて処理を行う経路案内装置、または集音装置の出力信号を用いる通話装置、または集音装置の出力信号を用いる能動消音装置の少なくともいずれか一つを備えるようにしたものである。
この発明の集音装置によれば、マイクロホンアレーを構成する各マイクロホンからの入力信号について、規定される第1のしきい値よりも小さいパワーをそれぞれの入力信号の小信号パワーとして、この小信号パワーに基づいてそれぞれの入力信号を補正するための補正量を求めて、各入力信号を求めた補正量で補正するようにしたので、集音対象の音に対して適切でない補正をする可能性を低減した集音装置を得ることができる。
この発明の集音装置の入力信号補正方法によれば、マイクロホンアレーを構成する各マイクロホンからの入力信号について、規定された第1のしきい値よりも小さいパワーをそれぞれの入力信号の小信号パワーとして、この小信号パワーに基づいてそれぞれの入力信号を補正するための補正量を求めて、各入力信号を求めた補正量で補正するようにしたので、集音対象の音に対して適切でない補正をする可能性を低減した補正をすることができる。
この発明の移動機器情報システムによれば、複数のマイクロホンで取得された複数の入力信号のそれぞれについて、規定されるしきい値よりも値の小さい入力信号のパワーをその入力信号の小信号パワーとし、それぞれのこの小信号パワーに基づいてその小信号パワーに対応する入力信号を補正するための補正量を求め、それぞれのこの補正量に基づいて複数の入力信号をそれぞれ補正した信号を用いて集音対象の音を強調した出力信号を集音装置が出力し、経路案内装置、通話装置または能動消音装置はこの良好な音の信号を用いることでより良好な性能で動作をすることができる。
この発明の実施の形態1に係る集音装置の構成を示すブロック図である。 この発明の実施の形態1の集音装置の信号補正部の構成を示すブロック図である。 この発明の実施の形態1の集音装置の小信号パワー取得部の構成を示すブロック図である。 この発明の実施の形態1の集音装置の処理フローを示すフローチャートである。 この発明の実施の形態1の集音装置の入力信号のパワーと小信号パワーしきい値の一例を示すグラフである。 図5に示したグラフの一部を縦軸方向に拡大したグラフである。 この発明の実施の形態2に係る集音装置の信号補正部の構成を示すブロックである。 この発明の実施の形態3に係る集音装置の信号補正部の構成を示すブロックである。 この発明の実施の形態3の集音装置の信号補正部の変形例の構成を示すブロックである。 この発明の実施の形態4に係る車載情報システム(移動機器情報システム)の構成を示すブロック図である。
以下、この発明の実施の形態を、図面を参照して説明する。なお、参照する図面において同一もしくは相当する部分には同一の符号を付している。
実施の形態1.
図1はこの発明の実施の形態に係る集音装置の構成を示すブロック図である。この実施の形態の集音装置は、マイクロホンアレー20を構成する複数のマイクロホン21〜21(Nは2以上の自然数)において取得された音の信号(入力信号)を補正する信号補正部1と信号補正部1で補正された信号を処理する信号処理部2を備えている。なお、以降の説明では例えば特定のマイクロホンを区別する必要が無い場合に単にマイクロホン21と記す場合がある。これは他のブロックおよび信号の表記においても同様である。
図1において信号補正部1に入力される入力信号xin(n)〜xin(n)は、マイクロホン21〜21が取得した音の電気信号を集音装置が備えるAD(アナログデジタル)変換器(図示せず)がデジタル化し、規定されたサンプリング周波数(例えば8kHz)でサンプリングして、規定された時間毎(例えば10ミリ秒毎)のフレームに分割した信号とする。ここで、nは分割された個々のフレームを識別するためのフレーム番号を示している。なお、以降の説明では(n)を省略して単にxinのように示す場合がある。
図2は信号補正部1の構成の一例を示すブロック図である。信号補正部1は、小信号パワー取得部3〜3、補正量設定部4、補正部5〜5とで構成されている。小信号パワー取得部3は入力された入力信号xinについて規定される第1のしきい値よりも値の小さい入力信号xinのパワーを小信号パワーPminと定めて出力する。補正量設定部4は小信号パワー取得部3が出力する小信号パワーPminに基づいてそれぞれに対応する入力信号xinを補正する補正量を決定する。補正部5は補正量設定部4で決定されたそれぞれの補正量に基づいて入力信号xinを補正する。なお、ここではN個の小信号パワー取得部3〜3をN個の入力信号xin〜xinに対応して備えるようにしているが、1個のブロックが複数の入力信号を処理するように構成しても良い。これは補正部5〜5等についても同様である。
図3は小信号パワー取得部3の内部構成の一例を示すブロック図である。小信号パワー取得部3は入力信号xinのパワーを計算するパワー計算部6、パワーの最小値の長期平均値を求める最小値追跡部7、パワーの最小値の長期平均値に基づいて第1のしきい値を計算するしきい値計算部8、入力信号xinのパワーと第1のしきい値を比較し小信号パワーPminを出力する比較部9で構成されている。なお、小信号パワー取得部3〜3は同様の構成を有する。
上述の信号補正部1および信号処理部2、また、信号補正部1を構成する小信号パワー取得部3、補正量設定部4、補正部5、小信号パワー取得部3を構成するパワー計算部6、最小値追跡部7、しきい値計算部8、比較部9は汎用プロセッサあるいはDSP(Digital Signal Processor)とRAM(Random Access Memory)などの周辺回路で構成されるハードウェアとプロセッサで実行されるソフトウェアで実現することが可能である。また、これらの各ブロックをASIC(Application Specific Integrated Circuit)等のハードウェアで実現することも可能である。
次にこの実施の形態の集音装置の動作を説明する。図4はこの実施の形態の集音装置の処理フローを示すフローチャートである。
最初に信号補正部1がマイクロホンアレー20のマイクロホン21〜21が取得した音声あるいは音楽などの目的音、および暗騒音などの目的音以外の雑音を含む入力音の入力信号xin(n)〜xin(n)を受信する(ST100)。
信号補正部1に入力された入力信号xin(n)〜xin(n)を小信号パワー取得部3〜3が処理して、入力信号xin(n)〜xin(n)のそれぞれの小信号パワーPmin(n)〜Pmin(n)を出力する。以下に図3および図4を参照して小信号パワー取得部3が行う処理の詳細を説明する。
まず、小信号パワー取得部3のパワー計算部6が下式(1)により入力信号xin(n)から入力信号の現在のフレームのパワーを計算して、入力信号パワーPin(n)を出力する(ST101)。式(1)においてnはフレーム番号であり、tはフレーム内の離散時間を示す番号である。xin(n,t)は、入力信号xin(n)についてフレームnの時刻tの振幅を表している。なお、サンプリング周波数8kHz、10ミリ秒フレームである場合、M=80である。
Figure 0006048596
パワー計算部6が出力した入力信号パワーPin(n)を受信した最小値追跡部7は入力信号パワーPin(n)の最小値(最小パワー)をトラッキングし、最小値の長期平均値を算出する(ST102)。具体的には、最小値追跡部7は下式(2)に従って入力信号パワーPin(n)の最小値の長期平均値Ptr(n)を算出する。最小値追跡部7は算出した長期平均値Ptr(n)をしきい値計算部8に出力する。
Figure 0006048596
式(2)において、αは忘却のための時定数であり、例えば下式(3)で与えられる。式(3)においてPNPOW_THは予め規定しておくしきい値である。入力信号パワーPin(n)がPNPOW_THよりも大きい場合には、忘却係数αを大きい値にして忘却速度を緩やかにする。このようにすると、入力信号xin(n)に目的音である音声などの大きなパワーの成分が混入している場合に、入力信号パワーPin(n)の最小値の長期平均値Ptr(n)に目的音のパワーが影響することを抑制でき、入力信号パワーPin(n)の最小値のトラッキング精度を向上することができる。
Figure 0006048596
次に、しきい値計算部8が下式(4)に従って入力された長期平均値Ptr(n)に規定された数値PADD(n)を加算して、入力信号xin(n)の第1のしきい値である小信号パワーしきい値Pth(n)を規定して出力する(ST103)。この実施の形態における数値PADD(n)の好適な一例は固定値の3dBである。ただし、入力信号の補正が良好に行われるように、入力音の種類等に応じて例えばフレーム毎に適宜変更するようにしても良い。
Figure 0006048596
次に、比較部9が下式(5)に従って入力信号パワーPin(n)と小信号パワーしきい値Pth(n)とを比較し、入力信号xin(n)の小信号パワーPmin(n)を求めて出力する(ST104)。Pin(n)がPth(n)を下回る場合にはPin(n)をPmin(n)として出力する。一方、Pin(n)がPth(n)以上である場合には前フレームの値であるPmin(n−1)を出力する。
Figure 0006048596
なお、比較部9は出力した入力信号xin(n)の小信号パワーPmin(n)を次のフレームの処理において使用するために記憶する。
この実施の形態における小信号パワー取得部3の動作原理を図5および図6に示すグラフを用いて説明する。図5において(A)は音声を取得した入力信号xinの時間経過にともなう波形の変化を示し、(B)はその入力信号xinのパワーの時間経過にともなう変化を示したものである。図5(B)において実線B1はパワー計算部6が算出した入力信号パワーPinを表している。また、太実線B2はしきい値計算部8が算出した小信号パワーしきい値Pthである。図6は図5の(B)の一部を縦軸方向に拡大したグラフである。
図5、図6に示した入力信号パワーPinが小信号パワーしきい値Pth以上である区間のフレームでは、入力信号パワーPinではなく前フレームの小信号パワーPminをそのフレームの小信号パワーPminとするので、目的音である音声が含まれた区間の入力信号パワーPinが小信号パワーPminに与える影響を抑制することができる。
小信号パワー取得部3〜3のそれぞれが出力する小信号パワーPmin(n)〜Pmin(n)を受信した補正量設定部4は、各マイクロホン21のゲインを補正するための補正量である補正ゲインg(n)を算出して求める(ST105)。ここでは補正量の算出の一例として、マイクロホン21を基準にする例を説明する。なお、マイクロホン21を基準にするのではなく他のマイクロホン21〜21のいずれかを基準とするようにしても良い。例えば、あらかじめ目的音の音源の位置がわかっている場合に、もっとも音源に近いマイクロホン21を基準にすることが可能である。なお、いずれかのマイクロホン21を基準にすることで、補正量を求めるためのパワーの基準をあらかじめ定めておく必要をなくすことができる。
補正量の算出について詳細を説明する。補正量設定部4はマイクロホン21に係る小信号パワーPmin(n)を基準にマイクロホン21〜21に係る小信号パワーPmin(n)〜Pmin(n)のそれぞれが同じレベルになるように、下式(6)に従って補正ゲインg(n)を算出する。なお、mは1以上N以下の自然数である。
Figure 0006048596
補正量設定部4は算出した補正ゲインg(n)〜g(n)をそれぞれ補正部5〜5に出力する。補正ゲインg(n)〜g(n)を受信した補正部5〜5は下式(7)により入力信号xin(n)〜xin(n)を補正する(ST106)。ここでmは1以上N以下の自然数である。なお、マイクロホン21を基準とした場合、式(6)によって入力信号xin(n)に対する補正ゲインg(n)は1.0となるので、xin(n)=yin(n)である。補正部5は入力信号xin(n)〜xin(n)を補正した信号(補正信号と称す)yin(n)〜yin(n)を信号処理部2へ出力する。
Figure 0006048596
補正信号yin(n)〜yin(n)を受信した信号処理部2では、補正信号yin(n)〜yin(n)を用いて例えば遅延和法、最尤法などの公知の強調処理を行って出力信号を出力する(ST107)。
上述のように、この実施の形態の集音装置によれば、マイクロホンアレーの各マイクロホンからのそれぞれの入力信号についてパワーの最小値をトラッキングしてそれぞれの入力信号のパワーの第1のしきい値である小信号パワーしきい値を規定し、この小信号パワーしきい値よりも値の小さい入力信号のパワーを小信号パワーと定め、小信号パワーに基づいて各マイクロホンからの入力信号を補正する補正量を算出するようにした。
これにより、規定のしきい値よりもパワーの小さい入力信号に基づいて入力信号の補正を行うことができるので、集音対象の音に対して適切でない補正をする可能性を低減して、マイクロホンで取得した入力信号の補正を行うことができる。これは、マイクロホンの特性の違いを小さくするための入力信号の補正には例えば暗騒音などのような無指向性の音が適しており、パワーの小さい入力信号は拡散した無指向性の音の信号とみなせるためである。
また、マイクロホンからの入力信号のパワーの最小値をトラッキングして第1のしきい値を規定しているので、あらかじめこのしきい値を決定しておく必要が無く、集音装置の使用環境に柔軟に対応してマイクロホン間の特性の差を補正することが可能である。
実施の形態2.
実施の形態1では、入力信号のパワーの最小値(最小パワー)に応じた制御を行っているが、入力信号の様態を分析して補正の精度を向上させることも可能である。
図7は、この発明の実施の形態2に係る集音装置の信号補正部1bの構成を示すブロック図である。なお、実施の形態2の集音装置の全体の構成は実施の形態1と同様である。図7において実施の形態1と異なるのは、入力信号を分析する信号判定部10を備え、信号判定部10の分析結果が小信号パワー取得部3bに入力されるようにしたことである。
なお、信号判定部10は他のブロックと同様にプロセッサおよびプロセッサで実行されるプログラムで実現したり、ASIC等のハードウェアで実現したりすることが可能である。
この実施の形態の集音装置の動作を実施の形態1との差分を中心に説明する。信号補正部1bは実施の形態1と同様に入力信号xin(n)〜xin(n)を受信する。この実施の形態ではまず、信号判定部10が受信した入力信号xin(n)〜xin(n)を分析する。そして、信号判定部10は受信した入力信号xinが例えば音声か雑音かの判定を行い、その結果を判定情報として小信号パワー取得部3bに出力する。なお、入力信号xin(n)〜xin(n)を分析する方法としては例えば自己相関分析などの方法を用いれば良い。小信号パワー取得部3bでは、入力された判定情報に基づいて、例えば入力信号が雑音でない場合には最小パワーのトラッキングを停止し、雑音と判定された場合に最小パワーのトラッキングをするようにする。これ以外の処理は実施の形態1と同様である。
この実施の形態によれば、入力信号の様態を分析した結果を用いて最小パワーのトラッキングの処理を制御することで、より精度の高いトラッキングが可能になり、精密なゲイン補正をすることが可能となる。これは、入力信号に音声が頻繁に混入したりする場合や、あるいはマイクロホンが叩かれるなどで高レベルの雑音が混入する場合などで特に有効である。
実施の形態3.
実施の形態1では、入力信号の全周波数帯域の最小パワーに応じた制御を行っているが、入力信号を周波数領域に変換し、入力信号のスペクトル成分毎、あるいは帯域毎に補正を細分化することで、更にきめ細やかな補正を行うことも可能である。
図8はこの発明の実施の形態3に係る集音装置の信号補正部1cの構成を示すブロック図である。なお、実施の形態3の集音装置の全体の構成は実施の形態1と同様である。図8において実施の形態1と異なるのは、入力信号に対して高速フーリエ変換(FFT:Fast Fourier Transform)処理を行うFFT部(スペクトル変換部)11と、補正後の信号に対して逆FFT(IFFT:Inverse FFT)処理を行うIFFT部(スペクトル逆変換部)12を備えていることである。その他の構成については図2と同様であるが、小信号パワー抽出部3c、補正量設定部4c、補正部5cはスペクトルを処理対象とする。
なお、FFT部11、IFFT部12は他のブロックと同様にプロセッサとプロセッサで実行されるプログラムで実現したり、ASIC等のハードウェアで実現したりすることが可能である。
次にこの実施の形態の集音装置の動作を実施の形態1との差分を中心に説明する。なお、FFT処理およびIFFT処理は公知の技術であるので詳細な説明を省略する。この実施の形態の信号補正部1cでは、まずFFT部11が入力された入力信号xin(n)対してFFT処理を行う。具体的には下式(8)に示すFFT分析を行って入力信号xin(n)をパワースペクトルXin(n,k)に変換する。ここで、FFT(・)はFFT分析を表し、Kはこの処理によって求まるパワースペクトルの総数、kは求めたパワースペクトルに付される0からK−1までの番号(スペクトル番号)である。なお、図8ではスペクトル番号の表記を省略している。
Figure 0006048596
小信号パワー取得部3cは、FFT部11が出力したパワースペクトルXin(n,k)を受信すると、前述の実施の形態1と同様の方法により、スペクトル毎に第2のしきい値であるパワースペクトルのしきい値を求めて、このしきい値に基づいて小信号パワースペクトルXmin(n,k)を定めて出力する。
次に、補正量設定部4cは入力信号xin(n)〜xin(n)のそれぞれに対応する小信号パワースペクトルXmin(n,k)〜Xmin(n,k)を用いて、実施の形態1と同様の方法でスペクトル毎の補正量であるスペクトル補正ゲインG(n,k)〜G(n,k)を算出する。
次に、補正部5cは対応する入力信号xin(n)のパワースペクトルXin(n,k)に対してスペクトル毎に下式(9)により補正を行う。ここで、mは1以上N以下の自然数である。
Figure 0006048596
そして、IFFT部12がそれぞれ対応する補正後のパワースペクトルYin(n,k)〜Yin(n,k)をIFFT処理により時間領域の信号に再変換して補正信号yin(n)〜yin(n)を信号処理部2へ出力する。以降の処理は実施の形態1と同様である。
この実施の形態3によれば、入力信号xin(n)をFFT処理して求めたパワースペクトル毎に補正量を算出して補正を行うようにしたので、入力信号全体ではなくスペクトル成分毎あるいは帯域毎に周波数特性と振幅を揃えることができ、より精密な補正を行うことができる。
また、上述の実施の形態3の変形例として、図9に示すように実施の形態2と同様の入力信号の分析を入力信号のスペクトルに対して行う信号判定部10dを備えて、信号判定部10dが出力する判定情報を用いて小信号パワー取得部3dが実施の形態2と同様の処理をするように構成することも可能である。
実施の形態4.
上述の実施の形態1から実施の形態3で説明した集音装置を、自動車や船舶等の移動機器に搭載される経路案内装置やあるいは通話装置などを備えた移動機器情報システムに組み込んだ実施の形態を説明する。なお、以下では車載情報システムを移動機器情報システムの例として説明する。
図10はこの実施の形態に係る車載情報システムの構成の一例を示すブロック図である。この実施の形態の車載情報システムは、上述の実施の形態1から3のいずれかに係る集音装置100と、経路案内装置101、音声認識装置102、通話装置103、能動消音装置104、マイクロホンアレー20、表示装置105、通信装置106、スピーカ107を備えている。なお、図10に示した構成は一例でありこの他にもさまざまな装置を組み合わせることが可能である。
次にこの車載情報システムの動作を説明する。マイクロホンアレー20は取得した音の信号を集音装置100に入力する。集音装置100は実施の形態1から実施の形態3で説明したいずれかの動作を行い、出力信号を出力する。集音装置100が出力した出力信号を音声認識装置102、通話装置103、能動消音装置104が受信する。
音声認識装置102は受信した集音装置100の出力信号について音声認識処理を行い利用者が発した指示等を経路案内装置101あるいは通話装置103に出力する。音声認識装置102からの指示を受信した経路案内装置101は指定された経路案内の処理を実施して、経路案内画像を表示装置105によって表示したり、経路案内音声等をスピーカ107から出力したりする。
また、音声認識装置102からの指示を受信した通話装置103は通信装置106を制御する。例えば通話開始の指示であった場合、通話装置103は通信装置106が通信相手との通信回線を接続するように制御する。そして集音装置100から受信した出力信号を通信装置106に出力する。通信装置106は通信回線を介して通信相手と通信を行い、受信した信号を通話装置103に出力する。通話装置103は通信装置106から受信した信号をスピーカ107から出力する。
また、能動消音装置104は、集音装置100から受信した出力信号を用いて車室内の環境騒音を予測し、その環境騒音を打ち消す音響信号を生成して、スピーカ107から出力し、車室内の騒音を低減させる。
上述のようにこの実施の形態によれば、車載情報システムの集音装置100はマイクロホンに到来する音を用いて、集音対象の音に対して適切でない補正をする可能性を低減して、マイクロホンで取得した信号の補正を行うことができるので、良好な出力信号を得ることが可能である。これにより、車載情報システムが備える装置が行うマイクロホンで取得した音声などの音を用いて行う処理の性能を向上することができる。
以上のように、この発明の集音装置もしくは集音方法は、マイクロホンアレーが取得した音の信号を、集音する目的音を必要せずにマイクロホン間の特性の差異が小さくなるように補正することで良好な集音した音の信号を生成できるので、カーナビゲーションシステムといった車載情報システムなどの集音した音に基づいて処理を実施するシステムにおいて有用である。
1,1b,1c,1d 信号補正部、2 信号処理部、3,3b,3c,3d 小信号パワー取得部、4,4c 補正量設定部、5、5c 補正部、6 パワー計算部、7 最小値追跡部、8 しきい値計算部、9 比較部、10,10d 信号判定部、10 FFT部(スペクトル変換部)、11 IFFT部(スペクトル逆変換部)、20 マイクロホンアレー、21 マイクロホン、100 集音装置、101 経路案内装置、102 音声認識装置、103 通話装置、104 能動消音装置、105 表示装置、106 通信装置、107 スピーカ。

Claims (7)

  1. 複数のマイクロホンで取得された複数の入力信号のそれぞれについて、前記入力信号のパワーに応じて複数の異なる忘却係数を用いて求められた前記入力信号のパワーの最小値の長期平均値に基づいて第1のしきい値を規定し、前記第1のしきい値よりも値の小さい前記入力信号のパワーをその入力信号の小信号パワーとする小信号パワー取得部と、
    前記複数の入力信号を補正するためのそれぞれの補正量を前記入力信号のそれぞれの前記小信号パワーに基づいて求める補正量設定部と、
    前記複数の入力信号を補正するためのそれぞれの前記補正量に基づいて前記入力信号をそれぞれ補正する補正部と、
    を備えることを特徴とする集音装置。
  2. 前記補正量設定部は、前記複数のマイクロホンのうちのあらかじめ定められた1つのマイクロホンで取得された前記入力信号の前記小信号パワーを基準とし、前記複数の入力信号を補正するためのそれぞれの前記補正量を、当該補正量で補正される前記入力信号の前記小信号パワーと前記基準とした小信号パワーに基づいて求めることを特徴とする請求項1に記載の集音装置。
  3. 前記入力信号を周波数領域の信号であるスペクトルに変換するスペクトル変換部と、
    周波数領域の信号であるスペクトルを時間領域の信号に変換するスペクトル逆変換部と、を備え、
    前記小信号パワー取得部は前記スペクトル変換部で変換された前記入力信号のスペクトルに応じて複数の異なる忘却係数を用いて求められた前記入力信号のスペクトルの最小値の長期平均値に基づいて第2のしきい値を規定し、前記第2のしきい値よりも値の小さい前記入力信号のパワースペクトルをその入力信号の小信号パワースペクトルとし、
    前記補正量設定部は前記入力信号の前記小信号パワースペクトルに基づいて当該入力信号のスペクトルを補正するための補正量を求め、
    前記補正部は前記入力信号のスペクトルを前記補正量設定部で求められた当該入力信号のスペクトルを補正するための補正量に基づいて補正し、
    前記スペクトル逆変換部は前記補正部において補正された前記入力信号のスペクトルを時間領域の信号に変換することを特徴とする請求項1または請求項2に記載の集音装置。
  4. 前記入力信号を分析して当該入力信号の状態を判定した判定情報を出力する信号判定部を備え、
    前記小信号パワー取得部は前記判定情報を用いて前記小信号パワーまたは小信号パワースペクトルを取得する処理を実施することを特徴とする請求項1から請求項3のいずれか一項に記載の集音装置。
  5. 複数のマイクロホンで取得された複数の入力信号から集音する対象の音の信号を生成する集音装置における前記入力信号の補正方法であって、
    前記入力信号のパワーに応じて複数の異なる忘却係数を用いて求められた前記入力信号のパワーの最小値の長期平均値に基づいて第1のしきい値を規定するステップと、
    規定された前記第1のしきい値よりも値の小さい前記入力信号のパワーをその入力信号の小信号パワーとするステップと、
    前記入力信号を補正するためのそれぞれの補正量を当該入力信号の前記小信号パワーに基づいて求めるステップと、
    前記入力信号のそれぞれをその入力信号を補正するための前記補正量に基づいて補正するステップと、
    を備えることを特徴とする集音装置の入力信号補正方法。
  6. 前記補正量は、前記複数のマイクロホンのうちのあらかじめ定められた1つのマイクロホンで取得された前記入力信号の前記小信号パワーを基準とし、当該補正量で補正される前記入力信号の前記小信号パワーと前記基準とした小信号パワーに基づいて求められることを特徴とする請求項5に記載の集音装置の入力信号補正方法。
  7. 複数のマイクロホンで取得された複数の入力信号のそれぞれについて、前記入力信号のパワーに応じて複数の異なる忘却係数を用いて求められた前記入力信号のパワーの最小値の長期平均値に基づいて第1のしきい値を規定し、前記第1のしきい値よりも値の小さい前記入力信号のパワーをその入力信号の小信号パワーとし、このそれぞれの小信号パワーに基づいてその小信号パワーに対応する前記入力信号を補正するための補正量を求め、それぞれのこの補正量に基づいて前記複数の入力信号をそれぞれ補正した信号を用いて集音対象の音を強調した出力信号を生成する集音装置と、
    前記集音装置が出力した前記出力信号の音声認識結果に基づいて処理を行う経路案内装置、または前記出力信号を用いる通話装置、または前記出力信号を用いる能動消音装置の少なくともいずれか一つを備えることを特徴とする移動機器情報システム。
JP2015559605A 2014-01-28 2014-01-28 集音装置、集音装置の入力信号補正方法および移動機器情報システム Active JP6048596B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/000412 WO2015114674A1 (ja) 2014-01-28 2014-01-28 集音装置、集音装置の入力信号補正方法および移動機器情報システム

Publications (2)

Publication Number Publication Date
JP6048596B2 true JP6048596B2 (ja) 2016-12-21
JPWO2015114674A1 JPWO2015114674A1 (ja) 2017-03-23

Family

ID=53756307

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015559605A Active JP6048596B2 (ja) 2014-01-28 2014-01-28 集音装置、集音装置の入力信号補正方法および移動機器情報システム

Country Status (5)

Country Link
US (1) US9674607B2 (ja)
JP (1) JP6048596B2 (ja)
CN (1) CN105830152B (ja)
DE (1) DE112014006281T5 (ja)
WO (1) WO2015114674A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6567456B2 (ja) * 2016-04-05 2019-08-28 日本電信電話株式会社 レベル差補正装置、レベル差補正プログラム、および記録媒体
JP6844149B2 (ja) * 2016-08-24 2021-03-17 富士通株式会社 利得調整装置および利得調整プログラム
CN107509155B (zh) * 2017-09-29 2020-07-24 广州视源电子科技股份有限公司 一种阵列麦克风的校正方法、装置、设备及存储介质
CN111417053B (zh) * 2020-03-10 2023-07-25 北京小米松果电子有限公司 拾音音量控制方法、装置以及存储介质
EP4156719A1 (en) * 2021-09-28 2023-03-29 GN Audio A/S Audio device with microphone sensitivity compensator

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2944098B2 (ja) * 1989-04-14 1999-08-30 沖電気工業株式会社 音声区間検出方式
JPH07152397A (ja) * 1993-11-29 1995-06-16 Sony Corp 音声区間検出方法、並びに音声通信装置および音声認識装置
JPH10139571A (ja) * 1996-11-05 1998-05-26 Seibu Trading:Kk 陶磁器の絵付方法
JP3297346B2 (ja) 1997-04-30 2002-07-02 沖電気工業株式会社 音声検出装置
JP2000250568A (ja) * 1999-02-26 2000-09-14 Kobe Steel Ltd 音声区間検出装置
JP3540988B2 (ja) 2000-07-17 2004-07-07 日本電信電話株式会社 発音体指向性補正方法およびその装置
JP2002099297A (ja) 2000-09-22 2002-04-05 Tokai Rika Co Ltd マイクロフォン装置
FR2824978B1 (fr) * 2001-05-15 2003-09-19 Wavecom Sa Dispositif et procede de traitement d'un signal audio
JP2002354576A (ja) * 2001-05-25 2002-12-06 Sony Corp ノイズキャンセラー装置及びノイズキャンセル方法
EP1453348A1 (de) 2003-02-25 2004-09-01 AKG Acoustics GmbH Selbstkalibrierung von Arraymikrofonen
US20070230712A1 (en) * 2004-09-07 2007-10-04 Koninklijke Philips Electronics, N.V. Telephony Device with Improved Noise Suppression
JP4262703B2 (ja) * 2005-08-09 2009-05-13 本田技研工業株式会社 能動型騒音制御装置
CN101263734B (zh) * 2005-09-02 2012-01-25 丰田自动车株式会社 麦克风阵列用后置滤波器
US8275120B2 (en) * 2006-05-30 2012-09-25 Microsoft Corp. Adaptive acoustic echo cancellation
JP5070993B2 (ja) * 2007-08-27 2012-11-14 富士通株式会社 音処理装置、位相差補正方法及びコンピュータプログラム
JP4886715B2 (ja) * 2007-08-28 2012-02-29 日本電信電話株式会社 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
US8411880B2 (en) * 2008-01-29 2013-04-02 Qualcomm Incorporated Sound quality by intelligently selecting between signals from a plurality of microphones
JP5326533B2 (ja) 2008-12-09 2013-10-30 富士通株式会社 音声加工装置及び音声加工方法
JP5197458B2 (ja) * 2009-03-25 2013-05-15 株式会社東芝 受音信号処理装置、方法およびプログラム
JP5180139B2 (ja) * 2009-04-17 2013-04-10 セコム株式会社 発声検出装置
CN102044243B (zh) * 2009-10-15 2012-08-29 华为技术有限公司 语音激活检测方法与装置、编码器
JP5170465B2 (ja) * 2009-12-11 2013-03-27 沖電気工業株式会社 音源分離装置、方法及びプログラム
CN101867853B (zh) * 2010-06-08 2014-11-05 中兴通讯股份有限公司 基于传声器阵列的语音信号处理方法及装置
JP5110614B2 (ja) * 2010-12-20 2012-12-26 株式会社日本製鋼所 狭帯域能動騒音制御方法および狭帯域能動騒音制御装置
DE112011104737B4 (de) * 2011-01-19 2015-06-03 Mitsubishi Electric Corporation Geräuschunterdrückungsvorrichtung
FR2976710B1 (fr) * 2011-06-20 2013-07-05 Parrot Procede de debruitage pour equipement audio multi-microphones, notamment pour un systeme de telephonie "mains libres"
CN103440872B (zh) * 2013-08-15 2016-06-01 大连理工大学 瞬态噪声的去噪方法

Also Published As

Publication number Publication date
US20160241954A1 (en) 2016-08-18
DE112014006281T5 (de) 2016-10-20
CN105830152B (zh) 2019-09-06
WO2015114674A1 (ja) 2015-08-06
CN105830152A (zh) 2016-08-03
US9674607B2 (en) 2017-06-06
JPWO2015114674A1 (ja) 2017-03-23

Similar Documents

Publication Publication Date Title
KR100883712B1 (ko) 음원 방향 추정 방법, 및 음원 방향 추정 장치
EP2773137B1 (en) Microphone sensitivity difference correction device
KR101156847B1 (ko) 자동화된 센서 신호 매칭
JP4916394B2 (ja) エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム
JP4912036B2 (ja) 指向性集音装置、指向性集音方法、及びコンピュータプログラム
CN103329200B (zh) 目标音增强装置以及车辆导航系统
JP6048596B2 (ja) 集音装置、集音装置の入力信号補正方法および移動機器情報システム
JP6107151B2 (ja) 雑音抑圧装置、方法、及びプログラム
JP6668995B2 (ja) 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム
US11984132B2 (en) Noise suppression device, noise suppression method, and storage medium storing noise suppression program
WO2016133007A1 (ja) 音場補正装置、音場補正方法及び音場補正プログラム
JP6840302B2 (ja) 情報処理装置、プログラム及び情報処理方法
WO2020035180A1 (en) Method of operating an ear level audio system and an ear level audio system
JP2016042613A (ja) 目的音声区間検出装置、目的音声区間検出方法、目的音声区間検出プログラム、音声信号処理装置及びサーバ
US11470429B2 (en) Method of operating an ear level audio system and an ear level audio system
JP6903947B2 (ja) 非目的音抑圧装置、方法及びプログラム
JP6711205B2 (ja) 音響信号処理装置、プログラム及び方法
JP2017067844A (ja) 音声判定装置、方法及びプログラム、並びに、音声処理装置
JP6638248B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声信号処理装置
JP2010152107A (ja) 目的音抽出装置及び目的音抽出プログラム
JP6763319B2 (ja) 非目的音判定装置、プログラム及び方法
JP2026020809A (ja) 収音装置、収音プログラム及び収音方法
JP2019140609A (ja) 音場補正装置、音場補正方法及び音場補正プログラム
CN113514799A (zh) 基于麦克风阵列的声源定位方法、装置、设备及存储介质
JP2020134778A (ja) 雑音除去装置、雑音除去方法およびプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150909

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150909

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161025

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161107

R151 Written notification of patent or utility model registration

Ref document number: 6048596

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250