JP6065308B2 - 音量補正装置 - Google Patents

音量補正装置 Download PDF

Info

Publication number
JP6065308B2
JP6065308B2 JP2012197869A JP2012197869A JP6065308B2 JP 6065308 B2 JP6065308 B2 JP 6065308B2 JP 2012197869 A JP2012197869 A JP 2012197869A JP 2012197869 A JP2012197869 A JP 2012197869A JP 6065308 B2 JP6065308 B2 JP 6065308B2
Authority
JP
Japan
Prior art keywords
gain
unit
value
input signal
audio input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012197869A
Other languages
English (en)
Other versions
JP2014052553A (ja
Inventor
哲平 鷲
哲平 鷲
福島 実
実 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2012197869A priority Critical patent/JP6065308B2/ja
Publication of JP2014052553A publication Critical patent/JP2014052553A/ja
Application granted granted Critical
Publication of JP6065308B2 publication Critical patent/JP6065308B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Control Of Amplification And Gain Control (AREA)

Description

本発明は、音量補正装置に関するものである。
従来、パケットにより音声信号を送信する音声送信端末装置と、受信した音声信号に基づいて音声を出力する音声受信端末装置とを備え、リアルタイムで音声通話を行う音声伝送システムがあった(例えば特許文献1参照)。
この音声伝送システムでは、音声受信端末装置が、音声送信端末装置から受信したパケットが有する音声データの一音声フレームを復号化した後、復号化されたディジタル音声信号に異音対策処理を行って、伝送エラーによる異音の発生を抑えていた。すなわち、音声送信端末装置側では、第1差分演算手段が、ディジタル音声信号の標本点の量子化値とその一つ前の標本点の量子化値との差分の絶対値を算出し、一音声フレームについて絶対値の最大値を求めている。そして、音声受信端末装置の異音対策処理手段が、ディジタル音声信号の標本点の量子化値とその一つ前の標本点の量子化値との差分の絶対値を算出し、この絶対値が上記の最大値を超えた場合は異音と判断して、異音を抑制する処理を行っていた。
特開2008−292961号公報
上述のようなリアルタイムで音声通話を行う音声伝送システムでは、音声入力信号の信号レベルが変化するのに合わせて、適応的に利得を調整する必要があった。そのため、従来は音声入力信号をサンプリングする毎に、サンプリングした瞬時値から音声全体の振幅を推定し、その推定値をもとに利得を算出することが行われていた。これらの処理はサンプリング毎に行われるため、信号処理の処理量が多量になって、演算処理部に高性能のマイコンを使用する必要があった。
本発明は上記課題に鑑みて為されたものであり、その目的とするところは、音量補正処理の処理量を低減した音量補正装置を提供することにある。
本発明の音量補正装置は、バッファ部と、利得算出部と、利得制限部と、利得乗算部とを備える。バッファ部は、所定時間分の音声入力信号を記憶可能な記憶領域を有し、前記記憶領域に空きがなくなると、最も古い音声入力信号を記憶する記憶領域に、新しい音声入力信号を上書き保存する。利得算出部は、前記バッファ部に保存される音声入力信号が全て入れ替わる毎に、前記バッファ部に保存されている音声入力信号の代表値に基づいて利得を算出する。利得制限部は、前記利得算出部が前回算出した利得と今回算出した利得との変化分を求め、前記変化分の絶対値が所定の第1閾値以上の場合、前回算出した利得を、今回算出した利得に近付くように所定の変動上限分だけ変化させて得た制限値を今回の利得とする。利得乗算部は、前記利得算出部及び前記利得制限部によって前記利得が設定されると、前記バッファ部から音声入力信号を古い順番に読み出し、読み出した音声入力信号に前記利得を乗算して出力する。前記変化分の絶対値が前記第1閾値以上となって、前記利得制限部が前記制限値を今回の利得とした場合、前記バッファ部が前記記憶領域のサイズを小さくする。
この音量補正装置において、前記利得算出部は、前記バッファ部に保存されている音声入力信号の絶対値の最大値を求め、前記最大値を前記代表値とすることも好ましい。
この音量補正装置において、前記利得算出部は、前記バッファ部に保存されている音声入力信号の絶対値の平均値を求め、前記平均値を前記代表値とすることも好ましい。
この音量補正装置において、前記利得算出部は、前記代表値に利得を乗算した値が予め設定された目標値と等しくなるように利得を設定することも好ましい。
この音量補正装置において、前記利得制限部が前記制限値を今回の利得とした場合に前記利得と前記代表値との積が所定の第2閾値を超えると、前記利得制限部は、前記代表値に利得を乗算した値が所定の目標値となるように前記利得算出部によって算出された利得を今回の利得とすることも好ましい。
この音量補正装置において、前記代表値が、無音状態か有音状態かを判定する判定レベル以下であれば、前記利得乗算部は、前記利得算出部によって前回算出された利得を、前記バッファ部から読み出した音声入力信号に乗算して出力することも好ましい。
この音量補正装置において、前記バッファ部に入力される音声入力信号が音声か非音声かを判定する音声判定部を備えることも好ましい。前記音声判定部によって前記バッファ部に入力されている音声入力信号が全て非音声と判定された場合、前記利得乗算部は、前記利得算出部によって前回算出された利得を、前記バッファ部から読み出した音声入力信号に乗算して出力する。
この音量補正装置において、前記利得算出部は、算出した利得が所定の上限値を超えた場合、利得を前記上限値に設定することも好ましい。
本発明によれば、バッファ部に保存される音声入力信号が全て入れ替わる毎に、利得算出部が、バッファ部に保存された音声入力信号の代表値に基づいて利得を算出している。したがって、サンプリング毎に利得を算出する従来例に比べて、音量補正の処理量を低減でき、またバッファ部の記憶容量に応じた遅延のみで利得を算出できるから、出力音声の遅延を低減できる。さらに、利得算出部によって前回算出された利得と今回算出された利得との変化分を求め、この変化分の絶対値が第1閾値以上の場合、利得制限部は、前回算出した利得を、今回算出した利得に近付くように、所定の変動上限分だけ変化させて得た制限値を今回の利得としている。これにより、入力音声の音量レベルが急変したために、利得の算出結果が第1閾値以上変動した場合でも、利得の変動が所定の変動上限分に抑えられるから、出力される音声の音量が急変するのを抑制できる。
本実施形態のブロック図である。 同上の動作を説明する波形図であり、(a)は利得、(b)は音声入力信号の絶対値を示す図である。 同上の別の動作を説明する波形図であり、(a)は利得、(b)は音声入力信号の絶対値を示す図である。 同上のバッファ部に保存された音声入力信号から代表値を求める方法の説明図である。 同上のバッファ部に保存された音声入力信号から代表値を求める別の方法の説明図である。 同上のまた別の動作を説明する波形図であり、(a)は利得、(b)は音声入力信号の絶対値を示す図である。 同上のさらに別の動作を説明する波形図であり、(a)は利得、(b)は音声入力信号の絶対値を示す図である。 同上のまた別の動作を説明する波形図であり、(a)は利得、(b)は音声入力信号の絶対値を示す図である。
以下に本発明の実施の形態を図面に基づいて説明する。
図1は、本発明に係る音量補正装置10を用いた音声出力装置1のブロック図である。
音声出力装置1は、マイク2と、A/D変換部3と、音量補正装置10と、符号化・パケット化処理部4と、無線送信部5とを備える。
マイク2は、入力された音声を電気信号に変換してA/D変換部3に出力する。
A/D変換部3は、マイク2から入力された電気信号をA/D変換する。そして、A/D変換部3によりデジタル信号に変換された音声入力信号は音量補正装置10に出力される。
音量補正装置10は、バッファ部11と、利得設定部12(利得算出部13及び利得制限部14からなる)と、利得乗算部15とを主要な構成として備え、A/D変換部3から入力された音声入力信号の音量レベルを補正する。尚、利得設定部12及び利得乗算部15は、例えばマイクロコンピュータに組み込みのプログラムを実行させることによって、実現される。
バッファ部11は、A/D変換部3から入力される所定時間分の音声入力信号を記憶可能な記憶領域を備えている。バッファ部11は、記憶領域に空きがなくなると、最も古い音声入力信号を記憶する記憶領域に、新しい音声入力信号を上書き保存する。
利得設定部12は利得算出部13と利得制限部14とからなり、バッファ部11に保存される音声入力信号が全て入れ替わる毎(すなわち所定時間毎)に利得を決定する。
利得算出部13は、バッファ部11に保存される音声入力信号が全て入れ替わる毎に、バッファ部11に保存されている音声入力信号の代表値に基づいて利得を算出する。具体的には、利得算出部13は、バッファ部11に保存されている所定時間分の音声入力信号をもとに、音声入力信号の絶対値の最大値を求め、この最大値を代表値としている。図4に音声入力信号(絶対値)の波形の一例を示す。図4の期間T1,T2,T3,T4は、それぞれ、バッファ部11に保存可能な音声入力信号の時間長に対応しており、期間T1,T2,T3,T4の各々で、バッファ部11内に保存される音声入力信号が全て入れ替わるようになっている。利得算出部13は、期間T1,T2,T3,T4の終わりで、バッファ部11に保存されている音声入力信号の最大値P1,P2,P3,P4を求め、この最大値P1,P2,P3,P4を各期間における音声入力信号の代表値とする。そして、利得算出部13は、各期間における音声入力信号の最大値(代表値)に利得を乗算した値が所定の目標値となるように、利得を算出する。
利得制限部14は、利得算出部13によって利得が算出されると、利得算出部13によって前回算出された利得と今回算出された利得との変化分を求める。この変化分の絶対値が所定の第1閾値以上の場合、利得制限部14は、前回算出した利得を、今回算出した利得に近付くように所定の変動上限分ΔGだけ変化させて得た制限値を今回の利得として、利得乗算部15に出力する。一方、上述した変化分の絶対値が第1閾値未満であれば、利得制限部14は、利得を制限する処理を行わず、利得算出部13が今回算出した利得をそのまま利得乗算部15に出力する。尚、第1閾値は、少なくとも変動上限分ΔGより大きい値に設定されている。
図2(b)は音声入力信号の波形の一例であり、図2(a)は音声入力信号をもとに決定された利得を示している。利得算出部13は、バッファ部11に保存される音声入力信号が全て入れ替わる毎に利得を算出しており、期間T1,T2,T3,T4の終わりに算出された利得はそれぞれG1,G2,G3,G4となる。
ここで、期間T2の終わりに利得算出部13によって利得が算出された場合、利得制限部14は、前回算出された利得G1と今回算出された利得G2との変化分を求め、この変化分の絶対値(|G1−G2|)と第1閾値との高低を比較する。利得G1と利得G2との変化分の絶対値は第1閾値未満であるので、利得制限部14は、今回算出された利得G2を期間T2における利得に設定して、利得乗算部15に出力する。
また期間T3の終わりに利得算出部13によって利得が算出された場合、利得制限部14は、前回算出された利得G2(期間T2の利得)と、今回算出された利得G3との変化分を求め、この変化分の絶対値と第1閾値との高低を比較する。利得G2と利得G3との変化分の絶対値は第1閾値未満であるので、利得制限部14は、今回算出された利得G3を期間T3における利得に設定して、利得乗算部15に出力する。
一方、期間T4の終わりに利得算出部13によって利得が算出された場合、利得制限部14は、前回算出された利得G3(期間T3の利得)と、今回算出された利得G4との変化分を求め、この変化分の絶対値と第1閾値との高低を比較する。ここで、期間T4では期間T3に比べて音声入力信号の最大値が大幅に低下しているため、利得G3と利得G4との変化分の絶対値は第1閾値以上となる。よって、利得制限部14は、前回算出した利得G3を、今回算出した利得G4に近付く向きに所定の変動上限分ΔGだけ変化させて得た制限値G4b(=G3+ΔG)を今回の利得に設定する。ここにおいて、変動上限分ΔGは、人間の聴覚特性に鑑みて3dB程度に設定されるのが好ましく、利得の変化に伴って発生する音量の変化に気付きにくくなるから、ユーザが違和感を抱かないように音量変化を抑制できる。
利得乗算部15は、利得設定部12によって利得が設定されると、バッファ部11から音声入力信号を古い順番に読み出し、読み出した音声入力信号に、利得設定部12から入力された利得を乗算して、符号化・パケット化処理部4に出力する。
符号化・パケット化処理部4は、音量補正装置10によって音量が補正された信号に、音声符号化処理、パケット化処理を施した後、無線送信部5に出力する。
無線送信部5は、符号化・パケット化処理部4によって音声符号化処理およびパケット化処理が施された音声信号を無線送信する。
以上のように本実施形態では、マイク2から入力された音声は、A/D変換部3によってA/D変換され、音量補正装置10によって音量レベルが補正された後、音声符号化処理、パケット化処理が施されて無線送信部5から無線送信されるのである。
そして、音量補正装置10では、バッファ部11に保存される音声入力信号が全て入れ替わる毎に、利得算出部13が、バッファ部11に保存された音声入力信号の代表値に基づいて利得を算出している。したがって、サンプリング毎に利得を算出する従来例に比べて、音量補正の処理量を低減でき、またバッファ部11の記憶容量に応じた遅延のみで利得を算出できるから、出力音声の遅延を低減できる。さらに、前回算出された利得と今回算出された利得との変化分を求め、この変化分の絶対値が第1閾値以上の場合、利得制限部14は、前回算出した利得が今回算出した利得に近付くように、前回算出した利得を所定の変動上限分だけ変化させて得た制限値を今回の利得とする。これにより、入力音声の音量レベルが急変したために、利得の算出結果が第1閾値以上変動した場合でも、利得の変動が所定の変動上限分に抑えられるから、出力される音声の音量が急変するのを抑制できる。
ところで、バッファ部11に記憶される音声信号の時間長が短すぎると、入力される音声の信号レベルの変化に対して、音量補正装置10が過剰に反応し、音量補正処理が頻繁に行われるため、音量補正装置10の処理量が増大することになる。また、バッファ部11に記憶される音声信号の時間長が長すぎると、記憶容量の大きなバッファ部11が必要になり、バッファ部11に保存可能な時間分だけの遅延が発生するという問題がある。
また、通常の発話において1音節或いは1文字の時間長を平均すると130(mSec)程度であることが知られている(参考文献:「音声情報処理の基礎」,斎藤収三,中田和男著,オーム社刊,1981年)。本実施形態では、少なくとも数音節のデータを用いて音量調整が行えるよう、バッファ部11に記憶される音声信号の時間を数100(mSec)〜数1000(mSec)程度に設定しており、バッファリングによる遅延を短くしつつ、音量補正処理が頻繁に行われるのを抑制することができる。
また利得算出部13は、算出した利得が所定の上限値を超えた場合、出力する利得を上限値に設定することも好ましい。このように、利得算出部13から出力される利得を上限値内に制限することで、音声入力信号が過大な利得で増幅されるのを防止でき、それによって出力音声に含まれるフロアノイズを低減できる。またインターホンなどの通話システムに利用された場合には、出力レベルを抑制してハウリングを発生し難くできる。
ここで、前回算出した利得と今回算出した利得との変化分の絶対値が上記第1閾値以上の場合、利得制限部14は、上述のようにして求めた制限値を今回の利得としているが、それに加えて、バッファ部11が記憶領域のサイズを小さくすることも好ましい。
図3(b)は音声入力信号の波形の一例を示し、図3(a)は音声入力信号をもとに決定された利得を示している。利得算出部13は、バッファ部11に保存される音声入力信号が全て入れ替わる毎に利得を算出しており、期間T11,T12,T13の終わりにバッファ部11内に保存された音声入力信号をもとに算出された利得はG11,G12,G13となる。
期間T12の終わりでは、前回算出された利得G11と今回算出された利得G12との変化分の絶対値(|G11−G12|)が第1閾値未満となっているから、利得制限部14は、算出された利得G12を今回との利得とする。
一方、期間T13では期間T12に比べて音声入力信号の音量レベルが大きく低下しているから、前回(期間T12において)算出された利得G12と今回算出された利得G13との変化分の絶対値が第1閾値以上となっている。よって、利得制限部14は、前回算出された利得G12を、今回算出された利得G13に近付くように所定の変動上限分ΔGだけ変化させて得た制限値G13bを今回の利得とする。また利得制限部14は、バッファ部11を制御して、音声入力信号を記憶するのに用いる記憶領域のサイズを小さくしており、記憶領域のサイズを小さくすることで保存可能な音声入力信号の時間長を短くしている。すなわち、期間T11〜T13までの時間長D1に比べて、期間T14以後はバッファ部11に保存可能な音声入力信号の時間長D2が短くなっている。尚、期間T14,T15の終了時においても、利得算出部13が今回算出した利得と前回の利得との変化分の絶対値が第1閾値以上となっているので、利得制限部14は、前回の利得に変動上限分ΔGを加算して得た制限値を今回の利得として設定する。また期間T16の終了時には、利得算出部13が今回算出した利得と前回の利得との変化分の絶対値が第1閾値未満となっているので、利得算出部13は今回算出した値を利得G16として設定しており、期間T13の終わりに算出された利得G13に略一致する。
このように、期間T14以降はバッファ部11に保存される音声入力信号の時間長が短くなるから、短時間で利得が更新されることになる。よって、利得の変化分が上記の変動上限値ΔG以内に制限された場合でも、より短い時間で利得を目標利得(利得制限部14で利得の変化分が制限される前に利得算出部13で算出された利得G13)に到達させることができる。尚、バッファ部11が記憶領域のサイズを小さくした後、利得算出部13が今回算出した利得と前回の利得との変化分の絶対値が第1閾値未満になれば、バッファ部11が、音声入力信号を記憶するために用いる記憶領域のサイズを元の大きさに戻してもよい。
また本実施形態では、バッファ部11内に保存された音声入力信号が全て入れ替わった後に、利得算出部13が、バッファ部11に保存されている音声入力信号の絶対値の最大値を求め、この最大値を代表値としている。そして、利得算出部13は、音声入力信号の代表値(最大値)に利得を乗算して得た値が所定の目標値となるように、利得を設定している。これにより、音量補正装置10から出力される信号の最大値を一定にすることができる。
尚、音量補正装置10から出力される信号の平均レベルを一定としたい場合には、バッファ部11に保存された音声入力信号の平均値を代表値とし、この代表値(平均値)に利得を乗算して得た値が所定の目標値となるように、利得を設定してもよい。図5に音声入力信号(絶対値)の波形の一例を示し、期間T1,T2,T3,T4の時間長はバッファ部11内に保存される音声入力信号の時間長に対応している。バッファ部11に保存される音声入力信号が全て入れ替わる毎(すなわち期間T1,T2,T3,T4の終了時)に、利得算出部13は、期間T1,T2,T3,T4の各々において音声入力信号の平均値A1,A2,A3,A4を求める。そして、利得算出部13は、各期間で求めた平均値を各期間における音声入力信号の代表値とし、この代表値に利得を乗算した値が所定の目標値となるように利得を算出する。これにより音量補正装置10から出力される信号の平均値を所定の目標値とすることができ、音量レベルの平均値を一定にできる。
ところで、図6(a)(b)に示すように期間T4において音声入力信号の音量レベルが急激に大きくなると、利得算出部13によって算出された利得G4は、前回算出された利得G3に比べて大幅に低下する。ここで、利得G3と利得G4との変化分の絶対値が第1閾値を超えた場合、利得制限部14は、前回算出された利得G3を、今回算出された利得G4に近付く向きに変動上限分ΔGだけ変化させた値G4bを、今回の利得として設定する。この場合、期間T4における利得が十分低下していないため、期間T4における音声入力信号の代表値と利得G4bとの積が、所定の第2閾値を超える可能性がある。利得制限部14は、制限値を今回の利得とした場合にこの利得と代表値との積が所定の第2閾値を超えると、代表値に利得を乗算した値が所定の目標値となるように利得算出部13によって算出された利得を今回の利得とする。これにより、マイク2に入力される音声の信号レベルが急激に大きくなった場合は、第1閾値を超えて利得を変化(低下)させることによって、過大な音量の信号が出力されるのを防止できる。尚、上記の第2閾値は、上記した目標値よりも大きい値であって、出力音量の上限レベルに対応した値に設定されていればよい。
また本実施形態において、バッファ部11内に保存された音声入力信号の代表値が、無音状態か有音状態かを判定する判定レベル以下であれば、利得算出部13は利得の算出を行わず、利得算出部13が前回算出した利得を利得乗算部15が用いることも好ましい。
図7(b)は音声入力信号の波形の一例であり、図7(a)は音声入力信号をもとに決定された利得を示している。図示例では、期間T1,T2,T3ではバッファ部11内に保存された音声入力信号の代表値(例えば最大値)が所定の判定レベルL1を超えているので、利得算出部13は、各期間における音声入力信号の代表値をもとに利得を算出する。一方、期間T4ではバッファ部11内に保存された音声入力信号の代表値(最大値)が判定レベルL1以下であるから、利得算出部13は利得の算出を行わない。そして、利得乗算部15は、期間T4において、利得算出部13が前回算出した利得G3を用い、バッファ部11から読み出した音声入力信号に利得G3を乗算して、符号化・パケット化処理部4に出力する。
音声入力信号の代表値が判定レベルL1以下の場合、すなわち意味のある信号が入力されていない無音状態で、利得算出部13が利得を算出すると、利得が過大な値に設定されてしまうが、上述のように代表値が判定レベルL1以下であれば利得算出部13が利得の算出を行わず、前回算出された利得で音声入力信号を乗算しているので、フロアノイズが過大な利得で増幅される可能性を低減できる。尚、上記の判定レベルL1は、フロアノイズの音量レベルよりは大きく、且つ、意味のある信号(すなわち音声信号)の代表値の下限より小さい値に設定されることが好ましく、意味のある信号とフロアノイズとを確実に弁別できる。
また本実施形態において、バッファ部11に入力される音声入力信号が音声か非音声かを判定する音声判定部(図示せず)を備えることも好ましい。この場合、音声判定部によってバッファ部11に入力されている音声入力信号が全て非音声と判定されると、利得算出部13は利得の算出を行わず、利得乗算部15は、利得算出部13によって前回算出された利得を用いて音声入力信号を乗算している。
例えば図8(b)に示す音声入力信号の場合、期間T1,T2,T3では、バッファ部11内に保存されている音声入力信号の少なくとも一部が音声と判定されている。よって、期間T1,T2,T3では利得算出部13が利得の算出を行っており、期間T1,T2,T3における利得はそれぞれG1,G2,G3となっている(図8(a)参照)。一方、期間T4では、音声判定部によってバッファ部11内に保存されている音声入力信号の全てが非音声と判定されており、この場合、利得算出部13は利得の算出を行わない。そして、利得乗算部15は、期間T4において、利得算出部13が前回算出した利得G3を用い、バッファ部11から読み出した音声入力信号に利得G3を乗算して、符号化・パケット化処理部4に出力する。ここで、期間T4における非音声の信号から利得を求めた場合、その利得G21は、音声信号から求めた利得(例えば期間T3の利得G3)に比べて大幅に大きくなり、この利得G21を用いて音声入力信号を乗算すると、雑音を高利得で増幅してしまうことになる。それに対して、本実施形態では、音声入力信号が全て非音声と判定された期間T4において利得の算出を行わず、前回求めた利得G3を用いて音声入力信号を増幅しているので、非常に高い利得で雑音が増幅されるのを抑制できる。
このように、音声判定部によってバッファ部11に入力されている音声入力信号が全て非音声と判定された場合、利得乗算部15は、利得算出部13によって前回算出された利得を、バッファ部11から読み出した音声入力信号に乗算している。よって、音声以外のノイズが高い利得で増幅されるのを抑制することができる。
尚、音声判定部は以下のような方法で音声か非音声かを判定する。すなわち音声判定部は、A/D変換部3から入力される音声入力信号の比較的長い時間における長時間平均値と、音声入力信号の比較的短い時間における短時間平均値とを求める。ここで、短時間平均値は、音声入力信号に含まれる音声成分によってそのレベルが決定され、長時間平均値は、音声入力信号に含まれる雑音成分(音声以外の音成分)によってそのレベルが決定されると考えられる。而して音声判定部は、長時間平均値に対する短時間平均値の割合が所定の基準値以上であれば音声と判定し、基準値未満であれば非音声と判定しており、音声と非音声とを確実に判別することができる。尚、音声か非音声かを判定する方法は上記の方法に限定されるものではなく、例えば音声入力時に話者が操作するスイッチの入力から音声か非音声かを判定してもよい。
10 音量補正装置
11 バッファ部
12 利得設定部
13 利得算出部
14 利得制限部
15 利得乗算部

Claims (8)

  1. 所定時間分の音声入力信号を記憶可能な記憶領域を有し、前記記憶領域に空きがなくなると、最も古い音声入力信号を記憶する記憶領域に、新しい音声入力信号を上書き保存するバッファ部と、
    前記バッファ部に保存される音声入力信号が全て入れ替わる毎に、前記バッファ部に保存されている音声入力信号の代表値に基づいて利得を算出する利得算出部と、
    前記利得算出部が前回算出した利得と今回算出した利得との変化分を求め、前記変化分の絶対値が所定の第1閾値以上の場合、前回算出した利得を、今回算出した利得に近付くように所定の変動上限分だけ変化させて得た制限値を今回の利得とする利得制限部と、
    前記利得算出部及び前記利得制限部によって利得が設定されると、前記バッファ部から音声入力信号を古い順番に読み出し、読み出した音声入力信号に前記利得を乗算して出力する利得乗算部とを備え
    前記変化分の絶対値が前記第1閾値以上となって、前記利得制限部が前記制限値を今回の利得とした場合、前記バッファ部が前記記憶領域のサイズを小さくする
    ことを特徴とする音量補正装置。
  2. 前記利得算出部は、前記バッファ部に保存されている音声入力信号の絶対値の最大値を求め、前記最大値を前記代表値とすることを特徴とする請求項1記載の音量補正装置。
  3. 前記利得算出部は、前記バッファ部に保存されている音声入力信号の絶対値の平均値を求め、前記平均値を前記代表値とすることを特徴とする請求項1記載の音量補正装置。
  4. 前記利得算出部は、前記代表値に利得を乗算した値が予め設定された目標値と等しくなるように利得を設定することを特徴とする請求項1乃至3の何れか1項に記載の音量補正装置。
  5. 前記利得制限部が前記制限値を今回の利得とした場合に前記利得と前記代表値との積が所定の第2閾値を超えると、前記利得制限部は、前記代表値に利得を乗算した値が所定の目標値となるように前記利得算出部によって算出された利得を今回の利得とすることを特徴とする請求項1乃至4の何れか1項に記載の音量補正装置。
  6. 前記代表値が、無音状態か有音状態かを判定する判定レベル以下であれば、
    前記利得乗算部は、前記利得算出部によって前回算出された利得を、前記バッファ部から読み出した音声入力信号に乗算して出力することを特徴とする請求項1乃至5の何れか1項に記載の音量補正装置。
  7. 前記バッファ部に入力される音声入力信号が音声か非音声かを判定する音声判定部を備え、
    前記音声判定部によって前記バッファ部に入力されている音声入力信号が全て非音声と判定された場合、
    前記利得乗算部は、前記利得算出部によって前回算出された利得を、前記バッファ部から読み出した音声入力信号に乗算して出力することを特徴とする請求項1乃至5の何れか1項に記載の音量補正装置。
  8. 前記利得算出部は、算出した利得が所定の上限値を超えた場合、利得を前記上限値に設定することを特徴とする請求項1乃至7の何れか1項に記載の音量補正装置。
JP2012197869A 2012-09-07 2012-09-07 音量補正装置 Active JP6065308B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012197869A JP6065308B2 (ja) 2012-09-07 2012-09-07 音量補正装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012197869A JP6065308B2 (ja) 2012-09-07 2012-09-07 音量補正装置

Publications (2)

Publication Number Publication Date
JP2014052553A JP2014052553A (ja) 2014-03-20
JP6065308B2 true JP6065308B2 (ja) 2017-01-25

Family

ID=50611069

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012197869A Active JP6065308B2 (ja) 2012-09-07 2012-09-07 音量補正装置

Country Status (1)

Country Link
JP (1) JP6065308B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11191486B2 (en) 2017-09-19 2021-12-07 Ausculsciences, Inc. System and method for detecting decoupling of an auscultatory sound sensor from a test-subject

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6451079B2 (ja) * 2014-05-14 2019-01-16 沖電気工業株式会社 音声強調装置及びプログラム、並びに、音声復号装置及びプログラム
JPWO2017042875A1 (ja) * 2015-09-08 2018-07-19 パイオニア株式会社 電子聴診装置、制御方法、コンピュータプログラム及び記録媒体
CN109716432B (zh) * 2018-11-30 2023-05-02 深圳市汇顶科技股份有限公司 增益处理方法及其装置、电子设备、信号采集方法及其系统
CN110111805B (zh) 2019-04-29 2021-10-29 北京声智科技有限公司 远场语音交互中的自动增益控制方法、装置及可读存储介质
JP2020078642A (ja) * 2020-02-27 2020-05-28 パイオニア株式会社 電子聴診装置、制御方法、コンピュータプログラム及び記録媒体

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3473517B2 (ja) * 1999-09-24 2003-12-08 ヤマハ株式会社 指向性拡声装置
JP4321049B2 (ja) * 2002-07-29 2009-08-26 パナソニック電工株式会社 自動利得制御装置
KR100561440B1 (ko) * 2004-07-24 2006-03-17 삼성전자주식회사 채널 변경에 따른 음량 자동 보정 장치 및 그 방법
JP4997833B2 (ja) * 2006-05-30 2012-08-08 沖電気工業株式会社 自動利得制御装置
US8401844B2 (en) * 2006-06-02 2013-03-19 Nec Corporation Gain control system, gain control method, and gain control program
FR2906071B1 (fr) * 2006-09-15 2009-02-06 Imra Europ Sas Soc Par Actions Reduction de bruit multibande avec une reference de bruit non acoustique
FR2906070B1 (fr) * 2006-09-15 2009-02-06 Imra Europ Sas Soc Par Actions Reduction de bruit multi-reference pour des applications vocales en environnement automobile
JP2008261978A (ja) * 2007-04-11 2008-10-30 Toshiba Microelectronics Corp 再生音量自動調整方法
JP5147420B2 (ja) * 2008-01-11 2013-02-20 オンセミコンダクター・トレーディング・リミテッド 増幅回路
WO2011074164A1 (ja) * 2009-12-15 2011-06-23 パナソニック株式会社 自動利得制御装置、受信機、電子機器、及び自動利得制御方法
JP5821022B2 (ja) * 2010-12-20 2015-11-24 パナソニックIpマネジメント株式会社 集合住宅用インターホンシステムの外線転送装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11191486B2 (en) 2017-09-19 2021-12-07 Ausculsciences, Inc. System and method for detecting decoupling of an auscultatory sound sensor from a test-subject

Also Published As

Publication number Publication date
JP2014052553A (ja) 2014-03-20

Similar Documents

Publication Publication Date Title
JP6065308B2 (ja) 音量補正装置
CN101388216B (zh) 声音处理装置、控制增益的装置和方法
US9531338B2 (en) Signal processing apparatus, signal processing method, program, signal processing system, and communication terminal
EP2265039B1 (en) Hearing aid
JP5151762B2 (ja) 音声強調装置、携帯端末、音声強調方法および音声強調プログラム
JP2007316658A (ja) ステレオ音響信号の処理方法と装置
JP5598552B2 (ja) 音声制御装置、音声制御方法、音声制御プログラム及び携帯端末装置
CN103220595A (zh) 音频处理装置和音频处理方法
CN101447771A (zh) 一种增益自动控制的方法和系统
WO2011055489A1 (ja) 補聴器
CN107454537B (zh) 包括滤波器组和起始检测器的听力装置
EP2743923B1 (en) Voice processing device, voice processing method
WO2014194273A2 (en) Systems and methods for enhancing targeted audibility
JP2008309955A (ja) ノイズサプレス装置
US9424830B2 (en) Apparatus and method for encoding audio signal, system and method for transmitting audio signal, and apparatus for decoding audio signal
JP5724869B2 (ja) 信号処理装置、信号処理方法及びプログラム
JP2019110447A (ja) 電子機器、電子機器の制御方法、及び、電子機器の制御プログラム
JP5172335B2 (ja) 音声活動の検出
JP5453131B2 (ja) ハンズフリー制御装置およびノイズ制御方法
US11245997B2 (en) Headphone volume control method and headphone
JP5709973B2 (ja) ノイズ除去装置
JP2013090249A (ja) 自動利得制御装置
JP4973376B2 (ja) 音声の基本周期を検出する装置およびその基本周期を用いて話速変換を行う装置
US20120163628A1 (en) Method for reducing digital audio output noise
KR100741434B1 (ko) 무선 오디오 시스템에서 전송지연 최소화 및/또는 잡음감소를 위한 데이터 처리 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150310

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20150312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160405

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161209

R151 Written notification of patent or utility model registration

Ref document number: 6065308

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151