JP5302190B2 - オーディオ復号装置、オーディオ復号方法、プログラム及び集積回路 - Google Patents

オーディオ復号装置、オーディオ復号方法、プログラム及び集積回路 Download PDF

Info

Publication number
JP5302190B2
JP5302190B2 JP2009516175A JP2009516175A JP5302190B2 JP 5302190 B2 JP5302190 B2 JP 5302190B2 JP 2009516175 A JP2009516175 A JP 2009516175A JP 2009516175 A JP2009516175 A JP 2009516175A JP 5302190 B2 JP5302190 B2 JP 5302190B2
Authority
JP
Japan
Prior art keywords
frame
section
time signal
correction
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009516175A
Other languages
English (en)
Other versions
JPWO2008146466A1 (ja
Inventor
耕司郎 小野
武志 則松
良明 高木
崇 片山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2009516175A priority Critical patent/JP5302190B2/ja
Publication of JPWO2008146466A1 publication Critical patent/JPWO2008146466A1/ja
Application granted granted Critical
Publication of JP5302190B2 publication Critical patent/JP5302190B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、オーディオ復号装置、オーディオ復号方法、プログラム及び集積回路に関し、特に、互いに重複する区間を含む複数のフレーム区間に分割された時間信号が、それぞれ符号化された複数のフレームデータを含むオーディオストリームを復号するオーディオ復号装置に関する。
近年、マルチチャンネルオーディオの再生装置が整備されつつあり、マルチチャンネルに対するニーズが高まっている。そのため、MPEG(Moving Picture Experts Group)オーディオ規格において、MPEG Surroundと呼ばれるマルチチャンネル信号の符号化技術が規格化された。MPEG Surroundはマルチチャンネル信号の臨場感を維持したまま、マルチチャンネル信号をモノラル又はステレオの信号に符号化する。当該モノラル又はステレオの信号は、従来の放送又は配信によりオーディオ復号装置を備える再生装置に放送又は配信される。オーディオ復号装置は、当該モノラル又はステレオの信号をマルチチャンネル信号に復号する(例えば、非特許文献1参照)。
このMPEG Surroundは、従来のマルチチャンネル符号化技術であるAC3(Dolby Digital、Audio Code number 3)及びDTS(Digital Theater Systems)よりもビットレートが低く、かつ従来のAAC(Advanced Audio Coding)及びAAC+SBR(Spectral Band Replication)といった符号化技術と互換性を保っているため、デジタルラジオ又はワンセグ放送などの移動体放送に用いられることが予想される。
ここで、一般的なオーディオ復号装置を、図1を用いて説明する。
図1に示す従来のオーディオ復号装置10は、ストリーム100を復号することで出力波形106を生成する。
ストリーム100は、オーディオ符号化装置によってオーディオ信号が符号化されたビットストリームであり、一般に複数のアクセス単位によって構成される。このストリームのアクセス単位を以後フレームと呼ぶことにする。また、フレームに含まれる符号化されたオーディオ信号をフレームデータと呼ぶことにする。フレームデータは、原音(符号化前のオーディオ信号)が所定の区間ごとに符号化されたデータであり、当該所定の区間をフレーム区間と呼ぶことにする。
オーディオ復号装置10は、デコード部101と、直交変換部103と、出力部105とを備える。
デコード部101は、ストリーム100の文法解析を行い、フレーム単位で、ハフマン符号の復号及び逆量子化を行うことで、スペクトル係数102を生成するオーディオデコーダである。
直交変換部103は、フレーム単位で、スペクトル係数102をデコード部101で決められた変換アルゴリズムに基づいて時間信号104に変換する。
出力部105は、時間信号104から出力波形106を生成する。
また、従来のオーディオ復号装置10では、デコード部101でエラーが発生した際には、エラーが発生したフレーム(以下、エラーフレームと呼ぶ)の時間信号104を0でクリアするミュート処理、又は過去の時間信号104を繰り返し用いるリピート処理が行われる。
また、エラーが発生したフレーム区間(以下、エラーフレーム区間と呼ぶ)の前後の時間信号からエラーフレーム区間の時間信号を補間することで、連続性を維持した補間を行うオーディオ復号装置も知られている(例えば、特許文献1参照)。
118th AES convertion、 Barcelona、 Spain、 2005、 Convention Paper 6447 特開2002−41088号公報
しかしながら、デジタルテレビなどに対する非移動体放送と比べ、移動体放送ではエラーが頻繁に発生することが予想される。エラーが頻繁に発生すると、従来のオーディオ復号装置10では、ミュート処理又はリピート処理が頻繁に繰り返される。これにより、ユーザーが不快に感じる可能性が高くなる。
また、特許文献1記載のオーディオ復号装置のように、前後のフレームからエラーフレーム区間を合成した場合にもリピート処理の様に信号の位相が合わず、ノイズを知覚する可能性がある。これにより、ユーザーが不快に感じる可能性が高くなる。
本発明は、このような従来の問題点を補うため、前後フレームとの連続性を維持したままエラーフレームを補間することで、ユーザーの不快感を低減できるオーディオ復号装置、オーディオ復号方法、プログラム及び集積回路を提供することを目的とする。
上記の課題を解決するため、本発明に係るオーディオ復号装置は、隣接するフレーム区間の間で互いに重複する区間を含む複数のフレーム区間に分割された時間信号がそれぞれ符号化された複数のフレームデータを含むオーディオストリームを復号するオーディオ復号装置であって、前記オーディオストリームを前記フレームデータ単位でスペクトル係数に復号し、当該フレームデータを復号できない場合にエラー情報を出力するデコード手段と、前記スペクトル係数を前記フレーム区間単位の時間信号に変換する直交変換手段と、前記デコード手段により前記エラー情報が出力された場合、当該エラー情報が出力されたフレーム区間と当該フレーム区間に隣接するフレーム区間とが重複する区間内であり、かつ当該隣接するフレーム区間の中央部分の区間である基準区間の時間信号に基づき補正時間信号を生成する補正手段と、前記補正時間信号を前記エラー情報が出力されたフレーム区間の時間信号として用いたうえで、複数のフレーム区間の時間信号を合成することで、出力波形を生成する出力手段とを備える。
この構成によれば、本発明に係るオーディオ復号装置は、エラーが発生したフレーム区間に残っている時間信号を参照することで、エラーが発生したフレームの時間信号の波形に近い補正時間信号を生成し、生成した補正時間信号を出力波形に合成できる。これにより、本発明に係るオーディオ復号装置は、前後フレームとの連続性を維持したままエラーフレームを補間することで、ユーザーの不快感を低減できる。
さらに、本発明に係るオーディオ復号装置は、エラーが発生したフレーム区間の時間信号のうち、隣接するフレーム区間の中央部分の時間信号を用いて、補正時間信号を生成する。ここで、各フレーム区間の中央部分の時間信号は、両端部分の時間信号に比べて、原音(符号化前かつ分割前の時間信号)の情報を多く含んでいる。よって、本発明に係るオーディオ復号装置は、エラーが発生したフレーム区間の時間信号の波形により近い波形の補正時間信号を生成できる。
また、前記補正手段は、前記基準区間の時間信号と、前記出力手段により既に生成された前記出力波形との相関値を算出し、算出した相関値が最も大きい前記出力波形を切り出すことで前記補正時間信号を生成してもよい。
この構成によれば、本発明に係るオーディオ復号装置は、基準区間の時間信号に類似する補正時間信号を生成できる。
また、前記各フレーム区間は、それぞれ同じ時間長の第1区間、第2区間、第3区間及び第4区間からなり、前記隣接するフレーム区間の中央部分の区間は、前記隣接するフレーム区間の前記第2区間又は前記第3区間であってもよい。
また、前記補正手段は、前記算出した相関のうち最も強い相関値が予め定められた第1の値より大きいか否かを判定し、当該相関値が前記第1の値より大きい場合、前記補正時間信号を生成し、当該相関値が前記第1の値より小さい場合、前記補正時間信号を生成しなくてもよい。
この構成によれば、本発明に係るオーディオ復号装置は、基準区間の時間信号と、出力波形との相関値が第1の値より小さい場合には、エラーが発生した時間信号の補正を行わない。これにより、本発明に係るオーディオ復号装置は、時間信号にアタック成分が含まれている場合、つまり補正を行うことで逆に音質が劣化する場合には補正を中止できる。
また、前記補正手段は、前記基準区間の出力波形のスペクトルを算出し、算出したスペクトルにおいて、高域のエネルギーの低域のエネルギーに対する比が予め定められた第2の値より大きいか否かを判定し、当該比が前記第2の値より小さい場合、前記補正時間信号を生成し、当該比が前記第2の値より大きい場合、前記補正時間信号を生成しなくてもよい。
この構成によれば、本発明に係るオーディオ復号装置は、基準区間の時間信号のスペクトルにおいて、高域のエネルギーが低域のエネルギーに比べて高い場合には、エラーが発生した時間信号の補正を行わない。これにより、本発明に係るオーディオ復号装置は、時間信号にアタック成分が含まれる場合、つまり補正を行うことで逆に音質が劣化する場合には補正を中止できる。
また、前記補正手段は、前記相関値が最も大きい出力波形のスペクトルを算出し、算出したスペクトルにおいて、高域のエネルギーの低域のエネルギーに対する比が予め定められた第2の値より大きいか否かを判定し、当該比が前記第2の値より小さい場合、当該出力波形を切り出すことで前記補正時間信号を生成し、当該比が前記第2の値より大きい場合、前記補正時間信号を生成しなくてもよい。
この構成によれば、本発明に係るオーディオ復号装置は、補正時間信号に用いる出力波形のスペクトルにおいて、高域のエネルギーが低域のエネルギーに比べて高い場合には、エラーが発生した時間信号の補正を行わない。これにより、本発明に係るオーディオ復号装置は、時間信号にアタック成分が含まれる場合、つまり補正を行うことで逆に音質が劣化する場合には補正を中止できる。
なお、本発明は、このようなオーディオ復号装置として実現できるだけでなく、オーディオ復号装置に含まれる特徴的な手段をステップとするオーディオ方法として実現したり、そのような特徴的なステップをコンピュータに実行させるプログラムとして実現したりすることもできる。そして、そのようなプログラムは、CD−ROM等の記録媒体及びインターネット等の伝送媒体を介して流通させることができるのは言うまでもない。
また、本発明は、このようなオーディオ復号装置の機能の一部又は全てを実現する集積回路としても実現できる。
以上より、本発明は、前後フレームとの連続性を維持したままエラーフレームを補間することで、ユーザーの不快感を低減できるオーディオ復号装置、オーディオ復号方法、プログラム及び集積回路を提供できる。
以下、本発明に係るオーディオ復号装置の実施の形態を、図面を参照しながら説明する。
(実施の形態1)
本発明の実施の形態1に係るオーディオ復号装置は、エラーフレーム区間に含まれる出力波形(時間信号)を用いて、エラーフレームの時間信号の波形に近い補正時間信号を生成し、生成した補正時間信号を出力波形に合成する。さらに、本発明に係るオーディオ復号装置は、エラーフレーム区間の時間信号のうち、原音の情報を多く含む、隣接するフレーム区間の中央部分の時間信号(出力波形)を用いて、補正時間信号を生成する。
これにより、本発明に係るオーディオ復号装置は、前後フレームとの連続性を維持したままエラーフレームを補間することで、ユーザーの不快感を低減できる。
まず、本発明の実施の形態1に係るオーディオ復号装置の構成を説明する。
図2は、本実施の形態1に係るオーディオ復号装置の構成を示す図である。
図2に示すオーディオ復号装置20は、ストリーム200を復号することで、復号したオーディオ信号である出力波形206を生成する。
ストリーム200は、オーディオ符号化装置によってオーディオ信号が符号化されたオーディオビットストリームである。ストリーム200は、複数のフレームを含む。各フレームは、複数のフレーム区間に分割されたオーディオ信号が符号化されたフレームデータを含む。
オーディオ復号装置20は、デコード部201と、直交変換部203と、出力部205と、補正部208とを備える。
オーディオ復号装置20は、デコード部201でエラーが発生した場合に、デコード部201から得られるストリーム情報207と、エラーフレーム区間に含まれる出力波形206とに基づいてエラーフレームを復元する。
デコード部201は、ストリーム200の文法解析を行ったうえで、フレーム単位で、ハフマン符号の復号及び逆量子化を行うことで、スペクトルデータであるスペクトル係数202を生成する。
また、デコード部201は、ストリーム情報207を出力する。
ストリーム情報207は、デコード結果と、ストリームの特性とを含む情報である。ここで、デコード結果とは、デコード時にエラーが発生したか否かを示すエラーフラグの情報である。つまり、デコード部201は、フレームデータを復号できない場合に、エラーフラグを含むストリーム情報207を出力する。
また、ストリームの特性とは、MPEG−2 AACデコーダにおける、ストリーム長及びブロック長などの情報である。
直交変換部203は、デコード部201で決められた変換アルゴリズムに基づいて、フレーム単位で、スペクトル係数202を時間データである時間信号204に変換する。
出力部205は、直交変換部203で決められた変換アルゴリズムに基づいて、複数のフレームの時間信号204を合成することで、最終的な出力波形206を生成する。
補正部208は、ストリーム情報207にエラーフラグが含まれている場合に、出力波形206のエラーフレーム区間と過去又は未来の出力波形206に基づいてエラーフレームを補正するための時間信号である補正時間信号209を生成する。
また、出力部205は、補正部208により生成された補正時間信号209をエラーフレーム区間の時間信号として用いたうえで、複数のフレーム区間の時間信号204を合成することで、出力波形206を生成する。
以上のように構成されたオーディオ復号装置20の動作について説明する。
まず、MDCT(Modified Discrete Cosine Transform)によるオーディオ符号化について説明する。
図3は、MDCTによるオーディオ符号化を説明するための図である。
図3に示すように、MDCTによる符号化では、元のオーディオ時間信号301は、複数のフレーム区間の時間信号301〜305に分割される。例えば、期間t1及びt2を合わした期間が1つのフレーム区間に対応し、期間t2及び期間t3を合わした期間が1つのフレーム区間に対応する。
つまり、1つのフレーム区間は、隣接するフレーム区間に対して、互いに重複する区間を含む。例えば、時間信号301のフレーム区間と時間信号302のフレーム区間とは期間t2が重複する。
つまり、MDCTによる符号化では、期間t2の時間信号300は、時間信号301と時間信号302に分割され、期間t3の時間信号300は、時間信号302と時間信号303とに分割される。具体的には、期間t1及びt2の時間信号300に窓関数を掛けることで時間信号301が生成され、期間t2及びt3の時間信号300に窓関数を掛けることで時間信号302が生成される。
次に、分割された時間信号301〜305は、それぞれ1つのフレームデータに符号化される。当該複数のフレームデータを含むストリーム200がオーディオ復号装置20に入力される。
図4は、オーディオ復号装置20の動作の流れを示すフローチャートである。
はじめに、デコード部201は、ストリーム200の文法解析を行ったうえで、フレーム毎に、ハフマン符号の復号及び逆量子化を行うことで、スペクトル係数202を生成する(S101)。
次に、直交変換部203は、オーディオコーデックで決められた変換アルゴリズムに基づいてスペクトル係数202を時間信号204に変換する(S102)。
具体的には、MPEG−2 AACデコーダでは、2048点の振幅データを出力するIMDCT(逆MDCT:Inverse Modified Discrete Cosine Transform)が直交変換に用いられる。
図5は、IMDCTを説明するための図である。なお、ここでは、正弦波に対して、MDCT及びIMDCTを行った場合の時間信号を例に示す。
図5において、時間信号310は、符号化前の1フレームに対応する時間信号である。つまり、時間信号310は、図3に示す時間信号301〜305に対応する。
ここで、1フレームの時間信号310は、それぞれ同じ時間長の4つの区間a〜dの信号からなる。
直交変換部203は、スペクトル係数202にIMDCTを行うことで、時間信号311を生成する。符号化及び復号化の影響を無視すると、IMDCTの出力である時間信号311は、MDCTの入力である時間信号301〜305と下記の式(1)の関係が成立する。
Yn=IMDCT(MDCT(a、b、c、d))
=(a−bR、b−aR、c−dR、d−cR)・・・式(1)
ここで、a、b、c、dは、それぞれ区間a〜dの信号であり、aR、bR、cR、dRは、それぞれ区間a、b、c、dの信号を時間軸で反転させた信号である。時間信号301〜305に対して式(1)を適用して得られる信号を時間信号301'〜305'とする。
次に、直交変換部203は、時間信号311に窓関数を掛けることで時間信号204を生成する。
デコード部201で当該フレームにエラーが発生していない場合(S103でNo)、つまりストリーム情報207にエラーフラグが含まれない場合、次に、出力部205は、直交変換のアルゴリズムに基づいて複数のフレームに対応する複数の時間信号204から出力波形206を生成する。具体的には、出力部205は、MPEG−2 AACデコーダでは、各時間信号204に含まれる2048点の振幅データを、それぞれ直前及び直後の時間データに含まれる振幅データと、1024点ずつ重ね合わせて合成することで、出力波形206を生成する(S105)。
つまり、出力部205は、図3に示す複数の時間信号301〜305に対して式(1)を適用した信号を加算することで、時間信号を復元する。例えば、出力部205は、時間信号301'の後半と、時間信号302'の前半を加算することで、期間t2の時間信号を生成し、時間信号302'の後半と、時間信号303'の前半を加算することで期間t3の時間信号を生成する。
一方、デコード部201で当該フレームにエラーが発生した場合(S103でYes)、つまりストリーム情報207にエラーフラグが含まれる場合に、補正部208は、出力波形206のエラーフレーム区間とバッファリングされた出力波形206とに基づいてエラーフレームを補正する(S104)。
一般に、オーディオ符号化技術で用いられているMDCT及びQMF(Quadrature Mirror Filters)といった直交変換では、連続したフレームのうちの1つのフレームでエラーが発生した場合においても、出力波形206のエラーフレーム区間に情報が含まれる。
図6は、エラーが発生した場合の時間信号204及び出力波形206のエンベロープ(包絡線)を示す図である。ここで、エンベロープとは、時間信号204及び出力波形206の概形を示す線である。
図6に示すように、連続するフレームのうち1つのフレームでエラーが発生した場合、当該エラーが発生したフレームに対応する時間信号204aの振幅値は0でクリアされる。しかしながら、上述したようにエラーフレーム区間t10の出力波形206は、エラーフレームの時間信号204aと、エラーフレームに隣接するフレームの時間信号204bの後半分及び時間信号204cの前半分を加算したものなので、エラーフレーム区間t10の出力波形206の振幅値は0にならない。つまり、エラーフレーム区間t10の出力波形206は、時間信号204bの後半分及び時間信号204cの前半分となる。
よって、補正部208は、エラーフレーム区間t10に含まれている情報、すなわち時間信号204bの後半分及び時間信号204cの前半分の振幅値のデータと似ている波形をバッファリングされた出力波形206から捜し出し、補正時間信号209を生成することが可能となる。
以下、補正部208による補正処理(S104)を詳細に説明する。
図7は、補正部208による補正処理(S104)の流れを示すフローチャートである。
補正部208は、エラーフレーム区間と、エラーフレーム区間に隣接するフレーム区間とが重複する区間内であり、かつ当該隣接するフレーム区間の中央部分の区間である基準区間の時間信号に基づき補正時間信号209を生成する。
具体的には、補正部208は、基準区間の時間信号と、既に出力部205により生成された出力波形206との相関値を算出し、算出した相関値が最も大きい出力波形206を切り出すことで補正時間信号209を生成する。
始めに、補正部208は、直前のフレーム区間から類似する波形の基準とする時間信号の波形である基準波形を抽出する(S501)。
ここで、エラーのために復元されなかった時間信号204aは、直前のフレームの時間信号204bの後半分と重複する区間の信号である。つまり、復元すべき時間信号204aの波形の前半分は、直前のフレームの時間信号204bの後半分の波形と似ていることが予想される。同様に、復元すべき時間信号204aの波形の後半分は、直後のフレームの時間信号204cの前半分の波形と似ていることが予想される。
また、図5に示すように、符号化前の時間信号310に含まれる4つの区間a〜dの時間信号のうち、区間b及びcの時間信号は、窓関数の中央部分に位置するため原音(時間信号300)の情報を多く含む。区間a及びdの時間信号は、窓関数の両端部分に近いため原音(時間信号300)の情報が少ない。
さらに、時間信号204を生成する際には、式(1)に示すように、区間a及びdの時間信号は、情報量が多い区間b及びcの時間信号を時間軸で反転させた信号であるbR及びcRで減算される。さらに、直交変換部203により、IMDCT後の時間信号311に窓関数が掛けられる。よって、時間信号204に含まれる区間b及びcの時間信号は、原音(時間信号300)の情報を多く含み、区間a及びdの時間信号は、原音(時間信号300)の情報が少ない。
そこで、補正部208は、基準波形として、原音の情報を多く含む区間b又はcの時間信号を基準波形として抽出する。
図8〜図11は、補正部208による補正処理を説明するための図である。
図8に示すように、補正部208は、エラーフレーム区間t10に含まれる出力波形206のうち、直前のフレームの区間cに対応する基準区間320の出力波形206を基準波形として抽出する。なお、補正部208は、直後のフレームの区間bに対応する基準区間321の出力波形206を基準波形として抽出してもよい。
なお、補正部208は、基準区間320及び321の一部の区間に含まれる出力波形206を基準波形として抽出してもよい。
また、基準区間320より前(図8における左側)の区間及び基準区間321より後(図8における右側)の区間では、出力波形206は完全に復元されているので、補正部208は、当該区間を含む区間の出力波形206を基準波形として抽出してもよい。
次に、補正部208は、基準波形を用いて、補正時間信号209の候補となる時間信号を含む対象区間323を探索する(S502)。
補正部208は、図9に示すように、基準波形322と、バッファに蓄積された正常な出力波形206との相関をとり、相関の強い波形を含む対象区間323を探す。具体的には、補正部208は、出力波形206の各期間における相関度を算出することで、相関関数を算出する。補正部208は、算出した相関関数を用いて、相関度が最も高い対象区間323を探索する。つまり、補正部208は、算出した相関関数のピークを抽出する。ここで、相関度とは、波形(位相)の類似度合いである。つまり、対象区間323は、エラーにより消失した時間信号204aと、類似する音を含む区間である。
次に、補正部208は、補正時間信号209を切り出す(S503)。具体的には、図10に示すように、対象区間323を含む1フレーム区間分の区間である切り出し区間324の出力波形206を切り出す。ここで、切り出し区間324は、基準区間320に対するエラーフレーム区間の相対位置に対応する、対象区間323に対する1フレーム区間である。ここでは、基準区間320は、エラーフレーム区間t10の先頭の区間なので、切り出し区間324は、対象区間323を先頭とする1フレーム区間である。
次に、補正部208は、切り出した出力波形206に、MDCTと同様の窓関数を掛けることで、補正時間信号209を生成する。
最後に、補正部208は、補正時間信号209を出力部205に転送する(S504)。
次に、出力部205は、エラーによって失われた時間信号204の代わりに補正時間信号209を用いて、複数のフレームの時間信号204及び補正時間信号209を合成することで、出力波形206の補間を行う(S105)。
このように、本発明の実施の形態1に係るオーディオ復号装置20は、エラーが発生した時間信号204aとの相関が高い補正時間信号209で、出力波形206を補間する。これにより、出力波形206が連続的につながれるだけでなく、エラーフレームの位相が再現する可能性も高くなり、より高音質な補間が実現される。つまり、本発明の実施の形態1に係るオーディオ復号装置20は、前後フレームとの連続性を維持したままエラーフレームを補間できるので、ユーザーの不快感を低減できる。
なお、実施の形態1ではデコード時にエラーが発生した場合に常に補正を行う例を示したが、オーディオ復号装置20は、補正を行うか否かの判別を行ってもよい。
図12は、出力波形206から補正を行うか否かを判断するオーディオ復号装置21の構成を示す図である。図12に示すオーディオ復号装置21は、図2に示すオーディオ復号装置20の構成に加え、さらに、補正制御部210を備える。なお、図2と同様の要素には同一の符号を付している。
補正制御部210は、エラーフレーム区間の出力波形206に基づき補正の実行の有無を判別する。
図13は、補正制御部210の動作の流れを示すフローチャートである。
始めに、補正制御部210は、エラーフレーム区間の出力波形206に対してスペクトル変換を行うことで、スペクトルを生成する(S1101)。
次に、補正制御部210は、生成したスペクトルの高域の低域に対するエネルギー比を算出する。補正制御部210、算出したエネルギー比と閾値を比較する(S1102)。
エネルギー比が高い、すなわち、高域のエネルギーが低域と比べて高い場合には時間信号が定常的ではない可能性がある。このような場合は、エラーフレーム区間にアタック成分が含まれていることが考えられ、前のフレームの波形を用いて補間を行っても逆に音質が劣化する可能性がある。そのため、補正制御部210は、エネルギー比が閾値以上の場合(S1102でYes)には、補正を中止するように補正部208に指示する(S1104)。
一方、エネルギー比が閾値以下の場合(S1102でNo)には、補正制御部210は、定常的な波形と判断し、補正部208に補正を継続させる(S1103)。
なお、補正制御部210は、アタック成分が含まれているかの判定を、エラーフレーム区間に対してだけでなく、対象区間323、又は切り出し区間324に対し行ってもよい。
また、定常性の判断を、補正部208がステップS502で算出する相関関数から判断してもよい。
図14は、本発明の実施の形態1の変形例における、補正部208によるステップS502の動作の流れを示すフローチャートである。
上述したように、始めに、補正部208は、エラーフレーム区間の基準波形322とバッファに蓄積された出力波形206との相関関数を算出し(S1201)、ピークを抽出する(S1202)。このとき、相関関数に強いピークが出現しているときはエラーフレーム区間の基準波形322と似ている信号が得られるが、ピークが弱い場合は、相関関数を算出する範囲の出力波形206にアタック成分が含まれていると考えられる。
そのため、補正部208は、ピークの値が閾値以下か否かを判定する(S1203)。補正部208は、ピークの値が閾値以下の場合(S1203でYes)には、相関が弱いと判断し、補正を中止する(S1204)。一方、ピークの値が閾値以上の場合(S1203でNo)には、補正部208は補間を継続する。
また、上記実施の形態1ではエラーが発生したか否かを判断する情報としてストリーム情報207に含まれるエラーフラグを用いているが、ストリーム情報207に含まれるストリームのパラメータを用いてもよい。
図15は、ストリームのパラメータを用いて補間を行うか否かを判断するオーディオ復号装置22の構成を示す図である。図15に示すオーディオ復号装置22は、図2に示すオーディオ復号装置20の構成に加え、さらに、補正制御部211を備える。なお、図2と同様の要素には同一の符号を付している。
補正制御部211は、ストリーム情報207に含まれるストリームのパラメータを用いて補正の実行の有無を判別する。
例えば、MPEG−2 AACでは、MDCTの長さに2048点と256点の2つが用いられており、当該情報はストリーム200内に記述されている。2048点の場合には、エンコード時に信号が定常的であると判断された可能性が高く、256点の場合には、信号にアタック成分が含まれている可能性が高い。
デコード部201は、当該情報を含むストリーム情報207を出力する。
補正制御部211は、ストリーム情報207を参照し、MDCTの長さが2048点の場合には、補正部208に補正を行わせる。また、補正制御部211は、MDCTの長さが256点の場合には、補正部208に補正を行わせない。
また、上記説明において補正部208は、補間に用いる補正時間信号209を、過去の出力波形206から切り出されているが、出力波形206がバッファリングされている場合は、補正部208は、未来に相当する出力波形206から補正時間信号209を切り出してもよい。
また、補正部208は、波形を切り出すのではなく、ピッチ波形のみを切り出し、ピッチ波形を重ね合わせることでエラーフレームを復元してもよい。
また、補正部208は、波形を切り出すのではなく、切り出し区間のLPC(線形予測符号)分析を行い、エラーフレームにおいてLPC合成を行うことでエラーフレームを復元してもよい。
また、上記説明において、補正部208は、出力部205により合成された出力波形206を用いて補正時間信号209を生成するとしたが、合成前の時間信号204を用いて同様の処理を行ってもよい。同様に、補正制御部210も、合成前の時間信号204を用いて補正を行うか否かの判定を行ってもよい。
(実施の形態2)
本発明の実施の形態2では、音声符号化方式にMPEGサラウンドを用いたデジタル放送受信機を例に説明する。
図16は、本発明の実施の形態2に係るデジタル放送受信機が備えるオーディオ復号装置の構成を示した図である。
図16に示すオーディオ復号装置30は、受信したビットストリーム信号1400を復号し、音声信号1403を出力する。オーディオ復号装置30は、デコード部1301と、バッファ部1302と、話速変換部1303と、エラー検出部1304と、出力速度設定部1305とを備える。
デコード部1301は、ビットストリーム信号1400を復号することで、ビットストリーム信号1400を音声信号1401に変換する。バッファ部1302はデコード部1301で変換された音声信号1401を蓄積し、蓄積する音声信号1402を出力する。エラー検出部1304はデコード部1301でエラーが発生したか否かを検出する。
話速変換部1303は、エラーが発生した場合、エラーが存在するフレームの音声信号1402を削除し、残りのフレームの音声信号1402を伸張し、伸張した音声信号1403を出力する。
出力速度設定部1305は、話速変換部1303により伸張された時間長の総計が1フレームの長さを上回る場合、当該時間長の総計が1フレームの長さと合致するよう、伸張する最後のフレームの話速を調整する。また、出力速度設定部1305は、当該最後のフレーム以降は次にエラーが検出されるまで話速変換を行わない。
図17は、オーディオ復号装置30におけるデータの流れを示す図である。なお、図16と同様の要素には同一の符号を付している。
図17に示す個々のブロックはフレームを構成する時間領域の音声データを表し、番号が小さいものほど古いフレームを意味し、番号が大きいほど新しいフレームを意味するものとする。また、バッファ部1302の遅延時間を4フレームと仮定する。
ここで第6フレームのデータをデコードする際にエラーが検出された場合、話速変換部1303は、第3フレーム以降の音声信号を伸張させ、第5フレームの次に第7フレームの音声信号を出力する。また第10フレームにおいて、第3フレームから第9フレームまでと同等の出力速度で音声信号を出力した場合には第10フレームの終了タイミングが、エラーの発生しない場合より遅くなるという課題が発生する。そこで、出力速度設定部1305は、第10フレームの終了タイミングがエラーの発生しなかった場合と同等になるように、第10フレームの出力速度を微調整する。
なお、話速変換部1303は、再生速度を伸張する他に、新たに同じピッチの音声信号を挿入することで話速を変換してもよい。
図18は、話速変換の前後における音声信号の例を示す図である。図18において、横軸は時間、縦軸は振幅を表している。
また、図18に示す音声信号1501は話速変換前の音声信号の波形の例を示し、音声信号1502は音声信号1501を時間軸方向に伸張した音声信号の波形を示し、音声信号1503は音声信号1501に同じピッチの音声信号を挿入した音声信号の波形を示す。
図18に示すように、伸張した音声信号1502のピッチは、元の音声信号1501に比べてピッチがさがってしまう。
一方、話速変換前の音声信号1501と同じピッチの音声信号を挿入することで、話速変換前の音声信号1501からピッチを変化させること無く話速を伸張できる。また、挿入する音声信号と、削除した音声信号と位相を揃えることで、音声信号の挿入に伴うノイズの発生を軽減できる。
(実施の形態3)
本発明の実施の形態3に係るオーディオ復号装置は、実施の形態2に係るオーディオ復号装置30の変形例である。
図19は、本発明の実施の形態3に係るオーディオ復号装置の構成を示す図である。なお、図16と同一の要素には同一の符号を付しており、説明は省略する。
図19に示すオーディオ復号装置31は、実施の形態2に係るオーディオ復号装置30の構成に加えて、さらに、エラー長計測部1605を備える。また、出力速度設定部1606の構成が異なる。
エラー長計測部1605は、エラーが複数フレームにわたって継続する場合、エラーが継続する継続フレーム数を計測する。
出力速度設定部1606は、エラー長計測部1605により計測された継続フレーム数に応じた変換比を決定する。出力速度設定部1606は、話速変換部1303により伸張した時間長の総計がフレームの長さを上回るとき、当該時間長の総計がフレーム長と合致するよう、伸張する最後のフレームの話速を調整する。また、出力速度設定部1606は、当該最後のフレーム以降は次にエラーが検出されるまで話速変換を行わない。
図20は、オーディオ復号装置31におけるデータの流れを示す図である。なお、図19と同一の要素には同一の符号を付している。
図20に示す個々のブロックはフレームを構成する時間領域の音声データを表し、番号が小さいものほど古いフレームを意味し、番号が大きいほど新しいフレームを意味するものとする。また、バッファ部1302の遅延時間を4フレームと仮定する。
ここで第6フレームのデータをデコードする際にエラーが検出された場合、出力速度設定部1606は、決定した変換比を話速変換部1303に通知することで、話速変換部1303に第3フレーム以降のデータの出力を当該変換比で伸張させる。さらに第7フレームをデコードする際にエラーが検出された場合、出力速度設定部1606は、前記変換比より大きな変換比を話速変換部1303に通知することで、話速変換部1303に第4フレーム以降のデータの出力をさらに遅い速度で再生するよう伸張させる。また、第5フレームの次には第8フレームの信号が出力される。
なお、出力速度設定部1606は、変換比に上限を設けてもよい。これにより、エラーが多発することで再生速度が遅くなりすぎることを防止できる。よって、受聴者の違和感を低減できる。
また、出力速度設定部1606は、所定のエラー率を超えてエラーが発生する場合には、話速変換を停止したうえで、ミュートによるエラー処理に切り替えてもよい。これにより、受聴者に違和感を与えることを防止できる。
(実施の形態4)
本発明の実施の形態4に係るオーディオ復号装置は、実施の形態2に係るオーディオ復号装置30の変形例である。
図21は、本発明の実施の形態4に係るオーディオ復号装置の構成を示す図である。なお、図16と同一の要素には同一の符号を付しており、説明は省略する。
図21に示すオーディオ復号装置32は、実施の形態2に係るオーディオ復号装置30の構成に加えて、さらに、ジャンル識別部1805を備える。また、出力速度設定部1806の構成が異なる。
ジャンル識別部1805は、デコード部1301によりデコードされた音声信号1401のジャンルを識別する。
出力速度設定部1806は、ジャンル識別部1805により識別されたジャンルに応じて変換比を決定する。
ジャンル識別部1805は、音声信号1401のリズム、テンポ、スペクトル、及び音圧レベルなどから音声信号1401のジャンルを識別する。例えば、ジャンル識別部1805は、音声信号1401を、音楽、音声、雑音、及び無音に分類する。この場合、出力速度設定部1806は、音楽の場合の変換比を最も小さくし、音声、雑音、無音の順に大きな変換比を決定する。これにより、出力速度設定部1806は、聴感上違和感を与えない最大の変換比を設定できる。
なお、本発明の実施の形態1〜4において、オーディオ復号装置を構成する各機能ブロックは、典型的には、CPU及びメモリを要した情報機器がプログラムを実行することで実現されるが、その機能の一部又は全部を集積回路であるLSIとして実現してもよい。これらのLSIは、個別に1チップ化されても良いし、一部又は全てを含むように1チップ化されても良い。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。また、LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)、又はLSI内部の回路セルの接続及び設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
本発明は、オーディオ復号装置に適用でき、特に、エラーが発生しやすい移動体放送向けのオーディオ復号装置、及び電波状態が変化しやすい車載オーディオ機器に適用できる。
図1は、従来のオーディオ復号装置の構成を示す図である。 図2は、本発明の実施の形態1に係るオーディオ復号装置の構成を示す図である。 図3は、MDCTによるオーディオ符号化を説明するための図である。 図4は、本発明の実施の形態1に係るオーディオ復号装置の動作の流れを示すフローチャートである。 図5は、IMDCTを説明するための図である。 図6は、本発明の実施の形態1に係るオーディオ復号装置において、エラーが発生した場合の時間信号及び出力波形のエンベロープを示す図である。 図7は、本発明の実施の形態1に係る補正部による補正処理の流れを示すフローチャートである。 図8は、本発明の実施の形態1に係るオーディオ復号装置における、基準波形の抽出処理を説明するための図である。 図9は、本発明の実施の形態1に係るオーディオ復号装置における、対象区間の探索処理を説明するための図である。 図10は、本発明の実施の形態1に係るオーディオ復号装置における、補正時間信号の切り出し処理を説明するための図である。 図11は、本発明の実施の形態1に係るオーディオ復号装置における、合成処理を説明するための図である。 図12は、本発明の実施の形態1におけるオーディオ復号装置の変形例の構成を示す図である。 図13は、本発明の実施の形態1に係る補正制御部の動作の流れを示すフローチャートである。 図14は、本発明の実施の形態1に係るオーディオ復号装置の変形例における、補正部の動作の流れを示すフローチャートである。 図15は、本発明の実施の形態1におけるオーディオ復号装置の変形例の構成を示す図である。 図16は、本発明の実施の形態2に係るオーディオ復号装置の構成を示す図である。 図17は、本発明の実施の形態2に係るオーディオ復号装置におけるデータの流れを示す図である。 図18は、本発明の実施の形態2に係るオーディオ復号装置における話速変換の前後における音声信号の例を示す図である。 図19は、本発明の実施の形態3に係るオーディオ復号装置の構成を示す図である。 図20は、本発明の実施の形態3に係るオーディオ復号装置におけるデータの流れを示す図である。 図21は、本発明の実施の形態4に係るオーディオ復号装置の構成を示す図である。
符号の説明
10、20、21、22、30、31、32 オーディオ復号装置
100、200 ストリーム
101、201 デコード部
102、202 スペクトル係数
103、203 直交変換部
104、204、204a、204b、204c、300、301、302、303、304、305、310、311 時間信号
105、205 出力部
106、206 出力波形
207 ストリーム情報
208 補正部
209 補正時間信号
210、211 補正制御部
320、321 基準区間
322 基準波形
323 対象区間
1301 デコード部
1302 バッファ部
1303 話速変換部
1304 エラー検出部
1305、1606、1806 出力速度設定部
1400 ビットストリーム信号
1401、1402、1403、1501、1502、1503 音声信号
1605 エラー長計測部
1805 ジャンル識別部

Claims (9)

  1. 隣接するフレーム区間の間で互いに重複する区間を含む複数のフレーム区間に分割された時間信号がそれぞれ符号化された複数のフレームデータを含むオーディオストリームを復号するオーディオ復号装置であって、
    前記オーディオストリームを前記フレームデータ単位でスペクトル係数に復号し、当該フレームデータを復号できない場合にエラー情報を出力するデコード手段と、
    前記スペクトル係数を前記フレーム区間単位の時間信号に変換する直交変換手段と、
    前記デコード手段により前記エラー情報が出力された場合、当該エラー情報が出力されたフレーム区間と当該フレーム区間に隣接するフレーム区間とが重複する区間内であり、かつ当該隣接するフレーム区間の中央部分の区間である基準区間の時間信号に基づき補正時間信号を生成する補正手段と、
    前記補正時間信号を前記エラー情報が出力されたフレーム区間の時間信号として用いたうえで、複数のフレーム区間の時間信号を合成することで、出力波形を生成する出力手段とを備える
    ことを特徴とするオーディオ復号装置。
  2. 前記補正手段は、前記基準区間の時間信号と、前記出力手段により既に生成された前記出力波形との相関値を算出し、算出した相関値が最も大きい前記出力波形を切り出すことで前記補正時間信号を生成する
    ことを特徴とする請求項1記載のオーディオ復号装置。
  3. 前記各フレーム区間は、それぞれ同じ時間長の第1区間、第2区間、第3区間及び第4区間からなり、
    前記隣接するフレーム区間の中央部分の区間は、前記隣接するフレーム区間の前記第2区間又は前記第3区間である
    ことを特徴とする請求項1記載のオーディオ復号装置。
  4. 前記補正手段は、前記算出した相関のうち最も強い相関値が予め定められた第1の値より大きいか否かを判定し、当該相関値が前記第1の値より大きい場合、前記補正時間信号を生成し、当該相関値が前記第1の値より小さい場合、前記補正時間信号を生成しない
    ことを特徴とする請求項2記載のオーディオ復号装置。
  5. 前記補正手段は、前記基準区間の出力波形のスペクトルを算出し、算出したスペクトルにおいて、高域のエネルギーの低域のエネルギーに対する比が予め定められた第2の値より大きいか否かを判定し、当該比が前記第2の値より小さい場合、前記補正時間信号を生成し、当該比が前記第2の値より大きい場合、前記補正時間信号を生成しない
    ことを特徴とする請求項1記載のオーディオ復号装置。
  6. 前記補正手段は、前記相関値が最も大きい出力波形のスペクトルを算出し、算出したスペクトルにおいて、高域のエネルギーの低域のエネルギーに対する比が予め定められた第2の値より大きいか否かを判定し、当該比が前記第2の値より小さい場合、当該出力波形を切り出すことで前記補正時間信号を生成し、当該比が前記第2の値より大きい場合、前記補正時間信号を生成しない
    ことを特徴とする請求項1記載のオーディオ復号装置。
  7. 隣接するフレーム区間の間で互いに重複する区間を含む複数のフレーム区間に分割された時間信号がそれぞれ符号化された複数のフレームデータを含むオーディオストリームを復号するオーディオ復号装置におけるオーディオ復号方法であって、
    前記オーディオストリームを前記フレームデータ単位でスペクトル係数に復号し、当該フレームデータを復号できない場合にエラー情報を出力するデコードステップと、
    前記スペクトル係数を前記フレーム区間単位の時間信号に変換する直交変換ステップと、
    前記デコードステップにより前記エラー情報が出力された場合、当該エラー情報が出力されたフレーム区間と当該フレーム区間に隣接するフレーム区間とが重複する区間内であり、かつ当該隣接するフレーム区間の中央部分の区間である基準区間の時間信号に基づき補正時間信号を生成する補正ステップと、
    前記補正時間信号を前記エラー情報が出力されたフレーム区間の時間信号として用いたうえで、複数のフレーム区間の時間信号を合成することで、出力波形を生成する出力ステップとを含む
    ことを特徴とするオーディオ復号方法。
  8. 隣接するフレーム区間の間で互いに重複する区間を含む複数のフレーム区間に分割された時間信号がそれぞれ符号化された複数のフレームデータを含むオーディオストリームを復号するオーディオ復号方法のプログラムであって、
    前記オーディオストリームを前記フレームデータ単位でスペクトル係数に復号し、当該フレームデータを復号できない場合にエラー情報を出力するデコードステップと、
    前記スペクトル係数を前記フレーム区間単位の時間信号に変換する直交変換ステップと、
    前記デコードステップにより前記エラー情報が出力された場合、当該エラー情報が出力されたフレーム区間と当該フレーム区間に隣接するフレーム区間とが重複する区間内であり、かつ当該隣接するフレーム区間の中央部分の区間である基準区間の時間信号に基づき補正時間信号を生成する補正ステップと、
    前記補正時間信号を前記エラー情報が出力されたフレーム区間の時間信号として用いたうえで、複数のフレーム区間の時間信号を合成することで、出力波形を生成する出力ステップとをコンピュータに実行させる
    ことを特徴とするプログラム。
  9. 隣接するフレーム区間の間で互いに重複する区間を含む複数のフレーム区間に分割された時間信号がそれぞれ符号化された複数のフレームデータを含むオーディオストリームを復号する集積回路であって、
    前記オーディオストリームを前記フレームデータ単位でスペクトル係数に復号し、当該フレームデータを復号できない場合にエラー情報を出力するデコード手段と、
    前記スペクトル係数を前記フレーム区間単位の時間信号に変換する直交変換手段と、
    前記デコード手段により前記エラー情報が出力された場合、当該エラー情報が出力されたフレーム区間と当該フレーム区間に隣接するフレーム区間とが重複する区間内であり、かつ当該隣接するフレーム区間の中央部分の区間である基準区間の時間信号に基づき補正時間信号を生成する補正手段と、
    前記補正時間信号を前記エラー情報が出力されたフレーム区間の時間信号として用いたうえで、複数のフレーム区間の時間信号を合成することで、出力波形を生成する出力手段とを備える
    ことを特徴とする集積回路。
JP2009516175A 2007-05-24 2008-05-20 オーディオ復号装置、オーディオ復号方法、プログラム及び集積回路 Expired - Fee Related JP5302190B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009516175A JP5302190B2 (ja) 2007-05-24 2008-05-20 オーディオ復号装置、オーディオ復号方法、プログラム及び集積回路

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007137423 2007-05-24
JP2007137423 2007-05-24
PCT/JP2008/001256 WO2008146466A1 (ja) 2007-05-24 2008-05-20 オーディオ復号装置、オーディオ復号方法、プログラム及び集積回路
JP2009516175A JP5302190B2 (ja) 2007-05-24 2008-05-20 オーディオ復号装置、オーディオ復号方法、プログラム及び集積回路

Publications (2)

Publication Number Publication Date
JPWO2008146466A1 JPWO2008146466A1 (ja) 2010-08-19
JP5302190B2 true JP5302190B2 (ja) 2013-10-02

Family

ID=40074742

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009516175A Expired - Fee Related JP5302190B2 (ja) 2007-05-24 2008-05-20 オーディオ復号装置、オーディオ復号方法、プログラム及び集積回路

Country Status (4)

Country Link
US (1) US8428953B2 (ja)
EP (1) EP2112653A4 (ja)
JP (1) JP5302190B2 (ja)
WO (1) WO2008146466A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010100895A1 (ja) * 2009-03-06 2010-09-10 パナソニック株式会社 音声再生装置及び映像音声再生装置
JP5637379B2 (ja) * 2010-11-26 2014-12-10 ソニー株式会社 復号装置、復号方法、およびプログラム
EP2541547A1 (en) 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
US9055376B1 (en) * 2013-03-08 2015-06-09 Google Inc. Classifying music by genre using discrete cosine transforms
EP3392884A1 (en) * 2017-04-21 2018-10-24 audEERING GmbH A method for automatic affective state inference and an automated affective state inference system
EP3948856A4 (en) * 2019-03-25 2022-03-30 Razer (Asia-Pacific) Pte. Ltd. METHOD AND APPARATUS FOR USING AN INCREMENTAL SEARCH SEQUENCE IN AUDIO FAULT CONCEALING
BR112022007279A2 (pt) 2019-10-18 2022-07-05 Dolby Laboratories Licensing Corp Métodos e sistema para codificação de forma de onda de sinais de áudio com um modelo generativo

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001272996A (ja) * 2000-03-27 2001-10-05 Victor Co Of Japan Ltd オーディオ符号化ストリーム復号化方法
JP2002542521A (ja) * 1999-04-19 2002-12-10 エイ・ティ・アンド・ティ・コーポレーション パケットロス又はフレーム消去隠蔽を実行するための方法及び装置
US6597961B1 (en) * 1999-04-27 2003-07-22 Realnetworks, Inc. System and method for concealing errors in an audio transmission
JP2004109362A (ja) * 2002-09-17 2004-04-08 Pioneer Electronic Corp フレーム構造のノイズ除去装置、フレーム構造のノイズ除去方法およびフレーム構造のノイズ除去プログラム
WO2005059900A1 (en) * 2003-12-19 2005-06-30 Telefonaktiebolaget Lm Ericsson (Publ) Improved frequency-domain error concealment
JP2007049491A (ja) * 2005-08-10 2007-02-22 Ntt Docomo Inc 復号装置、および復号方法

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
US6961697B1 (en) * 1999-04-19 2005-11-01 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US7117156B1 (en) * 1999-04-19 2006-10-03 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US6952668B1 (en) * 1999-04-19 2005-10-04 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US6775649B1 (en) * 1999-09-01 2004-08-10 Texas Instruments Incorporated Concealment of frame erasures for speech transmission and storage system and method
JP4458635B2 (ja) 2000-07-19 2010-04-28 クラリオン株式会社 フレーム補正装置
FR2813722B1 (fr) * 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
EP1199709A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Error Concealment in relation to decoding of encoded acoustic signals
US7031926B2 (en) * 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
EP1215663A1 (en) * 2000-12-15 2002-06-19 BRITISH TELECOMMUNICATIONS public limited company Encoding audio signals
US7711563B2 (en) * 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
CN1324558C (zh) * 2001-11-02 2007-07-04 松下电器产业株式会社 编码设备,解码设备以及音频数据分配系统
US7117423B2 (en) * 2002-04-24 2006-10-03 Georgia Tech Research Corp. Methods and systems for multiple substream unequal error protection and error concealment
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
US7536305B2 (en) * 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
US7424434B2 (en) * 2002-09-04 2008-09-09 Microsoft Corporation Unified lossy and lossless audio compression
EP1672618B1 (en) * 2003-10-07 2010-12-15 Panasonic Corporation Method for deciding time boundary for encoding spectrum envelope and frequency resolution
US7324937B2 (en) * 2003-10-24 2008-01-29 Broadcom Corporation Method for packet loss and/or frame erasure concealment in a voice communication system
US7356748B2 (en) * 2003-12-19 2008-04-08 Telefonaktiebolaget Lm Ericsson (Publ) Partial spectral loss concealment in transform codecs
CN1961511B (zh) * 2004-06-02 2010-06-09 松下电器产业株式会社 声音数据接收装置及声音数据接收方法
CN101006495A (zh) * 2004-08-31 2007-07-25 松下电器产业株式会社 语音编码装置、语音解码装置、通信装置以及语音编码方法
US7519535B2 (en) * 2005-01-31 2009-04-14 Qualcomm Incorporated Frame erasure concealment in voice communications
US7627467B2 (en) * 2005-03-01 2009-12-01 Microsoft Corporation Packet loss concealment for overlapped transform codecs
US8355907B2 (en) * 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
KR100723409B1 (ko) * 2005-07-27 2007-05-30 삼성전자주식회사 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치
US8532984B2 (en) * 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
BRPI0718300B1 (pt) * 2006-10-24 2018-08-14 Voiceage Corporation Método e dispositivo para codificar quadros de transição em sinais de fala.

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002542521A (ja) * 1999-04-19 2002-12-10 エイ・ティ・アンド・ティ・コーポレーション パケットロス又はフレーム消去隠蔽を実行するための方法及び装置
US6597961B1 (en) * 1999-04-27 2003-07-22 Realnetworks, Inc. System and method for concealing errors in an audio transmission
JP2001272996A (ja) * 2000-03-27 2001-10-05 Victor Co Of Japan Ltd オーディオ符号化ストリーム復号化方法
JP2004109362A (ja) * 2002-09-17 2004-04-08 Pioneer Electronic Corp フレーム構造のノイズ除去装置、フレーム構造のノイズ除去方法およびフレーム構造のノイズ除去プログラム
WO2005059900A1 (en) * 2003-12-19 2005-06-30 Telefonaktiebolaget Lm Ericsson (Publ) Improved frequency-domain error concealment
JP2007049491A (ja) * 2005-08-10 2007-02-22 Ntt Docomo Inc 復号装置、および復号方法

Also Published As

Publication number Publication date
EP2112653A4 (en) 2013-09-11
EP2112653A1 (en) 2009-10-28
US20090326934A1 (en) 2009-12-31
US8428953B2 (en) 2013-04-23
WO2008146466A1 (ja) 2008-12-04
JPWO2008146466A1 (ja) 2010-08-19

Similar Documents

Publication Publication Date Title
JP3646938B1 (ja) オーディオ復号化装置およびオーディオ復号化方法
KR101975066B1 (ko) 신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체
KR101586317B1 (ko) 신호 처리 방법 및 장치
US8504378B2 (en) Stereo acoustic signal encoding apparatus, stereo acoustic signal decoding apparatus, and methods for the same
JP5302190B2 (ja) オーディオ復号装置、オーディオ復号方法、プログラム及び集積回路
CN101903944B (zh) 用于处理音频信号的方法和装置
KR100462615B1 (ko) 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
CN102089809B (zh) 用于提供改进的音频处理的方法、装置
WO2010024371A1 (ja) 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
US20180182403A1 (en) Audio coding device and audio coding method
JPWO2007116809A1 (ja) ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
JP2015172778A (ja) オーディオ信号符号化方法および装置
WO2009081567A1 (ja) ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法
US9117461B2 (en) Coding device, decoding device, coding method, and decoding method for audio signals
CN118280375A (zh) 用于多声道音频编码的方法和设备
RU2481650C2 (ru) Ослабление опережающих эхо-сигналов в цифровом звуковом сигнале
US20120065984A1 (en) Decoding device and decoding method
CN102272830B (zh) 音响信号解码装置及平衡调整方法
CN101981616A (zh) 立体声信号变换装置、立体声信号逆变换装置及其方法
US20090070120A1 (en) Audio regeneration method
JP5093514B2 (ja) オーディオ符号化装置、オーディオ符号化方法およびそのプログラム
JP6439843B2 (ja) 信号処理装置および方法、並びにプログラム
JP6210338B2 (ja) 信号処理装置および方法、並びにプログラム
JP2005148539A (ja) オーディオ信号符号化装置およびオーディオ信号符号化方法
JP2007178529A (ja) 符号化オーディオ信号再生装置及び符号化オーディオ信号再生方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130528

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130620

R150 Certificate of patent or registration of utility model

Ref document number: 5302190

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees