JP5325307B2 - 過渡的事象を含んでいるオーディオ信号を操作するための装置、方法およびコンピュータ・プログラム - Google Patents
過渡的事象を含んでいるオーディオ信号を操作するための装置、方法およびコンピュータ・プログラム Download PDFInfo
- Publication number
- JP5325307B2 JP5325307B2 JP2011546728A JP2011546728A JP5325307B2 JP 5325307 B2 JP5325307 B2 JP 5325307B2 JP 2011546728 A JP2011546728 A JP 2011546728A JP 2011546728 A JP2011546728 A JP 2011546728A JP 5325307 B2 JP5325307 B2 JP 5325307B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- transient
- audio signal
- audio
- signal portion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Amplifiers (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Studio Circuits (AREA)
- Television Signal Processing For Recording (AREA)
- Studio Devices (AREA)
Description
図1は、本発明の一実施形態による、過渡的事象を含んでいるオーディオ信号を操作するための装置のブロック略図を示す。図1に示された装置は、全体として100で示される。装置100は、過渡的事象を含んでいるオーディオ信号110を受けて、それに基づいて、処理されたオーディオ信号120に、処理されていない「本来の」又は合成された過渡現象を供給するように構成される。装置100は、過渡現象を低減したオーディオ信号132を得るために、オーディオ信号110の過渡的事象を含んでいる過渡信号部分を、オーディオ信号の一つ以上の非過渡信号部分の信号エネルギー特性に、又は、過渡信号部分の信号エネルギー特性に適合された置換信号部分と、置換するように構成された過渡信号置換器130を含む。任意で、置換信号部分の位相特性は、オーディオ信号の一つ以上の非過渡信号部分の位相特性に適合されうる。装置100は、過渡現象を低減したオーディオ信号の処理されたバージョン142を得るために、過渡現象を低減したオーディオ信号132を処理するように構成された信号処理器140を更に含む。装置100は、処理されていない「本来の」又は合成された過渡現象を有する処理されたオーディオ信号120を得るために、過渡現象を低減したオーディオ信号の処理されたバージョン142を過渡信号152と結合するように構成された過渡信号再挿入器150を含む。過渡信号152は、元の又は処理された形で、過渡信号置換器130により置換信号部分と置換された過渡信号部分の過渡現象内容を示しうる。
以下では、過渡信号置換器130の機能が、図2を参照として説明される。そこにおいて、図2は、過渡信号置換器130の実施形態のブロック略図を示す。過渡信号置換器130は、オーディオ信号110を受けて、それに基づいて、過渡現象を低減したオーディオ信号132を供給する。
いくつかの用途のシナリオは、参照信号との照合により「正しい」又は「誤っている」と評価される必要がなく、ただ良い全体の音に基づく信号部分を生成することについてのものである。これは、本発明による実施形態が、その部分を分離し、過渡現象成分を省くことに限定されず、特定の特性を有する合成信号を生成しうることを意味する。
以下に、過渡現象を低減したオーディオ信号132の生成のための更なる構想が説明され、その態様は、本願明細書において説明されるいかなる実施形態においても適用できる。検知および置き換えのプロセスに関しては、参照により本願明細書において全体として取り入れられる国際公開2007/118533号を参照することができる。
ここに説明された応用(良いヒアリング印象を維持すると共に、過渡信号を含んでいる信号の処理)において、結果生じる信号の高いオーディオ品質が、国際公開2007/118533号(アンビエント信号生成(Ambient Signal Generation))の応用においてよりも、より実質的に重要であるので、オーディオ信号品質を改善するために、国際公開2007/118533号において説明された方法は、いくつかのステップによって拡大される。
以下では、過渡現象検知器130aに関するいくつかの現在の詳細が説明される。しかし、過渡現象検知器130aの多くの異なる実施例が使用できる点に留意する必要がある。そうすると、以下の詳細は1つの有益な実施の例とみなされるべきである。いくつかの実施形態では、適合可能な閾値は、過渡現象時間を認識するために好まれる。通常、適合可能な閾値は、大きな変動となり、それにより大きいピークの周辺の小さいピークの非検知をもたらしうる検知関数の平滑化されたバージョンである。詳細は、刊行物[ベロ]を参照できる。この問題は、例えば、現在検知された状態(過渡現象領域/非過渡現象領域)に、および、検知関数の推移(例えば立ち上がり、減衰)に依存したスムージング定数の適切な適合によって解決されうる。
[エドラー]、[ベロ]、[グッドウィン]、[ワルサー]、[マヘル]、[ドーデ]
上記の機能に加えて、過渡信号置換器130は、過渡現象部分抽出器130eがオーディオ信号110(又は少なくともその過渡信号部分)を受けるように、および、過渡現象情報134を供給するように構成された、過渡現象部分抽出器130eを更に含む。過渡現象部分抽出器130eは、考えられるあらゆる形で、例えば、過渡信号部分―時間信号の形で、過渡信号部分―時間周波数領域表現の形で、または、過渡パラメータ(例えば過渡現象時間情報および/または過渡現象強度情報および/または過渡現象スチープネス情報および/または他の適当な過渡現象情報)の形で、過渡現象情報134を供給するように構成されうる。
以下に、信号処理器140の実施のための種々の基本的概念が説明される。図3aは、図1の信号処理器140の好ましい実施例を示す。この実施例は、周波数選択分析器310と元のオーディオ信号の「垂直コヒーレンス」に悪影響を与えるように実施される、後に接続された周波数選択処理デバイス312を含む。この周波数選択処理のための例は、時間における信号の拡張又は時間における信号の縮小である。ここで、この拡張又は縮小は、例えばその処理が、異なる周波数ごとに異なる処理されたオーディオ信号に位相シフトを取り入れるように、周波数選択的な方法で適用される。位相シフトは、例えば過渡現象が弱められるように取り入れられる。図3aに示された信号処理器140は、任意で、周波数選択処理312により供給された処理されたオーディオ信号の異なる周波数成分を単一の信号(例えば時間領域信号)に結合するように構成される周波数結合器314を更に含みうる。
以下に、図5および図6を参照に、信号処理器140の実施例のために使用できる、または、信号処理器140の一部でありうる、ボコーダのための好ましい実施例が示される。図5aは、位相ボコーダのフィルタバンク実施例を示す。そこにおいて、入力オーディオ信号(例えば過渡現象を低減したオーディオ信号132)は、入力500に送り込まれ、そして、処理されたオーディオ信号(例えば処理されたオーディオ信号142)は、出力510で得られる。特に、図5aにおいて図示された模式的なフィルタバンクの各チャンネルは、バンドパスフィルタ501およびダウンストリーム発振器502を含む。全てのチャンネルからの全ての発振器の出力信号は、出力510で出力信号を得るために、例えばアダーとして実行されて503で示される結合器により、結合される。各フィルタ501は、それが一方では振幅信号、他方では周波数信号を供給するように、実行される。振幅信号および周波数信号は、時間上でのフィルタ501の振幅の推移を示している時間信号であり、その一方で、周波数信号は、フィルタ501によってフィルタをかけられた信号の周波数の推移を示す。
図5aに示されたフィルタバンク実施例に代わるものとして、位相ボコーダの変形実施例はまた、図6に示すように、使用されうる。ここで、オーディオ信号132は、FFT処理器に、または、さらに一般的にいえば、短時間フーリエ変換処理器600に、一連の時間サンプルとして送られる。FFT処理器600は、FFTによりスペクトルの強度および位相を計算するために、オーディオ信号の時間ウィンドウ化を実行するように、図6において図式的に実行される。そこにおいて、この計算は、強くオーバーラップしているオーディオ信号のブロックに関連がある連続したスペクトルのために実行される。
以下に、図1に示された過渡信号再挿入器150の好ましい実施例が、図4を参照にして説明される。
以下に、可能なタイミング関係に関する詳細は、図9を参照として説明される。図9は、元の入力オーディオ信号110の異なるブロックの処理のグラフ表示を示す。第1のグラフ表示910は、元の入力オーディオ信号110の時間的推移を表し、そこにおいて、横軸912は時間を示す。入力オーディオ信号110は、過渡信号部分920を含み、その長さは可変的でありうる。タイミング基準として、信号処理器140の処理区間又は処理ブロック922a、922b、922cは、グラフ表示910に示される。図から分かるように、過渡信号部分920の継続時間は、処理区間922a、922b、922cの継続時間より小さいこともある。しかしながら、場合によっては、過渡信号部分の継続時間は、処理区間の継続時間より大きくさえありうる、または、1つのみの処理区間以上にわたって拡張しうる。場合によっては、処理区間922a、922b、922cはまた、時間的にオーバーラップしていることもありうる。
上記説明から分かるように、過渡的事象を含んでいるオーディオ信号を操作するための本発明概念は、多くの異なる応用例において適用できる。例えば、前記構想は、過渡現象が信号処理により弱めさせられる、および、それにもかかわらず過渡現象を維持することが望まれるいかなるオーディオ信号処理においても、適用できる。例えば、多くの種類の非線形オーディオ信号処理は、過渡現象がある場合には、ひどく質の落ちた結果をもたらすだろう。加えて、ある種の時間的フィルタリングは、過渡現象の存在により、著しく影響を受けるだろう。更に、過渡現象のエネルギーが全部の処理ブロックにわたって塗りつけられるので、オーディオ信号のいかなるブロック的な処理も、一般的に過渡信号の存在により劣化させられ、こうして、結果として聞き取れるアーチファクトが生じる。
1.過渡現象の認識
2.過渡現象の長さの決定
3.過渡現象が保存される
4.外挿および/または内挿
5.実際の方法の適用(例えば位相ボコーダ)
6.保存された過渡現象の再挿入
7.場合によっては(任意で)(サンプルレートの変更のための)再サンプリング
以下に、過渡信号152が過渡信号挿入器150を使用して、処理されたオーディオ信号142とどのように結合できるかについて説明する。例えば、過渡信号挿入器150は、処理されたオーディオ信号142から過渡現象領域をカットアウトするように構成されうる。そして、その過渡現象領域に過渡信号152が挿入される。過渡信号152の境界部分が、カットアウト過渡現象領域の境界部分と時間的にオーバーラップしうると、ここではみなすことができる。このオーバーラップしている境界部分において、処理されたオーディオ信号142と過渡信号152間のクロスフェードが起こりうる。過渡信号152はまた、処理されたオーディオ信号142に関して時間シフトされうる。そうすると、カバーされた過渡現象領域の境界部分の波形が、過渡信号152の境界部分の波形と良い一致に至らされる。
例えば処理された信号に単に付け加えられたために、過渡現象がカットアウトに続く再挿入の前に音色がなくなることになる場合、対応するウィンドウ化された過渡現象部分は適切な方法で処理されなければならない。これに関連して、逆(LPC)フィルタリングは行われうる。
1.スペクトルを得るために、(例えば、過渡現象情報134によって表された過渡信号部分の)短時間フーリエ変換(STFT)測定すること
2.(例えば過渡信号部分のスペクトルの)ケプストラム(Cepstrum)を測定すること
3.スペクトルのハイパスフィルタリングを得るために、ケプストラム(第1の係数は0にセットされる)のハイパスフィルタリング
4.平滑化されたスペクトルを得るために、(例えば過渡信号部分の)フィルタをかけたスペクトルにより、(過渡信号部分の)スペクトルを分割すること
5.(例えば処理された過渡信号152を得るために)時間領域に(例えば、平滑化されたスペクトルの)逆変換
本発明による実施形態は、過渡的事象を含んでいるオーディオ信号を操作するための方法を含む。図12は、この種の方法1200のフローチャートを示す。
特定の実現要求に応じて、本発明の実施形態は、ハードウェアにおいて、または、ソフトウェアにおいて実行できる。その実施は、各方法が実行されるように、プログラミング可能な計算機システムと協動する(または協動できる)、その上に格納された電子的に読み込み可能な制御信号を有するデジタル記憶媒体、例えばフロッピー(登録商標)ディスク、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリを使用して実行できる。従って、デジタル記憶媒体は、コンピュータ読み込み可能でありうる。
上記を要約すると、本発明による実施形態は、(例えば、信号処理器を使用して)現存する処理ルーチンによって処理されない、又は、処理することができない音響事象を処理するという新規な方法を含む。いくつかの実施形態において、本発明の方法は、基本的に、別々に処理されることになる音響事象を含んでいる信号部分を外挿するステップ又は内挿するステップから成る。その処理の後に、別々に処理された過渡現象部分は、再度付加される。この処理は、時間又は周波数拡張に制限されず、信号の実際の処理が過渡信号部分に有害であるとき(または、過渡信号部分に悪影響を受ける場合)、信号処理において一般的に使用されうる。
本発明の他の実施形態は、図13〜図16を参照として、以下に説明される。
発明された構想を実施するために、過渡現象の置換および過渡現象の別々の処理を可能にするために、過渡現象の存在を検知することは重要である。
以下に、過渡現象の処理は、図13および図14を参照に説明される。図13は、過渡現象除去および内挿のグラフ表示を示す。図14は、時間拡張および過渡現象再挿入のグラフ表示を示す。このように、図13および図14の略図は、提示されたアルゴリズムの処理ステップのシーケンスを示す。
以下に、本発明の過渡現象処理のいくつかの結果は、図15を参照に述べられる。図15は、位相ボコーダを有する時間―拡張アプリケーションにおける本発明の過渡現象処理のステップのグラフ表示を示す。第1行は拡張されていない信号を含み、そして、第2行は拡張されたポートを含む。第1行のグラフ表示において、および、第2行において使用された異なる時間幅には留意すべきである。
カットアウト過渡現象領域の内挿に関する種々の構想が場合によっては重要でありうることが分かっている。例えば、過渡現象の前の信号が、過渡現象の後の信号とかなり異なる場合、過渡現象領域上への内挿は困難でありえる。その場合、過渡的事象の間の信号の関係は、場合によってはほとんど予測できない。図16は、例証として2つの部分にそれぞれ1つのみのありうる評価を用いることにより単純化された、この種の状況を示す。アルゴリズム(例えばギャップを穴埋めするための内挿を実行するためのアルゴリズム)は、(ギャップを埋めるために内挿された信号の)ピッチの1つの関係に有利な決定を下さなければならない。同じことが、より複雑な広帯域の信号にあてはまる。問題を解決する考えられる解決法が、各々の間にクロスフェードを有する前方および後方予測(forward and backward prediction)にある。このように、ギャップを埋めるために内挿された信号を計算するときに、互い間でクロスフェードを有するこの種の前方および後方予測は適用できる。
提案された方法の知覚的な性能にいくらかの洞察を得るために、非公式のリスニングが行われた。選択された信号は、過渡信号のための新規なスキームの利益を評価し、同時に、定常信号が劣化させられないことを確実にするために、過渡信号および定常信号の特性の両方を有する項目を含んだ。
上記を要約すると、時間―拡張アルゴリズムのために有益に使用できる、新規な過渡現象処理スキームが説明された。それぞれの残りに影響を及ぼさずにオーディオ信号の速度かピッチを変えることは、音楽制作および創造的な再生(例えばリミックス)のためにしばしば使用される。それは、例えば帯域幅拡張および速度増加などの他の目的のためにも利用される。定常信号が品質を害せずに拡張できる一方で、過渡現象は、従来のアルゴリズムを使用するとき、拡張後にしばしばうまく維持されない。本発明は、時間―拡張アルゴリズムの過渡現象処理のためのアプローチを示す。過渡現象領域は、定常信号と置換される。このことにより除去された過渡現象は、保存され、時間―拡張の後に時間拡張した定常のオーディオ信号に再挿入される。
[A1]J.L.フラナガンおよびR.M.ゴールデン、「ベルシステム技術ジャーナル」、1966年11月、ページ1394〜1509
[A2]米国特許出願番号6,549,884、ラロッシュ J.、ドルセン M.:「位相ボコーダのピッチシフト」
[A3]ジーン・ラロッシュおよびマーク・ドルセン、会報「ピッチシフト、調和、および他のエキゾチックな効果のための新しい位相ボコーダ技術」
[A4]ゼルザー.U著:「DAFX:デジタル音声効果」、ワイリーアンドサンズ、第1版、2002年2月26日、ページ201〜298
[A5]ラロッシュ.Lおよびドルセン.M、「オーディオの改良された位相ボコーダ時間スケール変更」、IEEE通信、音声およびオーディオ処理、7巻、No.3、ページ323〜332
[A6]エマニュエル・ラベリ、マーク・サンドラーおよびホアン・P.ベロ、「ステレオオーディオの非線形時間スケールの高速実行」、デジタル音声効果の第8回国際会議(DAFx´05)の議事録、マドリード、スペイン、2005年9月20日〜22日[A7]ダックスベリー、C.M.デイヴィスおよびM.サンドラー(2001年、12月)、「マルチ分解能分析技術を使用した音楽オーディオの過渡的事象情報の分離」、デジタル音声効果のCOST G−6会議(DAFX−01)の議事録、リムリック、アイルランド
[A8]ローベル、A.:「位相ボコーダでの過渡的事象の処理に対する新しいアプローチ」、デジタル音声効果の第6回国際会議(DAFx−03)の議事録、ロンドン、イギリス、2003年9月8日〜11日
[B1]T.カラー、E.リー、J.ボーチャーズ、「Phavorit:リアルタイム相互時間拡張のための位相ボコーダ」、ICMC2006 コンピュータ音楽国際会議の会報、ニューオーリンズ、USA、2006年11月、pp.708〜715
[B2]T.F.クアティエリ、R.B.ダン、R.J.マコーレー、T.E.ハンナ、「雑音における複雑な音響信号の時間スケール変更」、技術報告書、マサチューセッツ工科大学、1994年2月
[B3]C.ダックスベリー、M.デイヴィス、M.B.サンドラー、「過渡現象の位相ロックを使用した音楽オーディオの改良された時間スケーリング」、第112回AESコンベンション、ミュンヘン、2002年、オーディオエンジニアリング協会
[B4]S.レヴィン、ジュリアス O.スミスIII、「データ圧縮及び時間/ピッチスケール変更のための正弦波+過渡現象+雑音オーディオ表現」、1998
[B5]T.S.ヴァルマー、T.H.Y.ムオン、「正弦波+過渡現象+雑音信号モデルを用いた時間スケール変更」、DAFX98、バルセロナ、スペイン、1998
[B6]A.ローベル、「位相ボコーダにおける過渡現象処理への新しいアプローチ」、デジタルオーディオエフェクトに関する第6回会議(DAFx−03)、ロンドン、2003年、pp.344〜349
[B7]A.ローベル、「位相ボコーダにおける過渡現象検知及び保存」、コンピュータ音楽国際会議(ICMC 03)、シンガポール、2003、pp.247〜250
[B8]F.ナゲル、S.ディッシュ、N.レッテルバッハ、「オーディオ符号化のための新しい過渡現象操作を用いた位相ボコーダ駆動の帯域幅拡張方法」、第126回AESコンベンション、ミュンヘン、2009年
[B9]M.ドルセン、「位相ボコーダ:チュートリアル」、コンピュータ音楽ジャーナル、10巻、No.4、pp.14〜27、1986年
[B10]B.エドラー、「オーバーラッピングブロック変換及び適応型窓関数を用いたオーディオ信号の符号化(ドイツ語)」、Frequenz、43巻、No.9、pp.252〜256、1989年9月
[B11]オリバー・ニーマイヤー、ベルント・エドラー、「オーディオ符号化のための過渡現象の検知及び抽出」、第120回AESコンベンション、パリ、フランス、2006年
[B12]M.M.グッドウィン、C.アヴェンダノ、「過渡現象変更に基づいたオーディオ信号拡張のための周波数領域アルゴリズム」、オーディオエンジニアリング協会のジャーナル、54巻、pp.827〜840、2006年
[B13]P.ブロッシヤー、J.P.ベロ、M.D.プラムブライ、「音楽信号における音符オブジェクトのリアルタイム時間的分割」、ICMC、マイアミ、USA、2004年
[B14]J.P.ベロ、L.ドーデ、S.アブドゥッラー、C.ダックスベリー、M.デイヴィス、M.B.サンドラー、「音楽信号における開始検知に関するチュートリアル」、音声およびオーディオ処理、IEEE通信、13巻、No.5、pp.1035〜1047、2005年9月
[B15]A.クラプリ、「心理音響学情報の適用による音響開始検知」、ICASSP、1999年
[B16]P.マスリ、A.ベイトマン、「音楽分析再合成における過渡現象への取り組みの改良されたモデリング」、ICMC、1996年
[B17]C.ダックスベリー、M.デイヴィス、M.サンドラー、「マルチ分解能分析技術を使用した音楽オーディオの過渡的事象情報の分離」、DAFX、2001年
[B18]C.ダックスベリー、M.サンドラー、M.デイヴィス、「音符開始検知へのハイブリッドアプローチ」、DAFX、2002年
[B19]W−C.リー、C−C.J.クオ、「適応線形予測に基づいた音開始の検知」、ICME、2006年
[エドラー]O.ニーマイヤー、B.エドラー、「オーディオ符号化のための過渡現象の検知及び抽出」、第120回AESコンベンションにて発表、パリ、フランス、2006年
[ベロ]J.P.ベロら、「音楽信号における開始検知に関するチュートリアル」、音声およびオーディオ処理、IEEE通信、13巻、No.5、2005年9月
[グッドウィン]M.グッドウィン、C.アヴェンダノ、「過渡現象検知及び変更を用いたオーディオ信号の拡張」、第117回AESコンベンションにて発表、USA、2004年10月
[ワルサー]ワルサーら、「ブラインド・マルチチャンネルアップミックスアルゴリズムにおける過渡現象抑制の使用」、第122回AESコンベンションにて発表、オーストリア、2007年5月
[マヘル]R.C.マヘル、「デジタルオーディオデータ欠落の外挿のための方法」、JAES、42巻、No.5、1994年5月
[ドーデ]L.ドーデ、「音楽信号における過渡現象の抽出のための技術に関する考察」、本シリーズ:コンピュータサイエンスの講義ノート、シュプリンガー・ベルリン/ハイデルベルク、Vol.3902/2006、本:コンピュータ音楽モデリング及び検索
Claims (15)
- 過渡的事象を含んでいるオーディオ信号(110)を操作するための装置(100)であって、前記装置(100)は、
過渡現象を低減したオーディオ信号(132)を得るために、前記オーディオ信号の、前記過渡的事象を含んでいる過渡信号部分を、前記オーディオ信号の一つ以上の非過渡信号部分の信号エネルギー特性に、又は、前記過渡信号部分の信号エネルギー特性に適合された置換信号部分と置換するように構成された過渡信号置換器(130)と、
前記過渡現象を低減したオーディオ信号の処理されたバージョン(142)を得るために、前記過渡現象を低減したオーディオ信号(132)を処理するように構成された信号処理器(140)と、
前記過渡現象を低減したオーディオ信号(132)の前記処理されたバージョン(142)を、元の又は処理された形で、前記過渡信号部分の過渡現象内容を示している過渡信号(152)と結合するように構成された、過渡信号再挿入器(150)と、を含み、
前記過渡信号置換器(130)は、前記置換信号部分の振幅値を得るために、前記過渡信号部分の前の一つ以上の信号部分の振幅値を外挿するように構成されること、および、
前記過渡信号置換器(130)は、前記置換信号部分の位相値を得るために、前記過渡信号部分の前の一つ以上の信号部分の位相値を外挿するように構成されること、を特徴とする、装置。 - 過渡的事象を含んでいるオーディオ信号(110)を操作するための装置(100)であって、前記装置(100)は、
過渡現象を低減したオーディオ信号(132)を得るために、前記オーディオ信号の、前記過渡的事象を含んでいる過渡信号部分を、前記オーディオ信号の一つ以上の非過渡信号部分の信号エネルギー特性に、又は、前記過渡信号部分の信号エネルギー特性に適合された置換信号部分と置換するように構成された過渡信号置換器(130)と、
前記過渡現象を低減したオーディオ信号の処理されたバージョン(142)を得るために、前記過渡現象を低減したオーディオ信号(132)を処理するように構成された信号処理器(140)と、
前記過渡現象を低減したオーディオ信号(132)の前記処理されたバージョン(142)を、元の又は処理された形で、前記過渡信号部分の過渡現象内容を示している過渡信号(152)と結合するように構成された、過渡信号再挿入器(150)と、を含み、
前記過渡信号置換器(130)は、前記置換信号部分の一つ以上の振幅値を得るために、前記過渡信号部分の前の信号部分の振幅値と前記過渡信号部分の後の信号部分の振幅値との間を内挿するように構成されること、および、
前記過渡信号置換器(130)は、前記置換信号部分の一つ以上の位相値を得るために、前記過渡信号部分の前の信号部分の位相値と前記過渡信号部分の後の信号部分の位相値との間を内挿するように構成されること、を特徴とする、装置。 - 過渡的事象を含んでいるオーディオ信号(110)を操作するための装置(100)であって、前記装置(100)は、
過渡現象を低減したオーディオ信号(132)を得るために、前記オーディオ信号の、前記過渡的事象を含んでいる過渡信号部分を、前記オーディオ信号の一つ以上の非過渡信号部分の信号エネルギー特性に、又は、前記過渡信号部分の信号エネルギー特性に適合された置換信号部分と置換するように構成された過渡信号置換器(130)と、
前記過渡現象を低減したオーディオ信号の処理されたバージョン(142)を得るために、前記過渡現象を低減したオーディオ信号(132)を処理するように構成された信号処理器(140)と、
前記過渡現象を低減したオーディオ信号(132)の前記処理されたバージョン(142)を、元の又は処理された形で、前記過渡信号部分の過渡現象内容を示している過渡信号(152)と結合するように構成された、過渡信号再挿入器(150)と、を含み、
前記過渡信号置換器(130)は、前記置換信号部分の時間周波数領域係数を得るために、時間周波数領域において、前記過渡信号部分の前の前記オーディオ信号(110)の非過渡信号部分と関連した複素数値の時間周波数領域係数を外挿するように構成されること、または、
前記過渡信号置換器(130)は、前記置換信号部分の時間周波数領域係数を得るために、時間周波数領域において、前記過渡信号部分の前の前記オーディオ信号(110)の非過渡信号部分と関連した複素数値の時間周波数領域係数と前記過渡信号部分の後の前記オーディオ信号の非過渡信号部分と関連した複素数値の時間周波数領域係数との間を内挿するように構成されること、
前記置換信号部分の前記時間周波数領域係数が複素数値であること
を特徴とする、装置。 - 前記置換信号部分のエネルギーと前記過渡信号部分の前の又は前記過渡信号部分の後の前記オーディオ信号(110)の非過渡信号部分のエネルギーとの間の偏差が所定の閾値より小さくなるように、前記過渡信号部分と比較して、前記置換信号部分が平滑化された時間的推移を有する時間信号を示すように、前記過渡信号置換器(130)は、前記置換信号部分を供給するように構成されること、を特徴とする、請求項1〜請求項3のうちの1つに記載の装置(100)。
- 前記過渡信号置換器(130)は、前記置換信号部分を得るために、前記過渡信号部分の非過渡信号成分を、前記外挿又は内挿された値と結合するように構成されること、を特徴とする、請求項1〜請求項4のうちの1つに記載の装置(100)。
- 前記過渡信号置換器(130)は、前記現在の過渡信号部分の長さに依存して、可変の長さの置換信号部分を得るように構成されること、を特徴とする、請求項1〜請求項5のうちの1つに記載の装置(100)。
- 前記信号処理器(140)は、前記過渡現象を低減したオーディオ信号の前記処理されたバージョン(142)の所定の時間的信号部分が、前記過渡現象を低減したオーディオ信号(132)の複数の時間的にシフトされた時間的信号部分に依存するように、前記過渡現象を低減したオーディオ信号(132)を処理するように構成されること、を特徴とする、請求項1〜請求項6のうちの1つに記載の装置(100)。
- 前記信号処理器(140)は、前記過渡現象を低減したオーディオ信号の前記処理されたバージョン(142)を得るために、前記過渡現象を低減したオーディオ信号132の時間ブロックベースの処理を実行するように構成されること、および、
前記過渡信号置換器130は、時間ブロックの継続時間より微細である時間分解能を有する前記置換信号部分と置換される前記過渡信号部分の継続時間を調整するように、又は、前記時間ブロックの前記継続時間より小さい継続時間を有する過渡信号部分を、前記時間ブロックの前記継続時間より小さい継続時間を有する置換信号部分と置換するように、構成されること、を特徴とする、請求項1〜請求項7のうちの1つに記載の装置(100)。 - 前記信号処理器(140)は、周波数依存の方法で前記過渡現象を低減したオーディオ信号(132)を処理するように構成され、その結果、前記処理が過渡現象を弱める周波数依存の位相シフトを、前記過渡現象を低減したオーディオ信号(132)に生ぜしめること、を特徴とする、請求項1〜請求項8のうちの1つに記載の装置(100)。
- 前記過渡信号置換器(130)は、過渡現象検知器(130a)を含むこと、前記過渡現象検知器(130a)は、検知閾値が調節可能なスムージング時定数に関する前記オーディオ信号の包絡線をたどるように、前記オーディオ信号(110)の前記過渡現象の前記検知のための前記時変の検知閾値を供給するように構成されること、および、
前記過渡現象検知器は、過渡現象の前記検知に応答して、および/または、前記オーディオ信号の時間的推移に依存して、前記スムージング時定数を変えるように構成されること、を特徴とする、請求項1〜請求項9のうちの1つに記載の装置(100)。 - 前記装置(100)は、過渡現象情報(134)を受けて、前記過渡現象情報(134)に基づいて、音の成分を低減された処理された過渡信号(152)を得るように構成された過渡現象処理器(160)を含むこと、および、
前記過渡信号再挿入器(150)は、前記過渡現象を低減したオーディオ信号(132)の前記処理されたバージョン(142)を、前記過渡現象処理器(160)により供給された前記処理された過渡信号(152)と結合するように構成されること、を特徴とする、請求項1〜請求項10の1つに記載の装置(100)。 - 前記過渡信号置換器(130)は、前記オーディオ信号(110)をモニターすることに基づいて、又は、前記オーディオ信号に付随している補助情報に基づいて、前記オーディオ信号(110)の過渡信号部分を検知するように、そして、前記過渡信号部分の長さを決定するように構成された過渡現象検知器(130a、130c)を含むことと、
前記過渡信号置換器(130)は、前記過渡現象検知器(130a、130c)により決定された前記過渡信号部分の前記長さを考慮するように構成されることと、
前記過渡信号置換器(130)は、前記置換信号部分の時間周波数領域係数を得るために、時間周波数領域において、前記過渡信号部分の前の前記オーディオ信号(110)の非過渡信号部分と関連した複素数値の時間周波数領域係数を外挿するように構成されること、または、
前記過渡信号置換器(130)は、前記置換信号部分の時間周波数領域係数を得るために、時間周波数領域において、前記過渡信号部分の前の前記オーディオ信号(110)の非過渡信号部分と関連した複素数値の時間周波数領域係数と前記過渡信号部分の後の前記オーディオ信号の非過渡信号部分と関連した複素数値の時間周波数領域係数との間を内挿するように構成されることと、
前記信号処理器(140)は、前記信号処理器(140)により供給された前記処理された信号(142)が前記オーディオ信号処理器により受けた前記処理されていない信号(132)の継続時間より大きい又は小さい継続時間を含むように、時間拡張又は時間圧縮により過渡現象を弱めるオーディオ信号処理を実行するように構成されることと、
前記装置(100)は、前記過渡信号置換器(130)に入力された前記オーディオ信号(110)と比較して、前記過渡信号再挿入器(150)により得られた前記信号の少なくとも非過渡現象成分が周波数転置されるように、前記過渡信号再挿入器(150)により得られた前記信号の時間スケーリング又はサンプルレートを適合するように構成されることと、
を特徴とした、請求項1〜請求項11のうちの1つに記載の装置(100)。 - 前記過渡信号再挿入器(150)は、元の又は処理された形で、前記過渡信号部分の過渡現象内容を示している過渡信号(152)と、前記過渡現象を低減したオーディオ信号(132)の前記処理されたバージョン(142)をクロスフェードするように構成されること、を特徴とする、請求項1〜請求項12のうちの1つに記載の装置(100)。
- 過渡的事象を含んでいるオーディオ信号を操作するための方法(1200)であって、前記方法は、
過渡現象を低減したオーディオ信号を得るために、前記オーディオ信号の、前記過渡的事象を含んでいる過渡信号部分を、前記オーディオ信号の一つ以上の非過渡信号部分の信号エネルギー特性に、又は、前記過渡信号部分の信号エネルギー特性に適合された置換信号部分と置換するステップ(1210)、
前記過渡現象を低減したオーディオ信号の処理されたバージョンを得るために、前記過渡現象を低減したオーディオ信号を処理するステップ(1220)、および、
前記過渡現象を低減したオーディオ信号の前記処理されたバージョンを、元の又は処理された形で、前記過渡信号部分の過渡現象内容を示している過渡信号と結合するステップ(1230)、を含み、
前記過渡信号部分の前の一つ以上の信号部分の振幅値は、前記置換信号部分の振幅値を得るために、外挿されることと、
前記過渡信号部分の前の一つ以上の信号部分の位相値は、前記置換信号部分の位相値を得るために、外挿されること、または、
前記置換信号部分の一つ以上の振幅値を得るために、前記過渡信号部分の前の信号部分の振幅値と前記過渡信号部分の後の信号部分の振幅値との間で、内挿が実行されることと、
前記置換信号部分の一つ以上の位相値を得るために、前記過渡信号部分の前の信号部分の位相値と前記過渡信号部分の後の信号部分の位相値との間で、内挿が実行されることと、または、
前記置換信号部分の複素数値の時間周波数領域係数を得るために、時間周波数領域において、前記過渡信号部分の前の前記オーディオ信号の非過渡信号部分と関連した複素数値の時間周波数領域係数は、外挿されること、または、
前記置換信号部分の複素数値の時間周波数領域係数を得るために、時間周波数領域において、前記過渡信号部分の前の前記オーディオ信号の非過渡信号部分と関連した複素数値の時間周波数領域係数と前記過渡信号部分の後の前記オーディオ信号の非過渡信号部分と関連した複素数値の時間周波数領域係数との間で、内挿が実行されること、を特徴とする、方法。 - コンピュータに、請求項14に記載の方法を実行させるためのコンピュータ・プログラム。
Applications Claiming Priority (7)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US14875909P | 2009-01-30 | 2009-01-30 | |
| US61/148,759 | 2009-01-30 | ||
| US23156309P | 2009-08-05 | 2009-08-05 | |
| US61/231,563 | 2009-08-05 | ||
| EP09012410.8 | 2009-09-30 | ||
| EP09012410A EP2214165A3 (en) | 2009-01-30 | 2009-09-30 | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
| PCT/EP2010/050042 WO2010086194A2 (en) | 2009-01-30 | 2010-01-05 | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2012516460A JP2012516460A (ja) | 2012-07-19 |
| JP5325307B2 true JP5325307B2 (ja) | 2013-10-23 |
Family
ID=42040618
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2011546728A Active JP5325307B2 (ja) | 2009-01-30 | 2010-01-05 | 過渡的事象を含んでいるオーディオ信号を操作するための装置、方法およびコンピュータ・プログラム |
Country Status (14)
| Country | Link |
|---|---|
| US (1) | US9230557B2 (ja) |
| EP (2) | EP2214165A3 (ja) |
| JP (1) | JP5325307B2 (ja) |
| KR (1) | KR101317479B1 (ja) |
| CN (1) | CN102341847B (ja) |
| AR (1) | AR075164A1 (ja) |
| AU (1) | AU2010209943B2 (ja) |
| BR (1) | BRPI1005311B1 (ja) |
| CA (1) | CA2751205C (ja) |
| ES (1) | ES2566927T3 (ja) |
| MX (1) | MX2011008004A (ja) |
| RU (1) | RU2543309C2 (ja) |
| TW (1) | TWI493541B (ja) |
| WO (1) | WO2010086194A2 (ja) |
Families Citing this family (44)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| PL3751570T3 (pl) | 2009-01-28 | 2022-03-07 | Dolby International Ab | Ulepszona transpozycja harmonicznych |
| WO2010086461A1 (en) | 2009-01-28 | 2010-08-05 | Dolby International Ab | Improved harmonic transposition |
| KR101405022B1 (ko) | 2009-09-18 | 2014-06-10 | 돌비 인터네셔널 에이비 | 입력 신호를 전위시키기 위한 시스템 및 방법, 상기 방법을 수행하는 소프트웨어 프로그램 및 컴퓨터 프로그램 제품을 포함하는 저장 매체 |
| EP2545551B1 (en) | 2010-03-09 | 2017-10-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals |
| CA2792368C (en) * | 2010-03-09 | 2016-04-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for handling transient sound events in audio signals when changing the replay speed or pitch |
| AU2011226212B2 (en) | 2010-03-09 | 2014-03-27 | Dolby International Ab | Apparatus and method for processing an input audio signal using cascaded filterbanks |
| IL317702A (en) * | 2010-09-16 | 2025-02-01 | Dolby Int Ab | Method and system for harmonic, block, subchannel, and enhanced transposition by rhetorical multiplication |
| TWI564882B (zh) | 2011-02-14 | 2017-01-01 | 弗勞恩霍夫爾協會 | 利用重疊變換之資訊信號表示技術(一) |
| MY165853A (en) | 2011-02-14 | 2018-05-18 | Fraunhofer Ges Forschung | Linear prediction based coding scheme using spectral domain noise shaping |
| KR101613673B1 (ko) | 2011-02-14 | 2016-04-29 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 불활성 위상 동안에 잡음 합성을 사용하는 오디오 코덱 |
| EP2676267B1 (en) | 2011-02-14 | 2017-07-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding of pulse positions of tracks of an audio signal |
| TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
| WO2012110448A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
| TWI479478B (zh) | 2011-02-14 | 2015-04-01 | 弗勞恩霍夫爾協會 | 用以使用對齊的預看部分將音訊信號解碼的裝置與方法 |
| BR112013020324B8 (pt) | 2011-02-14 | 2022-02-08 | Fraunhofer Ges Forschung | Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio |
| KR101699898B1 (ko) | 2011-02-14 | 2017-01-25 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 스펙트럼 영역에서 디코딩된 오디오 신호를 처리하기 위한 방법 및 장치 |
| JP5633431B2 (ja) * | 2011-03-02 | 2014-12-03 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
| RU2595912C2 (ru) | 2011-05-26 | 2016-08-27 | Конинклейке Филипс Н.В. | Аудиосистема и способ для нее |
| JP6118522B2 (ja) * | 2012-08-22 | 2017-04-19 | Pioneer DJ株式会社 | タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム |
| TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
| US9830917B2 (en) * | 2013-02-14 | 2017-11-28 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
| JP6305694B2 (ja) * | 2013-05-31 | 2018-04-04 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
| CN105408955B (zh) | 2013-07-29 | 2019-11-05 | 杜比实验室特许公司 | 用于降低去相关器电路中瞬态信号的时间伪差的系统和方法 |
| CN103440871B (zh) * | 2013-08-21 | 2016-04-13 | 大连理工大学 | 一种语音中瞬态噪声抑制的方法 |
| CN103456310B (zh) * | 2013-08-28 | 2017-02-22 | 大连理工大学 | 一种基于谱估计的瞬态噪声抑制方法 |
| EP3071997B1 (en) * | 2013-11-18 | 2018-01-10 | Baker Hughes, a GE company, LLC | Methods of transient em data compression |
| CN104681034A (zh) * | 2013-11-27 | 2015-06-03 | 杜比实验室特许公司 | 音频信号处理 |
| PL3139380T3 (pl) * | 2014-05-01 | 2019-09-30 | Nippon Telegraph And Telephone Corporation | Koder, dekoder, sposób kodowania, sposób dekodowania, program kodujący, program dekodujący i nośnik rejestrujący |
| WO2016004336A1 (en) * | 2014-07-03 | 2016-01-07 | Bio-Rad Laboratories, Inc. | Deconstructing overlapped peaks in experimental data |
| JP6430626B2 (ja) | 2014-07-22 | 2018-11-28 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | 入力音声信号を操作するための装置および方法 |
| EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
| US9668074B2 (en) * | 2014-08-01 | 2017-05-30 | Litepoint Corporation | Isolation, extraction and evaluation of transient distortions from a composite signal |
| EP3171362B1 (en) * | 2015-11-19 | 2019-08-28 | Harman Becker Automotive Systems GmbH | Bass enhancement and separation of an audio signal into a harmonic and transient signal component |
| WO2017158105A1 (en) | 2016-03-18 | 2017-09-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding by reconstructing phase information using a structure tensor on audio spectrograms |
| EP3246923A1 (en) * | 2016-05-20 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing a multichannel audio signal |
| EP3516534A1 (en) * | 2016-09-23 | 2019-07-31 | Eventide Inc. | Tonal/transient structural separation for audio effects |
| EP3382700A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using a transient location detection |
| EP3382701A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using prediction based shaping |
| EP3382703A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and methods for processing an audio signal |
| US10749534B2 (en) * | 2017-06-28 | 2020-08-18 | Analog Devices, Inc. | Apparatus and methods for system clock compensation |
| US20190074805A1 (en) * | 2017-09-07 | 2019-03-07 | Cirrus Logic International Semiconductor Ltd. | Transient Detection for Speaker Distortion Reduction |
| CN115132214A (zh) | 2018-06-29 | 2022-09-30 | 华为技术有限公司 | 立体声信号的编码、解码方法、编码装置和解码装置 |
| CN110085214B (zh) * | 2019-02-28 | 2021-07-20 | 北京字节跳动网络技术有限公司 | 音频起始点检测方法和装置 |
| CN117059113A (zh) * | 2022-05-05 | 2023-11-14 | 北京字跳网络技术有限公司 | 音频处理方法、装置、设备及存储介质 |
Family Cites Families (25)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2006E (fr) | 1903-03-14 | 1903-11-24 | Societe A. Monborne Aine Et Fils | Articulation pour supports de lampes électriques à incandescence et autres applications |
| US5933801A (en) * | 1994-11-25 | 1999-08-03 | Fink; Flemming K. | Method for transforming a speech signal using a pitch manipulator |
| AU6785696A (en) * | 1995-09-05 | 1997-03-27 | Frank Uldall Leonhard | Method and system for processing auditory signals |
| SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
| GB9718026D0 (en) * | 1997-08-27 | 1997-10-29 | Secr Defence | Multi-component signal detection system |
| US20030156624A1 (en) * | 2002-02-08 | 2003-08-21 | Koslar | Signal transmission method with frequency and time spreading |
| US6549884B1 (en) | 1999-09-21 | 2003-04-15 | Creative Technology Ltd. | Phase-vocoder pitch-shifting |
| US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
| ATE355656T1 (de) | 2000-03-23 | 2006-03-15 | Interdigital Tech Corp | Effizienter spreizer für spreizspektrumübertragungssysteme |
| ATE338333T1 (de) * | 2001-04-05 | 2006-09-15 | Koninkl Philips Electronics Nv | Zeitskalenmodifikation von signalen mit spezifischem verfahren je nach ermitteltem signaltyp |
| US7610205B2 (en) * | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
| DK1386312T3 (da) * | 2001-05-10 | 2008-06-09 | Dolby Lab Licensing Corp | Forbedring af transient ydeevne af audio kodningssystemer med lav bithastighed ved reduktion af forudgående stöj |
| US6988066B2 (en) * | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
| EP1446796A1 (en) * | 2001-10-26 | 2004-08-18 | Koninklijke Philips Electronics N.V. | Tracking of sinusoidal parameters in an audio coder |
| US6965859B2 (en) * | 2003-02-28 | 2005-11-15 | Xvd Corporation | Method and apparatus for audio compression |
| CN100339886C (zh) * | 2003-04-10 | 2007-09-26 | 联发科技股份有限公司 | 可以检测声音信号的暂态位置的编码器及编码方法 |
| US7148415B2 (en) * | 2004-03-19 | 2006-12-12 | Apple Computer, Inc. | Method and apparatus for evaluating and correcting rhythm in audio data |
| US7876909B2 (en) * | 2004-07-13 | 2011-01-25 | Waves Audio Ltd. | Efficient filter for artificial ambience |
| US7565289B2 (en) * | 2005-09-30 | 2009-07-21 | Apple Inc. | Echo avoidance in audio time stretching |
| DE102006017280A1 (de) * | 2006-04-12 | 2007-10-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals |
| US8103504B2 (en) * | 2006-08-28 | 2012-01-24 | Victor Company Of Japan, Limited | Electronic appliance and voice signal processing method for use in the same |
| EP1918911A1 (en) * | 2006-11-02 | 2008-05-07 | RWTH Aachen University | Time scale modification of an audio signal |
| CN101308655B (zh) * | 2007-05-16 | 2011-07-06 | 展讯通信(上海)有限公司 | 一种音频编解码方法与装置 |
| US8078456B2 (en) * | 2007-06-06 | 2011-12-13 | Broadcom Corporation | Audio time scale modification algorithm for dynamic playback speed control |
| US9275652B2 (en) * | 2008-03-10 | 2016-03-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Device and method for manipulating an audio signal having a transient event |
-
2009
- 2009-09-30 EP EP09012410A patent/EP2214165A3/en not_active Withdrawn
-
2010
- 2010-01-05 JP JP2011546728A patent/JP5325307B2/ja active Active
- 2010-01-05 WO PCT/EP2010/050042 patent/WO2010086194A2/en not_active Ceased
- 2010-01-05 AU AU2010209943A patent/AU2010209943B2/en active Active
- 2010-01-05 MX MX2011008004A patent/MX2011008004A/es active IP Right Grant
- 2010-01-05 BR BRPI1005311-5A patent/BRPI1005311B1/pt active IP Right Grant
- 2010-01-05 CN CN201080009914.4A patent/CN102341847B/zh active Active
- 2010-01-05 EP EP10700048.1A patent/EP2392004B1/en active Active
- 2010-01-05 CA CA2751205A patent/CA2751205C/en active Active
- 2010-01-05 KR KR1020117019695A patent/KR101317479B1/ko active Active
- 2010-01-05 ES ES10700048.1T patent/ES2566927T3/es active Active
- 2010-01-05 RU RU2011133694/08A patent/RU2543309C2/ru not_active Application Discontinuation
- 2010-01-12 TW TW099100653A patent/TWI493541B/zh active
- 2010-01-26 AR ARP100100166A patent/AR075164A1/es active IP Right Grant
-
2011
- 2011-07-27 US US13/191,780 patent/US9230557B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| CA2751205A1 (en) | 2010-08-05 |
| AU2010209943A1 (en) | 2011-08-25 |
| WO2010086194A3 (en) | 2011-09-29 |
| RU2543309C2 (ru) | 2015-02-27 |
| KR101317479B1 (ko) | 2013-10-11 |
| TWI493541B (zh) | 2015-07-21 |
| CN102341847A (zh) | 2012-02-01 |
| EP2392004B1 (en) | 2015-12-30 |
| ES2566927T3 (es) | 2016-04-18 |
| EP2214165A2 (en) | 2010-08-04 |
| CA2751205C (en) | 2016-05-17 |
| EP2392004A2 (en) | 2011-12-07 |
| US9230557B2 (en) | 2016-01-05 |
| JP2012516460A (ja) | 2012-07-19 |
| BRPI1005311B1 (pt) | 2020-12-01 |
| RU2011133694A (ru) | 2013-03-10 |
| US20120051549A1 (en) | 2012-03-01 |
| WO2010086194A2 (en) | 2010-08-05 |
| AR075164A1 (es) | 2011-03-16 |
| HK1162080A1 (zh) | 2012-08-17 |
| AU2010209943B2 (en) | 2014-05-15 |
| EP2214165A3 (en) | 2010-09-15 |
| KR20110119745A (ko) | 2011-11-02 |
| MX2011008004A (es) | 2011-08-15 |
| CN102341847B (zh) | 2014-01-08 |
| BRPI1005311A2 (pt) | 2018-03-27 |
| TW201103009A (en) | 2011-01-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5325307B2 (ja) | 過渡的事象を含んでいるオーディオ信号を操作するための装置、方法およびコンピュータ・プログラム | |
| TWI505264B (zh) | 操縱具有瞬變事件的音頻信號的設備和方法以及具有執行該方法之程式碼的電腦程式 | |
| US8265940B2 (en) | Method and device for the artificial extension of the bandwidth of speech signals | |
| JP5898534B2 (ja) | 音響信号処理装置および音響信号処理方法 | |
| JP2020512593A (ja) | 音響信号の人為的帯域幅制限処理に関する所定の特性を決定するための装置および方法 | |
| KR101412117B1 (ko) | 재생 속도 또는 피치를 변경할 때 오디오 신호에서 과도 사운드 이벤트를 처리하기 위한 장치 및 방법 | |
| Nagel et al. | A novel transient handling scheme for time stretching algorithms | |
| HK1162080B (en) | Apparatus, method and computer program for manipulating an audio signal comprising a transient event | |
| AU2012216538B2 (en) | Device and method for manipulating an audio signal having a transient event |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121211 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130306 |
|
| A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130313 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130606 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130702 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130719 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5325307 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |