JP2017507365A - 複数のオブジェクトオーディオのポスト符号化ビットレート低減 - Google Patents
複数のオブジェクトオーディオのポスト符号化ビットレート低減 Download PDFInfo
- Publication number
- JP2017507365A JP2017507365A JP2016555722A JP2016555722A JP2017507365A JP 2017507365 A JP2017507365 A JP 2017507365A JP 2016555722 A JP2016555722 A JP 2016555722A JP 2016555722 A JP2016555722 A JP 2016555722A JP 2017507365 A JP2017507365 A JP 2017507365A
- Authority
- JP
- Japan
- Prior art keywords
- audio object
- file
- bit rate
- data frame
- bit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/266—Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
- H04N21/2662—Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/434—Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Telephonic Communication Services (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本出願は、開示内容全体が引用により本明細書に組み込まれている2014年3月6日出願の米国特許出願14/199,706号「複数のオブジェクトオーディオのポスト符号化ビットレート低減」に対する優先権を主張する。
オーディオオブジェクトは、特定の音又は音の組合せのソース信号である。状況によっては、オーディオオブジェクトが、それに関連付けられるレンダリングメタデータを含むこともある。レンダリングメタデータは、オーディオオブジェクトが再生中にオーディオ空間にどのようにレンダリングされるかを指示するオーディオオブジェクトに伴うデータである。このメタデータは、多次元オーディオ空間情報、空間内の位置情報、及びサラウンド配列情報を含むことができる。
ポスト符号化ビットレート低減システム及び方法の実施形態は、一部のプレナリービットレートで複数のオーディオオブジェクトファイルを別々にかつ独立して符号化する。次に本システム及び方法の実施形態は、これらの符号化オーディオオブジェクトファイルをそれに関連する階層化メタデータと結合してプレナリーファイルを生成する。複数のビットストリームは、単一のプレナリーファイルから取得することができる。これらの複数のビットストリームは、プレナリービットレートより小さいか又は等しいターゲットビットレートである。スケーリングとして公知であるこのビットレート変更は、最適品質が各スケールビットレートで維持されることを保証する。さらに、ビットレートのスケーリングは、最初にプレナリーファイルをその非圧縮形式に戻し、次に結果として得られた非圧縮データを異なるビットレートで再符号化することを必要とせずに達成される。
ポスト符号化ビットレート低減システム100の実施形態の構成要素のシステム詳細をここで説明する。これらの構成要素は、ビット低減モジュール150、スケーラブルビットストリーム符号器130、及びフレーム毎の階層ビット割り当てモジュールを含む。加えて、受信デバイス180のスケール圧縮ビットストリーム170の復号を説明する。本システムを実施できる幾つかの方法のうちの幾つかを以下に詳述する点に留意されたい。多くの変形例が可能である。
図8は、図1−7に示したポスト符号化ビットレート低減システム100及び方法の実施形態の一般的な動作を示す流れ図である。動作は複数のオーディオオブジェクトファイルを入力することによって開始する(ボックス800)。これらのオーディオオブジェクトファイルは、それに関連付けられるレンダリングメタデータと結合したソース信号を含むことができ、様々な音源を表現することができる。これらの音源は、個々の楽器及びボーカル、及びドラムキットの個々の構成要素の複数のトラックを包含するドラムキットのオーディオオブジェクトなどの音源のグループを含むことができる。
ポスト符号化ビットレート低減システム100及び方法の実施形態は、オーディオの無音期間を処理する実施形態、及び単一のプレナリーファイルを多種多様な異なる帯域幅ネットワークチャネルに配信する実施形態を含む。無音期間の実施形態は、幾つかのオーディオオブジェクトファイルが、オーディオが無音であるかなりの期間を有するか又は他のオーディオオブジェクトファイルに比べて非常に低レベルである場合に向けられる。例えば、音楽を包含するオーディオコンテンツは、ボーカルトラックが無音又は非常に低レベルである長期間を有する可能性がある。固定ビットレートオーディオコーデックを使用してこのようなオーディオオブジェクトファイルをコーディングする場合、かなりの量のデータペイロードが無音期間のコーディングに浪費される。
上述のように、一部の実施形態では、プレナリーファイル140は複数の符号化オーディオオブジェクトファイルを含む。このような符号化オーディオオブジェクトファイルの一部又は全部は、オーディオデータ、サウンド情報、及び関連付けられるメタデータの何らかの組合せを包含することができる。さらに、一部の実施形態では、符号化オーディオオブジェクトファイルは、データフレームに分割又は区分化することができる。データフレーム(単数又は複数)の使用は、ストリーミングアプリケーションに有効とすることができる。一般的に、「フレーム」は、コーデックによって作成され、符号化及び復号に使用される別個のデータセグメントである。
スケール圧縮ビットストリーム170に配置された要素の構造及び順序は、ビットストリーム170のワイドビットレンジ及び細粒度スケーラビリティを提供する。この構造及び順序は、ビットストリーム170がビット低減モジュール150などの外部機構によってスムーズにスケールされるのを可能にする。
期間中のフレーム間のビットの割り当ての実施例をここで説明する。これは、ビット割り当てを実行することができる複数の方法の1つにすぎない点に留意されたい。図12は、プレナリーファイル140を複数のフレーム及び期間に分割する実施例の例示的な実施形態を示す。図12に示すように、プレナリーファイル140は、複数のオーディオオブジェクトの複数のフレームに分割されて図示されている。x軸は時間軸、y軸は符号化オーディオオブジェクトファイル数である。この実施例では、M数の符号化オーディオオブジェクトがあり、ここでMは正のゼロでない整数である。また、この例示的な実施例では、各符号化オーディオオブジェクトファイルは、プレナリーファイル140の全持続時間に存在する。
本明細書に記載する以外の他の変形形態が明らかになるであろう。例えば、実施形態によっては、本明細書で説明した何らかの方法及びアルゴリズムの特定の動作、事象、又は機能を異なる順序で実行することができ、追加、統合、又は完全に省略することができる(従って、ここで説明する全ての動作又は事象が、本方法及びアルゴリズムの実施に必要というわけではない)。さらに、特定の実施形態において、動作又は事象は、連続的ではなく、例えば、マルチスレッド型処理、割り込み処理、もしくはマルチプロセッサ又はプロセッサコアによって、又は他の並列アーキテクチャ上で同時に実行することができる。加えて、様々なタスク又は処理は、一緒に機能することができる異なるマシン及びコンピューティングシステムによって実行することができる。
800 複数のオーディオオブジェクトファイルを入力する
810 オーディオオブジェクトファイルの各々を別々に符号化する
820 複数の別々に符号化されたオーディオオブジェクトファイルと対応する階層メタデータを結合して、プレナリービットレートのプレナリーファイルを生成する
830 別々に符号化されたオーディオファイルの各々のデータフレームのアクティビティを相互に比較して、選択された期間のデータフレームアクティビティ比較を取得する
840 データフレームアクティビティ比較及び階層メタデータに基づいて利用可能なビットプールからビットを割り当ててビット割り当てを取得する
850 ビット割り当てに従って別々に符号化されたオーディオオブジェクトファイルからビットを削減して、ペアードダウンフレームを生成する
860 ペアードダウンフレームからビット低減符号化オーディオオブジェクトファイルを生成する
870 ビット低減符号化オーディオオブジェクトファイルを一緒に多重化する
880 多重化ビット低減符号化オーディオオブジェクトファイルをスケール圧縮ビットストリームにパックする
Claims (22)
- 単一のプレナリーファイルからスケール圧縮ビットストリームを生成するための1又は2以上の処理デバイスによって実行される方法であって、
複数の別々に符号化されたオーディオオブジェクトファイルを結合することによってプレナリービットレートを有するプレナリーファイルを作成する段階であって、オーディオオブジェクトは、特定のサウンド又はサウンドの組合せのソース信号である、段階と、
前記符号化オーディオオブジェクトファイルの各々をデータフレームにセグメント化する段階と、
選択された期間の前記符号化オーディオファイルの各々のデータフレームのデータフレームアクティビティを相互に比較して、前記選択された期間の前記符号化オーディオファイルの全てのデータフレームアクティビティ比較を取得する段階と、
前記データフレームアクティビティ比較に基づいて、前記選択された期間中に、利用可能なビットプールから前記符号化オーディオオブジェクトファイルのデータフレームの各々にビットを割り当てて、前記選択された期間のビット割り当てを取得する段階と、
前記ビット割り当てに従って、前記データフレームのビットをトランケートすることによって前記プレナリーファイルをスケールダウンして、削減フレームを生成する段階と、
前記削減フレームからビット低減符号化オーディオオブジェクトファイルを取得して前記ビット低減符号化オーディオオブジェクトファイルを一緒に多重化する段階と、
前記単一のプレナリーファイルのポスト符号化ビットレート低減を助長するために前記プレナリービットレートより低いか又は等しいターゲットビットレートを前記スケール圧縮ビットストリームが有するように、前記多重化ビット低減符号化オーディオオブジェクトファイルを前記スケール圧縮ビットストリームにパックする段階と、
を含む方法。 - 前記複数の別々に符号化されたオーディオオブジェクトファイルと対応する階層メタデータとを結合することによって前記プレナリーファイルを作成する段階であって、前記階層メタデータが、他の符号化オーディオオブジェクトファイルに関する各符号化オーディオオブジェクトファイルの優先順位情報を包含する、段階と、
前記データフレームアクティビティ比較及び前記階層メタデータに基づいて、前記データフレームの各々に前記利用可能なビットプールからビットを割り当てて、前記選択された期間のビット割り当てを取得する段階と、
をさらに含む、請求項1に記載の方法。 - 前記符号化オーディオオブジェクトファイルの各々の全時間長は、前記プレナリーファイルを作成するために使用される、請求項1に記載の方法。
- 前記利用可能なビットプールから、前記選択された期間の前記データフレームの全て及び前記符号化オーディオオブジェクトファイルの全てに対してビットを割り当てる段階をさらに含む、請求項1に記載の方法。
- 前記選択された期間の前記データフレームの各々のデータフレームアクティビティを測定する段階と、
各データフレームの前記データフレームアクティビティを無音閾値と比較して、前記データフレームのいずれかに最小量のアクティビティがあるか否かを決定する段階と、
をさらに含む、請求項2に記載の方法。 - 特定のデータフレームの前記データフレームアクティビティが前記無音閾値よりも小さいか又は等しい場合に、前記特定のデータフレームを、最小量のアクティビティを有する無音データフレームとして指定して、ビットの何らかの低減なしに前記無音データフレームを表現するために使用されるビット数を同じに維持する段階と、
特定のデータフレームのデータフレームアクティビティが前記無音閾値より大きい場合に、前記データフレームアクティビティをフレームアクティビティバッファに記憶する段階と、
をさらに含む、請求項5に記載の方法。 - 前記選択された期間に割り当てられたビット数から、前記選択された期間中の無音データフレームによって使用されたビットを差し引くことによって、前記選択された期間の利用可能なビットプールを決定する段階をさらに含む、請求項6に記載の方法。
- 前記ビット割り当てにおいて前記データフレームに割り当てられるビット数を達成するよう、逆ランキング順でデータフレームのビットをトランケートする段階をさらに含み、前記ランクの低いビットが前記ランクの高いビットの前にトランケートされるようになる、請求項2に記載の方法。
- オーディオオブジェクトファイルの周波数領域表現から音色を抽出して、少なくとも一部の音色が取り除かれた前記オーディオオブジェクトファイルを表現する、時間領域残余信号を取得する段階と、
前記抽出された音色及び前記時間領域残余信号を複数のデータチャンクにフォーマット化する段階であって、各データチャンクが複数のデータバイトを含む、段階と、
心理音響的に重要な順序で前記オーディオオブジェクトファイルのデータフレームのデータチャンク及び前記データチャンクのビットの両方を順序付けして、最も重要なビットから最も重要でないビットのランキング順を取得する段階と、
をさらに含む、請求項8に記載の方法。 - 前記ターゲットビットレートより小さいか又は等しいビットレートでネットワークチャネルを通じて前記スケール圧縮ビットストリームを送信する段階と、
前記スケール圧縮ビットストリームを受信及び復号して復号オーディオオブジェクトファイルを取得する段階と、
をさらに含む、請求項2に記載の方法。 - 前記復号オーディオオブジェクトファイルをミキシングしてオーディオオブジェクトミックスを作成する段階をさらに含み、前記復号オーディオオブジェクトファイルの2又は3以上は、前記ミックスにおける位置に基づく空間マスキングのために相互に依存する、請求項10に記載の方法。
- オーディオオブジェクトミックスにおける空間位置決めに基づいて前記階層メタデータの前記符号化オーディオオブジェクトファイルを優先順位付けする段階をさらに含む、
ことを特徴とする請求項2に記載の方法。 - オーディオオブジェクトミックスにおける各オーディオオブジェクトファイルのユーザに対する重要度に基づいて、前記符号化オーディオオブジェクトファイルの優先順位付けを行う段階をさらに含む、請求項2に記載の方法。
- 単一のプレナリーファイルから複数のスケール圧縮ビットストリームを取得するための方法であって、
複数のオーディオオブジェクトファイルを別々に符号化して、人間の聴覚に対する心理音響的重要度の順で前記符号化オーディオオブジェクトファイルの各データフレームのビットをランキングする細粒度スケーラビリティを有するスケーラブルビットストリーム符号器を使用して、プレナリービットレートの複数の符号化オーディオオブジェクトファイルを取得する段階と、
前記複数の単独で符号化されたオーディオオブジェクトファイルと対応する階層メタデータを結合することによって、前記プレナリービットレートの前記プレナリーファイルを生成する段階と、
前記プレナリーファイルから第1のターゲットビットレートの第1のスケール圧縮ビットストリームを構成する段階と、
異なるターゲットビットレートの複数のスケールビットストリームが、前記複数の符号化オーディオオブジェクトファイルのいずれの再符号化なしに前記単一のプレナリーファイルから取得されるように、前記プレナリーファイルから第2のターゲットビットレートの第2のスケール圧縮ビットストリームを構成する段階と、
を含み、
前記第1のターゲットビットレート及び前記第2のターゲットビットレートは、互いに異なり、両方とも前記プレナリービットレートよりも小さい、ことを特徴とする方法。 - 前記第1のターゲットビットレートは、前記第1のスケール圧縮ビットストリームが送信される最大ビットレートである、請求項14に記載の方法。
- 前記複数の符号化オーディオオブジェクトファイルの各々は、永続的であり、前記プレナリーファイルの全持続時間に存在する、請求項15に記載の方法。
- 選択された期間の前記複数の符号化オーディオファイルの各々のデータフレームのデータフレームアクティビティを相互に比較してデータフレームアクティビティ比較を取得する段階と、
前記データフレームアクティビティ比較及び前記第1ターゲットビットレートに基づいて、前記選択された期間の前記符号化オーディオオブジェクトファイルのデータフレームの各々にビットを割り当てて、前記選択された期間のビット割り当てを取得する段階と、
前記ビット割り当てに従って前記データフレームのビットをトランケートすることによって、前記プレナリーファイルをスケールダウンして、前記第1のターゲットビットレートを達成しかつビット低減符号化オーディオオブジェクトファイルを取得する段階と、
前記ビット低減オーディオオブジェクトファイルを一緒に多重化して前記第1のターゲットビットレートの前記第1のスケール圧縮ビットストリームにパックする段階と、
をさらに含む、請求項16に記載の方法。 - 前記第1のスケール圧縮ビットストリームを前記第1のターゲットビットレートで受信デバイスに送信する段階と、
前記第1のスケール圧縮ビットストリームを復号して復号オーディオオブジェクトを取得する段階と、
をさらに含む、請求項17に記載の方法。 - 前記復号オーディオオブジェクトをミキシングしてオーディオオブジェクトミックスを作成する段階をさらに含む、請求項18に記載の方法。
- ポスト符号化ビットレート低減システムであって、
プレナリーファイルであって、該プレナリーファイルを形成するよう、プレナリービットレートで符号化されかつ対応する階層メタデータと一緒に結合されている別々に符号化されたオーディオオブジェクトファイルを包含する、プレナリーファイルと、
選択された期間において前記オーディオオブジェクトファイルの各々のデータフレームの各々のデータフレームアクティビティ比較に基づいて符号化オーディオオブジェクトファイルのデータフレームに割り当てられたビット数を低減して、ビット低減符号化オーディオオブジェクトを取得する、ビット低減モジュールと、
コンピュータネットワークを通じた伝送のためのコンテナにビット低減符号化オーディオオブジェクトのデータフレームを配置するためのビットストリームパッカーと、
前記ビット低減符号化オーディオを包含するコンテナを結合して、ターゲットビットレートのスケール圧縮ビットストリームを生成するためのマルチプレクサと、
を含み、
前記ターゲットビットレートがプレナリービットレートよりも小さい、ことを特徴とするポスト符号化ビットレート低減システム。 - ターゲットビットレートでネットワークを通じて受信されたスケール圧縮ビットストリームであって、前記ビットストリームは、コンピュータデバイスに常駐するスケーラブルビットストリーム符号器を使用して別々に符号化され、データフレームアクティビティ比較及び対応する階層メタデータに基づいてトランケートされたプレナリービットレートで符号化されたプレナリーファイルのデータフレームのビットを有する複数のビット低減符号化オーディオオブジェクトファイルを包含し、前記ターゲットビットレートは、前記プレナリービットレートより小さいか又は等しい、スケール圧縮ビットストリームと、
前記スケール圧縮ビットストリームを複数の符号化オーディオオブジェクトファイルに分離するためのデマルチプレクサと、
前記符号化オーディオオブジェクトを復号して復号オーディオオブジェクトを取得するスケーラブルビットストリーム復号器と、
を含む、オーディオ信号受信システム。 - 前記復号オーディオオブジェクトファイルをミキシングしてオーディオオブジェクトミックスを生成するよう使用されるミキシングデバイスをさらに含む、請求項22に記載のオーディオ信号受信システム。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US14/199,706 US9564136B2 (en) | 2014-03-06 | 2014-03-06 | Post-encoding bitrate reduction of multiple object audio |
| US14/199,706 | 2014-03-06 | ||
| PCT/US2015/017732 WO2015134272A1 (en) | 2014-03-06 | 2015-02-26 | Post-encoding bitrate reduction of multiple object audio |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2017507365A true JP2017507365A (ja) | 2017-03-16 |
| JP6620108B2 JP6620108B2 (ja) | 2019-12-11 |
Family
ID=54017971
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016555722A Active JP6620108B2 (ja) | 2014-03-06 | 2015-02-26 | 複数のオブジェクトオーディオのポスト符号化ビットレート低減 |
Country Status (7)
| Country | Link |
|---|---|
| US (2) | US9564136B2 (ja) |
| EP (2) | EP3114681B1 (ja) |
| JP (1) | JP6620108B2 (ja) |
| KR (1) | KR102451342B1 (ja) |
| CN (1) | CN106233380B (ja) |
| PL (1) | PL3114681T3 (ja) |
| WO (1) | WO2015134272A1 (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2018198789A1 (ja) * | 2017-04-26 | 2018-11-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
| WO2019130763A1 (ja) * | 2017-12-28 | 2019-07-04 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
| JP2022539608A (ja) * | 2019-07-08 | 2022-09-12 | ヴォイスエイジ・コーポレーション | オーディオストリーム内のメタデータのコーディングのためおよびオーディオストリームのコーディングへの効率的なビットレートの割り当てのための方法およびシステム |
| JP2023523081A (ja) * | 2020-04-30 | 2023-06-01 | 華為技術有限公司 | 音声信号に対するビット割り当て方法及び装置 |
Families Citing this family (25)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI530941B (zh) | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
| WO2016007210A1 (en) * | 2014-07-07 | 2016-01-14 | Thomson Licensing | Enhancing video content according to metadata |
| US10225676B2 (en) | 2015-02-06 | 2019-03-05 | Dolby Laboratories Licensing Corporation | Hybrid, priority-based rendering system and method for adaptive audio |
| JP2017168967A (ja) * | 2016-03-15 | 2017-09-21 | 富士ゼロックス株式会社 | 情報処理装置 |
| US10362082B2 (en) * | 2016-04-12 | 2019-07-23 | Baidu Usa Llc | Method for streaming-based distributed media data processing |
| US10831277B2 (en) * | 2016-12-21 | 2020-11-10 | Telefonaktiebolaget Lm Ericsson (Publ) | Region of interest classification |
| JPWO2018142947A1 (ja) * | 2017-01-31 | 2019-12-12 | ソニー株式会社 | 情報処理装置および方法 |
| US10771789B2 (en) * | 2017-05-19 | 2020-09-08 | Google Llc | Complexity adaptive rate control |
| CN110535810A (zh) * | 2018-05-25 | 2019-12-03 | 视联动力信息技术股份有限公司 | 一种视频数据的处理方法和终端 |
| GB2578715A (en) * | 2018-07-20 | 2020-05-27 | Nokia Technologies Oy | Controlling audio focus for spatial audio processing |
| WO2020089302A1 (en) * | 2018-11-02 | 2020-05-07 | Dolby International Ab | An audio encoder and an audio decoder |
| WO2020253941A1 (en) * | 2019-06-17 | 2020-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs |
| US11361776B2 (en) * | 2019-06-24 | 2022-06-14 | Qualcomm Incorporated | Coding scaled spatial components |
| US11538489B2 (en) | 2019-06-24 | 2022-12-27 | Qualcomm Incorporated | Correlating scene-based audio data for psychoacoustic audio coding |
| US12308034B2 (en) | 2019-06-24 | 2025-05-20 | Qualcomm Incorporated | Performing psychoacoustic audio coding based on operating conditions |
| US12142285B2 (en) | 2019-06-24 | 2024-11-12 | Qualcomm Incorporated | Quantizing spatial components based on bit allocations determined for psychoacoustic audio coding |
| IL290684B2 (en) | 2019-09-03 | 2025-12-01 | Dolby Laboratories Licensing Corp | Low-latency, low-frequency effects codec |
| CN110718211B (zh) * | 2019-09-26 | 2021-12-21 | 东南大学 | 一种基于混合压缩卷积神经网络的关键词识别系统 |
| CN113129861B (zh) | 2019-12-30 | 2024-12-31 | 华为技术有限公司 | 一种文本转语音的处理方法、终端及服务器 |
| CN111583898B (zh) * | 2020-05-26 | 2021-06-29 | 苏州双福智能科技有限公司 | 一种空间环境多方位选择性降噪系统及方法 |
| CA3189122A1 (en) * | 2020-09-22 | 2022-03-31 | Qsc, Llc | Transparent data encryption |
| US11355139B2 (en) * | 2020-09-22 | 2022-06-07 | International Business Machines Corporation | Real-time vs non-real time audio streaming |
| EP4380193B1 (en) | 2021-11-17 | 2025-09-24 | Samsung Electronics Co., Ltd. | Electronic device for performing audio streaming and operating method thereof |
| CN114884974B (zh) * | 2022-04-08 | 2024-02-23 | 海南车智易通信息技术有限公司 | 一种数据复用方法、系统及计算设备 |
| WO2024080597A1 (ko) * | 2022-10-12 | 2024-04-18 | 삼성전자주식회사 | 오디오 비트스트림을 적응적으로 처리하는 전자 장치, 방법, 및 비일시적 컴퓨터 판독가능 저장 매체 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11317682A (ja) * | 1998-02-26 | 1999-11-16 | Hitachi Ltd | 受信帰情報機器および受信システム |
| JP2004523790A (ja) * | 2001-01-18 | 2004-08-05 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ビットセイビングバンク、エンコーダおよびスケーラブルエンコーダを備えたスケーラブルデータストリームを生成する方法と装置および復号化する方法と装置 |
Family Cites Families (42)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4095052A (en) * | 1977-08-02 | 1978-06-13 | Bell Telephone Laboratories, Incorporated | Digital speech interpolation trunk priority rotator |
| GB8330885D0 (en) * | 1983-11-18 | 1983-12-29 | British Telecomm | Data transmission |
| ES2164640T3 (es) * | 1991-08-02 | 2002-03-01 | Sony Corp | Codificador digital con asignacion dinamica de bits de cuantificacion. |
| DE69430872T2 (de) | 1993-12-16 | 2003-02-20 | Voice Compression Technologies Inc., Boston | System und verfahren zur sprachkompression |
| US5519779A (en) * | 1994-08-05 | 1996-05-21 | Motorola, Inc. | Method and apparatus for inserting signaling in a communication system |
| US5742734A (en) | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
| AU5663296A (en) * | 1995-04-10 | 1996-10-30 | Corporate Computer Systems, Inc. | System for compression and decompression of audio signals fo r digital transmission |
| US5835495A (en) * | 1995-10-11 | 1998-11-10 | Microsoft Corporation | System and method for scaleable streamed audio transmission over a network |
| US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
| US6353703B1 (en) * | 1996-10-15 | 2002-03-05 | Matsushita Electric Industrial Co., Ltd. | Video and audio coding method, coding apparatus, and coding program recording medium |
| US6349286B2 (en) | 1998-09-03 | 2002-02-19 | Siemens Information And Communications Network, Inc. | System and method for automatic synchronization for multimedia presentations |
| US6775325B1 (en) * | 1998-10-07 | 2004-08-10 | Sarnoff Corporation | Method and apparatus for converting the bitrate of an encoded bitstream without full re-encoding |
| US7003449B1 (en) * | 1999-10-30 | 2006-02-21 | Stmicroelectronics Asia Pacific Pte Ltd. | Method of encoding an audio signal using a quality value for bit allocation |
| US6697776B1 (en) | 2000-07-31 | 2004-02-24 | Mindspeed Technologies, Inc. | Dynamic signal detector system and method |
| US20020131496A1 (en) * | 2001-01-18 | 2002-09-19 | Vinod Vasudevan | System and method for adjusting bit rate and cost of delivery of digital data |
| US6694293B2 (en) | 2001-02-13 | 2004-02-17 | Mindspeed Technologies, Inc. | Speech coding system with a music classifier |
| CA2992051C (en) | 2004-03-01 | 2019-01-22 | Dolby Laboratories Licensing Corporation | Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters |
| US7333929B1 (en) * | 2001-09-13 | 2008-02-19 | Chmounk Dmitri V | Modular scalable compressed audio data stream |
| US7313520B2 (en) | 2002-03-20 | 2007-12-25 | The Directv Group, Inc. | Adaptive variable bit rate audio compression encoding |
| US8244895B2 (en) * | 2002-07-15 | 2012-08-14 | Hewlett-Packard Development Company, L.P. | Method and apparatus for applying receiving attributes using constraints |
| US7398204B2 (en) * | 2002-08-27 | 2008-07-08 | Her Majesty In Right Of Canada As Represented By The Minister Of Industry | Bit rate reduction in audio encoders by exploiting inharmonicity effects and auditory temporal masking |
| US7804897B1 (en) * | 2002-12-16 | 2010-09-28 | Apple Inc. | Method for implementing an improved quantizer in a multimedia compression and encoding system |
| KR100528325B1 (ko) * | 2002-12-18 | 2005-11-15 | 삼성전자주식회사 | 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치 |
| US7075460B2 (en) * | 2004-02-13 | 2006-07-11 | Hewlett-Packard Development Company, L.P. | Methods for scaling encoded data without requiring knowledge of the encoding scheme |
| US7392195B2 (en) | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
| WO2006010951A1 (en) | 2004-07-30 | 2006-02-02 | U-Myx Limited | Multi-channel audio data distribution format, method and system |
| US7930184B2 (en) | 2004-08-04 | 2011-04-19 | Dts, Inc. | Multi-channel audio coding/decoding of random access points and transients |
| US8370514B2 (en) * | 2005-04-28 | 2013-02-05 | DISH Digital L.L.C. | System and method of minimizing network bandwidth retrieved from an external network |
| US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
| CA2647823A1 (en) | 2006-03-27 | 2007-10-04 | Vidyo, Inc. | System and method for management of scalability information in scalable video and audio coding systems using control messages |
| JP2007264154A (ja) * | 2006-03-28 | 2007-10-11 | Sony Corp | オーディオ信号符号化方法、オーディオ信号符号化方法のプログラム、オーディオ信号符号化方法のプログラムを記録した記録媒体及びオーディオ信号符号化装置 |
| EP1855271A1 (en) | 2006-05-12 | 2007-11-14 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for re-encoding signals |
| US8279889B2 (en) * | 2007-01-04 | 2012-10-02 | Qualcomm Incorporated | Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate |
| US20090099851A1 (en) | 2007-10-11 | 2009-04-16 | Broadcom Corporation | Adaptive bit pool allocation in sub-band coding |
| US20090210436A1 (en) | 2007-10-30 | 2009-08-20 | General Instrument Corporation | Encoding a hierarchical multi-layer data package |
| US8239210B2 (en) | 2007-12-19 | 2012-08-07 | Dts, Inc. | Lossless multi-channel audio codec |
| EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
| KR101209213B1 (ko) * | 2008-08-19 | 2012-12-06 | 광주과학기술원 | 오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치 및복호화 장치 |
| US8396577B2 (en) * | 2009-08-14 | 2013-03-12 | Dts Llc | System for creating audio objects for streaming |
| CN102081927B (zh) * | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
| TWI476761B (zh) * | 2011-04-08 | 2015-03-11 | Dolby Lab Licensing Corp | 用以產生可由實施不同解碼協定之解碼器所解碼的統一位元流之音頻編碼方法及系統 |
| DE102011106033A1 (de) * | 2011-06-30 | 2013-01-03 | Zte Corporation | Verfahren und System zur Audiocodierung und -decodierung und Verfahren zur Schätzung des Rauschpegels |
-
2014
- 2014-03-06 US US14/199,706 patent/US9564136B2/en active Active
-
2015
- 2015-02-26 WO PCT/US2015/017732 patent/WO2015134272A1/en not_active Ceased
- 2015-02-26 KR KR1020167027219A patent/KR102451342B1/ko active Active
- 2015-02-26 CN CN201580021028.6A patent/CN106233380B/zh active Active
- 2015-02-26 JP JP2016555722A patent/JP6620108B2/ja active Active
- 2015-02-26 PL PL15758957T patent/PL3114681T3/pl unknown
- 2015-02-26 EP EP15758957.3A patent/EP3114681B1/en active Active
- 2015-02-26 EP EP18185223.7A patent/EP3416165B1/en active Active
- 2015-12-15 US US14/970,320 patent/US9984692B2/en active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11317682A (ja) * | 1998-02-26 | 1999-11-16 | Hitachi Ltd | 受信帰情報機器および受信システム |
| JP2004523790A (ja) * | 2001-01-18 | 2004-08-05 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ビットセイビングバンク、エンコーダおよびスケーラブルエンコーダを備えたスケーラブルデータストリームを生成する方法と装置および復号化する方法と装置 |
Cited By (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7160032B2 (ja) | 2017-04-26 | 2022-10-25 | ソニーグループ株式会社 | 信号処理装置および方法、並びにプログラム |
| US11900956B2 (en) | 2017-04-26 | 2024-02-13 | Sony Group Corporation | Signal processing device and method, and program |
| JPWO2018198789A1 (ja) * | 2017-04-26 | 2020-03-05 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
| WO2018198789A1 (ja) * | 2017-04-26 | 2018-11-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
| US11574644B2 (en) | 2017-04-26 | 2023-02-07 | Sony Corporation | Signal processing device and method, and program |
| JPWO2019130763A1 (ja) * | 2017-12-28 | 2020-12-17 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
| JP7226335B2 (ja) | 2017-12-28 | 2023-02-21 | ソニーグループ株式会社 | 情報処理装置、情報処理方法およびプログラム |
| JP2023053131A (ja) * | 2017-12-28 | 2023-04-12 | ソニーグループ株式会社 | 情報処理装置および情報処理方法 |
| WO2019130763A1 (ja) * | 2017-12-28 | 2019-07-04 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
| JP7521625B2 (ja) | 2017-12-28 | 2024-07-24 | ソニーグループ株式会社 | 情報処理装置および情報処理方法 |
| JP2022539608A (ja) * | 2019-07-08 | 2022-09-12 | ヴォイスエイジ・コーポレーション | オーディオストリーム内のメタデータのコーディングのためおよびオーディオストリームのコーディングへの効率的なビットレートの割り当てのための方法およびシステム |
| JP7699095B2 (ja) | 2019-07-08 | 2025-06-26 | ヴォイスエイジ・コーポレーション | オーディオストリーム内のメタデータのコーディングのためおよびオーディオストリームのコーディングへの効率的なビットレートの割り当てのための方法およびシステム |
| JP2023523081A (ja) * | 2020-04-30 | 2023-06-01 | 華為技術有限公司 | 音声信号に対するビット割り当て方法及び装置 |
| US11900950B2 (en) | 2020-04-30 | 2024-02-13 | Huawei Technologies Co., Ltd. | Bit allocation method and apparatus for audio signal |
| JP7550881B2 (ja) | 2020-04-30 | 2024-09-13 | 華為技術有限公司 | 音声信号に対するビット割り当て方法及び装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| KR20160129876A (ko) | 2016-11-09 |
| CN106233380A (zh) | 2016-12-14 |
| EP3114681B1 (en) | 2018-07-25 |
| JP6620108B2 (ja) | 2019-12-11 |
| WO2015134272A1 (en) | 2015-09-11 |
| CN106233380B (zh) | 2019-11-08 |
| PL3114681T3 (pl) | 2018-12-31 |
| KR102451342B1 (ko) | 2022-10-05 |
| US20160099000A1 (en) | 2016-04-07 |
| EP3114681A1 (en) | 2017-01-11 |
| EP3114681A4 (en) | 2017-08-02 |
| US9564136B2 (en) | 2017-02-07 |
| EP3416165B1 (en) | 2020-10-21 |
| US20150255076A1 (en) | 2015-09-10 |
| EP3416165A1 (en) | 2018-12-19 |
| US9984692B2 (en) | 2018-05-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6620108B2 (ja) | 複数のオブジェクトオーディオのポスト符号化ビットレート低減 | |
| ES2777600T3 (es) | Control de rango dinámico basado en metadatos extendidos de audio codificado | |
| JP5174027B2 (ja) | ミックス信号処理装置及びミックス信号処理方法 | |
| ES3035091T3 (en) | Method and system for coding metadata in audio streams and for efficient bitrate allocation to audio streams coding | |
| JP6214765B2 (ja) | 音声デコーダ、符号化音声出力データを生成するための装置、及びデコーダの初期化を可能にする方法 | |
| JP2010501089A (ja) | 音声符号化システム | |
| CN100489965C (zh) | 音频编码系统 | |
| JP7257965B2 (ja) | デジタルオーディオ信号における差分データ | |
| JP7827065B2 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
| CN109983535B (zh) | 具有子带能量平滑的基于变换的音频编解码器和方法 | |
| CN101399042A (zh) | 信号记录和再现装置和方法 | |
| HK1227166A1 (en) | Post-encoding bitrate reduction of multiple object audio | |
| HK1227166B (zh) | 多对象音频的编码後位速率减少 | |
| CA3145045C (en) | Method and system for coding metadata in audio streams and for flexible intra-object and inter-object bitrate adaptation | |
| CA3145047C (en) | Method and system for coding metadata in audio streams and for efficient bitrate allocation to audio streams coding | |
| WO2025239172A1 (ja) | 符号化装置および方法、復号装置および方法、プログラム、並びに情報処理システム | |
| CN117651995A (zh) | 编码装置及方法、解码装置及方法、以及程序 | |
| HK40069013A (en) | Method and system for coding metadata in audio streams and for efficient bitrate allocation to audio streams coding | |
| HK40069813B (zh) | 用於编解码音频流中的元数据及用於灵活对象内和对象间比特率适配的方法和系统 | |
| KR20100125118A (ko) | 오디오 생성방법, 오디오 생성장치, 오디오 재생방법 및 오디오 재생장치 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180219 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181122 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181129 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190228 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190424 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190529 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190919 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20191021 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191118 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6620108 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |