JP4875204B2 - 符号化オーディオデータを処理するための装置及び方法 - Google Patents
符号化オーディオデータを処理するための装置及び方法 Download PDFInfo
- Publication number
- JP4875204B2 JP4875204B2 JP2010506343A JP2010506343A JP4875204B2 JP 4875204 B2 JP4875204 B2 JP 4875204B2 JP 2010506343 A JP2010506343 A JP 2010506343A JP 2010506343 A JP2010506343 A JP 2010506343A JP 4875204 B2 JP4875204 B2 JP 4875204B2
- Authority
- JP
- Japan
- Prior art keywords
- data stream
- frame boundary
- audio
- matching pattern
- header
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 41
- 238000012545 processing Methods 0.000 title claims description 25
- 238000001514 detection method Methods 0.000 claims description 40
- 125000004122 cyclic group Chemical group 0.000 claims 1
- 238000012546 transfer Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013497 data interchange Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
実施形態において、オーディオデコーダは、同期語と、有効な符号化オーディオフレームのヘッダフィールドに対する少なくとも1つの予測値に対応する1つ以上の付加ビットとを含むマッチングパタンを生成するマッチングパタン生成部を含む。オーディオデコーダは更に、前記マッチングパタンのインスタンスがないかデータストリームの部分を検索してフレーム境界を検出するフレーム境界検出部と、前記検出されたフレーム境界に対応する前記データストリームにおける点から始まる1つ以上の符号化オーディオフレームを復号化するフレームデコーダとを含む。実施形態において、前記フレーム境界検出部は、前記マッチングパタンの所定数のインスタンスを検索するように構成され、前記検出されたフレーム境界は、前記所定数のインスタンスのうちの最後のものに対応する。また、前記フレーム境界検出部は、停止信号を受信するように構成され、前記フレーム境界検出部は更に、前記停止信号が受信されるまで、前記マッチングパタンのインスタンスがないか前記データストリームの部分を検索するように構成される。また、実施形態において、前記フレーム境界検出部は更に、検出された前記マッチングパタンのインスタンスの数を示す、前記停止信号の生成に用いるためのフレーム検出信号を提供するように構成される。また、実施形態において、前記符号化フレームは、Audio Data Transport Stream (ADTS)ヘッダを含み、マッチングパタン生成部は、12ビット同期語と、1ビットIDフィールド、2ビットレイヤフィールド、1ビット保護なしフィールドの予測値に対応する付加ビットとを含むマッチングパタンを生成するように構成される。
また、実施形態において、オーディオ処理誤りを検出し、前記オーディオ処理誤りに対応する前記データストリームにおける誤り位置を特定する復号化誤り検出部を更に有し、前記フレーム境界検出部は、前記誤り位置から前記検索を開始する。また、実施形態において、前記フレーム境界検出部は更に、前記検出されたフレーム境界が有効なヘッダに対応しているかを検証するように構成される。また、実施形態において、前記フレーム境界検出部は、前記データストリームにおけるCRC(cyclical redundancy checksum)ビットを評価して前記検出されたフレーム境界が有効なヘッダに対応しているかを確認することによって、前記検出されたフレーム境界が有効なヘッダに対応しているかを検証するように構成される。
データストリームにおける複数の符号化オーディオフレームを復号化するための種々の方法も開示する。そのような方法の一例は、同期語と、有効な符号化オーディオフレームのヘッダフィールドに対する少なくとも1つの予測値に対応する1つ以上の付加ビットとを含むマッチングパタンを生成するステップと、前記マッチングパタンのインスタンスがないかデータストリームの部分を検索することによりフレーム境界を検出するステップと、前記検出されたフレーム境界に対応する前記データストリームにおける点から始まる1つ以上の符号化オーディオフレームを復号化するステップとを有する。実施形態において、前記フレーム境界を検出するステップは、前記マッチングパタンの所定数のインスタンスを検索するステップを含み、前記検出されたフレーム境界は、前記所定数のインスタンスのうちの最後のものに対応する。実施形態において、上記方法は、停止信号を受信するステップを更に有し、前記フレーム境界を検出するステップは、前記停止信号が受信されるまで、前記マッチングパタンのインスタンスがないか前記データストリームの部分を検索するステップを含む。実施形態において、前記フレーム境界を検出するステップは、前記停止信号が受信される前に検出された前記マッチングパタンの最後のインスタンスに対応するフレーム境界を検出するステップを含む。実施形態において、上記方法は、検出された前記マッチングパタンのインスタンスの数を示す、前記停止信号の生成に用いるためのフレーム検出信号を提供するステップを更に有する。
方法の実施形態においては、上記した装置と同様に、前記符号化オーディオフレームは、Advanced Audio Codec Rawデータブロックを含む。実施形態において、前記フレームヘッダは、Audio Data Transport Stream (ADTS)ヘッダを含み、前記マッチングパタンは、12ビット同期語と、1ビットIDフィールド、2ビットレイヤフィールド、1ビット保護なしフィールドの予測値に対応する付加ビットとを含む。
実施形態において、上記したいずれかの方法は、オーディオ処理誤りを検出するステップと、前記オーディオ処理誤りに対応する前記データストリームにおける誤り位置を特定するステップとを更に有し、前記マッチングパタンのインスタンスがないか前記データストリームの部分を検索するステップは、前記誤り位置から開始する。また、実施形態において、前記フレーム境界を検出するステップは、前記検出されたフレーム境界が有効なヘッダに対応しているかを検証するステップを含む。また、実施形態において、前記検出されたフレーム境界が有効なヘッダに対応しているかを検証するステップは、CRC(cyclical redundancy checksum)ビットを評価して前記検出されたフレーム境界が有効なヘッダに対応しているかを確認するステップを含む。
Claims (10)
- データストリーム(70)における複数の符号化オーディオフレーム(72)であって各フレームがヘッダ(80)を有する符号化オーディオフレーム(72)を復号化する方法であって、
同期語(62)と、有効な符号化オーディオフレーム(72)のヘッダ(80)フィールドに対する少なくとも1つの予測値に対応する1つ以上の付加ビット(64)とを含むマッチングパタン(60)を生成するステップと、
前記マッチングパタン(60)のインスタンスがないかデータストリーム(70)の部分を検索することによりフレーム境界(74)を検出するステップと、
前記検出されたフレーム境界(74)に対応する前記データストリーム(70)における点から始まる1つ以上の符号化オーディオフレーム(72)を復号化するステップと、
を有することを特徴とする方法。 - 前記フレーム境界(74)を検出するステップは、前記マッチングパタン(60)の所定数のインスタンスを検索するステップを含み、前記検出されたフレーム境界(74)は、前記所定数のインスタンスのうちの最後のものに対応することを特徴とする請求項1に記載の方法。
- 停止信号を受信するステップを更に有し、
前記フレーム境界(74)を検出するステップは、前記停止信号が受信されるまで、前記マッチングパタン(60)のインスタンスがないか前記データストリーム(70)の部分を検索するステップを含むことを特徴とする請求項1に記載の方法。 - 前記符号化オーディオフレーム(72)は、Advanced Audio Codec Rawデータブロックを含み、前記フレームヘッダ(80)は、Audio Data Transport Stream (ADTS)ヘッダを含み、前記マッチングパタン(60)は、12ビット同期語(62)と、1ビットIDフィールド(84)、2ビットレイヤフィールド(86)、1ビット保護なしフィールド(88)の予測値に対応する付加ビット(64)とを含むことを特徴とする請求項1に記載の方法。
- オーディオ処理誤りを検出するステップと、
前記オーディオ処理誤りに対応する前記データストリーム(70)における誤り位置を特定するステップと、を更に有し、
前記マッチングパタン(60)のインスタンスがないか前記データストリーム(70)の部分を検索するステップは、前記誤り位置から開始することを特徴とする請求項1に記載の方法。 - 前記フレーム境界(74)を検出するステップは、CRC(cyclical redundancy checksum)ビットを評価して前記検出されたフレーム境界(74)が有効なヘッダ(80)に対応しているかを確認することにより、前記検出されたフレーム境界(74)が有効なヘッダ(80)に対応しているかを検証するステップを含むことを特徴とする請求項1に記載の方法。
- データストリーム(70)における符号化オーディオフレーム(72)を復号化するオーディオデコーダ(50)であって、
同期語(62)と、有効な符号化オーディオフレーム(72)のヘッダ(80)フィールドに対する少なくとも1つの予測値に対応する1つ以上の付加ビット(64)とを含むマッチングパタン(60)を生成するマッチングパタン生成部(54)と、
前記マッチングパタン(60)のインスタンスがないかデータストリーム(70)の部分を検索してフレーム境界(74)を検出するフレーム境界検出部(56)と、
前記検出されたフレーム境界(74)に対応する前記データストリーム(70)における点から始まる1つ以上の符号化オーディオフレーム(72)を復号化するフレームデコーダ(58)と、
を備えることを特徴とするオーディオデコーダ(50)。 - 前記フレーム境界検出部(56)は、前記マッチングパタン(60)の所定数のインスタンスを検索するように構成され、前記検出されたフレーム境界(74)は、前記所定数のインスタンスのうちの最後のものに対応することを特徴とする請求項7に記載のオーディオデコーダ(50)。
- 前記フレーム境界検出部(56)は、停止信号を受信するように構成され、
前記フレーム境界検出部(56)は更に、前記停止信号が受信されるまで、前記マッチングパタン(60)のインスタンスがないか前記データストリーム(70)の部分を検索するように構成されている
ことを特徴とする請求項7に記載のオーディオデコーダ(50)。 - オーディオ処理誤りを検出し、前記オーディオ処理誤りに対応する前記データストリームにおける誤り位置を特定する復号化誤り検出部を更に有し、
前記フレーム境界検出部(56)は、前記誤り位置から前記検索を開始する
ことを特徴とする請求項7に記載のオーディオデコーダ(50)。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US11/741,297 US7778839B2 (en) | 2007-04-27 | 2007-04-27 | Method and apparatus for processing encoded audio data |
| US11/741,297 | 2007-04-27 | ||
| PCT/US2008/052581 WO2008134103A1 (en) | 2007-04-27 | 2008-01-31 | Method and apparatus for processing encoded audio data |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2010525414A JP2010525414A (ja) | 2010-07-22 |
| JP4875204B2 true JP4875204B2 (ja) | 2012-02-15 |
Family
ID=39563226
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010506343A Expired - Fee Related JP4875204B2 (ja) | 2007-04-27 | 2008-01-31 | 符号化オーディオデータを処理するための装置及び方法 |
Country Status (7)
| Country | Link |
|---|---|
| US (1) | US7778839B2 (ja) |
| EP (1) | EP2149138B1 (ja) |
| JP (1) | JP4875204B2 (ja) |
| CN (1) | CN101675473B (ja) |
| AT (1) | ATE478417T1 (ja) |
| DE (1) | DE602008002254D1 (ja) |
| WO (1) | WO2008134103A1 (ja) |
Families Citing this family (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8112570B2 (en) * | 2007-03-15 | 2012-02-07 | Broadcom Corporation | Pipelined buffer interconnect with trigger core controller |
| EP2131590A1 (en) * | 2008-06-02 | 2009-12-09 | Deutsche Thomson OHG | Method and apparatus for generating or cutting or changing a frame based bit stream format file including at least one header section, and a corresponding data structure |
| US8527267B2 (en) * | 2008-12-04 | 2013-09-03 | Linear Accoustic, Inc. | Adding additional data to encoded bit streams |
| TWI384459B (zh) * | 2009-07-22 | 2013-02-01 | Mstar Semiconductor Inc | 音框檔頭之自動偵測方法 |
| JP5785082B2 (ja) * | 2009-08-20 | 2015-09-24 | ジーブイビービー ホールディングス エス.エイ.アール.エル. | オーディオ・ストリームを合成する装置、方法及びプログラム |
| EP3499503B1 (en) * | 2010-04-13 | 2024-07-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoding sample-accurate representation of an audio signal |
| US20120185604A1 (en) * | 2011-01-14 | 2012-07-19 | Alexander Shatsky | System and method for indicating callee preferences |
| JP5805796B2 (ja) * | 2011-03-18 | 2015-11-10 | フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 柔軟なコンフィギュレーション機能性を有するオーディオエンコーダおよびデコーダ |
| US20170099119A1 (en) * | 2015-10-02 | 2017-04-06 | Samsung Electronics Co., Ltd. | Signalling of checksum for 802.11 mac headers |
| US11258576B2 (en) * | 2017-05-26 | 2022-02-22 | Harbin Hytera Technology Corp., Ltd. | Method, device, transmitter, and receiver for detecting syncwords |
| US12266351B2 (en) * | 2022-08-26 | 2025-04-01 | Qualcomm Incorporated | Adaptive frame skipping for speech recognition |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002530931A (ja) * | 1998-11-13 | 2002-09-17 | モトローラ・リミテッド | 分散音声認識プロセスにおける受信データの処理方法および装置 |
| JP2008084382A (ja) * | 2006-09-26 | 2008-04-10 | Oki Electric Ind Co Ltd | 圧縮データ再生方法 |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FI94817C (fi) * | 1993-06-10 | 1995-10-25 | Nokia Telecommunications Oy | Puheendekoodausmenetelmä ja puheendekoodain |
| US6421646B1 (en) * | 1999-01-12 | 2002-07-16 | Texas Instruments Incorporated | Probabilistic method and system for verifying synchronization words |
| US6721710B1 (en) | 1999-12-13 | 2004-04-13 | Texas Instruments Incorporated | Method and apparatus for audible fast-forward or reverse of compressed audio content |
| US20020027845A1 (en) | 2000-09-05 | 2002-03-07 | Tomoko Sogabe | Reproduction apparatus, reproduction method, program, and recording medium |
| EP1308931A1 (de) * | 2001-10-23 | 2003-05-07 | Deutsche Thomson-Brandt Gmbh | Decodierung eines codierten digitalen Audio-Signals welches in Header enthaltende Rahmen angeordnet ist |
| CN100463382C (zh) * | 2002-04-08 | 2009-02-18 | 松下电器产业株式会社 | 多媒体数据解码装置 |
| WO2004077406A1 (ja) * | 2003-02-28 | 2004-09-10 | Matsushita Electric Industrial Co., Ltd. | 再生装置および再生方法 |
| JP2005217486A (ja) * | 2004-01-27 | 2005-08-11 | Matsushita Electric Ind Co Ltd | ストリーム復号装置 |
| TWI268666B (en) * | 2004-03-02 | 2006-12-11 | Ali Corp | Frame calculation method of decoded audio a frame calculation method of decoded audio obtaining a true frame length by referring to no padding bit |
| US8131134B2 (en) | 2004-04-14 | 2012-03-06 | Microsoft Corporation | Digital media universal elementary stream |
| JP2006317575A (ja) * | 2005-05-11 | 2006-11-24 | Matsushita Electric Ind Co Ltd | オーディオ復号装置 |
-
2007
- 2007-04-27 US US11/741,297 patent/US7778839B2/en not_active Expired - Fee Related
-
2008
- 2008-01-31 WO PCT/US2008/052581 patent/WO2008134103A1/en not_active Ceased
- 2008-01-31 CN CN2008800136447A patent/CN101675473B/zh not_active Expired - Fee Related
- 2008-01-31 EP EP08728650A patent/EP2149138B1/en not_active Not-in-force
- 2008-01-31 DE DE602008002254T patent/DE602008002254D1/de active Active
- 2008-01-31 JP JP2010506343A patent/JP4875204B2/ja not_active Expired - Fee Related
- 2008-01-31 AT AT08728650T patent/ATE478417T1/de not_active IP Right Cessation
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002530931A (ja) * | 1998-11-13 | 2002-09-17 | モトローラ・リミテッド | 分散音声認識プロセスにおける受信データの処理方法および装置 |
| JP2008084382A (ja) * | 2006-09-26 | 2008-04-10 | Oki Electric Ind Co Ltd | 圧縮データ再生方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2008134103A1 (en) | 2008-11-06 |
| EP2149138B1 (en) | 2010-08-18 |
| US20080270143A1 (en) | 2008-10-30 |
| US7778839B2 (en) | 2010-08-17 |
| ATE478417T1 (de) | 2010-09-15 |
| EP2149138A1 (en) | 2010-02-03 |
| DE602008002254D1 (de) | 2010-09-30 |
| CN101675473A (zh) | 2010-03-17 |
| CN101675473B (zh) | 2012-07-11 |
| JP2010525414A (ja) | 2010-07-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4875204B2 (ja) | 符号化オーディオデータを処理するための装置及び方法 | |
| JP6530542B2 (ja) | 複数のメディア処理ノードによる適応処理 | |
| KR100946057B1 (ko) | 데이터 프레임에 코딩된 부가 데이터의 존재 결정 | |
| EP2289245B1 (en) | Method and apparatus for generating or cutting or changing a frame based bit stream format file including at least one header section, and a corresponding data structure | |
| US7940807B2 (en) | Methods, decoder circuits and computer program products for processing MPEG audio frames | |
| US7421641B2 (en) | Intelligent error checking method and mechanism | |
| US9484040B2 (en) | Audio decoding method and associated apparatus | |
| CN101266820B (zh) | 数据再生装置及数据再生方法 | |
| TWI384459B (zh) | 音框檔頭之自動偵測方法 | |
| US20260012666A1 (en) | Techniques for transmitting media using a data transport format | |
| RU2793832C2 (ru) | Способ аудиокодирования и способ аудиодекодирования | |
| CN101964187A (zh) | 帧标题的自动检测方法 | |
| KR20050077109A (ko) | Mpeg 오디오 디코딩 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111028 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111124 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141202 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |