JP2017203844A - 符号化装置、復号装置、通信システム - Google Patents
符号化装置、復号装置、通信システム Download PDFInfo
- Publication number
- JP2017203844A JP2017203844A JP2016094625A JP2016094625A JP2017203844A JP 2017203844 A JP2017203844 A JP 2017203844A JP 2016094625 A JP2016094625 A JP 2016094625A JP 2016094625 A JP2016094625 A JP 2016094625A JP 2017203844 A JP2017203844 A JP 2017203844A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- band
- encoding
- component
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0012—Smoothing of parameters of the decoder interpolation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明を具体的に説明する前に、まず概要を述べる。本発明の実施例1は、送信装置から受信装置に音声信号を送信する通信システムに関する。通信システムがデジタル方式の無線通信システムである場合、音声信号の送信のためにボコーダ方式を使用する場合が多い。ボコーダ方式は、通信用の音声圧縮技術である。送信装置は、音声の波形を直接送信のではなくパラメータ化して送信し、受信装置は、受信したパラメータから元の音声を合成する。
次に、実施例2を説明する。実施例2は、実施例1と同様に、送信装置から受信装置に音声信号を送信する通信システムに関する。これまでは、通信システム100としてNXDN 9600bps(Half Rate)システムを一例として説明している。そのため、帯域幅8kHzの音声信号を0〜4kHzの成分と4〜8kHzの成分に分割している。実施例2では、音声信号をn個の成分に等分割する。実施例2に係る通信システム100は、図1と同様のタイプである。ここでは、実施例1との差異を中心に説明する。
Claims (9)
- 音声信号を入力する入力部と、
前記入力部において入力した音声信号における第1帯域の成分を符号化することによって第1符号化信号を生成する第1符号化部と、
前記入力部において入力した音声信号における第2帯域の成分であって、かつ第1帯域よりも高い周波数の第2帯域の成分を第1帯域に周波数シフトする周波数シフト部と、
前記周波数シフト部において周波数シフトした成分を符号化することによって第2符号化信号を生成する第2符号化部と、
前記第1符号化部において生成した第1符号化信号と前記第2符号化部において生成した第2符号化信号とを出力する出力部と、
を備えることを特徴とする符号化装置。 - 前記出力部は、第1符号化信号と第2符号化信号とを交互に出力することを特徴とする請求項1に記載の符号化装置。
- 前記出力部は、複数の第1符号化信号を連続して出力してから、複数の第2符号化信号を連続して出力することを特徴とする請求項1に記載の符号化装置。
- 前記入力部において入力した音声信号における第i(i>2)帯域の成分であって、かつ第i−1帯域よりも高い周波数の第i帯域の成分を第1帯域に周波数シフトする追加周波数シフト部と、
前記追加周波数シフト部において周波数シフトした成分を符号化することによって第i符号化信号を生成する第i符号化部とをさらに備え、
前記出力部は、前記第i符号化部において生成した第i符号化信号も出力することを特徴とする請求項1に記載の符号化装置。 - 音声信号における第1帯域の成分を符号化した第1符号化信号と、音声信号における第2帯域の成分であって、かつ第1帯域よりも高い周波数の第2帯域の成分を第1帯域に周波数シフトして符号化した第2符号化信号とを入力する入力部と、
前記入力部において入力した第1符号化信号を復号することによって第1帯域の第1音声成分を生成する第1復号部と、
前記入力部において入力した第2符号化信号を復号することによって第1帯域の第2音声成分を生成する第2復号部と、
前記第2復号部において生成した第2音声成分を第2帯域に周波数シフトする周波数シフト部と、
前記第1復号部において生成した第1音声成分と前記周波数シフト部において周波数シフトした第2音声成分とを合成して出力する合成部と、
を備えることを特徴とする復号装置。 - 前記入力部は、第1符号化信号と第2符号化信号とを交互に入力することを特徴とする請求項5に記載の復号装置。
- 前記入力部は、複数の第1符号化信号を連続して入力してから、複数の第2符号化信号を連続して入力することを特徴とする請求項5に記載の復号装置。
- 前記入力部は、音声信号における第i(i>2)帯域の成分であって、かつ第i−1帯域よりも高い周波数の第i帯域の成分を第1帯域に周波数シフトして符号化した第i符号化信号も入力し、
本復号装置は、
前記入力部において入力した第i符号化信号を復号することによって第1帯域の第i音声成分を生成する第i復号部と、
前記第i復号部において生成した第i音声成分を第i帯域に周波数シフトする追加周波数シフト部とをさらに備え、
前記合成部は、前記追加周波数シフト部において周波数シフトした第i音声成分も合成して出力することを特徴とする請求項5に記載の復号装置。 - 符号化装置と、
復号装置とを備え、
前記符号化装置は、
音声信号を入力する入力部と、
前記入力部において入力した音声信号における第1帯域の成分を符号化することによって第1符号化信号を生成する第1符号化部と、
前記入力部において入力した音声信号における第2帯域の成分であって、かつ第1帯域よりも高い周波数の第2帯域の成分を第1帯域に周波数シフトする周波数シフト部と、
前記周波数シフト部において周波数シフトした成分を符号化することによって第2符号化信号を生成する第2符号化部と、
前記第1符号化部において生成した第1符号化信号と前記第2符号化部において生成した第2符号化信号とを出力する出力部とを備え、
前記復号装置は、前記符号化装置からの第1符号化信号と第2符号化信号とを入力する入力部と、
前記入力部において入力した第1符号化信号を復号することによって第1帯域の第1音声成分を生成する第1復号部と、
前記入力部において入力した第2符号化信号を復号することによって第1帯域の第2音声成分を生成する第2復号部と、
前記第2復号部において生成した第2音声成分を第2帯域に周波数シフトする周波数シフト部と、
前記第1復号部において生成した第1音声成分と前記周波数シフト部において周波数シフトした第2音声成分とを合成して出力する合成部と、
を備えることを特徴とする通信システム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016094625A JP6763194B2 (ja) | 2016-05-10 | 2016-05-10 | 符号化装置、復号装置、通信システム |
| US15/481,874 US10056093B2 (en) | 2016-05-10 | 2017-04-07 | Encoding device, decoding device, and communication system for extending voice band |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016094625A JP6763194B2 (ja) | 2016-05-10 | 2016-05-10 | 符号化装置、復号装置、通信システム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2017203844A true JP2017203844A (ja) | 2017-11-16 |
| JP6763194B2 JP6763194B2 (ja) | 2020-09-30 |
Family
ID=60295446
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016094625A Active JP6763194B2 (ja) | 2016-05-10 | 2016-05-10 | 符号化装置、復号装置、通信システム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US10056093B2 (ja) |
| JP (1) | JP6763194B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2020250370A1 (ja) * | 2019-06-13 | 2020-12-17 | 日本電信電話株式会社 | 音信号受信復号方法、音信号復号方法、音信号受信側装置、復号装置、プログラム及び記録媒体 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH09127987A (ja) * | 1995-10-26 | 1997-05-16 | Sony Corp | 信号符号化方法及び装置 |
| US6182031B1 (en) * | 1998-09-15 | 2001-01-30 | Intel Corp. | Scalable audio coding system |
| JP2003502704A (ja) * | 1999-06-21 | 2003-01-21 | デジタル・シアター・システムズ・インコーポレーテッド | デコーダの互換性を失わない確立済み低ビット・レートのオーディオ・コード化システムの音質の改善 |
| WO2005076622A1 (ja) * | 2004-02-06 | 2005-08-18 | Sony Corporation | 情報処理装置および情報処理方法、プログラム、並びにデータ構造 |
Family Cites Families (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
| US5848164A (en) * | 1996-04-30 | 1998-12-08 | The Board Of Trustees Of The Leland Stanford Junior University | System and method for effects processing on audio subband data |
| SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
| US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
| PT1423847E (pt) * | 2001-11-29 | 2005-05-31 | Coding Tech Ab | Reconstrucao de componentes de frequencia elevada |
| EP1470550B1 (en) * | 2002-01-30 | 2008-09-03 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding device and methods thereof |
| US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
| SE0301273D0 (sv) * | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
| EP1672618B1 (en) * | 2003-10-07 | 2010-12-15 | Panasonic Corporation | Method for deciding time boundary for encoding spectrum envelope and frequency resolution |
| CN1914668B (zh) * | 2004-01-28 | 2010-06-16 | 皇家飞利浦电子股份有限公司 | 用于信号时间标度的方法及设备 |
| WO2005112001A1 (ja) * | 2004-05-19 | 2005-11-24 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、およびこれらの方法 |
| SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
| US7813931B2 (en) | 2005-04-20 | 2010-10-12 | QNX Software Systems, Co. | System for improving speech quality and intelligibility with bandwidth compression/expansion |
| KR100803205B1 (ko) * | 2005-07-15 | 2008-02-14 | 삼성전자주식회사 | 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
| KR100717058B1 (ko) * | 2005-11-28 | 2007-05-14 | 삼성전자주식회사 | 고주파 성분 복원 방법 및 그 장치 |
| US7869994B2 (en) * | 2007-01-30 | 2011-01-11 | Qnx Software Systems Co. | Transient noise removal system using wavelets |
| CN103718240B (zh) * | 2011-09-09 | 2017-02-15 | 松下电器(美国)知识产权公司 | 编码装置、解码装置、编码方法和解码方法 |
-
2016
- 2016-05-10 JP JP2016094625A patent/JP6763194B2/ja active Active
-
2017
- 2017-04-07 US US15/481,874 patent/US10056093B2/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH09127987A (ja) * | 1995-10-26 | 1997-05-16 | Sony Corp | 信号符号化方法及び装置 |
| US6182031B1 (en) * | 1998-09-15 | 2001-01-30 | Intel Corp. | Scalable audio coding system |
| JP2003502704A (ja) * | 1999-06-21 | 2003-01-21 | デジタル・シアター・システムズ・インコーポレーテッド | デコーダの互換性を失わない確立済み低ビット・レートのオーディオ・コード化システムの音質の改善 |
| WO2005076622A1 (ja) * | 2004-02-06 | 2005-08-18 | Sony Corporation | 情報処理装置および情報処理方法、プログラム、並びにデータ構造 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP6763194B2 (ja) | 2020-09-30 |
| US10056093B2 (en) | 2018-08-21 |
| US20170330584A1 (en) | 2017-11-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6910416B2 (ja) | 時間的オフセットを推定するための方法、装置、およびコンピュータ可読記憶媒体 | |
| JP6571281B2 (ja) | 複数のオーディオ信号の符号化 | |
| KR101067514B1 (ko) | 버퍼 조정을 이용하는 예측 코딩 데이터의 디코딩 | |
| JP2001500344A (ja) | タンデム型ボコーダの音質を改良する方法および装置 | |
| JP2006317575A (ja) | オーディオ復号装置 | |
| JP2009116332A (ja) | 信号処理方法、処理装置および音声復号器 | |
| JPWO2006046546A1 (ja) | 音声符号化装置および音声符号化方法 | |
| JP2005107255A (ja) | サンプリングレート変換装置、符号化装置、および復号化装置 | |
| JP6873165B2 (ja) | 中間サンプリングレートを使用したオーディオ復号 | |
| JP2008058667A (ja) | 信号処理装置および方法、記録媒体、並びにプログラム | |
| EP2610867B1 (en) | Audio reproducing device and audio reproducing method | |
| JP5031006B2 (ja) | スケーラブル復号化装置及びスケーラブル復号化方法 | |
| JP6763194B2 (ja) | 符号化装置、復号装置、通信システム | |
| JP2006119524A (ja) | 音声再生機および音声再生方法 | |
| WO2000077775A1 (en) | Sound switching device | |
| CN109360574B (zh) | 一种无线蓝牙系统改进的高级音频编码/解码方法及系统 | |
| JP2009162918A (ja) | 復号再生装置及び方法並びに受信装置 | |
| JP4536621B2 (ja) | 復号装置、および復号方法 | |
| JP2010224180A (ja) | 帯域拡張装置、方法及びプログラム、並びに、量子化雑音学習装置、方法及びプログラム | |
| JP2009031377A (ja) | オーディオデータ処理装置およびビット幅変換方法並びにビット幅変換装置 | |
| JP5287502B2 (ja) | 音声復号装置及び方法 | |
| JP2007235502A (ja) | オーディオ通信システム | |
| JP2018137614A (ja) | 通信装置、通信システム、通信方法及びプログラム | |
| JP2004246313A (ja) | 電話機、通話方法および音声周波数変換方法 | |
| JP2021076739A (ja) | 信号処理装置、振動装置、信号処理システム、プログラム、信号処理方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190222 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191210 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200121 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200303 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200811 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200824 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6763194 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |