KR960030558A - 음성신호 부호화 및 복호화 방법 - Google Patents
음성신호 부호화 및 복호화 방법 Download PDFInfo
- Publication number
- KR960030558A KR960030558A KR1019950001575A KR19950001575A KR960030558A KR 960030558 A KR960030558 A KR 960030558A KR 1019950001575 A KR1019950001575 A KR 1019950001575A KR 19950001575 A KR19950001575 A KR 19950001575A KR 960030558 A KR960030558 A KR 960030558A
- Authority
- KR
- South Korea
- Prior art keywords
- pitch
- signal
- coefficient
- speech
- unvoiced
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (15)
- 송신측에서 음성신호를 부호화하여 전송하고, 수신측에서 부호화된 상기 음성신호를 복호화하여 원래의 상기 음성신호로 출력하는 음성신호 부호화 및 복호화방법에서, 상기 음성신호의 포락을 구하고, 부프레임별 피치를 추출하여 현재 프레임의 실제 피치값을 추정하고, 유성음 및 무성음을 판단하고, 선형예측부호화계수를 선형스펙트럼 쌍계수로 변환후 양자화하여 전송하는 음성부호화단계; 상기 양자화된 신호를 수신후 역양자화하여 상기 유성음 및 무성음에 대한 정보를 복원하고, 상기 복원된 정보를 이용하여 다중시·공간 스펙트럼을 만들어 상기 유성음 또는 무성음 대역별로 합성된 각각의 음성을 합쳐 원래의 상기 음성신호로 복호화하여 출력하는 음성복호화단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
- 제1항에 있어서, 상기 음성부호화단계는 상기 음성신호를 입력하여 디지탈신호로 변환하는 A/D 변환단계; 성도특성을 나타내는 정보를 추출하는 정보추출단계; 상기 음성신호의 피치의 주기를 추정하는 피치주기추정단계; 상기 음성신호가 유성음인가 또는 무성음인가를 판별하는 판별단계; 피치, 이득, 유·무성계수 및 선형스펙트럼 쌍계수들을 이용하여 상기 음성신호를 양자화하여 전송하는 양자화단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
- 제2항에 있어서, 상기 정보추출단계는 자기상관 계수방법을 이용하여 상기 성도특성정보를 선형예측부호화계수와 평균 전력으로 표현하고, 음성의 상호 관련성이 제거된 잔차신호를 만드는 단기예측단계; 상기 선형예측부호화계수를 상기 선형 스펙트럼 쌍계수로 변환하여 상기 이득 및 선형스펙트럼 쌍계수를 만드는 계수변환단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
- 제2항 또는 제3항에 있어서, 상기 피치주기추정단계는 적응코드북과 상기 잔차신호의 차가 최소로 되는 지연값인 폐쇄회로피치를 구하는 폐쇄피치검출단계; 상기 잔차신호의 자기상관계수를 이용하여 개방회로피치를 구하는 개방피치검출단계; 상기 개방회로피치 및 폐쇄회로피치를 이용하여 현재의 프레임을 가장 잘 표현하는 상기 피치계수를 예측 후 선택하는 피치적응단계를 구비하는 것을 특징으로 하는 음성부호화 및 복호화방법.
- 제4항에 있어서, 상기 피치적응단계는 선형회귀법을 이용하여 상기 피치를 예측하는 피치예측단계; 상기 예측된 피치를 사용하여 상기 폐쇄회로피치 중에서 현재의 프레임을 잘 표현하는 피치를 선택하는 피치선택단계를 구비하는 것을 특징으로 하는 음성부호화 및 복호화방법.
- 제1항에 있어서, 상기 음성복호화단계는 전송받은 상기 이득, 선형스펙트럼, 피치 및 유·무성계수를 역양자화하는 역양자화단계; 부프레임별로 음성을 생성하는 다중시간의 개념과 각 주파수 대역별로 음성을 생성하는 다중 스펙트럼의 개념을 혼용하여 상기 역양자화된 계수들로 상기 다중 시·공간 스펙트럼을 생성하는 다중 시·공간 스펙트럼생성단계; 원래의 상기 음성신호를 생성하기 위해 상기 유성음 합성신호와 무성음 합성신호를 합하는 신호생성단계; 합성된 신호를 아날로그로 변환하는 D/A 변환단계를 구비하는 것을 특징으로 하는 음성부호화 및 복호화방법.
- 제6항에 있어서, 상기 다중 시·공간 스펙트럼생성단계는 이전 프레임의 상기 선형 스펙트럼쌍계수와 현재 프레임의 선형 스펙트럼쌍계수를 선형 보간하여 각 부프레임의 상기 선형 스펙트럼쌍계수를 구하는 선형 스펙트럼쌍계수단계; 각 부프레임에 대하여 유성음 및 무성음 스펙트럼 포락을 계산하는 유·무성스펙트럼포락단계를 구비하는 것을 특징으로 하는 음성 부호화 및 복호화방법.
- 송신측에서 음성신호를 부호화하여 전송하고, 수신측에서 부호화된 상기 음성신호를 복호화하여 원래의 상기 음성신호로 출력하는 음성신호 부호화 및 복호화방법에 있어서, 상기 음성신호 부호화방법은 상기 음성신호의 포락을 구하고, 부프레임별 피치를 추출하여 현재 프레임의 실제 피치값을 추정하고, 유성음 및 무성음을 판단하고, 선형예측부호화계수를 선형스펙크럼 쌍계수로 변환후 양자화하여 전송하는 음성부호화단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
- 제8항에 있어서, 상기 음성부호화단계는 상기 음성신호를 입력하여 디지탈신호로 변환하는 A/D 변환단계; 성도특성을 나타내는 정보를 추출하는 정보추출단계; 상기 음성신호 피치의 주기를 추정하는 피치주기추정 단계; 상기 음성신호가 유성음인가 또는 무성음인가를 판별하는 판별단계; 피치, 이득, 유·무성계수 및 선형 스펙트럼 쌍계수들을 이용하여 상기 음성신호를 양자화하여 전송하는 양자화단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
- 제9항에 있어서, 상기 정보추출단계는 자기상관 계수방법을 이용하여 상기 성도특성정보를 선형예측부호화계수와 평균 전력으로 표현하고, 음성의 상호 관련성이 제거된 잔차신호를 만드는 단기예측단계; 상기 선형예측부호화계수를 상기 선형 스펙트럼 쌍계수로 변환하여 상기 이득 및 선형스펙트럼 쌍계수를 만드는 계수 변환단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
- 제9항 또는 제10항에 있어서, 상기 피치주기추정단계는 적응코드북과 상기 전차신호의 차가 최소로 되는 지연값인 폐쇄회로피치를 구하는 폐쇄피치검출단계; 상기 잔차신호의 자기상관계수를 이용하여 개방회로피치를 구하는 개방피치검출단계; 상기 개방회로피치 및 폐쇄회로피치를 이용하여 현재의 프레임을 가장 잘 표현하는 상기 피치계수를 예측 후 선택하는 피치적응단계를 구비하는 것을 특징으로 하는 음성부호화 및 복호화방법.
- 제11항에 있어서, 상기 피치적응단계는 선형회귀법을 이용하여 상기 피치를 예측하는 피치예측단계; 상기 예측된 피치를 사용하여 상기 폐쇄회로피치 중에서 현재의 프레임을 잘 표현하는 피치를 선택하는 피치선택단계를 구비하는 것을 특징으로 하는 음성부호화 및 복호화방법.
- 송신측에서 음성신호를 부호화하여 전송하고, 수신측에서 부호화된 상기 음성신호를 복호화하여 원래의 상기 음성신호로 출력하는 음성신호 부호화 및 복호화방법에서, 상기 음성신호의 복포화방법은 부호화단계에서 양자화된 신호를 수신후 역양자화하여 상기 음성신호의 유성음 및 무성음에 대한 정보를 복원하고, 상기 복원된 정보를 이용하여 다중 시·공간 스펙트럼을 만들어 상기 유성음 또는 무성음 대역별로 합성된 각각의 음성을 합쳐 원래의 상기 음성신호로 복호화하여 출력하는 음성복호화단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
- 제13항에 있어서, 상기 음성복호화단계는 전송받은 양자화된 상기 이득, 선형스펙트럼, 피치 및 유·무성계수를 역양자화하는 역양자화단계; 부프레임별로 음성을 생성하는 다중시간의 개념과 각 주파수 대역별로 음성을 생성하는 다중 스펙트럼의 개념을 혼용하여 상기 역양자화된 계수들로 상기 다중 시·공간 스펙트럼을 생성하는 다중 시·공간 스펙트럼생성단계; 원래의 상기 음성신호를 생성하기 위해 상기 유성음 합성신호와 무성음 합성신호를 합하는 신호생성단계; 합성된 신호를 아날로그로 변환하는 D/A 변환단계를 구비하는 것을 특징으로 하는 음성부호화 및 복호화방법.
- 제14항에 있어서, 상기 다중 시·공간 스펙트럼생성단계는 이전 프레임의 선형 스펙트럼쌍계수와 현재 프레임의 상기 선형 스펙트럼쌍계수를 선형 보간하여 각 부프레임의 상기 선형스펙트럼쌍계수를 구하는 선형 스펙트럼쌍계수단계; 각 부프레임에 대하여 유성음 및 무성음 스펙트럼 포락을 계산하는 유·무성스펙트럼포락단계를 구비하는 것을 특징으로 하는 음성부호화 및 복호화방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1019950001575A KR0155798B1 (ko) | 1995-01-27 | 1995-01-27 | 음성신호 부호화 및 복호화 방법 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1019950001575A KR0155798B1 (ko) | 1995-01-27 | 1995-01-27 | 음성신호 부호화 및 복호화 방법 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR960030558A true KR960030558A (ko) | 1996-08-17 |
| KR0155798B1 KR0155798B1 (ko) | 1998-12-15 |
Family
ID=19407411
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1019950001575A Expired - Fee Related KR0155798B1 (ko) | 1995-01-27 | 1995-01-27 | 음성신호 부호화 및 복호화 방법 |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR0155798B1 (ko) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100474826B1 (ko) * | 1998-05-09 | 2005-05-16 | 삼성전자주식회사 | 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치 |
| KR100526829B1 (ko) * | 1996-09-20 | 2006-01-27 | 소니 가부시끼 가이샤 | 음성부호화방법및장치음성복호화방법및장치 |
| KR101248353B1 (ko) * | 2005-06-09 | 2013-04-02 | 가부시키가이샤 에이.지.아이 | 피치 주파수를 검출하는 음성 해석 장치, 음성 해석 방법,및 음성 해석 프로그램 |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002208922A (ja) * | 2001-01-12 | 2002-07-26 | Ntt Docomo Inc | 暗号化装置および復号装置ならびに認証情報付与装置、暗号化方法、復号方法、認証情報付与方法 |
-
1995
- 1995-01-27 KR KR1019950001575A patent/KR0155798B1/ko not_active Expired - Fee Related
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100526829B1 (ko) * | 1996-09-20 | 2006-01-27 | 소니 가부시끼 가이샤 | 음성부호화방법및장치음성복호화방법및장치 |
| KR100474826B1 (ko) * | 1998-05-09 | 2005-05-16 | 삼성전자주식회사 | 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치 |
| KR101248353B1 (ko) * | 2005-06-09 | 2013-04-02 | 가부시키가이샤 에이.지.아이 | 피치 주파수를 검출하는 음성 해석 장치, 음성 해석 방법,및 음성 해석 프로그램 |
Also Published As
| Publication number | Publication date |
|---|---|
| KR0155798B1 (ko) | 1998-12-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101000345B1 (ko) | 음성 부호화 장치, 음성 복호화 장치 및 그 방법 | |
| US7315815B1 (en) | LPC-harmonic vocoder with superframe structure | |
| KR100873836B1 (ko) | Celp 트랜스코딩 | |
| KR100804461B1 (ko) | 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치 | |
| EP0920693B1 (en) | Method and apparatus for improving the voice quality of tandemed vocoders | |
| KR100574031B1 (ko) | 음성합성방법및장치그리고음성대역확장방법및장치 | |
| JP3557662B2 (ja) | 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置 | |
| US6678655B2 (en) | Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope | |
| KR101216098B1 (ko) | 신호 처리 방법 및 장치 | |
| JP2903533B2 (ja) | 音声符号化方式 | |
| JP3144009B2 (ja) | 音声符号復号化装置 | |
| EP1597721A2 (en) | 600 bps mixed excitation linear prediction transcoding | |
| US7684978B2 (en) | Apparatus and method for transcoding between CELP type codecs having different bandwidths | |
| WO2001065542A1 (en) | Voice encoding/decoding device and method therefor | |
| KR960030558A (ko) | 음성신호 부호화 및 복호화 방법 | |
| JP3092653B2 (ja) | 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置 | |
| JP2004302259A (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
| JP3050978B2 (ja) | 音声符号化方法 | |
| JP2797348B2 (ja) | 音声符号化・復号化装置 | |
| JP2004301954A (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
| JPS6134697B2 (ko) | ||
| JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
| KR0156983B1 (ko) | 음성 부호기 | |
| JPH05276049A (ja) | 音声符号化方法及びその装置 | |
| JPH02170199A (ja) | 音声符号化復号化方式 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| R17-X000 | Change to representative recorded |
St.27 status event code: A-3-3-R10-R17-oth-X000 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| R17-X000 | Change to representative recorded |
St.27 status event code: A-3-3-R10-R17-oth-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 6 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 7 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 8 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 9 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 10 |
|
| FPAY | Annual fee payment |
Payment date: 20080627 Year of fee payment: 11 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 11 |
|
| LAPS | Lapse due to unpaid annual fee | ||
| PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20090717 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20090717 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |