KR960030558A - 음성신호 부호화 및 복호화 방법 - Google Patents

음성신호 부호화 및 복호화 방법 Download PDF

Info

Publication number
KR960030558A
KR960030558A KR1019950001575A KR19950001575A KR960030558A KR 960030558 A KR960030558 A KR 960030558A KR 1019950001575 A KR1019950001575 A KR 1019950001575A KR 19950001575 A KR19950001575 A KR 19950001575A KR 960030558 A KR960030558 A KR 960030558A
Authority
KR
South Korea
Prior art keywords
pitch
signal
coefficient
speech
unvoiced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
KR1019950001575A
Other languages
English (en)
Other versions
KR0155798B1 (ko
Inventor
김홍국
하남규
Original Assignee
김광호
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김광호, 삼성전자 주식회사 filed Critical 김광호
Priority to KR1019950001575A priority Critical patent/KR0155798B1/ko
Publication of KR960030558A publication Critical patent/KR960030558A/ko
Application granted granted Critical
Publication of KR0155798B1 publication Critical patent/KR0155798B1/ko
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/125Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 음성 부호화 및 복호화방법을 공개한다. 그 방법은 송신측에서 음성신호를 부호화하여 전송하고, 수신측에서 부호화된 음성신호를 복호화하여 원래의 음성신호로 출력하는 시스템에서, 음성신호의 포락을 구하고, 부프레임별 피치를 추출하여 현재 프레임의 실제 피치값을 추정하고, 유성 또는 무성을 판단하고, 선형 예측부호화계수를 변환후 양자화하여 전송하는 음성부호화단계와, 양자화된 신호를 수신하여 역양자화하여 유·무성정보를 복원하고, 복원된 정보를 이용하여 다중 시·공간 스펙트럼을 만들어 유·무성을 합성하여 원래의 음성신호로 복호화하여 출력하는 음성복호화단계를 구비하는 것을 특징으로 하고, 피치 적응부를 독립적으로 음성의 피치 추출을 위해 응용할 수 있고, 음성합성 시스템(Text-to-Speech)의 개발에 기초로 활용할 수 있으며, 상용 디지탈 신호처리기(DSP:Digital Signal Processor 이하 DSP)의 구현 또는 DSP 중심을 이용한 칩화를 통해 통신망, 음성저장 시스템에 상용할 수 있는 효과가 있다.

Description

음성신호 부호화 및 복호화 방법
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명에 의한 음성부호화방법을 설명하기 위한 플로우차트이다. 제2도는 본 발명에 의한 음성복호화방법을 설명하기 위한 플로우차트이다.

Claims (15)

  1. 송신측에서 음성신호를 부호화하여 전송하고, 수신측에서 부호화된 상기 음성신호를 복호화하여 원래의 상기 음성신호로 출력하는 음성신호 부호화 및 복호화방법에서, 상기 음성신호의 포락을 구하고, 부프레임별 피치를 추출하여 현재 프레임의 실제 피치값을 추정하고, 유성음 및 무성음을 판단하고, 선형예측부호화계수를 선형스펙트럼 쌍계수로 변환후 양자화하여 전송하는 음성부호화단계; 상기 양자화된 신호를 수신후 역양자화하여 상기 유성음 및 무성음에 대한 정보를 복원하고, 상기 복원된 정보를 이용하여 다중시·공간 스펙트럼을 만들어 상기 유성음 또는 무성음 대역별로 합성된 각각의 음성을 합쳐 원래의 상기 음성신호로 복호화하여 출력하는 음성복호화단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
  2. 제1항에 있어서, 상기 음성부호화단계는 상기 음성신호를 입력하여 디지탈신호로 변환하는 A/D 변환단계; 성도특성을 나타내는 정보를 추출하는 정보추출단계; 상기 음성신호의 피치의 주기를 추정하는 피치주기추정단계; 상기 음성신호가 유성음인가 또는 무성음인가를 판별하는 판별단계; 피치, 이득, 유·무성계수 및 선형스펙트럼 쌍계수들을 이용하여 상기 음성신호를 양자화하여 전송하는 양자화단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
  3. 제2항에 있어서, 상기 정보추출단계는 자기상관 계수방법을 이용하여 상기 성도특성정보를 선형예측부호화계수와 평균 전력으로 표현하고, 음성의 상호 관련성이 제거된 잔차신호를 만드는 단기예측단계; 상기 선형예측부호화계수를 상기 선형 스펙트럼 쌍계수로 변환하여 상기 이득 및 선형스펙트럼 쌍계수를 만드는 계수변환단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
  4. 제2항 또는 제3항에 있어서, 상기 피치주기추정단계는 적응코드북과 상기 잔차신호의 차가 최소로 되는 지연값인 폐쇄회로피치를 구하는 폐쇄피치검출단계; 상기 잔차신호의 자기상관계수를 이용하여 개방회로피치를 구하는 개방피치검출단계; 상기 개방회로피치 및 폐쇄회로피치를 이용하여 현재의 프레임을 가장 잘 표현하는 상기 피치계수를 예측 후 선택하는 피치적응단계를 구비하는 것을 특징으로 하는 음성부호화 및 복호화방법.
  5. 제4항에 있어서, 상기 피치적응단계는 선형회귀법을 이용하여 상기 피치를 예측하는 피치예측단계; 상기 예측된 피치를 사용하여 상기 폐쇄회로피치 중에서 현재의 프레임을 잘 표현하는 피치를 선택하는 피치선택단계를 구비하는 것을 특징으로 하는 음성부호화 및 복호화방법.
  6. 제1항에 있어서, 상기 음성복호화단계는 전송받은 상기 이득, 선형스펙트럼, 피치 및 유·무성계수를 역양자화하는 역양자화단계; 부프레임별로 음성을 생성하는 다중시간의 개념과 각 주파수 대역별로 음성을 생성하는 다중 스펙트럼의 개념을 혼용하여 상기 역양자화된 계수들로 상기 다중 시·공간 스펙트럼을 생성하는 다중 시·공간 스펙트럼생성단계; 원래의 상기 음성신호를 생성하기 위해 상기 유성음 합성신호와 무성음 합성신호를 합하는 신호생성단계; 합성된 신호를 아날로그로 변환하는 D/A 변환단계를 구비하는 것을 특징으로 하는 음성부호화 및 복호화방법.
  7. 제6항에 있어서, 상기 다중 시·공간 스펙트럼생성단계는 이전 프레임의 상기 선형 스펙트럼쌍계수와 현재 프레임의 선형 스펙트럼쌍계수를 선형 보간하여 각 부프레임의 상기 선형 스펙트럼쌍계수를 구하는 선형 스펙트럼쌍계수단계; 각 부프레임에 대하여 유성음 및 무성음 스펙트럼 포락을 계산하는 유·무성스펙트럼포락단계를 구비하는 것을 특징으로 하는 음성 부호화 및 복호화방법.
  8. 송신측에서 음성신호를 부호화하여 전송하고, 수신측에서 부호화된 상기 음성신호를 복호화하여 원래의 상기 음성신호로 출력하는 음성신호 부호화 및 복호화방법에 있어서, 상기 음성신호 부호화방법은 상기 음성신호의 포락을 구하고, 부프레임별 피치를 추출하여 현재 프레임의 실제 피치값을 추정하고, 유성음 및 무성음을 판단하고, 선형예측부호화계수를 선형스펙크럼 쌍계수로 변환후 양자화하여 전송하는 음성부호화단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
  9. 제8항에 있어서, 상기 음성부호화단계는 상기 음성신호를 입력하여 디지탈신호로 변환하는 A/D 변환단계; 성도특성을 나타내는 정보를 추출하는 정보추출단계; 상기 음성신호 피치의 주기를 추정하는 피치주기추정 단계; 상기 음성신호가 유성음인가 또는 무성음인가를 판별하는 판별단계; 피치, 이득, 유·무성계수 및 선형 스펙트럼 쌍계수들을 이용하여 상기 음성신호를 양자화하여 전송하는 양자화단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
  10. 제9항에 있어서, 상기 정보추출단계는 자기상관 계수방법을 이용하여 상기 성도특성정보를 선형예측부호화계수와 평균 전력으로 표현하고, 음성의 상호 관련성이 제거된 잔차신호를 만드는 단기예측단계; 상기 선형예측부호화계수를 상기 선형 스펙트럼 쌍계수로 변환하여 상기 이득 및 선형스펙트럼 쌍계수를 만드는 계수 변환단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
  11. 제9항 또는 제10항에 있어서, 상기 피치주기추정단계는 적응코드북과 상기 전차신호의 차가 최소로 되는 지연값인 폐쇄회로피치를 구하는 폐쇄피치검출단계; 상기 잔차신호의 자기상관계수를 이용하여 개방회로피치를 구하는 개방피치검출단계; 상기 개방회로피치 및 폐쇄회로피치를 이용하여 현재의 프레임을 가장 잘 표현하는 상기 피치계수를 예측 후 선택하는 피치적응단계를 구비하는 것을 특징으로 하는 음성부호화 및 복호화방법.
  12. 제11항에 있어서, 상기 피치적응단계는 선형회귀법을 이용하여 상기 피치를 예측하는 피치예측단계; 상기 예측된 피치를 사용하여 상기 폐쇄회로피치 중에서 현재의 프레임을 잘 표현하는 피치를 선택하는 피치선택단계를 구비하는 것을 특징으로 하는 음성부호화 및 복호화방법.
  13. 송신측에서 음성신호를 부호화하여 전송하고, 수신측에서 부호화된 상기 음성신호를 복호화하여 원래의 상기 음성신호로 출력하는 음성신호 부호화 및 복호화방법에서, 상기 음성신호의 복포화방법은 부호화단계에서 양자화된 신호를 수신후 역양자화하여 상기 음성신호의 유성음 및 무성음에 대한 정보를 복원하고, 상기 복원된 정보를 이용하여 다중 시·공간 스펙트럼을 만들어 상기 유성음 또는 무성음 대역별로 합성된 각각의 음성을 합쳐 원래의 상기 음성신호로 복호화하여 출력하는 음성복호화단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
  14. 제13항에 있어서, 상기 음성복호화단계는 전송받은 양자화된 상기 이득, 선형스펙트럼, 피치 및 유·무성계수를 역양자화하는 역양자화단계; 부프레임별로 음성을 생성하는 다중시간의 개념과 각 주파수 대역별로 음성을 생성하는 다중 스펙트럼의 개념을 혼용하여 상기 역양자화된 계수들로 상기 다중 시·공간 스펙트럼을 생성하는 다중 시·공간 스펙트럼생성단계; 원래의 상기 음성신호를 생성하기 위해 상기 유성음 합성신호와 무성음 합성신호를 합하는 신호생성단계; 합성된 신호를 아날로그로 변환하는 D/A 변환단계를 구비하는 것을 특징으로 하는 음성부호화 및 복호화방법.
  15. 제14항에 있어서, 상기 다중 시·공간 스펙트럼생성단계는 이전 프레임의 선형 스펙트럼쌍계수와 현재 프레임의 상기 선형 스펙트럼쌍계수를 선형 보간하여 각 부프레임의 상기 선형스펙트럼쌍계수를 구하는 선형 스펙트럼쌍계수단계; 각 부프레임에 대하여 유성음 및 무성음 스펙트럼 포락을 계산하는 유·무성스펙트럼포락단계를 구비하는 것을 특징으로 하는 음성부호화 및 복호화방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019950001575A 1995-01-27 1995-01-27 음성신호 부호화 및 복호화 방법 Expired - Fee Related KR0155798B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019950001575A KR0155798B1 (ko) 1995-01-27 1995-01-27 음성신호 부호화 및 복호화 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019950001575A KR0155798B1 (ko) 1995-01-27 1995-01-27 음성신호 부호화 및 복호화 방법

Publications (2)

Publication Number Publication Date
KR960030558A true KR960030558A (ko) 1996-08-17
KR0155798B1 KR0155798B1 (ko) 1998-12-15

Family

ID=19407411

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950001575A Expired - Fee Related KR0155798B1 (ko) 1995-01-27 1995-01-27 음성신호 부호화 및 복호화 방법

Country Status (1)

Country Link
KR (1) KR0155798B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100474826B1 (ko) * 1998-05-09 2005-05-16 삼성전자주식회사 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치
KR100526829B1 (ko) * 1996-09-20 2006-01-27 소니 가부시끼 가이샤 음성부호화방법및장치음성복호화방법및장치
KR101248353B1 (ko) * 2005-06-09 2013-04-02 가부시키가이샤 에이.지.아이 피치 주파수를 검출하는 음성 해석 장치, 음성 해석 방법,및 음성 해석 프로그램

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002208922A (ja) * 2001-01-12 2002-07-26 Ntt Docomo Inc 暗号化装置および復号装置ならびに認証情報付与装置、暗号化方法、復号方法、認証情報付与方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100526829B1 (ko) * 1996-09-20 2006-01-27 소니 가부시끼 가이샤 음성부호화방법및장치음성복호화방법및장치
KR100474826B1 (ko) * 1998-05-09 2005-05-16 삼성전자주식회사 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치
KR101248353B1 (ko) * 2005-06-09 2013-04-02 가부시키가이샤 에이.지.아이 피치 주파수를 검출하는 음성 해석 장치, 음성 해석 방법,및 음성 해석 프로그램

Also Published As

Publication number Publication date
KR0155798B1 (ko) 1998-12-15

Similar Documents

Publication Publication Date Title
KR101000345B1 (ko) 음성 부호화 장치, 음성 복호화 장치 및 그 방법
US7315815B1 (en) LPC-harmonic vocoder with superframe structure
KR100873836B1 (ko) Celp 트랜스코딩
KR100804461B1 (ko) 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치
EP0920693B1 (en) Method and apparatus for improving the voice quality of tandemed vocoders
KR100574031B1 (ko) 음성합성방법및장치그리고음성대역확장방법및장치
JP3557662B2 (ja) 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
KR101216098B1 (ko) 신호 처리 방법 및 장치
JP2903533B2 (ja) 音声符号化方式
JP3144009B2 (ja) 音声符号復号化装置
EP1597721A2 (en) 600 bps mixed excitation linear prediction transcoding
US7684978B2 (en) Apparatus and method for transcoding between CELP type codecs having different bandwidths
WO2001065542A1 (en) Voice encoding/decoding device and method therefor
KR960030558A (ko) 음성신호 부호화 및 복호화 방법
JP3092653B2 (ja) 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
JP3050978B2 (ja) 音声符号化方法
JP2797348B2 (ja) 音声符号化・復号化装置
JP2004301954A (ja) 音響信号の階層符号化方法および階層復号化方法
JPS6134697B2 (ko)
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
KR0156983B1 (ko) 음성 부호기
JPH05276049A (ja) 音声符号化方法及びその装置
JPH02170199A (ja) 音声符号化復号化方式

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

R17-X000 Change to representative recorded

St.27 status event code: A-3-3-R10-R17-oth-X000

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

R17-X000 Change to representative recorded

St.27 status event code: A-3-3-R10-R17-oth-X000

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

St.27 status event code: A-2-2-U10-U11-oth-PR1002

Fee payment year number: 1

PG1601 Publication of registration

St.27 status event code: A-4-4-Q10-Q13-nap-PG1601

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 4

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 5

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 6

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 7

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 8

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 9

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 10

FPAY Annual fee payment

Payment date: 20080627

Year of fee payment: 11

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 11

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

St.27 status event code: A-4-4-U10-U13-oth-PC1903

Not in force date: 20090717

Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

PC1903 Unpaid annual fee

St.27 status event code: N-4-6-H10-H13-oth-PC1903

Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

Not in force date: 20090717

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000