KR101592425B1 - 음성 전처리 장치, 음성 인식 장치 및 그 방법 - Google Patents
음성 전처리 장치, 음성 인식 장치 및 그 방법 Download PDFInfo
- Publication number
- KR101592425B1 KR101592425B1 KR1020140127928A KR20140127928A KR101592425B1 KR 101592425 B1 KR101592425 B1 KR 101592425B1 KR 1020140127928 A KR1020140127928 A KR 1020140127928A KR 20140127928 A KR20140127928 A KR 20140127928A KR 101592425 B1 KR101592425 B1 KR 101592425B1
- Authority
- KR
- South Korea
- Prior art keywords
- echo
- echo parameter
- parameter
- input signal
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
Abstract
음성 전처리 장치는, 제1반향파라미터를 획득하는 반향파라미터 획득부, 그리고 입력신호에 잡음 제거 알고리즘을 적용함으로써, 상기 입력신호로부터 잡음성분을 제거하여 출력하며, 상기 제1반향파라미터가 기 설정된 제2반향파라미터와 다른 경우, 상기 제1반향파라미터를 토대로 상기 잡음 제거 알고리즘의 파라미터를 갱신하는 전처리부를 포함할 수 있다.
Description
도 2는 본 발명의 일 실시 예에 따른 음성 전처리부를 개략적으로 도시한 구조도다.
도 3은 본 발명의 일 실시 예에 따른 음성 인식 장치에서의 음성 인식 방법을 도시한 흐름도이다.
도 4는 본 발명의 일 실시 예에 따른 음성 인식 장치에서의 전처리 방법을 도시한 흐름도이다.
Claims (26)
- 좌석 센서를 통해 동승자의 동승위치를 감지하고, 기 설정된 복수의 후보 반향파라미터 중 상기 동승자의 동승위치에 대응하는 후보 반향파라미터를 이용하여 제1반향파라미터를 획득하는 반향파라미터 획득부, 그리고
상기 제1반향파라미터가 기 설정된 제2반향파라미터와 다른 경우 상기 제1반향파라미터를 토대로 잡음 제거 알고리즘의 파라미터를 갱신하고, 상기 잡음 제거 알고리즘을 이용하여 입력신호로부터 잡음성분을 제거하여 출력하는 전처리부를 포함하는 음성 전처리 장치.
- 삭제
- 제1항에 있어서,
상기 반향파라미터 획득부는,
상기 동승자의 동승위치에 대응하는 후보 반향파라미터를 상기 제1반향파라미터로 획득하는 음성 전처리 장치.
- 제1항에 있어서,
상기 반향파라미터 획득부는,
상기 복수의 후보 반향파라미터 중 상기 동승자의 동승위치에 대응하는 후보 반향파라미터를 제3반향파라미터로 획득하고, 상기 입력신호의 음의 방향 분산을 토대로 제4반향파라미터를 획득하며, 상기 제3반향파라미터와 상기 제4반향파라미터의 평균값을 상기 제1반향파라미터로 획득하는 음성 전처리 장치.
- 제1항에 있어서,
상기 전처리부는,
윈도우 함수를 이용하여 상기 입력신호를 프레임 단위로 분할하는 프레임 분할부,
프레임 단위로 분할된 상기 입력신호를 주파수 영역의 신호로 변환하는 주파수 변환부, 그리고
주파수 영역으로 변환된 상기 입력신호로부터 잡음성분을 제거하는 잡음 제거부를 포함하는 음성 전처리 장치.
- 제5항에 있어서,
상기 파라미터는 상기 윈도우 함수의 윈도우 사이즈를 포함하는 음성 전처리 장치.
- 제5항에 있어서,
상기 파라미터는 이득보정계수를 포함하며,
상기 잡음 제거부는, 상기 이득보정계수를 토대로 상기 입력신호로부터 잡음성분을 제거하는 정도를 조절하는 음성 전처리 장치.
- 제5항에 있어서,
상기 파라미터는 상기 잡음 제거 알고리즘의 반복횟수를 포함하는 음성 전처리 장치.
- 좌석 센서를 통해 동승자의 동승위치를 감지하고, 기 설정된 복수의 후보 반향파라미터 중 상기 동승자의 동승위치에 대응하는 후보 반향파라미터를 이용하여 제1반향파라미터를 획득하는 반향파라미터 획득부,
상기 제1반향파라미터가 기 설정된 제2반향파라미터와 다른 경우 상기 제1반향파라미터를 토대로 잡음 제거 알고리즘의 파라미터를 갱신하고, 상기 잡음 제거 알고리즘을 이용하여 입력신호로부터 잡음성분을 제거하여 출력하는 전처리부,
상기 전처리부에서 출력되는 신호로부터 음성신호의 특징패턴을 검출하는 특징패턴 검출부, 그리고
상기 특징패턴을 토대로 음성인식결과를 출력하는 음성 인식부를 포함하는 음성 인식 장치.
- 제9항에 있어서,
상기 전처리부는,
윈도우 함수를 이용하여 상기 입력신호를 프레임 단위로 분할하는 프레임 분할부,
프레임 단위로 분할된 상기 입력신호를 주파수 영역의 신호로 변환하는 주파수 변환부, 그리고
주파수 영역으로 변환된 상기 입력신호로부터 잡음성분을 제거하는 잡음 제거부를 포함하는 음성 인식 장치.
- 제10항에 있어서,
상기 파라미터는 상기 윈도우 함수의 윈도우 사이즈를 포함하는 음성 인식 장치.
- 제10항에 있어서,
상기 파라미터는 이득보정계수를 포함하며,
상기 잡음 제거부는, 상기 이득보정계수를 토대로 상기 입력신호로부터 잡음성분을 제거하는 정도를 조절하는 음성 인식 장치.
- 제10항에 있어서,
상기 파라미터는 상기 잡음 제거 알고리즘의 반복횟수를 포함하는 음성 인식 장치.
- 삭제
- 제9항에 있어서,
상기 반향파라미터 획득부는,
상기 복수의 후보 반향파라미터 중 상기 동승자의 동승위치에 대응하는 후보 반향파라미터를 상기 제1반향파라미터로 획득하는 음성 인식 장치.
- 제9항에 있어서,
상기 반향파라미터 획득부는,
상기 복수의 후보 반향파라미터 중 상기 동승자의 동승위치에 대응하는 후보 반향파라미터를 제3반향파라미터로 획득하고, 상기 입력신호의 음의 방향 분산을 토대로 제4반향파라미터를 획득하며, 상기 제3반향파라미터와 상기 제4반향파라미터의 평균값을 상기 제1반향파라미터로 획득하는 음성 인식 장치.
- 좌석 센서를 통해 동승자의 동승위치를 감지하는 단계,
서로 다른 동승위치에 대응하는 복수의 후보 반향파라미터 중 상기 동승자의 동승위치에 대응하는 후보 반향파라미터를 이용하여 제1반향파라미터를 획득하는 단계,
상기 제1반향파라미터가 기 설정된 제2반향파라미터와 다른 경우, 상기 제1반향파라미터를 토대로 잡음 제거 알고리즘의 파라미터를 갱신하는 단계,
상기 잡음 제거 알고리즘을 이용하여 입력신호로부터 잡음성분을 제거하는 전처리 단계,
상기 전처리 단계를 통해 잡음성분이 제거된 상기 입력신호로부터 음성신호의 특징패턴을 검출하는 단계, 그리고
상기 특징패턴을 토대로 음성인식결과를 출력하는 단계
를 포함하는 음성 인식 장치의 음성 인식 방법.
- 제17항에 있어서,
상기 전처리 단계는,
윈도우 함수를 이용하여 상기 입력신호를 프레임 단위로 분할하는 단계,
프레임 단위로 분할된 상기 입력신호를 주파수 영역의 신호로 변환하는 단계, 그리고
주파수 영역으로 변환된 상기 입력신호로부터 잡음성분을 제거하는 단계를 포함하는 음성 인식 장치의 음성 인식 방법.
- 제18항에 있어서,
상기 갱신하는 단계는,
상기 제1반향파라미터에 따라서 상기 윈도우 함수의 윈도우 사이즈를 가변하는 단계를 포함하는 음성 인식 장치의 음성 인식 방법.
- 제18항에 있어서,
상기 갱신하는 단계는,
상기 제1반향파라미터에 따라서 이득보정계수를 갱신하는 단계를 포함하며,
상기 잡음성분을 제거하는 단계는,
상기 이득보정계수를 토대로 상기 입력신호로부터 잡음성분을 제거하는 정도를 조절하는 단계를 포함하는 음성 인식 장치의 음성 인식 방법.
- 제18항에 있어서,
상기 갱신하는 단계는,
상기 제1반향파라미터에 따라서 상기 잡음 제거 알고리즘의 반복횟수를 갱신하는 단계를 포함하는 음성 인식 장치의 음성 인식 방법.
- 삭제
- 제18항에 있어서,
상기 획득하는 단계는,
상기 동승자의 동승위치에 대응하는 후보 반향파라미터를 상기 제1반향파라미터로 획득하는 단계를 포함하는 음성 인식 장치의 음성 인식 방법.
- 제18항에 있어서,
상기 획득하는 단계는,
상기 동승자의 동승위치에 대응하는 후보 반향파라미터를 제3반향파라미터로 획득하는 단계,
상기 입력신호의 음의 방향 분산을 토대로 제4반향파라미터를 획득하는 단계, 그리고
상기 제3 및 제4반향파라미터의 평균값을 상기 제1반향파라미터로 획득하는 단계를 포함하는 음성 인식 장치의 음성 인식 방법.
- 삭제
- 제17항 내지 제21항, 제23항 및 제24항 중 어느 한 항의 방법을 실행시키기 위해 기록매체에 저장된 프로그램.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020140127928A KR101592425B1 (ko) | 2014-09-24 | 2014-09-24 | 음성 전처리 장치, 음성 인식 장치 및 그 방법 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020140127928A KR101592425B1 (ko) | 2014-09-24 | 2014-09-24 | 음성 전처리 장치, 음성 인식 장치 및 그 방법 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| KR101592425B1 true KR101592425B1 (ko) | 2016-02-05 |
Family
ID=55353761
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020140127928A Expired - Fee Related KR101592425B1 (ko) | 2014-09-24 | 2014-09-24 | 음성 전처리 장치, 음성 인식 장치 및 그 방법 |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR101592425B1 (ko) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20190106902A (ko) | 2019-08-29 | 2019-09-18 | 엘지전자 주식회사 | 사운드 분석 방법 및 장치 |
| CN114242106A (zh) * | 2020-09-09 | 2022-03-25 | 中车株洲电力机车研究所有限公司 | 一种语音处理方法及其装置 |
-
2014
- 2014-09-24 KR KR1020140127928A patent/KR101592425B1/ko not_active Expired - Fee Related
Non-Patent Citations (1)
| Title |
|---|
| Alexander Krueger et al., ‘Model-based feature enhancement for reverberant speech recognition’, IEEE Trans. on Audio, Speech, and Language Processing, Vol.18, No.7, pp.1692~1707, September 2010.* |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20190106902A (ko) | 2019-08-29 | 2019-09-18 | 엘지전자 주식회사 | 사운드 분석 방법 및 장치 |
| US11437028B2 (en) | 2019-08-29 | 2022-09-06 | Lg Electronics Inc. | Method and apparatus for sound analysis |
| CN114242106A (zh) * | 2020-09-09 | 2022-03-25 | 中车株洲电力机车研究所有限公司 | 一种语音处理方法及其装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11056130B2 (en) | Speech enhancement method and apparatus, device and storage medium | |
| KR101610161B1 (ko) | 음성인식 시스템 및 그 방법 | |
| KR102487160B1 (ko) | 정량적 신호 대 노이즈비 분석 및 적응형 위너 필터링에 기초한 오디오 신호 품질 향상 방법 | |
| US8073689B2 (en) | Repetitive transient noise removal | |
| US9761245B2 (en) | Externally estimated SNR based modifiers for internal MMSE calculations | |
| US9552828B2 (en) | Audio signal processing device | |
| US20110238417A1 (en) | Speech detection apparatus | |
| US20130070939A1 (en) | Signal processing apparatus | |
| EP3276621B1 (en) | Noise suppression device and noise suppressing method | |
| CN109643552A (zh) | 用于可变噪声状况中语音增强的鲁棒噪声估计 | |
| US8326621B2 (en) | Repetitive transient noise removal | |
| US20140244245A1 (en) | Method for soundproofing an audio signal by an algorithm with a variable spectral gain and a dynamically modulatable hardness | |
| US9773509B2 (en) | Speech probability presence modifier improving log-MMSE based noise suppression performance | |
| US20060031067A1 (en) | Sound input device | |
| CN106558315A (zh) | 异质麦克风自动增益校准方法及系统 | |
| US9633673B2 (en) | Accurate forward SNR estimation based on MMSE speech probability presence | |
| EP1995722B1 (en) | Method for processing an acoustic input signal to provide an output signal with reduced noise | |
| JP2000330597A (ja) | 雑音抑圧装置 | |
| KR101592425B1 (ko) | 음성 전처리 장치, 음성 인식 장치 및 그 방법 | |
| KR101295727B1 (ko) | 적응적 잡음추정 장치 및 방법 | |
| JP5443547B2 (ja) | 信号処理装置 | |
| JP2008070878A (ja) | 音声信号前処理装置、音声信号処理装置、音声信号前処理方法、及び音声信号前処理用のプログラム | |
| JP2006313997A (ja) | 騒音量推定装置 | |
| KR101096091B1 (ko) | 음성 분리 장치 및 이를 이용한 단일 채널 음성 분리 방법 | |
| KR20160116440A (ko) | 음성인식 시스템의 신호대잡음비 추정 장치 및 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| E13-X000 | Pre-grant limitation requested |
St.27 status event code: A-2-3-E10-E13-lim-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| FPAY | Annual fee payment |
Payment date: 20190130 Year of fee payment: 4 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20200202 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20200202 |

