KR20170073113A - 음성의 톤, 템포 정보를 이용한 감정인식 방법 및 그 장치 - Google Patents
음성의 톤, 템포 정보를 이용한 감정인식 방법 및 그 장치 Download PDFInfo
- Publication number
- KR20170073113A KR20170073113A KR1020150181619A KR20150181619A KR20170073113A KR 20170073113 A KR20170073113 A KR 20170073113A KR 1020150181619 A KR1020150181619 A KR 1020150181619A KR 20150181619 A KR20150181619 A KR 20150181619A KR 20170073113 A KR20170073113 A KR 20170073113A
- Authority
- KR
- South Korea
- Prior art keywords
- value
- emotion
- voice
- interval
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Hospice & Palliative Care (AREA)
- Psychiatry (AREA)
- General Health & Medical Sciences (AREA)
- Child & Adolescent Psychology (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
도 2는 본 발명의 일실시예에 따른 음성구간 추출방법의 흐름도.
도 3은 본 발명의 일실시예에 따라 추출된 음성구간을 도시한 도면.
도 4는 본 발명의 다른 실시예에 따른 감정인식 장치의 구조도.
도 5은 감정에 따른 음성신호의 톤 특징을 도시한 도면.
도 6은 감정에 따른 음성신호의 템포 특징을 도시한 도면.
도 7은 본 발명의 다른 실시예에 따른 감정인식 장치의 구조도.
도 8은 본 발명의 또 다른 실시예에 따른 감정인식 장치의 구조도.
Claims (10)
- 사용자의 음성신호를 입력받는 단계;
상기 음성신호를 절대적분치를 이용하여 음성구간과 비 음성구간으로 구분하여 음성구간을 검출하는 단계;
상기 검출된 음성구간으로부터 톤 정보와 템포 정보를 추출하는 단계; 및
둘 이상의 신경회로망에서 상기 톤 정보와 템포 정보를 이용하여 감정 정보를 추출하되, 상기 신경회로망 중 제1 신경회로망은 보통 감정과 슬픔 감정을 구분하고, 제2 신경회로망은 기쁨 감정과 화남 감정을 구분하여 감정정보를 추출하는 단계;
를 포함하는 감정인식 방법.
- 제1항에 있어서, 상기 음성구간을 검출하는 단계는,
상기 음성신호의 절대적분치의 최대값과 최소값을 산출하고,
상기 최소값이 상기 최대값의 기설정된 일정비율을 초과하면 임계치를 최대값과 제1 비율을 곱한 값으로 하고, 상기 기설정된 일정비율 이하이면 임계치를 최소값에 최대값과 최소값의 차이에 제2 비율을 곱한 값을 더한 값으로 결정하며,
상기 절대적분치가 상기 임계치를 초과하면 음성구간으로 판단하고, 상기 절대적분치가 상기 임계치 이하이면 비 음성구간으로 판단하는 것
인 감정인식 방법.
- 제1항에 있어서,
상기 톤 정보는 상기 검출한 음성구간의 기본주파수의 평균값과 분산값을 포함하고,
상기 템포 정보는 상기 검출한 음성구간의 빠르기의 평균값과 분산값을 포함하는 것
인 감정인식 방법.
- 제3항에 있어서,
상기 감정정보를 추출하는 단계는, 상기 기본주파수의 평균값과 분산값 및 상기 빠르기의 평균값과 분산값을, 기설정된 각 감정의 기본주파수의 평균값과 분산값 및 빠르기의 평균값과 분산값과 비교하여 기설정된 임계치 이하인 경우 해당 감정으로 판단하는 것
인 감정인식 방법.
- 제1항에 있어서, 상기 톤 정보를 추출하는 단계는
자기상관함수, AMDF(Average Magnitude Difference Function) 또는 FFT(Fast Fourier Transform)를 이용하여 기본주파수를 추출하는 것
인 감정인식 방법.
- 사용자의 음성신호를 입력받는 입력부;
상기 음성신호를 절대적분치를 이용하여 음성구간과 비 음성구간으로 구분하여 음성구간을 검출하는 음성구간 검출부;
상기 검출된 음성구간으로부터 톤 정보를 추출하는 톤 정보 추출부;
상기 추출된 음성구간으로부터 템포 정보를 추출하는 템포 정보 추출부; 및
둘 이상의 신경회로망을 포함하여 상기 톤 정보와 템포 정보를 이용하여 감정 정보를 추출하되, 상기 신경회로망 중 제1 신경회로망은 보통 감정과 슬픔 감정을 구분하고, 제2 신경회로망은 기쁨 감정과 화남 감정을 구분하여 감정정보를 추출하는 감정인식부;
를 포함하는 감정인식 장치.
- 제6항에 있어서, 상기 음성구간 검출부는
상기 음성신호의 절대적분치의 최대값과 최소값을 산출하고,
상기 최소값이 상기 최대값의 기설정된 일정비율을 초과하면 임계치를 최대값과 제1 비율을 곱한 값으로 하고, 상기 기설정된 일정비율 이하이면 임계치를 최소값에 최대값과 최소값의 차이에 제2 비율을 곱한 값을 더한 값으로 결정하며,
상기 절대적분치가 상기 임계치를 초과하면 음성구간으로 판단하고, 상기 절대적분치가 상기 임계치 이하이면 비 음성구간으로 판단하는 것
인 감정인식 장치.
- 제6항에 있어서,
상기 톤 정보 추출부는 상기 검출한 음성구간의 톤의 평균값과 분산값을 포함하는 톤 정보를 추출하고,
상기 템포 정보 추출부는 상기 검출한 음성구간의 템포의 평균값과 분산값을 포함하는 템포 정보를 추출하는 것
인 감정인식 장치.
- 제8항에 있어서, 상기 감정인식부는
상기 톤의 평균값과 분산값 및 상기 템포의 평균값과 분산값을, 기설정된 각 감정의 톤의 평균값과 분산값 및 템포의 평균값과 분산값과 비교하여 기설정된 임계치 이하인 경우 해당 감정으로 판단하는 것
인 감정인식 장치.
- 제6항에 있어서, 상기 톤 정보 추출부는
자기상관함수, AMDF(Average Magnitude Difference Function) 또는 FFT(Fast Fourier Transform)를 이용하여 기본주파수를 추출하는 것
인 감정인식 장치.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/KR2015/013968 WO2017104875A1 (ko) | 2015-12-18 | 2015-12-18 | 음성의 톤, 템포 정보를 이용한 감정인식 방법 및 그 장치 |
| KR1020150181619A KR20170073113A (ko) | 2015-12-18 | 2015-12-18 | 음성의 톤, 템포 정보를 이용한 감정인식 방법 및 그 장치 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020150181619A KR20170073113A (ko) | 2015-12-18 | 2015-12-18 | 음성의 톤, 템포 정보를 이용한 감정인식 방법 및 그 장치 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| KR20170073113A true KR20170073113A (ko) | 2017-06-28 |
Family
ID=59056830
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020150181619A Ceased KR20170073113A (ko) | 2015-12-18 | 2015-12-18 | 음성의 톤, 템포 정보를 이용한 감정인식 방법 및 그 장치 |
Country Status (2)
| Country | Link |
|---|---|
| KR (1) | KR20170073113A (ko) |
| WO (1) | WO2017104875A1 (ko) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108806667B (zh) * | 2018-05-29 | 2020-04-17 | 重庆大学 | 基于神经网络的语音与情绪的同步识别方法 |
| CN109147826B (zh) * | 2018-08-22 | 2022-12-27 | 平安科技(深圳)有限公司 | 音乐情感识别方法、装置、计算机设备及计算机存储介质 |
| US10810382B2 (en) * | 2018-10-09 | 2020-10-20 | Disney Enterprises, Inc. | Automated conversion of vocabulary and narrative tone |
| CN109243491B (zh) * | 2018-10-11 | 2023-06-02 | 平安科技(深圳)有限公司 | 在频谱上对语音进行情绪识别的方法、系统及存储介质 |
| CN111627462B (zh) * | 2020-05-22 | 2023-12-19 | 上海师范大学 | 一种基于语义分析的情绪识别方法和设备 |
| CN113327630B (zh) * | 2021-05-27 | 2023-05-09 | 平安科技(深圳)有限公司 | 语音情绪识别方法、装置、设备及存储介质 |
| US12417762B2 (en) | 2022-04-13 | 2025-09-16 | International Business Machines Corporation | Speech-to-text voice visualization |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI221574B (en) * | 2000-09-13 | 2004-10-01 | Agi Inc | Sentiment sensing method, perception generation method and device thereof and software |
| US8788270B2 (en) * | 2009-06-16 | 2014-07-22 | University Of Florida Research Foundation, Inc. | Apparatus and method for determining an emotion state of a speaker |
| US9020822B2 (en) * | 2012-10-19 | 2015-04-28 | Sony Computer Entertainment Inc. | Emotion recognition using auditory attention cues extracted from users voice |
-
2015
- 2015-12-18 KR KR1020150181619A patent/KR20170073113A/ko not_active Ceased
- 2015-12-18 WO PCT/KR2015/013968 patent/WO2017104875A1/ko not_active Ceased
Also Published As
| Publication number | Publication date |
|---|---|
| WO2017104875A1 (ko) | 2017-06-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR20170073113A (ko) | 음성의 톤, 템포 정보를 이용한 감정인식 방법 및 그 장치 | |
| KR100834679B1 (ko) | 음성 인식 오류 통보 장치 및 방법 | |
| KR101616112B1 (ko) | 음성 특징 벡터를 이용한 화자 분리 시스템 및 방법 | |
| CN112102850A (zh) | 情绪识别的处理方法、装置、介质及电子设备 | |
| WO2011046474A2 (ru) | Способ идентификации говорящего по фонограммам произвольной устной речи на основе формантного выравнивания | |
| KR101943381B1 (ko) | 심층 신경망을 이용한 음성 끝점 검출 방법 및 이를 위한 끝점 검출 장치 | |
| JP2018180334A (ja) | 感情認識装置、方法およびプログラム | |
| CN114822502A (zh) | 一种报警方法、报警装置、计算机设备、以及存储介质 | |
| KR101893789B1 (ko) | 정규화를 이용한 음성 구간 판단 방법 및 이를 위한 음성 구간 판단 장치 | |
| JP4911034B2 (ja) | 音声判別システム、音声判別方法及び音声判別用プログラム | |
| Hasija et al. | Recognition of children Punjabi speech using tonal non-tonal classifier | |
| JP2015055653A (ja) | 音声認識装置及び方法、並びに、電子機器 | |
| KR102098956B1 (ko) | 음성인식장치 및 음성인식방법 | |
| KR101992955B1 (ko) | 정규화를 이용한 음성 구간 판단 방법 및 이를 위한 음성 구간 판단 장치 | |
| KR100391123B1 (ko) | 피치 단위 데이터 분석을 이용한 음성인식 방법 및 시스템 | |
| Mishra et al. | Speaker identification, differentiation and verification using deep learning for human machine interface | |
| JP6430318B2 (ja) | 不正音声入力判定装置、方法及びプログラム | |
| Lertwongkhanakool et al. | An automatic real-time synchronization of live speech with its transcription approach | |
| WO2007049879A1 (en) | Apparatus for vocal-cord signal recognition and method thereof | |
| Raj et al. | Gender based affection recognition of speech signals using spectral & prosodic feature extraction | |
| JP6827602B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
| Hosseini et al. | Speech emotion classification via a modified Gaussian mixture model approach | |
| JP3049711B2 (ja) | 音声処理装置 | |
| JP2891259B2 (ja) | 音声区間検出装置 | |
| JPH05249987A (ja) | 音声検出方法および音声検出装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20151218 |
|
| PA0201 | Request for examination | ||
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20161213 Patent event code: PE09021S01D |
|
| E90F | Notification of reason for final refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Final Notice of Reason for Refusal Patent event date: 20170523 Patent event code: PE09021S02D |
|
| PG1501 | Laying open of application | ||
| E601 | Decision to refuse application | ||
| PE0601 | Decision on rejection of patent |
Patent event date: 20171222 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20170523 Comment text: Final Notice of Reason for Refusal Patent event code: PE06011S02I Patent event date: 20161213 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |