WO2019000961A1

WO2019000961A1 - 一种基于算法的音频优化方法、智能终端及存储装置

Info

Publication number: WO2019000961A1
Application number: PCT/CN2018/076101
Authority: WO
Inventors: 陈学思
Original assignee: Shenzhen Chuangwei RGB Electronics Co Ltd
Current assignee: Shenzhen Chuangwei RGB Electronics Co Ltd
Priority date: 2017-06-27
Filing date: 2018-02-10
Publication date: 2019-01-03
Anticipated expiration: 2019-12-27
Also published as: CN107331403B; US10861472B2; EP3471097A4; EP3471097B1; US20200066286A1; EP3471097A1; CN107331403A

Abstract

一种基于算法的音频优化方法、智能终端及存储装置，方法包括：预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件（S100)；提取音频信号的频率范围和频幅信息，与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配，确定音频信号的类型（S200）；根据音频信号的类型，通过函数库匹配对应的频率映射函数转换得到处理后的音频文件，再通过傅里叶逆变换得到优化的音频文件（S300）。通过原始音频与标准音源的对比匹配，寻找相近的音源类型，进而确定变换的频率映射函数，将频率进行映射，压缩或扩展相关频率，自动进行调音，达到改善音质的效果。

Description

一种基于算法的音频优化方法、智能终端及存储装置

技术领域

本发明涉及音频处理技术领域，尤其涉及一种基于算法的音频优化方法、智能终端及存储装置。

背景技术

目前，电视节目中的音频处理主要是改善音频设备的频率响应，使频率响应曲线达到“平直”效果来直接反应声音的再现能力，以追求声音的准确性。不同产品对不同音频频率的响应能力不同，若其频率响应曲线越平直，声音再现越好。但是人耳听感与各频段声音有很大的关系，各频段的幅度不同和分布不同，给听者带来的感觉享受不同。例如音频若包含过量的低次级谐波，容易使人耳产生疲劳；音乐演奏音频如西洋管弦乐队，提升其8千赫兹左右的音量，可以增加明亮度。所以只追求频响曲线平直、声音准确的处理方法，容易失去声音的特性，声音不能完美表现出来。现有的常用来提高音频特性的方法，是利用频率均衡器对音频波形进行滤波，调整各个频段的增益值。通过频率均衡器可以改善音乐的听觉效果，但这种方法只适用于个人喜好风格的手动调整，且不能自动调整不同条件场景下的音效，对于普通观众来说并不能随时带来更好的听觉效果。

因此，现有技术还有待于改进和发展。

发明内容

本发明要解决的技术问题在于，针对现有技术的上述缺陷，提供一种基于算法的音频优化方法、智能终端及存储装置，旨在通过原始音频与标准音源的对比匹配，寻找相近的音源类型，进而确定变换的频率映射函数，将频率进行映射，压缩或扩展相关频率，自动进行调音，达到改善音质的效果。

本发明解决技术问题所采用的技术方案如下：

一种基于算法的音频优化方法，其中，所述方法包括：

预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件；

提取音频信号的频率范围和频幅信息，与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配，确定音频信号的类型；

根据音频信号的类型，通过函数库匹配对应的频率映射函数转换得到处理后的音频文件，再通过傅里叶逆变换得到优化的音频文件。

所述的基于算法的音频优化方法，其中，所述函数库包括第一频率映射函数和第二频率映射函数，所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变，调整音频频率。

所述的基于算法的音频优化方法，其中，所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变具体包括：

预先将所述频域上的音频文件中音频的频段划分为若干个区间；

根据音频信号的类型，对于每个不同区间频段的频率，通过选择第一频率映射函数或者第二频率映射函数进行针对性处理。

所述的基于算法的音频优化方法，其中，所述第一频率映射函数为：

其中f为频域上的音频文件中音频的频率，f'为处理后的音频文件中音频的频率。

所述的基于算法的音频优化方法，其中，所述第一频率映射函数对频域上的音频文件中音频的频率转换处理为：

将频域上的音频文件中小于等于330Hz的频率转换为330Hz，用于将音频的低音部分擦除；

将频域上的音频文件中大于330Hz但小于1000Hz的频率保持不变；

将频域上的音频文件中大于等于1000Hz的频率转换为1000Hz，用于将音频的高音部分擦除。

所述的基于算法的音频优化方法，其中，所述第二频率映射函数为：

其中f为频域上的音频文件中音频的频率，f'为处理后的音频文件中音频的频率，k为扩展系数。

所述的基于算法的音频优化方法，其中，所述第二频率映射函数对频域上的音频文件中音频的频率转换处理为：

将频域上的音频文件中大于330Hz的频率进行k倍扩大。

所述的基于算法的音频优化方法，其中，所述第一频率映射函数用于保留音频的中频部分，压缩低频和高频分布范围，应用于减小背景噪音和保持声音清晰纯正的语言节目；

所述第二频率映射函数用于扩展音频的中音和高音部分，压缩低音部分，应用于强调中音高音来表现金属打击声音的金属音乐演奏。

所述的基于算法的音频优化方法，其中，将频段的调整点划为：330Hz和1000Hz，小于330Hz划为低频，大于330Hz小于1000Hz为中频，大于1000Hz为高频。

所述的基于算法的音频优化方法，其中，所述第一频率映射函数将原来所有小于等于330Hz的频率转换为330Hz，将音频的低音部分擦除掉；原大于330Hz但小于1000Hz的频率不变，大于等于1000Hz的频率调整为1000Hz，高频信息消失。

所述的基于算法的音频优化方法，其中，所述第二频率映射函数将小于等于330Hz的音频频率擦除，将大于330Hz的音频频率进行扩大，扩大了大于330Hz的频率范围，扩展中音和高音部分，压缩低音。

所述的基于算法的音频优化方法，其中，函数库中的频率映射函数通过对音频频率分布范围进行针对性改变，来改善音频的音质表现，函数库的函数用来实现音频文件(F[y(t)])到音频文件(F'[y(t)])的变换，变换为线性变换，非线性变换、分段线性变换或者分段非线性变换；函数的表达式根据频段划分点的不同分段表示。

所述的基于算法的音频优化方法，其中，将频率与频率进行映射，通过频率映射函数压缩或扩展相关频率。

一种智能终端，其中，包括：处理器、与处理器通信连接的存储器，所述存储器存储有计算机程序，所述计算机程序用于被执行时实现所述的基于算法的音频优化方法；所述处理器用于调用所述存储器中的计算机程序，以实现所述的基于算法的音频优化方法。

一种存储装置，其中，所述存储装置存储有计算机程序，所述计算机程序能够被执行用于实现所述的基于算法的音频优化方法。

本发明的有益效果：本发明公开了一种基于算法的音频优化方法、智能终端及存储装置，所述方法包括：预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件；提取音频信号的频率范围和频幅信息，与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配，确定音频信号的类型；根据音频信号的类型，通过函数库匹配对应的频率映射函数转换得到处理后的音频文件，再通过傅里叶逆变换得到优化的音频文件。本发明通过原始音频与标准音源的对比匹配，寻找相近的音源类型，进而确定变换的频率映射函数，将频率进行映射，压缩或扩展相关频率，自动进行调音，达到改善音质的效果。

附图说明

图1是本发明基于算法的音频优化方法的较佳实施例的流程图。

图2是本发明通过频率映射函数对音频频率分布范围进行针对性改变过程的较佳实施例的流程图。

图3是本发明基于算法的音频优化方法中通过第一频率映射函数对频域上的音频文件中音频的频率转换处理的较佳实施例的流程图。

图4是本发明基于算法的音频优化方法中通过第二频率映射函数对频域上的音频文件中音频的频率转换处理的较佳实施例的流程图。

图5是本发明基于算法的音频优化方法中移动终端的较佳实施例的功能原理框图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明较佳实施例所述的一种基于算法的音频优化方法，如图1所示，所述方法包括以下步骤：

步骤S100、预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件。

具体地，原始音频文件中的音频数据描述的是随时间变化声音幅值变化的关系，由于本发明是对音频的频率进行转换，所以需要把时域(时域是描述数学函数或物理信号对时间的关系，例如一个信号的时域波形可以表达信号随着时间的变化)上的原始音频文件(y(t))通过傅里叶变换转换为频域(频域是描述信号在频率方面特性时用到的一种坐标系)上的音频文件(F[y(t)])。

傅里叶变换是数字信号处理领域一种很重要的算法，傅里叶原理表明：任何连续测量的时序或信号，都可以表示为不同频率的正弦波信号的无限叠加，而根据该原理创立的傅里叶变换算法利用直接测量到的原始信号，以累加方式来计算该信号中不同正弦波信号的频率、振幅和相位。因此，可以说，傅里叶变换将原来难以处理的时域信号转换成了易于分析的频域信号(信号的频谱)，可以利用一些工具对这些频域信号进行处理、加工。最后还可以利用傅里叶逆变换将这些频域信号转换成时域信号。

傅里叶变换公式为：

公式中F(ω)为f(t)的像函数，f(t)为F(ω)的像原函数。

步骤S200、提取音频信号的频率范围和频幅信息，与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配，确定音频信号的类型。

具体地，要对频域上的音频文件(F[y(t)])处理为音质较好的处理后的音频文件(F'[y(t)])，需要从函数库选择合适的频率映射函数来进行转换。各种声源频率范围不同，例如大钢琴的频率范围为27Hz～12000Hz，脚步声为100Hz～9000Hz。任何一个音频文件，其频率映射函数的选取可以根据一个标准音源作为匹配信息标准。

根据音频信号的某些特性(频率分布范围、频幅信息)，提取音频信号的频率范围和频幅信息，与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配，找到相符合音频测试标准音源，即确定了音频信号的类型，从而确定要变换的频率映射函数。

步骤S300、根据音频信号的类型，通过函数库匹配对应的频率映射函数转换得到处理后的音频文件，再通过傅里叶逆变换得到优化的音频文件。

具体地，所述函数库包括第一频率映射函数和第二频率映射函数，所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变，调整音频频率，来改善音频的音质表现。

如图2所示，所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变具体包括：

S10，预先将所述频域上的音频文件中音频的频段划分为若干个区间；例如两个区间或者三个区间不等；

S20，根据音频信号的类型，对于每个不同区间频段的频率，通过选择第一频率映射函数或者第二频率映射函数进行针对性处理。

进一步地，所述第一频率映射函数为：

如图3所示，所述第一频率映射函数对频域上的音频文件中音频的频率转换处理为(即所述第一频率映射函数公式的具体含义)：

S11，将频域上的音频文件中小于等于330Hz的频率转换为330Hz，用于将音频的低音部分擦除；

S12，将频域上的音频文件中大于330Hz但小于1000Hz的频率保持不变；

S13，将频域上的音频文件中大于等于1000Hz的频率转换为1000Hz，用于将音频的高音部分擦除。

具体地，本发明将频段的调整点划为：330Hz，1000Hz，即小于330Hz划为低频，大于330Hz小于1000Hz为中频，大于1000Hz为高频。所述第一频率映射函数将原来所有小于等于330Hz的频率转换为330Hz，这样就把音频的低音部分擦除掉；原大于330Hz但小于1000Hz的频率不变，大于等于1000Hz的频率调整为1000Hz，即高频信息消失。该函数保留中频部分，压缩低频和高频分布范围，主要应用于语言节目等音源，目的是减少低频和高频分量，可以使背景噪音减小，声音清晰纯正。

进一步地，所述第二频率映射函数为：

如图4所示，所述第二频率映射函数对频域上的音频文件中音频的频率转换处理为(即所述第二频率映射函数公式的具体含义)：

S21，将频域上的音频文件中小于等于330Hz的频率转换为330Hz，用于将音频的低音部分擦除；

S22，将频域上的音频文件中大于330Hz的频率进行k倍扩大。

具体地，本发明所述第二频率映射函数将小于等于330Hz的音频频率擦除，将大于330Hz的音频频率进行扩大，扩大了大于330Hz的频率范围，即扩展中音和高音部分，压缩低音，主要用来处理金属音乐演奏，强调中音高音来表现金属打击的声音。当然，k还可以为压缩系数(即k﹤1，此时对音频中的一些频率进行压缩)。

本发明中的所述函数库优先由第一频率映射函数和第二频率映射函数组成，当然还可以包括其他频率映射函数，函数库中的频率映射函数主要通过对音频频率分布范围进行针对性改变，来改善音频的音质表现。函数库的函数用来实现音频文件(F[y(t)])到音频文件(F'[y(t)])的变换，这个变换可以是线性变换，非线性变换(对数变换、指数变换)或者分段线性变换(如第一频率映射函数和第二频率映射函数)、分段非线性变换。函数的表达式可以根据频段(高频、中频、低频)划分点的不同分段表示，以达到对音频信号的细化或者简略处理。根据专业调音师的要求，不断增加针对不同音质改善的表达式，这些函数构成了专业化的面向音频处理的函数库。根据应用要求的不同，选择不同的变换函数，这些函数将有选择地对某一频率范围进行扩展或压缩。

本发明的技术方案区别于传统的滤波改善音质，本发明将频率与频率进行映射，通过频率映射函数压缩或扩展相关频率，针对性地修饰音色，达到改善音质的效果，优化听觉效果；通过与标准音源的对比匹配，寻找相近的音源类型，进而确定变换的映射函数，这样能自动调音，并达到专业调音的效果。

本发明还提供了一种移动终端，如图5所示，所述移动终端包括：处理器 (processor)10、存储器(memory)20、通信接口(Communications Interface)30和总线40；

其中，所述处理器10、存储器20、通信接口30通过所述总线40完成相互间的通信；

所述通信接口30用于所述移动终端的通信设备之间的信息传输；

所述处理器10用于调用所述存储器20中的计算机程序，以执行上述各方法实施例所提供的方法，例如包括：预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件；提取音频信号的频率范围和频幅信息，与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配，确定音频信号的类型；根据音频信号的类型，通过函数库匹配对应的频率映射函数转换得到处理后的音频文件，再通过傅里叶逆变换得到优化的音频文件。

本发明还提供一种存储装置，其中，所述存储装置存储有计算机程序，所述计算机程序能够被执行以用于实现所述基于算法的音频优化方法。

综上所述，本发明提供了一种基于算法的音频优化方法、智能终端及存储装置，所述方法包括：预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件；提取音频信号的频率范围和频幅信息，与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配，确定音频信号的类型；根据音频信号的类型，通过函数库匹配对应的频率映射函数转换得到处理后的音频文件，再通过傅里叶逆变换得到优化的音频文件。本发明通过原始音频与标准音源的对比匹配，寻找相近的音源类型，进而确定变换的频率映射函数，将频率进行映射，压缩或扩展相关频率，自动进行调音，达到改善音质的效果；补偿声音表现在人听觉上的缺陷，从而达到更好的听觉效果。

当然，本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关硬件(如处理器，控制器等)来完成，所述的程序可存储于一计算机可读取的存储介质中，该程序在执行时可包括如上述各方法实施例的流程。其中所述的存储介质可为存储器、磁碟、光盘等。

应当理解的是，本发明的应用不限于上述的举例，对本领域普通技术人员来说，可以根据上述说明加以改进或变换，所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims

一种基于算法的音频优化方法，其特征在于，所述方法包括：

预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件；

提取音频信号的频率范围和频幅信息，与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配，确定音频信号的类型；

根据音频信号的类型，通过函数库匹配对应的频率映射函数转换得到处理后的音频文件，再通过傅里叶逆变换得到优化的音频文件。
根据权利要求1所述的基于算法的音频优化方法，其特征在于，所述函数库包括第一频率映射函数和第二频率映射函数，所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变，调整音频频率。
根据权利要求2所述的基于算法的音频优化方法，其特征在于，所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变具体包括：

预先将所述频域上的音频文件中音频的频段划分为若干个区间；

根据音频信号的类型，对于每个不同区间频段的频率，通过选择第一频率映射函数或者第二频率映射函数进行针对性处理。
根据权利要求3所述的基于算法的音频优化方法，其特征在于，所述第一频率映射函数为：

其中f为频域上的音频文件中音频的频率，f'为处理后的音频文件中音频的频率。
根据权利要求4所述的基于算法的音频优化方法，其特征在于，所述第一频率映射函数对频域上的音频文件中音频的频率转换处理为：

将频域上的音频文件中小于等于330Hz的频率转换为330Hz,用于将音频的低音部分擦除；

将频域上的音频文件中大于330Hz但小于1000Hz的频率保持不变；

将频域上的音频文件中大于等于1000Hz的频率转换为1000Hz，用于将音频的高音部分擦除。
根据权利要求3所述的基于算法的音频优化方法，其特征在于，所述第二频率映射函数为：

其中f为频域上的音频文件中音频的频率，f'为处理后的音频文件中音频的频率，k为扩展系数。
根据权利要求6所述的基于算法的音频优化方法，其特征在于，所述第二频率映射函数对频域上的音频文件中音频的频率转换处理为：

将频域上的音频文件中小于等于330Hz的频率转换为330Hz,用于将音频的低音部分擦除；

将频域上的音频文件中大于330Hz的频率进行k倍扩大。
根据权利要求3所述的基于算法的音频优化方法，其特征在于，所述第一频率映射函数用于保留音频的中频部分，压缩低频和高频分布范围，应用于减小背景噪音和保持声音清晰纯正的语言节目；

所述第二频率映射函数用于扩展音频的中音和高音部分，压缩低音部分，应用于强调中音高音来表现金属打击声音的金属音乐演奏。
根据权利要求5所述的基于算法的音频优化方法，其特征在于，将频段的调整点划为：330Hz和1000Hz，小于330Hz划为低频，大于330Hz小于1000Hz为中频，大于1000Hz为高频。
根据权利要求9所述的基于算法的音频优化方法，其特征在于，所述第一频率映射函数将原来所有小于等于330Hz的频率转换为330Hz,将音频的低音部分擦除掉；原大于330Hz但小于1000Hz的频率不变，大于等于1000Hz的频率调整为1000Hz，高频信息消失。
根据权利要求9所述的基于算法的音频优化方法，其特征在于，所述第二频率映射函数将小于等于330Hz的音频频率擦除，将大于330Hz的音频频率进行扩大，扩大了大于330Hz的频率范围，扩展中音和高音部分，压缩低音。
根据权利要求1所述的基于算法的音频优化方法，其特征在于，函数库中的频率映射函数通过对音频频率分布范围进行针对性改变，来改善音频的音质表现，函数库的函数用来实现音频文件(F[y(t)])到音频文件(F'[y(t)])的变换，变换为线性变换，非线性变换、分段线性变换或者分段非线性变换；函数的表达式根据频段划分点的不同分段表示。
根据权利要求12所述的基于算法的音频优化方法，其特征在于，将频率与频率进行映射，通过频率映射函数压缩或扩展相关频率。
一种智能终端，其特征在于，包括：处理器、与处理器通信连接的存储器，所述存储器存储有计算机程序，所述计算机程序用于被执行时实现如权利要求1-13任一项所述的方法；所述处理器用于调用所述存储器中的计算机程序，以实现如权利要求1-13任一项所述的方法。
一种存储装置，其特征在于，所述存储装置存储有计算机程序，所述计算机程序能够被执行用于实现如权利要求1至13任一项所述的基于算法的音频优化方法。