WO2017020657A1

WO2017020657A1 - 从语音信息中识别时间信息的方法和装置

Info

Publication number: WO2017020657A1
Application number: PCT/CN2016/086125
Authority: WO
Inventors: 王飞; 徐浩; 冯晓冰; 许振兴; 裴国东
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2015-07-31
Filing date: 2016-06-17
Publication date: 2017-02-09
Anticipated expiration: 2018-01-31
Also published as: CN106409295A; EP3330962A1; JP6667931B2; KR20180016554A; JP2018527611A; EP3330962A4; CN106409295B; US20170372702A1; US10249302B2; KR102046728B1; EP3330962B1

Abstract

一种从语音信息中识别时间信息的方法和装置，该方法包括：采集语音信息，识别包含时间信息的语音信息，获得文本信息(S10)；识别与文本信息匹配的至少一个时间特征，并根据匹配的时间特征查找至少一个配置文件以获得对应的时间符(S20)；将时间符赋值给中间数据中与时间特征所在的配置文件对应的字段(S30)；根据中间数据中各字段的内容，获得时间数据(S40)。该方法将时间特征存放在配置文件中，使程序代码可读性更强，避免了代码冗长，在需要修改或添加时间特征数据时，只需要修改配置文件，无须改动和重新编码程序代码，简化了识别程序的修改过程，为程序代码的维护提供了方便。

Description

从语音信息中识别时间信息的方法和装置

本申请要求于2015年7月31日提交中国专利局、申请号为201510465853.7、发明名称为“从自然语音信息中识别时间信息的方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及到语音识别技术领域，特别涉及到从语音信息中识别时间信息的方法和装置。

背景技术

随着语音识别技术的发展，将语音识别结合到终端应用程序中，在终端中通过语音交互实现搜索查询或操作功能，例如查询天气、航班动态、搜索周边美食、拨打电话、设置提醒、调整闹钟、播放音乐等。在用户与终端进行语音交互时，语音指令中经常会携带时间信息，例如5月5日早上10点提醒开会、查询下周一深圳到北京的航班、设置明天早上8点的闹钟等。

发明内容

本申请实施例提供一种从语音信息中识别时间信息的方法和装置，在修改或添加语音指令的识别关键词时，无须改动或重新编译程序代码，可操作性强。

本申请实施例提出一种从语音信息中识别时间信息的方法，包括步骤：

采集语音信息，并识别包含时间信息的语音信息获得对应于所述语音信息的文本信息；

识别与所述文本信息匹配的至少一个时间特征，并根据所述匹配的时间特征查找至少一个配置文件以获得对应的时间符；

将所述对应的时间符赋值给中间数据中与所述匹配的时间特征所在的配置文件对应的字段；所述中间数据包括多个字段，每个字段对应于一个所述配置文件；

根据所述中间数据中各字段的内容，获得与所述语音信息中的所述时间信息对应的时间数据。

本申请实施例还提出一种从语音信息中识别时间信息的装置，包括：

语音采集模块，用于采集语音信息，并识别包含时间信息的语音信息获得对应于所述语音信息的文本信息；

配置查询模块，用于识别与所述文本信息匹配的至少一个时间特征，并根据所述匹配的时间特征查找至少一个配置文件以获得对应的时间符；

中间赋值模块，用于将所述对应的时间符赋值给中间数据中与所述匹配的时间特征所在的配置文件对应的字段；所述中间数据包括多个字段，每个字段对应于一个所述配置文件；

时间转换模块，用于根据所述中间数据中各字段的内容，获得与所述语音信息中的所述时间信息对应的时间数据。

本申请实施例将语音信息中可能出现的时间特征放入对应类别的配置文件中，将各类别的配置文件与中间数据中的各字段一一对应，在识别语音信息中的时间信息时，从配置文件中查找匹配的时间特征，并获得匹配时间特征对应的时间符，将该对应的时间符赋值给中间数据中的对应字段，并根据该字段的内容生成确切的时间数据，如此一来，所有待匹配的关键时间特征都存放在各自的配置文件中，识别程序只需要从配置文件中提取时间特征对应的时间符，并通过中间文件转换获得确切的时间数据，使程序代码的可读性更强，且有效避免了程序代码冗长，在需要修改或添加时间特征时，只需要修改配置文件，无须改动和重新编码程序代码，简化了识别程序的修改过程，为程序代码的维护提供了方便。

附图说明

图1为本申请实施例中从语音信息中识别时间信息的装置所在终端的总线图；

图2为本申请从语音信息中识别时间信息的方法的第一实施例的流程图；

图3为本申请从语音信息中识别时间信息的方法的第二实施例的流程图；

图4为本申请从语音信息中识别时间信息的方法的第三实施例的流程图；

图5为本申请从语音信息中识别时间信息的方法的第四实施例的流程图；

图6为本申请从语音信息中识别时间信息的方法的第五实施例的流程图；

图7为本申请从语音信息中识别时间信息的方法的第六实施例的流程图；

图8为本申请从语音信息中识别时间信息的装置的第一实施例的模块示意图；

图9为本申请从语音信息中识别时间信息的装置的第二实施例的模块示意图；

图10为本申请中配置文件的第一实施例的示意图；

图11为本申请中配置文件的第二实施例的示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

在本申请一实施例中，采用硬编码方式对于语音指令中的时间信息进行识别。具体是，在程序代码中编码各种关键词，在识别到语音指令中的关键词后，将其转换为对应的时间参数，生成对应的时间。但是，这种硬编码方式需要将所有的时间关键词都添加到代码中。

参照图1，图1为本申请实施例中从语音信息中识别时间信息的装置所在终端的总线图。该终端可以是手机、pad、电脑等，可以包括：至少一个处理器101，例如CPU，至少一个网络接口104，用户接口103，存储器105，至少一个通信总线102。其中，通信总线102用于实现这些组件之间的连接通信。其中，用户接口103可以包括显示屏(Display)、键盘(Keyboard)，还可以包括标准的有线接口、无线接口。网络接口104可以包括标准的有线接口、无线接口(如WIFI接口)。存储器105可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器105还可以是至少一个位于远离前述处理器101的存储装置。作为一种计算机存储介质的存储器 105中可以包括操作系统、网络通信模块、用户接口模块以及从语音信息中识别时间信息程序。在本发明实施例中，语音信息可以为自然语音信息，例如从人的表达的语言中识别出的语音信息。

在图1所示的从语音信息中识别时间信息的装置所在终端中，网络接口104主要用于连接服务器或其他终端，与服务器或其他终端进行数据通信；而用户接口103主要用于接收用户指令，并与用户进行交互；而处理器101可以用于调用存储器105中存储的从语音信息中识别时间信息程序，并执行以下操作：

采用用户接口103采集语音信息，并识别包含时间信息的语音信息获得对应于语音信息的文本信息；

识别与文本信息匹配的至少一个时间特征，并根据匹配的时间特征查找至少一个配置文件以获得对应的时间符；

将对应的时间符赋值给中间数据中与匹配的时间特征所在的配置文件对应的字段；中间数据包括多个字段，每个字段对应于一个配置文件；

根据中间数据中各字段的内容，获得与语音信息中的时间信息对应的时间数据。

在本发明实施例中，中间数据中各字段可以为：与上述各配置文件对应的字段。

在一个实施例中，处理器101调用存储器105中存储的从语音信息中识别时间信息程序还可以执行以下操作：

采用用户接口103接收录入的新的时间特征，确定新的时间特征对应的类别；

将新的时间特征添加到新的时间特征对应类别的配置文件中；

判断在对应类别的配置文件中是否存在与新的时间特征含义相同的时间特征；

如果是，则根据含义相同的时间特征的时间符设置新的时间特征对应的时间符；

如果否，则对所述新的时间特征设置新的时间符。

在各个配置文件中的时间特征表中查找与文本信息匹配的至少一个时间特征；

在匹配的时间特征所在的配置文件中的时间符表中查找与匹配的时间特征对应的时间符。

当已完成赋值的中间数据中上午/下午字段未赋值，且日期字段未赋值或与当前时间的日期相同时，获取当前时间；

判断已完成赋值的中间数据中时间点字段的时间符是否大于当前时间的时间点；

如果是，则将中间数据的上午/下午字段设置为与当前时间的时段一致；

如果否，则将中间数据的上午/下午字段设置为与当前时间的时段相反。

当已完成赋值的中间数据中星期字段已赋值，且本周/下周字段未赋值时，获取当前时间；

判断已完成赋值的中间数据中星期字段的时间符是否大于当前时间的星期数；

如果是，则将中间数据的本周/下周字段设置为本周；

如果否，则将中间数据的本周/下周字段设置为下周。

当匹配的时间特征中包括明天时，获取当前时间；

在当前时间在上午0点至上午x点范围内时，其中x为预设时间点，则将中间数据中日期字段赋值为与当前时间的日期相同。

本实施例图1所描述的从语音信息中识别时间信息的装置及其所在终端，将语音信息的文本信息中可能出现的时间特征放入对应类别的配置文件中，将各类别的配置文件与中间数据中的各字段一一对应，在识别语音信息中的时间信息时，从配置文件中查找匹配的时间特征，并获得匹配时间特征对应的时间符，将该对应的时间符赋值给中间数据中的对应字段，并根据该字段的内容生成确切的时间数据，如此一来，所有待匹配的关键时间特征都存放在各自的配置文件中，识别程序只需要从配置文件中提取时间特征对应的时间符，并通过中间文件转换获得确切的时间数据，使程序代码的可读性更强，且有效避免了程序代码冗长，在需要修改或添加时间特征时，只需要修改配置文件，无须改动和重新编码程序代码，简化了识别程序的修改过程，为程序代码的维护提供了方便。

如图2所示，图2为本申请从语音信息中识别时间信息的方法的第一实施例的流程图。本实施例提到的从语音信息中识别时间信息的方法，包括步骤：

步骤S10，采集语音信息，并识别语音信息获得对应于所述语音信息的文本信息；

本实施例中的终端载体可以是手机、pad、连接有麦克风的电脑等，当用户启动终端的语音采集功能时，终端通过话筒、麦克风等语音采集设备采集用户的语音信息。在本发明一实施例中，时间信息可以为采集到的语音信息中包含的，以语音格式进行编码的用于描述时间的信息。本实施例不止是对语音信息的内容进行识别，还要将语音信息获得可操作的控制指令，由终端根据该控制指令执行相应操作。因此，终端系统中包括有普通的语音识别程序，通过语音识别程序将语音信息获得对应的文本信息，然后再由本实施例的方式来将语音信息的内容转换成标准的格式，以便于生成可操作的控制指令。该语音信息包括的内容并不限定，本实施例以识别语音信息中的时间信息为例，其他内容的识别与转换也可采用本实施例的方案。

步骤S20，识别与文本信息匹配的至少一个时间特征，并根据匹配的时间特征查找至少一个配置文件以获得对应的时间符；

在本发明一实施例中，时间特征可以是包含在文本信息中的，以文本格式进行编码的用于描述时间的信息。本实施例还设有多个配置文件，每个配置文件对应一个分类，例如，星期的配置文件包括星期几、礼拜几、星期几的时间特征，日期的配置文件包括几号、几日的时间特征，月份的配置文件包括几月的时间特征，小时的配置文件包括几点钟的时间特征等待。在文本信息中识别时间特征的方式有多种，本实施例采用的是将语音信息的文本信息内容与各个配置文件中的时间特征进行匹配，获得匹配的时间特征。例如，语音信息的文本信息为“5月8日下午2点半提醒我开会”，则在月份的配置文件month中匹配到时间特征“5月”，日期的配置文件day中匹配到时间特征“8日”，上午/下午的配置文件halfday中匹配到时间特征“下午”，小时的配置文件hour中匹配到时间特征“2点”，分钟配置文件min中匹配到时间特征 “点半”。

此外，时间特征还可以分为绝对时间特征和相对时间特征。例如，十点半、十号、一月一号、正月初五、星期五、父亲节、国庆节、除夕等，不会因当前时间不同而产生变化，因此都是绝对时间特征。30分钟后、明年2月14号、下个月3号、下周三、后天等，需要以当前时间作为参照点，当前时间若有变化，则该时间特征对应的具体时间也会变化，因此是相对时间特征。

在配置文件中存储有该分类的多个时间特征，每一个时间特征对应于一个时间符，如图10所示。例如月份的配置文件中“5月”对应时间符5；日期的配置文件中“8日”对应时间符8。对于含义相同的多个时间特征，对应的时间符也相同，例如图10中，周七、周日、周天、星期七、星期日、星期天、礼拜七、礼拜日、礼拜天，这六个时间特征的含义相同，对应时间符都为7。前述实施例中，分钟配置文件min中的时间特征“点半”、“点30”的含义相同，对应时间符都为30。在本发明一实施例中，时间符可以是包含在配置文件中的，以文本格式进行编码的用于描述时间的信息。时间特征和时间符可以是均采用文本格式进行编码的信息，如上可见，两者的区别可在于两者描述时间的方式不同。

步骤S30，将对应的时间符赋值给中间数据中与匹配的时间特征所在的配置文件对应的字段；

本实施例还设有中间数据，中间数据中包括有多个字段，每一个字段对应于一个配置文件。终端在查找到文本信息匹配的时间特征后，将该时间特征的对应时间符赋值给匹配时间特征所在配置文件对应的字段中。例如，时间特征“5月”所在的配置文件为月份配置文件month，在中间数据中对应的字段为月份字段month，该月份字段中的变量为m，单位为“月”，将时间特征“5月”对应的时间符5赋值给月份字段的变量，即令m＝5，赋值后该字段为“5月”。

步骤S40，根据中间数据中各字段的内容，获得与语音信息中的时间信息对应的时间数据。

将本次语音信息的文本信息中所有匹配时间特征对应的时间符都赋值给中间数据的对应字段后，终端根据中间数据中已赋值的字段，获得确切的时间数据。获得的时间数据包括绝对时间和相对时间，绝对时间包括几点几分、几月几号等，还可包括农历日期和节假日，例如五月初五、中秋节、父亲节等；相对日期是相对于当前时间的一个偏移量，例如今天是3月1日，根据中间数据中已赋值的字段获得的内容为五天后，则在当前日期往后增加5天，转换后获得的确切时间为3月6日。

本实施例将语音信息的文本信息中可能出现的时间特征放入对应类别的配置文件中，将各类别的配置文件与中间数据中的各字段一一对应，在识别语音信息中的时间信息时，从配置文件中查找匹配的时间特征，并获得匹配时间特征对应的时间符，将该对应的时间符赋值给中间数据中的对应字段，并根据该字段的内容生成确切的时间数据，如此一来，所有待匹配的关键时间特征都存放在各自的配置文件中，识别程序只需要从配置文件中提取时间特征对应的时间符，并通过中间文件转换获得确切的时间数据，使程序代码的可读性更强，且有效避免了程序代码冗长，在需要修改或添加时间特征时，只需要修改配置文件，无须改动和重新编码程序代码，简化了识别程序的修改过程，为程序代码的维护提供了方便。

如图3所示，图3为本申请从语音信息中识别时间信息的方法的第二实施例的流程图。本实施例提到的从语音信息中识别时间信息的方法中配置文件的修改采用以下步骤：

步骤S51，接收录入的新的时间特征，确定新的时间特征对应的类别；

步骤S52，将新的时间特征添加到新的时间特征对应类别的配置文件中；

步骤S53，判断在对应类别的配置文件中是否存在与新的时间特征含义相同的时间特征；如果是，则执行步骤S54；如果否，则执行步骤S55；

步骤S54，根据含义相同的时间特征的时间符设置新的时间特征对应的时间符；

步骤S55，对新的时间特征设置新的时间符。

本实施例在修改或增加新的语音识别的关键时间特征时，只需要在对应类别的配置文件中添加新的时间特征，并对新的时间特征设置对应时间符。如果在配置文件中包括有与新的时间特征含义相同的时间特征，则根据含义相同的时间特征的时间符设置新的时间特征对应的时间符；否则，将新的时间符设置为新的时间特征的对应时间符。本实施例在需要修改或添加时间特征数据时，只需要修改配置文件，无须改动和重新编码程序代码，简化了识别程序的修改过程，为程序代码的维护提供了方便。

如图4所示，图4为本申请从语音信息中识别时间信息的方法的第三实施例的流程图。本实施例包括图2所示实施例的步骤，步骤S20还包括：

步骤S21，在各个配置文件中的时间特征表中查找与文本信息匹配的至少一个时间特征；

步骤S22，在匹配的时间特征所在的配置文件中的时间符表中查找与匹配的时间特征对应的时间符。

本实施例中的配置文件包括两个表，如图11所示，一个是时间特征表，另一个是时间符表，在建立配置文件时，将该配置文件对应类别的时间特征存储在时间特征表中，而在时间符表中预先设置有多个时间符，将时间特征表中的各个时间特征分别与时间符表中的时间符建立映射关系，时间特征的数量可小于或等于时间符的数量，多个时间特征可对应于一个时间符。在新增时间特征时，将新增的时间特征放置于时间特征表中，并查找该时间特征表中是否有与新增的时间特征含义相同的原有时间特征。如果有，则在时间符表中查找与该含义相同的原有时间特征匹配的时间符，并在查找到的特征符与新增的时间特征之间建立新的映射关系。如果该时间特征表中没有与新增的时间特征含义相同的原有时间特征，则在时间符表中新建一新的时间符，并将新的时间符与新增的时间特征建立映射关系。在查找匹配的时间特征时，在各个配置文件的时间特征表中查找与文本信息匹配的时间特征，然后在该匹配的配置文件的时间符表中查找与匹配的时间特征对应的时间符即可。

由于本实施例的配置文件分别采用了时间特征表和时间符表，将时间特征和时间符分别存储，使匹配查找更加方便。同时，时间特征和时间符的增加分别在各自所在的表中进行，有利于分别扩展时间特征表和时间符表。此外，在多个时间特征对应于一个时间符时，图10所示实施例中需要将同一个时间符在配置文件中重复的出现多次，而图11所示实施例中，无须在配置文件中写入过多的重复数据，只需要在两个表之间建立映射关系即可，无论是时间特征还是时间符，在配置文件中都只出现一次，有利于减少配置文件中的数据量，避免配置文件占用过多存储空间。

如图5所示，图5为本申请从语音信息中识别时间信息的方法的第四实施例的流程图。本实施例包括图2所示实施例的步骤，步骤S40之前还包括：

步骤S61，当已完成赋值的中间数据中上午/下午字段未赋值，且日期字段未赋值或与当前时间的日期相同时，获取当前时间；

步骤S62，判断已完成赋值的中间数据中时间点字段的时间符是否大于当前时间的时间点；如果是，则执行步骤S63；如果否，则执行步骤S64；

步骤S63，将中间数据的上午/下午字段设置为与当前时间的时段一致；

步骤S64，将中间数据的上午/下午字段设置为与当前时间的时段不同的时段。例如，当前时间所属的时段为上午，则将中间数据设置为下午字段。

本实施例在采集的语音信息中，常常会遇到一些不完整的信息，例如“10点提醒我开会”是指的上午十点还是下午十点？这时候则需要优先识别为未来的时间。此时可比较当前时间与语音信息的文本信息的匹配时间特征的大小来判断语音信息中的时段与当前时间的时段是否一致。例如，当前时间为上午9点，当语音信息的文本信息为“10点提醒我开会”时，匹配的时间特征为“10点”，大于当前时间，则默认语音信息中的“10点”为上午10点，提醒闹钟设置为上午10点；如果当语音信息的文本信息为“8点提醒我开会”，匹配时间特征“8点”，小于当前时间，则默认语音信息中的“8点”为下午8点，提醒闹钟设置为下午8点。如此一来，避免了因误解造成时间转换错误，有利于提高语音信息中时间识别的准确性。

如图6所示，图6为本申请从语音信息中识别时间信息的方法的第五实施例的流程图。本实施例包括图2所示实施例的步骤，步骤S40之前还包括：

步骤S71，当已完成赋值的中间数据中星期字段已赋值，且本周/下周字段未赋值时，获取当前时间；

步骤S72，判断已完成赋值的中间数据中星期字段的时间符是否大于当前时间的星期数；如果是，则执行步骤S73；如果否，则执行步骤S74；

步骤S74，将中间数据的本周/下周字段设置为本周；

步骤S73，将中间数据的本周/下周字段设置为下周。

本实施例对应不完整的信息，例如“周三提醒我开会”是指的本周三还是下周三？这时候也需要优先识别为未来的时间。此时可比较当前时间与语音信息的文本信息的匹配时间特征的大小来判断语音信息中的星期数与当前时间的星期数是否一致。例如，当前时间的星期数为周一，当语音信息的文本信息为“周三提醒我开会”时，匹配的时间特征为“周三”，大于当前时间，则默认语音信息中的“周三”为本周的周三，提醒闹钟设置为本周三；如果当前时间的星期数为周五，匹配时间特征“周三”，小于当前时间的星期数，则默认语音信息中的“周三”为下周的周三，提醒闹钟设置为下周三。如此一来，避免了因误解造成时间转换错误，有利于提高语音信息中时间识别的准确性。

如图7所示，图7为本申请从语音信息中识别时间信息的方法的第六实施例的流程图。本实施例包括图2所示实施例的步骤，步骤S40之前还包括：

步骤S81，当匹配的时间特征中包括明天时，获取当前时间；

步骤S82，在当前时间在上午0点至上午x点范围内时，其中x为预设时间点，则将中间数据中日期字段赋值为与当前时间的日期相同。

本实施例在采集的语音信息中，还会遇到一种特殊的情况，人们往往在凌晨时间段认为是前一天，但实际上凌晨时间段已经是第二天。例如，当前时间是7号凌晨1点，语音信息“明天早上10点提醒我开会”是指的7号上午十点还是8号上午十点？这时候可预先由用户设置一个时间范围，默认该时间范围内为凌晨时间段，在该凌晨时间段内默认为是前一天。例如，预设时间点为5点，则预设的凌晨时间段为上午0点至上午5点，当前时间是7号上午1点(即凌晨1点)，在此范围内，则语音信息“明天早上10点提醒我开会”是指7号上午十点，提醒闹钟设置为7号上午十点。如此一来，避免了因误解造成时间转换错误，有利于提高语音信息中时间识别的准确性。

如图8所示，图8为本申请从语音信息中识别时间信息的装置的第一实施例的模块示意图。本实施例提到的从语音信息中识别时间信息的装置，包括：

语音采集模块110，用于采集语音信息，并识别语音信息获得对应于所述语音信息的文本信息；

配置查询模块120，用于识别与文本信息匹配的至少一个时间特征，并根据匹配的时间特征查找至少一个配置文件以获得对应的时间符；

中间赋值模块130，用于将对应的时间符赋值给中间数据中与匹配的时间特征所在的配置文件对应的字段；

时间转换模块140，用于根据中间数据中各字段的内容，获得与所述语音信息中的时间信息对应的时间数据。

本实施例中的终端载体可以是手机、pad、连接有麦克风的电脑等，当用户启动终端的语音采集功能时，终端通过话筒、麦克风等语音采集设备采集用户的语音信息。本实施例不止是对语音信息的内容进行识别，还要将语音信息获得可操作的控制指令，由终端根据该控制指令执行相应操作。因此，终端系统中包括有普通的语音识别程序，通过语音识别程序将语音信息获得对应的文本信息，然后再由本实施例的方式来将语音信息的内容转换成标准的格式，以便于生成可操作的控制指令。该语音信息包括的内容并不限定，本实施例以识别语音信息中的时间信息为例，其他内容的识别与转换也可采用本实施例的方案。

本实施例还设有多个配置文件，每个配置文件对应一个分类，例如，星期的配置文件包括星期几、礼拜几、星期几的时间特征，日期的配置文件包括几号、几日的时间特征，月份的配置文件包括几月的时间特征，小时的配置文件包括几点钟的时间特征等待。在文本信息中识别时间特征的方式有多种，本实施例采用的是将语音信息的文本信息内容与各个配置文件中的时间特征进行匹配，获得匹配的时间特征。例如，语音信息的文本信息为“5月8日下午2点半提醒我开会”，则在月份的配置文件month中匹配到时间特征“5月”，日期的配置文件day中匹配到时间特征“8日”，上午/下午的配置文件halfday中匹配到时间特征“下午”，小时的配置文件hour中匹配到时间特征“2点”，分钟配置文件min中匹配到时间特征“点半”。

在配置文件中存储有该分类的多个时间特征，每一个时间特征对应于一个时间符，如图10所示。例如月份的配置文件中“5月”对应时间符5；日期的配置文件中“8日”对应时间符8。对于含义相同的多个时间特征，对应的时间符也相同，例如图10中，周七、周日、周天、星期七、星期日、星期天、礼拜七、礼拜日、礼拜天，这六个时间特征的含义相同，对应时间符都为7。前述实施例中，分钟配置文件min中的时间特征“点半”、“点30”的含义相同，对应时间符都为30。

本实施例将语音信息的文本信息中可能出现的时间特征放入对应类别的配置文件中，将各类别的配置文件与中间数据中的各字段一一对应，在识别语音信息中的时间信息时，从配置文件中查找匹配的时间特征，并获得匹配时间特征对应的时间符，将该对应的时间符赋值给中间数据中的对应字段，并根据该字段的内容生成确切的时间数据，如此一来，所有待匹配的关键时间特征都存放在各自的配置文件中，识别程序只需要从配置文件中提取时间特征对应的时间符，并通过中间文件转换获得确切的时间数据，使程序代码的可读性更强，且有效避免了程序代码冗长，在需要修改或添加时间特征数据时，只需要修改配置文件，无须改动和重新编码程序代码，简化了识别程序的修改过程，为程序代码的维护提供了方便。

如图9所示，图9为本申请从语音信息中识别时间信息的装置的第二实施例的模块示意图。本实施例包括图8所示实施例的模块，还包括配置修改模块150，用于：

接收录入的新的时间特征，确定所述新的时间特征对应的类别；

如果否，则对新的时间特征设置新的时间符。

进一步的，配置查询模块120还用于：

进一步的，中间赋值模块130还用于：

如果是，则将中间数据的本周/下周字段设置为本周；

如果否，则将中间数据的本周/下周字段设置为下周。

进一步的，中间赋值模块130还用于：

当匹配的时间特征中包括明天时，获取当前时间；

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种从语音信息中识别时间信息的方法，其特征在于，包括步骤：

采集语音信息，并识别包含时间信息的语音信息，获得对应于所述语音信息的文本信息；

识别与所述文本信息匹配的至少一个时间特征，并根据所述匹配的时间特征查找至少一个配置文件以获得对应的时间符；

将所述对应的时间符赋值给中间数据中与所述匹配的时间特征所在的配置文件对应的字段；所述中间数据包括多个字段，每个字段对应于一个所述配置文件；

根据所述中间数据中各字段的内容，获得与所述语音信息中的所述时间信息对应的时间数据。
如权利要求1所述的从语音信息中识别时间信息的方法，其特征在于，进一步包括：

接收录入的新的时间特征，确定所述新的时间特征对应的类别；

将所述新的时间特征添加到所述新的时间特征对应类别的配置文件中；

判断在所述对应类别的配置文件中是否存在与所述新的时间特征含义相同的时间特征；

如果是，则根据所述含义相同的时间特征的时间符设置所述新的时间特征对应的时间符；

如果否，则对所述新的时间特征设置新的时间符。
如权利要求1所述的从语音信息中识别时间信息的方法，其特征在于，所述识别与所述文本信息匹配的至少一个时间特征，并根据所述匹配的时间特征查找至少一个配置文件以获得对应的时间符的步骤包括：

在各个配置文件中的时间特征表中查找与所述文本信息匹配的至少一个时间特征；

在所述匹配的时间特征所在的配置文件中的时间符表中查找与所述匹配的时间特征对应的时间符。
如权利要求1至3任一项所述的从语音信息中识别时间信息的方法，其特征在于，所述根据中间数据中各字段的内容，获得与所述语音信息中的时间信息对应的时间数据的步骤之前还包括：

当已完成赋值的所述中间数据中上午/下午字段未赋值，且日期字段未赋值或与当前时间的日期相同时，获取当前时间；

判断已完成赋值的所述中间数据中时间点字段的时间符是否大于当前时间的时间点；

如果是，则将所述中间数据的上午/下午字段设置为与当前时间的时段一致；

如果否，则将所述中间数据的上午/下午字段设置为与当前时间的时段不同的时段。
如权利要求1至3任一项所述的从语音信息中识别时间信息的方法，其特征在于，所述根据中间数据中各字段的内容，获得与所述语音信息中的时间信息对应的时间数据的步骤之前还包括：

当已完成赋值的所述中间数据中星期字段已赋值，且本周/下周字段未赋值时，获取当前时间；

判断已完成赋值的所述中间数据中星期字段的时间符是否大于当前时间的星期数；

如果是，则将所述中间数据的本周/下周字段设置为本周；

如果否，则将所述中间数据的本周/下周字段设置为下周。
如权利要求1至3任一项所述的从语音信息中识别时间信息的方法，其特征在于，所述根据中间数据中各字段的内容，获得与所述语音信息中的时间信息对应的时间数据的步骤之前还包括：

当所述匹配的时间特征中包括明天时，获取当前时间；

在当前时间在上午0点至上午x点范围内时，其中x为预设时间点，则将所述中间数据中日期字段赋值为与当前时间的日期相同。
一种从语音信息中识别时间信息的装置，其特征在于，包括：

语音采集模块，用于采集语音信息，并识别包含时间信息的语音信息，获得对应于所述语音信息的文本信息；

配置查询模块，用于识别与所述文本信息匹配的至少一个时间特征，并根据所述匹配的时间特征查找至少一个配置文件以获得对应的时间符；

中间赋值模块，用于将所述对应的时间符赋值给中间数据中与所述匹配的时间特征所在的配置文件对应的字段；所述中间数据包括多个字段，每个字段对应于一个所述配置文件；

时间转换模块，用于根据所述中间数据中各字段的内容，获得与所述语音信息中的所述时间信息对应的时间数据。
如权利要求7所述的从语音信息中识别时间信息的装置，其特征在于，还包括配置修改模块，用于：

接收录入的新的时间特征，确定所述新的时间特征对应的类别；

将所述新的时间特征添加到所述新的时间特征对应类别的配置文件中；

判断在所述对应类别的配置文件中是否存在与所述新的时间特征含义相同的时间特征；

如果是，则根据所述含义相同的时间特征的时间符设置所述新的时间特征对应的时间符；

如果否，则对所述新的时间特征设置新的时间符。
如权利要求7所述的从语音信息中识别时间信息的装置，其特征在于，所述配置查询模块还用于：

在各个配置文件中的时间特征表中查找与所述文本信息匹配的至少一个时间特征；

在所述匹配的时间特征所在的配置文件中的时间符表中查找与所述匹配的时间特征对应的时间符。
如权利要求7至9任一项所述的从语音信息中识别时间信息的装置，其特征在于，所述中间赋值模块还用于：

当已完成赋值的所述中间数据中上午/下午字段未赋值，且日期字段未赋值或与当前时间的日期相同时，获取当前时间；

判断已完成赋值的所述中间数据中时间点字段的时间符是否大于当前时间的时间点；

如果是，则将所述中间数据的上午/下午字段设置为与当前时间的时段一致；

如果否，则将所述中间数据的上午/下午字段设置为与当前时间的时段不同的时段。
如权利要求7至9任一项所述的从语音信息中识别时间信息的装置，其特征在于，所述中间赋值模块还用于：

当已完成赋值的所述中间数据中星期字段已赋值，且本周/下周字段未赋值时，获取当前时间；

判断已完成赋值的所述中间数据中星期字段的时间符是否大于当前时间的星期数；

如果是，则将所述中间数据的本周/下周字段设置为本周；

如果否，则将所述中间数据的本周/下周字段设置为下周。
如权利要求7至9任一项所述的从语音信息中识别时间信息的装置，其特征在于，所述中间赋值模块还用于：

当所述匹配的时间特征中包括明天时，获取当前时间；

在当前时间在上午0点至上午x点范围内时，其中x为预设时间点，则将所述中间数据中日期字段赋值为与当前时间的日期相同。