WO2014101577A1

WO2014101577A1 - 一种用于提供输入字符串所对应的输入候选项的方法与设备

Info

Publication number: WO2014101577A1
Application number: PCT/CN2013/086968
Authority: WO
Inventors: 陆阳阳; 孟可丰
Original assignee: Baidu Online Network Technology Beijing Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd
Priority date: 2012-12-31
Filing date: 2013-11-12
Publication date: 2014-07-03
Anticipated expiration: 2015-06-30
Also published as: EP2940557B1; US20150293972A1; CN103076892B; CN103076892A; JP2016508264A; EP2940557A1; JP6114403B2; EP2940557A4

Abstract

一种用于提供输入字符串所对应的输入候选项的方法与设备。该方法包括：输入设备获取输入字符串；确定所述输入字符串的上下文信息；根据所述输入字符串，以及所述上下文信息，确定与所述输入字符串对应的一个或多个输入候选项；将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。与现有技术相比，该方法和设备通过根据输入字符串的上下文信息，确定与所述输入字符串对应的一个或多个输入候选项；并将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用；从而提高了输入灵活度，与用户的输入需求相匹配，还提高了输入法的输入效率，改善了用户体验。

Description

一种用于提供输入字符串所对应的输入候选项的方法与设备

技术领域

本发明涉及互联网技术领域，尤其涉及一种用于提供输入字符串所对应的输入候选项的技术。背景技术

对于中文输入而言，存在大量的同音异义词，而实际用户在输入过程中仅会选择其中的一个，当前的输入法将多个输入候选项提供给用户，由用户根据需求进行选择，当输入候选项较多时，用户进行选择操作则会导致输入的緩慢低效。考虑到文字的输入间具有一定的语义或逻辑关系，如何利用所述语义或逻辑关系，对输入候选项进行处理，从而提升用户的使用体验，成为本领域技术人员亟需解决的一个问题。发明内容

本发明的目的是提供一种用于提供输入字符串所对应的输入候选项的方法与设备。

根据本发明的一个方面，提供了一种用于提供输入字符串所对应的输入候选项的方法，其中，该方法包括以下步骤：

a 获取输入字符串；

b 确定所述输入字符串的上下文信息；

c 根据所述输入字符串，以及所述上下文信息，确定与所述输入字符串对应的一个或多个输入候选项；

d 将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。

根据本发明的另一方面，还提供了一种用于提供输入字符串所对应的输入候选项的输入设备，其中，该设备包括：

获取装置，用于获取输入字符串；

上下文确定装置，用于确定所述输入字符串的上下文信息；候选项确定装置，用于根据所述输入字符串，以及所述上下文信息，确定与所述输入字符串对应的一个或多个输入候选项；

提供装置，用于将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。

与现有技术相比，本发明通过根据输入字符串的上下文信息，确定与所述输入字符串对应的一个或多个输入候选项；并将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用；从而提高了输入灵活度，与用户的输入需求相匹配，还提高了输入法的输入效率，改善了用户体验。

而且，本发明还可以通过对与所述输入字符串对应的一个或多个初步输入候选项进行处理，以获得所述一个或多个输入候选项；进一步地，还可以根据所述初步输入候选项与所述上下文信息对应的搭配相关度信息，对所述一个或多个初步输入候选项进行处理，以获得所述一个或多个输入候选项；更进一步地，还可以根据对文本信息的分析处理，获得搭配频度满足一定阈值的分词搭配关系，从而建立或更新所述词语搭配数据库；从而提高了输入字符串与输入候选项的匹配准确度，与用户的输入需求相匹配，提高了输入法的输入效率，改善了用户体猃。

而且，本发明还可以确定包含所述输入字符串的增补字符串，并根据所述增补字符串，获得与所述增补字符串对应的一个或多个增补输入候选项，通过对所述增补输入候选项进行筛选处理，以获得所述一个或多个输入候选项；从而提高了输入灵活度，提高了输入字符串与输入候选项的匹配准确度，与用户的输入需求相匹配，提高了输入法的输入效率，改善了用户体 ^r。

而且，本发明还可以所述输入字符串所对应的相关文本进行自然语言处理，从所述相关文本提取对应的焦点词语，以作为所述上下文；从而提高了输入字符串与输入候选项的匹配准确度，与用户的输入需求相匹配，提高了输入法的输入效率，改善了用户体 ^r。

而且，本发明还可以检测所述输入字符串是否超出预定的长度阈值，若所述输入字符串超出所述长度阈值，根据所述输入字符串，以及所述上下文信息，迭代确定与所述输入字符串对应的一个或多个输入候选项；进一步地，通过检测所述输入字符串在输入词库中对应的一个或多个抽样输入候选项中至少一个中的字数是超出预定的字数阈值，以确定所述输入字符串是否超出预定的长度阈值；进一步地，当所述输入字符串超出所述长度阈值，还可以确定部分输入候选项与其余输入候选项，并才艮据所述一个或多个部分输入候选项，以及所述一个或多个其余输入候选项，确定所述一个或多个输入候选项；从而提高了输入灵活度，提高了输入字符串与输入候选项的匹配准确度，与用户的输入需求相匹配，提高了输入法的输入效率，改善了用户体验。附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图 1示出根据本发明一个方面的一种用于提供输入字符串所对应的输入候选项的输入设备示意图；

图 2示出根据本发明一个优选实施例的一种用于提供输入字符串所对应的输入候选项的输入设备示意图；

图 3示出根据本发明另一个优选实施例的一种用于提供输入字符串所对应的输入候选项的输入设备示意图；

图 4示出根据本发明另一个方面的一种用于提供输入字符串所对应的输入候选项的方法流程图；

图 5示出根据本发明一个优选实施例的一种用于提供输入字符串所对应的输入候选项的方法流程图；

图 6示出根据本发明另一个优选实施例的一种用于提供输入字符串所对应的输入候选项的方法流程图。

附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式

下面结合附图对本发明作进一步详细描述。

图 1示出根据本发明一个方面的一种用于提供输入字符串所对应的输入候选项的输入设备示意图；其中，所述输入设备包括获取装置

11、上下文确定装置 12、候选项确定装置 13、提供装置 14。具体地，获取装置 11获取输入字符串；上下文确定装置 12确定所述输入字符串的上下文信息；候选项确定装置 13根据所述输入字符串，以及所述上下文信息，确定与所述输入字符串对应的一个或多个输入候选项；提供装置 14将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。在此，输入设备包括但不限于网络设备、用户设备、或网络设备与用户设备通过网络相集成所构成的设备。其中，所述网络设备其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云；在此，云由基于云计算（ Cloud Computing )的大量计算机或网络服务器构成，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述用户设备其包括但不限于任何一种可与用户通过键盘、遥控器、触摸板、或声控设备进行人机交互的电子产品，例如计算机、智能手机、 PDA, 游戏机、或 IPTV等。所述网络包括但不限于互联网、广域网、城域网、局域网、 VPN网络、无线自组织网络（Ad Hoc 网络）等。本领域技术人员应能理解，其他的输入设备同样适用于本发明，也应包含在本发明保护范围以内，并在此以引用方式包含于此。

上述各装置之间是持续不断工作的，在此，本领域技术人员应理解"持续"是指上述各装置分别实时地或者按照设定的或实时调整的工作模式要求，进行输入字符串的获取、上下文信息的确定、输入候选项的确定、输入候选项的提供等，直至输入设备停止获取输入字符串。

获取装置 11获取输入字符串。具体地，所述获取装置 11通过从输入框中接收用户或其他应用等通过输入、选择、点击等操作所输入的字符串；或者根据各种通信协议 (Communications Protocol), 通过各种数据传输接口，获取从其他应用的输入框中的字符串；其中，所述输入框如短信编辑框、内容输入框等。其中，所述输入字符串包括但不限于通过如全拼或简拼等方式所输入的拼音编码字符等。

上下文确定装置 12确定所述输入字符串的上下文信息。具体地，所述上下文确定装置 12通过根据获取装置 11所获取的输入字符串，利用当前所输入的字符串所属的文字等，将所述当前输入字符串所属的文字与一个或多个词库进行匹配，获取与所述输入字符串相关联的一种或多种匹配信息，并作为所述输入字符串的上下文信息；例如，当输入 "huacao" 时，先确定所述输入字符串所属的文字可能为 "花草"，根据 "花草" 在所属词库中的匹配信息，确定其下文信息可能为 "茶" 等；或者，所述上下文确定装置 12通过根据与所述输入字符串相对应的历史记录信息，对所述输入字符串的上下文信息进行确定，例如，所述输入字符串前刚刚上屏的前一个输入字符串，则可作为所述输入字符串的前文信息。在此，所述上下文信息包括但不限于与所述输入字符串相对应的上文信息或下文信息；例如，当所述输入为 "shishi"时，当前次输入所上屏的词组为 "客观"时，则所述 "shishi" 对应的上文信息为 "客观"；若屏幕上存在一个词组 "计划"，且输入 "shishi" 时，光标位于 "计划" 前，则其所对应的下文信息为 "计划" 等。

候选项确定装置 13根据所述输入字符串，以及所述上下文信息，确定与所述输入字符串对应的一个或多个输入候选项。具体地，候选项确定装置 13通过根据获取装置 11所获取的输入字符串，以及上下文确定装置 12所确定的上下文信息，通过将与所述输入字符串相对应的一个或多个上下文信息直接作为一个或多个输入候选项，或者将所述输入字符串相对应的上下文信息进行处理后作为输入候选项的方式，确定与所述输入字符串对应的一个或多个输入候选项。例如，继上例，当所述输入字符串为 "shishi" 时，其所对应的上文信息可能为 "客观"， "我"， "谈论" 等，当所述上文信息为 "客观" 时，通过利用将所述输入字符串，以及所述上下文信息进行匹配等的方式，确定输入候选项为 "事实"、 "实时"、 "实施" 等；当所述上文信息为 "我" 时，确定输入候选项为 "试试"、 "实施"、 "试试" 等；当所述上文信息为 "谈论" 时，确定输入候选项为 "时事"、 "事实"、 "世事" 等。

提供装置 14将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。具体地，提供装置 14通过直接提供，或才艮据各种通信协议 (Communications Protocol), 通过各种数据传输接口，通过例如重新排序或筛选等方式，将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。其中，所述目标应用包括但不限于与所述获取装置 11 所对应的输入框相对应的相同应用，或者与所述获取装置 11 所对应的输入框相关联的其他应用等，如直接利用所述输入候选项进行搜索等。

优选地，所述候选项确定装置 13还可以才艮据所述输入字符串，以及所述上下文信息，确定包含所述输入字符串的增补字符串，其中，所述增补字符串还包括所述上下文信息所对应的字符串；才艮据所述增补字符串，在输入词库中进行匹配查询，以获得与所述增补字符串对应的一个或多个增补输入候选项；才艮据所述上下文信息，对所述一个或多个增补输入候选项进行筛选处理，以获得所述一个或多个输入候选项。具体地，所述候选项定装置 13 还可以根据所述输入字符串，以及所述上下文信息，通过将所述输入字符串结合所述上下文信息与例如输入词库进行匹配等方式，确定包含所述输入字符串的增补字符串，例如，当输入字符串为 "xuxu" 时，当上下文信息为 "形态"，则确定所述增补字符串为 "rusheng"; 或者，当输入字符串为" tianan", 上下文信息为 "北京"，则确定所述增补字符串为 "men" , 在此，所述增补字符串包括但不限于通过匹配等方式，确定一个或多个通过拼接而成的多段字符串。所述候选项定装置 13 通过将所述增补字符串在输入词库中进行匹配查询，以获得与所述增补字符串对应的一个或多个增补输入候选项；继前例，所述增补字符串为 "rusheng"时所对应的增补输入候选项如 "如生"、 "入声"、 "入胜" 等，所述增补字符串为 "men" 时，所对应的增补输入候选项如 "天安门"、 "门" 等。或者，所述增补输入候选项还可以直接包括所述上下文信息，如直接生成 "形态栩栩如生"、 "北京天安门" 等。根据所述上下文信息，对所述一个或多个增补输入候选项进行筛选处理，继前例，根据上下文信息，分别确定输入候选项为 "栩栩如生"、 "天安门" 从而获得所述一个或多个输入候选项；在此，若所述增补输入候选项中包含上下文信息，则将所述增补输入候选项中的上下文信息删除后，获得所述一个或多个输入候选项，如所述增补输入候选项 "北京天安门" 中的 "北京" 删除，获得所述一个或多个输入候选项 "天安门，，。

优选地，所述上下文确定装置 12还可以通过对所述输入字符串所对应的相关文本进行自然语言处理，从所述相关文本提取对应的焦点词语，以作为所述上下文，其中，所述焦点词语邻近所述输入字符串所对应的输入位置。具体地，所述上下文确定装置 12还可以通过分词或语义分析等方式，对所述输入字符串所对应的相关文本进行自然语言处理，其中，所述相关文本包括但不限于所述输入字符串本身所对应的文本，或者所述输入字符串所对应的输入位置前后已经上屏的相关文本；通过对所述相关文本中经由自然语言处理，提取对应的焦点词语以作为所述上下文。例如，当所述输入字符串为 "shishi" 时，其对应的相关文本为 "上海地铁一期工程"，且所述输入字符串位于 "上海地铁一期工程"之后，通过对所述相关文本进行自然语言处理，提取焦点词语为 "工程"，并将"工程"作为上下文。进一步地，因此，当输入字符串为 "shishi" 时，该输入设备才艮据所述上下文 "工程"，确定输入候选项为 "实施"、 "实时"、 "试试" 等。

图 2示出根据本发明一个优选实施例的一种用于提供输入字符串所对应的输入候选项的输入设备示意图；其中，所述输入设备包括获取装置 11 '、上下文确定装置 12'、候选项确定装置 13'、提供装置 14' , 在此，所述候选项确定装置 13，包括匹配单元 131，和处理单元 132，。具体地，获取装置 1 Γ获取输入字符串；上下文确定装置 12'确定所述输入字符串的上下文信息；匹配单元 131，才艮据所述输入字符串，在输入词库中进行匹配查询，以获得与所述输入字符串对应的一个或多个初步输入候选项；处理单元 132，根据所述上下文信息，对所述一个或多个初步输入候选项进行处理，以获得所述一个或多个输入候选项；提供装置 14'将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。其中，所述获取装置 11，、上下文确定装置 12，、提供装置 14，与图 1所示对应装置相同或基本相同，故此处不再赘述，并通过引用的方式包含于此。

上述各装置之间是持续不断工作的，在此，本领域技术人员应理解"持续"是指上述各装置分别实时地或者按照设定的或实时调整的工作模式要求，进行输入字符串的获取、上下文信息的确定、初步输入候选项的获取、输入候选项的确定、输入候选项的提供等，直至输入设备停止获取输入字符串。

匹配单元 131，根据所述输入字符串，在输入词库中进行匹配查询，以获得与所述输入字符串对应的一个或多个初步输入候选项。具体地，所述匹配单元 131，通过获取所述输入字符串，将所述输入字符串与输入词库中的词进行匹配，以获得与所述输入字符串对应的一个或多个初步输入候选项。例如，当输入字符串为 "shishi" 时，根据在输入词库中进行匹配查询后，获取 "实时"、 "试试"、 "实施"、 "事实"、 "适时"、 "逝世" 等多个初步输入候选项。

处理单元 132，根据所述上下文信息，对所述一个或多个初步输入候选项进行处理，以获得所述一个或多个输入候选项。具体地，处理单元 132'根据所述输入字符串的上下文信息，通过根据自然语言模型或词语搭配数据库等，确定上下文信息与初步输入候选项的搭配概率，并根据所述搭配概率对所述初步输入候选项进行筛选或排序，以获得输入候选项。例如，继前例，当上下文信息为 "客观"，则经处理后，将初步输入候选项进行重新排序，顺序变为 "事实"、 "实时"、 "试试"、 "实施"、 "适时"、 "逝世" 等。优选地，所述处理单元 132，还可以根据所述上下文信息，在词语搭配数据库中进行匹配查询，以确定所述初步输入候选项与所述上下文信息对应的搭配相关度信息；根据所述搭配相关度信息，对所述一个或多个初步输入候选项进行处理，以获得所述一个或多个输入候选项。具体地，所述处理单元 132，还可以根据所述上下文信息，在词语搭配数据库中进行匹配查询，通过才艮据所述词语搭配数据库中的一个或多个词条与所述上下文的匹配关系等，确定所述初步输入候选项与所述上下文信息对应的搭配相关度信息；例如若或为 bull变量，则所述搭配相关度信息表示如是否存在搭配；或为连续变量，如所述搭配相关度信息表示搭配概率为多少；在此，所述搭配相关度信息可根据如词语搭配数据库或其他相关数据库中的上下文与初步输入候选项的组合频率等通过机器学习获得。根据所述搭配相关度信息，通过对所述一个或多个初步输入候选项进行如筛选或排序处理，获得所述一个或多个输入候选项。

更优选地，所述输入设备还包括文本处理装置（未示出）和建立装置（未示出）；其中，文本处理装置对一个或多个文本信息进行分析处理，以获得搭配频度满足一定阈值的分词搭配关系；建立装置根据所述分词搭配关系，建立或更新所述词语搭配数据库。具体地，文本处理装置例如通过对各类日志、各类文章等进行获取，并对所获取文本信息进行如先分词，后统计相邻词间的共现频率等分析方法，当所述共现频率超过一定阈值时，则判断所述相邻词间存在一定的搭配关系，从而获得搭配频度满足一定阈值的分词搭配关系；建立装置根据所述分词搭配关系，建立所述词语搭配数据库，或对现有词语搭配数据库进行更新等，在此，所述词语搭配数据库中包括但不限于分词搭配关系以及分词搭配关系之间的搭配概率信息；并且，所述词语搭配数据库中可包含现有固定词语，如成语、俗语等，同时经过所述更新，可以将由于现有网络应用的快速发展所产生的新的词语及表述进行包含，从而有效提高用户的输入效率。

图 3示出根据本发明另一个优选实施例的一种用于提供输入字符串所对应的输入候选项的输入设备示意图；其中，所述输入设备包括获取装置 11"、上下文确定装置 12"、候选项确定装置 13"、提供装置 14", 在此，所述候选项确定装置 13"包括检测单元 133"和迭代单元 134"。具体地，获取装置 11"获取输入字符串；上下文确定装置 12" 确定所述输入字符串的上下文信息；检测单元 133"检测所述输入字符串是否超出预定的长度阈值；若所述输入字符串超出所述长度阈值，迭代单元 134 艮据所述输入字符串，以及所述上下文信息，迭代确定与所述输入字符串对应的一个或多个输入候选项；提供装置 14"将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。其中，所述获取装置 11"、上下文确定装置 12"、提供装置 14"与图 1 所示对应装置相同或基本相同，故此处不再赘述，并通过引用的方式包含于此。

上述各装置之间是持续不断工作的，在此，本领域技术人员应理解"持续"是指上述各装置分别实时地或者按照设定的或实时调整的工作模式要求，进行输入字符串的获取、上下文信息的确定、长度阈值的检测、输入候选项的确定、输入候选项的提供等，直至输入设备停止获取输入字符串。

检测单元 133"检测所述输入字符串是否超出预定的长度阈值。具体地，所述检测单元 133"通过基于预置的或用户自行设置的长度阈值，对所述输入字符串的长度进行检测，检测所述输入字符串的长度是否超出了预定的长度阈值。例如，当预定的字符长度阈值为 N, 当所述输入字符串的长度为 N+1时，则检测单元 133"检测所述输入字符串超出了预定的长度阈值。

若所述输入字符串超出所述长度阈值，迭代单元 134"根据所述输入字符串，以及所述上下文信息，迭代确定与所述输入字符串对应的一个或多个输入候选项。具体地，若所述输入字符串超出所述长度阈值，迭代单元 134"通过根据所述输入字符串，以及所述上下文信息，通过例如根据所述长度阈值，对所述输入字符串进行分段等处理，确定与第一个长度阈值的输入字符串所对应的所述输入候选项，并将所确定的输入候选项再次作为上下文信息，从而迭代确定下一个长度阈值的输入字符串所对应的输入候选项等的方式，确定与所述输入字符串对应的一个或多个输入候选项。

优选地，所述检测单元 133"还可以获取所述输入字符串在输入词库中对应的一个或多个抽样输入候选项；检测所述一个或多个抽样输入候选项中至少一个中的字数是超出预定的字数阈值，以确定所述输入字符串是否超出预定的长度阈值。具体地，所述检测单元 133"还可以通过例如将所述输入字符串直接在所述输入词库中进行匹配，获取与所述全部输入字符串所对应的一个或多个输入候选项，并从中随机抽取或指定抽取（如选择第一个输入候选项等）方式，获取所述输入字符串在输入词库中对应的一个或多个抽样输入候选项；通过对所述一个或多个抽样输入候选项进行检测，如所述抽样输入候选项中的其中至少一个字数超出预定的字数阈值，则确定所述输入字符串是否超出预定的长度阈值。

优选地，所述迭代单元 134"还可以当所述输入字符串超出所述长度阈值，根据所述上下文信息，以及所述输入字符串中与所述上下文信息相邻的部分输入字符串，确定与所述部分输入字符串对应的一个或多个部分输入候选项；根据所述部分输入字符串，以及所述输入字符串中其余输入字符串，确定与所述其余输入字符串对应的一个或多个其余输入候选项，其中，所述部分输入候选项被用作所述其余输入字符串的上下文信息；才艮据所述一个或多个部分输入候选项，以及所述一个或多个其余输入候选项，确定所述一个或多个输入候选项。

具体地，当所述输入字符串超出所述长度阈值，根据所述上下文信息，通过例如分词等处理，对所述输入字符串进行分词或分段等，从而获取所述输入字符串中与所述上下文信息相邻的部分输入字符串，通过将所述部分输入字符串结合所述上下文信息，确定与所述部分输入字符串对应的一个或多个部分输入候选项；在此，所述确定方法与图 1中所述候选项确定装置 13 中的确定方法相同或相似，故此处不再赘述，并通过引用的方式包含于此。所述迭代单元 134"将所述部分输入候选项作为其余输入字符串的上下文信息，通过迭代的方式，确定与所述其余输入字符串相对应的一个或多个其余输入候选项；迭代后通过例如对字符串之间的关系，对所述部分输入候选项与其余输入候选项进行拼接等方式，确定一个或多个输入候选项。

图 4示出根据本发明另一个方面的一种用于提供输入字符串所对应的输入候选项的方法流程图。具体地，在步骤 si 中，输入设备获取输入字符串；在步骤 s2 中，输入设备确定所述输入字符串的上下文信息；在步骤 S3 中，输入设备根据所述输入字符串，以及所述上下文信息，确定与所述输入字符串对应的一个或多个输入候选项；在步骤 s4 中，输入设备将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。

上述各步骤之间是持续不断工作的，在此，本领域技术人员应理解"持续"是指上述各步骤分别实时地或者按照设定的或实时调整的工作模式要求，进行输入字符串的获取、上下文信息的确定、输入候选项的确定、输入候选项的提供等，直至输入设备停止获取输入字符串。

在步骤 si中，输入设备获取输入字符串。具体地，在步骤 si中，输入设备通过从输入框中接收用户或其他应用等通过输入、选择、点击等操作所输入的字符串；或者根据各种通信协议 (Communications Protocol), 通过各种数据传输接口，获取从其他应用的输入框中的字符串；其中，所述输入框如短信编辑框、内容输入框等。其中，所述输入字符串包括但不限于通过如全拼或简拼等方式所输入的拼音编码字付矛。

在步骤 s2 中，输入设备确定所述输入字符串的上下文信息。具体地，在步骤 s2中，输入设备通过根据步骤 si所获取的输入字符串，利用当前所输入的字符串所属的文字等，将所述当前输入字符串所属的文字与一个或多个词库进行匹配，获取与所述输入字符串相关联的一种或多种匹配信息，并作为所述输入字符串的上下文信息；例如，当输入 "huacao" 时，先确定所述输入字符串所属的文字可能为 "花草"，根据 "花草" 在所属词库中的匹配信息，确定其下文信息可能为 "茶" 等；或者，在步骤 s2 中，输入设备通过根据与所述输入字符串相对应的历史记录信息，对所述输入字符串的上下文信息进行确定，例如，所述输入字符串前刚刚上屏的前一个输入字符串，则可作为所述输入字符串的前文信息。在此，所述上下文信息包括但不限于与所述输入字符串相对应的上文信息或下文信息；例如，当所述输入为 "shishi"时，当前次输入所上屏的词组为 "客观"时，则所述 "shishi" 对应的上文信息为 "客观"；若屏幕上存在一个词组 "计划"，且输入 "shishi" 时，光标位于 "计划" 前，则其所对应的下文信息为 "计划" 等。

在步骤 S3 中，输入设备根据所述输入字符串，以及所述上下文信息，确定与所述输入字符串对应的一个或多个输入候选项。具体地，在步骤 S3中，输入设备通过根据步骤 si中所获取的输入字符串，以及步骤 si 中所确定的上下文信息，通过将与所述输入字符串相对应的一个或多个上下文信息直接作为一个或多个输入候选项，或者将所述输入字符串相对应的上下文信息进行处理后作为输入候选项的方式，确定与所述输入字符串对应的一个或多个输入候选项。例如，继上例，当所述输入字符串为 "shishi" 时，其所对应的上文信息可能为 "客观"， "我"， "谈论" 等，当所述上文信息为 "客观" 时，通过利用将所述输入字符串，以及所述上下文信息进行匹配等的方式，确定输入候选项为 "事实"、 "实时"、 "实施"等；当所述上文信息为 "我" 时，确定输入候选项为 "试试"、 "实施"、 "试试" 等；当所述上文信息为 "谈论" 时，确定输入候选项为 "时事"、 "事实"、 "世事" 等。

在步骤 s4 中，输入设备将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。具体地，在步骤 s4中，输入设备通过直接提供，或 4艮据各种通信协议（Communications Protocol), 通过各种数据传输接口，通过例如重新排序或筛选等方式，将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。其中，所述目标应用包括但不限于与所述步骤 si 中所对应的输入框相对应的相同应用，或者与所述步骤 si 中所对应的输入框相关联的其他应用等，如直接利用所述输入候选项进行搜索等。

优选地，在步骤 s3中，输入设备还可以根据所述输入字符串，以及所述上下文信息，确定包含所述输入字符串的增补字符串，其中，所述增补字符串还包括所述上下文信息所对应的字符串；才据所述增补字符串，在输入词库中进行匹配查询，以获得与所述增补字符串对应的一个或多个增补输入候选项；才艮据所述上下文信息，对所述一个或多个增补输入候选项进行筛选处理，以获得所述一个或多个输入候选项。具体地，在步骤 s3中，输入设备还可以根据所述输入字符串，以及所述上下文信息，通过将所述输入字符串结合所述上下文信息与例如输入词库进行匹配等方式，确定包含所述输入字符串的增补字符串，例如，当输入字符串为 "xuxu" 时，当上下文信息为 "形态"，则确定所述增补字符串为 "rusheng"; 或者，当输入字符串为" tianan", 上下文信息为 "北京"，则确定所述增补字符串为 "men" , 在此，所述增补字符串包括但不限于通过匹配等方式，确定一个或多个通过拼接而成的多段字符串。在步骤 s3 中，输入设备通过将所述增补字符串在输入词库中进行匹配查询，以获得与所述增补字符串对应的一个或多个增补输入候选项；继前例，所述增补字符串为 "rusheng"时所对应的增补输入候选项如 "如生"、 "入声"、 "入胜" 等，所述增补字符串为 "men" 时，所对应的增补输入候选项如 "天安门"、 "门" 等。或者，所述增补输入候选项还可以直接包括所述上下文信息，如直接生成 "形态栩栩如生"、 "北京天安门" 等。根据所述上下文信息，对所述一个或多个增补输入候选项进行筛选处理，继前例，才艮据上下文信息，分别确定输入候选项为 "栩栩如生"、 "天安门" 从而获得所述一个或多个输入候选项；在此，若所述增补输入候选项中包含上下文信息，则将所述增补输入候选项中的上下文信息删除后，获得所述一个或多个输入候选项，如所述增补输入候选项 "北京天安门" 中的 "北京" 删除，获得所述一个或多个输入候选项 "天安门"。

优选地，在步骤 s2中，输入设备还可以通过对所述输入字符串所对应的相关文本进行自然语言处理，从所述相关文本提取对应的焦点词语，以作为所述上下文，其中，所述焦点词语邻近所述输入字符串所对应的输入位置。具体地，在步骤 s2中，输入设备还可以通过分词或语义分析等方式，对所述输入字符串所对应的相关文本进行自然语言处理，其中，所述相关文本包括但不限于所述输入字符串本身所对应的文本，或者所述输入字符串所对应的输入位置前后已经上屏的相关文本；通过对所述相关文本中经由自然语言处理，提取对应的焦点词语以作为所述上下文。例如，当所述输入字符串为 "shishi" 时，其对应的相关文本为 "上海地铁一期工程"，且所述输入字符串位于 "上海地铁一期工程"之后，通过对所述相关文本进行自然语言处理，提取焦点词语为 "工程"，并将"工程"作为上下文。进一步地，因此，当输入字符串为 "shishi" 时，该输入设备才艮据所述上下文 "工程"，确定输入候选项为 "实施"、 "实时"、 "试试" 等。

图 5示出根据本发明一个优选实施例的一种用于提供输入字符串所对应的输入候选项的方法流程图。具体地，在步骤 sl，中，输入设备获取输入字符串；在步骤 s2，中，输入设备确定所述输入字符串的上下文信息；在步骤 s31，中，输入设备根据所述输入字符串，在输入词库中进行匹配查询，以获得与所述输入字符串对应的一个或多个初步输入候选项；在步骤 s32，中，输入设备根据所述上下文信息，对所述一个或多个初步输入候选项进行处理，以获得所述一个或多个输入候选项；在步骤 s4'中，输入设备将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。其中，所述步骤 sl '、步骤 s2，、步骤 s4，与图 4所示对应步骤相同或基本相同，故此处不再赘述，并通过引用的方式包含于此。

上述各步骤之间是持续不断工作的，在此，本领域技术人员应理解"持续"是指上述各步骤分别实时地或者按照设定的或实时调整的工作模式要求，进行输入字符串的获取、上下文信息的确定、初步输入候选项的获取、输入候选项的确定、输入候选项的提供等，直至输入设备停止获取输入字符串。在步骤 s31 '中，输入设备根据所述输入字符串，在输入词库中进行匹配查询，以获得与所述输入字符串对应的一个或多个初步输入候选项。具体地，在步骤 s31，中，输入设备通过获取所述输入字符串，将所述输入字符串与输入词库中的词进行匹配，以获得与所述输入字符串对应的一个或多个初步输入候选项。例如，当输入字符串为 "shishi" 时，根据在输入词库中进行匹配查询后，获取 "实时"、 "试试"、 "实施"、 "事实"、 "适时"、 "逝世" 等多个初步输入候选项。

在步骤 s32，中，输入设备根据所述上下文信息，对所述一个或多个初步输入候选项进行处理，以获得所述一个或多个输入候选项。具体地，在步骤 s32，中，输入设备根据所述输入字符串的上下文信息，通过根据自然语言模型或词语搭配数据库等，确定上下文信息与初步输入候选项的搭配概率，并根据所述搭配概率对所述初步输入候选项进行筛选或排序，以获得输入候选项。例如，继前例，当上下文信息为 "客观 "，则经处理后，将初步输入候选项进行重新排序，顺序变为 "事实"、 "实时"、 "试试"、 "实施"、 "适时"、 "逝世" 等。

优选地，在步骤 s32，中，输入设备还可以根据所述上下文信息，在词语搭配数据库中进行匹配查询，以确定所述初步输入候选项与所述上下文信息对应的搭配相关度信息；根据所述搭配相关度信息，对所述一个或多个初步输入候选项进行处理，以获得所述一个或多个输入候选项。具体地，在步骤 s32，中，输入设备还可以根据所述上下文信息，在词语搭配数据库中进行匹配查询，通过根据所述词语搭配数据库中的一个或多个词条与所述上下文的匹配关系等，确定所述初步输入候选项与所述上下文信息对应的搭配相关度信息；例如若或为 bull变量，则所述搭配相关度信息表示如是否存在搭配；或为连续变量，如所述搭配相关度信息表示搭配概率为多少；在此，所述搭配相关度信息可根据如词语搭配数据库或其他相关数据库中的上下文与初步输入候选项的组合频率等通过机器学习获得。根据所述搭配相关度信息，通过对所述一个或多个初步输入候选项进行如筛选或排序处理，获得所述一个或多个输入候选项。更优选地，所述方法还包括步骤 s5，（未示出）和步骤 s6，（未示出）；其中，在步骤 s5'中，输入设备对一个或多个文本信息进行分析处理，以获得搭配频度满足一定阈值的分词搭配关系；在步骤 s6，中，输入设备根据所述分词搭配关系，建立或更新所述词语搭配数据库。具体地，在步骤 s5'中，输入设备例如通过对各类日志、各类文章等进行获取，并对所获取文本信息进行如先分词，后统计相邻词间的共现频率等分析方法，当所述共现频率超过一定阈值时，则判断所述相邻词间存在一定的搭配关系，从而获得搭配频度满足一定阈值的分词搭配关系；在步骤 s6，中，输入设备根据所述分词搭配关系，建立所述词语搭配数据库，或对现有词语搭配数据库进行更新等，在此，所述词语搭配数据库中包括但不限于分词搭配关系以及分词搭配关系之间的搭配概率信息；并且，所述词语搭配数据库中可包含现有固定词语，如成语、俗语等，同时经过所述更新，可以将由于现有网络应用的快速发展所产生的新的词语及表述进行包含，从而有效提高用户的输入效率。

图 6示出根据本发明另一个优选实施例的一种用于提供输入字符串所对应的输入候选项的方法流程图。具体地，在步骤 si '，中，输入设备获取输入字符串；在步骤 s2"中，输入设备确定所述输入字符串的上下文信息；在步骤 s33"中，输入设备检测所述输入字符串是否超出预定的长度阈值；若所述输入字符串超出所述长度阈值，在步骤 s34" 中，输入设备根据所述输入字符串，以及所述上下文信息，迭代确定与所述输入字符串对应的一个或多个输入候选项；在步骤 s4"中，输入设备将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。其中，所述步骤 sl "、步骤 s2"、步骤 s4"与图 4 所示对应步骤相同或基本相同，故此处不再赘述，并通过引用的方式包含于此。

上述各步骤之间是持续不断工作的，在此，本领域技术人员应理解"持续"是指上述各步骤分别实时地或者按照设定的或实时调整的工作模式要求，进行输入字符串的获取、上下文信息的确定、长度阈值的检测、输入候选项的确定、输入候选项的提供等，直至输入设备停止获取输入字符串。

在步骤 s33"中，输入设备检测所述输入字符串是否超出预定的长度阈值。具体地，在步骤 s33"中，输入设备通过基于预置的或用户自行设置的长度阈值，对所述输入字符串的长度进行检测，检测所述输入字符串的长度是否超出了预定的长度阈值。例如，当预定的字符长度阈值为 N, 当所述输入字符串的长度为 N+1时，则在步骤 s33"中，输入设备检测所述输入字符串超出了预定的长度阈值。

若所述输入字符串超出所述长度阈值，在步骤 s34"中，输入设备根据所述输入字符串，以及所述上下文信息，迭代确定与所述输入字符串对应的一个或多个输入候选项。具体地，若所述输入字符串超出所述长度阈值，在步骤 s34"中，输入设备通过根据所述输入字符串，以及所述上下文信息，通过例如根据所述长度阈值，对所述输入字符串进行分段等处理，确定与第一个长度阈值的输入字符串所对应的所述输入候选项，并将所确定的输入候选项再次作为上下文信息，从而迭代确定下一个长度阈值的输入字符串所对应的输入候选项等的方式，确定与所述输入字符串对应的一个或多个输入候选项。

优选地，在步骤 s33"中，输入设备还可以获取所述输入字符串在输入词库中对应的一个或多个抽样输入候选项；检测所述一个或多个抽样输入候选项中至少一个中的字数是超出预定的字数阈值，以确定所述输入字符串是否超出预定的长度阈值。具体地，在步骤 s33"中，输入设备还可以通过例如将所述输入字符串直接在所述输入词库中进行匹配，获取与所述全部输入字符串所对应的一个或多个输入候选项，并从中随机抽取或指定抽取（如选择第一个输入候选项等）方式，获取所述输入字符串在输入词库中对应的一个或多个抽样输入候选项；通过对所述一个或多个抽样输入候选项进行检测，如所述抽样输入候选项中的其中至少一个字数超出预定的字数阈值，则确定所述输入字符串是否超出预定的长度阈值。

优选地，在步骤 s34"中，输入设备还可以当所述输入字符串超出所述长度阈值，根据所述上下文信息，以及所述输入字符串中与所述上下文信息相邻的部分输入字符串，确定与所述部分输入字符串对应的一个或多个部分输入候选项；根据所述部分输入字符串，以及所述输入字符串中其余输入字符串，确定与所述其余输入字符串对应的一个或多个其余输入候选项，其中，所述部分输入候选项被用作所述其余输入字符串的上下文信息；才据所述一个或多个部分输入候选项，以及所述一个或多个其余输入候选项，确定所述一个或多个输入候选项。

具体地，当所述输入字符串超出所述长度阈值，根据所述上下文信息，通过例如分词等处理，对所述输入字符串进行分词或分段等，从而获取所述输入字符串中与所述上下文信息相邻的部分输入字符串，通过将所述部分输入字符串结合所述上下文信息，确定与所述部分输入字符串对应的一个或多个部分输入候选项；在此，所述确定方法与图 4 中所述步骤 s 3 中的确定方法相同或相似，故此处不再赘述，并通过引用的方式包含于此。在步骤 s 34"中，输入设备将所述部分输入候选项作为其余输入字符串的上下文信息，通过迭代的方式，确定与所述其余输入字符串相对应的一个或多个其余输入候选项；迭代后通过例如对字符串之间的关系，对所述部分输入候选项与其余输入候选项进行拼接等方式，确定一个或多个输入候选项。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然"包括"一词不排除其他单元或步骤，单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

Claims

权利要求书

1. 一种用于提供输入字符串所对应的输入候选项的方法，其中，该方法包括以下步骤：

a获取输入字符串；

b确定所述输入字符串的上下文信息；

c才艮据所述输入字符串，以及所述上下文信息，确定与所述输入字符串对应的一个或多个输入候选项；

2. 根据权利要求 1所述的方法，其中，所述步骤 c包括：

-根据所述输入字符串，在输入词库中进行匹配查询，以获得与所述输入字符串对应的一个或多个初步输入候选项；

cl 根据所述上下文信息，对所述一个或多个初步输入候选项进行处理，以获得所述一个或多个输入候选项。

3. 根据权利要求 2所述的方法，其中，所述步骤 cl包括：

-根据所述上下文信息，在词语搭配数据库中进行匹配查询，以确定所述初步输入候选项与所述上下文信息对应的搭配相关度信息；

-根据所述搭配相关度信息，对所述一个或多个初步输入候选项进行处理，以获得所述一个或多个输入候选项。

4. 根据权利要求 3所述的方法，其中，该方法还包括：

-对一个或多个文本信息进行分析处理，以获得搭配频度满足一定阈值的分词搭配关系；

-根据所述分词搭配关系，建立或更新所述词语搭配数据库。

5. 根据权利要求 1所述的方法，其中，所述步骤 c包括：

-根据所述输入字符串，以及所述上下文信息，确定包含所述输入字符串的增补字符串，其中，所述增补字符串还包括所述上下文信息所对应的字符串；

-根据所述增补字符串，在输入词库中进行匹配查询，以获得与所述增补字符串对应的一个或多个增补输入候选项；

-才艮据所述上下文信息，对所述一个或多个增补输入候选项进行筛选处理，以获得所述一个或多个输入候选项。

6. 根据权利要求 1至 5中任一项所述的方法，其中，所述步骤 b包括：

- 通过对所述输入字符串所对应的相关文本进行自然语言处理，从所述相关文本提取对应的焦点词语，以作为所述上下文，其中，所述焦点词语邻近所述输入字符串所对应的输入位置。

7. 根据权利要求 1至 6中任一项所述的方法，其中，所述步骤 c包括：

c2检测所述输入字符串是否超出预定的长度阈值；

c3 若所述输入字符串超出所述长度阈值，根据所述输入字符串，以及所述上下文信息，迭代确定与所述输入字符串对应的一个或多个输入候选项。

8. 根据权利要求 7所述的方法，其中，所述步骤 c2包括：

- 获取所述输入字符串在输入词库中对应的一个或多个抽样输入候选项；

-检测所述一个或多个抽样输入候选项中至少一个中的字数是超出预定的字数阈值，以确定所述输入字符串是否超出预定的长度阈值。

9. 根据权利要求 7或 8所述的方法，其中，所述步骤 c3包括：

- 当所述输入字符串超出所述长度阈值，根据所述上下文信息，以及所述输入字符串中与所述上下文信息相邻的部分输入字符串，确定与所述部分输入字符串对应的一个或多个部分输入候选项；

-根据所述部分输入字符串，以及所述输入字符串中其余输入字符串，确定与所述其余输入字符串对应的一个或多个其余输入候选项，其中，所述部分输入候选项被用作所述其余输入字符串的上下文信息；

-才艮据所述一个或多个部分输入候选项，以及所述一个或多个其余输入候选项，确定所述一个或多个输入候选项。

10. 一种用于提供输入字符串所对应的输入候选项的输入设备，其中，该设备包括：

获取装置，用于获取输入字符串；

上下文确定装置，用于确定所述输入字符串的上下文信息；候选项确定装置，用于才艮据所述输入字符串，以及所述上下文信息，确定与所述输入字符串对应的一个或多个输入候选项；

11. 根据权利要求 10所述的输入设备，其中，所述候选项确定装置包括：

匹配单元，用于根据所述输入字符串，在输入词库中进行匹配查询，以获得与所述输入字符串对应的一个或多个初步输入候选项；

处理单元，用于根据所述上下文信息，对所述一个或多个初步输入候选项进行处理，以获得所述一个或多个输入候选项。

12. 根据权利要求 11所述的输入设备，其中，所述处理单元用于：

13. 根据权利要求 12所述的输入设备，其中，该设备还包括：文本处理装置，用于对一个或多个文本信息进行分析处理，以获得搭配频度满足一定阈值的分词搭配关系；

建立装置，用于根据所述分词搭配关系，建立或更新所述词语搭配数据库。

14. 根据权利要求 10所述的输入设备，其中，所述候选项确定装置用于：

15. 根据权利要求 10至 14中任一项所述的输入设备，其中，所述上下文确定装置用于：

16. 根据权利要求 10至 15中任一项所述的输入设备，其中，所述候选项确定装置包括：

检测单元，用于检测所述输入字符串是否超出预定的长度阈值；迭代单元，用于若所述输入字符串超出所述长度阈值，根据所述输入字符串，以及所述上下文信息，迭代确定与所述输入字符串对应的一个或多个输入候选项。

17. 根据权利要求 16所述的输入设备，其中，所述检测单元用于：

18. 根据权利要求 16或 17所述的输入设备，其中，所述迭代单元用于：