WO2024088039A1

WO2024088039A1 - 人机对话方法、对话网络模型的训练方法及装置

Info

Publication number: WO2024088039A1
Application number: PCT/CN2023/123430
Authority: WO
Inventors: 李一同; 糜飞; 王雅圣; 庄兆永
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2022-10-28
Filing date: 2023-10-08
Publication date: 2024-05-02
Anticipated expiration: 2025-04-28
Also published as: EP4571530A1; EP4571530A4; US20250252267A1; CN117992579A

Abstract

本公开实施例提供了一种人机对话方法、对话网络模型的训练方法及装置，包括：获取第二历史对话数据、当前的对话环境数据、用户输入的第二输入对话数据，根据第二历史对话数据、当前的对话环境数据、第二输入对话数据确定第二语义关键字，根据第二语义关键字和预设类型知识库，生成并输出与第二输入对话数据对应的第二反馈对话数据，其中，预设类型知识库包括：知识图谱、文本知识、以及除知识图谱和文本知识之外的外部知识，可以避免第二反馈对话数据因关键知识的缺失而导致的歧义和语义模糊，提高了第二反馈对话数据的可靠性和有效性，且提高用户的交互体验。

Description

人机对话方法、对话网络模型的训练方法及装置

本申请要求于2022年10月28日提交中国专利局、申请号为202211335469.1、申请名称为“人机对话方法、对话网络模型的训练方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本公开涉及人工智能技术领域，尤其涉及一种人机对话方法、对话网络模型的训练方法及装置。

背景技术

对话系统是人工智能中的重要技术之一，对话系统旨在辅助人类并与人类完成自然、连贯、流畅的交流任务的计算机系统。如，基于对话系统，可以完成人机对话。

在一些实施例中，对话系统可以采集用户发起的用户对话数据，并从预设类型知识库中确定针对用户对话数据的反馈对话数据，并输出反馈对话数据。其中，预设类型知识库包括文本知识和知识图谱。

然而，文本知识和知识图谱中的知识更新相对较慢，可能导致确定出的反馈对话数据有歧义或者不清楚。

发明内容

为提高人机对话的可靠性和有效性，本公开实施例提供了一种人机对话方法、对话网络模型的训练方法及装置。

根据本公开实施例的一个方面，本公开实施例提供了一种人机对话方法，所述方法包括：

获取第二历史对话数据、当前的对话环境数据、用户输入的第二输入对话数据；

根据所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据确定第二语义关键字；

根据所述第二语义关键字和预设类型知识库，生成并输出与所述第二输入对话数据对应的第二反馈对话数据，其中，所述预设类型知识库包括：知识图谱、文本知识、以及除所述知识图谱和文本知识之外的外部知识。

在本实施例中，一方面，通过结合当前的对话环境数据确定第二语义关键字，使得第二语义关键字可以表征更多维度的内容，提高第二语义关键字的丰富表征能力，另一方面，通过引入外部知识确定第二反馈对话数据，以从更多类型的知识中确定第二反馈对话数据，可以避免第二反馈对话数据因关键知识的缺失而导致的歧义和语义模糊，从而提高第二反馈对话数据的可靠性和有效性，提高用户的交互体验。

在一些实施例中，所述根据所述第二语义关键字和预设类型知识库，生成并输出与所述第二输入对话数据对应的第二反馈对话数据，包括：

分别从所述外部知识、所述知识图谱、所述文本知识中，获取与所述第二语义关键字对应的知识；

根据各获取到的与所述第二语义关键字对应的知识，生成并输出所述第二反馈对话数据。

在本实施例中，通过从各类型的知识(即外部知识、知识图谱、文本知识)中，分别获取第二语义关键字对应的知识，使得获取到的知识较为丰富和全面，以便当基于较为丰富和全面的知识确定第二反馈对话数据时，使得第二反馈对话数据具有较高的可靠性和有效性。

在一些实施例中，在所述分别从所述外部知识、所述知识图谱、所述文本知识中，获取与所述第二语义关键字对应的知识之后，所述方法还包括：

根据从第一类型知识获取到的与所述第二语义关键字对应的知识，在至少一个其他类型知识中进行检索，得到与从第一类型知识获取到的与所述第二语义关键字对应的知识相关联的知识；

其中，所述至少一个其他类型知识中的与所述第二语义关键字对应的知识包括检索得到的与所述从第一类型知识获取到的与所述第二语义关键字对应的知识相关联的知识；所述第一类型知识为所述外部知识、所述知识图谱、所述文本知识中的任意一种，所述至少一个其他类型知识为所述外部知识、所述知识图谱、所述文本知识中除所述第一类型知识之外的类型知识。

在本实施例中，通过“多跳检索”的方式从不同类型的知识获取相关联的知识，可以避免知识的遗漏，实现在不同类型的知识中的交叉检索，提高了与第二语义关键字对应的知识的多样性和充分性。

在一些实施例中，根据各获取到的与所述第二语义关键字对应的知识，生成并输出所述第二反馈对话数据，包括：

对各获取到的与所述第二语义关键字对应的知识分别进行编码，得到各自对应的目标特征向量；

根据所述各自对应的目标特征向量，生成并输出所述第二反馈对话数据。

在一些实施例中，所述根据所述各自对应的目标特征向量，生成并输出所述第二反馈对话数据，包括：

对所述各自对应的目标特征向量进行融合处理，得到目标融合特征向量；

根据所述目标融合特征向量生成并输出所述第二反馈对话数据。

在本实施例中，通过对各目标特征向量进行融合处理，以使得目标融合特征向量可以表征各目标特征向量各自对应的特征，以便当基于目标融合特征向量确定第二反馈对话数据时，使得第二反馈对话数据具有较高的可靠性和有效性。

在一些实施例中，所述目标融合特征向量是将所述各自对应的目标特征向量输入至预先训练得到的交叉注意力网络模型得到的。

在一些实施例中，所述根据各获取到的与所述第二语义关键字对应的知识，生成并输出所述第二反馈对话数据，包括：

对各获取到的与所述第二语义关键字对应的知识进行去冗余处理，得到去冗余处理后的知识；

根据所述去冗余处理后的知识生成并输出所述第二反馈对话数据。

在本实施例中，通过去冗余处理，可以避免数据冗余，减少数据处理量，提高交互效率。

在一些实施例中，所述方法还包括：

根据所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据，确定是否需要引入所述外部知识的第三分类结果；

以及，所述根据所述第二语义关键字和预设类型知识库，生成并输出与所述第二输入对话数据对应的第二反馈对话数据，包括：若所述第三分类结果表征为需要引入所述外部知识，则根据所述第二语义关键字和预设类型知识库，生成并输出与所述第二输入对话数据对应的第二反馈对话数据。

在本实施例中，通过先确定是否需要引入外部知识，以便在知识图谱和文本知识无法满足对话需求的情况下，引入外部知识，以结合外部知识确定第二反馈对话数据，使得第二反馈对话数据可以满足用户的对话需求，提高交互体验。

在一些实施例中，所述第三分类结果是将所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据输入至预先训练的二分类网络模型得到的；

其中，所述二分类模型是基于第三样本数据集学习确定是否需要引入所述外部知识的能力的模型，所述第三样本数据集中包括第三样本输入对话数据、第三样本历史对话数据、以及与第三样本输入对话数据对应的第二样本对话环境数据。

在一些实施例中，所述第二语义关键字是将所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据输入至预先训练的生成网络模型得到的；

其中，所述生成网络模型是基于第四样本数据集学习与所述第四样本数据集对应的第三样本语义关键字的能力的模型，所述第四样本数据集中包括第四样本输入对话数据、第四样本历史对话数据、以及与第四样本输入对话数据对应的第三样本对话环境数据。

在一些实施例中，外部知识包括网络知识和多模态知识，其中，多模态知识为包括图片和文本的知识。

在本实施例中，通过结合外部知识确定第二反馈对话数据，可以避免因文本知识和知识图谱因为更新不及时而导致的第二反馈对话数据没有考虑到热点事件、热门话题等知识，从而提高了第二反馈对话数据的时效性、有效性、可靠性。

根据本公开实施例的另一个方面，本公开实施例还提供了一种对话网络模型的训练方法，所述方法包括：

获取第二样本数据集，所述第二样本数据集中包括用户输入的第二样本输入对话数据、第二样本历史对话数据、与所述第二样本输入对话数据对应的第一样本对话环境数据；

根据所述第二样本数据集生成第二样本语义关键字；

根据所述第二样本语义关键字和预设类型知识库，训练得到具有预测与输入对话数据对应的反馈对话数据能力的对话网络模型，其中，所述预设类型知识库包括：知识图谱、文本知识、以及除所述知识图谱和文本知识之外的外部知识。

在本实施例中，一方面，通过结合第一样本对话环境数据确定第二样本语义关键字，使得第二样本语义关键字可以表征更多维度的内容，提高第二样本语义关键字的丰富表征能力，另一方面，通过引入外部知识训练得到对话网络模型，以从更多类型的知识训练得到对话网络模型，从而提高对话网络模型的可靠性和有效性，提高用户的交互体验。

在一些实施例中，所述根据所述第二样本语义关键字和预设类型知识库，训练得到具有预测与输入对话数据对应的反馈对话数据能力的对话网络模型，包括：

分别从所述外部知识、所述知识图谱、所述文本知识中，获取与所述第二样本语义关键字对应的知识；

根据各获取到的与所述第二样本语义关键字对应的知识，训练得到所述对话网络模型。

在本实施例中，通过从各类型的知识(即外部知识、知识图谱、文本知识)中，分别获取第二样本语义关键字对应的知识，使得获取到的知识较为丰富和全面，以便当基于较为丰富和全面的知识训练得到对话网络模型时，使得对话网络模型具有较高的可靠性和有效性。

在一些实施例中，在所述分别从所述外部知识、所述知识图谱、所述文本知识中，获取与所述第二样本语义关键字对应的知识之后，所述方法还包括：

根据从第一类型知识获取到的与所述第二样本语义关键字对应的知识，在至少一个其他类型知识中进行检索，得到与从第一类型知识获取到的与所述第二样本语义关键字对应的知识相关联的知识；

其中，所述至少一个其他类型知识中的与所述第二样本语义关键字对应的知识包括检索得到的与所述从第一类型知识获取到的与所述第二样本语义关键字对应的知识相关联的知识；所述第一类型知识为所述外部知识、所述知识图谱、所述文本知识中的任意一种，所述至少一个其他类型知识为所述外部知识、所述知识图谱、所述文本知识中除所述第一类型知识之外的类型知识。

在本实施例中，通过“多跳检索”的方式从不同类型的知识获取相关联的知识，可以避免知识的遗漏，实现在不同类型的知识中的交叉检索，提高了与第二样本语义关键字对应的知识的多样性和充分性。

在一些实施例中，所述根据各获取到的与所述第二样本语义关键字对应的知识，训练得到所述对话网络模型，包括：

对各获取到的与所述第二样本语义关键字对应的知识分别进行编码，得到各自对应的特征向量；

根据所述各自对应的特征向量训练得到所述对话网络模型。

在一些实施例中，所述根据所述各自对应的特征向量训练得到所述对话网络模型，包括：

对所述各自对应的特征向量进行融合处理，得到融合特征向量；

将所述融合特征向量输入至第四神经网络，输出第二预测的向用户反馈的对话数据；

根据所述第二预测的向用户反馈的对话数据、以及第二预先标注的向用户反馈的对话数据对所述第四神经网络模型的参数进行调整，得到所述对话网络模型。

在本实施例中，通过对各特征向量进行融合处理，以使得融合特征向量可以表征各特征向量各自对应的特征，以提高基于融合特征向量训练得到的对话网络模型的可靠性和有效性。

在一些实施例中，所述融合特征向量是将所述各自对应的特征向量输入至预先训练得到的交叉注意力网络模型得到的。

对各获取到的与所述第二样本语义关键字对应的知识进行去冗余处理，得到去冗余处理后的知识；

根据所述去冗余处理后的知识训练得到所述对话网络模型。

在本实施例中，通过去冗余处理，可以避免数据冗余，减少数据处理量，提高训练效率。

在一些实施例中，所述方法还包括：

根据所述第二样本数据集，确定是否需要引入所述外部知识的第一分类结果；

以及，所述根据所述第二样本语义关键字和预设类型知识库，训练得到具有预测与输入对话数据对应的反馈对话数据能力的对话网络模型，包括：若所述第一分类结果表征为需要引入所述外部知识，则根据所述第二样本语义关键字和预设类型知识库，训练得到所述对话网络模型。

在本实施例中，通过先确定是否需要引入外部知识，以便在知识图谱和文本知识无法满足训练需求的情况下，引入外部知识，以结合外部知识确定训练得到对话网络模型，使得对话网络模型可以满足用户的对话需求，提高人机交互时的交互体验。

在一些实施例中，所述第一分类结果是将所述第二样本数据集输入至预先训练的二分类网络模型得到的；

在一些实施例中，所述第二样本语义关键字是将所述第二样本数据集输入至预先训练的生成网络模型得到的；

根据本公开实施例的另一个方面，本公开实施例还提供了一种人机对话装置，所述装置包括：

第一获取单元，用于获取第二历史对话数据、当前的对话环境数据、用户输入的第二输入对话数据；

第一确定单元，用于根据所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据确定第二语义关键字；

第一生成单元，用于根据所述第二语义关键字和预设类型知识库，生成与所述第二输入对话数据对应的第二反馈对话数据，其中，所述预设类型知识库包括：知识图谱、文本知识、以及除所述知识图谱和文本知识之外的外部知识；

输出单元，用于输出所述第二反馈对话数据。

根据本公开实施例的另一个方面，本公开实施例还提供了一种对话网络模型的训练装置，装置方法包括：

第二获取单元，用于获取第二样本数据集，所述第二样本数据集中包括用户输入的第二样本输入对话数据、第二样本历史对话数据、与所述第二样本输入对话数据对应的第一样本对话环境数据；

第二生成单元，用于根据所述第二样本数据集生成第二样本语义关键字；

训练单元，用于根据所述第二样本语义关键字和预设类型知识库，训练得到具有预测与输入对话数据对应的反馈对话数据能力的对话网络模型，其中，所述预设类型知识库包括：知识图谱、文本知识、以及除所述知识图谱和文本知识之外的外部知识。

根据本公开实施例的另一个方面，本公开实施例还提供了一种计算机存储介质，所述计算机存储介质上存储有计算机指令，当所述计算机指令在被处理器运行时，使得如上任意实施例所述的人机交互方法被执行；或者，使得如上任意实施例所述的对话网络模型的训练方法被执行。

根据本公开实施例的另一个方面，本公开实施例还提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机指令，所述计算机指令被所述至少一个处理器执行，使得如上任意实施例所述的人机交互方法被执行；或者，使得如上任意实施例所述的对话网络模型的训练方法被执行。

根据本公开实施例的另一个方面，本公开实施例还提供了一种计算机程序产品，当所述计算机程序产品在处理器上运行时，使得如上任意实施例所述的人机交互方法被执行；或者，使得如上任意实施例所述的对话网络模型的训练方法被执行。

根据本公开实施例的另一个方面，本公开实施例还提供了一种芯片，包括：

输入接口，用于获取第二历史对话数据、当前的对话环境数据、用户输入的第二输入对话数据；

逻辑电路，用于执行如上任意实施例所述的人机交互方法，得到与所述第二输入对话数据对应的第二反馈对话数据；

输出接口，用于输出所述第二反馈对话数据。

输入接口，用于获取第二样本数据集，所述第二样本数据集中包括用户输入的第二样本输入对话数据、第二样本历史对话数据、与所述第二样本输入对话数据对应的第一样本对话环境数据；

逻辑电路，用于执行如上任意实施例所述的对话网络模型的训练方法，得到具有预测与输入对话数据对应的反馈对话数据能力的对话网络模型；

输出接口，用于输出所述对话网络模型。

根据本公开实施例的另一个方面，本公开实施例还提供了一种终端设备，包括：

数据采集装置，用于获取第二历史对话数据、当前的对话环境数据、用户输入的第二输入对话数据；

对话系统，用于根据所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据确定第二语义关键字，并根据所述第二语义关键字和预设类型知识库，生成并输出与所述第二输入对话数据对应的第二反馈对话数据，其中，所述预设类型知识库包括：知识图谱、文本知识、以及除所述知识图谱和文本知识之外的外部知识。

附图说明

图1为本公开一个实施例的对话网络模型的训练方法的示意图；

图2为本公开一个实施例的人机对话方法的示意图；

图3为本公开一个实施例的对话网络模型的训练方法的原理示意图；

图4为本公开另一实施例的对话网络模型的训练方法的示意图；

图5为本公开另一实施例的人机对话方法的示意图；

图6为本公开另一实施例的人机对话方法的示意图；

图7为本公开另一实施例的对话网络模型的训练方法的原理示意图；

图8为本公开实施例的人机对话方法的场景示意图一；

图9为本公开实施例的人机对话方法的场景示意图二；

图10为本公开一个实施例的人机对话装置的示意图；

图11为本公开另一实施例的人机对话装置的示意图；

图12为本公开一个实施例的对话网络模型的训练装置的示意图；

图13为本公开另一实施例的对话网络模型的训练装置的示意图；

图14为本公开实施例的电子设备的示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

人工智能(Artificial Intelligence，AI)是研究、开发用于模拟、延伸和扩展人类的智能的理论、方法、技术及应用系统的技术科学。对话系统是人工智能中的重要技术之一，对话系统旨在辅助人类并与人类完成自然、连贯、流畅的交流任务的计算机系统。

示例性地，基于不同的对话需求，可以将对话系统可以分为不同的类型，如：问答型(Question Answering，QA)、任务型(Task-Oriented)、以及开放域(Open-domain)。

问答型对话系统可以应用于针对用户所提出的问题进行答复的场景，如电商店铺的语音客服、银行的语音客服等场景。相应的，问答型对话系统的实现原理为：响应于接收到用户输入的对话数据，该对话数据中包括用户所提出的问题，根据该对话数据在预先构建的知识库中进行检索匹配，以从知识库中得到用于答复用户所提出的问题的反馈消息，并输出该反馈消息。

其中，知识库可以为结构化知识库，也可以为非结构化知识库，还可以为半结构化知识库。结构化知识库可以理解为以关系知识库表形式管理的知识的知识库，非结构化知识库可以理解为没有固定模式的知识的知识库，半结构化知识库可以理解为非关系模式的、有基本固定结构模式的知识的知识库。也就是说，知识库中包括知识，且不同类型的知识库中的知识的存在方式可能并不相同。

示例性地，结构化知识库可以包括知识图谱，也可以包括表格。非结构化知识库可以包括自由文档。半结构化知识库可以包括问答型对(QA pair)。

任务型对话系统可以应用于根据用户输入的对话数据，完成与该对话数据对应的任务的场景，订票、导航等场景。相应的，任务型对话系统的实现原理为：响应于接收到用户输入的对话数据，确定与该对话数据对应的用户意图，并执行与用户意图对应的任务。

其中，任务型对话系统的技术架构包括管道(pipeline)式和端到端(End-to-End)式两种类型。管道式技术架构的任务型对话系统主要包含语音识别(Automatic Speech Recognition,ASR)、意图理解(Natural Language Understanding，NLU)、对话状态跟踪(Dialogue State Tracking，DST)、策略学习(Policy Learning，PL)、自然语言生成(Natural Language Generation，NLG)、语音生成(Text To Speech,TTS)六大模块，DST和PL统称为对话管理模块(Dialogue Manager，DM)。端到端式技术架构的任务型对话系统是指利用深度学习神经网络组成的端到端的任务型对话系统。

开放域对话系统可以通过两种方式实现，一种为检索式，一种为生成式。其中，检索式的开放域对话系统类似于问答型对话系统，此处不再赘述。生成式的开放域对话系统可以基于预先训练的序列到序列(Sequence-to-Sequence)模型，将用户输入的对话数据映射为用于回复该对话数据的回复序列，以基于该回复序列确定用于答复用户所提出的问题的反馈消息，并输出该反馈消息。

在一些实施例中，对话系统可以基于神经网络模型的方式实现，如在训练阶段，可以对神经网络模型进行训练，以使得神经网络模型学习对用户输入的对话数据进行答复的能力，从而得到用于对用户输入的对话数据进行答复的对话网络模型。相应地，在应用阶段(即对话阶段)，对话网络模型的输入为用户输入的对话数据，输出为用于回复该对话数据的反馈消息。现结合图1对对话网络模型的训练原理进行示范性地阐述如下：

S101：获取第一样本数据集，第一样本数据集中包括用户输入的第一样本输入对话数据、以及第一样本历史对话数据。

神经网络模型的训练可以在云端进行，也可以在本地进行，本实施例不做限定。若在云端训练对话网络模型，则执行主体可以为部署于云端的服务器或者服务器集群等。若在本地训练对话网络模型，则执行主体可以为部署于本地的服务器、服务器集群、处理器、以及芯片等中的任意一种。

本实施例对第一样本数据集中的数据量不做限定，可以基于需求、历史记录、以及试验等方式确定。例如，针对精度需求相对较高的场景，第一样本数据集中的数据量可以相对较多；反之，针对精度需求相对较低的场景，第一样本数据集中的数据量可以相对较少。

其中，第一样本输入对话数据可以理解为在用户与对话系统的历史对话中，用户向对话系统输入的对话数据(如音频)。第一样本历史对话数据可以理解为在用户与对话系统的历史对话中，对话系统针对用户向对话系统输入的对话数据所答复的数据(如音频)。

S102：生成与第一样本数据集对应的第一样本语义关键字。

示例性地，第一样本语义关键字可以理解为，基于自然语言理解(如上述示例中任务型对话系统中的意图理解)对第一样本输入对话数据进行理解，得到用户与对话系统进行对话的意图。

其中，第一样本语义关键字可以为词，也可以为句子，本实施例不做限定。

S103：基于第一样本语义关键字，在预先构建的知识库中进行语义检索，得到与第一样本语义关键字语义相近的知识。

其中，知识库可以包括文本知识和/或知识图谱。

示例性地，以知识库包括知识图谱为例，该步骤可以理解为：基于语义相似度匹配的方式，从知识图谱中检索得到与第一样本语义关键字的语义相似度较高的知识。

以知识库包括文本知识为例，该步骤可以理解为：基于语义相似度匹配的方式，从文本知识中检索得到与第一样本语义关键字的语义相似度较高的知识。

以知识库包括知识图谱和文本知识为例，该步骤可以理解为：基于语义相似度匹配的方式，从知识图谱中检索得到与第一样本语义关键字的语义相似度较高的知识，并基于语义相似度匹配的方式，从文本知识中检索得到与第一样本语义关键字的语义相似度较高的知识。

其中，语义相似度的计算的方法可以包括：对第一样本语义关键字、以及知识库中的各知识分别进行向量化处理，得到第一样本语义关键字对应的第一向量，以及知识库中的各知识各自对应的第二向量，分别计算第一向量与各第二向量之间的余弦距离，以得到第一样本语义关键字、以及知识库中的各知识之间各自对应的第一语义相似度。

相应地，可以设置第一相似度阈值，若知识库中的某知识与第一样本语义关键字之间的第一语义相似度达到(即大于或等于)第一相似度阈值，则知识库中的该知识为与第一样本语义关键字语义相近的知识；反之，若知识库中的某知识与第一样本语义关键字之间的第一语义相似度未达到(即小于)第一相似度阈值，则知识库中的该知识不是第一样本语义关键字语义相近的知识。

S104：将第一样本数据集、获取到的与第一样本语义关键字语义相近的知识，输入至第一神经网络模型中，对第一神经网络模型进行训练，得到对话网络模型。

其中，第一神经网络模型可以理解为训练前的初始化的神经网络模型，对话网络模型可以理解为经过训练得到的、可以用于预测向用户回复对话数据的神经网络模型。本实施例对第一神经网络模型的类型、框架、以及参数等不做限定。

由于第一样本数据集中包括第一样本输入对话数据和第一样本历史对话数据，因此，第一神经网络模型的输入包括三个维度的内容，分别为：第一样本输入对话数据、第一样本历史对话数据、以及获取到的与第一语义关键字语义相近的知识。

示例性的，S104可以包括：将第一样本输入对话数据、第一样本历史对话数据、以及获取到的与第一样本语义关键字语义相近的知识，分别输入至第一神经网络模型，得到第一预测的向用户反馈的对话数据，计算第一预测的向用户反馈的对话数据、以及第一预先标注的向用户反馈的对话数据之间的第一损失值，并基于第一损失值对第一神经网络模型的参数进行调整，以此类推，直至第一迭代次数达到第一预设次数阈值，或者第一损失值小于等于第一预设损失阈值，从而得到对话模型。

同理，第一预设次数阈值和第一预设损失阈值可以基于需求、历史记录、以及试验等方式确定，本实施例不做限定。

上述S101-S104阐述了在训练阶段时，怎样训练得到对话模型，现结合图2对对话模型的应用进行示范性地阐述如下：

S201：获取用户输入的第一输入对话数据。

结合上述分析可知，可以在云端训练得到对话网络模型，也可以在本地训练得到对话网络模型。相应地，对话网络模型的应用可以在云端实现，也可以在本地实现。然而，考虑到对话的实时性需求和高效反馈需求等，对话网络模型的应用通常在本地实现。

为便于将训练得到对话网络模型的执行主体、以及应用对话网络模型的执行主体进行区分，我们可以称训练得到对话网络模型的执行主体为训练装置，称应用对话网络模型的执行主体为应用装置。训练装置与应用装置可以为相同的装置，也可以为不同的装置，本实施例不做限定。

在一些实施例中，若训练装置为部署于云端的装置，应用装置为部署于本地的装置，则训练装置可以与应用装置建立通信链路，训练装置在训练得到对话网络模型之后，可以基于该通信链路将对话网络模型发送给应用装置。相应地，应用装置可以基于该对话网络模型实现与用户之间的对话。

结合上述分析可知，对话系统可以应用于不同的场景，而针对不同的应用场景，应用装置可能为不同的设备。例如，若对话系统应用于电商店铺的语音客服，则应用装置可以为部署有对话网络模型的电商店铺的计算机。又如，若对话系统应用于银行的语音客服，则应用装置可以为部署有对话网络模型的智能机器人。再如，若对话系统应用于导航场景，则应用装置可以为部署有对话网络模型的车载终端。

应该理解的是，上述示例只是用于示范性地说明对话系统可能的应用场景、以及在可能的应用场景下可能的应用装置，而不能理解为对应用场景的限定，也不能理解为对应用装置的限定。例如，应用装置还可以为移动终端，还可以为智能音箱等，此处不再一一列举。

应用装置可以包括拾音组件，以通过拾音组件获取用户输入的第一输入对话数据。其中，拾音组件可以为麦克风等用于采集音频的音频采集器。

S202：根据第一输入对话数据、以及获取到的第一历史对话数据，生成第一语义关键字。

应该理解地是，为了避免繁琐地陈述，关于本实施例与上述实施例中相同的技术特征，本实施例不再赘述。

其中，第一历史对话数据为在接收到第一输入对话数据之前，对话系统针对用户向对话系统输入的对话数据所答复的数据。因此，可以为与第一样本历史对话数据相同的数据，也可以为不同的数据。

相应地，关于S202的实现原理，可以参见S102地描述，此处不再赘述。

示例性地，若应用装置为任务型对话系统，结合上述分析，任务型对话系统包括意图理解模块，相应地，如图3所示，应用任务型对话系统获取到的为第一输入对话数据和第一历史对话数据，经意图理解模块生成第一语义关键字。

S203：基于第一语义关键字，在预先构建的知识库中进行语义检索，得到与第一语义关键字语义相近的知识。

其中，知识库可以包括文本知识和/或知识图谱。

同理，关于S203的实现原理，可以参见S103地描述，此处不再赘述。

结合上述分析和图3，基于第一语义关键字在文本知识和/或知识图谱中进行语义检索，以得到第一语义关键字语义相近的知识。

S204：将第一输入对话数据、第一历史对话数据、以及获取到的与第一语义关键字语义相近的知识，输入至基于如上S101-S104所述的方法训练得到的对话网络模型，得到向用户反馈的第一反馈对话数据。

结合上述分析和图3，将第一输入对话数据、第一历史对话数据、以及获取到的与第一语义关键字语义相近的知识，输入至对话网络模型，可以得到向用户反馈的第一反馈对话数据。

结合上述分析可知，经如上S101-S104所述训练阶段，对话网络模型学习到了预测向用户反馈对话数据的能力，因此，在应用阶段，对话网络模型可以基于输入确定针对用户输入的第一输入对话数据进行答复的第一反馈对话数据。

S205：输出向用户反馈的第一反馈对话数据。

示例性的，应用装置可以包括输出组件，以通过输出组件输出向用户反馈的第一反馈对话数据。其中，输出组件可以为扬声器。

在一些实施例中，可以通过舆情控制的方式，对第一反馈对话数据中敏感信息进行过滤处理，得到过滤处理后的第一反馈对话数据，并输出向用户反馈的过滤处理后的第一反馈对话数据。

结合上述分析和图3，对话系统中可以包括舆情控制模块，对话网络模型的输出(即第一反馈对话数据)可以输入至舆情控制模块，以由舆情控制模块对第一反馈对话数据进行过滤处理，以使得对话系统的输出回复为过滤处理后的第一反馈对话数据。

然而，一方面，随着互联网地飞速发展和信息量地飞速增加，知识每天都在不断增加、更新，而文本知识和知识图谱因地更新相对较慢，因此，文本知识和知识图谱可能因更新不及时而导致没有包含热点事件、热门话题等知识；另一方面，文本知识和知识图谱知识表示往往稀疏且有限，难以在不同粒度下进行知识表示，因此，基于文本知识和知识图谱所表示的知识相对不很全面；再一方面，单一维度难以充分表达和理解知识，如有限的历史对话数据、单一的文本知识可能会缺失关键信息而导致歧义、语义模糊。

为了避免上述问题中的至少一种，本公开的发明人经过创造性地劳动，得到了本公开的发明构思：结合多种不同类型的知识对用户输入的输入对话数据进行反馈，在此基础上，还可以结合“多跳补充”的方式对用户输入的输入对话数据进行反馈。

其中，多种不同类型的知识包括：文本知识、知识图谱、图片知识、多模态知识、网络知识。“多跳补充”，是指从一种类型的知识中查找与另一种类型的知识相关的知识。

多模态知识是指将至少两种模态的信息结合而得到的知识，如多媒体信息中包括图片所表征的信息，也包括文本所表征的信息，还包括音频所表征的信息，则多媒体信息可以为多模态知识，且该多模态知识为结合图片所表征的信息、文本所表征的信息、音频所表征的信息而得到的知识。

网络知识可以理解为从基于网络获取到的线上的知识，如基于网络从维基(wiki)获取到的线上的知识，又如基于网络从百科获取到的线上的知识，等等，此处不再一一列举。

相应地，现结合图4对对话网络模型的训练原理进行示范性地阐述如下：

S401：获取第二样本数据集，第二样本数据集中包括用户输入的第二样本输入对话数据、第二样本历史对话数据、以及与第二样本输入对话数据对应的第一样本对话环境数据。

同理，关于本实施例与上述实施例中相同的技术特征，本实施例不再赘述。例如，本实施例的执行主体可以为训练装置，训练装置可以部署于云端，也可以部署于本地，等等，此处不再一一列举。

第一样本对话环境数据可以理解为用于对对话场景中的对象进行描述的数据，如对对话场景的场地进行描述的数据，又如对对话场景中的用户的状态进行描述的数据，再如对对话场景中的用户的情绪进行描述的数据，等等。

S402：将第二样本数据集输入至预先训练的二分类网络模型，得到是否需要引入外部知识的第一分类结果。

其中，外部知识是指除知识图谱和文本知识之外的其他知识，例如图片知识、多模态知识、网络知识等。

二分类网络模型是基于第三样本数据集训练得到的，用于确定是否需要引入外部知识的神经网络模型。关于训练得到二分类网络模型的原理，可以参见下述步骤：

第一步骤：获取第三样本数据集，第三样本数据集中包括第三样本输入对话数据、第三样本历史对话数据、以及与第三样本输入对话数据对应的第二样本对话环境数据。

第二步骤：将第三样本数据集输入至二分类网络模型，输出的第二分类结果。其中，第二分类结果用于表征是否需要引入外部知识。

第三步骤：计算第二分类结果与预先标注的分类结果之间的第二损失值，并基于第二损失值对二分类网络模型的参数进行调整，以此类推，直至第二迭代次数达到第二预设次数阈值，或者第二损失值小于等于第二预设损失阈值，从而得到训练完成的二分类网络模型。

同理，第二预设次数阈值和第二预设损失阈值可以基于需求、历史记录、以及试验等方式确定，本实施例不做限定。

本实施例对二分类模型的网络结构和参数等不做限定，例如二分类模型可以为知识蒸馏(tinybert)模型。

S403：若第一分类结果表征需要引入外部知识，则根据第二样本数据集生成第二样本语义关键字。

在一些实施例中，生成第二样本语义关键字的原理可以参见上述实施例，如S102所述的实施例。

在另一些实施例中，也可以预先训练得到生成网络模型，以基于生成网络模型和第二样本数据集确定第二样本语义关键字。关于训练得到生成网络模型的原理，可以参见下述步骤：

第一步骤：获取第四样本数据集，第四样本数据集中包括第四样本输入对话数据、第四样本历史对话数据、以及与第四样本输入对话数据对应的第三样本对话环境数据。

第二步骤：将第四样本数据集输入至第二神经网络模型，输出第三样本语义关键字。

第三步骤：计算第三样本语义关键字与预先标注的样本语义关键字之间的第三损失值，并基于第三损失值对第二神经网络模型的参数进行调整，以此类推，直至第三迭代次数达到第三预设次数阈值，或者第三损失值小于等于第三预设损失阈值，从而得到训练完成的生成网络模型。

同理，第三预设次数阈值和第三预设损失阈值可以基于需求、历史记录、以及试验等方式确定，本实施例不做限定。本实施例对第二神经网络模型的类型、结构、以及参数等不做限定。

相应的，S403可以替换为：若第一分类结果表征需要引入外部知识，则将第二样本数据集输入至生成网络模型，输出第二样本语义关键字。

S404：分别从多种不同类型的知识中，获取与第二样本语义关键字对应的知识。

也就是说，从文本知识、图谱知识、以及外部知识中，分别获取与第二样本语义关键字对应的知识。

示例性地，结合上述分析，多种不同类型的知识包括：文本知识、知识图谱、图片知识、多模态知识、网络知识。因此，该步骤可以理解为：从文本知识中获取与第二样本语义关键字对应的知识，为便于区分，可以将该获取到的知识称为第一知识；从知识图谱中获取与第二样本语义关键字对应的知识，为便于区分，可以将该获取到的知识称为第二知识；从多模态知识中获取与第二样本语义关键字对应的知识，为便于区分，可以将该获取到的知识称为第三知识；从网络知识中获取与第二样本语义关键字对应的知识，为便于区分，可以将该获取到的知识称为第四知识；从图片知识中获取与第二样本语义关键字对应的知识，为便于区分，可以将该获取到的知识称为第五知识。

其中，可以采用不同的方法从不同类型的知识中获取与第二样本语义关键字对应的知识。

示例性地，可以采用句式检索法(如用来评相关性的算法bm25)或稠密检索法(sparse retrieval methods)等，从网络知识中获取与第二样本语义关键字对应的知识。

可以采用“编码+计算相似度”的方法，从文本知识和知识图谱中获取与第二样本语义关键字对应的知识。

例如，构建与知识图谱对应的图网络(Natural Graph)，基于图网络对知识图谱中的各知识进行编码，得到知识谱图中各知识各自对应的第三向量，对第二样本语义关键字进行编码，得到第四向量，分别计算第四向量和每一第三向量之间的第二语义相似度，并将第二语义相似度大于预设第二相似度阈值的第三向量对应的知识，确定为与第二样本语义关键字对应的知识。

在一些实施例中，也可以预先训练得到语义匹配网络模型，以基于语义匹配网络模型从文本知识和知识图谱中获取与第二样本语义关键字对应的知识。关于训练得到语义匹配网络模型的原理，可以参见下述步骤：

第一步骤：获取第五样本数据集，第五样本数据集中包括至少一个第五向量、以及多个第六向量。

第二步骤：将至少一个第五向量、以及多个第六向量输入至第三神经网络模型，输出匹配结果，匹配结果为与至少一个第五向量语义匹配的第六向量。

第三步骤：计算匹配结果与预先标定的匹配结果之间第四损失值，并基于第四损失值对第三神经网络模型的参数进行调整，以此类推，直至第四迭代次数达到第四预设次数阈值，或者第四损失值小于等于第四预设损失阈值，从而得到训练完成的语义匹配网络模型。

同理，第四预设次数阈值和第四预设损失阈值可以基于需求、历史记录、以及试验等方式确定，本实施例不做限定。本实施例对第三神经网络模型的类型、结构、以及参数等不做限定。例如，第三神经网络模型可以为语言表征模型(Bidirectional Encoder Representation from Transformers，BERT)。

相应的，可以将第四向量和各第三向量分别输入至语义匹配网络模型，输出与第三向量语义匹配的第三向量。

可以利用双塔结构模型的方法，从图片知识和多模态知识中获取与第二样本语义关键字对应的知识。其中，双塔结构模型中包括图片编码器和文本编码器，以基于图片编码器和文本编码分别计算损失的方式训练得到双塔结构模型。具体实现原理可以参见相关技术，此处不再赘述。

应该理解的是，上述示例只是用于示范性地说明，可以从不同类型的知识中获取与第二样本语义关键字对应的知识的方法，而不能理解为对不同类型的知识中获取与第二样本语义关键字对应的知识的限定。

在另一些实施例中，可以在从某一类型的知识中获取到与第二样本语义关键字对应的知识之后，基于该知识在其他类型的知识中进行补充检索，得到补充检索知识。

例如，在得到第一知识之后，可以从知识图谱中获取与第一知识相关的知识，可以将该知识称为补充检索知识。

又如，在得到第一知识之后，可以分别从知识图谱和文本知识中获取与第一知识相关的知识。

也就是说，可以在一种其他类型的知识中获取补充检索知识，也可以在多种其他类型的知识中获取补充检索知识，本实施例不做限定。

其中，关于对“与第一知识相关的知识”中的“相关”，可以理解为与第一知识之间的关联性较强。

结合上述分析可知，是从各种不同类型的知识中获取到的与第二样本语义关键字对应的知识，但是，不同类型的知识中可能存在相同的知识，为了避免后续处理的冗余性和复杂性，在获取到与第二样本语义关键字对应的知识之后，可以对获取到与第二样本语义关键字对应的知识进行去冗余处理，如从获取到与第二样本语义关键字对应的知识中去除重复的知识、不同表达方式的相同知识、相似度较高的知识(实现原理可以参见上述示例，此处不再赘述)。

S405：对获取到的与第二样本语义关键字对应的知识分别进行编码，得到各自对应的特征向量。

示例性地，结合上述分析，对第一知识进行编码，得到第一知识对应的特征向量，为了便于区分，可以将该特征向量称为第一特征向量；对第二知识进行编码，得到第二知识对应的特征向量，为了便于区分，可以将该特征向量称为第二特征向量；对第三知识进行编码，得到第三知识对应的特征向量，为了便于区分，可以将该特征向量称为第三特征向量；对第四知识进行编码，得到第四知识对应的特征向量，为了便于区分，可以将该特征向量称为第四特征向量；对第五知识进行编码，得到第五知识对应的特征向量，为了便于区分，可以将该特征向量称为第五特征向量。

S406：将得到的各特征向量输入至预先训练的交叉注意力网络模型，以基于交叉注意力网络模型对各特征向量进行融合处理，得到融合特征向量。

示例性地，结合上述分析，将第一特征向量、第二特征向量、第三特征向量、第四特征向量、以及第五特征向量分别输入至预先训练的交叉注意力网络模型，输出融合特征向量。

在一些实施例中，关于训练得到交叉注意力网络模型的训练方法，可以参见下述步骤：

第一步骤：获取第六样本数据集，第六样本数据集中包括样本第一特征向量、样本第二特征向量、样本第三特征向量、样本第四特征向量、以及样本第五特征向量。

其中，样本第一特征向量是对从文本知识中获取到的与标注的语义关键字对应的知识编码得到的；样本第二特征向量是对从知识图谱知识中获取到的与标注的语义关键字对应的知识编码得到的；样本第三特征向量是对从多模态知识中获取到的与标注的语义关键字对应的知识编码得到的；样本第四特征向量是对从网络知识中获取到的与标注的语义关键字对应的知识编码得到的；样本第五特征向量是对从图片知识中获取到的与标注的语义关键字对应的知识编码得到的。

第二步骤：将第六样本数据集输入至交叉注意力网络模型，输出预测的融合特征向量。

第三步骤：计算预测的融合特征向量与预先标注的融合特征向量之间的第五损失值，并基于第五损失值对交叉注意力网络模型的参数进行调整，以此类推，直至第五迭代次数达到第五预设次数阈值，或者第五损失值小于等于第五预设损失阈值，从而得到训练完成的交叉注意力网络模型。

同理，第五预设次数阈值和第五预设损失阈值可以基于需求、历史记录、以及试验等方式确定，本实施例不做限定。

S407：将融合特征向量输入至第四神经网络，输出第二预测的向用户反馈的对话数据。

S408：计算第二预测的向用户反馈的对话数据、以及第二预先标注的向用户反馈的对话数据之间的第六损失值，并基于第六损失值对第四神经网络模型的参数进行调整，以此类推，直至第六迭代次数达到第六预设次数阈值，或者第六损失值小于等于第六预设损失阈值，从而得到训练完成的对话网络模型。

同理，第六预设次数阈值和第六预设损失阈值可以基于需求、历史记录、以及试验等方式确定，本实施例不做限定。本实施例对第四神经网络模型的类型、结构、以及参数等不做限定。

上述S401-S408阐述了在训练阶段时，怎样训练得到对话模型，在上述发明构思的基础上，现结合图5对对话模型的应用进行示范性地阐述如下：

S501：获取第二历史对话数据、当前的对话环境数据、用户输入的第二输入对话数据。

为便于将训练得到对话网络模型的执行主体、以及应用对话网络模型的执行主体进行区分，我们可以称练将训练得到对话网络模型的执行主体为训练装置，称应用对话网络模型的执行主体为应用装置。训练装置与应用装置可以为相同的装置，也可以为不同的装置，本实施例不做限定。

应该理解的是，上述示例只是用于示范性地说明对话系统可能的应用场景、以及可能的应用场景下可能的应用装置，而不能理解为对应用场景的限定，也不能理解为对应用装置的限定。例如，应用装置还可以为移动终端，还可以为智能音箱等，此处不再一一列举。

应用装置可以包括拾音组件，以通过拾音组件获取用户输入的第二输入对话数据。其中，拾音组件可以为麦克风等用于采集音频的音频采集器。

当前的对话环境数据可以基于设置于应用装置的传感器获取，不同的应用场景中的传感器可能不同。例如，在室内的用户与智能音箱的对话场景中，传感器可以为图像采集装置；又如，在室外的用户与车载终端的对话场景中，传感器为可以为速度传感器，等等，此处不再一一列举。

S502：根据第二历史对话数据、当前的对话环境数据、第二输入对话数据确定第二语义关键字。

在本实施例中，采用三个维度的数据(即第二历史对话数据、当前的对话环境数据、第二输入对话数据)确定第二语义关键字，使得第二语义关键字既具有当前的环境特征，也具有当前的用户对话特征，还具有历史的对话特征，以使得第二语义关键字具有较高的可靠性。

S503：根据第二语义关键字和预设类型知识库，生成并输出与第二输入对话数据对应的第二反馈对话数据，其中，预设类型知识库包括：知识图谱、文本知识、以及除知识图谱和文本知识之外的外部知识。

在本实施例中，引入了外部知识，以通过结合外部知识生成并输出第二反馈对话数据，降低应用装置无法理解的情况，解决文本知识和图谱知识更新慢，难于全面覆盖和维护、知识稀疏且有限、单一的文本知识难以充分表达全面知识等弊端，实现了人机对话的有效性和可靠性。

为使读者深刻理解本公开，现结合图6对对话模型的应用进行示范性地阐述如下：

S601：获取用户输入的第二输入对话数据、第二历史对话数据、当前的对话环境数据。

应该理解的是，为了避免繁琐地陈述，关于本实施例与上述实施例相同的技术特征，本实施例不做限定。

S602：将用户输入的第二输入对话数据、第二历史对话数据、当前的对话环境数据，输入至基于上述示例所述的方法训练得到的二分类网络模型，得到是否需要引用外部知识的第三分类结果。

示例性地，若应用装置为任务型对话系统，如图7所示，任务型对话系统包括二分类网络模型，二分类网络模型的输入为第二输入对话数据、第二历史对话数据、当前的对话环境数据，输出为第三分类结果。

S603：若第三分类结果表征需要引入外部知识，则将第二输入对话数据、对话历史数据、当前的对话环境数据，输入至基于上述示例所述的方法训练得到的生成网络模型，输出第二语义关键字。

结合上述分析和,6，任务型对话系统还包括生成网络模型，生成网络模型的输入为第二输入对话数据、对话历史数据、当前的对话环境数据，输出为第二语义关键字。

S604：分别从多种不同类型的知识中，获取与第二语义关键字对应的知识。

关于S604的实现原理，可以参见S404地描述，此处不再赘述。

结合上述分析和图7，多种不同类型的知识包括：文本知识、知识图谱、图片知识、多模态知识、网络知识，其中，由于图片知识可能既包括图像内容，也可能包括文本内容，因此，将图片知识和多模态知识称为图片等多模态知识。

如图7所示，可以分别从文本知识、知识图谱、图片等多模态知识、以及网络知识中，获取与第二语义关键字对应的知识。且，可以采用如图7中所示的“多跳检索”的方式获取更多的与第二语义关键字对应的知识。

相应地，为了避免与第二语义关键字对应的知识的冗余，可以通过“交叉验证”的方式对获取到的与第二语义关键字对应的知识进行去冗余处理，“交叉验证”是指将从至少两种不同类型的知识中获取到的与第二语义关键字对应的知识进行验证，以确定是否存在冗余的知识，以将冗余的知识进行去除。

S605：对获取到的与第二语义关键字对应的知识分别进行编码，得到各自对应的目标特征向量。

S606：将得到的各目标特征向量输入至基于上述示例所述的方式训练得到的交叉注意力网络模型，以基于交叉注意力网络模型对各目标特征向量进行融合处理，得到目标融合特征向量。

结合上述分析和图7，任务型对话系统还包括交叉注意力网络模型，交叉注意力网络模型的输入为对获取到的与第二语义关键字对应的知识分别进行编码的结果，输出为目标融合特征向量。

S607：将目标融合特征向量输入至基于S401-S408所述示例训练得到的对话网络模型，得到向用户反馈的第二反馈对话数据。

结合上述分析和图7，任务型对话系统还包括对话网络模型，交叉注意力网络模型的输出为对话网络模型的输入，对话网络模型的输出为第二反馈对话数据。

同理，在一些实施例中，可以通过舆情控制的方式，对第二反馈对话数据中敏感信息进行过滤处理，得到过滤处理后的第二反馈对话数据，以使得向用户反馈的为过滤处理后的第二反馈对话数据。

结合上述分析和图7，任务型对话系统还包括舆情控制模块，舆情控制模块的输入为对话网络模型的输出，以由舆情控制模块对第一反馈对话数据进行过滤处理，以使得对话系统的输出回复为过滤处理后的第一反馈对话数据。

S608：输出第二反馈对话数据。

示例性地，如图8所示，在用户与移动终端对话的对话场景中，若第二输入对话数据为“某某动物园的熊猫”，通过上述方法，移动终端中的对话系统(如语音助手等)可以确定出第二输入对话数据的第二语义关键字为“熊猫”，则可以从网络知识中获取与“熊猫”对应的知识，如图8所示的从维基中获取对熊猫的知识“熊猫分布于某某城市……”，也可以获取如图8所示的熊猫的图片知识。

相应地，通过上述示例所述的方法，移动终端中的对话系统输出的第二反馈对话数据可以为如图8所示的“黑黑白白的，真可爱”。

又如，如图9所示，在用户与移动终端对话的对话场景中，若第二输入对话数据为“钥匙放在哪里了”，通过上述方法，移动终端中的对话系统(如语音助手等)可以确定出第二输入对话数据的第二语义关键字为“钥匙”，则可以从网络知识中获取与“钥匙”对应的知识，如图9所示的从维基中获取对钥匙的知识“钥匙是开锁……”，也可以获取如图9所示的钥匙的图片知识。

相应地，通过上述示例所述的方法，移动终端中的对话系统输出的第二反馈对话数据可以为如图9所示的“应该是放在书架上了”。

应该理解地是，图8和图9所述的示例只是用于示范性地说明，可能获取的与第二语义关键字对应的知识，而不能理解为对获取与第二语义关键字对应的知识的限定。

需要说明地是，本公开中的“第一”、“第二”等只是用于对不同实施例中的技术特征进行区分，而不能理解为对技术特征的限定。例如，第一神经网络模型和第二神经网络模型可以为相同类型的神经网络模型；又如，第三样本数据集和第四样本数据集可以采用相同的数据集；再如，第一预设次数阈值可以大于第二次数阈值，也可以小于第二次数阈值，也可以等于第二次数阈值，等等，此处不再一一列举。

根据本公开的另一个方面，本公开还提供了一种人机对话装置。图10为本公开一个实施例的人机对话装置的示意图，如图10所示，人机对话装置100包括：

第一获取单元1001，用于获取第二历史对话数据、当前的对话环境数据、用户输入的第二输入对话数据。

第一确定单元1002，用于根据所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据确定第二语义关键字。

第一生成单元1003，用于根据所述第二语义关键字和预设类型知识库，生成与所述第二输入对话数据对应的第二反馈对话数据，其中，所述预设类型知识库包括：知识图谱、文本知识、以及除所述知识图谱和文本知识之外的外部知识。

输出单元1004，用于输出所述第二反馈对话数据。

图11为本公开另一实施例的人机对话装置的示意图，如图11所示，人机对话装置1100包括：

第一获取单元1101，用于获取第二历史对话数据、当前的对话环境数据、用户输入的第二输入对话数据。

第一确定单元1102，用于根据所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据确定第二语义关键字。

第二确定单元1103根据所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据，确定是否需要引入所述外部知识的第三分类结果。

第一生成单元1104，用于根据所述第二语义关键字和预设类型知识库，生成与所述第二输入对话数据对应的第二反馈对话数据，其中，所述预设类型知识库包括：知识图谱、文本知识、以及除所述知识图谱和文本知识之外的外部知识。

在一些实施例中，第一生成单元1104用于，若所述第三分类结果表征为需要引入所述外部知识，则根据所述第二语义关键字和预设类型知识库，生成与所述第二输入对话数据对应的第二反馈对话数据。

结合图11可知，在一些实施例中，第一生成单元1104，包括：

第一获取子单元11041，用于分别从所述外部知识、所述知识图谱、所述文本知识中，获取与所述第二语义关键字对应的知识。

生成子单元11042，用于根据各获取到的与所述第二语义关键字对应的知识，生成所述第二反馈对话数据。

在一些实施例中，如图11所示，第一生成单元1104还包括：

第一检索子单元11043，用于根据从第一类型知识获取到的与所述第二语义关键字对应的知识，在至少一个其他类型知识中进行检索，得到与从第一类型知识获取到的与所述第二语义关键字对应的知识相关联的知识。

在一些实施例中，生成子单元11042，包括：

第一编码模块，用于对各获取到的与所述第二语义关键字对应的知识分别进行编码，得到各自对应的目标特征向量。

第一生成模块，用于根据所述各自对应的目标特征向量，生成所述第二反馈对话数据。

在一些实施例中，第一生成模块，包括：

第一融合子模块，用于对所述各自对应的目标特征向量进行融合处理，得到目标融合特征向量。

生成子模块，用于根据所述目标融合特征向量生成所述第二反馈对话数据。

在一些实施例中，生成子单元11042还包括：

第一处理模块，用于对各获取到的与所述第二语义关键字对应的知识进行去冗余处理，得到去冗余处理后的知识。

第二生成模块，用于根据所述去冗余处理后的知识生成所述第二反馈对话数据。

输出单元1105，用于输出所述第二反馈对话数据。

根据本公开的另一个方面，本公开还提供了一种对话网络模型的训练装置。图12为本公开一个实施例的对话网络模型的训练装置的示意图，如图12所示，人机对话装置1200包括：

第二获取单元1201，用于获取第二样本数据集，所述第二样本数据集中包括用户输入的第二样本输入对话数据、第二样本历史对话数据、与所述第二样本输入对话数据对应的第一样本对话环境数据。

第二生成单元1202，用于根据所述第二样本数据集生成第二样本语义关键字。

训练单元1203，用于根据所述第二样本语义关键字和预设类型知识库，训练得到具有预测与输入对话数据对应的反馈对话数据能力的对话网络模型，其中，所述预设类型知识库包括：知识图谱、文本知识、以及除所述知识图谱和文本知识之外的外部知识。

图13为本公开另一实施例的对话网络模型的训练装置的示意图，如图13所示，人机对话装置1300包括：

第二获取单元1301，用于获取第二样本数据集，所述第二样本数据集中包括用户输入的第二样本输入对话数据、第二样本历史对话数据、与所述第二样本输入对话数据对应的第一样本对话环境数据。

第二生成单元1302，用于根据所述第二样本数据集生成第二样本语义关键字。

第三确定单元1303，用于根据所述第二样本数据集，确定是否需要引入所述外部知识的第一分类结果。

训练单元1304，用于根据所述第二样本语义关键字和预设类型知识库，训练得到具有预测与输入对话数据对应的反馈对话数据能力的对话网络模型，其中，所述预设类型知识库包括：知识图谱、文本知识、以及除所述知识图谱和文本知识之外的外部知识。

所述第二样本语义关键字是将所述第二样本数据集输入至预先训练的生成网络模型得到的；

在一些实施例中，训练单元1304用于若所述第一分类结果表征为需要引入所述外部知识，则根据所述第二样本语义关键字和预设类型知识库，训练得到所述对话网络模型。

结合图13可知，在一些实施例中，训练单元1304，包括：

第二获取子单元13041，用于分别从所述外部知识、所述知识图谱、所述文本知识中，获取与所述第二样本语义关键字对应的知识。

训练子单元13042，用于根据各获取到的与所述第二样本语义关键字对应的知识，训练得到所述对话网络模型。

在一些实施例中，训练子单元13042，包括：

第二编码模块，用于对各获取到的与所述第二样本语义关键字对应的知识分别进行编码，得到各自对应的特征向量。

在一些实施例中，第二编码模块，包括：

第二融合子模块，用于对所述各自对应的特征向量进行融合处理，得到融合特征向量；

输入子模块，用于将所述融合特征向量输入至第四神经网络，输出第二预测的向用户反馈的对话数据；

调整子模块，用于根据所述第二预测的向用户反馈的对话数据、以及第二预先标注的向用户反馈的对话数据对所述第四神经网络模型的参数进行调整，得到所述对话网络模型。

第一训练模块，用于根据所述各自对应的特征向量训练得到所述对话网络模型。

结合图13可知，在一些实施例中，训练单元1304还包括：

第二检索子单元13043，用于根据从第一类型知识获取到的与所述第二样本语义关键字对应的知识，在至少一个其他类型知识中进行检索，得到与从第一类型知识获取到的与所述第二样本语义关键字对应的知识相关联的知识。

在一些实施例中，所述训练子单元13042还包括：

第二处理模块，用于对各获取到的与所述第二样本语义关键字对应的知识进行去冗余处理，得到去冗余处理后的知识；

第二训练模块，用于根据所述去冗余处理后的知识训练得到所述对话网络模型。

请参阅图14，图14为本公开实施例的电子设备的示意图，如图14所示，电子设备1400可以包括以下一个或多个组件：处理组件1401，存储器1402，电源组件1403，多媒体组件1404，音频组件1405，输入/输出(I/O)接口1406，传感器组件1407，以及通信组件1408。

处理组件1401通常控制电子设备1400的整体操作，诸如与视频播放、显示、电话呼叫、数据通信、相机操作、以及记录操作相关联的操作。处理组件1401可以包括一个或多个处理器14011来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件1401可以包括一个或多个模块，便于处理组件1401和其他组件之间的交互。例如，处理组件1401可以包括多媒体模块，以方便多媒体组件1404和处理组件1404之间的交互。

存储器1402被配置为存储各种类型的数据以支持在电子设备1400的操作。这些数据的示例包括用于在电子设备1400上操作的任何应用程序或方法的指令，如视频、联系人数据、电话簿数据、消息、以及图片等。存储器1402可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件1403为电子设备1400的各种组件提供电力。电源组件1403可以包括电源管理系统，一个或多个电源，及其他与为电子设备1400生成、管理和分配电力相关联的组件。

多媒体组件1404包括在所述电子设备1400和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件1404包括一个前置摄像头和/或后置摄像头。当电子设备1400处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件1405被配置为输出和/或输入音频数据。例如，音频组件1405包括一个麦克风(MIC)，当电子设备1400处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频数据。所接收的音频数据可以被进一步存储在存储器1402或经由通信组件1408发送。在一些实施例中，音频组件1405还包括一个扬声器，用于输出音频数据，如输出经上述实施例所述的方法确定出的音频增益和原音频数据。

I/O接口1406为处理组件1401和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件1407包括一个或多个传感器，用于为电子设备1400提供各个方面的状态评估。例如，传感器组件1407可以检测到电子设备1400的打开/关闭状态，组件的相对定位，例如所述组件为电子设备1400的显示器和小键盘，传感器组件1407还可以检测电子设备1400或电子设备1400一个组件的位置改变，用户与电子设备1400接触的存在或不存在，电子设备1400方位或加速/减速和电子设备1400的温度变化。传感器组件1407可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1407还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件1407还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件1408被配置为便于电子设备1400和其他设备之间有线或无线方式的通信。电子设备1400可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件1408经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件1408还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，电子设备1400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器1402，上述指令可由电子设备1400的处理器14011执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

输出接口，用于输出所述第二反馈对话数据。

输出接口，用于输出所述对话网络模型。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

一种人机对话方法，其特征在于，所述方法包括：

获取第二历史对话数据、当前的对话环境数据、用户输入的第二输入对话数据；

根据所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据确定第二语义关键字；

根据所述第二语义关键字和预设类型知识库，生成并输出与所述第二输入对话数据对应的第二反馈对话数据，其中，所述预设类型知识库包括：知识图谱、文本知识、以及除所述知识图谱和文本知识之外的外部知识。
根据权利要求1所述的方法，其特征在于，所述根据所述第二语义关键字和预设类型知识库，生成并输出与所述第二输入对话数据对应的第二反馈对话数据，包括：

分别从所述外部知识、所述知识图谱、所述文本知识中，获取与所述第二语义关键字对应的知识；

根据各获取到的与所述第二语义关键字对应的知识，生成并输出所述第二反馈对话数据。
根据权利要求2所述的方法，其特征在于，在所述分别从所述外部知识、所述知识图谱、所述文本知识中，获取与所述第二语义关键字对应的知识之后，所述方法还包括：

根据从第一类型知识获取到的与所述第二语义关键字对应的知识，在至少一个其他类型知识中进行检索，得到与从第一类型知识获取到的与所述第二语义关键字对应的知识相关联的知识；

其中，所述至少一个其他类型知识中的与所述第二语义关键字对应的知识包括检索得到的与所述从第一类型知识获取到的与所述第二语义关键字对应的知识相关联的知识；所述第一类型知识为所述外部知识、所述知识图谱、所述文本知识中的任意一种，所述至少一个其他类型知识为所述外部知识、所述知识图谱、所述文本知识中除所述第一类型知识之外的类型知识。
根据权利要求2所述的方法，其特征在于，所述根据各获取到的与所述第二语义关键字对应的知识，生成并输出所述第二反馈对话数据，包括：

对各获取到的与所述第二语义关键字对应的知识分别进行编码，得到各自对应的目标特征向量；

根据所述各自对应的目标特征向量，生成并输出所述第二反馈对话数据。
根据权利要求4所述的方法，其特征在于，所述根据所述各自对应的目标特征向量，生成并输出所述第二反馈对话数据，包括：

对所述各自对应的目标特征向量进行融合处理，得到目标融合特征向量；

根据所述目标融合特征向量生成并输出所述第二反馈对话数据。
根据权利要求5所述的方法，其特征在于，所述目标融合特征向量是将所述各自对应的目标特征向量输入至预先训练得到的交叉注意力网络模型得到的。
根据权利要求2-6中任一项所述的方法，其特征在于，所述根据各获取到的与所述第二语义关键字对应的知识，生成并输出所述第二反馈对话数据，包括：

对各获取到的与所述第二语义关键字对应的知识进行去冗余处理，得到去冗余处理后的知识；

根据所述去冗余处理后的知识生成并输出所述第二反馈对话数据。
根据权利要求1-6中任一项所述的方法，其特征在于，所述方法还包括：

根据所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据，确定是否需要引入所述外部知识的第三分类结果；

以及，所述根据所述第二语义关键字和预设类型知识库，生成并输出与所述第二输入对话数据对应的第二反馈对话数据，包括：若所述第三分类结果表征为需要引入所述外部知识，则根据所述第二语义关键字和预设类型知识库，生成并输出与所述第二输入对话数据对应的第二反馈对话数据。
根据权利要求8所述的方法，其特征在于，所述第三分类结果是将所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据输入至预先训练的二分类网络模型得到的；

其中，所述二分类模型是基于第三样本数据集学习确定是否需要引入所述外部知识的能力的模型，所述第三样本数据集中包括第三样本输入对话数据、第三样本历史对话数据、以及与第三样本输入对话数据对应的第二样本对话环境数据。
根据权利要求1-9中任一项所述的方法，其特征在于，所述第二语义关键字是将所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据输入至预先训练的生成网络模型得到的；

其中，所述生成网络模型是基于第四样本数据集学习与所述第四样本数据集对应的第三样本语义关键字的能力的模型，所述第四样本数据集中包括第四样本输入对话数据、第四样本历史对话数据、以及与第四样本输入对话数据对应的第三样本对话环境数据。
一种对话网络模型的训练方法，其特征在于，所述方法包括：

获取第二样本数据集，所述第二样本数据集中包括用户输入的第二样本输入对话数据、第二样本历史对话数据、与所述第二样本输入对话数据对应的第一样本对话环境数据；

根据所述第二样本数据集生成第二样本语义关键字；

根据所述第二样本语义关键字和预设类型知识库，训练得到具有预测与输入对话数据对应的反馈对话数据能力的对话网络模型，其中，所述预设类型知识库包括：知识图谱、文本知识、以及除所述知识图谱和文本知识之外的外部知识。
根据权利要求11所述的方法，其特征在于，所述根据所述第二样本语义关键字和预设类型知识库，训练得到具有预测与输入对话数据对应的反馈对话数据能力的对话网络模型，包括：

分别从所述外部知识、所述知识图谱、所述文本知识中，获取与所述第二样本语义关键字对应的知识；

根据各获取到的与所述第二样本语义关键字对应的知识，训练得到所述对话网络模型。
根据权利要求12所述的方法，其特征在于，在所述分别从所述外部知识、所述知识图谱、所述文本知识中，获取与所述第二样本语义关键字对应的知识之后，所述方法还包括：

根据从第一类型知识获取到的与所述第二样本语义关键字对应的知识，在至少一个其他类型知识中进行检索，得到与从第一类型知识获取到的与所述第二样本语义关键字对应的知识相关联的知识；

其中，所述至少一个其他类型知识中的与所述第二样本语义关键字对应的知识包括检索得到的与所述从第一类型知识获取到的与所述第二样本语义关键字对应的知识相关联的知识；所述第一类型知识为所述外部知识、所述知识图谱、所述文本知识中的任意一种，所述至少一个其他类型知识为所述外部知识、所述知识图谱、所述文本知识中除所述第一类型知识之外的类型知识。
根据权利要求12所述的方法，其特征在于，所述根据各获取到的与所述第二样本语义关键字对应的知识，训练得到所述对话网络模型，包括：

对各获取到的与所述第二样本语义关键字对应的知识分别进行编码，得到各自对应的特征向量；

根据所述各自对应的特征向量训练得到所述对话网络模型。
根据权利要求14所述的方法，其特征在于，所述根据所述各自对应的特征向量训练得到所述对话网络模型，包括：

对所述各自对应的特征向量进行融合处理，得到融合特征向量；

将所述融合特征向量输入至第四神经网络，输出第二预测的向用户反馈的对话数据；

根据所述第二预测的向用户反馈的对话数据、以及第二预先标注的向用户反馈的对话数据对所述第四神经网络模型的参数进行调整，得到所述对话网络模型。
根据权利要求15所述的方法，其特征在于，所述融合特征向量是将所述各自对应的特征向量输入至预先训练得到的交叉注意力网络模型得到的。
根据权利要求12-16中任一项所述的方法，其特征在于，所述根据各获取到的与所述第二样本语义关键字对应的知识，训练得到所述对话网络模型，包括：

对各获取到的与所述第二样本语义关键字对应的知识进行去冗余处理，得到去冗余处理后的知识；

根据所述去冗余处理后的知识训练得到所述对话网络模型。
根据权利要求11-16中任一项所述的方法，其特征在于，所述方法还包括：

根据所述第二样本数据集，确定是否需要引入所述外部知识的第一分类结果；

以及，所述根据所述第二样本语义关键字和预设类型知识库，训练得到具有预测与输入对话数据对应的反馈对话数据能力的对话网络模型，包括：若所述第一分类结果表征为需要引入所述外部知识，则根据所述第二样本语义关键字和预设类型知识库，训练得到所述对话网络模型。
根据权利要求18所述的方法，其特征在于，所述第一分类结果是将所述第二样本数据集输入至预先训练的二分类网络模型得到的；

其中，所述二分类模型是基于第三样本数据集学习确定是否需要引入所述外部知识的能力的模型，所述第三样本数据集中包括第三样本输入对话数据、第三样本历史对话数据、以及与第三样本输入对话数据对应的第二样本对话环境数据。
根据权利要求11-19中任一项所述的方法，其特征在于，所述第二样本语义关键字是将所述第二样本数据集输入至预先训练的生成网络模型得到的；

其中，所述生成网络模型是基于第四样本数据集学习与所述第四样本数据集对应的第三样本语义关键字的能力的模型，所述第四样本数据集中包括第四样本输入对话数据、第四样本历史对话数据、以及与第四样本输入对话数据对应的第三样本对话环境数据。
一种人机对话装置，其特征在于，所述装置包括：

第一获取单元，用于获取第二历史对话数据、当前的对话环境数据、用户输入的第二输入对话数据；

第一确定单元，用于根据所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据确定第二语义关键字；

第一生成单元，用于根据所述第二语义关键字和预设类型知识库，生成与所述第二输入对话数据对应的第二反馈对话数据，其中，所述预设类型知识库包括：知识图谱、文本知识、以及除所述知识图谱和文本知识之外的外部知识；

输出单元，用于输出所述第二反馈对话数据。
一种对话网络模型的训练装置，其特征在于，所述装置包括：

第二获取单元，用于获取第二样本数据集，所述第二样本数据集中包括用户输入的第二样本输入对话数据、第二样本历史对话数据、与所述第二样本输入对话数据对应的第一样本对话环境数据；

第二生成单元，用于根据所述第二样本数据集生成第二样本语义关键字；

训练单元，用于根据所述第二样本语义关键字和预设类型知识库，训练得到具有预测与输入对话数据对应的反馈对话数据能力的对话网络模型，其中，所述预设类型知识库包括：知识图谱、文本知识、以及除所述知识图谱和文本知识之外的外部知识。
一种计算机存储介质，其特征在于，所述计算机存储介质上存储有计算机指令，当所述计算机指令在被处理器运行时，使得权利要求1至10中任一项所述的方法被执行；或者，使得权利要求11至20中任一项所述的方法被执行。
一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机指令，所述计算机指令被所述至少一个处理器执行，使得权利要求1至10中任一项所述的方法被执行；或者，使得权利要求11至20中任一项所述的方法被执行。
一种计算机程序产品，其特征在于，当所述计算机程序产品在处理器上运行时，使得权利要求1至10中任一项所述的方法被执行；或者，使得权利要求11至20中任一项所述的方法被执行。
一种芯片，其特征在于，包括：

输入接口，用于获取第二历史对话数据、当前的对话环境数据、用户输入的第二输入对话数据；

逻辑电路，用于执行如权利要求1至10中任一项所述的方法，得到与所述第二输入对话数据对应的第二反馈对话数据；

输出接口，用于输出所述第二反馈对话数据。
一种终端设备，其特征在于，包括：

数据采集装置，用于获取第二历史对话数据、当前的对话环境数据、用户输入的第二输入对话数据；

对话系统，用于根据所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据确定第二语义关键字，并根据所述第二语义关键字和预设类型知识库，生成并输出与所述第二输入对话数据对应的第二反馈对话数据，其中，所述预设类型知识库包括：知识图谱、文本知识、以及除所述知识图谱和文本知识之外的外部知识。