WO2022252694A1

WO2022252694A1 - 神经网络优化方法及其装置

Info

Publication number: WO2022252694A1
Application number: PCT/CN2022/076556
Authority: WO
Inventors: 周卫民; 麦宇庭; 李亿; 郭益君; 邓彬彬; 戴宗宏
Original assignee: Huawei Cloud Computing Technologies Co Ltd
Current assignee: Huawei Cloud Computing Technologies Co Ltd
Priority date: 2021-05-29
Filing date: 2022-02-17
Publication date: 2022-12-08
Anticipated expiration: 2023-11-29
Also published as: EP4339843A4; CN115409168A; US20240095529A1; EP4339843A1

Abstract

本申请公开了一种神经网络优化方法及其装置，属于人工智能AI技术领域。该方法包括：接收待优化神经网络的模型文件；基于待优化神经网络的模型文件，获取目标神经网络架构的搜索空间，搜索空间包括目标神经网络架构中各神经元的各属性的取值范围；基于搜索空间，获得目标神经网络架构；基于待优化神经网络的模型文件对目标神经网络架构进行训练，得到目标神经网络的模型文件；向用户提供目标神经网络的模型文件。本申请能够有效提高优化后的神经网络的性能。

Description

神经网络优化方法及其装置

本申请要求于2021年05月29日提交的申请号为202110596002.1、发明名称为“神经网络优化方法及其装置”的中国专利申请的优先权，其全部内容通过引用结合在本公开中。

技术领域

本申请涉及人工智能(artificial intelligence，AI)技术领域，特别涉及一种神经网络优化方法及其装置。

背景技术

随着神经网络的普及，神经网络应用到了越来越多的领域。在用户使用神经网络之前，通常需要使用神经网络开发平台(如自动机器学习(auto machine learning，AutoML)平台)为其设计和训练神经网络。并且，用户在使用已有神经网络时，还会出现对该已有神经网络的性能不满意的情况，此时用户还可以使用神经网络开发平台对该已有神经网络进行优化，以得到性能更好的神经网络。

相关技术中，神经网络开发平台可以通过对已有神经网络执行图优化和算子融合等优化操作，以得到能够实现已有神经网络的功能，且性能更好的神经网络。

但是，优化操作对神经网络的性能提升空间有限，导致神经网络的性能提升效果较差。

发明内容

本申请提供了一种神经网络优化方法及其装置，本申请能够有效提高优化后的神经网络的性能。本申请提供的技术方案如下：

第一方面，本申请提供了一种神经网络优化方法，该神经网络优化方法包括：接收待优化神经网络的模型文件；基于待优化神经网络的模型文件，获取目标神经网络架构的搜索空间，搜索空间包括目标神经网络架构中各神经元的各属性的取值范围；基于搜索空间，获得目标神经网络架构；基于待优化神经网络的模型文件对目标神经网络架构进行训练，得到目标神经网络的模型文件；向用户提供目标神经网络的模型文件。

在本申请提供的神经网络优化方法中，能够先根据待优化神经网络的模型文件，为待优化神经网络映射到较相似的搜索空间，然后在基于该搜索空间确定目标神经网络架构，并通过对该目标神经网络架构进行训练，能够得到性能得到较大提升的目标神经网络，然后向用户提供目标神经网络的模型文件。该方法使得优化后的神经网络的性能能够得到较大的提升，能够将优化后的神经网络用于解决较复杂的任务，保证了优化后的神经网络的适用范围。

可选地，该神经网络优化方法还包括：接收用户输入的目标信息，目标信息包括以下信息中的一种或多种：运行目标神经网络的硬件的信息，及指示用户对目标神经网络的性能要求的信息。相应的，基于待优化神经网络的模型文件，获取目标神经网络架构的搜索空间，包括：基于待优化神经网络的模型文件和目标信息，获取目标神经网络架构的搜索空间。

当用户选择向优化系统提供该目标信息时，能够便于优化系统确定需要针对什么样的待优化神经网络进行优化，使优化系统对待优化神经网络的优化过程更具有针对性，以便于向用户提供更符合用户需求的目标神经网络。

知识库中存储的评价指标值通常包括多种指标值，则需要根据与该多种指标值对应的多类评价指标值对知识库进行检索，但根据用户的输入可能不包括多类评价指标值中的全部，则在一种可能的实现方式中，基于搜索空间，获得目标神经网络架构，包括：基于搜索空间，获取用于反映用户对目标神经网络的性能要求的指定信息；基于指定信息，在知识库中进行检索；当知识库中存在满足指定信息的已有神经网络架构时，将已有神经网络架构确定为目标神经网络架构。

在一种可实现方式中，指定信息可以包括多类评价指标值，则基于搜索空间，获取用于反映用户对目标神经网络的性能要求的指定信息，包括：基于搜索空间，得到至少一个备选神经网络架构；对每个备选神经网络架构进行训练和推理，得到每个备选神经网络架构的多类评价指标值。

相应的，基于指定信息，在知识库中进行检索，包括：基于每个备选神经网络架构的多类评价指标值，在知识库中进行检索；当知识库中任一神经网络架构满足任一备选神经网络架构的多类评价指标值时，确定知识库中存在满足指定信息的已有神经网络架构。

进一步地，基于搜索空间，获得目标神经网络架构，还包括：当知识库中不存在满足指定信息的已有神经网络架构时，采用架构搜索策略搜索得到目标神经网络架构。

通过先在知识库中进行检索，当知识库中存在与搜索空间、目标信息匹配的已有神经网络架构时，能够直接将已有神经网络架构确定为目标神经网络架构，无需再使用架构搜索策略搜索该神经网络架构，能够提高对待优化神经网络的优化效率，并降低优化神经网络的资源消耗。

在一种可实现方式中，该神经网络优化方法还包括：将搜索目标神经网络架构的过程中产生的中间数据存储在知识库中，中间数据包括以下一项或多项：目标神经网络架构的搜索空间、基于搜索空间得到的备选神经网络架构、与硬件相关的第一类评价指标值、与硬件无关的第二类评价指标值、用于运行目标神经网络的硬件的信息。

通过将搜索过程中的中间数据存储在知识库中，使得能够利用该中间数据为其他用户提供服务，并且，通过先在知识库中进行检索，当知识库中存在于待优化神经网络匹配的已有神经网络架构时，无需再使用架构搜索策略搜索神经网络架构，能够提高对待优化神经网络的优化效率，并降低优化神经网络的资源消耗。

可选地，基于待优化神经网络的模型文件对目标神经网络架构进行训练，得到目标神经网络的模型文件，包括：基于待优化神经网络的模型文件，采用模型克隆方法对目标神经网络架构进行训练，得到目标神经网络的模型文件。

通过模型克隆方法对目标神经网络架构进行训练，该模型克隆方法能够将该待优化神经网络的推理行为克隆到目标神经网络架构，能够保证目标神经网络的推理行为与待优化神经网络的推理行为具有一致性。

其中，基于待优化神经网络的模型文件，获取目标神经网络架构的搜索空间，包括：将待优化神经网络的模型文件输入经过预训练的人工智能模型，得到人工智能模型输出的目标神经网络架构的搜索空间。

通过人工智能模型预测搜索空间，能够使用人工智能模型对目标神经网络的任务类型进行自动检测，使得无需用户告知优化系统待优化神经网络的任务类型，简化了对神经网络进行优化时用户需要执行的操作。

可选地，在基于待优化神经网络的模型文件对目标神经网络架构进行训练，得到目标神经网络的模型文件之后，该神经网络优化方法还包括：采用优化策略对目标神经网络进行速度优化，优化策略包括：图优化策略和算子优化策略；向用户提供目标神经网络的模型文件，包括：向用户提供速度优化后的目标神经网络的模型文件。

或者，在向用户提供目标神经网络的模型文件之后，该神经网络优化方法还包括：接收用户发送的速度优化请求；基于速度优化请求，采用优化策略对目标神经网络进行速度优化，优化策略包括：图优化策略和算子优化策略；向用户提供速度优化后的目标神经网络的模型文件。

通过使用优化策略对目标神经网络进行速度优化，能够减少目标神经网络的计算量或者其他系统开销(如访存开销)，能够提高目标神经网络的推理速度。

第二方面，本申请提供了一种神经网络优化装置，该神经网络优化装置包括：交互模块，用于接收待优化神经网络的模型文件；架构确定模块，用于基于待优化神经网络的模型文件，获取目标神经网络架构的搜索空间，搜索空间包括目标神经网络架构中各神经元的各属性的取值范围；架构确定模块，还用于基于搜索空间，获得目标神经网络架构；训练模块，用于基于待优化神经网络的模型文件对目标神经网络架构进行训练，得到目标神经网络的模型文件；交互模块，还用于向用户提供目标神经网络的模型文件。

可选地，交互模块，还接收用户输入的目标信息，目标信息包括以下信息中的一种或多种：运行目标神经网络的硬件的信息，及指示用户对目标神经网络的性能要求的信息；架构确定模块，具体用于：基于待优化神经网络的模型文件和目标信息，获取目标神经网络架构的搜索空间。

可选地，架构确定模块，具体用于：基于搜索空间，获取用于反映用户对目标神经网络的性能要求的指定信息；基于指定信息，在知识库中进行检索；当知识库中存在满足指定信息的已有神经网络架构时，将已有神经网络架构确定为目标神经网络架构。

可选地，指定信息包括多类评价指标值，架构确定模块，具体用于：基于搜索空间，得到至少一个备选神经网络架构；对每个备选神经网络架构进行训练和推理，得到每个备选神经网络架构的多类评价指标值。

可选地，架构确定模块，具体用于：基于每个备选神经网络架构的多类评价指标值，在知识库中进行检索；当知识库中任一神经网络架构满足任一备选神经网络架构的多类评价指标值时，确定知识库中存在满足指定信息的已有神经网络架构。

可选地，架构确定模块，还具体用于：当知识库中不存在满足指定信息的已有神经网络架构时，采用架构搜索策略搜索得到目标神经网络架构。

可选地，该神经网络优化装置还包括：存储模块，用于将搜索目标神经网络架构的过程中产生的中间数据存储在知识库中，中间数据包括以下一项或多项：目标神经网络架构的搜索空间、基于搜索空间得到的备选神经网络架构、与硬件相关的第一类评价指标值、与硬件无关的第二类评价指标值、用于运行目标神经网络的硬件的信息。

可选地，训练模块，具体用于：基于待优化神经网络的模型文件，采用模型克隆装置对目标神经网络架构进行训练，得到目标神经网络的模型文件。

可选地，架构确定模块，具体用于：将待优化神经网络的模型文件输入经过预训练的人工智能模型，得到人工智能模型输出的目标神经网络架构的搜索空间。

可选地，该神经网络优化装置还包括：推理模块，用于采用优化策略对目标神经网络进行速度优化，优化策略包括：图优化策略和算子优化策略；交互模块，具体用于：向用户提供速度优化后的目标神经网络的模型文件。

可选地，交互模块，还用于接收用户发送的速度优化请求；相应的，该神经网络优化装置还包括：推理模块，用于基于速度优化请求，采用优化策略对目标神经网络进行速度优化，优化策略包括：图优化策略和算子优化策略；交互模块，还用于向用户提供速度优化后的目标神经网络的模型文件。

第三方面，本申请提供了一种计算机设备，计算机设备包括：处理器和存储器，存储器中存储有计算机程序；处理器执行计算机程序时，计算机设备实现本申请第一方面及任一可选的实现方式提供的方法。

第四方面，本申请提供了一种非瞬态的计算机可读存储介质，当该计算机可读存储介质中的指令被处理器执行时，实现本申请第一方面及任一可选的实现方式提供的方法。

第五方面，本申请提供了一种包含指令的计算机程序产品，当计算机程序产品在计算机上运行时，使得计算机执行本申请第一方面及任一可选的实现方式提供的方法。

附图说明

图1是本申请实施例提供的一种神经网络优化方法涉及的优化系统的示意图；

图2是本申请实施例提供的另一种神经网络优化方法涉及的优化系统的示意图；

图3是本申请实施例提供的又一种神经网络优化方法涉及的优化系统的示意图；

图4是本申请实施例提供的一种神经网络优化方法涉及的应用场景的示意图；

图5是本申请实施例提供的一种神经网络优化方法的流程图；

图6是本申请实施例提供的一种待优化神经网络的运算过程的示意图；

图7是本申请实施例提供的一种通过损失函数控制对神经网络架构进行调参使用的梯度的实现过程示意图；

图8是本申请实施例提供的另一种神经网络优化方法的流程图；

图9是本申请实施例提供的一种知识库的示意图；

图10是本申请实施例提供的又一种知识库的示意图；

图11是本申请实施例提供的再一种神经网络优化方法涉及的优化系统的示意图；

图12是本申请实施例提供的一种采用MBNAS方法进行搜索的过程示意图；

图13是本申请实施例提供的一种神经网络优化装置的结构示意图；

图14是本申请实施例提供的另一种神经网络优化装置的结构示意图；

图15是本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

为了便于理解本申请的技术方案，下面对本申请涉及的一些技术术语进行介绍。

深度学习(Deep Learning)：是一类基于深层次神经网络算法的机器学习技术，其主要特征是使用多重非线性变换构对数据进行处理和分析。主要应用于人工智能领域的感知、决策等场景，例如图像和语音识别、自然语言翻译、计算机博弈等。

自动机器学习：是针对机器学习模型的高级控制框架，其可以在无需人工干预的情况下，自动地搜索机器学习模型的最优参数配置。

神经网络(neural networks，NN)是一种模拟人脑的神经网络以期能够实现类人工智能的数学模型，神经网络也可以称为神经网络模型。神经网络通常采用具有连接关系的多个神经元(也称作节点，node)模拟人脑的神经网络。

其中，每个神经网络中各神经元的连接方式和/或连接结构称为该神经网络的神经网络架构。典型的神经网络架构包括循环神经网络(recurrent neural network，RNN)架构、卷积神经网络(convolutional neural network，CNN)架构等等。神经网络架构可以通过有向图(如有向无环图)进行表征。有向图中的每条边具有一个权重，权重用于表征一条边中输入节点相对于该边中输出节点的重要性。神经网络的参数即包括上述权重。需要说明，权重通常可以利用样本数据对神经网络进行训练得到。

根据神经网络架构获得神经网络模型包括两个阶段。一个阶段是对神经网络架构进行权重初始化(weight initialization)，得到初始神经网络模型，也称作初始子模型。其中，权重初始化是指对神经网络架构中各条边的权重(在有些情况下，还包括偏置)进行初始化。具体实现时，可以通过高斯分布生成权重初始值从而实现权重初始化。另一个阶段是利用样本数据更新初始子模型的权重，得到神经网络模型，也称作子模型(child model)。具体地，将样本数据输入初始子模型，该初始子模型可以根据初始子模型对样本数据的预测值以及样本数据携带的真值确定损失值，基于该损失值更新初始子模型的权重。通过多轮权重迭代后，可以获得一个子模型。该子模型即为已训练的、可用于特定应用的神经网络模型。

衡量一个子模型的优劣可以通过子模型的评价指标值实现。其中，评价指标值是对子模型从至少一个维度进行评价所得的度量值。子模型的评价指标值可以分为两类，一类评价指标值随着硬件变化而变化，另一类评价指标值随着硬件变化保持不变。为了方便描述，本申请实施例将随着硬件变化而变化的评价指标值称为第一类评价指标值，将随着硬件变化保持不变的评价指标值称为第二类评价指标值。

第一类评价指标值是与硬件相关的评价指标值，包括与硬件相关的性能值。在一些实现方式中，与硬件相关的性能值包括模型推理时延(latency)、激活量、吞吐量、功耗(power)和显存占用率中的任意一种或多种。第二类评价指标值是与硬件不相关的评价指标值，包括与硬件不相关的精度值。在一些实现方式中，精度值包括准确率(accuracy)、精确率(precision)和召回率(recall)中的任意一种或多种。其中，与硬件不相关的评价指标值还包括参数量和计算力，计算力具体包括每秒浮点运算次数(floating-point operations per second，FLOPs)。

随着近年来计算机设备的算力的提升，业界提出了使用神经网络开发平台(如AutoML平台)为用户设计和训练神经网络。并且，用户在使用已有神经网络时，还会出现对该已有神经网络的性能不满意的情况，此时用户还可以使用神经网络开发平台对该已有神经网络进行优化，以得到性能更好的神经网络。其主要过程包括：根据已有神经网络确定优化后的神经网络的搜索空间，在搜索空间中搜索得到优化后神经网络的神经网络架构，然后对得到的神经网络架构进行训练，得到优化后的神经网络。

其中，搜索空间包括各神经元的各属性的取值范围。该搜索空间定义了对神经网络架构进行搜索的范围，基于搜索空间定义的范围可以提供一组可供搜索的神经网络架构。根据需要构建的神经网络的类型，搜索空间可以分为链式架构空间、多分支架构空间以及基于单元块(block)的搜索空间等多种类型。不同的搜索空间均可以通过各属性的取值范围进行表征。例如，搜索空间可以通过神经元的标识和神经元执行操作这2种属性的取值范围进行表征。在一些情况下，搜索空间还可以结合神经网络架构包括的层数、每层包括的单元块数据以及每个单元块包括的神经元数中的至少一个进行表征。

目前，在对神经网络进行优化时，通常是对已有神经网络执行图优化和算子融合等优化操作。但是，目前优化操作对神经网络的性能提升空间有限，导致优化后的神经网络的性能仍然较差。

本申请实施例提供了一种神经网络优化方法。该方法能够先根据待优化神经网络的模型文件，为待优化神经网络映射到较相似的搜索空间，然后在基于该搜索空间确定目标神经网络架构，并通过对该目标神经网络架构进行训练，能够得到性能得到较大提升的目标神经网络，然后向用户提供目标神经网络的模型文件。因此，通过本申请实施例提供的神经网络优化方法优化后的神经网络的性能能够得到较大的提升。

本申请实施例提供的神经网络优化方法可应用于优化系统。该优化系统用于执行本申请实施例提供的神经网络优化方法。可选地，该优化系统可以通过终端、物理机、裸金属服务器、云服务器、虚拟机或容器等一种或多种设备实现。

优化系统可以在逻辑上分成多个部分，每个部分具有不同的功能。例如，如图1所示，优化系统1可以包括以下几个功能模块：交互模块11、架构确定模块12和训练模块13。交互模块11用于接收待优化神经网络的模型文件，并向用户提供优化后的目标神经网络的模型文件。架构确定模块12用于根据待优化神经网络的模型文件，获取目标神经网络架构的搜索空间，并基于搜索空间获得目标神经网络架构。训练模块13用于基于待优化神经网络的模型文件对目标神经网络架构进行训练，得到目标神经网络的模型文件。其中，由于神经网络需要以模型文件的形式向用户提供，下文中向用户提供神经网络和向用户提供神经网络的模型文件均指向用户提供神经网络，且为便于描述不对其进行区分。

可选地，如图2所示，该优化系统1还可以包括推理模块14。该推理模块14用于提供推理功能。例如，架构确定模块12在获得目标神经网络架构的过程中，可以生成多个备选神经网络架构，以便根据该多个备选神经网络架构得到目标神经网络架构，则推理模块14可以在硬件上对该多个备选神经网络架构对应的模型执行推理，获得多个备选神经网络架构在硬件上运行的推理时延等第一类评价指标值。此时，训练模块13还用于对架构确定模块12生成的多个备选神经网络架构对应的模型进行训练，获得多个备选神经网络架构的精度值等第二类评价指标值。相应的，架构确定模块12具体用于根据多个备选神经网络架构的第一类评价指标值和第二类评价指标值，获得目标神经网络架构。

进一步的，该推理模块14还用于对目标神经网络进行速度优化。此时，交互模块11具体用于向用户提供速度优化后的目标神经网络的模型文件。并且，该推理模块14还用于获取目标神经网络的第二类评价指标值，以便于向用户提供目标神经网络的模型文件时，一并向用于提供该目标神经网络的评价指标值。

并且，如图2所示，该优化系统1还可以包括存储模块15，该存储模块15用于存储获得目标神经网络架构过程中的中间数据，以提高对待优化神经网络的优化效率。另外，以上各个模块还可以具有其他功能，此处对其不进行一一列举。

优化系统1的多个部分可以部署在终端、物理机、裸金属服务器、云服务器、虚拟机和容器中的任一个上。或者，优化系统1的多个部分可以分布式地部署在多个终端、多个物理机、多个裸金属服务器、多个云服务器、多个虚拟机和多个容器中的一个或多个上。

并且，如图1和图2所示，训练模块13可以位于服务侧，例如：该训练模块13可以由神经网络优化服务的提供方提供。当然，在另一些实施例中，如图3所示，训练模块13也可以位于用户侧，即训练模块13可以由需要使用神经网络优化服务的用户提供。采用用户提供的训练模块13进行子模型训练，可以避免用于训练子模型的训练数据泄露，保障了数据安全。其中，神经网络优化服务用于提供本申请实施例提供的神经网络优化方法实现的功能。或者，由上可知，由于训练模块13可用于对目标神经网络架构进行训练，还用于与对架构确定模块12生成的多个备选神经网络架构对应的模型进行训练，则该训练模块13可以包括至少两部分。该至少两部分中的第一部分用于对目标神经网络架构进行训练，该至少两部分中的第二部分用于与对架构确定模块12生成的多个备选神经网络架构对应的模型进行训练。则作为一种部署方式，该第一部分可以位于用户侧，以便于使用该用户侧的训练数据执行训练过程，该第二部分可以位于服务侧。

类似地，如图2所示，推理模块14可以位于服务侧，或者，如图3所示，推理模块14也可以位于用户侧。当推理模块14位于用户侧时，采用用户所提供的推理模块14对架构确定模块12生成的多个备选神经网络架构对应的模型执行推理，无需将模型上传至服务侧，如此可以避免模型泄露，保障模型隐私。或者，由于推理模块14可用于在硬件上对架构确定模块12生成的多个备选神经网络架构对应的模型执行推理，还可用于获取目标神经网络的第二类评价指标值，则类似于训练模块13的部署方式，该推理模块14包括至少两部分。该至少两部分中的第一部分用于获取目标神经网络的第二类评价指标值，该至少两部分中的第二部分用于获得多个备选神经网络架构在硬件上运行的推理时延等第一类评价指标值。并且，作为一种部署方式，该第一部分可以位于用户侧，以便于使用该用户侧的训练数据获取目标神经网络的第二类评价指标值，该第二部分可以位于服务侧。

在一种可实现方式中，优化系统1中的部分或所有模块可以通过云平台中的资源实现。云平台中部署有云服务提供商拥有的基础资源，例如：计算资源、存储资源和网络资源等，该计算资源可以是大量的计算机设备(例如服务器)。优化系统1可以利用该云平台中部署的基础资源实现本申请实施例提供的神经网络优化方法，实现对神经网络的优化。例如：如图3所示的当交互模块11和架构确定模块12位于服务侧，训练模块13和推理模块14位于用户侧时，交互模块11和架构确定模块12可以部署在公有云平台中，训练模块13和推理模块14可以部署在私有云平台中，如此可以基于公有云平台和私有云平台形成的混合云平台实现本申请实施例提供的神经网络优化方法。或者如前述图1、图2所示的优化系统1可以全部部署在公有云平台或者全部部署在私有云平台。

当优化系统1中的部分或所有模块通过云平台中的资源实现时，如图4所示，本申请实施例提供的神经网络优化方法能够由云服务提供商在云平台抽象成一种神经网络优化云服务提供给用户。用户在云平台购买神经网络优化云服务后，云平台能够利用优化系统1对用户提供的神经网络进行优化的云服务。并且，根据优化系统1中的模块的部署方式，云平台可以向用户提供不同的神经网络优化云服务。例如，对于上述训练模块13和推理模块14的不同部署方式，云平台至少可以向用户提供以下两种神经网络优化云服务：

在第一种神经网络优化云服务中，当训练模块13和推理模块14均部署在服务侧，例如，优化系统1中的各部分均部署在公有云平台的一个云计算集群中，则用户在购买神经网络优化云服务后，可以将待优化神经网络发送至公有云平台中，则公有云平台可以利用优化系统1提供的神经网络优化云服务，对该待优化神经网络进行优化，并向用户提供优化后的神经网络。

在第二种神经网络优化云服务中，当训练模块13和推理模块14均部署在用户侧，交互模块11和架构确定模块12部署在服务侧时，例如，交互模块11和架构确定模块12部署在公有云平台的一个云计算集群)中，训练模块13和推理模块14部署在私有云平台的一个云计算集群中。则用户在购买神经网络优化云服务后，需要将待优化神经网络发送至公有云平台中，公有云平台利用架构确定模块12根据该待优化神经网络，向用户提供多个备选神经网络架构或多个备选神经网络架构对应的模型。然后用户使用训练模块13和推理模块14获取多个备选神经网络架构的评价指标值，并向公有云平台发送评价指标值。公有云平台根据评价指标值在多个备选神经网络架构中确定目标神经网络架构。然后公有云平台向用户提供目标神经网络架构或该神经网络架构对应的模型，使得用户使用训练模块13对目标神经网络架构或该神经网络架构对应的模型进行训练，以得到优化后的目标神经网络。

可选地，在本申请实施例中，云平台可以是中心云的云平台、边缘云的云平台或包括中心云和边缘云的云平台，本申请实施例对其不做具体限定。并且，当云平台为包括中心云和边缘云的云平台时，该优化系统可以部分部署在边缘云的云平台中，部分部署在中心云的云平台中。

需要说明的是，图1至图3仅仅是本申请实施例提供的优化系统的一些具体示例。并且，以上对优化系统中功能模块的划分方式和部署方式仅为示意性的举例，本申请不对优化系统中功能模块的划分方式和各功能模块的部署方式进行限定，实际应用时可根据用于部署优化系统的计算设备的计算能力或具体应用需求进行适应性的部署。

为了便于理解本申请实施例的技术方案，接下来以采用图2所示的优化系统实现本申请实施例提供的神经网络优化方法为例，对本申请实施例的一种神经网络优化方法进行介绍。图5是本申请实施例提供的一种神经网络优化方法的流程图。如图5所示，该神经网络优化方法包括以下步骤：

步骤501、接收待优化神经网络的模型文件。

当用户需要使用优化系统对待优化神经网络进行优化时，需要向优化系统提供待优化神经网络的模型文件，以便于优化系统确定需要针对什么样的待优化神经网络进行优化。待优化神经网络的模型文件用于指示待优化神经网络。例如，待优化神经网络实质上是有向图，有向图可以使用模型文件表示，且该模型文件可以为后缀为.ph的文件。如图6所示，模型文件表示的待优化神经网络的运算过程为：先对输入数据(input)执行卷积运算(conv)，然后采用线性整流函数(rectified linear unit，ReLU)对卷积运算结果进行线性整流处理，并对经线性整流函数处理后的结果和卷积运算结果执行求和运算(add)，然后输出(output)求和结果。其中，线性整流函数又称修正线性单元，是一种人工神经网络中常用的激活函数(activation function)，通常指代以斜坡函数及其变种为代表的非线性函数。比较常用的线性整流函数有斜坡函数f(x)＝max(0,x)，以及带泄露整流函数(leaky reLU)，其中x为神经元(Neuron)的输入。

步骤502、接收用户输入的目标信息，目标信息包括以下信息中的一种或多种：运行目标神经网络的硬件的信息(也称为硬件信息)，及指示用户对目标神经网络的性能要求的信息(也称为性能要求信息)。

用户在使用优化系统对待优化神经网络进行优化时，除了向优化系统提供待优化神经网络的模型文件，还可以向优化系统提供用户对待优化神经网络进行优化的相关要求，该相关要求可以使用目标信息表示。可选地，该目标信息可以包括以下一种或多种：用户期望运行目标神经网络的硬件的信息，及指示用户对目标神经网络的性能要求的信息。并且，性能要求信息还可以指示目标神经网络在指定数据集上的性能要求，且该性能要求信息可以包括指示目标神经网络的第一类评价指标值和第二类评价指标值中的至少一个的信息。例如，硬件信息用于指示用户期望运行目标神经网络的硬件为某型号的图形处理器(graphics processing unit，GPU)，性能要求信息用于指示用户期望目标神经网络的推理精度为95.94％，或者，性能要求信息用于指示用户期望目标神经网络在cifar10数据集上的推理精度为95.94％。其中，目标神经网络为经过优化系统对待优化神经网络进行优化后得到的神经网络。

需要说明的是，该步骤502是可选执行步骤。用户在使用优化系统对待优化神经网络进行优化时，可以选择是否需要向优化系统提供目标信息。当用户选择向优化系统提供该目标信息时，能够使优化系统对待优化神经网络的优化过程更具有针对性，以便于向用户提供更符合用户需求的目标神经网络。

步骤503、基于待优化神经网络的模型文件和目标信息，获取目标神经网络架构的搜索空间。

由上可知，步骤502是可选执行步骤，当不执行步骤502，即优化系统未接收目标信息时，可以不根据目标信息获取目标神经网络架构的搜索空间，则获得搜索空间的实现过程包括：基于待优化神经网络的模型文件，获得搜索空间。下面以执行步骤502为例，对基于待优化神经网络的模型文件和目标信息，获取目标神经网络架构的搜索空间的实现过程进行说明。其中，搜索空间包括目标神经网络架构中各神经元的各属性的取值范围。

在获取搜索空间的一种实现方式中，可以采用经过预训练的人工智能模型预测搜索空间。该人工智能模型能够根据输入的待优化神经网络的模型文件和目标信息，输出目标神经网络架构的搜索空间。通过人工智能模型预测搜索空间的过程可以包括：人工智能模型基于待优化神经网络的模型文件分析待优化神经网络的网络架构特征，得到目标神经网络可能的任务类型，并基于目标信息在该可能的任务类型中进一步确定目标神经网络的任务类型，如在分类任务和检测任务中进一步确定目标神经网络的任务类型是分类任务还是检测任务，然后根据任务类型与搜索空间的对应关系，输出目标神经网络的任务类型对应的搜索空间，得到目标神经网络架构的搜索空间。

其中，由于目标信息与神经网络的任务类型有一定关联关系，因此可以利用该关联关系基于目标信息在可能的任务类型中，进一步确定目标神经网络的任务类型。例如，假设目标信息与神经网络的任务类型的关联关系为：通常使用A1型号的GPU实现A2任务类型的任务，使用B1型号的GPU实现B2任务类型的任务，则当目标信息指示运行目标神经网络的硬件为A1型号的GPU时，可以根据该关联关系在可能的任务类型中，确定目标神经网络的任务类型为A2任务类型。

并且，根据人工智能模型预测搜索空间的过程可以看出，当优化系统接收到目标信息时，在确定搜索空间的过程中，能够使用该目标信息对根据待优化神经网络的模型文件确定的可能的任务类型进一步筛选。因此，对于优化系统接收到和未接收到目标信息的不同情况，对确定搜索空间的实现过程的影响在于是否使用目标信息进一步筛选。并且，当优化系统接收到目标信息时，由于能够使用目标信息进一步筛选，能够为目标神经网络确定更匹配的搜索空间，能够提高根据搜索空间优化得到的目标神经网络的性能。

在该确定搜索空间的实现方式中，由于人工智能模型能够对目标神经网络的任务类型进行自动检测，使得无需用户告知优化系统待优化神经网络的任务类型，简化了对神经网络进行优化时用户需要执行的操作。可选地，人工智能模型可以为分类模型，例如可以为支持向量机(support vector machine，SVM)。

需要说明的是，在将待优化神经网络的模型文件输入至人工智能模型之前，还可以将待优化神经网络的模型文件的数据类型转换为人工智能模型能够识别的数据类型，如将待优化神经网络的模型文件转化为一维特征数据，然后将该一维特征数据输入人工智能模型，该一维特征数据用于表示待优化神经网络中每个节点的类型及节点间的关系。可选地，可以采用图算法(如图核(graph kernel)算法)将待优化神经网络的模型文件转化为一维特征数据。

例如，继续以步骤501的待优化神经网络的模型文件为例，将该模型文件转换为一维特征数据的结果如表1所示，对于该表1中的每一行数据，"t#N"表示第N个图，如“t#0”表示第0个图，"v M L"表示该图中第M个顶点的标签为L，如“v01”表示图中第0个顶点的标签为1，"e P Q"表示第P个顶点和第Q个顶点之间通过一条边连接，如"e01"表示第0个顶点和第1个顶点之间通过一条边连接，“t#-1”表示模型文件的结尾。其中，图6中顶点的顺序按照从上至下且从左至右的顺序排列得到。

表1

01	t#0
02	v01
03	v12
04	v23
05	e01
06	e02
07	e12
08	t#-1

步骤504、基于目标神经网络架构的搜索空间和目标信息，获得目标神经网络架构。

由上可知，步骤502是可选执行步骤，当不执行步骤502，即优化系统未接收目标信息时，可以不根据目标信息获取目标神经网络架构，则获得目标神经网络架构的实现过程包括：基于待优化神经网络的模型文件，获得目标神经网络架构。下面以执行步骤502为例，对基于待优化神经网络的模型文件和目标信息，获取目标神经网络架构的实现过程进行说明。

在确定搜索空间后，可以基于搜索空间和目标信息，获得目标神经网络架构。可选地，可以根据搜索空间和目标信息，采用架构搜索策略搜索得到目标神经网络架构。或者，优化系统可以配置有知识库，可以根据搜索空间和目标信息，在知识库中检索，以获取目标神经网络架构。或者，在优化系统配置有知识库时，可以先基于搜索空间和目标信息，在知识库中进行检索，当知识库中存在与搜索空间、目标信息匹配的已有神经网络架构时，将已有神经网络架构确定为目标神经网络架构，当知识库中不存在与搜索空间、目标信息匹配的已有神经网络架构时，基于搜索空间和目标信息，采用架构搜索策略搜索得到目标神经网络架构。其中，为提高本申请实施例的可读性，此处暂不对在知识库中进行检索和采用架构搜索策略进行搜索的实现过程进行说明，在后面内容中再行介绍。

在一些实施例中，为了便于使用该搜索过程中得到的中间数据为其他用户服务，还可以将搜索目标神经网络架构的过程中产生的中间数据存储在知识库中，以提高对待优化神经网络的优化效率。可选地，中间数据包括以下一项或多项：目标神经网络架构的搜索空间、基于搜索空间得到的备选神经网络架构、与硬件相关的第一类评价指标值、与硬件无关的第二类评价指标值、及用于运行目标神经网络的硬件的信息。可选地，第一类评价指标值包括在硬件上运行的推理时延等，第二类评价指标值包括精度值等。

步骤505、基于待优化神经网络的模型文件对目标神经网络架构进行训练，得到目标神经网络的模型文件。

可选地，可以采用本申请实施例提供的一种模型克隆方法，对目标神经网络架构进行训练，得到目标神经网络的模型文件。下面对该模型克隆方法进行说明：

模型克隆方法的基本原理是：以控制目标神经网络架构对任一训练数据的输出，拟合待优化神经网络对该任一训练数据的输出为目标，对目标神经网络架构进行训练，得到训练完成的目标神经网络。也即是，在使用模型克隆方法对目标神经网络架构进行训练时，可以通过判断目标神经网络架构对任一训练数据的输出，与待优化神经网络对该任一训练数据的输出的差别是否趋于最小，来确定是否完成了对目标神经网络架构的训练。其中，拟合是指通过调整目标神经网络架构中的权重系数，使得调整权重系数后的神经网络架构对任一训练数据的输出与待优化神经网络对该任一训练数据的输出的差别趋于最小。

在一种可实现方式中，控制目标神经网络架构对任一训练数据的输出，拟合待优化神经网络对该任一训练数据的输出，可以通过损失函数控制对神经网络架构进行调参使用的梯度实现。如图7所示，其实现过程包括：对与任一训练数据，分别获取目标神经网络架构和待优化神经网络对该任一训练数据的目标参数，然后根据目标神经网络架构和待优化神经网络对该任一训练数据的目标参数，获取指定损失函数的损失值，然后将该损失值回传至目标神经网络架构，以便于根据该损失值确定对神经网络架构进行调参使用的梯度，然后根据确定的梯度调整目标神经网络架构的权重参数，直至达到训练目标。可选地，神经网络对训练数据的目标参数为神经网络针对训练数据发生事件A的次数与不发生事件A的次数的比值的对数，即logits。该图7即为目标参数为logits时，对目标神经网络架构进行训练的过程示意图。另外，获取指定损失函数的损失值的过程可选为：将目标神经网络架构对该任一训练数据的目标参数和待优化神经网络对该任一训练数据的目标参数均作为指定损失函数的输入，该指定损失函数的输出即为该指定损失函数的损失值。其中，指定损失函数的具体实现形式可以根据应用需求进行设计，本申请实施例对其不做具体限定。

并且，在对目标神经网络架构进行训练时，可以采用公开的数据集作为训练集。例如，可以使用ImageNet数据集等公开数据集。由于ImageNet数据集具有丰富的图像信息，将ImageNet数据集作为训练集能够有效保证对神经网络的训练效果。并且，通过使用公开的数据集，使得用户无需上传训练数据，能够解决用户出于对数据的隐私、法律或传输方面限制的原因而无法提供用于训练模型的数据的问题。另外，通过使用公开数据集作为训练集，相对于使用生成对抗网络(generative adversarial network，GAN)等生成训练数据的相关技术，避免了因生成对抗网络等存在的缺点对训练结果的影响，如训练不稳定、调参难度大、训练成本高昂、及在复杂的任务或高分辨率数据集上难以取得很好效果等缺点。

由上可知，通过使用该模型克隆方法对目标神经网络架构进行训练，能够将该待优化神经网络的推理行为克隆到目标神经网络架构，能够保证目标神经网络的推理行为与待优化神经网络的推理行为具有一致性。并且，通过采用本申请实施例提供的神经网络优化方法，及使用公开的数据集并设计指定损失函数，使得优化后的目标神经网络架构能够相对于待优化神经网络的神经网络架构发生改变，能够进一步保证目标神经网络的精度。

步骤506、向用户提供目标神经网络的模型文件。

在训练得到目标神经网络后，即可向用户提供目标神经网络的模型文件，以便于用户使用该目标神经网络。

可选地，在训练得到目标神经网络后，优化系统还可以对目标神经网络进行速度优化，并向用户提供速度优化后的神经网络。该速度优化可以包括线下优化和线上优化。线下优化是指用户在未使用目标神经网络进行推理时，对该目标神经网络进行速度优化，线上优化是指在用户使用目标神经网络进行推理的过程中，对该目标神经网络进行速度优化。

对于线下优化，可以在训练得到目标神经网络后，直接采用优化策略对目标神经网络进行速度优化，相应的，该步骤506的实现过程包括：向用户提供速度优化后的目标神经网络的模型文件。其中，优化策略包括：图优化策略和算子优化策略。图优化策略可以包括：对用于表示目标神经网络的图进行图的等效变换，然后根据等效变换后的图调整目标神经网络的结构，和/或，将目标神经网络中多个节点实现的算子融合到一个节点上实现，然后根据算子融合结果调整目标神经网络的结构。算子优化策略可以包括：使用算子搜索技术根据算子的类型和参数，在用于实现算子的多种算法中搜索出最优的算子实现算法。其中，对操作对象执行的一项或多项操作的集合称为一个算子。

在线下优化的另一种实现方式中，可以在向用户提供目标神经网络的模型文件之后，根据用户的请求对目标神经网络进行速度优化。相应的，如图8所示，神经网络优化方法还包括：

步骤507、接收用户发送的速度优化请求。

用户在目标神经网络的过程中，若觉得需要对目标神经网络的速度进行优化，还可以向优化系统发送速度优化请求，以请求优化系统采用优化策略对目标神经网络进行速度优化。

步骤508、基于速度优化请求，采用优化策略对目标神经网络进行速度优化。

其中，优化策略包括：图优化策略和算子优化策略。该优化策略的实现方式可以相应参考前述描述，此处不再赘述。

步骤509、向用户提供速度优化后的目标神经网络的模型文件。

下面对在知识库中进行检索，以获得目标神经网络架构的实现过程进行说明。为便于理解，先对知识库进行说明，然后对在知识库中进行检索的实现过程进行说明。

知识库可视为一个数据库，该知识库存储有与神经网络模型架构相关的信息。可选地，知识库包括至少三类信息，该至少三类信息包括：神经网络的预训练参数、评价指标值和神经网络架构。评价指标值包括第一类评价指标值和第二类评价指标值等评价指标值，第一类评价指标值包括在硬件上运行的推理时延和功耗等，第二类评价指标值包括精度值等。预训练参数包括：用于验证神经网络的训练集中验证精度的验证数据和用于进行知识迁移的其他数据(如训练数据等)。知识迁移是指根据用户需求和知识库中的已有数据，生成用于得到用户所需神经网络的数据。预训练参数和评价指标值可视为神经网络架构的标签信息。图9为知识库包括神经网络的预训练参数、评价指标值和神经网络架构的示意图。

其中，知识库中的信息按照来源分类，可分为初始信息和后期信息。该初始信息可以来自公开数据集和公开模型库。该后期信息可以在对神经网络进行优化的过程中累积得到。例如，后期信息可以为在采用搜索策略搜索神经网络架构过程中得到的中间数据。通过将采用搜索策略为用户搜索神经网络架构过程中得到的中间数据存储在该知识库中，使得能够利用该中间数据为其他用户提供服务，能够提高对待优化神经网络的优化效率，并降低优化神经网络的资源消耗。

可选地，根据目标神经网络架构的搜索空间和目标信息，在知识库中进行检索的实现方式包括：根据搜索空间和目标信息，查询知识库中是否存储有使用该搜索空间，且满足该目标信息的已有神经网络架构，当知识库中存储有使用该搜索空间，且满足该目标信息的已有神经网络架构时，说明该已有神经网络架构与目标神经网络的任务需求匹配，则可将该已有神经网络架构确定为目标神经网络架构。

由于预训练参数和评价指标值可视为神经网络架构的标签信息，在查询知识库中是否存储有使用该搜索空间，且满足该目标信息的已有神经网络架构的过程，可以视为根据搜索空间和目标信息，在知识库的预训练参数和评价指标值中查询是否存储有使用该搜索空间，且与目标信息匹配的标签信息的过程。当知识库中存储的预训练参数和评价指标值中存在存储有使用该搜索空间，且与目标信息匹配的标签信息时，将使用该搜索空间，且携带有与目标信息匹配的标签信息的神经网络架构，确定为使用该搜索空间，且满足该目标信息的已有神经网络架构。并且，搜索空间和与目标信息匹配的标签信息，可以共同指示对目标神经网络进行训练的训练集，与目标信息匹配的标签信息可以指示目标神经网络的第一类评价指标值和第二类评价指标值等评价指标值，神经网络架构使用该搜索空间可以指示神经网络架构与待优化神经网络属于同一类型的神经网络类型。

其中，查询知识库中是否存储有使用该搜索空间的已有神经网络架构，是指对知识库存储的神经网络架构的网络结构进行分析，以确定该神经网络架构中各神经元的各属性的取值范围是否落入该搜索空间包括的范围内，当该神经网络架构中各神经元的各属性的取值范围均落入该搜索空间包括的范围内时，确定该神经网络架构使用该搜索空间。

知识库中存储的评价指标值通常包括多种指标值，例如，包括第一类评价指标值和第二类评价指标值。则在查询知识库中是否存在与目标信息匹配的标签信息时，需要将该多种指标值分别与目标信息匹配，当该多种指标值均与目标信息匹配时，确定知识库中存在与目标信息匹配的标签信息。相应的，此时需要保证目标信息包括与该多种指标值对应的多类评价指标值。

但是，用户输入的目标信息可能仅包括该多类评价指标值中的部分类评价指标值。此时，可以根据目标神经网络架构的搜索空间，得到目标信息未包括的部分类评价指标值，该得到的部分评价指标值和目标信息中的部分类评价指标值共同组成多类评价指标值。类似的，当优化系统未接收到目标信息时，则可以根据搜索空间，得到与该多种指标值对应的多类评价指标值。其中，为便于描述，将根据搜索空间获得的评价值和目标信息包括的评价值组成的集合称为指定信息，该指定信息用于反映用户对目标神经网络的性能要求，且该指定信息包括与知识库中的多种指标值对应的多类评价指标值。

在一种可实现方式中，基于目标神经网络架构的搜索空间，获取指定信息的实现方式包括：基于搜索空间，得到至少一个备选神经网络架构，对每个备选神经网络架构进行训练和推理，得到每个备选神经网络架构的多类评价指标值。其中，可以通过对搜索空间进行采样，得到每个备选神经网络架构中各神经元的各属性的取值，从而生成至少一个备选神经网络架构，该过程可以相应参考步骤5041。并且，可以采用训练模块对每个备选神经网络架构进行权重初始化，得到多个初始子模型，然后利用训练数据训练多个初始子模型，得到多个备选子模型的第二类评价指标值，该过程可以相应参考步骤5042。可以采用推理模块在硬件上对每个备选神经网络架构进行权重初始化得到的初始子模型，然后对初始子模型进行推理，获得初始子模型在硬件上的第一类评价指标值，该过程可以相应参考步骤5043。

此时，由于能够根据每个备选神经网络架构得到多类评价指标值，则在知识库中进行检索时，可以基于每个备选神经网络架构的多类评价指标值，在知识库中进行检索，并当知识库中任一神经网络架构满足任一备选神经网络架构的多类评价指标值时，确定知识库中存在满足指定信息的已有神经网络架构。

需要说明的是，当基于搜索空间得到多个备选神经网络架构时，知识库中满足指定信息的已有神经网络架构可能有多个，此时可以根据指定筛选策略将该多个已有神经网络架构中的一个确定为目标神经网络架构。该指定筛选策略可以根据应用需求确定，例如，可以随机选择，或者，可以将该多个已有神经网络架构中性能最好的一个确定为目标神经网络架构，本申请实施例对其不做具体限定。

可选地，知识库中的信息可以按照搜索空间进行存储。在一种可实现方式中，知识库可以以搜索空间为单位分成多个子知识库，任一搜索空间对应的子知识库中存储的信息为在该搜索空间下得到的信息。例如，如图10所示，知识库可以以搜索空间spaceA、spaceB和spaceC为单位分成三个子知识库。搜索空间spaceA对应的子知识库中存储的信息包括：在该搜索空间spaceA下，得到的神经网络的预训练参数、评价指标值和神经网络架构。搜索空间spaceB对应的子知识库中存储的信息包括：在该搜索空间spaceB下，得到的神经网络的预训练参数、评价指标值和神经网络架构。搜索空间spaceC对应的子知识库中存储的信息包括：在该搜索空间spaceC下，得到的神经网络的预训练参数、评价指标值和神经网络架构。

相应的，此时在知识库中进行检索时，可以先在知识库中找到目标神经网络架构的搜索空间对应的子知识库，然后在该子知识库中进行检索。这样一来，当确定目标神经网络架构的搜索空间后，就无需在其他搜索空间对应的子知识库中进行检索，减小了在知识库中进行检索的检索范围，缩短了对知识库进行检索的耗时，减少了对知识库进行检索的资源耗费。

例如，假设用户提供的模型文件指示待优化神经网络为ResNet34神经网络，用户提供的目标信息指示优化得到的目标神经网络的性能需要满足在cifar10数据集的推理精度至少为95.94％，且希望提升目标神经网络在A型号的GPU上的推理性能。则根据该模型文件，可以确定目标神经网络架构的搜索空间为ResNet系列神经网络模型的搜索空间。假设知识库存储的评价指标值推理精度、推理时延和功耗，由于目标信息仅指示了推理精度，则需要基于搜索空间，获取用户所需的推理时延和功耗。那么可以根据ResNet系列神经网络模型的搜索空间，生成多个备选神经网络架构，并在A型号的GPU上对该多个备选神经网络架构对应的神经网络模型进行推理，得到该多个备选神经网络架构的推理时延和功耗。然后，根据搜索空间、目标信息指示得推理精度、每个备选神经网络架构的推理时延和功耗，在知识库中进行检索。在知识库中进行检索时，发现知识库中存在ResNet18神经网络，该ResNet18神经网络能够满足搜索空间、根据备选神经网络架构确定的推理时延和功耗，且该ResNet18为在cifar10数据集上的推理精度为96.01％。即该ResNet18神经网络满足根据待优化神经网络ResNet34确定的搜索空间，满足用户提供的目标信息，且满足根据备选神经网络架构确定的推理时延和功耗。因此可将该ResNet18神经网络确定为对待优化神经网络ResNet34优化后的目标神经网络架构。

下面对采用架构搜索策略进行搜索，获得目标神经网络架构的实现过程进行说明。在一种可实现方式中，可以采用神经网络架构搜索(neural architecture search，NAS)算法或高效神经网络架构搜索(efficient neural architecture search，ENAS)算法等传统神经网络架构搜索算法进行搜索。在另一种可实现方式中，可以采用本申请实施例提供的一种基于模型的神经网络架构搜索(model-based neural architecture search，MBNAS)方法进行搜索。并且，该MBNAS方法的实现可以通过多个功能模块实现。为便于理解，本申请实施例以通过图11所示的多个功能模块实现MBNAS方法为例，对采用MBNAS方法进行搜索的实现过程进行说明：

如图11所示，用于实现MBNAS方法的功能模块包括架构确定模块12、训练模块13和推理模块14，架构确定模块12包括生成子模块121和搜索子模块122，搜索子模块122包括评估单元1221和控制单元1222。下面借助图12所示的过程示意图，对采用MBNAS方法进行搜索的过程进行说明，该过程包括以下步骤：

步骤5041、生成子模块根据搜索空间生成多个神经网络架构，并向训练模块和推理模块提供该多个神经网络架构。

如前，搜索空间包括优化后神经网络的神经网络架构中各神经元的各属性的取值范围，则生成子模块可以通过对搜索空间进行采样，得到优化后神经网络的神经网络架构中各神经元的各属性的取值，从而生成多个神经网络架构。并且，在对搜索空间进行采样时，生成子模块可以采用随机方式进行采样，如此可以保障后续用于训练评估单元的样本的均衡性。或者，生成子模块也可以采用其他方式对搜索空间进行采样，本申请实施例对其不做具体限定。

步骤5042、训练模块根据多个神经网络架构训练得到多个备选子模型，获取多个备选子模型的第二类评价指标值，并向搜索子模块提供该多个神经网络架构和多个备选子模型的第二类评价指标值。

训练模块可以对神经网络架构进行权重初始化，得到多个初始子模型，然后利用训练数据训练多个初始子模型，得到多个备选子模型的第二类评价指标值。可选地，该第二类评价指标值可以包括推理时延和功耗。训练初始子模型所采用的训练数据可以是ImageNet数据集等公开数据集，或者是用户提供的数据集。

其中，由于多个初始子模型的训练过程不存在相互依赖关系，训练模块可以并发地对多个初始子模型进行训练，如此可以缩短训练时长，提高训练效率。

步骤5043、推理模块在硬件上对生成子模块提供的多个神经网络架构对应的多个子模型进行推理，获得多个子模型在硬件上的第一类评价指标值，并向搜索子模块提供该多个神经网络架构和多个子模型的第一类评价指标值。

可选地，该第一类评价指标值可以包括精度值。其中，当用户提供的目标信息包括硬件信息时，用于推理子模型的硬件可以为该硬件信息指示的硬件，或者，在已为推理模块配置的硬件中与该硬件信息指示的硬件具有较大性能相似度的硬件。当用户提供的目标信息不包括硬件信息时，即用户未指定用于运行目标神经网络的硬件时，用于推理子模型的硬件可以为已为推理模块配置的硬件。

并且，推理模块在硬件上执行推理的多个子模型，可以为推理模块对生成子模块提供的神经网络架构进行权重初始化得到的多个初始子模型，也可以为训练模块对多个初始子模型进行训练得到的多个备选子模型。另外，只要推理模块、训练模块和生成子模块中有一个向搜索子模块提供生成子模块生成的多个神经网络架构即可。

与训练模块类似，推理模块可以并行地对多个子模型在硬件上执行推理，获得多个子模型在硬件上的第一类评价指标值。

步骤5044、搜索子模块根据多个神经网络架构、多个备选子模型的第二类评价指标值和多个子模型的第一类评价指标值，确定目标神经网络架构。

搜索子模块可以根据多个神经网络架构、多个备选子模型的第二类评价指标值和多个子模型的第一类评价指标值，对评估单元进行训练。然后，搜索子模块使用训练完成的评估单元对控制单元提供的神经网络架构进行预测，得到控制单元提供的神经网络架构对应的评价指标值，并将该评价指标值作为反馈用于训练控制单元，然后使用训练完的控制单元确定目标神经网络架构。

评估单元属于一种神经网络，其训练过程包括：将生成子模块生成的神经网络架构及其对应的第一类评价指标值和第二类评价指标值输入评估单元，以输入的第一类评价指标值和第二类评价指标值作为输入的神经网络架构的标签进行监督学习，使得评估单元根据标签和评估单元对神经网络架构预测得到的评价指标值确定损失值，并根据该损失值更新评估单元的权重参数，直至满足评估单元的训练结束条件，如评估单元趋于收敛或评估单元的损失值小于预设损失值。其中，评估单元可以为循环神经网络。用于对评估单元进行训练的一组训练数据包括：生成子模块生成的多个神经网络架构中的任一神经网络架构、该神经网络对应的备选子模型的第二类评价指标值、及该神经网络对应的子模型的第一类评价指标值。

控制单元也属于一种神经网络。控制单元可以根据搜索空间生成神经网络架构，训练完成的评估单元可以预测控制单元生成的神经网络架构的评价指标值(例如包括第一类评价指标值和第二类评价指标值中的至少一个)，该预测得到的评价指标值用于作为训练控制单元的激励(reward)，以根据该激励对控制单元的权重参数进行调整，直至满足控制单元的训练结束条件，如控制单元趋于收敛。其中，控制单元可以为循环神经网络。

完成训练后的控制单元用于根据目标神经网络的搜索空间，生成多个候选神经网络架构。搜索子模块可以获取该多个候选神经网络架构，并根据该多个候选神经网络架构得到多个初始神经网络，然后分别对多个初始神经网络进行训练，得到多个候选神经网络架构对应的多个候选神经网络，并分别对多个候选神经网络进行推理，得到多个候选神经网络的评价指标值，然后根据多个候选神经网络的评价指标值，筛选满足指定筛选条件的候选神经网络，并将该满足指定筛选条件的候选神经网络的神经网络架构，确定为目标神经网络架构。其中，指定筛选条件可以根据搜索空间和目标信息中的至少一个确定。例如，指定筛选条件指示目标神经网络架构需要满足目标信息指示的用户对目标神经网络的性能要求，且若多个候选神经网络中存在多个候选神经网络满足该性能要求时，可以将性能最好的候选神经网络的神经网络架构确定为目标神经网络架构。并且，可以采用本申请实施例提供的一种模型克隆方法，对多个初始神经网络进行训练，且训练使用的训练集可以为ImageNet数据集等公开数据集。在一些可能的实现方式中，搜索子模块可以采用训练模块对多个初始神经网络进行训练。且当训练模块部署在用户侧时，需要将多个初始神经网络发送至部署在用户侧的训练模块，以使用该训练模块执行训练过程。并且，以上描述是以采用MBNAS方法进行搜索的过程中所需的训练功能均由训练模块13提供，所需的推理功能均由推理模块14提供为例进行说明。在一种可能的实现方式中，该搜索过程中所需的训练功能也可以不由训练模块13提供，所需的推理功能也可以不由推理模块14提供。例如，架构确定模块还包括训练子模块和推理子模块，该训练子模块用于提供该搜索过程所需的训练功能，该推理子模块用于提供该搜索过程所需的推理功能。

需要说明的是，根据前面描述可知：知识库包括至少三类信息，该至少三类信息包括：神经网络的预训练参数、评价指标值和神经网络架构，且预训练参数和评价指标值可视为神经网络架构中神经网络架构的标签信息。若用户指定了目标神经网络的训练集，则根据搜索空间和目标信息对知识库的检索存在以下至少六种检索结果：与至少三类信息均不匹配(即与训练集与全部目标信息均不匹配)、仅与预训练参数匹配(即仅训练集匹配)、仅与评价指标值中多种指标值中的部分匹配(即仅与部分评价指标值匹配)、仅与全部评价指标值匹配(即与评价指标值中多种指标值中的全部匹配)、与预训练参数匹配且与部分评价指标值匹配、及与预训练参数匹配且与全部评价指标值匹配。若用户未指定目标神经网络的训练集，则根据搜索空间和目标信息对知识库的检索存在以下至少三种检索结果：与评价指标值均不匹配、仅与部分评价指标值匹配、及与全部评价指标值匹配。

当与预训练参数匹配且与全部评价指标值匹配，或与全部评价指标值匹配时，可以直接使用知识库中的已有神经网络架构，在其他匹配情况均需要使用MBNAS方法进行搜索。并且，对于上述不同匹配情况，采用MBNAS方法进行搜索的实现过程会稍有差别，具体为：当与至少三类信息均不匹配、仅与预训练参数匹配、指定训练集情况下仅与部分评价指标值匹配、指定训练集情况下仅与全部评价指标值匹配、或与评价指标值均不匹配时，按照上述步骤5041至步骤5044描述的实现过程进行搜索。当与预训练参数匹配且与部分评价指标值匹配、或未指定训练集情况下仅与部分评价指标值匹配时，若与评价指标值中部分匹配的信息为第二类评价指标值，则可以无需执行上述步骤5042，可以直接使用评价指标值中的第二类评价指标值对评估单元进行训练，若与评价指标值中部分匹配的信息为第一类评价指标值，则可以无需执行上述步骤5043，可以直接使用评价指标值中的第一类评价指标值对评估单元进行训练。当无需执行上述步骤5042或5043时，能够提高对待优化神经网络进行优化的效率，且由于上述第一类评价指标值、第二类评价指标值和搜索空间等为优化系统为其他用户优化神经网络过程中得到的中间数据，因此，通过将中间数据存储在知识库中，能够丰富知识库，且提高对待优化神经网络的优化效率。

综上所述，在本申请实施例提供的神经网络优化方法中，能够先根据待优化神经网络的模型文件，为待优化神经网络映射到较相似的搜索空间，然后在基于该搜索空间确定目标神经网络架构，并通过对该目标神经网络架构进行训练，能够得到性能得到较大提升的目标神经网络，然后向用户提供目标神经网络的模型文件。该方法使得优化后的神经网络的性能能够得到较大的提升，能够将优化后的神经网络用于解决较复杂的任务，保证了优化后的神经网络的适用范围。

并且，由于该方法无需用户上传训练数据，能够避免用户出于对数据的隐私、法律或传输方面限制的原因而无法向平台提供用于训练数据的问题，实现对用户数据的保护，提高了该神经网络优化方法的适用性。

同时，由于该方法只需用户提供待优化神经网络，且可选提供目标信息，即可完成待优化神经网络的优化，不会像高阶自动机器学习平台一样，无需用户对模型优化的相关知识有一定储备就能开展优化工作，降低了该神经网络优化方法的使用门槛，扩展了该神经网络优化方法的使用范围。

另外，通过将搜索过程中的中间数据存储在知识库中，使得能够利用该中间数据为其他用户提供服务，并且，通过先在知识库中进行检索，当知识库中存在于待优化神经网络匹配的已有神经网络架构时，无需再使用架构搜索策略搜索神经网络架构，能够提高对待优化神经网络的优化效率，并降低优化神经网络的资源消耗。

需要说明的是，本申请实施例提供的神经网络优化方法的步骤先后顺序可以进行适当调整，步骤也可以根据情况进行相应增减。任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化的方法，都应涵盖在本申请的保护范围之内，因此不再赘述。

本申请实施例还提供了一种神经网络优化装置。该神经网络优化装置可以实现前述优化系统1的部分或全部功能。当神经网络优化装置为软件装置时，其可以是前述优化系统的部分或者全部。如图13所示，该神经网络优化装置130包括：

交互模块1301，用于接收待优化神经网络的模型文件。

架构确定模块1302，用于基于待优化神经网络的模型文件，获取目标神经网络架构的搜索空间，搜索空间包括目标神经网络架构中各神经元的各属性的取值范围。

架构确定模块1302，还用于基于搜索空间，获得目标神经网络架构。

训练模块1303，用于基于待优化神经网络的模型文件对目标神经网络架构进行训练，得到目标神经网络的模型文件。

交互模块1301，还用于向用户提供目标神经网络的模型文件。

可选地，交互模块1301，还接收用户输入的目标信息，目标信息包括以下信息中的一种或多种：运行目标神经网络的硬件的信息，及指示用户对目标神经网络的性能要求的信息。

相应的，架构确定模块1302，具体用于：基于待优化神经网络的模型文件和目标信息，获取目标神经网络架构的搜索空间。

可选地，架构确定模块1302，具体用于：基于搜索空间，获取用于反映用户对目标神经网络的性能要求的指定信息；基于指定信息，在知识库中进行检索；当知识库中存在满足指定信息的已有神经网络架构时，将已有神经网络架构确定为目标神经网络架构。

可选地，指定信息包括多类评价指标值，架构确定模块1302，具体用于：基于搜索空间，得到至少一个备选神经网络架构；对每个备选神经网络架构进行训练和推理，得到每个备选神经网络架构的多类评价指标值。

可选地，架构确定模块1302，具体用于：基于每个备选神经网络架构的多类评价指标值，在知识库中进行检索；当知识库中任一神经网络架构满足任一备选神经网络架构的多类评价指标值时，确定知识库中存在满足指定信息的已有神经网络架构。

可选地，架构确定模块1302，还具体用于：当知识库中不存在满足指定信息的已有神经网络架构时，采用架构搜索策略搜索得到目标神经网络架构。

可选地，如图14所示，该神经网络优化装置130还包括：存储模块1304，用于将搜索目标神经网络架构的过程中产生的中间数据存储在知识库中，中间数据包括以下一项或多项：目标神经网络架构的搜索空间、基于搜索空间得到的备选神经网络架构、与硬件相关的第一类评价指标值、与硬件无关的第二类评价指标值、用于运行目标神经网络的硬件的信息。

可选地，训练模块1303，具体用于：基于待优化神经网络的模型文件，采用模型克隆装置130对目标神经网络架构进行训练，得到目标神经网络的模型文件。

可选地，架构确定模块1302，具体用于：将待优化神经网络的模型文件输入经过预训练的人工智能模型，得到人工智能模型输出的目标神经网络架构的搜索空间。

可选地，如图14所示，该神经网络优化装置130还包括：推理模块1305，用于采用优化策略对目标神经网络进行速度优化，优化策略包括：图优化策略和算子优化策略。

相应的，交互模块1301，具体用于：向用户提供速度优化后的目标神经网络的模型文件。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置和模块的具体工作过程，可以参考前述方法实施例中的对应内容，在此不再赘述。

综上所述，在本申请实施例提供的神经网络优化装置中，能够先根据待优化神经网络的模型文件，为待优化神经网络映射到较相似的搜索空间，然后在基于该搜索空间确定目标神经网络架构，并通过对该目标神经网络架构进行训练，能够得到性能得到较大提升的目标神经网络，然后向用户提供目标神经网络的模型文件。该神经网络优化装置使得优化后的神经网络的性能能够得到较大的提升，能够将优化后的神经网络用于解决较复杂的任务，保证了优化后的神经网络的适用范围。

并且，由于该神经网络优化装置无需用户上传训练数据，能够避免用户出于对数据的隐私、法律或传输方面限制的原因而无法向平台提供用于训练数据的问题，实现对用户数据的保护，提高了该神经网络优化装置的适用性。

同时，由于该神经网络优化装置只需用户提供待优化神经网络，且可选提供目标信息，即可完成待优化神经网络的优化，不会像高阶深度学习AutoML平台一样，无需用户对模型优化的相关知识有一定储备就能开展优化工作，降低了该神经网络优化装置的使用门槛，扩展了该神经网络优化装置的使用范围。

图15是本申请实施例提供的一种计算机设备的结构示意图。图1、图2或图3所示的优化系统可部署在该计算机设备中。如图15所示，该计算机设备150包括存储器1501、处理器1502、通信接口1503以及总线1504。其中，存储器1501、处理器1502、通信接口1503通过总线1504实现彼此之间的通信连接。并且，该计算机设备150可以包括多个处理器1502，以便于通过不同的处理器实现上述不同功能模块的功能。

存储器1501可以是只读存储器(read only memory，ROM)，静态存储设备，动态存储设备或者随机存取存储器(random access memory，RAM)。存储器1501可以存储可执行代码序，当存储器1501中存储的可执行代码被处理器1502执行时，处理器1502和通信接口1503用于执行本申请实施例提供的神经网络优化方法。存储器1501中还可以包括操作系统等其他运行进程所需的软件模块和数据等。且操作系统可以为LINUX，UNIX，WINDOWS ^TM等。

处理器1502可以采用通用的中央处理器(central processing unit，CPU)，微处理器，应用专用集成电路(application specific integrated circuit，ASIC)，图形处理器(graphics processing unit，GPU)或者一个或多个集成电路。

处理器1502还可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，本申请的神经网络优化方法的部分或全部功能可以通过处理器1502中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1502还可以是通用处理器、数字信号处理器(digital signal processing，DSP)、专用集成电路(ASIC)、现成可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1501，处理器1502读取存储器1501中的信息，结合其硬件完成本申请实施例的神经网络优化方法。

通信接口1503使用例如但不限于收发器一类的收发模块，来实现计算机设备150与其他设备或通信网络之间的通信。例如，通信接口1503可以是以下器件的任一种或任一种组合：网络接口(如以太网接口)、无线网卡等具有网络接入功能的器件。

总线1504可包括在计算机设备150各个部件(例如，存储器1501、处理器1502、通信接口1503)之间传送信息的通路。

上述每个计算机设备150间通过通信网络建立通信通路。每个计算机设备150用于实现本申请实施例提供的神经网络优化方法的部分功能。任一计算机设备150可以为云数据中心中的计算机设备(例如：服务器)，或边缘数据中心中的计算机设备等。

上述各个附图对应的流程的描述各有侧重，某个流程中没有详述的部分，可以参见其他流程的相关描述。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。提供数据同步云服务的计算机程序产品包括一个或多个计算机指令，在计算机设备上加载和执行这些计算机程序指令时，全部或部分地实现本申请实施例提供的神经网络优化方法的流程或功能。

计算机设备可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质存储有提供数据同步云服务的计算机程序指令。

本申请实施例还提供了一种存储介质，该存储介质为非易失性计算机可读存储介质，当存储介质中的指令被处理器执行时，实现如本申请实施例提供的神经网络优化方法。

本申请实施例还提供了一种包含指令的计算机程序产品，当计算机程序产品在计算机上运行时，使得计算机执行本申请实施例提供的神经网络优化方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本申请实施例中，术语“第一”、“第二”和“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。术语“至少一个”是指一个或多个，术语“多个”指两个或两个以上，除非另有明确的限定。

本申请中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的构思和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种神经网络优化方法，其特征在于，所述方法包括：

接收待优化神经网络的模型文件；

基于所述待优化神经网络的模型文件，获取目标神经网络架构的搜索空间，所述搜索空间包括所述目标神经网络架构中各神经元的各属性的取值范围；

基于所述搜索空间，获得所述目标神经网络架构；

基于所述待优化神经网络的模型文件对所述目标神经网络架构进行训练，得到目标神经网络的模型文件；

向用户提供所述目标神经网络的模型文件。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

接收所述用户输入的目标信息，所述目标信息包括以下信息中的一种或多种：运行所述目标神经网络的硬件的信息，及指示所述用户对所述目标神经网络的性能要求的信息；

所述基于所述待优化神经网络的模型文件，获取目标神经网络架构的搜索空间，包括：

基于所述待优化神经网络的模型文件和所述目标信息，获取所述目标神经网络架构的搜索空间。
根据权利要求1或2所述的方法，其特征在于，所述基于所述搜索空间，获得所述目标神经网络架构，包括：

基于所述搜索空间，获取用于反映所述用户对所述目标神经网络的性能要求的指定信息；

基于所述指定信息，在知识库中进行检索；

当所述知识库中存在满足所述指定信息的已有神经网络架构时，将所述已有神经网络架构确定为所述目标神经网络架构。
根据权利要求3所述的方法，其特征在于，所述指定信息包括多类评价指标值，所述基于所述搜索空间，获取用于反映所述用户对所述目标神经网络的性能要求的指定信息，包括：

基于所述搜索空间，得到至少一个备选神经网络架构；

对每个备选神经网络架构进行训练和推理，得到每个备选神经网络架构的所述多类评价指标值。
根据权利要求4所述的方法，其特征在于，所述基于所述指定信息，在知识库中进行检索，包括：

基于每个备选神经网络架构的所述多类评价指标值，在所述知识库中进行检索；

当所述知识库中任一神经网络架构满足任一备选神经网络架构的所述多类评价指标值时，确定所述知识库中存在满足所述指定信息的已有神经网络架构。
根据权利要求3至5任一所述的方法，其特征在于，所述基于所述搜索空间，获得所述目标神经网络架构，还包括：

当所述知识库中不存在满足所述指定信息的已有神经网络架构时，采用架构搜索策略搜索得到所述目标神经网络架构。
根据权利要求6所述的方法，其特征在于，所述方法还包括：

将搜索所述目标神经网络架构的过程中产生的中间数据存储在所述知识库中，所述中间数据包括以下一项或多项：所述目标神经网络架构的搜索空间、基于所述搜索空间得到的备选神经网络架构、与硬件相关的第一类评价指标值、与硬件无关的第二类评价指标值、用于运行所述目标神经网络的硬件的信息。
根据权利要求1至7任一所述的方法，其特征在于，所述基于所述待优化神经网络的模型文件对所述目标神经网络架构进行训练，得到目标神经网络的模型文件，包括：

基于所述待优化神经网络的模型文件，采用模型克隆方法对所述目标神经网络架构进行训练，得到所述目标神经网络的模型文件。
根据权利要求1至8任一所述的方法，其特征在于，所述基于所述待优化神经网络的模型文件，获取目标神经网络架构的搜索空间，包括：

将所述待优化神经网络的模型文件输入经过预训练的人工智能模型，得到所述人工智能模型输出的所述目标神经网络架构的搜索空间。
根据权利要求1至9任一所述的方法，其特征在于，在所述基于所述待优化神经网络的模型文件对所述目标神经网络架构进行训练，得到目标神经网络的模型文件之后，所述方法还包括：

采用优化策略对所述目标神经网络进行速度优化，所述优化策略包括：图优化策略和算子优化策略；

所述向用户提供所述目标神经网络的模型文件，包括：

向所述用户提供速度优化后的目标神经网络的模型文件。
根据权利要求1至9任一所述的方法，其特征在于，在所述向用户提供所述目标神经网络的模型文件之后，所述方法还包括：

接收所述用户发送的速度优化请求；

基于所述速度优化请求，采用优化策略对所述目标神经网络进行速度优化，所述优化策略包括：图优化策略和算子优化策略；

向所述用户提供速度优化后的目标神经网络的模型文件。
一种神经网络优化装置，其特征在于，所述装置包括：

交互模块，用于接收待优化神经网络的模型文件；

架构确定模块，用于基于所述待优化神经网络的模型文件，获取目标神经网络架构的搜索空间，所述搜索空间包括所述目标神经网络架构中各神经元的各属性的取值范围；

所述架构确定模块，还用于基于所述搜索空间，获得所述目标神经网络架构；

训练模块，用于基于所述待优化神经网络的模型文件对所述目标神经网络架构进行训练，得到目标神经网络的模型文件；

所述交互模块，还用于向用户提供所述目标神经网络的模型文件。
根据权利要求12所述的装置，其特征在于，

所述交互模块，还接收所述用户输入的目标信息，所述目标信息包括以下信息中的一种或多种：运行所述目标神经网络的硬件的信息，及指示所述用户对所述目标神经网络的性能要求的信息；

所述架构确定模块，具体用于：基于所述待优化神经网络的模型文件和所述目标信息，获取所述目标神经网络架构的搜索空间。
根据权利要求12或13所述的装置，其特征在于，所述架构确定模块，具体用于：

基于所述搜索空间，获取用于反映所述用户对所述目标神经网络的性能要求的指定信息；

基于所述指定信息，在知识库中进行检索；

当所述知识库中存在满足所述指定信息的已有神经网络架构时，将所述已有神经网络架构确定为所述目标神经网络架构。
根据权利要求14所述的装置，其特征在于，所述指定信息包括多类评价指标值，所述架构确定模块，具体用于：

基于所述搜索空间，得到至少一个备选神经网络架构；

对每个备选神经网络架构进行训练和推理，得到每个备选神经网络架构的所述多类评价指标值。
根据权利要求15所述的装置，其特征在于，所述架构确定模块，具体用于：

基于每个备选神经网络架构的所述多类评价指标值，在所述知识库中进行检索；

当所述知识库中任一神经网络架构满足任一备选神经网络架构的所述多类评价指标值时，确定所述知识库中存在满足所述指定信息的已有神经网络架构。
根据权利要求14至16任一所述的装置，其特征在于，所述架构确定模块，还具体用于：

当所述知识库中不存在满足所述指定信息的已有神经网络架构时，采用架构搜索策略搜索得到所述目标神经网络架构。
根据权利要求17所述的装置，其特征在于，所述装置还包括：

存储模块，用于将搜索所述目标神经网络架构的过程中产生的中间数据存储在所述知识库中，所述中间数据包括以下一项或多项：所述目标神经网络架构的搜索空间、基于所述搜索空间得到的备选神经网络架构、与硬件相关的第一类评价指标值、与硬件无关的第二类评价指标值、用于运行所述目标神经网络的硬件的信息。
根据权利要求12至18任一所述的装置，其特征在于，所述训练模块，具体用于：

基于所述待优化神经网络的模型文件，采用模型克隆装置对所述目标神经网络架构进行训练，得到所述目标神经网络的模型文件。
根据权利要求12至19任一所述的装置，其特征在于，所述架构确定模块，具体用于：

将所述待优化神经网络的模型文件输入经过预训练的人工智能模型，得到所述人工智能模型输出的所述目标神经网络架构的搜索空间。
根据权利要求12至20任一所述的装置，其特征在于，所述装置还包括：

推理模块，用于采用优化策略对所述目标神经网络进行速度优化，所述优化策略包括：图优化策略和算子优化策略；

所述交互模块，具体用于：向所述用户提供速度优化后的目标神经网络的模型文件。
根据权利要求12至20任一所述的装置，其特征在于，

所述交互模块，还用于接收所述用户发送的速度优化请求；

所述装置还包括：推理模块，用于基于所述速度优化请求，采用优化策略对所述目标神经网络进行速度优化，所述优化策略包括：图优化策略和算子优化策略；

所述交互模块，还用于向所述用户提供速度优化后的目标神经网络的模型文件。
一种计算机设备，其特征在于，所述计算机设备包括：处理器和存储器，所述存储器中存储有计算机程序；所述处理器执行计算机程序时，所述计算机设备实现权利要求1至11任一所述的方法。
一种非瞬态的计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的指令被处理器执行时，所述处理器执行权利要求1至11任一所述的方法。
一种包含指令的计算机程序产品，其特征在于，当计算机程序产品中的指令在计算机上运行时，所述计算机执行权利要求1至11任一所述的方法。