WO2018023212A1

WO2018023212A1 - 一种图像识别方法及终端

Info

Publication number: WO2018023212A1
Application number: PCT/CN2016/092464
Authority: WO
Inventors: 李昌竹; 王细勇
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2016-07-30
Filing date: 2016-07-30
Publication date: 2018-02-08
Anticipated expiration: 2019-01-30
Also published as: US11804053B2; CN109478311A; US20190180101A1; US20210240982A1; EP3486863A4; EP3486863A1; US11132545B2

Abstract

公开了一种图像识别方法及终端，该方法包括：终端获取包含目标物的图像文件；所述终端通过所述终端中的神经网络计算装置根据所述终端中的图像识别模型对所述目标物进行识别，以得到所述目标物的物体类别信息；所述终端将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件。可见，能够提高终端进行图像识别的效率，并有效保护终端用户的隐私。

Description

一种图像识别方法及终端

技术领域

本发明涉及图像识别技术领域，具体涉及一种图像识别方法及终端。

背景技术

当前，由于互联网上的信息繁杂，需要对互联网上的文本文件或者图像文件标注至少一个标签信息，以便于对文本文件或图像文件根据标签信息进行分类管理。随着计算机视觉(Computer Vision，CV)、自然语言理解(Natural Language Processing，NLP)、深度神经网络(Deep Neural Network)等技术的发展，可实现对图像文件自动标注标签信息。当为终端上的图像标注标签信息时，需要将图像上传至服务器中，服务器对图像识别分类后为图像标注标签信息，并将标注的标签信息反馈给终端。由于终端数量日益增加，导致服务器需要处理的图像数量增加，服务器工作量增大，则对图像标注标签信息的处理效率会降低；并且，终端需要将图像上传至服务器进行标签信息的标注，不利于保护终端用户的隐私。

发明内容

本发明实施例公开了一种图像识别方法及终端，能够提高终端进行图像识别的效率，并有效保护终端用户的隐私。

本发明实施例第一方面公开了一种图像识别方法，包括：终端获取包含目标物的图像文件；所述终端通过所述终端中的神经网络计算装置根据所述终端中的图像识别模型对所述目标物进行识别，以得到所述目标物的物体类别信息；所述终端将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件。

可见，终端通过获取包含目标物的图像文件，可通过所述终端中的神经网络计算装置根据所述终端中图像识别模型对图像文件中的目标物进行识别，并可得到该目标物的物品类别信息，并可将该物品类别信息作为第一标签信息保存至图像文件中。通过上述方式，终端可通过终端中的神经网络计算装置对目标物进行识别。从而提高终端进行图像识别的效率，并有效保护终端用户的隐私。

在第一方面的一些可能的实施方式中，所述终端获取包含目标物的图像文件，包括：所述终端根据用户对所述终端上的显示图像的选取操作，确定所述选取操作对应的目标物；所述终端生成包含所述目标物的图像文件。

可见，终端可通过上述方式实现与用户进行交互。

在第一方面的一些可能的实施方式中，若所述选取操作对应n个目标物，n为正整数，所述终端生成包含所述目标物的图像文件，包括：所述终端生成包含所述n个目标物的图像文件；或者，所述终端生成包含所述n个目标物中的至少一个目标物的m个图像文件，m为整数且m≤n。

在第一方面的一些可能的实施方式中，所述终端根据终端中的图像识别模型对所述目标物进行识别，以得到所述目标物的物体类别信息之前，所述方法还包括：所述终端接收并存储第一服务器发送的所述图像识别模型；或者，所述终端通过所述神经网络计算装置根据所述终端中的图片进行图像识别训练，以得到所述图像识别模型。

可见，终端可通过多种方式进行图像识别训练，有利于得到更准确的图形识别模型。

在第一方面的一些可能的实施方式中，所述终端将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件之后，所述方法还包括：所述终端将所述目标物的第一标签信息发送至所述第一服务器，以在所述第一服务器上共享所述第一标签信息。

可见，终端可通过共享标签信息，分担服务器的工作量，并可实现与其他终端进行信息共享。

在第一方面的一些可能的实施方式中，所述终端将所述目标物的第一标签信息发送至所述第一服务器之前，所述方法还包括：所述终端根据用户针对所述第一标签信息的修订操作，对所述第一标签信息进行修订；所述终端将所述目标物的第一标签信息发送至所述第一服务器，包括：所述终端将所述修订后的所述第一标签信息发送至所述第一服务器。

可见，终端进一步提高所生成标签的准确度，并可通过服务器进行共享，分担了需要在服务器上进行修订的工作量。

在第一方面的一些可能的实施方式中，所述终端将所述目标物的第一标签信息发送至所述第一服务器之后，所述方法还包括：若所述终端接收到所述第一服务器发送的第一标签修订信息，所述终端将所述第一标签信息更新为所述第一标签修订信息。

可见，终端还可通过服务器获取更准确地标签信息。

在第一方面的一些可能的实施方式中，所述终端将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件之后，所述方法还包括：所述终端在目标物详细信息库中查找与所述第一标签信息相匹配的第二标签信息；所述终端判断是否查找到所述第二标签信息；若为是，则所述终端将所述第二标签信息保存至所述图像文件，并根据所述第二标签信息对所述图像文件中的所述目标物进行标注；若为否，则所述终端根据所述第一标签信息对所述图像文件中的所述目标物进行标注。

可见，终端可通过上述方式有可能获取更详细的标签信息。

本发明实施例第二方面公开了一种终端，所述终端包括用于执行第一方面中的方法的单元。

本发明实施例第三方面公开了一种终端，所述终端包括处理器、存储器、神经网络计算装置、通信接口和通信总线，所述处理器、所述存储器、所述神经网络计算装置和所述通信接口通过所述通信总线连接并完成相互间的通信；

所述存储器存储有可执行程序代码，所述通信接口用于无线通信；

所述处理器被配置为支持该终端执行第一方面提供的方法中相应的功能。

本发明实施例第四方面公开一种计算机存储介质，用于储存为上述第三方面提供的终端所用的计算机软件指令，其包含用于执行第一方面中方法所设计的程序。

本发明实施例中，终端通过获取包含目标物的图像文件，可通过所述终端中的神经网络计算装置根据所述终端中图像识别模型对图像文件中的目标物进行识别，并可得到该目标物的物品类别信息，并可将该物品类别信息作为第一标签信息保存至图像文件中。通过上述方式，终端可通过终端中的神经网络计算装置对目标物进行识别。从而提高终端进行图像识别的效率，并有效保护终端用户的隐私。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的图像识别系统的结构示意图；

图2是本发明实施例公开的一种图像识别方法的流程示意图；

图3是本发明实施例公开的另一种图像识别方法的流程示意图；

图4是本发明实施例公开的又一种图像识别方法的流程示意图；

图5是本发明实施例公开的又一种图像识别方法的流程示意图；

图6是本发明实施例公开的一种终端显示界面的示意图；

图7是本发明实施例公开的另一种终端显示界面的示意图；

图8是本发明实施例公开的又一种终端显示界面的示意图；

图9是本发明实施例公开的一种终端的单元组成示意图；

图10是本发明实施例公开的一种终端的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

本发明实施例公开了一种图像识别方法、终端及系统，能够提高终端进行图像识别的效率，并有效保护终端用户的隐私。为了更好的理解本发明实施例，下面先对本发明实施例的应用场景进行描述，其中，本发明实施例中的应用场景也可理解为本发明方法及装置实施例所应用的通信系统。

请参阅图1，图1是现有技术公开的图像识别系统的结构示意图。如图1所示，该系统包括图像识别服务器1及n个终端21～2n。在传统的图像识别的技术方案中，图像识别服务器1可通过CV技术、NLP技术等对终端上传的图像进行图像识别分类后，为上传的图像标注标签信息，并可将该标签信息反馈至上传终端。其中，在图像识别服务器对图像标注标签信息后，后台还可通过人工校准对该标签信息进行修订，以增加为图像标注标签信息的准确性。即通过图像识别服务器1可同时实现为图像自动标注标签信息以及人工标注标签信息。然而，随着系统中终端数量的增加，导致图像识别服务器1的工作量增加，对图像标注标签信息的处理效率低，若需要后台人工校准标签信息，则还会增加维护图像识别服务器1的成本，并且由于终端中的图像需要上传才能够获取对应的标签信息，则上述方式无法有效保护终端用户的隐私。

基于图1所示系统，为解决上述传统方式存在的技术问题，下面对本发明实施例中的方法实施例进行详细描述。其中，本发明实施例中描述的终端可以包括手持计算机、个人数字助理、蜂窝电话、网络应用、照相机、智能电话、增强型通用分组无线服务(EGPRS)移动电话、媒体播放器、导航设备、电子邮件设备、游戏机或这些数据处理设备或其它数据处理设备中的至少一种。

请参阅图2，图2是本发明实施例公开的一种图像识别方法的流程示意图。该方法可由上述终端实现。如图2所示，该方法至少包括以下步骤。

步骤S201，终端获取包含目标物的图像文件。

在一些可行的实施方式中，终端可从图像文件或视频文件中获取包含目标物的图像文件；或者，终端也可从其他与其通信的通信设备中获取包含目标物的图像文件；或者，终端也可从原图像文件中或视频文件中提取出目标物，并生成包含该目标物的新图像文件；或者，终端将存储的图像文件作为包含目标物的图像文件，并根据用户的选取操作确定该图像文件上的目标物。其中，该图像文件可包括至少一个目标物。可选的，目标物的确定可基于用户对图像文件的操作确定，也可基于目标物中的目标特征进行确定。

步骤S202，所述终端通过所述终端中的神经网络计算装置根据所述终端中的图像识别模型对所述目标物进行识别，以得到所述目标物的物体类别信息。

在一些可行的实施方式中，终端获取到上述包含目标物的图像文件后，可通过所述终端中的神经网络计算装置根据终端中的图像识别模型对目标物进行识别，以得到该目标物的物体类别信息。具体的，终端中的图像识别模型可由服务器建立，服务器通过采集多种类型的图像文件进行图像识别模型训练，并将训练好的图像识别模型推送至终端中。或者，终端中可通过神经网络计算装置建立图像识别模型。当终端获取到包含目标物的图像文件后，可根据用户指令或其他方式触发终端调用上述图像识别模型对目标物进行识别，并通过上述图像识别模型得到该目标物的物体类别信息。其中，物体类别信息可包括该目标物的物体类别或物体名称等文本信息。通过终端中配置的神经网络计算装置，能够提高终端进行图像识别的效率。

步骤S203，所述终端将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件。

在一些可行的实施方式中，终端在根据所述终端中的图像识别模型对所述目标物进行识别，以得到所述目标物的物体类别信息之后，终端将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件。其中，通过图像识别模型得到的目标物的物体类别信息可按照预设的标签信息格式保存至图像文件中，从而，物体类别信息即作为第一标签信息保存至图像文件。可选的，可将第一标签信息保存至图像文件的扩展段或注释段中。可选的，终端可按照第一标签信息对目标物进行标注，也可根据第一标签信息确定更详尽的第二标签信息，从而根据第二标签信息对目标物进行标注。可选的，终端还可接收用户操作对上述保存的第一标签信息进行修订，也可将第一标签信息上传至服务器进行共享。在此，本发明实施例不做限定。

请参见图3，图3是本发明实施例公开的另一种图像识别方法的流程示意图。如图3所示，该方法至少包括以下步骤。

步骤S301，服务器A进行图像识别模型的训练。

在一些可行的实施方式中，服务器A可通过手机视频文件或图形文件训练图像识别模型。可选的，该图像识别模型可为卷积神经网络模型(Convolutional Neural Network，CNN)。服务器A可通过离线(如后台人工收集)或者在先收集的方式手机多种多媒体文件(如视频文件、图像文件或其他包括显示图像的文件)作为训练材料。

步骤S302，所述服务器A将训练好的所述图像识别模型发送给终端。

在一些可行的实施方式中，服务器A可将训练好的图像识别模型发送给终端。具体的，服务器可将图像识别模型作为特定格式的文件发送给终端，该特定格式可被服务器与终端共知，从而终端能够在接收到该特定格式的文件后，对其进行识别，并可对该图像识别模型进行存储。可选的，服务器A可在接收到终端的请求后，向请求终端发送图像识别模型；或者，服务器A可在训练好上述图像识别模型后，将图像识别模型发送给系统中的全部或部分终端；或者，服务器A可在训练好上述图像识别模型后，对系统中的终端进行广播通知，当接收到系统中终端的响应后，向系统中的响应终端发送图像识别模型。

步骤S303，所述终端接收并存储所述图像识别模型。

在一些可行的实施方式中，终端可接收服务器A发送的图像识别模型，并将其存储在终端内存中，当获取到包含目标物的图像文件后，即可从终端内存中调取该图像识别模型。

步骤S304，所述终端根据用户对所述终端上的显示图像的选取操作，确定所述选取操作对应的目标物。

在一些可行的实施方式中，终端可在显示界面上显示图像文件或视频文件等，并可监测用户对显示界面上当前显示图像的触控操作，当监测到用户对终端上显示图像的触控操作为选取操作时，可确定该选取操作对应的目标物。可选的，监测到的用户对显示图像的选取操作可为一次或多次，当监测到用户对显示图像的选取操作时，该选取操作对应的目标物可为一个或多个。可根据选取操作选取的图像区域确定上述一个或多个目标物。

举例说明，请参阅图6，图6是本发明实施例公开的一种终端显示界面的示意图。如图6A所示，当监测到用户的选取操作对应的选取区域为C1时，则可确定目标物为M1；或者，当监测到用户的选取操作对应的选取区域为C2时，则可确定目标物为M2和M3。

步骤S305，所述终端生成包含所述目标物的图像文件。

在一些可行的实施方式中，当确定选取操作对应的图像中的目标物后，终端可生成包含该目标物的图像文件。可选的，可根据选取的图像中的目标物的数量，对应生成不同数量的目标物的图像文件。如在一个图像文件中可包括多个目标物，或者在一个图形文件中也可仅包括一个目标物。

举例说明，当终端确定用户选取操作在显示界面上对应的选取区域为C2时，可生成包含目标物的新的图像文件，如图6B所示，图像文件中同时包括目标物M2与目标物M3；或者，如图6C所示，根据目标物的数量生成两个图像文件，其中，图6C中的两个图像文件分别包含目标物M2与目标物M3。

步骤S306，所述终端通过所述终端中的神经网络计算装置根据所述存储的图像识别模型对所述目标物进行识别，以得到所述目标物的物体类别信息。

在一些可行的实施方式中，当终端生成包含目标物的图像文件后，终端可通过所述终端中的神经网络计算装置根据存储的图像识别模型对目标物进行识别，以得到目标物的物体类别信息。可选的，当终端生成包含目标物的图像文件后，终端可通过神经网络计算装置将该图像文件作为输入数据输入至终端存储的图像识别模型中，图像识别模型可通过神经网络计算装置中的计算方式提取出图像文件中的目标物，并对该目标物进行分类识别，最后输出目标物的物体类别信息。终端可在该图像识别模型的输出端输出目标物的物体类别信息。该物体类别信息可包括目标物的物体类别或者目标物的物体名称等。

步骤S307，所述终端将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件。

在一些可行的实施方式中，当终端根据图像识别模型对目标物进行识别，以得到目标物的物体类别信息后，可将该物体类别信息作为目标物的第一标签信息保存至图像文件中。其中，终端得到的物体类别信息可按照预设的标签格式进行存储。

举例说明，当终端得到目标物的物体类别信息为目标物的物体类别为动物，物体名称为兔子时；可将其按照如下预设的标签格式转化为第一标签信息。

本发明实施例中标签格式可为但不限于：

<xml>

<类别>动物</类别>

<名称>兔子</名称>

</xml>

可选的，终端将物体类别信息按照上述标签格式转化为第一标签信息后，可保存至图像文件的扩展段或注释段中。以图像文件的格式为JPEG(Joint Photographic Experts Group)为例，JPEG格式的图像文件中0xFF0～0xFFD为预保留的扩展(Extension)段，JPEG格式的图像文件中0xFFE为预保留的注释(Comment)段。则终端可将第一标签信息保存至包含目标物图像文件的上述两个段中的任意一个段内。当然，若图像文件的格式为其他格式时，如为PNG(Portable Network Graphic Format，图像文件存储格式)等，终端可将第一标签信息保存至其他格式的对应段中，本发明实施例不做限定。

可选的，可将第一标签信息按照预设的标签显示格式显示在图像文件上。

可选的，还可将第一标签信息按照预设的标签显示格式显示在用户未进行选取操作前的原始图像或视频文件上。

举例说明，请参阅图7，图7是本发明实施例公开的另一种终端显示界面的示意图。如图7B或图7C所示，当生成一个或多个包含目标物的图像文件时，可对图像文件中的目标物进行标注，具体标签信息可参见图7B或图7C中所示；或者，还可对原始图像中的目标物进行标注，具体标签信息可参见图 7A中的标签信息。

步骤S308，所述终端将所述目标物的第一标签信息发送至所述服务器A，以在所述服务器A上共享所述第一标签信息。

在一些可行的实施方式中，终端还可将得到的第一标签信息发送至服务器A中，以在服务器A上对第一标签信息进行共享。或者，可选的，终端可将物体类别信息发送至服务器A中。终端还可将保存有第一标签信息的包含目标物的图像文件发送给服务器A。服务器A能够存储终端进行图像识别的识别结果，即终端发送的目标物的物体类别信息或第一标签信息。当其他终端请求服务器识别相同目标物时，服务器可将终端上传的上述物体类别信息或第一标签信息反馈给其他终端，以实现图像识别结果的共享，同时，服务器A可避免通过图像识别模型对该目标物进行多次识别，提升了图像识别的效率。

可选的，终端在将目标物的第一标签信息发送至服务器A之前，可对该第一标签信息进行修订或校准。如在图像文件上显示该第一标签信息后，若图像识别模块的识别结果有误，即第一标签信息不够精确时，可接收用户对该第一标签信息的修订操作，并根据该修订操作对第一标签信息进行修订，以使第一标签信息能够更加准确。从而，将修订后的第一标签信息发送给服务器A，可减免服务器A后台对标签信息进行修订的过程，从而，进一步提升了图像识别的效率。或者，终端可将目标物的第一标签信息发送给服务器A后，接收服务器A针对该第一标签信息反馈的修订标签信息，从而，终端可利用服务器A对图像识别结果进行修订，可使终端得到更加准确的图像识别结果。

本发明实施例中，终端可接收并存储服务器训练的图像识别模型，并可根据服务器发送的图像识别模型对终端中的包含目标物的图像进行识别，以获取目标物的物体类别信息，并可将该物体类别信息作为第一标签信息对目标物进行标注，也可将该第一标签信息发送给服务器以在服务器上进行共享，从而通过终端能够分担服务器进行图像识别的工作量，提升图像识别效率。

请参阅图4，图4是本发明实施例公开的又一种图像识别方法的流程示意图。如图4所示，该方法包括以下步骤。

步骤S401，终端获取包含目标物的图像文件。

步骤S402，所述终端通过所述终端中的神经网络计算装置根据所述终端中的图像识别模型对所述目标物进行识别，以得到所述目标物的物体类别信息。

步骤S403，所述终端将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件。

在一些可行的实施方式中，步骤S401～步骤S403的具体实施方式可参见图2或图3所示实施例中的对应步骤的具体实施方式，在此不再赘述。

步骤S404，所述终端向服务器B发送所述第一标签信息。

在一些可行的实施方式中，当终端确定目标物的第一标签信息后，可将该第一标签信息发送至服务器B中。可选的，终端向服务器B发送查询请求，该查询请求携带有第一标签信息。终端通过发送查询请求以请求服务器B查找与第一标签信息相匹配的第二标签信息，其中，第二标签信息包括更加详细的对目标物的描述信息。

步骤S405，所述服务器B接收所述第一标签信息，并在存储的目标物详细信息库中查找与所述第一标签信息相匹配的第二标签信息。

在一些可行的实施方式中，服务器B接收到第一标签信息后，可在存储的目标物详细信息库中查找与第一标签信息相匹配的第二标签信息。具体的，服务器B可预建立物品详细信息库，该物品详细信息库中包括物品的详细信息，其中，物品类别不同可对应不同的物品详细信息；如当物品为动植物时，物品详细信息可包括但不限于物品名称、学名、英文名、所属科目、栖息地、特点等信息；当物品为商品时，物品详细信息可包括但不限于物品名称、类别、生产地、生产商等信息。其中，服务器B可根据第一标签信息中的物品类别或物品名称在物品详细信息库中查找是否存在与第一标签信息中的物品类别或物品名称相匹配的第二标签信息。若当查找出多个标签信息与第一标签信息中的物品类别或物品名称相匹配的标签信息时，还可根据目标物的具体显示图像从多个标签信息中筛选出与第一标签信息对应的目标物显示图像相匹配的第二标签信息。

步骤S406，所述服务器B向所述终端发送查找结果。

在一些可行的实施例中，服务器B可确定在目标物详细信息库中的查找结果。其中，查找结果可包括查找到或未查找到。当服务器查找到第二标签信息后，可在查找结果中携带第二标签信息发送至终端。

步骤S407，所述终端根据所述查找结果判断是否查找到所述第二标签信息。

在一些可行的实施例中，终端可接收服务器B发送的查找结果，并可根据查找结果判断是否查找到与第一标签信息相匹配的第二标签信息。具体的，终端可通过解析查找结果中是否携带第二标签信息，来判断是否查找到第二标签信息。若查找结果中未携带第二标签信息，则终端可判断未查找到第二标签信息。或者，终端与服务器B可约定查找结果所携带的值不同，代表不同的查找结果，如查找结果携带值为0时，表明查找结果为未查找到；查找结果携带值为1，表明查找结果为已查找到，则终端可在接收到的查找结果为1时，进一步向服务器请求第二标签信息。

步骤S408，若所述终端判断结果为是，则所述终端将所述第二标签信息保存至所述图像文件，并根据所述第二标签信息对所述图像文件中的所述目标物进行标注。

在一些可行的实施方式中，当终端判断出查找到第二标签信息后，可进一步将第二标签信息保存至包含目标物体的图像文件中。其中，保存第二标签信息的具体实施方式可参见保存第一标签信息的实施方式。其中，可将第一标签信息及第二标签信息保存至图像文件的同一扩展段或注释段内，或者将第一标签信息或第二标签信息分别保存至图像文件的扩展段及注释段中。

可选的，可将保存的第一标签信息或第二标签信息标注至图像文件的目标物上。本发明实施例中，当终端判断出查找到第二标签信息后，可将第二标签信息按照预设的标签格式标注至图像文件的目标物上。其中，第二标签信息的标签格式可与第一标签信息的标签格式不同。

可选的，还可同时通过第一标签信息与第二标签信息对图像文件进行标注。

举例说明，请参阅图8，图8是本发明实施例公开的又一种终端显示界面的示意图。如图8A所示，通过第二标签信息对图像文件上的目标物进行标注；如图8B所示，还可同时通过第一标签信息与第二标签信息对图像文件上的目标物进行标注。

步骤S409，若所述终端判断结果为否，则所述终端根据所述第一标签信息对所述图像文件中的所述目标物进行标注，并向所述服务器B发送通知消息，以通知所述服务器B在所述目标物详细信息库中缺失与所述第一标签信息相匹配的第二标签信息。

在一些可行的实施方式中，当终端判断出未查找到第二标签信息后，可根据第一标签信息按照预设的标签格式标注至图像文件中的目标物上。并可通知服务器B在服务器B存储的目标物详细信息库中缺失与第一标签信息相匹配的第二标签信息，即缺失目标物的详细信息。可选的，终端可通过其他方式(如通过网页)查找对应的第二标签信息并反馈至服务器B，由服务器B进行审核，若服务器B审核通过，则向服务器B反馈承认该第二标签信息的消息；或者服务器B自行查找第二标签信息，并将其补充至目标物详细信息库中。

本发明实施例中，终端可在获取第一标签信息后，获取更加详细的第二标签信息。从而可为目标物标注多种标签信息，为用户提供了多种标签信息，增强用户体验。

请参阅图5，图5是本发明实施例公开的又一种图像识别方法的流程示意图。如图5所示，该方法包括以下步骤。

步骤S501，服务器A进行图像识别模型的训练。

步骤S502，所述服务器A将训练好的所述图像识别模型发送给终端。

步骤S503，所述终端接收并存储所述图像识别模型。

步骤S504，所述终端根据用户对所述终端上的显示图像的选取操作，确定所述选取操作对应的目标物。

步骤S505，所述终端生成包含所述目标物的图像文件。

步骤S506，所述终端通过所述终端中的神经网络计算装置根据所述存储的图像识别模型对所述目标物进行识别，以得到所述目标物的物体类别信息。

步骤S507，所述终端将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件。

步骤S508，所述终端向服务器A发送所述第一标签信息，以在所述服务器A上共享所述第一标签信息。

步骤S509，所述终端向服务器B发送所述第一标签信息。

步骤S510，所述服务器B接收所述第一标签信息，并在存储的目标物详细信息库中查找与所述第一标签信息相匹配的第二标签信息。

步骤S511，所述服务器B向所述终端发送查找结果。

步骤S512，若所述终端根据所述查找结果获取到第二标签信息，将所述第二标签信息保存至所述图像文件，并根据所述第二标签信息对所述图像文件中的所述目标物进行标注。

在一些可行的实施方式中，步骤S501～S511的具体实施方式可参见图2～图4所示的实施例中响应步骤的具体实施方式描述，在此不再赘述。需要注意的是，本发明实施例对步骤S508、S509的执行顺序并无限定。

本发明实施例中，终端可利用服务器A推送的图像识别模型在终端上实现获取图像中目标物的标签信息，也可利用服务器B获取该目标物更加详细的标签信息，从而能够分担服务器进行图像识别的工作量，提升图像识别效率，并为用户提供了多种标签信息，提升了用户体验。

下面结合上述应用场景以及上述方法实施例，对本发明实施例中的装置实施例进行详细说明。

请参阅图9，图9是本发明实施例公开的一种终端的单元组成示意图。所述终端900可包括：

获取单元901，用于获取包含目标物的图像文件；

识别单元902，用于通过所述终端中的神经网络计算装置根据所述终端中的图像识别模型对所述目标物进行识别，以得到所述目标物的物体类别信息；

保存单元903，用于将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件。

可选的，在一些可行的实施方式中，所述获取单元901包括：

确定单元，用于根据用户对所述终端上的显示图像的选取操作，确定所述选取操作对应的目标物；

生成单元，用于生成包含所述目标物的图像文件。

可选的，在一些可行的实施方式中，若所述选取操作对应n个目标物，n为正整数，所述生成单元还用于：

生成包含所述n个目标物的图像文件；或者，

生成包含所述n个目标物中的至少一个目标物的m个图像文件，m为整数且m≤n。

可选的，在一些可行的实施方式中，所述识别单元902根据终端中的图像识别模型对所述目标物进行识别，以得到所述目标物的物体类别信息之前，所述终端还包括：

接收单元904，用于接收并存储第一服务器发送的所述图像识别模型；或者，

训练单元905，用于通过所述神经网络计算装置根据所述终端中的图片进行图像识别训练，以得到所述图像识别模型。

可选的，在一些可行的实施方式中，所述保存单元903将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件之后，所述终端还包括：

发送单元906，用于将所述目标物的第一标签信息发送至所述第一服务器，以在所述第一服务器上共享所述第一标签信息。

可选的，在一些可行的实施方式中，所述发送单元906将所述目标物的第一标签信息发送至所述第一服务器之前，所述终端还包括：

修订单元907，用于根据用户针对所述第一标签信息的修订操作，对所述第一标签信息进行修订；

所述发送单元906还用于：

将所述修订后的所述第一标签信息发送至所述第一服务器。

可选的，在一些可行的实施方式中，所述发送单元906将所述目标物的第一标签信息发送至所述第一服务器之后，所述终端还包括：

更新单元908，用于若所述终端接收到所述第一服务器发送的第一标签修订信息，将所述第一标签信息更新为所述第一标签修订信息。

查找单元909，用于在目标物详细信息库中查找与所述第一标签信息相匹配的第二标签信息；

判断单元910，用于判断是否查找到所述第二标签信息；

所述保存单元903，还用于若所述判断单元的判断结果为是，将所述第二标签信息保存至所述图像文件，并根据所述第二标签信息对所述图像文件中的所述目标物进行标注；

标注单元911，用于若所述判断单元的判断结果为否，根据所述第一标签信息对所述图像文件中的所述目标物进行标注。

本发明实施例中，获取单元901用于执行图2所示的实施例中步骤S201 的方法；识别单元902用于执行图2所示的实施例中步骤S202的方法；保存单元903用于执行图3所示的实施例中步骤S203的方法。

本发明实施例中，接收单元904用于执行图3所示的实施例中步骤S303的方法；获取单元901还用于执行图3所示的实施例中步骤S304～S305的方法；识别单元902还用于执行图3所示的实施例中步骤S306的方法；保存单元903还用于执行图3所示的实施例中步骤S307的方法；发送单元906用于执行图3所示的实施例中步骤S308的方法。

本发明实施例中，获取单元901还用于执行图4所示的实施例中步骤S401的方法；识别单元902还用于执行图4所示的实施例中步骤S402的方法；保存单元903还用于执行图4所示的实施例中步骤S403的方法；发送单元907还用于执行图4所示的实施例中步骤S404的方法；判断单元910用于执行图4所示的实施例中步骤S407的方法；保存单元903还用于执行图4所示的实施例中步骤S408的方法；标注单元911用于执行图4所示的实施例中步骤S408～S409的方法。

本发明实施例中，接收单元904还用于执行图5所示实施例中的步骤S503的方法；获取单元901还用于执行图5所示实施例中的步骤S504～S505的方法；识别单元902还用于执行图5所示实施例中的步骤S506的方法；保存单元903还用于执行图5所示实施例中的步骤S507的方法；发送单元907还用于执行图5所示实施例中的步骤S508～S509的方法；标注单元911还用于执行图5所示实施例中的步骤S512的方法。

本发明实施例中，以上发送单元907可以通过终端900中配置的通信接口向服务器或其他通信设备发送消息、信息等；以上接收单元904可以通过终端900中配置通信接口接收终端或其他通信设备发送的消息、信息等。上述通信接口为无线接口。

参照以上实施例，图9所示实施例中的终端900是以单元的形式来呈现。这里的“单元”可以指特定应用集成电路(application-specific integrated circuit，ASIC)，执行一个或多个软件或固件程序的处理器和存储器，集成逻辑电路，和/或其他可以提供上述功能的器件。

请参阅图10，图10是本发明实施例公开的一种终端的结构示意图。终端1000包括：存储单元1010、通信接口1020、神经网络计算装置1030及与所述存储单元1010和通信接口1020耦合的处理器1040。所述存储单元1010用于存储指令，所述处理器1040用于执行所述指令，所述通信接口1020用于在所述处理器1040的控制下与其他设备进行通信。当所述处理器1040在执行所述指令时可根据所述指令执行本申请上述实施例中的任意一种图像识别方法。

神经网络计算装置1030可包括一个或多个神经网络计算芯片，如DSP(Digital Signal Process，数字信号处理)芯片、NPU(Network Process Unit，网络处理单元)、GPU(Graphic Process Unit，图像处理器)等中的至少一种。

处理器1040还可称中央处理单元(CPU，Central Processing Unit)。存储单元1010可以包括只读存储器和随机存取存储器，并向处理器1040提供指令和数据等。存储单元1010的一部分还可包括非易失性随机存取存储器。具体的应用中终端1000的各组件例如通过总线系统耦合在一起。总线系统除了可包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图中将各种总线都标为总线系统1050。上述本发明实施例揭示的方法可应用于处理器1040中，或由处理器1040实现。处理器1040可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器1040中的硬件的集成逻辑电路或者软件形式的指令完成。其中，上述处理器1040可以是通用处理器、数字信号处理器、专用集成电路、现成可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。处理器1040可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储单元1010，例如处理器1040可读取存储单元1010中的信息，结合其硬件完成上述方法的步骤。

本发明实施例还提供了一种计算机存储介质，用于储存为上述微基站所用的计算机软件指令，其包含用于执行上述方法实施例所涉及的计算机程序。

尽管在此结合各实施例对本发明进行了描述，然而，在实施所要求保护的本发明过程中，本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书，可理解并实现所述公开实施例的其他变化。在权利要求中，“包括”(comprising)一词不排除其他组成部分或步骤，“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施，但这并不表示这些措施不能组合起来产生良好的效果。

本领域技术人员应明白，本发明的实施例可提供为方法、装置(设备)、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机程序存储/分布在合适的介质中，与其它硬件一起提供或作为硬件的一部分，也可以采用其他分布形式，如通过Internet或其它有线或无线电信系统。

本发明是参照本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管结合具体特征及其实施例对本发明进行了描述，显而易见的，在不脱离本发明的精神和范围的情况下，可对其进行各种修改和组合。相应地，本说明书和附图仅仅是所附权利要求所界定的本发明的示例性说明，且视为已覆盖本发明范围内的任意和所有修改、变化、组合或等同物。显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

一种终端，其特征在于，包括处理器、存储器、神经网络计算装置、通信接口和通信总线，所述处理器、所述存储器、所述神经网络计算装置和所述通信接口通过所述通信总线连接并完成相互间的通信；

所述存储器存储有可执行程序代码，所述通信接口用于无线通信；

所述处理器用于调用所述存储器中的所述可执行程序代码，以执行以下操作：

获取包含目标物的图像文件；

控制所述神经网络计算装置根据所述终端中的图像识别模型对所述目标物进行识别，以得到所述目标物的物体类别信息；

将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件。
如权利要求1所述终端，其特征在于，所述神经网络计算装置包括至少一个神经网络计算芯片。
如权利要求1或2所述终端，其特征在于，所述处理器获取包含目标物的图像文件的具体方式为：

根据用户对所述终端上的显示图像的选取操作，确定所述选取操作对应的目标物；

生成包含所述目标物的图像文件。
如权利要求3所述终端，其特征在于，若所述选取操作对应n个目标物，n为正整数，所述处理器生成包含所述目标物的图像文件的具体方式为：

生成包含所述n个目标物的图像文件；或者，

生成包含所述n个目标物中的至少一个目标物的m个图像文件，m为整数且m≤n。
如权利要求1-4任一项所述终端，其特征在于，所述处理器控制所述神经网络计算装置根据所述终端中的图像识别模型对所述目标物进行识别，以得到所述目标物的物体类别信息之前，所述处理器还用于调用所述存储器中的所述可执行程序代码，以执行以下操作：

控制所述通信接口接收并存储第一服务器发送的所述图像识别模型；或者，

控制所述神经网络计算装置根据所述终端中的图片进行图像识别训练，以得到所述图像识别模型。
如权利要求5所述终端，其特征在于，所述处理器将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件之后，所述处理器还用于调用所述存储器中的所述可执行程序代码，以执行以下操作：

控制所述通信接口将所述目标物的第一标签信息发送至所述第一服务器，以在所述第一服务器上共享所述第一标签信息。
如权利要求6所述终端，其特征在于，所述处理器将所述目标物的第一标签信息发送至所述第一服务器之前，所述处理器还用于调用所述存储器中的所述可执行程序代码，以执行以下操作：

根据用户针对所述第一标签信息的修订操作，对所述第一标签信息进行修订；

其中，所述处理器控制所述通信接口将所述目标物的第一标签信息发送至所述第一服务器的具体方式为：

将所述修订后的所述第一标签信息发送至所述第一服务器。
如权利要求6所述终端，其特征在于，所述处理器控制所述通信接口将所述目标物的第一标签信息发送至所述第一服务器之后，所述处理器还用于调用所述存储器中的所述可执行程序代码，以执行以下操作：

若通过所述通信接口收到所述第一服务器发送的第一标签修订信息，将所述第一标签信息更新为所述第一标签修订信息。
如权利要求1-8任一项所述终端，其特征在于，所述处理器将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件之后，所述处理器还用于调用所述存储器中的所述可执行程序代码，以执行以下操作：

在目标物详细信息库中查找与所述第一标签信息相匹配的第二标签信息；

判断是否查找到所述第二标签信息；

若为是，则将所述第二标签信息保存至所述图像文件，并根据所述第二标签信息对所述图像文件中的所述目标物进行标注；

若为否，则根据所述第一标签信息对所述图像文件中的所述目标物进行标注。
一种终端，其特征在于，包括：

获取单元，用于获取包含目标物的图像文件；

识别单元，用于通过所述终端中的神经网络计算装置根据所述终端中的图像识别模型对所述目标物进行识别，以得到所述目标物的物体类别信息；

保存单元，用于将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件。
如权利要求10所述终端，其特征在于，所述获取单元包括：

确定单元，用于根据用户对所述终端上的显示图像的选取操作，确定所述选取操作对应的目标物；

生成单元，用于生成包含所述目标物的图像文件。
如权利要求11所述终端，其特征在于，若所述选取操作对应n个目标物，n为正整数，所述生成单元还用于：

生成包含所述n个目标物的图像文件；或者，

生成包含所述n个目标物中的至少一个目标物的m个图像文件，m为整数且m≤n。
如权利要求10-12任一项所述终端，其特征在于，所述识别单元根据终端中的图像识别模型对所述目标物进行识别，以得到所述目标物的物体类别信息之前，所述终端还包括：

接收单元，用于接收并存储第一服务器发送的所述图像识别模型；或者，

训练单元，用于通过所述神经网络计算装置根据所述终端中的图片进行图像识别训练，以得到所述图像识别模型。
如权利要求13所述终端，其特征在于，所述保存单元将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件之后，所述终端还包括：

发送单元，用于将所述目标物的第一标签信息发送至所述第一服务器，以在所述第一服务器上共享所述第一标签信息。
如权利要求14所述终端，其特征在于，所述发送单元将所述目标物的第一标签信息发送至所述第一服务器之前，所述终端还包括：

修订单元，用于根据用户针对所述第一标签信息的修订操作，对所述第一标签信息进行修订；

所述发送单元还用于：

将所述修订后的所述第一标签信息发送至所述第一服务器。
如权利要求14所述终端，其特征在于，所述发送单元将所述目标物的第一标签信息发送至所述第一服务器之后，所述终端还包括：

更新单元，用于若所述终端接收到所述第一服务器发送的第一标签修订信息，将所述第一标签信息更新为所述第一标签修订信息。
如权利要求10-16任一项所述终端，其特征在于，所述保存单元将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件之后，所述终端还包括：

查找单元，用于在目标物详细信息库中查找与所述第一标签信息相匹配的第二标签信息；

判断单元，用于判断是否查找到所述第二标签信息；

所述保存单元，还用于若所述判断单元的判断结果为是，将所述第二标签信息保存至所述图像文件，并根据所述第二标签信息对所述图像文件中的所述目标物进行标注；

标注单元，用于若所述判断单元的判断结果为否，根据所述第一标签信息对所述图像文件中的所述目标物进行标注。
一种图像识别方法，其特征在于，包括：

终端获取包含目标物的图像文件；

所述终端通过所述终端中的神经网络计算装置根据所述终端中的图像识别模型对所述目标物进行识别，以得到所述目标物的物体类别信息；

所述终端将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件。
如权利要求18所述方法，其特征在于，所述终端获取包含目标物的图像文件，包括：

所述终端根据用户对所述终端上的显示图像的选取操作，确定所述选取操作对应的目标物；

所述终端生成包含所述目标物的图像文件。
如权利要求19所述方法，其特征在于，若所述选取操作对应n个目标物，n为正整数，所述终端生成包含所述目标物的图像文件，包括：

所述终端生成包含所述n个目标物的图像文件；或者，

所述终端生成包含所述n个目标物中的至少一个目标物的m个图像文件，m为整数且m≤n。
如权利要求18-20任一项所述方法，其特征在于，所述终端根据终端中的图像识别模型对所述目标物进行识别，以得到所述目标物的物体类别信息之前，所述方法还包括：

所述终端接收并存储第一服务器发送的所述图像识别模型；或者，

所述终端通过所述神经网络计算装置根据所述终端中的图片进行图像识别训练，以得到所述图像识别模型。
如权利要求21所述方法，其特征在于，所述终端将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件之后，所述方法还包括：

所述终端将所述目标物的第一标签信息发送至所述第一服务器，以在所述第一服务器上共享所述第一标签信息。
如权利要求22所述方法，其特征在于，所述终端将所述目标物的第一标签信息发送至所述第一服务器之前，所述方法还包括：

所述终端根据用户针对所述第一标签信息的修订操作，对所述第一标签信息进行修订；

所述终端将所述目标物的第一标签信息发送至所述第一服务器，包括：

所述终端将所述修订后的所述第一标签信息发送至所述第一服务器。
如权利要求22所述方法，其特征在于，所述终端将所述目标物的第一标签信息发送至所述第一服务器之后，所述方法还包括：

若所述终端接收到所述第一服务器发送的第一标签修订信息，所述终端将所述第一标签信息更新为所述第一标签修订信息。
如权利要求18-24任一项所述方法，其特征在于，所述终端将所述物体类别信息作为所述目标物的第一标签信息保存至所述图像文件之后，所述方法还包括：

所述终端在目标物详细信息库中查找与所述第一标签信息相匹配的第二标签信息；

所述终端判断是否查找到所述第二标签信息；

若为是，则所述终端将所述第二标签信息保存至所述图像文件，并根据所述第二标签信息对所述图像文件中的所述目标物进行标注；

若为否，则所述终端根据所述第一标签信息对所述图像文件中的所述目标物进行标注。