WO2017185395A1

WO2017185395A1 - 一种用于执行向量比较运算的装置和方法

Info

Publication number: WO2017185395A1
Application number: PCT/CN2016/081115
Authority: WO
Inventors: 韩栋; 张潇; 刘少礼; 陈天石; 陈云霁
Original assignee: Cambricon Technologies Corp Ltd
Current assignee: Cambricon Technologies Corp Ltd
Priority date: 2016-04-26
Filing date: 2016-05-05
Publication date: 2017-11-02
Anticipated expiration: 2018-10-26
Also published as: CN107315563A; US20190163477A1; CN111176608A; CN111176608B; EP3451151A4; EP3451151B1; EP3451151A1; CN107315563B; US20190065189A1; US10853069B2

Abstract

一种用于执行向量比较运算的装置和方法。所述装置包括：存储单元，用于存储向量比较运算指令相关的向量数据；寄存器单元，用于存储向量比较运算指令相关的标量数据；控制单元，用于对向量比较运算指令进行译码，并控制向量比较运算指令的运算过程；向量比较单元，用于根据译码后的向量比较运算指令，对两待比较输入向量数据进行向量比较操作；其中，所述向量比较单元为定制的硬件电路。所述用于执行向量比较运算的装置和方法，通过定制的硬件电路实现了精简向量比较运算指令的完整过程，即通过一条精简的向量比较指令即可实现向量比较运算。

Description

一种用于执行向量比较运算的装置和方法

技术领域

本公开涉及计算机指令运算领域，尤其涉及一种用于执行向量比较运算的装置和方法。

背景技术

向量比较，即针对两长度一致的向量，对应的元素之间进行比较，得到的比较结果构成新的输出向量。深度学习领域存在着针对两向量进行大小比较操作的需求，在人工神经网络的受限玻尔兹曼机中，即存在这样的步骤，要求对一组神经元组成的向量进行采样，即将向量中每一个神经元与一个随机数进行比较，神经元的值大于该向量就取1反之取0。又比如将一组32位单精度浮点数转换值16位的半精度浮点数，如果选择随机进位的方法，则需要将截断部分与满足某分布的随机数进行比较，大于该随机数选择进1，这同样要求对两向量数据进行比较操作。

在现有技术中，一种最常用的实现向量比较操作的方法是在通用CPU上逐个比较，该方法执行效率低。

另一种现有技术是在图形处理器(GPU)上进行向量比较操作，其中，通过使用通用寄存器堆和通用流处理单元执行通用SIMD指令来进行运算。但在上述方案中，GPU片上缓存太小，在进行大规模向量比较运算时需要不断进行片外数据搬运，片外带宽成为了主要性能瓶颈。

综上所述，现有的不管是通用处理器还是图形处理器，均不能高效处理大规模的向量比较运算。

发明内容

有鉴于此，本公开提供了一种执行向量比较运算的装置和方法，根据指令可以支持任意长度的向量比较运算，同时还具有优异的执行性能。该装置根据指令可以执行一系列向量比较运算，包括但不限于大于等于、大于、等于、不等于、小于、小于等于，可以灵活支持不同长度的向量数据。

根据本公开一方面，提供了一种用于执行向量比较运算的装置，包括：

存储单元，用于存储向量比较运算指令相关的向量数据；

寄存器单元，用于存储向量比较运算指令相关的标量数据；

控制单元，用于对向量比较运算指令进行译码，并控制向量比较运算指令的运算过程；

向量比较单元，用于根据译码后的向量比较运算指令，对两待比较输入向量数据进行向量比较操作；

其中，所述向量比较单元为定制的硬件电路。

可选地，所述寄存器单元所存储的标量数据包括向量比较运算指令相关的待比较输入向量起始地址、比较结果输出向量存储地址、待比较输入向量长度；其中，所述待比较输入向量的起始地址以及比较结果输出向量存储地址为所述存储单元中的地址。

可选地，所述控制单元包括：

指令队列模块，用于对译码后的向量比较运算指令进行顺序存储，并获取向量比较运算指令相关的标量数据。

可选地，所述控制单元包括：

依赖关系处理单元，用于在向量比较单元获取当前向量比较运算指令前，判断当前向量比较运算指令与之前未执行完的运算指令是否存在依赖关系。

可选地，所述控制单元包括：

存储队列模块，用于在当前向量比较运算指令与之前未执行完的运算指令存在依赖关系时，暂时存储当前向量比较运算指令，并且在该依赖关系消除时，将暂存的向量比较运算指令送往向量比较单元。

可选地，所述装置还包括：

指令缓存单元，用于存储待执行的向量运算指令；

输入输出单元，用于将向量比较运算指令相关的向量数据存储于存储单元，或者，从存储单元中获取向量比较运算指令的比较结果输出向量。

可选地，所述向量比较运算指令包括操作码和操作域；

所述操作码用于指示执行向量比较操作；

所述操作域包括立即数和/或寄存器号，指示向量比较运算相关的标量数据，其中寄存器号指向所述寄存器单元地址。

可选地，所述存储单元为高速暂存存储器。

根据本公开第二方面，提供了一种用于执行向量比较运算的装置，包括：

取指模块，用于从指令序列中取出下一条要执行的向量比较运算指令，并将该向量比较运算指令传给译码模块；

译码模块，用于对该向量比较运算指令进行译码，并将译码后的向量比较运算指令传送给指令队列模块；

指令队列模块，用于暂存译码后的向量比较运算指令，并从向量比较运算指令或标量寄存器获得向量比较运算指令相关的标量数据；获得所述标量数据后，将所述向量比较运算指令送至依赖关系处理单元；

标量寄存器堆，包括多个标量寄存器，用于存储向量比较运算指令相关的标量数据；

依赖关系处理单元，用于判断所述向量比较运算指令与之前未执行完的运算指令之间是否存在依赖关系；如果存在依赖关系，则将所述向量比较运算指令送至存储队列模块，如果不存在依赖关系，则将所述向量比较运算指令送至向量比较单元；

存储队列模块，用于存储与之前运算指令存在依赖关系的向量比较运算指令，并且在所述依赖关系解除后，将所述向量比较运算指令送至向量比较单元；

向量比较单元，用于根据接收到向量比较运算指令对输入向量数据进行向量比较操作；

高速暂存存储器，用于存储待比较输入向量和比较结果输出向量；

输入输出存取模块，用于直接访问所述高速暂存存储器，负责从所述高速暂存存储器中读取待比较输入向量和写入比较结果输出向量。

可选地，所述向量比较单元为定制的硬件电路。

根据本公开第三方面，提供了一种用于执行向量比较运算方法，该方法包括：

取指模块从指令序列中取出下一条要执行的向量比较运算指令，并将该向量比较运算指令传给译码模块；

译码模块对该向量比较运算指令进行译码，并将译码后的向量比较运算指令传送给指令队列模块；

指令队列模块暂存译码后的向量比较运算指令，并从向量比较运算指令或标量寄存器获得向量比较指令运算相关的标量数据；获得所述标量数据后，将所述向量比较运算指令送至依赖关系处理单元；

依赖关系处理单元判断所述向量比较运算指令与之前未执行完的运算指令之间是否存在依赖关系；如果存在依赖关系，则将所述向量比较运算指令送至存储队列模块，如果不存在依赖关系，则将所述向量比较运算指令送至向量比较单元；

存储队列模块存储与之前运算指令存在依赖关系的向量比较运算指令，并且在所述依赖关系解除后，将所述向量比较运算指令送至向量比较单元；

向量比较单元根据接收到的向量比较运算指令，通过输入输出存取模块从高速暂存存储器取出待比较输入向量，然后对待比较输入向量进行向量比较运算，并将比较结果输出向量写入高速暂存存储器。

本公开提供的用于执行向量比较运算的装置和方法，通过定制的硬件电路实现了精简向量比较运算指令的完整过程，即通过一条精简的向量比较指令即可实现向量比较运算。本公开还通过将参与计算的向量数据暂存在高速暂存存储器上(Scratchpad Memory)，使得运算过程中可以更加灵活有效地支持不同宽度的向量数据，同时定制的向量比较单元能够更加高效地实现各种比较运算，本公开采用的指令具有精简的格式，使得指令使用方便。

本公开可以应用于以下场景中(包括但不限于)：数据处理、机器人、电脑、打印机、扫描仪、电话、平板电脑、智能终端、手机、行车记录仪、导航仪、传感器、摄像头、云端服务器、相机、摄像机、投影仪、手表、耳机、移动存储、可穿戴设备等各类电子产品；飞机、轮船、车辆等各类交通工具；电视、空调、微波炉、冰箱、电饭煲、加湿器、洗衣机、电灯、燃气灶、油烟机等各类家用电器；以及包括核磁共振仪、B超、心电图仪等各类医疗设备。

附图说明

图1是本公开提供的用于执行向量比较运算的装置的结构示意图。

图2是本公开提供的向量比较原始指令的格式示意图。

图3是本公开实施例提供的用于执行向量比较运算装置的结构示意图。

图4是本公开实施例提供的向量比较运算装置执行向量比较原始指令的流程图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本公开作进一步的详细说明。

图1是本公开提供的一种用于执行向量比较运算的装置的结构示意图，如图1所示，向量比较运算装置包括：

存储单元，用于存储向量比较运算指令相关的向量数据，在一种实施方式中，该存储单元可以是高速暂存存储器(Scratchpad Memory)，能够支持不同大小的向量数据；本公开将必要的计算数据暂存在高速暂存存储器上(Scratchpad Memory)，使本运算装置在进行向量运算过程中可以更加灵活有效地支持不同宽度的数据。所述向量比较运算指令相关的向量数据包括待比较的输入向量数据和比较结果输出向量数据；本公开将参与运算的向量数据暂存在高速暂存存储器上，使得向量运算过程中可以更加灵活有效地支持不同宽度的数据。所述高速暂存存储器可以通过各种不同存储器件如SRAM、DRAM、eDRAM、忆阻器、3D-DRAM和非易失存储等实现。

寄存器单元，用于存储向量比较运算指令相关的标量数据，所述标量数据包括待比较的输入向量数据的起始地址及长度、比较结果输出向量数据存储地址以及其他相关参数，其中，向量所述输入向量数据的地址和输出向量数据的存储地址为向量在存储单元中存储的地址；在一种实施方式中，寄存器单元可以是标量寄存器堆，提供运算过程中所需的标量寄存器，标量寄存器不只存放向量存储地址，还存放有其他的标量数据。

控制单元，用于对向量比较运算指令进行译码，并控制向量比较运算指令的执行过程；其主要通过控制装置中各个模块的行为实现对向量比较运算指令的执行过程的控制。在一种实施方式中，控制单元读取准备好的指令，进行译码生成控制信号，发送给装置中的其他模块，其他模块根据得到的控制信号执行相应的操作。

向量比较单元，该单元根据指令实现对输入向量数据的指定比较运算。该单元是向量运算单元，同时对所有输入数据进行相同的运算。在一实施例中，向量比较单元根据向量比较运算指令得到两待比较向量的起始地址和长度，从存储单元获取两待比较向量，并对两待比较向量中对应的元素进行比较，当条件满足时将比较结果输出向量的相应位置置1，否则置0，得到比较结果。本公开中所述向量比较单元为定制的硬件电路，包括但不限于FPGA、CGRA、专用集成电路ASIC、模拟电路和忆阻器等；所述向量比较单元通过与该装置中的其它模块相互协作，能够完成任意长度向量的比较运算。

本公开提供一种向量比较运算装置，通过指令来控制具体执行的比较操作的方式以及向量数据的地址和长度，运算装置主要包括了存储单元、寄存器单元、控制单元和比较运算单元。存储单元中存储有向量，寄存器单元中存储有向量存储地址和其他标量参数，控制单元执行译码操作，根据指令控制各个模块，而比较运算单元根据指令在指令中或从寄存器单元中获取向量的长度、地址和其他参数，然后，根据该地址和长度在存储单元中获取相应的向量数据，接着，对向量执行比较运算，依指令的不同，可以执行大于等于、大于、等于、不等于、小于和小于等于等比较运算。本公开将参与计算的向量数据暂存在高速暂存存储器上，使得运算过程中可以更加灵活有效地支持不同宽度的向量数据。

根据本公开的一种实施方式，所述向量比较运算装置还包括：指令缓存单元，用于存储待执行的向量比较运算指令。向量比较原始指令在执行过程中，同时也被缓存在指令缓存单元中，当一条指令执行完之后，该指令将被提交。

图2示出了本公开中向量比较运算指令的格式示意图，如图2所示，所述向量比较运算指令包含操作码和多个操作域，其中操作码用于指示进行何种向量比较运算，如大于等于、大于、等于、不等于、小于和小于等于等比较运算；而操作域用于存储向量比较运算相关的标量数据，包括立即数和寄存器号，所述寄存器号指向具体的寄存器单元；所述立即数和寄存器单元用于存储待比较向量的起始地址及长度、输出向量的存储地址等，根据该指令，装置可以直接从指令中或者通过访问指令提供的寄存器号来获得指令相关的标量数据。所述待比较向量的起始地址和输出向量的存储地址均为存储单元中的地址。

根据本公开的一种实施方式，所述向量比较装置的控制单元还包括：指令队列模块，用于对译码后的向量比较运算指令进行顺序存储，其通过向量比较运算指令中的操作域获取向量比较运算指令相关的标量数据，如待比较向量起始地址和长度等，将其填充至向量比较运算指令后将其送往依赖关系处理单元。

根据本公开的一种实施方式，所述装置的控制单元还包括：依赖关系处理单元，用于在向量比较运算单元获取向量比较原始指令前，判断该向量比较运算指令与之前未执行的运算指令是否存在依赖关系，如是否访问相同的向量存储地址，若是，则将该向量比较运算指令存储在存储队列模块中，待与其存在依赖关系的运算指令执行完毕后，存储队列模块将该向量比较运算指令提供给所述向量比较运算单元；否则，直接将该向量比较运算指令提供给所述向量比较运算单元。具体地，向量比较运算指令访问高速暂存存储器时，前后指令可能会访问同一块存储空间，为了保证指令执行结果的正确性，当前指令如果被检测到与之前的指令的数据存在依赖关系，该指令必须在存储队列内等待至依赖关系被消除。

根据本公开的一种实施方式，所述装置的控制单元还包括：存储队列模块，该模块包括一个有序队列，与之前指令在数据上有依赖关系的指令被存储在该有序队列内直至依赖关系被消除，在依赖关系消除后，其将运算指令提供给向量比较运算单元。

根据本公开的一种实施方式，所述装置还包括：输入输出单元，用于将向量存储于存储单元，或者，从存储单元中获取向量比较运算结果。其中，输入输出单元可直接存储单元，负责从内存中读取向量数据或写入向量数据。

根据本公开的一种实施方式，本装置的指令设计采用精简化的方式，一条指令可以完成一次完整的向量比较运算。

在本装置执行向量比较运算的过程中，装置取出指令进行译码，然后送至指令队列存储，根据译码结果，获取指令中的各个参数，这些参数可以是直接写在指令的操作域(即立即数)中，也可以是根据指令操作域中的寄存器号从指定的寄存器中读取。这种使用寄存器存储参数的好处是无需改变指令本身，只要用指令改变寄存器中的值，就可以实现大部分的循环，因此大大节省了在解决某些实际问题时所需要的指令条数。在全部操作数之后，依赖关系处理单元会判断指令实际需要使用的数据与之前指令中是否存在依赖关系，这决定了这条指令是否可以被立即发送至运算单元中执行。一旦发现与之前的数据之间存在依赖关系，则该条指令必须等到它依赖的指令执行完毕之后才可以送至运算单元执行。在定制的运算单元中，该条指令将快速执行完毕，并将结果，即生成的随机向量写回至指令提供的地址，该条指令执行完毕。

本装置可以执行下列几种向量比较运算指令：

大于等于运算指令(GE)，根据该指令，装置可以直接从指令中或者通过访问指令提供的寄存器号来获得指令的参数，包括向量的长度、两向量的起始地址以及输出向量的存储地址，然后读取两向量数据，在向量比较运算单元中对向量中所有位置上的元素进行比较，若某位置行前一向量的值大于等于后一向量的值，则将比较结果向量在该位置上的值置为1，否则置为0。最后将比较结果写回至高速暂存存储器的指定存储地址。

小于等于运算指令(LE)，根据该指令，装置可以直接从指令中或者通过访问指令提供的寄存器号来获得指令的参数，包括向量的长度、两向量的起始地址以及输出向量的存储地址，然后读取两向量数据，在向量比较运算单元中对向量中所有位置上的元素进行比较，若某位置行前一向量的值小于等于后一向量的值，则将比较结果向量在该位置上的值置为1，否则置为0。最后将比较结果写回值高速暂存存储器的指定存储地址。

大于运算指令(GT)，根据该指令，装置可以直接从指令中或者通过访问指令提供的寄存器号来获得指令的参数，包括向量的长度、两向量的起始地址以及输出向量的存储地址，然后读取两向量数据，在向量比较运算单元中对向量中所有位置上的元素进行比较，若某位置行前一向量的值大于后一向量的值，则将比较结果向量在该位置上的值置为1，否则置为0。最后将比较结果写回值高速暂存存储器的指定存储地址。

小于运算指令(LT)，根据该指令，装置可以直接从指令中或者通过访问指令提供的寄存器号来获得指令的参数，包括向量的长度、两向量的起始地址以及输出向量的存储地址，然后读取两向量数据，在向量比较运算单元中对向量中所有位置上的元素进行比较，若某位置行前一向量的值小于后一向量的值，则将比较结果向量在该位置上的值置为1，否则置为0。最后将比较结果写回值高速暂存存储器的指定存储地址。

等于运算指令(EQ)，根据该指令，装置可以直接从指令中或者通过访问指令提供的寄存器号来获得指令的参数，包括向量的长度、两向量的起始地址以及输出向量的存储地址，然后读取两向量数据，在向量比较运算单元中对向量中所有位置上的元素进行比较，若某位置行前一向量的值等于后一向量的值，则将比较结果向量在该位置上的值置为1，否则置为0。最后将比较结果写回值高速暂存存储器的指定存储地址。

不等于运算指令(UEQ)，根据该指令，装置可以直接从指令中或者通过访问指令提供的寄存器号来获得指令的参数，包括向量的长度、两向量的起始地址以及输出向量的存储地址，然后读取两向量数据，在向量比较运算单元中对向量中所有位置上的元素进行比较，若某位置行前一向量的值不等于后一向量的值，则将比较结果向量在该位置上的值置为1，否则置为0。最后将比较结果写回值高速暂存存储器的指定存储地址。

为使本公开的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本公开进一步详细说明。

图3是本公开一实施例提供的用于执行向量比较运算的装置的结构示意图，如图3所示，该装置包括取指模块、译码模块、指令队列模块、标量寄存器堆、依赖关系处理单元、存储队列模块、向量比较运算单元、高速暂存器、IO内存存取模块；

取指模块，该模块负责从指令序列中取出下一条将要执行的指令，并将该指令传给译码模块；

译码模块，该模块负责对指令进行译码，并将译码后指令传给指令队列；

指令队列模块，该模块用于暂存从译码模块获得的指令，并从指令或标量寄存器获得指令运算相应的数据，包括向量数据的起始地址和大小以及一些标量常数。获得数据后，指令被送至依赖关系处理单元；

标量寄存器堆，提供运算过程中所需的标量寄存器；

依赖关系处理单元，该单元用于处理向量比较运算指令与之前未执行完的指令可能存在的存储依赖关系。向量比较运算指令会访问高速暂存存储器以获取待比较向量，前后指令可能会访问同一块存储空间。为了保证指令执行结果的正确性，当前指令如果被检测到与之前的指令的数据存在依赖关系，该指令被送至存储队列模块内等待至依赖关系被消除。即检测本条指令的输入数据的存储区间与之前没有执行完毕的指令的输出数据的存储区间是否有重叠，存储区间是由起始地址和数据长度决定的。如果有重叠，则说明本条指令实际上是需要之前指令的执行结果作为输入的，因此必须等到那条指令执行完毕后，这条指令才能开始执行。在这个过程中，指令实际被暂存在存储队列模块中。

存储队列模块，该模块是一个有序队列，与之前指令在数据上有依赖关系的指令被存储在该队列内直至存储关系被消除；依赖关系被消除后的向量比较运算指令被送往向量比较运算单元；

向量比较运算单元，该单元负责执行两待比较向量的比较操作，包括大于等于、大于、小于等于、小于、等于、不等于的比较运算；该向量比较运算单元为定制的硬件电路实现；

高速暂存器，该模块是向量数据专用的暂存存储装置，能够支持不同大小的向量数据；所述高速暂存器主要用于存储待比较向量数据和比较运算结果向量数据；

IO内存存取模块，该模块用于直接访问高速暂存存储器，负责从高速暂存存储器中读取数据或写入数据。

图4是本公开一实施例提供的向量比较运算装置执行向量比较运算指令的流程图，如图4所示，执行向量比较运算指令的过程包括：

S1，取指模块取出该条向量比较运算指令，并将该向量比较运算指令送往译码模块。

S2，译码模块对该向量比较运算指令译码，并将该向量比较运算指令送往指令队列模块。

S3，在指令队列模块中，从向量比较运算指令本身或从标量寄存器堆中获取向量比较运算指令中操作域所对应的标量数据，包括两待比较输入向量的起始地址、输入向量长度、输出向量地址。

S4，在取得需要的标量数据后，该向量比较运算指令被送往依赖关系处理单元。

S5，依赖关系处理单元分析该向量比较运算指令与前面的尚未执行结束的指令在数据上是否存在依赖关系。若存在依赖关系，则该条向量比较运算指令被送往存储队列中等待至其与前面的未执行结束的指令在数据上不再存在依赖关系为止。若不存在依赖关系，则该条向量比较原始指令被送往向量比较运算单元。

S6，向量比较运算单元根据向量比较运算指令中的两待比较向量的起始地址和长度从高速暂存器中取出需比较的两待比较向量数据的一部分。

S7，向量比较单元同时比较所取出的两待比较向量数据的一部分中所有位置上的元素，当某位置上的两元素相等时，置输出结果的相应位置为1或0。

S8，转步骤S6，向量比较单元继续取出两待比较向量数据的下一部分进行比较，直至完成两待比较向量是否相等的运算。

S9，运算完成后，将结果向量写回至高速暂存存储器的指定地址。

综上所述，本公开提供向量比较运算装置，配合相应的指令，能够很好地解决当前计算机领域越来越多的针对向量的比较操作。相比于已有的传统解决方案，本公开可以具有指令精简、使用方便、支持的向量长度灵活、片上缓存充足等优点。

以上所述的具体实施例，对本公开的目的、技术方案和有益效果进行了进一步详细说明，应理解的是，以上所述仅为本公开的具体实施例而已，并不用于限制本公开，凡在本公开的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

一种用于执行向量比较运算的装置，其特征在于，包括：

存储单元，用于存储向量比较运算指令相关的向量数据；

寄存器单元，用于存储向量比较运算指令相关的标量数据；

控制单元，用于对向量比较运算指令进行译码，并控制向量比较运算指令的运算过程；

向量比较单元，用于根据译码后的向量比较运算指令，对两待比较输入向量数据进行向量比较操作；

其中，所述向量比较单元为定制的硬件电路。
如权利要求1所述的装置，其特征在于，所述寄存器单元所存储的标量数据包括向量比较运算指令相关的待比较输入向量起始地址、比较结果输出向量存储地址、待比较输入向量长度；其中，所述待比较输入向量的起始地址以及比较结果输出向量存储地址为所述存储单元中的地址。
如权利要求1所述的装置，其特征在于，所述控制单元包括：

指令队列模块，用于对译码后的向量比较运算指令进行顺序存储，并获取向量比较运算指令相关的标量数据。
如权利要求1所述的装置，其特征在于，所述控制单元包括：

依赖关系处理单元，用于在向量比较单元获取当前向量比较运算指令前，判断当前向量比较运算指令与之前未执行完的运算指令是否存在依赖关系。
如权利要求1所述的装置，其特征在于，所述控制单元包括：

存储队列模块，用于在当前向量比较运算指令与之前未执行完的运算指令存在依赖关系时，暂时存储当前向量比较运算指令，并且在该依赖关系消除时，将暂存的向量比较运算指令送往向量比较单元。
如权利要求1-5任一项所述的装置，其特征在于，所述装置还包括：

指令缓存单元，用于存储待执行的向量运算指令；

输入输出单元，用于将向量比较运算指令相关的向量数据存储于存储单元，或者，从存储单元中获取向量比较运算指令的比较结果输出向量。
如权利要求1所述的装置，其特征在于，所述向量比较运算指令包括操作码和操作域；

所述操作码用于指示执行向量比较操作；

所述操作域包括立即数和/或寄存器号，指示向量比较运算相关的标量数据，其中寄存器号指向所述寄存器单元地址。
如权利要求1-5、7任一项所述的装置，其特征在于，所述存储单元为高速暂存存储器。
一种用于执行向量比较运算的装置，其特征在于，包括：

取指模块，用于从指令序列中取出下一条要执行的向量比较运算指令，并将该向量比较运算指令传给译码模块；

译码模块，用于对该向量比较运算指令进行译码，并将译码后的向量比较运算指令传送给指令队列模块；

指令队列模块，用于暂存译码后的向量比较运算指令，并从向量比较运算指令或标量寄存器获得向量比较运算指令相关的标量数据；获得所述标量数据后，将所述向量比较运算指令送至依赖关系处理单元；

标量寄存器堆，包括多个标量寄存器，用于存储向量比较运算指令相关的标量数据；

依赖关系处理单元，用于判断所述向量比较运算指令与之前未执行完的运算指令之间是否存在依赖关系；如果存在依赖关系，则将所述向量比较运算指令送至存储队列模块，如果不存在依赖关系，则将所述向量比较运算指令送至向量比较单元；

存储队列模块，用于存储与之前运算指令存在依赖关系的向量比较运算指令，并且在所述依赖关系解除后，将所述向量比较运算指令送至向量比较单元；

向量比较单元，用于根据接收到向量比较运算指令对输入向量数据进行向量比较操作；

高速暂存存储器，用于存储待比较输入向量和比较结果输出向量；

输入输出存取模块，用于直接访问所述高速暂存存储器，负责从所述高速暂存存储器中读取待比较输入向量和写入比较结果输出向量。
如权利要求9所述的装置，其特征在于，所述向量比较单元为定制的硬件电路。
一种用于执行向量比较运算方法，其特征在于，该方法包括：

取指模块从指令序列中取出下一条要执行的向量比较运算指令，并将该向量比较运算指令传给译码模块；

译码模块对该向量比较运算指令进行译码，并将译码后的向量比较运算指令传送给指令队列模块；

指令队列模块暂存译码后的向量比较运算指令，并从向量比较运算指令或标量寄存器获得向量比较指令运算相关的标量数据；获得所述标量数据后，将所述向量比较运算指令送至依赖关系处理单元；

依赖关系处理单元判断所述向量比较运算指令与之前未执行完的运算指令之间是否存在依赖关系；如果存在依赖关系，则将所述向量比较运算指令送至存储队列模块，如果不存在依赖关系，则将所述向量比较运算指令送至向量比较单元；

存储队列模块存储与之前运算指令存在依赖关系的向量比较运算指令，并且在所述依赖关系解除后，将所述向量比较运算指令送至向量比较单元；

向量比较单元根据接收到的向量比较运算指令，通过输入输出存取模块从高速暂存存储器取出待比较输入向量，然后对待比较输入向量进行向量比较运算，并通过输入输出存取模块将比较结果输出向量写入高速暂存存储器。