KR20200045006A - 신경망 프로세서에서 사용하기 위한 가중치들의 프리페칭 - Google Patents
신경망 프로세서에서 사용하기 위한 가중치들의 프리페칭 Download PDFInfo
- Publication number
- KR20200045006A KR20200045006A KR1020207011552A KR20207011552A KR20200045006A KR 20200045006 A KR20200045006 A KR 20200045006A KR 1020207011552 A KR1020207011552 A KR 1020207011552A KR 20207011552 A KR20207011552 A KR 20207011552A KR 20200045006 A KR20200045006 A KR 20200045006A
- Authority
- KR
- South Korea
- Prior art keywords
- weight
- cell
- input
- cells
- register
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8007—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
- G06F15/8023—Two dimensional arrays, e.g. mesh, torus
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8046—Systolic arrays
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/002—Biomolecular computers, i.e. using biomolecules, proteins, cells
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Neurology (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Databases & Information Systems (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Algebra (AREA)
- Image Processing (AREA)
- Complex Calculations (AREA)
- Design And Manufacture Of Integrated Circuits (AREA)
- Image Analysis (AREA)
- Multi Processors (AREA)
Abstract
Description
도 2는 예시적인 신경망 프로세싱 시스템을 도시한다.
도 3은 매트릭스 컴퓨테이션 유닛을 포함하는 예시적인 아키텍처를 도시한다.
도 4는 시스톨릭 어레이 내부의 셀의 예시적인 아키텍처를 도시한다.
도 5는 공간 차원들 및 특징 차원을 갖는 예시적인 매트릭스 구조를 도시한다.
도 6은 커넬 매트릭스 구조가 시스톨릭 어레이에 전송되는 방법을 예시하는 예를 도시한다.
도 7은 3개의 클록 사이클들 이후 셀들 내부의 가중치 입력들을 예시하는 예를 도시한다.
도 8은 제어 신호들이 활성화 입력들을 시프트시키거나 또는 로딩시키는 방법을 예시하는 예이다.
다양한 도면들에서의 동일한 참조 번호들 및 표기들은 동일한 엘리먼트들을 표시한다.
Claims (19)
- 복수의 계층들을 포함하는 신경망에 대한 신경망 컴퓨테이션들을 수행하기 위한 회로로서,
제 1 셀 및 제 2 셀을 포함하는 매트릭스 컴퓨테이션 유닛; 및
가중치 회로를 포함하고, 상기 가중치 회로는:
상기 제 1 및 제 2 셀들 각각 내의 각각의 가중치 레지스터 ― 상기 각각의 가중치 레지스터는 외부 소스(source)로부터 수신되는 가중치 입력을 저장하기 위해 구성됨 ―;
적어도 상기 제 1 셀에 가중치 입력을 전송하도록 구성된 가중치 페처; 및
상기 제 1 셀로부터 상기 제 2 셀에 상기 가중치 입력을 시프트하도록 구성된 가중치 시퀀서를 포함하고,
상기 매트릭스 컴퓨테이션 유닛은, 상기 가중치 입력과 계층 입력의 곱을 컴퓨팅하는 것을 포함하는 신경망 컴퓨테이션을 수행하기 위해 상기 제 1 셀, 상기 제 2 셀 및 상기 가중치 회로를 사용하는,
회로. - 제 1 항에 있어서,
상기 제 1 및 제 2 셀들 각각 내의 각각의 제어 레지스터를 더 포함하고,
상기 각각의 제어 레지스터는 상기 가중치 시퀀서로부터 각각의 제어 값을 수신하도록 구성되며,
상기 각각의 제어 레지스터는, 상기 각각의 제어 레지스터가 상기 가중치 레지스터에 상기 가중치 입력을 저장하지 않는다고 결정하는 것에 대한 응답으로 상기 제 2 셀을 저장할지 여부를 결정하도록 구성되는,
회로. - 제 2 항에 있어서,
상기 제 1 셀에서 상기 각각의 제어 레지스터에 의해 수신되는 상기 각각의 제어 값은, 상기 각각의 제어 레지스터가 상기 가중치 레지스터에 상기 가중치 입력을 저장하지 않는다고 결정하는 것에 대한 응답으로 상기 제 1 셀로부터 상기 제 2 셀에 상기 가중치 입력을 시프트하기 위해 사용되는,
회로. - 제 1 항에 있어서,
상기 가중치 페처는:
상기 외부 소스와 통신하는 동적 메모리 유닛을 통해 상기 외부 소스로부터 상기 가중치 입력을 수신하고; 그리고
상기 매트릭스 컴퓨테이션 유닛의 제 1 차원을 따라 적어도 상기 제 1 셀에 상기 가중치 입력을 전송하는,
회로. - 제 4 항에 있어서,
상기 가중치 페처가 상기 매트릭스 컴퓨테이션 유닛의 제 1 차원을 따라 적어도 상기 제 1 셀에 상기 가중치 입력을 전송하는 것에 대한 응답으로, 상기 가중치 입력은 상기 제 1 셀의 각각의 가중치 레지스터에 저장되는,
회로. - 제 1 항에 있어서,
상기 제 1 셀 및 상기 제 2 셀 각각은 상기 셀의 각각의 가중치 레지스터에 커플링되는 각각의 곱셈 회로를 포함하고, 그리고
상기 곱셈 회로는 상기 계층 입력과 상기 가중치 입력을 곱한 곱을 출력하도록 구성되는,
회로. - 제 1 항에 있어서,
상기 매트릭스 컴퓨테이션 유닛은 셀들의 어레이을 포함하고, 상기 셀들의 어레이는 상기 제 1 및 제 2 셀들을 포함하고 적어도 2개의 차원들을 가지고,
상기 가중치 페처는 상기 셀들의 어레이의 제 1 차원을 따라 다수의 셀들 각각에 커플링되며, 그리고
상기 가중치 시퀀서는 상기 셀들의 어레이의 제 2 차원을 따라 다수의 셀들 각각에 커플링되는,
회로. - 제 7 항에 있어서,
상기 셀들의 어레이의 제 2 차원을 따라 다수의 셀들 각각에 커플링되는 값 로더를 더 포함하고,
상기 값 로더는:
상기 외부 소스로부터 하나 이상의 계층 입력들을 수신하고; 그리고
상기 셀들의 어레이의 제 2 차원을 따라, 적어도 상기 제 1 또는 제 2 셀들에 상기 하나 이상의 계층 입력들을 전송하도록 구성되는,
회로. - 가중치 회로 및 매트릭스 컴퓨테이션 유닛을 포함하는 회로를 사용하고 복수의 계층들을 포함하는 신경망에 대한 신경망 컴퓨테이션들을 수행하기 위한 방법으로서,
상기 가중치 회로의 가중치 페처를 사용하여, 상기 매트릭스 컴퓨테이션 유닛의 셀에 가중치 입력을 전송하는 단계 ― 상기 가중치 입력은 외부 소스로부터 수신됨 ―;
상기 셀의 제어 레지스터에 의해, 상기 제어 레지스터에 의해 수신된 제어 값에 기초하여 상기 셀의 가중치 레지스터에 상기 가중치 입력을 저장할지 여부를 결정하는 단계;
상기 제어 레지스터가 상기 가중치 입력이 상기 가중치 레지스터에 저장되어야 한다고 결정하는 것에 대한 응답으로 상기 셀의 가중치 레지스터에 상기 가중치 입력을 저장하는 단계;
상기 셀에 의해, 상기 외부 소스에 의해 제공된 계층 입력을 수신하는 단계; 및
상기 셀의 가중치 레지스터에 커플링된 곱셈 회로를 사용하여, 상기 가중치 입력과 상기 계층 입력을 곱한 곱을 생성하는 단계를 포함하는,
방법. - 제 9 항에 있어서,
상기 매트릭스 컴퓨테이션 유닛은 다수의 셀들의 어레이를 포함하고, 상기 어레이는 적어도 두개의 차원들을 가지며,
상기 방법은:
상기 매트릭스 컴퓨테이션 유닛의 셀들에 의해, 상기 가중치 페처에 의해 전송된 상기 가중치 입력을 수신하는 단계; 및
상기 어레이의 제 1 차원을 따라, 상기 어레이의 인접 셀에 상기 가중치 입력을 시프트하는 단계를 더 포함하고,
상기 가중치 입력은, 상기 셀의 제어 레지스터가 상기 셀의 가중치 레지스터에 상기 가중치 입력을 저장하지 않는다고 결정하는 것에 대한 응답으로 상기 인접 셀로 시프트되는,
방법. - 제 10 항에 있어서,
상기 회로의 가중치 시퀀서에 의해, 상기 셀의 제어 레지스터에 의해 수신된 상기 제어 값을 제공하는 단계; 및
상기 제어 값에 기초하여, 복수의 클록 사이클들에 걸쳐 상기 어레이의 제 1 차원을 따라 하나 이상의 셀들에 하나 이상의 가중치 입력들을 시프트하는 단계를 더 포함하는,
방법. - 제 11 항에 있어서,
상기 가중치 페처는 상기 어레이의 제 1 차원을 따라 다수의 셀들 각각에 커플링되며, 그리고
상기 가중치 시퀀서는 상기 어레이의 제 2 차원을 따라 다수의 셀들 각각에 커플링되는,
방법. - 제 12 항에 있어서,
상기 회로는 상기 어레이의 제 2 차원을 따라 다수의 셀들 각각에 커플링되는 값 로더를 더 포함하며, 그리고
상기 방법은:
상기 값 로더에 의해, 상기 외부 소스로부터 하나 이상의 계층 입력들을 수신하는 단계; 및
상기 값 로더에 의해 그리고 상기 어레이의 제 2 차원을 따라, 상기 어레이의 제 2 차원을 따라 배열된 하나 이상의 셀들에 상기 하나 이상의 계층 입력들을 전송하는 단계를 더 포함하는,
방법. - 제 13 항에 있어서,
상기 셀의 가중치 레지스터에 상기 가중치 입력을 저장하는 단계는:
상기 셀에 계층 입력들이 제공될 때, 상기 값 로더를 사용하여 그리고 다수의 클록 사이클들에 걸쳐, 상기 가중치 입력이 셀 내에 저장된 채 남아있고 인접 셀로 시프트되지 않도록, 상기 가중치 입력을 정적으로 저장하는 단계를 포함하는,
방법. - 제 10 항에 있어서,
상기 가중치 페처에 의해, 상기 외부 소스와 통신하는 동적 메모리를 통해 상기 외부 소스로부터 상기 가중치 입력을 수신하는 단계; 및
상기 가중치 페처에 의해, 상기 매트릭스 컴퓨테이션 유닛의 다수의 셀들의 어레이의 제 1 차원을 따라 적어도 제 1 셀에 상기 가중치 입력을 전송하는 단계를 더 포함하는,
방법. - 제 15 항에 있어서,
상기 가중치 페처가 상기 매트릭스 컴퓨테이션 유닛의 제 1 차원을 따라 적어도 상기 제 1 셀에 상기 가중치 입력을 전송하는 것에 대한 응답으로, 상기 가중치 입력은 상기 제 1 셀의 가중치 레지스터에 저장되는,
방법. - 제 9 항에 있어서,
상기 셀의 합산 회로에 의해, 상기 곱셈 회로에 의해 생성된 상기 곱 및 상기 매트릭스 컴퓨테이션 유닛의 인접한 셀로부터의 제 1 부분 합을 수신하는 단계; 및
상기 합산 회로에 의해, 상기 곱과 상기 제 1 부분 합을 더한 합인 제 2 부분 합을 생성하는 단계를 더 포함하는,
방법. - 다중 계층 신경망에 대한 신경망 컴퓨테이션들을 수행하기 위해 사용되는 명령들을 저장하고 가중치 회로 및 매트릭스 컴퓨테이션 유닛을 사용하기 위한 비일시적 기계-판독가능한 저장 장치로서,
상기 명령들은 동작들을 수행시키기 위해 프로세싱 장치에 의해 실행될 수 있고, 그리고
상기 동작들은:
상기 가중치 회로의 가중치 페처를 사용하여, 상기 매트릭스 컴퓨테이션 유닛의 셀에 가중치 입력을 전송하는 동작 ― 상기 가중치 입력은 외부 소스로부터 수신됨 ―;
상기 셀의 제어 레지스터에 의해, 상기 제어 레지스터에 의해 수신된 제어 값에 기초하여 상기 셀의 가중치 레지스터에 상기 가중치 입력을 저장할지 여부를 결정하는 동작;
상기 제어 레지스터가 상기 가중치 입력이 상기 가중치 레지스터에 저장되어야 한다고 결정하는 것에 대한 응답으로 상기 셀의 가중치 레지스터에 상기 가중치 입력을 저장하는 동작;
상기 셀에 의해, 상기 외부 소스에 의해 제공된 계층 입력을 수신하는 동작; 및
상기 셀의 가중치 레지스터에 커플링된 곱셈 회로를 사용하여, 상기 가중치 입력과 상기 계층 입력을 곱한 곱을 생성하는 동작을 포함하는,
비일시적 기계-판독가능한 저장 장치. - 제 18 항에 있어서,
상기 매트릭스 컴퓨테이션 유닛은 다수의 셀들의 어레이를 포함하고, 상기 셀들의 어레이는 적어도 2개의 차원들을 가지며, 그리고
상기 동작들은:
상기 매트릭스 컴퓨테이션 유닛의 셀들에 의해, 상기 가중치 페처에 의해 전송된 상기 가중치 입력을 수신하는 동작; 및
상기 어레이의 제 1 차원을 따라, 상기 어레이의 인접 셀에 상기 가중치 입력을 시프트하는 동작을 더 포함하고,
상기 가중치 입력은, 상기 셀의 제어 레지스터가 상기 셀의 가중치 레지스터에 상기 가중치 입력을 저장하지 않는다고 결정하는 것에 대한 응답으로 상기 인접 셀로 시프트되는,
비일시적 기계-판독가능한 저장 장치.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020227021145A KR102641283B1 (ko) | 2015-05-21 | 2016-04-29 | 신경망 프로세서에서 사용하기 위한 가중치들의 프리페칭 |
Applications Claiming Priority (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201562164981P | 2015-05-21 | 2015-05-21 | |
| US62/164,981 | 2015-05-21 | ||
| US14/844,670 US10049322B2 (en) | 2015-05-21 | 2015-09-03 | Prefetching weights for use in a neural network processor |
| US14/844,670 | 2015-09-03 | ||
| PCT/US2016/029965 WO2016186810A1 (en) | 2015-05-21 | 2016-04-29 | Prefetching weights for use in a neural network processor |
| KR1020177028188A KR102105128B1 (ko) | 2015-05-21 | 2016-04-29 | 신경망 프로세서에서 사용하기 위한 가중치들의 프리페칭 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020177028188A Division KR102105128B1 (ko) | 2015-05-21 | 2016-04-29 | 신경망 프로세서에서 사용하기 위한 가중치들의 프리페칭 |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020227021145A Division KR102641283B1 (ko) | 2015-05-21 | 2016-04-29 | 신경망 프로세서에서 사용하기 위한 가중치들의 프리페칭 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20200045006A true KR20200045006A (ko) | 2020-04-29 |
| KR102413522B1 KR102413522B1 (ko) | 2022-06-24 |
Family
ID=56081550
Family Applications (4)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020177028188A Active KR102105128B1 (ko) | 2015-05-21 | 2016-04-29 | 신경망 프로세서에서 사용하기 위한 가중치들의 프리페칭 |
| KR1020227021145A Active KR102641283B1 (ko) | 2015-05-21 | 2016-04-29 | 신경망 프로세서에서 사용하기 위한 가중치들의 프리페칭 |
| KR1020207011552A Active KR102413522B1 (ko) | 2015-05-21 | 2016-04-29 | 신경망 프로세서에서 사용하기 위한 가중치들의 프리페칭 |
| KR1020247005904A Active KR102774226B1 (ko) | 2015-05-21 | 2016-04-29 | 신경망 프로세서에서 사용하기 위한 가중치들의 프리페칭 |
Family Applications Before (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020177028188A Active KR102105128B1 (ko) | 2015-05-21 | 2016-04-29 | 신경망 프로세서에서 사용하기 위한 가중치들의 프리페칭 |
| KR1020227021145A Active KR102641283B1 (ko) | 2015-05-21 | 2016-04-29 | 신경망 프로세서에서 사용하기 위한 가중치들의 프리페칭 |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020247005904A Active KR102774226B1 (ko) | 2015-05-21 | 2016-04-29 | 신경망 프로세서에서 사용하기 위한 가중치들의 프리페칭 |
Country Status (10)
| Country | Link |
|---|---|
| US (6) | US10049322B2 (ko) |
| EP (2) | EP3968232A1 (ko) |
| JP (5) | JP6689878B2 (ko) |
| KR (4) | KR102105128B1 (ko) |
| CN (2) | CN107454966B (ko) |
| DE (2) | DE202016107439U1 (ko) |
| DK (1) | DK3298546T3 (ko) |
| GB (2) | GB2597611B (ko) |
| TW (1) | TWI636368B (ko) |
| WO (1) | WO2016186810A1 (ko) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021246818A1 (ko) * | 2020-06-05 | 2021-12-09 | 주식회사 퓨리오사에이아이 | 뉴럴 네트워크 프로세싱 방법 및 이를 위한 장치 |
Families Citing this family (153)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10846591B2 (en) * | 2015-12-29 | 2020-11-24 | Synopsys, Inc. | Configurable and programmable multi-core architecture with a specialized instruction set for embedded application based on neural networks |
| US10360496B2 (en) * | 2016-04-01 | 2019-07-23 | Intel Corporation | Apparatus and method for a digital neuromorphic processor |
| KR102835519B1 (ko) * | 2016-09-28 | 2025-07-17 | 에스케이하이닉스 주식회사 | 합성곱 신경망의 연산 장치 및 방법 |
| IE87469B1 (en) * | 2016-10-06 | 2024-01-03 | Google Llc | Image processing neural networks with separable convolutional layers |
| US10521488B1 (en) | 2016-12-30 | 2019-12-31 | X Development Llc | Dynamic partitioning |
| EP4160449A1 (en) * | 2016-12-30 | 2023-04-05 | Intel Corporation | Deep learning hardware |
| US10146768B2 (en) * | 2017-01-25 | 2018-12-04 | Google Llc | Automatic suggested responses to images received in messages using language model |
| JP6823495B2 (ja) * | 2017-02-27 | 2021-02-03 | 株式会社日立製作所 | 情報処理装置および画像認識装置 |
| US10896367B2 (en) * | 2017-03-07 | 2021-01-19 | Google Llc | Depth concatenation using a matrix computation unit |
| US10909447B2 (en) | 2017-03-09 | 2021-02-02 | Google Llc | Transposing neural network matrices in hardware |
| US10241972B2 (en) | 2017-03-16 | 2019-03-26 | International Business Machines Corporation | Matrix multiplication on a systolic array |
| KR102414583B1 (ko) * | 2017-03-23 | 2022-06-29 | 삼성전자주식회사 | 머신 러닝을 수행하는 전자 장치 및 머신 러닝 수행 방법 |
| US10331999B2 (en) * | 2017-04-03 | 2019-06-25 | Gyrfalcon Technology Inc. | Memory subsystem in CNN based digital IC for artificial intelligence |
| US10534996B2 (en) | 2017-04-03 | 2020-01-14 | Gyrfalcon Technology Inc. | Memory subsystem in CNN based digital IC for artificial intelligence |
| US10546234B2 (en) | 2017-04-03 | 2020-01-28 | Gyrfalcon Technology Inc. | Buffer memory architecture for a CNN based processing unit and creation methods thereof |
| US10552733B2 (en) | 2017-04-03 | 2020-02-04 | Gyrfalcon Technology Inc. | Memory subsystem in CNN based digital IC for artificial intelligence |
| US10409614B2 (en) | 2017-04-24 | 2019-09-10 | Intel Corporation | Instructions having support for floating point and integer data types in the same register |
| US10824938B2 (en) | 2017-04-24 | 2020-11-03 | Intel Corporation | Specialized fixed function hardware for efficient convolution |
| US10474458B2 (en) | 2017-04-28 | 2019-11-12 | Intel Corporation | Instructions and logic to perform floating-point and integer operations for machine learning |
| TWI858883B (zh) * | 2017-05-17 | 2024-10-11 | 美商谷歌有限責任公司 | 低延遲矩陣乘法單元中之胞元、相關之方法及非暫時性電腦程式產品 |
| US10019668B1 (en) * | 2017-05-19 | 2018-07-10 | Google Llc | Scheduling neural network processing |
| US11328037B2 (en) * | 2017-07-07 | 2022-05-10 | Intel Corporation | Memory-size- and bandwidth-efficient method for feeding systolic array matrix multipliers |
| CN109284827A (zh) * | 2017-07-19 | 2019-01-29 | 阿里巴巴集团控股有限公司 | 神经网络计算方法、设备、处理器及计算机可读存储介质 |
| US11157287B2 (en) | 2017-07-24 | 2021-10-26 | Tesla, Inc. | Computational array microprocessor system with variable latency memory access |
| US11893393B2 (en) | 2017-07-24 | 2024-02-06 | Tesla, Inc. | Computational array microprocessor system with hardware arbiter managing memory requests |
| US11157441B2 (en) | 2017-07-24 | 2021-10-26 | Tesla, Inc. | Computational array microprocessor system using non-consecutive data formatting |
| US11409692B2 (en) | 2017-07-24 | 2022-08-09 | Tesla, Inc. | Vector computational unit |
| US10671349B2 (en) | 2017-07-24 | 2020-06-02 | Tesla, Inc. | Accelerated mathematical engine |
| US11243880B1 (en) | 2017-09-15 | 2022-02-08 | Groq, Inc. | Processor architecture |
| US11360934B1 (en) | 2017-09-15 | 2022-06-14 | Groq, Inc. | Tensor streaming processor architecture |
| US11114138B2 (en) | 2017-09-15 | 2021-09-07 | Groq, Inc. | Data structures with multiple read ports |
| US11868804B1 (en) | 2019-11-18 | 2024-01-09 | Groq, Inc. | Processor instruction dispatch configuration |
| US11170307B1 (en) | 2017-09-21 | 2021-11-09 | Groq, Inc. | Predictive model compiler for generating a statically scheduled binary with known resource constraints |
| WO2019057281A1 (en) * | 2017-09-21 | 2019-03-28 | Huawei Technologies Co., Ltd. | MULTI-WIRE SYSTOLIC NETWORK |
| CN107832839B (zh) * | 2017-10-31 | 2020-02-14 | 南京地平线机器人技术有限公司 | 执行卷积神经网络中的运算的方法和装置 |
| GB2568086B (en) * | 2017-11-03 | 2020-05-27 | Imagination Tech Ltd | Hardware implementation of convolution layer of deep neutral network |
| GB2570186B (en) * | 2017-11-06 | 2021-09-01 | Imagination Tech Ltd | Weight buffers |
| KR102424962B1 (ko) | 2017-11-15 | 2022-07-25 | 삼성전자주식회사 | 병렬 연산 처리를 수행하는 메모리 장치 및 이를 포함하는 메모리 모듈 |
| US10803379B2 (en) | 2017-12-12 | 2020-10-13 | Amazon Technologies, Inc. | Multi-memory on-chip computational network |
| CN107909148B (zh) * | 2017-12-12 | 2020-10-20 | 南京地平线机器人技术有限公司 | 用于执行卷积神经网络中的卷积运算的装置 |
| CN111465943B (zh) * | 2017-12-12 | 2023-10-31 | 亚马逊技术股份有限公司 | 一种集成电路和用于神经网络处理的方法 |
| CN111126588B (zh) * | 2017-12-14 | 2023-05-23 | 中科寒武纪科技股份有限公司 | 集成电路芯片装置及相关产品 |
| US11119677B2 (en) | 2017-12-15 | 2021-09-14 | Samsung Electronics Co., Ltd. | HBM based memory lookup engine for deep learning accelerator |
| KR102637735B1 (ko) | 2018-01-09 | 2024-02-19 | 삼성전자주식회사 | 근사 곱셈기를 구비하는 뉴럴 네트워크 처리 장치 및 이를 포함하는 시스템온 칩 |
| CN109416756A (zh) * | 2018-01-15 | 2019-03-01 | 深圳鲲云信息科技有限公司 | 卷积器及其所应用的人工智能处理装置 |
| CN108364063B (zh) * | 2018-01-24 | 2019-09-27 | 福州瑞芯微电子股份有限公司 | 一种基于权值分配资源的神经网络训练方法和装置 |
| US11561791B2 (en) | 2018-02-01 | 2023-01-24 | Tesla, Inc. | Vector computational unit receiving data elements in parallel from a last row of a computational array |
| CN108416434B (zh) * | 2018-02-07 | 2021-06-04 | 复旦大学 | 针对神经网络的卷积层与全连接层进行加速的电路结构 |
| US11164072B2 (en) | 2018-02-08 | 2021-11-02 | Western Digital Technologies, Inc. | Convolution engines for systolic neural network processor |
| US11769042B2 (en) | 2018-02-08 | 2023-09-26 | Western Digital Technologies, Inc. | Reconfigurable systolic neural network engine |
| DE102018202095A1 (de) * | 2018-02-12 | 2019-08-14 | Robert Bosch Gmbh | Verfahren und Vorrichtung zum Überprüfen einer Neuronenfunktion in einem neuronalen Netzwerk |
| US11468302B2 (en) | 2018-03-13 | 2022-10-11 | Recogni Inc. | Efficient convolutional engine |
| EP3738081B1 (en) * | 2018-03-22 | 2025-05-07 | Amazon Technologies Inc. | Processing for multiple input data sets |
| US11475306B2 (en) | 2018-03-22 | 2022-10-18 | Amazon Technologies, Inc. | Processing for multiple input data sets |
| CN110210610B (zh) * | 2018-03-27 | 2023-06-20 | 腾讯科技(深圳)有限公司 | 卷积计算加速器、卷积计算方法及卷积计算设备 |
| US10621489B2 (en) * | 2018-03-30 | 2020-04-14 | International Business Machines Corporation | Massively parallel neural inference computing elements |
| US11188814B2 (en) * | 2018-04-05 | 2021-11-30 | Arm Limited | Systolic convolutional neural network |
| US20190332924A1 (en) * | 2018-04-27 | 2019-10-31 | International Business Machines Corporation | Central scheduler and instruction dispatcher for a neural inference processor |
| US11537838B2 (en) | 2018-05-04 | 2022-12-27 | Apple Inc. | Scalable neural network processing engine |
| US11823376B2 (en) | 2018-05-16 | 2023-11-21 | Benevis Informatics, Llc | Systems and methods for review of computer-aided detection of pathology in images |
| CN112424796B (zh) * | 2018-06-05 | 2026-01-30 | 光子智能私营科技有限公司 | 光电计算系统 |
| US11669446B2 (en) * | 2018-06-18 | 2023-06-06 | The Trustees Of Princeton University | Configurable in memory computing engine, platform, bit cells and layouts therefore |
| US12099912B2 (en) | 2018-06-22 | 2024-09-24 | Samsung Electronics Co., Ltd. | Neural processor |
| US10839894B2 (en) | 2018-06-29 | 2020-11-17 | Taiwan Semiconductor Manufacturing Company Ltd. | Memory computation circuit and method |
| US12481861B2 (en) | 2018-07-12 | 2025-11-25 | International Business Machines Corporation | Hierarchical parallelism in a network of distributed neural network cores |
| DE102019119744B4 (de) * | 2018-07-24 | 2024-12-24 | Sandisk Technologies Llc | Konfigurierbares präzises neuronales netz mit differentieller binärer, nichtflüchtiger speicherzellenstruktur |
| CN110751276A (zh) * | 2018-07-24 | 2020-02-04 | 闪迪技术有限公司 | 在nand存储器阵列中实现具有三值输入和二值权重的神经网络 |
| US10643119B2 (en) * | 2018-07-24 | 2020-05-05 | Sandisk Technologies Llc | Differential non-volatile memory cell for artificial neural network |
| US11954573B2 (en) | 2018-09-06 | 2024-04-09 | Black Sesame Technologies Inc. | Convolutional neural network using adaptive 3D array |
| KR102816285B1 (ko) * | 2018-09-07 | 2025-06-02 | 삼성전자주식회사 | 뉴럴 프로세싱 시스템 |
| US11455370B2 (en) | 2018-11-19 | 2022-09-27 | Groq, Inc. | Flattened input stream generation for convolution with expanded kernel |
| US12340300B1 (en) | 2018-09-14 | 2025-06-24 | Groq, Inc. | Streaming processor architecture |
| CN109543140B (zh) * | 2018-09-20 | 2020-07-10 | 中国科学院计算技术研究所 | 一种卷积神经网络加速器 |
| US10817042B2 (en) * | 2018-09-27 | 2020-10-27 | Intel Corporation | Power savings for neural network architecture with zero activations during inference |
| US11443185B2 (en) * | 2018-10-11 | 2022-09-13 | Powerchip Semiconductor Manufacturing Corporation | Memory chip capable of performing artificial intelligence operation and method thereof |
| US11636325B2 (en) | 2018-10-24 | 2023-04-25 | Macronix International Co., Ltd. | In-memory data pooling for machine learning |
| KR102637733B1 (ko) | 2018-10-31 | 2024-02-19 | 삼성전자주식회사 | 뉴럴 네트워크 프로세서 및 그것의 컨볼루션 연산 방법 |
| JP7315317B2 (ja) * | 2018-11-09 | 2023-07-26 | 株式会社Preferred Networks | プロセッサおよびプロセッサのデータ転送方法 |
| US11562229B2 (en) * | 2018-11-30 | 2023-01-24 | Macronix International Co., Ltd. | Convolution accelerator using in-memory computation |
| CN111291874B (zh) * | 2018-12-06 | 2023-12-01 | 神盾股份有限公司 | 卷积神经网络处理器及其数据处理方法 |
| US11494645B2 (en) | 2018-12-06 | 2022-11-08 | Egis Technology Inc. | Convolutional neural network processor and data processing method thereof |
| US20200183837A1 (en) * | 2018-12-07 | 2020-06-11 | Samsung Electronics Co., Ltd. | Dataflow accelerator architecture for general matrix-matrix multiplication and tensor computation in deep learning |
| US11934480B2 (en) | 2018-12-18 | 2024-03-19 | Macronix International Co., Ltd. | NAND block architecture for in-memory multiply-and-accumulate operations |
| US11734556B2 (en) | 2019-01-14 | 2023-08-22 | Lightelligence PTE. Ltd. | Optoelectronic computing systems |
| US11500442B2 (en) * | 2019-01-18 | 2022-11-15 | Silicon Storage Technology, Inc. | System for converting neuron current into neuron current-based time pulses in an analog neural memory in a deep learning artificial neural network |
| CN109933371A (zh) * | 2019-02-01 | 2019-06-25 | 京微齐力(北京)科技有限公司 | 其单元可访问本地存储器的人工智能模块和系统芯片 |
| CN109902064A (zh) * | 2019-02-01 | 2019-06-18 | 京微齐力(北京)科技有限公司 | 一种二维脉动阵列的芯片电路 |
| CN109919321A (zh) * | 2019-02-01 | 2019-06-21 | 京微齐力(北京)科技有限公司 | 单元具有本地累加功能的人工智能模块及系统芯片 |
| CN109857024B (zh) * | 2019-02-01 | 2021-11-12 | 京微齐力(北京)科技有限公司 | 人工智能模块的单元性能测试方法和系统芯片 |
| US11544525B2 (en) | 2019-02-04 | 2023-01-03 | Sateesh Kumar Addepalli | Systems and methods for artificial intelligence with a flexible hardware processing framework |
| US11150720B2 (en) | 2019-02-04 | 2021-10-19 | Sateesh Kumar Addepalli | Systems and methods for power management of hardware utilizing virtual multilane architecture |
| US11507662B2 (en) | 2019-02-04 | 2022-11-22 | Sateesh Kumar Addepalli | Systems and methods of security for trusted artificial intelligence hardware processing |
| US20200249996A1 (en) * | 2019-02-04 | 2020-08-06 | Pathtronic Inc. | Systems and methods for artificial intelligence hardware processing |
| US11423454B2 (en) | 2019-02-15 | 2022-08-23 | Sateesh Kumar Addepalli | Real-time customizable AI model collaboration and marketplace service over a trusted AI model network |
| JP7297468B2 (ja) | 2019-02-28 | 2023-06-26 | キヤノン株式会社 | データ処理装置及びその方法 |
| KR102792986B1 (ko) * | 2019-03-07 | 2025-04-11 | 에스케이하이닉스 주식회사 | 시스톨릭 어레이 및 프로세싱 시스템 |
| WO2020190807A1 (en) | 2019-03-15 | 2020-09-24 | Intel Corporation | Systolic disaggregation within a matrix accelerator architecture |
| US12182035B2 (en) | 2019-03-15 | 2024-12-31 | Intel Corporation | Systems and methods for cache optimization |
| PL3938914T3 (pl) | 2019-03-15 | 2025-03-31 | Intel Corporation | Dynamiczna rekonfiguracja pamięci |
| US11783176B2 (en) | 2019-03-25 | 2023-10-10 | Western Digital Technologies, Inc. | Enhanced storage device memory architecture for machine learning |
| US10929058B2 (en) | 2019-03-25 | 2021-02-23 | Western Digital Technologies, Inc. | Enhanced memory device architecture for machine learning |
| US11671111B2 (en) | 2019-04-17 | 2023-06-06 | Samsung Electronics Co., Ltd. | Hardware channel-parallel data compression/decompression |
| US11880760B2 (en) | 2019-05-01 | 2024-01-23 | Samsung Electronics Co., Ltd. | Mixed-precision NPU tile with depth-wise convolution |
| US12182577B2 (en) | 2019-05-01 | 2024-12-31 | Samsung Electronics Co., Ltd. | Neural-processing unit tile for shuffling queued nibbles for multiplication with non-zero weight nibbles |
| CN111985628B (zh) * | 2019-05-24 | 2024-04-30 | 澜起科技股份有限公司 | 计算装置及包括所述计算装置的神经网络处理器 |
| KR102351087B1 (ko) | 2019-06-04 | 2022-01-14 | 주식회사 딥엑스 | 인공신경망의 데이터 로컬리티 기반의 데이터 캐슁을 이용하여 고속의 인공신경망 오퍼레이션을 지원하는 데이터 관리 장치 |
| TWI698810B (zh) * | 2019-06-14 | 2020-07-11 | 旺宏電子股份有限公司 | 類神經計算裝置 |
| US11514300B2 (en) | 2019-06-14 | 2022-11-29 | Macronix International Co., Ltd. | Resistor circuit, artificial intelligence chip and method for manufacturing the same |
| US11233049B2 (en) | 2019-06-14 | 2022-01-25 | Macronix International Co., Ltd. | Neuromorphic computing device |
| CN110210615B (zh) * | 2019-07-08 | 2024-05-28 | 中昊芯英(杭州)科技有限公司 | 一种用于执行神经网络计算的脉动阵列系统 |
| CN110543934B (zh) * | 2019-08-14 | 2022-02-01 | 北京航空航天大学 | 一种用于卷积神经网络的脉动阵列计算结构及方法 |
| KR102670905B1 (ko) * | 2019-08-22 | 2024-05-31 | 구글 엘엘씨 | 전파 지연 감소 |
| US11501145B1 (en) * | 2019-09-17 | 2022-11-15 | Amazon Technologies, Inc. | Memory operation for systolic array |
| US11842169B1 (en) | 2019-09-25 | 2023-12-12 | Amazon Technologies, Inc. | Systolic multiply delayed accumulate processor architecture |
| US11861761B2 (en) | 2019-11-15 | 2024-01-02 | Intel Corporation | Graphics processing unit processing and caching improvements |
| US11663746B2 (en) | 2019-11-15 | 2023-05-30 | Intel Corporation | Systolic arithmetic on sparse data |
| WO2021108559A1 (en) * | 2019-11-26 | 2021-06-03 | Groq, Inc. | Loading operands and outputting results from a multi-dimensional array using only a single side |
| KR102817185B1 (ko) | 2019-11-27 | 2025-06-09 | 한국전자통신연구원 | 선인출 정보를 이용한 메모리 제어 방법 및 장치 |
| US11467806B2 (en) | 2019-11-27 | 2022-10-11 | Amazon Technologies, Inc. | Systolic array including fused multiply accumulate with efficient prenormalization and extended dynamic range |
| US11816446B2 (en) | 2019-11-27 | 2023-11-14 | Amazon Technologies, Inc. | Systolic array component combining multiple integer and floating-point data types |
| US12112141B2 (en) | 2019-12-12 | 2024-10-08 | Samsung Electronics Co., Ltd. | Accelerating 2D convolutional layer mapping on a dot product architecture |
| US11586889B1 (en) * | 2019-12-13 | 2023-02-21 | Amazon Technologies, Inc. | Sensory perception accelerator |
| WO2021125496A1 (ko) | 2019-12-16 | 2021-06-24 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
| US11669733B2 (en) | 2019-12-23 | 2023-06-06 | Marvell Asia Pte. Ltd. | Processing unit and method for computing a convolution using a hardware-implemented spiral algorithm |
| TWI733334B (zh) * | 2020-02-15 | 2021-07-11 | 財團法人工業技術研究院 | 卷積神經網路運算裝置及其運算的方法 |
| KR102836069B1 (ko) * | 2020-02-18 | 2025-07-18 | 에스케이하이닉스 주식회사 | 연산 회로 및 그것을 포함하는 딥 러닝 시스템 |
| US12073310B2 (en) * | 2020-04-01 | 2024-08-27 | Microsoft Technology Licensing, Llc | Deep neural network accelerator with independent datapaths for simultaneous processing of different classes of operations |
| CN113496117B (zh) * | 2020-04-02 | 2024-03-12 | 北京庖丁科技有限公司 | 交叉检查表格中单元格数字内容的方法和电子设备 |
| US11507817B2 (en) | 2020-04-17 | 2022-11-22 | Samsung Electronics Co., Ltd. | System and method for performing computations for deep neural networks |
| JP7537213B2 (ja) | 2020-09-30 | 2024-08-21 | セイコーエプソン株式会社 | 情報処理装置、演算方法、及び、コンピュータープログラム |
| US11422773B1 (en) | 2020-06-29 | 2022-08-23 | Amazon Technologies, Inc. | Multiple busses within a systolic array processing element |
| US11308027B1 (en) | 2020-06-29 | 2022-04-19 | Amazon Technologies, Inc. | Multiple accumulate busses in a systolic array |
| CN111737193B (zh) * | 2020-08-03 | 2020-12-08 | 深圳鲲云信息科技有限公司 | 数据存储方法、装置、设备和存储介质 |
| US12008469B1 (en) | 2020-09-01 | 2024-06-11 | Amazon Technologies, Inc. | Acceleration of neural networks with stacks of convolutional layers |
| US12205013B1 (en) | 2020-09-01 | 2025-01-21 | Amazon Technologies, Inc. | Accelerated convolution of neural networks |
| CN112580787B (zh) * | 2020-12-25 | 2023-11-17 | 北京百度网讯科技有限公司 | 神经网络加速器的数据处理方法、装置、设备及存储介质 |
| US12608587B2 (en) * | 2021-01-07 | 2026-04-21 | Mobileye Vision Technologies Ltd. | Neural network processor |
| TWI788128B (zh) * | 2021-04-16 | 2022-12-21 | 旺宏電子股份有限公司 | 記憶體裝置及其操作方法 |
| TWI847030B (zh) | 2021-05-05 | 2024-07-01 | 創鑫智慧股份有限公司 | 矩陣乘法器及其操作方法 |
| US12423058B2 (en) | 2021-06-30 | 2025-09-23 | Amazon Technologies, Inc. | Systolic array with input reduction to multiple reduced inputs |
| US11880682B2 (en) | 2021-06-30 | 2024-01-23 | Amazon Technologies, Inc. | Systolic array with efficient input reduction and extended array performance |
| US12197890B2 (en) * | 2021-07-16 | 2025-01-14 | Google Llc | Multiplier and adder in systolic array |
| US12299597B2 (en) | 2021-08-27 | 2025-05-13 | Macronix International Co., Ltd. | Reconfigurable AI system |
| US12517700B1 (en) | 2022-03-30 | 2026-01-06 | Amazon Technologies, Inc. | Systolic array with output rounding for multiple source/destination data type pairs |
| KR102866739B1 (ko) * | 2022-10-14 | 2025-09-30 | 주식회사 딥엑스 | 쌍선형 보간법을 연산할 수 있는 신경 프로세싱 유닛 |
| US12591431B2 (en) | 2022-12-15 | 2026-03-31 | Electronics And Telecommunications Research Institute | Artificial intelligence processing apparatus, and data prefetching device and method for artificial intelligence processor |
| US12536404B2 (en) | 2023-02-22 | 2026-01-27 | Macronix International Co., Ltd. | Data optimization for high bandwidth (HBW) NVM AI inference system |
| US12321603B2 (en) | 2023-02-22 | 2025-06-03 | Macronix International Co., Ltd. | High bandwidth non-volatile memory for AI inference system |
| US12585931B2 (en) * | 2023-05-04 | 2026-03-24 | Macronix International Co., Ltd. | 3D hybrid bonding 3D memory devices with NPU/CPU for AI inference application |
| US12417170B2 (en) | 2023-05-10 | 2025-09-16 | Macronix International Co., Ltd. | Computing system and method of operation thereof |
| KR102717245B1 (ko) * | 2023-06-23 | 2024-10-15 | 오픈엣지테크놀로지 주식회사 | 신경망 액티베이션의 채널별 크기를 증가시키고 채널의 총 개수를 감소시키는 액티베이션 변환방법, 및 이를 위한 하드웨어 가속장치와 컴퓨팅 장치 |
| CN119358606B (zh) * | 2024-09-25 | 2025-11-04 | 鹏城实验室 | 脉冲神经网络权重梯度计算方法及相关设备 |
| DE102024210285A1 (de) | 2024-10-24 | 2026-04-30 | Robert Bosch Gesellschaft mit beschränkter Haftung | Verfahren und Vorrichtung zur Speicherplanung für eine Code-Generierung für einen Programmcode zur Berechnung eines künstlichen neuronalen Netzes in einer Hardwareumgebung |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0422348A2 (en) * | 1989-10-10 | 1991-04-17 | Hnc, Inc. | Two-dimensional systolic array for neural networks, and method |
| JPH07141454A (ja) * | 1993-11-18 | 1995-06-02 | G D S:Kk | シストリックアレイプロセサー |
| KR100189195B1 (ko) * | 1996-04-04 | 1999-06-01 | 박래홍 | 단일화된 시스톨릭어레이 구조에 의한 2차원 dct/dst/dht의 수행장치 |
| KR20030082255A (ko) * | 2002-04-17 | 2003-10-22 | 한국전자통신연구원 | 향상된 선형 궤환 시프트 레지스터 구조의 유한체 승산기 |
| JP2004157756A (ja) * | 2002-11-06 | 2004-06-03 | Canon Inc | 階層処理装置 |
| US20040117710A1 (en) * | 2002-12-17 | 2004-06-17 | Srinivas Patil | Weight compression/decompression system |
Family Cites Families (41)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| AU8698582A (en) | 1981-08-14 | 1983-02-17 | Rca Corp. | Digital air filter |
| JPS6028345A (ja) | 1983-07-26 | 1985-02-13 | Fujitsu Ltd | 並列計算機における通信方式 |
| JPS63293668A (ja) | 1987-05-27 | 1988-11-30 | Matsushita Electric Ind Co Ltd | 並列計算機の通信方法 |
| US5014235A (en) | 1987-12-15 | 1991-05-07 | Steven G. Morton | Convolution memory |
| US5136717A (en) | 1988-11-23 | 1992-08-04 | Flavors Technology Inc. | Realtime systolic, multiple-instruction, single-data parallel computer system |
| US5337395A (en) | 1991-04-08 | 1994-08-09 | International Business Machines Corporation | SPIN: a sequential pipeline neurocomputer |
| US5146543A (en) | 1990-05-22 | 1992-09-08 | International Business Machines Corp. | Scalable neural array processor |
| US5274832A (en) * | 1990-10-04 | 1993-12-28 | National Semiconductor Corporation | Systolic array for multidimensional matrix computations |
| JP2760170B2 (ja) | 1990-11-29 | 1998-05-28 | 松下電器産業株式会社 | 学習機械 |
| JP2749725B2 (ja) | 1991-03-18 | 1998-05-13 | 富士通株式会社 | 並列計算機の通信方法 |
| JPH04290155A (ja) | 1991-03-19 | 1992-10-14 | Fujitsu Ltd | 並列データ処理方式 |
| US5903454A (en) | 1991-12-23 | 1999-05-11 | Hoffberg; Linda Irene | Human-factored interface corporating adaptive pattern recognition based controller apparatus |
| JPH05346914A (ja) | 1992-06-16 | 1993-12-27 | Matsushita Electron Corp | ニューロプロセッサ |
| US5465041A (en) | 1993-09-17 | 1995-11-07 | Penberthy, Inc. | Bipolar tracking current source/sink with ground clamp |
| DE4414821A1 (de) | 1994-04-28 | 1995-11-02 | Vorwerk Co Interholding | Küchenmaschine mit einem Rührgefäß und einem Antrieb für ein Rührwerk in dem Rührgefäß |
| US5583964A (en) * | 1994-05-02 | 1996-12-10 | Motorola, Inc. | Computer utilizing neural network and method of using same |
| US5799134A (en) | 1995-03-13 | 1998-08-25 | Industrial Technology Research Institute | One dimensional systolic array architecture for neural network |
| US5812993A (en) | 1996-03-07 | 1998-09-22 | Technion Research And Development Foundation Ltd. | Digital hardware architecture for realizing neural network |
| US6038337A (en) | 1996-03-29 | 2000-03-14 | Nec Research Institute, Inc. | Method and apparatus for object recognition |
| JPH11177399A (ja) * | 1997-12-15 | 1999-07-02 | Mitsubishi Electric Corp | クロック遅延回路およびこれを用いた発振回路、位相同期回路、クロック生成回路 |
| GB9902115D0 (en) | 1999-02-01 | 1999-03-24 | Axeon Limited | Neural networks |
| FR2853424B1 (fr) * | 2003-04-04 | 2005-10-21 | Atmel Corp | Architecture de multiplicateurs polynomial et naturel combines |
| US7245767B2 (en) | 2003-08-21 | 2007-07-17 | Hewlett-Packard Development Company, L.P. | Method and apparatus for object identification, classification or verification |
| US7634137B2 (en) | 2005-10-14 | 2009-12-15 | Microsoft Corporation | Unfolded convolution for fast feature extraction |
| WO2008067676A1 (en) | 2006-12-08 | 2008-06-12 | Medhat Moussa | Architecture, system and method for artificial neural network implementation |
| US8184696B1 (en) | 2007-09-11 | 2012-05-22 | Xilinx, Inc. | Method and apparatus for an adaptive systolic array structure |
| TW200923803A (en) | 2007-11-26 | 2009-06-01 | Univ Nat Taipei Technology | Hardware neural network learning and recall architecture |
| TWI417798B (zh) | 2008-11-21 | 2013-12-01 | Nat Taipei University Oftechnology | High - speed reverse transfer neural network system with elastic structure and learning function |
| JP5376920B2 (ja) | 2008-12-04 | 2013-12-25 | キヤノン株式会社 | コンボリューション演算回路、階層的コンボリューション演算回路及び物体認識装置 |
| US8442927B2 (en) | 2009-07-30 | 2013-05-14 | Nec Laboratories America, Inc. | Dynamically configurable, multi-ported co-processor for convolutional neural networks |
| US9141386B2 (en) * | 2010-09-24 | 2015-09-22 | Intel Corporation | Vector logical reduction operation implemented using swizzling on a semiconductor chip |
| TWI525558B (zh) | 2011-01-17 | 2016-03-11 | Univ Nat Taipei Technology | Resilient high - speed hardware reverse transfer and feedback type neural network system |
| US8924455B1 (en) | 2011-02-25 | 2014-12-30 | Xilinx, Inc. | Multiplication of matrices using systolic arrays |
| US9111222B2 (en) * | 2011-11-09 | 2015-08-18 | Qualcomm Incorporated | Method and apparatus for switching the binary state of a location in memory in a probabilistic manner to store synaptic weights of a neural network |
| TW201331855A (zh) | 2012-01-19 | 2013-08-01 | Univ Nat Taipei Technology | 具自由回饋節點的高速硬體倒傳遞及回饋型類神經網路 |
| US9477925B2 (en) | 2012-11-20 | 2016-10-25 | Microsoft Technology Licensing, Llc | Deep neural networks training for speech and pattern recognition |
| US9811775B2 (en) | 2012-12-24 | 2017-11-07 | Google Inc. | Parallelizing neural networks during training |
| US9190053B2 (en) | 2013-03-25 | 2015-11-17 | The Governing Council Of The Univeristy Of Toronto | System and method for applying a convolutional neural network to speech recognition |
| CN104035751B (zh) | 2014-06-20 | 2016-10-12 | 深圳市腾讯计算机系统有限公司 | 基于多图形处理器的数据并行处理方法及装置 |
| EP3064130A1 (en) | 2015-03-02 | 2016-09-07 | MindMaze SA | Brain activity measurement and feedback system |
| US20160267111A1 (en) | 2015-03-11 | 2016-09-15 | Microsoft Technology Licensing, Llc | Two-stage vector reduction using two-dimensional and one-dimensional systolic arrays |
-
2015
- 2015-09-03 US US14/844,670 patent/US10049322B2/en active Active
-
2016
- 2016-04-29 WO PCT/US2016/029965 patent/WO2016186810A1/en not_active Ceased
- 2016-04-29 CN CN201680020202.XA patent/CN107454966B/zh active Active
- 2016-04-29 EP EP21205423.3A patent/EP3968232A1/en active Pending
- 2016-04-29 KR KR1020177028188A patent/KR102105128B1/ko active Active
- 2016-04-29 GB GB2112401.1A patent/GB2597611B/en active Active
- 2016-04-29 KR KR1020227021145A patent/KR102641283B1/ko active Active
- 2016-04-29 EP EP16725266.7A patent/EP3298546B1/en active Active
- 2016-04-29 KR KR1020207011552A patent/KR102413522B1/ko active Active
- 2016-04-29 DK DK16725266.7T patent/DK3298546T3/da active
- 2016-04-29 DE DE202016107439.8U patent/DE202016107439U1/de not_active Expired - Lifetime
- 2016-04-29 KR KR1020247005904A patent/KR102774226B1/ko active Active
- 2016-04-29 GB GB1715437.8A patent/GB2553052B/en active Active
- 2016-04-29 JP JP2017550913A patent/JP6689878B2/ja active Active
- 2016-04-29 CN CN202011278833.6A patent/CN112465132B/zh active Active
- 2016-04-29 DE DE112016002298.0T patent/DE112016002298T5/de not_active Ceased
- 2016-05-20 TW TW105115866A patent/TWI636368B/zh active
- 2016-12-22 US US15/389,273 patent/US9805304B2/en active Active
-
2018
- 2018-08-02 US US16/053,305 patent/US11281966B2/en active Active
-
2020
- 2020-03-23 US US16/826,466 patent/US10878316B2/en active Active
- 2020-04-08 JP JP2020069854A patent/JP6953577B2/ja active Active
- 2020-12-28 US US17/134,936 patent/US11853865B2/en active Active
-
2021
- 2021-09-29 JP JP2021159352A patent/JP7071577B2/ja active Active
-
2022
- 2022-05-06 JP JP2022076581A patent/JP7383757B2/ja active Active
-
2023
- 2023-11-01 US US18/386,037 patent/US20240062055A1/en active Pending
- 2023-11-08 JP JP2023190654A patent/JP7710018B2/ja active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0422348A2 (en) * | 1989-10-10 | 1991-04-17 | Hnc, Inc. | Two-dimensional systolic array for neural networks, and method |
| JPH07141454A (ja) * | 1993-11-18 | 1995-06-02 | G D S:Kk | シストリックアレイプロセサー |
| KR100189195B1 (ko) * | 1996-04-04 | 1999-06-01 | 박래홍 | 단일화된 시스톨릭어레이 구조에 의한 2차원 dct/dst/dht의 수행장치 |
| KR20030082255A (ko) * | 2002-04-17 | 2003-10-22 | 한국전자통신연구원 | 향상된 선형 궤환 시프트 레지스터 구조의 유한체 승산기 |
| JP2004157756A (ja) * | 2002-11-06 | 2004-06-03 | Canon Inc | 階層処理装置 |
| US20040117710A1 (en) * | 2002-12-17 | 2004-06-17 | Srinivas Patil | Weight compression/decompression system |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021246818A1 (ko) * | 2020-06-05 | 2021-12-09 | 주식회사 퓨리오사에이아이 | 뉴럴 네트워크 프로세싱 방법 및 이를 위한 장치 |
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102105128B1 (ko) | 신경망 프로세서에서 사용하기 위한 가중치들의 프리페칭 | |
| US11361051B1 (en) | Dynamic partitioning | |
| KR102127524B1 (ko) | 신경망 프로세서의 벡터 컴퓨테이션 유닛 | |
| KR102106144B1 (ko) | 신경망 프로세서에서의 배치 프로세싱 | |
| TWI851499B (zh) | 用於執行類神經網路計算之電路、方法及非暫時性機器可讀儲存裝置 | |
| HK40070899A (en) | Prefetching weights for use in a neural network processor |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A107 | Divisional application of patent | ||
| PA0104 | Divisional application for international application |
Comment text: Divisional Application for International Patent Patent event code: PA01041R01D Patent event date: 20200421 Application number text: 1020177028188 Filing date: 20170929 |
|
| PG1501 | Laying open of application | ||
| A201 | Request for examination | ||
| AMND | Amendment | ||
| PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20210311 Comment text: Request for Examination of Application |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210609 Patent event code: PE09021S01D |
|
| AMND | Amendment | ||
| E601 | Decision to refuse application | ||
| PE0601 | Decision on rejection of patent |
Patent event date: 20211224 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20210609 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |
|
| X091 | Application refused [patent] | ||
| AMND | Amendment | ||
| PX0901 | Re-examination |
Patent event code: PX09011S01I Patent event date: 20211224 Comment text: Decision to Refuse Application Patent event code: PX09012R01I Patent event date: 20210714 Comment text: Amendment to Specification, etc. Patent event code: PX09012R01I Patent event date: 20210311 Comment text: Amendment to Specification, etc. |
|
| PX0701 | Decision of registration after re-examination |
Patent event date: 20220322 Comment text: Decision to Grant Registration Patent event code: PX07013S01D Patent event date: 20220225 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I Patent event date: 20211224 Comment text: Decision to Refuse Application Patent event code: PX07011S01I Patent event date: 20210714 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I Patent event date: 20210311 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I |
|
| X701 | Decision to grant (after re-examination) | ||
| A107 | Divisional application of patent | ||
| PA0104 | Divisional application for international application |
Comment text: Divisional Application for International Patent Patent event code: PA01041R01D Patent event date: 20220621 Application number text: 1020177028188 Filing date: 20170929 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20220622 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20220622 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration |