KR20200094056A - 컨벌루션 신경망 파라미터 최적화 방법, 컨벌루션 신경망 연산방법 및 그 장치 - Google Patents
컨벌루션 신경망 파라미터 최적화 방법, 컨벌루션 신경망 연산방법 및 그 장치 Download PDFInfo
- Publication number
- KR20200094056A KR20200094056A KR1020190058453A KR20190058453A KR20200094056A KR 20200094056 A KR20200094056 A KR 20200094056A KR 1020190058453 A KR1020190058453 A KR 1020190058453A KR 20190058453 A KR20190058453 A KR 20190058453A KR 20200094056 A KR20200094056 A KR 20200094056A
- Authority
- KR
- South Korea
- Prior art keywords
- parameter
- neural network
- size
- value
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0495—Quantised networks; Sparse networks; Compressed networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Neurology (AREA)
- Complex Calculations (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Feedback Control In General (AREA)
Abstract
따라서, 본 발명은, 컨볼루션 신경망이 가지는 많은 연산량과 파라미터를 하드웨어 구현에 효과적으로 최적화시켜 최소한의 정확도 손실 및 최대한의 연산속도를 얻을 수 있는 신경망 파라미터 최적화 방법, 신경망 연산방법 및 그 장치를 제공하는 효과가 있다.
Description
도 2는 본 발명의 일 실시 예에 따른 컨볼루션 신경망(Convolution Neural Network: CNN)에서 최적화 파라미터 생성을 위한 학습 프로세스를 도시한 도면,
도 3은 본 발명의 일 실시 예에 따른 도 2의 최적화 파라미터 생성을 위한 학습 프로세스를 세부화하여 도시한 도면,
도 4는 본 발명의 일 실시 예에 따른 추론 프로세스를 세부화하여 도시한 도면,
도 5는 본 발명의 일 실시 예에 따른 컨볼루션 파라미터 최적화 프로세스의 적용 예를 보여주는 도면,
도 6은 일반적인 컨볼루션 연산과 본 발명의 일 실시 예에 따른 컨볼루션 연산을 비교한 도면,
도 7은 본 발명의 일 실시 예에 따른 파라미터 최적화 이후 컨볼루션 연산의 이점을 보여주는 도면,
도 8은 본 발명의 다른 실시 예에 따른 컨볼루션 파라미터 최적화 프로세스의 적용 예를 보여주는 도면,
도 9는 비율 파라미터 최적화를 설명하기 위해 크기 파라미터만을 적용한 파라미터 분포와 비율 파라미터를 추가 적용한 파라미터 분포를 비교한 도면,
도 10은 본 발명의 일 실시 예에 따른 최적화된 파라미터를 이용한 컨볼루션 연산의 예를 도시한 도면,
도 11은 본 발명의 일 실시 예에 따른 신경망 연산장치의 구성을 도시한 도면,
도 12는 본 발명의 일 실시 예에 따른 도 11의 파라미터 최적화부의 세부 구성을 도시한 도면이다.
12 : 프로세서
14 : 메모리
16 : 출력부
120 : 파라미터 최적화부
122 : 추론부
124 : 보정부
126 : 업데이트부
1200 : 크기 파라미터 변환부
1202 : 부호 파라미터 변환부
1204 : 파라미터 가지치기부
1206 : 비율 파라미터 변환부
Claims (18)
- 파라미터 최적화부를 구성하는 부호 파라미터 변환부와 크기 파라미터 변환부를 이용해 신경망의 기존 파라미터를 부호 파라미터 및 채널 당 단일의 값을 가지는 크기 파라미터로 형태 변환하는 단계; 및
파라미터 최적화부를 구성하는 파라미터 가지치기부를 이용해 상기 형태 변환된 크기 파라미터를 가지치기하여 최적화된 파라미터를 생성하는 단계;를 포함하는 것을 특징으로 하는 신경망 파라미터 최적화 방법.
- 제 1 항에 있어서,
상기 부호 파라미터는 기존 파라미터의 채널 별 원소들의 방향을 결정하고,
상기 크기 파라미터는 기존 파라미터의 채널 당 단일의 대표 값으로 가중치들을 최적화한 것을 특징으로 하는 신경망 파라미터 최적화 방법.
- 제 1 항에 있어서, 상기 형태 변환하는 단계는,
기존 파라미터의 채널 별 원소들의 절대값의 평균을 연산하여 크기 파라미터를 생성하는 것을 특징으로 하는 신경망 파라미터 최적화 방법.
- 제 1 항에 있어서, 상기 형태 변환하는 단계는,
기존 파라미터의 채널을 구성하는 소정의 원소가 0보다 작으면 대응하는 부호 파라미터의 원소 값을 0으로, 0보다 크거나 같으면 대응하는 부호 파라미터의 원소 값을 1로 표현하여 부호 파라미터를 생성하는 것을 특징으로 하는 신경망 파라미터 최적화 방법.
- 제 1 항에 있어서, 상기 가지치기하는 단계는,
입력채널 별 크기 파라미터의 평균 값 및 크기 분포 또는 입력 및 출력채널 별 크기 파라미터의 평균 값 및 크기 분포를 이용하여 기준 값을 계산하고, 계산된 기준 값보다 적은 값을 가진 크기 파라미터 값을 0으로 만들어 해당 채널의 컨볼루션 연산을 생략하도록 하는 것을 특징으로 하는 신경망 파라미터 최적화 방법.
- 제 1 항에 있어서, 상기 신경망 파라미터 최적화 방법은,
파라미터 최적화부를 구성하는 비율 파라미터 변환부를 이용해 신경망의 기존 파라미터를 비율 파라미터로 형태 변환하는 단계;
를 더 포함하는 것을 특징으로 하는 신경망 파라미터 최적화 방법.
- 제 6 항에 있어서, 상기 비율 파라미터로 형태 변환하는 단계는,
비율 파라미터의 비트를 가변적으로 할당하는 단계; 및
비율 파라미터 원소의 값의 범위 및 가중치를 사용자 선택에 의해 양자화되는 단계;
를 포함하는 것을 특징으로 하는 신경망 파라미터 최적화 방법.
- 신경망 연산장치를 구성하는 프로세서를 이용해 신경망의 기존 파라미터 및 입력채널 데이터를 메모리에 로드하는 단계;
상기 프로세서에 포함되는 파라미터 최적화부를 구성하는 부호 파라미터 변환부 및 크기 파라미터 변환부를 이용해 신경망의 기존 파라미터를 부호 파라미터 및 채널 당 단일의 값을 가지는 크기 파라미터로 형태 변환하고, 상기 파라미터 최적화부를 구성하는 파라미터 가지치기부를 이용해 상기 형태 변환된 크기 파라미터를 가지치기하여 최적화된 파라미터를 생성하는 단계;
상기 프로세서에 포함되는 추론부를 이용해 상기 최적화된 파라미터 및 입력채널 데이터를 컨볼루션 연산하여 추론하는 단계;
상기 프로세서에 포함되는 보정부를 이용해 상기 최적화된 파라미터를 보정하는 단계; 및
상기 프로세서에 포함되는 업데이트부를 이용해 기존 파라미터를 보정된 최적화 파라미터로 업데이트하는 단계;
를 포함하는 것을 특징으로 하는 신경망 연산방법.
- 제 8 항에 있어서, 상기 신경망 연산방법은,
학습된 파라미터가 존재하는지 판단하는 단계;
상기 학습된 파라미터가 없으면 파라미터 초기화를 통해 초기 파라미터를 생성하는 단계;
초기 파라미터를 대상으로 최적화된 파라미터를 생성하는 단계; 및
상기 학습된 파라미터가 있으면 기존 파라미터를 로드하는 단계;
를 더 포함하는 것을 특징으로 하는 신경망 연산방법.
- 제 8 항에 있어서, 상기 추론부를 이용해 최적화된 파라미터 및 입력채널 데이터를 컨볼루션 연산하여 추론하는 단계는,
상기 최적화된 파라미터를 메모리에 로드하는 단계;
상기 로드된 최적화된 파라미터에 포함되는 크기 파라미터의 값이 0인지 판단하는 단계; 및
상기 크기 파라미터의 값이 0이면 컨볼루션 연산 과정을 생략하는 단계;
를 포함하는 것을 특징으로 하는 신경망 연산방법.
- 제 8 항에 있어서, 상기 추론부를 이용해 최적화된 파라미터 및 입력채널 데이터를 컨볼루션 연산하여 추론하는 단계는,
상기 크기 파라미터의 값이 0이 아니면 부호 파라미터와 입력채널 데이터를 비트 연산하여 데이터의 방향을 결정하는 단계;
컨볼루션 파라미터 필터 크기만큼 입력채널 데이터 간 합 연산하는 단계; 및
상기 크기 파라미터와 입력채널 데이터를 대상으로 단일의 곱 연산을 수행하는 단계;
를 포함하는 것을 특징으로 하는 신경망 연산방법.
- 제 10 항에 있어서, 상기 최적화된 파라미터 및 입력채널 데이터를 컨볼루션 연산하여 추론하는 단계는,
비율 파라미터가 존재하면 비율 파라미터를 이용하여 크기 파라미터에 가중치를 차등 반영함에 따라 연산결과의 오차를 줄이는 단계;
를 더 포함하는 것을 특징으로 하는 신경망 연산방법.
- 기존 파라미터를 부호 파라미터로 형태 변환하는 부호 파라미터 변환부;
상기 기존 파라미터를 채널 당 단일의 값을 가지는 크기 파라미터로 형태 변환하는 크기 파라미터 변환부; 및
상기 형태 변환된 크기 파라미터를 가지치기하여 최적화된 파라미터를 생성하는 파라미터 가지치기부;
를 포함하는 것을 특징으로 하는 신경망 연산장치.
- 제 13 항에 있어서, 상기 파라미터 가지치기부는
입력채널 별 크기 파라미터의 평균 값 및 크기 분포 또는 입력 및 출력채널 별 크기 파라미터의 평균 값 및 크기 분포를 이용하여 기준 값을 계산하고, 계산된 기준 값보다 적은 값을 가진 크기 파라미터 값을 0으로 만들어 해당 채널의 컨볼루션 연산을 생략하도록 하는 것을 특징으로 하는 신경망 연산장치.
- 제 13 항에 있어서, 상기 신경망 연산장치는
기존 파라미터를 비율 파라미터로 형태 변환하는 비율 파라미터 변환부;
를 더 포함하는 것을 특징으로 하는 신경망 연산장치.
- 제 13 항에 있어서, 상기 신경망 연산장치는
최적화된 파라미터 및 입력채널 데이터를 컨볼루션 연산하여 추론하는 추론부;
를 더 포함하는 것을 특징으로 하는 신경망 연산장치.
- 제 16 항에 있어서, 상기 추론부는
최적화 파라미터에 포함된 크기 파라미터의 값이 0인지 판단하고 크기 파라미터의 값이 0이면 컨볼루션 연산 과정을 생략하는 것을 특징으로 하는 신경망 연산장치.
- 제 16 항에 있어서, 상기 추론부는
비율 파라미터가 존재하면 비율 파라미터를 이용하여 크기 파라미터에 가중치를 차등 반영함에 따라 연산결과의 오차를 줄이는 것을 특징으로 하는 신경망 연산장치.
Priority Applications (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020190058453A KR102214837B1 (ko) | 2019-01-29 | 2019-05-18 | 컨벌루션 신경망 파라미터 최적화 방법, 컨벌루션 신경망 연산방법 및 그 장치 |
| US16/626,493 US12165051B2 (en) | 2019-01-29 | 2019-07-18 | Neural network parameter optimization method and neural network computing method and apparatus suitable for hardware implementation |
| PCT/KR2019/008913 WO2020159016A1 (ko) | 2019-01-29 | 2019-07-18 | 하드웨어 구현에 적합한 신경망 파라미터 최적화 방법, 신경망 연산방법 및 그 장치 |
| CN201980007377.0A CN111758104B (zh) | 2019-01-29 | 2019-07-18 | 适合于硬件实现的神经网络参数优化方法、神经网络计算方法和装置 |
| EP19913658.1A EP3779801A4 (en) | 2019-01-29 | 2019-07-18 | APPROPRIATE NEURONAL NETWORK PARAMETER OPTIMIZATION PROCESS FOR IMPLEMENTATION ON HARDWARE, NEURONAL NETWORK OPERATION PROCESS AND ASSOCIATED APPARATUS |
| KR1020210011925A KR102247896B1 (ko) | 2019-05-18 | 2021-01-27 | 학습된 파라미터의 형태변환을 이용한 컨벌루션 신경망 파라미터 최적화 방법, 컨벌루션 신경망 연산방법 및 그 장치 |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020190011516A KR101987475B1 (ko) | 2019-01-29 | 2019-01-29 | 하드웨어 구현에 적합한 신경망 파라미터 최적화 방법, 신경망 연산방법 및 그 장치 |
| KR1020190058453A KR102214837B1 (ko) | 2019-01-29 | 2019-05-18 | 컨벌루션 신경망 파라미터 최적화 방법, 컨벌루션 신경망 연산방법 및 그 장치 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020190011516A Division KR101987475B1 (ko) | 2019-01-29 | 2019-01-29 | 하드웨어 구현에 적합한 신경망 파라미터 최적화 방법, 신경망 연산방법 및 그 장치 |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020210011925A Division KR102247896B1 (ko) | 2019-05-18 | 2021-01-27 | 학습된 파라미터의 형태변환을 이용한 컨벌루션 신경망 파라미터 최적화 방법, 컨벌루션 신경망 연산방법 및 그 장치 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| KR20200094056A true KR20200094056A (ko) | 2020-08-06 |
| KR102214837B1 KR102214837B1 (ko) | 2021-02-10 |
| KR102214837B9 KR102214837B9 (ko) | 2021-11-12 |
Family
ID=71841870
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020190058453A Active KR102214837B1 (ko) | 2019-01-29 | 2019-05-18 | 컨벌루션 신경망 파라미터 최적화 방법, 컨벌루션 신경망 연산방법 및 그 장치 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US12165051B2 (ko) |
| EP (1) | EP3779801A4 (ko) |
| KR (1) | KR102214837B1 (ko) |
| CN (1) | CN111758104B (ko) |
| WO (1) | WO2020159016A1 (ko) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20220055827A (ko) * | 2020-10-27 | 2022-05-04 | 한림대학교 산학협력단 | 인공지능 모델의 파라미터 저장을 위한 필터 조합 학습 네트워크 시스템의 제어 방법, 장치 및 프로그램 |
| KR20220073600A (ko) * | 2020-11-26 | 2022-06-03 | 주식회사 노타 | 최적 파라미터 결정 방법 및 시스템 |
| KR20220109826A (ko) * | 2021-01-29 | 2022-08-05 | 주식회사 노타 | 인공지능 추론모델을 경량화하는 방법 및 시스템 |
| KR20220116644A (ko) * | 2021-02-15 | 2022-08-23 | 에스케이플래닛 주식회사 | 가설 가지치기 방식 생산적 적대 신경망 기반 미세먼지센서의 이상을 탐지하기 위한 장치 및 이를 위한 방법 |
| KR20230001580A (ko) * | 2021-06-28 | 2023-01-05 | 한국자동차연구원 | S-파라미터 생성 장치 및 방법 |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP3471271A1 (en) * | 2017-10-16 | 2019-04-17 | Acoustical Beauty | Improved convolutions of digital signals using a bit requirement optimization of a target digital signal |
| JP7287388B2 (ja) * | 2018-05-14 | 2023-06-06 | ソニーグループ株式会社 | 情報処理装置および情報処理方法 |
| KR102214837B1 (ko) | 2019-01-29 | 2021-02-10 | 주식회사 디퍼아이 | 컨벌루션 신경망 파라미터 최적화 방법, 컨벌루션 신경망 연산방법 및 그 장치 |
| CN113065636B (zh) * | 2021-02-27 | 2024-06-07 | 华为技术有限公司 | 一种卷积神经网络的剪枝处理方法、数据处理方法及设备 |
| US12499345B2 (en) * | 2022-03-24 | 2025-12-16 | Qualcomm Incorporated | Simulated low bit-width quantization using bit shifted neural network parameters |
| US12602749B2 (en) | 2023-03-05 | 2026-04-14 | Genesys Logic, Inc. | Parameter optimizing method of neural network and computing apparatus |
| TWI855894B (zh) * | 2023-03-05 | 2024-09-11 | 創惟科技股份有限公司 | 神經網路的參數優化方法及運算裝置 |
| KR20250142112A (ko) * | 2024-03-21 | 2025-09-30 | 삼성전자주식회사 | 차동 연산 회로 및 그것을 포함하는 메모리 장치, 그리고 메모리 장치의 동작 방법 |
| KR102953722B1 (ko) * | 2024-12-20 | 2026-04-15 | 오재호 | 진동 데이터 기반의 기계 설비의 고장을 판단하기 위한 장치 및 이를 위한 방법 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20110027916A (ko) | 2009-09-11 | 2011-03-17 | 연세대학교 산학협력단 | 퍼셉트론 인공신경망의 가중치 부여 장치와 이를 이용한 탐지 장치, 탐지 시스템 및 탐지 방법 |
| KR20160143505A (ko) * | 2015-06-04 | 2016-12-14 | 삼성전자주식회사 | 신경망의 연산량을 줄이는 방법 및 시스템 |
| KR20170128080A (ko) * | 2016-05-13 | 2017-11-22 | 삼성전자주식회사 | 신경 네트워크를 구현하는 방법 및 장치 |
| US20180046900A1 (en) * | 2016-08-11 | 2018-02-15 | Nvidia Corporation | Sparse convolutional neural network accelerator |
Family Cites Families (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11244225B2 (en) * | 2015-07-10 | 2022-02-08 | Samsung Electronics Co., Ltd. | Neural network processor configurable using macro instructions |
| US10831444B2 (en) * | 2016-04-04 | 2020-11-10 | Technion Research & Development Foundation Limited | Quantized neural network training and inference |
| WO2017189859A1 (en) * | 2016-04-27 | 2017-11-02 | Neurala, Inc. | Methods and apparatus for pruning experience memories for deep neural network-based q-learning |
| US20180082181A1 (en) * | 2016-05-13 | 2018-03-22 | Samsung Electronics, Co. Ltd. | Neural Network Reordering, Weight Compression, and Processing |
| US12093813B2 (en) * | 2016-09-30 | 2024-09-17 | Intel Corporation | Dynamic neural network surgery |
| KR102336295B1 (ko) * | 2016-10-04 | 2021-12-09 | 한국전자통신연구원 | 적응적 프루닝 및 가중치 공유를 사용하는 컨볼루션 신경망 시스템 및 그것의 동작 방법 |
| US11315018B2 (en) * | 2016-10-21 | 2022-04-26 | Nvidia Corporation | Systems and methods for pruning neural networks for resource efficient inference |
| EP3340129B1 (en) | 2016-12-21 | 2019-01-30 | Axis AB | Artificial neural network class-based pruning |
| US10796169B2 (en) * | 2017-05-16 | 2020-10-06 | Nec Corporation | Pruning filters for efficient convolutional neural networks for image recognition of environmental hazards |
| CN107368885A (zh) | 2017-07-13 | 2017-11-21 | 北京智芯原动科技有限公司 | 基于多粒度剪枝的网络模型压缩方法及装置 |
| US11429862B2 (en) * | 2018-03-20 | 2022-08-30 | Sri International | Dynamic adaptation of deep neural networks |
| US11423312B2 (en) * | 2018-05-14 | 2022-08-23 | Samsung Electronics Co., Ltd | Method and apparatus for universal pruning and compression of deep convolutional neural networks under joint sparsity constraints |
| CN108764471B (zh) * | 2018-05-17 | 2020-04-14 | 西安电子科技大学 | 基于特征冗余分析的神经网络跨层剪枝方法 |
| CN108932548A (zh) | 2018-05-22 | 2018-12-04 | 中国科学技术大学苏州研究院 | 一种基于fpga的稀疏度神经网络加速系统 |
| KR102214837B1 (ko) | 2019-01-29 | 2021-02-10 | 주식회사 디퍼아이 | 컨벌루션 신경망 파라미터 최적화 방법, 컨벌루션 신경망 연산방법 및 그 장치 |
-
2019
- 2019-05-18 KR KR1020190058453A patent/KR102214837B1/ko active Active
- 2019-07-18 CN CN201980007377.0A patent/CN111758104B/zh active Active
- 2019-07-18 EP EP19913658.1A patent/EP3779801A4/en active Pending
- 2019-07-18 WO PCT/KR2019/008913 patent/WO2020159016A1/ko not_active Ceased
- 2019-07-18 US US16/626,493 patent/US12165051B2/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20110027916A (ko) | 2009-09-11 | 2011-03-17 | 연세대학교 산학협력단 | 퍼셉트론 인공신경망의 가중치 부여 장치와 이를 이용한 탐지 장치, 탐지 시스템 및 탐지 방법 |
| KR20160143505A (ko) * | 2015-06-04 | 2016-12-14 | 삼성전자주식회사 | 신경망의 연산량을 줄이는 방법 및 시스템 |
| KR20170128080A (ko) * | 2016-05-13 | 2017-11-22 | 삼성전자주식회사 | 신경 네트워크를 구현하는 방법 및 장치 |
| US20180046900A1 (en) * | 2016-08-11 | 2018-02-15 | Nvidia Corporation | Sparse convolutional neural network accelerator |
Non-Patent Citations (1)
| Title |
|---|
| Ge, Shiming, et al. Compressing deep neural networks for efficient visual inference. 2017 IEEE International Conference on Multimedia and Expo (ICME). IEEE, 2017.* * |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20220055827A (ko) * | 2020-10-27 | 2022-05-04 | 한림대학교 산학협력단 | 인공지능 모델의 파라미터 저장을 위한 필터 조합 학습 네트워크 시스템의 제어 방법, 장치 및 프로그램 |
| KR20220073600A (ko) * | 2020-11-26 | 2022-06-03 | 주식회사 노타 | 최적 파라미터 결정 방법 및 시스템 |
| KR20230024950A (ko) * | 2020-11-26 | 2023-02-21 | 주식회사 노타 | 최적 파라미터 결정 방법 및 시스템 |
| KR20220109826A (ko) * | 2021-01-29 | 2022-08-05 | 주식회사 노타 | 인공지능 추론모델을 경량화하는 방법 및 시스템 |
| KR20220116644A (ko) * | 2021-02-15 | 2022-08-23 | 에스케이플래닛 주식회사 | 가설 가지치기 방식 생산적 적대 신경망 기반 미세먼지센서의 이상을 탐지하기 위한 장치 및 이를 위한 방법 |
| KR20230001580A (ko) * | 2021-06-28 | 2023-01-05 | 한국자동차연구원 | S-파라미터 생성 장치 및 방법 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN111758104B (zh) | 2024-04-16 |
| EP3779801A1 (en) | 2021-02-17 |
| KR102214837B9 (ko) | 2021-11-12 |
| US20200372340A1 (en) | 2020-11-26 |
| EP3779801A4 (en) | 2021-07-14 |
| KR102214837B1 (ko) | 2021-02-10 |
| US12165051B2 (en) | 2024-12-10 |
| WO2020159016A1 (ko) | 2020-08-06 |
| CN111758104A (zh) | 2020-10-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102214837B1 (ko) | 컨벌루션 신경망 파라미터 최적화 방법, 컨벌루션 신경망 연산방법 및 그 장치 | |
| KR101987475B1 (ko) | 하드웨어 구현에 적합한 신경망 파라미터 최적화 방법, 신경망 연산방법 및 그 장치 | |
| KR102247896B1 (ko) | 학습된 파라미터의 형태변환을 이용한 컨벌루션 신경망 파라미터 최적화 방법, 컨벌루션 신경망 연산방법 및 그 장치 | |
| JP6528893B1 (ja) | 学習プログラム、学習方法、情報処理装置 | |
| JP6977864B2 (ja) | 推論装置、畳み込み演算実行方法及びプログラム | |
| CN110008952B (zh) | 一种目标识别方法及设备 | |
| CN113159276B (zh) | 模型优化部署方法、系统、设备及存储介质 | |
| KR20190051755A (ko) | 저 정밀도 뉴럴 네트워크 학습을 위한 방법 및 장치 | |
| KR20200004700A (ko) | 뉴럴 네트워크에서 파라미터를 처리하는 방법 및 장치 | |
| US12050976B2 (en) | Convolution operations utilizing nonzero padding data copied from input channel data | |
| US12412097B2 (en) | Neural network compression device | |
| CN115600637B (zh) | 面向数据流神经网络加速器设计的架构自动优化方法 | |
| CN112990438B (zh) | 基于移位量化操作的全定点卷积计算方法、系统及设备 | |
| CN114004327B (zh) | 一种适配于运行在fpga上的神经网络加速器的自适应量化方法 | |
| KR102384588B1 (ko) | 신경망 연산방법 및 신경망 가중치 생성방법 | |
| US20210097397A1 (en) | Information processing apparatus and information processing method | |
| US11551087B2 (en) | Information processor, information processing method, and storage medium | |
| CN110222816A (zh) | 深度学习模型的建立方法、图像处理方法及装置 | |
| CN114358281A (zh) | 一种模型压缩方法、装置、设备及介质 | |
| CN119721168A (zh) | 一种模型压缩方法、图像识别方法、产品、设备及介质 | |
| EP4052188A1 (en) | Neural network instruction streaming | |
| CN117852596A (zh) | 用于硬件量化过程的数学建模的系统和方法 | |
| WO2024159541A1 (en) | Systems and methods for compression of deep learning model using reinforcement learning for low rank decomposition | |
| CN113220344A (zh) | 算术处理装置、算术处理方法及算术处理程序 | |
| CN120725175B (zh) | 硬件自适应的量子电路编译方法、装置、设备、介质及产品 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0107 | Divisional application |
St.27 status event code: A-0-1-A10-A18-div-PA0107 St.27 status event code: A-0-1-A10-A16-div-PA0107 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| AMND | Amendment | ||
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| E601 | Decision to refuse application | ||
| PE0601 | Decision on rejection of patent |
St.27 status event code: N-2-6-B10-B15-exm-PE0601 |
|
| X091 | Application refused [patent] | ||
| AMND | Amendment | ||
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| PA0107 | Divisional application |
St.27 status event code: A-0-1-A10-A18-div-PA0107 St.27 status event code: A-0-1-A10-A16-div-PA0107 |
|
| PX0901 | Re-examination |
St.27 status event code: A-2-3-E10-E12-rex-PX0901 |
|
| PX0701 | Decision of registration after re-examination |
St.27 status event code: A-3-4-F10-F13-rex-PX0701 |
|
| X701 | Decision to grant (after re-examination) | ||
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| G170 | Re-publication after modification of scope of protection [patent] | ||
| PG1701 | Publication of correction |
St.27 status event code: A-5-5-P10-P19-oth-PG1701 Patent document republication publication date: 20211112 Republication note text: Request for Correction Notice (Document Request) Gazette number: 1022148370000 Gazette reference publication date: 20210210 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 6 |
|
| U11 | Full renewal or maintenance fee paid |
Free format text: ST27 STATUS EVENT CODE: A-4-4-U10-U11-OTH-PR1001 (AS PROVIDED BY THE NATIONAL OFFICE) Year of fee payment: 6 |




