KR20200036079A - 적응적 비최대억제 방법을 이용하는 딥러닝기반 영상객체 탐지를 위한 장치 및 방법 - Google Patents
적응적 비최대억제 방법을 이용하는 딥러닝기반 영상객체 탐지를 위한 장치 및 방법 Download PDFInfo
- Publication number
- KR20200036079A KR20200036079A KR1020180111651A KR20180111651A KR20200036079A KR 20200036079 A KR20200036079 A KR 20200036079A KR 1020180111651 A KR1020180111651 A KR 1020180111651A KR 20180111651 A KR20180111651 A KR 20180111651A KR 20200036079 A KR20200036079 A KR 20200036079A
- Authority
- KR
- South Korea
- Prior art keywords
- maximum suppression
- suppression method
- box
- group
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G06K9/00362—
-
- G06K9/627—
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/52—Scale-space analysis, e.g. wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2210/00—Indexing scheme for image generation or computer graphics
- G06T2210/12—Bounding box
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2는 임계값에 따른 NMS의 성능을 비교한 구성도
도 3은 딥러닝(CNN) 기반 열화상열상 내 인간객체 탐지 방법을 나타낸 구성도
도 4는 멀티스케일 슬라이딩 윈도우 기반 분류 방법을 나타낸 구성도
도 5는 본 발명에 따른 비최대억제 방법을 나타낸 플로우 차트
도 6은 NMS 방법의 개념을 나타낸 구성도
도 7은 본 발명에 따른 적응적 비최대억제 방법을 이용하는 딥러닝기반 영상객체 탐지를 위한 장치의 구성도
도 8은 본 발명에 따른 적응적 비최대억제 방법을 이용하는 딥러닝기반 영상객체 탐지를 위한 방법을 나타낸 플로우 차트
도 9는 kmeans 집단화 과정을 나타낸 플로우 차트
도 10는 본 발명을 적용한 열화상 영상에서 인간객체를 탐지를 위한 방법에서 사용되는 CNN 구조의 일 예를 나타낸 구성도
도 11은 본 발명을 적용한 열화상 영상에서 인간객체를 탐지 결과 구성도
72. 집단수 결정부 73. 집단화 수행부
74. 그룹별 임계값 결정부 75. 탐지객체박스 결정부
Claims (11)
- 비최대억제방법을 호출하는 함수 nmax_suppr()의 입력 와 을 입력받아 비최대억제방법을 수행하여 추정된 객체후보 박스 집합 을 출력하는 비최대억제방법 수행부;
상기 비최대억제방법 수행부에서 출력되는 집합 에서 중첩된 박스의 개수를 구하는 중첩 박스 확인부;
겹친영역의 개수를 고려하여 kmeans 집단화를 수행하기 위한 집단수를 결정하는 집단수 결정부;
상기 집단수 결정부에서 결정된 집단수를 이용하여 에 대하여 집단화를 kmeans 알고리듬을 사용하여 수행하는 집단화 수행부;
집단화 수행부에서의 k개의 집단에 대하여 집단별 박스 개수로부터 그룹별 임계값을 결정하는 그룹별 임계값 결정부;
각 그룹에 대하여 그룹별 임계값 결정부에서 결정된 임계값을 이용하여 비최대억제방법을 시행하고, 그 결과를 모두 합하여 최종 탐지객체박스를 결정하는 탐지객체박스 결정부;를 포함하는 것을 특징으로 하는 적응적 비최대억제 방법을 이용하는 딥러닝기반 영상객체 탐지를 위한 장치. - 제 3 항에 있어서, CNN의 결과를 출력하기 위한 딥러닝 신경망 학습을 위하여,
인간객체 및 비인간객체 샘플 데이터베이스를 구축하여 CNN(Convolutional Neural Network)의 파라미터를 학습하고 그 결과를 저장하고,
다음 입력영상이 들어오면 다중-스케일 탐색(multi-scale search)를 통하여 후보 윈도우 박스 영역의 영상을 CNN 구조에 입력하여 출력값을 계산하는 것을 특징으로 하는 적응적 비최대억제 방법을 이용하는 딥러닝기반 영상객체 탐지를 위한 장치. - 제 4 항에 있어서, 슬라이딩 윈도우(박스)의 크기는 고정하고, 입력영상을 스케일-공간 피라미드로 변환하면서, 박스영역의 입력영상을 CNN 분류기에 입력하면,
입력 영상에 대하여 실제 인간객체마다 다수의 후보 박스들이 발생하게 되고, 얻어지는 정보는 박스의 위치 정보와 크기정보인 것을 특징으로 하는 적응적 비최대억제 방법을 이용하는 딥러닝기반 영상객체 탐지를 위한 장치. - 비최대억제방법을 호출하는 함수 nmax_suppr()의 입력 와 을 입력받아 비최대억제방법을 수행하여 추정된 객체후보 박스 집합 을 출력하는 비최대억제방법 수행 단계;
상기 비최대억제방법 수행 단계에서 출력되는 집합 에서 중첩된 박스의 개수를 구하는 중첩 박스 확인 단계;
겹친영역의 개수를 고려하여 kmeans 집단화를 수행하기 위한 집단수를 결정하는 집단수 결정 단계;
상기 집단수 결정 단계에서 결정된 집단수를 이용하여 에 대하여 집단화를 kmeans 알고리듬을 사용하여 수행하는 집단화 수행 단계;
집단화 수행 단계에서의 k개의 집단에 대하여 집단별 박스 개수로부터 그룹별 임계값을 결정하는 그룹별 임계값 결정 단계;
각 그룹에 대하여 그룹별 임계값 결정 단계에서 결정된 임계값을 이용하여 비최대억제방법을 시행하고, 그 결과를 모두 합하여 최종 탐지객체박스를 결정하는 탐지객체박스 결정 단계;를 포함하는 것을 특징으로 하는 적응적 비최대억제 방법을 이용하는 딥러닝기반 영상객체 탐지를 위한 방법.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020180111651A KR102195940B1 (ko) | 2018-09-18 | 2018-09-18 | 적응적 비최대억제 방법을 이용하는 딥러닝기반 영상객체 탐지를 위한 장치 및 방법 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020180111651A KR102195940B1 (ko) | 2018-09-18 | 2018-09-18 | 적응적 비최대억제 방법을 이용하는 딥러닝기반 영상객체 탐지를 위한 장치 및 방법 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20200036079A true KR20200036079A (ko) | 2020-04-07 |
| KR102195940B1 KR102195940B1 (ko) | 2020-12-28 |
Family
ID=70290840
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020180111651A Active KR102195940B1 (ko) | 2018-09-18 | 2018-09-18 | 적응적 비최대억제 방법을 이용하는 딥러닝기반 영상객체 탐지를 위한 장치 및 방법 |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR102195940B1 (ko) |
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111783700A (zh) * | 2020-07-06 | 2020-10-16 | 中国交通通信信息中心 | 一种路面异物自动识别预警方法和系统 |
| CN112052787A (zh) * | 2020-09-03 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 基于人工智能的目标检测方法、装置及电子设备 |
| CN113536842A (zh) * | 2020-04-15 | 2021-10-22 | 普天信息技术有限公司 | 电力作业人员安全着装识别方法及装置 |
| CN113591734A (zh) * | 2021-08-03 | 2021-11-02 | 中国科学院空天信息创新研究院 | 一种基于改进nms算法的目标检测方法 |
| CN114022830A (zh) * | 2020-07-17 | 2022-02-08 | 华为技术有限公司 | 一种目标确定方法以及目标确定装置 |
| CN114049651A (zh) * | 2021-11-03 | 2022-02-15 | 珠海格力电器股份有限公司 | 对象检测方法、装置、电子设备及存储介质 |
| CN114120127A (zh) * | 2021-11-30 | 2022-03-01 | 济南博观智能科技有限公司 | 一种目标检测方法、装置及相关设备 |
| CN114581983A (zh) * | 2022-03-04 | 2022-06-03 | 浪潮(北京)电子信息产业有限公司 | 一种目标检测的检测框处理方法及相关装置 |
| KR20230045297A (ko) * | 2021-09-28 | 2023-04-04 | 주식회사 디비엔텍 | 대체 이미지 획득 방법 및 시스템 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017157138A (ja) * | 2016-03-04 | 2017-09-07 | キヤノン株式会社 | 画像認識装置、画像認識方法及びプログラム |
| JP2017191608A (ja) * | 2016-04-15 | 2017-10-19 | 株式会社リコー | 対象識別方法、対象識別装置、及び分類器訓練方法 |
| KR20170134158A (ko) | 2016-05-28 | 2017-12-06 | 삼성전자주식회사 | 이미지 내의 물체 인식 시스템 및 방법 |
| KR20180009180A (ko) * | 2016-07-18 | 2018-01-26 | 단국대학교 천안캠퍼스 산학협력단 | 모바일 환경 객체 신뢰도 평가와 학습을 통한 융합 객체 추적 시스템 및 방법 |
| KR20180065856A (ko) | 2016-12-07 | 2018-06-18 | 삼성전자주식회사 | 영역 기반 딥 러닝 모델을 이용한 객체 탐지 장치 및 방법, 그리고 이를 이용한 칩셋 제조 방법 |
| KR101873169B1 (ko) | 2017-10-26 | 2018-06-29 | 한국항공우주연구원 | 관측 영상에 대한 실시간 훈련 및 객체 탐지하는 통합 모듈 장치 및 방법 |
-
2018
- 2018-09-18 KR KR1020180111651A patent/KR102195940B1/ko active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017157138A (ja) * | 2016-03-04 | 2017-09-07 | キヤノン株式会社 | 画像認識装置、画像認識方法及びプログラム |
| JP2017191608A (ja) * | 2016-04-15 | 2017-10-19 | 株式会社リコー | 対象識別方法、対象識別装置、及び分類器訓練方法 |
| KR20170134158A (ko) | 2016-05-28 | 2017-12-06 | 삼성전자주식회사 | 이미지 내의 물체 인식 시스템 및 방법 |
| KR20180009180A (ko) * | 2016-07-18 | 2018-01-26 | 단국대학교 천안캠퍼스 산학협력단 | 모바일 환경 객체 신뢰도 평가와 학습을 통한 융합 객체 추적 시스템 및 방법 |
| KR20180065856A (ko) | 2016-12-07 | 2018-06-18 | 삼성전자주식회사 | 영역 기반 딥 러닝 모델을 이용한 객체 탐지 장치 및 방법, 그리고 이를 이용한 칩셋 제조 방법 |
| KR101873169B1 (ko) | 2017-10-26 | 2018-06-29 | 한국항공우주연구원 | 관측 영상에 대한 실시간 훈련 및 객체 탐지하는 통합 모듈 장치 및 방법 |
Cited By (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN113536842A (zh) * | 2020-04-15 | 2021-10-22 | 普天信息技术有限公司 | 电力作业人员安全着装识别方法及装置 |
| CN111783700A (zh) * | 2020-07-06 | 2020-10-16 | 中国交通通信信息中心 | 一种路面异物自动识别预警方法和系统 |
| CN111783700B (zh) * | 2020-07-06 | 2023-11-24 | 中国交通通信信息中心 | 一种路面异物自动识别预警方法和系统 |
| CN114022830A (zh) * | 2020-07-17 | 2022-02-08 | 华为技术有限公司 | 一种目标确定方法以及目标确定装置 |
| CN112052787A (zh) * | 2020-09-03 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 基于人工智能的目标检测方法、装置及电子设备 |
| CN113591734A (zh) * | 2021-08-03 | 2021-11-02 | 中国科学院空天信息创新研究院 | 一种基于改进nms算法的目标检测方法 |
| CN113591734B (zh) * | 2021-08-03 | 2024-02-20 | 中国科学院空天信息创新研究院 | 一种基于改进nms算法的目标检测方法 |
| KR20230045297A (ko) * | 2021-09-28 | 2023-04-04 | 주식회사 디비엔텍 | 대체 이미지 획득 방법 및 시스템 |
| CN114049651A (zh) * | 2021-11-03 | 2022-02-15 | 珠海格力电器股份有限公司 | 对象检测方法、装置、电子设备及存储介质 |
| CN114120127A (zh) * | 2021-11-30 | 2022-03-01 | 济南博观智能科技有限公司 | 一种目标检测方法、装置及相关设备 |
| CN114120127B (zh) * | 2021-11-30 | 2024-06-07 | 济南博观智能科技有限公司 | 一种目标检测方法、装置及相关设备 |
| CN114581983A (zh) * | 2022-03-04 | 2022-06-03 | 浪潮(北京)电子信息产业有限公司 | 一种目标检测的检测框处理方法及相关装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| KR102195940B1 (ko) | 2020-12-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102195940B1 (ko) | 적응적 비최대억제 방법을 이용하는 딥러닝기반 영상객체 탐지를 위한 장치 및 방법 | |
| Vennelakanti et al. | Traffic sign detection and recognition using a CNN ensemble | |
| US8867828B2 (en) | Text region detection system and method | |
| WO2016107103A1 (zh) | 图像主体区域的识别方法及装置 | |
| US20170262723A1 (en) | Method and system for detection and classification of license plates | |
| US20120294535A1 (en) | Face detection method and apparatus | |
| CN109284664B (zh) | 驾驶员辅助系统和护栏检测方法 | |
| CN111382637B (zh) | 行人检测跟踪方法、装置、终端设备及介质 | |
| KR102476022B1 (ko) | 얼굴검출 방법 및 그 장치 | |
| CN101198987A (zh) | 对象检测装置及其学习装置 | |
| CN110706261A (zh) | 车辆违章检测方法、装置、计算机设备和存储介质 | |
| Prates et al. | Brazilian license plate detection using histogram of oriented gradients and sliding windows | |
| KR20170087817A (ko) | 얼굴 검출 방법 및 장치 | |
| Tarabek | A real-time license plate localization method based on vertical edge analysis | |
| Borthakur et al. | Object detection for military surveillance using YOLO framework | |
| CN106778675B (zh) | 一种视频图像中目标对象的识别方法和装置 | |
| KR101847175B1 (ko) | 객체 인식방법 및 이를 이용한 객체 인식장치 | |
| CN111027482B (zh) | 基于运动向量分段分析的行为分析方法及装置 | |
| JP2019106089A (ja) | 情報処理装置、情報処理方法、コンピュータプログラム | |
| KR101437228B1 (ko) | 입체영상에서의 외곽선 가중치 기반 장애물 영역 검출 장치 및 방법 | |
| KR20210079922A (ko) | 영상에 포함된 객체를 분류하는 장치, 방법 및 컴퓨터 프로그램 | |
| Prates et al. | An adaptive vehicle license plate detection at higher matching degree | |
| KR102133045B1 (ko) | Cctv 영상 기반 데이터 처리 방법 및 그 시스템 | |
| CN109977729A (zh) | 一种文本检测方法及装置 | |
| Vu et al. | Vehicle detection, tracking and counting in traffic video streams based on the combination of YOLOv9 and DeepSORT algorithms |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20180918 |
|
| PA0201 | Request for examination | ||
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20200217 Patent event code: PE09021S01D |
|
| PG1501 | Laying open of application | ||
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20201214 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20201221 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20201222 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration | ||
| PR1001 | Payment of annual fee |
Payment date: 20241112 Start annual number: 5 End annual number: 5 |





