257 0

복잡한 시각 환경에서 개선된 YOLOv4 알고리즘 기반의 보행자 검출 기술

Title
복잡한 시각 환경에서 개선된 YOLOv4 알고리즘 기반의 보행자 검출 기술
Other Titles
An Improved YOLOv4 Algorithm For Pedestrian Detection In Complex Visual Scenes
Author
정가흔
Alternative Author(s)
CHENG JIAXIN
Advisor(s)
조인휘
Issue Date
2022. 8
Publisher
한양대학교
Degree
Master
Abstract
보행자 검출(pedestrian detection)는 이미지나 동영상에서 보행자를 측정하고 상대적 위치를 표시하는 것을 말한다. 보행자 검출는 줄곧 컴퓨터 비전(computer vision) 영역에서 연구하는 이슈였다. 딥러닝의 발달로 인해, 딥러닝과 보행자 검출을 결합하는 것은 보행자 검출의 잠재적인 연구와 응용 가치를 더욱 향상시킬 수 있다. 본 논문은 딥러닝에 기반한 복잡한 시각 상황에서 효과적인 보행자 검출을 실현하는 것이다. 어두움, 악천후, 장애물, 보행자 크기, 시진의 질 등을 고려하는 복잡한 시각 환경에서 보행자 검출의 난이도가 크게 높아졌다. 본 논문은 복잡한 시각 환경에서 보행자의 검출 정확도가 낮고 누락도 심각한 문제에 대해, 개선한 YOLOv4 알고리즘을 제안한다. 전통적인 보행자 검출 알고리즘은 보행자 검출의 정확도와 누락률에 대한 요구를 만족시키지 못한다, 따라서 본문은 2020년에 발표된 YOLOv4 알고리즘을 개선하여 복잡한 시각 환경에서의 보행자 검출 문제를 해결한다. 본 논문의 주요 연구 내용은 다음과 같다. 첫째, 복잡한 시각 환경에서 장애물, 날씨, 보행자 크기 등의 문제를 고려하여, 다양한 장면과 자연 조건의 이미지를 최대한 수집하기 위해, 새로운 복잡한 시각 환경에서의 보행자 데이터 세트를 구축했다; 둘째, 본 논문에 구축된 보행자 데이터 세트의 보행자 샘플의 사이즈와 비율에 대해, K평균(K-means) 알고리즘로 앵커박스(anchor box)의 사이즈를 선별하여, 보행자 데이터 세트에 알맞은 세밀화된 앵커박스 사이즈를 얻었다. 실험결과 K-means 알고리즘은 보행자 검출의 정확도를 높이는 데 유리하다는 결과가 나왔다. 셋째, 복잡한 시각 환경은 알고리즘 신뢰도(Confidence)에 영향을 미쳐 오차와 누락을 발생한 문제에 대해, YOLOv4 알고리즘에 어텐션 메커니즘 (attention mechanism) SE(Squeeze-and Excitation)을 삽입했다. 실험결과는 SE-Residual은 특징 추출력을 증대시켜 복잡한 시각 환경이 보행자 검출에 미치는 영향을 효과적으로 감소시키고 오차와 누락를 방지하는 것으로 나타났다. 실험결과, 본문에 구축된 보행자 데이터 세트에서 개선한 YOLOv4 알고리즘의 mAP(mean average precision)는 67.32%의 결과를 얻었으며, YOLOv3 알고리즘보다 17.84% 향상되고 기존 YOLOv4 알고리즘보다 4.85% 향상된 결과를 얻었다. 따라서 제안하는 개선된 YOLOv4 알고리즘은 복잡한 시각 환경에서의 보행자 검출 효과를 효과적으로 향상시킨다.|Pedestrian detection refers to detecting pedestrian objects in an image or video, and marking the relative position of the pedestrian in the image or video. Pedestrian detection has always been a hot topic in the field of target detection. With the development of deep learning, the combination of deep learning and pedestrian detection has more in-depth exploration of the potential research and application value of pedestrian detection. This article is based on deep learning in the complex Realize effective pedestrian detection in visual scenes. In complex visual scenes such as excessively dark or overexposed lighting, bad weather, severe occlusion, large differences in pedestrian size, and blurred images, it greatly increases the difficulty of pedestrian detection. This paper aims at the low accuracy of pedestrian detection in complex visual scenes. For serious problems of missed detection, an improved yolov4 algorithm is proposed. The traditional pedestrian detection algorithm cannot meet the accuracy and real-time requirements of pedestrian detection. Therefore, this article uses the YOLOv4 algorithm just released in 2020 to improve and solve the problem in complex visual scenes. Pedestrian detection problem. The main research content of the thesis includes the following aspects: First, considering the natural lighting, weather, occlusion and other issues in complex visual scenes, in order to collect as much as possible the pictures under different scenes and natural conditions as a data set, it is constructed according to the requirements of this experiment Pedestrian data set in a new complex visual scene, then/secondly, based on the width-to-height ratio of pedestrian samples in the pedestrian data set constructed in this paper, the K-means algorithm is used to filter the cluster anchor frame size, and obtain a suitable pedestrian data set The size of the anchor frame is refined, and the experimental results show that the K-means algorithm is beneficial to improve the accuracy of network detection. At the same time/finally, in view of the influence of complex visual scenes on the algorithm's confidence, there are problems of false detection and leak detection, which affect the characteristics of YOLOv4 The extraction network is improved, the attention mechanism is introduced into the YOLOv4 algorithm, and the SENet (Squeeze-and Excitation Networks) module is added to its network structure. The experimental results show that SE-Residual can enhance the feature extraction ability and effectively reduce the complex visual environment. The influence of pedestrian detection, to avoid false detections and missed detections. Experiments show that on the pedestrian data set constructed in this paper, the improved yolov4 improves the ability to extract pedestrian features and effectively enhances the pedestrian detection effect in complex visual scenes.
URI
http://hanyang.dcollection.net/common/orgView/200000623627https://repository.hanyang.ac.kr/handle/20.500.11754/174216
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE(컴퓨터·소프트웨어학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE