534 0

이미지 배경 분석을 활용한 이미지 객체 인식률 증대

Title
이미지 배경 분석을 활용한 이미지 객체 인식률 증대
Other Titles
Object Detection Improvement with Semantic Segmentation Recognition
Author
이중석
Alternative Author(s)
Jungsuk Lee
Advisor(s)
조 인 휘
Issue Date
2022. 2
Publisher
한양대학교
Degree
Master
Abstract
Computer vision 분야에서 CNN (Convolutional Neural Network)이 발표된 이래로 객체 탐지, 휴먼 포즈, 얼굴 인식 등 수 많은 알고리즘이 발전하여 실생활에 밀접하게 사용되어 오고 있다. 하지만 2020년 객체 탐지 분야에서는 정확도가 90%를 기록한 이후 이렇다 할 추가 연구가 없어 정체되어 왔다. 사람이 눈으로 객체를 인식할 때에 우선적으로 배경 또는 장소에 대한 사전 지식이 있다면, 해당 배경과 장소에 어울리는 객체와 그와는 대조적으로 부자연스러운 객체를 분별하여 판단할 수 있다. 이러한 사람의 사물 인식 이전 자료 수집의 특징을 기반으로 새롭게 객체 인식 구조의 방법을 제안한다. 새로운 배경 인식을 이용한 객체 인식 기술 구현을 위해 가장 최근의 배경 인식(Semantic Segmentation) 연구와 가장 많이 사용되는 Dataset, 그리고 다중 출력이 가능한 모델(Linear Regression, Random Forest, Gaussian Mixture Model)을 비교하고 최적의 알고리즘과 자료를 선택한다. 여기에 HRNetV2를 배경 인식 브랜치로 하고 Mask RCNN을 객체 인식 브랜치로 하여 LR Filter (Linear Regression Filter)를 통해 출력 값을 합산하고 수식을 사용하여 객체 탐지 성능을 향상 시켰다. 여러 측정 방법을 이용하여 객체 탐지 성능을 측정한 결과 Precision 지표에서 다소 낮아졌지만 그외 Recall, F1 Score 에서 Mask RCNN 보다 두드러진 향상을 이루었고, 특히 Category Detection 지표에서는 월등한 향상을 보였다. 본 연구에서 제안하는 Semantic Segmentation을 활용한 객체 인식 구조가 객체의 카테고리를 정확하게 탐지함으로써 객체 탐지의 향상을 이끌어 낼 수 있음을 증명하였다. | Since CNN (Convolutional Neural Network) was announced in the field of computer vision, numerous algorithms such as object detection, human pose, and face recognition have been developed and used closely in real life. However, in the field of object detection in 2020, since the accuracy reached 90%, there has been no further research. When a person recognizes an object with his or her eyes, if he has prior knowledge of a background or a place, it is possible to discriminate between an object suitable for the background and place and an object that is unnatural in contrast to that. Based on the characteristics of data collection prior to human object recognition, we propose a new object recognition structure method. For the implementation of object recognition technology using new background recognition, we compare the most recent Semantic Segmentation study, the most used dataset, and models that can output multiple models (Linear Regression, Random Forest, Gaussian Mixture Model), and Choose an algorithm and data. Here, with HRNetV2 as the background recognition branch and Mask RCNN as the object recognition branch, the output values ​​are summed through LR Filter (Linear Regression Filter), and the object detection performance is improved by using the formula. As a result of measuring object detection performance using various measurement methods, the precision index was slightly lowered, but in other respects Recall and F1 Score, it achieved a marked improvement compared to Mask RCNN, and in particular, it showed a superior improvement in the Category Detection index. It has been demonstrated that the object recognition structure using semantic segmentation proposed in this study can improve object detection by accurately detecting object categories.
URI
http://hanyang.dcollection.net/common/orgView/200000595714https://repository.hanyang.ac.kr/handle/20.500.11754/168390
Appears in Collections:
GRADUATE SCHOOL OF ENGINEERING[S](공학대학원) > ELECTRICAL ENGINEERING AND COMPUTER SCIENCE(전기ㆍ전자ㆍ컴퓨터공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE