327 0

A study on a rotated object detector based on vision transformer

Title
A study on a rotated object detector based on vision transformer
Author
리야오펑
Advisor(s)
Tae Hyun Sung
Issue Date
2023. 2
Publisher
한양대학교
Degree
Master
Abstract
Rotated object detection in aerial images aims to locate objects of interest on the ground and identify their classes. As more and more aerial photographs become available, rotated object detection in aerial photos has become a specific and active topic in computer vision. Deep learning has achieved great success in basic computer vision applications such as image recognition, Object detection, and image segmentation in recent years. Based on this, deep learning has also been applied to face, text, and aerial image detection. Aerial image detection plays a crucial role in the military and is receiving increasing attention in the civilian sector. It aims to predict more accurate bounding boxes and retain orientation information of objects on aerial images. The most common rotated object detection is based on a convolutional neural network (CNN). We construct the detector based on Vision Transformer (ViT) and get a good result.|항공 이미지에서 회전되어있는 물체를 감지하여, 지상에서 목표로 하는 물체를 찾고, 분류 및 식별하는 것을 목표로 한다. 최근 더 많은 항공사진을 이용할 수 있게 되면서, 항공사진에서 회전되어있는 물체를 감지하고 식별하는 것은 컴퓨터 비전 관련 학문에서 각광받고 있는 분야가 되었다. 최근 몇 년 동안 이미지 인식, 객체 감지 및 이미지 분할과 같은 딥 러닝 기술 기반의 컴퓨터 비전 애플리케이션에서 큰 발전을 이루었다. 이는 얼굴 인식, 텍스트 인식, 항공사진의 식별 등과 같은 분야에도 폭 넓게 활용되고 있다. 특히, 항공사진 식별 기술은 그동안 군대를 중심으로 중요한 역할을 해왔었지만, 최근에는 민간 부문에서도 점차 많은 관심을 받고 있다. 본 연구는 보다 정확한 경계 상자(Bounding Boxes)를 예측하고 항공 이미지에 물체의 방향 정보를 유지하는 것을 목표로 한다. 가장 일반적인 회전 물체 감지는 컨볼루션 신경망(CNN)을 기반으로 한다. 본 연구에서는 Vision Transformer (ViT)를 기반으로 검출기를 구성하여 보다 우수한 결과를 도출해 냈다.
URI
http://hanyang.dcollection.net/common/orgView/200000650009https://repository.hanyang.ac.kr/handle/20.500.11754/179868
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > ELECTRICAL ENGINEERING(전기공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE