Repository at Hanyang University: 비전 트랜스포머의 시각화를 위한 적대적 정규화 연구

Browse

My Repository

Repository at Hanyang UniversityGRADUATE SCHOOL[S](대학원)ARTIFICIAL INTELLIGENCE(인공지능학과)Theses(Master)

105 0

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	한경식	-
dc.contributor.author	최호영	-
dc.date.accessioned	2024-03-01T07:53:51Z	-
dc.date.available	2024-03-01T07:53:51Z	-
dc.date.issued	2024. 2	-
dc.identifier.uri	http://hanyang.dcollection.net/common/orgView/200000723996	en_US
dc.identifier.uri	https://repository.hanyang.ac.kr/handle/20.500.11754/188870	-
dc.description.abstract	Vision Transformer는 이미지의 클래스 예측에 있어서 주로 [CLS] 토큰을 활용하도록 개발되어 왔다. 설명 가능한 vision transformer의 시각화는 [CLS] 토큰과의 연관성 정보를 활용하거나, self-attention 과정에서의 attention score에 주목하여 연구되어 왔다. 하지만, transformer 구조의 skip connection 및 attention operators에 대한 의존성, 학습 과정에서의 비선형성으로 인한 불안정성, 그리고 attention score가 relevancy를 충분히 반영하지 못하는 이슈 등은 Vision Transformer의 시각화를 어렵게 만드는 요인이다. 본 논문에서, 우리는 Vision Transformer에서 각 입력 패치 토큰에 대한 출력 벡터가 각 패치 위치의 이미지 정보를 유지하고, 이것이 이미지 클래스의 예측을 용이하게 할 수 있다고 주목한다. 이를 기반으로 우리는 모델이 이미지의 각 패치에 대해 학습된 클래스를 예측하게 하고, 이미지의 클래스를 결정짓지 않는 패치들에 대해서는 배경 클래스로 예측하게 하여 Vision Transformer의 설명 가능성을 효과적으로 시각화 할 수 있는 방법론인 ICE (Adversarial Normalization: I Can visualize Everything)를 제안한다. 우리는 설명 가능한 Vision Transformer의 시각화 연구에서 대표적으로 사용되는 DeiT-S 모델을 활용하여 ImageNet-Segmentation 데이터 셋에서 네 가지 모델 크기에 대해 기존 설명 가능한 시각화 방법론들을 능가하였다. 또한, 우리는 약지도학습 객체 탐지와 비지도 객체 탐지에 대해 정량적 및 정성적 분석을 실시하였다. CUB-200-2011과 PASCALVOC07/12 데이터셋에서 ICE는 최신 방법론들과 비교할 만한 성능을 보였다. ImageNet 데이터셋에서 DeiT-S의 인코더에 ICE를 통합하여 기존 DeiT-S 모델보다 44.01% 효율성을 개선하였다. 이는 최신 가지치기 모델인 EViT와 비교하여 정확도 및 효율성에 있어서 ICE의 효과성을 입증하였다.	-
dc.publisher	한양대학교 대학원	-
dc.title	비전 트랜스포머의 시각화를 위한 적대적 정규화 연구	-
dc.title.alternative	Adversarial Normalization: A Study on the Visualization of Vision Transformers	-
dc.type	Theses	-
dc.contributor.googleauthor	최호영	-
dc.contributor.alternativeauthor	Hoyoung Choi	-
dc.sector.campus	S	-
dc.sector.daehak	대학원	-
dc.sector.department	인공지능학과	-
dc.description.degree	Master	-

Appears in Collections:: GRADUATE SCHOOL[S](대학원) > ARTIFICIAL INTELLIGENCE(인공지능학과) > Theses(Master)

Files in This Item:

Export: RIS (EndNote); XLS (Excel); XML

Show simple item record

qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

한양대학교 리포지터리는 국립중앙도서관 OAK 보급사업으로 구축되었습니다. Feedback 개인정보처리방침

BROWSE