200 0

개선된 추천 시스템을 위한 삼중항 손실 기반 사용자 분석

Title
개선된 추천 시스템을 위한 삼중항 손실 기반 사용자 분석
Other Titles
User Analysis Based on the Triplet Loss for an Advanced Recommendation System
Author
구선모
Alternative Author(s)
Sunmo Koo
Advisor(s)
손승우
Issue Date
2023. 2
Publisher
한양대학교
Degree
Master
Abstract
서비스 운영주체가 사용자들 각각에 맞는 제품을 추천하기 위해서 개개인의 특징을 아는 것은 중요하다. 사용자의 특징이라 불릴 수 있는 요소들은 성격, 사회계층, 취미 등이 존재한다. 서비스 운영주체는 사용자의 특징을 파악하여 기능을 개선하거나 개인화된 추천 시스템을 발전시키는 데에 이용할 수 있다. 그러나 직접적인 질의응답을 통해 해당 특징들을 파악하는 데에는 데이터를 수집하는 주체에 대한 높은 신뢰 또는 서비스의 대체 불가능성이 담보되어야 한다. 반면, 사용자들은 잠재적 자기표현에 대한 욕구가 존재하고, 많은 경우에서 서비스의 사용 목적이 그것이 되기도 한다. 이러한 자기표현은 주로 텍스트나 이미지의 형태로 표출되고, 자연히 정보제공에 관대한 태도로 이어지게 된다. 본 연구는 다층적 세부조정 (fine-tuning)을 통해 언어적 특성, 인적 특성, 구체적 특성으로 이어지는, 전반적 지식으로부터 단계적으로 구체적 지식을 도출해 내는 방향성을 따른다. 일차적으로 대중적으로 사용되고 있는 거대 언어 모델인 Bi-directional Encoder Representations from Transformers (BERT) [1]를 기반으로 세부 조정 된 Sentence-BERT [2]를 통한 텍스트의 의미론적 정보를 추출한다. 이차적으로 이러한 정보를 통해 알 수 있는 작성자의 인적 특성을 임베딩한다. 연구에서 중점적으로 다루는 인적 특성의 임베딩은 메트릭 학습 (metric learning) 방법론의 일종인 삼중항 손실 (triplet loss) [3]을 통한 학습을 통해 이루어진다. 이는 동일한 사용자가 작성한 텍스트보다 동일하지 않은 사용자가 작성한 텍스트의 임베딩 값이 기준이 되는 텍스트로부터 상대적으로 유클리드 거리 (Euclidean distance)가 멀어지도록 하는 과정으로, 해당 학습과정을 거쳐 유사한 인적 특성을 가진 사람이 작성한 텍스트는 임베딩 공간 내에서 유클리드 거리가 가까워지게 된다. 사회적 그룹, 성별 등의 중요 특성을 가정하는 방법론과는 대조적으로, 텍스트 데이터를 통해 유저 간 구별점을 스스로 찾기 때문에 최종적으로 더 높은 분류 성능을 기대할 수 있다. 또한 측정대상 외의 작성자 라벨을 활용하는 열린 데이터를 모델의 학습에 이용하였고, 해당 모델을 통한 임베딩 공간 상의 라벨 분포를 분석하여 유저 간 유사성에 대한 정성적인 통찰을 이끌어낼 수 있었다.
URI
http://hanyang.dcollection.net/common/orgView/200000656110https://repository.hanyang.ac.kr/handle/20.500.11754/179792
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > APPLIED ARTIFICIAL INTELLIGENCE(인공지능융합학과) > Theses(Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE