232 0

한국어 임베딩과 딥러닝을 활용한 효율적인 정치적 견해 분류

Title
한국어 임베딩과 딥러닝을 활용한 효율적인 정치적 견해 분류
Other Titles
Efficient Political Opinion Classification Exploiting Korean Embedding and Deep Learning
Author
이예진
Alternative Author(s)
Lee, Ye Jin
Advisor(s)
이동호
Issue Date
2021. 2
Publisher
한양대학교
Degree
Master
Abstract
최근 소셜 네트워크 서비스(Social Network Service, SNS)의 이용자가 급증함에 따라 트위터, 인스타그램, 페이스북과 같은 애플리케이션에서 대량의 텍스트 데이터가 생성되고 있다. 매일 생성되는 수많은 양의 텍스트 데이터에는 개인에게 민감한 정보들이 포함되는 경우가 많으며, 이러한 정보들이 타인에게 무분별하게 노출될 경우 사생활 침해, 개인 정보 유출과 같은 문제들이 발생된다. 이를 위해, 딥러닝 모델을 활용하여 문장의 민감 여부를 분류하려는 연구들이 진행되었으나, 학습 데이터에 존재하지 않는 새로운 단어들에 대한 고려 없이 문장을 표현하기 때문에 해당 문장의 민감 여부를 제대로 분류하지 못하는 미등록 단어(Out-of-Vocabulary, OOV) 문제가 발생하였다. 본 논문에서는 모델의 학습 과정에서 발생되는 OOV 문제를 대비하며, 한국어 어절을 다양한 단위로 분절한 임베딩 정보를 기반으로 정치적 견해를 분류하는 시스템을 제안한다. 또한 본 논문에서 제안하는 방법과 기존 방법의 성능 비교를 통해 제안된 시스템의 우수성을 검증한다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/158954http://hanyang.dcollection.net/common/orgView/200000486438
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE & ENGINEERING(컴퓨터공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE