텍스트 코퍼스 기반 감정 분석 및 시각화 도구

Title
텍스트 코퍼스 기반 감정 분석 및 시각화 도구
Other Titles
Text Corpus Based Emotion Analysis and Visualization Tool
Author
김재민
Alternative Author(s)
Kim, Jae Min
Advisor(s)
최용석
Issue Date
2018-02
Publisher
한양대학교
Degree
Master
Abstract
최근 자살, 사교육 경쟁, 노후 빈곤, 저출산, 증오 범죄 등 다양한 사회 문제들이 증가하고 있다. 이러한 사회 문제들을 해결하기 위해 사회 구성원의 감정 및 그 분포에 대한 연구가 사회과학자들 사이에서 꾸준히 진행되어 왔다. 기존의 사회 과학에서 감정 과 그 분포를 연구하는데 사용하던 방법은 사회 구성원 일부에 대한 설문조사를 통해 수행된다. 그러나 이 방법은 개인이 자신의 감정을 정확히 이해할 수 없고, 설문조사 결과를 분석하기 위해 시간이 필요하다는 제약 때문에 체적으로 연구를 수행하기가 어렵다. 본 논문에서는 기존의 설문조사를 대신해 달리 소셜 네트워크 서비스로부터 텍스트 코퍼스를 수집하여, 개발된 분류기를 통해 분류한 뒤, 시각화하여 제공한다. 이 방법은 기존 방법의 제약들을 해결할 수 있다. 전문가가 분류한 텍스트 코퍼스를 이용해 학습된 분류기를 사용하므로 개인이 자신의 감정을 정확히 이해하지 못해 발생하는 부정확성을 해결한다. 게다가 텍스트 코퍼스 수집, 분류 및 시각화에 걸리는 시간이 거의 없으므로 기존의 방법에는 존재하던 결과를 분석하기 위해 시간이 걸리는 제약도 해결된다. 우선 사회 구성원의 감정을 연구하기 위한 예비 연구로 감정 중 하나인 불안에 대해 연구한다. 이 연구를 위한 텍스트 코퍼스를 수집하기 위한 소셜 네트워크 서비스로 트위터를 선택했다. 수집된 텍스트 코퍼스 중 일부는 사회과학자들의 도움을 얻어 불안 분류 됐고, 불안 사전 구축을 위한 훈련 코퍼스로 사용했다. 불안을 분류하기 위해 나이브 베이즈 분류 기법과 라플라스 평활화를 사용했다. 시각화를 위해 통계청에서 제공하는 SGIS API를 사용했다. 분류기의 성능은 불안 태깅 된 텍스트 코퍼스를 교차 검증하는 것으로 평가했다. 결과 약 88%의 정확도로 측정됐다. 예비 연구를 통해 해당 연구에 대한 타당성이 증명됐다. 사회 과학에서 사람의 감정을 나타내는 값인 Arousal과 Valence를 이용해 불안 뿐 아니라 사람의 각종 감정을 분류해 내기 위해 연구한다. 교차 검증을 통해 성능을 평가한 결과 각각 60%, 55%의 정확도로 측정됐다.
URI
http://www.dcollection.net/handler/hanyang/000000105001http://repository.hanyang.ac.kr/handle/20.500.11754/68653
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE(컴퓨터·소프트웨어학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE