457 0

머신러닝을 통한 SNS 우울감 정량적 평가

Title
머신러닝을 통한 SNS 우울감 정량적 평가
Other Titles
Quantitative evaluation of SNS depression through machine learning
Author
김시은
Alternative Author(s)
Kim Sieun
Advisor(s)
조인휘
Issue Date
2021. 8
Publisher
한양대학교
Degree
Master
Abstract
한국은 OECD국가 중 자살률 1위라는 불명예를 안고있다. 최근에는 유명 연예인을 비롯해 셀럽들의 우울증으로인한 잇다른 극단적 선택으로인해 우울증에 대한 관리의 중요성이 커지고 있다. 또한 코로나19로인해 소외된 사람들의 우울증을 일컽는 말로 '코로나 블루'라는 신생어가 생길 정도로 사회의 우울증은 보이지 않는 곳에서 커지고 있다. 우울증을 겪고 있는 사람의 경우 본인이 우울증이라고 인식하기 쉽지 않다. 인식을 하더라도 이미 상당히 심화된 경우가 많다. 스마트폰과 SNS는 현대사회를 살아가는 사람들에게 대개 필수적인 항목이다. 따라서 스마트폰과 SNS의 데이터는 사용자의 감정 상태를 파악할 근거가 될 수 있다. SNS의 텍스트 데이터를 분석하여 사용자의 우울감을 정량적으로 평가하는 모델을 만드는 것을 주제로 한다. 감정분석 모델은 KoNLPy의 Okt, Mecab, kkma를 사용하여 빈도기반의 임베딩을 할용한 다층 신경망과 Google의 BERT 네가지 모델을 활용한 연구를 진행하였다. KoNLPy의 각 라이브러리들과 BERT의 성능을 비교한 후에 Mecab의 성능을 개선하기 위해 BERT와 결합시켰다. 결합시킨 결과와 Mecab 단독으로 사용했을 때의 성능을 비교한다. 실험 결과 KoNLPy의 라이브러리 들과 BERT 모델이 90%이상의 정확도를 나타내었다. 모든 모델에서 적용가능한 수준의 정확도를 나타내어 SNS의 업로드된 텍스트 문장으로 사용자의 우울감을 정량적으로 평가할 수 있음을 확인하였다. |South Korea has the highest suicide rate among OECD countries. Recently, the importance of managing depression has been growing due to a series of extreme choices caused by depression by celebrities and celebrities. In addition, depression in society is growing out of sight, with the new term "corona blue," which refers to depression among marginalized people due to Covid-19. For people suffering from depression, it is not easy to recognize themselves as depression. Even if you recognize it, it is often already significantly intensified. Smartphones and SNS are usually essential items for people living in modern society. Therefore, data from smartphones and SNS can be the basis for understanding users' emotional states. The theme is to create a model that quantitatively evaluates users' depression by analyzing textual data on SNS. Emotional analysis models are conducted using KoNLPy's Okt, Mecab, and kkma to leverage multi-layer neural networks with frequency-based embeddings and Google's BERT four models. After comparing the performance of BERT with each library in KoNLPy, we combined it with BERT to improve the performance of Mecab. We compare the combined results with the performance when used alone by Mecab. Experiments have shown that KoNLPy's libraries and BERT models have more than 90% accuracy. We confirm that users' depression can be quantitatively evaluated with uploaded text sentences from SNS by representing applicable levels of accuracy in all models.
URI
http://hanyang.dcollection.net/common/orgView/200000498499https://repository.hanyang.ac.kr/handle/20.500.11754/164218
Appears in Collections:
GRADUATE SCHOOL OF ENGINEERING[S](공학대학원) > ELECTRICAL ENGINEERING AND COMPUTER SCIENCE(전기ㆍ전자ㆍ컴퓨터공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE