810 0

텍스트 마이닝을 이용한 주가지수 예측

Title
텍스트 마이닝을 이용한 주가지수 예측
Other Titles
Prediction of Stock Market Fluctuation Using Text Mining
Author
박혁인
Alternative Author(s)
PARK HYEOKIN
Advisor(s)
김명직
Issue Date
2021. 8
Publisher
한양대학교
Degree
Master
Abstract
본 논문은 텍스트 마이닝을 이용해 주가지수를 예측하는 연구로 데이터 수집과 분류모델 구축까지 연구과정을 중심으로 담고 있다. 금융시장에서 정보는 수익과 연결되는 중요한 요인이며 BERT를 이용해 증권사 보고서를 다음 달의 주가지수의 상승과 하락 값을 지도학습해 모델을 구성해 정확도를 기준으로 증권사 보고서가 담고 있는 어조와 정보의 질을 이용한 예측모델을 설계했다. 크롤링 기법을 활용해 증권사 보고서를 수집하고 분석을 위해 PDF에서 TXT파일로 변환해 총 15,484개의 보고서를 확보했다. 확보한 데이터는 전처리 작업을 통해 불용어와 필요하지 않은 텍스트를 여과했다. 이후 KoBERT를 이용해 사전 학습된 임베딩 모델로 Tokenization과 Vectorization을 진행했으며 다음 달 주가지수 방향을 0과1로 Labeling해 지도학습 했다. 분류 정확도는 60%정도로 이진 분류모델임을 고려할 때 낮은 정확도를 보였다. 이는 증권사 보고서가 가지는 고유한 특수성이 정확도에 영향을 준 것으로 생각되며 특수성을 제어해 모델을 구축할 수 있다면 모델의 성능향상을 기대해 볼 수 있다. 또한 특수성을 제어한 분류모델을 토대로 증권사 보고서가 담은 정보의 질과 어조를 파악할 수 있어 증권사 보고서의 주 이용자인 개인투자자들의 기관투자자 신뢰도를 재고 할 수 있을 것으로 기대된다.
URI
http://hanyang.dcollection.net/common/orgView/200000500422https://repository.hanyang.ac.kr/handle/20.500.11754/164393
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > ECONOMICS & FINANCE(경제금융학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE