주요 변수 선택과 Decision Tree를 활용한 개봉 첫 주 영화 흥행 예측에 대한 머신 러닝 기법 연구

Title
주요 변수 선택과 Decision Tree를 활용한 개봉 첫 주 영화 흥행 예측에 대한 머신 러닝 기법 연구
Authors
이정미
Advisor(s)
임규건
Issue Date
2018-02
Publisher
한양대학교
Degree
Master
Abstract
한국 영화시장의 규모는 날로 발전해가고 있으나 개별 영화의 수익 면에서는 밝지만은 않다. 대박영화가 아니면 손익분기점을 넘기기조차 어려운 것이 현실이다. 특히 고수익, 고위험을 가진 영화 산업은 초기 단계에서 영화 흥행을 예측하는 것이 중요하며 개봉 첫 주의 흥행 성적은 전체 흥행 성적을 좌우할 정도로 중요하다. 영화 흥행 예측 연구들이 많아지고 있지만 기존 연구들은 개봉이 이뤄지고 한참 지난 후의 데이터를 통해 영화의 흥행을 예측한다는 점에서 그 한계가 존재하였다. 따라서 본 연구에서는 개봉 전부터 개봉 당일까지의 데이터만을 사용하며 흥행 예측을 진행하였으며 영화의 기본적인 속성 데이터뿐 아니라 온라인 구전 효과와 인터넷 정보검색 행동에 대한 변수들을 포함하여 개봉 첫 주의 영화 흥행 예측 모델을 구축하였다. 또한 기존의 머신러닝 방식으로 구축된 모델과 변수선택을 통해 예측 정확도를 높인 모델을 비교분석하여 기존 방식에 비하여 예측의 정확도를 높인 모델을 제시하고자 하였다. 예측 변수 선택을 통한 모델의 경우 Support vector machine의 정확도는 79.84%로 기존의 모델에 비해 약 3.2% 개선되었으며, Neural network의 경우 정확도는 79.84%로 기존의 모델에 비하여 약 9.7% 예측 정확도가 향상되었음을 보였다. 따라서 예측 변수 선택을 통한 2개의 모델 모두 기존의 모델에 비하여 높은 정확도를 보인다는 것을 확인할 수 있었다. 본 연구를 통해 개봉 전부터 개봉 당일까지의 데이터를 사용하여 개봉 첫 주의 흥행을 예측함으로써 수요 예측과 이익이 가장 극대화 되는 스크린 수 배정이 가능해 질 것으로 기대한다. 또한 변수선택을 통한 예측 모델이 더 뛰어난 성능을 보일 수 있다는 것을 확인함으로서 영화 흥행예측에 있어서 기존의 다양한 변수를 활용하는 것보다는 변수선택을 통해 예측을 하는 것이 더 효과적임을 밝혀낼 수 있었다.
URI
http://www.dcollection.net/handler/hanyang/000000105973http://repository.hanyang.ac.kr/handle/20.500.11754/68153
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > BUSINESS INFORMATICS(비즈니스인포매틱스학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE