291 0

로지스틱 회귀모형과 랜덤포레스트를 혼합한 변수선택법에 기반하여 의사결정나무를 이용한 외래 관광객 만족도 분석

Title
로지스틱 회귀모형과 랜덤포레스트를 혼합한 변수선택법에 기반하여 의사결정나무를 이용한 외래 관광객 만족도 분석
Other Titles
An Analysis on Foreign Tourists Satisfaction using Dicision Tree based on a Combination of Logistic Regression Model and Random Forest
Author
오세웅
Advisor(s)
차경준
Issue Date
2017-02
Publisher
한양대학교
Degree
Master
Abstract
본 연구는 2013년1월부터 2015년 12월까지 3년 동안 국내여행을 한 외래 관광객을 조사대상으로 한국문화체육관광부에서 발표한 ‘외래 관광객 실태조사’ 설문지 데이터를 활용하여 외래 관광객의 만족도를 확인하고 매우 만족한 집단의 특징을 파악하고자 한다. 분석모형은 의사결정나무의 CART, CHAID, CTree 알고리즘 중 가장 높게 분류되는 모델을 사용하였다. 그 결과 CART 알고리즘이 가장 잘 분류되었다. 목표변수는 만족도로 지정하였고, 만족도가 매우 높은 외국인 관광객들의 특징을 잡아내기 위해 의사결정나무의 CART 모델을 사용하였다. 과적합을 막기 위해 변수들을 선택하는 방법은 데이터 마이닝 기법 중 로지스틱 회귀모형, 의사결정나무(C4.5), 랜덤포레스트, 인공신경망, 로지스틱 회귀모형과 랜덤포레스트를 혼합한 모델을 사용하여, 정확도와 민감도가 가장 높은 방법을 사용하였다. 그 결과 로지스틱 회귀모형과 랜덤포레스트를 혼합하여 사용하면 조사연도, 연령, 거주국, 활동내역의 변수를 선택하게 되고, 이 선택 된 변수들로 더 높은 민감도를 보였다. 기존에 주로 사용되고 있는 변수선택 방법들을 혼합하여 변수선택을 하였고 외래 관광객 데이터를 분석할 때에는 이 혼합방법을 이용하는 변수를 선택하는 것이 좋은 성능을 나타낸다. 본 연구로 빅데이터를 연구함에 있어 좋은 예측력과 분류 특징을 잡아내는 분류 모델을 만들었고, 연구의 결과는 향후 외국인 관광객 유치를 위한 효과적인 마케팅전략 수립 시 기초 자료로 활용이 가능할 것이라고 사료 된다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/124612http://hanyang.dcollection.net/common/orgView/200000430057
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > APPLIED STATISTICS(응용통계학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE