로지스틱 회귀모형과 랜덤포레스트를 혼합한 변수선택법에 기반하여 의사결정나무를 이용한 외래 관광객 만족도 분석
- Title
- 로지스틱 회귀모형과 랜덤포레스트를 혼합한 변수선택법에 기반하여 의사결정나무를 이용한 외래 관광객 만족도 분석
- Other Titles
- An Analysis on Foreign Tourists Satisfaction using Dicision Tree based on a Combination of Logistic Regression Model and Random Forest
- Author
- 오세웅
- Advisor(s)
- 차경준
- Issue Date
- 2017-02
- Publisher
- 한양대학교
- Degree
- Master
- Abstract
- 본 연구는 2013년1월부터 2015년 12월까지 3년 동안 국내여행을 한 외래 관광객을 조사대상으로 한국문화체육관광부에서 발표한 ‘외래 관광객 실태조사’ 설문지 데이터를 활용하여 외래 관광객의 만족도를 확인하고 매우 만족한 집단의 특징을 파악하고자 한다.
분석모형은 의사결정나무의 CART, CHAID, CTree 알고리즘 중 가장 높게 분류되는 모델을 사용하였다. 그 결과 CART 알고리즘이 가장 잘 분류되었다. 목표변수는 만족도로 지정하였고, 만족도가 매우 높은 외국인 관광객들의 특징을 잡아내기 위해 의사결정나무의 CART 모델을 사용하였다.
과적합을 막기 위해 변수들을 선택하는 방법은 데이터 마이닝 기법 중 로지스틱 회귀모형, 의사결정나무(C4.5), 랜덤포레스트, 인공신경망, 로지스틱 회귀모형과 랜덤포레스트를 혼합한 모델을 사용하여, 정확도와 민감도가 가장 높은 방법을 사용하였다.
그 결과 로지스틱 회귀모형과 랜덤포레스트를 혼합하여 사용하면 조사연도, 연령, 거주국, 활동내역의 변수를 선택하게 되고, 이 선택 된 변수들로 더 높은 민감도를 보였다. 기존에 주로 사용되고 있는 변수선택 방법들을 혼합하여 변수선택을 하였고 외래 관광객 데이터를 분석할 때에는 이 혼합방법을 이용하는 변수를 선택하는 것이 좋은 성능을 나타낸다.
본 연구로 빅데이터를 연구함에 있어 좋은 예측력과 분류 특징을 잡아내는 분류 모델을 만들었고, 연구의 결과는 향후 외국인 관광객 유치를 위한 효과적인 마케팅전략 수립 시 기초 자료로 활용이 가능할 것이라고 사료 된다.
- URI
- https://repository.hanyang.ac.kr/handle/20.500.11754/124612http://hanyang.dcollection.net/common/orgView/200000430057
- Appears in Collections:
- GRADUATE SCHOOL[S](대학원) > APPLIED STATISTICS(응용통계학과) > Theses (Master)
- Files in This Item:
There are no files associated with this item.
- Export
- RIS (EndNote)
- XLS (Excel)
- XML