42 0

D램 생산량 예측을 위한 Backcasting ARIMA 기반의 Random Forest알고리즘

Title
D램 생산량 예측을 위한 Backcasting ARIMA 기반의 Random Forest알고리즘
Other Titles
A Random Forest Algorithm based on Backcasting ARIMA for DRAM Production Prediction
Author
이정웅
Advisor(s)
조인휘
Issue Date
2020-02
Publisher
한양대학교
Degree
Master
Abstract
본 논문은 데이터가 충분치 않은 Random Forest 모델에 대하여 가상 과거데이터를 활용해 데이터를 증가한 모델과 기존의 데이터만 사용한 모델과의 비교를 통해 성능향상을 검증 하는 것이다. 해당 연구를 위해 한국 경제와 4차 산업의 핵심산업으로 주목 받고 있는 메모리 반도체 산업의 DRAM 생산량 예측을 선정 하였다. 모델에 활용한 데이터는 한국은행 경제통계 시스템과 ICT 통계분석 시스템의 데이터를 사용했다. 구현은 머신러닝 프레임워크(Scikit-learn)와 라이브러리를 제공하는 Python 기반의 Anaconda를 통해 구현 하였다. 가상 과거 데이터는 ARIMA 모델의 Backcasting을 활용해 추정 하였고 Random Forest 모델의 전처리 과정에서 원본 데이터와의 합산을 통하여 증가 시켰다. 성능 평가는 데이터를 증가시킨 모델과 원본 데이터만을 이용한 두 가지 Random Forest모델에 대하여 비교 평가를 진행하였고 RMSLE, K-겹 교차검증, 훈련세트 정확도, 테스트세트 정확도 점수를 통해 실시 하였다. RMSLE의 경우 모델의 트리의 개수(n_estimators)를 0 ~ 500개까지 실행하여 비교 평가를 진행 하였다. 성능 평가 결과 ARIMA 모델을 이용하여 가상 과거 데이터와의 합산을 통해 데이터를 증가시킨 Random Forest 모델이 K-겹 교차검증, 테스트세트 정확도가 평균 0.01의 더 좋은 성능을 보였다. RMSLE 평가 결과로는 데이터를 증가시킨 모델이 0.129223으로 원본 데이터만을 사용한 모델의 0.130492 보다 0.001269 차이로 우월한 성능을 보였다. 결과적으로 데이터가 충분하지 않을 경우 Backcasting ARIMA 모델로 데이터를 증가시킨 Random Forest 모델을 통해 기존의 원본데이터를 사용한 Random Forest 모델의 성능을 향상시킬 수 있음을 입증 할 수 있었다.
URI
http://dcollection.hanyang.ac.kr/common/orgView/000000111832https://repository.hanyang.ac.kr/handle/20.500.11754/122947
Appears in Collections:
GRADUATE SCHOOL OF ENGINEERING[S](공학대학원) > ELECTRICAL ENGINEERING AND COMPUTER SCIENCE(전기ㆍ전자ㆍ컴퓨터공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE