470 0

불균형 데이터 분류를 위한 가우시안 혼합 모델 기반의 오버샘플링

Title
불균형 데이터 분류를 위한 가우시안 혼합 모델 기반의 오버샘플링
Other Titles
Oversampling based on Gaussian Mixture Model for Imbalanced data classification
Author
이강혁
Alternative Author(s)
Kanghyuck Lee
Advisor(s)
최정순
Issue Date
2020-02
Publisher
한양대학교
Degree
Master
Abstract
본 논문에서는 선행 연구에서 제시했던 군집화 기법인 가우시안 혼합 모델 (Gaussian Mixture Model)과 오버샘플링 기법인 SMOTE 기법을 결합하였던 것에 ADASYN, Borderline-SMOTE 기법들을 추가적으로 결합하여 분석을 시행한다. 가우시안 혼합 모델을 이용하여 소수 계급의 데이터를 군집화를 한 후, 3가지의 오버샘플링 기법을 통해 소수 계급의 데이터를 증가시킨 후 로지스틱 회귀 (Logistic Regression), 랜덤 포레스트 (Random Forest), 서포트 벡터 머신 (Support Vector Machine, SVM)을 이용하여 선행 연구에서 사용된 예제 데이터와 LDL-콜레스테롤 데이터를 분류한 후 성능을 비교 분석하였다. 또한 동일한 3가지의 오버샘플링 기법들과 언더샘플링 기법인 Tomek-Links 기법을 결합한 하이브리드 기법을 본 연구에서 제안한 방법과 비교하였다. 정확도, F1점수, 정밀도, 재현율, 와 AUC를 사용하여, 가우시안 혼합 모델과 ADASYN 또는 Borderline-SMOTE 기법을 결합하여 분석을 시행하였을 때 분류기의 정확도가 개선됨을 확인하였고 하이브리드 기법에 비해 분류기의 정확도가 높음을 확인하였다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/123629http://hanyang.dcollection.net/common/orgView/200000437397
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > APPLIED STATISTICS(응용통계학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE