1274 0

Full metadata record

DC FieldValueLanguage
dc.contributor.advisor최정순-
dc.contributor.author이강혁-
dc.date.accessioned2020-02-11T03:55:25Z-
dc.date.available2020-02-11T03:55:25Z-
dc.date.issued2020-02-
dc.identifier.urihttps://repository.hanyang.ac.kr/handle/20.500.11754/123629-
dc.identifier.urihttp://hanyang.dcollection.net/common/orgView/200000437397en_US
dc.description.abstract본 논문에서는 선행 연구에서 제시했던 군집화 기법인 가우시안 혼합 모델 (Gaussian Mixture Model)과 오버샘플링 기법인 SMOTE 기법을 결합하였던 것에 ADASYN, Borderline-SMOTE 기법들을 추가적으로 결합하여 분석을 시행한다. 가우시안 혼합 모델을 이용하여 소수 계급의 데이터를 군집화를 한 후, 3가지의 오버샘플링 기법을 통해 소수 계급의 데이터를 증가시킨 후 로지스틱 회귀 (Logistic Regression), 랜덤 포레스트 (Random Forest), 서포트 벡터 머신 (Support Vector Machine, SVM)을 이용하여 선행 연구에서 사용된 예제 데이터와 LDL-콜레스테롤 데이터를 분류한 후 성능을 비교 분석하였다. 또한 동일한 3가지의 오버샘플링 기법들과 언더샘플링 기법인 Tomek-Links 기법을 결합한 하이브리드 기법을 본 연구에서 제안한 방법과 비교하였다. 정확도, F1점수, 정밀도, 재현율, 와 AUC를 사용하여, 가우시안 혼합 모델과 ADASYN 또는 Borderline-SMOTE 기법을 결합하여 분석을 시행하였을 때 분류기의 정확도가 개선됨을 확인하였고 하이브리드 기법에 비해 분류기의 정확도가 높음을 확인하였다.-
dc.publisher한양대학교-
dc.title불균형 데이터 분류를 위한 가우시안 혼합 모델 기반의 오버샘플링-
dc.title.alternativeOversampling based on Gaussian Mixture Model for Imbalanced data classification-
dc.typeTheses-
dc.contributor.googleauthor이강혁-
dc.contributor.alternativeauthorKanghyuck Lee-
dc.sector.campusS-
dc.sector.daehak대학원-
dc.sector.department응용통계학과-
dc.description.degreeMaster-
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > APPLIED STATISTICS(응용통계학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE