Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | 최정순 | - |
dc.contributor.author | 이강혁 | - |
dc.date.accessioned | 2020-02-11T03:55:25Z | - |
dc.date.available | 2020-02-11T03:55:25Z | - |
dc.date.issued | 2020-02 | - |
dc.identifier.uri | https://repository.hanyang.ac.kr/handle/20.500.11754/123629 | - |
dc.identifier.uri | http://hanyang.dcollection.net/common/orgView/200000437397 | en_US |
dc.description.abstract | 본 논문에서는 선행 연구에서 제시했던 군집화 기법인 가우시안 혼합 모델 (Gaussian Mixture Model)과 오버샘플링 기법인 SMOTE 기법을 결합하였던 것에 ADASYN, Borderline-SMOTE 기법들을 추가적으로 결합하여 분석을 시행한다. 가우시안 혼합 모델을 이용하여 소수 계급의 데이터를 군집화를 한 후, 3가지의 오버샘플링 기법을 통해 소수 계급의 데이터를 증가시킨 후 로지스틱 회귀 (Logistic Regression), 랜덤 포레스트 (Random Forest), 서포트 벡터 머신 (Support Vector Machine, SVM)을 이용하여 선행 연구에서 사용된 예제 데이터와 LDL-콜레스테롤 데이터를 분류한 후 성능을 비교 분석하였다. 또한 동일한 3가지의 오버샘플링 기법들과 언더샘플링 기법인 Tomek-Links 기법을 결합한 하이브리드 기법을 본 연구에서 제안한 방법과 비교하였다. 정확도, F1점수, 정밀도, 재현율, 와 AUC를 사용하여, 가우시안 혼합 모델과 ADASYN 또는 Borderline-SMOTE 기법을 결합하여 분석을 시행하였을 때 분류기의 정확도가 개선됨을 확인하였고 하이브리드 기법에 비해 분류기의 정확도가 높음을 확인하였다. | - |
dc.publisher | 한양대학교 | - |
dc.title | 불균형 데이터 분류를 위한 가우시안 혼합 모델 기반의 오버샘플링 | - |
dc.title.alternative | Oversampling based on Gaussian Mixture Model for Imbalanced data classification | - |
dc.type | Theses | - |
dc.contributor.googleauthor | 이강혁 | - |
dc.contributor.alternativeauthor | Kanghyuck Lee | - |
dc.sector.campus | S | - |
dc.sector.daehak | 대학원 | - |
dc.sector.department | 응용통계학과 | - |
dc.description.degree | Master | - |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.