Repository at Hanyang University: 불균형 데이터 분류를 위한 가우시안 혼합 모델 기반의 오버샘플링

Browse

My Repository

Repository at Hanyang UniversityGRADUATE SCHOOL[S](대학원)APPLIED STATISTICS(응용통계학과)Theses (Master)

1274 0

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	최정순	-
dc.contributor.author	이강혁	-
dc.date.accessioned	2020-02-11T03:55:25Z	-
dc.date.available	2020-02-11T03:55:25Z	-
dc.date.issued	2020-02	-
dc.identifier.uri	https://repository.hanyang.ac.kr/handle/20.500.11754/123629	-
dc.identifier.uri	http://hanyang.dcollection.net/common/orgView/200000437397	en_US
dc.description.abstract	본 논문에서는 선행 연구에서 제시했던 군집화 기법인 가우시안 혼합 모델 (Gaussian Mixture Model)과 오버샘플링 기법인 SMOTE 기법을 결합하였던 것에 ADASYN, Borderline-SMOTE 기법들을 추가적으로 결합하여 분석을 시행한다. 가우시안 혼합 모델을 이용하여 소수 계급의 데이터를 군집화를 한 후, 3가지의 오버샘플링 기법을 통해 소수 계급의 데이터를 증가시킨 후 로지스틱 회귀 (Logistic Regression), 랜덤 포레스트 (Random Forest), 서포트 벡터 머신 (Support Vector Machine, SVM)을 이용하여 선행 연구에서 사용된 예제 데이터와 LDL-콜레스테롤 데이터를 분류한 후 성능을 비교 분석하였다. 또한 동일한 3가지의 오버샘플링 기법들과 언더샘플링 기법인 Tomek-Links 기법을 결합한 하이브리드 기법을 본 연구에서 제안한 방법과 비교하였다. 정확도, F1점수, 정밀도, 재현율, 와 AUC를 사용하여, 가우시안 혼합 모델과 ADASYN 또는 Borderline-SMOTE 기법을 결합하여 분석을 시행하였을 때 분류기의 정확도가 개선됨을 확인하였고 하이브리드 기법에 비해 분류기의 정확도가 높음을 확인하였다.	-
dc.publisher	한양대학교	-
dc.title	불균형 데이터 분류를 위한 가우시안 혼합 모델 기반의 오버샘플링	-
dc.title.alternative	Oversampling based on Gaussian Mixture Model for Imbalanced data classification	-
dc.type	Theses	-
dc.contributor.googleauthor	이강혁	-
dc.contributor.alternativeauthor	Kanghyuck Lee	-
dc.sector.campus	S	-
dc.sector.daehak	대학원	-
dc.sector.department	응용통계학과	-
dc.description.degree	Master	-

Appears in Collections:: GRADUATE SCHOOL[S](대학원) > APPLIED STATISTICS(응용통계학과) > Theses (Master)

Files in This Item:

Export: RIS (EndNote); XLS (Excel); XML

Show simple item record

qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

한양대학교 리포지터리는 국립중앙도서관 OAK 보급사업으로 구축되었습니다. Feedback 개인정보처리방침

BROWSE