830 0

불균형 데이터 분류를 위한 언더샘플링 앙상블 계층적 서포트 벡터 머신

Title
불균형 데이터 분류를 위한 언더샘플링 앙상블 계층적 서포트 벡터 머신
Other Titles
EUS Multiple-Layer Hierarchical SVM for Imbalanced Data Classification
Author
이승헌
Advisor(s)
차경준
Issue Date
2018-02
Publisher
한양대학교
Degree
Master
Abstract
불균형 데이터 분류 문제는 드물게 발생하지만 중요하게 다루어지는 희귀한 사건들을 감지하는데 활용된다. 머신러닝 분류모델들은 대부분 균형 데이터를 가정하고 만들어졌기 때문에 불균형 데이터에 대해서는 좋지 못한 분류 성능을 보이게 된다. 이를 해소하기 위한 다양한 연구들이 활발하게 진행되어 왔다. 언더샘플링 앙상블은 학습데이터로부터 다수의 언더샘플링 데이터집합을 추출하여 학습한 다수의 분류모델을 앙상블 결합한다. 이는 언더샘플링의 단점과 오버샘플링의 단점을 보완하지만, 소수범주의 비중이 커지고 다수범주의 비중은 줄어드는 분포 왜곡효과가 중첩되어 다수범주의 정확도를 심각하게 낮추는 단점을 갖고 있다. 본 논문에서는 언더샘플링 앙상블 서포트벡터머신을 계층적으로 결합하여 기존 소수범주의 정확도를 유지하면서 다수범주의 정확도를 높이는 계층적 모델을 제안한다. 불균형 정도가 다른 데이터에 적용해본 결과, 제안된 계층적 모델의 층이 깊어짐에 따라 소수범주의 정확도는 일정 수준으로 유지하고 다수범주의 정확도는 향상되는 것을 확인할 수 있었다. 또한 보다 복잡한 실제 개별교통사고데이터로부터 사망 교통사고를 예측 분류하는 문제에서 유사한 효과를 확인할 수 있었다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/68399http://hanyang.dcollection.net/common/orgView/200000432557
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > APPLIED STATISTICS(응용통계학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE