72 0

가맹점 거래의 효율적 분류를 위한 머신러닝 기반의 스태킹 앙상블 기법

Title
가맹점 거래의 효율적 분류를 위한 머신러닝 기반의 스태킹 앙상블 기법
Other Titles
Efficient Classification of Merchant Transactions Using Machine Learning-Based Stacking Ensemble
Author
임충훈
Alternative Author(s)
Lim Chunghun
Advisor(s)
조인휘
Issue Date
2024. 2
Publisher
한양대학교 공학대학원
Degree
Master
Abstract
본 논문은 한국의 카드 결제 산업 발전과 가맹점의 금융적 피해 감소를 목표로 진행하였다. 카드 결제 산업은 지난 50년 동안 크게 성장했으며, 카드사를 필두로 한 부정거래 적발 시스템(FDS)의 개발과 연구는 활발하게 이루어지고 있다. 나아가 머신러닝 기술을 도입하여 상용화 성공하였다. 그런데도 카드 결제 전반에 있어서, 매입과 정산 과정에서의 문제점들이 여전히 존재한다. 따라서 본 연구는 VAN 사의 다양한 역할 중 매입 프로세스에 중점을 두고 진행하였다. 본 연구에서는 카드 결제의 매입 전표 분류 과정을 효율적으로 처리하기 위해 다양한 머신러닝 알고리즘을 활용하였다. 이를 위해 10가지의 다중 분류 알고리즘을 적용하고, 이들 알고리즘의 성능을 비교 평가하였다. 또한, 최종 분류기인 로지스틱 회귀 알고리즘을 제외한, 9가지 알고리즘을 조합하여 84개의 스태킹 앙상블 모델을 구현하고 그 성능을 평가하였다. 이 과정에서 실제 가맹점에서 발생한 거래 내역을 데이터셋으로 활용하여 최적화된 스태킹 앙상블 모델을 설계 및 구현하였다. 본 논문의 핵심 제안은 스태킹(Stacking) 앙상블 모델을 활용한 가맹점 거래 데이터의 효율적인 분류이다. 여러 베이스 모델(Base Model)과 이들을 결합한 앙상블 모델(Ensemble Model)을 사용하여 최적의 분류 모델을 찾는 것이 목표이다. 이를 위해 기본 모델을 조합하는 Combiner를 구현하여 가능한 모든 조합에 대해 모델을 실행하고 성능을 측정하였다. 각 모델 조합의 성능평가는 혼동행렬(Confusion Matrix)과 여러 성능 지표들(정확도, 정밀도, 재현율, F1-Score)을 사용하여 측정 및 평가하였고, 최적의 스태킹 앙상블 모델은 이러한 성능 지표를 바탕으로 선별되었으며, 실제 가맹점 거래 데이터에 적용하여 그 효과를 평가하였다. 주요 실험 결과로는 스태킹 앙상블 모델들이 기본 단일 모델들보다 우수한 성능을 보였다는 점이다. 특히, Support Vector Machine – Random Forest -Gaussian NB 조합의 스태킹 앙상블 모델이 정확도 97.703%, F1-Score76,833%로 가장 안정적이고 높은 성능을 보였으며, 이 수치는 타 모델 대비 0.14%에서 많게는 1.64%의 성능이 더 좋다는 것을 입증하였다.
URI
http://hanyang.dcollection.net/common/orgView/200000725674https://repository.hanyang.ac.kr/handle/20.500.11754/189244
Appears in Collections:
GRADUATE SCHOOL OF ENGINEERING[S](공학대학원) > ELECTRICAL ENGINEERING AND COMPUTER SCIENCE(전기ㆍ전자ㆍ컴퓨터공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE