545 0

혼합 변수 기반 자동차보험 데이터의 샘플링 기법을 활용한 사기 예측

Title
혼합 변수 기반 자동차보험 데이터의 샘플링 기법을 활용한 사기 예측
Other Titles
Instance-based Resampling for Fraud Detection in Mixed-Attribute Auto Insurance Data
Author
임남경
Advisor(s)
배석주
Issue Date
2020-02
Publisher
한양대학교
Degree
Master
Abstract
보험이란 우발적으로 발생하는 일정한 위험(사고)에서 생기는 경제적 타격이나 부담을 덜어주기 위하여 다수의 경제주체가 협동하여 합리적으로 산정된 금액을 조달하고 지급하는 경제적 제도이며, 이중 자동차보험은 보험계약자가 자동차를 소유·사용 또는 관리하는 동안 발생한 사고로 인하여 생긴 손해를 보상하는 보험을 지칭한다. 보험계약자가 자동차보험을 미래의 손해에 대한 보상이 아닌 보험 사기를 통한 개인의 불법적인 이득으로 사용하는 경우, 불필요한 보험금 지출로 인하여 다른 보험계약자가 지불하는 보험료 상승의 원인이 되며 이는 사회적 비용의 증가로 이어지므로, 보험사기의 대한 적발 및 관리가 반드시 필요하다. 자동차보험 청구 데이터는 보험계약과 보험금 청구 및 사기 조사에 대한 기록이 정리된 자료를 지칭하며, 보험계약자, 소유차량, 사고기록 등의 다양한 자료의 범주형 변수와 수치형 변수로 구성되어 있고. 정상으로 구분된 범주와 비정상(사기)로 구분되어 있는 범주의 수의 차이가 극심한 불균형 데이터의 특징을 가지고 있다. 현재까지 많은 연구들이 자동차보험 청구 데이터에서 사기를 구분하는 예측모델을 제안하였다. 다수의 논문에서 데이터의 변수들을 L2-norm, 유클리드 거리(euclidean distance) 등의 기하학적인 구분을 통한 과소 표본 추출법(undersampling)과 데이터마이닝(data mining)으로 정상과 사기의 불균형 문제를 해결하고 분류모델(classifier)에 적용하는 예측 방법을 제시하였지만 낮은 정확도 성능을 보이고 있다. 본 논문에서는 자동차보험 청구 데이터의 변수 특성을 활용한 샘플링 기법으로 데이터 불균형을 해결하여, 분류의 정확도를 높이는 사기 예측모델을 제안하였다. 데이터의 불균형은 분류 모델의 낮은 정확도 성능을 유발하므로, 데이터 변수들 간 연관관계(association rule)의 지지도를 활용한 과소 표본 추출법(undersampling)을 적용하였으며, 불균형을 해소한 데이터로 기계학습 기반의 분류모델을 적용하여 사기 검출 분류 정확도를 향상시켰다. 즉, 본 논문에서는 새롭게 제안하는 과소 표본 추출법을 이용하여 데이터를 재구성하고, 이를 적용하여 자동차보험 청구 데이터의 사기 예측 문제를 해결하고자 한다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/123446http://hanyang.dcollection.net/common/orgView/200000437821
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > INDUSTRIAL ENGINEERING(산업공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE