284 0

비금융 데이터와 이종 앙상블 학습을 활용한 신용 연체자 분류모형 연구

Title
비금융 데이터와 이종 앙상블 학습을 활용한 신용 연체자 분류모형 연구
Other Titles
Credit delinquency classification models using non-financial data and heterogeneous ensemble learning
Author
유철호
Alternative Author(s)
Chulho Yoo
Advisor(s)
송재욱
Issue Date
2023. 2
Publisher
한양대학교
Degree
Master
Abstract
금융기관은 대출을 통해 자금 수요자와 공급자를 매개하는 역할을 수행하지만 금융거래 당사자 간에는 정보 비대칭 문제가 항상 존재해왔다. 이런 비대칭 문제에 대한 해결책으로 제시되고 있는 비금융정보 기반 신용연체 분류모형은 금융정보만을 사용하는 전통적 금융정보 기반 평가 모형과 달리 신용거래 무경력자의 금융 건전성 파악에 용이하다고 알려져있다. 하지만 금융기관이 새로운 모형을 도입하기 위해서는 금융기관의 심사자들은 기 사용 중인 고객평가 프로세스의 변화 없이 전체 업무를 개선하려는데 목적을 두고 있기 때문에 실제 현장의 심사자들과 유사한 프로세스로 작동할 수 있는 방법이 필요하다. 또한 발전된 모형을 도입하는데 어렵게 하는 요인으로 GDPR을 위시한 신용정보법 개정에 의해 알고리즘에 기초한 신용평가 시 신용정보 주체의 설명요구권 및 이의를 제기할 수 있는 프로파일링 대응권이 있다. 이러한 맥락에서 설명 가능한 인공지능은 자동화된 금융업무 프로세스에서 고객에게 합리적인 결과를 제시할 수 있는 대안으로 떠오르고 있다. 본 연구는 다양한 머신러닝 알고리즘을 도입할 때 비금융정보가 갖는 분류 성능 개선 효과에 대해 비교하고 실제 심사 프로세스와 유사하며 기존 다수의 연구에서도 다뤄진 바 있는 이종 앙상블 방법의 효과와 한계를 탐색한다. 그리고 이종 앙상블에서 본 연구가 제안한 방법과 벤치마크 방법을 비교해 실제 심사에서 추구해야하는 비즈니스적 가치를 재고하며 이종 앙상블을 거친 평가모형에 XAI 기법 중 하나인 SHAP을 적용해 모형에서 중요하게 나타난 비금융정보의 의미를 분석한다. 결과적으로 비금융정보는 분류 성능의 개선 효과를 줄 수 있으나 활용에 있어 과적합을 방지하기 위한 변수의 적절한 수집과 선택이 필요함을 확인했다. 이종 앙상블 방법은 실제 심사 프로세스와 유사하게 활용할 때 정확도에서 모형을 개선할 수 있으나 불균형 지표에서는 가장 우수한 모형을 넘기 힘들었다. 비즈니스 측면으로는 제안한 방법을 통해 심사 기관에게 기대 손실을 최소화하는 것이 중요할 수 있다는 점을 발견했다. |Financial institutions act as intermediaries between the demanders and the suppliers of funds, but there exists an information asymmetry problem between the parties to financial loans. Unlike the traditional financial information-based evaluation model that uses only financial information, the non-financial information-based credit delinquency classification model, which is suggested as a solution to this asymmetric problem, is known to be easy to grasp the financial soundness of people without past credit transactions. However, for financial institutions to introduce a new model, financial institutions' reviewers need a method that can act similarly to actual field reviewers. They aim to improve their operations while maintaining the existing customer evaluation process. In addition, factors that make it difficult to introduce an advanced model include the right to demand explanation and the right to respond to profiling when evaluating credit based on algorithms by revising the Credit Information Act, including GDPR. In this context, explainable artificial intelligence is emerging as an alternative to present reasonable results to customers in automated financial business processes. This study compares the classification performance improvement effects of non-financial information when introducing various machine learning algorithms and explores the effects and limitations of heterogeneous ensemble methods, which are similar to actual screening processes and have been addressed in many existing studies. By comparing the methods proposed by this study with the benchmark methods in heterogeneous ensembles, we reconsider the business value to be pursued in actual screening, and apply SHAP, one of the XAI techniques, to the evaluation model that went through heterogeneous ensembles to analyze the meaning of non-financial information. As a result, non-financial information can have an effect of improving classification performance, but it was confirmed that appropriate collection and selection of variables are needed to prevent overfitting in its use. The heterogeneous ensemble method can improve the model in accuracy when used in a similar way to the actual judging process, but it has been difficult to overcome the best model in the imbalance performance measures. On the business side, we found that it may be important to minimize expected losses for screening institutions through the proposed method.
URI
http://hanyang.dcollection.net/common/orgView/200000649754https://repository.hanyang.ac.kr/handle/20.500.11754/180099
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > INDUSTRIAL ENGINEERING(산업공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE