520 0

데이터 연결 정책변수가 연결 데이터 성능에 미치는 영향 : 채무불이행 예측 실험연구

Title
데이터 연결 정책변수가 연결 데이터 성능에 미치는 영향 : 채무불이행 예측 실험연구
Other Titles
Impact of Data Linkage Policy Variables on Linked Data Performance : An Experimental Study on the Default Prediction
Author
봉하윤
Alternative Author(s)
Bong, Ha Yun
Advisor(s)
장석권
Issue Date
2021. 2
Publisher
한양대학교
Degree
Master
Abstract
일명 데이터 3법이 2018년 11월 국회에 발의되어 2020년 1월 본회의를 통과, 8월 5일 시행되었다. 데이터 3법은 개인정보를 가명정보화해 분석을 목적으로 한다면 데이터 거래를 허용해주는 내용을 담고 있는 개정안이다. 이는 기업들이 가명정보를 사 가지고 있는 정보와 연결한다면 데이터 분석을 더 유용하게 수행할 수 있다. 사들인 정보와 기존 정보를 연결해주는 기술이 데이터 연결이다. 데이터 연결에 관한 연구는 주로 기술적인 부분에 초점이 맞춰져 다양한 방법들이 연구되고 있다. 하지만 데이터 연결 과정에서 필연적으로 발생하는 연결 오류에 관한 연구는 아직 미흡하다. 기존의 연결 오류 연구들은 연결 오류를 데이터연결 과정의 품질을 평가하기 위한 척도로 사용했다. 실제 상황에서 중요한 것은 연결 오류가 왜 발생하고 그에 따라 데이터 분석 결과에는 어떻게 영향을 미치느냐이다. 즉, 연결 오류가 포함된 데이터일지라도 활용할 수 있는지가 중요하다. 본 연구는 두 가지의 연구를 진행하였다. 첫 번째는 데이터 연결 정책변수가 연결 오류에 영향을 미치는지에 대해서 연구하였다. 두 번째는 데이터 연결 정책변수가 연결 데이터 예측 정확도에 영향을 미치는지에 대해서 연구하였다. 미국 중소기업청(SBA)의 기업 채무불이행 데이터를 사용하여 데이터를 분리한 후 데이터 연결 정책변수인 공통속성의 구성, 데이터 연결 방법, 훈련 /시험 데이터 비율을 조합해 데이터를 연결했으며 연결된 데이터를 가지고 채무불이행 예측모델을 만들어 연결 데이터의 성능을 비교하였다. 본 연구의 실험 결과는 다음과 같다. 데이터 연결 정책변수 중 공통속성의 구성과 훈련 / 시험 데이터 비율이 연결 오류에 영향을 미친다. 데이터 연결 정책변수 중 공통속성의 구성과 훈련 / 시험 데이터 비율이 연결 데이터 예측 정확도에 영향을 미친다. 본 논문은 데이터 연결 정책변수가 연결 오류와 연결 데이터 예측 정확도인 연결 데이터 성능에 영향을 미치는 것을 확인하였다. 또한, 데이터 연결에서 연결 오류가 매우 엄격한 기준점이 아니라는 것을 확인하였다. 이를 통해 기업들은 데이터를 연결하는 데 효율적인 연결 전략을 수립할 수 있다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/159564http://hanyang.dcollection.net/common/orgView/200000485936
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > BUSINESS INFORMATICS(비즈니스인포매틱스학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE