208 0

응급의료서비스에서 엘라스틱넷 기반 로그우도함수를 대입한 회귀분석 방안

Title
응급의료서비스에서 엘라스틱넷 기반 로그우도함수를 대입한 회귀분석 방안
Other Titles
A Regression Analysis Method Using Elastic Net-Based Log-Likelihood Function in Emergency Medical Service
Author
강대한
Advisor(s)
조인휘
Issue Date
2023. 2
Publisher
한양대학교
Degree
Master
Abstract
중앙응급센터의 응급의료 통계 조사에 따르면 자체통계품질진단 평가를 통하여 98.8%의 정확도를 가지고 서비스를 제공하고 있다. 해당 논문에서는 회귀분석을 통한 데이터의 세분화 작업과 분류, 집단별 특성을 파악하고 기존 회귀분석과 비교하여 데이터 분석의 정확도와 질적 향상을 목표로 하고 있다. 회귀분석에서 가장 많이 사용하는 최소제곱법(OLS)은 잔차제곱합을 최소로 하는 추정량을 구하는 방법이다. 데이터가 많아지면 계산량이 많이 증가한다는 점과 노이즈(outlier)에 취약하다는 단점이 있다. 의료데이터 특성상 조건부 확률의 설명변수들이 단조 함수로 표현되기 때문에 모형 설정에 있어서 최소제곱법으로 정밀한 추정을 하기 어렵다. 회귀 계수의 추정은 𝑿의 선형인 로짓에 의해 만들어지며, 이때 로짓은 likelihood(가능도)를 최대로 해 주는 직선에 해당한다. 그래서, 로지스틱 회귀모형의 회귀계수 추정은 𝒴축이log인 것을 제외하면 선형 회귀모형과 정확하게 일치하므로 기존 잔차제곱합 부분을 로그우도함수로 대체 가능하다고 판단되어 본 논문에서 진행하게 될 방법론으로 엘라스틱 넷(Elastic Net regression analysis)의 잔차제곱합 부분을 로지스틱 회귀모형의 로그우도함수로 대체하는 방법으로 연구를 진행하게 되었다. 해당 방법론을 실제 데이터에 적용하여 도출된 결과로는 첫째, 의료데이터 특성상 조건부 확률이 설명변수들의 단조 함수로 표현하기 때문에 모형 설정에 있어 어려움이 있는 부분을 로그우도함수를 통해 각 범주형 변수 0 또는 1로 표현하여 회귀계수 값들이 축소되는 것을 확인 할 수 있었으며, 이로 인해 변수 선택에 있어서 효과적인 선택을 할 수 있다. 둘째, 설명 변수 간의 상관이 존재하는 다변량정규분포에서 난수를 생성하고, 설명 변수 값이 로지스틱 회귀모형에서 난수를 생성하여 진행이 가능함을 확인 하였다. 셋째, 엘라스틱넷 회귀모델을 적용하여 변수선택과 다중공선성 문제를 해결하였으며, 최소제곱법을 적용하여 예상되는 문제를 로지스틱 회귀모형의 로그우도함수 적용하여 해결 가능 하다는 것을 확인 하였다. |According to the Emergency Medical Statistics Survey of the Central Emergency Center, the service is provided with 98.8% accuracy through self-statistical quality diagnosis evaluation. In order to conduct research on improving the overall emergency system and improving the quality of emergency medical services in developed countries, and to realize public information opening and sharing for trusted emergency medical services, this paper aims to improve the accuracy and quality of data analysis compared to existing regression analysis. The least squares method (OLS), which is most commonly used in regression analysis, is a method of obtaining an estimate that minimizes the sum of residual squares. Although it is a relatively simple calculation method, it has the disadvantages of very increasing computation volume and being vulnerable to noise as data increases. Due to the nature of medical data, it is difficult to accurately estimate with the least squares method in setting the model because the explanatory variables of the conditional probability are expressed as monotonous functions. The estimation of the underlying regression coefficient is made by a logit that is linear with respect to X, where the estimated logit corresponds to a straight line that maximizes the likelihood. Therefore, since the estimation of the regression coefficient of the logistic regression model is exactly the same as the linear regression model except that the 𝒴 axis is log (Odds), it is judged that the existing residual square part can be replaced with a log-likelihood function. First, since the conditional probability is expressed as a monotonous function of explanatory variables due to the nature of medical data, it was confirmed that each categorical variable was reduced by a value of 0, or 1. Second, it was confirmed that random numbers were generated from multivariate normal distributions where there was a correlation between explanatory variables, and random numbers were generated from logistic regression models given explanatory variable values. Third, the ElasticNet regression model was applied to solve the variable selection and multicollinearity problem, and the least squares method was applied to confirm that the expected problem could be solved by applying the log-likelihood function of the logistic regression model.
URI
http://hanyang.dcollection.net/common/orgView/200000655306https://repository.hanyang.ac.kr/handle/20.500.11754/180263
Appears in Collections:
GRADUATE SCHOOL OF ENGINEERING[S](공학대학원) > ELECTRICAL ENGINEERING AND COMPUTER SCIENCE(전기ㆍ전자ㆍ컴퓨터공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE