256 0

심층 확장 위험 모형 빠른 추정을 위한 히스토그램 적용 알고리즘

Title
심층 확장 위험 모형 빠른 추정을 위한 히스토그램 적용 알고리즘
Other Titles
A Fast Algorithm for computing Estimation of Deep Extended Hazards Model using Histogram
Author
신기수
Advisor(s)
차경준
Issue Date
2023. 2
Publisher
한양대학교
Degree
Master
Abstract
생존분석에서 생존시간을 추정하기 위한 방법론으로 Cox(1972)가 제안한 콕스 비례위험 모형(Cox Proportional Hazard model)이다. 콕스 비례위험 모형은 표본의 생존시간을 추정하면서 독립변수 사이의 관계를 확인할 수 있는 회귀모형이다. Etezadi-Amoli & Ciampi(1985)는 콕스 비례위험 모형의 일반화한 확장된 위험 모형(Extended Hazards model)을 제안했다. Zhong et al.(2021)은 인공신경망을 통해 확장된 위험 모형의 모수 추정한 심층 확장된 위험 모형(Deep Extended Hazard model)을 제안했다. 이 모형은 커널밀도추정(Kernel Density Estimation)으로 추정한 가능도함수(Likelihood Function)를 손실함수(Loss Function)로 적용한다. 커널밀도추정은 미분이 가능한 매끄러운 밀도함수를 도출하는 장점이 있지만, 데이터의 양이 많아지면 분석시간이 증가하게 되는 단점이 있다. 본 연구에서는 분석시간을 줄이기 위해 가능도함수를 추정하면서 적용된 커널밀도추정을 히스토그램으로 대체하는 방안을 제안한다. 단순히 히스토그램으로 대체할 경우 미분이 불가능하고 비일관적(Inconsistent)인 단점이 있기에(Scott, 2009) 이를 극복하고자 다양한 방법론들을 적용하였다. 평균이동히스토그램(Averaged Shifted Histogram), 비음수 조각별 선형히스토그램(Nonnegative Piecewise Linear Histogram) 및 양 극단에 절반의 정규분포 첨부 방안을 적용하였다. 또한 제안 방법론의 예측 정확도 및 예측 오차를 확인하고자 Harrell et al.(1982)가 제시한 일치성 지수(Concordance index)와 적분 브라이어 점수(Integrated Brier Score)를 사용하였다. 분석 결과, 커널밀도추정 대신 제안 방법론으로 대체한 경우 분석시간이 감소한 것을 확인하였다. 또한 히스토그램 밀도함수의 일관성을 높이고, 함수를 매끄럽게 구성하였으며, 미분 가능성을 추가함에 따라 인공신경망 훈련에 지장 없도록 하였다. 더 나아가 제안 방법론이 심층 확장된 위험 모형보다 평균 일치성 지수가 높고 평균 적분 브라이어 점수가 적은 경우도 확인하였다. 즉, 특정 모수에 대해서는 제안 방법론이 분석시간이 심층 확장된 위험 모형보다 적으면서 예측력이 좋고 예측오차가 적은 결과를 확인하였다.|Cox Proportional Hazard model proposed by Cox(1972) as a methodology for estimating survival time in Survival Analysis. Cox Proportional Hazard model is a Regression model that can confirm the relationship between independent variables while estimating the survival time of the sample. Etezadi-Amoli & Ciampi(1985) proposed an Extended Hazard Model that generalizes the Cox Proportional Hazard model. Zhong et al.(2021) proposed Deep Extended Hazard Model that estimates the parameters of Extended Hazard Model using Artificial Neural Networks. This model employs a Likelihood Function estimated through Kernel Density Estimation as the loss function. Kernel density estimation has the advantage of deriving a differentiable smooth density function, but has the disadvantage of increasing the analysis time as the amount of data increases. In this study, we propose a method that replaces Kernel Density Estimation with a Histogram to estimate the probability function and reduce analysis time. However, replacing Kernel Density Estimation with a Histogram results in a loss of differentiability and inconsistency (Scott, 2009). To address these problems, we applied Averaged Shifted Histogram, Nonnegative Piecewise Linear Histogram, and Half-normal distribution attachments on both ends. And to confirm the prediction accuracy and prediction error of the proposed methodology, the Concordance index and Integrated Brier Score presented by Harrell et al.(1982) were used. The analysis showed that the proposed method took less computational time than methods using kernel density estimation. Additionally, the Histogram density function was more consistent and smooth. The proposed method provided the possibility of differentiation, which allowed for the successful training of Artificial Neural Networks. Furthermore, the proposed method had a higher average Consistency index and fewer average Integral Brier scores compared to Deep Extended Hazard Model.
URI
http://hanyang.dcollection.net/common/orgView/200000653137https://repository.hanyang.ac.kr/handle/20.500.11754/179743
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > APPLIED STATISTICS(응용통계학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE