View : 754 Download: 0

Semi-Supervised Regression for Survival Analysis

Title
Semi-Supervised Regression for Survival Analysis
Authors
이시영
Issue Date
2020
Department/Major
대학원 통계학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
송종우
Abstract
Since most survival models estimate survival probability or hazard function to reflect censored data in the model, it is difficult to predict survival time through the model. This makes it hard to evaluate the predictive power of models and use them as prediction models. We propose a new methodology to make up for the shortcomings of existing survival models: Semi-Supervised Survival Regression (SSR). The basic idea of the SSR methodology is as follows: Use KNN and sampling to estimate the actual survival time of the censored survival time and then model the survival time using models known for their good existing performance. In this paper, we introduce the algorithm of SSR in detail and assess the performance of methodology using simulation data. To evaluate the performance of the model, the Concordance Index, which is commonly used in existing survival analyses, and the newly proposed measurement ASP were used. As a benchmark model, we used Cox PH and Random Survival Forest.;대부분의 생존 모형이 절단 데이터를 모형에 반영하기 위해 생존함수 또는 위험함수를 추정하기에 모형을 통해 생존 시간 예측이 어렵다. 이로 인해 모형의 예측 성능에 대한 객관적 평가 및 예측 모형으로써 활용이 어렵다. 이에 새로운 방법론을 제안한다: Semi-Supervised Survival Regression(SSR). SSR 방법론의 기본적인 아이디어는 다음과 같다: KNN 및 샘플링을 통해 절단 생존시간의 실제 생존 시간을 추정하고 기존의 성능이 좋기로 유명한 모형들을 이용해 생존시간을 모델링한다. 본 논문에서는 SSR의 알고리즘에 대해 자세히 소개하며 시뮬레이션 데이터에 대하여 방법론을 적용한 뒤 그 성능을 평가한다. 벤치마크 모형으로 기존 생존분석에서 많이 사용되는 Cox PH, Random Survival Forests 를 사용하였고 모형의 성능을 평가하기 위해, Concordance index와 새로 제안한 측 도 ASP(Accuracy for Survival Probability)를 사용하였다.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE