View : 755 Download: 0

Full metadata record

DC Field Value Language
dc.contributor.advisor송종우-
dc.contributor.author이시영-
dc.creator이시영-
dc.date.accessioned2020-02-03T16:31:17Z-
dc.date.available2020-02-03T16:31:17Z-
dc.date.issued2020-
dc.identifier.otherOAK-000000163203-
dc.identifier.urihttp://dcollection.ewha.ac.kr/common/orgView/000000163203en_US
dc.identifier.urihttps://dspace.ewha.ac.kr/handle/2015.oak/252737-
dc.description.abstractSince most survival models estimate survival probability or hazard function to reflect censored data in the model, it is difficult to predict survival time through the model. This makes it hard to evaluate the predictive power of models and use them as prediction models. We propose a new methodology to make up for the shortcomings of existing survival models: Semi-Supervised Survival Regression (SSR). The basic idea of the SSR methodology is as follows: Use KNN and sampling to estimate the actual survival time of the censored survival time and then model the survival time using models known for their good existing performance. In this paper, we introduce the algorithm of SSR in detail and assess the performance of methodology using simulation data. To evaluate the performance of the model, the Concordance Index, which is commonly used in existing survival analyses, and the newly proposed measurement ASP were used. As a benchmark model, we used Cox PH and Random Survival Forest.;대부분의 생존 모형이 절단 데이터를 모형에 반영하기 위해 생존함수 또는 위험함수를 추정하기에 모형을 통해 생존 시간 예측이 어렵다. 이로 인해 모형의 예측 성능에 대한 객관적 평가 및 예측 모형으로써 활용이 어렵다. 이에 새로운 방법론을 제안한다: Semi-Supervised Survival Regression(SSR). SSR 방법론의 기본적인 아이디어는 다음과 같다: KNN 및 샘플링을 통해 절단 생존시간의 실제 생존 시간을 추정하고 기존의 성능이 좋기로 유명한 모형들을 이용해 생존시간을 모델링한다. 본 논문에서는 SSR의 알고리즘에 대해 자세히 소개하며 시뮬레이션 데이터에 대하여 방법론을 적용한 뒤 그 성능을 평가한다. 벤치마크 모형으로 기존 생존분석에서 많이 사용되는 Cox PH, Random Survival Forests 를 사용하였고 모형의 성능을 평가하기 위해, Concordance index와 새로 제안한 측 도 ASP(Accuracy for Survival Probability)를 사용하였다.-
dc.description.tableofcontentsI. Introduction 1 II. Theoretical Background 3 A. Terms and Notations 3 B. Kaplan-Meier Estimator 6 C. Cox’s Proportional Hazard Model 6 D. Random Survival Forests 7 III. Semi-Supervised Regression (SSR) 10 A. Algorithm 10 B. Survival Probability for SSR 13 IV. Model Performance Measures 14 A. Harrell’s Concordance index 14 B. ASP (Accuracy for Survival Probability) 16 V. Simulation 17 A. Data Description 17 B. Example: Scenario1 with 10% random censored 24 C. Simulation Results 35 VI. Conclusion 40 Bibliography 42 Abstract (in Korean) 44-
dc.formatapplication/pdf-
dc.format.extent1452161 bytes-
dc.languageeng-
dc.publisher이화여자대학교 대학원-
dc.subject.ddc500-
dc.titleSemi-Supervised Regression for Survival Analysis-
dc.typeMaster's Thesis-
dc.creator.othernameLee, Si Young-
dc.format.pagev, 44 p.-
dc.identifier.thesisdegreeMaster-
dc.identifier.major대학원 통계학과-
dc.date.awarded2020. 2-
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE