A study on survival analysis and application to real data

Issue Date
대학원 통계학과
이화여자대학교 대학원
응용통계학자들이 자주 접하는 문제가 자료분석에서 관심의 대상이 특정 사건이 발생하기까지 걸린 시간인 경우 이를 어떻게 효과적으로 분석할 것인가라는 점이다. 이러한 데이터는 의학, 생물학, 공중보건, 유행병학, 산업공학, 경제학, 인류통계학 등의 다양한 분야들에서 발생한다. 특히 한국에서는 요즈음 막 시행되기 시작한 의약분업으로 인해 약효의 동등성의 여부에 대한 대중의 관심이 높아졌고, 이를 분석하는 생존분석의 중요성 역시 더욱 인식되어지고 있다. 생존과 관련된 실험의 분석은 절단(censoring)이라는 생존자료만의 독특한 특징으로 인해 매우 복잡하고, 이를 설명하기 위해서 많은 연구가 되어져 왔다. 본 논문에서는 우선 절단(censoring)과 생존함수(survival function), 위험함수(hazard function)의 개념을 소개하고, 그 다음에 생존분석의 세가지 접근 방법들을 다루어 본다. 모수적 방법에서는 기본적으로 지수모형과 와이블 모형을, 비모수적 방법에서는 생존함수를 추정하기위해 넓게 사용되어지는 Kaplan-Meier 추정법을, 그리고 가장 최근에 나왔지만 앞의 두 접근방법보다 더 많은 잇점을 갖고있어 가장 널리 이용되어지고 있는 Cox의 비례위험 회귀모형을 언급하고, 마지막으로 Recidivism 데이터와 Stanford Heart Transplant 데이터에 위 세가지 방법론을 각각 적용하여 분석, 비교하여본다. ; A problem frequently faced by applied statisticians is the analysis of time-to-event data, which arise in diverse fields such as medicine, biology, public health, epidemiology, engineering, economics, and demography. In Korea, nowadays the public interest in the equivalence test for the effects of medicines is ascending and the importance of survival analysis is being recognized more due to separation of dispensary from medical practice started just now. The analysis of survival experiment is complicated by issues of censoring, where an individual s life length is known to occur only in a certain period of time. The substantial advances in statistical theory to account for the censoring has been accomplished. In this paper, we first introduce the concepts of censoring, survival function and hazard function, and then deal with three approaches of survival analysis. We address basically exponential and Weibull model in parametric method, and Kaplan-Meier estimation used widely to estimate survival probabilities in nonparametric method. Also we mention Cox s proportional hazards regression model, which has been used in a most variety of parts and has more advantages in comparison to the other two methods even though it was developed in the most recent. At last, we apply the said three methods to Recidivism data and Stanford heart transplant data.
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
