View : 59 Download: 0

영과잉 포아송 회귀모형에 대한 베이지안 추론

영과잉 포아송 회귀모형에 대한 베이지안 추론
Issue Date
대학원 통계학과
이화여자대학교 대학원
In this thesis, zero-inflated data is considered, which is discrete count data but has too many zeroes compared to the Poisson distribution. Zero-inflated data can be found in various areas. If a manufacturing system is almost perfect then there would be many normal products and the number of defective items would have high probability. Other examples are the frequency of epidemic desease for each city in a country, the number of accidents in a highway each day of a month. Despite its increasing importance in practice, appropriate statistical inference on zero-inflated data is limited. Classical inference based on a large number theory does not fit unless the sample size is very large. And regular Poisson model shows lack of fit due to many zeroes. To handle the difficulties, a mixture of distributions are considered for the zero-inflated data. Specifically, a mixture of a point mass at zero and a Poisson distribution is employed for the inflated zero and other non-zero data. In addition, when there are covariates a loglinear link is used between the mean of the response and the cavariates in the Poisson distribution part. We propose a Bayesian inference for parameter estimation and prediction. The Bayesian method is easy to employ by using Markov chain Monte Carlo methods. We compared the inference results with other models and found that the proposed method is superior in that it gives small parameter estimation error and more accurate predictions.;셀 수 있는 이산 자료(discrete count data)에 대한 분석은 여러 분야에서 활용되고 있지만, 영(zero)을 과도하게 포함하고 있는 영과잉 자료는 자료의 성격상 포아송 분포를 따르지 못할 때가 있어 분석에 어려움이 따른다. 예를 들면 제조 과정에서 얻어지는 제품의 불량품수의 경우 공정이 완벽에 가까우면 전체 자료의 80-90%가 영으로 관측된다. 또 다른 예로, 한 마을에서 콜레라가 발생할 빈도, 한 달 동안 고속도로에서 발생하는 자동차 사고빈도 등이 있다. 이렇듯 영과잉 자료는 실제 생활에서 쉽게 접할 수 있음에도 불구하고, 적절한 통계적 추론에 한계가 있었다. 기존에 전통적인 추론방법은 대표본 근사를 사용하므로 영과잉 자료와 같이 매우 치우친 분포를 갖는 경우, 표본 크기가 크지 않으면 적합하지 않았고, 일반적인 포아송 모형도 너무 많은 영(zero)으로 인해 적합 결여를 보였다. 이런 어려움을 보완하기 위하여 분포의 혼합 형태를 가지는 Zero-Inflated Poisson(ZIP)모형이 제안되었다. 이 모형의 기본 아이디어는 영에 대한 점확률을 가지는 분포와 포아송 분포를 합성하여 과도한 영과 영이 아닌 자료를 설명한다는 것이다. 공변량이 존재할 때는 포아송 분포 부분에서 반응변수의 평균과 공변량사이에 로그선형 연결함수를 사용한 Zero-Inflated Poisson Regression(ZIP regression)이 제안되었다. 본 논문에서는 Markov Chain Monte Carlo방법을 이용하여 베이지안 관점에서 이 두 모형을 살펴보고, 기존의 전통적인 추론방법을 적용하는 다른 모형들과 추론 결과를 비교하였다. 그 결과, 베이지안 추론 방법을 적용한 두 모형의 추정오차가 다른 모형들의 추정오차보다 작았고, 예측치가 더 정확했다는 점에서 우수함을 알 수 있었다.
Show the fulltext
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.