View : 670 Download: 0
Non-parametric Variable Selection through Sufficient Dimension Reduction
- Title
- Non-parametric Variable Selection through Sufficient Dimension Reduction
- Authors
- 이경진
- Issue Date
- 2014
- Department/Major
- 대학원 통계학과
- Publisher
- 이화여자대학교 대학원
- Degree
- Master
- Advisors
- 유재근
- Abstract
- Due to the increase of social demands in discovering patterns form high-dimensional data sets, dimension reduction and variable selection have been major issues in statistics. To meet the demands, statisticians have developed Sufficient Dimension Reduction(SDR) methodology which allows analyzing multi-dimensional data without loss of information. Prior researches have shown that non-parametric variable selection thorough SDR is possible by constructing bootstraps, however, the bootstrapping method does not offer p-values for the predictor hypotheses. In this article, permutation approaches were devised to estimate p-values for the predictor hypotheses in non-parametric variable selection through SDR. Discussions on effectiveness of the permutation approach are reported through simulation studies.
;설명변수에 대한 반응변수의 조건부 분포를 추론할 때 정보의 손실 없이 설명변수의 차원을 축소함으로써 분석의 효율성 및 정확성을 개선하는 방법을 충분차원축소(Sufficient Dimension Reduction, SDR)라 한다.
기존의 연구에서 설명변수 통합가설(Unified Predictor Hypothesis)로부터 충분차원축소 방법론을 이용하여 부트스트랩을 통해 비모수적 변수 선택이 가능함이 증명되었으나 구체적인 p-값이 제시되지 않는다는 한계점을 가진다. 본 논문에서는 이러한 제한성을 극복하기 위하여 순열 재배치 검정법(permutation tests)을 이용해 설명변수통합가설의 두 경우인 주변설명변수가설 및 조건부설명변수가설에서의 p-값을 도출하는 방법론 및 알고리즘을 제안하였다. 이를 통해 추가적인 분포 가정 없이 비모수적인 변수 선택 및 설명변수의 차원 축소가 가능하다.
제시된 방법론의 성능을 측정하기 위하여 선형 및 비선형 모형에서의 모의실험을 진행함으로 p-값을 도출하고, 설명변수가설의 기각률을 계산함으로써 1종 오류 값을 도출하였다.
- Fulltext
- Show the fulltext
- Appears in Collections:
- 일반대학원 > 통계학과 > Theses_Master
- Files in This Item:
There are no files associated with this item.
- Export
- RIS (EndNote)
- XLS (Excel)
- XML