View : 1395 Download: 0

사영추적 회귀나무

Title
사영추적 회귀나무
Other Titles
Projection Pursuit Regression Tree : Extension to continuous variable
Authors
백선영
Issue Date
2013
Department/Major
대학원 통계학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
이은경
Abstract
분류분석은 일반적으로 자료를 미리 정해진 그룹 또는 범주로 분류하는 분석 방법으로 통계적 분류분석에서 많이 쓰이고 있는 방법은 의사결정나무(CART)이다. 이는 해석상의 용이하다는 장점을 가지고 있으나 한 번의 가지치기에서 한 가지 변수만을 이용하므로 경우에 따라 분류의 정확성이 떨어질 수 있다. 사영추적나무(PPtree)는 이를 보완하기 위하여 제안된 방법으로 반응변수가 범주형 변수인 경우에 분류를 하고 분류에 영향을 미치는 변수들을 파악하기 위해 사용된다. 본 논문에서는 사영추적나무를 반응변수가 연속형 변수인 경우로 확장하여 사영추적회귀나무를 제안하고 있다. 자료를 연속형 변수와 이용되는 설명변수들을 이용하여 G개의 군집으로 나누고 이를 범주형 자료화 하여 이미 개발되어 있는 사영추적나무에 적용시킨다. 본 연구에서는 경우 군집의 개수인 G의 선택과 G개의 군집으로 나누는 세 가지 방법을 제안하고, 사례분석을 통하여 개발한 사영추적회귀나무의 기능을 파악하고 이미 개발되어 있는 의사결정회귀나무와 랜덤 포레스트의 분석 결과와 비교 분석하여 사영추적회귀나무의 성능을 알아보았다. ;In this paper we propose projection pursuit regression tree for a continuous response variable. This tree is expanded from Projection pursuit classification tree. First, we separate our data into G groups using continuous response variable only or explanatory variables and continuous response variable. Then we apply projection pursuit tree to our data with G groups. This paper proposes three clustering methods to find G groups. Also we use cross validation to select optimal number of cluster, G. We apply three methods to several real data sets and figure out main features of the Projection pursuit regression tree. And we compare out new methods with CART and Random Forest that has already developed.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE