View : 75 Download: 0

사영 추적 나무

Title
사영 추적 나무
Other Titles
Projection Pusuit Tree : Classification and Variable Selection Using Projection Pursuit Method
Authors
박지원
Issue Date
2012
Department/Major
대학원 통계학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
이은경
Abstract
통계적 분류 분석에는 Fisher의 판별 분석(Discriminant analysis), 로지스틱 회귀분석, 의사결정나무(Decision tree) 모형 등이 많이 쓰이고 있다. 분류 분석은 일반적으로 자료를 미리 정해진 그룹 또는 범주로 분류한다. 본 논문에서는 자료가 아닌 그룹 또는 범주를 분류하는 나무 모형으로 다변량 자료의 탐색적 분석을 하였다. 다변량 자료의 탐색적 분석을 하려면 기본적으로 자료를 시각화 하는 부분부터 시작한다. 그러나 고차원 공간상에 다변량 자료를 나타내는 것은 쉽지 않다. 이 문제에 대한 해결방안으로 다변량 자료에 대한 탐색적 기법 중 하나는 Kruskal (1972)와 Friedman and Tukey (1974)에 의하여 고안된 사영추적 방법(projection pursuit method)이다. 이 방법은 사영추적지수 (projection pursuit index)를 최적화 하여 고차원의 자료에서 관심 있는 저차원의 사영들을 찾아 자료의 특징을 저차원 공간상에서 살펴볼 수 있게 한다. 본 논문에서는 사영추적나무 모형을 이론적으로 살펴보고 R 패키지 ‘classPP’를 통해 실제 자료를 적용해 보았다. 이 모형은 사영추적 방법을 이용한 나무 모형으로 사영추적지수는 Lee et al (2005) 과 Lee and Cook (2010)에서 제안된 LDA 사영추적지수, -norm 사영추적지수, PDA 사영추적지수를 이용하였다. 실제 자료를 적합시킨 결과, 사영추적나무 모형은 그룹 정보를 가진 다변량 자료를 사영추적방법을 통해 그룹 간 차이를 유지하면서 차원을 축소시켜 저차원 공간상에 그룹 간 차이를 시각적으로 표현할 수 있도록 하였다. 또한 각 마디(node) 마다 그룹 또는 범주단위로 둘로 나누고 이들을 분류하는데 중요한 역할을 하는 변수들을 선택할 수 있도록 하였다.;In this paper we propose projection pursuit tree. This tree is originated from the projection pursuit method for classification. In each node, one of the projection pursuit indices using class information - LDA, or PDA indices - is maximized to find the projection with separated group view. With this optimized projection, groups are separated. These processes are continued until separating the last two groups. The main advantage of this tree is that it enables visual representation with the differences between groups in 1- dimensional space. Also in each node of the tree, the projection coefficients represent the amount of importance in separating two groups. This information is very helpful to select variables in classification problem. We apply this method to several real data sets. This method is implemented in R, ‘classPP’ package.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE