View : 675 Download: 0

Full metadata record

DC Field Value Language
dc.contributor.advisor이은경-
dc.contributor.author박지원-
dc.creator박지원-
dc.date.accessioned2016-08-26T12:08:13Z-
dc.date.available2016-08-26T12:08:13Z-
dc.date.issued2012-
dc.identifier.otherOAK-000000069465-
dc.identifier.urihttps://dspace.ewha.ac.kr/handle/2015.oak/189458-
dc.identifier.urihttp://dcollection.ewha.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000069465-
dc.description.abstract통계적 분류 분석에는 Fisher의 판별 분석(Discriminant analysis), 로지스틱 회귀분석, 의사결정나무(Decision tree) 모형 등이 많이 쓰이고 있다. 분류 분석은 일반적으로 자료를 미리 정해진 그룹 또는 범주로 분류한다. 본 논문에서는 자료가 아닌 그룹 또는 범주를 분류하는 나무 모형으로 다변량 자료의 탐색적 분석을 하였다. 다변량 자료의 탐색적 분석을 하려면 기본적으로 자료를 시각화 하는 부분부터 시작한다. 그러나 고차원 공간상에 다변량 자료를 나타내는 것은 쉽지 않다. 이 문제에 대한 해결방안으로 다변량 자료에 대한 탐색적 기법 중 하나는 Kruskal (1972)와 Friedman and Tukey (1974)에 의하여 고안된 사영추적 방법(projection pursuit method)이다. 이 방법은 사영추적지수 (projection pursuit index)를 최적화 하여 고차원의 자료에서 관심 있는 저차원의 사영들을 찾아 자료의 특징을 저차원 공간상에서 살펴볼 수 있게 한다. 본 논문에서는 사영추적나무 모형을 이론적으로 살펴보고 R 패키지 ‘classPP’를 통해 실제 자료를 적용해 보았다. 이 모형은 사영추적 방법을 이용한 나무 모형으로 사영추적지수는 Lee et al (2005) 과 Lee and Cook (2010)에서 제안된 LDA 사영추적지수, -norm 사영추적지수, PDA 사영추적지수를 이용하였다. 실제 자료를 적합시킨 결과, 사영추적나무 모형은 그룹 정보를 가진 다변량 자료를 사영추적방법을 통해 그룹 간 차이를 유지하면서 차원을 축소시켜 저차원 공간상에 그룹 간 차이를 시각적으로 표현할 수 있도록 하였다. 또한 각 마디(node) 마다 그룹 또는 범주단위로 둘로 나누고 이들을 분류하는데 중요한 역할을 하는 변수들을 선택할 수 있도록 하였다.;In this paper we propose projection pursuit tree. This tree is originated from the projection pursuit method for classification. In each node, one of the projection pursuit indices using class information - LDA, or PDA indices - is maximized to find the projection with separated group view. With this optimized projection, groups are separated. These processes are continued until separating the last two groups. The main advantage of this tree is that it enables visual representation with the differences between groups in 1- dimensional space. Also in each node of the tree, the projection coefficients represent the amount of importance in separating two groups. This information is very helpful to select variables in classification problem. We apply this method to several real data sets. This method is implemented in R, ‘classPP’ package.-
dc.description.tableofcontentsI. 서론 1 II. 사영 추적 나무 방법의 이론적 배경 3 A. 사영 추적 (Projection Pursuit) 3 1. 사영 추적 (Projection Pursuit) 3 2. 그룹 정보를 이용한 사영 추적 3 III. 사영 추적 나무 (Projection Pursuit Tree) 7 IV. 시뮬레이션 11 V. 사례분석 15 A. LDA 사영지수를 이용한 경우 15 1. 자료의 구성 15 2. 분석결과 16 B. PDA 사영지수를 이용한 경우 24 1. 자료의 구성 24 2. 분석결과 25 VI. 요약 및 결론 27 참 고 문 헌 28 ABSTRACT 30-
dc.formatapplication/pdf-
dc.format.extent2425373 bytes-
dc.languagekor-
dc.publisher이화여자대학교 대학원-
dc.title사영 추적 나무-
dc.typeMaster's Thesis-
dc.title.subtitle사영추적을 이용한 분류와 변수선택-
dc.title.translatedProjection Pusuit Tree : Classification and Variable Selection Using Projection Pursuit Method-
dc.creator.othernamePark, Ji-won-
dc.format.pagevii, 30 p.-
dc.identifier.thesisdegreeMaster-
dc.identifier.major대학원 통계학과-
dc.date.awarded2012. 2-
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE