View : 270 Download: 0

비선형 충분차원축소를 위한 nsdr 패키지 연구

Title
비선형 충분차원축소를 위한 nsdr 패키지 연구
Other Titles
nsdr: An R package for Nonlinear Sufficient Dimension Reduction
Authors
강지영
Issue Date
2023
Department/Major
대학원 통계학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
김경원
Abstract
dr 패키지는 선형 충분차원축소를 수행하기 위한 R 패키지로 널리 알려졌을 뿐 아니라 고차원의 데이터로부터 핵심 정보를 추출하는 데 유용하게 사용된다. 하지만, 복잡한 비선형 구조를 가진 빅데이터를 분석할 때 선형 차원축소 방법을 사용하게 되면 해당 데이터를 온전히 설명하기 어려운 상황에 직면하기도 한다. 반면, 복잡한 빅데이터를 다루는 상황에서 비선형 충분차원축소 방법은 선형 충분차원축소 방법의 좋은 대안이 될 수 있다. 하지만, 비선형 충분차원축소 방법의 이론은 힐버트 공간(Hilbert space) 안의 선형 연산자들(linear operators)에 의존한다는 점은 많은 사용자들로 하여금 실제 데이터 분석에서 비선형 충분차원축소 방법을 적용하기 어렵게 만드는 요소이다. 본 논문에서는 선형 충분차원축소 방법과 비선형 충분차원축소 방법의 이론적 배경에 대해 비교한다. 또한, 널리 알려진 dr패키지와 본 연구를 통해 개발한 nsdr 패키지를 활용하여 선형 충분차원축소 방법과 비선형 충분차원축소 방법의 수치적 결과에 대해 비교한다. 더불어 실제 데이터 분석을 통해 분류 데이터인 와인 품종 데이터를 활용하여 선형 충분차원축소 방법과 비선형 충분차원축소 방법의 분류 성능에 대해도 알아보고자 한다. ;The dr package is a popular tool for implementing linear sufficient dimension reduction, which helps extract essential information from high-dimensional datasets. However, when dealing with big data that exhibits complex nonlinear structures, linear sufficient dimension reduction may not fully explain certain dataset features. To overcome this limitation, researchers have developed nonlinear sufficient dimension reduction methods as an alternative solution. However, the theoretical formulation of nonlinear sufficient dimension reduction relies on linear operators in Hilbert space, making it challenging for many users to apply these methods in real data analysis. This study aims to evaluate and compare the underlying principles and empirical outcomes of linear and nonlinear sufficient dimension reduction techniques. We accomplish this by utilizing two software packages: the well-established dr package, which facilitates linear dimension reduction, and the newly developed nsdr package, which focuses on nonlinear dimension reduction. Moreover, we illustrate the practical application of nonlinear sufficient dimension reduction approaches in addressing a classification problem, leveraging the wine cultivar dataset as an example.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE