View : 1508 Download: 0

의사결정 분류나무를 위한 다양한 R 패키지들에 대한 비교 분석

Title
의사결정 분류나무를 위한 다양한 R 패키지들에 대한 비교 분석
Other Titles
An empirical comparison for several classification tree methods in R package
Authors
신혜정
Issue Date
2016
Department/Major
대학원 통계학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
이은경
Abstract
의사결정나무는 데이터마이닝에서 널리 쓰이는 분석 방법 중 하나이다. 의학, 생물학, 경영 등 다양한 분야에서 의사결정나무는 통계적 의사 결정을 내리고 학습을 하는데 도움을 주고 있다. 본 논문의 목적은 분류분석을 위한 다양한 종류의 의사결정나무들의 알고리즘을 비교해보고 보건자료 위주로 실증 비교분석 하는 것에 있다. 비교분석을 위해 반응변수가 범주형 자료인 5가지의 보건자료와 그 외 여러 분야의 실제 자료를 사용하였고, 분류분석을 위한 R의 의사결정나무 패키지(tree, rpart, party, evtree, CORElearn, randomForest)를 이용하여 오분류율을 계산하고 각 패키지의 성능을 비교하였다. 알고리즘의 비교결과 진화 알고리즘을 이용한 패키지 evtree가 좋은 성능을 보였다.;A classification tree is one of the statistical tools that is widely used in the data mining field. It is useful for making statistical decisions, for example, in medical, biology, and business management area. The purpose of this study is to compare performances of newly developed R packages for classification trees. For comparative study, we use 10 real datasets including 5 medical data sets. We analyze datasets by various R packages - tree, rpart, party, evtree, and CORElearn. Misclassification rates are calculated and performances of packages are compared. It turns out that evtree package using evolution algorithm shows the best performance.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE