View : 1508 Download: 0
의사결정 분류나무를 위한 다양한 R 패키지들에 대한 비교 분석
- Title
- 의사결정 분류나무를 위한 다양한 R 패키지들에 대한 비교 분석
- Other Titles
- An empirical comparison for several classification tree methods in R package
- Authors
- 신혜정
- Issue Date
- 2016
- Department/Major
- 대학원 통계학과
- Publisher
- 이화여자대학교 대학원
- Degree
- Master
- Advisors
- 이은경
- Abstract
- 의사결정나무는 데이터마이닝에서 널리 쓰이는 분석 방법 중 하나이다. 의학, 생물학, 경영 등 다양한 분야에서 의사결정나무는 통계적 의사 결정을 내리고 학습을 하는데 도움을 주고 있다. 본 논문의 목적은 분류분석을 위한 다양한 종류의 의사결정나무들의 알고리즘을 비교해보고 보건자료 위주로 실증 비교분석 하는 것에 있다. 비교분석을 위해 반응변수가 범주형 자료인 5가지의 보건자료와 그 외 여러 분야의 실제 자료를 사용하였고, 분류분석을 위한 R의 의사결정나무 패키지(tree, rpart, party, evtree, CORElearn, randomForest)를 이용하여 오분류율을 계산하고 각 패키지의 성능을 비교하였다. 알고리즘의 비교결과 진화 알고리즘을 이용한 패키지 evtree가 좋은 성능을 보였다.;A classification tree is one of the statistical tools that is widely used in the data mining field. It is useful for making statistical decisions, for example, in medical, biology, and business management area. The purpose of this study is to compare performances of newly developed R packages for classification trees. For comparative study, we use 10 real datasets including 5 medical data sets. We analyze datasets by various R packages - tree, rpart, party, evtree, and CORElearn. Misclassification rates are calculated and performances of packages are compared. It turns out that evtree package using evolution algorithm shows the best performance.
- Fulltext
- Show the fulltext
- Appears in Collections:
- 일반대학원 > 통계학과 > Theses_Master
- Files in This Item:
There are no files associated with this item.
- Export
- RIS (EndNote)
- XLS (Excel)
- XML