View : 607 Download: 0

Full metadata record

DC Field Value Language
dc.contributor.advisor차지환-
dc.contributor.author김혜승-
dc.creator김혜승-
dc.date.accessioned2016-08-26T04:08:45Z-
dc.date.available2016-08-26T04:08:45Z-
dc.date.issued2014-
dc.identifier.otherOAK-000000089054-
dc.identifier.urihttps://dspace.ewha.ac.kr/handle/2015.oak/211269-
dc.identifier.urihttp://dcollection.ewha.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000089054-
dc.description.abstract빅데이터가 이슈인 요즘 많은 양의 자료를 분석할 시 변수를 선택하는 것은 중요한 문제가 되며 다양한 방법들이 적용된다. 본 논문에서는 변수 선택 방법 중 다중 검정에 대한 여러 가지 방법을 자세히 살펴보았다. 그 중 널리 알려져 있는 것은 Bonferroni 방법으로 계산하기가 쉽고 검정 방법이 간단하다는 장점이 있으나 2종 오류가 크기 때문에 검정력이 낮다는 단점이 있다. 그래서 이를 보완하고 검정력을 높이기 위하여 Dunn-Sidak, step-up, step-down 등의 다양한 방법이 제안되었다.또 다른 다중 검정 방법으로는 재배열(re-sampling)을 이용하여 보정된 유의확률(p-value)을 계산하는 것이다. 이 방법은 step-down 방법과 bootstrap 방법이 결합한 것으로 시간이 오래 걸린다는 단점이 있으나 최근 컴퓨터의 성능이 좋아지면서많이 쓰이고 있다. 본 논문에서 여러 가지 다중 검정 방법 중 재배열(re-sampling)을 이용한 다양한 알고리즘들을 중점적으로 논의하였다. 그리고 통계프로그램 R을 이용해 실제 자료에 여러 방법을 적용하여 어떻게 다른지 비교 분석하였다.;This paper is about resampling-based multiple testing of various methods for variable selection. First, the Bonferroni method is the most well-known method for dealing with multiple testing. It provides easy method to calculate and control over Type I error. By the way, it is also well-known that it can be very conservative. So many other approaches have been developed to control the Type I error. In this paper, we review multiple testing methods, especially focusing on resampling-based methods. Also, we applied various resampling-based multiple testing methods to various real data. We compared the performance of algorithms in each dataset.-
dc.description.tableofcontentsI. 서론 1 A. 다중 검정의 개념 1 B. 연구 방법 및 논문구성 1 II. 다중 검정을 이용한 다양한 변수 선택 방법 2 A. Bonferroni 방법 2 B. Dunn-Sidak 방법 2 C. 순차적인 Bonferroni 방법 3 1. Holm의 step-down 방법 3 2. Hochberg의 step-up 방법 4 D. 재배열을 이용하여 보정된 유의확률 계산 방법 4 III. 재배열을 이용한 다양한 다중 검정 알고리즘 6 A. Raw 유의확률 6 B. Step-down maxT의 보정된 유의확률 6 C. Step-down minP의 보정된 유의확률 7 D. 새로운 재배열을 이용한 step-down minP의 보정된 유의확률 8 IV. 사례분석 9 A. 자료의 구성 9 1. Glass 자료 9 2. Parkinson 자료 9 3. Leukemia 자료 10 4. Lymphoma 자료 11 5. NCI 자료 11 B. 주요 변수 찾기 위한 분석방법 13 C. 분석 결과 14 V. 요약 및 결론 21 참고문헌 22 ABSTRACT 23-
dc.formatapplication/pdf-
dc.format.extent731792 bytes-
dc.languagekor-
dc.publisher이화여자대학교 대학원-
dc.subject.ddc500-
dc.title변수 선택을 위한 다양한 다중 검정 방법에 대한 고찰-
dc.typeMaster's Thesis-
dc.title.translatedReview of resampling-based multiple testing method for variable selection-
dc.creator.othernameKim, Hye Seung-
dc.format.pageviii, 23 p.-
dc.identifier.thesisdegreeMaster-
dc.identifier.major대학원 통계학과-
dc.date.awarded2014. 8-
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE