View : 708 Download: 0

Full metadata record

DC Field Value Language
dc.contributor.advisor송종우-
dc.contributor.author강수연-
dc.creator강수연-
dc.date.accessioned2017-08-27T12:08:43Z-
dc.date.available2017-08-27T12:08:43Z-
dc.date.issued2017-
dc.identifier.otherOAK-000000138290-
dc.identifier.urihttp://dcollection.ewha.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000138290en_US
dc.identifier.urihttps://dspace.ewha.ac.kr/handle/2015.oak/236350-
dc.description.abstract마이크로어레이 실험으로 얻은 유전자 발현 데이터를 이용하여 흔히 하는 분석은 서로 다른 두 가지의 실험 조건이나 생물학적 표현형에 따라 다른 발현도를 갖는 유전자를 찾아내는 테스트이다. 마이크로어레이 데이터는 노이즈가 심하고 수천, 수만 개의 유전자 수에 비해 얻어지는 샘플의 수가 매우 제한적인 특성을 갖고 있기 때문에, 많은 분석 기법들의 성능이 데이터의 노이즈 레벨과 실험으로 얻은 샘플 수와 같은 실험 조건에 따라 크게 달라진다. 우리는 significance analysis of microarrays (SAM) 의 분석 프로시저를 바탕으로 실험 조건이 제한적일 때에도 로버스트한 성능을 보여주는 테스트 방법을 제시하고자 한다. 비교하는 방법론은 SAM, 가우시안 커널 함수를 이용한 Normal-weighted SAM, 그리고 유클리드 거리를 이용한 Distance-weighted SAM이다. 세 테스트 방법의 비교를 위해, 실제 마이크로어레이 데이터의 특성을 반영한 시뮬레이션 데이터와 실제 데이터를 이용하였다. 실험 결과는 제안된 방법론이 유의한 유전자들을 효과적으로 찾아내는 것을 보여준다. 특히, 데이터에 노이즈가 많고 샘플 수가 적을수록 효과적임을 알 수 있다.;A common task in microarray data analysis is to identify genes that are differentially expressed between two different states. For such research, useful statistical methods have been proposed and have enhanced our biological knowledge. However, the performance of existing test procedures is highly dependent on the experimental conditions, such as the presence of measurement error or a limited number of sample replicates. Hence, we here propose new test procedures that show relatively robust performance across all noise levels and sample sizes, by applying a simple modification to the most widely used gene selection method, significance analysis of microarrays (SAM). To compare gene selection methods, we generated six simulation datasets with different noise levels along with two real datasets. The results of simulation study and real data analysis demonstrate that our proposed methods are effective for detecting significant genes with permutation test using the false discovery rate (FDR), especially when the given data are noisy or sample size is small.-
dc.description.tableofcontentsI. Introduction 1 II. Method 4 A. SAM 4 B. Modified SAM 5 C. Data generation 8 D. Performance metrics 10 III. Simulation study 13 IV. Real data analysis 17 A. Fusarium 17 B. Leukemia 19 V. Concluding remarks 25 References 27 Abstract(in Korean) 29-
dc.formatapplication/pdf-
dc.format.extent823974 bytes-
dc.languageeng-
dc.publisher이화여자대학교 대학원-
dc.subject.ddc500-
dc.titleA robust test procedure for gene selection in microarray data-
dc.typeMaster's Thesis-
dc.format.pageiv, 29 p.-
dc.identifier.thesisdegreeMaster-
dc.identifier.major대학원 통계학과-
dc.date.awarded2017. 2-
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE