View : 651 Download: 0

여러 가지 다변량 분석 기법을 이용한 마이크로어레이 자료 분석

Title
여러 가지 다변량 분석 기법을 이용한 마이크로어레이 자료 분석
Other Titles
Using several multivariate analysis of microarray data analysis
Authors
이동은
Issue Date
2014
Department/Major
대학원 통계학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
이은경
Abstract
본 논문에서는 유전자의 발현 정도를 수치화한 자료인 마이크로어레이 자료를 이용한다. 마이크로어레이가 무엇인지 살펴보고, 분석에 필요한 통계적 기법들을 확인한다. 유전자 발현 옴니버스 사이트인 GEO로부터 비흡연 대만 폐암 여성의 종양 조직과 정상조직의 정보를 가진 마이크로어레이 자료 GDS3837를 이용하여 분석을 시행한다. 분석에 앞서 생물학적 요인 외에 다른 요인에 의한 편의를 제거하기 위하여 자료를 표준화한다. 표준화한 자료는 정상 조직과 종양조직의 발현 차이가 존재하는지 검정하기 위하여 대응 표본 T 검정을 시행한다. 대응 표본 T 검정으로부터 얻은 유의 확률을 이용하여 유의한 유전자를 찾아 주성분 분석, 독립성분 분석, 계층적 군집분석, 랜덤 포레스트 군집분석의 다변량 자료 분석 방법을 적용한다. 또한, 다중비교 방법을 이용하여 전체 유전자로부터 차별 발현 유전자를 찾고자 한다.;This paper is a study about microarray and statistical analysis method by using microarray data which is numerical value of gene expression. It is an analysis about the GDS3837 data, which is paired tumor and normal tissues for gene expression microarray data of non-smoking female lung cancer in Taiwan. GDS3837 data is provided by gene expression omnibus site GEO. Before analysis, microarray data must be normalize in order to remove bias according to factor except biological factor. We perform paired t-test for confirming difference between normal and tumor tissue using the normalization data. We find significant genes from the p value of paired t test, and significant genes are used to do multivariate analysis such as principal component analysis, independent component analysis, random forest clustering and hierarchical clustering. Also, By implementing the multiple comparison method, we find differential expression genes from the whole genes.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE