View : 654 Download: 0

Full metadata record

DC Field Value Language
dc.contributor.advisor이은경-
dc.contributor.author이동은-
dc.creator이동은-
dc.date.accessioned2016-08-26T04:08:45Z-
dc.date.available2016-08-26T04:08:45Z-
dc.date.issued2014-
dc.identifier.otherOAK-000000089485-
dc.identifier.urihttps://dspace.ewha.ac.kr/handle/2015.oak/211271-
dc.identifier.urihttp://dcollection.ewha.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000089485-
dc.description.abstract본 논문에서는 유전자의 발현 정도를 수치화한 자료인 마이크로어레이 자료를 이용한다. 마이크로어레이가 무엇인지 살펴보고, 분석에 필요한 통계적 기법들을 확인한다. 유전자 발현 옴니버스 사이트인 GEO로부터 비흡연 대만 폐암 여성의 종양 조직과 정상조직의 정보를 가진 마이크로어레이 자료 GDS3837를 이용하여 분석을 시행한다. 분석에 앞서 생물학적 요인 외에 다른 요인에 의한 편의를 제거하기 위하여 자료를 표준화한다. 표준화한 자료는 정상 조직과 종양조직의 발현 차이가 존재하는지 검정하기 위하여 대응 표본 T 검정을 시행한다. 대응 표본 T 검정으로부터 얻은 유의 확률을 이용하여 유의한 유전자를 찾아 주성분 분석, 독립성분 분석, 계층적 군집분석, 랜덤 포레스트 군집분석의 다변량 자료 분석 방법을 적용한다. 또한, 다중비교 방법을 이용하여 전체 유전자로부터 차별 발현 유전자를 찾고자 한다.;This paper is a study about microarray and statistical analysis method by using microarray data which is numerical value of gene expression. It is an analysis about the GDS3837 data, which is paired tumor and normal tissues for gene expression microarray data of non-smoking female lung cancer in Taiwan. GDS3837 data is provided by gene expression omnibus site GEO. Before analysis, microarray data must be normalize in order to remove bias according to factor except biological factor. We perform paired t-test for confirming difference between normal and tumor tissue using the normalization data. We find significant genes from the p value of paired t test, and significant genes are used to do multivariate analysis such as principal component analysis, independent component analysis, random forest clustering and hierarchical clustering. Also, By implementing the multiple comparison method, we find differential expression genes from the whole genes.-
dc.description.tableofcontentsⅠ. 서론 1 Ⅱ. 마이크로어레이 2 A. DNA 마이크로어레이 2 B. 전처리 과정 3 Ⅲ. 통계적 방법론 5 A. 주성분 분석 (Principal Component Analysis) 5 B. 독립성분 분석(Independent Component Analysis) 6 C. 계층적 군집분석(Hierarchical clustering) 6 D. 랜덤 포레스트 군집분석 (Random forest clustering) 7 E. 대응표본 T검정(Paired T-test) 8 F. 다중 비교 8 Ⅳ. DNA 마이크로어레이 자료 분석 11 A. 자료 소개 11 B. 전처리 과정 11 C. 대응표본 T검정 12 D. 주성분 분석 13 E. 독립성분 분석 14 F. 계층적 군집분석 15 G. 랜덤포레스트 군집분석 17 H. 다중 비교 18 Ⅴ. 결론 20 참고문헌 21 부록 23 ABSTRACT 30-
dc.formatapplication/pdf-
dc.format.extent1217425 bytes-
dc.languagekor-
dc.publisher이화여자대학교 대학원-
dc.subject.ddc500-
dc.title여러 가지 다변량 분석 기법을 이용한 마이크로어레이 자료 분석-
dc.typeMaster's Thesis-
dc.title.translatedUsing several multivariate analysis of microarray data analysis-
dc.creator.othernameLee, Dong Eun-
dc.format.pagevii, 30 p.-
dc.identifier.thesisdegreeMaster-
dc.identifier.major대학원 통계학과-
dc.date.awarded2014. 8-
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE