View : 588 Download: 0

반복 마이크로어레이 실험으로부터의 유전자 발현성 분류

Title
반복 마이크로어레이 실험으로부터의 유전자 발현성 분류
Other Titles
Identifying Differentially Expressed Genes from Repeated Microarray Experiment by Using a Mixture of Three Normal Distributions
Authors
金惠珍
Issue Date
2003
Department/Major
대학원 통계학과
Keywords
마이크로어레이 실험유전자 발현성Repeated Microarray Experiment통계학
Publisher
이화여자대학교 대학원
Degree
Master
Abstract
There have been some works such as Dudoit et a1.(2000) which performs cluster analysis for cDNA Microarray data by using a mixture of two normal distributions representing positive signals and normal signals. However, in many experiments there exist genes that are damaged or nearly lose their real function due to the influence of treatment, hence react in a passive manner and show more negative signals than normal genes. Thus, it is desirable to separate negative groups from normal groups for more accurate analysis of the data. In this paper, we use 3-component normal mixture distributions that represent active, normal, and under-active genes groups. EM algorithm is used for parameters estimation. An example of real data is analyzed for illustration.;지금까지 cDNA를 활용한 Microarray의 자료로 분석된 논문(Dudoit 외, 2000)들은 2가지 그룹 즉, 활성그룹과 정상그룹으로 분류되어 왔다. 하지만 외부적 영향으로 비정상적으로 반응하는 음성그룹이 존재함을 확인하였다. 이 음성그룹을 분석 시 정상그룹에서 분리하는 것이 자료에 대한 정확한 이해와 분석 시 선행 될 것으로 요구된다. 이 논문은 이 음성그룹의 분리를 위해 K-평균 분석을 통해 EM알고리즘에 적용할 초기치 모수를 추정하고, 그 결과를 바탕으로 3구성 정규 합성모형의 모수를 EM알고리즘을 적용시켜 쉽게 추정할 수 있었다. 이 논문은 3구성 정규합성모형에 대한 예제로 HDL(high density lipoprotein)콜레스테롤 수치가 낮은 쥐에게서 얻어진 Microarray 데이터에 적용시켰다. 이 결과 음성그룹이 존재하며 활성분포, 정규분포와 분리되어지는 것을 확인할 수 있었다.;There have been some works such as Dudoit et a1.(2000) which performs cluster analysis for cDNA Microarray data by using a mixture of two normal distributions representing positive signals and normal signals. However, in many experiments there exist genes that are damaged or nearly lose their real function due to the influence of treatment, hence react in a passive manner and show more negative signals than normal genes. Thus, it is desirable to separate negative groups from normal groups for more accurate analysis of the data. In this paper, we use 3-component normal mixture distributions that represent active, normal, and under-active genes groups. EM algorithm is used for parameters estimation. An example of real data is analyzed for illustration.;지금까지 cDNA를 활용한 Microarray의 자료로 분석된 논문(Dudoit 외, 2000)들은 2가지 그룹 즉, 활성그룹과 정상그룹으로 분류되어 왔다. 하지만 외부적 영향으로 비정상적으로 반응하는 음성그룹이 존재함을 확인하였다. 이 음성그룹을 분석 시 정상그룹에서 분리하는 것이 자료에 대한 정확한 이해와 분석 시 선행 될 것으로 요구된다. 이 논문은 이 음성그룹의 분리를 위해 K-평균 분석을 통해 EM알고리즘에 적용할 초기치 모수를 추정하고, 그 결과를 바탕으로 3구성 정규 합성모형의 모수를 EM알고리즘을 적용시켜 쉽게 추정할 수 있었다. 이 논문은 3구성 정규합성모형에 대한 예제로 HDL(high density lipoprotein)콜레스테롤 수치가 낮은 쥐에게서 얻어진 Microarray 데이터에 적용시켰다. 이 결과 음성그룹이 존재하며 활성분포, 정규분포와 분리되어지는 것을 확인할 수 있었다.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE