View : 1019 Download: 0

뇌의 3차원 유전자 발현 데이터 군집화 및 영상 매칭 기반 3차원 가시화

Title
뇌의 3차원 유전자 발현 데이터 군집화 및 영상 매칭 기반 3차원 가시화
Other Titles
Clustering and visualization of 3-D gene expression data in the mouse brain
Authors
박서하
Issue Date
2015
Department/Major
대학원 컴퓨터공학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
김명희
Abstract
As the amount of data to research life phenomena becomes massive, it became possible to extract a new hypothesis from the data and attempt theoretical interpretation. Clustering algorithm is useful for analyzing big data without information in advance. Recently, gene expression data are obtained in three-dimensional images and there is no tool to cluster, analyze, and show the data in images. Such tool would be necessary for researchers to reduce time to design a test and design an effective test according to the new form of data. This study attempts to provide a method to cluster 3-d gene expression data and a test tool for researchers to conduct biological tests by using the method. In this study, 3-d gene expression of mouse brains of Allen Institute for Brain Science was used as data for the experimental data. The number of downloaded genes was 25,896, and all of them were 3-d, expression profile data with cellular resolution. Among these data, only 3,258 data in the coronal direction that were extracted by the test were used. Before clustering, data re-composition was performed for processing of the 3-d image data by using a computer, and dimension reduction to reduce the noise and scale of the data. In this study, to cluster genes, the expression locations of genes were considered. Therefore, before clustering genes, voxels were fist clustered according to similarity of gene expression, and then, genes were clustered within the created community. While clustering voxels, data with reduced dimension were verified and, while they were verified for suitability to be used as location data, it was found that the clustering result has similar anatomical structure to the brain. The result of gene clustering was compared with the website Brain Architecture project that provides the result of clustering the same data, and Brain Explorer 2, of Allen Institute for Brain Science, was used to examine the expression pattern of genes. And then, in this study, the result of gene clustering was designed so that it can be verified in the actual brain image. In the process, it was necessary to adjust the size of the two images because the resolutions of gene expression data and that of the actual brain image were different, and trilinear interpolation was used to adjust the size. By using this, clustering was performed and a tool to simultaneously verify the 2-d section and 3-d volume was created.; 생명현상을 연구하기 위한 데이터의 양이 방대해짐에 따라 데이터를 통해 새로운 가설을 추출하고 이론적 해석을 시도할 수 있게 되었다. 또한, 단일 유전자를 대상으로 연구했던 것에서 수많은 유전자들 간의 연관성을 찾는 연구로 발전하게 되었다. 이러한 대용량 데이터를 사전 정보 없이 데이터만을 이용해 분석하기 위해서는 군집화 알고리즘이 유용하다. 또한, 유사한 기능을 수행하는 유전자들은 그 발현 패턴이 매우 유사한 경향을 보이며 이미 알려져 있는 유전자의 기능으로부터 새로운 유전자의 기능을 예측할 수 있기 때문에 유용하다. 최근에는 유전자 발현 데이터가 3차원 영상 데이터의 형태로 획득되고 있는데, 이러한 데이터를 군집화하고 분석하고 영상 형태로 보여주는 도구는 없다. 새로운 데이터의 형태에 맞추어 유전자 실험 연구를 하는 연구자들에게 실험을 설계하는 시간을 줄이고 효율적인 설계를 할 수 있도록 돕기 위해선 이러한 도구가 필요하다. 따라서 본 논문에서는 3차원 유전자 발현 데이터를 군집화하는 방법과 이를 이용해 생물학적 실험을 하는 연구자들에게 가설이 되는 실험 도구를 제공하고자 한다. 본 논문에서는 앨런 뇌 과학 연구소의 쥐 뇌의 3차원 유전자 발현 데이터를 실험 데이터로 이용하였다. 다운로드 받은 유전자의 개수는 25,896개의 세포 수준의 해상도를 갖는 발현 양상 데이터이며, 모두 3차원 데이터이다. 이 데이터를 관상면 방향의 데이터와 시상면 방향의 데이터간 상관관계 분석을 통해 관상면 방향의 데이터 3,258개만을 이용해 실험하였다. 군집화하기 전에 3차원 영상 데이터를 컴퓨터를 이용해 처리하기 위한 데이터 재구성 과정을 거치고, 복셀을 군집화 하기 위해 데이터의 노이즈와 크기를 줄이기 위한 차원 축소 과정을 수행했다. 그 결과 복셀의 개수는 159,326개에서 49,742개로, 복셀의 군집화를 위해 이용할 유전자의 개수는 3,258개에서 8개로 줄어들었다. 본 논문에서는 유전자를 군집화하기 위해 유전자들의 발현 위치를 고려하고자 하였다. 뇌는 부위별로 서로 다른 기능을 수행하기 때문에 이러한 특징을 군집화에 고려하면 보다 영향력 있는 유전자들의 군집을 추정할 수 있기 때문이다. 게다가 실험 데이터가 3차원 형태이기 때문에 이러한 특징을 이용한 추정이 가능하다. 따라서 유전자를 군집화하기 전에 유전자 발현의 유사성에 따라 복셀을 먼저 군집화 하고 만들어진 군집 내에서 유전자를 군집화하였다. 복셀을 군집화하는 과정에서 차원 축소한 데이터를 검증하고, 위치 정보로 이용하기 위해 적합한지 확인해 보는 과정에서 군집화 결과와 뇌의 해부학적 구조가 유사함을 확인하였고, 이를 통해 유전자 발현이 유사한 복셀들은 뭉쳐있는 경향이 있으며, 이렇게 모인 유전자들이 유사한 기능을 수행한다는 것을 알 수 있었다. 따라서 이러한 복셀의 군집을 이용하면 해부학적 구조를 이용하는 것보다 더 유전자의 발현이 유사한 군집을 찾아낼 수 있다. 유전자를 군집화한 결과를 같은 데이터를 이용해 군집화한 결과를 제공하는 Brain Architecture project 사이트와 비교하고, 앨런 뇌 과학 연구소에서 제공하는 Brain explorer 2 프로그램을 이용해 유전자의 발현 패턴을 확인했다. 그리고 본 논문에서는 유전자를 군집화한 결과를 실제 뇌 영상에서 확인할 수 있도록 만들었다. 이 과정에서 유전자 발현 데이터의 해상도와 실제 뇌 영상의 해상도가 다르기 때문에 이 두 영상의 크기를 맞추어 주는 작업이 필요했고, 삼선형 보간법을 이용하여 크기를 맞추었다. 67×41×58의 유전자 크기를 528×320×456의 크기로 맞추었고, 이를 이용해 군집화를 수행하고 뇌의 2차원 단면과 3차원 볼륨의 형태를 동시에 확인할 수 있는 도구를 만들었다.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 컴퓨터공학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE