View : 482 Download: 0

인간유전체 비암호화 영역의 DNA 서열과 염색질 상태의 상관관계에 대한 연구

Title
인간유전체 비암호화 영역의 DNA 서열과 염색질 상태의 상관관계에 대한 연구
Other Titles
A Study on the Correlation between DNA Sequence of Non-coding Regions of the Human Genome and Chromatin States
Authors
남희조
Issue Date
2021
Department/Major
대학원 인공지능·소프트웨어학부
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
박현석
Abstract
The purpose of the study is to model the functions and properties of the complete non-coding regions of human genome in relation to chromatin state. Most of the non-coding regions of the human genome have unknown biological functions. Unlike genetic information, epigenetic status is influenced by various environments. Therefore, it is a pioneering study to elucidate the relationship between the non-coding region of the human genome and the chromatin state. Extensive studies of genomic regions show that one approach is not sufficient to study the function of non-coding regions. In order to comprehensively understand the functional structure of the human genome, it is necessary to integrate all information obtained through various approaches using appropriate statistical learning methods. This study seeks to develop a basis for functional annotation that can be generalized to various cell types. By integrating the 127 epigenetic data published in the Roadmap Epigenomics Project, the effect of the nucleotide sequence on the epigenetic landscape is confirmed. In addition, a new statistical concept of chromatin state variability is presented to analyze the relationship with the DNA sequence. A sequence model of the human genome is constructed using a convolutional neural network, and biological functions are confirmed through motif and gene ontology analysis.;본 연구의 목적은 염색질 상태(chromatin state)에 관하여 인간유전체 비암호화 영역의 기능과 속성을 모델링하는 것이다. 인간유전체 비암호화 영역의 대부분은 생물학적 기능이 밝혀져 있지 않다. 또한 염색질 상태와 같은 후성유전학적 상태는 유전 정보와는 다르게 다양한 환경에 영향을 받는다. 따라서 인간유전체 비암호화 영역과 염색질 상태와의 상관관계를 밝히는 것은 선구적인 연구이다. 유전체 영역에 관한 방대한 연구는 한 가지 접근방식으로는 비암호화 영역의 기능을 연구하는데 충분하지 않음을 보여준다. 유전체의 기능적 구조를 포괄적으로 이해하기 위해서는 다양한 접근 방식을 통해 얻은 모든 정보를 적절한 통계적인 학습 방법을 사용하여 통합하여야 한다. 본 연구에서는 다양한 세포 유형에 대해 일반화할 수 있는 기능적 주석의 기초를 개발하고자 했다. 로드맵 프로젝트 (Roadmap Epigenomics Project)에서 공개된 127개의 후성유전자 데이터를 통합하여 후성유전학적 지형에 대한 염기서열의 효과를 확인한다. 또한 염색질 상태 가변성이라는 새로운 통계적 개념을 제시하여 염기서열과의 관계를 분석한다. CNN(Convolutional Neural Network)를 이용하여 인간 유전체의 시퀀스 모델을 구축하고, 모티프(motif)와 유전자 온톨로지(gene ontology) 분석을 통해 생물학적 기능을 확인한다.
Fulltext
Show the fulltext
Appears in Collections:
ETC > ETC
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE