View : 37 Download: 0

GEPdb

Title
GEPdb
Authors
류다은
Issue Date
2013
Department/Major
대학원 생명과학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
김완규이상혁
Abstract
생물체의 특성이나 질병은 체내에서 일어나는 많은 물리적, 화학적 메커니즘을 통해 나타나는데 이 과정은 단순한 관계가 아닌 여러 분자들이 함께 상호작용하며 진행되기 때문에 정확히 밝혀내지 못한 부분이 많다. 근원적인 조절 메커니즘과 인간 질병의 유전적 위험의 이해를 위해서는 ‘유전형-발현형-표현형’간 관계(ternary relation)를 이해하는 것이 중요하다. 단일 염기 다형성 (Single nucleotide polymorphism, SNP)과 특정 표현형 특성의 연관 관계를 연구하는 전역 유전체 연관 연구 (Genome-wide associated study, GWAS)는 현재 1,200건 이상이 보고되어 많은 복합질병(complex disease)과 관련 있는 SNP을 밝혀내고 있다. 발현의 양적 특징에 관련 있는 좌위 eQTL (expression quantitative trait loci) 분석은 유전자의 발현에 영향을 미치는 특정 유전적 좌위를 나타낸다. eQTL은 조직 특이적으로 나타나기 때문에 분석 샘플의 기원이 중요하고 발현조절에 관련된 locus를 찾는 것 외에 조절네트워크를 구성하거나 임상 실험 시 후보유전자를 선택하는 유의한 정보를 제공할 수 있다. GWAS data는 생물학적 메커니즘 정보를 가지지 않기 때문에 생물학적 과정을 설명 할 수 있도록 eQTL정보를 통합하는 연구가 늘어나고 있다. GWAS데이터와 eQTL데이터 각각을 제공하는 여러 데이터베이스들이 존재하지만 이 두 정보를 통합하여 제공하는 데이터 베이스는 거의 없다. 우리는 유전형-표현형(GWAS)와 유전형-발현형(eQTL) 정보를 통합하는 웹 기반 데이터 베이스, GEPdb(Genotype-Expression-Phenotype database)를 개발 했다. GEPdb는 ‘유전형-발현형-표현형’관계에서 전역 유전체 연관 연구와 eQTL 매핑으로 각각 설명할 수 없는 부분의 연결을 가능하게 한다. 또한 인간 질병의 유전적 위험과 조절 메커니즘을 더 자세히 설명 할 수 있는 정보를 제공한다. 인터넷에 공개되어 있는 자료를 사용하였으며 데이터의 표준화를 위해 표현형은MeSH term, 유전자 정보는 미국 국가 생물 정보 센터(National Center for Biotechnology Information, NCBI) 에서 제공 하는 최신 버전의 유전자 정보로 변환 하였다. 데이터는 조직, 질병, 연구 제목으로 분류하여 사용자가 이용하는데 어려움이 없도록 하였고 더 많은 유의한 후보 군을 나타내기 위해 입력된 SNP은 연관 불균형, 유전자는 동시 발현 네트워크(co-expression)를 통해 확장하여 결과를 볼 수 있다.;Central dogma states that genetic information on DNA is expressed on RNA and then eventually, proteins. The produced proteins drive the manifestation of its inherent characteristics: various phenotypes and traits like risk probability of specific diseases. However, disease mechanism is highly complex interaction between numerous small molecules. To discover the causal regulation and genetic reasons of human disease, researchers in the post genomic era accept the important concept of ternary relation including genotypes, expression, and phenotype. The relation study, as called genome-wide associated study (GWAS), has been conducted >1,200 times until 2013, reporting >12,000 relevant SNPs, but it revealed only a connection between a genotype—mainly, single nucleotide polymorphism (SNP) and a specific human phenotype. Expression quantitative trait loci (eQTL) which regulates expression of transcripts have been found tissue-specifically, an origin of analyzed samples is apparently important. This initial record affords meaningful information as we detect accurate locus related, compose regulation networks, and choose candidate genes for experimental study. Comparing with GWAS data unconcerned with biological dynamics, eQTL outcomes are integrated to fully account for biological activities. There are several databases covering GWAS or eQTL respectively, as only few databases support the united results, though. I developed a web-based database, GEPdb (Genotype-Expression-Phenotype database), which seamless investigation of the ternary relation of genotype-expression -phenotype in a genome scale by filling the gap between GWAS and eQTL. GEPdb may provide a more complete picture on both genetic risks and gene regulatory mechanisms in various human diseases, which is not feasible by looking at GWAS or eQTL data separately. Wherever possible, the datasets in GEPdb are classified by tissue, disease (trait) and study, allowing easy querying and navigation according to the user’s interest. SNPs and gene lists can be expanded via linkage disequilibrium (LD) and co-expression network, increasing the scope of analysis significantly.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 생명과학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE