View : 840 Download: 0

Functional annotation of alternative splicing in the human genome

Title
Functional annotation of alternative splicing in the human genome
Authors
이영희
Issue Date
2007
Department/Major
대학원 분자생명과학부
Publisher
이화여자대학교 대학원
Degree
Doctor
Abstract
컴퓨터가 인터넷에 연결되어 있을 때, 우리는 유전체 전체 서열을 쉽게 얻을 수 있다. 인간 유전체 프로젝트 (The U.S. Human genome project, HGP) 가 1990년에 공식적으로 시작한 지 13년 만에 이루어낸 성과였다. HGP는 미국 에너지부서와 국립보건원에 의해 조정되어 오고 있다. 이 프로젝트는 15년 동안 지속 될 것이라고 예상 되었으나, 빠른 기술 향상으로 인하여 2003년도에 완성이 되었다. 2006년 6월에 인간 유전체의 “working draft”가 발표되었고 2003년에는 인간 유전체를 완성되었다. 인간 유전체의 완성에 따라, 많은 질문들이 야기된다. DNA는 아데닌 (A), 티민 (T), 구아닌 (G), 타이토신 (C) 의 4 가지 뉴클레오타이드 염기가 인간 유전체에서 30억 개를 구성하고 있다. 인간 유전체에서 이들 4 가지 염기들의 특이한 순서를 찾으려고 했을까? 우리는 이것을 가지고 무엇을 할 수 있는가? 4 가지 염기의 특이한 서열은 단백질 합성 정보와 인간 질병 유전자를 찾는 기초적인 자원이라는 것을 명심해야 한다. DNA 서열을 이용하여 우리가 해야 할 임무는 그들의 암호를 해독하고 기능을 찾아내는 것이다. 이러한 과정을 유전체 해석 (Genome annotation) 이라 한다. DNA 정보는 mRNA를 통하여 단백질로 전달되므로. 이 과정에 대한 유전체 해석을 성공적으로 하는 것이 중요하다. 이러한 관점에서 인간 유전체 해석의 기본은 mRNA의 선택적 접합 (alternative splicing of pre-mRNA) 에 초점이 맞추어진다. 인간과 같은 진핵생물들은 원핵생물들이 가지고 있지 않은 인트론과 엑손을 가지고 있다. 진핵생물들의 인트론 들은 pre-mRNA 과정서 제거 된다. 이 과정을 선택적 접합이라고 한다. 선택적 접합은 하나의 pre-mRNA로부터 다양한 단백질들을 만들어 내는 역할을 한다. 선택적 접합 현상은 인간 유전자의 70%에서 나타나며 단백질의 기능을 변화시킨다. 이러한 변화는 pre-mRNA로부터 인트론을 제거 할 때 엑손으로부터 인트론을 인식하는 접합 위치를 달리 사용할 경우에 보여진다. 접합 위치 선택의 변화가 다양한 형태의 암에서 관찰되므로 아마도 pre-mRNA의 선택적 접합은 종양 발달과 암에 대한 민감성에 관련된 유전자에 영향을 끼칠 수 있다. 이러한 맥락에서, 선택적 전사물질의 구조가 유전자에게 어떻게 영향을 미치는가를 이해하는 것은 중요한 문제이다. 선택적 접합이 후-전사 과정에서 적절한 단백질을 만드는 중요한 단계라는 관점에서, 이전의 연구들은 유전체 해석에 돕는 가치 있는 증거들을 제시하고 있다. 선택적 적합에 의한 단백질 도메인 상실 결과들은 표현형의 변화에 관련되어 있기 때문에, 본 논문은 도메인 상실을 일으키는 선택적 접합에 초점을 맞추었다. 선택적 접합에 의해 영향을 받는 도메인을 유전체 범위로 분석하는 작업이 요구된다. 본 논문의 목적은 선택적 접합이 단백질 도메인에 끼치는 영향을 이해하는 것과 선택적 접합과 관련된 병리학을 연구하는 생물학자들을 돕는 것이다. 선택적 접합을 하는 유전자들의 구조와 그들의 기능적 특징들을 시각화하는 자바 웹 도구를 개발하였다. 선택적 전사자들의 완벽한 모델인 ECgene의 인간 전사자 데이터를 이용하여 도메인을 암호화하는 선택적 접합 전사자 구조에 영향을 끼치는 선택적 접합의 경향을 연구하였다;Ⅱ. Abstract Alternative splicing produces various transcript structures by differential use of splice sites. Comparing the gene structure and functional features of splice variants is an essential but nontrivial and tedious task as numerous predictions of gene functions are available. Thus, we designed novel viewers visualizing the transcript structure and functional features of alternatively spliced genes intuitively. Two key ideas used in these viewers are clustering of overlapping exons and representing introns at an arbitrary scale. Using the representative exons in the master coordinate facilitates comparison of transcript structure for genes with many splice variants. Arbitrary intron scaling enables seamless transition from the genome browser to the transcript or protein viewer. Thus, the detailed gene structure as well as any functional features in the genomic, mRNA, and protein sequences can be readily shown in a unified interface. Current java implementation, ASviewer, supports four well-known gene predictions websites (RefSeq, Ensembl, AceView, and ECgene) and users may upload sequences, features, and annotations in various formats. ECfunction is one of the major applications in the ECgene annotation project, collecting information related to gene function. They not only collect information related to gene functions and SNP, but also predict transmembrane, signal peptides, BLAST hits, GO annotation, and cis-regulatory elements. Available at http://genome.ewha.ac.kr/ECgene/ECfunction/ and http://genome.ewha.ac.kr/ASviewer/ III. Abstract Alternative splicing (AS) is an important mechanism which enhances diversity of polypeptides and transcripts manufactured by a constrained number of genes. Deleterious polypeptides generated by abnormal alternative splicing, give rise to human diseases including cancer. Therefore, alternative splicing is a critical step of producing a proper protein during post-transcriptional processing. About 75% of AS events occur in the translated region of mRNAs and affects the protein-coding region and -88% of AS change the protein product. A post transcriptional pathway, Non-sense mediated (NMD) is important not only in that it degrades aberrant mRNA containing a premature termination codon (PTC) which is targeted for NMD in its open reading frame (ORF) thereby deleting truncated proteins that could be deleterious to the cell, but also in that it modulates the levels of naturally occurring transcripts. Questions that need to be asked in these circumstances are: What is a distribution of AS patterns affecting coding regions encoding protein domain? When one misses its domain completely, is it NMD candidate or not? In order to address these questions in the human genome, we speculated alternative transcripts structures affecting coding regions in the encoded protein products. The concurrency between domain loss and NMD was also investigated. Through the study, we tried to present distinct features for AS patterns that affect domain loss.
Description
☞ 이 논문은 저자가 원문공개에 동의하지 않은 논문으로, 도서관 내에서만 열람이 가능하며, 인쇄 및 저장은 불가합니다.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 생명·약학부 > Theses_Ph.D
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE