View : 1186 Download: 0

Draft de novo genome assembly of a pulmonate species, Ellobium chinense

Title
Draft de novo genome assembly of a pulmonate species, Ellobium chinense
Authors
진소영
Issue Date
2018
Department/Major
대학원 에코과학부
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
박중기
Abstract
복족강은 연체동물의 8개 강 중, 가장 많은 종을 포함하는 분류군으로 해양 및 담수는 물론, 그 중 일부는 육상에까지 적응 진화하여 다양한 환경에 서식하고 있다. 복족강의 전장 유전체 정보는 해양이나 담수에 서식하는 일부 종에 대하여 연구된 바 있으나 아직까지 육상이나 기수에 서식하는 종에 대한 전장 유전체 정보는 연구된 바 없다. 본 연구에서는 기수지역에 서식하고 있는 유폐류인 대추귀고둥 (E. chinense )에 대한 de novo 전장 유전체 분석을 수행하여 전장 유전체 정보를 보고한다. 연구 결과 대추귀고둥의 전장유전체는 약 978Mbp로 어셈블되었으며, 9종의 근연 종과 UniProt 데이터베이스를 사용하여 상동성에 기반한 유전자 예측을 수행하여 총 17,963 개의 유전자를 예측하였다. 유전자 1개당 약 7 개의 CDS를 가지고 있으며 CDS의 평균 길이는 약 201bp로 나타났다. Intron의 경우, 유전자 당 평균 개수는 약 6개이고 평균 길이는 약 8,191bp이며 이는 CDS보다 약 40배 정도로, 훨씬 더 길다. 아울러 17,963개의 예측된 유전자에서 4,742개의 InterPro term과 1,244개의 GO term, 4,976개의 KEGG orthology가 발견되었다. 종간 유전자 서열의 상동성에 기반하여 예측된 유전자를 이용하여 3가지 어노테이션 및 온톨로지 분석을 진행했을 때, 그 구조가 매우 보존적인 유전자들이 많이 도출 된 것을 알 수 있다. 복족강의 일부 종들이 담수 및 육상의 서식처로 이동하여 적응 진화한 과정을 정확히 이해하기 위해서는 해양 및 담수에 서식하고 있는 근연종과의 비교 유전체 연구가 중요하다. 본 연구에서 처음으로 밝혀진 대추귀고둥의 전장 유전체 정보는 해양으로부터 담수 및 육지로 진화하는 과정에서 경험한 유전체의 진화 연구에 중요한 정보를 제공할 수 있을 것으로 판단된다. 또한 환경부 지정 멸종위기종인 대추귀고둥의 유전체 정보는 멸종위기종 보전을 위한 집단 유전학적 마커 개발 등을 위한 유전정보로 활용될 수 있다.;Although a total of 20 mollusk draft genomes has been sequenced for marine and freshwater species, no whole genome sequence has been characterized yet from terrestrial or brackish water gastropod representatives. Ellobium chinense is a terrestrial pulmonate gastropod species and has been assessed as endangered species in Korea. Since the species inhabits saltmarsh in brackish water area, an intermediate environment between marine and freshwater habitats differing in salt concentration, temperature, and exposure time to the ambient air. In this respect, the characterization of draft genome sequence of E. chinense provides an insight into gastropod evolution and captures genetic signals associated with genome evolution in their terrestrialization from marine environments. In this thesis, I report the whole genome sequencing of E. chinense using de novo genomic methods. The assembled E. chinense genome was about 978 Mbp, with a total of 17,963 genes predicted by homology-based gene prediction using 9 related molluscan species and the UniProt database. Predicted genes had about 7 CDSs per gene on average, and the average CDS length was 201 bp. The average number of introns per gene was 6 and the average intron length was 8,191 bp, which is much longer than the CDS. A total of 4,742 InterPro terms, 1,244 GO terms and 4,976 KEGG pathways were found in 17,963 predicted genes. These ontology tests showed that the most commonly found genes were highly conserved genes.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 에코과학부 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE