View : 1110 Download: 0

Full metadata record

DC Field Value Language
dc.contributor.advisor박현석-
dc.contributor.author이경은-
dc.creator이경은-
dc.date.accessioned2016-08-25T11:08:41Z-
dc.date.available2016-08-25T11:08:41Z-
dc.date.issued2011-
dc.identifier.otherOAK-000000068331-
dc.identifier.urihttps://dspace.ewha.ac.kr/handle/2015.oak/186691-
dc.identifier.urihttp://dcollection.ewha.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000068331-
dc.description.abstract다양한 생체 정보들이 DNA의 염기서열로 이루어져 있으므로, 정확한 염기서열을 밝혀내는 것은 생명 현상을 이해하는 바탕이 된다. DNA염기서열을 밝혀내는 기술을 ‘시퀀싱’ 이라고 하는데, 시퀀싱 기술은 지난 수년간 엄청난 발전을 거듭하여 현재 포스트 게놈 시대가 열렸다. 현재, 주로 사용되는 시퀀싱 기법은 2007년 등장한 차세대 시퀀싱(Next Generation Sequencing, NGS)인데, 기존의 기법에 비해 저비용으로 대용량의 시퀀싱 데이터를 생산해 낼 수 있다는 특징을 가지고 있고, 주로Roche, Illumina, 그리고 ABI라는 세 회사에서 시퀀싱 플랫폼을 제공하고 있다. 이에 따른 각각의 시퀀싱 데이터의 분석 프로그램을 최적화 시켜놓았기 때문에, 통합된 분석 프로그램이 존재하기 어려운 상황이다. 또한 플랫폼 별 시퀀싱 기술의 차이로 시퀀싱 결과 역시 차이가 있다는 점도 차세대 시퀀싱 기술의 문제점 중 하나이다. 본 논문에서는 이러한 차세대 시퀀싱 기술의 문제점을 해결하고자 차세대 시퀀싱 플랫폼의 포맷 변환기를 개발하여, 플랫폼에 의존적이지 않게 분석을 할 수 있도록 하였다. 또한 하나의 플랫폼만 수용 가능했던 기존의 서열정렬(alignment) 뷰어와 달리, 다양한 플랫폼을 수용하여 alignment된 결과를 한 창에서 확인 할 수 있도록 하였다. 또한 다양한 플랫폼에서 나온 서열 정보들의 quality 값을 비교해보며, 사용자가 적절한 결과를 유추할 수 있다는 것을 가장 큰 장점으로 한다.;To unearth the exact nucleotide is the foundation of understanding vital phenomenon because various biologic information consists of nucleotide of DNA. The technology to find DNA nucleotide is called ‘sequencing’. The sequencing technology made great progress during past several years and open the era of post genome. Nowadays most popular sequencing technology is Next Generation Sequencing(NGS), introduced in 2007 and produce high-throughput sequencing data with lower cost than previous methodology. Three companies (Roche, Illumina and ABI) provide different sequencing platforms. They optimize their own analysis programs for sequencing data and it is impossible to integrate analysis programs. And sequencing results also have difference because each platform has different sequencing technology. It is the one of the problems of next generation sequencing technology. In this thesis, to solve the technical problems of next generation sequencing technology, we develop NGS format converter for platform independent analysis. Unlike previous alignment viewer, accepts only one platform, we made new viewer accepts various platforms and can verify the alignment results on one window. And one of the most advantage of this viewer is the user can infer the proper result by comparing quality value of sequencing data aligned from various platforms.-
dc.description.tableofcontentsI. 서론 1 A.연구배경 1 1. 시퀀싱 기술의 발전 1 가. 고전적인 시퀀싱 방법인 Sanger 기술 1 나. 3대 차세대 시퀀싱 플랫폼 5 2. 시퀀싱 데이터의 이용 10 B. 연구 목적 및 내용 13 II. 관련 연구 16 A. 시퀀싱 기술의 발달 16 B. 차세대 시퀀싱 플랫폼의 데이터 포맷 17 1. Roche 454의 GS FLX: .sff포맷 17 2. ABI의 SOLiD: .csfasta와 .qual포맷 17 3. Illumina Solexa의 Genome Analyzer: .fasta 또는 .fastq 포맷 20 C. 차세대 시퀀싱 분석 툴 21 1. 시퀀스 Alignment 툴과 SAM 포맷 21 2. 차세대 시퀀싱 데이터 뷰어 25 가. Bambino 26 나. Tablet 27 3. Alignment 알고리즘 28 가. Burrows-Wheeler Transform 29 4. 어셈블리 툴 32 III. 연구내용 34 A. 시스템 개요 36 B. 프로그램 비교 38 1. Bambino 38 2. Tablet 39 C. 시스템 구현 40 D. 실제 차세대 시퀀싱 데이터를 이용한 실험 44 IV.결론 46 참고문헌 54 부록1. 통합뷰어의 Usecase Diagram 58 부록2. 차세대 시퀀싱 통합 분석을 위한 LIMS 시스템의 Usecase Diagram 59 ABSTRACT 60-
dc.formatapplication/pdf-
dc.format.extent3882131 bytes-
dc.languagekor-
dc.publisher이화여자대학교 대학원-
dc.title차세대 시퀀싱(NGS) 플랫폼 별 포맷 변환과 통합 뷰어 모듈 구현-
dc.typeMaster's Thesis-
dc.format.pagevi, 60 p.-
dc.identifier.thesisdegreeMaster-
dc.identifier.major대학원 컴퓨터공학과-
dc.date.awarded2011. 8-
Appears in Collections:
일반대학원 > 컴퓨터공학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE