View : 1167 Download: 0

ChimerDB 3.0

Title
ChimerDB 3.0
Authors
이명교
Issue Date
2017
Department/Major
대학원 바이오정보학협동과정
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
이상혁
Abstract
Identification and analysis of fusion genes is essential to find prognostic markers and therapeutic targets of cancer. Fusion transcriptome analysis from RNA sequencing is one of the best way to configure fusion genes. We updated ChimerDB to provide enhanced and refined information. ChimerDB 3.0 is a comprehensive catalog of fusion genes through manual curation, RNA-seq fusion gene analysis, and text mining of fusion gene literature evidence. ChimerDB 3.0 is composed of three main data sources of fusion genes which are ChimerKB (knowledgebase), ChimerSeq(RNA-Seq analysis), ChimerPub(PubMed Abstract data-mining). ChimerKB incudes manually curated and 1,770 fusion genes with experimental evidences from COSMIC, GenBank, OMIM, Mitelman, TICdb, and ChimerDB 2.0. ChimerPub includes results of fusion gene extraction from PubMed abstracts with statistical approach. ChimerPub includes 2,767 fusion gene entity as a results of PubMed text-mining. ChimerSeq is a collection of 30,001 fusion transcripts that we have analyzed the TCGA transcriptome sequencing data (5,277 patients in 29 cancer types) using fusion gene predicting programs FusionScan and TopHat-Fusion. To reduce false-positive case of fusion genes, we filtered out fusion gene with reads evidence. ChimerDB 3.0 provides search interface with fusion gene related options and create publication-ready figures of fusion gene structure.;Fusion gene의 발견은 암 연구의 진단의 기초가 되는 바이오마커의 발견과 암 표적 치료에 사용되는 약물 표적으로 중요한 역할을 한다. 가장 널리 쓰이는 fusion gene 분석 방법은 RNA-sequencing 데이터 분석이다. 여러 데이터베이스에서 fusion gene RNA-sequencing 분석결과를 다루고 있으며, The Cancer Genome Atlas project 에서는 암 환자의 RNA-sequencing 데이터를 공개 하고 있다. ChimerDB 3.0은 기존의 fusion gene database, ChimerDB를 업데이트하여 데이터베이스로서의 기능을 향상시키고 한층 정제된 정보를 제공하고자 하였다. ChimerDB 3.0 데이터베이스는 데이터 소스에 따라 크게 세 부분으로 나뉘는데 ChimerKB는 knowledgebase를 뜻하며 manual curation을 통해 검증된 fusion gene 정보를 다루었다. ChimerPub은 NCBI의 논문 검색 엔진인 PubMed에서 초록을 분석하여 최신의 fusion gene 정보를 요약해서 보여주고자 하였다. ChimerSeq은 RNA-Seq fusion gene 분석을 통해 다양한 암 종과 여러 샘플에서 얻어진 fusion gene 예측 결과를 제공하였다. ChimerKB는 1,066 개의 fusion gene을 수록하였으며 COSMIC, GenBank(38), OMIM(95), Mitelman, TICdb, ChimerDB 2.0에서 실험적 증거가 있는 fusion gene 만을 포함시켰다. ChimerPub은 PubMed 초록에서 텍스트 마이닝 기법을 이용하여 추출한 2,767개 고유한 유전자를 포함시켰다. ChimerSeq은 총 30,001개의 유전자를 포함하며 그 중 TCGA RNA-seq data를 FusionScan과 TopHat-Fusion 두가지 알고리즘으로 분석한 fusion transcript와 TCGA fusion gene data portal에서 수집된 13,731개의 고유한 fusion transcript 분석결과를 데이터베이스화 하였고 총 29개의 암 종의 5,277명의 환자 샘플의 분석결과가 포함되었다. False-positive인 경우를 줄이기 위해서 리드 증거로 fusion gene을 필터링하는 기준을 정립하였다. ChimerDB 3.0은 fusion gene에 관한 정보를 데이터베이스로 구축하여 이를 편리하게 검색할 수 있도록 웹 서비스를 제공하였고 ChimerKB, ChimerPub, ChimerSeq 세가지 데이터베이스의 연관성을 보여주도록 각각의 공통된 fusion gene에 대하여 링크를 제공하고 있다. ChimerDB 3.0을 통하여 다양한 분야의fusion gene 정보를 체계적으로 제공하는 것이 이 연구의 목표이다.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 바이오정보학협동과정 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE