View : 384 Download: 0

Full metadata record

DC Field Value Language
dc.description.abstractDrug repositioning is identifying and developing new uses for existing drugs. Here, we evaluated associations of between chemical and disease. This evaluation is based on gene set analysis (GSA) between disease signature genes and chemical targets. We amassed 400 sets of signature genes for 97 types of diseases extracted from publically available gene expression profiles. Chemical target data for more than 40,000 chemicals are collected from a number of databases such as CTD, DrugBank and PharmGKB. Disease-chemical associations are inferred based on the significance of overlap between disease signatures and chemical target genes. Our method was evaluated using known disease-chemical pairs, resulting in a reasonably high prediction accuracy. In-depth evaluation was also performed for the five types of cancer: lung cancer, glioblastoma, breast cancer, prostate cancer and acute promyelocytic leukemia.;Drug repositioning은 이미 치료에 쓰이고 있는 약에 새로운 쓰임을 주는 것으로 기존 신약 개발 방법보다 시간, 비용을 효과적으로 줄일 수 있다. Drug repositioning에서 중요한 것은 chemical이 작용하는 gene과 disease가 발생함으로 인해 비정상이 된 gene이 서로 일치하여 chemical이 효과적으로 작용할 수 있게 되는 것이다. 본 논문에서는 chemical과 disease 사이에 연관성을 예측하고, 그 예측이 얼마나 정확하게 되었는지 평가하였다. 예측은 Chemical의 target과 disease signature 사이의 gene set analysis(GSA)를 기초로 하였다. 97가지 disease에 대하여 gene expression omnibus(GEO)에서 microarray data를 가져와 400여 subset으로 나누어 disease signature를 추출하였다. Chemical target data에는 40,000여 개의 chemical의 target 정보를 담고 있으며 CTD, Drug Bank, PharmGKB같은 총 13개 public database와 text-mining을 통하여 정보를 수집하였다. Chemical과 disease 연관성은 chemical의 target gene과 disease의 signature gene이 겹치는 정도를 통하여 예측하였으며, 이 예측의 정확도를 평가하기 위하여 이미 알려져 있는 disease와 chemical pair를 CTD에서 가져와 사용하였으며, 특별히 5가지 cancer(APL, Breast cancer, Glioblastoma, Lung cancer, Prostate cancer)에 대해서는 hand curation을 통하여 각각의 cancer에 작용하는 chemical의 pool을 넓히어 예측을 평가하는데 사용하였다. 이렇게 모아진 알려져 있는 disease와 chemical pair를 이용하여 평가한 우리 예측의 정확도는 매우 높은 값을 나타내었다.-
dc.description.tableofcontentsI. Introduction 1 II. Materials and Methods 4 A. Data 4 1. Chemical - Target Data 4 2. Disease signature 10 3. Known Chemical - Disease Association 13 B. Methods 17 1. Selection of Differentially Expressed Genes 17 2. Gene Set Analysis (GSA) 19 III. Results 20 A. Analysis of chemical-target data 20 1. Targets of known chemical 20 2. Data filtering 24 3. Accuracy of predicted association 38 B. Case study 43 IV. Conclusion 46 V. Reference 47 Abstract 49-
dc.format.extent10873506 bytes-
dc.publisher이화여자대학교 대학원-
dc.titleAssociation of diseases and chemicals by gene set analysis for drug repositioning-
dc.typeMaster's Thesis-
dc.format.pagevi, 49 p.-
dc.identifier.major대학원 생명·약학부생명과학전공- 2-
Appears in Collections:
일반대학원 > 생명·약학부 > Theses_Master
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.