View : 412 Download: 0

Computational drug discovery using drug-induced transcriptome data

Title
Computational drug discovery using drug-induced transcriptome data
Authors
이한비
Issue Date
2023
Department/Major
대학원 바이오정보학협동과정
Publisher
이화여자대학교 대학원
Degree
Doctor
Advisors
김완규
Abstract
About ~95% of drug candidates fail during pre-clinical and clinical trials despite huge cost and time. It is critical to fully understand a drug’s mechanism of action (MoA) to choose the right candidates for clinical development during the early stage of drug discovery, i.e. hit identification, hit-to-lead, and lead optimization, etc. Omics-based molecular profiling allows a comprehensive understanding of a drug’s MoA as it did in many studies of genetic perturbation, disease subtypes, cell differentiation, etc. Particularly, computational analysis of drug-induced transcriptome has been applied to various problems of early drug discovery including drug-target interaction (DTI), drug repositioning (DR), side effect/toxicity prediction, and elucidation of unknown off-targets. All these approaches contribute to selecting more promising candidates of desired properties throughout the drug discovery stages. In this thesis, I applied computational analyses to i) elucidate transcriptome-wide MoA of a drug candidate, ii) identify DR candidates for non-alcoholic steatohepatitis (NASH), and iii) predict DTI using deep neural network (DNN). In chapter I, I analyzed both bulk- and single-cell RNA (scRNA) transcriptome of asthma mouse models treated by a novel phosphoinositide 3-kinase delta (PI3Kδ) inhibitor. This led to the elucidation of therapeutic mechanisms distinct from dexamethasone, a corticosteroid conventionally used to treat asthma. In addition, receptor-ligand analysis of scRNA-sequencing data predicted unique cell-cell interactions. The PI3Kδ inhibitor modulates pathways related to airway remodeling, type 2 inflammation and Th17 immune response. These results suggest that the PI3Kδ inhibitor may be effective in treating corticosteroid-resistant asthma. In chapter II, I predicted DR candidates for NASH by comparing drug-induced and disease expression profiles. This approach is called ‘CMAP analysis’, which searches for drugs that show an inverse transcriptomic pattern of disease. CMAP analysis is based on the hypothesis that drugs reversing disease transcriptomic pattern are likely to drive a cell or tissue from a disease state closer to a normal state. I compared expression profiles of NASH mouse models (11 sets, 70 profiles) and patients (9 sets, 285 profiles). Using CMAP analysis, I listed the top 9 candidates, seven of which inhibited lipid accumulation of AML12 cells. These seven candidates included four MEK inhibitors, suggesting MEK as a promising target in treating NASH. In chapter III, I developed a novel DNN model to predict DTI based on large-scale drug-induced expression profiles. I evaluated three different target features for DTI prediction: pathway memberships, protein-protein interaction (PPI) networks, and genetically perturbed expression profiles (gene knockdown). Additionally, the DNN model was compared with other machine learning models, i.e. naïve Bayes, logistic regression, and random forest. The DNN model shows more robust and better performance (AUC 0.85) than other machine learning models (AUC 0.66~0.76). In conclusion, I introduced three approaches for computational drug discovery using drug-induced transcriptome data. I showed that utilizing transcriptomics technology can provide a new perspective in addressing common challenges in the early stages of drug development. The approaches introduced in this thesis provide opportunities for a more efficient drug discovery process. ;신약 개발 과정은 많은 시간과 비용이 소모되지만 95%의 후보 물질은 임상과 전임상 단계에서 실패한다. 적합한 후보 물질을 도출하기 위해서는 신약 개발 초기 단계에서 후보 물질의 작용 기전에 대한 충분한 이해가 필요하다. 오믹스 기반의 분자 프로파일링은 생물학적 기전에 대한 포괄적인 이해를 돕기 때문에 과거부터 질병 아형 분류, 세포 분화 연구 뿐만 아니라 약물의 작용 기전 해석에도 사용되어 왔다. 특히, 약물 유도 전사체를 활용한 컴퓨터 분석은 약물 개발 초기 단계에 적용되어 약물-표적 단백질 상호작용 예측, 신약 재창출 및 약물 부작용 예측과 같은 문제를 해결하기 위해 사용되고 있다. 이러한 접근법들은 적합한 효능의 후보 약물을 도출하여 성공적인 신약 개발로 이어지는데 도움을 주고 있다. 본 논문은 약물 유도 전사체를 활용한 컴퓨터 기반 신약 개발의 세 가지 방법을 제시한다. 첫 번째로 본 논문은 벌크 전사체 시퀀싱 (bulk RNA sequencing)과 단일 세포 전사체 시퀀싱 (single-cell RNA sequencing) 데이터의 통합 분석을 통하여 새로 개발된 PI3Kδ 억제제의 중증 천식에서의 작용 기전을 탐구했다. 공개 데이터베이스로부터 천식 모델 전사체 데이터를 수집하고 중증 천식 모델의 전사체와 비교하여 중증 천식 특이적 기전을 규명하였다. 또한 천식에서 주 치료제로 사용되는 덱사메타손과 PI3Kδ 억제제가 처리된 전사체 데이터를 비교 분석하여 PI3Kδ 억제제 특이적 치료 기전을 추론하였다. 본 연구를 통해 새로 개발된 PI3Kδ 억제제가 제2형 사이토킨 뿐만 아니라 중증 천식과 관련 있는 airway remodeling 경로와 IL-17면역 반응을 조절하여 중증 천식을 호전시킨다는 것을 제시하였다. 두 번째로, 약물 재창출 방법을 통해 비알코올성 지방간염을 치료할 수 있는 후보 약물을 도출하였다. 대규모 약물 유도 전사체 데이터베이스로부터 수집한 약물의 시그니처와 비알코올성 지방간염의 시그니처를 비교하여 질병에서 유도된 유전자 발현 변화를 역접 시킬 수 있는 후보 약물을 예측했다. 또한 질병의 발현변화를 유도할 수 있는 타겟을 예측하여 MEK 억제제를 비알코올성 지방간염을 치료할 수 있는 후보 약물로 도출하였다. 세포 실험을 통하여 4종의 MEK 억제제들의 지방 축적 억제 효능과 간 성상 세포 활성 억제 효능을 확인하였다. 마지막으로 본 논문은 심층 신경망 알고리즘을 대규모 약물 유도 전사체에 적용하여 약물-표적 단백질 상호작용을 예측하는 새로운 심층 신경망 모델을 제시했다. 세 가지 다른 성질의 데이터로부터 표적 단백질의 특성을 도출하고 약물 유도 전사체와 함께 학습시켜 성능을 비교했다. 가장 우수한 성능을 보이는 모델을 최종 모델로 선정하였으며 다른 기계 학습 모델들보다 더 안정적이고 좋은 성능을 보였다 (AUROC 0.85). 본 논문은 약물 유도 전사체를 활용한 컴퓨터 기반의 신약 개발 방법을 소개하였다. 약물 유도 전사체를 활용하여 신약의 작용 기전을 추론하고 신약 재창출을 통해 비알콜성 지방간염을 치료할 수 있는 후보 물질을 도출하였다. 또한 심층 신경망 모델을 구축하여 약물-표적 단백질의 상호작용을 예측하였다. 세 가지 문제 해결을 통해 약물 유도 전사체를 활용한 컴퓨터 기반 접근법의 유용성을 확인하였다. 결론적으로, 본 논문은 약물 유도 전사체가 약물 개발 초기 단계의 문제를 해결하는 데에 새로운 관점을 제시하여 약물 개발의 효율을 높이는 기회를 제공할 수 있음을 확인하였다.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 바이오정보학협동과정 > Theses_Ph.D
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE