View : 1104 Download: 0

In silico prediction of phenotypic screening targets from large-scale bioassay data

Title
In silico prediction of phenotypic screening targets from large-scale bioassay data
Authors
박세라
Issue Date
2020
Department/Major
대학원 바이오정보학협동과정
Publisher
이화여자대학교 대학원
Degree
Doctor
Advisors
김완규
Abstract
The main goal of drug discovery is to develop safe and effective medicines for human diseases. In particular, phenotypic screening has recently attracted attention in industry and academia as an efficient strategy for screening promising drug candidates because it can directly measure biological systems to provide active molecules suitable for complex clinical conditions. An important challenge for phenotypic screening is the ‘target deconvolution’ process, which identifies molecular targets that characterize the observed phenotypic outcomes. Over the decades, large amounts of information about the bioactivity, structure, and targets of small molecule libraries have been accumulated in public databases such as PubChem and ChEMBL. This allows in silico methods to compare the bioactivity or structure of known drugs based on similarity searching and to increase the potential of target identification. Thus, this study proposes in silico target deconvolution methods based on large-scale bioactivity data in order to understand the underlying mode of action (MoA) of promising phenotypic hit compounds. First, the Hit Enriched Assay (HEA) analysis is a novel idea that it can assume the bioactivity profile for given compounds using large-scale bioactivity data. HEA refers to a list of bioassays of which hits are enriched among a query compound set. HEA was applied to infer unknown targets of phenotypic hits based on overlap with the targeted assay outcomes. Case studies applying three sets of phenotypic screening hits confirmed that the HEA assay can assume underlying targets for the phenotype. The results show the potential of HEA analysis to uncover a mechanism-of-action phenotype-based drug candidates In order to overcome the limitations on the applicability of HEA analysis, an in silico target deconvolution method, called sHEA (structurally similar HEA) analysis, was devised by generalizing the idea of HEAs using molecular similarity. The sHEA analysis is based on the enrichment of structural similarity between phenotypic hit compounds and bioactive compounds for target and can estimate the targets connected with the phenotype. Comparative analyzes with HEA and SEA using the ligand set as the benchmark data showed that sHEA not only expands the applicable target space but also provides robust and better performance regardless of seed size. In addition, rigorous literature validation was conducted for 4 phenotypic assay outcomes for approved drugs from Open Innovation Drug Discovery (OIDD), which demonstrated that the predicted targets by the sHEA method obviously overlap with known genes associated with the corresponding phenotype. Thus, the sHEA analysis may provide clues for the development of target therapies as well as target deconvolution of phenotypic hits. Lastly, CSgator (Compound Set navigator), a web tool useful for collective analysis of candidate compounds, was developed. CSgator is a comprehensive analytical tool for set-wise interpretation of compounds, which has two unique analytic features of Compound Set Enrichment Analysis (CSEA) and Compound Cluster Analysis (CCA) and allows batch analysis of compound set in terms of (i) target, (ii) bioactivity, (iii) disease, and (iv) structure. CSEA and CCA present enriched profiles of targets and bioactivities in a compound set, which leads to novel insights on underlying drug mode-of-action, and potential targets. Notably, CSgator includes the HEA analysis, which can serve as an efficient tool to optimize hit compounds. CSgator is designed for easy and intuitive use by researchers through visualization tools and a convenient web interface, which is available at http://csgator.ewha.ac.kr and most analytic results are downloadable.;약물 발견의 목표는 인간 질병 치료를 위해 안전하고 효과적인 의약품을 개발하는 것이다. 특히, 표현형 스크리닝(phenotypic screening)은 생물학적 시스템을 직접 측정하여 복잡한 임상 조건에 적합한 활성 분자를 제공할 수 있기 때문에 최근 산업계와 학계에서 유망한 약물 후보를 가려내는 효율적인 전략으로써 주목받고 있다. 표현형 중심 스크리닝 접근법의 중요한 과제는 관찰된 표현형 결과를 특성화 하는 분자 표적을 식별하는 ‘타겟 디컨볼루션(target deconvolution)’ 과정이다. 수십 년 동안 소분자(small molecule) 라이브러리의 활성, 구조 및 표적에 대한 방대한 양의 정보가 ChEMBL, PubChem 및 ChemBank와 같은 공개 데이터베이스에 축적되면서, 표적이 잘 알려진 약물의 활성 또는 구조를 비교하여 적중 화합물(Hit compound)의 표적을 예측하는 유사성 탐색(Similarity searching)을 기반으로 한 인실리코(in silico) 방법들이 개발되었다. 이 논문은 유망한 약물 후보의 근본적인 작용 방식을 이해하고 적중 화합물을 최적화하기 위한 인실리코 방법들을 제안한다. 먼저, HEA (Hit Enriched Assay) 분석은 대규모 생체 활성 데이터를 사용하여 주어진 화합물에 대한 생체 활성 프로파일을 가정할 수 있다는 새로운 아이디어이다. HEA는 주어진 화합물 세트 사이에서 적중 화합물(Hit)이 통계학적으로 농축된 바이오어세이(생물검사; bioassay)를 의미하며, 표적이 알려지지 않은 표현형 스크리닝의 적중 화합물들에 대해 알려지지 않은 표적들을 유추하기 위해 활용될 수 있다. 세가지 표현형 스크리닝 적중 화합물 세트를 적용한 사례 연구를 통해서, HEA 분석이 표현형에 대한 기저 표적을 추정해낼 수 있음을 확인하였다. 이 결과들은 HEA 분석이 표현형 기반 개발 약물에 대한 표적들을 탐색함으로써 약물 작용 메커니즘(mechanism of action)을 밝혀낼 수 있는 가능성을 보여주었다. HEA의 좁은 활용범위를 극복하기 위해, 화학적 유사성을 이용하여 HEA의 아이디어를 일반화한 sHEA (structural similar HEA)이라는 인실리코 표적 디컨볼루션 방법을 고안하였다. sHEA 분석은 표적에 대한 표현형 적중 화합물과 주어진 활성 화합물 사이의 구조적 유사성의 농축을 기반으로 하며, 상대적 농축을 통해 표현형과 관련된 표적을 추정할 수 있다. 표적 리간드 세트를 비교평가 데이터로 사용하여 HEA와 SEA를 비교 분석한 결과, sHEA는 적용가능한 표적의 범위를 넓힐 뿐만 아니라 입력한 화합물의 개수에 관계없이 견고하고 우수한 성능을 제공하는 것으로 나타났다. 또한, OIDD (Open Innovation Drug Discovery)로부터 승인된 약물에 대한 4가지 표현형 분석 결과에 대해 엄격한 문헌 검증이 수행되었으며, 이를 통해 sHEA 방법에 의한 예측 표적이 해당 표현형과 관련된 알려진 유전자와 60% 이상 일치하는 결과를 나타냈다. 따라서, sHEA 분석은 타겟 테라피(target therapy)의 개발뿐 아니라 표현형 적중 화합물의 표적 디컨볼루션에 대한 단서를 제공할 수 있다. 마지막으로, 후보 약물 리스트의 집합적 분석에 유용한 화합물 분석 웹도구인 CSgator을 개발하였다. CSgator는 화합물 세트의 해석을 위한 종합적인 분석 툴로써, (i) 약물 표적, (ii) 생물학적 활성 (iii) 질병, (iv) 화학적 구조 측면에서 화합물의 집합을 일괄 분석할 수 있는 Compound Set Enrichment Analysis (CSEA)과 Compound Cluster Analysis (CCA)의 두 가지 고유한 분석 특성을 가지고 있다. CSEA와 CCA는 화합물 세트의 표적과 생물 활성의 풍부한 프로파일을 제시하며, 이는 화합물들의 약물 작용(MoA)과 잠재적 표적에 대한 새로운 통찰력을 이끌어내는데 도움을 준다. 특히 CSgator에는 HEA 분석이 포함되어 있어 적중 화합물을 최적화하는 효율적인 도구로써 역할을 할 수 있다. CSgator는 시각화 도구와 편리한 웹 인터페이스를 통해 연구자가 쉽고 직관적으로 사용할 수 있도록 설계되었다. CSgator는 http://csgator.ewha.ac.kr에서 이용가능 하며, 대부분의 분석 결과를 다운로드할 수 있다.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 바이오정보학협동과정 > Theses_Ph.D
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE