View : 100 Download: 0

Machine Learning and Docking Studies of Cytochrome P450 Ligands

Machine Learning and Docking Studies of Cytochrome P450 Ligands
Issue Date
대학원 생명·약학부약학전공
이화여자대학교 대학원
Cytochrome P450 (CYP) enzyme superfamily is involved in oxidative phase I metabolism which is a critical determinant for metabolism of various xenobiotics including drugs. It is, therefore, desirable to have models that can predict whether a compound interactions with a specific CYP isozyme. There are five major CYP isozymes which are closely associated with more than 80% of the metabolism of all the pharmaceuticals in clinical use, so this study focused on them. In silico classification models were developed to effectively distinguish ligands from non-ligands for each CYP isozyme. Four machine learning methods were used the classification to obtain the models of Laplacian-modified naïve Bayesian, random forest (RF), recursive partitioning (RP), and support vector machine (SVM). These methods are frequently used as a computational approach for data categorization due to their high speed and accuracy. Data sets were collected from public domain and randomly divided into training and test sets in the ratio of 7 to 3. The quality of each model was evaluated by the accuracy, sensitivity, specificity, area under the receiver operating characteristic (ROC) scores, and Matthews correlation coefficient (MCC), and most of the models successfully classified ligands and non-ligands for each CYP isozyme. In addition, docking study was carried out to predict the binding modes and interactions of ligands onto CYP. The overall docked ligands occupied the active site and showed the reasonable binding modes and interactions between CYP and its known substrates. These studies could be useful to predict the CYP-mediated drug metabolism profiles in drug discovery. ;Cytochrome P450 (CYP)는 많은 동질효소가 존재하는 효소군으로 체내의 제1상 대사반응에 관여하여 약물을 비롯한 다양한 외부물질의 대사에 관여한다. 따라서, 어떠한 물질이 CYP와 결합할 것인지를 예측할 수 있는 방법이 신약개발 과정에서 크게 요구되고 있다. 특히, 임상에서 사용되는 약물의 80% 이상을 대사시키는 것으로 알려진 다섯 개의 CYP 동질효소가 특히 중요하게 여겨져 이에 대한 연구를 수행하였다. 기계 학습(Machine learning) 방법은 빠른 속도와 정확성을 장점으로 하여 널리 사용되고 있다. 그 중에서도 Laplacian-modified naïve Bayesian, random forest, recursive partitioning, and support vector machine의 네 가지 방법을 사용하여 다섯 개의 CYP 동질효소에 대해 분류기 모델(classification model)을 수립하였다. 대부분 정확성, 민감도, 특수성에서 80% 이상의 수치를 보였고, AUC와 MCC 역시 통계적으로 유의한 범위의 수치를 나타내어 좋은 모델임을 확인할 수 있었다. 또한, docking 연구를 통해 CYP와 그 기질간의 상호작용에 대하여 살펴보았다. Docking 방법을 통해, 알려져 있는 CYP의 기질이 CYP의 활성부위에 잘 결합하는 것을 확인하였고, 기질과 CYP 사이에서 가능한 결합모드와 상호작용을 예측할 수 있었다. 본 연구를 통해 좋은 분류기 모델과 docking 결과를 얻었고, 이는 앞으로 신약개발 연구에 활용될 수 있을 것으로 기대된다.
Show the fulltext
Appears in Collections:
일반대학원 > 생명·약학부 > Theses_Master
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.