View : 804 Download: 0

Prediction of preterm birth based on machine learning using vaginal microbiome

Title
Prediction of preterm birth based on machine learning using vaginal microbiome
Authors
박선화
Issue Date
2021
Department/Major
대학원 의학과
Publisher
이화여자대학교 대학원
Degree
Doctor
Advisors
김영주
Abstract
Introduction: Preterm birth (PTB), which is increasing worldwide, is the most important cause of morbidity and mortality in newborns. 75% of the causes of PTB are spontaneous preterm birth (sPTB). In one-third of sPTBs, intra-amniotic infections are accompanied, and the isolated microorganisms are similar to those of the lower genital tract, so infection/inflammatory response due to ascending infections was thought to be the cause. There are various attempts to predict PTB, but the measurement of fetal fibronectin in cervicovaginal fluid (CVF), which is commercially used, has a sensitivity of only 56%. Therefore, the association with PTB was investigated through the analysis of the vaginal microbiome of pregnant women, and candidate microbiota were selected and measured it with the qPCR kit, which is easy to test in clinical practice. Furthermore, prediction model based on a machine learning technique using bacterial risk score in CVF were generated. Material and method: In this case-cohort study, the subjects of this study were pregnant women who visited the hospital from 2019 to 2020. CVF was collected from pregnant women between 15 and 36 weeks of gestation. In first matched case-control study, 203 Korean pregnant women with PTBs (n=102) and term births (TB; n=101) were analyzed. Their microbiome of CVF were analyzed with 16s rRNA gene amplification. Shannon’s alpha-diversity (α-diversity) and beta-diversity analysis were done between the groups. Basic statistical analyses such as t-test, analysis of variance (ANOVA) and the linear discriminant analysis (LDA) effect size (LEfSe) was done. Multivariate analysis such as Principal Coordinate Analysis (PCoA) and Non-metric multidimensional scaling (NMDS), was performed. Statistical analyses were performed in R software (version 3.6.2), and microbiome analysis was done using MicrobiomeAnalyst software and Calypso software.   Multiplex PCR combinations were produced by selecting 10 candidate bacteria through literature review and bacteria that were significant in previous studies and 16s metagenome study. In the second matched case-control study, 94 pregnant women with PTBs (n=38) and TBs (n=56) were selected. A total of 10 bacteria were analyzed using multiplex quantitative real-time PCR (qPCR) with CVF of study subjects. The vaginal microbiome of PTB and TB groups were compared and bacterial risk score, which is a PTB prediction model, was created using machine learning techniques (decision tree and support vector machine). The predictive performance of the model was validated with random subsampling. Results: In the first set of matched case-control study, the α-diversity was significantly higher in the PTB group than in the TB group and in pPROM group. The group dominant by Lactobacillus spp., showed a tendency to TB, and in PTB group, Bacterioides spp. Ureaplasma spp., Staphylococcus spp., Escherichia fergusonii, Prevotella spp., Sphingomonas spp. Weissella koreensis, Mediterranea massiliensis, Cutibacterium acnes, Agrobacterium rubi were shown to increase differences (P<0.05, LDA score>4). In second set of matched case-control study, bacterial risk scoring model using multiplex PCR showed significant differences (P<0.001). The PTB risk was low when the Lactobacillus iners ratio was 0.812 or higher. In groups with a ratio under 0.812, moderate and high risk was classified as a U. parvum ratio of 4.6 × 10–3. The sensitivity and specificity of the PTB prediction model using bacteria risk score were 71% and 59%, respectively, and 77% and 67%, respectively, when white blood cell (WBC) data were included. Conclusion: In this study, several bacteria that were significantly different between the PTB group and TB group were analyzed. In addition, a multiplex qPCR kit was developed so that meaningful bacteria can be used for diagnostic purposes quickly in clinical practice, not limited to research. The CVF bacterial risk scores based on machine learning can be used for the prediction of PTB. Further multicenter studies will be needed to confirm this results before applying the techniques developed in this study in the clinical field. In addition, by adding clinical risk factors to the bacterial risk score, it will be possible to develop a model with a higher predictive rate.;전 세계적으로 증가하고 있는 조산은 신생아의 이환율과 사망률의 가장 중요한 원인이다. 조산 원인의 75%는 자발적 조산에 의한 것으로 이 중 3분의 1 이상이 미생물 군집의 감염과 관련이 있는 것으로 알려져 있다. 조산을 예측하기 위한 다양한 방법이 있지만, 임상에서 사용할 수 있는 자궁경부질액(CVF)의 태아 파이브로넥틴 (fFN) 측정을 통한 조산의 예측을 위한 민감도는 56 %에 불과하다. 이에 임산부의 질 내 미생물 군집 분석을 통해 조산과의 연관성이 있는 미생물에 대해 조사하고, 또한 임상에서 쉽게 적용할 수 있는 CVF에서의 PCR 측정을 분석한 결과에 따라서 머신 러닝 기법을 이용하여 박테리아 위험도 점수의 예측 모델을 생성하고자 하였다. 본 연구의 대상은 2019 년부터 2020년까지 이대목동병원과 연대세브란스병원을 방문한 임신부였으며, 임신 15주에서 36주 사이의 임신부로부터 CVF를 수집했다. 첫 번째 코호트 내 환자-대조군 연구로서 조산군 (n=102) 및 만삭군 (n=101)을 비교 분석했다. CVF의 미생물 군집은 16s 리보솜핵산 (rRNA) 유전자 증폭으로 메타지놈을 분석하였다. Shannon의 알파-다양성과 베타-다양성에 대한 그룹 간 분석이 시행되었으며 t-test, 분산 분석 (ANOVA), 선형 판별 분석 (LDA) 효과 크기 (LEfSe)와 같은 기본분석 및 PCoA (Principal Coordinates Analysis), Non-metric multidimensional scling (NMDS)과 같은 다변량 분석이 시행되었다. 통계분석은 R software를 이용하였으며 마이크로바이옴 분석은 MicrobiomeAnalyst software와 Calypso software가 사용되었다. 첫 번째 코호트 연구 결과 및 선행 연구 결과 및 문헌 고찰을 통하여 선택된 박테리아의 조합으로 다중 PCR 키트를 구성하였고 이의 분석을 위하여 두 번째 코호트 내 환자-대조군 연구에서는 조산군 (n = 38) 및 만삭군 (n = 56)를 가진 94 명의 임산부가 선택되었다. 연구 대상의 CVF는 정량 실시간 PCR (qPCR)을 사용하여 총 10 개의 박테리아를 분석했다. 조산 및 만삭 그룹의 질 미생물 군집을 비교하고 머신 러닝 기법을 사용하여 박테리아 위험도 점수를 사용하여 조산 예측 모델을 생성하였다. 모델의 예측 성능은 무작위 서브 샘플링을 사용하여 검증되었다. 알파-다양성은 만삭 군보다 조산 군에서 유의하게 높았다. Lactobacillus 가 우세한 그룹은 만삭 분만의 경향을 보였고 조산 군에서는 Bacterioides spp. Ureaplasma spp., Staphylococcus spp., Escherichia fergusonii, Prevotella spp., Sphingomonas spp. Weissella koreensis, Mediterranea massiliensis, Cutibacterium acnes, Agrobacterium rubi가 증가함을 보였다 (P <0.05, LDA score> 4). 마이크로바이옴의 알파-다양성은 조기양막파수 군에서 더 높았다. 다중 PCR을 사용한 박테리아 위험도 점수 모델은 조산 군과 만삭 군의 비교에서 통계적으로 유의한 차이를 보였는데 (P <0.001), Lactobacillus iners 비율이 0.812 이상일 때 조산의 위험은 낮았으며, 0.812 미만의 비율을 가진 그룹에서 중등도 및 고위험군은 U. parvum 비율로 4.6 × 10–3에 따라 분류되었다. 박테리아 위험도 점수를 이용한 조산 예측 모델의 민감도와 특이도는 혈중 백혈구수 (WBC) 데이터를 포함했을 때 각각 77 %와 67 %였다. 본 연구에서는 조산 군과 만삭 군간에 유의한 차이가 있는 세균을 분석하여 후보 세균을 선정하였다. 나아가 이러한 후보 박테리아를 조산의 임상에서 쉽게 적용할 수 있는 PCR 방법으로 분석할 수 있도록 다중 PCR 키트를 제작하였으며 머신 러닝 기법을 이용한 CVF 박테리아 위험도 점수를 산출하였다. 이는 임신 중기의 조산의 예측을 위하여 사용할 수 있을 것으로 기대하며 조산의 예방을 위한 교육 및 치료적 방법에 이용될 수 있을 것이나 연구에서 개발 한 기술을 임상 분야에 적용하기 위한 추가 다기관 연구가 필요할 것으로 생각한다.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 의학과 > Theses_Ph.D
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE