View : 537 Download: 0

성별 예측 모델 결합 뇌연령 예측 모델의 개발

Title
성별 예측 모델 결합 뇌연령 예측 모델의 개발
Other Titles
Development of the brain age prediction model combined with the sex prediction model : Application of a hybrid deep learning algorithm
Authors
주윤지
Issue Date
2022
Department/Major
대학원 약학과
Publisher
이화여자대학교 대학원
Degree
Doctor
Advisors
류인균
Abstract
Introduction: As the human brain ages, the structural and functional changes occur at the molecular and cellular levels, along with the cognitive decline. Considering that accelerated brain aging may increase the risks for the brain disorder, inter-individual differences in brain aging are receiving increasing attention. The prediction of individual brain age has been attempted by using structural brain images. Moreover, the brain age has been utilized as a biological marker to predict the onset of a brain disease and evaluate its prognosis. Despite the prominent sex effects on the brain development and aging, the effects of sex have not been considered in the development of brain age prediction models. In this study, [Study 1] is aimed to construct a novel brain age prediction model by using the structural brain images and the sex information. Moreover, [Study 2] is aimed to construct the sex prediction model. In predicting the brain age and sex, this study constructed a novel deep learning model which combines the convolutional neural network (CNN) and multi-layer perceptron (MLP) algorithms. Methods: T1-weighted images and demographic information of 3,004 healthy adults older than 18 years of age were collected from five large-scale open-access neuroimaging databases. As the preprocessing step, T1-weighted images were registered, resampled, and normalized into the standard-space structural template, and entered into the CNN algorithm as the inputs. The sex information was converted into the one-dimensional vector format of 0 or 1 through one-hot encoding and entered as the inputs for the MLP algorithm. T1-weighted images were automatically segmented into the brain structures (e.g., cortical regions, subcortical structures, and white matter) and thresholded as the region-of-interests to extract radiomic features. The radiomic features were then normalized and used as the inputs of the MLP algorithm. Then, after the brain age and sex prediction algorithms were differently constructed with different combinations of the input data, the prediction performance of each algorithm was evaluated through the 10-fold cross validation. As a result, the final model was selected in each study, and each final model was internally and externally validated with the test set and the external validation set. Furthermore, the effect of sex prediction on the performance of brain age prediction was reviewed by applying the sex prediction results of the test set and the external validation set into the brain age prediction model. Results: In [Study 1], after the 10-fold cross validation, the brain age prediction algorithm was selected by using the T1-weighted images and the sex information. The hybrid CNN−MLP model was finally constructed by combining the CNN and MLP algorithms. In the test set, the brain age prediction model, with the actual sex information, achieved the mean absolute error (MAE) of 3.410 years, the root mean squared error (RMSE) of 4.910 years, and the coefficient of determination (R2) of 0.930. In the external validation set, the brain age prediction model, with the actual sex information, achieved the MAE of 5.037 years, the RMSE of 6.309 years, and the R2 of 0.885. In [Study 2], after the 10-fold cross validation, the sex prediction algorithm was selected by using T1-weighted images and the radiomic features, and the hybrid CNN−MLP model was finally constructed as in [Study 1]. The performance of the sex prediction model in the test set was as follows: prediction accuracy, 0.973; area under the receiver operating characteristic curve (AUROC), 0.985. The performance of the sex prediction model in the external validation set was as follows: prediction accuracy, 0.969; AUROC, 0.997. In the test set, the brain age prediction model, with the ‘probability of sex’ from the sex prediction, achieved the MAE of 3.411 years, the RMSE of 4.911 years, and the R2 of 0.930. In the test set, the brain age prediction model, with the ‘predicted sex’ from the sex prediction, achieved the MAE of 3.408 years, the RMSE of 4.908 years, and the R2 of 0.930. In the external validation set, the brain age prediction model, with the ‘probability of sex’ from the sex prediction, achieved the MAE of 5.046 years, the RMSE of 6.324 years, and the R2 of 0.884. In the external validation set, the brain age prediction model, with the ‘predicted sex’ from the sex prediction, achieved the MAE of 5.042 years, the RMSE of 6.318 years, and the R2 of 0.884. Discussion: The proposed brain age prediction model demonstrated excellent performance in [Study 1], by using the structural brain imaging data and the sex information; the proposed sex prediction model also demonstrated excellent performance in [Study 2], by using the structural brain imaging data with the radiomic features. One of the strengths of the current study is that the minimally preprocessed T1-weighted images were used as the main input of the proposed algorithms. The minimal preprocessing of the input images is receiving increasing attention for its efficiency in clinical settings. Moreover, the ‘pipeline of brain age estimation’ predicted the sex-related features of the brain images, and then used these results to predict the brain age with the T1-weighted images only in this study. This algorithm which used the sex-related features of the brain structures in predicting the brain age is noteworthy and a novel paradigm. The performance of brain age prediction through the two hybrid models needs further investigations since the 'pipeline of brain age estimation' showed inconsistent prediction results when the sex prediction results of the test set and the external validation set were applied. Taken together, the ‘pipeline of brain age estimation’ of the current study may be applied into various disease groups through further studies, potentially providing insights regarding the personalized neuropsychiatric interventions and treatments.;서론: 사람의 뇌는 연령이 증가함에 따라 분자·세포 수준에서의 구조 및 기능의 변화, 인지 기능의 저하 등 노화 과정을 겪게 된다. 이러한 양상들은 모든 사람에게서 공통적으로 관찰되지만 그 세부적인 양상에는 개인차가 존재할 수 있으며, 평균적인 수준보다 뇌 노화가 빠르게 진행된 개인에서는 뇌 질환의 발병 가능성이 높은 것으로 알려졌다. 이와 관련하여 구조적 뇌영상(structural brain image)을 기반으로 뇌연령(brain age)을 예측하여 개인별 뇌의 노화 정도를 보다 정확히 평가하기 위한 연구들이 수행되고 있으며, 뇌 질환의 발병 예측 및 예후 평가를 위한 인자로 뇌연령을 활용하기 위한 시도들 또한 이어지고 있다. 그러나 뇌 발달 및 노화 과정에 뚜렷한 성별 간 차이가 있음에도 불구하고, 기존 연구들 중 성별을 반영하여 뇌연령 예측 모델을 개발한 경우가 거의 없었다. 본 연구의 [연구 1]에서는 구조적 뇌영상과 성별 정보를 함께 사용함으로써 새로운 뇌연령 예측 모델을 구축하는 것을 목표로 한다. 한 사람의 뇌영상 전반에는 양쪽 성별의 특성들이 모자이크처럼 동시다발적으로 나타나는데, 이러한 양상들은 머신러닝(machine learning) 기법을 활용하여 학습 및 해석이 가능한 것으로 보고되었다. 이에 [연구 2]에서는 성별 예측 모델을 구축하는 것을 목표로 한다. 모델 개발 과정에서는 T1 강조 영상(T1-weighted image)과 더불어 성별 정보 또는 radiomic 특성과 같이 범주형 및 수치형 데이터를 함께 입력 데이터(mixed input data)로 사용하기 위해, 합성곱 신경망(convolutional neural network, CNN) 알고리즘과 다층 퍼셉트론(multi-layer perceptron, MLP) 알고리즘을 결합함으로써 기존의 뇌연령 및 성별 예측 과정에서 흔히 시도되지 않았던 구성의 딥러닝(deep learning) 모델을 제시하고자 한다. 방법: 5개의 대규모 뇌영상 데이터베이스들에서 만 18세 이상 건강한 성인 3,004명의 T1 강조 영상 및 성별, 연령 정보를 수집하였다. [연구 1] 및 [연구 2] 모델의 학습 및 검증 과정에서 사용하기 위한 입력 데이터별 전처리(preprocessing) 과정은 다음과 같다: T1 강조 영상을 합성곱 신경망 알고리즘에서 사용하기 위해, 각 T1 강조 영상을 표준 템플릿에 정합한 후 복셀 크기를 통일하여 영상의 형태를 정규화하였다. 성별 정보를 다층 퍼셉트론 알고리즘에서 사용하기 위해, 원-핫 인코딩(one-hot encoding)을 통해 0 또는 1만으로 구성된 1차원 벡터(vector) 형식으로 변환하였다. Radiomic 특성을 다층 퍼셉트론 알고리즘에서 사용하기 위해, T1 강조 영상을 자동 구획(automatic segmentation)하여 대뇌 피질(cortical region), 피질하 구조물(subcortical structure) 및 백질(white matter) 영역들을 관심 영역으로 지정하고 radiomic 특성을 추출한 후 개별값들을 정규화하였다. 이어서 입력 데이터의 조합에 따라 뇌연령 및 성별 예측 알고리즘을 달리 구성한 후, 10-겹 교차 검증을 수행하여 각 알고리즘에서의 성능을 평가하였다. 그 결과를 바탕으로 각 연구별 최종 모델을 선정하고, 선정된 모델들에 대해 각각 테스트세트와 외부 검증용 데이터세트를 적용하여 내부 및 외부 검증을 수행하였다. 나아가 뇌연령 예측 모델에 테스트세트 및 외부 검증용 데이터세트의 성별 예측 결과를 반영함으로써 성별 예측이 뇌연령 예측 성능에 미치는 영향을 검토하고자 하였다. 결과: [연구 1]에서는 10-겹 교차 검증 결과, T1 강조 영상과 성별 정보를 사용하는 뇌연령 예측 알고리즘을 선정하여, 합성곱 신경망 알고리즘과 다층 퍼셉트론 알고리즘을 결합한 하이브리드(hybrid) CNN−MLP 모델을 최종적으로 구축하였다. 뇌연령 예측 모델에 실제 성별 정보와 함께 테스트세트를 적용했을 시 평균 절대 오차(mean absolute error)는 3.410년, 평균 제곱근 오차(root mean squared error)는 4.910년, 결정 계수(coefficient of determination)는 0.930이었다. 실제 성별 정보와 함께 외부 검증용 데이터세트를 적용했을 시에는 평균 절대 오차는 5.037년, 평균 제곱근 오차는 6.309년, 결정 계수는 0.885이었다. [연구 2]에서는 10-겹 교차 검증 결과, T1 강조 영상과 radiomic 특성을 사용하는 성별 예측 알고리즘을 선정하여, [연구 1]에서와 마찬가지로 하이브리드 CNN−MLP 모델을 구축하였다. 성별 예측 모델에 테스트세트를 적용했을 시, 총 301명 중 293명에 대해 실제 성별을 정확히 예측하였으며(성별 예측 정확도: 0.973), 수신자 조작 특성 곡선 아래 면적(area under the receiver operating characteristic curve, AUROC)는 0.985이었다. 외부 검증용 데이터세트를 적용했을 시에는 총 645명 중 625명에 대해 실제 성별을 정확히 예측하였으며(성별 예측 정확도: 0.969), AUROC는 0.997이었다. 나아가 뇌연령 예측 모델에 테스트세트의 성별 예측 결과 중 '예측 확률'을 반영했을 시, 평균 절대 오차는 3.411년, 평균 제곱근 오차는 4.911년, 결정 계수는 0.930이었다. '예측 성별'을 반영했을 시, 평균 절대 오차는 3.408년, 평균 제곱근 오차는 4.908년, 결정 계수는 0.930이었다. 또한 뇌연령 예측 모델에 외부 검증용 데이터세트의 성별 예측 결과 중 '예측 확률'을 반영했을 시, 평균 절대 오차는 5.046년, 평균 제곱근 오차는 6.324년, 결정 계수는 0.884이었다. '예측 성별'을 반영했을 시, 평균 절대 오차는 5.042년, 평균 제곱근 오차는 6.318년, 결정 계수는 0.884이었다. 고찰: [연구 1]의 뇌연령 예측 모델은 구조적 뇌영상 데이터와 성별 정보를 함께 사용함으로써 뇌연령 예측 성능을 확보하였으며, 이와 유사하게 [연구 2]의 성별 예측 모델은 구조적 뇌영상 데이터와 radiomic 특성을 함께 사용함으로써 성별 예측 성능을 확보하였다. 특히 임상 현장은 시간이 많이 소요되는 전처리를 수행하기 어려운 환경이므로, 예측 모델의 활용 가능성을 높이기 위해 간단한 전처리 과정을 거친 영상 데이터를 사용하는 것에 대한 필요성이 최근 강조되고 있다. 이에 본 연구에서는 최소한의 전처리 과정을 거친 T1 강조 영상을 주요 입력 데이터로 사용함으로써 효율성을 확보하고자 하였다. 또한 T1 강조 영상만을 사용하여, 뇌영상상 성별 특성을 예측하고 이를 활용하여 뇌연령까지 예측할 수 있는 '뇌연령 평가 파이프라인(pipeline of brain age estimation)'을 구성하였다. 이는 뇌 노화 양상을 검토하는 과정에서 뇌 구조가 나타내는 성별 특성을 반영하는 새로운 뇌연령 예측 패러다임을 제공할 것으로 사료된다. 그러나 테스트세트 및 외부 검증용 데이터세트에서의 성별 예측 결과를 적용했을 경우 '뇌연령 평가 파이프라인'의 성능 검토 결과가 일관적이지 않았으므로, 향후 추가 데이터를 사용하여 두 하이브리드 모델을 사용한 뇌연령 예측 과정에서의 경향성을 더 검토해 볼 필요가 있다. 결론적으로 추후 연구를 통해 다양한 질환군에 본 연구에서 개발한 '뇌연령 평가 파이프라인'을 적용함으로써 성별에 따른 뇌 노화 양상을 파악할 수 있을 뿐 아니라, 이는 궁극적으로 개인화된 정신·신경학적 개입법(intervention) 및 치료법(treatment)의 개발에 대한 통찰력을 제공할 것이다.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 약학과 > Theses_Ph.D
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE