View : 76 Download: 0

Full metadata record

DC Field Value Language
dc.contributor.advisor오만숙-
dc.contributor.author오혜윤-
dc.creator오혜윤-
dc.date.accessioned2020-02-03T16:31:16Z-
dc.date.available2020-02-03T16:31:16Z-
dc.date.issued2020-
dc.identifier.otherOAK-000000163477-
dc.identifier.urihttp://dcollection.ewha.ac.kr/common/orgView/000000163477en_US
dc.identifier.urihttp://dspace.ewha.ac.kr/handle/2015.oak/252729-
dc.description.abstractRoad traffic accident is the principal cause of deaths globally. Therefore, it is important to predict the severity type of road traffic accidents and understand the affecting factors. In this paper, we analyze the severity of road traffic accidents in Seoul, Korea, 2017-2018. We give weights to three variables, the number of deaths, the number of serious injuries, and the number of slight injuries and the weights for each variable are 12, 3, and 3 respectively. Then, we calculate the severity score for each road traffic accident based on the total number of three weighted variables and categorize the severity score into three severity types. The ordered probit model which is generally used for severity prediction and machine learning methods including RandomForest, XGboost and Bayesian Network are applied to predict the severity type of road traffic accidents. The goal of this analysis is to predict the different severity degrees of road traffic accidents and figure out the factors that contribute to the increase in the severity of road traffic accidents. Furthermore, we compare the performance of the models that we use to predict.;전세계적으로 교통사고는 사망을 초래하는 가장 영향력 있는 원인 중 하나이다. 그러므로 교통사고 심각도를 예측하고 심각도에 영향을 주는 변수들을 찾는 것은 중요하다. 본 논문에서는 교통사고 심각도를 예측하기 위하여 2017년부터 2018년까지의 서울시 교통사고 데이터를 순서적 프로빗 모형과 머신러닝 모델을 사용하여 분석하였다. 각 사고 별 사망자 수, 중상자 수, 경상자 수에 각각 12, 3, 3의 가중치를 부여하여 곱하고 심각도 점수를 계산하였다. 이후, 계산된 심각도 점수를 세 가지 클래스로 분류하고 순서적 프로빗 모형과 RandomForest, XGboost, Bayesian Network를 사용하여 심각도를 예측하였다. 순서적 프로빗 모형에서는 심각도에 순서를 부여하여 예측하고, 사후 확률을 추정하였다. 또한, Oversampling을 도입하여 데이터의 불균형을 해소하고 머신 러닝 모델의 적합도를 높였다. 세 가지 머신 러닝 모델 중 가장 적합한 모델을 찾고, 변수 중요도 그림과 부분 의존도 그림을 그려 영향력 있는 변수들을 찾았다. 모형의 비교 척도로는 Precision, Recall, Accuracy, F1-Score를 사용하였다.-
dc.description.tableofcontentsI. Introduction 1 A. Road Traffic Accident Severity 3 II. Methodology 4 A. The Ordered Probit Model. 4 B. RandomForest 5 C. XGboost 6 D. Bayesian Network 7 III. Data Description 9 A. Data Overview 9 B. Response Variable 9 C. Explanatory Variable 11 IV. Analysis Results 15 A. Results via The Ordered Probit Model 16 B. Results via Machine Learning Models 18 V. Conclusion 24 Bibliography 25 Appendix 1 Codes 26 Abstract(inKorean) 32-
dc.formatapplication/pdf-
dc.format.extent690549 bytes-
dc.languageeng-
dc.publisher이화여자대학교 대학원-
dc.subject.ddc500-
dc.titlePrediction of Road Accident Severity-
dc.typeMaster's Thesis-
dc.title.subtitleComparing the Ordered Probit Model and Machine Learning Models-
dc.creator.othernameOh, Hye Yun-
dc.format.pagev, 32 p.-
dc.identifier.thesisdegreeMaster-
dc.identifier.major대학원 통계학과-
dc.date.awarded2020. 2-
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE