View : 761 Download: 0

Full metadata record

DC Field Value Language
dc.contributor.advisor송종우-
dc.contributor.author신현주-
dc.creator신현주-
dc.date.accessioned2016-08-26T12:08:13Z-
dc.date.available2016-08-26T12:08:13Z-
dc.date.issued2012-
dc.identifier.otherOAK-000000069509-
dc.identifier.urihttps://dspace.ewha.ac.kr/handle/2015.oak/189459-
dc.identifier.urihttp://dcollection.ewha.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000069509-
dc.description.abstract본 논문은 최근까지 전 세계적으로 관심이 대상이 되고 있는 ‘Risk’란 주제 중에서도 자동차 보험 손해액에 대한 연구를 하고자 한다. 보험사는 쏟아져 들어오는 방대한 고객 정보 데이터를 적절히 이용하여 치솟는 자동차 보험 손해율을 낮추는 리스크 관리에 힘써 오고 있다. Data mining이란 보험사의 고객 정보 데이터와 같은 대용량 데이터로부터 데이터 내의 관계, 패턴, 규칙 등을 찾아내고 이를 모델링함으로써 분석에 유용한 지식을 추출하고 가공하는 과정이다. 따라서 Data mining은 거의 모든 기업에서 데이터를 다루는데 필수적으로 사용된다고 해도 과언이 아니며, 보험사의 경우 또한 다르지 않다. 본 연구에서는 Data mining 회귀 모형을 구축하여 손해액을 추정한다. 첫째로, 연구에서 사용된 3가지 회귀 모형인 선형 모형, Random Forest, Gradient Boosting의 이해를 돕기 위해 개념을 설명할 것이다. 둘째로는 자료를 가공하는 과정으로, 개별 자료의 변수를 범주화 시키고 변수를 선택하여 적절히 자료를 그룹화시켜 새로운 그룹데이터를 생성할 것이다. 또한, 그룹데이터로 만들기 때문에 파생되는 종속 변수 손해액의 결측치를 처리하도록 한다. 이러한 일련의 과정을 거쳐 자료가 준비되고 나면 마지막으로 3가지 방법론을 적용시켜 분석 후, 모형의 성능을 비교하고 장단점을 설명하도록 하겠다.;This paper estimates amount of losses for car insurance using data mining regression methods. To analyze car insurance damages this paper use three different regression methods such as Linear Model, Random Forest, and Generalized Boosting. The first part of this paper explains the simple concepts of these three regression methods. The second part or the paper represents procedures of data preparation before the major analysis with real car insurance data. In order to regress the amount of losses, we should transform the individual data to the grouped data. It is important that this study is based on the grouped data from selected explanatory variables. The main study in this paper is to estimate car insurance losses using three data mining regression methods and compare performances, strengths, and weaknesses among them.-
dc.description.tableofcontentsI.서론 1 II.회귀 모형 3 A.선형 회귀 모형 3 B.Random Forest 4 1.Bagging 4 2.Random Forest의 이해 5 가.Algorithm 5 나.Tuningparameter 6 C.GradientBoostingMethod 7 1.Boosting 7 2.GradientBoosting의 이해 7 가.Algorithm 9 나.Tuningparameter 10 III.분석 데이터 준비 11 A.데이터 설명 11 1.가공 전 자료 변수 설명 11 2.추가 변수 생성 12 3.단순 모형 분석 13 B.변수의 그룹화 14 1.변수의 범주화 14 2.그룹화를 위한 변수 선택 16 C.종속 변수의 결측값 처리 19 1.EM Algorithm의 이해 20 2.회귀 분석에서의 EM Algorithm 적용 21 IV.분석 결과 22 A.종속 변수의 결측값 처리 22 B.모형 구축 24 1.기본 모형 24 2.추가 모형 27 3.모형 비교 및 최종 모형 선택 29 4.최종 모형에 대한 추가 설명 31 V.결론 34 참 고 문 헌 35 ABSTRACT 36-
dc.formatapplication/pdf-
dc.format.extent1121192 bytes-
dc.languagekor-
dc.publisher이화여자대학교 대학원-
dc.titleData Mining 회귀 분석 방법론을 이용한 자동차 보험 손해액 추정-
dc.typeMaster's Thesis-
dc.title.translatedEstimation of Car Insurance Damages Using Data Mining Regression Methods-
dc.creator.othernameShin, Hyun-joo-
dc.format.pageviii, 36 p.-
dc.identifier.thesisdegreeMaster-
dc.identifier.major대학원 통계학과-
dc.date.awarded2012. 2-
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE