View : 1027 Download: 0

데이터 마이닝 기법을 이용한 초,중,고 사교육비 영향요인 분석

Title
데이터 마이닝 기법을 이용한 초,중,고 사교육비 영향요인 분석
Authors
이혜정
Issue Date
2014
Department/Major
대학원 통계학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
송종우
Abstract
본 논문의 주제는 현 사회에 대두되고 있는 사교육에 대한 연구이다. 사교육비가 논란이 되는 이유 가운데 하나는 각 가정에서 소비되는 전체 교육비 가운데 사교육비가 차지하는 비중이 높으면 경제적으로 교육에 대한 기회균등이 이루어지지 않는 문제를 유발할 수 있기 때문이다. 또한, 과도한 사교육으로 인해 기본적인 학교 교육보다 더 많은 시간과 비용을 할애한다면, 계층 간, 지역 간의 양극화와 더불어 학교의 기능이 저하되는 요인으로 작용할 수 있기 때문이다. 이러한 현상을 조금이나마 줄이고자 사교육비에 대한 연구를 통하여 현재 사교육을 시행하게 되는 영향요인을 알아 볼 것이다. 사용 한 자료는 2012년 통계청에서 조사한 사교육비 자료로써 학생의 거주 지역, 성별, 성적등 기본적인 학생 조사문항과 더불어 사교육을 하고 있는 과목과 비용까지 자세히 조사되어있다. 총 52개의 조사 항목 가운데 의미 있는 14개 변수를 가지고 일반교과 사교육비와 예체능교과 사교육비, 마지막으로 두 개를 더한 총 사교육비를 종속변수로 두어 해당 종속 변수를 설명하는데 중요한 변수와 미치는 영향의 정도를 알아 볼 것이다. 논문의 처음에는 연구에서 사용된 방법인 Linear Regression, Random Forest, Gradient Boosting을 이해하기 위하여 이론을 살펴 볼 것이다. 그 다음으로 원 자료에 대한 변수들을 살펴보고, 사교육비 0원의 의미와 그 분포를 알아 볼 것이다. 그 후에 분류분석을 통하여 사교육 시행에 영향을 미치는 요인을 알아 볼 것이다. 그 다음으로 회귀분석을 이용하여 종속변수에 영향을 미치는 중요한 변수를 알아보고, 3가지 방법에 대해 중요한 변수의 차이가 있는지 알아 볼 것이다. 이 때 Linear Regression방법에 대해서만 모형의 해석이 가능하므로, 각각의 계수가 의미하는 바를 짚어볼 것이다.;The subject of this paper is a study on education that has emerged in the current society. The analysis method used is divided into three main categories. The first analysis performed is a frequency analysis using the original data. It was used to find the basic feature materials through examining the frequency analysis. The second analysis performed was the classification analysis. Through the classification analysis, the factors that distinguished the students who performed a private education to those who did not run a private education were examined. This was enforeced by dividing the data of the non-zero result of the response of the private education expenses is 0, it has been described a variable as a reference of classification. As a method of classification analysis, Logistic Regression, Random Forest, is the Gradient Boosting method were used. Finally, the third analysis used was a Regression analysis. In the Regression analysis, the actual factors of educational expenses were used to find out the effect it has on the execution of private education. Rather than depending on the responded anwers 0. The method of analysis used on Regression analysis corporation were Linear Regression, Random Forest, a Gradient Boosting In this thesis, the dependent variables examins three types of private education, the total cost of education, general curriculum education, the arts, physical education curriculum and the private educational expenses. This paper identified the important factors that influence each other in each case.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE