View : 29 Download: 0

일반화 가법모형을 이용한 이동 통신사 고객이탈 예측모형연구

Title
일반화 가법모형을 이용한 이동 통신사 고객이탈 예측모형연구
Other Titles
A Study on the Application of Generalized Additive Model in predicting customer churn of the mobile phone company
Authors
추민주
Issue Date
2011
Department/Major
대학원 통계학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
소병수
Abstract
우리나라 이동통신시장은 시장의 포화상태로 인해 성장이 둔화되고 있으며 번호이동성 제도의 시행과 최신 스마트폰의 출시로 인해 고객의 이탈이 매우 활발히 일어나고 있다. 그로 인해서 각 이동 통신사들은 이탈고객 관리(Churn Manage -ment)를 위한 다각적인 마케팅 활동을 하고 있으며 기존 고객의 이탈방지의 원인들을 찾고자 노력하고 있다. 이와 같은 치열한 경쟁시장에서 고객 이탈 문제를 완화시키기 위해서는 먼저 정확한 고객의 정보 확보를 통하여 통신사 고객이탈여부에 영향을 미치는 중요 변수를 찾아내어 보다 정확한 고객이탈 예측 모형 구축이 필요하다. 본 논문에서는 첫 번째로는 원변수를 이용한 로지스틱 회귀분석으로 이동 통신사의 고객이탈여부에 영향을 주는 중요 변수를 찾아보았다. 그리고 두 번째로는 선택된 독립변수 중 정량변수에 비선형이 존재하는 경우, 변수들에 대하여 적절한 평활함수(Smoothing function)를 이용하여 종속변수를 예측하는 방법인 일반화 가법모형(Generalized Additive Model)을 이용하여 분석하였다. 세 번째로는 위의 일반화 가법모형의 분석결과를 토대로 정량변수들을 변환하고 변수들의 교호작용을 추가하여 원변수와 함께 회귀모형을 구축하여 분석하였다. 모형 평가는 각 모형의 AIC값 비교, 리프트 차트(Lift Chart)를 이용하여 모형의 예측력을 비교해본 결과 원변수를 이용한 로지스틱 회귀모형보다는 변수변환을 이용한 로지스틱 회귀모형의 AIC값이 작게 나타났다. 반면 GAM을 이용한 모형의 AIC값은 원변수를 이용한 로지스틱의 AIC값보다 크게 나타났다. 이는 spline을 이용한 자유도 증가 때문에 나타나는 현상이라 판단이 된다. 그리고 리프트 차트(Lift Chart)를 이용한 모형평가에서도 변수변환과 교호작용을 이용한 로지스틱회귀모형이 1등급(상위10%)에서 예측력이 뛰어났으며, 등급이 낮을수록 Lift값이 안정적으로 감소하는 것을 볼 수 있었다. 또한 일반화 가법모형 역시 1등급에서 원변수보다 좋은 예측력을 보였고, 등급이 낮을수록 Lift값이 안정적으로 감소되는 현상을 볼 수 있었다. 이 논문에서는 종속변수와 독립변수 사이의 비선형적인 관계를 설명할 수 있는 일반화 가법모형을 토대로 연속형 독립변수의 적절한 변수변환과 교호작용을 추가하여 기존 단순선형모형의 예측력을 향상시킨 점에서 논문의 의의를 두고 있다.; This paper studies the problem of prediction of the customer churn of the mobile phone company using logistic regression and generalized additive model(GAM). Using the stepwise variable selection method with =0.15, we found the appropriate linear logistic model. Then we used the GAM to find the possible nonlinear transformations of the continuous independent variables. On the basis of the GAM results, we applied appropriate transformation of numerical variables, such as log, square transformations. Besides, we also added interactions of continuous variables. As a result, we obtained the logistic regression model with the AIC value smaller than that of the GAM. Lift Charts based of the test data show that both GAM and the model using suitable variables transformation and interaction have a better predictive power than the model based on the original variables.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE