View : 625 Download: 0

Full metadata record

DC Field Value Language
dc.description.abstractThe purpose of this study is to compare and analyse several Data Mining methods to find out meaningful variables according to the type of response variable. Also, to know which kinds of Data Mining methods are significant with the result while analysing a variable, index for VIP customer, which is differently collected from companies. Decision Tree, Random Forest, Gradient Boosting and Linear Model were used for the dichotomous VIP simple variance. Continuous variable, ranged from 0 to 12, which includes non-VIP customers was analyzed by using Random Forest, Gradient Boosting and Linear Model, and in the case of continuous variable, ranged from 1 to 12, except for non-VIP customers, Decision Tree, Random Forest, Gradient Boosting and Linear Model were performed.;본 논문에서는 많은 기업들이 고객을 유치, 유지함에 있어 기업 내에 축적된 고객정보들을 적절하게 이용하여 경영면에서 최소한의 정보로 최대한의 효과를 가질 수 있는 방법을 알아내는 것이 중요한 관심사일 것이다. 하지만 나날이 개인정보의 안전에 민감해지고 있는 고객들의 개인정보를 수집하기란 쉽지 않은 것이 현실이다. 이에 고객들 동의하에 최소한의 정보만을 수집하되 그 데이터들을 이용하여 어떤 요인들에 관심을 가져야 기업입장에서 시간과 비용의 낭비를 줄일 수 있는지를 밝히는 것에 중점이 될 것이다. 따라서 고객등급을 어떤 데이터 형식으로 나누어야 하는지, 종속변수에 중요한 영향을 미치는 변수가 무엇인지를 데이터마이닝을 이용하여 분석해낸 뒤 그 결과 중 어떤 분석방법이 의미 있는 변수를 가장 잘 도출해 내는지 판별할 것이다. 이렇게 정확도가 높은 데이터마이닝 기법으로 도출된 결과를 이용하여 기업 매출에 많은 영향을 끼치는 우수고객층의 공통적인 패턴 분석을 알아내 주요고객층의 이탈을 방지 할 수 있을 방법을 고안해 내는 등에 적절히 이용될 것이다. 나아가 고정고객의 기본 데이터 자료에 근거하여 고객별 타깃 마케팅 활동 등을 통해 우수고객을 이탈하지 않고 지속적인 구매를 유도하여 기업의 이윤을 남기기는 마케팅에 유용하게 사용할 수 있을 것이다.-
dc.description.tableofcontentsI. 서론 1 II. 이론 3 A. Decision Tree(의사결정나무) 3 1. Decision Tree의 개념 3 2. Decision Tree의 장/단점 4 가. 장점 4 나. 단점 4 3. Algorithm 4 B. Random Forest 5 1. Random Forest의 이론 5 2. Algorithm 7 C. Gradient Boosting Method(gbm) 8 1. Gradient Boosting의 이해 8 2. Algorithm 8 D. Linear Regression Model 9 1. MSE(Mean Square Error) 10 2. 변수선택법 10 Ⅲ. 사례분석 11 A. 데이터 설명 12 1. Real-data 설명 12 2. 결측값 처리 15 B. 변수 설명 16 1. 변수변환 16 2. 파생변수 18 Ⅳ. 비교 분석 19 A. 종속변수 VIP에 대한 이해 19 B. Classification : VIP01 21 1. Decision Tree 21 2. Random Forest 23 3. Gradient Boosting 25 4. Linear Model (Stepwise regression) 26 5. Classification : VIP01 결과 28 C. Regression : VIP012 vs VIP112 비교분석 29 1. Training data / Test data 의 MSE (n=100) 30 2. Total Data 31 가. Decision Tree 31 나. Random Forest 33 다. Gradient Boosting 35 라. Linear Model (Stepwise regression) 37 3. VIP012 vs VIP112 최종 선택된 변수 41 IV. 결론 43 참고문헌 44 ABSTRACT 46-
dc.format.extent1549038 bytes-
dc.publisher이화여자대학교 대학원-
dc.title우수고객에 대한 데이터마이닝 기법 비교연구-
dc.typeMaster's Thesis-
dc.title.subtitleC기업 고객데이터를 중심으로-
dc.creator.othernameJang, Eun Joo-
dc.format.pageix, 46 p.-
dc.identifier.major대학원 통계학과- 8-
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)
