View : 128 Download: 0

Review of Association Rule

Review of Association Rule
Issue Date
대학원 통계학과
이화여자대학교 대학원
데이터 마이닝 기법 중 하나인 Association Rule(연관 규칙)은 대용량의 데이터에서 숨겨진 유용한 정보를 찾아내는 방법이다. 이 Association Rule은 한 항목들의 그룹과 다른 항목들의 그룹 사이에 강한 연관성이 있음을 밝혀 준다. “Market Basket”분석 이라고 불리는 Association Rule의 목표는 데이터에서 변수가 X= {X_1, X_2, … , X_p} 일 때, 가장 빈번히 발생한 항목들의 결합 변수를 찾는 것이다. 이를 바탕으로 고객의 구매 패턴을 알 수 있고, 상품 진열, 상품 판매 촉진, 경영의사결정, 마케팅 활동 등에 활용할 수 있다. 본 논문에서는Association Rule을 찾아주는 알고리즘으로 Apriori와 Eclat 두 가지 방법론을 적용하여 항목간의 패턴을 찾아보고, 그 결과를 비교해 본다. 두 가지 방법론에 대해서 Simulation data와 Real data를 사용하여 그 성능을 비교 분석 하였다. 그 결과 Eclat 방법론이 Apriori 방법론 보다 훨씬 짧은 시간에 연관성이 높은 항목들을 찾을 수 있음을 볼 수 있다. Real data의 경우에는 두 방법론 모두 연관성이 높은 규칙들을 잘 찾을 수 있음을 보였다. 하지만 Support(지지도)가 아주 낮고 Confidence(신뢰도)가 높은 규칙을 찾는 것은 구조적으로 아주 많은 시간이 걸리는 것을 피할 수는 없다.;Association Rules are used to discover the relationships, and potential associations, of items or attributes among huge data. These rules cans be effective in uncovering unknown relationships, providing results that can be the basis of forecast and decision. Since association rules are useful and easy to understand, recently, the discovery of association rules from database has become an important research topic and there have been many successful business applications, including cross-marketing, attached mailing, store layout, customer segmentation, telecommunication, and web analysis. A typical example of association rule mining is “Market Basket” analysis. In well-known market basket problems, the association rule has been used to discover buying patterns such as two or more items that are often bought together. In this paper, I discover the patterns of items using the association rule methods, especially Apriori algorithm and Eclat algorithm. I analyze the performance of two algorithms with simulation data and real data. I know that the Eclat algorithm has much shorter time to make association rules. In the real data case, two algorithms have a good performance to select high quality items. But having the low support and the high confidence, it takes time to find association rules.
Show the fulltext
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.