View : 39 Download: 0

트렌드 분석 속도 향상을 위한 동적 계층 구조 생성 방법

Title
트렌드 분석 속도 향상을 위한 동적 계층 구조 생성 방법
Authors
김이은
Issue Date
2003
Department/Major
과학기술대학원 컴퓨터학과
Publisher
이화여자대학교 과학기술대학원
Degree
Master
Abstract
OLAP은 많은 양의 데이터에서 의사 결정자의 의사 결정을 위한 분석을 도와 의미있는 정보를 찾아내도록 하는 데 그 목적이 있다. 이러한 의사 결정을 돕기 위한 분석에는 여러 가지 종류가 있는데, OLAP의 계층 구조를 따라 오르내리는 기본 연산 외에도 정확한 조건에 따른 매치를 요하는 질의와 범위 질의가 있다. 범위 질의는 조건이 특정 범위로 주어지고 그 안에 있는 셀에 대한 접근이 필요하다. 그러므로 그 셀의 수가 늘어나면, 즉 범위가 크고 여러 차원에 걸쳐 복합적이면 응답 시간이 길어지게 된다. 그러면서도 범위 질의는 보다 자세하고 구체적인 데이터 분석에 있어서 필수적이다. 이러한 범위 질의가 전체 데이터 큐브에 대한 것일 때, 트렌드 분석을 할 수가 있다. 즉, 3개월간의 매출량을 알아보고자 하는 것이 범위 질의라면, 3개월 단위의 매출량 분석은 트렌드 분석이라고 할 수 있다. 이러한 질의는 전체 큐브에 대한 것이기 때문에 일반 범위 질의보다 더 오래 걸리고 복잡하다. 본 논문은 이러한 트렌드를 찾고자 하는 분석가의 분석 목표에 초점이 맞춰져 있다. 트렌드를 어떤 기준에 대한 추이를 살펴보고 얻어진 결과라고 정의할 때, 그 기준은 시간이 될 수도 있고 나이가 될 수도 있다. 또한 어떤 연봉 대의 사람일 수도 있고 어떤 상품의 가격에 대한 것일 수도 있다. 각 제품에 대한 판매량을 분석하다가 제품군에 대한 판매량을 분석하듯이, 트렌드 분석을 위해서는 그 기준 차원에 대해 한 단계롤업을 한 정보가 필요하다. 그러나 앞서 말한 기준 차원이 될 수 있는 차원들의 특징은 정확히 의미 있는 계층이 있지 않다는 것이다. 예를 들어서 시간 차원에서 일주일만 의미 있다고 할 수 없으며 10일이 더 의미 있다고 할 수도 없기 때문이다. 또한 가능한 모든 단위의 계층을 만들어 놓는다고 한다면 그 여러 개의 계층에 따른 데이터 폭발 현상이 일어나기 때문에 그렇게 할 수 없다. 그러므로 본 연구에서는 한 큐브에서 특정 차원에 대해 동적으로 계층을 생성하는 방법에 대해 연구하였다. 우선 동적으로 생성될 계층도 전체 큐브에 대한 범위 합을 미리 구해 놓는 것과 같은 의미를 가지므로 범위 합을 구하기 위해 기존에 연구되었던 Prefix sum을 응용하였다. 또한 분석시에 가장 효율적인 디스크 접근 시간을 가지려면 이를 어떤 방식으로 저장해 놓는가에 대해서도 고려하였다. 그리고 마지막으로는 이러한 Prefix sum의 응용과 저장방식에 따라 계층을 생성해 놓으면, 트렌드 분석시에 얼마나 디스크 블록 접근이 감소되는지를 분석하여 성능을 검증하였다. ;OLAP is to support analysis in terms of business decision making. There are several ways to analyze data cubes for decisions of business in OLAP system. One way is using basic operation with hierarchies. And others are exact matches and range queries. This paper focused on analysis purpose to find out trends looking the whole cube regularly ranged. Trend is like a tendency which is resulted from watching flows of measures of time or age dimensions. Numeric dimensions like time or age dimensions don't have exact superior hierarchy or subordinate hierarchy. So this research tries to define the method to generate hierarchies dynamically. First of all, we apply 'prefix sum' to our research to generate range sum regularly, and also consider about storage strategies of specialized prefix sum. Then verify the performance of dynamic hierarchy generation method by analyzing disk block access according to the prefix sum application and storage strategies.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 컴퓨터공학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE