View : 98 Download: 0

페이지 소요 시간을 고려한 웹 액세스 패턴 마이닝

페이지 소요 시간을 고려한 웹 액세스 패턴 마이닝
Issue Date
과학기술대학원 컴퓨터학과
이화여자대학교 과학기술대학원
웹 액세스 패턴이란 웹 사이트의 방문자들에 의해 만들어지는 일련의 링크들의 집합이다. 본 논문에서는 원시 웹 로그 데이터에 직접적인 프로세싱 작업을 통하여 웹 사이트 방문자들의 일반적인 액세스 패턴을 발견하였다. 특히 사용자가 웹 사이트의 어느 부분에 관심이 있는가 하는 관심도를 보다 잘 반영할 수 있는 패턴 추출 방법에 초점을 맞추었다. 기존의 연구들이 패턴 추출의 기준으로 페이지가 얼마나 방문되었는가 하는 액세스 횟수만을 고려하고 있는데 이 경우에 발생할 수 있는 문제점을 제시하고 이러한 문제점들을 해결할 수 있는 방법으로 해당 페이지에서 방문자가 얼마나 머물렀는가 하는 시간의 요소까지 함께 고려하여 패턴을 추출하는 방안을 제안하였다. 패턴 추출 애플리케이션은 데이터 전처리 모듈, 웹 액세스 경로 트리 생성 모듈, 패턴 추출 모듈, 패턴 가시화 모듈로 이루어져 있으며 추출된 패턴을 데이터베이스로 저장하여 다음 번 패턴 분석을 위해 트리를 재생성 해야 할 경우 방대한 양의 웹 로그 데이터 전체를 다시 스캔해야 하는 것을 피할 수 있도록 하였다. 또, 추출된 패턴을 웹 사이트의 관리자나 분석가가 쉽게 분석할 수 있도록 트리 형태로 가시화하였다. 이러한 웹 액세스 패턴 마이닝의 결과로 웹 사이트 방문자들의 일반적인 행동 패턴을 발견할 수 있으며,웹 설계상의 문제점을 발견하고 보완하는데 사용할 수 있다. 또, 방문자가 사이트에 재 방문 시에 개인의 선호도에 맞게 차별화된 개인화 페이지를 제공하는데 이용될 수 있을 것이다.;Web access pattern is the form of sequences of links followed by the user. In this paper, we find the general web access pattern of web site visitors using the technic which can be invoked directly on the web log data. This paper focuses on a method for estimating user interest and motivation. We illustrate the problems that just counting page requests cause, and propose a method which considers both the time spent by users on pages (page duration time) and the page hits. The web access pattern extraction application consists of four modules. The data preparation module pre-processes the raw log data, and the tree generation module for the web access paths transforms the log of sequences into a tree structure, where sequences with the same prefix are merged. The pattern extraction module finds patterns according to user-specified criteria, and the extracted web access patterns are visualized by the pattern visualization module. By mining web access pattern, we can understand the users' browsing behavior. Understanding the user's access behavior will be a step forward to provide personalized web pages or to improve the site structure.
Show the fulltext
Appears in Collections:
일반대학원 > 컴퓨터공학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.