View : 104 Download: 0

시공간 데이터를 위한 클러스터링 기법의 성능 비교

시공간 데이터를 위한 클러스터링 기법의 성능 비교
Other Titles
Performance Comparison of Clustering Technique For Spatio-Temporal Data
Issue Date
과학기술대학원 컴퓨터학과
시공간 데이터클러스터링ClusteringSpatio-Temporal Data
이화여자대학교 과학기술대학원
With the growth in the size of datasets, data mining has recently become an important research topic. Especially, interests about spatio-temporal data mining has been increased which is a method for analyzing massive spatio-temporal data collected from a wide variety of applications like GPS data, trajectory data of surveillance system and earth geographic data. In the former approaches, conventional clustering algorithms such as K-means, Agglomerative Hierarchical algorithm and SOM are commonly applied as spatio-temporal data mining techniques. However, researches on the performance of these approaches when they actually applied to spatio-temporal data mining and on what is the proper data mining algorithm for the input data sets considering the spatio-temporal properties, is sparse at present. In this thesis, we analyze SOM, which is the popular clustering algorism applied to clustering analysis in data mining area, and develop the spatio-temporal data mining module based on it. In addition, we analyze the clustering results of SOM and compare it with those of K-means and Agglomerative Hierarchical algorithm in the aspects of homogeneity, separation, separation, silhouette width and accuracy. We also develop specialized visualization module for more accurate interpretation of mining result. This is because, without considering the properties of spatio-temporal data, numerical criterions of performance evaluation may not show properly the accuracy and performance of clustering results.;최근 데이터 양이 급증하면서 데이터 마이닝에 대한 연구가 활발하게 진행되고 있다. 특히 GPS 데이터, 감시 카메라의 궤적 데이터, 기상 데이터들과 같은 다양한 응용시스템으로부터 수집된 시공간 데이터를 분석하고자 하는 시공간 데이터 마이닝 연구에 대한 관심이 더욱더 높아지고 있다. 기존 연구들에서는 SOM, K-means, 응집 계층 알고리즘과 같은 일반적인 클러스터링 기법들을 적용하여 시공간 데이터 마이닝을 수행하고 있다. 하지만 이러한 알고리즘들이 실제적으로 시공간 데이터에 이러한 기법들을 적용하는데 있어서 어느 정도의 성능을 보장할 수 있는지 혹은 데이터의 시공간속성에 따라 적절한 마이닝 알고리즘을 선택하기 위한 기준이 무엇인지 등에 대한 연구는 미흡한 실정이다. 본 논문에서는 기존의 시공간 데이터 마이닝 연구에서 주로 사용되어 온 알고리즘인 SOM을 분석하여 SOM 기반 마이닝 모듈을 개발한다. 그리고 K-means 와 응집 계층 알고리즘과의 성능 비교를 통해 SOM 이 시공간 마이닝에 있어서 어느 정도의 성능을 보장하는지를 균질도, 분리도, 반면영상 너비, 정확도의 네 가지 기준에서 분석한다. 또한 시공간 데이터의 경우 입력 데이터의 속성에 따라 이러한 평가 기준 수치가 클러스터링 결과의 정확성 및 성능을 제대로 나타내지 못하는 경우가 발생할 수 있다는 점을 고려하여 시공간 데이터의 클러스터링 결과를 위한 특화된 가시화 모듈을 개발하고 이를 통해 결과 비교 및 분석을 수행한다.
Show the fulltext
Appears in Collections:
과학기술대학원 > 컴퓨터학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.