데이터 품질 메트릭스 설정

데이터 품질 메트릭스 설정
Other Titles
Establishing Data Quality Metrics
Issue Date
과학기술대학원 컴퓨터학과
이화여자대학교 과학기술대학원
소프트웨어 제품의 품질을 평가하고 보증하는 일은 매우 중요하며, 국제 표준인 IS0/IEC 9126은 소프트웨어 품질 특성 및 측정 메트릭스 표준을 제공하고 있다. 이때 IS0/IEC 9125에서는 소프트웨어를 프로그램, 절차, 규칙 및 관련문서로 한정하고 있기 때문에 실제 소프트웨어를 구동 시키기 위해 요구되는 데이터에는 적용할 수 없다. 그러나, 소프트웨어 시스템에서 얻어지는 최상의 결과를 얻기 위해서는 높은 품질을 지닌 데이터가 요구되며, 아직까지 이를 측정하는 어떠한 데이터 품질 측정 모형은 없었다. 본 논문에서는 소프트웨어 시스템에서 실질적으로 움직이는 사용자 중심의 데이터 품질 평가를 위하여 이를 측정할 수 있는 데이터 품질 메트릭스를 제안한다. 이를 위해 발생 가능한 총체적인 오류 데이터 형태를 품질 특성 관점에서 분류하고, 오류 데이터 분류와 소프트웨어 품질 표준인 IS0/IEC 9126을 기반으로 데이터 품질 특성 및 부특성을 추출한다. 추출된 데이터 품질 특성을 측정하기 위해, 특성을 이끌어내는 데 사용된 오류 데이터를 품질 속성으로 하는 데이터 품질 메트릭스를 제안한다. 제안한 메트릭스는 기존의 데이터 품질 관련 연구 및 일반 메트릭스, 그리고 IS0/IEC 9126에 미치는 영향을 통해 분석하였다. 제안한 메트릭스를 적용하여 데이터 품질을 측정할 수 있는 DAQUM 아키텍쳐를 설계 구현하였으며, 이를 실제 데이터베이스에 적용한 사례 연구를 진행하였다. 본 논문에서 제시하는 데이터 품질 메트릭스는 지식 공학 시스템이 최종 사용자에게 제공하는 데이터나 지식의 품질 측정에 기준이 될 수 있다.;While evaluating and affirming the quality of software are extremely significant, International Standard ISO/IEC 9126 provides metric standards for measuring software quality. Yet, ISO/IEC 9126 could not be applied to the data required for operating actual software since it limits software to program, process, rules and related documents. In order to get the best results from a software system, securing high quality data is a must. Unfortunately, however, there has been no such model for measuring the quality of data. Against this backdrop, this paper introduces a data quality metric for measuring the quality of data that are operated on a software system. It classifies possible-to-occur dirty data from the perspective of quality characteristics. In addition, the paper shows both characteristics and sub-characteristics of data quality based on ISO/IEC 9126, which is the standard for software quality, and the taxonomy of dirty data. To measure the quality of the sampling data, the paper also proposes the data quality metric that embraces dirty data, which has been used in abstracting the characteristics. The proposed metric has been analyzed through having an effect on the study related to quality of data, general metric, and ISO/IEC 9126. DAQUM Architecture which the metric is applied to, can measure quality of data and also, the related case study has been shown on the paper using real database. The data quality metric suggested by this paper could be helpful to knowledge engineering system in measuring the quality of data or knowledge providing for end-users.
일반대학원 > 컴퓨터정보통신공학과 > Theses_Master
