View : 241 Download: 0

사용자 관점에서 데이터 품질 측정 방안

사용자 관점에서 데이터 품질 측정 방안
Other Titles
(A) Method of Measuring Data Quality from Viewpoint of Software User
Issue Date
과학기술대학원 컴퓨터학과
이화여자대학교 과학기술대학원
IS0/IEC 9126 could not be applied to the data required for operating actual software since it limits software to program, process, rules and related documents. To asure the meaningful results in a Knowledge-Engineering System, Data Quality must be guaranteed. Unfortunately, however, there has been no such standard for measuring the quality of data in spite of subject of serious research. We suggest a method to measure data quality from end-user's point of view. We developed the quality metric that can measure the quality of data. It classifies two groups into data of columns related to purpose of data usage and data of columns unrelated to purpose of data usage. We described a1gorithm to detect dirty data. Because data quality changes according to purpose of data usage in end-users for establishing metric, we offered user function that selected purpose of data usage. The proposed metric has been analyzed through purpose of data usage. DAQUM Architecture which the metric is applied to, can measure quality of data and also, the related case study has been shown on the paper using real database. The data quality metric is going to help end-users to trust in the Knowledge engineering system.;소프트웨어 제품의 품질을 보증하는 일은 중요하며, 이를 위해서는 실제 소프트웨어 제품이 실행될 때 최적의 결과에 영향을 주는 데이터의 품질이 먼저 보증 되어야 한다. 하지만, 대부분의 소프트웨어 품질 관련 연구는 소프트웨어 품질 측정에 대한 모형과 이에 대한 측정 메트릭스만을 제시할 뿐 데이터 품질에 대해서는 다루고 있지 있다. 본 논문에서는 데이터 품질 평가를 위하여 사용자 관점에서 데이터 품질을 측정하는 메트릭스를 제안한다. 이 메트릭스는 데이터 사용 목적에 따라 관련 있는 컬럼과 관련 없는 컬럼의 그룹으로 구분하여 두 개의 그룹으로 나누고 이 두 그룹에 대해 각각 해당 컬럼별로 전체 컬럼별 데이터 총수에서 오류 데이터가 발생한 비율을 계산하여, 이 결과값을 반영한 전체 데이터의 품질을 파악한다. 따라서 오류 데이터의 비율을 측정하기 위하여 오류데이터를 발견하는 알고리즘을 기술한다. 데이터를 사용하는 목적에 따라 데이터 품질을 파악하는 방법을 제안한다. 제안한 메트릭스를 적용하여 데이터 품질을 측정 할 수 있는 DAQUM 아키텍쳐를 설계 구현하였으며, 이를 실제 데이터베이스에 적용한 사례연구를 수행하였다. DAQUM에 의해 측정된 데이터 품질값은 전체 데이터베이스에서 수치화된 오류 데이터 수의 비율을 나타내는 단순한 수치 값이 아니라 사용자 관점에서의 데이터 사용목적에 따라 오류 데이터의 심각도를 반영한 의미 있는 값들이다. 본 논문에서 제시하는 데이터 품질 메트릭스는 지식 공학 시스템이 최종 사용자에게 제공하는 데이터나 지식의 품질 측정의 기준이 될 수 있다.
Show the fulltext
Appears in Collections:
과학기술대학원 > 컴퓨터학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.