View : 784 Download: 0

XML 문서의 저장 기법에 대한 성능평가

Title
XML 문서의 저장 기법에 대한 성능평가
Other Titles
(The) Performance Evaluation on storage techniques for XML documents
Authors
김지심
Issue Date
2002
Department/Major
대학원 컴퓨터학과
Keywords
XML문서저장 기법성능평가컴퓨터
Publisher
이화여자대학교 과학기술대학원
Degree
Master
Abstract
XML(eXtensible Markup Language)로 기술된 문서는 데이터 자체로서, 현재 인터넷에서 개발자들이 구성하고 엔드 유저들이 사용하고 있는 모든 애플리케이션에서 표준 형식을 지닌 데이터의 역할을 하고 있다. 이에 따라, XML을 중심으로 한 여러 응용 기술들이 개발되고 있으며, 특히 XML 데이터를 효율적으로 관리하기 위한 연구들이 활발히 진행되고 있다. 이 중에서도 XML 문서의 저장에 관한 연구들은 기존의 기반 기술을 토대로 하거나 새로운 모델을 제시하여 문서를 효과적으로 저장하는 데에 초점을 맞추고 있다. 그러나 기존의 연구들은 저장시 문서의 정보를 일부 표현하지 못하거나 XML 문서의 질의를 효율적으로 지원하지 못하는 등의 제한점을 가지고 있다. 따라서, 본 논문에서는 기존 연구들의 제한점을 극복할 수 있는 새로운 XML 문서의 저장 기법을 제안하고, 새로운 저장 기법의 효율성을 검증하기 위해 기존의 XML 문서의 저장 기법들과 함께 질의에 대한 성능 평가를 수행한다. 본 논문에서는 BFST(Breadth First STorage)라는 새로운 저장 기법을 제안한다. 이 저장 기법은 먼저 문서의 DTD와 인스턴스로부터 문서의 구조를 분석한다. 그리고, 문서의 계층 구조와 엘리먼트들 간의 관계 정보를 담고 있는 EPID(Element Path IDentifier)를 기반으로 XML 문서의 구조 정보를 추출한다. 이렇게 추출된 문서의 정보를 손실하지 않고 저장하기 위해 객체 지향(object-oriented) 개념을 적용한다. 즉 OID(Object IDentifier)를 사용한 참조를 통해 문서의 계층 구조를 표현함으로써, 원래의 XML문서와 동일한 구조로 문서를 저장할 수 있다. 또한, 기존 연구에서 해결하지 못했던 다중 애트리뷰트(set-valued attribute)를 중첩 릴레이션(nested relation)에 저장함으로써 저장 공간을 줄이고 질의 비용을 감소시킬 수 있다. 이러한 객체-관계형 개념을 적용하여 넓이 우선 탐색(Breadth First Search) 방식으로 문서를 순회하며 저장하게 된다. 그리고, XML 고유의 질의 유형에 대한 분류를 평가 기준으로 하여 성능 평가를 수행함으로써, 본 논문에서 제시한 BFST 기법의 질의 성능을 기존 연구들의 질의 성능과 비교·분석하여 BFST 기법의 효율성을 검증한다. 본 논문의 의의는 저장시에 원래의 XML 문서와 동일한 구조로 표현하여 정보의 손실을 막고, XML 질의를 효율적으로 지원하는 새로운 저장기법을 제시한 것이다.;The documents described with XML(extensible Markup Language) is standard data itself, They used in applications developed by venders and used by end users in WWW. The various technologies focusing on XML are being exploited. Especially, many studies on managing XML documents are in progress actively. There have been a number of research projects on data models for XML documents. The important question is what is the best way of storing XML documents since the performance of the underlying storage representation has a significant impact on query processing efficiency. The studies on storage techniques for XML documents are focusing on storing documents efficiently based on existing data models or new storage models. However, related storage techniques have limitations that they lose some information for original documents or can not support queries for XML documents efficiently. In this work, therefore, we suggest new storage technique, BFST(Breadth First STorage). In this approach, we analyze structures for documents with a DTD and an instance. Then, we extract information from an instance, based on an EPID(Element Path Identifier) including the hierarchical structure and relationship among elements in a document. The Object-Oriented concept is applied to a BFST technique to store a document in Database without information loss. As the hierarchy of a document can be expressed in Database through references with OID(Object IDentifier), we can keep original structures in Database. In addition, as storing set-valued attributes in nested relations, we reduce spaces and query costs. We store documents in Database with object-oriented concept and BFS(Breadth First Search) in BFST method. The performance evaluation for storing XML documents can verify the efficiency of BFST method, comparing query costs of documents stored with existing storage techniques with them of documents stored with BFST techniques. This paper will bring following benefits to manage XML documents. we can store XML documents in Database with no loss of original information and support queries for XML documents. A BFST technique will be used efficiently in systems for managing XML-based data.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 컴퓨터공학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE