View : 1389 Download: 0

의미 관계 유사성 기반의 온톨로지 매칭과 온톨로지 교차 매칭의 정제 기법

Title
의미 관계 유사성 기반의 온톨로지 매칭과 온톨로지 교차 매칭의 정제 기법
Other Titles
Ontology Matching based on Semantic Relationship Similarity and Matching Refinement for Ontology Cross Matching
Authors
곽정애
Issue Date
2010
Department/Major
대학원 컴퓨터정보통신공학과
Publisher
이화여자대학교 대학원
Degree
Doctor
Advisors
용환승
Abstract
온톨로지는 여러 도메인에서 연구, 개발되고 있으며, 이에 서로간의 정보 공유와 재사용이 활발해 짐에 따라 온톨로지 매칭 기법이 중요하게 대두되었다. 온톨로지 매칭은 Upper온톨로지의 사용시, 온톨로지 통합, 새로운 온톨로지를 모델링 할 때, 그리고 의미 기반의 정보 검색 등 다양한 분야에서 사용된다. 이렇게 온톨로지 매칭이 많이 사용되면서 동의어 문제, 다의어 문제, 다형성의 문제 등이 발생하게 되었다. 이에 온톨로지 매칭의 문제점을 해결할 수 있는 다양한 온톨로지 기법이 연구되었다. 온톨로지 매칭 기법은 어휘 유사성 기법, 구조 유사성 기법, 인스턴스 유사성 기법, 추론 기반 유사성 기법으로 나눌 수 있다. 기존 온톨로지 매칭 도구는 이러한 온톨로지 매칭 기법을 조합해서 연구되었다. 본 연구에서는 먼저 기존 온톨로지 매칭 기법을 이용하여 온톨로지 매칭을 수행한 후 얻은 온톨로지 매칭 결과를 분석하여 매칭이 되어야 하는데 매칭이 안된 개념을 추출하였다. 이 개념을 트리플 비매칭 개념(Triple Unmatched Concept)이라 정의하며, 이 트리플 비매칭 개념을 매칭 시킬 수 있는 기법을 제안하였다. 트리플 비매칭 개념의 매칭을 위해 의미 관계 유사성(Semantic Relationship Similarity)을 제안하였으며, 의미 관계 유사성은 워드넷의 동의어 집합 단어가 워드넷의 상위어, 하위어, 전체어, 부분어 집합에 포함된 비율로 정의하였다. 또한 트리플 비매칭 개념의 매칭 여부와 매칭할 때 적용할 의미 관계를 결정하기 위해 최대 포함 집합과 이에 따른 매칭 임계값을 실험을 통해 결정하였다. 또한 선 수행된 온톨로지 매칭 결과에서 도메인 개념과 레인지 개념이 교차로 매칭된 매칭 프로퍼티를 추출하고, 이를 온톨로지 교차 매칭(Ontology Cross Matching)이라 정의하였다. 대부분의 온톨로지 매칭 기법에서는 오브젝트 프로퍼티의 도메인 개념과 레인지 개념의 매칭 결과와는 상관없이 등치 프로퍼티 관계로 매칭을 수행한다. 하지만 온톨로지 교차 매칭에 해당하는 프로퍼티에 등치 프로퍼티 관계로 매칭한다면 추론 결과가 기존 설계된 온톨로지 구조에 상충됨을 확인할 수 있었다. 이에 따라 본 연구에서는 등치 프로퍼티 관계로 매칭된 온톨로지 교차 매칭을 역 프로퍼티 특성으로 매칭 정제함으로써 온톨로지 매칭 후에도 온톨로지가 일관성을 유지할 수 있도록 하였다. 본 연구에서 제안한 기법인 의미 관계 유사성과 온톨로지 교차 매칭을 ‘SRS/OCM’ 로 간단히 표기하며, 이 기법의 실험 결과 대부분의 온톨로지 집합이 90%이상의 정확율과 재현율을 나타냈으며, F-Measure와 Overall도 높은 결과를 나타냈다. 또한 OAEI-2009의 벤치마크에 참가한 MapPSO, AROMA, ASMOV, RiMOM의 성능 평가와 비교해본 결과 다른 온톨로지 매칭 도구보다 SRS/OCM 의 성능이 높게 나타났다. 그리고 다른 온톨로지 도구에서는 정확율과 재현율의 차이가 커서 F-Measur는 높아도, Overall이 낮은 성능을 보였지만 SRS/OCM은 정확율과 재현율의 차이가 크지 않았기 때문에 F-Measure와 Overall도 높게 평가 되었다. 의미 관계 유사성 매칭 기법은 워드넷의 동의어 집합만 뿐만 아니라 워드넷의 의미 관계 집합을 사용할 수 있는 온톨로지 매칭 기법으로 ‘hasPart’와 ‘isPart’ 의 의미 관계를 최초로 온토로지 매칭에 적용한 기법이다. 또한 온톨로지 교차 매칭 정제 기법은 온톨로지 매칭 기법에 최초로 프로퍼티 특성을 적용한 기법이다. 이에 의미 관계 유사성 기법과 온톨로지 교차 매칭의 정제 기법은 온톨로지의 매칭의 성능을 높을 수 있는 새로운 온톨로지 매칭 기법으로 사용될 수 있을 것이라 기대된다.;Ontology has been studied and developed in many domains and as the sharing and reuses of information have become active, ontology matching techniques have come to the fore to become important. Ontology matching is used in diverse areas such as in using upper ontology, integrating ontology, modeling new ontology and semantic based information searches. As ontology matching has been frequently used as such, the issues of synonyms, words with multiple meanings and polymorphism have arisen. Accordingly, diverse ontology techniques to solve issues in ontology matching have been studied. Ontology matching measures can be divided into lexical similarity, structure similarity, instance similarity and logical inference similarity. Existing ontology matching tools have been studied by combining these ontology matching measures. In this study, first, ontology matching was performed using existing ontology matching methods and then, the obtained results of the ontology matching were analyzed to extract those concepts that were supposed to be matched but were not matched. These concepts were defined as Triple Unmatched Concepts(TUC) and method to match these TUCs were proposed. For the matching of TUCs, Semantic Relationship Similarity(SRS) was proposed and SRS was defined by the ratios of words in the synonym sets in WordNet included in the hypernym, hyponym, holonym and meronym sets in WordNet. In addition, to determine whether TUCs match or not and the semantic relationship to be applied when matching them, the largest inclusion set and relation critical matching values were determined through experiments. Also, matched properties where domain concepts and range concepts were cross matched were extracted from the results of previously executed ontology matching and they were defined as Ontology Cross Matching(OCM). In most ontology matching tools, matching is performed with ‘equivalentProperty’ relation regardless of the results of matching between the domain concepts and range concepts of object properties. However, through the results of inferences, it could be identified that, if properties corresponding to OCM would be matched with ‘equivalentProperty’ relation, the results of inferences would conflict with previously designed ontology structures. Therefore, in this study, OCM matched with ‘equivalentProperty’ relation was refined by ‘inverseOf’ property characteristic so that ontology can maintain consistency even after ontology matching. SRS and OCM were experimented and based on the results, most ontology sets showed at least 90% precision and recall and showed high F-Measure and Overall. In addition, the results were compared with the assessments of the performances of MapPSO, AROMA, ASMOV and RiMOM that participated in the bench mark of OAEI-2009 and based on the results; the performance of SRS/OCM was shown to be higher than the performances of other ontology matching tools. Also, other ontology tools showed large differences between precision and recall and thus they showed performances with high F-Measure but with low Overall. However, SRS/OCM showed a small differences between precision and recall and thus its F-Measure and Overall were also assessed to be high. The SRS is an ontology matching that enables using not only the synonym set of WordNet but also the semantic relationship set of WordNet and this formed a base to use WordNet widely in ontology matching. The ontology refinement of OCM applied ‘inverseOf’ property characteristic to OCM thereby enabling ontology to maintain consistency even after ontology matching. This method applied property characteristic to ontology matching techniques for the first time. Therefore, it is expected that the SRS and OCM can be used as new ontology matching method that can enhance the performance of ontology matching.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 컴퓨터정보통신공학과 > Theses_Ph.D
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE