연관규칙을 이용한 미토콘드리아 DNA 분류학습

Issue Date
과학기술대학원 컴퓨터학과
이화여자대학교 과학기술대학원
인간의 DNA는 의학적인 질병연구 뿐만 아니라, 범죄현장에서의 증거물, 친자감별, 생물의 진화 연구 등 여러 분야에서 연구되고 있다. DNA의 종류는 크게 핵 DNA와 미토콘드리아 DNA가 있는데, 이중 미토콘드리아 DNA의 빠르고 다양한 돌연변이는 종간의 계통발생학이나 동족간의 진화 연구에 유용한 지표로 사용되고 있고, 인류의 진화 연구에서도 중요한 지표로 사용되고 있다. 본 논문은 미토콘드리아 DNA분석에 데이터 마이닝 기법을 적용하고자 한다. 데이터 마이닝은 데이터베이스가 점차 대형화됨으로써 보다 효율적으로 데이터에 대한 분석의 필요성으로 연구되는 분야로 데이터베이스 기술, 통계학 관련 기술, 인공지능 관련 기술이 모두 합쳐진 복합적인 학문이다. 데이터 마이닝에서 중요한 요소는 사용자의 요구에 적절한 분석 기법을 적용하고, 이 기법을 이용해서 찾아진 정보를 효과적으로 분석할 수 있는 방법이 필요하다. 미토콘드리아 DNA의 특징을 분석하기 위해서 본 논문에서 제안하는 기법은 확률 분류(probability classificaiton)이다. 확률 분류는 연관 규칙과 이 규칙의 지지도 값을 바탕으로 분류에 적용하는 기법이다. 미토콘드리아 DNA의 특징을 데이터베이스화 한 뒤에 확률 분류기법을 적용한다. 이 기법을 통해서 민족별 미토콘드리아 DNA의 특징을 분석 할 수 있고, 이를 바탕으로 임의의 데이터와 유사한 민족을 분류할 수 있다.;Human DNA has been of great concern due to its diverse applications such as a medical prevention of disease, criminal investigation, a DNA discrimination and a biological evolution, DNA can be classified as neuclear DNA & mitochondria DNA. Among them, mitochondria DNA can be used in many research area including phylogeny, evolution of species, and human evolution. In this work, datamining method has been employed in mitochondria DNA analysis. Datamining is a research area that deals with an efficient analysis method of huge database, which requires knowledges in a variety of disciplmes like database, statistics, and so on. Important ingredients in datamining are chosing a proper analysis method and selecting an efficient method of analysing information. We used 'probability classification' method to analyse mitochondria DNA characteristics. Probability classification is a method utiliting classification based on the association rule & its support values. Characteristics of mitochondria DNA have been made into databases and then subject to probability classification. Using this method, we have been able to classify characteristics mitochondria DNAs among different races. Based on the results, we can also discriminate DNA between similar races.
