View : 663 Download: 0

DNA 마이크로어레이 데이터에 대한 연관규칙 마이닝 시스템의 설계 및 구현

Title
DNA 마이크로어레이 데이터에 대한 연관규칙 마이닝 시스템의 설계 및 구현
Authors
편선경
Issue Date
2003
Department/Major
과학기술대학원 컴퓨터학과
Publisher
이화여자대학교 과학기술대학원
Degree
Master
Abstract
최근 생명공학의 급속한 발달로 대량의 유전자 서열 정보 및 새로운 형태의 생물학 정보들이 빠른 속도로 증가하고 있다. 그런 생물학 데이터들 중 유전자 발현을 측정을 목적으로 만들어진 마이크로어레이 데이터는 인체의 유전자 기능 분석, 신약개발 등 많은 분야에서 활용될 수 있다. 이러한 마이크로어레이 데이터를 분석하는 문제는 이제 Bioinformatics의 중요한 과제중의 하나일 것이다. 기존의 연구는 기능과 상호관련성을 분석할 수 있는 클러스터링을 기반으로 진행되어왔지만, 연관규칙을 적용함으로써, 유전자들 간의 상호작용 또는 기능별 그룹들간의 방향성 등을 밝혀낼 수 있다. 기존 P-tree를 이용한 연관 규칙 연구는 픽셀 단위의 이미지 자체를 분석해서 트리구조로 표현하는 기법으로, 용량이 큰 어레이 데이터에 적용하기에는 한계가 있다. 본 논문은 연관규칙의 기본 알고리즘이 Apriori를 기반으로 하는 연관규칙 생성 알고리즘을 제안하고, 연관규칙의 문제점 중의 하나인 많은 규칙 수를 포스트 프로세싱을 통하여 해결하고자 한다. 포스트 프로세싱은 생성된 규칙들을 사용자 주관적인 평가를 반영하는 템플릿 기반의 규칙 필터링과 유전자들을 상위레벨의 규칙들로 변환하는 유사도 기반 그룹화 과정으로 이루어져 있다. 규칙생성모듈과 규칙 평가모듈 두 가지에 실제 마이크로어레이 데이터를 적용함으로써, 생물학적 질문들에 대한 해답을 찾아낼 수 있었다. ; Recently, the rapid development of biotechnology brings the explosion status of biological data, gene sequence information, new format of biology, etc. Microarray data, which is made for gene expression measurement, is used for gene function analysis of human, and development of new medicine, etc. Therefore, the problem of microarray data analysis is the one of the most important works in the bioinformatics. Many bioinformatics and data mining researchers have been working on applying data mining methods to the analysis of microarray data. In particular, clustering methods group genes into clusters that exhibit similar types of behavior in the experiments. But, they don’t provide the direction of the relationship and interaction of genes. Therefore, association algorithms is introduced in the micorarray data that is based on Peano count trees. In this thesis, we present association generation algorithm based on apriori algorithm and post-processing for generated association rule. Association rule generation module is transformed into the appropriate shape for applying microarray data, and post-processing modules is composed of the template-based rule filtering and the similarity-based rule grouping. We conduct experimental tests for cases of two biological questions on the proposed system using sample microarray data. As a result, we managed to answer the questions about gene regulation relationships that were of interest to biologists using our methods.
Fulltext
Show the fulltext
Appears in Collections:
과학기술대학원 > 컴퓨터학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE