View : 649 Download: 0

Full metadata record

DC Field Value Language
dc.contributor.author편선경-
dc.creator편선경-
dc.date.accessioned2016-08-26T03:08:11Z-
dc.date.available2016-08-26T03:08:11Z-
dc.date.issued2003-
dc.identifier.otherOAK-000000004568-
dc.identifier.urihttps://dspace.ewha.ac.kr/handle/2015.oak/195327-
dc.identifier.urihttp://dcollection.ewha.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000004568-
dc.description.abstract최근 생명공학의 급속한 발달로 대량의 유전자 서열 정보 및 새로운 형태의 생물학 정보들이 빠른 속도로 증가하고 있다. 그런 생물학 데이터들 중 유전자 발현을 측정을 목적으로 만들어진 마이크로어레이 데이터는 인체의 유전자 기능 분석, 신약개발 등 많은 분야에서 활용될 수 있다. 이러한 마이크로어레이 데이터를 분석하는 문제는 이제 Bioinformatics의 중요한 과제중의 하나일 것이다. 기존의 연구는 기능과 상호관련성을 분석할 수 있는 클러스터링을 기반으로 진행되어왔지만, 연관규칙을 적용함으로써, 유전자들 간의 상호작용 또는 기능별 그룹들간의 방향성 등을 밝혀낼 수 있다. 기존 P-tree를 이용한 연관 규칙 연구는 픽셀 단위의 이미지 자체를 분석해서 트리구조로 표현하는 기법으로, 용량이 큰 어레이 데이터에 적용하기에는 한계가 있다. 본 논문은 연관규칙의 기본 알고리즘이 Apriori를 기반으로 하는 연관규칙 생성 알고리즘을 제안하고, 연관규칙의 문제점 중의 하나인 많은 규칙 수를 포스트 프로세싱을 통하여 해결하고자 한다. 포스트 프로세싱은 생성된 규칙들을 사용자 주관적인 평가를 반영하는 템플릿 기반의 규칙 필터링과 유전자들을 상위레벨의 규칙들로 변환하는 유사도 기반 그룹화 과정으로 이루어져 있다. 규칙생성모듈과 규칙 평가모듈 두 가지에 실제 마이크로어레이 데이터를 적용함으로써, 생물학적 질문들에 대한 해답을 찾아낼 수 있었다. ; Recently, the rapid development of biotechnology brings the explosion status of biological data, gene sequence information, new format of biology, etc. Microarray data, which is made for gene expression measurement, is used for gene function analysis of human, and development of new medicine, etc. Therefore, the problem of microarray data analysis is the one of the most important works in the bioinformatics. Many bioinformatics and data mining researchers have been working on applying data mining methods to the analysis of microarray data. In particular, clustering methods group genes into clusters that exhibit similar types of behavior in the experiments. But, they don’t provide the direction of the relationship and interaction of genes. Therefore, association algorithms is introduced in the micorarray data that is based on Peano count trees. In this thesis, we present association generation algorithm based on apriori algorithm and post-processing for generated association rule. Association rule generation module is transformed into the appropriate shape for applying microarray data, and post-processing modules is composed of the template-based rule filtering and the similarity-based rule grouping. We conduct experimental tests for cases of two biological questions on the proposed system using sample microarray data. As a result, we managed to answer the questions about gene regulation relationships that were of interest to biologists using our methods.-
dc.description.tableofcontents논문개요 = v I. 서론 = 1 1.1 연구 배경 및 목적 = 1 1.2 연구 내용 = 2 II. 관련 기술 및 연구 동향 = 5 2.1 데이터 마이닝 = 5 2.2 마이크로어레이(Microarray) 데이터 = 9 2.2.1 마이크로어레이의 제작과정 = 9 2.2.2 마이크로어레이의 활용분야 = 14 2.3 마이크로어레이 데이터마이닝 동향 = 15 2.3.1 클러스터링(Clustering) = 16 2.3.2 연관규칙(Association) = 18 III. 연관규칙 시스템 설계 = 20 3.1 기존 Apriori 연관규칙 알고리즘 = 20 3.2 마이크로어레이 데이터에 연관규칙 적용 = 23 3.2.1 Apriori변형 알고리즘을 이용하여 규칙생성(Datamining Phase) = 25 3.2.2 연관규칙 적용 후 포스트프로세싱(Validation Phase) = 30 IV. 시스템 구현 및 실험 = 39 4.1 데이터 전처리 = 39 4.2 규칙 생성 모듈 = 43 4.3 규칙 평가 모듈 = 48 4.4 결과 분석 = 54 V. 결론 및 향후 과제 = 55 참고문헌 = 57 영문초록 = 60-
dc.formatapplication/pdf-
dc.format.extent4423414 bytes-
dc.languagekor-
dc.publisher이화여자대학교 과학기술대학원-
dc.titleDNA 마이크로어레이 데이터에 대한 연관규칙 마이닝 시스템의 설계 및 구현-
dc.typeMaster's Thesis-
dc.identifier.thesisdegreeMaster-
dc.identifier.major과학기술대학원 컴퓨터학과-
dc.date.awarded2003. 2-
Appears in Collections:
과학기술대학원 > 컴퓨터학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE