유전성 유방암 조기 진단을 위한 코돈 패턴 데이터 마이닝

Issue Date
과학기술대학원 컴퓨터학과
이화여자대학교 과학기술대학원
코돈 패턴이란 DNA의 유전 암호로서 수학적으로 네 종류의 DNA염기 중에서 세 개씩의 묶음을 만드는 조합이다. 본 논문에서는 암 억제 유전자로 알려진 BRCA1유전자가 변이를 일으킬 경우에 유전성 유방암을 유발한다는 점에 착안하여 정상 BRCA1 유전자와 돌연변이 BRCA1유전자와의 서열을 비교하여 유전성 유방암의 발현을 가능케 하는 유전자의 코돈 패턴을 발견하였다. 특히 세균에서 사람에 이르기까지 연구된 모든 형태의 생물에서 같은 코돈이 같은 아미노산을 지정한다는 특성을 고려하여 유전자 패턴 중에서도 코돈 패턴에 초점을 맞추었다. 기존의 연구들이 유전성 유방암에 걸린 가계의 몇 세대를 조사하여 발병 유무를 예측하거나, 세포 배양 연구와 같은 분자유전학적 방법으로 연구하여 왔는데 본 논문에서는 이 경우에 발생할 수 있는 문제점을 제시하고 이러한 문제점들을 해결할 수 있는 방법으로 유전성 유방암을 유발 가능케 하는 『돌연변이 BRCA1코돈 패턴』을 추출하는 방안을 제안하였다. 코돈 패턴 추출 과정은 정상BRCA1과 돌연변이 BRCA1으로부터 DNA 시퀀스 데이터 추출, BLAST 와 ClustalW 알고리즘 적용, 정상 BRCA1서열과 일치하지 않는(변이를 일으킨) 돌연변이 BRCA1의 서열 추출, 변이 된 시퀀스로부터의 코돈 패턴 발견 및 분석 의 구성 방식으로 진행된다. 이러한 코돈 패턴 마이닝의 결과로 유전성 유방암을 지닌 환자들의 돌연변이 BRCA1코돈 패턴을 발견할 수 있으며, 여러 가지 유전성 질환과 관련되어 발현하는 돌연변이 유전자의 코돈 패턴을 발견하는데 사용할 수 있다. 또한 발견된 유전자 변이 코돈 패턴은 유전성 유방암의 조기진단에 이용될 수 있을 것이다. ; The BRCA1 gene sequence functions as a tumor suppressor in human breast cancer cells. The inherited breast cancer is mainly caused by the mutations in BRCA1. So far, the previous studies for breast cancer have made an examination of a family line (general screening of the population for BRCA1 not yet recommended) or a method of cell cultivation. However, these methods cannot provide an appropriate solution for the early diagnosis of inherited breast cancer. Therefore, we propose a new method of codon pattern data mining find mutations in BRCA1. We have used the DNA sequence data of mutated BRCA1 as experiment data, because it has been identified as a strong candidate data causing the inherited breast cancer by the positional cloning method. The process of codon pattern extraction consists of three steps. First, we extract the normal and mutational DNA sequences in BRCA1 from the『human map viewer』tool for the data mining. Second, we seek the homology from the global and local alignment, and detect the similarity or difference relationships between two sequences from the pair wise and multi alignment. The Blast and ClustalW algorithms are used for these processes. Third, we analyze the codon pattern of the DNA sequences in the mutational BRCA1 by using the『mutational site search』tool. Through the proposed process, we have found the common codon pattern in mutational BRCA1. Consequently, we can analyze the mutational codon pattern of the patients with inherited disease by using the proposed codon pattern mining method. We expect that the proposed method can be applied to an early diagnosis of inherited breast cancer.
Appears in Collections:
과학기술대학원 > 컴퓨터학과 > Theses_Master
