구조적 특징에 기반한 대사 경로 드로잉 알고리즘의 설계 및 구현

구조적 특징에 기반한 대사 경로 드로잉 알고리즘의 설계 및 구현
Issue Date
과학기술대학원 컴퓨터학과
이화여자대학교 과학기술대학원
'생물정보학'이란 생물학적 데이터를 처리, 가공하여 정보를 얻어내는 연구 분야로 생물을 유전자의 집단으로 이해하려는 유전체학과, 단백질이라는 가장 중요한 기능단위를 중심으로 이해하려는 단백질체학, 그리고 이런 유전체학과 단백질체학의 단위들을 네트워크나 경로를 통해 이해하려는 대사체학으로 크게 나누어진다. 현재 생물정보학의 관심의 초점은 과거의 서열 및 구조 중심의 연구로부터 상호작용 및 기능 중심의 연구인 대사체학으로 옮겨가고 있다. 대사체학은 대사 경로 네트워크를 가시화하여 볼 수 있는 그래프로 작성하여 생명 활동을 총체적으로 이해하고자 하는 분야이다. 이 분야의 연구를 위해서는 대사 경로 내의 흐름을 한 눈에 알 수 있도록 대사 경로를 가시화하여 보여 줄 수 있는 도구가 반드시 필요하다. 따라서 본 논문에서는 기존의 '대사 경로 가시화 시스템'을 제공하는 KEGG와 EcoCyc등의 단점을 보완한 개선된 그래프 드로잉 알고리즘을 제안하였다. 대사 경로 그래프의 구조로는 기존의 화합물 그래프가 아닌 이분 그래프의 구조를 이용함으로써 가독성을 높였다. 그리고 대사 경로 그래프가 척도 없는 네트워크 구조라는 것과 구조적으로 환형 컴포넌트, 계층적 컴포넌트, 그리고 선형 컴포넌트를 가진다는 것을 고려하여 드로잉 알고리즘을 제안 및 구현함으로써 사이즈가 큰 그래프도 적절하게 드로잉 하도록 하였다. 이렇게 자동적으로 드로잉 된 대사 경로 그래프들은 수정을 위한 초기 드로잉으로 유용하게 사용될 수 있다. 구현한 드로잉 알고리즘의 실험에는 KEGG에 저장되어 있는 대사 경로 정보를 이용하였다. 이를 통하여 컴포넌트 사이의 오버랩과 에지 교차가 줄어든 드로잉 결과를 얻을 수 있다. ;Generally speaking, bioinformatics is concerned with the creation and development of advanced information and computational technologies for problems in biology, most commonly molecular biology. As such, it deals with methods for storing, retrieving and analyzing biological data, such as DNA/RNA, protein sequences, structures, functions, pathways and genetic interactions. It is divided into three major categories: (1) genomics∼ which interprets an organism as a genome, (2) proteomics∼ which interprets an organism as functional proteins, and (3) metabolimics ∼which interprets an organism as a network of functional units such as genes and proteins. Currently the focus of bioinformatics research moves from the sequence and the structure to the interaction and the function of biological units. In metabolimics, an organism is represented by metabolic pathway, i.e., well-displayed graph, and so the graph drawing tool to draw pathway well is necessary to understand it comprehensively. In this thesis, we design an improved drawing algorithm which complements the existing 'metabolic pathway drawing algorithm' in KEGG and EcoCyc. It enhances the readability by making use of the bipartite graph as metabolic pathway graph structure. It is possible to draw large graph properly by considering the facts that metabolic pathway graph is scale-free network and is composed of circular components, hierarchic components and linear components. This drawing result can be used as initial drawing which will be edited later manually. Some experiments are performed on our improved algorithm with metabolic pathway data in KEGG. The results show that the metabolic pathway graphs are well drawn by avoiding overlapping components and reducing unnecessary edge crossings.
