View : 1956 Download: 0

SVDD를 이용한 단백질 2차 구조 예측

Title
SVDD를 이용한 단백질 2차 구조 예측
Authors
최혜연
Issue Date
2003
Department/Major
과학기술대학원 컴퓨터학과
Publisher
이화여자대학교 과학기술대학원
Degree
Master
Abstract
IT기술과 맞물려 생물정보학은 눈부신 발전을 이룩하였고, 그 결과 많은 양의 생물관련 정보들이 쏟아져 나오게 되었다. 이런 풍부해진 데이터 속에서 사람들은 이 정보를 어떻게 잘 이용하여 인간 삶에 적용시킬 수 있는지에 관해 연구를 하게 되었고, 특히 모든 생명 현상을 규명할 수 있는 단백질 관련 연구에 많은 관심이 집중되었다. 단백질 연구에서 가장 핵심이 되는 것은 그 기능을 밝혀내는 것이다. 이런 단백질 기능은 3차 이상의 단백질 구조를 밝혀냄으로써 유추가 가능한데, 현재의 기술로는 아미노산 서열로부터 단백질 3차 구조를 직접 밝혀내는 것이 불가능하므로, 그 중간단계인 2차 구조를 예측하기 위한 연구가 중요하다고 할 수 있다. 이런 중요성으로 인하여, 단백질 2차 구조를 예측하기 위한 많은 연구들이 기계학습이란 방법을 통하여 70년대부터 활발히 진행되었고 최근에는 SVM이라는 새로운 방법을 통하여 연구가 진행되고 있다. 본 논문에서는 이런 연구흐름에 맞추어 SVM 방법 중 SVDD(Support Vector Data Description) 알고리즘을 이용한 단백질 2차 구조예측에 관한 연구를 수행하였다. 그 결과 77.22% 라는 평균 예측정확률을 보였으며, 이 결과는 신경망을 이용한 기존의 예측 시스템보다 약 4% 높은 결과였다. 또한, 2001년에 발표된 SVM 예측시스템보다도 약 3.7%의 높은 예측정확률을 보였다. 그러나, 2003년에 발표된 예측시스템보다는 아쉽지만 0.08% 낮은 예측정확률을 보였다. 이런 결과는 아마도 각 구조별 화학 및 물리적인 성질을 고려하지 않고, 아미노산 전체 서열상의 구조만을 고려했기 때문으로 판단된다. 비록 최근의 시스템에 비해 0.08% 정도의 낮은 예측정확률을 보였지만, 본 논문에서 제안한 예측 시스템은 기존의 시스템과 거의 동등한 예측정확률을 보였을 뿐 아니라, 물리·화학적인 정보를 고려하지 않고 오직 아미노산 서열에만 기반하여 단백질 2차 구조를 보다 정확하게 예측하였다. 또한, 생물관련 데이터에 SVDD알고리즘을 처음으로 적용시켰으며, 그 결과 기존의 시스템보다 좀 더 효율적인 시스템을 구현했다는데 그 의의가 있다.;Bioinformatics is fast growing with IT technology. As a result, many of biological data is produced. In this situation, people research method that this information is applied human life. Specially, people are concerned about protein function that it can explain life cycle. The key point of protein research is protein function prediction. This working is possible through protein third structure prediction. But current technology isn't possible protein third structure prediction from purely amino acid sequence. So, people research about protein secondary structure prediction that it is a middle step for protein third structure prediction. Because of this important thing, people have researched about protein secondary structure prediction from 1970s. Also, they have recently researched through "SVM". This thesis proposes new protein secondary structure prediction method using support vector data description algorithm with the needs of the times. As a result, Q_(3) of proposed system is 77.22%. This result is higher 4% than artificial neural network method. Also, it is higher 3.7% than publish paper in 2001. But, this system is lower 0.08% than publish paper in 2003. I think the reason that it isn't after due to consideration about chemical property with full amino acid sequence. Even if the result is lower 0.08% than existing system, proposed new system show equal prediction percentage. Also, it is more efficiently system than existing system as using
Fulltext
Show the fulltext
Appears in Collections:
과학기술대학원 > 컴퓨터학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE