View : 1546 Download: 0

Full metadata record

DC Field Value Language
dc.contributor.advisor박승수-
dc.contributor.author윤성희-
dc.creator윤성희-
dc.date.accessioned2016-08-25T11:08:16Z-
dc.date.available2016-08-25T11:08:16Z-
dc.date.issued2005-
dc.identifier.otherOAK-000000010909-
dc.identifier.urihttps://dspace.ewha.ac.kr/handle/2015.oak/171949-
dc.identifier.urihttp://dcollection.ewha.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000010909-
dc.description.abstractMembrane protein is a substance that charge of signal transmission between inside of the cell and outside of cell. It has been regarded important research subject in bio-industry that is leading the new medicine development, because over 80% of commercial medicines are worked by membrane protein. Transmembrane Protein, which is integral membrane protein, mostly exists in cell membrane and both end of it is projected in each inside of the cell and outside of the cell. because the part which is in the cell membrane is the second structure, it is related to the function of protein, The structure of protein is studied by both experimental method and computer modeling method. In computer modeling method, systems based on Hidden Markov Model(HMM) show good performance. But these systems are not considering the knowledge about diverse characteristics of protein which involved in structure marking. Lf these characters are considered, it can helps in making more intellectual models which is effective in predicting structure. This paper is about to represent the method which predicting a-helix transmembrane region from sequence of membrane protein, by using Maximum Entropy Markov Model(MEMM) that is effective in fusing diverse information about characters of protein.;막단백질(Membrane Protein)은 세포내외의 신호를 전달에 관여하고 대사를 조절하며 세포의 분화를 유도하는 물질로서 낭포성섬유증(cystic fibrosis)과 같이 사람에게 발병하는 유전 장애(genetic disorders)에 직접적인 영향을 미치는 등 생체 내에서 중요한 기능을 담당하고 있다. 특히 현재 상용화되고 있는 약물 가운데 70% 정도가 막단백질을 경유해 약리 활성을 나타내기 때문에 신약개발로 대표되는 바이오 산업에서 중요한 연구대상이 되고 있다. 막단백질을 발현시키는 유전자는 전체 유전자 가운데 30% 정도에 이른다. 하지만 지금까지 구조가 규명된 막단백질의 수는 미미한 실정이다. 그 이유는 막단백질은 분자량이 적고 물에 용해되기 어려워 단백질 결정화 문제 등으로 인하여 X선 결정학(X-ray Crystallography), 핵자기공명법(Nuclear Magnetic Resonance: NMR) 등의 실험적 기법에 의한 해석이 어렵기 때문이다. 따라서 근래에 들어서는 실험적 기법의 단점인 결정화 문제, 시간과 비용의 비효율성을 극복하고 결과의 효율을 극대화 시키기 위하여 생물정보학의 컴퓨터 모델링 기술을 이용한 막단백질 구조 연구가 활발하게 진행되고 있다. 컴퓨터 모델링 기술 중에서는 확률 모델인 은닉 마르코프 모델(Hidden Markov Model: HMM) 에 기반한 시스템들이 좋은 성능을 보이고 있다. 그런데 HMM 은 서로 상이한 정보들을 통합하는데 한계가 있기 때문에 예측 시 단백질의 구조 형성에 영향을 끼치는 다양한 생물학 정보들을 고려하지 못한다는 문제가 있다. 다양한 특성정보는 구조 예측에 효과적인 보다 지능적인 모델을 만드는데 도움을 줄 수 있을 것이다. 따라서 본 논문에서는 서로 모양이 다른 비동형(eterogeneous) 정보를 합치는데 유용하고, 새로운 정보를 추가 및 갱신이 편리한 최대 엔트로피 마르코프 모델 (Maximum Entropy Markov Model: MEMM)을 사용하여 내재성 막단백질(Integral Membrane Protein)인 막횡단 단백질 (Transmembrane protein)의 구조를 예측하였다. 결과는 최대 엔트로피 마르코프 모델을 통한 예측이 재현율에서 높은 성능을 보임으로써 단백질의 다양한 특성정보가 구조 예측에 긍정적인 영향을 끼친다는 것을 보여주었다.-
dc.description.tableofcontents목차 논문개요 = ⅶ Ⅰ. 서론 = 1 1.1 연구배경 = 1 1.2 연구 목적 및 내용 = 2 Ⅱ. 관련 연구 = 3 2.1 막단백질과 기본구성 요소 = 3 2.1.1 막단백질 = 3 2.1.2 아미노산(Amino Acid) = 4 2.2 막단백질의 구조연구 = 7 2.2.1 실험적 기법 = 7 2.2.2 컴퓨터 모델링 기법 = 8 2.3 HMM에 기반한 기존시스템의 한계점 = 10 Ⅲ. 최대 엔트로피 방법 = 11 3.1 은닉 마르코프 모델과 최대 엔트로피 마르코프 모델 = 11 3.2 최대 엔트로피 마르코프 모델 = 12 3.3 모델 구조 = 15 Ⅳ. 시스템 설계 및 구현 = 19 4.1 시스템 설계 = 19 4.1.1 시스템 개요 = 19 4.1.2 시스템 구조 = 20 4.2 기초실험 단계 = 22 4.2.1 기초실험 1: 위상 별 아미노산의 구성 비율 = 22 4.2.2 기초실험 2: 아미노산의 발생 정확도 = 26 4.3 전처리 및 학습 = 30 4.3.1 전처리(Preprocessing): 학습데이터 생성 = 30 4.3.2 학습을 위해 고려된 자질 = 32 4.3.3 자질의 표현 및 자질파일 생성 = 36 4.3.4 모델 = 40 Ⅴ. 실험 = 41 5.1 데이터 집합 = 41 5.2 결과 = 44 5.2.1 결과화면 = 44 5.2.2 시스템 성능 = 47 5.2.3 성능 비교 = 50 Ⅵ. 결론 = 53 참고문헌 = 55 ABSTRACT = 58-
dc.formatapplication/pdf-
dc.format.extent1400369 bytes-
dc.languagekor-
dc.publisher이화여자대학교 과학기술대학원-
dc.title최대 엔트로피 마르코프 모델을 이용한 막횡단 단백질 나선형 구조 예측-
dc.typeMaster's Thesis-
dc.title.translatedMaximum Entropy Approach to Helical Transmembrane Protein Prediction-
dc.creator.othernameYoon, Sung Hee-
dc.format.pageⅷ, 59 p.-
dc.identifier.thesisdegreeMaster-
dc.identifier.major과학기술대학원 컴퓨터학과-
dc.date.awarded2005. 8-
Appears in Collections:
과학기술대학원 > 컴퓨터학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE