View : 1344 Download: 0

New method for detecting incomplete selective sweeps and its application to Drosophila melanogaster population genomic data

Title
New method for detecting incomplete selective sweeps and its application to Drosophila melanogaster population genomic data
Authors
VY THI HA MY
Issue Date
2016
Department/Major
대학원 에코크리에이티브협동과정
Publisher
이화여자대학교 대학원
Degree
Doctor
Advisors
김유섭
Abstract
Adaptive evolution occurs as beneficial mutations arise and then increase in frequency by positive natural selection. How, when, and where in the genome such evolutionary events occur is a fundamental question in evolutionary biology. It is possible to detect ongoing positive selection or incomplete selective sweep in species with sexual reproduction because, when a beneficial mutation is on the way to fixation, homologous chromosomes in the population are divided into two groups: one carrying the beneficial allele with very low polymorphism at nearby linked loci, and the other carrying the ancestral allele with normal pattern of sequence variation. In this study, I propose a composite likelihood ratio (CLR) test for detecting incomplete selective sweeps based on the joint sampling probabilities for allele frequencies of two groups as a function of strength of selection and recombination rate. Tested against simulated data, this method yielded statistical power and accuracy in parameter estimation that are higher than the iHS test and comparable to more recently developed nSL test. This procedure was also applied to African Drosophila melanogaster population genomic data in two populations with large sample size, Rwanda and Zambia, to detect candidate genes under ongoing positive selection. Upon visual inspection of sequence polymorphism, candidates detected by CLR method exhibited clear haplotype structures predicted under incomplete selective sweeps. Furthermore, using genomic data from Rwanda, Zambia and nine other populations in Africa, I investigated the geographic distribution of beneficial haplotypes at loci detected as the significant candidates of incomplete sweep. Distinct spatial distributions of beneficial haplotype are observed across loci, suggesting the operation of different modes of positive selection. To explain this range of results, I analyzed simulated data under the island model of two subpopulations with selective pressure that vary in space (local vs. global selection) and time (constant vs. diminishing selection). More than half of the loci appear to be under simple selection with constant selective pressure. However, there are also many loci compatible with diminishing selection, for example due to heterozygote advantage. I also found a few loci under incomplete soft selective sweeps. One of them is characterized by a complex haplotype distribution that can only be explained by very high adaptive mutation rate and possibly heterozygote advantage. ;적응진화는 개체의 적응도를 높이는 돌연변이가 집단 내에서 발생하여, 양성 자연선택(positive selection)으로 인해 그 수가 증가하는 방식으로 이루어진다. 어느 유전자 좌위에서, 언제, 어떠한 기작으로 위와 같은 진화적 사건이 일어나는가는 진화유전학을 관통하는 핵심적인 질문임에 틀림이 없다. 그러므로 염기서열 변이의 패턴으로부터 자연선택이 일어난 흔적을 검출하는 것이 매우 중요하다. 이로운 돌연변이가 선택되어 그 빈도가 증가하고 있는 유성생식 집단에서 염색체는 두 부류로 나뉜다. 개체의 적응도를 높이는, 즉 이로운 대립유전자를 포함하는 염색체들은 그 유전자 좌위를 중심으로 매우 낮은 유전적 다양성을 갖는다. 나머지 염색체들은 정상적인 수준의 유전적 다양성을 보인다. 이러한 진화적 과정을 불완전 선택일소라고 부른다. 본 연구에서는 위와 같이 두 그룹으로 나뉜 염색체 샘플에서 중립적 염기서열 변이가 어떠한 빈도로 관찰되는지 확률을 계산하고, 이에 기반하여 CLR (composite likelihood ratio) 테스트라고 하는 불완전 선택일소의 검출 방법을 고안하였다. 시뮬레이션으로 생성한 가상 데이터에 CLR 테스트를 적용한 결과, 기존에 많이 사용되는 iHS 테스트나 비교적 최근에 고안된 nSL 테스트를 했을 때보다 통계적 유의성과 더불어 모수의 추정에 있어서 더 높은 정확도를 보였다. 실제 자연 집단의 분석에도 이러한 방법을 적용하였다. 아프리카 노랑초파리의 르완다와 잠비아 집단의 유전체 변이 데이터를 분석하였고, 양성 자연선택 하에 있다고 생각되는 후보 유전자 좌위들을 검출하였다. 후보 유전자 좌위의 염기서열 변이를 눈으로 관찰한 결과 불완전 선택일소 이론이 예측하는 것과 일치하는 패턴을 확인하였다. 나아가, 르완다와 잠비아, 그 외 아프리카의 9개의 집단을 대상으로 후보 유전자 좌위의 이로운 대립유전자의 빈도를 계산하고 지리적 분포를 구하였다. 좌위별로 이로운 대립유전자 분포의 차이가 관찰되었는데, 이는 좌위에 따라 적응진화가 일어나는 기작이 다르다는 점을 시사한다. 어떠한 기작들이 초파리 데이터를 설명할 수 있는지 탐구하기 위하여, 집단 간 이주의 섬 모델 (island model) 하에서 자연선택의 힘이 시간과 장소에 따라 다르게 작용하는 네 가지의 시나리오를 가정하고 시뮬레이션을 수행하였다. 그리하여 시뮬레이션 된 집단과 실제 집단에서 이로운 대립유전자에 의한 소집단 간 유전적 분화의 정도를 비교하였다. 그 결과 과반수의 유전자 좌위가 시간적으로 일정한 선택압을 받는 단순 자연선택의 모델과 부합한다는 사실을 밝혔다. 그러나 이형접합 우세 (heterozygote advantage)와 같이 이로운 대립유전자 빈도의 증가에 따라 선택압이 감소하는 모델이 후보 대립유전자 빈도의 지리적 분포를 더 잘 설명하는 좌위들도 있었다. 또한 이로운 대립유전자가 독립적인 돌연변이에 의해 반복적으로 생성되어 불완전 선택일소의 패턴을 구성하는 좌위도 검출하였다. 이러한 패턴이 나타나는 것은 이 좌위에서 이로운 돌연변이가 매우 높은 빈도로 일어나며 이형접합 우세가 작용하기 때문인 것으로 보인다.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 에코크리에이티브협동과정 > Theses_Ph.D
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE