Você está na página 1de 60

TEORIA DA

COALESCÊNCIA

Estudo das propriedades genealógicas


de linhagens
APLICABILIDADE

• É o instrumento interpretativo mais usado na análise dos


processos populacionais que estão na base da variação
de sequências de DNA.
CARACTERÍSTICAS

• Abordagem genealógica
• Modelação dos processos mutacionais no sentido
presentepassado e não presentefuturo
• Limitação da análise à amostra disponível sem que seja
necessário ter em conta toda a população
• Dissociação conceptual entre processos mutacionais e
genealógicos
TIPO DE DADOS

SNP

AAGCTTGTTCAGAGGAGTGACAATCTGCTTACATCTTGACCTT

AAGCTTGTTCAGAGGAGTGATAATCTGCTTACATCTTGACCTT
TIPO DE DADOS

Nat Rev Genet 7: 669-680 (2006)


TIPO DE DADOS
site of variation

individuals

http://pga.gs.washington.edu/
A ABORDAGEM GENEALÓGICA

ab cd ab cd

xy ad ac tz ad ac

ax ay at az ax ay at az
A ABORDAGEM GENEALÓGICA

a
ab cd

ad ac
a a

ax ay at az
a a a a
A teoria da coalescência centra-se na genealogia da amostra
MODELO DE WRIGHT-FISHER

• N constante
• Acasalamento ao acaso
• Ausência subdivisões geográficas (ou outras)
• Ausência de selecção
• Gerações discretas
•  O insucesso reprodutivo está distribuído ao acaso

– Para valores de N grandes, o número de descendentes por


indivíduo tem uma distribuição Poisson.
MODELO DE WRIGHT-FISHER

AB CD EF GH IJ KL
PROPRIEDADES DAS GENEALOGIAS NO
MODELO DE WRIGHT-FISHER
TEMPO DE COALESCÊNCIA n=2

tMRCA
TEMPO DE COALESCÊNCIA n=2

AB CD EF GH IJ KL

Prob. de partilha de ancestral na geração anterior

AA = [1/12]2 DD = [1/12]2 GG = [1/12]2 JJ= [1/12]2


BB = [1/12]2 EE = [1/12]2 HH = [1/12]2 KK = [1/12]2
CC = [1/12]2 FF = [1/12]2 II = [1/12]2 LL = [1/12]2

= [1/12]2 . 12 = 1/12 = 1/2N


TEMPO DE COALESCÊNCIA n=2

• n=2
• Prob. de partilha de ancestral na
geração anterior:
• 1/2N
• Prob. de não partilha de ancestral na
geração anterior:
• 1- (1/2N)
• Probabilidade de coalescência na
geração t+1
• 1/2N [1- (1/2N) ]t
n=2; N=10
0,05 0,05
0,045 0,045
0,04 Distribuição geométrica 0,04 Distribuição exponencial
0,035 0,035
P(MRCA=t)

P(MRCA=t)
0,03 0,03
0,025 P(MRCA=t)= 1/2N [1- (1/2N) ]t P(MRCA=t)= 1/2N e-t/2N
0,025
0,02 0,02
0,015 0,015
0,01 0,01
0,005 0,005
0 0
1 8 15 22 29 36 43 50 57 64 71 78 85 92 99
1 9 17 25 33 41 49 57 65 73 81 89 97
t
• P (MRCA=t)=1/(2N) e-t/2N t

n=2; N=20
0,03
• E (t)=2N
0,03 gerações
0,025
Distribuição geométrica 0,025 Distribuição exponencial
P(MRCA=t)

0,02

P(MRCA=t)
0,02

0,015 P(MRCA=t)= 1/2N [1- (1/2N) ]t 0,015 P(MRCA=t)= 1/2N e-t/2N

0,01 0,01

0,005 0,005

0 0
1 8 15 22 29 36 43 50 57 64 71 78 85 92 99 1 9 17 25 33 41 49 57 65 73 81 89 97
t t
TEMPO DE COALESCÊNCIA n=2

tMRCA = 2N gerações
TEMPO DE COALESCÊNCIA n=n

tMRCA
TEMPO DE COALESCÊNCIA n=n
TEMPO DE COALESCÊNCIA n=n

E (tMRCA com n=2) = 2N

Número de pares possíveis= n (n-1) / 2

Tempo médio para a primeira coalescência


numa amostra de n linhagens:
1/ [(n (n-1) / 2)] . 2N = 4N / n(n-1)
TEMPO DE COALESCÊNCIA n=n

T2

4N / 2 (2-1) = 1 . 2N

4N / 3 (3-1) = 1/3 . 2N
T3 4N / 4 (4-1) = 1/6 . 2N
T4 4N / 5 (5-1) = 1/10 . 2N
T5 4N / 6 (6-1) = 1/15 . 2N
T6 4N / 7 (7-1) = 1/21 . 2N
T7 4N / 8 (8-1) = 1/28 . 2N
T8 4N / 9 (9-1) = 1/36 . 2N
T9

TOTAL = E(tMRCA)=3,56 N = 4N [1- (1/n)] 0,78 * 2N


TEMPO DE COALESCÊNCIA n=n

• E (tMRCA)=4N [1- (1/n)]

• n  4N
100

• E (tMRCA)=4N 80

60
• Ex: E(t)
40
• n=2; E (t)=2N
20
• n=10; E (t)=3,6N
• . 0
• . n
• .
• .
TEMPO DE COALESCÊNCIA

• Propriedades médias

2N
4N

2N
TEMPO DE COALESCÊNCIA

• Aleatoridade

Stable

Growing Contracting
TEMPO DE COALESCÊNCIA
• Consequências

• Inutilidade de aumento da amostra: a estrutura da genealogia é


basicamente determinada a partir da altura em que já há poucos
ancestrais

• A inclusão da bifurcação mais antiga na amostra é obtida com um


número surpreendentemente baixo de indivíduos:
• (n-1)/(n+1) é a probabilidade de incluir o MRCA numa amostra de
tamanho n

• A informação obtida a partir de um único gene é muito limitada.

• É melhor aumentar o número de loci analisados do que o número


de amostras em cada locus.
ADIÇÃO DE MUTAÇÕES
ADIÇÃO DE MUTAÇÕES

• Os padrões de diversidade genética observados


reflectem a sobreposição de mutações numa genealogia
ADIÇÃO DE MUTAÇÕES-ISM

t t+x t+x+y

• Cada mutação ocorre numa posição diferente de


uma sequência de DNA: ISM
ADIÇÃO DE MUTAÇÕES

1 2 3 4 5 6 7 8 9 101112

6 4 2 10
8

12
ADIÇÃO DE MUTAÇÕES

Exemplo de aplicação do programa GENETREE


MEDIDAS SUMÁRIAS DE DIVERSIDADE GENÉTICA

2t

E() =2  t
 =4N
E(t)=2 N E() =2 E(t)
ou
Nº Médio de diferenças  = taxa de
entre um par de mutação por = 4N
locus por
sequências = 
geração
MEDIDAS SUMÁRIAS DE DIVERSIDADE GENÉTICA

Nº de mutações (posições
com segregação) numa T2
amostra de tamanho n = S
T3
T4 Diapositivo 23

Comprimento total da árvore L = 4T4 + 3 T3 + 2 T2


n
 4N  n 4N
L   iT i
n n n 1
1
E ( L)   iE (Ti )   i     4N 
i 2 i 2 i  2  i (i  1)  i 2 i  1 i 1 i

Nº esperado de mutações

n 1 n 1 n 1
1
1
E (S )   4 N    
1
w  S / 
i 1 i i 1 i i 1 i
MEDIDAS SUMÁRIAS DE DIVERSIDADE GENÉTICA

Exemplo numérico

S=6
θ= 6/(1/1 + 1/2 + 1/3 + 1/4 + 1/5)
θ =2,63

n 1
1
w  S / 
i 1 i
VARIAÇÃO NO TAMANHO
POPULACIONAL
Crescimento da população
Topologia das genealogias

N N

t t
• Aleatoridade das genealogias

ng Estável Contracting Crescimento


(maior aleatoridade) (menor aleatoridade)
Distribuição de mutações

wing Contracting
Crescimento populacional
Espectro de frequências

6
5
4
3
2
1
1 2 3
Crescimento populacional
Espectro de frequências

6 6
5 5
4 4
3 3
2 2
1 1
1 2 3 1 2 3
Crescimento populacional
Crescimento populacional
• O D de Tajima

n 1
1
n 1
1 w  S / 
w  S / 
= 2,73
= 2,73
i 1 i
i 1 i
 = θ = 2,25  = θ = 1,875
  2,25  2,73  0,48   1,875  2,73  0,855
D   D  
sd (   ) sd (   ) sd (   ) sd (   ) sd (   ) sd (   )
Crescimento populacional
• O D de Tajima

D~0

D<0
Crescimento populacional
Teste de D

 ,, S Simulações/WF,, , S

6
5
4
D obs
3
2
1
1 2 3
D esp
Crescimento populacional
Número de diferenças entre pares de sequências comparadas (mismatch distributions).
Média=
Crescimento populacional
Diminuição da população
Topologia das genealogias

N N

t t
Diminuição da população

6 6
5 5
4 4
3 3
2 2
1 1
1 2 3
1 2 3

t
Alterações no tamanho
Subdivisão populacional
Subdivisão da população
Subdivisão da população

Fst
Subdivisão populacional

PANMIXIA
SUBESTRUTURAÇÃO
D~0 D >0
Alterações no tamanho e subdivisão

Você também pode gostar