Escolar Documentos
Profissional Documentos
Cultura Documentos
Seleção Genomica Ampla
Seleção Genomica Ampla
Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Citao: Resende, M.D.V.; Silva, F.F.; Lopes, P.S.; Azevedo, C.F. Seleo Genmica Ampla (GWS)
Viosa MG 2012
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Apresentao
A Seleo Genmica veio unir a Gentica de Populaes Gentica
Quantitativa. Estes dois ramos com forte orientao Biomtrica tradicionalmente
caminharam em separado, seja no Melhoramento Gentico de Plantas e Animais ou
na Gentica Humana. Atualmente, a estimao de componentes da variao gentica
e de valores genticos e a predio de fentipos usa trs conjuntos de dados ou
informaes: fenotpicos, genealgicos e genotpicos em locos marcadores
moleculares em desequilbrio de ligao com os genes de interesse. Ferramentas da
Gentica de Populaes participam plenamente dos mtodos de estimao
atualmente empregados. Dessa forma, Gentica de Populaes, Gentica
Quantitativa, Gentica Molecular e Estatstica so demandados simultaneamente na
anlise gentica dos caracteres de interesse. Esse texto aborda a nova Gentica
Quantitativa do terceiro milnio.
Viosa MG 2012.
Os autores.
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Sumrio
1 Fundamentos Estatsticos da Seleo Gentica (7)
1.1 Propriedades dos Estimadores em Inferncia Estatstica (7)
1.2 Evoluo dos Mtodos de Avaliao Gentica (10)
1.3 Modelos Estatsticos Lineares (17)
1.4 Modelos Estatsticos de Seleo (19)
1.5 Mtodos Estatsticos de Estimao (20)
1.6 Derivaes Frequentistas e Bayesianas dos Estimadores de Valores Genticos (22)
1.7 Estimao de Componentes de Varincia (30)
1.8 Estimao Bayesiana de Componentes de Varincia: relao com ML e REML (33)
1.9 Estimao Bayesiana via MCMC (34)
1.10 Mtodos Numricos e Softwares para REML/BLUP e MCMC (41)
1.11 Testes de Hipteses e Parcimnia de Modelos (46)
1.12 Modelos Computacionais BLUP (48)
1.13 Modelos BLUP Univariados Multi-Efeitos (50)
1.14 Modelos BLUP Multivariados (50)
1.15 Modelos BLUP Espaciais e de Competio (Efeitos Associativos) (53)
1.16 Modelos BLUP Longitudinais (Regresso Aleatria e Normas de Reao) (60)
1.17 Casos Especiais: GLMM, GEE, HGLMM, PL, MP, PLS e SALP (67)
1.18 Mtodos Estatsticos para GWS (73)
1.19 Procedimento Estatstico para Comparao de Duas Metodologias (75)
1.20 Procedimento BLUP Melhorado: I-BAYES-BLUP (79)
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
6.26
6.27
6.28
6.29
6.30
6.31
Reduo no Erro da Inferncia sobre os QTL via Uso dos Marcadores (209)
Gentica de Populaes Genmica Ampla (GWPG) (226)
Gentica Quantitativa Genmica Ampla (GWQG) (229)
Software Selegen Genmica para GWS e GWAS (234)
Software GCTA para G-REML em Gentica Humana e Animal (239)
Variao Epigentica e Covarincia entre Parentes (243)
8 Referncias (264)
9 Fotos de Pesquisadores com Participao Relevante na Evoluo dos
Mtodos Estatsticos de Avaliao Gentica (288)
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Valor Gentico
Predito ( g )
Erro de Predio
(%)( g g )
65.929
76.213
55.333
54.678
74.766
92.742
81.241
62.385
83.280
66.279
59.107
63.325
60.807
66.864
78.432
54.042
75.274
86.995
72.250
80.547
71.716
74.242
62.620
60.012
76.409
75.515
76.785
72.929
81.906
67.104
63.747
64.381
68.552
65.872
67.242
56.527
77.499
76.232
78.856
70.806
0.09
0.03
0.13
0.10
0.02
0.19
0.05
0.17
0.02
0.01
0.08
0.02
0.13
0.01
0.14
0.05
0.03
0.12
0.09
0.12
Erro Mdio de Predio 0.08
Correlao ou Acurcia 0.78
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
a)
b)
c)
d)
Figura 1: ilustrao dos conceitos de acurcia, preciso e vcio. (a): alto vicio, baixa preciso, baixa acurcia;
(b): baixo vcio, baixa preciso, baixa acurcia; (c): alto vcio, alta preciso, baixa acurcia; (d): baixo vcio,
alta peciso, alta acurcia.
- Preciso (PEV)
PEV Var ( g g ) (1 rg2g ) g2
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
C 12 X ' X
X 'Z
C 22 Z ' X Z ' Z A 1
11
12
C
C
a C 21
, em que y, b e g so vetores de dados, efeitos fixos e genticos
C 22
C
aditivos, respectivamente, os ltimos com matrizes de incidncia X e Z. Tem-se
tambm Var ( g ) A g2 , em que uma matriz de correlao entre os elementos de g.
O estimador da varincia do erro de predio (PEV) dos efeitos genticos dado por
PEV Var ( g g ) C 22 e2 .
Assim, a acurcia pode ser estimada por: r [1 PEV / g2 ]1 / 2 .
C
C 11
C 21
g g
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Propriedades Componentes
2
Vis baixo + PEV mnima global
Vis 0 + PEV mnima na classe U
2
Vis baixo + PEV mnima global
Complexidade Mnima
Estimabilidade + Ajuste vlido
10
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
11
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
12
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Nmero de tratamentos
Regressor
Nmero de tratamentos
Regressor
1 - 0,33/F*
14
1 - 0,85/F
1 - 0,33/F
15
1 - 0,86/F
1 - 0,50/F
16
1 - 0,87/F
1 - 0,60/F
17
1 - 0,88/F
1 - 0,67/F
18
1 - 0,88/F
1 - 0,71/F
19
1 - 0,89/F
1 - 0,75/F
20
1 - 0,89/F
10
1 - 0,78/F
21
1 - 0,90/F
11
1 - 0,80/F
38
1 0,95/F
12
1 - 0,82/F
135
1 0,99/F
13
1 - 0,83/F
400
1 1/F
- F*: F de Snedecor centrado em zero, sendo que esse regressor deve multiplicar diretamente a mdia fenotpica e no o desvio; F: F de Snedecor centrado na mdia geral
13
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Mtodo
OLS
Fisher (1925)
Fixo y
WLS
Yates (1934)
GLS
Henderson
(1959)
BLP
BLUP (A-BLUP)
James-Stein
MAP (Bayes)
et
al.
b ( X ' X ) 1 X ' y
Estrutura de
Varincias
e ~ N (0, I e2 )
Fixo y Xb e
b ( X ' R 1 X ) 1 X ' R 1 y
e ~ N ( 0, R I ei2 )
Fixo
b ( X ' V 1 X ) 1 X ' V 1 y
Xb e
y Xb Zg e
Aleatrio y Zg e
g [ Z ' R 1 Z ( A g2 ) 1 ]1 Z ' R 1 y
Henderson (1973);
Thompson (1976);
Henderson (1949)
Misto
g [ Z ' R 1 Z ( A g2 ) 1 ] 1
Efron e Morris
(1977); James e
Stein (1962); Stein
(1955)
Gianola e Fernando
(1986); Fernando e
Gianola (1986);
Robertson (1955);
Dempfle (1971);
Bayes (1763)
Lande e Thompson
(1990, OLS);
y Xb Zg e
y Xb Zg e
Aleatrio
y Xb Zg e
y ~ N ( Xb, V )
V Var ( g ) I e2
e ~ N (0, R I e2 )
g ~ N (0, A g2 )
e ~ N (0, R I e2 )
g ~ N (0, A g2 )
Z ' R 1 (Y Xb )
e ~ N ( 0, R I ei2 )
Py g P( g )
P( y )
g [ Z ' R 1 Z ( A g2 ) 1 ] 1
e ~ N (0, R I e2 )
P g y
g ~ N (0, A g2 )
Z ' R 1 (Y Xb )
b ~ N (0, I b2 )
b2
Fixo
e ~ N (0, I e2 )
y u Zg Qi qi e
i 1
g Zg Wi mi
i 1
ou
s
y u Zg Wi mi e
Fernando e
Grossman (1989);
Goddard (1991)
i 1
Misto
y Xb Zg Qi qi e
i
g Zg Wi mi
e ~ N (0, I e2 )
e ~ N (0, I e2 )
g ~ N (0, A g2 )
ou
y Xb Zg Wi mi e
i
Meuwissen et al.
(2001); Whittaker et
al. (2000); Van
Raden (2008);
Nejati-Javaremi et
al. (1997); Resende
et al. (2010);
Resende Jr. et al.
(2012)
Misto
y Xb Qi qi e
g Wm W (W ' R 1W I ) 1W ' R 1 ( y Xb )
em_que
ou
m (W ' R 1W I ) 1W ' R 1 ( y Xb )
g ~ N (0, G g2 )
ou
m (W 'W I ) 1W ' ( y Xb )
G (WW ' ) /[ 2 p i (1 p i )]
Mtodo
Autores
Modelo
Estimador
Modelos Espaciais:
Krigagem e
Autoregressivos
Matheron (1971);
Robinson (1991);
Gilmour et al. (1995)
Misto
g [ Z ' Z ( A ) ]
GWS (RR-BLUP);
GBLUP; Bayes; RRBLUP_B)
y Xb Wi mi e
n
i
ou
y Xb Z Wi mi e
i
g [ R 1 G 1 ( e2 / g2 )] 1 R 1 ( y Xb )
em_que
n
A G (WW ' ) /[ 2 p i (1 p i )]
i
y Xb ZWm e
Observaes em y so Variveis Mistas (Aleatrias + Determinsticas)
ou
y Xb Zg e
2
g
Z ' 1 (Y Xb )
1 1
Estrutura
Varincias
e ~ N (0, )
g ~ N (0, A g2 )
e2 [ ( c ) ( r )]
c
de
14
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
1 1 2 3
1
1 1 2
c (c ) 2 1 1 1
3
2
1
1
Modelos de Regresso
Aleatria Multivariada:
Polinmios de Legendre,
Splines cbicas e B
Modelos de Competio:
Efeitos Associativos ou
Indiretos
Schaeffer e Dekkers
(1994); White et al.
(1999); Meyer (2005)
Misto
g [ Z ' 1 Z ( A K g ) 1 ] 1
y Xb Zg e
e ~ N (0, )
g ~ N (0, A K g )
Z ' 1 (Y Xb)
e2 [ ( c ) ( r )]
c
Misto
g [ Z ' 1 Z G * 1 ] 1
Z ' 1 (Y Xb )
y Xb Zg e
y Xb Z NZ e
y Xb Z NZ
2 [ (c ) (r )] I2
c
g
G*
g
A: matriz de correlao gentica aditiva construda via pedigree; G: matriz de correlao gentica aditiva construda via marcadores. Notao: Vetores y, b, g, m, q: referentes aos
dados fenotpicos, efeitos fixos, genticos aditivos polignicos aleatrios, genticos aditivos aleatrios de marcadores, genticos aditivos aleatrios de QTL, respectivamente,
2 e
com varincias 0, 2 ,
2 . Matrizes X, Z, W, Q: incidncia para b, g, m, q, respectivamente.
Efeitos
Polignico Infinitesimal
Pequenos - Infinitos
Mtodo de
Seleo
BLUP
Autores
LE - MAS
Fernando e Grossman
(1989)
LE - MAS
LD - MAS e
GWS
Fisher (1918)
que Qi uma matriz de incidncia que relaciona os indivduos com os alelos do loco
i, e qi e mi contm os efeitos allicos para cada loco gnico e marcador,
respectivamente. As matrizes de incidncia Q no so conhecidas e nem as suas
dimenses, dadas pelo nmero de alelos em cada loco. Tambm no conhecido o
nmero de locos que afeta o carter. Isto contrasta com o primeiro modelo, em que as
matrizes de incidncia para b e g (X e Z, respectivamente) so conhecidas. Se Q fosse
conhecida as equaes de modelo misto poderiam ser usadas sem qualquer alterao.
Um outro modelo melhor seria y Xb Qi qi e ou y Xb Z Wi mi e (Modelo
i
15
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
16
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
17
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Efeitos fixos
Pop (p)
1
1
1
1
1
Touro (t)
Indivduo (g)
Peso
Modelo Ajustado
1
2
2
3
3
11
12
13
14
15
200.10
160.50
302.45
112.67
145.89
y 1u Tt e
t ~ N ( 0, I t2 )
Ajuste para
Touro
Aleatrio em t
Aleatrio em t
Aleatrio em t
Aleatrio em t
Aleatrio em t
(B) - Modelo de reprodutor: ajustes concorrentes: efeitos fixos dominam efeitos aleatrios com matriz de correlao I:
Efeitos fixos
Pop (p)
1
2
2
2
2
0 1 I 1
Touro (t)
Indivduo (g)
Peso
Modelo Ajustado
1
2
2
3
3
11
12
13
14
15
200.10
160.50
302.45
112.67
145.89
y Xp Tt e
Fixo em p e zero em t
Aleatrio em t
Aleatrio em t
Aleatrio em t
Aleatrio em t
t ~ N ( 0, I )
2
t
(C) - Modelo individual ou animal: ajustes concorrentes: efeitos fixos dominam efeitos aleatrios com matriz de correlao A:
0 1 A 1 . O indivduo 11 ter seu efeito gentico predito em g mas o valor refere-se somente parte dentro de famlia.
Efeitos fixos
Pop (p)
1
2
2
2
2
Touro (t)
Indivduo (g)
Peso
Modelo Ajustado
1
2
2
3
3
11
12
13
14
15
200.10
160.50
302.45
112.67
145.89
y Xp Zg e
Fixo em p e zero em g
Aleatrio em g
Aleatrio em g
Aleatrio em g
Aleatrio em g
g ~ N ( 0, A g2 )
(D) - Modelo individual ou animal: ajustes concorrentes: efeitos aleatrios com matriz de correlao A dominam efeitos
aleatrios com matriz de correlao I:
Efeitos fixos
Pop (p)
1
1
1
1
1
Touro (t)
1
2
2
3
3
y 1u Tt Zg e
200.10
160.50
302.45
112.67
145.89
g ~ N ( 0, A g2 )
t ~ N ( 0, I t2 )
Ajuste para
Touro
Aleatrio em g
Aleatrio em g
Aleatrio em g
Aleatrio em g
Aleatrio em g
(E) - Modelo individual ou animal: ajustes concorrentes: efeitos fixos dominam efeitos aleatrios com matrizes de correlao A e
I simultaneamente: 0 1 A 1 e I 1
Efeitos fixos
Pop (p)
1
2
2
2
2
Touro (t)
Indivduo (g)
Peso
1
2
2
3
3
11
12
13
14
15
200.10
160.50
302.45
112.67
145.89
Modelo Ajustado
y Xp Tt Zg e
g ~ N ( 0, A g2 )
t ~ N ( 0, I t2 )
(F) - Modelo de famlias de irmos completos: ajustes no concorrentes: o vetor f estima os efeitos de famlia contemplando
Famla (f)
Indivduo (g)
Peso
Modelo Ajustado
1
2
2
3
3
11
12
13
14
15
200.10
160.50
302.45
112.67
145.89
y 1u Ff e
f ~ N ( 0, I 2f )
Ajuste para
Famlia
Aleatrio em f
Aleatrio em f
Aleatrio em f
Aleatrio em f
Aleatrio em f
(G) - Modelo individual ou animal com famlias de irmos completos: ajustes concorrentes: efeitos aleatrios com matriz de
correlao A dominam efeitos aleatrios com matriz de correlao I:
Efeitos fixos
Pop (p)
1
1
1
1
1
Famla (f)
Indivduo (g)
Peso
Modelo Ajustado
1
2
2
3
3
11
12
13
14
15
200.10
160.50
302.45
112.67
145.89
y 1u Ff Zg e
g ~ N ( 0, A g2 )
f ~ N ( 0, I 2f )
Ajuste para
CEC de Famlia
Aleatrio em f
Aleatrio em f
Aleatrio em f
Aleatrio em f
Aleatrio em f
18
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
X 'Z
;
1
2
2
Z' X
Z ' Z I ( e / g )
X ' X A 1 ( e2 / g2 )
X'Z
,
1
2
2
Z' X
Z ' Z I ( e / g )
X ' X 0 1 ( e2 / b2 )
X'Z
e
1
2
2
Z' X
Z ' Z A ( e / g )
pela correlao ra XY
(ii)
(iii)
19
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
(v)
Modelo Estatstico
Linear e de Seleo
Modelo I (Fixo)
Mtodo de Estimao de
Componentes de Mdias
Quadrados Mnimos (LS)
Modelo II (Aleatrio)
BLP ou BLUP
BLUP
Modelo IV
James-Stein
Modelo V
Bayes (MAP)
Mtodo de Estimao de
Componentes de Varincia
Quadrados Mnimos: Anlise
de Varincia (ANOVA)
Mxima Verossimilhana (ML)
ou ML Residual (REML):
Anlise
de
Deviance
(ANADEV)
REML: Anlise de Deviance
(ANADEV)
Quadrados Mnimos: (OLS);
Mxima Verossimilhana (ML)
Moda a Posteriori (MAP) via
MCMC
Teste da Significncia
dos Efeitos
Teste F de Snedecor;
Teste de Wald
Teste LRT via Qui Quadrado
Teste LRT via QuiQuadrado
Intervalo de Confiana
Intervalo Bayesiano de
Credibilidade
20
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Deviance
+
LRT(Qui-quadradod)
Comp.Var.
Coef. Determ.
6.5546**
0.032924*
h2g = 0.0456*
Gentipos
647.1794
Parcela
654.1289+
13.5041**
0.068492**
c2parc = 0.0948**
Resduo
0.6206
c2res=0.8595
Modelo Completo
640.6248
c2total=1.0000
Bloco
F = 7.0172**
21
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
1
2
(1 / 2 ) N
1/ 2
exp ( y Xb )'V 1 ( y Xb )
2
22
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
1
2
(1 / 2 ) N
1/ 2
1
1/ 2
2 (1 / 2 ) q G
exp ( y Xb Zg )' R 1 ( y Xb Zg )
2
exp ( g ' G 1 g )
2
P[ A B ]
P[B]
se P[B] 0,
PA P A B j PB j PA ,
n
j 1
P A , B
P A
P A B k P B k
P A
n
j 1
Bj P Bj
Pr obabilidad e Conjunta
.
Pr obabilidad e Total
23
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
P (a Y b) f ( y) dy
(i)
(ii)
f ( y) dy 1
1
1
exp
( y u )2 , y , e 0
2 1/ 2
2
( 2 )
2
(ii)
E [ g (Y )]
g (Y )
24
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
(ii)
Y2 Var (Y )
(Y
) 2 f Y ( y ) dy
se Y contnua.
y1 y 2
/ m arg inal y 2 )( y 2 2 )
Estimao Bayesiana
A estimao Bayesiana difere da estimao por mxima verossimilhana (ML)
devido ao fato de se maximizar a distribuio a posteriori do parmetro em vez da
funo de verossimilhana. Essa distribuio dita condicional do parmetro dadas
as observaes (y) e proporcional ao produto da funo de verossimilhana pela
distribuio a priori do parmetro. De maneira similar ML, possvel tambm
maximizar a funo densidade a posteriori em relao aos parmetros. Se a
informao a priori encontra-se disponvel a estimao Bayesiana deve ser prefervel
ML.
O princpio bayesiano atribudo postumamente (1763) a Thomas Bayes, que
nunca publicou em vida um trabalho matemtico. No entanto, a base desse princpio
foi publicada antes por Saunderson (1683-1739), um cego professor de tica, que
publicou vrios artigos matemticos.
Ao invs de maximizar a distribuio a posteriori, uma alternativa definir uma
funo de perda, como por exemplo as funes de perda linear e quadrtica, as quais
contemplam respectivamente as diferenas simples e quadrticas entre os valores
estimados e os parmtricos. Minimizar a funo de perda linear equivale a
maximizar a densidade a posteriori (obtendo a moda) e minimizar a funo de perda
quadrtica equivale a maximizar a mdia da distribuio a posteriori. Se a distribuio
a priori no informativa (vaga) e/ou a quantidade de dados muito grande (a
25
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
f ( y , )
f ( y)
f ( y ) f
f ( y ) f
(1)
: vetor de parmetros
f(): funo densidade de probabilidade da distribuio a priori, que tambm a
densidade marginal de . Esta funo denota o grau de conhecimento acumulado
sobre , antes da observao de y.
y : vetor de dados ou de informaes obtidas por amostragem.
f(y): funo densidade de probabilidade da distribuio condicional de uma
observao (y) dado (denominada funo de verossimilhana ou
modelo para os dados).
26
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
f y R f ( y, ) d R f ( y ) f d E f ( y )
distribuio
marginal
ou
i f ( y ) f ( ) d
R
f ( y )
f ( ) d
27
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
1
Z' R X
X ' R 1 Z
1
1 2
Z' R Z A g
E ( b y ) X ' R 1 y S 1 r1 ,
1
1 2
E ( g y ) Z ' R y ( A g ) 0
1
Z' R X
1
1 2
Z'R Z A g
X ' R 1 Z
b X ' R 1 y
1
g Z ' R y
Essa equao pode ser derivada tambm pela maximizao de f (y, ) para
variaes em (em que = b;g), sendo o estimador, neste caso, denominado mximo
a posteriori (MAP). Sendo P(gy) = probabilidade de g dado y, o mximo a posteriori
(MAP) de g dado pela maximizao de P(gy). Quando g e y seguem uma
distribuio normal multivariada, o MAP de g equivalente ao BLUP de g. A prova
disso apresentada a seguir.
28
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
1
( 2 ) n / 2 V
n/2
1
( y )'V 1 ( y )
2
em que n =
P y g P( g )
P( y )
X ' R 1 ( y X Z g ) 0
X ' R 1 X X ' R 1 Z g X ' R 1 y
B
Z ' R 1 ( y X Z g ) G 1 g 0
Z ' R 1 X ( Z ' R 1 Z G 1 ) g Z ' R 1 y
g
29
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Bayes, pode ser realizada atravs dos mtodos (Gamerman, 1996): (i) analtico
para aproximao de integral; (ii) automticos ou de quadratura; (iii) simulao
estocstica para obteno de distribuies a posteriori, a qual descrita em tpico
seguinte.
1.7 Estimao de Componentes de Varincia
BAYES- MCMC
G-REML
ou
REML/G-BLUP
Patterson e Thompson
(1971); Thompson
(1969; 1973)
Geman
e
Geman
(1984); Gelfand e Smith
(1990)
e ~ N (0, R I e2 )
g ~ N (0, A g2 )
Aleatrio, distribuio a
posteriori
e ~ N ( 0, I e2 )
e2 ~ 2 ( e , S e2 )
a ~ N ( 0, A )
a2 ~ 2 ( a , S a2 )
Uniforme se
i 2; Si2 0
-
2
a
e ~ N (0, R I e2 )
g ~ N (0, G g2 )
30
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
31
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
32
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
f ( 2 , 3 y ) f ( y 2 , 3 )
e ento
33
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
34
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
35
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Distribuies a priori
Considerando o modelo quantitativo infinitesimal, tem-se que a distribuio de
g tambm normal multivariada: g A, g2 ~ N (O, A g2 ) , onde A a matriz de
parentesco gentico aditivo e g2 a varincia gentica aditiva na populao base.
Os parmetros de interesse para inferncias so: b, g , g2 e e2 . Para conduzir a
anlise Bayesiana torna-se necessrio especificar as distribuies a priori para
b, g2 e e2 (a distribuio de g j foi especificada).
Como priori para b pode-se assumir p(b) constante, que especifica
aproximadamente a noo de conhecimento a priori vago para b. Esta distribuio a
priori imprpria, mas pode-se tornar prpria, desde que se especifique os limites
superior e inferior para p(b).
As distribuies a priori dos componentes de varincia ( e2 e g2 ) poderiam ser
uniforme da forma p (i2 ) constante, 0 i2 i2 max (i e, g ) , onde, de acordo com
o conhecimento acumulado sobre o carter, i2 max
p ( b ) p ( g g2 ) p ( g2 ) p ( e2 ) p ( y b, g , g2 , e2 ) , em que se omitiu
36
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
g2
n e
1
2
q a
1
2
( y Xb Zg )' ( y Xb Zg ) e S e2
exp
2 e2
( g ' A 1 g g S g2
exp
2 g2
de modelo misto.
Como exemplo, a derivao da distribuio condicional a posteriori para bi ( o
i-simo elemento do vetor b) conduz a
bi b i , g , g2 , e2 , y ~ N ( bi , ( X ' X i ) 1 e2 ),
em que : bi ( X ' X i ) 1 X ' i ( y X i b i Zg )
(1)
e
37
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
e2 b, g , g2 , y ~ SS e(1) n22
componente de varincia a priori S02 . Dessa expresso tem-se que SS S02 0 e que
S 2
2 0 0 , que a distribuio (qui-quadrado invertida escalada) ou densidade a priori
2
2
e
2.
~
b , g , , y ~ ~e S e2 ~e2
2
g
2
g
~
b , g , e2 , y ~ ~ g S g2 ~2g .
0 2
2( S02 0 ) 2
.
( 0 2) 2 ( 0 4)
Algoritmo GS
Em termos mais simples, o algoritmo GS pode ser apresentado de forma
resumida:
1. Fornecer os valores iniciais dos parmetros de locao e disperso do
modelo. Estes valores iniciais podem ser calculados atravs de
procedimentos padres tais como a estimao de componentes de varincia
por REML ou quadrados mnimos. Considerando a mdia geral y como
nico efeito fixo, pode-se calcular y como a mdia aritmtica das
observaes e g i h 2 yi y . Devem ser fornecidos os valores iniciais para
yi , g i , e2 , g2 e e2 / g2 .
2. Gerar valores para os efeitos fixos. Sendo o nico efeito fixo, a mdia geral,
tem-se: y y rnd e /(n)1 / 2
3. Gerar valores para os efeitos aleatrios: g g i rnd [(1 rg2g ) g2 ]1/ 2 , onde rgg
a acurcia dada por rg2g (1 PEVi / g2 )1 / 2 , onde PEVi o isimo elemento da
inversa da matriz dos coeficientes das EMM multiplicado por 2e .
4. Calcular a soma de quadrados do resduo (SSE) e a varincia residual 2e .
Considerando que a distribuio a priori para a varincia residual a inversa de
uma qui-quadrado, tem-se:
SSE ( yi y g i ) 2
e2
SSE
X n2
38
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
g ' A 1 g
X q2
e2
g2
39
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
40
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
41
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
42
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Re I .
43
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
(5 X 2k 1 X 3k 1 )
;
4
X 2k
(0 2 X1k X 3k 1 )
;
5
X 3k
(6,5 3X1k X 2k )
,
6
(5 0 0) 5
;
4
4
X 21
Na 2a iterao, tem-se:
X12
(0 2 5 / 4 0) 1
;
5
2
X 31
(6,5 3 5 / 4 1 / 2)
1,7967.
6
(5 1/ 2 1,7967)
(0 2 1,58 (1,7967))
(6,5 3 1,58 0,992)
0,992; X 32
2,03
1,58; X 22
4
5
6
X k X k 1
, em que
105 ).
44
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Autores
Newton
Ordem da Derivao
Derivadas parciais de primeira e segunda ordens
Fisher
Dempster et al.
(1977)
Graser et al. (1987)
Gilmour, Cullis e
Thompson (1995)
No derivativo
Derivadas parciais de primeira e segunda ordens
Gelfand e Smith
(1990)
Jaffrezic et al.
(2007)
Autores
Mtodo Numrico
para REML
Informao Mdia (AI)
Inverso
Esparsa
AS
Procedimentos
REML e BLUP
ASREML e GENSTAT
Gilmour, Cullis e
Thompson (1995)
DFREML/WOMBAT
Meyer (1991)
Esperana
Maximizao (EM) e AI
REML e BLUP
REMLF90 e BLUPF90
Misztal (1995)
EM Acelerado
Takahashi
REML e BLUP
Blup Genmico
SELEGEN-REML/BLUP
Resende (1994)
EM Acelerado
Zollenkopf
REML e BLUP
SAS
REML e BLUP
SELEGEN GENMICA
Resende (2007)
Zollenkopf
Blup Genmico
QxPack
Perez-Enciso e
Misztal (2004)
Anlise de QTL
REML e BLUP
Blup Genmico
ASREML
Blup Genmico
GS3
Blup Genmico
IBLASSO
Bayes Cpi
MCMC
Meuwissen (2009)
Blup Genmico
BayesA
BayesB
BLR
Blasso
rr-BLUP
Endelman (2011)
REML e BLUP
Blup Genmico
45
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Efeitos
Fixos
Distribuio
Assinttica
t
Fixos e Aleatrios
F =[ Var(trat) + Var(Residual)]
/ Var(Residual)
LRT
Aleatrios
Quiquadrado
t =F
Fixos
F = [Var(trat) + Var(Residual)]
/ Var(Residual)
WALD n pequeno = F
Fixos
W = / Var()
Aleatrios
W = / Var()
AIC
Aleatrios
Quiquadrado
-
BIC
Aleatrios
AICc
Aleatrios
Calculo
t (Yi Y j ) /( / n 1 / 2 )
AIC = -2 log L + 2 p
BIC = -2 log L + p log v
v = N r(x)
AIC = -2 log L + 2 p + [2p(p+1)/(n-p-1)]
46
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
47
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
para os genitores.
g d / h d2 : valor gentico desregressado e corrigido para os genitores, em que
2
hd2 (1 / 2 h 2 ) /(1 / 2 h 2 (1 h 2 )) a herdabilidade da segregao mendeliana e h a
herdabilidade individual.
48
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
No modelo (1), o interesse reside apenas sobre os efeitos fixos (b) e todos os
efeitos aleatrios (gentico aditivo, gentico de dominncia, episttico e ambientais)
so agrupados no resduo aleatrio e1. O modelo (3) o prprio modelo de valores
genticos aditivos individuais (g) e, o resduo e2 contempla os efeitos aleatrios de
dominncia allica, epistasia e ambientais. No modelo (2), o valor gentico aditivo
individual (a) dividido em 3 partes: (i) metade do valor gentico aditivo da me =
gm/2; (ii) metade do valor gentico aditivo do pai = gp/2; (iii) segregao mendeliana
ou desvio gentico em relao mdia dos valores genticos aditivos dos genitores =
gd. O modelo (4) expresso em termos da metade do valor gentico aditivo dos
genitores femininos ou do efeito de famlias f, sendo que e4 compreende o somatrio
de gp/2, gd e e2 . Nestes modelos, X, Z e Zm so matrizes de incidncia para b, a e gm/2,
respectivamente.
O modelo de interesse prtico ao melhoramento refere-se ao (3) ou modelo
individual (MI). Entretanto, tal modelo o mais complexo computacionalmente,
com nmero de equaes para g igual ao nmero de descendentes mais o nmero de
genitores em avaliao. O modelo individual reduzido - MIR- produz resultados
idnticos ao MI, porm com um menor esforo computacional, podendo-se trabalhar
com um nmero de equaes igual ao nmero de genitores, obtendo-se as predies
para gp e gm e, posteriormente, as predies para gd e, conseqentemente, para g. Um
resumo dos modelos computacionais BLUP apresentado na Tabela 12.
Tabela 12. Modelos Computacionais BLUP.
Nome
Modelo Individual (Animal)
Modelo de Genitor (Reprodutor)
Modelo Individual (Animal) Reduzido
Modelo Individual (Animal) com Grupos Genticos (r)
Modelo
y = Xb + Zg + e2
y = Xb + Zm(gm/2) + e4
y = Xb + Z(gp/2 + gm/2 + gd) + e2
y = Xb + Pr + Zg + e2
49
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Objetivo
Anlise Simultnea de Variveis, posto completo.
50
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
, em que = VD
51
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
52
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
O BLUP sob modelos espaciais e de competio (SCM) pode ser ajustado usando
diferentes parametrizaes. Um resumo desses modelos apresentado na Tabela 15.
Tabela 15. Modelos espaciais e de competio para o BLUP.
Nome
Modelo Geoestatstico (Exponencial)
Modelo
y Xb Zg e
e ~ N ( 0, )
Estrutura de Varincias
e2 [ ( c ) ( r )]
c
g ~ N (0, A g2 )
Modelos Autoregressivos
Modelos Ante-Dependncia
Modelos ARIMA
Modelos Associativos de Competio
Idem acima
Ver texto
Ver texto
y Xb Z NZ
y Xb Z NZ e
1 1 2 3
1
1 1 2
c (c ) 2 1 1 1
3
2
1
1
Idem acima
Ver texto
Ver texto
g
G*
g
g
G*
g
g
2 [ (c ) (r )] I2
g
c
r
g
g
Modelos Espaciais
As variveis com comportamento espacial so denominadas variveis
regionalizadas e mostram caractersticas intermedirias entre as variveis
verdadeiramente casuais ou aleatrias e aquelas completamente determinsticas,
exatas ou matemticas. A estatstica clssica trata de variveis aleatrias ao passo que
a estatstica espacial aborda estas variveis mistas.
Tais variveis regionalizadas apresentam uma aparente continuidade no espao. A
continuidade geogrfica se manifesta pela tendncia de a varivel apresentar valores
muito prximos (dependentes) em dois pontos vizinhos e muito diferentes em
pontos distantes. Assim, no so realizaes de uma varivel aleatria, pois so
correlacionadas. Grficos contemplando a variabilidade espacial dos experimentos,
denominados variogramas, ilustram o padro de dependncia espacial.
Algumas estatsticas permitem sumarizar as informaes contidas nos diagramas
e descrever a continuidade espacial. Estas estatsticas so: (i) o coeficiente de
correlao entre valores separados por uma dada distncia, ou seja, o coeficiente de
autocorrelao, tambm denominado autocorrelao serial ou autocorrelao espacial;
(ii) a covarincia entre valores separados por uma distncia (autocovarincia); (iii)
momento de inrcia ou semivarincia. Variogramas, correlogramas e covariograma
para a descrio da continuidade espacial podem ser obtidos a partir da
semivarincia, autocorrelao e autocovarincia, respectivamente, associados a
diferentes distncias em uma determinada direo.
A variabilidade espacial pode ser estudada basicamente por meio de duas classes
de mtodos: os mtodos de anlise de sries temporais e os mtodos geoestatsticos.
Por meio dos mtodos de anlise de sries temporais, tem sido usado de um modelo
auto-regressivo de primeira ordem (AR1) para modelar os resduos em uma
dimenso do espao e o uso do mtodo REML para estimar os parmetros do modelo.
Em um modelo AR1, a autocorrelao [(Yi , Yj)] entre as observaes Yi e Yj uma
funo potncia da distncia entre as observaes, de forma que (Yi , Yj) = i-j,
em que i e j referem-se s coordenadas espaciais e o coeficiente de autocorrelao.
53
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
[ik ]
[ j ]
para observaes com coordenadas i, j e k, referentes a
Yi , j , Y k , lin
col
linhas e colunas, respectivamente (Cullis e Gleeson, 1991; Cullis et al., 1998).
Estes ltimos modelos consideram os erros por meio de um processo autoregressivo integrado de mdias mveis (ARIMA (p, q, d)) que pode ser aplicado a
duas dimenses: linhas e colunas. Tal modelo estendido da forma ARIMA (p1, d1,
q1) x ARIMA (p2, d2, q2). Estes modelos so denominados modelos com erros nas
variveis e consideram um efeito de tendncia () mais um erro independente ou
efeito pepita. Assim, o vetor de erros particionado em e = + . Os modelos de
anlise tradicionais no incluem o componente .
O modelo da forma y Xb Zg , em que o vetor aleatrio de
erros correlacionados e o vetor aleatrio de erros no correlacionados. A
varincia dos resduos dada por Var(e) = Var ( + )= , em que
2 [(c ) (r )] I2 , sendo 2 a varincia devida a tendncia e 2 a
c
(
c
) e
so da forma:
1 1 2 3
1
1
2
1
(
)
c c 2 1 1 1
3 2 1 1 .
54
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
W ' X
I' X
X'Z
Z ' Z A11
2
1 2 ;
g
W' Z*
I' Z*
X 'W
Z 'W
W 'W I2
I 'W
2
2 2
c
X'I
Z' I
W' I
1
I ' I H 3
b X ' y
~
g Z ' y , em que:
c~ W ' y
~
I ' y
2
3 2 .
55
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
2
A WW ' /[ 2 pi (1 pi )] , pois g [2
i
p (1 p )]
2
m
(Falconer, 1989).
G A WW ' /[ 2 pi (1 pi )]
apresentada a seguir:
Cdigos na matriz W
Cdigos
Cdigos Centrados
Cdigos Centrados
com pi = 0.5
Numerador do coeficiente de
parentesco de Wright entre Irmos
Completos
0
1
2
0 2pi
1 2pi
2 2pi
-1
0
1
0.0
0.5
1.0
Clculo da matriz G = A
Matriz W
Individuo
Matriz WW
Marca 1
Marca 2
Marca 3
Marca 4
-1
-1
0
0
0
0
1
1
Matriz G
n
2 pi (1 pi ) 2
i
Individuo 1
Individuo 2
2
2
2
2
1
1
1
1
56
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Se
for
parametrizado
como
tem-se
m ~ (0, D ) ,
G WDW ' / g2 WDW ' /{[2 pi (1 pi )] m2 } . Em ambos os casos, a matriz G substitui a
n
i
(wij 2p i )
[2p i ( 1 pi )]1 / 2
2
mc
a varincia correlacionada
de marcadores e mc uma matriz de correlao autoregressiva de primeira ordem
com parmetro de autocorrelao . Para o caso de 4 marcas, mc dada por
1 1 2 3
1
1 1 2
mc 2 1
1 1
3 2 1 1
.
57
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
mch Sim.
m2 2
m 2 m 3 1 .
m2 3
2 mc
3 mc
mnc
) 1 mc
1 2
2
2
1 2
2 2
mc ( mc mnc ) mc mc
2 2 1 2
2
2
2
mc mc ( mc
mnc
) 1 mc
2
2
2
2
2
3 mc
2 mc
1 mc
mnc
( mc
)
.
Outra estrutura de correlao que pode ser usada associada a modelos antedependncia estruturados (SAD), em que a estrutura da matriz de covarincia :
m2 m1 m 2 1 m1 m 3 1 2
m2
m 2 m 3 2
mSAD Sim.
m2
Modelos SAD nos mtodos BayesA e BayesB foram aplicados por Yang e
Tempelman (2012). Maiores detalhes sobre modelos espaciais na anlise genmica
so apresentados no tpico 6.26.
Modelos de Competio (Associativos ou de Interao Social)
Em um modelo de interferncia ou de interao social, a parcela ou individuo
i tem um efeito direto i nele e um efeito indireto i no individuo vizinho. A
competio genotpica pode ser considerada sob a tica desse modelo. Esse modelo
da forma: y Xb Zg e Xb Z NZ e , em que:
Zg Z NZ .
58
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
g
, em que
g
59
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Objetivo
Modelagem de medidas repetidas no tempo
Modelos
Ver texto
Ver texto
Ver texto
Ver texto
Ver texto
G = (WW' ) / k = (WW' ) / [ 2 pi ( 1 pi ) ] .
i
60
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
em que:
varivel observada no jsima idade do isimo indivduo;
Fij conjunto de efeitos fixos;
: msimo coeficiente de regresso de efeito fixo da curva mdia da varivel na
populao;
e
: msimos coeficientes de regresso aleatria referentes aos efeitos gentico
aditivo e de ambiente permanente, respectivamente, para o isimo indivduo;
e
: ordens das funes de covarincias utilizadas para descrever,
respectivamente, os efeitos gentico aditivo e de ambiente permanente;
: idade j do indivduo i;
: polinmios de Legendre avaliados para , referentes a regresso de efeito
fixo e aos efeitos aleatrios gentico e de ambiente permanente, considerando as
ordens das funes de covarincias e , respectivamente;
: efeito aleatrio residual.
O modelo matricial equivalente y Xb g g p p e caracterizado a
seguir:
, em que g e p so os vetores dos coeficientes de regresso
aleatria referentes aos efeitos gentico aditivo e de ambiente permanente,
respectivamente.
para o indivduo j contm os elementos
ou polinmios de
A matriz
Legendre avaliados para
(idade padronizada i para o individuo j) e dada por
= M. A matriz apresenta dimenso kg x kg , em que kg refere-se ordem da
funo de covarincia utilizada. A matriz M (de dimenso t x kg, em que t o
nmero de idades avaliadas no indivduo j) contm os valores de idade padronizados.
Os polinmios de Legendre so denotados por Pn x . Definindo P0 x 1 , o
polinmio n+1 descrito pela frmula de recorrncia:
.
Assim,
,
P3 x
P4 x
5 3
x
3 5 x3 3 x
2
2
2
1
35 x 4 30 x 2 3 e assim sucessivamente.
8
61
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
de polinmios ortogonais:
2n 1
so dados por n x
Pn x . Considerando kg = 6 a ordem da funo de
2
covarincia utilizada, a matriz (de dimenso kg x kg ) dos coeficientes dos
polinmios de Legendre definida da seguinte forma:
0
0,7955 0
0,7906
0,7071 0
0
1,2247 0
4,3973
2,8062 0
0
2,3717
0
7,9550 0
0
0
4,6771 0
20,5206
0
0
0
0
0
9,2808 0
0
0
0
0
18,4685
0
A matriz M, considerando a avaliao de 6 idades no indivduo j dada por
1
1
M
1
1
1
a12
a13
a14
a 2 a 22
a 23
a 24
a3
a 32
a33
a34
a4
a 42
a 43
a 44
a5
a52
a53
a54
a6
a 62
a63
a64
a1
a15
a 25
a 35
a 45 .
a55
a 65
62
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Para o caso das idades 60, 150, 300, 420, 500 e 620 dias, o vetor a das idades
padronizadas dado por a=
[-1.0000
-0.6786
-0.1429
0.2857
0.5714
1.0000].
-1
-1
-1
-0.6786
0.4605
-0.3125
0.2120
-0.1439
-0.1429
0.0204
-0.0029
0.0004
-0.0001
0.2857
0.0816
0.0233
0.0067
0.0019
0.5714
0.3265
0.1866
0.1066
0.0609
Finalmente a matriz
= M.
=
0.7071 -1.2247 1.5811 -1.8709 2.1213 -2.3452
0.7071 -0.8311 0.3016 0.4427 -0.9002 0.7711
0.7071 -0.1750 -0.7422 0.3874 0.6369 -0.5707
0.7071 0.3499 -0.5971 -0.6928 0.2086 0.8133
0.7071 0.6998 -0.0162 -0.7307 -0.8125 -0.1918
0.7071 1.2247 1.5811 1.8709 2.1213 2.3452
g A g0 e
R I R 0 , sendo
g0 g K g g ' ,
1
1
1
1
g ' R X g R g A K g
' R1 X
p ' R1g
p
1
1
1
pR p I K p
X ' R1 p
g R1 p
1
b X ' R y
g g R1 y
p ' R y
63
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
0 Var ( 0 )
K g Var
1 Cov ( 0 , 1 )
Cov ( 0 , 1 ) g 0 0
Var ( 1 ) g 0 1
g 0 1
,
g 1 1
em
que
para
y t Xb ( g g ) t ( p p ) t e t
y t Xb ( g g ) t ( p p ) t e t
Para o caso de um ajuste linear, o efeito aleatrio do valor gentico no tempo t dado
0 .
por: g t 0 1 t . Matricialmente, tem-se: g 0 1
t
t
gt
0
0 1 t ;
2
3
0 1 t 2 t2
Com k = 3, 0 1 t 2 t 2 e
1
.
i t
t 2
g ( ij )
0 1
1 1
: varincia fenotpica na idade i.
i' K g j g 0 0 ( t i t j ) g 01 ti t j g 11 : covarincia gentica entre as idades i
2
y (i)
e j.
rg ( ij )
2
g (i)
2
e
g ( ij )
: a correlao gentica entre as idades i e j.
g ( i ) g ( j )
Para o caso de um ajuste linear, um modelo sem efeito de ambiente permanente pode
ser escrito como (Resende e Rosa-Perez, 1999; Resende et al, 2001):
y = Xb + Z0 0 +Z1 1 + e, em que:
Z0 :
matriz de incidncia para 0 , contendo 0 e 1s.
Z1 :
matriz associando 1 a y, contendo zero e valores de idade.
As equaes de modelo misto podem ser formuladas:
64
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
X X
Z ' X
0
Z1X
X Z 0
Z 0 Z 0 A100
Z1Z 0 A101
K g1 e2 00
01
X Z1
1
Z 0 Z1 A 01
Z1Z1 A111
b X y
0 Z 0 y , em que:
1 Z1 y
01
g
, sendo K g
11
g
0
g 0 1
.
g 1 1
X Z 0
X Z1
Z 0 Z 0 A100
Z1Z 0 A101
N r1 e2 00
01
1
Z 0 Z1 A 01
Z1Z1 A111
b X y
Z 0 y , em que:
Z1 y
01
2
, sendo N r Var
11
65
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
g2 |
g2 |
, pois g2 | Var ( ) 2 2 2 2 , .
g2 | e2 2 2 2 2 , e2
2
o coeficiente de herdabilidade e e2 a
2
e
2
varincia residual.
A correlao entre intercepto e inclinao das normas de reao so dadas
por: r , , . Essa correlao, quando tende a 1, indica que os indivduos de
2 2
rg | i , g | k
g| i , g| k
2
g | i
2
g | k
em
que
g| i , g| k
2 2 i k , ( i k )
g2 | i Var ( i ) 2 2 2i 2 , i .
Os modelos de normas de reao podem ser ajustados via modelos de regresso
aleatria por REML ou por via Bayesiana usando MCMC. Inclusive, modelos de
regresso quadrtica, cbica e de maiores graus podem tambm ser avaliados. E pela
abordagem Bayesiana, comparaes entre modelos podem ser realizadas via AIC ou
BIC usando uma deviance a posteriori. O mtodo BIC usa o nmero efetivo de
parmetros, o qual menor do que o numero bruto, devido ao parentesco.
66
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Dimenso do
Modelo
Funo Associada
Varivel
Aleatria Discreta
Classificao do
Modelo quanto
aos Efeitos
Mtodo de
Estimao
Algoritmo
Numrico
Modelos Lineares
Generalizados (GLM)
Univariada
Verossimilhana
Fixo
Mxima
Verossimilhana
(ML)
Quadrados
Mnimos
Ponderados
Iterativos
(IWLS)
Modelos Lineares
Generalizados (GLM)
Multivariada
QuaseVerossimilhana
Fixo
Equaes de
Estimao
Generalizada (GEE)
Quadrados
Mnimos
Ponderados
Iterativos
(IWLS)
Modelos Lineares
Generalizados Mistos
(GLMM)
Univariada
Verossimilhana
Residual
Misto
Mxima
Verossimilhana
Residual (REML)
Vrios
Modelos Lineares
Generalizados Mistos
(GLMM)
Multivariada
QuaseVerossimilhana
Misto
Pseudo Mxima
Verossimilhana ou
REML Condicional
Vrios
67
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
linear devido relao no linear que existe entre a escala latente e a probabilidade de
um indivduo pertencer a uma determinada categoria da varivel discreta.
Para dados binomiais, 0 1, funes de ligao tal qual a logito so utilizadas
para satisfazer esta restrio natural. As transformaes so importantes para: (i)
estender a amplitude da varivel analisada de (0,1) para a reta real; (ii) fazer a
varincia constante atravs da amplitude dos efeitos fixos (na escala da varivel
latente contnua). A funo de ligao descreve, ento, a relao existente entre o
preditor linear () e o valor esperado de Y . No modelo linear clssico, tem-se =
que chamada de ligao identidade, e esta ligao adequada no sentido em que
ambos e podem assumir valores na reta real.
As distribuies a serem assumidas para a escala da varivel latente e
correspondentes funes de ligao devem ser capazes de transformar o intervalo
(0,1) em (- , ). Neste sentido, as distribuies logstica, normal padro e Gumbel
(ou distribuio de valor extremo) para a varivel latente e suas correspondentes
funes de ligao denominadas logito, probito e complemento log-log so
apropriadas para o modelo binomial. Maiores detalhes sobre a estimao e predio
em modelos lineares generalizados mistos via REML/BLUP so apresentados por
Resende e Biele (2002).
Equaes de Estimao Generalizada (GEE)
Anlises estatsticas univariadas de variveis discretas so realizadas
eficientemente via a classe de modelos lineares generalizados. Nesse caso, uma funo
de verossimilhana maximizada iterativamente analisando uma varivel linearizada
(transformao de y para a escala linear), usando modelos lineares normais ponderados.
Modelos mistos normais ponderados podem ser ajustados via REML.
Para o caso multivariado, a estatstica clssica tem se limitado a tcnicas
descritivas no paramtricas tal qual a anlise de componentes principais ou a modelos
paramtricos baseados em normalidade. Em muitas aplicaes, principalmente na rea
de estatstica mdica, muitos problemas de estimao associados a variveis discretas
no podem ser abordados usando a estatstica multivariada tradicional. Para o caso de
variveis no normais, uma forma geral para a distribuio multivariada no existe.
Isto conduz ao fato de que uma verdadeira funo de verossimilhana, que baseia-se
em normalidade, no est disponvel. Uma funo alternativa a quaseverossimilhana, a qual tem propriedades similares s da verossimilhana verdadeira.
Essa funo de quase-verossimilhana pode ser maximizada usando a tcnica das
equaes de estimao generalizada (GEE) criada por Zeger et al. (1988). Por essa
tcnica, a estimao pode ser realizada por meio do mtodo numrico ou algoritmo de
quadrados mnimos ponderados iterativos (IWLS). Ento, a tcnica GEE encontra seu
principal uso na anlise multivariada de variveis discretas. ento um
desdobramento da classe de modelos lineares generalizados (GLM) em que se
incorporam as correlaes entre variveis ou entre medidas repetidas. Pode ser aplicada
a modelos de efeitos fixos e a modelos de efeitos mistos.
68
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
69
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
70
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
71
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
dado
por
1
( t xi , g j ) g j exp[ b' xi ] t . Risco no caso refere-se propenso em atingir a
produtividade desejada. Uma funo de risco (t xi , g j ) que cresce rapidamente e
funo de sobrevivncia P(t xi , g j ) que decresce rapidamente (menor tempo) atravs
do tempo identifica um individuo precoce e interessante ao melhoramento.
72
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Famlia
Mtodos de estimao
penalizada
(Regresso
linear)
Mtodo
RR-BLUP/GWS
LASSO
EN
RR-BLUP-Het/GWS
Mtodos de estimao
bayesiana (Regresso no
linear)
BayesA
BayesB
Fast BayesB
BayesC
BayesD
BLASSO
IBLASSO
Regresso implcita
Regresso
com
reduo dimensional
Atributos
Regularizao
Arquitetura gentica homognea
Seleo indireta de covariveis
Regularizao
Arquitetura gentica homognea
Seleo direta de covariveis
Regularizao
Arquitetura gentica homognea
Seleo direta de covariveis
Regularizao
Arquitetura gentica flexvel
Seleo indireta de covariveis
Regularizao
Arquitetura gentica flexvel
Seleo indireta de covariveis
Regularizao
Arquitetura gentica flexvel
Seleo direcionada de covariveis
Regularizao
Arquitetura gentica flexvel
Seleo direcionada de covariveis
Regularizao
Arquitetura gentica homognea
Seleo direta de covariveis
Regularizao
Arquitetura gentica flexvel
Seleo direta de covariveis
Regularizao
Arquitetura gentica flexvel
Seleo direta de covariveis
Regularizao
Arquitetura gentica flexvel
Seleo direta de covariveis
Regresso Kernel
RKHS
Redes neurais
Quadrados mnimos parciais
Componentes principais
Componentes Independentes
73
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
i ~ N ( 0 , 2 ) ,
conduz a uma distribuio t para , e portanto, com uma cauda mais longa que a
distribuio normal. Este mtodo pode ser implementado via amostragem de Gibbs,
para obteno dessa informao combinada ou da distribuio a posteriori das
varincias.
Os mtodos associados a modelos hierrquicos bayesianos (BayesA e B) por
meio de suas formulaes em termos dos hiperparmetros propiciam varincias
especficas para cada marcador. O mtodo RR-BLUP so funes lineares dos dados
e regressam as estimativas com o mesmo erro padro (mesmas freqncias allicas e
tamanho amostral) pela mesma quantidade. Prioris Gaussianas conduzem a
shrinkage homogneo atravs dos marcadores. Os mtodos Bayesianos so funes
no lineares dos dados e regressam efeitos menores mais do que os maiores, ou seja,
admitem maiores herdabilidades para os maiores efeitos.
O shrinkage homogneo no desejvel, pois alguns marcadores esto ligados a
QTLs e outros no esto. Mas assumindo distribuio a priori t escalada ou dupla
exponencial para os efeitos de marcadores tem-se os mtodos BayesA e BLASSO,
respectivamente, os quais produzem shrinkage especficos de acordo com o tamanho
do efeito e da varincia do marcador.
Em resumo, no modelo linear os efeitos de marcas so assumidos com distribuio
normal e regressam as marcas de mesmas freqncias allicas pela mesma
quantidade. O modelo Bayesiano no linear e os efeitos menores so regressados
mais do que os maiores efeitos usando para isso informao a priori sobre a esperada
distribuio dos efeitos de QTL (distribuio t no caso do BayesA).
74
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
EQM
constante determinstica;
2
PEV E g 2 E g ;
b 2 ( E g g ) 2 EQM PEV E g 2 E g g g 2 ;
Vcio b ( E g g ) ;
1 n
Vcio i b i
( g ij g i ) se pelo menos n = 2 repeties forem
n j 1
Vcio
- Preciso (PEV)
PEV Var ( g g ) (1 rg2g ) g2 , em que
g2 a varincia de g.
Assim, o mtodo ideal de estimao pode ser viciado em pequeno grau, pois o que
importa minimizar a soma (Vcio ) 2 PEV . Na classe dos estimadores/preditores
no viciados, a preciso dada pelo parmetro varincia do erro de predio (PEV) e
a estratgia de minimizar PEV conduz tambm maximizao da acurcia. Mas, de
maneira geral (relaxando a necessidade de no vcio), o que deve ser minimizado o
EQM, buscando a admissibilidade.
A comparao entre duas metodologias estatsticas ou dois vetores contendo
variveis quantitativas pode ser realizada por meio da comparao de seus EQMs e a
75
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
identidade entre as duas pode ser inferida com base na identidade de seus EQMs.
Geralmente um modelo ( g ) comparado com a distribuio paramtrica ( g ). Mas,
em muitas situaes prticas, uma metodologia alternativa ( g ) comparada com
uma metodologia padro ou de referncia ( g ) por meio de seu erro em relao essa
referncia. Sendo EQM (Vcio ) 2 PEV , seus componentes devem ser testados
estatisticamente visando inferir sobre a identidade entre duas metodologias. Uma
abordagem para isso foi apresentada por Leite e Oliveira (2002). Esses autores
propem os seguintes testes para os trs componentes:
n
( g g i )
/ n contra zero:
(i) teste t para o erro mdio e i
gi
i 1
( e 0)
, em que se se / n e se a estimativa do desvio
Estatstica de teste: t e
se
( g g i )
;
padro do erro, ou seja, s i
gi
.
g*
.
.
g1
g2
. e
.
.
gn
0
( )( g*' g*)( )
, em que 0 ; ;
2QM Re siduo
1
1
n
( g*' g *)
g i
g
g
.
2
i
76
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
n
Um erro mdio e ( g i g i ) / n pode no ser significativamente diferente de
i 1
gi
zero mas, o estimador pode ser viesado. Em estudos de simulao, o vis pode ser calculado
pela expresso (Vcio ) 2 EQM PEV . Na prtica, os valores paramtricos so
desconhecidos mas, a significncia do vis pode ser avaliada pelo teste simultneo de 0 0
Var( g )
no significativo
no significativo
rgg (1 e )
g g
no significativo
no significativo
rgg (1 e )
g g
no significativo
significativo
rgg (1 e )
g g
no significativo
significativo
rgg (1 e )
g g
significativo
no significativo
rgg (1 e )
g g
significativo
no significativo
rgg (1 e )
g g
significativo
significativo
rgg (1 e )
g g
significativo
significativo
rgg (1 e )
g g
77
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
g g
gg
gg
gg
2
g,
gg
gg
gg
78
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
79
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
g2 w i
individuais dentro de famlia ( h 2 ), especficas para cada famlia i; (5)
y w i
estimao do efeito da segregao mendeliana usando uma formula especfica para
cada famlia i ( g wij ( yij Xbij 0.5g pi )hw2 i ), em que b um vetor de efeitos fixos;
2
wi
(6) soma dos efeitos dos genitores ( g pi ) com os efeitos da segregao mendeliana de
cada individuo por meio de g 0.5g g 0.5g ( y Xb 0.5g )h 2 .
ij
pi
wij
pi
ij
ij
pi
wi
80
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
81
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
2 Anlise Genmica
Esforos na rea de pesquisa com marcadores genticos em prol do
melhoramento tm se dividido em duas linhas: a deteco de marcadores associados a
QTL e mapeamento desses; uso dos marcadores nos programas de seleo gentica
via seleo auxiliada por marcadores (MAS) e seleo genmica ampla (GWS),
tambm denominada seleo genmica (GS). Esse captulo aborda ambas as linhas,
enfatizando a seleo gentica via uso das informaes genmicas. Contempla o
estudo de QTLs baseado em anlise de anlise de ligao e de desequilbrio de ligao
(gentica de associao - GWAS) e a seleo genmica ampla (GWS). A abordagem
apresentada nesse documento baseia-se no livro publicado por Resende (2008).
2.1 Fundamentos da Anlise de QTLs e da Seleo Genmica
82
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
83
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
podem ser usados para cobrir o genoma de um organismo com marcadores que no
esto a mais de 1 cM (1 milho de bases) um do outro no genoma inteiro. Os
marcadores moleculares do tipo microssatlites tambm so usados. Tais marcadores
so eficientes por serem co-dominantes, multi-allicos, abundantes e apresentarem
alta transferibilidade entre indivduos e espcies.
Os marcadores SNPs apresentam natureza biallica, conforme ilustrado a
seguir:
Indivduo 1: TCACCGCG
Indivduo 2: TCATCGCG
Verifica-se polimorfismo de SNPs entre os dois indivduos. Na seqncia
especificada na fita simples de DNA ocorre troca de uma nica base, caracterizando
o referido polimorfismo. Mais de 1,5 milho de SNPs foram identificados no genoma
humano. Suas posies esto localizadas em um espaamento mdio de 2 x 10-3 cM
(Hartl e Jones, 2002).
Marcadores DArT (Diversity Array Technology) so tambm bi-allicos e
adequados GWS pois so abundantes tais quais os SNPs, e podem ser obtidos com
alta velocidade e rendimento. No entanto, tais marcadores so dominantes e essa
pode ser uma desvantagem em relao aos SNPs, que so codominantes. Entretanto,
podem comportar-se de duas maneiras: dominante (presena vs ausncia) ou
codominante (2 doses vs 1 dose vs ausncia).
A seleo genmica ampla (GWS) ou seleo genmica (GS) foi proposta por
Meuwissen et al. (2001) como uma forma de aumentar a eficincia e acelerar o
melhoramento gentico. A GWS enfatiza a predio simultnea (sem o uso de testes
de significncia para marcas individuais) dos efeitos genticos de milhares de
marcadores genticos de DNA (SNP, DArT, Microssatlites) dispersos em todo o
genoma de um organismo, de forma a capturar os efeitos de todos os locos (tanto de
pequenos quanto de grandes efeitos) e explicar toda a variao gentica de um carter
quantitativo. A condio fundamental para isso que haja desequilbrio de ligao,
em nvel populacional, entre alelos dos marcadores e alelos dos genes que controlam
o carter. A predio dos efeitos genticos realizada com base em dados genotpicos
e fenotpicos de indivduos pertencentes a uma amostra da populao de seleo.
Esses efeitos genticos dos marcadores sobre fentipos de caracteres
quantitativos so somados e usados na predio de valores genticos de indivduos
apenas genotipados, candidatos seleo em programas de melhoramento gentico.
A predio e a seleo podem ser realizadas em fases muito juvenis de plantas e
animais, acelerando assim o processo de melhoramento gentico. Adicionalmente, a
prpria predio tende a ser mais acurada por considerar o real parentesco gentico
dos indivduos em avaliao, em detrimento do parentesco mdio esperado
matematicamente (Resende, 2007). A GWS propicia uma forma de seleo precoce
direta (SPD), pois, atua precocemente sobre genes expressos na idade adulta. Ao
contrrio a seleo precoce tradicional indireta, pois, atua (via avaliao fenotpica)
84
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
sobre genes ativados na idade precoce, esperando que esses informem parcialmente
sobre genes expressos na idade adulta. Assim, a SPD propiciada pela GWS
especialmente importante para o melhoramento de organismos perenes como
animais, espcies florestais, fruteiras (e outras frutferas), forrageiras, cana-deacar, caf, dentre outras.
Em resumo, a superioridade da GWS sobre a seleo baseada em fentipos
pode ser atribuda a quatro fatores: uso da matriz de parentesco real e prpria de cada
carter, fato que aumenta a acurcia seletiva; (ii) viabilizao da SPD, que aumenta o
ganho gentico por unidade de tempo; (iii) permisso da avaliao repetida de cada
alelo (propicia repetio experimental) sem o uso de testes clonais e de prognies,
fato que aumenta a acurcia seletiva; (iv) uso de maior nmero de informaes,
combinando trs tipos de informao (fenotpica, genotpica e genealgica) para
corrigir e desregressar os dados e fazer a anlise genmica, fato que aumenta a
acurcia.
A MAS surgiu basicamente na dcada de 1990. Os primeiros trabalhos relativos
a organismos perenes foram os de Fernando e Grossman (1989), Lande e Thompson
(1990), Goddard (1991) e Kennedy et al. (1992). A GWS um produto do terceiro
milnio. Aps a proposio da GWS em 2001 o procedimento permaneceu discreto
at 2007, quando vrios trabalhos abordaram o mtodo e sua acurcia no
melhoramento animal e vegetal (Fernando et al., 2007; Goddard e Hayes, 2007;
Meuwissen, 2007; Bernardo e Yu, 2007; Resende 2007). Outros trabalhos relatam que
a GWS o novo paradigma em gentica quantitativa (Resende, 2008; Gianola et al.,
2009), melhoramento de gado de leite (Hayes et al., 2009; Van Raden, 2008;
VanRaden et al., 2009), de corte (Ferraz e Rezende, 2011), de aves (Gonzales-Recio et
al., 2009), de plantas anuais (Heffner et al., 2009) e de espcies florestais (Resende et
al. 2008; Grattapaglia e Resende, 2011).
Atualmente resultados prticos j existem para eucalipto (Resende et al., 2012),
pinus (Resende Jnior et al., 2012), sunos (Rocha et al., 2012; Azevedo et al., 2012),
milho (Fritsche Neto et al., 2012) e caju (Cavalcanti et al., 2012). Acredita-se que a
GWS propiciar um impacto positivo nos mtodos de seleo e nas estratgias de
melhoramento de plantas e animais. No entanto, preciso adquirir experincia
prtica com a GWS, visando inferir sobre sua efetividade.
2.2 Anlise de Ligao (LA) e Anlise de Desequilbrio de Ligao (LDA)
A quantidade de material gentico herdvel de um indivduo finita e referese ao tamanho do genoma. Em humanos, o genoma composto de cerca de 35 mil
genes (Ewing e Green, 2000). Assim, um nmero finito de genes deve controlar cada
um dos caracteres quantitativos e isso torna possvel a avaliao de todos os locos
associados ao controle gentico de um carter.
Existem basicamente trs abordagens para a descoberta de um QTL: (i)
abordagem de genes candidatos; (ii) abordagem de mapeamento via anlise de
ligao ou linkage analysis (LA); (iii) abordagem de mapeamento via anlise de
desequilbrio de ligao ou linkage disequilibrium analysis (LDA). A estratgia de genes
85
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
86
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
87
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
88
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
89
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
90
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
91
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
92
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
3.2 Anlise de QTL como Efeito Aleatrio via Modelos Lineares Mistos
93
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
94
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
zero, um ou dois alelos IBD com probabilidades (1/4), (1/2) e (1/4), respectivamente.
Assim, nesse caso, m f 2 (1 / 2 ) f 1 (1 / 4 ) (1 / 2 )(1 / 2 ) 1 / 2 .
Fulker e Cardon (1994) apresentaram uma expresso para o cmputo da mdia
condicional da proporo de alelos IBD do QTL como funo linear dos m nos dois
marcadores
de
um
intervalo.
Essa
expresso
dada
por
,
em
que
e
so
as
propores
IBD
para
os
q E [ q m 1 m 2 ] 1 m 1 2 m 2
m1
m2
dois marcadores. Os
equaes: Cov ( m1 , q )
Cov ( m 2 , q )
valores
Var ( m 1 )
Cov ( , )
m1
m2
de
so
dados
pelo
sistema
de
Cov ( m1 , m 2 ) 1 .
Var ( m 2 ) 2
95
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Proporo de
Segregao
Cruzamento
entre F1
Divergentes
MiMj x MkMl
Toda a prognie
informativa para ambos
os genitores
1:1:1:1
Retrocruzamento
MiMj x MkMk
A prognie informativa
somente para o genitor
heterozigoto
1:1
Cruzamento
entre F1 Idnticos
(Gerao de F2)
MiMj x MiMj
Somente indivduos
homozigotos da prognie
so informativos
1:2:1
Quando vrias famlias existem, pode-se tambm realizar uma ANOVA com
efeito de marcador hierrquico dentro de cada famlia. A ANOVA ter trs fontes de
informao: (i) entre famlias (com f-1 graus de liberdade); (ii) entre gentipos
marcadores (com 3f graus de liberdade para o caso de cruzamento completamente
informativo); (iii) resduo.
Contrastes de mdias para os efeitos allicos dentro de cada genitor da famlia
de irmos completos podem ser realizados. Para o genitor MiMj a diferena entre a
mdia fenotpica dos indivduos com o alelo Mi no loco marcador e a mdia
fenotpica dos indivduos com o alelo Mj fornece a seguinte quantidade Mif Mjf =
(1-2r) (ai aj), em ausncia de dominncia. As quantidades r, ai e aj referem-se taxa
de recombinao, efeito mdio do alelo i e efeito mdio do alelo j, respectivamente.
Com ligao completa entre o loco do QTL (Q) e o loco do marcador (M) tem-se r =
0 e a quantidade aij = (ai aj) fornece o efeito mdio de substituio gnica. Esse
efeito refere-se conseqncia mdia de se substituir o alelo Qj por Qi no
heterozigoto QiQj (tornando-o QiQi) e no homozigoto QjQj (tornando-o QiQj). De
maneira similar, pode-se obter a quantidade akl = (ak al), que fornece o efeito mdio
de substituio gnica de Ql por Qk. Comparando-se aij com akl, pode-se inferir qual
dos quatro alelos mais favorvel. A Tabela 20 ilustra essa questo. Verifica-se que o
alelo mais favorvel Mi, seguido por Ml.
96
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Tabela 20. Efeitos allicos comparativos no cruzamento MiMj x MkMl, dados as mdias
fenotpicas.
Mdia Fenotpica
Mdia Fenotpica
Efeito do Alelo no
Diferena Allica
dos Alelos Mi e Mk
dos Alelos Mj e Ml
Genitor
Mi-Mj
Mk-Ml
17.7 (Mi)
14.5 (Mk)
12.03 (Mj)
15.64 (Ml)
5.67
-1.14
Mi: mdia de (MiMk + MiMl); Mj: mdia de (MjMk + MjMl); Mk: mdia de (MiMk + MjMk) ; Ml: mdia de (MiMl + MjMl).
Conforme Lynch e Walsh (1998), o modelo para o valor fenotpico de um (j) dos
membros do par i de irmos completos dado por Yij u qij eij , em que q o
efeito aditivo do QTL e e o efeito residual, o qual inclui efeito ambiental e
polignico residual. A diferena entre efeitos residuais dos dois indivduos do par,
ei ei1 ei 2 , assumida com mdia zero e varincia e2 , e no correlacionada com
qi qi1 qi 2 . Constata-se que a diferena entre os valores fenotpicos dos irmos
desejvel pois, cancelam os efeitos de ambiente comum que afetam os membros da
famlia.
O quadrado da diferena entre os valores fenotpicos dos irmos tem valor
esperado dado por
E (Y j ) E [( qi1 qi 2 ei1 ei 2 ) 2 ]
E [( qi1 qi 2 ) 2 ] e2
2[ q2 ( qi1 , qi 2 )] e2
97
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
ydfic
ydfic
herdabilidade
do
QTL
na
populao
deve
ser
calculada
como
h 2 2 /[ 2 (1 / 2 ) 2 ] ( / 2 ) /( 2 / 4 ) . Se a varincia fenotpica
aq
q
ydfic
q
ydfic
individual da populao for computada, a herdabilidade do QTL dentro de famlia
2
2
deve ser calculada por haqd
[(1 / 2 ) q2 ] /[ ydfic
(1 / 2 ) q2 ] ( / 4 ) /( y2 / 4 ) .
A herdabilidade de todo o carter (sobre todos os locos) pode ser calculada por
meio da regresso ( * ) dos quadrados das diferenas fenotpicas entre dois irmos
dentro de uma famlia na estimativa da proporo IBD ampla em todo o genoma.
Nesse caso, * 2 g2 e h 2 * /( 2 y2 ) . Maiores detalhes so apresentados por
Visscher et al. (2006) e Odegard e Meuwissen (2012).
Para a estimao de parmetros genticos tais como a herdabilidade, so
necessrias informaes fenotpicas e de parentesco entre os indivduos avaliados. As
anlises genticas de dados moleculares fornecem informaes sobre o parentesco
entre os indivduos. Resende (2008) apresenta estimadores para a herdabilidade
nestas condies.
Definindo Z ij
( yi y ) ( y j y )
Var ( y )
2rij g2 eij
2
y
2rij h2
eij
y2
eij
2
y
g2
: herdabilidade individual no sentido
y2
Var ( y) .
2
y
estimador
da
herdabilidade
dado
por
cov ( Zij , rij ) cov [(2 rij h2 eij ' ), rij ] 2 Var (rij ) h2
h2 cov ( Zij , rij ) /[2 Var(rij )] , pois h2
h2 .
2 Var (rij )
2 Var (rij )
2 Var (rij )
98
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
99
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
100
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
101
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
102
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
No caso de microarranjos, dois tipos de plataforma de arranjos podem ser usadas: (i)
baseada em um sistema de duas cores, gerando duas amostras por arranjo (do tipo
spotted cDNA); (ii) baseada em um sistema de cor (dye) nica ou arranjo de canal
nico, gerando uma amostra por arranjo (do tipo Affymetrix). O sistema (i)
demanda delineamentos (em loop ou circulares, parcelas subdividas) e anlises mais
complexos, alm de um alto nvel de repeties tcnicas. Por outro lado, o sistema
(ii) permite mltiplas sondas por gene e apresenta uma tendncia de se usar menor
nmero de repeties. Tambm o delineamento mais simples e no existe amostra
de referncia.
Duas abordagens principais tm sido empregadas na experimentao com
arranjos de duas cores: (i) uma cor (verde = Cyanine 3 ou Cy3) reservada para a
amostra de referncia ou controle e outra cor (vermelha = Cyanine 5 ou Cy5) usada
para avaliar os tratamentos; (ii) as duas cores so usadas para avaliar tratamentos de
interesse. Na abordagem (i) a proporo Cy3/Cy5 entre as intensidades de
fluorescncia propicia uma medida de intensidade de expresso gnica. Essa
abordagem intuitiva e adequada em situaes em que existe um grande nmero de
tratamentos do mesmo fator com baixo nmero de repeties. A abordagem (ii)
requer delineamentos mais refinados para evitar o confundimento entre fatores
(lminas e amostras de cido nuclico). Os efeitos de corantes ou dye so
pronunciados e torna-se essencial que cada amostra seja representada por repeties
tcnicas de ambos dyes em iguais propores.
O delineamento em loop deve ser empregado quando o interesse contrastar as
contribuies de cada fator. O delineamento em parcela subdividida deve ser usado
quando o interesse reside no efeito de um fator atravs de amostras que incluem
efeitos de um outro fator de menor interesse. Para qualquer das duas abordagens (i e
ii) o efeito de arranjo deve ser ajustado como aleatrio, visando considerar o fato de
que as duas medidas em um mesmo arranjo so correlacionadas. Isso ajusta para o
efeito do ambiente comum de arranjo. O delineamento experimental guia a
formulao do modelo linear apropriado para a anlise. Cada lmina ou arranjo
anlogo a um bloco incompleto pois, contempla apenas dois dos vrios tratamentos.
Adicionalmente, cada lmina contm os efeitos de dois corantes e o delineamento
torna-se ento do tipo linha e coluna com dimenso 2 x s, em que s o nmero de
slides ou arranjos.
No caso de arranjos de canal nico o delineamento experimental simplificado e
no h necessidade de considerar os efeitos de arranjo e de dye, pois no h
confundimento uma vez que cada amostra hibridizada sobre um arranjo diferente e
medida independentemente. A amostra de referncia ou controle usada
exatamente para corrigir os dados para os efeitos de lmina. Nesse caso, o
delineamento do tipo blocos incompletos com tratamentos comuns. A comparao
entre tratamentos realizada de forma indireta, por meio da diferena entre
contrastes de cada tratamento e a referncia ou controle em cada lmina. Por outro
lado, nos delineamentos circulares, os efeitos comparativos de tratamentos so
estimados por meio de combinaes entre comparaes diretas (entre tratamentos
dentro de blocos ou lminas) e de comparaes indiretas (entre tratamentos entre
blocos ou lminas).
103
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
104
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
105
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
106
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
107
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Valor Fenotpico
Valor Gentico
+
++
++
+++
Valor Gentico
-5
108
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Como exerccio, considere o seguinte: Dois locos com dois alelos esto
segregando na populao e so fornecidas as seguintes informaes: prob (AB) = 0,35;
p (A) = 0,7 e p (b) = 0,4. Essa populao encontra-se em equilbrio gamtico? Com
base nas informaes tem-se: p (B) = 1 0,4 = 0,6 e a probabilidade esperada de AB
P (AB) = p (A) p(B) = 0,7 x 0,6 = 0,42. Assim D = prob (AB) - p (A) p (B) = P11 p1q1
= 0,35 0,42 = -0,07. Assim, a populao encontra-se em desequilbrio de ligao e
existe um excesso de gametas em repulso. Supondo locos ligados com taxa de
permuta de 2 %, o nmero de geraes para que o desequilbrio caia metade (Dt/D0
= 0,5) ser dado por Dt/D0 = (1 r)t = 0,5. Assim, 0,5 = (1 r)t e 0,5 = (1 0,02)t e,
portanto, resolvendo para t obtm-se t = 34,31 geraes.
A estatstica de desequilbrio de ligao apresentada por Hill (1981) e usada
acima, D = prob(AB) prob (ab) prob (Ab) prob (aB), muito dependente das
freqncias de alelos individuais e portanto no til para comparao do LD entre
mltiplos pares de locos envolvendo diferentes pontos ao longo do genoma. A
estatstica r2 desenvolvida por Hill e Robertson (1968) mais adequada, pois menos
dependente das freqncias allicas. Tal estatstica dada por r2 = D2 / [prob(A)
prob (a) prob (B) prob (b)]. Os valores de r2 variam de zero (pares de locos com
nenhum desequilbrio entre eles) a 1 (pares de locos com completo LD).
Considerando o exemplo acima, tm-se as seguintes freqncias observadas dos
hapltipos: P (AB) = 0,35; P (ab) = 0,05; P (aB) = 0,25; p(Ab) = 0,35. Assim, D = P
(AB) P(ab) P (Ab) P(aB) = -0,07 e D2 = 0,0049. O valor de r2 ento dado por r2 =
D2 / [prob(A) prob (a) prob (B) prob (b)] = 0,0049 / [0,7 0,3 0,6 0,4] = 0,0972. Esse
nvel de desequilbrio considerado baixo. Valores moderados de r2 so da ordem de
0,2 ou mais (Hayes et al., 2006).
Outra medida de LD a estatstica D`= mdulo (D) / Dmax, proposta por
Lewontin (1964), a qual refere-se ao prprio D padronizado pelo D mximo. O
Dmx dado por Dmax = min (p1q2 , p2q1) se D > 0 e Dmax = min (p1q1 , p2q2) se D <
0. Essa medida de LD no muito precisa pois pode ser inflacionada quando
estimada a partir de amostras pequenas ou em situao de baixas freqncias allicas
(McRae et al., 2002). Outra caracterstica de D refere-se sua incapacidade de
predio da densidade de marcadores necessria para uma completa varredura do
genoma usando LD.
A estatstica r2 ento preferida. O significado gentico de r2 entre um
marcador e um QTL no observado que ele mede a proporo da variao causada
por alelos do QTL que explicada pelos marcadores. Assim, o decrscimo de r2 com
o aumento da distncia indica quantos marcadores e fentipos so necessrios para a
acurada predio no contexto da seleo genmica ampla e da deteco de QTL
usando LD em nvel populacional. Os tamanhos amostrais devem aumentar em uma
proporo dada por 1/r2 para detectar um QTL no observado, em comparao com a
amostragem necessria para avaliar o prprio QTL (Pritchard e Przeworski, 2001).
As medidas de desequilbrio apresentadas referem-se a locos com dois alelos, ou
seja, marcadores bi-allicos. Isto adequado para marcadores do tipo SNPs, embora
possam ser estendidos tambm para marcadores multi-allicos como os
microssatlites. No entanto, um estimador de desequilbrio de ligao multi-alllico
109
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
foi proposto por Zhao et al. (2005), por meio da estatstica x2* dada por
n
k
2
2* [1 /( m 1)] { D ij2 /[ p ( a i ) p (b j )]} , em que D ij p ( a i b j ) p ( a i ) p (b j ) e p ( a i ) e
i 1
j 1
p (b j ) so
Ne
S (Morgan)
S (CentiMorgan)
E(r2)
Ne
S (Morgan)
S (CentiMorgan)
E(r2)
10
10
10
10
10
10
20
20
20
20
20
20
30
30
30
30
30
30
50
50
50
50
50
50
0.005
0.01
0.02
0.03
0.04
0.05
0.005
0.01
0.02
0.03
0.04
0.05
0.005
0.01
0.02
0.03
0.04
0.05
0.005
0.01
0.02
0.03
0.04
0.05
0.5
1
2
3
4
5
0.5
1
2
3
4
5
0.5
1
2
3
4
5
0.5
1
2
3
4
5
0.83
0.71
0.56
0.45
0.38
0.33
0.71
0.56
0.38
0.29
0.24
0.20
0.63
0.45
0.29
0.22
0.17
0.14
0.50
0.33
0.20
0.14
0.11
0.09
100
100
100
100
100
100
200
200
200
200
200
200
500
500
500
500
500
500
1000
1000
1000
1000
1000
1000
0.005
0.01
0.02
0.03
0.04
0.05
0.005
0.01
0.02
0.03
0.04
0.05
0.005
0.01
0.02
0.03
0.04
0.05
0.005
0.01
0.02
0.03
0.04
0.05
0.5
1
2
3
4
5
0.5
1
2
3
4
5
0.5
1
2
3
4
5
0.5
1
2
3
4
5
0.33
0.20
0.11
0.08
0.06
0.05
0.20
0.11
0.06
0.04
0.03
0.02
0.09
0.05
0.02
0.02
0.01
0.01
0.05
0.02
0.01
0.01
0.01
0.00
110
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
1
2
3
4
5
Correlao r
N. Alelos
Loco Marcador
(Wa)
0
2
1
1
2
r = 0.76
N. Alelos
Loco QTL
(Wb)
0
1
1
0
1
2
r = 0.58
Cov ( a, b)
ab a b Pr ob(ab) Pr ob(a ) Pr ob(b) D
r2 =
D2 ,
[pq rs]
quadrado
D = Prob(ab) Prob(a) Prob(b) , em que Prob (a) a frequncia do alelo a e Prob (ab) a
111
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
112
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
113
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
mapeamento fino. Assim, uma pura anlise LDA pode resultar em um alto nmero
de falsos positivos, ou seja, falsa inferncia de associao em ausncia de ligao. Em
funo disso, mtodos (LA-LDA) que incorporam simultaneamente as informaes
de LD populacional e de ligao dentro de famlias so indicados, visando mitigar os
efeitos da associao espria entre marcadores e QTLs (Meuwissen e Goddard,
2004).
A seleo auxiliada por marcadores moleculares (MAS) e a seleo genmica
ampla (GWS) sero tanto mais efetivas quanto mais prximos estiverem os
marcadores dos QTLs. Dado o pequeno espaamento entre genes no cromossomo, o
mapeamento de QTLs com preciso uma tarefa cruel. Em mdia, um segmento
cromossmico de 10 cM pode conter cerca de 200 genes. Assim, uma alta densidade
de marcadores genotipados aumenta a resoluo do mapeamento de QTLs. Mas se o
objetivo for encontrar o prprio gene que afeta o carter, o intervalo de confiana
para a localizao do QTL ainda ser amplo, mesmo para QTL de grande efeito e
com grande tamanho amostral (Weller, 2001). Estratgias de mapeamento baseadas
em LDA so relatadas a seguir.
4.3 Mapeamento genmico amplo via regresso em marcas nicas
Fentipo
1
2
3
4
5
6
7
8
9
10
11
12
9,87
14,48
8,91
14,64
9,55
7,96
16,07
14,01
7,96
21,17
10,19
9,23
A
A
A
A
A
a
A
A
a
A
A
A
a
A
a
A
a
a
A
a
a
A
a
A
114
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
i
u
7,2713
sistema, obtm-se:
.
i 3,7856
m
e2
( y y m W ' y u J ' y ) /( n 2)
No presente exemplo, o valor calculado de F foi de 9,74. Tal valor pode ser
comparado com o valor tabelado de F ao nvel de significncia de 5 % e graus de
liberdade 1 e 10, o qual equivale a 4,96. Assim, o efeito do SNP significativo. Isso
era esperado, pois, associados aos maiores valores fenotpicos esto os alelos A do
SNP, conforme se v claramente na tabela dos dados. Na prtica da GWS, o nvel de
significncia a ser adotado deve ser bem menor, da ordem de 10-5.
Um modelo mais completo da forma:
y = Xb + Ts Wmi + Zg + e , que b, s e g so vetores de efeitos fixos de natureza
ambiental, de covarivel de efeitos fixos referente estrutura de populao e de
efeitos aditivos polignicos (aleatrios), respectivamente, com matrizes de incidncia
X, T e Z.
115
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
(ii)
(iii)
(iv)
(v)
116
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Sa p i2
, em que p a freqncia
i 1
117
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
i 1
Totais
Alelo 1 do QTL
p1q1 D1
piq1 Di
pnq1 Dn
Q1
Alelo 2 do QTL
p1q2 + D1
piq2 + Di
Pnq2 + Dn
Q2
Totais
p1
pi
pn
i 1
freqncia do hapltipo e das freqncias dos alelos do QTL. Valores de r2 podem ser
obtidos via simulao de diferentes freqncias q1 e q2 e tamanhos de genoma e
118
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Q q
j
Zg * e ,
em que:
qj : vetor que contm duas incgnitas para cada indivduo em cada loco (um efeito do
QTL no cromossomo maternal e outro no paternal); g*: vetor aleatrio de efeitos
polignicos, excluindo q; Qj : matriz de incidncia para os alelos do QTL no
segmento cromossmico j; Z : matriz de incidncia para g*; b e ei : vetor de efeitos
fixos e erro aleatrio, respectivamente; X : matriz de incidncia para b. Esse modelo,
que inclui ambos, os efeitos do QTL e polignico infinitesimal, denominado
modelo misto de herana (Fernando et al., 1994). Detalhes algbricos desse modelo
so apresentados por Resende (2008). O mapeamento dos QTLs realizado com base
119
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
120
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
121
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
gi2
2
2
no QTL (Visscher et al., 2010). As expresses r 2 = mi
/ gi2 e mi
= r 2 gi2
ilustram essa questo.
122
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
capturar o variante causal mesmo que nenhum SNP esteja em perfeito LD com ele
(Visscher et al., 2010). Assim, um SNP pode no ser detectado como significativo,
mas, em conjunto com outros, ser importante para explicar a variao gentica e
maximizar a acurcia seletiva. Dessa forma, recomenda-se no aplicar teste de
significncia antes da GWS. Mesmo com o uso de dezenas de milhares de
marcadores, se os variantes so raros, e sendo comuns os marcadores, ainda assim, os
marcadores no capturaro toda a variao gentica. Assim, a eficincia da GWS
depende da arquitetura gentica do carter na populao. Se o mesmo for governado
por um grande nmero de variantes raros que explicam grande parte da variao
gentica, a GWS ter menor sucesso. Nesse caso, recomendvel ajustar no modelo,
o efeito polignico residual, como forma de capturar esses variantes raros.
Em resumo, as causas da herdabilidade perdida so: (i) variantes de baixa
frequncia (MAF < 0,10) no esto em alto LD com marcadores comuns (MAF >
0,10), causando baixo r2; (ii) pequeno nmero de marcas, causando baixo r2; (iii) uso
apenas dos SNPs significativos na GWAS. A estimao simultnea necessria
porque os SNPs esto em LD, ou seja, so dependentes e correlacionados. A
regresso simultnea (via RR-BLUP) equivalente a regressar o fentipo em todos
os componentes principais derivados dos marcadores, sendo que o grau de shrinkage
experimentado por cada efeito estimado proporcional ao seu associado valor
singular quadrtico (Campos et al., 2010). Isso d suporte ao mtodo da GWAS com
estimao simultnea (GWAS-SE), conforme Yang et al. (2011). Baseados nesse
princpio h tambm os mtodos regresso via quadrados mnimos parciais (PLSR) e
regresso via componentes principais (PCR) (Solberg et al., 2009) e tambm o
mtodo regresso via componentes independentes (ICR) (Azevedo et al., 2012).
4.11 GWAS via BayesCpi e BayesDpi
Os mtodos BayesC e BayesD (descritos por Habier et al., 2011; Resende et al.,
2011) apresentam a vantagem de propiciar informao sobre a arquitetura gentica do
carter quantitativo e identificar as posies de QTL por modelagem da frequncia
de single nucleotide polymorphism( SNP) no nulos. So vantajosos em relao anlise
de regresso marcas nicas devido ao fato de considerar simultaneamente todas as
marcas.
No mtodo BayesC uma varincia comum especificada para todos os locos. O
mtodo BayesD mantm varincias especficas para cada loco. Adicionalmente,
tratada como uma incgnita com distribuio a priori uniforme (0,1) produzindo o
mtodos BayesC e BayesD. A modelagem de muito interessante para a anlise
de associao. A maioria das marcas no est em desequilbrio de ligao com os
genes. Assim, necessria a seleo de um grupo de marcas que est em associao
com o carter. O mtodo BayesB determina subjetivamente. Usando a varivel
indicadora i os mtodos BayesC e BayesD modelam os efeitos genticos aditivos
n
123
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
124
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
125
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
126
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
QTL
como
de
efeitos
Var ( y ) ZVar ( g *) Z ' Var ( e ) .
fixos,
tem-se
Assumindo os gentipos do
e Var ( Qq ) 0 . Assim,
E ( Qq ) Qq
Q ' X
X'Z
Z ' Z A 11
Q' Z
X 'Q
Z'Q
Q ' Q
b
g *
q
X ' y ,
Z' y
Q ' y
2
em que: 1 e ; A : matriz de parentesco
2
g*
gentico aditivo; g2* : varincia aditiva polignica, ajustada para os efeitos dos genes
conhecidos; e2 : varincia residual. A seleo dos indivduos baseada em
g g * q .
O presente modelo considera que o marcador o prprio gene que afeta o
carter. Se o marcador no o prprio gene, mas encontra-se ligado a ele, a
recombinao entre eles pode conduzir ao fato de que um mesmo alelo do marcador
carregue diferentes alelos do QTL. Nesse caso, o efeito do gene ou QTL pode ser
considerado como aleatrio e a probabilidade de identidade por descendncia dos
alelos do QTL pode ser calculada a partir dos gentipos marcadores, desde que a
freqncia de recombinao entre marcador e QTL seja conhecida. Isto produz o
modelo de Fernando e Grossman (1989), abordado no tpico seguinte.
5.3 MAS via marcadores em equilbrio de ligao (LE-MAS)
127
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
A maioria dos projetos de pesquisa com QTL mudaram o seu curso para o
mapeamento fino baseado em marcadores LD ou diretamente nas mutaes
causadoras da variao nos QTLs. No caso dos marcadores LD, os mesmos
propiciam informaes sobre os QTLs em toda a populao (atravs de todas as
famlias) e ento, a abordagem no difere muito em eficincia, do uso de marcadores
diretos (mutao). Pela abordagem LD, a incluso de informaes dos marcadores ou
dos hapltipos nos esquemas de avaliao gentica pode ser realizada por meio do
modelo de QTL aleatrio de Fernando e Grosmann (1989). Nesse caso, as
covarincias baseadas em probabilidades de identidade por descendncia (IBD)
podem ser obtidas alm do pedigree, via LD e similaridade entre hapltipos ou
marcadores. Meuwissen e Goddard (2001) propuseram o uso das informaes via
LDA e LA para calcular a matriz de covarincia via IBD. Lee e van der Werf (2005)
mostraram que com alta densidade de marcadores, o valor do uso da informao de
ligao e do pedigree reduzido e pouco acrescenta em relao ao uso apenas da
informao de LD.
5.5 LD-MAS via Anlise de Marcas nicas
128
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Pai
Me
Fentipo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
1
4
2
3
5
9,87
14,48
8,91
14,64
9,55
7,96
16,07
14,01
7,96
21,17
10,19
9,23
-
A
A
A
A
A
a
A
A
a
A
A
A
a
A
a
A
A
a
A
a
a
A
a
a
A
a
A
A
A
a
129
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
A matriz Z equivale a
Indiv
1
2
3
4
5
6
7
8
9
10
11
12
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
10
0
0
0
0
0
0
0
0
1
0
0
0
11
0
0
0
0
0
0
0
0
0
1
0
0
12
0
0
0
0
0
0
0
0
0
0
1
0
13
0
0
0
0
0
0
0
0
0
0
0
1
14
0
0
0
0
0
0
0
0
0
0
0
0
15
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
A matriz A equivale a
Indiv
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
0
0
0
0
0
0
0
0
0
0
0
0.5
0.5
0
0
1
0
0
0
0
0
0
0
0
0
0
0.5
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0.5
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0.5
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0.5
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
10
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
11
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
12
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
13
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0.5
0.5
0
0
0
0
0
0
0
0
0
0
1
0
0
14
0.5
0
0.5
0
0
0
0
0
0
0
0
0
0
1
0
15
0
0
0
0.5
0.5
0
0
0
0
0
0
0
0
0
1
Z ' J
J 'W
W 'W
Z 'W
W'Z
1
Z ' Z A
J'Z
u
m
g *
J' y
W ' y ,
Z ' y
em que: 1
e2
; g2* : varincia aditiva
2
g*
Solues
Mdia Geral
7.2713
3.7856
-0.2374
-0.0725
-0.4294
-0.0405
-0.3014
0.1377
0.2455
0.5906
0.1377
1.2655
-0.1734
-1.1225
-0.1549
-0.3334
-0.1709
130
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Predies
Indivduo 1
10.820
Indivduo 2
14.770
Indivduo 3
10.628
Indivduo 4
14.802
Indivduo 5
10.756
Indivduo 6
7.409
Indivduo 7
15.088
Indivduo 8
11.648
Indivduo 9
7.409
Indivduo 10
16.108
Indivduo 11
10.884
Indivduo 12
13.720
Indivduo 13
10.902
Indivduo 14
14.509
Indivduo 15
7.100
i 1
131
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
132
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
133
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
A razo pela qual uma limitada frao da variao gentica explicada pelos
QTLs identificados refere-se aos baixos nveis de significncia adotados na deteco,
visando evitar a deteco de muitos falsos positivos, quando se avalia muitas
posies para a presena de QTL. Relaxados nveis de significncia, da ordem de 20
% a 40 %, tm maximizado o ganho gentico com a MAS (Hospital et al., 1997).
Esses nveis de significncia conduzem ao uso na seleo de um maior nmero de
locos, detectados como significativos. Bernardo e Yu (2007) obtiveram resultados
similares.
134
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
135
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
A seleo gentica tem sido praticada pelo procedimento BLUP (em suas
verses frequentista e bayesiana) usando dados fenotpicos avaliados a campo. Uma
primeira proposio realizada para aumentar a eficincia desse procedimento baseado
em dados fenotpicos foi descrita por Lande & Thompson (1990), por meio da seleo
auxiliada por marcadores (MAS) moleculares. A MAS utiliza simultaneamente
dados fenotpicos e dados de marcadores moleculares em ligao gnica prxima com
alguns locos controladores de caractersticas quantitativas (QTL). Em geral, os dados
de marcadores so utilizados como covariveis (efeitos fixos) na explicao dos
valores fenotpicos dos indivduos em avaliao ou como efeitos aleatrios
incorporados no modelo para o fentipo (Fernando e Grossman, 1989). Esses
marcadores so eleitos ou no como determinantes dos efeitos de QTLs aps
modelagem estatstica sujeita a erros do tipo II (probabilidade de aceitar uma
hiptese falsa, ou seja, tomar como verdadeira uma hiptese falsa de ausncia de
efeitos).
A seleo baseada na MAS apresenta as seguintes caractersticas: requer o
estabelecimento (anlise de ligao) de associaes marcadores-QTLs para cada
famlia em avaliao, ou seja, essas associaes apresentam utilidade para seleo
apenas dentro de cada famlia mapeada; para ser til precisa explicar grande parte da
variao gentica de uma caracterstica quantitativa, que governada por muitos
locos de pequenos efeitos. Isto no tem sido observado na prtica, exatamente em
funo da natureza polignica e alta influncia ambiental nos caracteres
quantitativos, fato que conduz deteco apenas de um pequeno nmero de QTLs de
grandes efeitos, os quais no explicam suficientemente toda a variao gentica; s
apresenta superioridade considervel em relao seleo baseada em dados
fenotpicos, quando o tamanho de famlia avaliado e genotipado muito grande (da
ordem de 500 ou mais). Em funo desses aspectos, a implementao da MAS tem
sido limitada e os ganhos em eficincia muito reduzidos (Dekkers, 2004).
O atrativo da gentica molecular em benefcio do melhoramento gentico
aplicado a utilizao direta das informaes de DNA na seleo, de forma a
permitir alta eficincia seletiva, grande rapidez na obteno de ganhos genticos com
a seleo e baixo custo, em comparao com a tradicional seleo baseada em dados
fenotpicos. Visando a esses objetivos, Meuwissen et al. (2001) propuseram um novo
mtodo de seleo denominado seleo genmica (GS) ou seleo genmica ampla
(genome wide selection GWS) ou seleo genmica total (whole genome selection
WGS), a qual pode ser aplicada em todas as famlias em avaliao nos programas de
melhoramento gentico, apresenta alta acurcia seletiva para a seleo baseada
exclusivamente em marcadores (aps terem seus efeitos genticos estimados a partir
de dados fenotpicos em uma amostra da populao de seleo) e no exige prvio
conhecimento das posies (mapa) dos QTLs, no estando sujeita aos erros tipo II
associados seleo de marcadores ligados a QTLs.
136
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Esse mtodo permaneceu discreto por cerca de seis anos, devido ao fato dos
marcadores moleculares disponveis poca serem caros e restritos. Recentemente,
com o desenvolvimento e baixo custo dos marcadores tipo SNP (single nucleotide
polymorphism), o mtodo tornou-se atrativo (Meuwissen, 2007; Goddard & Hayes,
2007; Fernando et al., 2007; Resende 2007; Bernardo e Yu, 2007). A GWS permite a
predio de valores genticos genmicos e excelente para caracteres de baixa
herdabilidade, ao contrrio da MAS, que no til para caracteres de baixa
herdabilidade.
A analise de QTL baseia-se na deteco, mapeamento e uso de QTLs na
seleo (MAS). Ou seja, enfatiza a determinao do nmero, posio e efeitos dos
QTLs marcados. A GWS definida como a seleo simultnea para centenas ou
milhares de marcadores, os quais cobrem o genoma de uma maneira densa, de forma
que todos os genes de um carter quantitativo estejam em desequilbrio de ligao
com pelo menos uma parte dos marcadores. Esses marcadores em desequilbrio de
ligao com os QTLs, tanto de grandes quanto de pequenos efeitos, explicaro quase
a totalidade da variao gentica de um carter quantitativo. O nmero de SNPs de
tal magnitude que a probabilidade de se encontrar um QTL em desequilbrio de
ligao com pelo menos um marcador muito alta. Este aspecto importante uma
vez que somente os marcadores em desequilbrio de ligao com os QTLs sero teis
na determinao dos fentipos e na explicao da variao gentica. Os efeitos dos
marcadores so estimados em uma amostra de indivduos pertencentes a vrias
famlias. Assim, o impacto de determinadas famlias especficas (com especficos
padres de desequilbrio de ligao) nas estimativas dos efeitos dos marcadores ser
minimizado. importante enfatizar que os marcadores tero seus efeitos genticos
estimados a partir de uma amostra de pelo menos 1.000 indivduos genotipados e
fenotipados, ou seja, com base em pelo menos 1.000 repeties experimentais de cada
loco. Assim, embora a herdabilidade de cada marcador efetivo (aquele que identifica
um dos poligenes com preciso) seja muito baixa, com 1.000 repeties essa
herdabilidade se torna alta. Em outras palavras, o efeito de ambiente ser
minimizado por meio do uso de um nmero de repeties muito alto. Essa a mesma
filosofia da avaliao e seleo de caractersticas quantitativas com base em fentipos
em experimentos de campo, implantados com grande nmero de repeties.
A GWS ampla porque atua em todo o genoma, capturando todos os genes
que afetam um carter quantitativo. E isso sem a necessidade prvia de identificar os
marcadores com efeitos significativos e de mapear QTLs, como no caso da MAS.
Valores genticos genmicos associados a cada marcador ou alelo so usados para
fornecer o valor gentico genmico global de cada indivduo. H uma diferena
bsica na predio de valores genticos tradicionais e na predio de valores genticos
genmicos. Nos primeiros, informaes fenotpicas so utilizadas visando a
inferncias sobre os efeitos dos gentipos dos indivduos e, nos ltimos, informaes
genotpicas (gentipos para os alelos marcadores) so usadas visando a inferncias
sobre os valores fenotpicos futuros (ou valores genticos genmicos preditos) dos
indivduos. Em outras palavras, os mtodos tradicionais usam o fentipo para inferir
sobre o efeito do gentipo e a GWS usa o gentipo, com efeito gentico pr-estimado
em uma amostra da populao, para inferir sobre o fentipo a ser expresso nos
candidatos seleo.
137
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
138
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
dada
por
2
2
1/ 2
2
2
2
rq q ( rmq rm m ) rmq ( Nh m ) /[1 ( N 1) h m ] . Com ajuste dos efeitos polignicos
residuais no modelo de predio tem-se h m2 ( rmq2 h 2 / n Q ) /( rmq2 h 2 (1 h 2 )) . Sem
ajuste dos efeitos polignicos residuais tem-se h m2 ( rmq2 h 2 / n Q ) , em que h 2 a
herdabilidade individual no sentido restrito do carter, hm2 a herdabilidade
2
individual de um loco, N o nmero de indivduos genotipados e fenotipados, rmq
139
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
desequilbrio
rmq2 E ( r 2 )
ligao
(Sved, 1971) ou
de
1S
e
N
4
2
E (r 2 )
rmq
magnitude
1 Se
N
4
quantificada
por
O
(Tenesa et al., 2007).
2
rmq
( Nh m2 ) /[1 ( N 1) h m2 ]
2
2
2
rmq
( Nrmq
h 2 / n Q ) /[1 ( N 1) rmq
h 2 / nQ ]
140
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
100
0,06
0,18
0,27
0,36
200
0,09
0,24
0,36
0,47
500
0,13
0,33
0,48
0,61
1000
0,17
0,40
0,57
0,70
2000
0,21
0,46
0,62
0,76
4000
0,25
0,50
0,66
0,79
8000
0,28
0,52
0,68
0,81
*Acurcia mxima para a seleo de indivduos pelo BLUP tradicional na idade adulta = 0.70
0,44
0,57
0,72
0,81
0,87
0,91
0,93
0,70
0,70
0,70
0,70
0,70
0,79
0,79
0,79
0,79
0,79
4
4
4
4
4
Temp
Genmica
(TG)
Eficincia
(AG TF)/(AF TG)
Superioridade %
4
3
2
1
0,5
1,13
1,50
2,26
4,51
9,03
13
50
126
351
803
141
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
( N 1)
1
N
rg g
2
2
rmq
h 2 / nQ )
( Nr mq
2
h 2 / nQ
1 ( N 1) rmq
2
2
rmq
( Nr mq
h 2 / nQ )
2
1 Nr mq
h 2 / nQ
g g
1
2
Nr mq
h 2 / nQ
r2 .
igual raiz quadrada de mq
2
2
para se aumentar a acurcia. E rmq
rmq
, donde se verifica que o seu aumento s pode ser
e
nm M e
nm
rg g
Rearranjando
, tem-se
1
Nr h 2 / n Q
rg g 1 /(
nQ
1
)
2
2
, donde se
)2 h 2
rmq N ( rmq
2
mq
Se r2mq = 1,
rg g 1 /(1
1
)
Nh / n Q
2
nQ
e a acurcia depende apenas de um
Se r2mq = 1 e se h2 = 1: rgg 1 /(1 N )
tamanho amostral N de indivduos suficiente para estimar efeitos de nQ genes. Se
nQ
2
)2
N ( rmq
n
Q
Nh
nm )2
]
2
nm
Me
nm
rg g 1 /[1
2
m
Substituindo rmq n m M e na expresso da acurcia e rearranjando chega-se a
142
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Considerando
al.
nm
(2009)
tem-se
L
e
N
4
conforme
Ln( 2 Ne )
L
e
N
2
rg g 1 /[1
et
L
e
N
4
Hayes
L
Ne
4
nm )
Nh [ Ln ( 2 Ne )]
nm
expresso
final
L
Ne
4
nm
nm M e
2
rmq
L
e
N
14
, e, portanto,
L
Ne
4
nm
segmentos
corrigidos
1
ou
Var(W ) 2 p(1 p )
Ln( 2 Ne)
nQ M e Var (W ) M e [ 2 p (1 p )]
L
Ne
2
, em que
o nmero total de segmentos cromossmicos (a serem marcados) e
L/nm = S. Hayes et al. (2009) consideram
como o nmero efetivo (de
Ln( 2 N e ) Ln( 2 N e )
para
mesmo
tamanho
frequncia,
em
que
Nh 2
nm
1 /[1
nm
L
e
N
4
L
e
N
2
rg g
nm
n
Q
L
e
N
4
ou
nQ
2
rg g 1 /[1
Nh
nm )2
nm
1 /(1
nm
L
e
N
2
L
e
N
2
rg g
x
a
Se nQ Ne
Nh 2
rg g
1 /(1
nQ
nm
nQ
Nh 2
ou
[
/
L
Ne
2
e
M
Ln ( Ne L / k ) .
Quanto maior o tamanho L / k do cromossomo, melhor (mais marcadores no
cromossomo ajudando a capturar o mesmo QTL). Nesse caso, tem-se:
m
[
/
L
e
N
2
rmq2
Ln ( Ne L / k )]
143
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
e
M
1
Me
Nh 2
nm
equivale a
rgg 1 /[1
nm
1 /[1
nm
nm )2
nm
L
e
N
2
L
e
N
2
L
e
N
2
rg g
Me
Nh 2
e
M
n
Q
e
M
nm
e
M
e
M
rgg 1 /[1
Nh 2
nm )2
nm
rmq
rg g
2
2
1 4 N e L / nm
(2008)
1 ( N 1) rmq h / nQ
nm
nm M e
Daetwyler
et
al.
(2008)
Goddard
(2009)
Hayes et
al. (2009)
Goddard
et al. (2011)
Nh 2 / n Q
rg g
rg g
Nh 2 / n Q
1 Nh 2 / n Q
1 /(1
Nh / n Q
1 Nh / n Q
rg g
Nh 2
nQ
Nh 2
rg g
nQ
1 /(1
1 Nh 2 / n Q
1 /(1
2
rmq
1
Nh
e2
e2 (1 h 2 ) y2
2
ou nQ suposto y 1
conforme
a
herdabilidade
e2 y2
nQ suposto
e2 1
2
rmq
1
nQ
nQ
Me
2
rmq
1
2
2
rmq
( Nr mq
h 2 / nQ )
2
1 Nr mq
h 2 / nQ
M e 2 Ne L
nm
nm M e
2
rmq
2 Ne L
Ln(4 Ne L)
Me
2 Ne L
Ln( Ne L / c)
nQ
Me
Ln(2 Ne )
e2 y2
nQ
Me
Ln(2 Ne )
e2 y2
e2 1
e2 1
nQ M e
e2 y2
e2 1
rg g
2
2
rmq
( Nr mq
h 2 / nQ )
1 /[1
rg g
1 /[1
nm
nm
nm
Nh [ Ln ( 2 Ne )]
Nh
]
nm )2
L
e
N
2
L
e
N
2
1 /[1
L
e
N
2
r gg
nm )2
L
e
N
4
Nh
L
e
N
2
L
e
N
4
nm
n
Q
rg g
2
1 ( N 1) rmq
h 2 / nQ
nm
nm )2
nm
144
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
nm
3000
5000
10000
15000
20000
30000
r2mq
0.74
0.83
0.91
0.94
0.95
0.97
30
30
30
30
30
30
190.5
190.5
190.5
190.5
190.5
190.5
3000
5000
10000
15000
20000
30000
0.66
0.76
0.87
0.91
0.93
0.95
50
50
50
50
50
50
282.3
282.3
282.3
282.3
282.3
282.3
3000
5000
10000
15000
20000
30000
0.54
0.66
0.79
0.85
0.88
0.92
100
100
100
100
100
100
490.7
490.7
490.7
490.7
490.7
490.7
3000
5000
10000
15000
20000
30000
0.37
0.49
0.66
0.74
0.79
0.85
200
200
200
200
200
200
867.9
867.9
867.9
867.9
867.9
867.9
3000
5000
10000
15000
20000
30000
0.22
0.32
0.49
0.59
0.66
0.74
145
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
0.1
0.2
0.3
0.4
0.5
0.6
2000
2000
2000
2000
2000
2000
10000
10000
10000
10000
10000
10000
0.37
0.48
0.54
0.58
0.61
0.64
0.1
0.2
0.3
0.4
0.5
0.6
2000
2000
2000
2000
2000
2000
20000
20000
20000
20000
20000
20000
0.44
0.56
0.63
0.67
0.70
0.72
0.1
0.2
0.3
0.4
0.5
0.6
10000
10000
10000
10000
10000
10000
10000
10000
10000
10000
10000
10000
0.61
0.69
0.73
0.74
0.76
0.76
0.1
0.2
0.3
0.4
0.5
0.6
10000
10000
10000
10000
10000
10000
20000
20000
20000
20000
20000
20000
0.70
0.78
0.81
0.83
0.84
0.85
Herdabilidade
Massal
0.1
0.2
0.3
0.4
0.5
0.6
0.277
0.392
0.481
0.555
0.620
0.680
Entre e
Dentro*
0.494
0.547
0.583
0.614
0.642
0.670
Blup
Individual
0.592
0.635
0.663
0.688
0.713
0.740
GWS1
GWS2
1.55
1.96
2.19
2.35
2.46
2.54
2.46
2.73
2.85
2.91
2.95
2.98
GWS1: Seleo Genmica Ampla usando 2.000 indivduos genotipados para 20.000 marcas;
GWS2: Seleo Genmica Ampla usando 10.000 indivduos genotipados para 20.000 marcas.
* de Famlias.
146
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
147
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
y = 1u + Xm + e
148
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
149
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Varincias
Var ( g V ) g2V
Var ( y c ) y2c g2 e2 g2 / h c2
C.
Correlao
gV
Acurcia
rg g rgf / h c
F.
Confiabilidade
rg2g ( rgf / h c ) 2
150
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
151
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Um mtodo ideal para GWS deve contemplar trs atributos: (i) acomodar a
arquitetura gentica do carter em termos de genes de pequenos e grandes efeitos e
suas distribuies; (ii) realizar a regularizao do processo de estimao em presena
de multicolinearidade e grande nmero de marcadores, usando para isso estimadores
do tipo shrinkage; (iii) realizar a seleo de covariveis (marcadores) que afetam a
caracterstica em anlise. O problema principal da GWS a estimao de um grande
nmero de efeitos a partir de um limitado nmero de observaes e tambm as
colinearidades advindas do desequilbrio de ligao entre os marcadores. Os
estimadores do tipo shrinkage lidam adequadamente com isso, tratando os efeitos de
marcadores como variveis aleatrias e estimando-os simultaneamente (Resende et
al., 2008). Os principais mtodos para a GWS (Tabela 25) podem ser divididos em
trs grandes classes: regresso explcita, implcita e com reduo dimensional. Na
primeira classe, destacam-se os mtodos RR-BLUP, LASSO (Least Absolute Shrinkage
and Selection Operator), Rede Elstica (Elastic Net EN), BayesA e BayesB, dentre
outros. Na classe de regresso implcita, citam-se os mtodos de redes neurais,
RKHS (Reproducing Kernel Hilbert Spaces, que um mtodo semi-paramtrico
(Gianola; Campos, 2009) e regresso kernel no paramtrica via modelos aditivos
generalizados (Gianola et al., 2006). Dentre os mtodos de regresso com reduo
dimensional, destacam-se o de componentes independentes, quadrados mnimos
parciais e de componentes principais.
Tabela 25. Classificao dos Mtodos para GWS
Classe
Regresso explcita
Famlia
Mtodos de estimao
penalizada
(Regresso
linear)
Mtodo
RR-BLUP/GWS
LASSO
EN
RR-BLUP-Het/GWS
Mtodos de estimao
bayesiana
(Regresso
no linear)
BayesA
BayesB
Fast BayesB
BayesC
BayesD
BLASSO
IBLASSO
Regresso implcita
Regresso
com
reduo dimensional
Atributos
Regularizao
Arquitetura gentica homognea
Seleo indireta de covariveis
Regularizao
Arquitetura
gentica
homognea
Seleo direta de covariveis
Regularizao
Arquitetura gentica homognea
Seleo direta de covariveis
Regularizao
Arquitetura gentica flexvel
Seleo indireta de covariveis
Regularizao
Arquitetura gentica flexvel
Seleo indireta de covariveis
Regularizao
Arquitetura gentica flexvel
Seleo direcionada de covariveis
Regularizao
Arquitetura gentica flexvel
Seleo direcionada de covariveis
Regularizao
Arquitetura
gentica
homognea
Seleo direta de covariveis
Regularizao
Arquitetura gentica flexvel
Seleo direta de covariveis
Regularizao
Arquitetura gentica flexvel
Seleo direta de covariveis
Regularizao
Arquitetura gentica flexvel
Seleo direta de covariveis
Regresso Kernel
RKHS
Redes neurais
Quadrados mnimos parciais
Componentes principais
Componentes Independentes
152
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
153
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
154
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
155
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
significncia para marcas individuais. Isto contrasta com o mtodo da MAS proposto
por Lande e Thompson (1990). Uma comparao entre as trs proposies pode ser
vista na Tabela 26.
Tabela 26. Comparao entre as trs proposies de seleo auxiliada por marcadores.
Autores
Mtodo
Populao
Nmero de
Marcadores (m)
Teste de
Significncia
Extenso para
o Enfoque
Bayesiano
Lande e
Thompson (1990)
Dentro de famlia
ou cruzamento
No
No
No
Meuwissen et al.
(2001)
GWS RRBLUP
Sim
Whittaker et al.
(2000)
MAS Indice
de Seleo
Reg. Mult.
MAS Ridge
Regression
No
Sim
Dentro de famlia
ou cruzamento
Toda a Populao
Verifica-se pela Tabela 26, que a inovao de Meuwissen et al. (2001) no foi
em termos de metodologia estatstica mas, em termos conceituais enfatizando o uso
do conceito de desequilbrio de ligao em nvel populacional e no apenas dentro de
famlia e o no uso de testes de significncia para marcas. E o maior mrito foi a
demonstrao, via simulao, do fato de que a GWS pode realmente funcionar na
prtica.
A GWS enfatiza tambm o no uso de significncia estatstica para a seleo de
marcas. Esse ponto distingue a GWS da GWAS (Genome Wide Association
Studies), a qual procura associao entre locos e carter fenotpico em nvel
populacional, por meio de testes de hipteses visando detectar efeitos com
significncia estatstica. A GWAS sofre com a alta taxa de falsos negativos devido
ao uso de pontos de corte muito rigorosos visando evitar a ocorrncia de falsos
positivos. A GWS equivale GWAS aplicada sobre todos os locos simultaneamente
e baseando-se em estimao e predio em vez de teste de hiptese. Dessa forma
consegue explicar parte muito maior da variabilidade gentica e evitar a chamada
herdabilidade faltante ou perdida (missing heritability), tpica dos estudos de anlise
de ligao e de associao.
A distino entre regresso fixa, regresso ridge e regresso aleatria, em um
modelo usando somente fentipos, est associada ao parmetro de penalizao *, o
qual dado por * (1 h 2 ) / h 2 . Valores pequenos de * j so suficientes para reduzir
o impacto da multicolinearidade presente entre as covariveis na matriz WW, que
aproximadamente singular. Valor de * igual a zero (valor de h2 igual a 1) caracteriza
a regresso fixa. Valores de * pequenos (0,01 a 1) caracterizam a regresso ridge e
valores altos de * (maiores que 0,1) caracterizam a regresso aleatria.
A predio via RR-BLUP descrita a seguir com base em Resende (2007;
2008). O seguinte modelo linear misto geral ajustado para estimar os efeitos dos
marcadores: y = Xb + Wm + e, em que y o vetor de observaes fenotpicas, b o
vetor de efeitos fixos, m o vetor dos efeitos aleatrios de marcadores e e refere-se ao
156
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
e2 b X ' y .
W ' X W 'W I ( 2 / n ) m
W ' y
g
Q
VGG y j wij m i
dada por n Q 2 p i (1 p i ) .
i
157
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
158
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
( g2 / nQ )
(ii) Via BLP ou ndice de seleo (com G genmica e b estimado via quadrados
mnimos generalizados, o que garantido quando y contem valores
genticos desregressados), em que: g G[G R( e2 / g2 )]1 ( y Xb) . Se
necessrio os efeitos dos marcadores podem ser obtidos por
n
Com
I,
uma
159
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Parametrizao 1
A matriz de incidncia W contm os valores 0, 1 e 2 para o nmero de alelos do
marcador (ou do suposto QTL) em um indivduo diplide. Com marcadores
codominantes a mdia e varincia da varivel indicadora W associada matriz de
incidncia so dadas por:
2
2
Mdia da varivel W = 0 x p + 1 x 2p(1-p) + 2 x (1-p) = 2p
2
2
2
Varincia da varivel W = Var (Z) = Var (Zi) = (0 2p) x p + (1 2p) x 2p(12
2
p) + (2 - 2p) x (1-p) = 2p(1-p)
Assumindo os alelos de cada marca como em equilbrio de Hardy-Weinberg
na populao, o clculo das frequncias allicas realizado conforme o quadro a
seguir, sendo p dado por p = N2/N + (1/2) N1/N, sendo o calculo realizado para cada
coluna de marcador no arquivo de dados em que N2 o numero de cdigos 2 na
referida coluna no arquivo.
Gentipos
Cdigo
Contagem
Frequencia
Clculo da Frequencia de M
MM
Mm
mm
2
1
0
N2
N1
N0
p2
2p(1-p)
(1-p)2
N2/N = p2
(1/2) N1/N = p(1-p)
0
Soma
Os valores de W devem ser centrados em zero para que os efeitos das marcas
codominantes sejam efeitos de substituio allica com mdia zero na populao, e,
nesse caso, assumindo equilbrio de Hardy-Weinberg, a variao gentica aditiva do
m
dados por g W m . Para os indivduos com dados perdidos de marcas, seus valores
na matriz W devem ser o valor esperado 2p, que, centrados, transformam-se em
zero.
importante relatar que os efeitos dos QTLs via marcadores m so
assumidos com distribuio normal ( m ~ (0, I m2 ) ) e os alelos marcadores so
assumidos como amostras de uma distribuio Bernoulli com mdia p e varincia
p(1-p). O nmero de alelos em um indivduo diploide (varivel W) apresenta
distribuio Binomial com mdia 2p e varincia 2p(1-p) (2 provas Bernoulli).
Parametrizao 2
Adicionalmente, pode-se padronizar (usando Var (Wi ) 2 pi ( 1 pi ) ) os dados
dos marcadores na matriz W, da seguinte forma para cada elemento Wi da matriz,
referente ao loco i:
160
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
G WW ' /[2 pi (1 pi )] ,
Parametrizao 3
Em outra parametrizao, a matriz de incidncia X contm os valores -1, 0 e 1
para o nmero de alelos do marcador (ou do suposto QTL) em um indivduo
diploide, ou seja, para os gentipos mm, Mm e MM, respectivamente. Essa
parametrizao ligeiramente inferior anterior (Legarra et al., 2011). Para essa
parametrizao deve-se usar, no mtodo RR-BLUP, n = 2 p ( 1 p ) e o efeito gentico
aditivo
g j
do
[I (w
ij
indivduo
dado
por
1)( 2 p i m i ) I ( w ij 0 )( p i m i q i m i ) I ( w ij 1)( 2 q i m i ) .
Var ( g )
Var ( g ) 0 .125 / n m ,
em que
0 .05 2
se Var ( g ) 0 . 05 2 ( bovinos )
0 .05 0 .125 / n m
2
161
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
162
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Z i' Z i 2* g i yi
2*
2
* (1 h 2 ) / h 2 , em que h a herdabilidade ao nvel de indivduo.
'
Z gm
Z gm : contedo de informao associado mdia dos genitores.
'
Z gm
Z gm * (0.5 4) 0.5* ( 2 16 / )1 / 2 , em que:
2
1/(0.5 rgm
)
2
(0.5 rgm
) /(1 ri2 )
2
rgm
(rgj2 rgk2 ) / 4 : confiabilidade associada ao valor gentico mdio predito dos
genitores j e k.
ri2 : confiabilidade associada ao valor gentico predito do indivduo.
(iii) Obteno da quantidade desconhecida Z i' Zi :
'
Z i' Z i Z gm
Z gm 2* (2 1)
(iv) Obteno da quantidade desconhecida yi :
'
Z gm
Z gm 4*
2*
2* g gm y gm
. Assim,
Z i' Z i 2* g i yi
163
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
g gm ( g j g k ) / 2 (13 5) / 2 9 ;
* (1 h 2 ) / h 2 0.8 / 0.2 4 ;
2
1/(0.5 rgm
) 1/(0.5 0.425) 13.3333;
2
(0.5 rgm
) /(1 ri2 ) (0.5 0.425) /(1 0.70) 0.25.
'
Com base nesses valores e seguindo o passo (ii) calcula-se Z gm
Z gm :
'
Z gm
Z gm * (0.5 4) 0.5* ( 2 16 / )1/ 2 4(0.5 13.3333 4) 0.5 4(13.33332 16 / 0.25)1/ 2 41.765
quantidade
seus
genitores
e
desregressado
pela
quantidade
*
'
*
*
ri 1 /(Z i Z i ) 1 4 /(6.4412 4) 0.6169, que a acurcia da estimao
do efeito da segregao mendeliana.
2*
164
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
C UV ( U iV i ) / n ( U i / n )( V i ) / n )
magnitudes
n
U V
i
nC UV
Sendo
dos
efeitos
allicos. Rearranjando
n
( U i )( V i ) / n ) , de forma que 2 U V
n
( m i2 ) / n m2
essa
i
, tem-se g2
[ 2 p i (1 p i ) m2 ] nC UV
expresso
n
nC UV [ 2 p i (1
i
tem-se
p )] ( m 2 ) / n .
n
g2 [ 2 p i (1 p i ) m2 ]
usam
varincia
entre
marcadores
dada
por
m2 ( g2 nC UV ) /[ 2 p i (1 p i ) ]
Na
RR-BLUP/GWS
necessita-se
da
quantidade
/ /( / nQ ) , em que nQ o nmero de locos controlando o carter
(assumindo que cada loco est perfeitamente marcado), o qual desconhecido a
2
e
predio
2
gi
2
e
2
g
Alternativamente,
n
pode
ser
expresso
como
allicas nos locos marcadores, obtm-se para uso nas equaes de modelo misto.
A varincia gentica e a herdabilidade (h2) podem ser computadas via dados
fenotpicos ou via dados de marcadores e fenotpicos conforme descrito acima no
165
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
166
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Dimetro
Marca 1
Marca 2
Marca 3
Marca 4
Marca 5
Marca 6
Marca 7
9.87
14.48
8.91
14.64
9.55
e2 b X ' y .
W ' X W ' W I 2
( g / nQ ) m W ' y
W 0
1
1
1
2
0
0
0
0
1
0
1
0
0
0
2 y
0
0
9.87
14.48
;
8.91
14.64
9.55
W 'W I
3 1 1 5
8 1 1 1 7
1 6
0 1 1
1 0
1 0
2
0
0 1 0
2 1 1
7 1 1
1 8 2
2 1 0 1
0
4
0
0
0
5
1
1
.
X 1
1
1
e2
( g2 / nQ )
Xy = [57.45]
W' y
= 1, tem-se
3 1 1 5
2]'
58.4100
32.3000
14.6400
9.5500
58.4100
24.0300
17.8200
167
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Assim, tem-se:
b
m
3 1 1 5
8 1 1 1 7
3 1 6
0 1 1
1 1 0 2 0 1 0
1 1 0 0 2 1 1
5 7 1 1 1 8 2
2
2 1 0 1
Os resultados
so
b
m
2
0
0
0
0
0
-1
57.4500
58.4100
32.3000 .
14.6400
9.5500
58.4100
24.0300
17.8200
12.4519
- 0.3526
0.2761 ,
1.4467
- 1.3701
- 0.3526
0.5436
- 1.63765
so
VGG
- 1.4104
0.1145 .
- 2.7230
0.7415
- 1.5317
indivduos aos alelos do loco j, e q contm os efeitos allicos para cada loco. As
matrizes de incidncia Q no so conhecidas e nem as suas dimenses, dadas pelo
nmero de alelos em cada loco. Tambm no conhecido o nmero de locos que
afeta o carter. Isto contrasta com o primeiro modelo, em que as matrizes de
incidncia para b e g (X e Z, respectivamente) so conhecidas. Se Q fosse conhecida
as equaes de modelo misto poderiam ser usadas sem qualquer alterao.
168
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Modelo GWS
Um outro modelo melhor poderia ser y Xb Q j q j e , no qual todos os locos
j
X' X
Z' X
k = 2 pi ( 1 p i ) .
X'Z
2 b X ' y ,
Z ' Z G e2 g Z ' y
g
1
em que
[2 pi ( 1 pi ) ] 1/ 2 )
169
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
efeitos de SNPs. Visando contornar essa suposio, Gianola et al. (2009) sugeriram o
seguinte parmetro de escala:
n
k ( p 0 q 0 ) 2 2 [ pi (1 pi )] / n 2 /( ) n
em que
p0 = /( + ) a
g2
2
1
1
1
GZ' R X GZ' R Z I (1 / g ) g GZ' R y
e2
'
'
GZ
X
GZ
Z
I
g2
b X ' y .
g GZ' y
X ' X
Z' X
X'Z
Z ' Z H 1
X ' y
.
b
Z
'
y
e2
g2
A11 A12
A21 G
0
0
0
G A22
0
0
1
22
A11
A
21
A12
A G
22
1
22
170
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
uso das equaes de modelo misto para a estimao dos componentes de varincia
g2 e e2 . Segundo outra parametrizao, os elementos da matriz G representam o
parentesco
realizado
n
G jk = ( 1 / n)
mdio
(wij 2p i )(wik 2p i )
2p i ( 1 pi )
i=1
multi-locos
so
dados
por
dada
por
2
g ~ N (0, G g2 ); d ~ N (0, Gd d2 ); aa ~ N (0, Gaa aa
); e ~ N (0, I e2 )
os
efeitos
2 , em que 2
covarincia Gd , com varincia d2 [2pi ( 1 pi )][1 (2pi ( 1 pi ))] md
md a
i 1
2
/ d2 entodada
varincia de dominncia contribuda por um loco m. A relao md
n
2
por md
/ d2 1 / [2p i ( 1 p i )][1 ( 2p i ( 1 p i ))] .
i 1
171
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
2
2
Sendo Var( Smd ) SS ' md
e pelo modelo equivalente Gd d2 Var( Smd ) SS ' md
,
2
2
a matriz de parentesco de dominncia , ento, dada por Gd SS ' md / d . Sendo
n
i 1
i 1
2
md
/ d2 1 / [2p i ( 1 p i )][1 ( 2p i ( 1 p i ))] , tem-se Gd SS ' / [2p i ( 1 pi )][1 ( 2p i ( 1 pi ))] .
Gd jk = ( 1 / n)
i=1
Z' X
Z X
X'Z
X Z
2
Z ' Z G e2
g
ZZ
ZZ
ZZ Gge1
e2
ge2
b X ' y ,
g Z ' y
ge Z
em que:
do loco i e W* refere-se matriz W corrigida para suas mdias em cada loco (2pi). A
matriz D dada por diag(D) = (12 ... n2 ) e os elementos i2 podem ser obtidos pelos
mtodos IBLASSO, BLASSO, BayesA, BayesB, etc. Essa abordagem apresenta
tambm os seguintes pontos favorveis: (i) permite a anlise simultnea de
indivduos genotipados e no genotipados; (ii) permite o cmputo direto da acurcia
seletiva via inverso da matriz dos coeficientes das equaes de modelo misto; (iii) a
matriz D pode ser estimada em apenas uma amostra da populao e ser usada em
toda a populao de seleo e em vrias geraes; (iv) permite considerar a
heterogeneidade de varincia gentica entre marcadores.
172
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
173
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Isso implica E ( | w , y ) [ p ( ) p ( y | , w ) d ] /[ p ( ) p ( y | , w ) d ] , em
que p( ) a funo densidade de probabilidade de e p(y | , w) a funo de
verossimilhana de y.
Assim, a predio de y depende de p( ) , ou seja, da distribuio dos efeitos
(via LD com os QTLs) dos marcadores. Essa distribuio pode ser tratada como
informao ou distribuio a priori no contexto bayesiano ou como varivel aleatria
no contexto frequentista. Se ~ N( 0, 2 ) , BLUP de e y BLUP de y. Isto
implica que os efeitos de todos os marcadores so tomados da mesma distribuio.
2
i=1
regresso via
i =1
2
i
um maior custo para de grande valor, levando-o a encolher mais. Ocorre ento a
n
minimizao da soma de quadrados dos resduos, sujeita restrio i2 t . A
i=1
i=1
i=1
n
minimizao de ( 1 / N) (y j wij i )2 + L | i | , em que | i | a soma dos valores
i=1
i=1
i=1
174
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
RR = argmin (y j wij i )2 + RR i2
i=1
i=1
175
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
RR i2
i 1
Caractersticas:
- Mantm todas as covariveis, conduzindo a modelos complexos.
- Produz bons resultados para o caso de muitos marcadores de pequenos efeitos.
- Previne problema de multicolinearidade (que conduziria a estimativas imprecisas)
entre marcadores correlacionados.
- Regressa os coeficientes de preditores correlacionados igualmente na direo de
zero e de cada um.
n
2
i
a norma de penalizao em .
i =1
L = argmin (y j wij i )2 + L | i |
i=1
i=1
Funo de penalizao:
n
L | i |
i=1
176
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Caractersticas:
- Mantm as covariveis mais significativas e remove as demais.
-
| | a norma de penalizao em
i
i=1
zero. Essa formulao do regularizador faz com que o Lasso regresse de forma
mais forte que o RR-BLUP, conduzindo alguns coeficientes a zero.
- Instvel com dados de alta dimenso, pois no pode selecionar mais covariveis (n)
do que do que o tamanho amostral (N) e, nesse caso, seleciona arbitrariamente um
membro de um grupo de covariveis altamente correlacionadas.
- No possui a propriedade orculo ou de retido, que se refere a coeficientes no zero
assintoticamente no viesados, normalidade assinttica e seleo consistente de
covariveis medida que N e n tendem a infinito.
- O mtodo Lasso adaptativo foi proposto visando atingir a propriedade orculo, mas
mantm a instabilidade com dados de alta dimenso.
c. Rede elstica (EN)
Funo objetivo a ser minimizada:
n
n
N
n
EN = argmin (y j wij i )2 + EN i2 + ( 1 )| i |
i=1
i=1
i=1
Funo de Penalizao:
n
n
EN i2 + ( 1 )| i | ou
i=1
i=1
n
EN | i |q
i=1
Caractersticas:
- Se 0 , EN = LASSO ou se q = 1, EN = LASSO.
- Se 1 , EN = RR ou se q = 2, EN = RR.
- Se 1 q 2 tem-se EN.
- varia entre 0 e 1 e maior que 0.
177
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Densidade
Figura 3. Densidades das distribuies normal (curva pontilhada) e exponencial dupla (curva
cheia), ambas com mdias iguais a zero e varincias iguais unidade.
178
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
179
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
i2 ~ 2 ( , S 2 )
180
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
2
matemtica, para um componente de varincia genrico 2 , dada por E( 2 ) = S .
E( 2 )( 2 ) .
S =
2
genticos dos marcadores tem-se E( 2i ) = S
E( i2 ) equivale E( 2 ) =
i
g2
. Assim, S 2 =
2p ( 1 p
i
S 2 =
E( i2 )( 2 ) .
g2
n
2p ( 1 p
i
A esperana
( 2 ) , em que =
i=1
i=1
E( e2 ) =
S e2 = ~e2
S e2 e
e 2
S e2 =
E( e2 )(e 2 ) .
e
(e 2 ) ~ 2 ( 4.2 2 ) ,
= e
4.2
e
A esperana
priori de e2 .
2
Assumindo i ~ N( 0, i ) , em que i tomado de uma distribuio quiquadrado invertida, segundo o enfoque bayesiano, isso implica que grande nmero de
marcadores apresenta efeitos pequenos e poucos marcadores apresentam efeitos
grandes. O uso de uma mistura de distribuies normal e qui-quadrado invertida
conduz a uma distribuio t para e, portanto, com uma cauda mais longa que a
distribuio normal. Este mtodo pode ser implementado via amostragem de Gibbs,
para obteno dessa informao combinada (priori x verossimilhana) ou da
distribuio a posteriori das varincias.
Os mtodos associados a modelos hierrquicos bayesianos (BayesA e B) por
meio de suas formulaes em termos dos hiperparmetros propiciam varincias
especficas para cada marcador. RR-BLUP so funes lineares dos dados e
regressam as estimativas com o mesmo erro padro (mesmas frequncias allicas e
tamanho amostral) pela mesma quantidade. Prioris Gaussianas conduzem a shrinkage
homogneo atravs dos marcadores. Os mtodos bayesianos so funes no lineares
dos dados e regressam efeitos menores mais do que os maiores, ou seja, admitem
maiores herdabilidades para os maiores efeitos.
O shrinkage homogneo no desejvel, pois alguns marcadores esto ligados a
QTLs e outros no esto. Mas assumindo distribuio a priori t escalada ou dupla
exponencial para os efeitos de marcadores tem-se os mtodos BayesA e BLASSO,
respectivamente, os quais produzem shrinkage especficos de acordo com o tamanho
do efeito e da varincia do marcador.
Alm das distribuies consideradas para os efeitos aleatrios no modelo linear
frequentista e para a verossimilhana do vetor de observaes, a abordagem
181
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
e
normal
multivariada:
2
2
2
y , , e ~ N (1 W , I e ) , onde I a matriz identidade e e a varincia
residual.
Os parmetros de interesse para inferncias so: , , i2 e e2 . Para conduzir
a anlise bayesiana, torna-se necessrio especificar as distribuies a priori para
, i2 e e2 . Isto j foi realizado acima. Definidas estas distribuies, pode-se agora
escrever a distribuio conjunta a posteriori dos parmetros do modelo.
fenotpicos,
dados
u,
p ( , , 2i , e2 y ) p ( , , 2i , e2 ) p ( y , , 2i , e2 )
p ( ) p ( i 2i ) p ( 2i ) p ( e2 ) p ( y , , 2i , e2 )
N e
1
2
n
2 2 1
( y 1 W )' ( y 1 W ) e S e2
exp
2 e2
( ' S 2
exp
2 2i
S 2 + i ' i e
com
graus
de
liberdade
ou
seja
182
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
completa
P( 2i | i ) = 2 ( , S 2 + i ' i )
com
g = 4.2
e varincia
183
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
BayesB
O mtodo BayesB apresenta as mesmas suposies que o BayesA para uma
frao dos SNPs e assume que ( 1 ) dos SNPs apresenta efeitos nulos. Um
problema desse mtodo a escolha da frao . Com a seleo de covariveis
baseada nos maiores mdulos de seus efeitos estimados, os dois mtodos tendem a se
equivaler. Na prtica, o BayesA tem se mostrado superior ao BayesB com igual a
0.66 (Habier et al., 2011; Mrode et al., 2010).
Para os efeitos dos QTLs, o mtodo BayesB usa uma distribuio a priori com
2
amostragem
184
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
BayesC
Gianola et al. (2009) faz uma anlise crtica dos mtodos associados a modelos
hierrquicos bayesianos (BayesA e B) especificamente em relao s suas
formulaes em termos dos hiperparmetros que propiciam varincias especficas
para cada marcador. Segundo o autor nenhum dos mtodos permite o aprendizado
bayesiano sobre essas varincias para prosseguir para longe das prioris. Em outras
palavras, os hiperparmetros da priori para essas varincias sempre tero influncia
na extenso do shrinkage produzido nos efeitos dos marcadores. O usurio do mtodo
pode controlar a quantidade de shrinkage apenas arbitrariamente, por meio da
variao nos parmetros e S (associados distribuio qui-quadrado invertida).
Segundo os autores, o mtodo BayesB no bem formulado no contexto bayesiano.
Isto porque designar a priori que gi2 = 0 , no conduz necessariamente a gi = 0,
conforme inteno original de Meuwissen et al. (2001), em que gi o efeito gentico
do loco i. Sugere ento que o estado zero seja especificado ao nvel dos efeitos e no
ao nvel das varincias. Assim, probabilidade de mistura poderia ser atribuda
uma distribuio a priori Beta. Surge ento, o mtodo BayesC que vantajoso e
permite especificar uma distribuio a priori para , permitindo a modelagem da
distribuio dupla exponencial.
Vrios outros mtodos bayesianos foram propostos (BayesC e BayesD,
conforme Habier et al., 2011), todos eles com o propsito de permitir o aprendizado
bayesiano. Habier et al. (2011) relataram que o mtodo BayesA mostrou-se superior
na maioria das situaes, mas que nenhum dos mtodos bayesianos so claramente
superiores dentre eles; entretanto o BayesB, BayesD e especialmente o BayesC
apresentam a vantagem de propiciar informao sobre a arquitetura gentica do
carter quantitativo e identificar as posies de QTL por modelagem da frequncia
de SNP no nulos. No mtodo BayesC uma varincia comum especificada para
todos os locos. Adicionalmente, tratada como uma incgnita com distribuio a
priori uniforme (0,1) caracterizando o mtodo BayesC, que equivale ento ao
mtodo RR-BLUP com seleo de covariveis e implementado via MCMC. Tambm
se igual a zero os mtodos BayesC e RR-BLUP so iguais.
A modelagem de muito interessante para a anlise de associao. A
maioria das marcas no est em desequilbrio de ligao com os genes. Assim, a
seleo de um grupo de marcas que est em associao com o carter necessria. O
mtodo BayesB determina subjetivamente. Os mtodos BayesC e BayesD
n
modelam os efeitos genticos aditivos como a j = i xij i , em que i = ( 0,1 ) . A
i=1
185
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Parmetros que
estima
Mtodo se = 1
BayesD
a j = i wij i
i2 , i , e2 ,
BayesD
2 , i , e2 ,
BayesC
2 , i , e2
RR-BLUP bayesiano ( i = 1)
i2 , i , e2
BayesA
a j = i wij
i2 , e2
2 , e2
i=1
BayesC
a j = i wij i
i=1
BayesC
a j = i wij i
i=1
BayesB
a j = i wij i
i=1
BayesA
i=1
RR-BLUP
a j = i wij
i=1
186
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Fast BayesB
O mtodo Fast BayesB foi desenvolvido por Meuwissen et al. (2009) visando
diminuir o tempo de computao do mtodo BayesB. Esses autores derivaram um
algoritmo de esperana condicional iterativa (ICE) para estimar i por meio de
integrao analtica. Os seguintes passos devem ser adotados.
a) Calcular as observaes ajustadas, y i , que so corrigidas para os efeitos de
n
187
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
no contexto dos modelos mistos, conforme Singer et al. (2011). Isso tambm
coerente com a teoria da gentica quantitativa, que preconiza a decomposio da
variao fenotpica em variao gentica e residual.
Uma comparao entre os trs mtodos Lassos, o RR-BLUP e o RR-BLUP-Het
apresentada na Tabela 28.
Tabela 28. Caractersticas dos trs mtodos Lassos.
Mtodo
Modelo
Varincia entre
marcadores
-
y 1u W e
LASSO
Parmetro de forma
e ~ MVN (0, I )
2
e
2
e
p( e2 1, ) ( / 2) exp( )
~ ( / 2) exp[( i )
i
y 1u W e
BLASSO
Var ( ) (2 e2 ) / 2
e 2 ~ MVN (0, I 2 )
a2 = 2p i ( 1 pi )( 2 2e ) / 2
2 = ( 2 2e ) / 2
i=1
p ( 2 , ) ( / 2 ) exp[( ) / ]
p( | ) ~ N( 0, D 2 ); diag(D) = ( 12 ... n2 );
p( | ) = ( 2 / 2 )exp( 2 i2 / 2 ).
i
y 1u W e
IBLASSO
a2 = 2p i ( 1 pi ) 2 / 2
e e2 ~ MVN (0, I e2 )
2 = 2 / 2
i=1
, 2 ~ ( / 2 ) exp[( i ) / ]
i
Var ( ) 2 /
Var(i ) = i2 = i2
p( | ) = ( 2 / 2 )exp( 2 i2 / 2 ).
i
RR-BLUP
y = 1u + W + e
e | e2 ~ MVN( 0, I e2 )
2
Var() = 2
a2 = 2p i ( 1 pi ) 2
2 = ( e2 / 2 )2
i=1
| ~ MVN( 0, I )
RR-BLUPHet
y = 1u + W + e
2
e
Var(i ) = i2 = i2
i2 = ( e2 / 2i )2
2
e
e | ~ MVN( 0, I )
| , ~ MVN( 0, D)
IBLASSO
A parametrizao do IBLASSO equivalente ao do LASSO original de
Tibshirani (1996), porm, a implementao bayesiana. Outra diferena refere-se ao
fato de que a parametrizao do LASSO original assume que a matriz de incidncia
W foi padronizada. O IBLASSO no assume isso. Essa diferena pode ser observada
na descrio dos modelos apresentada na Tabela 3. A igualdade na parametrizao
advm da comparao entre os termos ( / 2 ) e ( / 2 ) . Somente a proporo
( / ) utilizada na prtica e, portanto, e no podem ser estimados
188
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Partindo-se da relao g2 = 2p i ( 1 pi ) 2
i=1
2 = 2p i ( 1 pi ) 2 / g2 .
Entretanto,
nos
modelos
hierrquicos
bayesianos
i=1
| , 2 ~ ( / 2 )exp [( i ) / ]
i
189
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
p( | ) = ( 2 / 2 )exp( 2 i2 / 2 ).
i
~
2
2
i | demais N(wi ' (y 1i ~
W i )~e2 / LHS I , 1 / LHS I ) , em que LHSi = wi ' wi ~e + i e
~
~
wi a linha de W correspondente ao efeito i e i indica todas as variveis ,
~
exceto i .
~
i2 | demais IG ( 2 / i2 )1 / 2 , 2 , em que IG refere-se a Gama Invertida.
2 | demais G m,2 / ~
2 ) , em que G refere-se a Gama com parmetro de forma
Assim, tem-se que a varincia gentica em cada loco marcador dada por i2 = i2 2 .
As distribuies condicionais a posteriori completas so conforme descrito para o
IBLASSO, porm com as seguintes modificaes:
190
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
alelos do loco i e W* refere-se matriz W corrigida para suas mdias em cada loco
(2pi). A matriz D dada por diag(D) = (12 ... n2 ) e os elementos i2 podem ser obtidos
via os mtodos IBLASSO, BLASSO, BayesA, BayesB, etc. Essa abordagem
apresenta tambm os seguintes pontos favorveis: (i) permite a anlise simultnea de
indivduos genotipados e no genotipados; (ii) permite o cmputo direto da acurcia
seletiva via inverso da matriz dos coeficientes das equaes de modelo misto; (iii) a
matriz D pode ser estimada em apenas uma amostra da populao e ser usada em
toda a populao de seleo e em vrias geraes.
Relao entre RR-BLUP, BLASSO e IBLASSO
Em presena de genes maiores, o RR-BLUP difere consideravelmente do
BLASSO e IBLASSO. Nesse caso, o IBLASSO e o RR-BLUP-Het so melhores. O
IBLASSO similar ao BayesA mas com maior shrinkage, nas marcas de menor
efeito.
Em termos de ordenamento dos candidatos seleo, tm-se as seguintes
tendncias. Com seleo indireta de covariveis nos mtodos que no o fazem
diretamente: (i) BayesA igual a BayesB; (ii) RR-BLUP igual ao Lasso em ranking,
desde que a arquitetura gentica seja homognea; (iii) RR-BLUP igual ao BayesA e
BayesB, desde que a arquitetura gentica seja homognea e as prioris utilizadas nos
mtodos bayesianos sejam no informativas; (iv) Com arquitetura gentica
heterognea, RR-BLUP-Het similar ao IBLASSO em ranking; (v) RR-BLUP
igual ao BayesC desde que as prioris utilizadas no mtodo bayesiano sejam no
informativas; (vi) RR-BLUP igual ao BayesD, desde que a arquitetura gentica
seja homognea e as prioris utilizadas no mtodo bayesiano sejam no informativas.
Se = 1, o BayesC igual ao RR-BLUP.
RR-BLUP e Lasso podem ser implementadas sob o enfoque frequentista e
bayesiano. Se prioris no informativas forem utilizadas, tem-se que RR-BLUP
frequentista semelhante ao RR-BLUP bayesiano e Lasso frequentista semelhante
ao Lasso bayesiano.
191
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
nQ = 2 pi ( 1 pi ) .
i
BL
h2 =
2 pi ( 1 pi ) m2
i
2 pi ( 1 pi ) +
i
2
m
=
2
e
2 pi ( 1 pi ) 2
i
2 pi ( 1 pi ) +
2
.
2
e
2
De forma alternativa e usando m2 = 2 / IBL
, tem-se:
192
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
h2
2 pi (1 pi ) m2
i
2 pi (1 pi ) m2 e2
i
2 pi (1 pi )2 / 2IBL
i
2 pi (1 pi )2 / 2IBL e2
i
1
n
1 e22IBL /[4 pi (1 pi )]
pois
1 /(2nQ )
2 2
e IBL
1
1
2 2
e IBL
nQ
nQ RR
RR-BLUP
(bayesiano)
BayesA
BayesB
Distribuio a priori
das varincias
qui-quadrado invertida
no informativa
Distribuio a posteriori
das varincias
qui-quadrado invertida
qui-quadrado invertida
(equivale ao BayesB
com = 0)
qui-quadrado invertida
qui-quadrado invertida
Mistura de distribuies
0 com probabilidade (1) e qui-quadrado
invertida com
probabilidade
BayesC
qui-quadrado invertida,
com distribuio
Uniforme entre 0 e 1
qui-quadrado invertida
Lassos
Exponencial Dupla
Exponencial Dupla
Gama Invertida
193
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
0.5
0.3
0.2
0.0
0.1
Densidade
0.4
Exponencial Dupla
t-Student
Normal
-10
-5
10
X
Figura 4 Funes densidade de probabilidade das distribuies exponencial dupla,
normal e t de Student, todas com mdias iguais a zero e varincias iguais unidade
(Resende Jr. et al., 2012c).
194
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
g ( w) E ( y w)
2
H
y p ( y , w) dy
p ( w)
Funo de Penalizao
2
2
h g ( w) H , em que h o parmetro de suavizao e g ( w) H a norma de g(w) em um
espao de Hilbert, a qual induz regularizao, cuja fora ditada por h.
195
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Caractersticas
No espao infinito de Hilbert, procura-se a funo g(w) que minimize a soma de
196
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
t1 (h)
t (h)
2
.
T ( h)
, ti ( h ) 1 [k h ( wi w1 ) k h ( wi w2 )...k h ( wi wn )]n e ' =1 [1 2 ...n ]n .
.
t n (h)
e2
T
h
T
h
T
h
I
(
)
1
'
(
)'
(
)
T (h)' y
2
197
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
p (u, , p, 2 , p2 , e2 df e , Se , df , S , df p , Sf p ) N ( 0, K RKHS 2 ) N ( p 0, A p2 )
x 2 ( e2 df e , Se ) 2 ( 2 df , S ) 2 ( p2 df p , S p )
Qualquer funo positiva definida satisfazendo
K
i
RKHS
( wi , w j )
para
escolher
um
kernel
Gaussiano
k=1
x 2 ( e2 df e , Se ) 2 ( 2 df , S ) 2 ( p2 df p , S p )
Amostras so retiradas dessa distribuio.
Um modelo sem o efeito polignico pode ser ajustado removendo p j das equaes
acima. Assim, as distribuies a priori e a posteriori so dadas por:
p (u, , 2 , p2 , e2 df e , Se , df , S , df p , Sf p ) N ( 0, K RKHS 2 ) 2 ( e2 df e , Se )
x 2 ( 2 df , S ) 2 ( p2 df p , S p )
198
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
n
p (u, , 2 , p2 , e2 y, H N y j u j , e2 / ni N ( 0, K RKHS 2 )
i 1
x 2 ( e2 df e , Se ) 2 ( 2 df , S ) 2 ( p2 df p , S p )
respectivamente.
O modelo animal univariado tradicional pode tambm ser expresso em
termos de y g e em que g 0, K RKHS 2 ~ N (0, K RKHS 2 ) , conduzindo ao estimador
1
[ e2 I 2 K RKHS
] g e2 y (Campos et al., 2009).
199
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Y=Uq'+e 2 (1),
, em que T e U so matrizes de componentes, L e q so matrizes de
carregamento, E1 e e 2 so vetores de resduos. A decomposio no independente,
o que possibilita estabelecer uma relao entre componentes de W e Y de forma que
para cada fator a relao abaixo obtida:
u =b t
, sendo b (u' t ) (t' t ) ( 1,...,n ) coeficientes estimados via
pls
200
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
201
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Va
Ve
h2
Soma 2pq
N genes
menores
N genes
maiores
N
indivduos
N SNP
Sem gen
maior
4,826202
11,26114
0,300
233,47
100
300
500
98
2*
300
500
Com gen
114,5132
267,1974
0,300
231,80
maior
* os dois explicando 30% da variao gentica e os 98 explicando 70%.
Software
Referncia
Selegen Genmica
Resende (2007)
2 RR-BLUP
Selegen Genmica
Resende (2007)
3 RR-BLUP-Het
Selegen Genmica
Resende (2007)
4 RR-BLUP Padronizado
Meuwissen et al (2009)
5 Fast BayesA
Meuwissen et al (2009)
6 Fast BayesB
Meuwissen et al (2009)
7 IBLASSO
GS3
Legarra et al (2011)
8 BayesCPi
GS3
Legarra et al (2011)
9 MCMC-BLUP
GS3
Legarra et al (2011)
10 BLASSO
BLR
11 RKRS
12 PLSR
Os autores
1 FR-LS
202
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Acurcia Carter 1
Acurcia Carter 2
0,59
0,44
2 RR-BLUP
0,71
0,78
3 RR-BLUP-Het (IBLASSO)
0,71
0,80
4 RR-BLUP Padronizado
0,71
0,78
5 Fast BayesA
0,71
0,79
6 Fast BayesB
0,71
0,79
7 IBLASSO
0,71
0,80
8 BayesCPi
0,59
0,70
9 MCMC-BLUP
0,71
0,80
10 BLASSO
0,68
0,63
11 RKRS
0,99
0,99
12 PLSR
0,99
0,99
1 FR-LS
203
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
quando se faz as mdias de todas as amostras de Gibbs salvas aps o perodo de burn
in.
Diferenas nos pesos dos marcadores, ou seja, diferentes shrinkages podem
surgir mesmo quando se usa o mtodo RR-BLUP, como resultado da variao nas
frequncias allicas. Mrode et al. (2010) relatam os seguintes pesos associados a cada
categoria (alta, mdia e baixa) de frequncia allica: 0,19, 0,12 e 0,04, respectivamente.
Para os mtodos BayesA e BayesB, os pesos no variaram entre as categorias de
frequncia allica, equivalendo a 0,52 e 0,88, respectivamente. O peso maior
associado ao BayesB deve-se ao fato desse mtodo efetivamente ajustar um menor
(66% no caso) nmero de marcadores.
Verifica-se ento que os pesos diferem entre mtodos. Isso afeta as alteraes nas
frequncias allicas como resultado da seleo. E o mtodo RR-BLUP enfatiza pouco
os alelos de baixa frequncia, podendo ser desfavorvel para o melhoramento a longo
prazo. Para contornar isso, um ndice de seleo enfatizando mais os alelos de baixa
frequncia poderia ser estabelecido. Tambm, isto pode ser corrigido via
parametrizao com padronizao em W.
As correlaes entre pesos e frequncias allicas foram 0,99; 0,40 e -0,05 para o
RR-BLUP, BayesA e BayesB, respectivamente. No mtodo RR-BLUP, a quantidade
e magnitude de informao depende essencialmente das frequncias allicas. No
BayesA e BayesB, dependem tambm da variao gentica diferencial entre locos.
Conforme Mrode et al. (2010), a correlao entre os efeitos dos marcadores pelos
mtodos BayesA e RR-BLUP usando componentes de varincia obtidos pelo mtodo
BayesA foi de 0,99.
204
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
cX 1
1
A XY AYY
M '1 M ' M A 1
que associa cY a
cY
cX
c Y
c
X
1' c Y
M 'c y
AYX
. O modelo associado
AXX
cX ] .
205
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0.5
0
0
0
0.5
1]
MC
1
M
'
1
M
'
M
A
MC = [ 4.0000
1.0000
1.0000
1.0000
1.0000
0
0
0
0
0
-0.0007
0.0013]
LD
M 'cy
LD = [5 1 0 2 2 0].
206
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Soluo
1 . 2500
0 . 2498
1 . 2488
1
cY ( MC ) LD 0 . 7493
0 . 7493
c
X
0 . 3746
c X 1
1
1
c 1
A XY AYY
Y
1
A XY I ( 4 )
A XY
1
c
Y
1 . 25
0 . 25
0 0 0 0 . 5 1 . 25 1 . 625
0 . 75
0 . 75
1
c
207
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
208
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
209
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Sendo GQ = A + (GQ - A) e como no se conhece GQ, essa pode ser estimada por
G Q A (GM A) , em que uma regresso matricial dos elementos de (GQ A)
nos elementos de (GM A) e visa retirar de GM quanto devido a GQ, separando-a
O
coeficiente
de
regresso
dado
por
de
GE.
equivale
A quantidade
Var (GM 1 GM 2 )
Assim,
estima
2Var (G E ) ,
den
c 1 / nm
1 1 /(cn 1) .
formada somente com os SNPs de baixa MAF (minor allele frequency), os quais
mimicam os referidos QTLs. Intrinsecamente tem-se Cov(GM , GQMAF ) .
LOW
Var(GM )
210
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
tem-se
deve ento ser usada no lugar de A nas equaes de modelo misto para a predio dos
valores genticos dos indivduos e cmputo de suas acurcias seletivas.
Esse modelo G-BLUP melhorado equivalente ao RR-BLUP com ajuste do vetor
de efeitos polignicos residuais. Apresenta como vantagem a possibilidade de computar
as acurcias seletivas dos indivduos.
(C) Otimizao do G-BLUP na predio de g (catlogo de valores genticos dos indivduos)
(wij 2p i )
[2p i ( 1 pi )]1 / 2
, em que j
211
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
(wij 2p i )(wik 2p i )
2p i ( 1 pi )
g W m g * q g *
g g GQ
Tem-se
tambm
que
nm /( nm Me ) 1 /( 2 4 NeS / ln( Ne Lc )) em
S Lc N c / n a distncia mdia entre marcadores ou tamanho do segmento
cromossmico, ou seja, ~ E ( r 2 ) 1 /(2 4 NeS ) , que mede o r2 entre pares de locos
vizinhos, conforme Tenesa et al. (2007). Tomando por base a expresso de Sved
(1971), E ( r 2 ) 1 /(1 4 NeS ) , e no de Tenesa et al. (2007), tem-se
Me ( 2 NeLc N c ) /[ln( 2 Ne Lc )] .
212
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
gerao seguinte (s), a partir de suas matrizes de incidncia (Ws) e dos efeitos
genticos preditos de seus genitores maternos e paternos.
e. Modelo G-BLUP com correo prvia dos fentipos (yc) para os efeitos dos
genitores.
y c Xb Zg e ; Var ( g ) G Q g2
m (W W ) 1W g
g s W s m 0 .5( g m g p ) .
(E) Estimao do Me
(1 / Me) Var (GQ A) valor mdio de r2 entre todos os pares de locos ( rall2 p ).
Assim, a varincia nos coeficientes de parentesco em torno de A equivale ao
desequilbrio de ligao mdio.
A quantidade Me (1 / rall2 p ) tem grande impacto na acurcia seletiva. Essa
depende sobretudo de Nh 2 / Me . Se Me baixo essa frao ter valor alto, e a acurcia
ser alta. No caso, rall2 p refere-se ao desequilbrio mdio envolvendo todos os pares
2
de SNPs e difere de rmq
que refere-se ao desequilbrio envolvendo marcadores
Outra abordagem para inferir sobre nQ (nmero de locos gnicos) usar o seu
valor esperado, dado o tamanho efetivo (Ne) da populao e o tamanho L do genoma
da espcie. Com base no tamanho efetivo populacional (Ne), pode-se calcular o
213
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
214
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Tabela 33. Nmero efetivo de segmentos cromossmicos (Me) e de locos (nQ) em funo do
tamanho efetivo (Ne) e do comprimento do genoma (L) em bovinos e eucalipto.
Bovinos
Ne
Tam
Ne
15
30
50
100
200
500
1000
Me Max.
Ltot
4 Ne L
30
30
30
30
30
30
30
1800
3600
6000
12000
24000
60000
120000
Me
Provavel
Ln
(4NeL)
2NeL
900
1800
3000
6000
12000
30000
60000
Me Min.
Correo
Me Provvel
Corrigido*
Me Min.
Corrigido**
2NeL/
Ln (4NeL)
1/Ln(2Ne)
2NeL/ Ln(2Ne)
2NeL /
[Ln (4NeL)
Ln(2Ne)]
120.07
219.82
344.85
638.80
1189.79
2726.75
5130.29
0.29
0.24
0.22
0.19
0.17
0.14
0.13
261
432
660
1140
2040
4200
7800
Me Min.
Correo
Me Provvel
Corrigido*
Me Min.
Corrigido**
2NeL/
Ln (4NeL)
1/Ln(2Ne)
2NeL/ Ln(2Ne)
2NeL /
[Ln (4NeL)
Ln(2Ne)]
7.50
8.19
8.70
9.39
10.09
11.00
11.70
Correo 2
Ln (Ne
Lc)
34.82
52.76
75.87
121.37
202.26
381.75
666.94
2.71
3.40
3.91
4.61
5.30
6.21
6.91
Me Prov
Corrigido
2***
2NeL/
Ln
(Ne Lc)
332.34
529.23
766.87
1302.88
2264.87
4827.34
8685.89
Ne
15
30
50
100
200
500
1000
Ltot
13.2
13.2
13.2
13.2
13.2
13.2
13.2
Me Max.
4 Ne L
792
1584
2640
5280
10560
26400
52800
Me
Provavel
Ln
(4NeL)
2NeL
396
792
1320
2640
5280
13200
26400
6.67
7.37
7.88
8.57
9.26
10.18
10.87
59.33
107.50
167.54
307.99
569.90
1296.52
2427.75
0.29
0.24
0.22
0.19
0.17
0.14
0.13
115
190
290
502
898
1848
3432
17.21
25.80
36.86
58.52
96.88
181.51
315.61
Correo 2
Ln (Ne
Lc)
2.71
3.40
3.91
4.61
5.30
6.21
6.91
* Lc = comprimento do cromossomo, aproximadamente igual (1 Morgan) para bovinos e eucalipto, que apresentam 30 e 13 pares
de cromossomo respectivamente.
nm /(nm Me) .
Bovinos
Ne
Me
100
1302.88
100
1302.88
100
1302.88
M
10000
20000
30000
r2mq
0.88
0.94
0.96
200
200
200
2264.87
2264.87
2264.87
10000
20000
30000
0.82
0.90
0.93
1000
1000
1000
4827.34
4827.34
4827.34
10000
20000
30000
0.67
0.81
0.86
215
Me Prov
Corrigido
2***
2NeL/
Ln
(Ne Lc)
146.23
232.86
337.42
573.27
996.54
2124.03
3821.79
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Eucalipto
Ne
Me
r2mq
15
15
15
50
50
50
100
100
100
500
500
500
146.23
146.23
146.23
337.42
337.42
337.42
573.27
573.27
573.27
2124.03
2124.03
2124.03
5000
10000
20000
5000
10000
20000
5000
10000
20000
5000
10000
20000
0.97
0.99
0.99
0.94
0.97
0.98
0.90
0.95
0.97
0.70
0.82
0.90
Sunos
h2 a
Nmarcas
Ne
r2mq
nQ
ra*
0.2
0.2
0.2
0.2
0.2
0.2
0.2
0.4
0.4
0.4
0.4
0.4
0.4
0.4
0.2
0.2
0.2
0.2
0.2
0.2
0.2
0.4
0.4
0.4
0.4
0.4
0.4
0.4
1000
1000
1000
1000
1000
1000
1000
1000
1000
1000
1000
1000
1000
1000
2000
2000
2000
2000
2000
2000
2000
2000
2000
2000
2000
2000
2000
2000
1000
1000
1000
1000
1000
1000
1000
10000
10000
10000
10000
10000
10000
10000
1000
1000
1000
1000
1000
1000
1000
10000
10000
10000
10000
10000
10000
10000
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
15
30
50
100
400
500
1000
15
30
50
100
400
500
1000
15
30
50
100
400
500
1000
15
30
50
100
400
500
1000
0.79
0.69
0.61
0.47
0.22
0.19
0.12
0.97
0.96
0.94
0.90
0.74
0.70
0.57
0.79
0.69
0.61
0.47
0.22
0.19
0.12
0.97
0.96
0.94
0.90
0.74
0.70
0.57
247.0
410.3
608.0
1056.9
3351.0
4053.4
7367.5
247.0
410.3
608.0
1056.9
3351.0
4053.4
7367.5
247.0
410.3
608.0
1056.9
3351.0
4053.4
7367.5
247.0
410.3
608.0
1056.9
3351.0
4053.4
7367.5
0.55
0.42
0.32
0.20
0.05
0.04
0.02
0.77
0.68
0.60
0.48
0.25
0.21
0.13
0.66
0.53
0.42
0.27
0.08
0.06
0.03
0.86
0.79
0.72
0.60
0.33
0.29
0.18
* Acurcia
216
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
rg g
X'Z
1
2
2
Z' Z G * e / g
b X ' y
~
g Z ' y
(wij 2p i )
[2p i ( 1 pi )]1 / 2
entre SNPs
Com dependncia espacial entre efeitos de SNPs dentro de cromossomos
devida ao desequilbrio de ligao entre eles, modelos espaciais podem ser adotados.
Nesse caso, a matriz D deve ser substituda por uma matriz de correlao
autoregressiva (AR1) contemplando essa covarincia espacial.
Um modelo autorregressivo com varincias heterogneas (ARH) pode ser
ajustado. Nesse caso, tem-se Var ( g ) Var (W p m ) W p m ARH W p ' e para 3 marcas a
estrutura de covarincia :
217
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
m ARH
m21 m1 m 2 1 m1 m3 2
m2 2
m 2 m3 1 e GM (W p m ARH WP' ) / g2 .
Sim.
m2 3
ARH
( m2 3 c m2 3 nc )
Outra estrutura de correlao que pode ser usada associada a modelos antedependncia estruturados (SAD, que inclui tambm heterogeneidade de
autocorrelaes), em que Var ( g ) Var (W p m ) W p mSAD W p ' e a estrutura da matriz de
covarincia :
m21 m1 m 2 1 m1 m3 1 2
m2 2
m 2 m3 2 e G M (W p mSADWP' ) / g2 .
mSAD Sim.
m2 3
SAD
( m2 2 c m2 2 nc ) m 2 c m3c 2 e GM (W p SADWP' ) / g2 .
Sim.
( m2 3c m2 3 nc )
218
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
y Xb Zg e;
g ~ N (0, A g2 ); e ~ N (0, I e2 ).
2 1
Z ' ( I e ) X
X ' X
Z' X
X ' ( I e2 ) 1 Z
1
2 1
2
Z ' ( I e ) Z A 1 / g
X 'Z
b X ' y
1 2
2 ~
Z ' Z A e / g g Z ' y
(ii)
b X ' ( I e2 ) 1 y
~
2 1
g Z ' ( I e ) y
y Xb Zg e;
g ~ N (0, A g2 ); e ~ N (0, R e2 )
2 1
Z ' ( R e ) X
X ' ( R 11 / e2 ) X
2
1
Z ' (R 1/ e ) X
X ' R 1 X
1
Z' R X
X ' ( R e2 )1 Z
2 1
2
1
Z ' ( R e ) Z A 1 / g
b X ' ( R e2 )1 y
~
2 1
g Z ' ( R e ) y
X ' ( R 11 / e2 ) Z
b X ' ( R 11 / e2 ) y
Z ' ( R 1 / )Z A 1 / g~ Z ' ( R 11 / e2 ) y
b X ' R 1 y
X ' R 1 Z
.
Z ' R1Z A1 e2 / g2 g~ Z ' R 1 y
1
2
e
2
g
219
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
(1 / 4) g2
(1 / 4) g2 [( 3 / 4) g2 e2 ] / n Fi
, em que
(1 / 4) g2 [(3 / 4) g2 e2 ] / n Fi (1 / 4) g2 [(3 / 4) g2 e2 ] / n Fi (3 / 4) g2 e2 1
1
1
2
rggi
(1 / 4) g2
(1 / 4) g2
(1 / 4) g2
(1 / 4) g2
n Fi
As
equaes
(1 / 4) g2
( I n Fi ) X
X '
2
2
(3 / 4) g e
(1 / 4) g2
( I n Fi ) X
Z'
2
2
(3 / 4) g e
de
modelo
(1 / 4) g2
misto
2
2
(3 / 4) g e
(1 / 4) g2
2
2
1
Z'
I
n
Z
A
(
)
(
/
)
Fi
e
g
(3 / 4) g2 e2
X'
( I n Fi ) Z
tornam-se
ento
(1 / 4) g2
X'
( I n Fi ) y
2
2
b (3 / 4) g e
~
2
(
1
/
4
)
g
g
Z'
(
I
n
)
y
Fi
2
2
(3 / 4) g e
(1 / 4) g2
X
'
( I n Fi ) X
2
2
(3 / 4) g e
(1 / 4) g2
( I n Fi ) X
Z'
2
2
(3 / 4) g e
Multiplicando-se
X ' ( I n Fi ) X
Z ' ( I n Fi ) X
(1 / 4) g2
(1 / 4) g2
X
'
( I n Fi ) y
2
2
b (3 / 4) g e
.
~
2
(
1
/
4
)
g
g
Z'
( I n Fi ) y
2
2
(3 / 4) g e
2
2
(
3
/
4
)
g
e
equao por
obtm-se
(1 / 4) g2
2
2
(3 / 4) g e
(1 / 4) g2
Z'
( I n Fi ) Z A 1
2
2
(3 / 4) g e
X'
todos
os
termos
X ' ( I n Fi ) Z
(3 / 4) g2 e2
1
Z ' ( I n Fi ) Z A
(1 / 4) g2
( I n Fi ) Z
da
b X ' ( I n Fi ) y ,
~
g Z ' ( I n Fi ) y
2
2
2
2
2
2
2
2
[(1 rmq )(1 rggi ) / rggi ] g [(1 rmq )(1 rggi ) / rggi ]h
desequilbrio envolvendo marcadores vizinhos ou proporo da variao gentica
2
explicada
pelos
marcadores.
As
quantidades
rmq
q2 /( q2 g2* )
e
2
rmq
nm /(nm Me)
so
estimadores
de
2
rmq
.
Tem-se
tambm
2
E ( rmq
) 1 /( 2 4 Ne S ) (Tenesa et al., 2007), em que S a distncia mdia entre
marcadores ou tamanho do segmento cromossmico que no sofre recombinao
dentro dele.
Mas como
e2
g2
1
1
. Tambm
constante para todos os indivduos e tem2
[(1 r )(1 rg2gi ) / rg2gi ]
[(1 rmq
)
1
1
. Verifica-se que esses pesos so equivalentes
se que Pii
Pii
2
mq
220
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
ponderao por Rii1 nas equaes de modelo misto, conforme Van Raden et al.
(2008), fato no notado por Garrick et al. (2009). Tambm os pesos no dependem da
2
quantidade rmq
.
Outra
R
1 / 2
opo
yR
1 / 2
Xb R
1 / 2
Zg R
1 / 2
transformar
e; g ~ N (0, A ); e ~ N (0, I )
2
g
2
e
modelo
para
e usar as tradicionais
Z ' Z A /
X 'Z
1
2
e
2
g
b X ' y
.
~
g Z ' y
Nesse caso, usando valores genticos desregressados e corrigidos para os efeitos dos
genitores, tem-se:
Z ' R
Rii
Z G 1 ( e2 / g2 ) g~ Z ' R 1 ( y Xb) ;
(3 / 4) g2 e2 1
1
.
1
n Fi
rg2gi
(1 / 4) g2
G 1 ( e2 / g2 ) g~ R 1 ( y Xb) ;
n Fi (1 / 4) g2
~ n Fi (1 / 4) g2
1
2
2
I
G
( y Xb) .
(
/
)
e
g g I
2
2
2
2
(3 / 4) g e
(3 / 4) g e
1
) .
G
g
I
(
y
X
b
2
2
2
2
(3 / 4) g e
(3 / 4) g e
2
2
Multiplicando-se todos os termos da equao por (3 / 4) g e obtm-se
g2
(3 / 4) g2 e2 ~
1
g I ( n Fi (1 / 4)) ( y Xb) que so as equaes de modelo
I ( n Fi (1 / 4)) G
g2
misto para um modelo individual reduzido (em que a matriz Z composta por
valores 0 e 0.5), ponderadas pelo tamanho de prognie de cada um. Esse modelo
estima o valor gentico aditivo total e no apenas o metade dele como o faz o modelo
de reprodutor. Assim, embora usando indivduos genotipados diferentes dos
2
2
fenotipados, o uso da matriz R dada por Rii 1 1 (3 / 4) g e 1
2
2
rggi
(1 / 4) g
n Fi
conduz
221
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
X ' X
Z' X
X'Z
Z ' Z H 1
X ' y
.
b
Z
'
y
e2
g2
A A
0
H 11 12 A
A21 G
0
0 ,
G A22
A12 ,
A22 G 1 A221
forma
de
expressar
1
H 21 H 22 G A22 A21
1
22
1
22
1
22
A12 A
G
por
meio
de
G . Verifica-se que os efeitos de G
222
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
1
1
*
GFG12 GFG11 GFG12GFG
22 (G GFG 22 ) GFG 22GFG 21
*
*
1
G G GFG 22GFG 21
1
*
GFG12GFG
22G
*
G
wij p
(wij 2p i )
[2p i ( 1 pi )]1 / 2
* 1
G GFG 22GFG 21
G *
223
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
G * ii*
G ji
*
ij
*
jj
FG11
FG12
H LDLAb
* 1
G GFG 22GFG 21
1
FG 22
FG 22
1
FG 22
FG 21
FG12
1
FG 22
G *
224
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Essa situao ocorre quando esto disponveis os valores genticos preditos para o
carter com base em dados fenotpicos (a) e genotpicos de marcas (g). Um ndice de
seleo pode ser estabelecido usando essas duas informaes, cuja covarincia
equivale a rg2g ra2a , em que rgg2 a confiabilidade da seleo genmica e raa2 a
confiabilidade da predio dos valores genticos usando dados fenotpicos.
Tal ndice dado por:
I b1 g b2 a
r2
P 2 gg 2
rg g ra a
rg2g ra2a
ra2a
rg2g
C 2 = vetor de covarincia gentica entre o valor gentico
ra a
225
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Indivduo
1
2
3
4
5
Correlao r
N. Alelos
Loco Marcador a (Wa)
0
2
1
1
2
r = 0.76
N. Alelos
Loco Marcador b (Wb)
0
1
1
0
1
2
r = 0.58
226
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
L
e
N
2
mq
e
M
rtpl2
[
/
L
e
N
2
2
mq
Ln ( Ne L / k )]
n r2
nm
2
, rmq
pode ser estimado por rmq2 m 2 tpl .
nm Me
nm rtpl 1
Nmero de
Alelos do
Marcador
(Binomial, n =2)
MM
Mm
mm
-
0
1
2
Proporo de
uma
Binomial
com n =2
(rg*)
Frequncia
Genotpica
(f)
Medias por
Gentipo: =
rg * f
Desvio
de r
Desvio
Quadrtico
Desvio
Quadrtico *
Frequncia
0
0.5
1
0.25
0.5
0.25
0
0.25
0.25
-0.5
0
0.5
0.25
0
0.25
0.0625
0
0.0625
Mdia Geral
= 0.50
g
Varincia
( Var( ) ) = 0.125
g
Verifica-se que a varincia ( Var( g ) ) equivale a 0.125 para um loco. Para nQd locos
segregantes ou segmentos cromossmicos independentes dentro de famlia, tem-se
1
para famlias de irmos completos.
Var ( g )
8 n Qd
227
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
MM e mm
Mm
-
Efeitos de
Dominncia:
Distribuio
Bernoulli (f)
Corelao
Gentica de
Dominncia
(rd)
Medias por
Classe de
Gentipo: = rd
*f
Efeitos: Desvio
da Bernoulli
0
1
0
0.25
0x0=0
0.25 *1=0.25
1-0.25=-0.25
1-0.25=0.75
0.0625
0.5625
0.046875
0.140625
p=0.25
0.1875
Varincia: Desvio
Quadrtico *
Frequncia (1-p) e p
Desvio
Quadrtico
Verifica-se que a varincia ( Var ( d ) ) equivale a 0.1875 para um loco. Para nQd locos
1
tem-se Var ( d )
para famlias de irmos completos. Outra denominao
0 .1875 n Qd
0.5
Var ( g )
[
2
(
L
k )]
ni
4
8
12
24
48
100
200
0.1667
0.1429
0.1364
0.1304
0.1277
0.1263
0.1256
%de0.125
0.75
0.88
0.92
0.96
0.98
0.99
1.00
2
rmq
nm
n m 2 Ne L
nm ,
nm Me
2
estima-se rmq2 nm 2rtpl .
nm rtpl 1
e conhecendo-se L, estima-se
Ne
2
n m (1 rmq
).
2
2 rmq
L
228
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Var ( g )
1
8
Var ( g )
1
8 n Qd
tem-se Var ( g ) 16 para um loco e Var ( g ) 16 n Qd para nQd locos. No quadro a seguir
essa questo ilustrada para o caso de famlias de irmos completos.
229
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Irmos Completos
nQd
Varincia
Desvio
LIIC:
0.5 - 3 desvios
LSIC:
0.5 + 3 desvios
1
2
5
10
35
100
200
300
400
500
600
700
800
900
1000
2000
3000
4000
0.1250
0.0625
0.0250
0.0125
0.0036
0.0013
0.0006
0.0004
0.0003
0.0003
0.0002
0.0002
0.0002
0.0001
0.0001
0.0001
0.0000
0.0000
0.354
0.250
0.158
0.112
0.060
0.035
0.025
0.020
0.018
0.016
0.014
0.013
0.013
0.012
0.011
0.008
0.007
0.006
-0.56
-0.25
0.03
0.16
0.32
0.39
0.43
0.44
0.45
0.45
0.46
0.46
0.46
0.46
0.47
0.48
0.48
0.48
1.56
1.25
0.97
0.84
0.68
0.61
0.58
0.56
0.55
0.55
0.54
0.54
0.54
0.54
0.53
0.52
0.52
0.52
Varincia
Desvio
LIIC:
0.5 - 3
desvios
1
2
5
10
100
200
300
400
500
600
700
800
900
1000
2000
3000
4000
0.0625
0.0313
0.0125
0.0063
0.0006
0.0003
0.0002
0.0002
0.0001
0.0001
0.0001
0.0001
0.0001
0.0001
0.0000
0.0000
0.0000
0.2500
0.1768
0.1118
0.0791
0.0250
0.0177
0.0144
0.0125
0.0112
0.0102
0.0094
0.0088
0.0083
0.0079
0.0056
0.0046
0.0040
-0.50
-0.28
-0.09
0.01
0.18
0.20
0.21
0.21
0.22
0.22
0.22
0.22
0.23
0.23
0.23
0.24
0.24
LSIC:
0.5 + 3
desvios
1.00
0.78
0.59
0.49
0.33
0.30
0.29
0.29
0.28
0.28
0.28
0.28
0.28
0.27
0.27
0.26
0.26
Frao da
Frao da Varincia
Varincia Dentro
de Famlia: LIIC
1.50
1.28
1.09
0.99
0.83
0.80
0.79
0.79
0.78
0.78
0.78
0.78
0.78
0.77
0.77
0.76
0.76
Dentro de Famlia:
LSIC
0.00
0.22
0.41
0.51
0.68
0.70
0.71
0.71
0.72
0.72
0.72
0.72
0.73
0.73
0.73
0.74
0.74
230
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
em que:
L: o tamanho total do genoma;
i : o comprimento do cromossomo i.
O termo
4 i
Var ( g ) 1 /( 32 L ) k / 128 L2
.
Usando a expresso Var (
n Qd
1
16 n Qd
tem-se:
1
83 .05
16 Var ( g )
83 .05
8 Var ( g )
Var ( g )
n Qd
n Qd
1
0 . 003569
8 n Qd
1
35 .02
8 Var ( g )
Var ( g )
Var ( g ) 0 .125 / n m
1
0 .05 2
0 .05 0 .125 / n m
2
231
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
n Qd
1
0 . 001785
16 n Qd
1
35 .02
16 Var ( g )
g
d
g
s maior que zero para nQd maior que 1000.
A covarincia
Assim, o modelo y Xb Zg Zd e deve ser ajustado com estrutura de varincia
G 2
G g g
G g gd
G g gd
G d d2
X'Z
X ' X
2
1 e
Z ' X Z ' Z Gg
a2
2
Z X ZZ Gg 1 e
gd
associada ao vetor
X Z
g ,
d
e2 X ' y .
ZZ Gg
b
gd g Z ' y
Z
2
1 e
d
ZZ Gd
d2
1
Herdabilidade Genmica
Esse procedimento G-BLUP permite estimar os componentes de varincia:
g2 : varincia gentica aditiva;
Gg jk = ( 1 / n)
i=1
Gd j k = ( 1 / n)
i=1
: aditivo.
dominncia.
232
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
F (1 / n ) Fi ,
i 1
C12 X ' X
C
X 'Z
C 11
1
C
C
22
21
Z ' X Z ' Z G
C 11
C 21
C
C 12
.
C 22
rg g 1 /(1
1
)
Nh / Me
2
ou
rg g 1 /(1
Me
)
Nh 2
233
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Fentipos
1 GWAS-FR-OBS
Fixo
2 GWAS-PSE-FR-EST
Fixo
3 GWAS-PSE-RR- OBS
Aleatrio
4 GWAS-PSE*-RR-EST
Aleatrio
yc
y
yc
y
Penalizao
1 FR-LS
Fentipos
Corrigidos
Fixo
yc
yc
yc
y c ou y
2 RR-BLUP
Aleatrio
3 RR-BLUP-Het
Aleatrio
4 G-REML/G-BLUP
Aleatrio
N Marcas
Selecinadas
95
139
e2 / gi2
e2 / gi2
97
GWS
Mtodo
Penalizao
Acurcia
0.44
e2 / g2
0.78
e2 / gi2
0.80
e2 / g2
0.80
234
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
GWAS
Mtodo*
1 GWAS-FR-OBS
2 GWAS-PSE-FR-EST
3 GWAS-PSE-RR- OBS
4 GWAS-PSE-RR-EST
Modelo Estatstico do
Selegen Genmica
Modelo Estatstico 4
Modelo Estatstico 4
Modelo Estatstico 3
Modelo Estatstico 3
Arquivo de
Fentipos
Observados
Estimados
Observados
Estimados
Arquivo de Lambdas
Zeros na 2 coluna
Zeros na 2 coluna
Lambda de cada marca na 2 coluna
Lambda de cada marca na 2 coluna
GWS
Mtodo
1 FR-LS
2 RR-BLUP
3 RR-BLUP-Het
4 RR-BLUP-Het
Modelo Estatstico do
Selegen Genmica
Modelo Estatstico 5
Modelo Estatstico 1
Modelo Estatstico 2
Modelo Estatstico 6
Fentipos
Corrigidos
Observados
Observados
Observados
Observados
Arquivo de Lambdas
Lambda de cada marca na 2 coluna
-
235
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Clone Famlia Bloco rvore Variveis. Deve ser fornecido tambm um arquivo de
pedigree com a seguinte seqncia de colunas: Indivduo Pai Me. Todos os indivduos
devem constar na primeira coluna mesmo os que so apenas genitores. Genitores de
genitores devem receber cdigos zero na segunda e terceira colunas.
Os componentes de varincia associados ao modelo, conforme notao do
Selegen-Reml/Blup, so assim interpretados:
Va: varincia gentica aditiva.
Vclone/fam: varincia entre clones dentro de famlias de irmos completos,
ajustada para varincia gentica aditiva total.
Vfam: varincia da capacidade especfica de combinao ou varincia
gentica de dominncia entre famlias de irmos germanos.
Vbloc: varincia entre blocos.
Ve: varincia ambiental.
Vf: varincia fenotpica individual.
h2a = h2: herdabilidade individual no sentido restrito no bloco, ou seja, dos
efeitos aditivos.
h2g: herdabilidade individual no sentido amplo, ou seja, dos efeitos
genotpicos totais.
c2clone/fam = c2: coeficiente de determinao dos efeitos de clones dentro de
famlias de irmos completos, ajustado para varincia gentica aditiva total.
c2fam = c21: coeficiente de determinao dos efeitos da capacidade especfica
de combinao.
c2bloc = c22: coeficiente de determinao dos efeitos de bloco.
u = Mdia geral do experimento.
Os componentes de varincia apresentados acima podem ser decompostos da
seguinte forma:
Va g2 : varincia gentica aditiva.
2
2
2
Vfam (1 / 4) d2 (1 / 4) gg
(1 / 8) gd
(1 / 16 ) dd
...
2
2
2
Vclone / fam (3 / 4) d2 (3 / 4) gg
(7 / 8) gd
(15 / 16) dd
... , em que d refere-se a
n 0.5h 2
2
2
2
n 0.5h 2 1 h 2 cclone
/ fam c fam c bloc
, em que n o nmero de
esse
modelo
valor
genotpico
n 0.5 g2
n 0.5 g2 e2
dos
clones
dado
por
236
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
0.588
0.833
1
1.09
1.44
1.71
2
3
3.87
6.81
10.00
12.27
27.54
51.29
100.00
1000.00
2.71
3.84
4.61
5.02
6.64
7.88
9.22
13.83
Significncia
10.00%
5.00%
3.17%
2.50%
1.00%
0.50%
0.23%
0.02%
H0: hiptese de ausncia de ligao marcador QTL; H1: hiptese de presena de ligao marcador QTL; *
*Potncia de 10 cujo resultado indica quantas vezes H1 mais provvel do que H0.
237
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
b X ' y
~
m W ' y
W 'W I /
X 'W
2
e
2
m
(RR-BLUP ou SNP-BLUP)
ou
X ' X
W ' X
b X ' y
1 2
~
W 'W D 2 e m
i
W ' y
X 'W
(RR-BLUP-Het), em que i
so varincias
X'Z
Z ' Z G 1 e2 / g2
b X ' y
~
g Z ' y
(G-BLUP)
ou
X ' X
Z' X
Z ' Z G *
X'Z
2
e
b X ' y
(G-BLUP-Het)
~
g Z ' y
Z ' Z A /
X 'Z
1
2
e
2
g
b X ' y
(A-BLUP).
~
Z
'
y
g
238
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
239
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
y Xb U i i Wm e (RR-BLUP);
y Xb
i 1
v
U
i 1
Zg e ou y Xb
U
i 1
Z Wm e (G-BLUP),
(wij 2p i )
[2p i ( 1 pi )]1 / 2
contm
dados
por
240
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
G jk = ( 1 / n)
(wij 2p i )(wik 2p i )
2p i ( 1 pi )
i=1
4pi2 ( 1 pi )2
2pi (1 pi )
depende da frequncia do alelo do SNP. Isto conduz ao uso de
2
Gijj =1 [ wi j (1 2 pi )wij 2 pi2 ] /[ 2 pi (1 pi )] , o qual um estimador no viesado de
1 + F, conforme mostrado abaixo. Se F = 0, Var (Gijj ) = 1 e no h necessidade de
correo
Gijj .
em
n
G jk = ( 1 / n)
Assim,
considerando
(wij 2p i )(wik 2p i )
2p i ( 1 pi )
i=1
G jk =1 ( 1 / n)
para
todos
os
SNPs
jk
tem-se
e
[ wi j (1 2 pi )wij 2 pi2 ]
2p i ( 1 pi )
i=1
para j k .
dada
por
pi2 pi (1 pi ) F ;
[2 pi (1 pi )] (1 F ) e
+ {[2 pi (1 pi )] (1 F ) }Mm +
[(1 p ) pi (1 pi ) F ]mm .
2
i
dado por F (1 / n ) Fi , ou seja, pela mdia das estimativas atravs de todos os SNPs,
i 1
referncia para o SNP i. Este estimador o usado no GCTA. Isto significa que, no
loco i, os elementos da diagonal da matriz G so dados por
2
G jj = 1 Fi 1 [ wi j (1 2 pi )wij 2 pi2 ] /[2 pi (1 pi )] . Na matriz G o parentesco no
uma probabilidade (conforme definio clssica de IBD) mas sim uma correlao
entre valores genticos aditivos. Outro estimador de Fi dado por
Fi {( wi 2 pi ) 2 /[( 2 pi (1 pi )]} 1 .
241
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
G jk = ( 1 / n)
(wij 2p i )(wik 2p i )
2p i ( 1 pi )
i=1
G jk =1 ( 1 / n)
jk
para
[ wi j (1 2 pi )wij 2 pi2 ]
2p i ( 1 pi )
1/ n
1/ n
c (1 / n )
c
1
.
c (1 / n ) c (1 / n ) c (1 / n ) c (1 / n )
jk;
para
i=1
242
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
epigentica:
probabilidade
de
transmisso
de
fentipos
243
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
2[COV ( P, F ) 2COV ( MI )]
(1 )
2COV ( P, F ) (1 ) 2
2
g
Herdabilidade Epigentica
2
h 2
y
2
O modelo pode ser ajustado por meio das equaes de modelo misto:
X'Z
X Z
X ' X
2
1 e
Z' Z A
ZZ
Z' X
2
g
Z X ZZ
ZZ 1 e2
b X ' y .
g Z ' y
Z '
2 : varincia epigentica;
e2 : varincia residual;
h2 : herdabilidade epigentica;
A: matriz de correlao gentica aditiva entre indivduos;
: matriz de transmissibilidade epigentica.
(b) Covarincia entre Parentes para Sistemas de Reproduo Assexuada (Tal et al.,
2010)
(1 )
COV ( P, F ) (1 ) 2
2
gt
244
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Bloc Parc
1 999999
2 999999
3 999999
4 999999
5 999999
6
1
Alt
0.0
0.0
0.0
0.0
0.0
2.6
# montagem do pedigree
pedCows=read.table("modelo1Ru3.txt",h=T)
sire = pedCows[,2]
dam = pedCows[,3]
id = pedCows[,1]
pedCows = pedigree(sire=as.integer(sire),dam=as.integer(dam),label=as.character(id))
245
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Parc = parcela
Alt = varivel
# comentrios
No pedigreemm deve-se duplicar a ultima linha do arquivo e atribuir um novo cdigo (por
exemplo, 999999)para bloco e parcela;
O pedigreemm s inclui na anlise genitores com dados prprios. Assim, no caso de um
teste de prognies e usando apenas dados do teste, os genitores devem ser includos no
arquivo de dados com dados (y) fictcios e posteriormente os resultados devem ser
corrigidos. Os valores genticos preditos dos genitores corrigidos so dados por
a
( y B loc ) , em que B loc referem-se aos efeitos estimados de blocos (os quais
gen correto
devem receber im cdigo diferente para cada genitor (ver incio do arquivo de exemplo).
Para correo dos valores genticos preditos dos indivduos, os autores derivaram a
seguinte correo, vlida para prognies de meios irmos em delineamento com vrias
plantas por parcela:
3h 2
2 2 c 2 2h 2
) a gencorreto (
)
2
2
16 4h 16c
4 h 2 4c 2
, em que:
preditos pelo
pedigreemm;
a gen incorreto :
pedigreemm;
a gencorreto :
h2 :
c2 :
Para prognies de meios irmos em delineamento com uma planta por parcela, a correo
dada por:
(3 / 4)h 2
(1 / 2)(1 h 2 )
a gen correto
2
(4 h )
(1 / 4)(4 h 2 )
Para prognies de irmos germanos em delineamento com vrias plantas por parcela, a
correo dada por:
h2
1 c2 h2
a
(
)(
)
sirecorrigido
damcorrigido
8 4h 2 8c 2
2 h 2 2c 2
Para prognies de irmos germanos em delineamento com uma planta por parcela, a correo
dada por:
a i a iR (a sirenaocorrigido a damnaocorrigido )
(1 / 4)h 2
(1 h 2 )
(
a
a
)
sire corrigido
dam corrigido
(2 h 2 )
(2 h 2 )
246
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
# comentrios
O vetor beta fornece os valores genticos preditos dos genitores ( g ) e VBeta fornece as
pi
estimativas de varincias genticas aditivas ( gVBetai
2
247
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
# just an approximation
# 0.5 = (v-2)/v for v=4
size = dim(x)[2];
b = array(0.0,size);
meanb = b;
b[1] = mean(y);
var = array(0.0,size);
# adjust y
ycorr = y - x%*%b;
# mcmc sampling
for (iter in 1:numiter){
# sample vare
vare = ( t(ycorr)%*%ycorr )/rchisq(1,nrecords + 3);
# sample intercept
ycorr = ycorr + x[,1]*b[1];
rhs
= sum(ycorr)/vare;
invLhs = 1.0/(nrecords/vare);
mean = rhs*invLhs;
b[1] = rnorm(1,mean,sqrt(invLhs));
ycorr = ycorr - x[,1]*b[1];
meanb[1] = meanb[1] + b[1];
# sample variance for each locus
for (locus in 2:size){
var[locus] = (scalea*4+b[locus]*b[locus])/rchisq(1,4.0+1)
}
# sample effect for each locus
for (locus in 2:size){
ycorr = ycorr + x[,locus]*b[locus];
#unadjust y for this locus
rhs = t(x[,locus])%*%ycorr/vare;
lhs = t(x[,locus])%*%x[,locus]/vare + 1.0/var[locus];
invLhs = 1.0/lhs;
mean = invLhs*rhs;
b[locus]= rnorm(1,mean,sqrt(invLhs));
ycorr = ycorr - x[,locus]*b[locus];
#adjust y for the new value of this
locus
meanb[locus] = meanb[locus] + b[locus];
}
}
meanb = meanb/numiter;
plot(meanb)
gebv=x%*%meanb
plot(hist(gebv))
248
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
#test population
nmarkers=2000
data1
= matrix(scan("testData.out0"),ncol=nmarkers+2,byrow=TRUE);
nrecords = dim(data1)[1];
x = cbind(1,data1[,startMarker:nmarkers]);
yt = data1[,nmarkers+1];
yHat_t
= x %*% meanb;
corr = cor(yt,yHat_t);
corr
#number of markers
#number of iterations
#use 1 for Bayes A
#Change this to run Bayes B rather than Bayes A
249
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
logDataOld = logDataNullModel;
}
for (mhiter in 1:numMHIter){
u = runif(1);
varCandidate = 0;
if (u > pi){
varCandidate = scaleb*4/rchisq(1,4);
}
if (varCandidate > 0.0){
v1 = (xpx^2*varCandidate + xpx*vare);
logDataNew = -0.5*(log(v1) + rhs^2/v1);
}
else{
logDataNew = logDataNullModel;
}
acceptProb = exp(logDataNew-logDataOld); # slide 45
u = runif(1);
if(u <acceptProb) {
var[locus] = varCandidate;
logDataOld = logDataNew;
}
}
if(var[locus]) {
nLoci = nLoci + 1;
lhs = xpx/vare + 1.0/var[locus];
invLhs = 1.0/lhs;
mean = invLhs*rhs/vare;
b[1+locus]= rnorm(1,mean,sqrt(invLhs));
ycorr = ycorr - x[,1+locus]*b[1+locus];
meanb[1+locus] = meanb[1+locus] + b[1+locus];
ppa[locus] = ppa[locus] + 1;
}
else b[1+locus] = 0.0;
}
}
meanb = meanb/numiter;
plot(meanb)
gebv=x%*%meanb
plot(hist(gebv))
#test population
nmarkers=2000
data1
= matrix(scan("testData.out0"),ncol=nmarkers+2,byrow=TRUE);
nrecords = dim(data1)[1];
x = cbind(1,data1[,startMarker:nmarkers]);
yt = data1[,nmarkers+1];
yHat_t
= x %*% meanb;
corr = cor(yt,yHat_t);
corr
250
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
storePi = array(0.0,numiter);
# inital values
nmarkers = nmarkers - startMarker + 1;
varEffects = vara/(nmarkers*(1-pi)*mean2pq);
scalec
= varEffects*(nua-2)/nua;
cat ("scale : ",scalec);
# Hyper parameters of Scale factor
theta = 1;
beta = 1;
meanscalec = 0;
b = array(0.0,nmarkers+1);
meanb
= b;
b[1]
= mean(y);
var
= array(0.0,nmarkers);
ppa
= array(0.0,nmarkers);
piMean = 0.0;
# adjust y
ycorr = y - x%*%b;
# mcmc sampling
for (iter in 1:numiter){
# sample vare
vare = ( t(ycorr)%*%ycorr )/rchisq(1,nrecords + 3);
# sample intercept
ycorr = ycorr + x[,1]*b[1];
rhs
= sum(ycorr)/vare;
invLhs = 1.0/(nrecords/vare);
mean = rhs*invLhs;
b[1] = rnorm(1,mean,sqrt(invLhs));
ycorr = ycorr - x[,1]*b[1];
meanb[1] = meanb[1] + b[1];
# sample effect for each locus
nLoci = 0;
for (locus in 1:nmarkers){
ycorr = ycorr + x[,1+locus]*b[1+locus];
rhs = t(x[,1+locus])%*%ycorr;
xpx = t(x[,1+locus])%*%x[,1+locus];
v0 = xpx*vare;
v1 = (xpx^2*varEffects + xpx*vare);
logDelta0 = -0.5*(log(v0) + rhs^2/v0) + logPi;
logDelta1 = -0.5*(log(v1) + rhs^2/v1) + logPiComp;
probDelta1 = 1.0/(1.0 + exp(logDelta0-logDelta1));
u = runif(1);
if(u < probDelta1) {
nLoci = nLoci + 1;
lhs = xpx/vare + 1.0/varEffects;
invLhs = 1.0/lhs;
mean = invLhs*rhs/vare;
b[1+locus]= rnorm(1,mean,sqrt(invLhs));
ycorr = ycorr - x[,1+locus]*b[1+locus];
meanb[1+locus] = meanb[1+locus] + b[1+locus];
ppa[locus] = ppa[locus] + 1;
var[locus] = varEffects;
}
else {
b[1+locus] = 0.0;
var[locus] = 0.0;
}
}
# sample common variance
countLoci = 0;
sum = 0.0;
for (locus in 1:nmarkers){
if(var[locus]>0.0){
countLoci = countLoci + 1;
sum = sum + b[1+locus]^2;
}
251
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
}
varEffects = (scalec*nua + sum)/rchisq(1,nua+countLoci);
# sample Pi
aa = nmarkers-countLoci + 1;
bb = countLoci + 1;
pi = rbeta(1, aa, bb);
storePi[iter] = pi;
piMean = piMean + pi;
#
scalec = (nua-2)/nua*vara/((1-pi)*nmarkers*mean2pq)
logPi
= log(pi);
logPiComp = log(1-pi);
}
piMean = piMean/numiter;
meanb = meanb/numiter;
plot(meanb)
gebv=x%*%meanb
plot(hist(gebv))
#test population
nmarkers=2000
data1
= matrix(scan("testData.out0"),ncol=nmarkers+2,byrow=TRUE);
nrecords = dim(data1)[1];
x = cbind(1,data1[,startMarker:nmarkers]);
yt = data1[,nmarkers+1];
yHat_t
= x %*% meanb;
corr = cor(yt,yHat_t);
corr
7.3.4 Mtodo BLASSO no Pacote BLR (escrito por Gustavo de los Campos,
University of Wisconsin)
#Bayesian LASSO
setwd("C:\\R 2013")
# Example of whole-Genome prediction by Lasso using BLR package
library(BLR)
nmarkers=2000;
startMarker=1801;
# training data
data = matrix(scan("trainData.out0"),ncol=nmarkers+2,byrow=TRUE);
x
y
= data[,startMarker:nmarkers];
= data[,nmarkers+1]
prior=list( varE=list(S=4.5,df=3),
varBR=list(S=.009,df=3),
lambda=list(type='random', value=30,shape=.52,rate=2e-5))
nIter<-200
252
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
burnIn<-1
fmL1<-BLR(y=y,XL=x,nIter=nIter, burnIn=burnIn,thin=1,prior=prior)
meanb = fmL1$bL;
plot(meanb)
gebv=x%*%meanb
plot(hist(gebv))
#test population
nmarkers=2000
data1
= matrix(scan("testData.out0"),ncol=nmarkers+2,byrow=TRUE);
nrecords = dim(data1)[1];
x = data1[,startMarker:nmarkers]
yt = data1[,nmarkers+1];
yHat_t
= x %*% meanb;
corr = cor(yt,yHat_t);
corr
253
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
PCR Supervisionado
# leitura do arquivo de marcadores moleculares
setwd("C:\\R 2013")
library(pls)
dados=read.table("Veracel-A-BV-ALT-TOT.txt",h=T)
#leitura do arquivo de marcadores
snp=dados[,-(1:5)]
head(snp)
tail(snp)
#leitura do arquivo fenotpico
fenotipo=dados$EBV
head(fenotipo)
tail(fenotipo)
#transformar os dados do arquivo snp em uma matriz
M=as.matrix(snp)
# entrada: vetor y1
# M: matriz de marcadores
y=as.matrix(fenotipo)
# critrio para a escolha do nmero de componentes
model=pcr(y~M,validation="CV")
rmsep.cv=sqrt(model$validation$PRESS/nrow(M))
nc=which(rmsep.cv==min(rmsep.cv))
# efeitos de marcadores
a=model$coefficients[,,nc]
# rank dos efeitos de marcadores
rank=cbind(colnames(M),matrix(rank(abs(a))))
colnames(rank)=c("marker","rank")
n=300 # n snps menores efeitos retirados
num_snp=matrix(seq(n+1,ncol(M)))
colnames(num_snp)=c("rank")
254
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
255
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
256
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
M=as.matrix(snp)
#transformar os dados do arquivo fenotpico
y=as.matrix(fenotipo)
# entrada: vetor y
# M: matriz de marcadores
fit=icr(M,y,n.comp=nc) # nc: nmero de componentes
# Matriz de branqueamento
K=fit$ica$ica$K
# Matriz ortogonal
R= fit$ica$ica$W
# Matriz transposta da matriz de misturas
A_trans=K%*%R
# Vetor de coeficientes associados aos componentes
gamma= fit$model$coefficients[-1]
#Vetor de efeito de marcadores
eff_snp=A_trans%*%gamma
eff_snp
par(mfrow=c(3,1)) # divide a tela grfica em 3
plot(eff_snp)
plot(abs(eff_snp), type = "l")
# visualizao dos mais informativos
plot(density(eff_snp))
# populao de validao
nmarkers=2000
data1 = matrix(scan("testData.out0"),ncol=nmarkers+2,byrow=TRUE);
x = data1[,startMarker:nmarkers]
yt = data1[,nmarkers+1];
yHat_t = x %*% eff_snp;
corr = cor(yt,yHat_t);
corr
257
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
258
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
plot(mean_eff)
plot(abs(mean_eff), type = "l")
# visualizao dos mais informativos
plot(density(mean_eff))
# Clculo da herdabilidade da caracterstica
model=mixed.solve(y, Z=M,K=diag(ncol(M))) # todos indivduos
Va=model$Vu # varincia gentica aditiva explicada por 1 SNP
Vu=sum(2*(t(p[,1])%*%p[,2])*Va) # varincia gentica aditiva
Ve=model$Ve # varincia residual
h2=Vu/(Vu+Ve) # herdabilidade
h2
write.table(h2,"h2.txt",row.names=FALSE,col.names=FALSE,quote=FALSE)
# Correlao e Acurcia
cor=cor(gbv,y) # capacidade preditiva
cor
ac=cor/sqrt(h2) # acurcia
ac
259
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
rownames(gbv)<-c(fenotipo$id)
#ordenamento dos valores genmicos
gbv1=sort(as.matrix(gbv)[,],decreasing=TRUE) #ordenamento dos valores
plot(hist(gbv1))
gbv_10=quantile(gbv1, probs =c(90)/100) #identificao dos 10% melhores
top_10=gbv1[gbv1>=gbv_10]
top_10
260
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
GBLUP Reduzido R
# leitura do arquivo de marcadores moleculares
setwd("C:\\R 2013")
library(rrBLUP)
library(MASS)
dados=read.table("Veracel-A-BV-ALT-TOT.txt",h=T)
#leitura do arquivo de marcadores
snp=dados[,-(1:5)]
head(snp)
tail(snp)
#leitura do arquivo fenotpico
fenotipo=dados$EBV
head(fenotipo)
tail(fenotipo)
#transformar os dados do arquivo snp em uma matriz
M=as.matrix(snp)
#
#
#
#
entrada: vetor y1
M: matriz de marcadores
k: uma matriz diagonal com nmero de colunas igual a da matriz M
output: "Vu" "Ve" "beta" "u" "LL"
y=as.matrix(fenotipo)
u=as.matrix(mixed.solve(y,K=A.mat(M))$u) # valor gentico dos indivduos
a=ginv(t(M)%*%M)%*%(t(M)%*%u) # efeitos de todos os marcadores
rank=cbind(colnames(M),matrix(rank(abs(a))))
colnames(rank)=c("marker","rank")
n=300 # n de marcadores de menor efeito retirados
num_snp=matrix(seq(n+1,ncol(M)))
colnames(num_snp)=c("rank")
# merge entre o arquivo total de marcadores e os marcadores selecionados
merge_rank=merge(rank,num_snp, by=intersect("rank","rank"))
merge_rank1=matrix(merge_rank[,2])
colnames(merge_rank1)=c("marker")
marc=cbind(noquote(matrix(colnames(as.matrix(M)))),noquote(t(M)))
colnames(marc)=c("marker",1:nrow(M))
# marcadores selecionados
snp_new=merge(marc,merge_rank1, by=intersect("marker","marker"))
write.table(snp_new,"snp_new.txt",row.names=FALSE,col.names=FALSE,quote=FALSE)
#leitura dos marcadores selecionados
snp=read.table("snp_new.txt")
M_new=t(snp[,-1])
261
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
# jacknife : Validao2
gbv=NULL
eff=matrix(0,ncol(M_new),nrow(M))
for(i in 1:nrow(M))
{
a=as.matrix(mixed.solve(y[-i],K=A.mat(M_new[-i,]))$u)
eff[,i]=ginv(t(M_new[-i,])%*%M_new[-i,])%*%(t(M_new[-i,])%*%a)
gbv[i]=M_new[i,]%*%eff[,i]
}
# Vetor de valores genmicos dos indivduos
gbv
#Vetor de efeito de marcadores
mean_eff=NULL
for(i in 1:nrow(eff))
{
mean_eff[i]=sum(eff[i,])/ncol(eff)
}
write.table(mean_eff,"eff_rgblup.txt",row.names=FALSE,col.names=FALSE,quote=FALSE)
mean_eff
par(mfrow=c(3,1)) # divide a tela grfica em 3
plot(mean_eff)
plot(abs(mean_eff), type = "l")
# visualizao dos mais informativos
plot(density(mean_eff))
# Clculo da herdabilidade da caracterstica
model=mixed.solve(y, K=A.mat(M_new)) # todos indivduos
Vu=model$Vu # varincia gentica aditiva
Ve=model$Ve
# varincia residual
h2=Vu/(Vu+Ve)
# herdabilidade
h2
# Correlacao, Acuracia
cor=cor(gbv,y)
cor
ac=cor/sqrt(h2)
ac
262
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
7.3.11 Mtodo Regresso Kernel Hilbert Spaces (RKHS) (escrito por Gustavo
de los Campos, University of Wisconsin)
setwd("C:\\R 2013")
data = read.table("fen_final.txt"))
phe = as.matrix(data[,5])
gen = matrix(as.numeric(as.matrix(data[,-c(1:5)])),nrow = nrow(data))
D<-as.matrix(dist(gen,method="euclidean"))^2
D<-D/mean(D)
h<-c(1e-2,.1,.4,0.5,.8,1.5,2,3,5)
R2<-numeric()
PMSE<-numeric()
VARE<-numeric()
VARU<-numeric()
for(i in 1:length(h)){
print(paste('Working with h=',h[i],sep=''))
# COMPUTES THE KERNEL
K<-exp(-h[i]*D)
# FITS THE MODEL
prefix<- paste(h[i], "_",sep="")
fm<-RKHS(y=phe,K=list(list(K=K,df0=5,S0=2)),
nIter=12000,burnIn=2000,df0=5,S0=2,
saveAt=prefix)
R2[i] = cor(fm$yHat,phe)
PMSE[i]<-mean((phe-fm$yHat)^2)
VARE[i]<-fm$varE
VARU[i]<-fm$K[[1]]$varU
}
plot(R2~h,xlab="Bandwidth",
ylab="Residual Variance",type="o",col=4)
plot(VARE~h,xlab="Bandwidth",
ylab="Residual Variance",type="o",col=4)
plot(PMSE~h,xlab="Bandwidth",
ylab="PMSE",type="o",col=2)
plot(I(VARE/VARU)~h,xlab="Bandwidth",
ylab="Ratio of variances(noise/signal)",
type="o",col=4)
263
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
8 Referncias
AGUILAR I.; MISZTAL, I.; JOHNSON, D. L.; LEGARRA, A.;
TSURUTA, S.; LAWLOR, T. J. Hot topic: a unified approach to utilize
phenotypic, full pedigree, and genomic information for genetic evaluation
of Holstein final score. Journal of Dairy Science, Champaign, v. 93, n. 2,
p. 743-52, 2010.
AITKEN, A. C. Studies in practical mathematics: the evaluation of the
latent roots and latent vectors of a matrix. Proceedings of the Royal
Society of Edinburgh, v. 57, p. 269-304, 1937.
AKAIKE, H. A new look at the statistical model identification. IEEE
Transaction on Automatic Control, v. 19, p. 716-723, 1974.
ALMASY, L.; BLANGERO, J. Multipoint quantitative-trait linkage
analysis in general pedigrees. The American Journal of Human Genetics,
Chicago, v. 62, n. 5, p. 1198-1211, 1998.
ANDERSON, D. R.; BURNHAM, K. P.; THOMPSON, W. L. Null
hypothesis testing: problems, prevalence, and an alternative. Journal of
Wildlife Management, Bethesda, v. 64, p. 912-923, 2000.
ANDERSON, L.; GEORGES, M. Domestic animal genomes: deciphering
the genetics of complex traits. Nature Reviews Genetics, v. 5, n.3, p.202212, 2004.
ARANGO, J.; MISZTAL, I.; TSURUTA S.; CULBERTSON, M.;
HERRING, W. Estimation of variance components including competitive
effects of Large White growing gilts. Journal of Animal Science, v. 83, p.
1241-1246, 2005.
AUER, P.L.; DOERGE, R.W. Statistical design and analysis of RNA
sequencing data. Genetics. 185: 405-416, 2010.
AULCHENKO, Y. S.; KONNING, D.; HALEY, C. Grammar: a fast and
simple method for genome-wide pedigree-based quantitative trait loci
association analysis. Genetics, Austin, v. 177, p. 577-585, 2007.
AYROLES, J. F.; GIBSON, G. Analysis of variance of microarray data.
Methods in Enzymology, v. 411, p. 214-233, 2006.
AZEVEDO, C. F. Mtodos de reduo de dimensionalidade aplicados na
seleo genmica para caractersticas de carcaa em sunos. 2012.
Dissertao (Estatstica Aplicada e Biometria) - Universidade Federal de
Viosa.
AZEVEDO, C. F.; RESENDE, M.D.V.; SILVA, F.F.; LOPES, P.S.;
GUIMARAES, S.E.F. Regresso via Componentes Independentes (ICR)
para
reduo de dimensionalidade
na seleo genmica para
caractersticas de carcaa em sunos. Pesquisa Agropecuria Brasileira,
2012.
264
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
265
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
266
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
CUI, X.; HWANG, J.T.G.; QIU, J. et al. Improved statistical tests for
differential gene expression by shrinking variance components estimates.
Biostatistics, v.6, n.1, p.59-75, 2005.
CULLIS, B. R.; GLEESON, A. C. Spatial analysis of field experiments-an
extension at two dimensions. Biometrics, v. 47, p. 1449-1460, 1991.
CULLIS, B. R.; GOGELL, B.; VERBYLA, A.; THOMPSON, R. Spatial
analysis of multi-environment early generation variety trials. Biometrics,
v. 54, p. 1-18, 1998.
DAETWYLER H.D; VILLANUEVA B; BIJMA P.; WOOLLIAMS JA
(2007) Accuracy of predicting the genetic risk of disease using a genomewide approach. PLoS ONE 3:e3395.
DAETWYLER H.D; PONG-WONG, R.; VILLANUEVA B;
WOOLLIAMS, J.A. The impact of genetic architecture on genome-wide
evaluation methods. Genetics, v.185, p.1021-1031, 2010.
DAETWYLER, H. D. .; KEMPER, K. E. .; VAN DER WERF, J. H. J.;
HAYES, B. J. Components of the accuracy of genomic prediction in a
multi-breed sheep population. J. Anim. Sci. v. 90, p. 33753384, 2012.
DARVASI, A.; SOLLER, M. A simple method to calculate resolving
power and confidence interval of QTL map location. Behavior Genetics,
v. 27, p. 125- 132, 1997.
DEKKERS, J. C. M. 2007. Marker-assisted selection for commercial
crossbred performance. Journal of Animal Science, v.85, p. 2104-2114, 2007.
DEKKERS, J. C. M. Commercial application of marker and gene assisted
selection in livestock: strategies and lessons. Journal of Animal Science, v.
82, p.313-328, 2004.
DEKKERS, J. C. M. Commercial application of marker and gene assisted
selection in livestock: strategies and lessons. Journal of Animal Science, v.
82, p.313-328, 2004.
DEKKERS, J. C. M. Prediction of response to marker assisted and
genomic selection using selection index theory. Journal of Animal
Breeding and Genetics, v. 124, p. 331-341, 2007.
DEMPFLE, L. Relation entre BLUP (Best linear unbiased prediction) et
estimateurs bayesiens. Annales de Gntique et Slection Animale, v. 9, p. 2732, 1977.
DEMPSTER, A. P.; LAIRD, N. M.; RUBIN, D. B. Maximum likelihood
from incomplete data via the EM algorithm. Journal of the Royal Statistic
Society, London, v. 39, p. 1-38, 1977.
267
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
268
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
269
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
270
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
2003.
GILMOUR, A. R. Mixed model regression mapping for QTL detection in
experimental crosses. Computational Statistics e Data Analysis, v.51, n.8,
p. 3749-3764, 2007.
GILMOUR, A. R. Mixed model regression mapping for QTL detection in
experimental crosses. Computational Statistics and Data Analysis, v. 51, n.
8, p. 3749-3764, 2007.
GILMOUR, A. R.; THOMPSON, R. Modelling variance parameters in
ASREML for repeated measures. In: WORLD CONGRESS ON
GENETIC APPLIED TO LIVESTOCK PRODUCTION, 6., 1998,
Armidale. Proceedings Armidale: AGBU: University of New England,
1998. v. 27, p. 453-454.
GILMOUR, A. R.; THOMPSON, R.; CULLIS, B. R. Average
information REML: an efficient algorithm for parameter estimation in
linear mixed models. Biometrics, v. 51, p. 1440-1450, 1995.
GODDARD, M. E. A mixed model for analysis of data on multiple
genetic markers. Theoretical and Applied Genetics, v. 83, p. 878-886, 1992.
GODDARD, M. E. Mapping genes for quantitative traits using linkage
disequilibrium. Genetics Selection Evolution, v.23, p. 131-134, 1991.
GODDARD, M. E. Genomic selection: prediction of accuracy and
maximization of long term response. Genetica, Dordrecht, v. 136, n. 2, p.
245-257, 2009.
GODDARD, M. E.; HAYES, B. J. Genomic selection. Journal of Animal
Breeding and Genetics, v. 124, p. 323-330, 2007.
GODDARD, M. E.; HAYES, B. J. Mapping genes for complex traits in
domestic animals and their use in breeding programmes. Nature Reviews
Genetics, v. 10, p. 381-391, 2009.
GODDARD, M.E. New technology to enhance genetic improvement of
pigs. Manipulating Pig Production, v.7, p.4452, 1999.
GODDARD, M.E.; HAYES, B. J.; MEUWISSEN, T. H. E. Using the
genomic relationship matrix to predict the accuracy of genomic selection.
Journal of Animal Breeding and Genetics, v. 128, n. 6, p.409-421, 2011.
GODDARD, M. E.; WRAY, N. R.; VERBYLA, K.; VISSCHER, P .M.
Estimating effects and making predictions from genome-wide marker
data. Statistical Science, Hayward, v. 24, p. 517-529, 2009.
GONZALEZ-RECIO, O.; GIANOLA, D.; LONG, N.; WEIGEL, K. A.;
ROSA, G. J. M.; AVENDANO, S. Nonparametric methods for
incorporating genomic information into genetic evaluations: an
application to mortality in broilers. Genetics, v.178, n.4, p. 2305 2313, 2008.
271
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
272
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
273
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
274
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
275
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
276
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
McRAE, A. F.; McEVAN, J. C.; DODDS, K. G.; WILSON, T.; CRAWFORD, A. M.;
SLATE, J. Linkage disequilibrium in domestic sheep. Genetics, v. 160, p.1113-1122, 2002.
MEUWISSEN, T. H. E. Genomic selection: marker assisted selection on genome-wide
scale. Journal of Animal Breeding and Genetics, v. 124, p. 321-322, 2007.
MEUWISSEN, T.H. Accuracy of breeding values of 'unrelated' individuals predicted by
dense SNP genotyping. Genetics Selection Evolution v.41, p.35, 2009.
MEUWISSEN, T. H. E.; GODDARD, M. E. Fine mapping of quantitative trait loci using
linkage disequilibria with closely linked marker loci. Genetics, v. 155, p.421-430, 2000.
MEUWISSEN, T. H. E.; GODDARD, M. E. Mapping multiple QTL using linkage
disequilibrium and linkage analysis information and multitrait data. Genetics Selection
Evolution, v. 36, p. 261-279, 2004.
MEUWISSEN, T. H. E.; HAYES, B. J.; GODDARD, M. E. Prediction of total genetic
value using genome-wide dense marker maps. Genetics, v. 157, p. 1819-1829, 2001.
MEUWISSEN, T. H. E.; KARLSEN, A.; LIEN, S; OLSAKER, I; GODDARD, M. E. Fine
mapping of a quantitative trait locus for twinning rate using combined linkage and linkage
disequilibrium mapping. Genetics, v.161, p. 373-379, 2002.
277
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
278
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
279
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
280
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
281
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
282
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
SCHAEFFER,
L.
R.
Linear
models.
1999.
Disponvel
em:
<www.http://cgil.uoguelph.ca/people/faculty/lschaeffer.html>. Acesso em: 15 jan. 2007.
SCHAEFFER, L. R.; DEKKERS, J. C. M. Random regressions in animal models for testday production in dairy cattle. WORLD CONGRESS OF GENETICS APPLIED TO
LIVESTOCK PRODUCTION, 5., 1994, Guelph. Proceedings... Guelph: University of
Guelph, 1994, v.18, p.443.
SCHFER, J.; STRIMMER, K. A shrinkage approach to large-scale covariance matrix
estimation and implications for functional genomics. Stat. Appl. Genet. Mol. Biol. 4: 32,
2005.
SCHUSTER, I.; CRUZ, C. D. Estatstica genmica aplicada a populaes derivadas de
cruzamentos controlados. Viosa: Editora UFV, 2004. 568 p.
SILVA, F. F. e.; ROSA, G. J. M.; GUIMARES, S. E.F.; LOPES, P. S.; de los CAMPOS,
G. Three-step Bayesian factor analysis applied to QTL detection in crosses between outbred
pig populations. Livestock Science, v. 4, p. 1, 2011.
SILVA, F. F. e.; SFADI, T. ; MUNIZ, J. A.; ROSA, G. J. M.; AQUINO, L. H.;
MOURO, G. B. Comparao bayesiana de modelos de previso de diferenas esperadas
nas prognies no melhoramento gentico de gado Nelore. Pesquisa Agropecuria Brasileira,
v. 43, p. 37, 2008.
SILVA, F. F. e.; SFADI, T. ; MUNIZ, J. A.; ROSA, G. J. M.; AQUINO, L. H.;
MOURO, G. B. ; SILVA, C. H. O. Bayesian analysis of autoregressive panel data model:
application in genetic evaluation of beef cattle. Scientia Agrcola, v. 68, p. 237-245, 2011.
SILVA, F. F. e.; VARONA, L.; RESENDE, M. D. V.; BUENO FILHO, J. S. S.; ROSA, G.
J. M.; VIANA, J. M. S. A note on accuracy of Bayesian LASSO regression in GWS.
Livestock Science, v. 141, n. 1-3, p. 310-314, 2011.
SILVA, M. A. ; THIEBAUT, J. T. L.; VALENTE, B. D.; TORRES, R. A.; FARIA, F. J. C.
Modelos lineares aplicados ao melhoramento gentico animal. 1. ed. Belo Horizonte MG:
PEPMVZ-Editora, 2008. 378 p.
SIMEAO, R. M.; CASLER, M.D.; RESENDE, M. D. V. Genomic selection in forage
breeding: designing an estimation population. In: Plant and Animal Genome Conference
XXI - 2013, San Diego. Abstracts of the Plant and Animal Genome Conference XXI, 2013.
SINGER, J. M.; STANEK, E. J.; LENCINA, V. B.; GONZLEZ, L. M.; LIE, W.;
MARTIN, S. S. Prediction with measurement errors in finite populations. Statistics and
Probability Letters, Amsterdam, v. 82, n. 2, Feb. 2011. DOI: 10.1016/j.spl.2011.10.013.
SOLBERG, T. R.; SONESSON, A. K.; WOOLLIAMS, J. A.; MEUWISSEN, T. H. E.
Reducing dimensionality for prediction of genome-wide breeding values. Genetics Selection
Evolution,
London,
v.
41,
n.
29,
2009.
Disponvel
em:
<http://www.gsejournal.org/content/41/1/29>. Acesso em 30/10/2010.
SOLBERG, T. R.; SONESSON, A.; WOOLIAMS, J.; MEUWISSEN, T. H. E. Genomic
selection using different marker types and density. In: WORLD CONGRESS OF
GENETICS APPLIED TO LIVESTOCK PRODUCTION, 8., 2006. Proceedings. Belo
Horizonte: Ed. da UFMG, 2006. 1 CD-ROM.
283
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
284
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
285
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
286
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
287
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Foto 3: Criadores e difusores do uso dos mtodos BLUP (Charles Henderson, esquerda) e
Bayesianos (Daniel Gianola, ao centro) na estimao de valores genticos; direita, Richard
Quaas, especialista em matriz de parentesco e modelo animal.
288
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Foto 5: Criador do mtodo REML e mtodo numrico de Informao Mdia (AI) (Robin
Thompson, esquerda) e autor do software ASREML (Arthur Gilmour, ao centro); John
Nelder, criador da tcnica GLMM e do software Genstat em Rothamsted ( direita).
Foto 6: Autores do software ASREML: Arthur Gilmour, ao centro, Brian Cullis, esquerda
e Robin Thompson, direita.
Foto 7: Criadores do mtodo de anlise espacial via processos ARIMA separveis em duas
direes (AR1AR1) e autores do software ASREML: Arthur Gilmour, esquerda e Brian
Cullis, direita.
289
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Foto 8: Larry Schaeffer, um dos pioneiros dos modelos de regresso aleatria multivariada e
Raphael Mrode, autor de compreensivo livro sobre modelos mistos e regresso aleatria.
Foto 9: Rohan Fernando, pioneiro na anlise de ligao gnica via BLUP e um dos pioneiros
(juntamente com Daniel Gianola) no uso da Inferncia Bayesiana no melhoramento
gentico; Ignacy Misztal, cone dos mtodos computacionais no melhoramento gentico;
Miguel Prez-Enciso, autor do software QxPack.
Foto 10: cones dos Modelos Lineares e Componentes de Varincia: Shayle Searle, David
Harville e Jean Louis Foulley, respectivamente.
Foto 11: Robert Tibshirani, Gustavo de los Campos e Andrs Legarra: autores dos mtodos
LASSO, BLASSO e IBLASSO, respectivamente.
290
Seleo Genmica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferncia Bayesiana (MCMC), Regresso Aleatria (RR) e Estatstica Espacial
Marcos Deon Vilela de Resende; Fabyano Fonseca e Silva; Paulo Svio Lopes; Camila Ferreira Azevedo
____________________________________________________________________________________
Foto 12: Pioneiros e cones da Gentica de Populaes: Sewall Wright , Alan Robertson,
Gustave Malecot e William Hill, respectivamente.
Foto 13: cones da Gentica Quantitativa Humana: Robert Elston, Kenneth Lange, Peter
Visscher e Naomi Wray, respectivamente.
Foto 14: Roland Vencovsky e Martinho Almeida e Silva: pioneiros e expoentes da Gentica
Quantitativa Vegetal e Animal no Brasil, respectivamente; Newton Freire-Maia, pioneiro da
Gentica de Populaes Humanas no Brasil.
291