Você está na página 1de 68

DOCUMENTOS, 46

ISSN 1517-536X

INFERNCIA BAYESIANA E SIMULAO


ESTOCSTICA (AMOSTRAGEM DE GIBBS) NA
ESTIMAO DE COMPONENTES DE VARINCIA E
DE VALORES GENTICOS EM PLANTAS PERENES

Marcos Deon Vilela de Resende

Colombo
2000
Documentos, 46

Embrapa Florestas. Documentos 46.

ISSN 1517-536-X

Exemplares desta publicao podem ser solicitados :


Embrapa Florestas
Estrada da Ribeira km 111 - Caixa Postal 319
83411-000 - Colombo, PR Brasil
Fone: (0**41) 666-1313
Fax: (0**41) 666-1276
E-mail: sac@cnpf.embrapa.br
Tiragem: 300 exemplares
Comit de Publicaes:
Amrico Pereira de Carvalho, Antnio Carlos de S. Medeiros, Edilson Batista de
Oliveira, Erich Gomes Schaitza, Guiomar Moreira de Souza Braguinia (Secretaria
Executiva), Honorino Roque Rodigheri, Jarbas Yukio Shimizu, Jos Alfredo Sturion,
Moacir Jos Sales Medrado (Presidente), Patrcia Pvoa de Mattos, Rivail Salvador
Loureno, Srgio Ahrens, Susete do Rocio C. Penteado.
Reviso gramatical: Elly Claire Jansson Lopes
Normalizao: Lidia Woronkoff
RESENDE, M.D.V. de. Inferncia Bayesiana e simulao
estocstica (amostragem de Gibbs) na estimao de
componentes de varincia e de valores genticos em plantas
perenes. Colombo: Embrapa Florestas, 2000.
68p. (Embrapa Florestas. Documentos, 46).
ISSN 1517-536X
1. Gentica. 2. Planta perene. 3. Inferncia. I. Ttulo. II.
Srie.
CDD 581.35

Produo:
REA DE COMUNICAES E NEGCIOS
Supervisor: Miguel Haliski

Embrapa, 2000

LAYOUT DA CAPA:
Cleide da S.N.F. de Oliveira
DIAGRAMAO
Marta de Ftima Vencato
IMPRESSO
Grfica Radial - Fone: 333-9593
Dezembro/2000
2

Documentos, 46

Sumrio
1 SINOPSE ............................................................................ 5
2 INTRODUO ........................................................................ 8
3 ESTIMAO E PREDIO BAYESIANA .............................................. 9
3.1 CONCEITO DE PROBABILIDADE, PROBABILIDADE CONDICIONAL E TEOREMA
BAYES ......................................................................... 10

DE

3.2 FUNO DE VEROSSIMILHANA .............................................. 16


3.3 DISTRIBUIES A PRIORI .................................................... 19
3.4 PRIORI NO INFORMATIVA ................................................... 19
3.5 DETERMINAO SUBJETIVA DA PRIORI ...................................... 21
3.6 DETERMINAO DA PRIORI POR FORMAS FUNCIONAIS ...................... 21
3.7 INFERNCIA BAYESIANA, INFERNCIA FREQENTISTA E INFERNCIA
VEROSSIMILHANA ................................................................. 22
4 FUNDAMENTOS BAYESIANOS DA PREDIO DE VALORES GENTICOS ............ 24
5 ESTIMAO BAYESIANA DE NDICES DE SELEO UNICARACTERSTICOS ........ 25
6 RELAO ENTRE BLUP E ESTIMADORES BAYESIANOS .......................... 26
7 RELAO ENTRE ESTIMADORES DE MXIMA VEROSSIMILHANA E ESTIMADORES
BAYESIANOS ....................................................................... 29
8 ESTIMAO BAYESIANA

DE NDICES DE SELEO MULTICARACTERSTICOS .. 29

9 ESTIMAO BAYESIANA DE COMPONENTES DE VARINCIA E RELAO COM


ML E REML .................................................................... 30
10 ESTIMADORES MELHORADOS PARA A MDIA DE TRATAMENTOS ................. 32
11 PROBLEMAS

DA ABORDAGEM CLSSICA DE PREDIO DE VALORES GENTICOS

E VANTAGENS DA ABORDAGEM

BAYESIANA ..................................... 34

12 IMPLEMENTAO PRTICA DA ANLISE BAYESIANA ............................. 41


13 DIAGNSTICO DE CONVERGNCIA ................................................ 51
14 ESTIMAO BAYESIANA VIA MODELOS LINEARES ROBUSTOS .................... 53
15 APLICAO A DADOS EXPERIMENTAIS ........................................... 54
16 REFERNCIAS BIBLIOGRFICAS .................................................... 62
Documentos, 46

Documentos, 46

INFERNCIA BAYESIANA E SIMULAO


ESTOCSTICA (AMOSTRAGEM DE GIBBS) NA ESTIMAO
DE COMPONENTES DE VARINCIA E DE VALORES
GENTICOS EM PLANTAS PERENES
Marcos Deon Vilela de Resende

1. Sinopse
A predio de valores genticos e a estimao de componentes de
varincia so atividades essenciais no melhoramento de plantas perenes, sendo
que o procedimento padro de estimao/predio o REML/BLUP (mxima
verossimilhana restrita/melhor predio linear no viciada). Uma deficincia
do procedimento REML/BLUP para a estimao/predio de componentes de
varincia/valores genticos refere-se ao fato de que o mtodo REML propicia
intervalos de confiana apenas aproximados para os parmetros genticos,
atravs do uso de aproximaes e suposies de normalidade assinttica. Isto
porque a distribuio e varincia dos estimadores no so conhecidos e, assim,
questes referentes efetividade da seleo a ser praticada no podem ser
respondidas com rigor.
A anlise Bayesiana baseia-se no conhecimento da distribuio a posteriori
dos parmetros genticos e possibilita a construo de intervalos de confiana
(melhor definido como intervalo de probabilidade ou intervalo de confiana
Bayesiano) exatos para as estimativas dos parmetros genticos. Assim, esta
anlise propicia uma descrio mais completa sobre a confiabilidade dos
parmetros genticos do que o mtodo REML (Gianola & Fernando, 1986;
Resende, 1997; 1999).
A inferncia estatstica Bayesiana baseia-se na distribuio condicional
do parmetro (q) dado o vetor de dados (y), ou seja na distribuio a posteriori
do parmetro dadas as observaes fenotpicas, a qual eqivale a:

f ( y ) =

f ( y ) f ( )

f ( y ) f ( ) d , em que:

f(yq) funo densidade de probabilidade da distribuio condicional de um


vetor de observaes (y) dado q(denominada funo de verossimilhana
ou modelo para os dados).

Documentos, 46

f(q) - funo densidade de probabilidade da distribuio a priori, que tambm


a densidade marginal de q. Esta funo denota o grau de conhecimento
acumulado sobre q, antes da observao de y.

f ( y ) f ( ) d - distribuio marginal ou preditiva de y com respeito a

q, onde R a amplitude da distribuio de q.


Verifica-se ento que a distribuio a posteriori proporcional a
verossimilhana x priori, ou seja, a funo de verossimilhana conecta a priori
posteriori, usando para isto os dados do experimento (observaes). Dessa
forma, a distribuio a posteriori contempla o grau de conhecimento prvio
sobre o parmetro (q) e tambm as informaes adicionais propiciadas pelo
experimento (y).
Para a situao em que tanto a distribuio a priori quanto a distribuio
das informaes so normais, ou seja, ~ N (u, r 2 ) e (Y ) ~ N ( , 2 ) com

2 conhecido, a distribuio a posteriori de q tambm normal, ou seja


(Y = y ) ~ N (u1 , r12 ) onde:

1 =

r 2 + 2 y
;
r 2 + 2

r12 = r 2 + 2

Usando esta distribuio a posteriori, pode-se demonstrar que os


fundamentos bsicos da predio de valores genticos so essencialmente de
natureza Bayesiana, conforme apresentado inicialmente por Robertson (1955).
Os efeitos genticos aditivos so definidos como desvios e uma populao
de efeitos genticos apresenta zero como mdia e a2 como varincia. A
melhor predio do efeito gentico de um indivduo sem nenhuma informao,
tomado aleatoriamente da populao a mdia populacional u, a qual pode ser
tomada como o estimador a priori, cuja varincia a2 . Tomando uma informao
y do indivduo, um segundo estimador do efeito gentico o desvio (y-u)
2
2
2
fenotpico em relao mdia populacional, o qual possui varincia e = y a ,
2
em que y a varincia de y. Estes dois estimadores independentes podem

ser combinados linearmente da melhor maneira possvel, tomando as recprocas


das respectivas varincias como pesos. Sob o enfoque Bayesiano, a esperana
da distribuio a posteriori corresponde mdia ponderada pela preciso, das
mdias da priori e da verossimilhana. Assim, tem-se:

Documentos, 46

estimador `a priori estimador inf ormao observada


/
a =
+

a2
y2 a2

Y u 1
1
= h 2 ( y u ),
= 2 + 2
/
+ 2
2
2
2

a y a a y a

=
+ 2
2
2

a y a

como no enfoque da inferncia estatstica clssica, onde h2 a herdabilidade.


Este tambm (considerando y como a mdia dos indivduos selecionados) o
estimador para o ganho gentico para a seleo massal.
No contexto Bayesiano, as equaes de modelo misto (denominadas
equaes de modelo misto de Robertson) so dadas por:

X ' R 1 X + S 1

1
Z'R X

X ' R 1Z E ( y ) X ' R 1 y + S 1 r1

=

Z ' R 1Z + G 1 E (a y ) Z ' R 1 y + G 1 0

onde r1 = E(b) e 0 = E (a).


Tomando a informao a priori sobre os efeitos fixos (b) como no
informativa (expressa como S e ento S 1 0 ), tem-se que esta
equao resultante eqivale s equaes do modelo misto (EMM):

X ' R 1 y
=
1 , em que:
a Z ' R y

X ' R 1 X

1
Z'R X

X ' R 1Z

Z ' R 1Z + G 1

R = I e2 ;

G = A a2 e S = Var ( ).

O problema bsico da implementao da anlise Bayesiana refere-se


integrao numrica (no espao do parmetro) da funo densidade de
probabilidade a posteriori. Tal integrao, por mtodos analticos, impossvel
na prtica. Assim, tem sido utilizado o procedimento de simulao estocstica
denominado amostragem de Gibbs (GS) para a viabilizao da estimao
Bayesiana (Sorensen, 1996).
Alm das distribuies (normais) assumidas para os efeitos aleatrios
(a) no modelo linear clssico e para a verossimilhana do vetor de observaes
(y), a abordagem Bayesiana requer atribuies para as distribuies a priori
dos efeitos fixos e componentes de varincia. De maneira geral, so atribudas
distribuies a priori no informativas ou uniformes para os efeitos fixos e
componentes de varincia, como forma de caracterizar um conhecimento a

Documentos, 46

priori vago sobre os referidos efeitos e componentes (Gianola & Fernando,


1986).
Utilizando-se distribuies a priori no informativas para os efeitos fixos
e componentes de varincia, tem-se que as modas das distribuies marginais
a posteriori dos parmetros genticos correspondem s estimativas obtidas
por REML e gera estimativas de componentes de varincia pelo mtodo VEIL
(ou de verossimilhana integrada) apresentados por Gianola & Foulley (1990).
A grande vantagem da anlise Bayesiana, neste caso, refere-se obteno
dos desvios padres e intervalos de confiana exatos para os parmetros
genticos bem como a obteno de estimativas mais precisas. Resende (1999b)
empregando as abordagens REML e GS obteve estimativas de 0,32 + 0,06 e
0,34 + 0,005, respectivamente, para a herdabilidade no sentido restrito para
o carter dimetro em Pinus caribaea var. hondurensis, confirmando a grande
preciso do mtodo Bayesiano.
Quanto estimao dos efeitos fixos (efeitos de blocos por exemplo) e
a predio dos efeitos aleatrios (valores genticos), tem-se que as mdias das
distribuies marginais a posteriori dos parmetros de locao (efeitos fixos e
aleatrios), dado os componentes de varincia ou parmetros de disperso,
eqivalem s solues das equaes do modelo misto do BLUP desde que sejam
atribudas prioris no informativas para os efeitos fixos, prioris normais para os
efeitos aleatrios e verossimilhana normal para o vetor de observaes. Neste
caso, a vantagem da abordagem Bayesiana refere-se obteno de valores
genticos preditos com menores desvios padres.
Em resumo, a anlise Bayesiana propicia estimativas mais precisas de
componentes de varincia, parmetros genticos, valores genticos e ganhos
genticos. Adicionalmente, a estimao Bayesiana permite a anlise exata de
amostras de tamanho finito. Este ltimo aspecto muito importante,
especialmente para programas de melhoramento baseados em conjuntos de
dados desbalanceados, onde tal abordagem propicia uma elegante anlise de
amostra finita, a qual no pode ser obtida pela metodologia freqentista de
modelos mistos.

2. Introduo
A predio de variveis aleatrias e a estimao de componentes de
varincia e efeitos fixos via metodologia de modelos mistos apresentam grande
relevncia na gentica quantitativa aplicada ao melhorameto de plantas perenes.
Embora a metodologia de modelos lineares mistos (MMLM) tratada pela
abordagem da Inferncia Estatstica Freqentista apresente vrias propriedades
desejveis, publicaes recentes tm mostrado uma superioridade da MMLM
quando abordada do ponto de vista da Inferncia Estatstica Bayesiana.

Documentos, 46

Em 1986, o trabalho clssico de Gianola & Fernando (1986) props a


abordagem Bayesiana como uma estratgia conceitual para resoluo de
problemas em melhoramento animal, a qual foi detalhada por Gianola et al.
(1990). Devido s excelentes propriedades tericas e prticas da anlise
Bayesiana, acredita-se que a mesma tornar-se- rotineira em melhoramento
de espcies perenes, transformando-se no procedimento padro de estimao
de componentes de varincia e de predio de valores genticos.
Os geneticistas quantitativos foram influenciados pelo renascimento
Bayesiano que ocorreu em meados da dcada de 1960. Lindley & Smith (1972)
apresentaram uma ligao entre modelos mistos e as abordagens Bayesianas.
Dempfle (1977) e Ronningen (1971) pesquisaram as conexes entre BLUP e
estimadores Bayesianos. Entretanto, somente na dcada de 1990, a utilizao
da Inferncia Bayesiana em melhoramento animal tornou-se rotineira,
destacando-se os trabalhos de Gianola & Foulley (1990); Gianola et al. (1990),
Weigel & Gianola (1993); Wang et al. (1993, 1994a e b); Jensen et al. (1994);
Sorensen et al. (1994); Varona et al. (1994); Varona (1994); Tassel et al.
(1995); Rodriguez et al. (1996); Arendonk et al. (1996), Garcia-Cortez &
Sorensen (1996) e Rekaya (1997).
Outros trabalhos, enfatizando a estimao Bayesiana de parmetros
genticos, mas no no contexto dos modelos lineares mistos, foram
desenvolvidos (Toro & Prunonosa, 1984; Saio & Hayashi, 1990) atravs do
uso do espao paramtrico como informaes a priori. No Brasil, a anlise
Bayesiana vem sendo recomendada para avaliao gentica em melhoramento
animal (Magnabosco, 1997; Rosa, 1999) e florestal (Resende, 1997; 1999).
A estimao Bayesiana de variveis aleatrias apresenta grande
relevncia em diversas reas do conhecimento alm da gentica quantitativa,
especialmente na biometria, econometria, engenharia, fsica e inteligncia
artificial, dentre outras. Segundo Sun et al. (1996), de maneira genrica, uma
anlise Bayesiana exata pode ser obtida para os modelos de componentes de
varincia baseados tradicionalmente na teoria da normalidade, permitindo, para
qualquer parmetro de interesse, uma detalhada inferncia, para amostras de
tamanho finito. Esta uma das grandes vantagens da anlise Bayesiana.

3. Estimao e predio Bayesiana


A origem da Inferncia Estatstica Bayesiana ocorreu com o lanamento
da obra An Essay Towards Solving a Problem in the Doctrine of Chances, a
ttulo pstumo, de autoria do Reverendo Thomas Bayes. Esta obra foi publicada
em 1763, por Richard Price, e apresenta o teorema denominado Teorema de
Bayes (Murteira, 1990).

Documentos, 46

O teorema de Bayes fundamenta-se em probabilidades condicionais. Para


enunciar tal teorema torna-se relevante apresentar alguns conceitos bsicos
de probabilidade, conceitos estes apresentados em vrios livros de estatstica,
por exemplo em Mood et al. (1974).

3.1. Conceito de probabilidade, probabilidade condicional e


Teorema de Bayes
O conceito de probabilidade a base de toda a Estatstica. A definio
de probabilidade aceita por praticamente todos os estatsticos. Entretanto,
vrias interpretaes de probabilidade existem, destacando-se a Fsica ou
Clssica, a Freqentista, a Lgica e a Subjetiva.
(i)

Probabilidade Freqentista

Sob o enfoque freqentista, as freqncias relativas de ocorrncia dos


resultados convergem para a probabilidade de ocorrncia destes resultados
quando o nmero n de repeties do experimento tende a ser grande.
Por exemplo, a freqncia de um resultado A dada por

nA
n lim f A = P[ A] , em que nA o nmero de vezes em que ocorreu o
n
resultado A e P[A] denota a probabilidade de A.
fA =

(ii)

Probabilidade Fsica ou Clssica

A interpretao clssica de probabilidade baseia-se no conceito de


resultados igualmente provveis. Assim, a probabilidade de um resultado ou
evento dada pela razo 1/N, em que N o nmero de resultados possveis.
(iii)

Probabilidade Subjetiva

Segundo esta interpretao, a probabilidade que uma pessoa atribui a


um possvel resultado de algum processo representa seu prprio julgamento da
chance de o resultado ser obtido. Assim, a probabilidade de um evento A a
medida do grau de confiana que a pessoa deposita em A.
(iv)

Probabilidade Lgica

A interpretao lgica de probabilidade pode ser derivada em funo do


conhecimento cientfico que de domnio pblico, ou seja, do conhecimento
comum a todos.
A seguir
Probabilidade.

10

so apresentadas algumas definies relevantes de

Documentos, 46

Espao de probabilidade: um espao de probabilidade a tripla (W , A,


P[.]), onde W o espao amostral, A uma coleo de eventos e P[.] uma
funo de probabilidade com domnio em A.
Probabilidade condicional: Se A e B so eventos em A, para um dado
espao de probabilidade (W ,A, P[.]), a probabilidade condicional de um evento
A dado o evento B, indicado por P[A|B] definido por:

P [A B ] =

P [A, B ]
se P [B ] 0,
P [B ]

P[A, B] = P[B] P[A B] = P[A ] P[B A ]

Desta forma, como P[AB] uma probabilidade, valem para ela todas
as propriedades de probabilidade. A prova de que a proporo P[A,B]/P[B]
uma probabilidade vem da verificao dos axiomas:
(i)

P[AB] = P[A,B]/ P[B] 0

(ii)

P[W B] = P[W ,B]/ P[B] = P[B]/ P[B] = 1

(iii)

Se A1, A2, ... An ..., uma seqncia de eventos mutuamente exclusivos


em A, ento:


P U A1 B = P[A1 B ]
i =1
i =1
Regra da multiplicao: Para um dado espao de probabilidade
(W ,A, P[.]), se A1, A2, ... An so eventos em A, para o qual [A1, A2, ... An-1]
> 0; ento:
P[A1.A2.... An] = P[A1]. P[A2A1]. P[A3A1A2] ....P[AnA1.A2 ... An-1]
Eventos independentes: Para um dado espao de probabilidade
(W ,A, P[.]), sejam A e B dois eventos em A. Os eventos A e B so definidos
ser independentes se, e somente se, uma das condies for satisfeita:
(i)

P[A,B] = P[A].P[B]

(ii)

P[AB] = P[A] se P[B] > 0

(iii)

P[BA] = P[B] se P[A] > 0

Teorema de probabilidade total: Para um dado espao de probabilidade


(W ,A, P[.]), se B1, B2, ..., Bn uma coleo de eventos mutuamente disjuntos
em A satisfazendo:

Documentos, 46

11

[ ]

= U B j e P B j 0 para j = 1, 2, ..., n ento para todo A A :


j 1

] [ ]

P[A] = P A B j P B j = P[A]
j 1

Considere o seguinte exerccio: duas caixas possuem bolas vermelhas


(V) e azuis (A). A caixa 1 (C1) possui 60V e 40A enquanto a caixa 2 (C2) possui
10V e 20A. Suponha que uma caixa seja tomada aleatoriamente e uma bola
tomada aleatoriamente dentro desta caixa. Qual a probabilidade de que a bola
seja vermelha?
Tem-se:
P[C1] = 0,5; P[C2] = 0,5
P[VC1] = 0,60; P[VC2] = 10/30 = 0,3333
Aplicando o teorema da probabilidade total, tem-se:
P[V] = P[V C1] + P[V C2]
= P[VC1] . P[C1] + P[VC2]. P[C2]
= 0,60 . 0,5 + 0,3333 . 0,5
= 0,4666
Teorema de Bayes: Para um dado espao de probabilidade (W ,A, P[.]),
se B1, B2, ..., Bn uma coleo de eventos mutuamente disjuntos em A
satisfazendo:

[ ]

= U B j e P B j 0 para j = 1, 2, ..., n ento para todo A A :


j 1

P[Bk A] =

P[A Bk ] P[Bk ]
n

j 1

] [ ]

P A Bj P Bj

Considere novamente o exemplo das bolas e caixas. Qual a probabilidade


de ter sido tomada a caixa 1, sabendo-se que a bola amostrada foi a vermelha?
Aplicando-se o teorema de Bayes, tem-se:

P[C1 V ] =

12

P[V C1 ].P[C1 ]
P[V C1 ].P[C1 ] + P[V C2 ].P[C2 ]

.=

P[V C1 ].P[C1 ]
P[V ]

0,60.0,5
= 0,6428
0,4666

Documentos, 46

Assim, o Teorema de Bayes envolve os conceitos de Probabilidade


Condicional e Probabilidade Total.
O Teorema de Bayes definido em termos de densidades de probabilidade,
tem a seguinte formulao para a distribuio de uma varivel aleatria contnua:

f ( y ) =

f ( y ) f ( )

f ( y ) f ( ) d

(1), onde:

q vetor de parmetros
y vetor de dados ou de informaes obtidas por amostragem
f(qy) distribuio condicional de q dado y, ou distribuio a posteriori (que
a base da estimao e predio Bayesiana).
f(yq) funo densidade de probabilidade da distribuio condicional de uma
observao (y) dado q (denominada funo de verossimilhana ou
modelo para os dados).
f(q)
funo densidade de probabilidade da distribuio a priori, que
tambm a densidade marginal de q. Esta funo denota o grau de
conhecimento acumulado sobre q, antes da observao de y.
f(yq) f(q) funo densidade conjunta de y e q.

f ( y ) = R f ( y, ) d = R f ( y ) f ( ) d = E f ( y )

distribuio

marginal ou preditiva de y com respeito a q, onde R a amplitude da


distribuio de q. Eq significa esperana com respeito distribuio
de q. (A integrao da distribuio conjunta, no espao paramtrico,
produz a marginal de y).

Como f(y) no funo de q (ou seja, f(y) constante para qualquer q),
a forma usual da formulao de Bayes : f(qy) a f(yq) f(q), onde a indica
proporcionalidade.
A expresso (1) advm das expresses f(q,y) = f(yq) f(q) e
f(q,y)=f(qy) f(y), as quais so obtidas a partir do teorema da probabilidade
condicional.
Verifica-se pela expresso (1) que um fator lgico que diferencia o enfoque
Bayesiano da abordagem freqentista refere-se ao tipo de informao utilizada.
Na concepo Bayesiana, toda informao de que se dispe til e deve ser
utilizada. Por outro lado, a estatstica clssica utiliza apenas observaes de
dados reais, desprezando-se as informaes subjetivas (Gamerman & Migon,
1993).
A componente amostral ou experimental comum aos modelos clssicos
e Bayesianos, mas com interpretaes diferentes. Embora os modelos
Bayesianos passem por uma extenso dos modelos clssicos, existe uma
Documentos, 46

13

divergncia fundamental entre os dois enfoques: no modelo clssico o parmetro


um escalar ou um vetor desconhecido, porm fixo, ao passo que no modelo
Bayesiano, o parmetro considerado como escalar ou vetor aleatrio (no
observvel), pois para os Bayesianos tudo o que desconhecido incerto e,
portanto, toda a incerteza deve ser quantificada em termos de probabilidade
(Murteira, 1988; 1990). Em funo disto, os modelos Bayesianos tratam
formalmente a informao a priori, atravs da distribuio de probabilidade
(subjetiva ou lgica) a priori. As informaes a priori e amostrais permitem a
atualizao peridica da distribuio de probabilidade a posteriori e, portanto,
permite modificar e atualizar as estimativas dos parmetros.
O teorema de Bayes uma regra para atualizao de probabilidades e
pode ser utilizado para clculo de probabilidades a posteriori em mais que um
estgio. Considerando ainda o exemplo das duas caixas com bolas vermelhas
(V) e azuis (A), qual a probabilidade de ter sido amostrada a caixa 1 (C1), tendose amostradas 2 bolas vermelhas?

P[C1 V1 V2 ] =

P[V1 V2 C1 ].P[C1 ]
P[V2 C1 ].P[C1 V1 ]
.=
P[V1 V2 ]
P[V2 C1 ].P[C1 V1 ] + P[V2 C2 ].P[C2 V1 ]

O raciocnio usado na expresso acima de que, no clculo da


probabilidade a posteriori aps a retirada da segunda bola vermelha V2, a
probabilidade a priori a ser utilizada refere-se probabilidade a posteriori no
estgio anterior (aps a retirada da primeira bola vermelha V1). Assim, tem-se:
P[V2C1] = P[VC1] = 0,60;
P[C1V1] = P[C1V] = 0,6428, conforme clculado anteriormente;
P[V2C2] = P[VC2] = 0,3333;
P[C2V1] = 1 - P[C1V] = 0,3572;

P[C1 V1 V2 ] =

0,60 0,6428
. = 0,7641
0,60.0,6428 + 0,3333.0,3572

A ordem com que as informaes so processadas pelo Teorema de


Bayes irrelevante, sendo que a posteriori resultante sempre a mesma.
Tambm, as observaes podem ser processadas em um nico grupo, uma a
uma, ou divididas em subgrupos que o resultado final permanece o mesmo
(Gamerman, 1996).
A expresso (1) fornece a regra de atualizao de probabilidades sobre
q, partindo de f(q) e chegando a f(qy). Assim, a distribuio a posteriori
proporcional verossimilhana X priori, ou seja, a funo de verossimilhana
conecta a priori posteriori usando para isto os dados experimentais (amostrais).
14

Documentos, 46

Dessa forma, a distribuio a posteriori contempla o grau de conhecimento


prvio sobre o parmetro [f(q)] e tambm as informaes adicionais propiciadas
pelo experimento [f(yq)]. A distribuio [f(y)] preditiva ou marginal de y,
antes de se observar y til para verificar a adequao da priori atravs das
predies que ela fornece para y. Aps observar y til para testar o modelo
como um todo (Gamerman & Migon, 1993).
Assumindo distribuio normal para a priori e para as observaes, ou
2
2
seja, ~ N ( , r ) e (Y ) ~ N ( , ) com 2 conhecido, a distribuio a

posteriori de q tambm normal, ou seja (Y = y ) ~ N ( 1 , r12 ) , onde:

1 =

r 2 + 2 y
;
r 2 + 2

r12 = r 2 + 2

Assim, verifica-se que a preciso ou inverso da varincia conota


informao, ou seja, a relao w = r 2 /(r 2 + 2 ), w (0,1), mede a
informao contida na priori em relao informao total (priori +
verossimilhana). Dessa forma, pode-se rescrever m1 = w m + (1-w) y, de
forma que a mdia da posteriori eqivale mdia ponderada pela certeza na
priori e na verossimilhana. Verifica-se tambm que a preciso (r12 ) da posteriori
eqivale soma das precises da priori e da verossimilhana.
Em termos de estimao, enquanto para a estatstica freqentista
possam existir vrios estimadores para um determinado parmetro, para a
Estatstica Bayesiana existe, em princpio, um nico estimador, o qual conduz a
estimativas que maximizam a funo densidade de probabilidade a posteriori.
Assim, inferncias sobre q so realizadas a partir da densidade a posteriori

( )

atravs da expresso geral p y = R f (y ) d onde p denota probabilidade


(Gianola & Fernando, 1986).

Ao nvel do i-simo elemento do vetor q, a esperana condicional de qi


dado y

i f ( y ) f ( ) d
R

f ( y ) f ( ) d

, o qual o usual estimador Bayesiano

de qi.
O teorema de Bayes pode ser estendido para inferncias sobre dados
no observados (dados futuros, por exemplo) (Lindley, 1965; Gammerman &
Migon, 1993). Sendo ~
y um vetor de dados no observados, tem-se

Documentos, 46

15

f (~
y , y ) = f ( ~y , y ) f ( y ) ,

(2)

que a funo densidade de probabilidade conjunta ou funo preditiva. A


funo densidade de probabilidade marginal ou funo preditiva de ~
y dada

y y ) = R f ( ~
y , y ) d
por f ( ~

(3)

= R f ( ~
y , y ) f ( y ) d
= R f ( ~
y ) f ( y ) d

= E y [ f ( ~
y )]
As expresses (2) e (3) representam a base para os problemas de predio
Bayesiana. Do exposto, torna-se claro que a estimao trata da compreenso
de um fenmeno (realidade) atravs de afirmaes probabilsticas a respeito
de quantidades no observveis e a predio trata de se fazer afirmaes
probabilsticas acerca de quantidades a serem observadas no futuro.

3.2. Funo de verossimilhana


A funo de verossimilhana formaliza a contribuio dos dados
amostrais para o conhecimento sobre q, visto que a mesma conecta a
distribuio a priori distribuio a posteriori.
A funo de verossimilhana [l( ; y )] de
cada

q a funo que associa a

q, o valor f(y|q). Dessa forma l( ; y ) = f ( y | ) . A funo

l( ; y ) associa (para um valor fixo de y) a probabilidade de ser observado


y a cada valor de q. Assim, quanto maior o valor de l maiores so as
probabilidades atribudas pelo particular valor de q considerado, ao valor
fixado de y. Ao fixar um valor de y e variar os valores de q observa-se a
plausibilidade ou verossimilhana de cada um dos valores de q. interessante
observar que:

f ( y | ) d y = 1 mas

l( ; y ) d = K 1 , ou seja a integral

da funo densidade de probabilidade eqivale a 1, mas a funo de


verossimilhana no integra 1 (Gamerman & Migon, 1993).
importante ressaltar que os termos probabilidade e verossimilhana
so conceitos diferentes. No cmputo da verossimilhana, fixa-se a amostra
ou conjunto de dados (y) e varia-se o parmetro q, procurando encontrar o

16

Documentos, 46

parmetro verossmel ou plausvel com o conjunto de dados. Por outro lado, no


clculo de uma probabilidade utiliza-se de uma distribuio com parmetro q
conhecido e calcula-se a probabilidade de se observar um determinado valor
y = y0. Em outras palavras, o problema da probabilidade predizer a chance
de ocorrer y sabendo q e o problema da verossimilhana fazer afirmaes
sobre q com base no valor observado y.
No clculo de probabilidades fixa-se q (conhecido) e varia-se y ao passo
que no clculo da verossimilhana fixa-se y e varia-se q.
Como exemplo, considere a distribuio y ~ Binomial (2, q), em que:
2 = n = nmero de repeties do experimento;
q = parmetro da binomial = probabilidade de sucesso;
y = 0, 1, 2 = espao amostral (y o nmero de sucessos);
q (0,1) = espao paramtrico ou domnio de variao do parmetro q.

2
A funo de probabilidade eqivale a p(yq) = y

qy (1 - q)2-y, a qual

eqivale prpria funo de verossimilhana, l (q; y), quando se observa y


= y0. Considerando os diferentes elementos do espao amostral, tem-se as
seguintes funes de verossimilhana:
(i)

2
se y = 0, ento l (q; y = 0) = 0 q0 (1 - q)2 = (1 - q)2;

(ii)

2
se y = 1, ento l (q; y = 1) = 1 q1 (1 - q)1 = 2q (1 - q);

(iii)

2
se y = 2, ento l (q; y = 2) = 2 q2 (1 - q)0 = q2.

Tendo-se observado y = 0, variando-se q no intervalo de 0 a 1 na funo


de verossimilhana l (q; y = 0) = (1 - q)2, verifica-se que o ponto de mximo
desta funo ocorre quando q = 0. Por outro lado, tendo-se observado y = 1,
variando-se q no intervalo de 0 a 1 na funo l (q; y = 1) = 2 q (1 - q),
verifica-se que o ponto de mximo ocorre quando q = . Finalmente, tendose observado y = 2, verifica-se que o mximo de l (q; y = 2) = q2 eqivale a
1. Estas funes de verossimilhana encontram-se plotadas na Figura 1.

Documentos, 46

17

l (; y)
l (; y=0)
1

l (; y=2)

l (; y=1)
0,5

0,5

Figura 1. Funes de verossimilhana para diferentes valores observados y


= 0, 1, 2.
Em resumo, se for observado:
y = 0 = 0 maximiza

l (q; 0);

y = 1 = maximiza l (q; 1);


y = 2 = 1 maximiza l (q; 2).
Genericamente, uma funo de verossimilhana pode ser construda
conforme descrito a seguir. Sendo, y1, y2, ..., yn uma amostra aleatria
independente e identicamente distribuda, com funo de probabilidade ou
funo densidade de probabilidade dada por f (yq), em que q o parmetro da
funo, a funo de verossimilhana de y~ = (y1, y2, ..., yn) dada por

l (q; y~ )=f( y~ q) = f (y1, y2, ... ynq), funo essa que associa a cada q, um
valor de f(yq).
A funo conjunta l (q; y~ )=f( y~ q) = f (y1, y2, ... ynq) fatora nas
marginais de forma que eqivale ao produtrio l (q; y~ )=f (y1q) ... f (ynq) =
n

2
f ( yi ). Como exemplo, considere a distribuio normal N( , ). Neste
i =1

18

Documentos, 46

caso, a funo de verossimilhana desta normal eqivale a l (q; y~ )= f ( y~ q)


=

i =1

i =1

f N ( yi ; , 2 ) =

1 ( yi ) 2
1
n
2
exp

exp 2 ( y ) ,
2 1/ 2
2
[2 ]

2
2

onde y a mdia aritmtica dos yi.


A funo de verossimilhana a base do Princpio da Verossimilhana, o
qual postula que toda a informao contida na amostra ou experimento encontrase representada nesta funo. Existem diferentes verossimilhanas que podem
ser empregadas na estimao paramtrica tais quais verossimilhana
incondicional marginal, verossimilhana condicional e verossimilhana parcial.
Gianola et al. (1989) apresentam detalhes sobre a estimao envolvendo estes
diferentes conceitos.

3.3. Distribuies a priori


A distribuio a priori constitui-se no nico elemento novo na anlise
Bayesiana em relao anlise clssica. A determinao desta distribuio
subjetiva, entretanto dados experimentais podem ser utilizados nesta etapa.
A premissa desta distribuio que ela represente o estado atual de
conhecimento sobre q, antes de serem analisados os resultados experimentais.
Zellner (1971) distingue dois tipos de informao a priori, uma baseada em
dados passados e outra completamente subjetiva (no baseada em dados). Na
presena de dados experimentais prvios ou quando baseada em fundamentos
tericos, a priori deve ser obtida de uma maneira cientfica (por formas
funcionais).
A distribuio a priori tem importncia maior quando a quantidade (n) de
dados experimentais atuais pequena. Caso contrrio a priori tende a ser
dominada (pois recebe menor peso) pela verossimilhana, ou seja, com n ,
as abordagens freqentista e Bayesiana so coincidentes. Em outras palavras,
o peso da verossimilhana maior do que o peso da priori, se a varincia dos
dados observados menor que a varincia da priori. importante ressaltar,
entretanto, que atribuir probabilidade zero a priori, significa atribuir zero tambm
a posteriori pois, neste caso, sendo a posteriori = priori x verossimilhana, no
h verossimilhana que faa a posteriori diferente de zero.

3.4. Priori no informativa


Existem situaes em que o conhecimento sobre determinado fenmeno
vago ou inexistente. Nestes casos, a distribuio a priori dita vaga, difusa

Documentos, 46

19

ou no informativa, no precisa ou de varincia alta, significando que a densidade


a priori reflete ignorncia (Jeffreys, 1961).
Assim, a priori no informativa poderia ser representada por f(q)a
(4)
constante; - <q<
Uma priori deste tipo poderia ser especificada atravs de uma distribuio
com varincia tendendo ao infinito (Gianola & Fernando, 1986) e neste caso,
maior nfase ou peso sero dados verossimilhana (dados experimentais ou
amostrais).
Entretanto, para inferncia sobre uma varincia s2, prioris da forma
mencionada tornam-se informativas (Jeffreys, 1961) e uma priori no
2
informativa poderia ser representada por f ( )

1
; 0 < 2 < .
2

Para prioris no informativas, supuseram-se inicialmente distribuies


uniformes como representantes de situaes onde no se dispe de informao
inicial, ou seja, f(q) a constante (q variando na reta), fato que implica em no
favorecer qualquer valor particular de q (Bayes, 1763).
Gamerman & Migon (1993) apresentam algumas dificuldades inerentes
a esta escolha:
(i)

f(q) imprpria, ou seja, a integral sobre todos os possveis valores de


q no converge:

(ii)

f ( ) d .

se = ( ) transformao 1 a 1 (biunvoca) de q e se q tem


distribuio uniforme ento pelo teorema de transformaes de
variveis, a densidade de f ser: f ( ) = f ( ( ))

d
d

.
d
d

Assim, o raciocnio que conduz especificao f(q) a constante, deveria


levar tambm a f(f) a constante, o que no verdade. O ideal seria estabelecer
uma regra que fosse invariante e que f(f) no fosse imprpria.
Entretanto, o interesse principal reside na distribuio a posteriori e como
esta , em geral, prpria (pois (4) absorvida na constante de integrao
associada com a posteriori) mesmo quando a priori no o , a eventual
impropriedade das distribuies a priori no importante (Gamerman & Migon,
1993). A classe de prioris no informativas proposta por Jeffreys (1961)
invariante, mas eventualmente imprpria.

20

Documentos, 46

3.5. Determinao subjetiva da priori


Sendo q uma quantidade desconhecida e considerando os seus possveis
valores, a probabilidade a priori de cada valor possvel de q pode ser avaliada
diretamente atravs de instrumentos auxiliares (loterias, roletas) quando q for
discreta. No caso de distribuies contnuas, tm sido sugeridas as abordagens
do histograma, da funo distribuio e da verossimilhana relativa (Gamerman
& Migon, 1993).

3.6. Determinao da priori por formas funcionais


De algum conhecimento sobre q pode-se descrever sua densidade por
uma determinada forma funcional, ou eventualmente, pode-se definir uma famlia
paramtrica de densidades. Adicionalmente deve-se verificar se a densidade
escolhida est representando bem a informao disponvel. Gamerman & Migon
(1993) citam que, por exemplo, poder-se-iam fazer as seguintes consideraes
sobre q:
(i)

q se distribui simetricamente em relao moda;

(ii)

a densidade de q decai rapidamente quando se afasta da moda,


implicando uma varincia pequena;

(iii)

intervalos muito afastados da moda tm probabilidade desprezvel.

Tais consideraes poderiam caracterizar aproximadamente a famlia


da distribuio normal com seus hiperparmetros, ou seja, parmetros que
auxiliam a especificao da priori.
Uma abordagem sistemtica para a determinao de distribuies a priori
pode ser enunciada tal qual o caso das distribuies conjugadas. A propriedade
de preservao da classe de distribuies quando a distribuio do parmetro
atualizada define conjugao.
No tpico 3.1., enunciou-se que se a distribuio dos dados (y|
q)~N(q,
2
) e a distribuio a priori q~N(u, r ), a distribuio a posteriori de q

s
(q
|y)~N(m1, r12 ). Assim, tem-se a priori e a posteriori com distribuio normal,

ou seja, priori normal conjugada a posteriori normal. Este tipo de priori, segundo
Gamerman & Migon (1993) torna a anlise mais tratvel, permitindo explorar
a natureza seqencial do mtodo Bayesiano.

Sendo F = f ( y | ), uma famlia de distribuies amostrais, uma


classe de distribuio Y conjugada a F se:

Documentos, 46

21

f F e f() ento f(|y)

Quanto definio de distribuies conjugadas, algumas ressalvas devem


ser feitas (Gamerman & Migon, 1993):
(i)

a classe Y pode ser muito ampla, por exemplo, quando se tem


Y = {todas as distribuies} e F qualquer. Neste caso, a definio
no tem valor prtico;

(ii)

a classe Y pode ser muito restrita, por exemplo, quando Y = {P:


P(q = q0) = 1}. Isto implica que qualquer amostra no dar informao
alguma, pois tem-se a certeza de que q = q0 e, portanto, esta certeza
ser mantida na posteriori. Assim, a definio tambm no ter valor
prtico. Dessa forma, recomenda-se ento a atribuio de probabilidade
positiva a todo e qualquer valor possvel de q por mais improvvel que
ele seja.

Em concluso, a classe Y deve ser ampla o suficiente para proporcionar


a escolha de uma distribuio a priori conveniente e, ao mesmo tempo deve
ser restrita o suficiente para que a definio de distribuies conjugadas seja
til.
Como principais famlias conjugadas podem ser citadas:
(i)

famlia de distribuies Beta conjugada Binomial;

(ii)

famlia de distribuies Normais conjugada Normal;

(iii)

famlia de distribuies Gama conjugada Poisson;

(iv)

famlia de distribuies Gama conjugada Exponencial;

(v)

Normal-Gama conjugada Normal.

3.7. Inferncia Bayesiana, Inferncia freqentista e Inferncia


verossimilhana
A inferncia estatstica tem evoludo muito nas ltimas dcadas,
principalmente em funo do aumento dos recursos computacionais. Desde o
incio do desenvolvimento da estatstica at recentemente, houve grande
supremacia da inferncia freqentista, a qual, em geral, tem sido creditada
como Fisheriana e se apia, principalmente, na consistncia assinttica atravs
da qual, um modelo estimado converge para o verdadeiro modelo. A propriedade
de se incorporar a informao a priori na anlise, sob o enfoque Bayesiano,
sempre gerou muita controvrsia, em determinada fase do desenvolvimento
da estatstica (Efron, 1978; Lindley, 1978; Smith, 1984). Atualmente, este
tipo de discusso parece no ser mais relevante, com as diferenas entre as
22

Documentos, 46

duas abordagens bem compreendidas e as virtudes de cada uma delas utilizadas


quando mais conveniente (Gamerman, 1996).
Atualmente, uma das marcantes caractersticas da inferncia estatstica
moderna o papel central da funo de verossimilhana, a qual foi introduzida
por Fisher (1922). Segundo Lindsey (1999), poucos estatsticos modernos
percebem que Fisher nunca foi um freqentista para inferncia (embora ele
tenha geralmente usado uma interpretao freqentista de probabilidade), sendo
muito mais prximo aos Bayesianos, tais quais Jeffreys, do que da escola de
Neyman-Pearson (os verdadeiros freqentistas, que introduziram a teoria dos
testes de hipteses entre 1936 e 1938). Segundo tal autor, a inferncia
estatstica no sentido Fisheriano enfatiza a obteno do mximo de informao,
dado o conjunto de observaes, sem incorporao de conhecimento e
informao a priori, exceto aquelas necessrias para a construo de modelos
(o princpio da verossimilhana baseia-se na suposio de que o modelo ou a
funo so verdadeiros e que somente os valores corretos dos parmetros
necessitam ser determinados). Portanto, a inferncia Fisheriana refere-se
essencialmente inferncia verossimilhana.
O uso da funo de verossimilhana como um meio direto de fazer
inferncia, conforme sugerido por Fisher, um enfoque recente em estatstica
(Edwards, 1972; Bardorff-Nielsen, 1976; Gomes, 1981; Pereira, 1997; Lindsey,
1999), caracterizando a inferncia verossimilhana.
O artigo de Pereira (1997) caracteriza muito bem os pontos fortes da
inferncia verossimilhana, tais quais: (i) a funo de verossimilhana fornece
uma medida exata da incerteza, resumindo toda a informao que os dados
fornecem sobre um parmetro desconhecido q; (ii) a verossimilhana uma
medida relativa, de forma que no possvel obter uma medida de plausibilidade
absoluta e por isto, somente as razes de verossimilhana so relevantes; (iii)
a funo de verossimilhana relativa, dada por R ( ; y) =

y (1 ) n y n n
pode
y n (n y) n y

ser utilizada para obteno de nveis de significncia aproximados, atravs dos


testes da razo de verossimilhana; (iv) existe uma relao entre a funo de
verossimilhana e os mtodos convencionais de teoria de grandes amostras,
ou seja, alm de fornecer uma medida exata de plausibilidade, a funo de
verossimilhana d uma indicao de aplicabilidade de resultados assintticos
em casos particulares; (v) os mtodos de verossimilhana so exatos tanto
para pequenas quanto para grandes amostras, no dependendo de propriedades
assintticas das vrias distribuies amostrais.
Assim, em inferncia Bayesiana, certos mtodos que assumem
distribuies a priori no informativas, so essencialmente de inferncia
verossimilhana, tais como o mtodo VEIL (ou da verossimilhana integrada de

Documentos, 46

23

Gianola & Foulley, 1990) de estimao de componentes de varincia, os quais


mantm a propriedade de conduzir a anlise exata de amostra de tamanho
finito.

4. Fundamentos Bayesianos da predio de valores genticos


Os fundamentos bsicos da predio de valores genticos so
essencialmente de natureza Bayesiana, conforme verificado inicialmente por
Robertson (1955) e Dempfle (1977) e mostrado a seguir, considerando a
distribuio a priori, normal, conjugada posteriori normal.
Os efeitos genticos aditivos so definidos como desvios e uma populao
de efeitos genticos apresenta zero como mdia e a2 como varincia. A
melhor predio do efeito gentico de um indivduo sem nenhuma informao,
tomado aleatoriamente da populao a mdia populacional m, a qual pode ser
tomada como o estimador a priori, cuja varincia a2 . Tomando uma informao
y do indivduo, um segundo (dado observado) estimador do efeito gentico o
desvio (y-u) fenotpico em relao mdia populacional, o qual possui varincia

e2 = y2 a2 . Estes dois estimadores independentes podem ser combinados


linearmente da melhor maneira possvel, tomando as recprocas das respectivas
varincias como pesos. Sob o enfoque Bayesiano, a esperana da distribuio
a posteriori corresponde mdia ponderada pela preciso, das mdias da priori
e da verossimilhana (tpico 3.1.). Assim, tem-se:
estimador `a priori estimador inf ormao observada
/
+
a =

a2
y2 a2

0
1
Y 1
= h 2 ( y ),
= 2 + 2
+
/
a y a2 a2 y2 a2

1
=

+
a2 y2 a2

como no enfoque freqentista, onde h2 a herdabilidade. Este tambm


(considerando y como a mdia dos indivduos selecionados) o estimador para o
ganho gentico para a seleo massal, conforme apresentado e derivado da
mesma forma por Lerner (1958).
No melhoramento, duas fontes independentes de informao tm
importante aplicao prtica, mesmo quando se tem apenas o estimador a
priori. Por exemplo, quando se deseja selecionar 30 indivduos para reproduo,
mas a partir de um teste de apenas 40 indivduos tomados aleatoriamente da
populao. Neste caso, o procedimento mais eficiente selecionar os 20
melhores (que provavelmente estaro acima da mdia populacional) identificados

24

Documentos, 46

com base no teste e tomar os outros 10 (no testados) aleatoriamente da


populao. Espera-se que, dentre os 10, em torno de 5 estejam acima da
mdia populacional. Robertson (1955) demonstrou claramente a utilidade de
duas fontes de informao independentes para derivar vrias frmulas de
predio.

5. Estimao Bayesiana de ndices de seleo unicaractersticos


A predio de valores genticos de genitores com base em testes de
prognies derivada a seguir, com base em Gianola & Fernando (1986), visando
elucidar a relao entre ndice de seleo e estimadores Bayesianos.
Considere uma amostra de 5 genitores no aparentados, tomados
aleatoriamente de uma populao de genitores e suas capacidades de
transmisso (metade de seus valores genticos) representados pelo vetor

q= [S1, ..., S5], distribudos a priori como N ~ ( g , S2 ) . Logicamente, neste


caso, o interesse reside nas inferncias sobre q, dados os resultados do teste
de prognies.

O modelo para a mdia da prognie do genitor i :

yi = + Si + ei. ; i = 1,..., S ,

onde

m uma constante conhecida e

ei. ~ N (0, e2 / ni ) a mdia dos resduos associados com as observaes


da prognie ni do genitor i. Uma vez que m assumido como conhecido, podese escrever: wi = yi = Si + ei. .

E ( wi Si ) = S i e Var ( wi Si ) = e2 / ni .
Uma vez que os genitores no so aparentados, a densidade a priori
dada por:
S

f ( ) =
i =1

1
2 S2

(S g )2
exp i 2
2 S

A funo de verossimilhana, com Cov (ei. , e j . ) = 0, i j ,

f ( wi ,..., wS ) =
S

i =1

n (w s )2
ni
exp i i 2 i .
2
2 e
2 e

Documentos, 46

25

Com a suposio de independncia

f ( Si w1 ,..., wS ) = f ( Si wi ); i = 1,..., S
A densidade a posteriori da capacidade de transmisso do i-simo genitor
ento:
2
2

1 S + e2 / ni
wi S2 + g e2 / ni

(
)
exp
.

f Si wi
X Si
2 S2 e2 / ni
S2 + e2 / ni

Este resultado eqivale a uma densidade normal com mdia:

E ( Si wi ) =

wi S2 + g e2 / ni g ( S2 ) 1 + wi ( e2 / ni ) 1
=
.
( S2 ) 1 + ( e2 / ni ) 1
S2 + e2 / ni

Observa-se que a mdia a posteriori corresponde mdia ponderada da


mdia a priori (g) e da mdia da amostra (wi), com os pesos sendo as recprocas
de suas varincias.
Denominando a = ( S2 ) 1 /[( S2 ) 1 + ( e2 / ni ) 1 ] , tem-se:

E ( Si wi ) = ag + (1 a) wi
= g + (1 a )(wi g ) = g + (1 a )( yi g ),
que a mdia condicional de uma distribuio normal bivariada.
Sendo (1 a ) = ni /(ni +

E ( Si wi ) =

e2
) , e sendo g = 0, neste caso tem-se:
S2

ni
ni
( yi . ) =
(Yi. ),
2

ni + (4 h 2 ) / h 2
ni + e2
S

que eqivale ao clssico ndice de seleo para avaliao da capacidade de


transmisso de um touro via teste de prognies (Vleck et al., 1987; Vleck,
1993).

6. Relao entre BLUP e estimadores Bayesianos


Duas derivaes da metodologia BLUP sob o enfoque Bayesiano so
apresentadas a seguir, uma delas com base em Ronningen (1971) e Dempfle
(1977, 1989) e outra com base em Robertson (1955).
26

Documentos, 46

Para ambas as derivaes tem-se o seguinte modelo e suposies,


assumindo G e R conhecidos:
y = Xb + Za + e = Wt + e;
E(a) = 0;

E(e) = 0;

Var(a) = G;

var(e) = R;

W = [X Z];

t= [b a];

E(y) = Xb;
cov (a, e) = 0;

var(y) = ZGZ+ R.

A primeira derivao (Dempfle, 1977) usa o teorema de Bayes e assumese que adicionalmente t ~ N (r, M); e ~ N (0, R); y ~ N(Xb, WMW+ R),
onde:


r
S 0

E (t ) = E = r = 1 e var(t ) = M =
a
0
0 G
Dado t, y ~ N(Wt, R), e dado r, t ~ N(r, M). A verossimilhana de y
dado t
L (t; y) = k1 exp[-(y Wt)R-1 (y Wt)/2] = f (y|t), e a densidade da
distribuio a priori de t
f(t) = k2 exp [-(t - r) M-1 (t r)/2].
Assim, a distribuio a posteriori de t proporcional a
f(t|y) a L(t; y) f(t) a k3 exp{-[(y Wt)R-1 (y Wt) + (t r)M-1 (t-r)]/2}.
Esta equao pode ser expressa tambm em termos da densidade
conjunta a posteriori dada por:
f(a, b) a exp { - (y Xb - Za) R-1 (y Xb - Za)}
x exp { - (b r1) S-1 (b r1)}
x exp { - (a E(a)) G-1 (a E(a))}.
Uma vez que esta distribuio simtrica e unimodal (normal), a moda,
a mediana e a mdia so idnticas e uma grande classe de funes de perda
comum (funo de perda quadrtica, funo de perda absoluta ou funo de
perda uniforme) conduz ao mesmo estimador. Determinando a moda, obtmse o vetor mdio da distribuio conjunta a posteriori, por maximizao e no
integrao. Diferenciando a expresso com respeito a t (b e a) e igualando a
zero, obtm-se:

[W ' R

W + M 1 t = W ' R 1 y + M 1r , onde t = E [t y ] .

Documentos, 46

27

Este sistema equivalente a:

X ' R 1 X + S 1

1
Z'R X

E ( y ) X ' R 1 y + S 1 r1

=

Z ' R 1Z + G 1 E (a y ) Z ' R 1 y + G 1 0
X ' R 1Z

(5)

onde r1 = E(b) e 0 = E (a).


Tomando a distribuio a priori sobre os efeitos fixos como no
informativa (expressa como S e ento S 1 0 ), tem-se que esta equao
resultante eqivale s equaes do modelo misto (EMM):

X ' R 1 X

1
Z'R X

1
1
Z'R Z + G
X ' R 1Z

X ' R 1 y
=
1
a Z ' R y

A equao para t , pode ser derivada tambm pela maximizao de f (y,


t) para variaes em t, sendo o estimador, neste caso, denominado mximo a
posteriori (MAP) (Henderson, 1982a, 1984).
A segunda derivao baseia-se em Robertson (1955) e fundamenta-se
na combinao de dois estimadores (fontes de informao) independentes:
(i) o estimador BLUE ou de mnimos quadrados generalizados de t

t1 = (W ' R 1W ) 1 W ' R 1 y e
(ii) o estimador a priori de t

t2 = E (t ) = r.
Estes estimadores apresentam as matrizes de varincia-covarincia

var(t1 ) = (W ' R 1W ) 1 M e var(t2 ) = 0,


com varincias do erro de estimao

var(t1 t ) = (W ' R 1W ) 1 e var(t2 t ) = M .


Combinando-se os dois estimadores obtm-se:

tc = [var(t1 t ) 1 + var(t2 t ) 1 ]1{var(t1 t ) 1 t1 + var(t2 t ) 1 t2 } , que eqivale a


[W ' R 1W + M 1 ] tc = W ' R 1 y + M 1r.
28

Documentos, 46

Fazendo as mesmas suposies sobre os efeitos fixos, esta expresso


eqivale s equaes de modelo misto. As equaes de modelo misto
apresentadas em (5) so denominadas equaes de modelo misto de Robertson.

7. Relao entre estimadores de mxima verossimilhana e


estimadores Bayesianos
Assumindo como uniforme a distribuio a priori dos parmetros a serem
estimados e maximizando (obtendo a moda) a distribuio a posteriori, o
estimador resultante eqivalente ao de mxima verossimilhana ML
(Henderson, 1984; Gianola & Fernando, 1986). De fato maximizando f (a, b)
(tpico anterior) (mas considerando uma priori no informativa para b) com
respeito a a e b obtm-se um estimador denominado de mxima verossimilhana,
por Henderson et al. (1959), embora f(a, b) (tpico anterior) no seja uma
funo de verossimilhana e sim uma densidade a posteriori. Mesmo assim,
pode ser obtido a partir das EMM que

E ( | y ) = ( X 'V 1 X ) 1 X 'V 1 y = e

E (a y ) = GZ 'V 1 [ y X ] = a
um estimador GLS e tambm ML de b e a um estimador ML de
E(ab, y), eqivalendo mdia da distribuio condicional na qual b fixado.

8. Estimao Bayesiana de ndices de seleo multicaractersticos


Com a tcnica dos ndices de seleo multicaractersticos deseja-se
predizer um vetor no observvel T = Aq1 (denominado agregado genotpico)
em que A e q1 referem-se a uma matriz conhecida, contendo os pesos
econmicos relativos dos diferentes caracteres e um vetor de valores genticos,
respectivamente.
O vetor de dados dado por:
y = q2 + Z q1 + e, onde:
de y

q2 - vetor de constantes especificando a locao da distribuio marginal


Z matriz de incidncia para q1

Documentos, 46

29

Para este modelo tem-se:

0 G
1

e ~ N 0 , 0


2 ZG
y

GZ '
R R
, onde V = ZGZ+R e G e R so conhecidas.
R V

A densidade a posteriori de q1 f(q1|y) a f(y|q1) . f(q1), a qual tem


distribuio normal pois f(y|q1) e f(q1) tambm tem distribuio normal. Esta
posteriori eqivale a:
f(q1y) a exp { - (y q2 - Zq1) R-1 (y q2 - Zq1)} x
x exp { - (q1 - 0) G-1 (q1 - 0)}, pois E (q1) = 0
Uma vez que esta distribuio simtrica e unimodal, a mdia e a moda
so a mesma, de forma que a distribuio pode ser diferenciada com respeito
a q1 e igualada a zero para se obter a mdia a posteriori. Fazendo-se isto
obtm-se
ZR-1 Z + G-1 E (q1|y) = [ZR-1 (y - q2) +G-1 0]
Resolvendo-se esta equao para E (q1|y) obtm-se
E (q1|y) =(ZR-1 Z + G-1)-1 [ZR-1 (y - q2) +G-1 0]
que eqivale equao para o BLP ou ndice de seleo associado a q1. Dessa
forma, necessita-se ainda incluir as informaes econmicas para se obter T.
Uma vez que T linear em q1, a posteriori T tambm normal com vetor
mdio E(T|y) = A E (q1|y).
Obtm-se, assim, o estimador Bayesiano de T, bastando para isto,
encontrar a mdia da distribuio a posteriori de q1|y e posteriormente
incorporar as informaes econmicas (A).

9. Estimao Bayesiana de componentes de varincia e relao


com ML e REML
No contexto dos modelos lineares mistos, os valores genticos (q1) so
preditos simultaneamente estimao dos efeitos fixos (q2) e dos componentes
de varincia (q3). Na abordagem Bayesiana, a avaliao gentica pode ser
obtida, de maneira geral, pela construo da densidade a posteriori f
(q1, q2, q3|y) e, se necessrio, pela integrao de f (q1, q2, q3|y) em relao a q2
e q3. Estes (q2 e q3) so denominados parmetros de nuissance e por isso
devem ser integrados fora, exceto q2 em alguns casos, onde o mesmo constituise em uma parte integrante da funo de mrito total (neste caso, a funo de
mrito depende da combinao linear de q1 e q2).
30

Documentos, 46

A obteno de q1 requer a integrao ou o conhecimento de q2 e q3.


Henderson (1973) props o mtodo BLUP para situaes em que q3 conhecido
e q2 no o . Para situaes em que q3 no conhecido, este autor sugeriu que
o procedimento de mxima verossimilhana (ML) propiciaria estimativas
razoveis. Conforme Gianola & Fernando (1986), argumentos Bayesianos,
que no requerem normalidade e linearidade permitem validar a intuio de
Henderson.
A distribuio de q1, q2, e q3, dado y proporcional a
f (q1, q2, q3|y) a f (y|q1, q2, q3) . f (q1, q2, q3)
Concentrando o interesse em q1 (o vetor de valores genticos), deve-se
integrar q2 e q3 atravs de

f (1 | y ) = R2 R3 f (1 2 , 3 , y ) f ( 2 , 3 y ) d 2 d 3
Tomando a distribuio conjunta a posteriori de forma que a maioria da
densidade esteja na moda ( , ) , tem-se:
2

f (1 | y ) =& f (1 2 = 2 , 3 = 3 , y ) .
Usando prioris no informativas para q2 e q3, tem-se que 2 e 3 so
precisamente estimadores ML de q2 e q3, pois neste caso f(q2, q3|y) a
f(y|q2, q3), ou seja a densidade de q2 e q3 dado y proporcional funo de
verossimilhana, de forma que a moda da posteriori conjunta corresponde ao
mximo da funo de verossimilhana, produzindo estimadores ML.
Uma abordagem alternativa para inferncia sobre q1 consiste em obter

f (1 , 2 | y ) =& f (1 , 2 | 3 = 3 , y ), onde 3

refere-se

moda

da

densidade marginal de q3, dado y. Para obteno de 3 deve-se integrar q2


em f ( 2 , 3 | y ) f ( y | 2 , 3 ) e ento maximizar f(q3|y). Usando-se uma
priori no informativa para q3, sob normalidade 3 um estimador de mxima
verossimilhana restrita (REML) para q3 (Harville, 1977). Assim, se o interesse
reside na inferncia conjunta para q1 e q2 basta usar

f (1 , 2 | y ) =& f (1 , 2 | 3 = 3 , y ) , que sob normalidade equivalente a


soluo das equaes de modelo misto com q3 substitudo pelas estimativas
REML de q3 (desde que se tenha usado prioris no informativas para q2 e q3).

Documentos, 46

31

Inferncias sobre componentes de varincia devem ser baseadas em


f(q3|y) a f(y|q3) . f(q3), onde q3 contm varincias e, portanto, f(q3|y) definida
na amplitude (0, ) para cada um dos elementos de q3, de forma que nunca
surgem problemas de estimativas negativas de componentes de varincia (Box
& Tiao, 1973). f(q3|y) obtida integrando-se q1 em f(q1, q2, q3|y) produzindo
f(q2, q3|y) e integrando-se q2 nesta ltima. Neste caso, f(q2, q3|y) conduz aos
estimadores ML de q2 e q3 e f(q3|y) conduz a um estimador REML de q3.
Segundo Gianola & Fernando (1986), isto (eliminao das influncias de q2 ou
dos efeitos fixos) mostra precisamente porque REML deve ser preferido em
relao a ML, ou seja, estes argumentos so mais fortes do que os apresentados
por Patterson & Thompson (1971), que enfatizaram a propriedade de vcio do
ML.

10. Estimadores melhorados para a mdia de tratamentos


A anlise Bayesiana pode ser til tambm no contexto da anlise de
experimentos de variados tipos e objetivos na pesquisa agropecuria.
Considerando o delineamento experimental de blocos ao acaso com t
tratamentos, b blocos e n plantas por parcela (plantas obtidas aleatoriamente
de uma populao), tem-se o modelo matemtico:

Yij = + ti + b j + eij , onde onde m, ti, bj e eij referem-se aos efeitos da


mdia geral, de tratamentos, de blocos e do resduo, respectivamente. Nas
anlises clssicas, os efeitos ti e eij podem ser assumidos como aleatrios e bj
como fixo, visto que estas suposies no alteram os resultados da anlise de
varincia e das comparaes de mdias, conforme Steel & Torrie (1980).
Aplicando o mesmo princpio (regresso) da predio de valores genticos
para a predio da mdia de tratamentos, tem-se que a frao de (Yi. Y.. )
(efeito de tratamento) que realmente determina a mdia do tratamento

R 2 (Yi. Y.. ) , em que:


R 2 = t2 /( e2 / b + t2 ) = 1 1 / F , onde F o valor do teste F de Snedecor
da anlise de varincia.
Assim, a determinao (R2) associada ao efeito de tratamento
pode ser generalizada para efeitos fixos ou aleatrios de tratamentos,
pois depende apenas de F que idntico para ambos os modelos. A
mdia (valor esperado em uma nova repetio do ensaio ou em uma
aplicao do tratamento ao nvel operacional) verdadeira do tratamento
(M)
,
ento,
melhor
predita,
fazendo-se

M = (1 1 / F )(Yi .. Y... ) + Y... = (1 1 / F ) Yi.. + (1 / F ) Y... . Em outras palavras, a


32

Documentos, 46

melhor predio da mdia dada pela frao (1-1/F) da mdia aritmtica do


tratamento mais a frao (1/F) da mdia geral. Esta expresso para a mdia,
alm de ser mais coerente com a prtica, considera adequadamente a preciso
experimental na estimao da mdia de tratamento, pois quanto mais preciso
(> F) o experimento, menor a correo (-1/F) aplicada sobre as mdias de
tratamento. Neste caso (agora supondo fixos os efeitos de tratamentos), nveis
de significncia diferentes (por exemplo 5% e 1%) conduziro a mdias
ajustadas diferentes, embora na metodologia convencional conduzissem a
inferncia e mdias idnticas.
Do ponto de vista da estatstica freqentista, a mdia amostral o melhor
estimador no viciado (BLUE) da mdia populacional. O estimador apresentado,
que apresenta um regressor (no caso 1-1/F) da mdia amostral do tratamento
em relao mdia geral viciado (Gianola & Fernando, 1986). Entretanto,
existem estimadores e preditores viciados que propiciam menor erro quadrtico
mdio do que os estimadores BLUE (Henderson, 1984), sendo assim vantajosos
em relao aos estimadores no viciados (Efron, 1975).
Os trs principais procedimentos de estimao caracterizam os
estimadores: melhor estimador linear no viciado (BLUE); estimador de mnimo
erro quadrtico mdio e estimador Bayesiano. Esses trs estimadores so
similares e idnticos sob certas circunstncias (Henderson, 1984).
A utilizao e reconhecimento das vantagens dos estimadores viciados
iniciou-se com o trabalho de Stein (1955) que constituiu um verdadeiro paradoxo
na Estatstica. Stein demonstrou que a mdia aritmtica estimador no
admissvel, isto , que existem estimadores que propiciam menor erro quadrtico
mdio ou menor risco que a mdia aritmtica. Neste contexto, James & Stein
(1961), apresentaram um estimador melhorado para a mdia populacional, o
qual dado por M * = k (Yi.. Y... ) + Y... , onde k um fator regressor da mdia
amostral de determinado tratamento sobre a mdia geral. Constata-se assim,
a similaridade entre M e M*.
O fator k apresentado por James & Stein dado por

K = 1

(t 3) 2
(Yi.. Y... ) 2

2
, onde t refere-se ao nmero de tratamentos e

refere-se varincia residual. Notando a similaridade entre (t - 3) e o nmero


de graus de liberdade (t - 1) para tratamentos, verifica-se tambm a grande
similaridade entre k e (1 1/F). Stein (1955) demonstrou que a mdia aritmtica
um estimador admissvel apenas quando existem apenas uma ou duas mdias
a serem estimadas, de forma que a correo somente torna-se necessria
quando trs ou mais tratamentos forem considerados, conforme intuitivamente

Documentos, 46

33

esperado. O estimador melhorado apresentado por James & Stein (1961), no


necessita de qualquer suposio referente aos efeitos fixos ou aleatrios ou
distribuies das mdias a serem estimadas (Efron & Morris, 1977). Os
estimadores de mnimo erro quadrtico mdio tm recebido mais ateno
recentemente (Bibby & Toutenburg, 1977).
O procedimento de estimao Bayesiana mais antigo (1763) do que o
mtodo de Stein e tambm minimiza o erro quadrtico esperado, de forma que
o estimador de James-Stein muito similar ao estimador de Bayes, tornandose idnticos para grande nmero de tratamentos (Efron & Morris, 1977). Em
inferncia Bayesiana no existe qualquer distino entre efeitos fixos ou
aleatrios, sendo que os parmetros a serem estimados so considerados
variveis aleatrias (Gianola & Fernando, 1986) que devem ser estimadas
considerando as incertezas associadas a elas. No caso de inferncias sobre
mdias populacionais de tratamentos, sob o enfoque Bayesiano, Box & Tiao
(1973) apresentam como regressor exatamente a quantidade (1 1/F).
Com base no exposto, recomenda-se, para inferncias (com menor risco)
prticas na rea de pesquisa agropecuria, a apresentao das mdias de
tratamento como M = (1 1 / F ) Yi.. + (1 / F )Y... , onde F , Yi.. e Y... referem-se ao
valor de F para tratamentos na anlise de varincia, mdia de tratamentos e
mdia geral, respectivamente.

11. Problemas da abordagem clssica de predio de valores


genticos e vantagens da abordagem Bayesiana
No procedimento de modelos mistos para avaliao gentica, torna-se
necessria a especificao de propriedades das distribuies dos vetores a e e,
principalmente em termos de seus primeiro e segundo momentos. Para
derivao do BLUP no necessrio assumir uma forma de distribuio,
devendo-se assumir apenas que:
E(a) = 0;

E(e) = 0;

Var(a) = G;

Var(e) = R;

COV(a, e)=0

Devido a isto tem-se:


E(y) = Xb

Var(y) = ZGZ+ R = V

Estas pressuposies so vlidas em ausncia de seleo. Em presena


de seleo, E(a) e COV(a, e) podem ser diferentes de zero bem como G e R
podem ser alteradas em relao a seus valores originais para uma populao
no selecionada e no endgama.

34

Documentos, 46

Como propriedades desejveis do BLUP, podem ser ressaltadas


(Henderson, 1982a; Ronningen & Vleck, 1985):
(i)

um preditor no viciado

(ii)

minimiza a varincia do erro de predio dentro da classe das predies


lineares no viciadas

(iii)

minimiza o quadrado mdio dos erros de predio dentro da classe das


predies lineares invariantes a translao (no afetadas por mudanas
nos efeitos fixos)

(iv)

maximiza a correlao entre ai e ai dentro da classe das predies


lineares no viciadas.

Assumindo distribuio normal multivariada para a e e, propriedades


adicionais interessantes so asseguradas (Henderson, 1982a).
(i)

se os indivduos candidatos seleo apresentam a mesma quantidade


de informao, a seleo maximiza a mdia esperada dos valores
genticos dos indivduos selecionados [E(a|y)]. (E(a|y) foi denominado
Best Predictor por Henderson, 1973).

(ii)

a estimador ML de E(a|y)

(iii)

a estimador MAP (mximo a posteriori) de a

(iv)

e a so estimativas Bayesianas, tomando-se como funo de perda


os desvios absolutos ou quadrticos e como estimativas a priori E(a) =
0 e Var (b) = S, com S-1 0.

(v)

As solues BLUP a e e , podem ser usadas em algortmos eficientes


para estimao de componentes de varincia por ML e REML, os quais
permitem ao BLUP, controlar vcios devidos a certos tipos de seleo.

Com relao aos efeitos da seleo na predio de valores genticos,


Henderson (1975, 1982b) mostrou (assumindo normalidade) que se os
componentes de varincia da populao no selecionada so conhecidos, as
equaes de modelo misto ignorando a seleo ainda conduzem a predio
BLUP sob seleo, desde que o critrio de seleo seja funo linear das
observaes e de translao invariante (ou seja, que o critrio de seleo no
envolva os efeitos fixos). Entretanto, predies envolvendo efeitos fixos
baseadas em um modelo que ignora a seleo, no so BLUP sob seleo. Fries
& Schenckel (1993) abordam com detalhes esta questo.

Documentos, 46

35

Torna-se claro ento, que BLUP sob um modelo de seleo requer, pelo
menos, o conhecimento das varincias antes da seleo. Estimativas de
componentes de varincia pelos mtodos ML e REML so livres de algumas
formas de vcio devidos seleo (Thompson, 1979; 1982; Gianola et al.,
1989).
Assumir distribuio normal multivariada de y, a e e, implica assumir
que os caracteres sejam determinados por um infinito nmero de locos no
ligados de pequenos efeitos aditivos (modelo infinitesimal) (Mrode, 1996). Com
o modelo infinitesimal, alteraes na varincia gentica devidas seleo, tais
como desequilbrio gamtico (covarincia negativa entre freqncias allicas
em diferentes locos) ou mudanas devidas a endogamia e deriva gentica so
consideradas nas equaes de modelo misto atravs da incluso da matriz de
parentesco completa (Sorensen & Kennedy, 1983). Alteraes na varincia
devidas a cruzamentos preferenciais, tambm so consideradas da mesma
forma. Considerando o modelo infinitesimal, os componentes de varincia
podem ser estimados de forma no viciada por REML, desde que os dados
utilizados incluam informaes sobre as quais a seleo foi baseada.
Dentre as propriedades desejveis do BLUP, duas esto associadas
propriedade Best: minimizao do quadrado mdio do erro de predio e
maximizao da correlao entre os valores genticos verdadeiros e os preditos.
A terceira refere-se propriedade de no vcio [ E ( a | a ) = a ] . Estas trs
propriedades so interessantes do ponto de vista estatstico, entretanto, somente
a propriedade de maximizao da correlao entre a e a apresenta uma conexo
direta com o problema do melhoramento por seleo. Uma vez que o objetivo
das funes dos dados ordenar os candidatos seleo e praticar a seleo
de forma a se maximizar o ganho gentico com seleo, as propriedades de
mnima varincia e normalidade assinttica talvez sejam irrelevantes (Gianola
& Fernando, 1986; Gianola, 1995). Esta assertiva pode ser confirmada
considerando que com dados desbalanceados, independentemente da
distribuio, o ordenamento dos candidatos com base em E(a|y) e a seleo
daqueles com os maiores valores, maximiza a mdia dos indivduos selecionados,
conforme demonstrado por Bulmer (1980); Goffinet (1983) e Fernando & Gianola
(1986).
A seguir sero relatados alguns pontos desfavorveis da abordagem
clssica e vantagens da inferncia Bayesiana para estimao. As propriedades
desejveis dos estimadores pontuais e intervalares na estatstica clssica so
baseadas em hipotticas repeties do experimento em um nmero infinito de
vezes e no considera apenas os dados disponveis. Isto significa que, na teoria
de amostragem, q uma quantidade conhecida fixa e o intervalo de confiana
aleatrio. Assim, sob hipottica repetio de y, espera-se que o intervalo
contenha q em uma certa proporo das amostras (repeties). Entretanto,

36

Documentos, 46

tendo-se os dados observados (uma repetio do vetor y), q estar dentro ou


fora do intervalo. Em anlise Bayesiana, inferncias so realizadas diretamente
da distribuio a posteriori, baseando-se apenas nos dados disponveis e na
distribuio a priori. A partir da posteriori, estimativas pontuais podem ser
obtidas para resumir as caractersticas de tal distribuio e tambm estimativas
intervalares e inferncias probabilsticas podem ser realizadas. Por exemplo,
no caso da seleo de genitores com base em testes de prognies, pode-se
fazer inferncias probabilsticas sobre a capacidade de transmisso do genitor
i dado wi, fazendo-se Z =

S i E ( S i | wi )
~ N (0,1) e computar para quaisquer
Var ( S i | wi )

valores fixados q1 e q2, a probabilidade P{q1 < Si < q2 | wi } = F ( z 2 ) F ( z1 ), onde


F a funo distribuio acumulada da normal padro.
Os procedimentos freqentistas de estimao, ML e REML, apresentam
propriedades desejveis que so bem definidas somente para amostras muito
grandes, ou seja, somente apresentam justificativas assintticas. Entretanto,
a maioria dos programas de melhoramento de espcies perenes baseia-se em
amostras de tamanho finito (pequeno). O teorema de Bayes propicia solues
precisas para o problema de amostras de tamanho finito, pois para cada conjunto
de dados, pequeno ou grande, existe uma distribuio a posteriori exata para
realizao de inferncias. Existe tambm uma teoria assinttica Bayesiana,
de forma que com grandes amostras obtm-se resultados similares aos obtidos
com o mtodo ML ou REML.
Em muitos casos, a distribuio dos dados (y) no depende exclusivamente
do grupo de parmetros de interesse (q1, por exemplo), mas depende tambm
de outros parmetros incidentais denominados parmetros de nuisance
(q2, por exemplo). Neste caso, a densidade conjunta a posteriori possui a
forma f(q1, q2|y) a f(y|q1, q2) f(q1, q2), onde f(q1, q2) a densidade conjunta
a priori de q1 e q2. Uma vez que o interesse concentra-se em inferncias sobre
q1 na ausncia de q2, os parmetros nuisance podem ser eliminados
integrando-se a densidade conjunta a posteriori com respeito a q2. Assim,
tem-se:

f ( | y ) = R f (1 , 2 y ) d 2
2

= R f (1 2 , y ) f ( 2 , y ) d 2
2

onde R 2 indica o espao de q2 (Zellner, 1971).

Documentos, 46

37

Como exemplo considere a questo da predio do valor gentico de um


indivduo (qi) a partir de uma mdia fenotpica (yi). A priori, qi ~N.I.I.D. (0, h2),
E(yi|
qi) = qi e Var(yi|
qi)=1-h2, onde h2 a herdabilidade. Neste caso, a densidade
2
condicional f(qi|h = K, yi) normal com mdia E(qi|h2 = K, yi) = K yi.
Uma vez que existe apenas um dado (ponto), pode-se expressar
f(h |yi) a f(h2), onde f(h2) e f(h2|yi) so as densidades a priori e marginal a
posteriori da herdabilidade, respectivamente. Suponha que a priori h2 pode
assumir trs valores (0; 0,10 e 0,20) com probabilidades P[h2 = 0] = 0,10;
P[h2 = 0,10] = 0,40; P[h2 = 0,20] = 0,50. A herdabilidade neste exemplo
um parmetro de nuisance uma vez que o interesse reside na inferncia
marginal sobre o valor gentico. Assim, h2 deve ser eliminado usando
2

f (1 | y ) = R f (1 2 , y) f ( 2 y) d 2 da seguinte forma:
2
f(qi|yi) = f(qii|h2 = 0, yi) x 0,10
+ f(qii|h2 = 0,10, yi) x 0,40
+ f(qii|h2 = 0,20, yi) x 0,50
= 0,10 E(qii|h2 = 0, yi)

(usando o fato de que a


densidade condicional

+ 0,40 E(qii|h2 = 0,10, yi)

f ( 1 | h 2 = K , yi ) normal

+ 0,50 E(qii|h2 = 0,20, yi)

com mdia

= 0,14 yi

E (1 | h 2 = K , yi ) = Kyi ).

O valor 0,14 corresponde mdia a priori da distribuio dos possveis


valores de herdabilidade. A expresso f ( i | y ) = 0,14 yi ilustra que a
herdabilidade foi efetivamente integrada (eliminada), pois esta expresso no
depende mais de h2 (Gianola & Fernando, 1986).
Segundo Box & Tiao (1973) muito importante examinar cuidadosamente
f(q2|y). Se f(q2|
y) aguda, isto , quando a maioria da densidade est prxima
de sua moda (2 , diga-se), ento f (1 | y ) =& f (1 2 ) = 2 , y ) e a moda ou
estimativas do tipo mxima verossimilhana (ML modal pois refere-se a um
ponto de mximo) podem ser usados como verdadeiros valores de f(q1|q2, y).
Como mostrado, isto eqivalente a realizar inferncias com base na distribuio
marginal de q1 (valores genticos) dado y (dados). Quanto s estimativas de
componentes de varincia, Gianola & Foulley (1990) mostraram que estimativas
obtidas por REML so marginais apenas com respeito aos efeitos fixos mas so
condicionais a outros parmetros nuisance do modelo. A anlise Bayesiana
propicia uma marginalizao adicional que particularmente interessante para
modelos com grande nmero de componentes de varincia.
38

Documentos, 46

Quanto questo da predio de valores genticos sob modelo de seleo,


em anlise Bayesiana, as inferncias sobre valores genticos e parmetros
genticos devem ser realizadas com base na densidade a posteriori construda
como se a seleo e cruzamentos preferenciais no tivessem ocorrido. Os
resultados obtidos dessa forma eqivalem aos obtidos pela abordagem clssica,
assumindo normalidade multivariada e so vlidos para qualquer distribuio.
Estes resultados so demonstrados a seguir com base em Gianola & Fernando
(1986).
Considere q1, um vetor desconhecido de valores genticos, e q2 (efeitos
fixos) e q3 (componentes de varincia), vetores desconhecidos de parmetros
de nuisance e as decises de seleo e cruzamento baseadas em dados
disponveis em y0 (vetor n0 x 1). Dependendo de y0, dados adicionais yi
(i = 1, ...,s) so obtidos a partir de decises de seleo e cruzamentos baseadas
em y0. Em ausncia de seleo e cruzamentos preferenciais y0, y1, ..., ys, q1,
q2 e q3 tm distribuio conjunta com densidade f(y0, y1, ..., ys, q1, q2, q3).
A densidade marginal de f(y0, yi, q1, q2,q3) obtida aps apropriada
integrao e as inferncias devem ser baseadas em f(q1, q2, q3|y0, yi), com
posterior integrao (eliminao) de q2 e q3.
Sendo Ri, a discreta e disjunta partio do espao no-dimensional, a
densidade conjunta de y0, yi, q1, q2, q3 definida se y0 Ri. Assim, pode-se
escrever:
f(y0, yi, q1, q2, q3|y0 Ri) =

f ( y0 , yi , 1 , 2 , 3 )
P[ y0 Ri ]

Usando probabilidade condicional, tem-se que:


f(y0, yi|y0 Ri) =

f ( y0 , yi )
P[ y0 Ri ]

onde f(y0, yi) a densidade conjunta de y0 e yi, considerando que a


seleo no tenha ocorrido. Combinando estas duas ltimas expresses obtmse:
f(q1, q2, q3|y0, yi, y0 Ri) =

f ( y0 , yi , 1 , 2 , 3 ) / P[ y0 Ri ]
f ( y0 , yi ) / P[ y0 Ri ]

= f(q1, q2, q3|y0, yi)

Documentos, 46

39

Este resultado prova que, se as decises de seleo e cruzamento forem


baseadas em y0 e, se y0 corresponde aos dados disponveis para anlise, as
inferncias sobre valores genticos, efeitos fixos e componentes de varincia
devem ser realizados a partir da densidade a posteriori considerando que a
seleo no tenha ocorrido, concordando com os resultados de Henderson
(1975, 1982b) e Thompson (1982) que so dependentes da suposio de
normalidade. Assim, a distribuio condicional, dado o conjunto completo de
dados, a mesma distribuio em ausncia ou presena de seleo e
cruzamentos preferenciais e, para obter este resultado, a abordagem Bayesiana
no assumiu linearidade, normalidade ou invarincia a translao.
Em resumo, podem-se relatar as principais vantagens dos mtodos
Bayesianos, conforme sumarizao realizada por Resende (1997):
- rotineiramente componentes de varincia so estimados pelo mtodo
REML e utilizados na predio de valores genticos e clculo do ganho
gentico. Entretanto, atravs deste procedimento, a distribuio e varincia
dos estimadores no so conhecidos e assim questes referentes efetividade
da seleo no podem ser respondidas com rigor. O mtodo Bayesiano de
estimao de componentes de varincia, implementado via simulao
estocstica como por exemplo atravs do procedimento denominado
amostragem de Gibbs (GS), propicia uma descrio mais completa sobre a
confiabilidade dos parmetros genticos do que o mtodo REML. A
abordagem Bayesiana (conhecimento da distribuio a posteriori dos
parmetros) possibilita a construo de intervalos de confiana (ou de
probabilidade) exatos para as estimativas dos parmetros genticos, estando
a confiabilidade (preciso) dos parmetros associada quantidade e preciso
das informaes utilizadas. Dessa forma, o mtodo GS propicia estimativas
mais precisas de componentes de varincia, parmetros genticos, valores
genticos e ganhos genticos. O mtodo REML propicia apenas intervalos
de confiana aproximados para os parmetros genticos, atravs do uso de
aproximaes e suposies de normalidade (argumentos assintticos). De
maneira geral, o mtodo GS apresenta estimativas com menores desvios
padres que o mtodo REML, especialmente para valores baixos de
herdabilidade. A diferena de preciso entre os dois mtodos reduz-se para
conjuntos de dados extremamente grandes e, neste caso, a tendncia
obterem-se resultados similares.
- permite a utilizao de informaes a priori, a eliminao de parmetros
de nuisance, a integrada estimao predio deciso e a anlise
exata de amostras de tamanho finito (pois os dados so fixados na distribuio
a posteriori). Este ltimo aspecto muito importante, especialmente para
programas de melhoramento baseados em pequenos conjuntos de dados
desbalanceados, onde a anlise Bayesiana propicia uma elegante anlise de
amostra finita, a qual no pode ser obtida pela metodologia padro de
40

Documentos, 46

modelos mistos. O teorema de Bayes propicia solues precisas para o


problema de amostras de tamanho finito, pois para cada conjunto de dados,
pequeno ou grande, existe uma distribuio a posteriori exata para a realizao
de inferncias. Existe tambm, uma teoria assinttica Bayesiana, de forma
que, com grandes amostras obtm-se resultados similares aos obtidos com
o mtodo REML. Quanto aos parmetros de nuisance, verifica-se que as
estimativas de componentes de varincia obtidas por REML so marginais
apenas com respeito aos efeitos fixos mas so condicionais a outros
parmetros nuisance do modelo. A anlise Bayesiana permite uma
marginalizao adicional particularmente interessante para modelos com
grande nmero de componentes de varincia.
- a principal caracterstica da anlise Bayesiana refere-se riqueza da
informao propiciada por esta abordagem, possibilitando a obteno de
estimativas pontuais e os intervalos de probabilidade para as distribuies a
posteriori dos parmetros. Assim, inferncias sobre parmetros genticos,
valores genticos e efeito de grupos genticos podem ser realizados com
segurana.
- sob modelo de seleo, as inferncias sobre valores genticos e parmetros
genticos podem ser realizados com base na densidade a posteriori,
construda como se seleo e cruzamentos preferenciais no tivessem
ocorrido, pois a distribuio destes parmetros a mesma com ou sem
seleo e cruzamentos preferenciais (desde que seja usada a matriz de
parentesco completa e tambm os dados originais que orientaram as decises
de seleo).
- a anlise Bayesiana capaz de resolver o problema dos valores genticos
ordenados, os quais apresentam distribuio desconhecida e cujas
propriedades da distribuio normal no se aplicam.
- a abordagem Bayesiana apresenta, tambm, vantagens computacionais
pois no exige soluo para as equaes de modelo misto e, portanto, pode
ser praticada em microcomputadores exigindo pouca memria (similar aos
requerimentos de processos iterativos), embora o tempo de processamento
seja muito maior.

12. Implementao prtica da anlise Bayesiana


Os resultados de interesse gerados pela anlise Bayesiana so, em geral,
as distribuies marginais a posteriori dos parmetros genticos, efeito de grupo
gentico e valores genticos. Assim, inferncias baseadas na mdia, mediana,
moda e desvios padres destas distribuies so realizadas na prtica.

Documentos, 46

41

O problema bsico da implementao da anlise Bayesiana refere-se


integrao numrica. A integrao (no espao do parmetro) da funo
densidade de probabilidade a posteriori, por exemplo:

E [ g ( ) y ] = R g ( ) p( y ) d , onde:
g ( ) = , para obteno da mdia a posteriori e

g ( ) = ( ) 2 , = E ( y ) , para obteno da varincia a posteriori ou


risco de Bayes, pode ser realizada atravs dos mtodos (Gamerman, 1997): (i)
analtico para aproximao de integral; (ii) automticos ou de quadratura; (iii)
simulao estocstica para obteno de distribuies a posteriori. Os mtodos
analticos para aproximao de integrais, tais como a Discrepncia de Kulback
Liebler, a Aproximao Assinttica Normal e o Mtodo de Laplace so
funcionais at determinada dimenso do problema e esto associados a
resultados assintticos e normalidade. O mtodo de quadratura puramente
matemtico e vem sendo substitudo vantajosamente por mtodos
computacionalmente intensivos, os quais so essencialmente estatsticos, tais
como os mtodos de simulao estocstica. Dentre os mtodos de simulao
estoctica destacam-se: (i) Monte Carlo; (ii) Monte-Carlo com Funo de
Importncia; (iii) Reamostragem ou Bootstrap Bayesiano; (iv) Monte-Carlo
Cadeias de Markov.
Dentre estas trs grandes classes de algortmos para aproximar as
integrais, os mtodos de Monte-Carlo so largamente indicados e utilizados
para integrao multivariada. Os mtodos de Monte-Carlo referem-se a
processos de aproximao de valores esperados (integrais com respeito a uma
distribuio de probabilidade) por meio de amostras, podendo ser referidos
tambm como um caso especial de simulao de um processo estocstico.
Em gentica quantitativa, para implementao prtica da anlise
Bayesiana, uma das maiores dificuldades tcnicas a marginalizao. A
obteno de distribuies marginais por processos analticos praticamente
impossvel (Sorensen, 1996). Assim, a obteno da distribuio marginal a
posteriori (marginalizao da distribuio conjunta a posteriori) tem sido obtida
pelo mtodo da amostragem de Gibbs (GS) atravs da amostragem e atualizao
das distribuies condicionais.
O mtodo da amostragem de Gibbs pertence classe de mtodos,
denominada Monte-Carlo Cadeias de Markov, a qual sustentada em
propriedades das Cadeias de Markov. O nome Gibbs advm da distribuio de
Gibbs, que muito utilizada na rea de Fsica Estatstica ou Mecnica Estatstica.
O amostrador de Gibbs explorando as distribuies condicionais completas
atravs de algortmo iterativo foi proposto inicialmente por Geman & Geman
42

Documentos, 46

(1984) para aplicaes na rea de processamento de imagens. Entretanto,


somente em 1990, este trabalho foi divulgado para toda a comunidade da rea
de estatstica atravs de Gelfand & Smith (1990) que publicaram em peridico
da rea de estatstica, trabalho comparando o amostrador de Gibbs com outros
processos de simulao estocstica. A partir de ento, houve uma revoluo
na inferncia estatstica com uma impressionante realizao de trabalhos
baseados nesta tcnica (Gamerman, 1996).
Para ilustrar a aplicao da tcnica da amostragem de Gibbs na avaliao
gentica de espcies perenes ser considerado o modelo individual univariado,
conforme Sorensen (1996).
Modelo
y = Xb + Za + e, onde:
y = vetor de dados, de ordem n;
b = vetor de efeitos fixos, de ordem p;
a = vetor de valores genticos aditivos, de ordem q;
e = vetor de erros, de ordem n;
X, Z = matrizes de incidncia que associam b e a aos dados (y).
Assume-se inicialmente que a distribuio condicional dos dados, b, a e

normal multivariada:
2
e

y , a, e2 ~ N ( X + Za, I e2 ) , onde I a matriz identidade e e2 a


varincia residual.
Assumindo o modelo quantitativo infinitesimal, tem-se que a distribuio
de a tambm normal multivariada:

a A, a2 ~ N (O, A a2 ) , onde A a matriz de parentesco gentico aditivo


e a2 a varincia gentica aditiva na populao base.
Os parmetros de interesse para inferncias so: , a, a2 e e2 . Para
conduzir a anlise Bayesiana torna-se necessrio especificar as distribuies a
priori para , a2 e e2 (a distribuio de a j foi especificada).
Como priori para b pode-se assumir p(b) a constante, que especifica
aproximadamente a noo de conhecimento a priori vago para b. Esta

Documentos, 46

43

distribuio a priori imprpria, mas pode-se tornar prpria, desde que se


especifiquem os limites superior e inferior para p(b).
As distribuies a priori dos componentes de varincia ( e2 e a2 ) poderiam
ser uniforme da forma p ( i2 ) contante, 0 i2 < i2 max (i = e, a) , onde,
de acordo com o conhecimento acumulado sobre o carter, i2 max seria o valor
mximo que i2 poderia assumir, a priori. Alternativamente, poderia ser
especificada uma priori mais informativa para os componentes de varincia,
assumindo uma distribuio qui-quadrado escalonada invertida, da forma:

S 2
p ( i2 i , S i2 ) ( i2 ) ((i / 2 ) +1) exp i 2i
2 i

(i = e, a ) , onde u so os graus

de liberdade da distribuio qui-quadrado e S i2 , o valor inicial da varincia.


Esta distribuio reduz-se a uma distribuio uniforme imprpria se

i = 2 e S i2 = 0

Definidas estas distribuies, pode-se agora escrever a distribuio


conjunta a posteriori dos parmetros do modelo.

p ( , a, a2 , e2 y ) p ( , a, a2 , e2 ) p ( y , a, a2 , e2 )
= p ( ) p ( a a2 ) p ( a2 ) p ( e2 ) p ( y , a, a2 , e2 ) , onde
omitiu-se o condicionamento nos hiperparmetros (parmetros que auxiliam na
especificao da priori) e na conhecida matriz de parentesco A.
Considerando a distribuio a priori dos componentes de varincia como
uma qui-quadrado escalonada invertida, tem-se que a distribuio conjunta a
posteriori pode ser reescrita:

p ( , a, a2 , e2 y ) e2

a2

44

n + e

+1
2

q + a

+1
2

( y X Za )' ( y X Za )+ e S e2
exp

2 e2

(a ' A1a + a S a2
exp

2 a2

Documentos, 46

Desejando assumir distribuio a priori uniforme para a2 e e2 , basta


fazer i = 2 e Si2 = 0 (i = a, e) na expresso acima.
Para implementao do GS, deve-se derivar todas as distribuies
condicionais a posteriori a partir da distribuio conjunta a posteriori
apresentada acima.
Denominando-se X + Za = W , onde W = [ X Z ] e ' = [ ' a' ] , tem-se
que a matriz dos coeficientes das equaes de modelo misto dada por
C = W W +

S, onde

= 0

2
2 . A distribuio condicional a

a e / a
1

posteriori de q :

a2 , e2 , y ~ N (, C 1 e2 ), em que dado por C = W ' y , ou seja, pelas

equaes de modelo misto.


Para derivar a distribuio condicional a posteriori para bi (o i-simo
elemento do vetor b) devem-se fazer as parties:
Ci ,i
' = ( 'i , 'i ); W ' = (Wi Wi )' ; C =
Ci ,i

X' X
Ci , i i i
X' X
=
Ci , i i i
Z ' X i

X 'i X i
X ' i X i
Z ' X i

X 'i Z
X 'i Z
,
Z ' Z + A1

onde: = e2 / a2 , i o vetor de efeitos fixos com o i-simo elemento


excludo, de ordem p-1, Xi o i-simo vetor coluna da matriz X e X-i a matriz
X com Xi excludo.
Assim, tem-se: i i , a2 , e2 , y ~ N (i , Ci,i1 e2 ), em que i dado por

Ci ,i i = (W 'i y Ci , i i ).
Tem-se tambm:

W 'i y = X 'i y; ( X 'i X i ) i = X ' y X 'i X i i X 'i Za e finalmente pode-se


escrever a distribuio condicional a posteriori de bi:

i i , a, a2 , e2 , y ~ N ( i , ( X ' X i ) 1 e2 ),
em que : i = ( X ' X i ) 1 X 'i ( y X i i Za )

Documentos, 46

(3)

45

Para derivar a distribuio condicional a posteriori de ai, deve-se proceder


de maneira similar. Assim, tem-se:

A1
A = ii1
Ai ,i
1

Ai, 1i
;
Ai1, i

X'X

C = z 'i X
Z 'i X

X ' zi
z 'i zi + Ai,i1
Z 'i zi + Ai1,i

X ' Z i

1
z 'i Z i + Ai , i
Z 'i Z i + Ai1, i

W 'i y = z 'i y; ( z 'i zi + Ai,i1 ) ai = z 'i y z 'i X ( z 'i Z i + Ai, 1 i ) ai


= z 'i y z 'i X Ai, 1i ai , pois z 'i Z i = 0
Finalmente, a distribuio condicional a posteriori de ai :

ai , ai , a2 , e2 , y ~ N ( ai , ( z 'i zi + Ai,i1 ) 1 e2 )

(4)

A obteno das distribuies condicionais a posteriori completas dos


componentes de varincia ser descrita a seguir. Para a2 , deve-se tomar da
distribuio conjunta a posteriori somente os termos que envolvem a2 . Assim:

p ( a2 , a, e2 , y ) ( a2 )

= ( a2 )

a +1
2

q + a

+1
2

a ' A 1a + a S a2
exp

2 a2

~ S~ 2
exp a 2 a , em que
2 a

~
S a2 = (a' A1a + a S a2 ) / ~a e ~a = q + a
A expresso de p ( a2 , a, e2 , y) proporcional distribuio quiquadrado (c2) escalonada invertida, com ~a graus de liberdade e parmetro de
escala a ' A1a + a S a2 .

46

Documentos, 46

Assim:

~
a2 , a, e2 , y ~ ~a S a2 ~2a

(5)

e para amostrar desta distribuio deve-se inicialmente trabalhar com um quiquadrado com ~ = q + graus de liberdade, inverter este nmero e
a

posteriormente multiplic-lo por a ' A1a + a S a2 .


De maneira similar tem-se para e2 :

p ( e2 , a, a2 , y ) ( e2 )

= ( )
2
e

n + e

+1
2

e +1
2

( y X Za )' ( y X Za ) + e S e2
exp

2 e2

~ S~ 2
exp e 2e , onde
2 e

~
~e = n + e e Se2 = (( y X Za)' ( y X Za) + e Se2 ) / ~e .
A expresso de p ( e2 , a, a2 , y) proporcional distribuio quiquadrado escalonada invertida, com ~e = n + e graus de liberdade e parmetro
de escala ( y X Za)' ( y X Za) + e Se2 .
Assim, tem-se:

~
e2 , a, a2 , y ~ ~e S e2 ~e2

(6)

A implementao da amostragem de Gibbs consiste em amostrar


sucessivamente de (3), (4), (5) e (6).

Documentos, 46

47

Considere o exemplo:
Indivduo
1
2
3
4
5
6
7

Bloco
1
2
1
2
1
2
1

Pai
1
1
3
1
5

Me
2
4
4
6

Yi
Y3
Y4
Y5
Y6
-

Considerando o modelo individual tem-se = ( 1 , 2 )' para os blocos 1


e 2 e a = ( a1 , ... , a7 )' para os valores genticos aditivos dos sete indivduos.
Assumindo distribuies a priori uniforme para os componentes de varincia,
tais que i = 2, S i2 = 0, (i = a , e) e valores iniciais a2 = 5,0 e e2 = 5,0 , devese trabalhar com as equaes de modelo misto atualizando o valor = e2 / a2 ,
a cada iterao. A matriz dos coeficientes das equaes de modelo misto em
funo de a eqivale a:

1
2
a1
a2
C = a3
a4
a5
a6
a7

a1

a2

a3

a4

2,00
0,00

0,00

0,00
1,00

0,00
1,00

0,00
0,00

0,00
2,00

0,00
0,00

0,00
0,00

1,00
0,00

0,00

2,33

a5

a6

a7

0,00
1,00

1,00
0,00

0,00
1,00

0,00
0,00
0,00

0,00
0,00

0,00
1,23

1,23
2,46

0,50

0,66

0,50

0,00

1,00

0,00 0,50
0,00 0,66

1,50
0,00

0,00
1 + 2,83

1,00
0,50

0,00
1,00

0,00
0,00

1,00

0,50

1,00

0,50

1 + 3,00

1,00

1,00

0,00
1,00

0,00
1,00

0,00
0,00

1,00
0,00

1,00
1,00

0,00

0,00

0,00

0,00

0,00

1 + 2,62
0,62
0,62
1 + 2,62
1,23

1,23

Os parmetros de locao so ' = ( 1 , 2 , a1 , ... a7 ) e assumindo que


os valores iniciais so zero, tem-se ( 0 ) = 0 e pode-se iniciar a amostragem
com uma cadeia de comprimento igual a n (i = 1, ..., n).
A primeira amostragem para 1(1) obtida de (3) ou seja obtm-se
2
2
1 2
1(1) de 1 2 , a, a , e , y ~ N ( 1 , (2) e ) . Dados os valores iniciais,

48

Documentos, 46

a mdia da distribuio normal 1 = (Y3 + Y5 ) / 2 e a varincia ( 2) 1 e2 , ou


seja, 5/2.

2(1) por sua vez, retirado de uma distribuio normal com mdia

2 = (Y4 + Y6 ) / 2 e varincia 5/2.


1 2
2
2
a1(1) por sua vez, retirado de a1 , a1 , a , e , y ~ N (a1 , (2,33 ) e ) , que

provm de (4), onde a1 = 0 / 2,33 = 0, e2 = 5 e = 1 .

a2(1) retirado de uma distribuio normal N ( a 2 , (1,50 ) 1 e2 ) , onde


a 2 = (0 0,50 a1(1) ) /(1,50 ), e2 = 5 e = 1 , onde 0,50 provm de C.
Para o indivduo nmero 6, o valor gentico na primeira iterao, a6(1) ,
retirado de:

N ( a 6 , (1 + 2,62 ) 1 e2 ), onde

a6 =

Y6 2(1) (1,00 a1(1) 1,00 a4(1) + 0,62 a5(1) )


, e2 = 5 e = 1
1 + 2,62

Para o indivduo nmero 7, o valor gentico na primeira iterao, a7(1) .


retirado de:

N (a7 , (2,46 ) 1 e2 ), , onde


a7 =

0 (1,23 a5(1) 1,23 a6(1) )


, e2 = 5 e = 1
2,46

Tendo-se amostrados todos os parmetros de locao do modelo, devese computar:

SS e(1) = ( y X (1) Za (1) )' ( y X (1) Za (1) )


SS a(1) = ( a (1) )' A1 a (1)

Documentos, 46

49

A primeira iterao do amostrador completada, retirando-se os


componentes de varincia, usando SS a(1) e SS e(1) :

a2 , a, e2 , y ~ SSa(1) q22

(7)

e2 , a, a2 , y ~ SSe(1) n22

(8)

A segunda iterao inicia-se atravs de atualizaes das equaes de


modelo misto com = e2 / a2 , onde e2 e a2 so os valores amostrados de (7)
e (8) e prossegue com a amostragem de ( 2 ) da mesma maneira realizada
para (1) e com o cmputo de SS e( 2) e SS a( 2) da mesma maneira realizada para

SS e(1) e SS a(1) , e assim sucessivamente.


Em termos mais simples, o algortmo GS pode ser apresentado de forma
resumida:
1.

Fornecer os valores iniciais dos parmetros de locao e disperso do


modelo. Estes valores iniciais podem ser calculados atravs de
procedimentos padres tais como a estimao de componentes de
varincia por REML ou quadrados mnimos. Assumindo a mdia geral
y como nico efeito fixo, pode-se calcular y como a mdia aritmtica
das observaes e ai = h 2 (yi y ) . Devem ser fornecidos os valores
iniciais para yi , ai , e2 , a2 e = e2 / a2 .

2.

Gerar valores para os efeitos fixos. Sendo o nico efeito fixo, a mdia
geral, tem-se:

y = y + rnd e /(n)1/ 2
3.

Gerar valores para os efeitos aleatrios:

a = ai + rnd [(1 rIA2 ) a2 ]1/ 2 , onde raa a acurcia dada por


raa = (1 PEVi / a2 )1/ 2 , onde PEVi o isimo elemento da inversa
da matriz dos coeficientes das EMM multiplicado por e2 .

50

Documentos, 46

4.

Calcular a soma de quadrados do resduo (SSE) e a varincia residual

e2 . Assumindo que a distribuio a priori para a varincia residual a


inversa de uma qui-quadrado, tem-se:

SSE = ( yi y ai ) 2
e2 =
5.

Gerar um valor para a varincia dos efeitos aleatrios de valores


genticos.

a2 =
6.

a ' A 1a
X q2

Calcular o novo valor do parmetro

=
7.

SSE
X n2

e2
a2

Repetir os passos de (2) a (6) at que se obtenha a convergncia da


cadeia.

13. Diagnstico de convergncia


Este tema foi apresentado em detalhes por Gamerman (1996) e aqui
sero apresentados alguns aspectos prticos principais, com base na referida
literatura.
As cadeias de Markov esto inseridas no contexto da teoria dos processos
estocsticos, teoria esta, definida como a parte dinmica da teoria de
probabilidades, onde se estuda uma coleo de variveis aleatrias, com respeito
a sua interdependncia e comportamento limite. Para a inferncia Bayesiana,
de maior relevncia o estudo do comportamento assinttico da cadeia, quando
o nmero de iteraes tende a , uma vez que a inferncia deve ser baseada
na distribuio (a posteriori) estacionria, ou seja, em equilbrio.
medida em que o nmero de iteraes aumenta, a cadeia se aproxima
da condio de equilbrio. Dessa forma, necessrio assumir a convergncia
em uma determinada iterao cuja distribuio esteja prxima da distribuio

Documentos, 46

51

em equilbrio (atingido teoricamente quando n


suficientemente grande de iteraes.

), ou seja, aps um nmero

A forma bsica de se obter uma amostra de tamanho m da posteriori


produzir m cadeias independentes (geradas a partir de m valores iniciais
diferentes) e, aps a convergncia, retirar os valores da ltima iterao de
cada cadeia. Outra opo consiste em retirar m amostras da mesma cadeia
aps a convergncia, visto que se estar amostrando da distribuio a posteriori
em equilbrio. Neste ltimo caso, importante relatar que as amostras sucessivas
no so independentes, de forma que torna-se necessrio descartar vrias
iteraes entre cada duas amostras a serem salvas. Como o processo
Markoviano, a dependncia diminui com o aumento da distncia entre iteraes,
obtendo-se, assim, independncia entre as amostras salvas.
Considerando a segunda opo, no contexto do diagnstico da
convergncia, tornam-se relevantes as quantidades: M = nmero de iteraes
pr-convergncia ou perodo de descarte ou perodo de aquecimento da cadeia;
N = nmero de iteraes aps a convergncia; K = nmero de iteraes
entre amostras sucessivas ou intervalo entre amostras. O tamanho total da
cadeia dado por T = M + N.
O valor de K pode ser determinado calculando as autocorrelaes na
srie de valores gerados e verificando a partir de qual ponto pode-se considerar
as autocorrelaes como nulas. Uma vez que o valor de K muito menor que
o de M, os mtodos baseados em uma nica cadeia (mais longa) so preferidos
computacionalmente.
Outra forma de anlise de convergncia refere-se estimao do erro
de Monte Carlo, conforme apresentado no tpico 15. Em resumo, para a
aplicao prtica, algumas recomendaes so apresentadas a seguir.
Devido ao fato de que valores aleatrios so utilizados inicialmente como
realizao do conjunto de parmetros, necessrio um perodo de descarte de
amostras at que as amostras de GS possam ser consideradas como provenientes
da distribuio conjunta a posteriori, ou seja da distribuio em equilbrio
estacionrio. Em geral, tem sido utilizado o esquema tradicional de cadeia
longa (nica) de Gibbs, onde o processo de reamostragem contnuo. Assim,
de maneira geral, um grande (da ordem de 10.000 a 1.000.000) nmero de
ciclos tem sido utilizado, sendo descartadas as primeiras amostras (da ordem
de poucos milhares) e amostras de cada parmetro so salvas a cada pequeno
(da ordem de 50 a 100) nmero de iteraes. O intervalo entre amostras
salvas necessrio como forma de obteno de amostras independentes, visto
que amostras sucessivas apresentam correlao serial. O nmero total de
amostras salvas utilizado para cmputo das estimativas pontuais e intervalares
de interesse. O software MTGSAM (Tassell & Vleck, 1995) tem sido utilizado
com sucesso para a implementao da anlise Bayesiana.
52

Documentos, 46

14. Estimao Bayesiana via modelos lineares robustos


No tpico 12 foram assumidas verossimilhanas normais para os dados
observados. Entretanto, a distribuio Gaussiana usualmente assumida nos
modelos de gentica quantitativa nem sempre se ajusta aos dados observados.
Neste caso, a presena de dados atpicos (outliers) podem distorcer os resultados
e inferncias obtidos com base na suposio de normalidade, visto que a
distribuio normal no robusta a observaes discrepantes, conforme relato
de Rogers & Tukey (1972).
Visando contornar este problema, distribuies simtricas de caudas
longas (tais como a t de Student, a Slash e a normal contaminada) tem sido
aplicadas recentemente (Strandn, 1996; Rosa, 1999) visando a estimao
robusta. Estas distribuies mencionadas pertencem ao grupo de distribuies
denominado normal/independente. Conforme relatado por Rosa (1999) a
distribuio normal/independente pode ser definida como a distribuio de um
vetor k dimensional dado por y = m + e|(w)1/2, onde m o vetor de locao de
dimenso k, w uma varivel aleatria positiva com densidade p(w|v), onde v
um parmetro de robustez, e um vetor aleatrio k dimensional, normalmente
distribudo com mdia 0 e matriz de covarincia no singular.
Neste caso, a distribuio de y, condicional a w, normal com mdia m
e matriz de covarincia |w. A distribuio de y dada por:

p ( y , , v) = p ( y , , w) p ( w v) d w
Dessa forma, a distribuio de w define a distribuio de y. As
distribuies normal/independente tm algumas propriedades comuns, tais quais
(Lange & Sinsheimer, 1993): (i) se y ~p (y|m, , v), ou seja se y tem distribuio
normal/independente, ento E[y|m, , v] = m e Var [y|m, , v] = E[w-1|v] ,
desde que existam o primeiro e segundo momentos; (ii) p(y|m, , v) simtrica
e unimodal, de forma que a moda e a mediana so iguais mdia m.
Dentre as distribuies robustas mencionadas, a t de Student tem um
nico parmetro de robustez, que so os graus de liberdade da distribuio.
Quanto menor o nmero de graus de liberdade, mais pesadas so as caudas
das distribuies t. Na distribuio Slash, a robustez tambm definida por
um nico parmetro. Por outro lado, a distribuio normal contaminada
apresenta dois parmetros de robustez, sendo que um fornece a proporo de
contaminantes e o outro define como a varincia das duas (contaminantes e
no contaminantes) populaes difere (Rosa, 1999). Verifica-se que estas
distribuies robustas so modificaes da distribuio normal (Gaussiana),
modificaes estas em funo dos parmetros de robustez. Assim, a
distribuio Gaussiana um caso particular de distribuio normal/independente

Documentos, 46

53

eqivalendo s distribuies t e Slash com parmetro v infinito ou distribuio


normal contaminada quando a proporo de contaminantes nula.
A implementao da anlise Bayesiana usando distribuies normal/
independente ao invs da suposio Gaussiana pode ser realizada via amostrador
de Gibbs, de maneira similar descrita no tpico 12.
Em melhoramento animal, a presena de dados discrepantes pode ser
devida ao tratamento preferencial aos melhores animais, conforme constatado
por Strandn (1996). Neste caso, os modelos robustos tendem a fornecer
resultados mais plausveis e devem ser adotados.

15. Aplicao a dados experimentais


A seguir so apresentados resultados obtidos por Resende (1999),
relativos avaliao gentica de um carter quantitativo em uma espcie
vegetal perene.
Foram utilizados dados de quatro experimentos (testes de prognies de
irmos germanos) desbalanceados de Pinus caribaea var. hondurensis com um
total de 89 prognies, sendo 65 diferentes e algumas comuns aos experimentos.
As 65 prognies foram obtidas de 76 genitores e no total foram avaliados
3.886 indivduos. Os experimentos foram implantados pela Champion Papel e
Celulose S.A., no municpio de Santana no Estado do Amap, no delineamento
em blocos casualizados com nove repeties e cinco plantas por parcela.
Considerou-se a varivel dimetro avaliada aos nove anos e meio e o modelo
aditivo infinitesimal.
O modelo linear univariado eqivale a:
y = Xb + Za + Wc + e, em que:
y, b, a, c e e = vetores de dados, de efeitos fixos (blocos), de valores
genticos, de efeitos de ambiente comum (parcela) e erros aleatrios,
respectivamente.
X, Z e W = matrizes de incidncia para b, a e c, respectivamente.
As seguintes distribuies foram assumidas:

54

Documentos, 46

y , a, c, e2 ~ N ( X + Za + Wc, I e2 )
a A, a2 ~ N (0, A a2 )
c c2 ~ N (0, I c2 )
e e2 ~ N (0, I e2 )
COV (a, c' ) = 0; COV (a, e' ) = 0; COV (c, e' ) = 0 , em que:
A = matriz de parentesco gentico aditivo.
I = matriz identidade de ordem apropriada.

a2 , c2 e e2 = varincias gentica aditiva, de ambiente comum da parcela e


residual, respectivamente.
Sob este modelo, a herdabilidade (h2) e a correlao devida ao ambiente
comum da parcela (c2) so, respectivamente:

h2 =

a2
;
+ c2 + e2
2
a

c2 =

c2
+ c2 + e2
2
a

A anlise Bayesiana deste modelo linear mais geral (incluindo o efeito de


parcela) apresentada a seguir:
Distribuio conjunta a posteriori dos parmetros do modelo
p ( , a, c, a2 , c2 , e2 y ) p ( , a, c, a2 , c2 , e2 ) p ( y , a, c, a2 , c2 , e2 )
= p ( ) p ( a a2 ) p (c c2 ) p ( a2 ) p ( c2 ) p ( e2 ) p ( y , a, c, a2 , c2 , e2 )

Assumindo a distribuio a priori dos componentes da varincia como


uma qui-quadrado escalonada invertida, tem-se que:

Documentos, 46

55

Distribuio conjunta a posteriori


p ( , a, c, a2 , c2 , e2 y ) e2

a2

c2

n + e

+1
2

exp ( y X Za Wc)' ( y X Za Wc)+ e S e2

q + a

+1
2

(a ' A1a + a S a2
exp

2 a2

p + c

+1
2

(c ' c + c S c2
exp

2 c2

Incorporando na matriz C (item 12) as submatrizes relacionando W com


Z e X, obtm-se as distribuies condicionais a posteriori para cada parmetro:
Distribuio condicional a posteriori de bi

i i , a, c, a2 , c2 , e2 , y ~ N ( i , ( X ' X i ) 1 e2 ),
em que : i = ( X ' X i ) 1 X 'i ( y X i i Za Wc )

Distribuio condicional a posteriori de ai

ai , ai , c, a2 , c2 , e2 , y ~ N (ai , ( Z ' Z i + Ai, 1i ) 1 e2 )

Distribuio condicional a posteriori de ci

ci , a, ci , a2 , c2 , e2 , y ~ N (ci , (W ' Wi + *) 1 e2 )

Distribuio condicional a posteriori de a2

~
a2 , a, c, c2 , e2 , y ~ ~a S a2 ~2a

56

Documentos, 46

Distribuio condicional a posteriori de c2

~
c2 , a, c, a2 , e2 , y ~ ~C S c2 ~2c

Distribuio condicional a posteriori de e2

e2
~2 2
~
=
*

em
que
e os demais parmetros
, a, c, , , y ~ e Se ~e
2
2
e

2
a

2
c

so definidos analogamente ao item 12.


Alm das distribuies assumidas para os efeitos aleatrios no modelo
linear freqentista e para a verossimilhana do vetor de observaes, a
abordagem Bayesiana requer atribuies para as distribuies a priori dos efeitos
fixos e componentes de varincia. Uma distribuio a priori no informativa ou
uniforme foi atribuda a b, refletindo conhecimento a priori vago sobre os efeitos
fixos, de forma que p(b)aK (constante). Para os componentes de varincia,
distribuies c2 inversas foram assumidas como priori, conforme especificado
no tpico anterior. Considerou-se adicionalmente ui = -2 e S i2 = 0, de forma
que a distribuio se tornasse uniforme, e, portanto, no informativa.
Para a inferncia Bayesiana sobre os parmetros de interesse empregouse a tcnica da amostragem de Gibbs. O principal aspecto deste procedimento
refere-se ao fato das inferncias basearem-se na distribuio marginal a
posteriori dos parmetros, sendo que a marginalizao da distribuio conjunta
a posteriori obtida via o amostrador de Gibbs, atravs de amostragens e
atualizaes das distribuies condicionais. Em resumo, a abordagem Bayesiana
baseia-se na construo da distribuio marginal a posteriori de um parmetro
de interesse, tratando-o como uma varivel aleatria e aplicando clculo de
probabilidades. Este procedimento implica problemas multidimensionais, uma
vez que todos os outros parmetros do modelo devem ser integrados (eliminados),
fato que raramente possvel usando os mtodos numricos padres. O
procedimento iterativo da amostragem de Gibbs refere-se a uma tcnica de
integrao estocstica que cria uma cadeia de Markov, que uma distribuio
(conjunta a posteriori) estacionria associada distribuio a posteriori de
interesse. Tomando-se amostras, iterativamente, das distribuies condicionais
a posteriori, com contnua atualizao, obtm-se a distribuio conjunta a
posteriori em equilbrio e, aps um nmero de iteraes suficientemente grande,
a ltima amostra desta seqncia e qualquer amostra subseqente uma
amostra da distribuio conjunta a posteriori. Este resultado implica que cada

Documentos, 46

57

coordenada do vetor de amostras retiradas, n = [ n a n c n a2 ( n ) c2

(n)

e2( n ) ] ,

uma amostra da distribuio marginal a posteriori apropriada.


Para a anlise Bayesiana empregou-se o software MTGSAM (Tassell &
Vleck, 1995) e para a anlise clssica empregou-se o software MTDFREML
(Boldman et al., 1995). Foram avaliados vrios tamanhos de cadeia de Markov
e intervalos entre amostragens.
Para anlise de convergncia do processo de estimao foram
consideradas cadeias de tamanhos 10.000, 15.000 e 20.000 ciclos, intervalos
de 50 e 100 entre amostras dos parmetros de interesse e perodo de descarte
de 2.000 ciclos. Alguns resultados referentes aos parmetros genticos so
apresentados na Tabela 1.
Tabela 1. Resultados comparativos entre algumas estratgias de amostragem
de Gibbs, empregadas para estimao (mdias) dos parmetros
genticos herdabilidade (h2) e correlao de ambiente comum (c2).
Tamanho da cadeia

Intervalo entre amostras

h2

c2

10.000

100

0,34

0,032

20.000

100

0,34

0,032

15.000

50

0,38

0,029

20.000

50

0,36

0,030

Os resultados apresentados na Tabela 1, juntamente com outros no


apresentados, permitiram concluir que a convergncia do processo de
amostragem ocorreu com intervalos de 100 entre amostras e com tamanho de
cadeia de 10.000 ciclos (visto que a cadeia de 10.000 ciclos encontra-se dentro
da cadeia de 20.000 ciclos e que ambas conduziram a resultados idnticos).
Outra forma de anlise de convergncia refere-se estimao do erro
de Monte Carlo, que uma estatstica associada ao erro de estimao de
determinado parmetro devido ao nmero de amostras utilizadas na cadeia de
Gibbs, sendo que este erro inversamente proporcional ao tamanho da cadeia
(Tassel & Vleck, 1996). Este erro pode ser calculado atravs da varincia dos
parmetros amostrados sucessivamente a cada intervalo dividida pelo nmero
de amostras salvas, sendo que a raiz quadrada deste erro fornece uma
aproximao para o desvio padro do erro associado ao comprimento da cadeia.

58

Documentos, 46

Considerando a cadeia de tamanho 20.000 e intervalo de 100 entre amostras,


o desvio padro do erro associado ao tamanho da cadeia foi de 0,0004 para a
herdabilidade (Tabela 2), resultado que revela que os 18.000 ciclos, aps o
perodo de descarte, foram suficientes para obteno de precisas estimativas
das mdias a posteriori. Dessa forma, optou-se por apresentar os resultados
referentes ao tamanho de cadeia de 20.000 ciclos e com amostras salvas a
cada 100 ciclos. O tempo de processamento para esta anlise foi de cerca de
10 horas em um computador Pentium 100 Mhz, com 16 MB de memria.
Na Tabela 2 so apresentadas as estimativas de parmetros genticos
pelos procedimentos REML e GS.
Tabela 2. Estimativas descritivas das distribuies marginais a posteriori da
herdabilidade (h2), correlao devida ao ambiente comum (c2) e
varincia fenotpica ( y ) obtidas pelo procedimento da amostragem
2

de Gibbs (GS), bem como estimativas destes parmetros obtidas


pelo mtodo da mxima verossimilhana restrita (REML). Carter
dimetro em Pinus caribaea var. hondurensis.
Parmetro

GS

REML

Mdia + s*

Moda

Mediana

s**

h2

0,34 + 0,005

0,34

0,34

0,0004

0,33

c2

0,032 + 0,003

0,032

0,032

0,0002

0,026

y2

8,2441 + 0,02

Intervalo de
Confiana (95%)
0,35
0,038
-

Estimativa
0,32 + 0,06
0,031 + 0,01
8,0624

s* = desvio padro; s** = desvio padro Monte Carlo.

Os resultados pontuais obtidos pelas abordagens freqentista e Bayesiana


foram similares (Tabela 2), conforme esperado. Uma vez que foram utilizadas
distribuies a priori no informativas na anlise Bayesiana, as modas das
distribuies marginais a posteriori dos parmetros genticos foram similares
s correspondentes estimativas REML. Do ponto de vista Bayesiano, as
estimativas obtidas por REML correspondem s modas das distribuies conjuntas
a posteriori dos componentes de varincia, dada a utilizao de prioris uniformes
para os efeitos fixos e componentes de varincia. A tcnica GS possibilitou
estimativas de componentes de varincia pelo mtodo VEIL (ou da
verossimilhana integrada) apresentado por Gianola & Foulley (1990).
A grande vantagem da anlise Bayesiana, neste caso, refere-se
obteno dos desvios padres e intervalos de confiana exatos para os
parmetros genticos e valores genticos preditos. Verificou-se que a tcnica
GS propiciou estimativas muito mais precisas que aquelas obtidas por REML.
Documentos, 46

59

Estimativas com precises similares empregando o procedimento GS foram


obtidas por Varona et al. (1994), para caracteres quantitativos em gado de
leite e por Soria et al. (1998) em Eucalyptus globulus. Na Tabela 3 so
apresentados os valores genticos preditos dos melhores genitores, obtidos
pelos procedimentos GS e BLUP, bem como os ganhos genticos associados.
Tabela 3. Estimativas descritivas das distribuies marginais a posteriori dos
valores genticos preditos dos 10 melhores genitores, obtidos pelo
procedimento da amostragem de Gibbs (GS), bem como valores
genticos preditos pelo procedimento BLUP. Carter dimetro em
Pinus caribaea var. hondurensis.
Genitor
130
49
104
73
114
56
100
92
76
125

Mdia + Desvio
Padro

Ordem
(GS)

+
+
+
+
+
+
+
+
+
+

1
2
3
4
5
6
7
8
9
10

2,70
2,23
2,19
2,07
2,03
1,99
1,97
1,90
1,80
1,79

0,03
0,07
0,06
0,07
0,09
0,07
0,03
0,03
0,05
0,03

BLUP + SEP*
2,61
2,15
2,26
1,96
1,96
1,89
1,97
1,82
1,81
1,69

+
+
+
+
+
+
+
+
+
+

0,80
0,94
0,86
0,99
1,06
0,96
0,78
0,79
0,96
0,65

Acurcia
(BLUP)

Ordem (BLUP)

0,86
0,81
0,84
0,78
0,75
0,80
0,87
0,87
0,80
0,91

GS

1
3
2
5
6
7
4
8
9
10
BLUP

Ganho
gentico (cm)

2,066 + 0,04

(1,99

Ganho
gentico (%)

13,93 + 0,27

(13,40

2,14)**

2,011 + 0,28

(1,46 - 2,56)***

14,46)**

13,56 + 1,88

(9,88 - 17,24)***

* desvio padro do erro de predio.


** intervalo com 95% de confiana (probabilidade).
*** clculo considerando uma acurcia mdia de 0,88.

As diferenas observadas nos valores genticos preditos pelos


procedimentos GS e BLUP/REML foram pequenas, conduzindo a uma ligeira
alterao na ordem dos melhores pelos dois procedimentos (Tabela 3). Do
ponto de vista Bayesiano, uma vez que nenhuma distino existe entre efeitos
fixos e aleatrios, as solues das equaes de modelo misto do BLUP
correspondem s mdias das distribuies marginais a posteriori dos parmetros
de locao (efeitos fixos e aleatrios), dados os componentes de varincia, ou
parmetros de disperso. As condies para que haja esta correspondncia
entre BLUP e GS para os parmetros de locao so: atribuio de prioris
uniformes (no informativas) para os efeitos fixos, prioris normais para os efeitos
aleatrios e verossimilhana normal para o vetor de observaes. Estas
premissas foram atendidas neste trabalho, fato que explica os resultados obtidos.
Segundo Wang et al. (1994), uma deficincia do procedimento BLUP/
REML que os erros de estimao dos componentes de disperso no so
considerados por ocasio da predio de valores genticos. A abordagem
Bayesiana e a teoria de probabilidade a ela associada impem que as inferncias
60

Documentos, 46

devem ser baseadas nas distribuies marginais a posteriori dos parmetros de


interesse, de forma que toda a incerteza sobre os parmetros considerada
completamente. Isto conseguido a partir da distribuio conjunta a posteriori
de todos os parmetros. Desta distribuio, a distribuio marginal a posteriori
do valor gentico de um indivduo obtida por sucessivas integraes
(eliminaes) de todos os parmetros de nuissance do modelo, tais como
efeitos fixos, outros efeitos aleatrios (ambiente comum) e componentes de
varincia e parmetros associados (h2 e c2 no caso).
O aspecto ressaltado por Wang et al. (1994) muito relevante
considerando, principalmente, que para que as propriedades desejveis do BLUP
sejam asseguradas, necessrio o conhecimento exato dos componentes de
varincia. Dessa forma, a anlise Bayesiana, que permite estimativas quase
exatas dos componentes de varincia, tende a conduzir tambm a uma maior
aproximao entre ganhos genticos preditos e realizados com seleo. Este
ltimo aspecto pode, em parte, ser visualizado atravs dos desvios padres
dos ganhos genticos apresentados na Tabela 3, sendo que o procedimento GS
propiciou uma inferncia muito mais segura (menor desvio padro ou risco)
sobre o ganho gentico a ser capitalizado com a seleo dos 10 melhores
genitores.
Os parmetros genticos iniciais utilizados foram obtidos pelo
procedimento REML e as distribuies a priori foram tomadas como no
informativas. Se as distribuies a priori para estes parmetros fossem tomadas
como informativas, menores desvios padres para os parmetros seriam obtidos.
Quanto s estimativas pontuais (mdias a posteriori), tem sido verificado que
os valores obtidos so similares quando se consideram prioris muito informativas
e no informativas (Tassell & Vleck, 1996).
As seguintes concluses podem ser relatadas: (i) a anlise Bayesiana
propicia resultados adicionais queles obtidos pela abordagem freqentista,
destacando-se os intervalos de confiana Bayesianos para as estimativas de
parmetros genticos, valores genticos e ganhos genticos; (ii) as estimativas
dos parmetros genticos, valores genticos e ganhos genticos pelo
procedimento da amostragem de Gibbs tendem a ser mais precisas do que pelo
procedimento REML/BLUP; (iii) a anlise Bayesiana uma tcnica elegante e
flexvel que permite a simultnea estimao dos parmetros genticos, efeitos
fixos e valores genticos de maneira precisa, mesmo para amostras de tamanho
finito.
importante relatar que o uso da abordagem Bayesiana em gentica
quantitativa no se restringe aos modelos lineares Gaussianos mas, engloba
tambm os modelos lineares generalizados (Tempelman, 1998), os modelos
no lineares e os modelos robustos (Gianola, 2000). De maneira geral, alm da
riqueza de informaes propiciada, a anlise Bayesiana oferece maior

Documentos, 46

61

flexibilidade quanto aos modelos de anlise, visto que permite o ajuste de


modelos de grande complexidade.

16. Referncias Bibliogrficas


ARENDONK, J.A.M. van ; ROSMEVLEN, C. van; JANSS, L.L.G.; KNOL, E.F.
Estimation of direct and maternal genetic (co)variances for survival within
litters of piglets. Livestock Production Science, v.46, p.163-171, 1996.
BARDORFF-NIELSEN, O. Plausibility inference. Journal of the Statistical
Society, Series B, v.38, p.103-131, 1976.
BAYES, T. An essay towards solving a problem in the doctrine of chances.
Philos. Trans. R. Soc. London, v.53, 370-418, 1763.
BIBBY, J.; TOUTENBURG, H. Prediction and improved estimation in linear
models. New York: Wiley and Sons, 1977.
BOLDMAN, K.G.; KRIESE, L.A.; VLECK, L.D. van.; KACHMAN, S.D. A manual
for use of MTDFREM: a set of programs to obtain estimates of variances
and covariances. Washington: ARS / USDA, 1993. 120p.
BOX, G.E.P.; TIAO, G.C. Bayesian inference in statistical analysis. Reading:
Addison-Wesley Publ.Co., 1973.
BULMER, M.G. The mathematical theory of quantitative genetics. Charedon
Press, Oxford, 1980.
DEMPFLE, L. Relation entre BLUP (Best linear unbiased prediction) et estimateurs
bayesiens. Ann. Genet. Sel. Anim., v.9, p.27-32, 1977.
DEMPFLE, L. Estimation of breeding values. In: HILL, W.G.; MACKAY, T.F.C.,
eds. Evolution and animal breeding. Wallingford: CAB International, , 1989,
p.181-188.
EDWARDS, A.W.F. Likelihood. Cambridge: Cambridge University Press, 1972.
EFRON, B. Biased versus unbiased estimation. Advances in Mathematics,
v.16, p.259-277, 1975.
EFRON, B. Why isnt everyone a Bayesian? American Statistician, v.40, p.11,
1986.
EFRON, B.; MORRIS, C. Steins paradox in statistics. Scientific American,
v.236, n.5, p.119-127, 1977.
FISHER, R.A. On the mathematical foundations of theoretical statistics. Phil.
Trans. R. Soc. Lond. Serie A, n.222, p.309-368, 1922.

62

Documentos, 46

FRIES, L.A.; SCHENKEL, F.S. Estimation and prediction under a selection model.
In: REUNIO ANUAL DA SOCIEDADE BRASILEIRA DE ZOOTECNIA, 30.,
1993, Rio de Janeiro. Anais dos Simpsios. Rio de Janeiro: Sociedade
Brasileira de Zootecnia , 1993. p.1-20.
GAMERMAN, D. Simulao estocstica via cadeias de Markov. Caxamb:
Associao Brasileira de Estatstica, 1996. 196p.
GAMERMAN, D. Markov Chain Monte Carlo: stochastic simulation for bayesian
inference. Boca Raton: CRC Press, 1997.
GAMERMAN, D.; MIGON, H.S. Inferncia Estatstica: uma abordagem
integrada. Rio de Janeiro: Instituto de Matemtica / UFRJ, 1993. 207p.
GARCIA-CORTES, L.A.; SORENSEN, D. On a multivariate implementation of
the Gibbs samples. Genetique, Selection, Evolution, v.28, p.121-126,
1996.
GELFAND, A.E.; SMITH, A.F.M. Sampling-based approaches to calculating
marginal densities. Journal of the American Statistical Association, v.85,
p.398-409, 1990.
GEMAN, S.; GEMAN, D. Stochastic relaxation, gibbs distribution and the
Bayesian rstoration of imagens. IEEE Transactions on Pattern Analysis
and Machine Intelligence, v.6, p.721-741, 1984.
GIANOLA, D. Statistics in animal breeding. Journal of the American Statistical
Association, v.95, p.296-299, 2000.
GIANOLA, D. Inferences about best, worst and ordered genetic values in a
small population with unknown variance. In: CONGRESSO NACIONAL
DE GENETICA, 41., 1995, Caxamb. Anais. Ribeiro Preto: Sociedade
Brasileira de Gentica, 1995. Palestra.
GIANOLA, D.; FERNANDO, R.L. Bayesian methods in animal breeding theory.
Journal of Animal Science, v.63, p.217-244, 1986.
GIANOLA, D.; FERNANDO, R.L.; IM, S.; FOULLEY, J.L. Likelihood estimation
of quantitative genetic parameters when selection occurs: models and
problems. Genome, Ottawa, v.31, p.768-777, 1989.
GIANOLA, D.; FOULLEY, J.L. Variance estimation from integrated likelihood
(VEIL). Genetics Selection Evolution, v.22, p.403-417, 1990.
GIANOLA, D.; IM, S.; MACEDO, F.W. A framework for prediction of breeding
value. In: GIANOLA, D.; HAMMOND, K., ed. Advances in statistical
methods for genetic improvement of livestock. Berlin: Springer Verlag,
1990. p.210-238.

Documentos, 46

63

GOFFINET, B. Selection on selected records. Genetique, Selection, Evolution,


v.15, p.91, 1983.
GOMES, M.I. Verossimilhana e inferencia estatstica. In: COLQUIO DE
ESTATSTICA E INVESTIGAO OPERACIONAL, 2., 1981. Actas. Rio
de Janeiro, 1981. p.230-246.
HARVILLE, D.A. Maximum likelihood approaches to variance component
estimation and to related problems. Journal of the American Statistics
Association, Washington, v.72, p.320-328, 1977.
HENDERSON, C.R. Aplications of linear models in animal breeding. Guelph:
University of Guelph, 1984. 462p.
HENDERSON, C.R. Avaliao de vacas e touros. In: SIMPSIO BRASILEIRO
DE MELHORAMENTO GENTICO DE BOVINOS, 1, 1982. Anais. Coronel
Pacheco: EMBRAPA-CNPGL, 1982a. p.137-168.
HENDERSON, C.R. Best linear unbiased estimation and prediction under a
selection model. Biometrics, v.31, p.423-449, 1975.
HENDERSON, C.R. Best linear unbiased prediction in populations that have
undergone selection. In: BARTON, R.A.; SMITH, W.C., ed. Proceedings
of the World Congress on Sheep and Beef Cattle Breeding. Palmerston
North: Dunmore Press 1982b, v.1, p.191-200.
HENDERSON, C.R. Sire evaluation and genetic trends. In: Animal Breeding
and Genetics Symposium in Honor of J. Lush, 1973, Champaign.
Proceedings. Champaingn: American Society of Animal Science, 1973.
1973, p.10-41.
HENDERSON, C.R.; KEMPTHORNE, O.; SEARLE, S.R.; VON KROSIGH, C.M.
The estimation of environmental and genetic trends from records subject
to culling. Biometrics, v.15, p.192, 1959.
JAMES, W.; STEIN, C. Estimation with quadratic loss. Proceedings of the
Fourth Barkeley Symposium on Mathematical Statistics and Probability,
v.1, p.361-379, 1961.
JEFFREYS, H. Theory of Probability. Oxford: Clarendon Press, 1961.
JENSEN, J.; WANG, C.S. ; SORENSEN, D.A.; GIANOLA, D. Bayesian inference
on variance and covariance components for traits influenced by maternal
and direct genetic effects using the Gibbs sampler. Acta Agriculturae
Scandinavica, v.44, p.192-201, 1994.
LANGE, K.; SINSHEIMER, J.S. Normal/independent distributions and their
applications in robust regression. Journal of the American Statistical
Association, v.2, p.175-198, 1993.

64

Documentos, 46

LERNER, I.M. The genetic basis of selection. New York: John Wiley & Sons,
1957. 298p.
LINDLEY, D.W. Introduction to probability and statistics. Cambridge: Cambridge
University Press, 1965.
LINDLEY, D.V. The Bayesian approach. Scandinavian Journal of Statistics,
v.5, p.1-26, 1978.
LINDLEY, D.V.; SMITH, A.F.M. Bayes estimates for the linear model. Journal
of the Royal Statistical Society, Series B, v.34, p.1-41, 1972.
LINDSEY, J.K. Some statistical heresies. Journal of the Royal Statistical Society,
Series B, v.61, p. 1- 26 , 1999.
MAGNABOSCO, C.V. Estimativas de parmetros genticos em caractersticas
de crescimento de animais da raa Nelore usando os mtodos REML e
Amostragem de Gibbs. Ribeiro Preto: USP / FMRP. 1997. 83p. Tese
Doutorado.
MOOD, A.M.; GRAYBILL, F.A.; BOES, D.C. Introduction to the theory of
statistics. McGraw-Hill, 1974.
MRODE, R.A. Linear models for the prediction of animal breeding values.
Wallingford: CAB International, 1996, 187p.
MURTEIRA, B.J.F. Estatstica: inferncia e deciso. Lisboa: Imprensa Nacional,
Casa da Moeda, 1988.
MURTEIRA, B.J.F. Probabilidade e estatstica: inferncia estatstica. 2.ed.
Lisboa: McGraw-Hill, 1990. v.2.
PATTERSON, H.D.; THOMPSON, R. Recovery of inter-block information when
block sizes are unequal. Biometrika, London, v.58, p.545-554, 1971.
PEREIRA, B.B. Inferncia verossimilhana. Boletim da Associao Brasileira de
Estatstica, v.38, p.31-42, 1997.
REKAYA, R. Analisis Bayesiano de datos de produccin en los das de control
para la seleccin de caracteres lecheros. Madrid: Universidad Politcnica
de Madrid. 1997. Doctoral Tesis.
RESENDE, M.D.V. de. Avanos da gentica biomtrica florestal. In: BANDEL,
G.; VELLO, N.A.; MIRANDA FILHO, J.B., eds. In: ENCONTRO SOBRE
TEMAS DE GENTICA E MELHORAMENTO: Gentica Biometrica Vegetal,
14, 1997, Piracicaba. Anais... Piracicaba: ESALQ, 1997. p.20-46.
RESENDE, M.D.V. de. Predio de valores genticos, componentes de varincia,
delineamentos de cruzamento e estrutura de populaes no melhoramento
florestal. Curitiba: Universidade Federal do Paran, 1999. 434p. Tese
Doutorado.
Documentos, 46

65

ROBERTSON, A. Prediction equations in quantitative genetics. Biometrics,


v.11, p.95-98, 1955.
RODRIGUEZ, M.C.; TORO, M.; SILIO, L. Selection on lean growth in a nucleus
of Landrace pigs: an analysis using Gibbs sampling. Animal Science, v.63,
p.243-253, 1996.
ROGERS, W.H.; TUKEY, J.W. Understanding some long-tailed distributions.
Statistica Neerlandia, v.26, p.211-226, 1972.
RONNINGEN, K. Some properties of the selection index derived by Hendersons
mixed model method. Z. Tierz Zuchtungsbiol, v.88, p.186, 1971.
RONNINGEN, K.; VLECK, L.D. van. Selection index theory with practical
applications. In: CHAPMAN, A.B. (ed.). World animal science A4: general
and quantitative genetics. Oxford: Elsevier Science Publ., 1985, p.187225.
ROSA, G.J.M. Robust mixed linear models in quantitative genetics: Bayesian
analysis via Gibbs sampling. In: LOPES, P.S.; EUCLYDES, R.F.; TORRES,
R.A.; GUIMARES, S.E.F., eds. International Symposium on Animal
Breeding and Genetics. Viosa: Universidade Federal de Viosa, 1999.
p.133-159.
SAIO, K.; HAYASHI, T. Bayesian estimation of genetic parameters. Japanese
Journal of Breeding, v.40, p.63-75, 1990.
SMITH, A.F.M. Bayesian statistics. Present position and potencial
developments: some personal views. Journal of the Royal Statistical
Society, Sries A, v.147, p.245-259, 1984.
SORENSEN, D.A. Gibbs Sampling in Quantitative Genetics. Denmark: Danish
Institute of Animal Science, Department of Breeding and Genetics. 1996.
186p. (Intern Report, 82).
SORENSEN, D.A.; KENNEDY, B.W. The use of the relationship matrix to account
for genetic drift variance in the analysis of genetic experiments. Theoretical
and Applied Genetics, v.66, p.217-220, 1983.
SORENSEN, D.A.; WANG, C.S.; JENSEN, J.; GIANOLA, D. Bayesian analysis
of genetic change due to selection using Gibbs sampling. Genetics,
Selection, Evolution, v.26, p.333-360, 1994.
SORIA, F.; BASURCO, F.; TOVAL, G.; SILIO, L.; RODRIGUEZ, M.C.; TORO,
M. Na application of Bayesian techniques to the genetic evaluation of
growth traits in Eucalyptus globulus. Canadian Journal of Forestry Research,
v.28, p.1286-1204, 1998.
STEEL, R.G.D.; TORRIE, J.H. Principles and procedures of statistics. 2.ed.
New York: McGraw-Hill, 1980. 633p.
66

Documentos, 46

STEIN, C. Inadmissibility of the usual estimator for the mean of a multivariate


normal distribution. Proceedings of the Third Berkeley Symposium on
Mathematical Statistics and Probability, v.1, p.197-206, 1955.
STRANDEN, I.J. Robust mixed effects linear models with t distribuctions and
application to dairy cattle breeding. Madison: University of Wisconsin,
1996. Ph.D. Thesis.
SUN, L. et al. Bayesian methods for variance component models. J. Am. Stat.
Assoc, v.91, n.434, p.743-52, 1996.
TASSELL, C.P. van; CASELLA, G.; POLLAK, E.J. Effects of selection on
estimates of variance components using Gibbs sampling and restricted
maximum likelihood. Journal of Dairy Science, v.78, p.678-692, 1995.
TASSELL, C.P. van ; VLECK, L.D. van. A manual for use of MTGSAM: a set of
FORTRAN programs to apply Gibbs sampling to animal models for variance
component estimation. Washington: USDA / ARS, 1995. 82p.
TASSELL, C.P. van; VLECK, L.D. van. Multiple-trait Gibbs sampler for animal
models: flexible programs for Bayesian and likelihood-based covariance
component inference. Journal of Animal Science, v.74, p.2586-2597,
1996.
TEMPELMAN, R.J. Generalized linear mixed models in dairy cattle breeding.
J. Dairy Sci., v.81, p.1428-1444, 1998.
THOMPSON, R. Recent developments in the estimation of variance components
and their application to the estimation of genetic parameters. In: BARTON,
R.A.; SMITH, W.C., ed. Proceedings of the World Congress on Sheep and
Beef Cattle Breeding. Palmerston North, Dunmore Press, 1982. v.1, p.217224.
THOMPSON, R. Sire evaluation. Biometrics, v.35, p.339-353, 1979.
TORO, M.A.; PRUNONOSA, D.V. The use of prior information in the estimation
of heritability by parent-offspring regression. Genetique, Selection,
Evolution, v.16, p.177-184, 1984.
VARONA, L. Aplicaciones del muestreo de Gibbs en modelos de Gentica
Cuantitativa: analisis de un caso de heterogeneidad de varianzas. Local:
Universidad de Zaragoza, 1994. PhD. Thesis.
VARONA, L.; MORENO, C.; GARCIA-CORTES, L.A.; ALTARRIBA, J. Estimacin
multicarcter de componentes de varianza y covarianza en vacuno lechero
mediante muestreo de Gibbs. Revista Portuguesa de Zootecnia, v.1, p.185195, 1994.
VLECK, L.D. van. Selection Index and Introduction to Mixed Model Methods.
Boca Raton: CRC Press, 1993. 512p.
Documentos, 46

67

VLECK, L.D. van; POLLAK, E.J.; OLTENACU, E.A.B. Genetics for the animal
sciences. New York: W.H. Freeman, 1987. 391p.
WANG, C.S.; GIANOLA, D.; SORENSEN, D.A.; JENSEN, J.; CHRISTENSEN,
A.; RUTLEDGE, J.J. Response to selection for litter size in Danish Landrace
pigs: a Bayesian analysis. Theor. Appl. Genet., v.88, p.220, 1994a.
WANG, C.S.; RUTLEDGE, J.J.; GIANOLA, D. Bayesian analysis of mixed linear
models via Gibbs sampling with an application to litter size in Iberian pigs.
Genetics Selection Evolution. v.26, p.91, 1994b.
WANG, C.S.; RUTLEDGE, J.J.; GIANOLA, D. Marginal inferences about
variance components in a mixed linear model using Gibbs sampling.
Genetics Selection Evolution, v.25, p.41, 1993.
WEIGEL, K.A.; GIANOLA, D. A computationally simple bayesian method for
estimation of heterogeneous within-herd phenotypic variances. Journal
of Dairy Science, v.76, p.1455-1465, 1993.
ZELLNER, A. An introduction to Bayesian inference in econometrics. New
York: J. Wiley and Sons, 1971.

68

Documentos, 46

Você também pode gostar