Escolar Documentos
Profissional Documentos
Cultura Documentos
RESUMO
O presente artigo props-se a refletir teoricamente o processo de estimao/
predio de mdias de tratamentos, nos delineamentos em blocos, com nfase nas suas
aplicaes em testes de gentipos, no melhoramento vegetal. Neste sentido, procurou-se
comparar as anlises baseadas no modelo linear fixo (anlise intrablocos) e no modelo
linear misto com gentipos aleatrios (anlise recuperando informao intertratamentos),
buscando identificar os fatores que podem determinar diferentes
classificaes
genotpicas. A anlise terica permitiu constatar que a abordagem de modelo misto (com
tratamentos aleatrios), comparativamente s anlises tradicionais (mdias marginais e
anlise intrablocos), em geral, leva a: i) maior homogeneidade das mdias de tratamentos;
e ii) seleo de diferentes tratamentos genticos, quando a varincia genotpica for baixa
em relao varincia do erro e os ensaios forem no ortogonais e desbalanceados.
Ademais, se os tratamentos forem oriundos de vrias populaes, a predio BLUP
poder determinar diferente classificao das mdias de tratamentos, em relao anlise
intrablocos, mesmo sob ortogonalidade e balanceamento.
Palavras-chave: modelo linear misto, delineamentos em blocos, predio de mdias,
mdias BLUP, ordenao de tratamentos, selecionando gentipos.
76
A BSTRACT
This study was aimed at reviewing the theory of estimation/prediction of treatment
means, in randomized block designs, emphasizing aspects of interest to plant breeders.
Comparisons were made between analyses based on fixed (intrablock) and mixed (with
random treatments effects - recovering intergenotypic information) linear models for
identifying determining factors that may affect the classification of genotypes. It could be
verified that the mixed model approach, in comparison with the traditional analyses
(marginal means and intrablock analysis) in general leads to: i) more uniformly
distributed treatment means; and ii) selection of different genetic treatments when the
genetic variance is small, relative to the environmental variance, and designs are nonorthogonal and unbalanced. In addition, if treatments of distinct reference populations are
evaluated in the same experiment, BLUP prediction can lead to different ranking of
means, in comparison with the intrablock analysis, even if designs are balanced and
orthogonal.
Key words: linear mixed models, analysis of block designs, estimation and prediction of
means, BLUP means, ranking of treatments, ordering and selecting genotypes.
77
1. INTRODUO
No melhoramento de plantas ainda comum o uso de anlise baseada em modelo fixo para
a estimao de mdias de tratamentos (ex: gentipos), mesmo quando estes foram obtidos por
amostragem numa populao. Isto , em situaes em que o modelo tipicamente misto, pois
inclui, alm de efeitos fixos, os efeitos aleatrios dos gentipos. Em boa parte dos casos, a
modelagem mista utilizada, com o rigor da suposio, apenas para a estimao de componentes de
varincia e para a construo de testes F apropriados na anlise da varincia.
Entre as razes que levam os melhoristas prticos a no utilizarem predies baseadas em
modelos mistos esto a falta de vivncia com estes mtodos e a sua pequena divulgao (Bueno
Filho, 1997). Acrescenta-se que os efeitos prejudiciais da abordagem tradicional normalmente so
tidos como mnimos, a ponto de no recompensar os esforos com a adoo da nova metodologia.
A ordem de classificao dos gentipos, em geral, no se altera no caso de ensaios que seguem
delineamentos ortogonais e balanceados. Assim, na prtica, a estimao de mdias admitindo-se
modelo fixo (ex: anlise intrablocos) quando, na verdade, misto, no modificaria o resultado final
da seleo.
Por outro lado, a ocorrncia de desbalanceamento no planejado, decorrente da perda de
parcelas, um fato normal nesse tipo de experimentao. Ademais, nas fases preliminares do
processo seletivo, quando os gentipos so numerosos e ainda possuem natureza aleatria (Piepho,
1994), comum o uso de delineamentos no ortogonais como BIB (blocos incompletos
balanceados) e PBIB (blocos incompletos parcialmente balanceados). Tambm tm ganhado
aplicao crescente os delineamentos aumentados (Federer, 1956; 1958), os quais, por construo,
so desbalanceados e no ortogonais. Nestes casos, a possibilidade de classificaes genotpicas
diferenciadas entre as duas abordagens analticas uma realidade. Assim, optar-se pela
convenincia da suposio de um fator como fixo ou aleatrio pode estar longe de ser prtica
inofensiva (Bueno Filho, 1997).
Atualmente, a metodologia de modelos mistos tem-se tornado mais acessvel aos usurios
graas sua implementao em sistemas estatstico-computacionais de ampla divulgao como o
SAS (Statistical Analysis System). Logo, a sua rigorosa aplicao perfeitamente exeqvel sempre
que o modelo subjacente aos dados for de tal natureza, o que dever garantir maior confiabilidade
s estimativas. Neste caso, covarincias biologicamente comprovadas passam a ser levadas em
conta no s nos testes estatsticos, mas tambm na estimao e predio de efeitos de implicao
78
Y ijr = m + b j + g i + e ijr ;
com:
e ijr ~ N ( 0, 2e );
g i ~ N ( 0, 2g );
E( Y ijr ) = m + b j ; e Var( Y ijk ) = 2g + 2e .
79
y = X + Z + ; com: ~ N ( ,R );
~ N ( ,G );
E( y ) =X ; e Var( y ) = V (n) = ZGZ + R .
Neste caso, tem-se: todos os efeitos fixos reunidos no vetor paramtrico (p x 1) ; os efeitos
aleatrios no vetor paramtrico (q x 1) , exceto os erros que compem o vetor (nx1) ; X (n x p) e
80
$ e R
$ ). Nos outros mtodos, a estimao fundamenta-se na construo de formas quadrticas do
(G
tipo yPty (t=1,2,...,s; sendo s o nmero de parmetros 2t a serem estimados), as quais so
equacionadas com suas esperanas matemticas, E(yPty). As formas quadrticas equivalem s
somas de quadrados obtidas na correspondente anlise de varincia e E(yPty) uma funo dos
parmetros 2t . Descries detalhadas so encontradas em Valrio Filho (1991), Searle et al.
(1992), Lopes et al. (1993), entre outros.
De posse dos valores paramtricos dos componentes de varincia ( G e R ) ou de
$ e R
$ ), passa-se, ento, aos problemas de estimar o vetor de efeitos
suas estimativas ( G
fixos (ou uma funo a ele associada) e de predizer o vetor de efeitos aleatrios (ou
tambm alguma funo de ). Ambos os problemas podem ser resolvidos, simul-
81
taneamente, atravs das chamadas equaes de modelo misto (EMM), propostas por
Henderson em 1948 (Littell et al., 1996; Henderson, 1984):
X R 1 X
X R 1 y
X R 1 Z 0
=
.
1
1
1 ~
1
Z R X Z R Z + G
Z R y
$ e R
$.
No se conhecendo as matrizes G e R , simplesmente substituem-nas por G
Manipulaes de lgebra matricial levam, por conseguinte, s solues do sistema:
0 = ( X V 1 X ) X V 1 y ; e
~
= GZ V 1 ( y X 0 ) = CV 1 ( y X 0 )
em que: C=GZ a matriz de covarincias entre y e (covarincia entre observaes
fenotpicas e valores genotpicos verdadeiros).
A obteno das solues do sistema por meio destas expresses pode, entretanto,
ter um alto custo computacional, haja vista a dimenso n x n da matriz V a ser invertida. O
uso de uma inversa generalizada da matriz de coeficientes em EMM representa uma opo
de menor esforo computacional, uma vez que esta matriz tem dimenso (p+q) x (p+q),
inferior a n x n (McLean et al., 1991). Andr (1999) deduz por absoro e substituio nas
EMM, uma outra alternativa neste sentido.
notrio que, se G -1 tende para a matriz nula (ex: 2g , no caso particular
domina as EMM (ex: 2g 0, sob G=I 2g ), tende para zero. Nos casos intermedirios,
G -1 opera reduzindo (shrinking, em ingls) a magnitude das estimativas de supostamente fixo, at zero (SAS Institute, 1997).
Se G e R so conhecidas, 0 (ou, mais provavelmente, alguma funo estimvel
82
dispondo-se apenas de estimativas obtidas por algum mtodo. Neste caso, os termos
BLUE e BLUP no mais se aplicam, sendo apropriado substitu-los por EBLUE (empirical
best linear unbiased estimator) e EBLUP (empirical best linear unbiased predictor),
respectivamente (SAS Institute, 1997; Littell et al., 1996). O termo emprico
adicionado, portanto, para indicar esse tipo de aproximao.
A correspondente matriz de varincias-covarincias dos parmetros, C 0 , ~ ou
$ 0 ~ , dada por:
C
,
C 0 ,~
X R 1 X
X R 1 Z
=
1
1
1
Z R X Z R Z + G
$ 1
$ 1 Z
X R
$ 0 ~ = X R X
ou C
.
,
$ 1
$ 1
$ 1
Z R X Z R Z + G
C11
C 0 , ~ =
C 21
C 21
C 22
C11 = ( X V 1 X ) ; C 21 = GZ V 1 XC11 ; e
.
1
1 1
1
C 22 = ( Z R Z + G ) C 21 X V ZG
; com:
-1
-1
-1
4. EXPLICITAO DO BLUP DE
Para entender as conseqncias da suposio de aleatoriedade dos efeitos de
tratamentos sobre suas estimativas de mdias necessrio primeiramente analisar o
~
~ , o BLUP de g (i=1,2,...,a). Sem perda de generalidade,
vetor , ou seja, de cada g
i
i
omite-se, neste momento, o ndice j (de blocos), mantendo-se apenas i e r, relativos ao
tratamento e a sua repetio. Sob a estrutura de componentes de varincia, G = I 2g e
a
i=1
i=1
83
Y11
Y12
~
g1
g~
Y
2
~
1
= = CV 1n1
M
Y
21
~
Y22
ga
Yana
Y$11
Y$12
Y$1n1
; com:
Y$21
Y$22
Y$ana
C
1( ni ) 2g
=
i=1
1 a 1
Bi
V = i
=1
B1 = 1 I J
( ni )
i ( ni )
i
e2
2g
=
i 2 + n 2
e
i g
onde: 1(ni ) , I ( ni ) e J ( ni ) so, respectivamente, um vetor linha de uns, uma matriz identidade
e uma matriz quadrada com todos os elementos iguais a um, todos de ordem n i .
-1
CV 1 =
2g
e2
n1 colunas
n2 colunas
644444
474444448 6444444
474444444
8
0
0
0
L
1 n11 1 n11 L 1 n11
0
0
0
L
1 n2 2 1 n2 2 L 1 n2 2
M
M
M
M
M
M
M
M
0
0
0
0
0
0
L
L
na colunas
6444444
474444444
8
0
0
0
L
0
0
0
L
L
.
M
M
M
M
M
L 1 na a 1 na a L 1 na a
L
BLUP( g i ) = g~i =
ni 2g
e2 + ni 2g
(Yi 0 ) = ni i (Yi 0 ) .
-1
Isto resulta da multiplicao da i-sima linha de CV pelo vetor ( y y$ ) ou ( y X 0 ) :
ni
ni
2g
2g
2g
2g ni
g~i = 2 (1 n i i )(Yir Y$ir ) = 2 (1 n i i ) (Yir Y$ir ) = 2 (1 ni 2
)
(Yir Y$ir )
e
e + n i 2g r=1
e
e r=1
r=1
(1)
ni
ni
2g 2e + n i 2g n i 2g ni
2g
$ )=
)
(Y
Y
(Y Y$ir ) = i (Yir Y$ir ) = i (Yi. Y$i. ) .
g~i = 2 (
ir
ir
2
2
2
2 ir
e
e + ni g
e + ni g r=1
r=1
r=1
g~i = ni i (Yi Yi ) =
ni 2g
+ ni
2
e
2
g
(Yi 0i ) = ni i (Yi 0i )
(2)
em que: Yi = i , representa a mdia dos valores ajustados (para os efeitos fixos) nas
0
84
i=
b
b
1
1 b
1 b
0
0
0
0
0
0
0
0
nij m + nij b j = ni m + nij b j = m + nij b j = m + b i ;
ni
j =1
j =1
ni j =1
n i j =1
em que: m0 e
0i
denota o
0 1 b
0
0
0
Y
m + nij b j = ni i [Yi ( m + b i )]
2
2 i
ni j=1
e + ni g
ni 2g
(3)
Este desenvolvimento mostra que o uso de uma constante 0 , comum para todo i,
como apresentam Searle et al. (1992, p. 271 ), no se aplica a todo tipo de situao e
0
2g
2g + 2e / ni
),
~ ( 1 , 2 ou 3 ). Para
cujo valor genotpico tenha sido predito por uma das expresses de g
i
simplificao, considere-se ainda um delineamento binrio, com n ij =0 ou n ij =1. Assim,
pode-se afirmar que, sob as condies da predio, o valor esperado para cada uma das
correspondentes unidades experimentais dado por: E(Y$ijr ) = m + b j . Contudo, para esse
85
~ em (1), tem-se:
blocos) numa das expresses preliminares de g
i
ni
ni
E(g~i ) = E[ i (Yijr Y$ijr )] = i E(m+ b j + g i + eijr Y$ijr )
r=1
r=1
ni
ni
ni
E(g~i ) = i (m+ b j + g i + eijr m b j ) = i (g i + eijr ) = n i i g i + i eijr .
r=1
r=1
r=1
~
n
um termo i r=1
eijr 0 . Isto prejudica a qualidade do preditor g i que ter um vis no
i
sentido do efeito ambiental mdio incidente nas parcelas que receberam o gentipo i.
n
Todavia, sob casualizao e n i grande, pode-se assumir, tranqilamente, que r=1
eijr = 0 e,
i
~ reduz-se, proporcionalmente, no
herdabilidade diminui ( n i i 0 ), o valor absoluto de g
i
sentido do valor esperado populacional, E(g i )=0. Isto revela o aumento da importncia do
relacionamento entre os gentipos, na predio do valor gentico de cada um.
que a informao individual diminui ( hY2 0), prefervel predizer a performance de cada
i
86
necessrio
construir
uma
funo
linear
de
parmetros
fixos
aleatrios:
~
~y = X 0 + Z~
Yij = ( m0 + b0j ) + g~i . Tal expresso representa a soma: (valor mdio do
ambiente particular j) + (efeito do gentipo i). Contudo, se o pesquisador estiver
~ (suficientes para o
interessado no apenas na informao dos efeitos genotpicos g
i
~
~
~ . Esta, sim, determina o
mdias genotpicas BLUP, sendo dada por: Yi = ( m0 + b 0 ) + g
i
ajuste das mdias de cada tratamento para um mesmo referencial, a constante ( m0 + b 0 ).
Computacionalmente, este termo da expresso obtido construindo-se uma funo linear
dos efeitos fixos, L , comum para todos os tratamentos. A matriz L [a x (1+b)] pode ter suas
linhas todas iguais a: [1 k 1 /n k 2 /n ... k b /n], o que gera uma mdia ponderada dos efeitos
de blocos pelos seus respectivos tamanhos, b 0 , qual adicionada a constante m0 .
estimvel,
87
~ = L 0 + ~
isso, chamado de BLUP(w): w
. No presente caso, tem-se: BLUP(w)=
BLUP( P + g i ) = $ P + g~i = ( m 0 + b 0 ) + g~i , o que corresponde mdia BLUP do
gentipo i. Littell et al. (1996) ilustram o tratamento desse tipo de problema atravs do
sistema SAS. Os autores referem-se a tais combinaes lineares como funes predizveis,
para diferenci-las das funes estimveis que combinam apenas efeitos fixos.
~.
Definido o significado das mdias BLUP, reconsidere-se agora a expresso de g
i
O termo n i i (a herdabilidade de mdias) representa um peso aplicado ao mais simples
0
genotpico mdio ( Yi i ).
Fazendo-se g = 2g / 2e , relao que reflete a herdabilidade em nvel de indivduos
ou parcelas ( hY2ij =
ni i =
2g
2e + 2g
= g 1+ g ), tem-se:
ni 2g
+ ni
2
e
2
g
ni g 2e
+ ni g
2
e
2
e
e2 ni g
(1 + ni g )
2
e
ni g
1 + ni g
gentipo i, o
0
88
entre
si,
igualmente
respectivas
mdias
marginais
simples
no
ajustadas
i
Yij / ni ).
( Yi = nk=1
Por outro lado, quando essa relao de varincias for muito baixa ( g 0), o
0
89
Quanto menor a repetibilidade, maior ser o efeito shrinkage, o qual tido como uma
propriedade desejvel do BLUP, haja vista que o efeito notadamente forte sobre as
mdias Yi extremas (Piepho, 1994; SAS Institute, 1996). Em razo disso, o BLUP
tambm denominado estimador shrinkage (Stroup & Mulitze, 1991).
Figura 2.1. Efeito shrinkage sobre mdias ajustadas intrablocos (MAJ_FIXO) em relao s mdias
ajustadas sob recuperao da informao intergenotpica (MAJ_BLUP). Os nmeros (1001 a
1010) identificam os gentipos, num ensaio simulado de blocos completos casualizados com:
=10; b j ~N(0,S b 2 =0,20); g i ~N(0, g 2 =0,25); e e ijr ~N(0, e 2 =2,00).
90
ainda avaliar uma possvel mudana na ordenao das mdias de tratamentos, quando se
passa de uma situao de anlise para a outra, o que ser considerado mais adiante.
~,
ordenao de suas mdias preditas fica determinada, como j referido, apenas pela de g
i
~ )]. Por isso, para fins de seleo de gentipos
ou seja: ranking[BLUP( P +g i )]=ranking[( g
i
(tratamentos), em geral, dispensa-se a obteno das respostas mdias preditas de cada
tratamento. Em alguns estudos, todavia, o resultado destas mdias pode ser de interesse.
0i
~ )=ranking( Y ). Isto
tambm inferior unidade. Logo: ranking[BLUP( P +g i )]=ranking( g
i
i
significa que, no caso de blocos completos balanceados, uma seleo baseada em mdias
marginais ( Yi ) levar reteno e descarte dos mesmos gentipos que uma seleo
~ (Figura 2.1).
baseada em BLUP( P +g i ), ou simplesmente em g
i
Resta, portanto, a questo de maior interesse prtico relacionada ao processo de
seleo de tratamentos: Existem ou no diferenas entre os ordenamentos de mdias
91
produzidas pela abordagem de modelo misto e por uma anlise convencional intrablocos
(modelo fixo)? A resposta sim. Em blocos incompletos, balanceados ou no,
0i
no
mais comum para todo i e os ajustes para os efeitos de blocos podem fazer com que os
muito
em
nmeros
de
repeties.
razo
pela
qual
nvel
de
desbalanceamento interfere nas mdias preditas e no seu ordenamento pode ser buscada
( Yi i ) , pois
0i
modelos mistos, a soluo para efeitos fixos tambm leva em conta a estrutura de varincias e
covarincias das observaes. Ademais, esta influncia vai alm da estimao pontual, interferindo
92
tambm nos testes de hipteses relacionados aos efeitos fixos, o que justifica sempre uma cuidadosa
especificao da estrutura de erros (Littell et al., 1996; Duchateau & Janssen, 1997).
Diante disso, o costumeiro uso de anlises fundamentadas na suposio de
tratamentos fixos (ex: anlise intrablocos) para fins de seleo de gentipos, quando, na
realidade, eles forem aleatrios, desperta especial preocupao se a relao g for baixa.
E, sem dvida, esse o caso de boa parte dos ensaios de avaliao de gentipos em
programas de seleo de espcies j bastante melhoradas como a soja, ou seja, com baixa
variabilidade gentica. verdade que, nas fases preliminares do processo, a varincia
gentica pode ser consideravelmente alta. Em contrapartida, nestas etapas, os erros
experimentais, em geral, so elevados (grande nmero de tratamentos e pequeno nmero
de repeties), implicando em baixos valores de g . Nestes casos, o nmero de repeties
(n i ) e o grau de desbalanceamento voltam a ter influncia decisiva na ordenao dos
gentipos pela abordagem aqui apresentada (modelo misto com tratamentos aleatrios).
Isto porque, sob desbalanceamento, n i i pondera diferentemente o valor do desvio
0
ni i =
ni 2g
2e + ni 2g
ni g
1 + ni g
g
g +
ni
h =
2
Yi
ni hY2ij
1 + ( ni 1)hY2ij
93
1,2
ni=1
ni=2
n i i
0,8
ni=3
ni=4
0,6
ni=6
ni=8
0,4
ni=12
0,2
ni=20
0
0
10
Figura 2.2.
g~i , para
94
0i
da
$p =m
$ ), haja vista
expresso do BLUP(g i ) torna-se comum a todos os tratamentos ( i =
um nico efeito fixo no modelo, a constante m . Logo, uma possvel modificao na ordem
95
96
97
Figura 2.3. Ordenamento de mdias ajustadas intrablocos (MAJ_FIXO) em relao s mdias ajustadas
sob recuperao da informao intergenotpica (MAJ_BLUP), para um conjunto de
tratamentos oriundos de trs populaes (P1, P2 e P3). Dados simulados para um ensaio em
blocos ao acaso sob: =10; b j ~N(0,S b 2 =0,2); e ijr ~N(0, e 2 =2,0); e g i ~N(1, g 2 =0,15) se i
P1; g i ~N(2, g 2 =0,05) se i P2; e g i ~N(3, g 2 =0,2) se i P3.
8. CONCLUSES
A anlise terica desenvolvida neste artigo permite constatar que a abordagem de
modelos mistos com tratamentos aleatrios, em geral, produz mdias mais uniformes para
os tratamentos do que a anlise intrablocos e do que o mtodo de mdias marginais
simples. Alm disso, a metodologia de modelos lineares mistos dever produzir selees
notadamente diferentes em relao s anlises tradicionais (mdias marginais e anlise
98