Você está na página 1de 24

CAPTULO 2

ESTIMAO E PREDIO SOB MODELO LINEAR MISTO


COM NFASE NA ORDENAO DE MDIAS
DE TRATAMENTOS GENTICOS
RESUMO
O presente artigo props-se a refletir teoricamente o processo de estimao/
predio de mdias de tratamentos, nos delineamentos em blocos, com nfase nas suas
aplicaes em testes de gentipos, no melhoramento vegetal. Neste sentido, procurou-se
comparar as anlises baseadas no modelo linear fixo (anlise intrablocos) e no modelo
linear misto com gentipos aleatrios (anlise recuperando informao intertratamentos),
buscando identificar os fatores que podem determinar diferentes classificaes
genotpicas. A anlise terica permitiu constatar que a abordagem de modelo misto (com
tratamentos aleatrios), comparativamente s anlises tradicionais (mdias marginais e
anlise intrablocos), em geral, leva a: i) maior homogeneidade das mdias de tratamentos;
e ii) seleo de diferentes tratamentos genticos, quando a varincia genotpica for baixa
em relao varincia do erro e os ensaios forem no ortogonais e desbalanceados.
Ademais, se os tratamentos forem oriundos de vrias populaes, a predio BLUP
poder determinar diferente classificao das mdias de tratamentos, em relao anlise
intrablocos, mesmo sob ortogonalidade e balanceamento.
Palavras-chave: modelo linear misto, delineamentos em blocos, predio de mdias,
mdias BLUP, ordenao de tratamentos, selecionando gentipos.
76
ESTIMATION AND PREDICTION UNDER LINEAR MIXED MODELS
EMPHASIZING THE RANKING OF MEANS OF GENETIC TREATMENTS
ABSTRACT
This study was aimed at reviewing the theory of estimation/prediction of treatment
means, in randomized block designs, emphasizing aspects of interest to plant breeders.
Comparisons were made between analyses based on fixed (intrablock) and mixed (with
random treatments effects - recovering intergenotypic information) linear models for
identifying determining factors that may affect the classification of genotypes. It could be
verified that the mixed model approach, in comparison with the traditional analyses
(marginal means and intrablock analysis) in general leads to: i) more uniformly
distributed treatment means; and ii) selection of different genetic treatments when the
genetic variance is small, relative to the environmental variance, and designs are non-
orthogonal and unbalanced. In addition, if treatments of distinct reference populations are
evaluated in the same experiment, BLUP prediction can lead to different ranking of
means, in comparison with the intrablock analysis, even if designs are balanced and
orthogonal.
Key words: linear mixed models, analysis of block designs, estimation and prediction of
means, BLUP means, ranking of treatments, ordering and selecting genotypes.
77
1. INTRODUO
No melhoramento de plantas ainda comum o uso de anlise baseada em modelo fixo para
a estimao de mdias de tratamentos (ex: gentipos), mesmo quando estes foram obtidos por
amostragem numa populao. Isto , em situaes em que o modelo tipicamente misto, pois
inclui, alm de efeitos fixos, os efeitos aleatrios dos gentipos. Em boa parte dos casos, a
modelagem mista utilizada, com o rigor da suposio, apenas para a estimao de componentes de
varincia e para a construo de testes F apropriados na anlise da varincia.
Entre as razes que levam os melhoristas prticos a no utilizarem predies baseadas em
modelos mistos esto a falta de vivncia com estes mtodos e a sua pequena divulgao (Bueno
Filho, 1997). Acrescenta-se que os efeitos prejudiciais da abordagem tradicional normalmente so
tidos como mnimos, a ponto de no recompensar os esforos com a adoo da nova metodologia.
A ordem de classificao dos gentipos, em geral, no se altera no caso de ensaios que seguem
delineamentos ortogonais e balanceados. Assim, na prtica, a estimao de mdias admitindo-se
modelo fixo (ex: anlise intrablocos) quando, na verdade, misto, no modificaria o resultado final
da seleo.
Por outro lado, a ocorrncia de desbalanceamento no planejado, decorrente da perda de
parcelas, um fato normal nesse tipo de experimentao. Ademais, nas fases preliminares do
processo seletivo, quando os gentipos so numerosos e ainda possuem natureza aleatria (Piepho,
1994), comum o uso de delineamentos no ortogonais como BIB (blocos incompletos
balanceados) e PBIB (blocos incompletos parcialmente balanceados). Tambm tm ganhado
aplicao crescente os delineamentos aumentados (Federer, 1956; 1958), os quais, por construo,
so desbalanceados e no ortogonais. Nestes casos, a possibilidade de classificaes genotpicas
diferenciadas entre as duas abordagens analticas uma realidade. Assim, optar-se pela
convenincia da suposio de um fator como fixo ou aleatrio pode estar longe de ser prtica
inofensiva (Bueno Filho, 1997).
Atualmente, a metodologia de modelos mistos tem-se tornado mais acessvel aos usurios
graas sua implementao em sistemas estatstico-computacionais de ampla divulgao como o
SAS

(Statistical Analysis System). Logo, a sua rigorosa aplicao perfeitamente exeqvel sempre
que o modelo subjacente aos dados for de tal natureza, o que dever garantir maior confiabilidade
s estimativas. Neste caso, covarincias biologicamente comprovadas passam a ser levadas em
conta no s nos testes estatsticos, mas tambm na estimao e predio de efeitos de implicao
78
direta no ordenamento dos gentipos e, por conseguinte, no resultado da seleo. Os estimadores
correspondentes, em geral, tm varincia menor do que os de modelo fixo, sendo por isso mais
eficientes (Henderson, 1975; Verbeke & Molenberghs, 1997; Federer, 1998).
O propsito deste artigo apontar, por meio de explicitaes tericas, os fatores que podem
determinar diferenas na classificao das mdias genotpicas (de tratamentos), quando estas forem
obtidas por modelos fixo ou misto, de anlise. O desenvolvimento centra-se na abordagem de
modelos lineares mistos, por razes de generalidade e de divulgao. A nfase principal est num
modelo de delineamento em blocos, admitindo os efeitos de blocos como fixos e os de tratamentos
como aleatrios. Entretanto, procurou-se tambm avaliar a extenso das constataes obtidas em
algumas variaes deste modelo.
2. UM MODELO DE DELINEAMENTO EM BLOCOS
Considere-se, para fins de ilustrao, um delineamento experimental em blocos,
com a tratamentos (gentipos) de efeitos g
i
(i=1,2,...,a) e b blocos (completos ou
incompletos) de efeitos b
j
(j=1,2,...,b). Com o propsito de generalizao, faz-se n
ij
ser o
nmero de vezes que o tratamento i aparece no bloco j (n
ij
=0,1,2,...). Portanto:
i

j
n
ij
= n
(nmero de observaes);
i
n
ij
=n
.j
=k
j
(tamanho ou nmero de parcelas do bloco j); e

j
n
ij
=n
i.
=n
i
(nmero de repeties do tratamento i); alm de que:
i
n
i
=
j
k
j
=n. Denota-se
ainda por Y
ijr
a observao num carter ou varivel aleatria Y (observvel), relativa r-
sima parcela (r=1,2,...,n
i
) que recebeu o tratamento i, identificada tambm pelo bloco j.
Um modelo linear que caracteriza esse conjunto de dados pode ser:
Y
ijr
= m + b
j
+ g
i
+ e
ijr
; com: e
ijr
~ N(0,
e
2
);
g
i
~ N(0,
g
2
);
E(Y
ijr
) = m + b
j
; e Var(Y
ijk
) =
g
2
+
e
2
.
Neste modelo, o efeito de bloco (b
j
) assumido como fixo e o de tratamento (g
i
),
como aleatrio. A constante m de natureza sempre fixa e e
ijr
uma varivel aleatria
no observvel. Isso caracteriza o que se conhece na literatura por um modelo misto, pois
incorpora uma mistura de tipos de efeitos, fixos e aleatrios (Searle, 1987). Dessa forma,
os tratamentos testados representam uma amostra de uma populao de gentipos, cujas
respostas so distribudas normalmente, em torno de uma mdia comum (
P
= m b + ) e
com varincia
g
2
; ou seja, os tratamentos so realizaes (valores) de variveis
79
aleatrias no observveis, as quais correspondem aos efeitos g
i
s (desvios genotpicos
aleatrios em relao mdia
P
). O tratamento estatstico desse tipo de modelo, no
campo do melhoramento gentico vegetal, tem recebido a denominao de anlise com
recuperao da informao intervarietal ou intergenotpica (Wolfinger et al.,1997;
Federer, 1998).
Matricialmente, a expresso que generaliza essa e outras modelagens mistas
alternativas pode ser escrita a partir do vetor y
(nx1)
de observaes, na forma do chamado
modelo linear misto geral:
y = X + Z + ; com: ~ N(,R);
~ N(,G);
E(y)=X; e Var(y)= V
(n)
= ZGZ + R .
Neste caso, tem-se: todos os efeitos fixos reunidos no vetor paramtrico
(px1)
; os efeitos
aleatrios no vetor paramtrico
(qx1)
, exceto os erros que compem o vetor
(nx1)
; X
(nxp)
e
Z
(nxq)
representam as matrizes de incidncias dos efeitos contidos em e ,
respectivamente; G
(q)
e R
(n)
so as matrizes de varincias-covarincias dos vetores
aleatrios e , respectivamente; e as covarincias entre vetores diferentes so assumidas
nulas (Henderson, 1984). Aqui, por simplificao, adotar-se-: G=I
(a)

g
2
e R=I
(n)

e
2
, em
que I
(.)
denota uma matriz identidade e a=q (nmero de nveis do fator aleatrio).
3. ESTIMAO E PREDIO NUM MODELO LINEAR MISTO
Sabe-se que, sob as condies definidas anteriormente, o mtodo de quadrados
mnimos ordinrio (OLS) no mais um bom procedimento de estimao, pois assume a
simples estrutura V=I
e
2
, minimizando: (y-X)(y-X). A recomendao para esse caso
recai sobre o mtodo de quadrados mnimos generalizado (GLS), o qual contempla
qualquer estrutura no singular de V (matriz de varincias e covarincias das
observaes), o que leva a minimizar a expresso mais genrica: (y-X)V
-1
(y-X).
Todavia, para isso necessrio conhecer a matriz V, atravs de G e R, ou, alternativa-
mente, inserir alguma estimativa de V no problema de minimizao GLS. Nesta ltima
situao, o que deve ser feito encontrar razoveis estimativas de G e de R por meio de
algum mtodo de estimao. Entre estes, destacam-se pelo volume de aplicaes, os
80
procedimentos ANOVA baseados no mtodo dos momentos (Fisher, 1918; Henderson,
1953) e os mtodos de mxima verossimilhana, ML (Hartley & Rao, 1967) e REML
(Patterson & Thompson, 1971).
Em vrias situaes, a preferncia tem sido dada aos mtodos baseados em
verossimilhana, os quais exploram a suposio de que e tm distribuio normal
(Littell et al., 1996; Verneque, 1994). Todavia, no caso de modelos mistos, no existe
consenso sobre a melhor forma de estimar componentes de varincia (Christensen et al.,
1992). Optando-se por ML ou REML necessrio, ento, construir uma funo objetivo e
maximiz-la em relao a todos os parmetros desconhecidos. Segundo a abordagem do
SAS Institute (1997), com alguns clculos possvel reduzir o problema de maximizao
apenas aos parmetros em G e R. Assim, os correspondentes logaritmos da funo de
verossimilhana (l
ML
) e da funo de verossimilhana restrita/residual (l
REML
) so:
l
ML
(G,R) = -(1/2) log|V| -(n/2) log(rV
-1
r) - (n/2) [1+ log(2/n)] ; e
l
REML
(G,R) = -(1/2) log|V| -(1/2) log|XV
-1
X| - [(n-p)/2] log(rV
-1
r) -[(n-p)/2]{1+log[2/(n-p)}.
em que: r = y X(XV
-1
X)
-
XV
-1
y ; p, aqui, o posto (rank) de X; e, dada uma matriz A
qualquer, A
-
denota uma inversa generalizada de A (tal que AA
-
A=A).
Do processamento numrico de uma destas expresses, atravs de algoritmos
iterativos como Newton-Raphson (implementado no PROC MIXED do sistema SAS) ou
EM (Expectation Maximization), pode-se obter as estimativas ML ou REML de interesse
(
$
G e
$
R). Nos outros mtodos, a estimao fundamenta-se na construo de formas quadrticas do
tipo yP
t
y (t=1,2,...,s; sendo s o nmero de parmetros
t
2
a serem estimados), as quais so
equacionadas com suas esperanas matemticas, E(yP
t
y). As formas quadrticas equivalem s
somas de quadrados obtidas na correspondente anlise de varincia e E(yP
t
y) uma funo dos
parmetros
t
2
. Descries detalhadas so encontradas em Valrio Filho (1991), Searle et al.
(1992), Lopes et al. (1993), entre outros.
De posse dos valores paramtricos dos componentes de varincia (G e R) ou de
suas estimativas (
$
G e
$
R), passa-se, ento, aos problemas de estimar o vetor de efeitos
fixos (ou uma funo a ele associada) e de predizer o vetor de efeitos aleatrios (ou
tambm alguma funo de ). Ambos os problemas podem ser resolvidos, simul-
81
taneamente, atravs das chamadas equaes de modelo misto (EMM), propostas por
Henderson em 1948 (Littell et al., 1996; Henderson, 1984):

+

X R X X R Z
Z R X Z R Z G
X R y
Z R y
1 1
1 1 1
0 1
1
=

~
.
No se conhecendo as matrizes G e R, simplesmente substituem-nas por
$
G e
$
R.
Manipulaes de lgebra matricial levam, por conseguinte, s solues do sistema:


0 1 1
1 0 1 0
=
=


( ) ; e
( ) = ( )
X V X X V y
GZ V y X CV y X
~
em que: C=GZ a matriz de covarincias entre y e (covarincia entre observaes
fenotpicas e valores genotpicos verdadeiros).
A obteno das solues do sistema por meio destas expresses pode, entretanto,
ter um alto custo computacional, haja vista a dimenso nxn da matriz V a ser invertida. O
uso de uma inversa generalizada da matriz de coeficientes em EMM representa uma opo
de menor esforo computacional, uma vez que esta matriz tem dimenso (p+q)x(p+q),
inferior a nxn (McLean et al., 1991). Andr (1999) deduz por absoro e substituio nas
EMM, uma outra alternativa neste sentido.
notrio que, se G
-1
tende para a matriz nula (ex:
g
2
, no caso particular
G=I
g
2
), as EMM tendem para as equaes de GLS para estimar e , quando os
componentes de so considerados fixos (Robinson, 1991). Por outro lado, quando G
-1
domina as EMM (ex:
g
2
0, sob G=I
g
2
),
~
tende para zero. Nos casos intermedirios,
G
-1
opera reduzindo (shrinking, em ingls) a magnitude das estimativas de suposta-
mente fixo, at zero (SAS Institute, 1997).
Se G e R so conhecidas,
0
(ou, mais provavelmente, alguma funo estimvel
L
0
) chamado melhor estimador linear no viesado (BLUE - best linear unbiased
estimator) de (ou de L ), e
~
denominado melhor preditor linear no viesado
(BLUP - best linear unbiased predictor) de . O uso do termo preditor tem apenas o
propsito de distinguir estimadores de efeitos aleatrios daqueles de efeitos fixos
(Robinson, 1991). Porm, como j mencionado, G e R geralmente so desconhecidas,
82
dispondo-se apenas de estimativas obtidas por algum mtodo. Neste caso, os termos
BLUE e BLUP no mais se aplicam, sendo apropriado substitu-los por EBLUE (empirical
best linear unbiased estimator) e EBLUP (empirical best linear unbiased predictor),
respectivamente (SAS Institute, 1997; Littell et al., 1996). O termo emprico
adicionado, portanto, para indicar esse tipo de aproximao.
A correspondente matriz de varincias-covarincias dos parmetros, C

0
,
~
ou
$
,
~
C

0
, dada por:
C
X R X X R Z
Z R X Z R Z G

0
1 1
1 1 1 ,
~
=

+

ou
$
$ $
$ $ $
,
~
C
X R X X R Z
Z R X Z R Z G

0
1 1
1 1 1
=

+

.
Dado que os resultados de partio destas matrizes so gerais, conhecendo-se ou no as
matrizes paramtricas G e R, pode-se simplesmente escrever:
C
C C
C C

0
11 21
21 22
,
~
=

(
; com:
C X V X C GZ V XC
C Z R Z G C X V ZG
11
1
21
1
11
22
1 1 1
21
1
= =
= +



( ) ;
( )
; e

.
Note-se que C
11
a frmula familiar da matriz de varincias-covarincias de
0
,
soluo de quadrados mnimos generalizados. Assim, entre outras propriedades, tem-se
(Henderson, 1984; Searle et al., 1992):
Var (L
0
) = L C
11
L;
Var (
~
)= CV
-1
C-CV
-1
XC
11
XV
-1
C = G -C
22
; e
Var (L
0
+
~
) = Var (L
0
) + Var (
~
).
4. EXPLICITAO DO BLUP DE
Para entender as conseqncias da suposio de aleatoriedade dos efeitos de
tratamentos sobre suas estimativas de mdias necessrio primeiramente analisar o
preditor
~
. conveniente, portanto, derivar a expresso de componentes individuais do
vetor
~
, ou seja, de cada
~
g
i
, o BLUP de g
i
(i=1,2,...,a). Sem perda de generalidade,
omite-se, neste momento, o ndice j (de blocos), mantendo-se apenas i e r, relativos ao
tratamento e a sua repetio. Sob a estrutura de componentes de varincia, G=I
g
2
e
R=I
e
2
, tem-se
i=1
a
i
V B = (sendo: B J I
i g n e n
i i
= +
2 2
( ) ( )
; e
i=1
a
, a operao matricial soma
direta, isto , a obteno de uma matriz bloco diagonal com as a matrizes B
i
), logo:
83
~
~
~
~
$
$
$
$
$
$
=

(
(
(
(
=

(
(
(
(
(
(
(
(
(
(
(

g
g
g
Y Y
Y Y
Y Y
Y Y
Y Y
Y Y

1
2
a
11 11
12 12
1n 1n
21 21
22 22
an an
1 1
a a
M
M
M
CV
1
; com:
| |

n

1
=



g i e
g
i
n i n
e
i
i
a
1 = i
g n
a
1 = i
i i
i

+

=

=
=


2 2
2
2
1
1 1
2
1
) ( ) (
) (
J I B
B V
C
onde: 1
( ) ( ) ( ) n n n
i i i
, e I J so, respectivamente, um vetor linha de uns, uma matriz identidade
e uma matriz quadrada com todos os elementos iguais a um, todos de ordem n
i
.
Portanto, a matriz CV
-1
, de ordem axn, assume o formato:
CV

(
(
(
(
(
1
2
2
1 1 1
0 0 0
0 0 0
0 0 0
2 2 2
0 0 0
0 0 0
0 0 0




g
e
1 n
1
1 n
1
1 n
1
n
1
colunas
1 n
2
1 n
2
1 n
2
n
2
colunas
1 n
a a
1 n
a a
1 n
a a
n
a
colunas
L
L
M M M M
L
6 7 444444 8 444444
L
L
M M M M
L
6 7 4444444 8 4444444
L
L
M
L
L
L
M M M M
L
6 7 4444444 8 4444444
.
Por conseguinte, como ilustram Searle et al. (1992), o preditor do efeito
genotpico de um tratamento i, ou seja, o BLUP(g
i
), fica determinado por:
BLUP g = g
n
n
Y n Y .
i i
i g
e i g
i i i i
( )
~
( ) ( ) =
+
=



2
2 2
0 0
Isto resulta da multiplicao da i-sima linha de CV
-1
pelo vetor ( $ ) y y ou ( ) y X
0
:
g (1 n )(Y Y ) (1 n ) (Y Y ) (1 n
n
) (Y Y )
g (
n n
n
) (Y Y )
n
(Y Y ) (Y
i
g
e
i i
r=1
n
ir ir
g
e
i i ir ir
r=1
n
g
e
i
g
e i g
ir ir
r=1
n
i
g
e
e i g i g
e i g
ir ir
r=1
n
g
e i g
ir ir
r=1
n
i ir
i i i
i i
~
$ $ $
~
$ $
= = =
+

=
+
+
=
+
=






2
2
2
2
2
2
2
2 2
2
2
2 2 2
2 2
2
2 2
$ $
Y ) (Y Y ) .
ir i i. i.
r=1
n
i
=
(1)
Sabendo-se que:
i i i. i i i.
Y n Y Y n Y

e = = , tem-se, finalmente:
) ( ) ( )

(
~
0 0
2 2
2
i i
i i i i
g i e
g i
i i i i i
Y n Y
n
n
Y Y n g =
+

= = (2)
em que:
i
i
Y
0

= , representa a mdia dos valores ajustados (para os efeitos fixos) nas


parcelas que receberam o tratamento i, ou seja, a mdia ambiental esperada
naquelas parcelas.
84
Nos delineamentos em blocos,
0
i
representa a soma: (mdia geral) + (efeito mdio
dos blocos que receberam o tratamento i). Assim, reintroduzindo-se o ndice de blocos (j)
tem-se:

0
i
i
ij
0
j 1
b
ij j
0
j 1
b
i
i
0
ij j
0
j 1
b
0
i
ij j
0
j 1
b
0
0
i
=
1
n
n m n b
1
n
n m n b m
1
n
n b m b
= = = =
+
|
\

|
.
|
= +
|
\

|
.
|
= + = + ;
em que: m
0

e

b
j
0
(j=1,2,...,b) so os elementos do vetor soluo
0
; e b
0
i
denota o
efeito mdio dos blocos que receberam o tratamento i.
Desse modo, o preditor do valor genotpico do tratamento i, o BLUP(g
i
) ou
simplesmente
~
g
i
, pode ainda ser escrito como:

~
[ ( )] g
n
+n
Y m
1
n
n b = n Y m b
i
i g
2
e
2
i g
2 i
0
i
ij
j=1
b
j
0
i i i
0
0
i
= +
|
\

|
.
|

(
+


(3)
Este desenvolvimento mostra que o uso de uma constante
0
, comum para todo i,
como apresentam Searle et al. (1992, p. 271), no se aplica a todo tipo de situao e
delineamentos. Por isso, deu-se aqui preferncia notao
0
i
. Entretanto, Y
i
tambm
estima tudo isso ( m+b
i
) mais o efeito do tratamento (g
i
). Logo, a diferena ( Y
i
i

0
)
contm, realmente, s a informao relativa ao efeito aleatrio do tratamento i, ou seja, a
mdia de seus efeitos genotpicos estimados por parcela. tambm oportuno observar que
o termo n
i

i
equivalente herdabilidade de mdias de tratamentos ( h =
Y
2
n
i
g
2
g
2
e
2
i

+ /
),
conceito de ampla aplicao em gentica.
Sob o ponto de vista experimental, notria a importncia do uso de repeties e
casualizao para uma predio imparcial de g
i
atravs de
~
g
i
, ressaltando-se que isto
tambm fundamental no caso de modelos fixos e seus respectivos BLUEs. O raciocnio
terico a seguir procurar, ento, ilustrar a relevncia destes princpios experimentais.
Para contornar as dificuldades de um tratamento matemtico atravs de esperanas
condicionadas, considere-se apenas as observaes relacionadas a um dado gentipo i,
cujo valor genotpico tenha sido predito por uma das expresses de
~
g
i
(1, 2 ou 3). Para
simplificao, considere-se ainda um delineamento binrio, com n
ij
=0 ou n
ij
=1. Assim,
pode-se afirmar que, sob as condies da predio, o valor esperado para cada uma das
correspondentes unidades experimentais dado por: E(Y ) m b
ijr j
$
= + . Contudo, para esse
85
conjunto particular de dados (relativos ao gentipo i), g
i
uma constante, desconhecida,
mas no uma varivel aleatria. Logo, E(g
i
)=g
i
. Ademais, desconhecendo-se o nmero de
repeties e as regras de alocao dos tratamentos s parcelas, no se pode, ainda,
assumir: E(e
ijr
)=0; mas, sim: E(e
ijr
)=e
ijr
. Neste caso, reintroduzindo-se o ndice j (de
blocos) numa das expresses preliminares de
~
g
i
em (1), tem-se:
E(g ) E[ (Y Y )] = E(m+b + g +e Y
E(g ) (m+b + g +e m b ) (g +e = n g + e
i i ijr ijr
r=1
n
i j i ijr ijr
r=1
n
i i j i ijr j
r=1
n
i i ijr
r=1
n
i i i i ijr
r=1
n
i i
i i i
~
$ $
)
~
) .
=
= =


Observa-se que, sob n
i
muito baixo e na ausncia de casualizao, E(g )
i
~
carrega
um termo
i ijr r=1
n
e 0
i
. Isto prejudica a qualidade do preditor
~
g
i
que ter um vis no
sentido do efeito ambiental mdio incidente nas parcelas que receberam o gentipo i.
Todavia, sob casualizao e n
i
grande, pode-se assumir, tranqilamente, que e 0
ijr r=1
n
i
= e,
nestas condies,
~
g
i
resulta em predies no tendenciosas de g
i
. Isto porque, garantidas
as condies que tornam E(e
ijr
)=0, tem-se: E(g ) n g
i i i i
~
= ; e, sob n
i
grande, n 1
i i

(herdabilidade mxima), o que implica em: E(g g
i i
~
) . Neste caso, a informao dos
outros gentipos torna-se irrelevante para a predio do valor gentico do tratamento i
(suposio inerente modelagem fixa). Mas, considerando-se 0n
i

i
1, medida que a
herdabilidade diminui ( n 0
i i
), o valor absoluto de
~
g
i
reduz-se, proporcionalmente, no
sentido do valor esperado populacional, E(g
i
)=0. Isto revela o aumento da importncia do
relacionamento entre os gentipos, na predio do valor gentico de cada um.
Em sntese,
~
g
i
g
i
quando a herdabilidade tende para um, seno,
~
g
i
E(g
i
)
medida que a herdabilidade tende para zero. De fato, assumir E(g )
i
~
=g
i
somente
desejvel se o experimento der condies para tal, isto , se for capaz de fornecer
informaes individuais em nmero suficientemente grande ( h
Y
2
i
1). Seno, medida
que a informao individual diminui ( h
Y
2
i
0), prefervel predizer a performance de cada
gentipo atribuindo-se um peso crescente s informaes de seus parentes, ou seja, fica
cada vez mais seguro admitir E(g )
i
~
=E(g
i
). Assumir E(g )
i
~
=g
i
(suposio do modelo fixo),
nestes casos, implica num risco crescente de
~
g
i
produzir estimativas muito pobres do
verdadeiro efeito genotpico. Enfim, a abordagem de modelos mistos usufrui da
flexibilidade de ponderar a informao individual, em detrimento daquela dos gentipos
86
aparentados, conforme a repetibilidade associada primeira (Piepho, 1994). J a
metodologia de modelos fixos (OLS) no dispe desta prudncia.
5. O EFEITO SHRINKAGE NAS MDIAS BLUP
Antes de analisar a influncia da suposio dos efeitos de tratamentos sobre a
estimao ou predio das mdias genotpicas, convm introduzir o conceito de mdias
BLUP. Como o vetor contm apenas os desvios genotpicos associados aos tratamentos,
para predizer, por exemplo, a resposta fenotpica de um gentipo i num bloco (ambiente) j
necessrio construir uma funo linear de parmetros fixos e aleatrios:
~ ~
~
( )
~
y X Z = Y m b g
ij
0
j
0
i

0
+ = + + . Tal expresso representa a soma: (valor mdio do
ambiente particular j) + (efeito do gentipo i). Contudo, se o pesquisador estiver
interessado no apenas na informao dos efeitos genotpicos
~
g
i

(suficientes para o
ordenamento e a seleo de gentipos), nem em predies de parcelas individuais (
~
Y
ij
),
mas na resposta mdia de cada gentipo, a expresso anterior tambm no responder ao
seu questionamento.
A nova funo deve levar em conta, no o efeito individual de bloco, mas, o efeito
mdio de blocos, assumido comum para todos os gentipos sob comparao. Isto
corresponde s chamadas mdias de tratamentos ajustadas para os efeitos fixos do
modelo. A expresso que atende a esse interesse aqui denominada BLUP(
P
+g
i
) ou
mdias genotpicas BLUP, sendo dada por:
~
( )
~
Y m b g
i
0 0
i
= + + . Esta, sim, determina o
ajuste das mdias de cada tratamento para um mesmo referencial, a constante ( m b
0 0
+ ).
Computacionalmente, este termo da expresso obtido construindo-se uma funo linear
dos efeitos fixos, L , comum para todos os tratamentos. A matriz L
[ax(1+b)]
pode ter suas
linhas todas iguais a: [1 k
1
/n k
2
/n ... k
b
/n], o que gera uma mdia ponderada dos efeitos
de blocos pelos seus respectivos tamanhos, b
0
, qual adicionada a constante m
0
.
Acrescentando-se o preditor
~
g
i
tem-se, ento, a mdia de interesse.
Searle et al. (1992) trata do problema de estimar ou predizer uma funo
linear do tipo: w L = + . Os autores comentam que, para L estimvel,
~
( ) w L CV y X = +


0 1 0
tem propriedades de melhor preditor linear no viesado (erro
mdio quadrtico mnimo, linearidade em relao a y e no tendenciosidade), sendo, por
87
isso, chamado de BLUP(w):
~ ~
w L = +
0
. No presente caso, tem-se: BLUP(w)=
BLUP + g + g m b g
i i
0 0
i
( )
$
~
( )
~

P P
= = + + , o que corresponde mdia BLUP do
gentipo i. Littell et al. (1996) ilustram o tratamento desse tipo de problema atravs do
sistema SAS. Os autores referem-se a tais combinaes lineares como funes predizveis,
para diferenci-las das funes estimveis que combinam apenas efeitos fixos.
Definido o significado das mdias BLUP, reconsidere-se agora a expresso de
~
g
i
.
O termo n
i

i
(a herdabilidade de mdias) representa um peso aplicado ao mais simples
estimador de g
i
, o desvio ( Y
i
i

0
). Vale esclarecer que, se o componente
g
2
no puder
ser isolado, este ponderador embora presente em expresses do BLUP(g
i
) no deve ser
referido como herdabilidade, mas como repetibilidade do efeito genotpico estimado
(Piepho, 1994). Mas, no presente caso, n
i

i
de fato uma funo da varincia gentica na
populao da qual os tratamentos foram amostrados (
g
2
), da varincia ambiental
influenciando a resposta do carter (
e
2
) e do nmero de repeties do tratamento i (n
i
).
Assim, a questo de interesse imediato avaliar a sua influncia sobre o desvio
genotpico mdio ( Y
i
i

0
).
Fazendo-se
g
=
g
2
/
e
2
, relao que reflete a herdabilidade em nvel de indivduos
ou parcelas ( h =
Y
2
1
ij
g
2
e
2
g
2
g
g

+
+
= ), tem-se:
n
n
n
n
n
n
1 n
n
1 n
i i
i g
e i g
i g e
e i g e
e i g
e i g
i g
i g

=
+
=
+
=
+
=
+
2
2 2
2
2 2
2
2
( )
.
Numa situao de variabilidade gentica muito superior ambiental ( h
Y
2
ij
de valor
bastante elevado), tem-se:
g
e n
i

i
1. Isto significa que a diferena ( Y
i
i

0
)
reflete, integralmente, o valor genotpico do tratamento i em relao mdia
P
da
populao, estimada por:
$

P
= m b
0 0
+ . Nesta situao, a resposta mdia esperada de um
gentipo i, o BLUP + g
i
( )
P
, tende para:
$
( )
P
+ Y
i
i
0
. Em blocos completos
balanceados,
0
i
=
0
=
P
; ento, sob n
i

i
1, o BLUP + g
i
( )
P
se reduz a Y
i
. Neste
caso, as respostas genotpicas obtidas pelo preditor BLUP + g
i
( )
P
dispersam ao mximo
88
entre si, igualmente s respectivas mdias marginais simples no ajustadas
( Y Y / n
i ij k=1
n
i
i
= ).
Por outro lado, quando essa relao de varincias for muito baixa (
g
0), o
referido peso tambm diminui (n
i


0) e a diferena ( Y
i
i

0
) pouco ou nada informar
sobre o valor genotpico individual do tratamento i. Seja porque os tratamentos no
diferem substancialmente entre si (
g
2
0), seja por erro experimental muito elevado
(
e
2
). Neste caso, a resposta mdia esperada de um gentipo i, o BLUP + g
i
( )
P
,
tende para
$

P
, pois,
~
g
i
0. Ou seja, todos os tratamentos tero respostas preditas
idnticas (
$

P
). Desse modo, variaes fenotpicas observadas entre gentipos no so
mais do que flutuaes errticas em torno da mdia populacional
P
; pois, suas
propriedades genticas individuais no so significativamente importantes ou, pelo
menos, no puderam ser discriminadas pelo experimento em questo.
Sob tais circunstncias, no haver disperso alguma entre as respostas
genotpicas mdias preditas. Com efeito, no seria coerente qualquer variao entre estas
numa situao de ausncia de variabilidade gentica. Portanto, a abordagem de modelos
mistos mostra-se coerente com a realidade e, por isso, tida como conceitualmente mais
completa (Resende et al., 1996a; Bueno Filho, 1997).
Na maioria das situaes prticas, entretanto, n
i

i
ser um nmero entre zero e um,
implicando num aproveitamento parcial da informao contida no desvio ( Y
i
i

0
).
Quanto mais esse nmero aproxima-se de um (
g
e/ou n
i
elevados) maior ser este
aproveitamento, haja vista o aumento da herdabilidade associada estimativa ( Y
i
i

0
),
ou seja, da confiabilidade de sua informao genotpica. Pode-se concluir, portanto, que
uma reduo na varincia gentica em relao varincia ambiental implica num
estreitamento da disperso das respostas genotpicas mdias preditas (Figura 2.1),
podendo-se chegar ao limite terico de se igualarem quando
g
=0.
Trata-se do chamado efeito shrinkage, relatado na literatura de modelos lineares
mistos, que nada mais do que o encolhimento da distribuio das mdias ajustadas de
tratamentos, em torno da mdia geral, quando se passa de uma anlise assumindo-os como
de efeitos fixos para outra em que tais efeitos so tidos como aleatrios (Figura 2.1).
89
Quanto menor a repetibilidade, maior ser o efeito shrinkage, o qual tido como uma
propriedade desejvel do BLUP, haja vista que o efeito notadamente forte sobre as
mdias Y
i
extremas (Piepho, 1994; SAS Institute, 1996). Em razo disso, o BLUP
tambm denominado estimador shrinkage (Stroup & Mulitze, 1991).
Figura 2.1. Efeito shrinkage sobre mdias ajustadas intrablocos (MAJ_FIXO) em relao s mdias
ajustadas sob recuperao da informao intergenotpica (MAJ_BLUP). Os nmeros (1001 a
1010) identificam os gentipos, num ensaio simulado de blocos completos casualizados com:
=10; b
j
~N(0,S
b
2
=0,20); g
i
~N(0,
g
2
=0,25); e e
ijr
~N(0,
e
2
=2,00).
Segundo Duchateau & Janssen (1997), em sntese, o BLUP representa uma
contrao da diferena ( Y
i
). De forma que, se o componente de varincia genotpico
for bem maior do que o ambiental (
g
2
>>
e
2
), o preditor
~
g
i
ser muito prximo de
( Y
i
). Isto significa que a informao dos outros gentipos no muito til para se
fazer predies acerca do gentipo i. Mas, se
g
2
<<
e
2
, o preditor encolher no sentido
do valor esperado populacional (zero). Alm disso, quanto maior o nmero de repeties
(n
i
), mais o valor ( Y
i
) ser considerado na predio individual.
Nota-se, portanto, que a abordagem BLUP consistente com a intuio dos
melhoristas de se suspeitar de um novo gentipo cujas respostas, em poucas repeties,
tm mdia excepcionalmente alta ou baixa em relao aos demais (Hill & Rosenberger,
1985). Isto pois, a soluo BLUP leva em conta a informao de que os efeitos g
i
tm
menor variao do que as respostas dentro de cada gentipo i (Robinson, 1991). Resta
90
ainda avaliar uma possvel mudana na ordenao das mdias de tratamentos, quando se
passa de uma situao de anlise para a outra, o que ser considerado mais adiante.
6. ORDENAMENTO COMPARATIVO DAS MDIAS BLUP
De posse dos conhecimentos acerca da predio de mdias genotpicas, pode-se
agora analisar o seu ordenamento em relao ao das mdias ajustadas por um modelo
fixo. Como
P
comum a todos os tratamentos (amostrados de uma mesma populao), a
ordenao de suas mdias preditas fica determinada, como j referido, apenas pela de

~
g
i
,
ou seja: ranking[BLUP(
P
+g
i
)]=ranking[(
~
g
i
)]. Por isso, para fins de seleo de gentipos
(tratamentos), em geral, dispensa-se a obteno das respostas mdias preditas de cada
tratamento. Em alguns estudos, todavia, o resultado destas mdias pode ser de interesse.
Da expresso de

~
g
i

pode-se tambm escrever: BLUP(
P
+g
i
)=
$
( )
P
+ n Y
i i i
i

0
.
Assim, dado que numa situao de blocos completos balanceados
0
i

comum para todo
i (i=1,2,...,a) e, inclusive, igual a
$

P
, tem-se: ranking ( ) Y
i
i

0
=ranking( Y
i
). Ademais,
sob balanceamento, o peso n
i

i
tambm comum para todo i (n), implicando em:
ranking(
~
g
i
)=ranking( Y
i
). E, se a varincia gentica for bastante elevada (
g
e
n1), tem-se ainda o resultado j obtido: BLUP(
P
+g
i
)= Y
i
. Por outro lado, se
n afasta-se de um (logicamente no sentido de zero) esta ltima igualdade no mais se
verifica, embora a dos ordenamentos ainda permanea, com a peculiaridade do efeito
shrinkage das mdias BLUP(
P
+g
i
) em relao s mdias Y
i
. Pois, medida que n tende
para zero, a amplitude de variao de nY
i
(termo determinante do ordenamento) reduz-se
sensivelmente. Ademais, a constante
$

P
passa a ser multiplicada por (1n), de valor
tambm inferior unidade. Logo: ranking[BLUP(
P
+g
i
)]=ranking(
~
g
i
)=ranking( Y
i
). Isto
significa que, no caso de blocos completos balanceados, uma seleo baseada em mdias
marginais ( Y
i
) levar reteno e descarte dos mesmos gentipos que uma seleo
baseada em BLUP(
P
+g
i
), ou simplesmente em
~
g
i
(Figura 2.1).
Resta, portanto, a questo de maior interesse prtico relacionada ao processo de
seleo de tratamentos: Existem ou no diferenas entre os ordenamentos de mdias
91
produzidas pela abordagem de modelo misto e por uma anlise convencional intrablocos
(modelo fixo)? A resposta sim. Em blocos incompletos, balanceados ou no,

0
i

no
mais comum para todo i e os ajustes para os efeitos de blocos podem fazer com que os
ordenamentos dos gentipos por
~
g
i

e Y
i

no sejam os mesmos. Ressalta-se que a condio
de desbalanceamento, por si s (em qualquer delineamento), j suficiente para no mais
garantir a concordncia perfeita desses dois tipos de seleo; sobretudo, se os tratamentos
diferirem muito em nmeros de repeties. A razo pela qual o nvel de
desbalanceamento interfere nas mdias preditas e no seu ordenamento pode ser buscada
diretamente na expresso do preditor
~
g
i
, e ser discutida mais adiante.
Ratificando o que fora tratado em pargrafos anteriores, pode-se dizer ainda que,
independentemente do desenho experimental, do grau de desbalanceamento e dos nmeros
de repeties, quando
g
e n
i

i
=1, tem-se:
~
g
i
=1. ( ) Y
i
i

0
=
0
i
; em que
0
i
a soluo
do sistema de equaes normais reduzidas da anlise intrablocos, sob n
i

0
i
=0. Em razo
disso, as mdias preditas da anlise de modelo misto, BLUP(
P
+g
i
), sero iguais s
mdias ajustadas pela anlise intrablocos ( Y
i( ./ ) ajust fixo
). Mas, medida que se afasta dessa
condio limite (
g
e n
i

i
=1), a igualdade entre
~
g
i
e
0
i
, bem como entre as mdias
correspondentes, no mais se verifica.
Embora a relao
g
deva atingir a ordem dos milhares (
g
) para uma
igualdade quase absoluta das mdias BLUP(
P
+g
i
) e Y
i( ./ ) ajust fixo
, a ordenao das mdias
pelas duas abordagens pode permanecer idntica, mesmo sob relaes bem menores. Na
prtica, valores de
g
na casa das centenas, em geral, garantem coincidncia absoluta das
classificaes. E, uma concordncia razovel j conseguida com valores de
g
na casa
das dezenas, o que resulta tambm em selees muito similares (no obrigatoriamente
idnticas) pelos dois procedimentos.
Deve-se ressaltar que a relao
g
no interfere somente no valor de
i
, mas tambm no de
( ) Y
i
i

0
, pois
0
i
advm de X
0
e
0 1 1
=

( ) X V X X V y . Isto , na abordagem de
modelos mistos, a soluo para efeitos fixos tambm leva em conta a estrutura de varincias e
covarincias das observaes. Ademais, esta influncia vai alm da estimao pontual, interferindo
92
tambm nos testes de hipteses relacionados aos efeitos fixos, o que justifica sempre uma cuidadosa
especificao da estrutura de erros (Littell et al., 1996; Duchateau & Janssen, 1997).
Diante disso, o costumeiro uso de anlises fundamentadas na suposio de
tratamentos fixos (ex: anlise intrablocos) para fins de seleo de gentipos, quando, na
realidade, eles forem aleatrios, desperta especial preocupao se a relao
g
for baixa.
E, sem dvida, esse o caso de boa parte dos ensaios de avaliao de gentipos em
programas de seleo de espcies j bastante melhoradas como a soja, ou seja, com baixa
variabilidade gentica. verdade que, nas fases preliminares do processo, a varincia
gentica pode ser consideravelmente alta. Em contrapartida, nestas etapas, os erros
experimentais, em geral, so elevados (grande nmero de tratamentos e pequeno nmero
de repeties), implicando em baixos valores de
g
. Nestes casos, o nmero de repeties
(n
i
) e o grau de desbalanceamento voltam a ter influncia decisiva na ordenao dos
gentipos pela abordagem aqui apresentada (modelo misto com tratamentos aleatrios).
Isto porque, sob desbalanceamento, n
i

i
pondera diferentemente o valor do desvio
( ) Y
i
i

0
de cada gentipo, o que pode resultar em ordenaes distintas dos tratamentos
pelas mdias BLUP(
P
+g
i
) e Y
i( ./ ) ajust fixo
(ou por
~
g
i
e

0
i
, respectivamente).
oportuno, ento, reconsiderar a influncia do peso n
i

i
sobre o desvio ( ) Y
i
i

0
e, conseqentemente, sobre
~
g
i
, diante de variaes em n
i
e
g
. Diante do que foi exposto,
pode-se estender ainda:
n
n
n
n
1 n
h
n h
1 n 1 h

i i
i g
e i g
i g
i g
g
g n
Y
2
i Y
i Y i
i
ij
ij

=
+
=
+
=
+
=
+
2
2 2
1
2
2
( )
Atribuindo-se valores seqenciais relao
g
possvel construir funes
diferentes para cada nmero de repetio n
i
(grupo de tratamentos com n
i
comum). A
Figura 2.2 ilustra esse tipo de relacionamento.
Observa-se que, para n
i
4, os pesos n
i

i
se aproximam rapidamente da unidade,
mesmo com
g
ainda diminutos (
g
2
/
e
2
1); isto , ainda que a herdabilidade seja baixa.
Contudo, para n
i
=1 ou n
i
=2, esses pesos aproximam-se de um de forma bem mais lenta,
ou seja, somente para os valores mais altos de
g
(situaes de herdabilidade mais
elevada). Assim, se o ensaio apresentar uma grande amplitude de desbalanceamento, sob
93
herdabilidade baixa, o peso atribudo ao desvio ( ) Y
i
i

0
poder diferir bastante entre os
tratamentos. Para ilustrar tal situao considere-se, por exemplo, um ensaio hipottico com dois
grupos de tratamentos, o primeiro com n
i
=2 e o outro com n
i
=20 repeties. Sob
g
=0,20
(baixa herdabilidade em nvel de indivduos), o peso atribudo a ( ) Y
i
i

0
no primeiro
grupo ser to baixo como 0,2857, enquanto no segundo ser igual a 0,80 (Figura 2.2).
Isto significa tambm que, para o primeiro grupo, a herdabilidade de observaes
individuais ( h
Y
2
ij
=0,1667) ser menos que duplicada para produzir a herdabilidade de
mdias ( h
Y
2
i
), j para o segundo, o valor de h
Y
2
i
ser quase cinco vezes o de h
Y
2
ij
.
Figura 2.2. Relao entre
g
(=
g
2
/
e
2
) e o peso n
i

i
(=
g
/[
g
+1/n
i
]) na expresso do preditor

~
g
i
, para
grupos de tratamentos com diferentes nmeros de repeties (n
i
).
O fato mencionado tem implicao direta no valor de BLUP(
P
+g
i
), pois as mdias
do primeiro grupo de tratamentos tero maior probabilidade de se concentrarem em torno
de
P
(no diferirem entre si e de
P
) do que as do segundo. Essa situao tpica dos
experimentos em blocos aumentados. Neles as testemunhas so grandemente repetidas,
enquanto as prognies (tratamentos novos), via de regra, so aplicadas a uma nica
parcela. Isso pode determinar uma forte convergncia das mdias preditas de prognies
em torno da mdia geral da populao de origem (
P
). A menos que
g
assuma, no
mnimo, um valor igual a 4 (herdabilidade alta), o que determina um peso n
i

i
= h
Y
2
i
= h
Y
2
ij
superior a 0,80 (linha correspondente a n
i
=1, na Figura 2.2).
0
0,2
0,4
0,6
0,8
1
1,2
0 1 2 3 4 5 6 7 8 9 10
g
n
i

i
ni=1
ni=2
ni=3
ni=4
ni=6
ni=8
ni=12
ni=20
94
verdade que, nesses ensaios, as testemunhas normalmente no so tidas como
parte da mesma populao, mas, como tratamentos de efeitos fixos. Entretanto, em alguns
programas de seleo, os cultivares parentais que constituem essa categoria de
tratamentos, as testemunhas (Azevedo Filho et al., 1998). Logo, a preocupao
procedente. Nestes casos, a classificao das prognies em relao s testemunhas pode
ser extremamente modificada ao se passar de uma anlise que admite o modelo como fixo
para outra que o faz como aleatrio ou misto (com prognies aleatrias). Isto pode
agravar-se quando as testemunhas forem assumidas como fixas, ou seja, representarem
outras tantas populaes (assunto que ser tratado na prxima seo). O posicionamento
relativo das prognies entre si (intrapopulacionais) no deve sofrer alteraes do mesmo
nvel, haja vista possurem nmero de repeties similares (n
i
=1, 2 ou 3) e
compartilharem um mesmo valor de
g
.
7. DUAS OUTRAS VARIAES NO MODELO
Com base no desenvolvimento terico apresentado procurar-se- estender algumas
constataes anteriores, sem demonstraes, a duas outras variaes no modelo estudado.
Na primeira, os efeitos de blocos sero admitidos como aleatrios ao lado dos de
tratamentos (modelo aleatrio). Na outra, os tratamentos (de efeitos aleatrios), so
supostamente oriundos de vrias populaes, cada uma com propriedades especficas em
termos de mdia e varincia (ex: gentipos em estrutura de famlias).
7.1. Modelo com blocos aleatrios
A suposio de aleatoriedade para os efeitos de blocos e de tratamentos, num
delineamento em blocos, corresponde adoo de um modelo de anlise com recuperao
das informaes interblocos e intertratamentos (Federer & Wolfinger, 1996; Federer,
1998). Neste caso, apesar da modificao na estrutura da matriz V, o termo
0
i
da
expresso do BLUP(g
i
) torna-se comum a todos os tratamentos (
0
i
=
$ $
p
= m), haja vista
um nico efeito fixo no modelo, a constante m. Logo, uma possvel modificao na ordem
de
~
g
i
, em relao de Y
i
, dependeria somente dos efeitos diferenciados de anlogos de
n
i

i
(componentes de CV
-1
), pois: ranking( Y
i
)=ranking ( $ ) Y m
i
. Sob pequena variao
entre blocos, condio para o uso eficiente da informao interblocos (Malheiros, 1982;
95
Kempton et al., 1994), tais efeitos aproximam-se de n
i

i
, podendo ser avaliados
diretamente na Figura 2.2.
Inspecionando-se os valores que geram a Figura 2.2 (aqui no apresentados),
observa-se que a maior diferenciao de pesos n
i

i
entre as classes de tratamentos ocorre,
aproximadamente, no intervalo 0,25<
g
<0,75 (ou 0,2< h
Y
2
ij
<0,4); o qual corresponde
regio de maior distanciamento entre as linhas, na Figura 2.2. Por exemplo, entre os
grupos com n
i
=1 e n
i
=2, a maior diferena (distncia) ocorre em
g
=0,70; entre os grupos
com n
i
=1 e n
i
=4, ocorre em
g
=0,50; e entre os grupos com n
i
=1 e n
i
=12, em
g
=0,28.
Portanto, num experimento com n
i
=1 e n
i
=4 (ex: teste de prognies em blocos
aumentados), a maior diferenciao possvel entre as classificaes dos tratamentos, por
BLUP(
P
+g
i
) e por Y
i
, esperada quando
g
0,50. E, quanto maior a amplitude de
desbalanceamento, maior ser a probabilidade de as duas classificaes diferirem. O
resultado indica, portanto, que a recuperao da informao intergenotpica, nesse tipo de
experimento, exerce maior influncia no ordenamento dos gentipos quando a
herdabilidade de observaes individuais situar-se em torno 0,30. Logicamente este valor
difere de uma situao experimental para a outra, mas, o intervalo anteriormente
mencionado serve como uma referncia sob baixa varincia de blocos (
b
2
).
sabido que, nos delineamentos em blocos incompletos (BIB e PBIB), a alta
eficincia da anlise com recuperao da informao interblocos requer uma relao

b
2
/
e
2
<1/k (onde k o tamanho dos blocos). Ou ainda, um valor de r<2, sendo:
r=1+k
b
e
b
=
b
2
/
e
2
(Malheiros, 1982). Analogamente, os resultados anteriores sugerem
que a eficincia do uso da informao intertratamentos exige relaes
g
inferiores ao
inverso do nmero de repeties, o que implica, obrigatoriamente, em
g
<1. Logo, esta
informao especialmente importante quando a discriminao dos tratamentos torna-se
dificultada pela baixa variabilidade gentica (pequenos valores de
g
). Com efeito, se

g
>4 at mesmo tratamentos no repetidos (n
i
=1) apresentam pesos n
i

i
>0,80 (Figura
2.2), o que implica numa grande concordncia das diferentes estratgias de anlise aqui
confrontadas. Esse fato aponta, mais uma vez, para os ensaios preliminares dos programas
de melhoramento de espcies com uma longa histria de seleo artificial, j bastante
melhoradas e com pequena varincia genotpica.
96
necessrio esclarecer que a recuperao da informao interblocos, embora
possa determinar trocas nas posies relativas das mdias dos tratamentos (em relao s
abordagens de mdias marginais ou de anlise intrablocos), no responsvel por
shrinkage no conjunto das mdias. Assim, uma possvel maior concentrao das mdias
de tratamentos obtidas a partir do modelo aleatrio (mdias BLUP), decorre do uso da
informao intertratamentos.
7.2. Modelo com tratamentos de diferentes populaes
Outro questionamento natural que surge ao se discutir o problema da ordenao
das mdias de tratamentos pelas abordagens de modelo fixo e de modelos mistos : Como
fica o ordenamento comparativo para um conjunto de tratamentos que so oriundos de
diversas populaes? Nos ensaios de melhoramento gentico, os tratamentos podem
representar diferentes linhagens ou prognies (gentipos) e as populaes suas diferentes
procedncias, cruzamentos ou famlias. A anlise de modelo misto aqui considerada,
assume os efeitos de blocos e de populaes como fixos e os efeitos de gentipos dentro
de populaes como aleatrios. Corresponde, portanto, a um modelo de delineamento em
blocos com tratamentos hierarquizados em populaes.
Dado que somente a abordagem de modelo misto utiliza a informao relativa s
variabilidades genotpicas das populaes, possvel surgir classificaes bastante
distintas pelos dois enfoques. Conforme j constatado, de se esperar que as mdias de
prognies relacionadas a populaes de baixa variabilidade genotpica apresentem valores
prximos (shrinkage). Isto representa um mecanismo de agrupamento das estimativas de
mdias do qual a anlise intrablocos no pode usufruir, haja vista no levar em conta a
informao intergenotpica (Figura 2.3).
Este afunilamento das mdias preditas quando se compara os dois enfoques,
sobretudo para as populaes de baixa variabilidade genotpica (ex: populao P2, na
Figura 2.3), pode determinar a troca de posicionamento relativo entre prognies de
populaes distintas, mesmo na presena de ortogonalidade e balanceamento. E, nas
situaes usuais de blocos incompletos, sujeitos a desbalanceamentos planejados ou no,
esperam-se, inclusive, mudanas de classificaes dentro da mesma populao, o que
pode, conseqentemente, ter um forte impacto na seleo.
Finalmente, ainda se poderia perguntar: O uso dessa abordagem de modelos mistos
no dificultaria a deteco dos chamados segregantes transgressivos, uma vez que h uma
97
tendncia dos
~
g
i
s convergirem para o valor esperado populacional? A resposta no.
Primeiramente, porque, se as exigncias da modelagem fixa forem satisfeitas, a de
modelos mistos produz resultados equivalentes; mas, se no o forem, esta ltima reduz a
chance de apontar gentipos comuns como transgressivos. Ademais, nesse tipo de
abordagem no se pode ignorar a seleo intrapopulacional, concebida pela prpria
estrutura hierrquica do modelo. Os gentipos segregantes transgressivos caracterizam-se
por valores de
~
g
i
discrepantes em relao aos demais gentipos relacionados (da mesma
populao), podendo ser facilmente identificados. O melhorista deve, portanto, estar
atento a este fato, praticando seleo entre e dentro das populaes. Caso contrrio, no
estar explorando adequadamente os recursos da modelagem estatstica menos restritiva.
Figura 2.3. Ordenamento de mdias ajustadas intrablocos (MAJ_FIXO) em relao s mdias ajustadas
sob recuperao da informao intergenotpica (MAJ_BLUP), para um conjunto de
tratamentos oriundos de trs populaes (P1, P2 e P3). Dados simulados para um ensaio em
blocos ao acaso sob: =10; b
j
~N(0,S
b
2
=0,2); e
ijr
~N(0,
e
2
=2,0); e g
i
~N(1,
g
2
=0,15) se i
P1; g
i
~N(2,
g
2
=0,05) se i P2; e g
i
~N(3,
g
2
=0,2) se i P3.
8. CONCLUSES
A anlise terica desenvolvida neste artigo permite constatar que a abordagem de
modelos mistos com tratamentos aleatrios, em geral, produz mdias mais uniformes para
os tratamentos do que a anlise intrablocos e do que o mtodo de mdias marginais
simples. Alm disso, a metodologia de modelos lineares mistos dever produzir selees
notadamente diferentes em relao s anlises tradicionais (mdias marginais e anlise
98
intrablocos), quando a variabilidade gentica relativa (
g
2
/
e
2
) for baixa e, sobretudo, nos
experimentos no ortogonais e desbalanceados. Portanto, um equvoco admitir que na
anlise de um modelo com um fator aleatrio, ao invs de fixo, apenas os componentes de
varincia (esperanas de quadrados mdios) e os teste F podem se alterar.
Pde-se verificar tambm que, se os tratamentos forem oriundos de populaes diferentes, o
fato de a predio BLUP levar em conta as varincias genotpicas especficas de cada populao,
pode determinar diferentes classificaes dos tratamentos em relao a uma anlise intrablocos,
mesmo sob ortogonalidade e balanceamento. Tais constataes reforam a preocupao acerca dos
problemas de especificao dos modelos de anlise estatstica, na rea do melhoramento vegetal.