Você está na página 1de 96

MODELOS LINEARES MISTOS: ESTRUTURAS DE

MATRIZES DE VARINCIAS E COVARINCIAS E


SELEO DE MODELOS

JOMAR ANTONIO CAMARINHA FILHO

Tese apresentada Escola Superior de Agricultura


Luiz de Queiroz, Universidade de So Paulo, para
obteno do ttulo de Doutor em Agronomia, rea de
Concentrao:
Agronmica.

PIRACICABA
Estado de So Paulo - Brasil
Agosto - 2002

Estatstica

Experimentao

MODELOS LINEARES MISTOS: ESTRUTURAS DE


MATRIZES DE VARINCIAS E COVARINCIAS E
SELEO DE MODELOS

JOMAR ANTONIO CAMARINHA FILHO


Engenheiro Agrnomo

Orientador: Prof. Dr. DCIO BARBIN

Tese apresentada Escola Superior de Agricultura


Luiz de Queiroz, Universidade de So Paulo, para
obteno do ttulo de Doutor em Agronomia, rea de
Concentrao:
Agronmica.

PIRACICABA
Estado de So Paulo - Brasil
Agosto - 2002

Estatstica

Experimentao

Dados Internacionais de Catalogao na Publicao (CIP)


DIVISO DE BIBLIOTECA E DOCUMENTAO - ESALQ/USP

Camarinha Filho, Jomar Antonio


Modelos lineares mistos: estruturas de matrizes de varincias e
covarincias e seleo de modelos / Jomar Antonio Camarinha Filho. - Piracicaba, 2002.
85 p.
Tese (doutorado) - Escola Superior de Agricultura Luiz de Queiroz, 2002.
Bibliografia.
1. Anlise de varincia 2. Estatstica aplicada 3. Modelos lineares
4.Verossimilhana I. Ttulo
CDD 511.8

Permitida a cpia total ou parcial deste documento, desde que citada a fonte O autor

s minhas mulheres:
Lectcia,
urea,
Adriana e
Carolina.
Dedico.

AGRADECIMENTOS
Universidade Federal do Paran, particularmente Pr-Reitoria de Pesquisa e PsGraduao / PICDT-CAPES, pela oportunidade desta qualificao.
Escola Superior de Agricultura Luiz de Queiroz da Universidade de So Paulo, pelo
total apoio institucional.
Aos professores do Departamento de Estatstica da Universidade Federal do Paran, pela
amizade e por assumirem minhas tarefas junto ao Departamento, possibilitando meu
afastamento.
Ao professor Dr. Dcio Barbin, pela orientao e pelos sempre sbios conselhos.
Aos professores Doutores Joo Riboldi, Antonio Augusto Franco Garcia e Andr Jalles
Monteiro, pelo estmulo e auxlio.
Aos professores Doutores Clarice Garcia Borges Demtrio, Dcio Barbin, Antonio
Francisco Iemma e Roberto Simionato Moraes, serei sempre grato.
Aos professores do Departamento de Cincias Exatas da ESALQ/USP, pela contribuio
minha formao.
Aos funcionrios do Departamento de Cincias Exatas da ESALQ/USP, Rosa, Solange,
Luciane, Robinson e Jorge, pelo atendimento sempre diligente e carregado de
carinho.
bibliotecria Eliana Maria Garcia Sabino, pela reviso das normas.
Aos amigos da minha turma de doutorado, Cristina, Suely, Andr, Heyder e Silvano,
pela troca de experincias e, sobretudo, pela possibilidade de me proporcionar
momentos de grande felicidade.
Enfim, em especial, agradeo a minha esposa Adriana, pelo amor e compreenso e,
principalmente, por me presentear com o meu maior estmulo, minha filha Carolina,
tornando, assim, esta caminhada muito mais prazerosa.

SUMRIO
Pgina
LISTA DE TABELAS.................................................................................................... vi
RESUMO....................................................................................................................... vii
SUMMARY................................................................................................................... ix
1 INTRODUO..............................................................................................................1
2 REVISO DE LITERATURA ..................................................................................... 3
2.1 Introduo e Definies...............................................................................................3
2.2 Estimao e Modelagem.............................................................................................6
2.3 Processos Iterativos....................................................................................................24
2.4 Estruturas de Covarincias.........................................................................................28
2.5 Seleo do Modelo e Testes.......................................................................................32
3 MATERIAL E MTODOS........................................................................................ 36
3.1 Material..................................................................................................................... 36
3.2 Mtodos.................................................................................................................... 38
4 RESULTADOS E DISCUSSO................................................................................. 41
5 CONCLUSES........................................................................................................... 48
ANEXOS........................................................................................................................ 50
REFERNCIAS BIBLIOGRFICAS............................................................................ 81

LISTA DE TABELAS
Pgina
1 Algumas estruturas da matriz de varincias e covarincias definidas no SAS....................... 29
2 Irrigao por asperso Line-Source. Dados referentes produtividade de trs cultivares de
trigo de inverno. Exemplo A................................................................................................. 36
3 Irrigao por asperso Line-Source. Dados referentes distribuio das observaes dos
trs cultivares de trigo de inverno. Exemplo B...................................................................... 37
4 Modelos Especficos conforme a Estrutura de Varincia e Covarincia (Exemplo A).......... 39
5 Modelos Especficos conforme a Estrutura de Varincia e Covarincia (Exemplo B).......... 40
6 Esquema Geral da Anlise de Varincia................................................................................. 40
7 Testes da Razo de Verossimilhana Restrita, Critrio de Akaike e Teste para os Efeitos Fixos
para os Modelos do Exemplo A, sem a interao tripla........................................................ 42
8 Testes da Razo de Verossimilhana Restrita, Critrio de Akaike e Teste para os Efeitos Fixos
para os Modelos do Exemplo B, sem a interao tripla.......................................................

46

MODELOS LINEARES MISTOS: ESTRUTURAS DE MATRIZES DE


VARINCIAS E COVARINCIAS E SELEO DE MODELOS
Autor: JOMAR ANTONIO CAMARINHA FILHO
Orientador: Prof. Dr. DCIO BARBIN

RESUMO
muito comum encontrar nas reas agronmica e biolgica experimentos cujas
observaes so correlacionadas. Porm, tais correlaes, em tese, podem estar
associadas s parcelas ou s subparcelas, dependendo do plano experimental adotado.
Alm disso, a metodologia de modelos lineares mistos vem sendo utilizada com mais
freqncia, principalmente aps os trabalhos de Searle (1988), Searle at al. (1992),
Wolfinger (1993b) entre outros. O sucesso do procedimento de modelagem est
fortemente associado ao exame dos efeitos aleatrios que devem permanecer no modelo
e na possibilidade de se introduzir, no modelo, estruturas de varincias e covarincias
das variveis aleatrias que, para o modelo linear misto, podem estar inseridas no
resduo e, tambm, na parte aleatria associada ao fator aleatrio conhecido. Nesse
contexto, o Teste da Razo de Verossimilhana e o Critrio de Akaike podem auxiliar na
tarefa de escolha do modelo mais apropriado para anlise dos dados, alm de permitir
verificar que escolhas de modelos inadequadas acarretam em concluses divergentes em
relao aos efeitos fixos do modelo. Com o desenvolvimento do Proc Mixed do SAS
(Littel at al. 1996), utilizado neste trabalho, a anlise desses experimentos, tratada pela
metodologia modelos lineares mistos, tornou-se mais usual e segura. Com a finalidade

viii

de se atingir o objetivo deste trabalho, utilizaram-se dois exemplos (A e B) sobre a


resposta da produtividade de trs cultivares de trigo, em relao a nveis de irrigao por
asperso line-source. Foram criados e analisados 29 modelos para o Exemplo A e 16
modelos para o Exemplo B. Pde-se verificar, para cada um dos exemplos, que as
concluses em relao aos efeitos fixos se modificaram de acordo com o modelo
adotado. Notou-se, tambm, que o Critrio de Akaike deve ser visto com cautela. Ao se
comparar modelos similares entre os dois exemplos, ratificou-se a importncia de se
programar corretamente no Proc Mixed. Nesse contexto, conclui-se que fundamental
conduzir a anlise de experimentos de forma ampla, buscando vrios modelos e
verificando quais tm lgica em relao ao plano experimental, evitando erros ao
trmino da anlise.

MIXED LINEAR MODELS: STRUCTURES OF MATRIX OF VARIANCES


AND COVARIANCES AND SELECTION OF MODELS
Author: JOMAR ANTONIO CAMARINHA FILHO
Adviser: Prof. Dr. DCIO BARBIN

SUMMARY
In Biology and Agronomy, experiments that produce correlated observations are
often found. Theoretically, these correlations may be associated with whole-plots or
subplots, according to the chosen experimental design. Also, the mixed linear model
methodology is now being used much more frequently, especially after the works of
Searle (1988), Searle et al. (1992) and Wolfinger (1993b), among others. The success of
the modeling procedure is strongly associated with the examination of the random
effects that must remain within the model and the possibility of introducing variancecovariance structures of random variables in the model. In the case of the mixed linear
model, they may be included in the residual error or in the random part which is
associated with the known random factor. In this context, the Likelihood Ratio Test and
Akaikes Information Criterion can help in choosing the most appropriate model for data
analysis. They also enable the verification of inadequate choice of models which can
lead to divergent conclusions regarding the fixed effects of the model. With the
development of the SAS Mixed Procedure (Little at al. 1996), which was used in this
work, analysis of these experiments, conducted through the mixed linear model
methodology, has become more usual and secure.

In order to achieve the target of this work, two examples were utilized (A and B)
involving the productivity response of three varieties of wheat, in regards to irrigation
levels by line-source aspersion. Twenty-nine models for Example A and 16 models for
Example B were created and analyzed. For each example, it was verified that
conclusions regarding fixed effects changed according to the model adopted. It was also
verified that Akaikes Information Criterion must be regarded with caution. When
comparing similar models between the two examples, the importance of correct
programming in the Mixed Procedure was confirmed. In this context, it can be
concluded that it is fundamental to conduct the experiment analysis in an ample manner,
looking for various models and verifying which ones make sense according to the
experimental plan, thus avoiding errors at analysis completion.

1 INTRODUO
A perfeita adequao do modelo linear a situaes reais depende, diretamente, da
competncia e da sensibilidade do usurio em captar a estrutura dos dados que sero
modelados e analisados, em relao aos efeitos aleatrios e ao efeito residual. A
metodologia de modelos lineares mistos procura auxiliar nessa tarefa e tem sido
estudada com mais nfase, principalmente aps os trabalhos de Searle (1988), Searle at
al. (1992), Wolfinger (1993b), Littel at al. (1996) e Mrode (1996).
O sucesso do procedimento de modelagem est fortemente associado
possibilidade de se introduzir, no modelo, estruturas de varincias e covarincias das
variveis aleatrias, que para o modelo linear misto, podem estar inseridas no resduo e,
tambm, na parte aleatria associada ao fator aleatrio conhecido.
A literatura mostra uma vasta discusso sobre o tema, examinando os
pressupostos para a realizao da anlise de varincia (Scheff, 1959), verificando
metodologias para estimao dos efeitos do modelo (Searle at al., 1992), analisando as
tcnicas apropriadas para a seleo de modelos (Bozdogan, 1987) e introduzindo
estruturas de varincias e covarincias no modelo, como por exemplo a auto-regressiva,
a Toeplitz, a de componentes de varincia e a sem estrutura, com o objetivo de melhorar
o ajuste (Wolfinger, 1993a). Porm, mesmo em discusses de situaes mais complexas,
bastante comum encontrar na literatura exemplos, como em Henderson (1984),
Wolfinger (1993a) e Diggle (1988), utilizando a estrutura mais simples I2 para o
resduo e a estrutura de componentes de varincia para a parte aleatria. Com

desenvolvimento do Proc Mixed do SAS (Littel at al., 1996) a anlise de experimentos,


tratada pela metodologia de modelos lineares mistos, tornou-se, alm de mais usual,
mais segura.

Nesse contexto, os objetivos do presente trabalho so: i) considerar diversas


estruturas de varincias e covarincias para as matrizes associadas parte aleatria e ao
resduo, procurando enfatizar quelas inseridas na parte aleatria; ii) com base nessa
modelagem, pretende-se questionar e comparar as diversas formas propostas para um
dado experimento. Dessa forma, as metodologias do teste da razo de verossimilhana e
do critrio de Akaike para seleo de modelos sero comparadas e discutidas. Alm
disso, com base nos resultados das anlise de varincia para cada um dos modelos
propostos, deseja-se verificar as conseqncias de no se considerar a estrutura que
proporciona o melhor ajuste na anlise dos dados.

2 REVISO DE LITERATURA
2.1 Introduo e Definies
Num modelo matemtico, deseja-se explicar as observaes de uma varivel
dependente por meio dos efeitos diferenciais que se atribuem a outra srie de variveis
independentes. Tais efeitos podem ser de natureza fixa ou aleatria, conforme
representem, respectivamente, constantes a serem estimadas ou realizaes de uma
varivel aleatria com distribuio de probabilidade conhecida.
Segundo Searle (1987), modelos lineares nos parmetros possuem ao menos um
efeito aleatrio (comumente denotado por erro experimental). Se um modelo apresenta
todos os demais componentes fixos chamado de modelo fixo; se, no entanto, todos os
demais fatores forem aleatrios (a menos de uma constante, para outros modelos que no
o de mdias de caselas) o modelo chamado de aleatrio; quando o modelo apresenta
tanto efeitos aleatrios como fixos, denominado de modelo misto. No Apndice A,
encontram-se 5 exemplos que procuram explicar, em detalhes, as diferenas existentes
entre os modelos fixo, aleatrio e misto, as variabilidades existentes entre as observaes
e, tambm, explicitar todas as matrizes envolvidas em cada um desses exemplos.
Para o modelo linear misto, a anlise de varincia apresenta algumas
peculiaridades, como, por exemplo, a composio das esperanas matemticas dos
quadrados mdios, cujo conhecimento permite o estabelecimento correto dos testes de
hipteses (Hicks, 1973). Caso o interesse do pesquisador esteja na estimao dos
componentes de varincia, mtodos adequados devem ser utilizados (Henderson, 1953;
Cunningham & Henderson, 1968; Patersson & Thompson, 1971).

Adotando-se um modelo linear misto pode-se fazer a predio de efeitos


aleatrios, na presena de efeitos fixos, pelos BLUPs que so de grande valia em
gentica e melhoramento.
Matricialmente, o modelo misto linear geral descrito em Harville (1977) e em
Laird & Ware (1982) denotado por:
y = X + Z + e

(1)

em que,
ny1

o vetor de observaes;

nXp+1

a matriz de incidncia dos efeitos fixos (conhecida);

p+11

o vetor de efeitos fixos desconhecidos;

nZq

a matriz de incidncia dos efeitos aleatrios (conhecida);

q1

o vetor de efeitos aleatrios desconhecidos;

n e1

o vetor de erros aleatrios;

em que, n o nmero de observaes, p o nmero de parmetros e q o nmeros de


efeitos aleatrios.
Assume-se que os efeitos aleatrios e os erros (resduos) tm distribuio normal
com mdia zero e so no correlacionados, com matrizes de varincias e covarincias,
respectivamente, G e R matrizes positivas definidas, por hiptese, e, portanto, no
singulares, dadas por:
Var() = E() = G e Var(e) = E(ee) = R.
Matricialmente, tem-se :

G
Var =
e

.
R

Deste modo, tem-se que:


V = Var(y) = Var( X ) +Var( Z ) + Var( e )=ZVar()Z+R = ZGZ+R
Assume-se, ainda, que V no singular, e
E(y) = E( X + Z + e ) = X ,
assim, y ~ N(X; ZGZ' + R) .

(2)

Solues para o caso de matrizes singulares podem ser vistas em Henderson


(1984).
De acordo com Scheff (1959), o modelo misto foi amplamente estudado por
Fisher1 em 1918, com grande repercusso nos estudos de gentica quantitativa. Tal
modelo foi denominado pelo autor de modelo de componentes de varincia.
O enquadramento de efeitos como fixos ou aleatrios est relacionado ao objetivo
da anlise: se os nveis do efeito constituem-se amostras de uma populao sobre a qual
se quer tirar concluses (efeitos aleatrios) ou se so parmetros constantes sobre os
quais se quer identificar diferenas e magnitudes (efeitos fixos). Muitos autores, no
entanto, entendem tal objetivo como banal, sem conseqncias para os processos de
estimao e predio.
Assim, Vieira & Hoffman (1998), por exemplo, afirmam que, com efeitos
aleatrios em vez de fixos, apenas as esperanas matemticas dos quadrados mdios e
testes F se alteram. implcito, dentro do contexto da estimao de mnimos quadrados
ordinrios, que no se reconhecem alteraes de conjunto na anlise de um experimento
por se pressupor algum dos fatores como aleatrios em vez de fixos.
Mas, na verdade, considerar fatores como fixos ou aleatrios pode afetar a
estimao e suas conseqncias pela presena das varincias das variveis aleatrias
perturbadoras, o que acarretar em alterao nos testes de hipteses sobre contrastes
paramtricos, na magnitude de testes F, nas concluses sobre os parmetros e nas
estimativas dos componentes de varincia (Scheff, 1959 e Hocking, 1985).
Nesse contexto, segundo Wolfinger (1993b), ignorar as covarincias entre as
observaes de um mesmo nvel da varivel aleatria pode, tambm, afetar a qualidade
da predio devido alterao na ordem dos valores das predies dos efeitos aleatrios
ou pela simples mudana na magnitude desses valores.
Os blocos incompletos, parcelas subdivididas, dados longitudinais, os coeficientes
aleatrios, a anlise de curvas de crescimento, curvas polinomiais e os BLUPs (Best
1

FISHER, R. A. The correlation between relatives on the supposition of Mendelian inheritance.


Transactions Royal Society of Edinburgh, v. 52, p. 399-433, 1918.

Linear Unbiased Predictors), entre outros, podem ser descritos por meio de um modelo
linear misto. Dessa forma, a estrutura da matriz de varincias e covarincias deve estar
inserida no modelo para melhor explicar o comportamento dos dados (detalhes em Littel
et al. (1996) e Wolfinger (1993a)).
Um dos problemas centrais do ajuste dos modelos mistos a um conjunto de
observaes a estimao dos componentes de varincia e covarincias dos efeitos
aleatrios e qual a metodologia mais adequada para estimao dos efeitos fixos.
Em geral, a seleo de modelos est ligada possibilidade de se estimarem
parmetros associados s definies do modelo ou de se predizer o comportamento das
suas variveis aleatrias para um dado conjunto de observaes. Na verdade, isso ocorre,
pois as esperanas de efeitos fixos e varincias populacionais de variveis aleatrias so
estimveis, enquanto que as variveis aleatrias podem ser preditas, mas no estimadas,
uma vez que no possuem valor fixo; mas, numa amostra dos seus possveis valores,
podem-se obter indicadores de sua esperana, conhecida sua distribuio, e verificar se
existe uma correlao entre o efeito aleatrio e o carter observado.
Assim, no uso de modelos fixos, devem-se estimar os prprios efeitos fixos,
enquanto que os modelos aleatrios prestam-se para estimar os componentes de varincia
(das variveis aleatrias), bem como para a predio das prprias variveis aleatrias.
Dessa forma, os modelos mistos podem servir para a estimao de mdias de um modo
mais preciso, uma vez que deve-se levar em conta a influncia dos componentes de
varincia que podem ser estimados pelo modelo, ou ainda para a predio, servindo de
base para o processo de seleo de modelos.
2.2 Estimao e Modelagem
A estimao de componentes de varincia em modelos com dados balanceados
o caso mais simples e de onde deriva boa parte da metodologia para dados
desbalanceados. O mtodo dos momentos (ANOVA) o mais comumente empregado,
constituindo em se igualarem formas quadrticas a suas respectivas esperanas, obtendose assim um conjunto de equaes que permite a estimao (Barbin, 1993).

Barbin (1993) apresenta um trabalho sobre componentes de varincia, enfatizando


o mtodo ANOVA para modelos com dados balanceados. Apresenta, tambm, um
mtodo prtico, o Mtodo de Hicks, para obteno dos quadrados mdios nos modelos
com dados balanceados. Visando a coerncia entre os resultados obtidos em seu estudo e
os resultados obtidos pelo mtodo dedutivo, apresenta-se, tambm, uma modificao
nesse mtodo.
O princpio do mtodo ANOVA usado com dados balanceados pode ser
generalizado para dados desbalanceados. A generalizao usar qualquer forma
quadrtica em lugar das somas de quadrados (Searle at al., 1992).
Seja o vetor de componentes de varincia que sero estimados e seja q um vetor
da mesma ordem de 2, de qualquer forma quadrtica linearmente independente das
observaes. Suponha que q tal que:
E(q) = C2,
para alguma matriz C no singular, ento,

2 = C-1q,
um estimador no-viesado de 2.
A matriz de disperso de 2 :

( )

var 2 = C 1 var(q )C1 ' ,


em que, os elementos de var(q) so varincias e covarincias das formas quadrticas
usadas como elementos de q.
Os estimadores ANOVA so sempre no-viesados e tm varincia
mnima. Pode-se citar, como desvantagem, o fato de que esse mtodo no exclui a
ocorrncia de estimativas negativas. Claramente, uma estimativa negativa de um
parmetro, uma varincia, que por definio positiva, causa no mnimo estranheza.
H, na verdade, uma infinidade de mtodos de estimao, mesmo entre os
chamados mtodos dos momentos, e o desenvolvimento de pacotes computacionais
tornou disponvel, para fins prticos, uma srie de metodologias antes consideradas de
difcil cmputo. Searle (1987) e Searle et al. (1992) apresentam, talvez, os mais

importantes e mostram os procedimentos de estimao e as vantagens e as desvantagens


desses estimadores.
A aplicao do mtodo dos momentos para dados balanceados em modelos
mistos direta. Casos particulares podem ser encontrados em textos padro de modelos
lineares, como Graybill (1976) e Hocking (1985). Note-se que, mesmo para modelos
mistos com dados balanceados, surgem polmicas sobre o modelo bsico e o significado
da interao de efeitos fixos com aleatrios (Scheff, 1959 e Searle, 1971).
Segundo Perri (1998), os trs mtodos de Henderson (1953) so tambm formas
de aplicao do mtodo dos momentos, embora as formas quadrticas que empregam no
se constituam sempre em somas de quadrados clssicas do mtodo dos momentos.
Searle (1968) reformula os mtodos de Henderson (1953), reescrevendo-os
matricialmente, enfocando, principalmente, o Mtodo II, ao qual sugere algumas
modificaes, generalizando-o.
O autor argumenta, ainda, que os mtodos de Henderson (1953) so de fcil
aplicao, do ponto de vista terico mas, na prtica, se as matrizes envolvidas nas somas
de quadrados so de dimenses grandes, a utilizao torna-se trabalhosa.
Os trs mtodos de Henderson (1953) para estimar componentes de varincia que
so exatamente trs diferentes maneiras de usar o mtodo ANOVA geral, as diferenas
ocorrem somente nas formas quadrticas que nem sempre so as somas de quadrados
usadas em q e podem levar a estimativas negativas.
No mtodo I, as formas quadrticas usadas so anlogas s somas de quadrados
usadas para dados balanceados. A analogia tal que somas de quadrados em dados
balanceados tornam-se, para dados no balanceados, em formas quadrticas que no so
necessariamente somas de quadrados, pois, nem sempre, so no negativas devido
estrutura no balanceada dos dados. Assim, por exemplo, para o modelo:
y ijk = + i + j + ij + ijk
com i = 1, 2, ..., I; j = 1, 2, ..., J; k = 1, 2, ..., n, a soma de quadrados

Jn (y
i

torna-se, para dados desbalanceados:

) = Jny
2

2
i

IJ y 2 ,

n (y
i

) = n
2

y 2i n y 2

(3)

O Mtodo I de Henderson utiliza o segundo membro da equao (3).


A soma de quadrados para a interao, para dados balanceados,

n
i

ij

(y

ij

y i y j + y

= n y 2ij Jn y 2i In y 2 j + IJny 2 .
i

A expresso para dados desbalanceados, utilizada pelo Mtodo I de Henderson :

n
i

ij

y ij2 n i y i2 n j y 2 j + n y 2 .
i

O mtodo I de Henderson consiste em igualarem os quadrados mdios s suas


esperanas matemticas e resolver o sistema de equaes formado. Esse mtodo fornece
estimativas no-viesadas, com varincia mnima, quando os dados so balanceados ou o
modelo aleatrio e os efeitos no so correlacionados.
Conforme Searle at al. (1992), esse mtodo no pode ser usado para modelos
mistos. Porm, pode ser adaptado a um modelo misto alterando o modelo e tratando os
efeitos fixos como no existentes ou como aleatrios. Neste caso os estimadores dos
componentes de varincia dos verdadeiros efeitos aleatrios so no-viesados.
O Mtodo II de Henderson, projetado para ter a facilidade computacional do
Mtodo I e ampliar seu uso removendo a limitao do mtodo I. Tal mtodo consta de
duas etapas. Primeiro faz-se a suposio temporria que os efeitos aleatrios so fixados,
e para o modelo y = X + Z + e como anteriormente definido, resolvem-se as equaes
normais

XX XZ Xy
ZX ZZ = Zy

para e, ento, considera-se o vetor ajustado de dados para , isto , z = y - X. Sob


certas condies, Searle (1968), relata que o modelo para z ser: z = l + Z + Ke,
sendo que K conhecido e que difere de . Ento, aplica-se o Mtodo I para z.
Portanto, o mtodo II de Henderson, consiste em estimar, em primeiro lugar, os
efeitos fixos e, em seguida aplicar o Mtodo I para os resduos restantes. Para que os
estimadores resultantes sejam no tendenciosos, necessrio que os resduos dependam

10

apenas dos fatores aleatrios, a menos de uma constante que pode ser includa no
modelo. Searle (l968) fazendo estudo dos mtodos de Henderson, mostrou as condies
que devem satisfazer um estimador dos efeitos fixos para que os resduos no dependam
desses efeitos. H dois inconvenientes nesse mtodo. Um deles o fato de no haver uma
nica soluo e o outro consiste em no poderem ser adotados modelos que incluam
interaes entre os efeitos fixos e aleatrios.
O Mtodo III de Henderson, tambm chamado mtodo de ajuste de constantes,
usa as redues nas somas de quadrados do modelo completo e de submodelos para
estimar os componentes de varincia.
Esse mtodo pode ser usado para qualquer modelo misto e produz estimadores
que no so viesados.
Para deduzir o mtodo, considere o modelo:
y = X + Z + e = W + e.
A matriz W pode ser subdividida em [W1W2], e ' em [1 2 ] . Dessa forma, o
modelo reescrito como:
y = W11 + W22 + e.
Note que nenhuma suposio feita sobre a subdiviso de W e no que se refere
a efeitos fixos ou aleatrios.
Chamando R(1,2) e R(1), respectivamente, s redues nas somas de
quadrados do modelo completo e do submodelo y = W11 + e, tem-se:
R(21) = R(1,2) - R(1).
Portanto,
E[R(21)] = E[R(1,2)] - E[R(1)].
-

Mas, R(1,2) = y'W(W'W) W'y

R(1) = y'W1(W1'W1) W1y,

isto , R(1,2) e R(1) so formas quadrticas de y, e tem-se:


-

E[R(1,2)] = E[y'W(W'W) W'y] = tr[W(W'W) W'var(y)] + E(y')W(W'W) W'E(y).


Alm disso, E(y) = E(W + e) = WE() e var(y) = var(W + e) = Wvar()W' + e2 I,
logo,

11

E[R(1,2)] = tr[W(W'W)-W'Wvar()W' + W(W'W)-W' e2 I] +


+ E(')W'W(W'W)-W'WE().
E[R(1,2)] = tr[W'Wvar()] + e2 tr[W(W'W)-W' + E(')W'WE() =
= tr{W'W[E(')-E()E(')]} + e2 tr[W(W'W)-W'] +tr(E(')W'WE()}.
Portanto,
E[R(1,2)] = tr{W'WE(')} + e2 tr[W(W'W)-W']
ou
W W
E[R (1 , 2 )] = tr 1 1
W2 W1

W1 W2
E( ) + e2 r (W ) ,
W2 W1

sendo r(W) o posto da matriz W.


De modo anlogo,
E[R(1)] = tr{W'W1(W1'W1)-W1'WE(')} + e2 tr[W1(W1'W)-W1'].
W W
E[R (1 )] = tr 1 1
W2 W1

W1 W2

E( ) + e2 r (W1 ) .

W2 W1 (W1 W1 ) W1 W2

Portanto, R(21) = R(1,2) - R(1) dado por:


E( ) + e2 [r (W ) r (W1 )]
E R ( 2 1 ) = tr

W2 W1 (W1 W1 ) W1 W2

ou
E[R(21)] = tr{W2'[I-W1(W1'W1)-W1']W2E(22')} + e2 [r(W) - r(W1)].
Note que [R(21)] no envolve 1 e portanto E[R(21)] no depende do vetor
de efeitos 1, sejam eles fixos ou aleatrios.
Assim, o Mtodo III de Henderson, consiste em encontrar os estimadores para os
componentes de varincia, montando um sistema de equaes a partir das diferenas
entre as redues do modelo completo e um submodelo e igualando-as s suas
respectivas esperanas.
Para modelos mistos, esse mtodo particularmente vantajoso porque, tomando o
vetor 1 como o vetor dos efeitos fixos e 2 como o vetor dos efeitos aleatrios,

12

E[R(21)] no conter termos devido a esses efeitos fixos, e ser apenas funo de e2
e das varincias dos efeitos aleatrios em 2, que o que se deseja estimar.
Para exemplificar o mtodo, considere o modelo:
y = 1 + X1 + X2 + X3 + e,
sendo uma constante, o vetor de efeitos fixos, e os vetores de efeitos aleatrios.
Nesse caso, a matriz W pode ser escrita como W = [1 X1 X2 X3] e
R(,,,) = y'W(W'W)-W'y, soma de quadrados total, com r(W) = r, o posto da matriz
W.
Considere os submodelos, dados por:
y = 1 + e
y = 1 + X1 +e
y = 1 + X1 + X2 + e
as redues nas somas de quadrados de resduos correspondentes, podem ser assim
descritas:
R ( ) = y 1(1 1) 1y = y 1(n )11y =

1
y Jy , com
n

R (, ) = y W1 (W1 W1 )W1 y , com

r(W1) = r(J) = 1;

W1 = [1 X1] e r(W1) = q (posto de W1);

R (, , ) = y W1 (W1 W1 ) W1 y , com

W1= [1 X1 X2] e r(W1) = s (posto de W2).

Ento, podese obter, sucessivamente, os componentes de varincia com auxlio


das somas de quadrados e suas respectivas esperanas. Sendo que, as matrizes W1 e W2
so especificadas de acordo com a parametrizao.
No necessrio utilizar a soma de quadrados dada por R(,,,) - R(), cuja
esperana seria h 4 2 + h 5 2 + h 6 2 + (n 1) e2 , pois, supondo-se como efeito fixo,
no se considera a existncia de 2 .
Rao (1970) apresenta um novo estimador de varincias heterocedsticas em
modelos lineares, conhecido como Estimador Quadrtico No-Viesado de Norma
Mnima, MINQUE. O autor aplica o mtodo MINQUE ao modelo linear de GaussMarkov, y = X + , com matriz de disperso diagonal e apresenta um procedimento para
obteno dos estimadores MINQUE no caso geral, para modelos de efeitos fixos.

13

Em 1971, Rao, dando continuidade aos seus estudos, desenvolve metodologia


para obteno dos estimadores para os componentes de varincia e para suas
combinaes lineares, agora para modelos mistos, satisfazendo algumas propriedades:
invarincia quanto translao dos efeitos fixos, no tendenciosidade e norma mnima da
diferena entre o estimador e seu verdadeiro valor ou varincia mnima do estimador. Os
estimadores, assim obtidos, so chamados, respectivamente, MINQUE, se possuem
norma mnima (Rao, 1971a) e Estimador Quadrtico No-Viesado de Varincia Mnima,
MIVQUE, se possuem varincia mnima (Rao, 1971b).
Tais mtodos baseiam-se na estimao dos componentes de varincia, tomando
como base as formas quadrticas. A condio de norma mnima do MINQUE imposta
matriz ncleo das formas quadrticas das observaes, enquanto que o MIVQUE utiliza a
restrio de que a matriz ncleo das formas quadrticas das observaes seja determinada
de tal forma que os estimadores obtidos sejam de varincia mnima.
O mtodo da mxima verossimilhana foi idealizado por Fisher, segundo Searle
(1987), e primeiramente usado para a obteno de estimativas de componentes de
varincia, em modelos mistos, por Hartley & Rao (1967).
O mtodo consiste na obteno de estimadores que maximizem a funo
densidade de probabilidade das observaes, em relao aos efeitos fixos e aos
componentes de varincia.
Assim, seja o modelo misto, dado em (1):

y = X + Z + e.
Assumindo que os efeitos aleatrios i, i = 1, ..., r e e tm distribuio normal
com mdia zero e matrizes de varincias e covarincias i2 I n , ..., para i=1, ..., r e e2 I n ,
respectivamente, o vetor y ter distribuio normal multivariada, com mdia X e matriz
de varincias e covarincias, V, ou seja, y ~ N(X, V), sendo,
r

V=

Z Z
i

i =1

2
l

+ e2 I =

Z Z
i

2
l

i =0

Assim, a funo de verossimilhana ser:

, com 02 = e2 e Z0=I.

14

L = f (y , ) =

1
( 2)

n/2

ZGZ'+ R

1/ 2

[(y X )(' ZGZ'+ R )

(y X )]

(4)

sendo V = ZGZ '+ R o determinante da matriz V.


Fazendo l = logL e maximizando l em relao aos elementos de e aos
componentes de varincia, os i2,j que ocorrem em V, obtm-se um sistema de equaes
que, resolvido, produz os estimadores de mxima verossimilhana de e 2 . Essas
equaes podem ser escritas de diversas maneiras, atendendo a certos objetivos (Searle,
1987). Sua forma geral apresenta dois tipos de equaes, quais sejam:

1X = X V
1y , que para V conhecido, transforma-se nas equaes normais do
(a) XV
BLUE dos efeitos fixos;
(b) e equaes para o trao da seguinte matriz:

1Z Z ) = (y X)'V
1Z ZV
1(y X) .
tr(V
i i
i i

(5)

Nota-se que essas equaes so formas anlogas s equaes do mtodo dos


momentos, em que o primeiro termo refere-se ao produto da contagem da ocorrncia das
variveis aleatrias pela sua varincia e o segundo termo a forma quadrtica
correspondente.
Seja o projetor
r

P=V-1-V-1X(X'V-1X)-X'V-1, com I = V 1 V = V 1 z i z i i2 , a operao de trao da matriz


i=0

para varincias, passa a ser escrita como:

) (

1Z Z V
1Z Z 2 = yP Z Z P y
tr V
i i
j j i
i i

(6)

No processo iterativo, pode-se escolher valores iniciais para i 2 em V e P, para


resolver a equao do trao e utilizar o resultado para novos valores de V, repetindo o
processo at que o critrio de convergncia seja satisfeito.
Algumas propriedades dessa classe de estimadores so fornecidas por Searle
(1987), dentre elas citam-se: a da invarincia, o do processo de estimao que , nesse
caso, iterativo, e de fornecer sempre estimativas no negativas de componentes de

15

varincia, mas essas so viesadas porque o mtodo no considera a perda de graus de


liberdade resultante da estimao dos efeitos fixos do modelo.
Para modelos mistos, estimadores de mxima verossimilhana so preferveis ao
do mtodo dos momentos (Searle, 1988). Nesse contexto, os estimadores de mxima
verossimilhana fornecem o BLUE dos efeitos fixos a cada passo da iterao, enquanto
que no existe um tratamento adequado para o reajuste das estimativas dos efeitos fixos
no mtodo dos momentos.
Dadas as estimativas de mxima verossimilhana de G e R, e so estimados
pela soluo das equaes do modelo misto descritas em Henderson (1984).
As equaes de modelos mistos podem ser encontradas pela minimizao da
soma de quadrados dos resduos, ou pela maximizao da funo densidade de
probabilidade conjunta de y e . Aqui ser adotada a segunda forma, considerando-se que
a distribuio seja normal, conforme discutido em Harville (1977) e em Searle et al.
(1992).
Conforme o modelo dado em (1) e a funo densidade de probabilidade de y dada
em (4), tem-se que a funo densidade de probabilidade conjunta de y e pode ser
escrita como o produto entre a funo densidade condicional de y, dado , e a funo
densidade de probabilidade de . Logo,
f ( y , ) = f ( y | ) f ( ) .

Assim,
f (y , ) =

1
( 2)

e
2

[( y X Z )' ( R )

( y X Z )

1
1

( 2) G
2

e
2

[( 0)' (G )

( 0)

sendo |R| e |G| os determinantes das matrizes de covarincias.


Para se proceder maximizao de f(y, ), pode-se usar a transformao por
logaritmo neperiano, denotado por log. Isso possvel, visto que, sendo f(y, ) e
log[f(y,)] funes contnuas e crescentes no espao R+, seus pontos de mximo so
coincidentes dentro do espao de [ ] e ZGZ+ R. Assim, fazendo-se l = log[f(y,)],
tem-se:

16

1
1
1
l = 2n log(2) (logR + logG) (y' R 1y 2y' R 1X 2y' R 1Z + 2' X' R 1Z
2
2
2
+ ' X' R 1X + ' Z' R 1Z + ' G 1).

Derivando-se l em relao a e , e tornando-se tais derivadas identicamente


nulas, obtm-se:
l
X' R 1y + X' R 1Xo + X' R 1Z
0
=
= ,
l Z' R 1y + Z' R 1Xo + Z' R 1Z + G 1 0

X' R 1 X o + X' R 1Z
X' R 1y

=
e
o
1
1
1
1

Z
'
R
X

+
Z
'
R
Z

+
G

Z' R y

X' R 1 X

Z' R 1X

o X' R 1y
.
=
Z' R 1Z + G 1 Z' R 1y
X' R 1Z

Essas so as equaes de modelos mistos (EMM), que permitem obter solues


para os efeitos fixos (o) e predies para os efeitos aleatrios ( ).
Tais solues podem ser escritas como:

1X) X' V
1y X' R
1y
(X' V

= C 1
=
Z' V
y ,
1(y X) Z' R
G


sendo,

1
1 Z
X R
= X R X
C
1 ,
1
1
Z R X Z R Z + G

e V tal que, segundo Henderson et al. (1959):


V-1 = R-1- R-1Z(ZR-1Z +G-1)-1ZR-1.
Se G e R so conhecidas, o BLUE de e o BLUP de . A matriz de
covarincias C, obtida de qualquer inversa generalizada da matriz de coeficientes nas
equaes do modelo misto. Contudo, a substituio das estimativas de G e R em C,
resultando em C estimada, permite testes aproximados. Os testes da razo de
verossimilhana so recomendados, embora seja possvel construir estatsticas t e F
aproximadas (Wolfinger, 1993a), como ser visto em 2.5.

17

A soluo do sistema de equaes de modelos mistos pode, tambm, ser obtida


por absoro ou por obteno da matriz inversa por partio (Martins et al., 1993). Em
ambos os casos, os resultados sero:

o = X' [R 1 R 1Z(Z' R 1Z + G 1 ) 1 Z' R 1 ]X X' [R 1 R 1Z(Z' R 1Z + G 1 ) 1 Z' R 1 ]y

(7)

= (Z' R1Z + G1)1 Z' R1(y Xo )

(8)

Segundo Searle (1971), a desvantagem de se utilizar a primeira opo, que


envolve o clculo de V-1, de ordem computacional, uma vez que a dimenso de V
igual ao nmero de observaes que, muitas vezes, principalmente na rea de
melhoramento gentico, chega a ser de algumas centenas. No caso de modelos fixos, V
usualmente assume a forma 2In ou , pelo menos, diagonal. Nesse caso a obteno de
V-1 simples. Mas, em geral, V = ZGZ+R no diagonal e, deste modo, a obteno de
V-1 no fcil. Segundo Martins et al. (1993), obter R-1Z(ZR-1Z+G-1)-1ZR-1 mais
simples, pois R-1 pode ser facilmente obtida por I R 01 , sendo R0 a matriz de varincias
e covarincias residual de ordem q (nmero de colunas de Z), entre as q mdias que
compem uma observao; G-1 obtida por A 1 G o1 , em que Go a matriz de
varincias e covarincias, de ordem q, entre os efeitos aleatrios nas q medidas que
compem uma observao, e A a matriz de correlao, de ordem n, entre os efeitos
aleatrios das n observaes. Apesar de a matriz A no possuir estrutura simples, como
ocorre na maioria das vezes, para aplicaes em melhoramento animal, existem
algoritmos eficientes para obteno direta de A-1 (Henderson, 1984, 1986; Quaas, 1976).
Mesmo assim, persiste a necessidade de se obter (ZR-1Z + G-1)-1 , que, a despeito de
possuir as mesmas dimenses de V, pode ser obtida por processos iterativos com a
vantagem de rpida convergncia em razo da dominncia dos elementos da diagonal
causada pela adio de G-1 a ZR-1Z. Nos casos de distribuio multivariada, elementos
dominantes podem estar fora da diagonal. Nesses casos, processos que usam iterao em
blocos garantem a rpida convergncia, porque os elementos dominantes passaro a estar
nos blocos (Quaas & Pollak, 1980).

18

No contexto de estimao dos efeitos fixos do modelo, Henderson (1984)


apresenta algumas propriedades dessas solues, dentre elas:
(a) A soluo o, obtida pelas EMM, tambm uma soluo de Mnimos Quadrados
Generalizados (MQG), utilizando o modelo que ignora os efeitos aleatrios.
Prova:
Substituindo de (8) em:
X' R 1X o + X' R 1Z = X' R 1y ,

tem-se:
X' R 1 X o + X' R 1 Z(Z' R 1Z + G 1 ) 1 Z' R 1 (y X o ) = X' R 1y
X' R 1 X o + X' R 1 Z(Z' R 1 Z + G 1 ) 1 Z' R 1y X' R 1Z(Z' R 1Z + G 1 ) 1 Z' R 1 X o = X' R 1y
[ X' R 1 X X' R 1 Z( Z' R 1 Z + G 1 ) 1 Z' R 1 X] o = [ X' R 1 X' R 1 Z( Z' R 1 Z + G 1 ) 1 Z' R 1 ]y

X' [R 1 R 1 Z( Z ' R 1 Z + G 1 ) 1 Z ' R 1 ]X o = X' [R 1 R 1 Z (Z ' R 1 Z + G 1 ) 1 Z ' R 1 ]y .

Assim,
o = {X' [ R 1 R 1 Z(Z ' R 1 Z + G 1 ) 1 Z' R 1 ]X} X' [R 1 R 1 Z (Z' R 1 Z + G 1 ) 1 Z' R 1 ]y ,

sendo V 1 = R 1 R 1Z(Z' R 1Z + D 1 ) 1 Z' R 1 .


Ento,
o = ( X ' V 1 X ) X ' V 1 y .

(b) A varincia de o dada por: Var ( o ) = Var[(X' V 1X) X' V 1y ] =


= (XV-1X)-XV-1Var(y)V-1X(XV-1X)- = (XV-1X)-XV-1VV-1X(XV-1X)- =
= (XV-1X)-XV-1X(XV-1X)-.
Como XV-1X uma matriz simtrica, a escolha apropriada de uma inversa
generalizada tambm simtrica, leva igualdade (Searle, 1971):
(XV-1X)-XV-1X(XV-1X)- = (XV-1X)-,
e assim,
Var( o ) = ( X' V 1 X) = {X[R-1-R-1Z(ZR-1Z+ G-1)-1ZR-1]X}-

= [XR-1-XR-1Z(ZR-1Z+ G-1)-1ZR-1X]-.

19

Para um dado conjunto de funes estimveis, linearmente independentes,


estabelecido por uma matriz conhecida , a varincia de o, BLUE de , dada por:
Var (o) = Var (o) .
= [(XV-1X)-XV-1X(XV-1X)-]
= [XR-1-XR-1Z(ZR-1Z+ G-1)-1ZR-1X]- .
Da mesma forma, Henderson apresenta algumas propriedades da predio para os
efeitos aleatrios. So elas:
a) O preditor o Melhor Preditor Linear No-Viesado (BLUP) de .
Segundo Martins et al.(1993), o termo predio refere-se a fatores aleatrios e a
Melhor Predio Linear No-Viesada pode ser, resumidamente, definida como resultado
da regresso dos efeitos de um fator aleatrio () em funo das observaes (y)
corrigidas para os efeitos dos fatores fixos (X), como dado na seguinte expresso;

= GZ(ZGZ + R)-1(y - Xo) = GZV-1(y - Xo).


Observa-se que o termo GZ(ZGZ + R)-1 o conjunto de coeficientes de
regresso de em funo de y, uma vez que GZ a matriz de covarincias entre e y,
(ZGZ + R)-1 a inversa da matriz de varincia de y, enquanto o termo (y - Xo) contm
os valores das observaes, y, corrigidas para os efeitos fixos X.
Pelas EMM, dado por:
= (ZR-1Z + G-1)-1ZR-1(y - Xo).

Ento, se a igualdade:
GZ(ZGZ+ R)-1 = (ZR-1Z + G-1)-1ZR-1,
for verdadeira, , obtido pelas EMM, o BLUP de . A prova dessa igualdade foi
apresentada por Henderson et al.(1959).
b) A varincia de dada por:
Var( ) = Var[GZV-1(y - Xo)] = GZV-1Var(y - Xo)V-1ZG =
= GZV-1[Var(y) - 2Cov(y, oX) + Var(Xo)] V-1ZG.
Mas, Cov(y, oX) = Var(Xo), ento,
Var( ) = GZV-1[Var(y) - Var (Xo)] V-1ZG = GZV-1[V - X(XV-1X)- X ] V-1ZG =
= GZ [V-1 - V-1 X(XV-1X)- X V-1]ZG.

20

Pode-se notar que a expresso


V-1 - V-1 X(XV-1X)- X V-1,
o complemento do projetor ortogonal de y no espao coluna de X, o que significa que
[V-1 - V-1 X(XV-1X)- X V-1]y = y - Xo.
c) A varincia do erro de predio dada por:
Var( - ) = Var( ) - 2 Cov(, ) + Var( ).
Mas, Cov (, ) = Var( ), ento,
Var( - ) = Var( ) - Var( ).
= G - GZ [V-1 - V-1 X(XV-1X)- X V-1]ZG.
Searle (1971) apresenta a deduo da expresso da esperana matemtica de uma
forma quadrtica para modelos mistos, como mostrado a seguir.
Dado o modelo misto:
Y=X + e,
em que, = [1 A B ... K ],
no qual,
1 contm todos os efeitos fixos do modelo, inclusive a constante ();
representa um conjunto de efeitos aleatrios dos fatores A, B, ... , K.
Esse modelo pode ser escrito na forma:
y = X11 + XA A + XB B ... XK K + e.
Ento,
K

y = X11 +

i i

+e.

i=A

Assumindo-se que os efeitos do modelo so independentes, com mdia zero e


covarincias entre os efeitos aleatrios nulas, tem-se que:
E(y) = X11 e

V = Var(y) =

X Var( )X
i

'|
i

+ I 2 .

i=A

Assumindo-se que os efeitos aleatrios so no correlacionados e tm varincias


uniformes ( i2 ), ento,

21

V = Var(y) =

X X
i

'
i

2
i

+ I 2 ,

i=A

e a esperana matemtica da forma quadrtica, yQy, fica:


E(yQy) = (X1)QX1 +

tr(X X ) + tr(Q)
2
i

'|
i

(9)

i=A

A partir da expresso (9), torna-se possvel a obteno das esperanas


matemticas dos quadrados mdios, que so de grande valia na determinao dos
denominadores adequados para as hipteses tanto sobre efeitos aleatrios quanto fixos,
nos modelos mistos.
Hartley & Rao (1967) desenvolveram um procedimento de mxima
verossimilhana para a estimao de constantes desconhecidas e varincias, incluindo o
modelo misto geral de anlise de varincia, envolvendo fatores fixos e aleatrios e
interaes. O mtodo aplica-se a todos os casos em que a matriz do delineamento satisfaz
certas condies de estimabilidade dos parmetros (Xavier, 2000). Os autores ainda
discutem a consistncia e a eficincia assinttica dos estimadores e deduzem os testes de
hipteses e regies de confiana.
O principal problema com a estimao dos componentes de varincia para dados
desbalanceados ocorre porque muitos mtodos de estimao esto disponveis e escolher
um deles pode no ser uma questo to simples (Searle at al. 1992).
Fernandez (1991) comenta que, principalmente, dois problemas tm impedido
que os estimadores de mxima verossimilhana para componentes de varincia se tornem
populares, a saber: (a) os estimadores de mxima verossimilhana para componentes de
varincia no consideram a perda de graus de liberdade resultante da estimao dos
efeitos fixos do modelo; (b) os estimadores de mxima verossimilhana so deduzidos
sob a suposio de uma particular forma paramtrica, geralmente normal, para a
distribuio do vetor de dados. Porm, segundo Lopes et al. (1993), em decorrncia do
avano tecnolgico e da facilidade em adquirir e utilizar os recursos da rea de
informtica, a escolha, na prtica, resume-se a um dos dois mtodos fundamentados na
mxima verossimilhana, pelo menos at que ocorra maior aceitao de outras
metodologias.

22

Alm disso, o primeiro desses problemas pode, de fato, ser eliminado pelo
mtodo da mxima verossimilhana restrita (Patterson & Thompson, 1971). Em relao
ao segundo problema, Harville (1977) mostra que os estimadores de mxima
verossimilhana, deduzidos com base na normalidade, podem ser perfeitamente
adaptados quando a forma da distribuio no for especificada.
A estimao de componentes de varincias e covarincias por mxima
verossimilhana restrita foi desenvolvida por muitos pesquisadores para modelos
especficos de anlise de varincia para dados balanceados, como, por exemplo,
Anderson & Bancroft (1952) e Russel & Bradley (1958) e foi estendida para todo modelo
com dados balanceados por Thompson (1962). O mtodo uma variante do mtodo de
mxima verossimilhana para modelos mistos e foi utilizado por Patterson & Thompson
(1971) para delineamentos em blocos com dados desbalanceados.
Os estimadores obtidos pelo mtodo de mxima verossimilhana restrita com
dados balanceados so idnticos aos estimadores ANOVA que so no-viesados e de
varincia mnima. Searle (1987, 1992), Perez (1992) e Ogliari (1998) ressaltam que, sob
normalidade, os estimadores de mxima verossimilhana restrita alm de idnticos aos
estimadores ANOVA, podem ser obtidos de forma analtica.
No mtodo da mxima verossimilhana restrita, a funo de verossimilhana
fatorada em duas partes independentes, uma referente aos efeitos fixos e outras aos
efeitos aleatrios, sendo assim, uma delas totalmente livre dos efeitos fixos, de maneira
que a funo densidade de probabilidade das observaes dada pela soma das funes
densidade de probabilidade de cada parte (Patterson & Thompson, 1971). A
maximizao da funo densidade de probabilidade referente aos efeitos aleatrios, em
relao aos componentes de varincia, elimina o vis resultante da perda de graus de
liberdade na estimao dos efeitos fixos do modelo. Note que uma verossimilhana
associada com R. Como R resduo de mnimos quadrados ordinrios, essa
verossimilhana chamada de mxima verossimilhana restrita ou residual. Restrita no
sentido de que se refere somente a V e residual por estar associada matriz dos resduos,
R.

23

Nesse contexto, considere o modelo descrito em (1),


y = X + Z + e,
o logaritmo da funo densidade de probabilidade de y, dado por,
1
1
1
n log 2 log ZGZ ' [ y ' ( ZGZ '+ R ) 1 y 2 y ' ( ZGZ '+ R ) 1 X + ' X' ( ZGZ '+ R ) 1 X] ,
2
2
2

l=

subdividido em duas partes:


l1 =

1
1
1
posto( X) log 2 log X' (ZGZ' ) 1 X {y ' (ZGZ'+ R) 1 X[ X' (ZGZ'+ R) 1 X] X' (ZGZ'+ R) 1 y
2
2
2

2y ' (ZGZ'+ R ) 1 X[ X' (ZGZ'+ R ) 1 X] X' (ZGZ'+ R ) 1 X +


+ ' X' (ZGZ'+ R ) 1 X[ X' (ZGZ'+ R ) 1 X] X' (ZGZ'+ R ) 1 X}
e
l2 =

1
1
1
posto {K ' [ K ( ZGZ '+ R ) K ' ] 1 K } log 2 log K ( ZGZ '+ R ) K ' {y ' K ' [ K ( ZGZ '+ R ) K ' ] 1 Ky } ,
2
2
2

sendo,
l1: o logaritmo da funo densidade de probabilidade, referente aos contrastes entre os
efeitos fixos;
l2: o logaritmo da funo densidade de probabilidade, referente aos contrastes
linearmente independentes entre as partes aleatrias das observaes, (y - X);
K: uma matriz que estabelece os contrastes linearmente independentes entre as partes
aleatrias das observaes.
Para a estimao dos componentes de varincia, a funo l2 derivada em relao
aos elementos de R e G, fazendo essas derivadas iguais a zero. Porm, mais uma vez, os
estimadores dos componentes de varincia no possuem formas explcitas, isto , o
estimador de cada componente est em funo dos estimadores dos outros componentes,
e s podem ser encontrados por mtodos numricos iterativos.
As equaes para a estimao de mxima verossimilhana restrita de i,j2,
para i, j = 0, 1, ..., r so:

tr P Zi Zi P Z jZj i2 = yP Zi Zi P y

(10)

24

Note que essas equaes so similares s equaes de mxima verossimilhana,


exceto por P em vez de V 1 , para o operador trao.
Wolfinger (1993a) comenta que feito um ajuste prvio dos dados para as
estimativas dos efeitos fixos, seguido do ajuste funo de verossimilhana para os
componentes de varincia. Usa-se para a estimao, portanto, apenas as equaes (10).
Tanto o mtodo de mxima verossimilhana como o de mxima verossimilhana
restrita produzem estimadores viesados para dados muito desbalanceados, mas as
propriedades desses estimadores em amostras grandes, sob normalidade, so as mais
desejveis (Searle, 1987).
Embora apresente ainda propriedades muito desejveis, tais como produzir
estimadores nicos, inicialmente o mtodo de mxima verossimilhana restrita era pouco
utilizado na prtica, devido a suas exigncias de clculo. Porm, com o avano da
informtica, vrios algoritmos iterativos tm sido desenvolvidos para sanar tal
dificuldade. Na verdade, existem vrios problemas numricos na obteno desses
estimadores que no sero aqui abordados (Searle, 1992). Os clculos para cada iterao
desses algoritmos esto associados aos clculos para a estimao de efeitos fixos e
aleatrios para valores conhecidos dos componentes de varincia.
Uma apresentao histrica dos modelos de efeitos aleatrios no perodo de 1820
a 1947 foi feita por Searle (1988) que, alm disso, apresentou uma nova maneira de se
trabalhar com os mtodos da mxima verossimilhana e mxima verossimilhana restrita
para a obteno dos componentes de varincia.
Segundo Searle (1992), as equaes (6) e (10) so no lineares em relao aos
componentes de varincia. Isso indica que, exceto para alguns casos e para dados
completamente balanceados, no h solues analticas para os componentes de
varincia, devendo-se recorrer a solues numricas, processos iterativos, tais como o de
Newton-Raphson, Score de Fisher e o algoritmo EM, discutidos
Schluchter (1986).

por

Jennrich

25

2.3 Processos Iterativos


Henderson (1984, 1986) defende o algoritmo de maximizao da esperana (EM)
devido a sua comparativa simplicidade de clculo no processo de iterao e por sua
propriedade de forar estimativas a carem dentro do espao paramtrico permitido.
Utilizando exemplos, Henderson (1984) ilustra algoritmos de mxima verossimilhana
restrita para uma variedade de situaes.
Laird & Ware (1982), tambm usaram o algoritmo EM

para obterem as

estimativas de e dos parmetros desconhecidos que compem G e R. Esse algoritmo


utiliza os conceitos de mxima verossimilhana e de mxima verossimilhana restrita ou
residual.
Lindstrom & Bates (1988) propuseram frmulas detalhadas para a implementao
do algoritmo de Newton-Raphson e mostraram os motivos para preferi-lo ao algoritmo
EM. Dentre esses motivos podem-se citar, com base no artigo, as qualidades de um bom
algoritmo de otimizao. So elas: maior rapidez para o processo de convergncia, a
consistncia da convergncia, a existncia de um critrio de convergncia objetivo, a
matriz Hessiana est disponvel at o fim do processo interativo e o algoritmo de
Newton-Raphson pode ser adaptado para a maioria dos modelos mistos. Embora esses
autores estivessem atentos para uma modelagem geral de R, suas aplicaes envolveram
apenas a estrutura R = 2I , com o uso de efeitos aleatrios para o modelo de
variabilidade.
Jennrich & Schluchter (1986) estudaram o caso linear gaussiano, aplicando-o a
dados de curvas de crescimento. Eles tambm utilizaram os algoritmos de NewtonRaphson e EM para o clculo das estimativas, por intermdio da mxima
verossimilhana e da mxima verossimilhana restrita. Os dois mtodos esto
implementados no BMDP-5V.
O mtodo iterativo de Newton-Raphson ser o empregado nesse trabalho. Para
tanto, faz-se necessrio obter a derivada de segunda ordem de l=lnL. Assim, tem-se, por
exemplo, para a mxima verossimilhana:

26

Detalhando a equao (5):


l
i2

1
1
1
= tr V1Ri + y' V1Ri V1y y' V1Ri V1X + ' X' V1Ri V1X ,
2
2
2

sendo ZiZi = Ri ou Gi e i = e1, e2, ..., e12, e13, ..., edd (associado a Ri) ou i = g1, g2, ..., g12,
g13, ..., gdd (associado a Gi). Logo, a derivada segunda obtida da seguinte forma para os
termos A, B, C e D:
Para A:

1 tr[V 1R1 ]
=
2
e21
e21
A

De Vonesh & Chinchilli (1997), tem-se:


tr[U(M)1Q .U(M)1U(T)]
tr[U(M)1Q]
=
T
T

M=T

Logo,

A
i2

1 tr[(ZGZ'+R) 1 R1 ] 1 tr[(ZGZ'+R) 1 R1 (ZGZ'+R) 1 (ZGZ'+R)]


=
=
2
2
e2
e2
1

1
1
= (V 1 )'[V 1R1V 1R1 + V 1 ] = [V 1V 1R1V 1R1 V 1V 1 ]
2
2
Para o termo B:
B
e21

1 y' (V 1R1V 1 )y 1 (y' V 1 )(R1V 1y)


=
=
2
2
e2
e2
1

1
= [y' V 1R1V 1R1V 1y + y' V 1 (V 1y R1V 1R1V 1y)] =
2
1
= [y' V 1R1V 1R1V 1y + y' V 1V 1y y' V 1R1V 1R1V 1y]
2

Para o termo C:
C
e21

y' (V1R1V 1 )X
e21

(y' V 1 )(R1V 1X)


e21

= [y' V1R1V 1R1V 1X + y' V1 (V 1X R1V1R1V1X)] =


= [y' V 1R1V1R1V1X y' V1V1X + y' V 1R1V 1R1V1X]

27

Para o termo D:
D
e21

1 (' X' V 1 )(R1V 1X) 1


= [' X' V 1R1V 1R1V 1X + ' X' V 1 (V 1X R1V 1R1V 1X)] =
2
2
2
e
1

1
= [' X' V 1R1V 1R1V 1X + ' X' V 1V 1X ' X' V 1R1V 1R1V 1X]
2

Para os elementos da Matriz G, o tratamento similar. Portanto, por exemplo:


Para o termo A:
A
i2

1 tr[(ZGZ'+R) 1 G1 ] 1 tr[(ZGZ'+R) 1 G1 (ZGZ'+R) 1 (ZGZ'+R)]


=
=
2
2
g2
g2
1

1
1
= (V 1 )'[V1G1V 1G1 + V 1 ] = [V 1V 1G1V 1G1 V 1V 1 ]
2
2

e assim sucessivamente. Podendo, dessa forma, obter a matriz Hessiana.


O processo de Newton-Raphson, na verdade, dado pela srie de Taylor, ver
Leithold (1977), truncada na primeira derivada, que para o nosso caso a funo em
estudo j se trata da primeira derivada, da a necessidade da matriz Hessiana. Segundo
Searle (1992), o processo iterativo pode ser simplificado da seguinte forma:

(m+1) = (m) (H(m) )1

l
| (m)

sendo, m o m-simo passo do processo iterativo, H a matriz Hessiana

e |(m ) o

gradiente da iterao ou derivada primeira da funo l=lnL, que para a mxima


verossimilhana restrita so dados por:

1
H = tr PRjPRi y' PRjPRi Py e
2

l
1
1
l
|( m ) = R2 tr(PR i ) + y ' PR i Py .
2

i 2

Pois, dadas as combinaes lineares de y, Ky = KX+KZ, de maneira que,


KX=0, para , ento KX=0. Logo,
K'= c'[I - X('X'X)- X' ] = c' (I XX+ ) = c' M ,
Ento, E[KY] = KX = 0. Assim, Ky ~ N(0, KVK).
O logaritmo neperiano da funo de mxima verossimilhana restrita, ento, fica:

1
1
1
l R = ln LR = (n p) ln 2 ln K' VK y' K(K' VK)1K
2
2
2

28

sendo p o posto de X.
A primeira derivada dada por :
l R
i2

1
1
1
1
= tr[ KV' K ) 1 K ' R i K y ' (1)PR i Py = tr(PR i ) + y ' PR i Py
2
2
2
2

Pois,

P
1
1 KVK '
(
'
)
'
(
'
)
(K ' VK ) 1 K ' =
=

=
K
K
VK
K
K
K
VK
2
2
2
i
i
i
= K (K ' VK ) 1 K '

V
V
1
=

(
'
)
'
K
K
VK
K
P
P = PZ i Z 'i P
2
2
i
i

A derivada segunda de lR, que informa a matriz Hessiana, fica:


2l R
i2 2j
=

1
1
1
tr PR j PR i y ' PR j PR i Py y ' PR j PR i Py =
2
2
2

1
tr PR j PR i y ' PR j PR i Py.
2

2.4 Estruturas de Covarincias


No modelo linear ordinrio, o valor esperado de y modelado por meio dos
efeitos fixos do vetor . A extenso fornecida pelo modelo misto indica que a varincia
de y, vista em (2), pode ser modelada por intermdio de Z, G e R.
No modelo linear misto clssico tem-se R = 2I, com I de dimenses n x n e uma
matriz G diagonal contendo componentes de varincias. Esse modelo muito til,
especialmente para delineamentos do tipo blocos aleatorizados e parcelas subdivididas,
conforme pode ser visto em Searle et al. (1992).
Contudo, o modelo linear misto clssico apenas um caso especial do modelo
linear misto geral que permite a escolha das estruturas de covarincias descritas em G e
em R.
A Tabela 1 ilustra diversas estruturas de covarincias para G e R, comumente
utilizadas, como a diagonal, a simtrica composta, a desestruturada e a AR(1). A
estrutura de Toeplitz pode ser vista como uma estrutura de mdias mveis com ordem
igual ao tamanho da matriz e a Banded-Toeplitz corresponde estrutura de mdias
mveis de menor ordem.

29

Tabela 1. Algumas estruturas da matriz de varincias e covarincias definidas no SAS.


Estruturas
Notao no SAS
Exemplo
2
0
0
0
0
Diagonal
I

Componentes de
Varincia
(Variance Components)

VC (A B)

Toeplitz

TOEP

0
0

0
A2

0
0

0
0

0
0

0
0
0

0
2
A

0
0
2
1

AR(1)

UN(2)

Sem estrutura
(Desestruturada)

UN

2
11

2
A

0
0
0

Auto-regressiva de
Primeira Ordem

SP(POW)

TOEP (2)

Espacial

Toeplitz de Banda
(Banded-Toeplitz)

Desestruturada de Banda
(Banded)

2
1

3
2
1

d 12
1

12
2
22

4
3
2
1

2
1

0
2
1

2
B

0
7
3

d 13
d 23
1

13
23
2
33

0
0

2
1
4

3
2

3
2

1
0
0

0
0

2
0

0
0

0
B2
5

4
3

2
1

8
4

d14
d 24
d 34
1
14
24
34
2
44

0
0
0

9
5

d 15

d 25
d 35

d 45
1
15
25
35
45
2
55

Todas as matrizes apresentadas na Tabela 1 so simtricas. As letras gregas


representam parmetros desconhecidos. O , para a AR(1), o parmetro auto-regressivo
e deve satisfazer ||<1 para estacionariedade, ver Xavier (2000). O , da Espacial, o
parmetro de correlao espacial e os dij so as distncias euclidianas.

30

A literatura contm algumas anlises especficas envolvendo modelos no triviais


para G e R. Diversos exemplos de Henderson (1984) contm modelos com estruturas
especficas para G e R conhecidas. Wolfinger (1993a) comenta que certos autores
consideraram modelos, do tipo y = X + Z + e, contendo efeitos aleatrios especficos
para cada indivduo em (associado matriz G) e uma correlao serial AR(1) em e
(associado matriz R). Alm disso, o autor comenta que outro ganho devido incluso
da estrutura de covarincias a possibilidade de se utilizarem sries temporais e
estruturas de heterogeneidade em adio s estruturas de simetria composta e
desestruturada.
Laird & Ware (1982) e Lindstrom & Bates (1988) tambm mencionaram
modelos desse tipo. Encontram-se, freqentemente, experimentos de irrigao LineSource contendo efeitos de blocos aleatrios em e uma correlao espacial esfrica em
e. O modelo de Diggle (1988) contm a estrutura de componentes de varincia em
(matriz G) e correlao espacial exponencial em e (matriz R).
Procurando melhorar o ajuste de certos modelos s observaes, Laird & Ware
(1982) esto entre os primeiros pesquisadores a considerar uma aplicao prtica da
formulao geral de G=var[] e de R=var[e]. Eles trabalharam com o modelo de efeitos
aleatrios em dois estgios, com dados longitudinais, em que as observaes so
dependentes no decorrer do tempo. O modelo descrito para o i-simo indivduo foi

y i = Xi + Zi i + ei , i=1, 2, ..., n.
No primeiro estgio , vetor de parmetros de locao desconhecido, e i, vetor
de efeitos aleatrios, so considerados fixos. Os ei so independentes e cada ei~N(0,Ri),
sendo Ri a matriz de covarincias do vetor de erros aleatrios. Em seguida, supe-se que
os i so independentes com i ~ N(0, G), sendo G a matriz de covarincias dos efeitos
aleatrios. A distribuio marginal de cada vetor resposta yi dada por yi~N(Xi, i)
com i = Ri + ZiGZi. comum assumir Ri = 2I, embora outras alternativas possam ser
consideradas.
Em trabalho semelhante, Andreoni (1989) apresentou em detalhes os
procedimentos de estimao dos parmetros do modelo y i = Xi + Zi i + ei , pelos

31

mtodos de mxima verossimilhana, de mxima verossimilhana restrita, com a


suposio de que o vetor de respostas de cada unidade segue uma distribuio normal. Os
sistemas de equaes resultantes da aplicao desses mtodos, geralmente, requerem o
uso de procedimentos iterativos para a sua resoluo. Assim, a autora recorreu aos
procedimentos iterativos de Newton-Raphson, Score de Fisher e EM.
Schaalje et al. (1991) apresentaram um modelo para dados de medidas repetidas
provenientes de um delineamento em blocos casualizados no esquema split-block. Nesse
modelo, a parte aleatria formada por dois componentes independentes, que so os
erros associados a blocos e aos indivduos no l-simo tempo. Apresentaram seis
estruturas de covarincia para o componente aleatrio; a primeira dada pela estrutura de
mnimos quadrados ordinrios, em que u = 12It e w = 22It, com u = b + w , sendo w
a mdia dos erros independentes associados s unidades individuais e b erros
independentes associados aos blocos, e a ltima estrutura dada pela matriz no
estruturada (com o mximo de parmetros para u e w). Consideraram, tambm, as
estruturas de simetria composta e AR(1).
Liang & Zeger (1986) numa abordagem mais geral de modelos lineares
generalizados, com toda variabilidade em R, assumiram a forma bloco diagonal com
blocos Ri correspondendo s observaes do mesmo indivduo. Eles recomendaram
considerar uma coleo de estruturas de covarincias e, ento, escolher uma delas para
modelar Ri. O mtodo de estimao consiste da iterao entre estimativas de , pela
equao geral do modelo misto, e estimativas dos parmetros na estrutura selecionada.
Esse procedimento reduz-se ao da mxima verossimilhana, para o modelo linear misto
normal geral.
Martins et al. (1993, 1997) e Lopes et al. (1993) fornecem subsdios para uma
boa compreenso de modelos mistos. Com bastante rigor, abordam pontos fundamentais
sobre a metodologia e a utilizao de modelos mistos em gentica: discutem a
demonstrao da equao do modelo misto, as propriedades da soluo para efeitos fixos
e das predies para efeitos aleatrios, os mtodos de estimao como mnimos
quadrados, mxima verossimilhana, mxima verossimilhana restrita, estimadores

32

quadrticos MINQUE e MIVQUE, alm de fornecerem algumas provas de formas de


obteno desses estimadores e de apresentarem exemplos de aplicaes.
2.5 Seleo do Modelo e Testes
Aps a construo de alguns modelos plausveis para a representao das
observaes, inclusive com a escolha das estruturas de covarincia para os efeitos
aleatrios, alguns mtodos de seleo de modelos podem ser utilizados para auxiliar na
escolha do modelo que melhor se ajuste aos dados de certo experimento (Wolfinger,
1993 a).
Algumas tcnicas sero apresentadas a seguir para auxiliar na escolha do modelo
adequado. Ver Wolfinger (1993 a, b), Ogliari (1998) e Xavier (2000).
O teste da razo de verossimilhana (TRV) compara dois modelos de cada vez,
estimados por verossimilhana, sendo um dos modelos uma verso restrita do outro, ou
seja, um modelo tem r parmetros adicionais. O teste ir verificar se esses parmetros
adicionais melhoram significativamente o modelo. Definindo-se 1 o valor de = (-2 log
da funo de verossimilhana) para o modelo com o menor nmero de parmetros e 2
para o modelo com maior nmero de parmetros, modelo com r parmetros extras, a
hiptese a ser testada a de que os dois modelos so equivalentes (os parmetros extras
no diferem de zero). A diferena entre os valores 1 e 2 assintoticamente distribuda
como uma qui-quadrado com r graus de liberdade (Mood et al., 1974). A estatstica X2
calculada desta forma tem uma distribuio amostral, que segue uma distribuio quiquadrado, sendo que o nmero de graus de liberdade (r) dado pela diferena entre o
nmero de parmetros inseridos nas matrizes de covarincias dos dois modelos. Assim,
1 - 2 ~ 2r .
A desvantagem desse teste, embora seja bastante eficaz, que s pode ser usado
para comparar dois modelos de cada vez, sendo que um desses modelos sempre um
caso especial do outro (Guimares, 1994; Matsushita, 1994).

33

Uma outra possibilidade tomar duas vezes a inversa da matriz de derivada


segunda, isto , a matriz de informao de Fisher, para construir testes de qui-quadrado
associados estatstica de Wald dos parmetros de covarincias. Essa estatstica compara
dois modelos com efeitos fixos, um como caso especial do outro. Ela s calculada
quando se comparam diferentes modelos de covarincia, embora deva-se usar o mtodo
da mxima verossimilhana e no o da mxima verossimilhana restrita por que falta o
termo associado verossimilhana restrita que depende da especificao dos efeitos
fixos. Tal estatstica apresenta bom desempenho para grandes amostras, mas no
satisfatria para pequenas amostras, assim como para parmetros tais como componentes
de varincia que possuam distribuio amostral assimtrica (Bozdogan, 1987). Portanto,
segundo Shaalje et al. (1991) melhor, ao menos para modelos que so casos
particulares de outros modelos, como o caso de parametrizao sucessiva, construir testes
da razo de verossimilhana. No caso de modelos mistos conveniente utilizar a
verossimilhana restrita.
Segundo Bozdogan (1987), outro procedimento para a seleo das estruturas
consiste em minimizar os critrios de informao de mxima verossimilhana restrita.
Logo, o modelo escolhido ser aquele que possuir o menor valor para tais critrios. Esses
critrios esto fundamentados na teoria de deciso e penaliza os modelos com nmero
grande de parmetros para evitar excesso de parametrizao e so descritos como
seguem:
AICR = -2logLR + 2q

(11)

SBCR = -2logLR + qlog(n-p)

(12)

CAICR = -2logLR + q(log(n-p) + 1)


sendo LR a funo de verossimilhana restrita, q o nmero de parmetros de covarincias,
n o nmero de observaes, log logaritmo neperiano e p o posto da matriz X. Os
critrios esto ordenados em aumento de preferncia para parcimnia.
Na verdade, o teste de Wald pode ser utilizado para avaliar a significncia dos
efeitos fixos e o teste da razo de verossimilhana, para avaliar tanto os efeitos fixos
como os aleatrios em modelos encaixados, por intermdio da comparao de modelos
mais simples com os mais gerais. Quando os modelos no so encaixados, pode-se

34

utilizar o critrio de informao de Akaike. Alguns programas computacionais esto


disponveis para a anlise de dados longitudinais por meio de modelos de efeitos
aleatrios, dentre eles o Proc Mixed do SAS e BMDP-5V.
Podem-se, ainda, considerar combinaes lineares estimveis da forma B. As
estatsticas associadas a essas funes estimveis podem ser obtidas pelo teste de
hiptese B = . Quando B consiste de apenas uma linha, pode-se trabalhar com a
estatstica t de Student. Se e e tiverem distribuio normal, t ter uma distribuio t
exata para casos em que haja balanceamento ou para casos especiais de
desbalanceamento (Camarinha Filho, 1995). Em geral, t possui distribuio aproximada.
Quando o posto de B maior do que um, o Proc Mixed constri a estatstica F que,
analogamente t, F possui distribuio aproximada de F com nmero de graus de
liberdade no numerador igual ao posto[B]. Tais estatsticas permitem fazer inferncia a
respeito dos efeitos fixos, auxiliando na escolha do modelo de varincias e covarincias.
Formalmente, tem-se: para inferncias relativas aos parmetros de efeitos fixos e
aleatrios no modelo misto, consideram-se as combinaes lineares estimveis da
seguinte forma:

B = B .

Funes dessa natureza so ditas estimveis se a parte fixa satisfaz a exigncia


de estimabilidade, uma vez que qualquer combinao linear de estimvel. A
inferncia sobre efeitos fixos o foco e nesse caso, o vetor associado a B assumido
igual a zero. Inferncias estatsticas, portanto, podem ser obtidas para testar as hipteses
do tipo:

H : B = ,

ou para a construo de intervalos estimados.


Quando B consiste de apenas uma linha, uma estatstica t pode ser construda
como segue:

35

t=


B

B'
BC

Se considerarmos g como o nmero de graus de liberdade estimado, o intervalo


de confiana associado o seguinte:


B'
B t g , / 2 BC
,


sendo, t g , / 2 o percentil (1 - /2)% da distribuio t g . Quando o posto de B maior do
que 1, deve-se considerar a seguinte estatstica F :
'


B 1 B
B ' B' C
' B ' B ( X ' V 1 X ) B '

F=
ou F =
posto ( B )
posto(B)

(13)

Analogamente t, F, em geral, tem uma distribuio F aproximada com nmero


de graus de liberdade no numerador igual ao posto[B]. As estatsticas t e F permitem
fazer inferncias sobre os efeitos fixos, estimados para o modelo de varincia e
covarincia selecionado.

3 MATERIAL E MTODOS
3.1 Material
Com a finalidade de exemplificar a metodologia de modelos lineares mistos
exposta, dois exemplos (A e B) do tipo irrigao por asperso line-source sero
apresentados.
Recomenda-se uma leitura inicial nos exemplos 4 e 5, apresentados no Anexo
A , uma vez que tais exemplos so similares aos dois exemplos tratados neste captulo.
Os dados mostrados na Tabela 2, referentes ao Exemplo A, foram levemente
modificados do artigo de Hanks et al (1980). O experimento consiste em trs cultivares
de trigo de inverno aleatorizados em parcelas retangulares dentro de cada um dos trs
blocos. As parcelas esto localizadas lado a lado e uma linha de asperso disposta
cruzando perpendicularmente o meio dessas parcelas, dividindo-as em norte e sul. Cada
parcela, dependendo da imposio do comando subject do SAS, pode ser subdividida em
dez ou cinco subparcelas. A subparcela mais prxima linha de asperso recebe mais
gua (5), enquanto a mais distante, menos (1).
Tabela 2. Irrigao por asperso Line-Source. Dados referentes produtividade de trs cultivares de
trigo de inverno. Exemplo A.
BLOCO
1
1
1
2
2
2
3
3
3

CULTIVAR
LUKE
NUGAINES
BRIDGER
LUKE
NUGAINES
BRIDGER
LUKE
NUGAINES
BRIDGER

1
2,3
2,5
3,2
1,9
3,1
2,7
1,8
2,3
2,8

2
5,2
4,3
5,1
3,7
5,7
4,3
3,4
3,7
4,0

NORTE
3
6,7
6,3
6,9
5,4
6,4
6,9
4,6
5,8
5,0

4
7,3
7,9
6,1
5,8
7,7
6,8
4,9
6,3
5,2

5
6,8
7,1
7,5
5,9
6,8
8,0
4,7
6,3
5,2

5
5,5
6,2
5,6
6,8
6,3
6,5
5,3
6,5
5,9

4
6,3
5,3
6,5
6,2
6,2
7,3
4,3
5,7
6,1

SUL
3
6,6
5,3
6,6
6,1
6,6
5,9
5,2
5,8
6,0

2
6,4
5,2
5,3
5,9
6,5
6,6
4,6
4,5
4,3

1
3,4
5,4
4,1
3,4
4,2
3,0
3,6
2,7
3,1

37

O Exemplo B similar ao Exemplo A. Assim como visto no Apndice A, a


diferena entre os dois exemplos se encontra no plano experimental. No Exemplo B a
parcela correspondia ao nvel de irrigao, j no Exemplo A corresponde faixa onde
est plantada cada variedade dentro de cada bloco, de acordo com a Tabela 2. Dessa
forma, as parcelas so dispostas horizontalmente no Exemplo A e verticalmente no
Exemplo B. Para que se possa comparar os dois exemplos, os mesmos dados obtidos no
Exemplo A sero mantidos no Exemplo B, apenas com a mudana de posio das
observaes. Assim, a Tabela 3 informa o posicionamento desses dados no campo para o
Exemplo B.
Tabela 3. Irrigao por asperso Line-Source. Dados referentes distribuio das observaes dos trs
cultivares de trigo de inverno. Exemplo B.
NORTE

SUL

BLOCO

C1

C2

C1

C3

C1

C2

C1

C2

C1

C2

C2

C1

C3

C1

C2

C1

C3

C1

C2

C1

C3

C3

C2

C2

C3

C3

C2

C3

C3

C3

C3

C1

C3

C1

C2

C2

C1

C2

C3

C3

C1

C2

C2

C3

C1

C1

C3

C3

C1

C2

C2

C3

C1

C2

C3

C3

C2

C1

C2

C1

C1

C2

C2

C3

C2

C1

C2

C3

C2

C3

C2

C3

C1

C1

C3

C2

C3

C1

C1

C2

C3

C1

C3

C2

C1

C3

C1

C2

C3

C1

O cultivar LUKE corresponde a C1, NUGAINES corresponde a C2 e


BRIDGER corresponde a C3.
Esses exemplos, alm de serem bastante empregados na prtica, possibilitam
trabalhar com vrias estruturas para as matrizes G e R e considerar uma possvel
dependncia espacial entre as observaes.

38

3.2 Mtodos
O modelo utilizado nesses exemplos ser o exposto em (1). Assim,
y = X + Z + e,
em que,
ny1

o vetor de observaes referentes s produtividades;

nXp+1
p+11

a matriz de incidncia dos efeitos fixos (conhecida);

o vetor de efeitos fixos (cultivar, direo, irrigao e suas interaes)


desconhecido;

nZq
q 1
n e1

a matriz de incidncia dos efeitos aleatrios (conhecida);


o vetor de efeitos aleatrios (bloco e interaes com bloco) desconhecido;
o vetor de erros aleatrios,

Os fatores cultivar (C), direo (D) e irrigao (I) e suas possveis interaes,
associados ao termo X, so considerados fixos e bloco (B) e suas interaes com os
efeitos fixos, associados ao termo Z, so aleatrios.
A caracterizao do modelo pode ser assim definida:

yijks = + i + j + k + ij + ik + jk + ijk + bs + ais +cjs+dks + fijs +giks + hjks +eijks,


em que, uma constante inerente a todas as observaes, i o efeito do cultivar i
(i=1, 2 e 3), j o efeito da direo j (j=1 e 2), k o efeito do nvel k de irrigao (k=1,
2, 3, 4, 5 e 6), ij o efeito da interao cultivar com direo, ik o efeito da interao
cultivar com nvel, jk o efeito da interao direo com nvel, ijk o efeito da
interao cultivar com direo com nvel, bs o efeito aleatrio do bloco s (s=1, 2 e 3),
ais o efeito aleatrio da interao bloco com cultivar, cjs o efeito aleatrio da
interao bloco com direo, dks o efeito aleatrio da interao bloco com nvel, fijs o
efeito aleatrio da interao bloco com cultivar com direo, giks o efeito aleatrio da
interao bloco com cultivar com nvel, hjks o efeito aleatrio da interao bloco com
direo com nvel e eijks o efeito residual. Sendo que bs ~ N(0, b2), ais ~ N(0, a2),
cjs ~ N(0, c2), dks ~ N(0, d2), fijs ~ N(0, f2), giks ~ N(0, g2), hjks ~ N(0, b2) e
eijks ~ N(0, 2).

39

Um ajuste do modelo misto utilizando estimadores de mxima verossimilhana


restrita foi executado, com auxlio do SAS, para verificar se h algum componente de
varincia cuja estimativa no difere de zero, com o intuito de reduzir o modelo inicial
composto por sete componentes de varincia.
Aps a caracterizao do modelo geral foram inseridas estruturas de varincias
e covarincias em G e R. Alm disso, foram impostas, segundo a opo subject, dentro
do comando RANDOM do Proc Mixed do SAS (Littel at al., 1996), as formas com que
se verificam as dependncias espaciais para a obteno dessas matrizes. Cada uma
dessas especificaes do modelo geral, segundo a estrutura e a forma de dependncia,
caracterizou um modelo especfico. Dessa forma, 29 modelos foram criados, segundo a
Tabela 4, para o Exemplo A e 16 modelos para o Exemplo B, conforme a Tabela 5.
Tabela 4. Modelos Especficos conforme a Estrutura de Varincia e Covarincia (Exemplo A).
Modelo
1A
2A
3A
4A
5A
6A
7A
8A
9A
10 A
11 A
12 A
13 A
14 A
15 A
16 A
17 A
18 A
19 A
20 A
21 A
22 A
23 A
24 A
25 A
26 A
27 A
28 A
29 A

MATRIZ G
VC(B)
VC(B)
VC(B)
VC(B)
VC(B)
VC(B)
VC(B)
VC(B BD)
VC(B BD)
VC(B BI)
VC(B BD BI)
VC(B BC BD BI
BCD BCI BDI)
AR(1)
SP(POW)
AR(1)
TOEP(3)
AR(1)
TOEP(3)
AR(1)
AR(1)
SP(POW)
SP(POW)

Subject G
B
B
B
B
B
B
B
B
B
B
B
B

MATRIZ R
I
AR(1)
TOEP(5)
AR(1)
TOEP(5)
SP(POW)
SP(POW)
I
AR(1)
TOEP(5)
AR(1)
TOEP(5)
SP(POW)
SP(POW)
AR(1)
TOEP(5)
TOEP(5)
TOEP(5)
I

Subject R
BCDI
BCD
BCD
BC
BC
D
1
BCDI
BCD
BCD
BC
BC
D
1
BCD
BC
BC
BC
BCDI

B
B
B
B
B
B
B
B
D
1

I
I
AR(1)
AR(1)
AR(1)
AR(1)
TOEP(5)
TOEP(5)
I
I

BCDI
BCDI
BCD
BCD
BC
BC
BCD
BC
BCDI
BCDI

Observao
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS

n total de parmetros (q)


1
2
5
2
5
2
2
2
3
6
3
6
3
3
4
7
7
8
8
3
3
4
5
4
7
7
7
8
8

40

Tabela 5. Modelos Especficos conforme a Estrutura de Varincia e Covarincia (Exemplo B).


MODELO
1B
2B
3B
4B
5B
6B
7B
8B
9B
10 B
11 B
12 B
13 B
14 B
15 B
16 B

MATRIZ G
VC(B); AR(1)
VC(B); SP(POW)
VC(B); TOEP(4)
VC(B); AR(1)
VC(B); AR(1)
VC(B); TOEP(4)
VC(B); TOEP(4)
VC(B); TOEP(4)
AR(1)
SP(POW)
TOEP(4)
AR(1)
AR(1)
TOEP(4)
TOEP(4)
TOEP(4)

Subject G
B; BC
B; BC
B; BC
B; BC
B; BC
B; BC
B; BC
B; BC
BC
BC
BC
BC
BC
BC
BC
BC

MATRIZ R
I
I
I
AR(1)
AR(1)
AR(1)
TOEP(4)
SP(POW)
I
I
I
AR(1)
AR(1)
AR(1)
AR(1)
TOEP(4)

Subject R
BCDI
BCDI
BCDI
BDI
BI
BDI
BDI
1
BCDI
BCDI
BCDI
BDI
BI
BDI
BI
BDI

Observao
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS
TRIPLA/DUPLAS

n total de parmetros (q)


4
4
6
5
5
7
8
7
3
3
5
4
4
6
6
8

Com a finalidade de se verificar qual o modelo que melhor se ajusta aos dados,
utilizou-se o teste da razo de verossimilhana e o critrio de Akaike (Bozdogan, 1987),
conforme o subitem 2.5.
Os resultados das anlises para cada um dos modelos foram comparados por
intermdio das tabelas da anlise de varincia fornecidas pelo Proc Mixed do SAS, com
o intuito de verificar se h mudanas nas concluses para os efeitos fixos. A tabela geral
da anlise pode ser assim descrita:
Tabela 6. Esquema Geral da Anlise de Varincia.
Causas de Variao
g.l.
CULTIVAR (C)
i-1
DIREO (D)
j-1
C*D
(i-1)(j-1)
IRRIGAO (I)
C*I
D*I
C*D*I

k-1

'

F = o B ' B ( X ' V 1 X ) B '

B o / posto (B )

(i-1)(k-1)
(j-1)(k-1)
(i-1)(j-1)(k-1)

Sendo B a matriz associada hiptese estatstica Ho: B = 0, conforme visto no


subitem 2.5, de acordo com o efeito a ser testado.
As programaes referentes aos resultados dessas anlises encontram-se no
anexo B.

4 RESULTADOS E DISCUSSO
Uma anlise preliminar do Exemplo A, com base na Tabela 4, indica que a
interao tripla no foi significativa em nenhum dos 29 modelos estudados. Assim,
optou-se em trabalhar, em busca dos resultados, com todos esses modelos sem a incluso
dessa interao, mantendo-se, no entanto, todas as interaes duplas. A Tabela 7 contm,
resumidamente, os resultados das anlises dos modelos do Exemplo A, que auxiliaro
nas discusses sobre tais resultados.
Ressalta-se que, na verdade, caso no fosse excluda a interao tripla, as
concluses referentes aos efeitos fixos, foco principal deste trabalho, no sofreriam
modificaes para esse exemplo. Porm, o procedimento de se retirar essa interao,
alm de estar correto, busca simplificar o modelo proposto para anlise dos dados da
Tabela 2.
Como visto no Anexo A, espera-se que qualquer estrutura de varincias e
covarincias, proposta para a matriz R, diferentemente da padro I2, melhore
significamente o ajuste do modelo aos dados, visto que coerente pensar em correlao
entre as subparcelas, especificadas no Exemplo A pelos nveis de irrigao.
Pela anlise da Tabela 7, nota-se que essa tese realmente se verifica. Pois, as
comparaes dos Modelos 2A ao 7A com o Modelo 1A (Modelo mais simples: sem
efeitos aleatrios e R=I2), executadas por intermdio de Testes da Razo de
Verossimilhana, indicam que a incluso de parmetros de covarincia nesses modelos
foi significativa, devendo, portanto, permanecer nos modelos. Para ilustrar, tome-se a
comparao do Modelo 2A com o Modelo 1A que resulta num valor de qui-quadrado
igual a 23,7, valor bem superior ao fornecido pela tabela de qui-quadrado com 1 grau de
liberdade e 0,01 de significncia, que de 6,6. A hiptese estatstica verifica se os

42

modelos no diferem. Como 23,7 est inserido na regio de rejeio, conclui-se que o
Modelo 1A difere do Modelo 2A. Logo, deve-se escolher o modelo com a estrutura de
covarincia AR(1). De fato, pela informao do Critrio de Akaike (AIC), visto em 2.5,
o Modelo 1A fornece um ajuste inferior ao Modelo 2A, 205,5 contra 187,0.
Tabela 7. Testes da Razo de Verossimilhana Restrita, Critrio de Akaike e Teste para
os Efeitos Fixos para os Modelos do Exemplo A, sem a interao tripla.
Modelo

1A
2A
3A
4A
5A
6A
7A
8A
9A
10 A
11 A
12 A
13 A
14 A
15 A
16 A
17 A
18 A
19 A
20 A
21 A
22 A
23 A
24 A
25 A
26 A
27 A
28 A
29 A

Matriz
G
-

Subject
G

Modelos
Comparados

8A

0,7

C**, I** e DxI**

3
3
4
5
4
5
7
7
3
3

1A e 8A
1A
9A
2A e 9A
11A
11A
19A
19A
1A
1A

27,7** e 0
27,7**
0
13,2** e 3,1
0
4,5
13,0**
13,5**
0
0

C**, I** , DxI** e D*


C**, I** , DxI** e D*
C*, I** e DxI**
I** e DxI**
* **
C , I e DxI**
I** e DxI**
* **
C , I e DxI**
C*, I** e DxI**
-

Subject
R

-2LR

Akaike

Matriz
R
I

BCDI

AR(1)

BCD

TOEP(5)

BCD

AR(1)

BC

203,6
183,0
174,9
184,0

205,6
187,0
184,9
188,0

TOEP(5)

SP(POW)
SP(POW)

172,3
189,2
1
189,3
BCDI 175,9
BCD 172,9
BCD 162,9
BC
174,0
BC
162,4
D
175,9
1
175,8
BCD 161,8
BC
161,8
BC
162,4
BC
161,8

182,3
193,2
193,3
179,9
178,9
174,9
180,0
174,4
181,9
181,8
175,8
175,8
174,4
175,8

1
I** e DxI**
**
2
1A
23,7
I** e DxI**
**
*
5 1A e 2A 28,7 e 8,1
I** e DxI**
**
2
1A
19,6
I** e DxI**
**
**
5 1A e 4A 31,3 e 11,7
I** e DxI**
**
2
1A
14,4
2
1A
14,3**
2
1A
27,7**
C**, I** , DxI** e D*
3
2A
10,1**
I** e DxI**
**
* **
6
9A
10,0
C , I e DxI**
**
3
4A
10,0
C*, I** e DxI**
**
**
6 5A e 11A 9,9 e 11,6
C*, I** e DxI**
**
** **
3
6A
13,3
C , I , DxI**e D*
**
3
7A
13,5
C**, I** , DxI**e D*
7
12A
0,6
C*, I** e DxI**
7
12A
0,6
C*, I** e DxI**
7
12A
C*, I** e DxI**
0
8 12A e 16A
0,6 e 0,6
C*, I** e DxI**

175,2

183,2

175,9
BCDI 175,9
BCD 172,9
BCD 169,8
BC
174,0
BC
169,5
BCD 162,9
BC
162,4
BCDI 203,6
BCDI 203,6

179,9
179,9
178,9
179,8
180,0
179,5
174,9
174,4
207,6
207,6

VC(B)

VC(B)

AR(1)

VC(B)

TOEP(5)

VC(B)

AR(1)

VC(B)

TOEP(5)

VC(B)

SP(POW)
SP(POW)

BC
D

VC(B)

VC(B BD)

AR(1)

VC(B BD)

TOEP(5)

VC(B BI)

TOEP(5)

VC(B BD
BI)
VC(B BC
BD BI
BCD BCI
BDI)
AR(1)

TOEP(5)

BCDI

BCDI

SP(POW)

AR(1)

AR(1)

TOEP(3)

AR(1)

AR(1)

AR(1)

TOEP(3)

AR(1)

AR(1)

TOEP(5)

AR(1)

TOEP(5)

SP(POW)

SP(POW)

* 0,01<p<0,05 e ** p<0,01

Efeitos fixos

43

Embora existam diferenas entre os valores de AIC entre os sete primeiros


modelos, indicando uma preferncia ao Modelo 5A, nota-se que as concluses em
relao aos efeitos fixos so idnticas. Ou seja, apenas os efeitos de irrigao e da
interao direo e irrigao (DxI) so significativos. Conclui-se, ento que, pelo menos
at o momento, e para esse exemplo, apenas a estrutura de covarincia, inserida em R,
no proporciona diferenas nas concluses sobre os efeitos fixos.
Estudando-se, agora, incluses das estruturas de varincias e covarincias em G,
verifica-se, a princpio, que qualquer estrutura de componentes de varincia (VC) resulta
numa incluso significativa, seja qual for o efeito aleatrio adicionado ao modelo, o que,
conseqentemente, proporciona um melhor ajuste do modelo. Tal significncia pode ser
observada pela comparao do Modelo 8A com o Modelo 1A, Modelo 9A com o
Modelo 2A, Modelo 16A com o Modelo 5A ou, ainda, Modelo 17A com o Modelo 5A,
entre outros. Porm, neste momento, verificam-se diferenas importantes sobre as
concluses dos efeitos fixos, de acordo com o modelo escolhido, ao contrrio dos
modelos em que h correlaes apenas no resduo. Nota-se que o Modelo 8A indica uma
diferena significativa, com uma probabilidade menor que 0,01, para os efeitos da
interao DxI, de cultivar e de irrigao e, com uma probabilidade prxima a 0,03, para
o efeito de direo, diferentemente do Modelo 1A. Mas, como visto anteriormente, as
estruturas de varincias e covarincias em R devem permanecer no modelo. Assim,
estudando-se os modelos que possuam estruturas de varincias e covarincias em G e R,
v-se que, mesmo assim, tais diferenas continuam a ocorrer. Pois, enquanto no modelo
9A h significncia apenas para os efeitos da interao DxI e de irrigao, no Modelo
15A, alm desses dois efeitos, o efeito de cultivar tambm mostra-se significativo
(p<0,05).
Percebe-se, portanto, que a caracterizao do efeito de bloco como fixo ou
aleatrio, acarreta em concluses distintas em relao aos efeitos fixos e, tambm,
notam-se resultados conflitantes caso se estabelea uma estrutura de varincias e
covarincias para G e R. Alm disso, conforme mudam-se essas estruturas, tanto em G,
quanto em R, as diferenas significativas dos efeitos fixos, segundo as anlises de
varincias, se modificam.

44

Visto que as estruturas de varincias e covarincias devem estar presentes em G


e R, busca-se agora verificar qual dentre esses modelos melhor se ajusta aos dados.
Assim, de acordo com o Teste da Razo de Verossimilhana (TRV), comparando-se o
Modelo 12A com o Modelo 11A, v-se que h diferena significativa entre esses
modelos. Logo, conclui-se que a incluso de mais trs parmetros de covarincia no
modelo, R=TOEP(5), em vez de R=AR(1), significativa (p<0,01), com um valor de
qui-quadrado igual a 11,6. O mesmo ocorre na comparao entre o Modelo 9A com o
Modelo 10A. Portanto, espera-se que o modelo que melhor se ajuste s observaes seja
o Modelo 12A, com G=VC(B) e R=TOEP(5), com subject R igual a BC. Ou seja, a
matriz G com estrutura de componentes de varincia para blocos, portanto sem
covarincia; a matriz R com estrutura toeplitz com cinco bandas e com subject BC,
indicando que a correlao ocorre dentro de cada linha onde esto plantados cada
cultivar. Por exemplo, bloco 1 e cultivar 1 (B1C1) est especificando a primeira linha.
Assim, as ausncias de D e I no subject indicam que tanto D quanto I so dependentes.
Em relao correlao entre parcelas, espera-se que no haja tal correlao,
uma vez que, sendo as parcelas dispostas nas linhas, segundo a Tabela 2, correlaes
entre os cultivares no seriam plausveis. Mesmo assim, optou-se em forar a
existncia de correlaes desse tipo, introduzindo programao do Proc Mixed
estruturas de varincias e covarincias em G, diferentes das estruturas diagonais (VC), a
fim de se verificarem as conseqncias dessas imposies.
Numa anlise inicial, o TRV resulta em diferena significativa para as
comparaes entre o Modelo 1A, sem estrutura de correlao em G, com os Modelos
20A ou 21A, que possuem correlao em G. Porm, tais diferenas no se devem ao
fato de realmente existirem correlaes, mas sim, pela razo dos modelos que possuem
tais estruturas de correlao, impostas pelos programadores, recarem em modelos mais
simples, com ausncia de correlao, do tipo componentes de varincia. Assim, verificase que o Modelo 21A, com estrutura espacial, recai no Modelo 20A, com estrutura autoregressiva, que, por sua vez, recai no Modelo 8A, com estrutura de componentes de
varincia. Da mesma forma, ao se comparar o Modelo 2A com o Modelo 23A, nota-se
que a incluso da estrutura TOEP(3) significativa. Mas, na verdade, v-se que, dentre

45

as variabilidades existentes na estrutura TOEP(3), h a variabilidade de bloco de forma


implcita. Logo, a diferena realmente existe, mas se deve ao efeito de bloco e no de
possveis covarincias.
Portanto, ressalta-se, neste momento, a importncia de se conhecer o tipo de
experimento analisado. Pois, um pesquisador menos atento, pode recair no erro de
concluir que existe uma estrutura em G, com presena de correlao, pelo simples fato
de comparar, por exemplo, o Modelo 1A com o Modelo 20A.
Nesse contexto, observa-se que os Modelos 6A e 7A, com estruturas espaciais
para R, diferem em relao ao Modelo 1A, implicando em parmetros espaciais
significativos. Mas possuem os maiores valores de informao de Akaike, indicando o
pior ajuste entre os demais modelos. Esse fato se justifica porque a correlao espacial,
nesses casos, se d em todas as direes (subject = D ou 1). Dessa forma, admite-se uma
covarincia entre os cultivares, o que, em tese, no se espera.
Agora, caso a imposio dessas estruturas espaciais for na matriz G, como nos
Modelos 27A e 28A,

tais modelos recaem no Modelo 1A. Portanto, incorporar

estruturas ainda mais complexas em G, para o Exemplo A, alm de no proporcionar


nenhum ganho, no far nenhum sentido, resultando na volta ao modelo mais simples.
Possivelmente, far algum sentido para o Exemplo B.
O tratamento dado ao Exemplo B ser similar ao Exemplo A. A Tabela 8 contm
os resultados referentes a modelos sem a presena de interao tripla, uma vez que essa
no foi considerada significativa.
Os Testes da Razo de Verossimilhana indicam que tentar modelar o resduo
diferentemente de I2, no resulta em diferenas significativas entre os modelos, como
mostram as comparaes entre os Modelos 1B e 4B ou entre os Modelos 3B e 6B.
Embora no existam diferenas entre os modelos, esse fato no permite observar os
quadros de anlise de varincia para os dois modelos, como se esses resultassem nas
mesmas concluses para os efeitos fixos. Assim, nota-se que os Modelo 3B e 6B no
fornecem os mesmos resultados. Ressalta-se, ento, a importncia da interpretao do
TRV. Na verdade o teste verifica se parmetros de correlao devem ser inseridos em R.
Como no h diferena entre os modelos, tais parmetros no resultam em melhoria no

46

ajuste. O que, nesse caso, a informao do Critrio de Akaike reitera, 181,0 para o
Modelo 3B contra 182,6 para o Modelo 6B.
Com respeito incluso de efeitos aleatrios no modelo, portanto na matriz G,
observa-se que apenas o efeito aleatrio de bloco significativo. Caso interprete-se os
resultados das anlises de varincia com todos os possveis efeitos aleatrios, efeitos das
interaes duplas e triplas, v-se que h significncia para os efeitos fixos de I e DxI,
enquanto que para o modelo apenas na presena do efeito aleatrio de bloco indica
significncia dos efeitos fixos C, I, DxI e D.
Tabela 8. Testes da Razo de Verossimilhana Restrita, Critrio de Akaike e Teste para
os Efeitos Fixos para os Modelos do Exemplo B, sem a interao tripla.
Modelo

Matriz
G

Subject
G

Matriz R

Subject
R

-2LR

Akaike

Modelos
Comparados

Efeitos fixos

1B

VC(B);
AR(1)
VC(B);
SP(POW)
VC(B);
TOEP(4)
VC(B);
AR(1)
VC(B);
AR(1)
VC(B);
TOEP(4)
VC(B);
TOEP(4)
VC(B);
TOEP(4)
AR(1)
SP(POW)
TOEP(4)
AR(1)
AR(1)
TOEP(4)
TOEP(4)
TOEP(4)

B; BC

BCDI

174,2

182,2

I** , DxI** e D*

B; BC

BCDI

174,6

182,6

I** , DxI** e D*

B; BC

BCDI

169,0

181,0

I** , DxI** e D*

B; BC

AR(1)

BDI

173,8

183,8

1B

0,6

I** , DxI** e D*

B; BC

AR(1)

BI

171,6

181,6

1B

2,6

I** e DxI**

B; BC

AR(1)

BDI

168,6

182,6

3B

0,4

I** e DxI**

B; BC

TOEP(4)

BDI

168,3

184,3

3B

0,7

I** e DxI**

B; BC

SP(POW)

BC
BC
BC
BC
BC
BC
BC
BC

I
I
I
AR(1)
AR(1)
AR(1)
AR(1)
TOEP(4)

BCDI
BCDI
BCDI
BDI
BI
BDI
BI
BDI

1B
2B
3B
4B
5B
6B
-

4,5*
4,8*
4,7*
4,4*
4,4*
4,3*
-

2B
3B
4B
5B
6B
7B
8B
9B
10 B
11 B
12 B
13 B
14 B
15 B
16 B

178,7
179,4
173,7
178,2
176,0
172,9
169,3
172,8

184,7
185,4
183,7
186,2
184,0
184,9
181,3
186,8

3
3
5
4
4
6
6
7

I** , DxI** e D*
I** , DxI** e D*
I** , DxI** e D*
I** e DxI**
I** e DxI**
I** e DxI**
I** e DxI**
I** e DxI**

Comparando-se os Modelos 9B, 10B ou 11B ao modelo mais simples, apenas


com R=I2, verifica-se que estruturas com correlaes em G mostram-se significativas.
Alm disso, pela comparao entre os Modelos 1B, 2B e 3B com os Modelos 9B, 10B e
11B, respectivamente, com a finalidade de verificar se a incluso de VC(B)

47

significativa, certifica-se que VC(B) deve permanecer no modelo, mesmo que as


concluses para os efeitos fixos sejam as mesmas.
Nota-se que os Modelos 12B ao 14B, que possuem parmetros de correlao para
R e G, em suas estruturas, resultam, tambm, em diferentes concluses para os efeitos
fixos, quando comparados aos seus modelos similares, os Modelos 4B ao 6B,
respectivamente.
No que se refere ao Critrio de Akaike, convm salientar que esse critrio deve
ser observado com certa cautela. Pois, ao se comparar, isoladamente, os Modelos 5B e
9B, poder-se-ia imaginar que, segundo o Critrio de Akaike, o Modelo 5B seria o mais
adequado, pois o valor de AIC para o Modelo 5B inferior. Porm, numa anlise
preliminar sabe-se que R no aceita correlao. O que poderia justificar tal contradio
a presena, no Modelo 5B, de VC(B) em G, que contribuiria mais para o ajuste que a
ausncia de correlao em R, no Modelo 9B.
Nesse contexto, aps uma anlise criteriosa, o modelo escolhido, dentre os
dezesseis propostos, deve ser o Modelo 3B.
Ressalta-se, tambm, que s vezes o teste para efeitos aleatrios, fundamentado
na Estatstica de Wald, no apresenta concordncia com o TRV. Nesses casos deve-se
dar preferncia ao TRV.
Confirma-se, portanto, nesse exemplo, que h correlao entre as parcelas, mas
no h entre as subparcelas. Alm de ratificar que escolhas inadequadas para G podem
refletir, consideravelmente, sobre as concluses a respeito dos efeitos fixos.
Finalmente, outro aspecto de interesse refere-se comparao dos resultados
entre os dois exemplos. Mesmo que os dois experimentos possuam as mesmas
observaes, nota-se, por exemplo, que para modelos similares como os Modelos 22A e
12B, as concluses a respeito dos efeitos fixos divergem. Nesse contexto, salienta-se a
importncia da correta programao do Proc Mixed, principalmente no que se concerne
ao comando subject.

5 CONCLUSES
Com base nos resultados obtidos, pde-se ratificar a importncia dos
pesquisadores conhecerem as variabilidades envolvidas entre as observaes. Notou-se
que ao desconhecerem tais itens, suas anlises podem ser severamente comprometidas.
Nesse contexto, observou-se que a incluso do efeito aleatrio de bloco
aumentou, sensivelmente, a significncia dos teste de hipteses, comprovada, por
exemplo, pela comparao do Modelo 1A com o Modelo 8A. Alm disso, a escolha
inadequada das estruturas de varincias e covarincias refletiu em concluses
divergentes em relao significncia dos efeitos fixos, visto pela comparao entre o
Modelo 12A com o Modelo 23A ou, ainda, entre o Modelo 3B com o Modelo 9B.
Outro fato importante ocorreu na interpretao dos valores do Critrio de
Informao de Akaike (AIC). Aps uma anlise criteriosa com o auxlio do Teste da
Razo de Verossimilhana (TRV), o AIC ratificou as concluses obtidas. Porm, a
utilizao do AIC, diretamente, para escolha do modelo que melhor se ajusta aos dados
se mostrou ineficaz, como demostrado na comparao entre os Modelos 5B e 9B.
Destacou-se, tambm, o fato de ao se incorporar, erroneamente, estruturas com
parmetros de covarincia no modelo, implicou em diferenas que no se devem s
correlaes, mas, sim, ao efeito aleatrio de bloco, como constatou-se no estudo do
Modelo 21A ou do Modelo 23A.
Enfim, salientou-se a importncia da correta programao do Proc Mixed.
Notou-se que modelos similares como os Modelos 22A e 12B, acarretam em diferentes
concluses a respeito dos efeitos fixos.

ANEXOS

50

ANEXO A
(Modelo Linear Fixo, Aleatrio e Misto)

Em anlise estatstica, efeitos aleatrios e fixos so tratados de forma especfica,


portanto, um claro entendimento dessas diferenas e similaridades necessrio e propicia
uma modelagem mais adequada de um experimento.
Assume-se que a relao entre a varivel dependente e os fatores linear nos
parmetros. Dessa forma, modelos lineares nos parmetros fornecem uma estrutura
apropriada para estudar a relao entre a varivel dependente (resposta) e uma ou mais
variveis independentes (fatores ou covariveis).
Cinco exemplos so apresentados a fim de se tornarem claras as diferenas entre
os modelos de efeitos fixos, aleatrios e mistos. O primeiro relaciona-se com o modelo
fixo, o segundo com o aleatrio e os trs ltimos com o modelo linear misto, sendo que
os dois ltimos sero tratados matricialmente buscando, assim, mostrar claramente todas
as matrizes envolvidas nos experimentos.
Admite-se neste trabalho que, tanto o efeito residual quanto os efeitos aleatrios
tm distribuio normal.
O Exemplo 1 clssico em agricultura, que consiste em testar a eficincia do
nitrognio (N), fsforo (P) e potssio (K) na produtividade de milho. Suponha que tem-se
24 plantas, com 6 plantas recebendo nitrognio, 6 potssio, 6 fsforo e 6 formando o
grupo controle, portanto, sem adubao (S/A). Um modelo plausvel para analisar esse
experimento seria:
y ij =+ i +e ij ;

51

sendo, yij a j-sima observao do tratamento i, uma constante inerente a todas as


informaes, i o efeito do tratamento i e eij o erro experimental com certa distribuio
de probabilidade. Nesse exemplo, eij ~ N(0, 2). Dessa forma, yij~N(+i, 2).
A caracterizao do modelo em fixo ou aleatrio est, fundamentalmente, na
suposio que lhe atribuda e, conseqentemente, no interesse do pesquisador. Dessa
forma, se a suposio desse modelo for de que a expectativa de cada observao seja
distinta para cada um dos quatro tratamentos principais e que a variabilidade seja
modelada apenas pela varivel aleatria eij, de preferncia de maneira que haja
homocedasticidade. Tem-se, assim, um modelo de efeito fixo. Como conseqncia,
podese pensar em estimar, por exemplo, 1 - 2, ou, analogamente testar Ho:1-2 = 0.
Nota-se, portanto, que o interesse, nesse caso, de se compararem os 4 tratamentos em
relao a suas expectativas, no caso o parmetro i = + i, representando a mdia de
cada um dos tratamentos. V-se, ento, que a comparao se dar somente entre os 4
tipos de adubao, previamente escolhidos, de acordo com o interesse do pesquisador.
Como E(Yij) =+i, tem-se que, dentro do tratamento 1 (Nitrognio), o valor
esperado E(Y1j)=+1=1 constante. Teoricamente, espera-se, portanto, que qualquer
que seja a realizao da varivel aleatria Y1j , seu valor seja 1. Dessa forma, os valores
y1j deveriam ser constantes e iguais a 1, mas, na prtica observam-se diferentes valores
dentro de cada um dos quatro tratamentos. Tal diferena se deve a diversos fatores no
controlveis, os quais geram um rudo em torno de E(Y1j). Essa variabilidade denotada
por efeito do acaso e pode ser quantificada pela soma de quadrados dos desvios das
observaes em relao s mdias dentro de cada um dos tratamentos, que para o modelo
de efeitos fixos, chama-se resduo. Logo, a diferena observada entre quaisquer
observaes dentro de um dado tratamento est associada apenas ao resduo, denotado
por 2. Tomando-se como a constante inerente a todos os tratamentos, por exemplo a
mdia geral, tem-se que a distncia observada entre um certo ponto de um dado
tratamento e essa mdia se deve ao efeito causado pelo tratamento e, tambm, ao acaso
(2+2). Agora, se diferena em estudo for verificada entre os tratamentos, por exemplo,
entre o tratamento com fsforo e o tratamento sem adubao, tem-se que tal diferena

52

ocorre devido aos efeitos inerentes aos dois tratamentos e aos fatores no controlveis
que esto presentes no resduo (3 - 4 + 22).
O Exemplo 2, est associado eficincia de um antibitico aps dois anos de
estocagem. Quatro lotes da droga so coletados aleatoriamente de uma populao de
lotes disponveis. Em cada um dos lotes, tem-se uma amostra de tamanho dois. A
concentrao do princpio ativo do antibitico medida e ser a varivel resposta. Os
objetivos desse experimento podem ser: determinar (estimar) a concentrao mdia geral
e, tambm, se o lote, aleatrio, tem um efeito significativo na variabilidade da resposta.
Um modelo para a anlise desse experimento pode ser:
y ij =+b i +e ij ,

sendo, yij o peso da j-sima amostra do i-simo lote, bi o efeito devido ao i-simo lote e
eij o erro experimental, com i=1, 2, 3, 4 e j=1,2.
Nesse exemplo, pode-se supor que a expectativa para cada yij dos 4 lotes a
mesma, ou seja, E(Yij) = . Agora, em relao ao Exemplo 1, h mais um componente de
perturbao no modelo, uma variabilidade adicional, alm daquela inerente ao resduo.
Tal variabilidade est inserida em cada um dos quatro lotes com duas amostras cada.
Assim, o termo bi ser uma varivel aleatria, aqui denotada por efeito aleatrio,
possuindo certa distribuio de probabilidade. Nesse exemplo, admite-se que bi~N(0,
2b). Logo, V(Yij)=2b +2. Espera-se, portanto, o mesmo valor, qualquer que seja o lote,
porm, a varincia de yij no ser modelada apenas em funo de eij, mas tambm por bi.
Dessa forma, yij ~ N(, 2b+2).
De forma anloga ao discutido para o Exemplo 1, pode-se discutir a respeito das
diferenas existentes entre as realizaes das variveis aleatrias.
A variabilidade proporcionada por fatores no controlveis denotada por efeito
do acaso, que no exemplo em questo possui fontes com diferentes intensidades, uma
associada ao resduo padro, que ocorre dentro de cada lote, e outra gerada pela mudana
de lote, denotada por efeito aleatrio de lote.
Nesse contexto, as amostras dentro de certo lote recebem pequenas flutuaes dos
fatores no controlveis, como por exemplo temperatura, presso e umidade. Logo, as

53

medidas das variveis sofrem alteraes mnimas. Porm, comparando-se essas


alteraes entre drogas produzidas em lotes diferentes, plausvel supor que as
flutuaes sofridas so maiores que dentro de um mesmo lote. Portanto, tem-se um
acrscimo de variabilidade na comparao de lotes distintos. Ou seja, V[Yij Yij] >
V[Yij Yij], quando i i e j j.
V-se que, similarmente, ao Exemplo 1, a diferena observada dentro de cada
lote, deve-se apenas ao resduo, 2. Porm, a diferena fundamental entre o modelo fixo
e aleatrio ocorre quando estuda-se a distncia das observaes entre os lotes ou, ainda, a
distncia entre qualquer observao e a mdia geral . Enquanto, no modelo fixo a
distncia entre as observaes de grupos distintos estava associada com (3 - 4) +22, no
modelo aleatrio essa diferena est associada com 2(2b +2). Assim, nota-se que no
modelo fixo os parmetros de locao, presentes em cada grupo, contribuem para a
existncia das distncias observadas, juntamente com o parmetro de disperso medido
por 2. J para o modelo aleatrio apenas os parmetros de disperso, um associado ao
resduo e outro aos lotes, geram a diferena observada entre as realizaes da varivel
aleatria Yij.
O Exemplo 3 consiste no estudo da habilidade maternal de 4 fmeas de sunos.
Tal habilidade medida em funo do peso da ninhada aps 10 dias do nascimento. Seis
ninhadas de cada uma das 4 fmeas, todas da mesma raa, constituem os dados. Trs
dietas especficas, conforme a gestao, foram includas em cada duas ninhadas de cada
fmea. A finalidade, agora, a de compar-las. Dessa forma, analogamente ao Exemplo
1, supe-se que a expectativa difere para cada peso de ninhada, de acordo com a dieta
utilizada, permanecendo as variabilidades iguais, caracterizando, portanto, o efeito fixo
para dieta. Um modelo a ser utilizado pode ser:

y ijk = + f i + j + g ij + e ijk ,
sendo, j o efeito fixo de dietas, fi, um efeito aleatrio da fmea, gij o efeito aleatrio de
interao entre fmea e dieta. Logo, diz-se que tal modelo misto, uma vez que possui
efeitos aleatrios e fixos.

54

Nota-se, no contexto de modelo misto, que as diferenas observadas possuem


componentes fixos e aleatrios. Por exemplo, tomando-se a diferena entre as
observaes y211 e y222, ou seja, a diferena dos pesos das ninhadas entre as dietas 1 e 2
da fmea 2, tem-se que essa distncia associa-se com 1-2 +2(2g +2). Estudando-se a
diferena entre as dietas 2 e 3 concomitantemente entre as fmeas 1 e 4, tem-se que tal
diferena associa-se com 2-3+ 2(2f+2g +2).
O Exemplo 4, trata-se de um experimento de irrigao por asperso LineSource, bastante utilizado na prtica. Na verdade os nveis de irrigao no podem ser
aleatorizados, o que descaracteriza o esquema split-plot clssico. Porm, h correlao
entre medidas dos nveis vizinhos de irrigao. Essa quantidade de irrigao comporta-se,
em tese, na anlise como o tempo num experimento de medidas repetidas.
O objetivo desse experimento comparar a produtividade de trs variedades de
milho sob diversos nveis de irrigao.
Devido ao planejamento experimental, as subparcelas (variedades) so
independentes, pois se encontram num mesmo nvel de irrigao, e as parcelas
dependentes, uma vez que pertencem a nveis distintos de irrigao.
Os dados desse exemplo, mostrados no Anexo B, so de Johnson et al. (1983).
Todas as matrizes envolvidas nesse experimento sero explicitadas e explicadas. Para
tanto, torna-se necessrio reduzir o experimento original, do artigo citado, a fim de
diminuir as dimenses dessas matrizes para que facilite uma visualizao global de todo
experimento. Assim, sero retirados do experimento original, o quarto bloco e os nveis
de irrigao 5 ao 8.
Dessa forma, o experimento fica assim descrito: trs cultivares de milho foram
aleatorizados em parcelas retangulares dentro de cada um dos trs blocos. Porm, como
se trata de um experimento desbalanceado, o bloco 1 recebeu as variedades 1 e 2, o bloco
2 as trs variedades e o bloco 3 as variedades 1 e 2. Quatro nveis de irrigao foram
utilizados e as quatro parcelas localizadas lado a lado. Cada parcela subdividida em 2
ou 3 subparcelas (variedades), de acordo com o bloco. A subparcela mais prxima linha
de asperso recebe mais gua (1), enquanto a mais distante, menos (4).

55

Os dados referentes a esse exemplo encontram-se, conjuntamente com a


programao necessria para a obteno dos resultados analisados, no Anexo B.
A Figura 1 descreve o croqui do experimento, de acordo com o Anexo B.
Parcela

1
2
3
4
NVEL

V1
V2
V2
V1
V1
V2
V1
V2
BLOCO 1

Subparcela

V1
V2
V1
V3

Linha de Asperso

V2
V1
V2
V1
BLOCO 2

V3
V3
V3
V2

V2
V1
V1
V2
V1
V2
V2
V1
BLOCO 3

Figura 1 Croqui do Exemplo 4. Cada nvel de irrigao uma Parcela dentro de cada
Bloco.
O modelo utilizado para esse exemplo ser:

yijk =+i +j +ij +bk +gjk +eijk,

(13)

sendo, a constante inerente a todas observaes, i o efeito fixo de variedade, j o


efeito fixo de nvel de irrigao, ij o efeito fixo da interao variedade com nvel, bk o
efeito aleatrio de bloco, gjk o efeito aleatrio da interao bloco com nvel e eijk o erro
experimental. Alm disso, bk ~ N(0, 2B), gjk ~ N(0, 2g) e e ~ N(0, I2).
Matricialmente, conforme o exposto em (2), o modelo ser:
y = X + Z + e,
em que,
ny1

o vetor de observaes referentes s produtividades;

nXp+1
p+11

a matriz de incidncia dos efeitos fixos (conhecida);

o vetor de efeitos fixos (variedade, nvel de irrigao e a interao)


desconhecido;

nZq
q 1
n e1

a matriz de incidncia dos efeitos aleatrios (conhecida);


o vetor de efeitos aleatrios (blocos e interao) desconhecido;
o vetor de erros aleatrios,

em que, n o nmero total de observaes, p o nmero de parmetros de efeitos fixos e


q o nmero de parmetros de efeitos aleatrios.

56

Nota-se, portanto, que os fatores: variedade, nvel de irrigao e sua interao,


associados ao termo X, so considerados fixos e que bloco e sua interao com o efeito
fixo de nvel, associados ao termo Z, so aleatrios.
As matrizes associadas a esse experimento sero construdas de acordo com o
conjunto de dados referente programao criada (Anexo B), para a anlise desse
experimento, no sistema estatstico SAS, mais especificamente no Proc Mixed.
Logo, devido ao comando Input, as quatro colunas do conjunto de dados,
associam-se, respectivamente, aos blocos, s variedades, aos nveis e aos valores das
produtividades. Assim, a primeira linha do conjunto de dados: 1 1 1 43, refere-se ao
bloco 1, variedade 1, ao nvel 1, cujo valor da produtividade 43.
Nesse contexto, as matrizes e vetores associados ao experimento so:
A matriz 28X20 e o vetores y e :
43
y111
45
y

211
41
y121

45
y 221
46
y131

46
y 231
46
y

141
46
y 241

39

y112
44
y 212

39

y312
43
y

122
47
y 222
42
y
y = = 322 ,
47
y132

49

y 232
45
y332

40
y142
42
y

242
40
y342
34
y

213
31
y313

38
y 223
34
y323

37
y 233
36
y

333
39
y 243

37
y343

1 1 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
1 0 1 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0

1 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0

1 0 1 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0
1 1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0

1 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0
1 1 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0

1 0 1 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0

1 1 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
1 0 1 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0

1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
1 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0

1 0 1 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0
1 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0

X=
1 1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0

1 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0
1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0

1 1 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0
1 0 1 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0

1 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1
1 0 1 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0

1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0

1 0 1 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0
1 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0

1 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0
1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0

1 0 1 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0

1 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1



1
2

3
1

2

3
4

11

= 12
13

14
21

22
23

24
31

32

33
34

57

Cada coluna da matriz X est associada a cada linha (ou elemento) do vetor .
Assim, a primeira coluna de X refere-se constante , a segunda, ao parmetro 1 e
assim sucessivamente.
A matriz 28Z15 e os vetores e e :
1 0 0 1 0 0 0 0 0 0 0 0 0 0 0
1 0 0 1 0 0 0 0 0 0 0 0 0 0 0

1 0 0 0 1 0 0 0 0 0 0 0 0 0 0

1 0 0 0 1 0 0 0 0 0 0 0 0 0 0
1 0 0 0 0 1 0 0 0 0 0 0 0 0 0

1 0 0 0 0 1 0 0 0 0 0 0 0 0 0
1 0 0 0 0 0 1 0 0 0 0 0 0 0 0

1 0 0 0 0 0 1 0 0 0 0 0 0 0 0

0 1 0 0 0 0 0 1 0 0 0 0 0 0 0
0 1 0 0 0 0 0 1 0 0 0 0 0 0 0

0 1 0 0 0 0 0 1 0 0 0 0 0 0 0
0 1 0 0 0 0 0 0 1 0 0 0 0 0 0

0 1 0 0 0 0 0 0 1 0 0 0 0 0 0
0 1 0 0 0 0 0 0 1 0 0 0 0 0 0
,
Z=
0 1 0 0 0 0 0 0 0 1 0 0 0 0 0

0 1 0 0 0 0 0 0 0 1 0 0 0 0 0
0 1 0 0 0 0 0 0 0 1 0 0 0 0 0

0 1 0 0 0 0 0 0 0 0 1 0 0 0 0
0 1 0 0 0 0 0 0 0 0 1 0 0 0 0

0 1 0 0 0 0 0 0 0 0 1 0 0 0 0
0 0 1 0 0 0 0 0 0 0 0 1 0 0 0

0 0 1 0 0 0 0 0 0 0 0 1 0 0 0

0 0 1 0 0 0 0 0 0 0 0 0 1 0 0
0 0 1 0 0 0 0 0 0 0 0 0 1 0 0

0 0 1 0 0 0 0 0 0 0 0 0 0 1 0
0 0 1 0 0 0 0 0 0 0 0 0 0 1 0

0 0 1 0 0 0 0 0 0 0 0 0 0 0 1

0 0 1 0 0 0 0 0 0 0 0 0 0 0 1

b1
b
2
b3

g11
g 21

g 31
g
41
= g12

g 22
g 32

g 42
g
13
g 23
g
33
g 43

e111
e
211
e121

e 221
e131

e 231
e
141
e 241

e112
e 212

e 312
e
122
e 222
e
e = 322
e132

e 232
e 332

e142
e
242
e 342
e
213
e 313

e 223
e 323

e 233
e
333
e 243

e 343

De forma anloga, a primeira coluna de Z associa-se b1, a segunda b2 e a


ltima interao g43.
Assim, a observao y132, referente variedade 1 do nvel 3 dentro do bloco 2,
pode ser representada algebricamente por:

58

y132 = + 1 + 3 + 13 + b2 + g32 + e132 = 47,


que, matricialmente, seria a multiplicao da 15 linha da matriz X pelo vetor , mais a
multiplicao da 15 linha de Z pelo vetor , mais a 15 linha do vetor e.
Como visto em (6), V(Y)=ZGZ+R, sendo G e R matrizes envolvidas com
efeitos do acaso e, pode-se escolher estruturas de varincias e covarincias para tais
matrizes a fim de explicar a forma da dependncia existente entre as observaes. A
escolha dessas estruturas depende da forma de como se manifesta a dependncia. Assim,
sero selecionadas algumas estruturas, dadas na Tabela 1, para se verificar qual melhor
ajusta os dados ao modelo proposto. Para tanto, o teste da razo de verossimilhana e o
critrio de Akaike, vistos em 4.1.5.2, sero empregados. Alm disso, tais estruturas sero
associadas ao croqui do experimento de acordo com a dependncia existente.
Para auxiliar nessa discusso, o Proc Mixed utilizado com a seguinte
programao:
PROC MIXED METHOD=REML ORD;
CLASS BLOCO VAR NIVEL;
MODEL Y=NIVEL VAR VAR*NIVEL;
RANDOM INTERCEPT/SUBJECT=BLOCO;
RANDOM NIVEL/SUBJECT=BLOCO*VAR TYPE=AR(1) G;
RUN;

A primeira linha indica que a anlise ser realizada pela mtodo da mxima
verossimilhana restrita como recomenda Shaalje at al (1991). O comando CLASS nomeia
as variveis independentes (categricas ou numricas) do modelo. O comando MODEL,
que vem sempre aps o CLASS, descreve a varivel dependente e os efeitos fixos. O
comando RANDOM indica os efeitos aleatrios do modelo. H dois comandos RANDOM,
um referente ao bloco e outro associado s parcelas. Os dois comandos devem ser
tratados diferentemente, pois os blocos so independentes, mas as parcelas so
correlacionadas. Assim, o primeiro define o efeito de bloco como aleatrio e o segundo a
parcela. A opo TYPE=AR(1) estabelece a correlao, nesse caso a estrutura autoregressiva de primeira ordem, entre as parcelas. Nesse exemplo e no Exemplo 5,
trabalhou-se, apenas, com essa estrutura de varincias e covarincias. Embora fosse

59

possvel escolher outras estruturas de interesse. Para tanto, basta modificar as opes
TYPE e SUBJECT dentro do comando RANDOM.

A sada do SAS para o primeiro programa fica:


Cov Parm
Intercept
Variance
AR(1)
Residual

Subject
BLOCO
BLOCO
BLOCO

Estimate
21.1916
3.8174
-0.1527
0.8242

St.Error
22.1556
2.5665
0.9121
0.4077

Z Value
0.96
1.49
-0.17
2.02

Pr Z
0.1694
0.0685
0.8670
0.0216

Quadro 1 - Estimativas dos Parmetros de Covarincia


O Quadro 1 mostra as estimativas dos parmetros de covarincia, obtidas por
meio do processo iterativo de Newton-Raphson, cujos resultados serviro na construo
das matrizes G e R. Assim, os parmetros presentes na primeira coluna do Quadro 1,
denotam: Intercept = estimativa da varincia para os blocos = 2 B , Variance = estimativa
da varincia para as parcelas = 2 P , AR(1) = estimativa do parmetro auto-regressivo de
primeira ordem = e Residual = estimativa da varincia residual = 2 .
Por V=ZGZ+R, v-se, por construo, que G uma matriz quadrada de ordem
15, dada por:
G B
0
G=
0

0
GP
0
0

0
0
GP
0

0
0
0

GP

sendo, GB a matriz associada aos blocos e GP a matriz associada s parcelas. Como h


trs blocos, GB ser quadrada de ordem 3 e h quatro parcelas em cada bloco, GP ser
quadrada de ordem quatro.
Note que, a inexistncia de dependncia entre os blocos faz com que GB seja uma
matriz diagonal dada por:
0
0
21,1916

21,1916
0 .
GB = 0
0
0
21,1916

Como a estrutura de varincias e covarincias AR(1), tem-se que


genericamente, conforme Tabela 1, AR(1) dada por:

60

2
AR (1) = P

1
simtrica
...

3
2

4 ...

3 ...
2 ...

...
1 ...

Porm, no Exemplo 4 tem-se quatro nveis de irrigao, portanto, essa matriz ser
quadrada de ordem 4, indicando uma varincia ou uma covarincia presente em cada um
dos elementos da matriz. Dessa forma, os elementos presentes na diagonal principal
referem-se estimativa P 2 , a variabilidade dentro das parcelas, ou seja, a variabilidade
entre a parcela 1 (nvel 1) e a parcela 1. Agora, os elementos pertencentes segunda
diagonal, por serem diferentes de zero, indicam uma certa correlao entre as parcelas
(nveis). Como se trata de uma correlao auto-regressiva de primeira ordem, as parcelas
vizinhas tero o mesmo grau de dependncia. Da, o motivo pelo qual qualquer diagonal
possuir os mesmos elementos. Assim, supe-se que a correlao existente entre as
parcelas 1 e 2 a mesma entre as parcelas 2 e 3, que ser a mesma entre 3 e 4. Por
exemplo, o elemento da linha 1 com a coluna 2, dado por P 2 = -0,5829, diz respeito a
correlao entre as parcelas 1 e 2, assim como entre as parcelas 3 e 4, indicada pela linha
3 com a coluna 4. Logo, GP assim construda:
3,8174 - 0,5829 0,0890 - 0,01359
- 0,5829 3,8174 - 0,5829 0,08900
.
GP =
0,08900 - 0,5829 3,8174 - 0,5829

- 0,01359 0,08900 - 0,5829 3,8174

Com o auxlio do croqui do experimento, ilustrado na Figura 5, as variabilidades


contidas na matriz GP estariam relacionadas da seguinte forma com as observaes:
2P + 2B + 2
1
2

V1 V2
3. 2P

.2P

V2 V1

V1 V2

V1 V2

NVEL

BLOCO 1

2. 2P

V1

V2

V3

V2 V1

V2

V1

V3

V1 V2

V1

V2

V3

V1 V2

V3

V1

V2

V2 V1

BLOCO 2

BLOCO 3

Figura 5 Croqui do Exemplo 4. Relacionamento das Observaes em Relao


Matriz GP.

61

A matriz R, associada ao resduo dada por:


R=0,8242I(28).
Dessa forma, segundo (6), pode-se obter V de acordo com V=ZGZ+R, que ser
fundamental para a realizao dos testes dos efeitos fixos resumidos no Quadro 2.
Para reproduzir os valores de Fvalue dados no Quadro 2, recorre-se a estatstica
F aproximada, vista em (5), dada por:

'

o B ' B ( X ' V 1 X ) B '


F=
posto (B )

B o

1
o
Sabe-se por (9) que = ( X' V X) X' V y , logo basta construir a matriz B

conforme a hiptese a ser testada. Por exemplo, para o teste das variveis a matriz B,
aqui denotada por VAR, fica:
0 1 - 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
VAR =
.
0 1 0 - 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Effect
NIVEL
VAR
VAR*NIVEL

Num DF
3
2
6

Den DF
6
8
8

F Value
2.48
29.71
2.12

Pr > F
0.1588
0.0002
0.1604

Quadro 2 - Testes dos Efeitos Fixos Segundo a Hiptese do Tipo III


Uma programao no Proc IML do SAS foi realizada com a finalidade de
reproduzir o Quadro 2, encontra-se no Anexo A.
Outra informao disponvel na sada do SAS, refere-se aos valores do logaritmo
da mxima verossimilhana restrita (Res Log Likelihood) e o critrio de informao de
Akaike, cujos resultados sero necessrios para a comparao entre os modelos
propostos, para posterior seleo desses modelos de acordo com o subitem 4.1.5.2.
O Exemplo 5 similar ao Exemplo 4. A diferena entre os dois est no plano
experimental. No Exemplo 4 a parcela correspondia ao nvel de irrigao e no Exemplo 5
a parcela corresponde faixa onde est plantada cada variedade dentro de cada bloco,
com a disposio das observaes seguindo a Figura 6. Desta forma, as parcelas so

62

dispostas horizontalmente no Exemplo 4 e verticalmente no Exemplo 5, conforme os


croquis dos experimentos.
Parcela

Subparcela

Linha de Asperso

1
V1
V2
V1
V2
V3
V1
V2
2
V1
V2
V1
V2
V3
V1
V2
3
V1
V2
V1
V2
V3
V1
V2
4
V1
V2
V1
V2
V3
V1
V2
NVEL
BLOCO 1
BLOCO 2
BLOCO 3
Figura 6 Croqui do Exemplo 5. Cada variedade dentro de cada bloco corresponde
uma Parcela.
O modelo utilizado ser o mesmo dado em (13), assim:

yijk =+i +j +ij +bk +gik +eijk .


Matricialmente, o modelo ser dado por:
y = X + Z + e.
Diferentemente do Exemplo 4, tem-se, neste exemplo, uma inverso nas
associaes das estruturas de varincias e covarincias. Enquanto no Exemplo 4 a matriz
G estava associada aos nveis de irrigao, indicando uma dependncia entre tais nveis
(parcelas) e a matriz R associada s variedades (subparcelas), indicava independncia J
no Exemplo 5 a matriz G est associada tambm s parcelas, porm, agora, as parcelas
so independentes, e a matriz R associa-se aos nveis de irrigao (subparcelas), agora
dependentes.
Nesse contexto, as matrizes construdas para o Exemplo 4 sero as mesmas, com
exceo das matrizes G e R, que sofrero mudanas em suas dimenses e formas de
correlaes.
Com a finalidade de comparar os dois exemplos ser escolhida a mesma estrutura
de varincias e covarincias do Exemplo 4, AR(1), para a anlise do Exemplo 5, agora
associada a matriz R.

63

A programao SAS no Proc Mixed, similar ao Exemplo 4, pode ser dada por:
PROC MIXED METHOD=REML ORD;
CLASS BLOCO VAR NIVEL;
MODEL Y=NIVEL VAR VAR*NIVEL;
RANDOM BLOCO BLOCO*NIVEL;
REPEATED/TYPE=AR(1) SUB=BLOCO*VAR R;
RUN;

O comando

SUB=BLOCO*VAR

indica que h independncia entre os blocos e entre

as variedades, mas existe uma correlao entre as observaes dentro de cada parcela, ou
seja, entre os nveis de irrigao. O comando

RANDOM

denota os efeitos aleatrios do

modelo, no caso, o efeito de bloco e a interao bloco com nvel de irrigao. Alm
disso, a matriz G, associada aos efeitos aleatrios, ser construda de acordo com a
estrutura de componentes de varincia, dada pela Tabela 1, pois a no especificao,
dentro do comando

RANDOM,

da estrutura de varincias e covarincias acarreta na

utilizao da estrutura de componentes de varincia que o default do programa.


Assim como visto para o Exemplo 4, os principais resultados para esse exemplo
encontram-se a seguir.
Cov Parm
Subject
BLOCO
BLOCO*NIVEL
AR(1)
BLOCO*VAR
Residual

Estimate
20.7183
4.1581
0.3603
0.8318

St.Error
21.9880
2.5649
0.3818
0.4564

Z Value
0.94
1.62
0.94
1.82

Pr Z
0.1730
0.0525
0.3453
0.0342

Quadro 3 - Estimativas dos Parmetros de Covarincia


As estimativas do Quadro 3, obtidas por processo iterativo, esto relacionadas
com as matrizes G e R da seguinte forma:
A matriz G ser diagonal, uma vez que no h correlao entre as parcelas e a
estrutura de componentes de varincia possui os trs primeiros elemento da diagonal
associando-se estimativa de bloco e os demais estimativa da interao bloco com
nvel, dadas pelo Quadro 3. Logo:
0
0
0
4,1581
0
0
20,7183
0
4,1581
0
0
,
20,7183
0 e G I =
G B = 0
0
0
4,1581
0
0
0
20,7183

0
0
4,1581
0

64

conseqentemente,
G B
0
G=
0

0
GI
0
0

0
0
GI
0

0
0
.
0

GI

Sendo GB a matriz associada aos trs blocos e GI a matriz relacionada com a interao
bloco com nvel.
A matriz R possui estrutura AR(1), logo ela ser do tipo:
1

AR (1) = 2

1
simtrica
...

3
2

4 ...

3 ...
2 ...

...
1 ...

possuindo uma pequena diferena em relao a do Exemplo 4, pois quela relacionava-se


aos efeitos aleatrios do modelo e essa relaciona-se ao resduo. Assim,
0,3603 0,1298 0,0467
1
0.3603
1
0,3603 0,1298
, a matriz associada a cada parcela, temsendo R P = 0,8318
0,1298 0,3603
1
0,3603

1
0,0467 0,1298 0,3603

se que R, matriz bloco diagonal, possuindo sete blocos, um para cada parcela, dada por:
R P

R=

RP
RP
RP
RP

RP

R P

A Figura 7 ilustra o croqui do experimento e associa as variabilidades contidas na


matriz R com as observaes.
2P + 2B + 2

65

1
2

V1 V2
3.2+2

V1

.2+2

V2

V1 V2

V1 V2

NVEL

BLOCO 1

2.2+2

V1

V2

V3

V2 V1

V1

V2

V3

V1 V2

V1

V2

V3

V1 V2

V1

V2

V3

V2 V1

BLOCO 2

BLOCO 3

Figura 7 Croqui do Exemplo 5. Relacionamento das Observaes em Relao


Matriz R.
Effect
NIVEL
VAR
VAR*NIVEL

DF
3
2
6

DF
6
8
8

F Value
2.17
17.33
2.39

Pr > F
0.1931
0.0012
0.1261

Quadro 4 - Testes dos Efeitos Fixos Segundo a Hiptese do Tipo III

Da mesma forma como feito no Exemplo 4, possvel desenvolver um programa


no Proc IML para reproduzir o Quadro 4.

66

ANEXO B
(Programao IML, Exemplo 4 do Anexo A)

PROC IML;
X1=J(28,1,1);
X={1 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0,
0 1 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0,
1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0,
0 1 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0,
1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0,
0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0,
1 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0,
0 1 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0,
1 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0,
0 1 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0,
0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0,
1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0,
0 1 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0,
0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0,
1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0,
0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0,
0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0,
1 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0,
0 1 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0,
0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1,
0 1 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0,
0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0,
0 1 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0,
0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0,
0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0,
0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0,
0 1 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0,
0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1};
X=X1||X;
Y={43,45,41,45,46,46,46,46,39,44,39,43,47,42,47,49,45,40,42,40,34,31,38
,34,37,36,39,37};

67

Z={1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1

1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0

0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
1,
1};

GB=21.1916*I(3);
GP={3.8174 -0.5829
0.08900 -0.01359,
-0.5829
3.8174 -0.5829
0.08900,
0.08900 -0.5829
3.8174 -0.5829,
-0.01359 0.08900 -0.5829
3.8174};
G=BLOCK(GB,GP,GP,GP);PRINT G;
ZGZ=Z*G*Z`;*PRINT ZGZ;
R=0.8242*I(28);
V=ZGZ+R;*PRINT V;
VI=GINV(V);
BETA=GINV(X`*VI*X)*X`*VI*Y;*PRINT BETA;
VAR={0 1 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0,
0 1 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0};
RVAR=round(trace(ginv(VAR)*VAR));PRINT RVAR;

68

SQVAR=(VAR*BETA)`*INV(VAR*GINV(X`*VI*X)*VAR`)*VAR*BETA/RVAR;PRINT SQVAR;

NIV={0 0 0 0 1 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0,
0 0 0 0 1 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 0,
0 0 0 0 1 0 0 -1 0 0 0 0 0 0 0 0 0 0 0 0};
RNIV=round(trace(ginv(NIV)*NIV));PRINT RNIV;
SQNIV=(NIV*BETA)`*INV(NIV*GINV(X`*VI*X)*NIV`)*NIV*BETA/RNIV;PRINT SQNIV;

69

ANEXO C
(Dados do Exemplo 4 do Anexo A)
DATALINES;
1 1 1 43
1 2 1 45
1 1 2 41
1 2 2 45
1 1 3 46
1 2 3 46
1 1 4 46
1 2 4 46
2 1 1 39
2 2 1 44
2 3 1 39
2 1 2 43
2 2 2 47
2 3 2 42
2 1 3 47
2 2 3 49
2 3 3 45
2 1 4 40
2 2 4 42
2 3 4 40
3 2 1 34
3 3 1 31
3 2 2 38
3 3 2 34
3 2 3 37
3 3 3 36
3 2 4 39
3 3 4 37
;
RUN;

70

ANEXO D
(Programas: Exemplos A e B)
Programao: Exemplo A
DATA EXEMPLO A;
LENGTH C$ 8;
INPUT B C$ @;
ROW = _N_;
DO SBPLT=1 TO 10;
IF SBPLT LE 5 THEN DO;
I=SBPLT;
D='NORTE';
END;
ELSE DO;
I=11-SBPLT;
D='SUL';
END;
INPUT PROD @; OUTPUT;
END;
CARDS;
1 LUKE
2.3 5.2 6.7 7.3 6.8 5.5 6.3 6.6 6.4 3.4
1 NUGAINES 2.5 4.3 6.3 7.9 7.1 6.2 5.3 5.3 5.2 5.4
1 BRIDGER 3.2 5.1 6.9 6.1 7.5 5.6 6.5 6.6 5.3 4.1
2 LUKE
1.9 3.7 5.4 5.8 5.9 6.8 6.2 6.1 5.9 3.4
2 NUGAINES 3.1 5.7 6.4 7.7 6.8 6.3 6.2 6.6 6.5 4.2
2 BRIDGER 2.7 4.3 6.9 6.8 8.0 6.5 7.3 5.9 6.6 3.0
3 LUKE
1.8 3.4 4.6 4.9 4.7 5.3 4.3 5.2 4.6 3.6
3 NUGAINES 2.3 3.7 5.8 6.3 6.3 6.5 5.7 5.8 4.5 2.7
3 BRIDGER 2.8 4.0 5.0 5.2 5.2 5.9 6.1 6.0 4.3 3.1
;
TITLE "MODELO 1 - G=NO; R=IDENTIDADE - SUBJECT=BCDI; TRIPLA";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I;
RUN;

71

TITLE "MODELO 1 - G=NO; R=IDENTIDADE - SUBJECT=BCDI; DUPLAS";


PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C D|I|C@2;
RUN;
TITLE "MODELO 2 - G=NO; R=AR(1) - SUBJECT=BCD; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
REPEATED/TYPE=AR(1) SUB=B*C*D;
RUN;
TITLE "MODELO 3 - G=NO; R=TOEPLITZ(5) - SUBJECT=BCD; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM B;
REPEATED/TYPE=TOEP(5) SUB=B*C*D;
RUN;
TITLE "MODELO 4 - G=NO; R=AR(1) - SUBJECT=BC; DUPLA";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
REPEATED/TYPE=AR(1) SUB=B*C;
RUN;
TITLE "MODELO 5 - G=NO; R=TOEPLITZ(5) - SUBJECT=BC; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM B;
REPEATED/TYPE=TOEP(5) SUB=B*C;
RUN;
TITLE "MODELO 6 - G=NO; R=ESPACIAL - SUBJECT=D; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
REPEATED/TYPE=SP(POW)(ROW SBPLT) SUB=D;
RUN;
TITLE "MODELO 7 - G=NO; R=ESPACIAL - SUBJECT=1; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
REPEATED/TYPE=SP(POW)(ROW SBPLT) SUB=INTERCEPT;
RUN;

72

TITLE "MODELO 8 - G=VC(B)-SUB=B; R=I-SUBJECT=BCDI; DUPLAS";


PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM B;
RUN;
TITLE "MODELO 9 - G=VC(B)-SUB=B; R=AR(1) - SUBJECT=BCD; DUPLA";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM B;
REPEATED/TYPE=AR(1) SUB=B*C*D;
RUN;
TITLE "MODELO 10 - G=VC(B)-SUB=B; R=TOEP(5) - SUBJECT=BCD; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM B;
REPEATED/TYPE=TOEP(5) SUB=B*C*D;
RUN;
TITLE "MODELO 11 - G=VC(B) - SUB=B; R=AR(1) - SUBJECT=BC; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM B;
REPEATED/TYPE=AR(1) SUB=B*C;
RUN;
TITLE "MODELO 12 - G=VC(B)-SUB=B; R=TOEP(5) - SUBJECT=BC; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM B;
REPEATED/TYPE=TOEP(5) SUB=B*C;
RUN;
TITLE "MODELO 13 - G=VC(B) - SUB=B; R=ESPACIAL - SUBJECT=D; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM B;
REPEATED/TYPE=SP(POW)(ROW SBPLT) SUB=D;
RUN;

73

TITLE "MODELO 14 - G=VC(B) - SUB=B; R=ESPACIAL - SUBJECT=1; DUPLAS";


PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM B;
REPEATED/TYPE=SP(POW)(ROW SBPLT) SUB=INTERCEPT;
RUN;
TITLE "MODELO 15 - G=VC(B)-SUB=B; R=AR(1) - SUBJECT=BCD; DUPLA";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM B B*D;
REPEATED/TYPE=AR(1) SUB=B*C*D;
RUN;
TITLE "MODELO 16 - G=VC(B BD)-SUB=B; R=TOEP(5) - SUBJECT=BC; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM B B*D;
REPEATED/TYPE=TOEP(5) SUB=B*C;
RUN;
TITLE "MODELO 17 - G=VC(B BI)-SUB=B; R=TOEP(5) - SUBJECT=BC; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM B B*I;
REPEATED/TYPE=TOEP(5) SUB=B*C;
RUN;
TITLE "MODELO 18 - G=VC(B BD BI)-SUB=B; R=TOEP(5) - SUBJECT=BC; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM B B*D B*I;
REPEATED/TYPE=TOEP(5) SUB=B*C;
RUN;
TITLE "MODELO 19 - G=VC(B BC BD BI BCD BCI BDI)-SUB=B; R=IDENTIDADE SUBJECT=BCDI; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM B B*C B*D B*I B*C*D B*C*I B*D*I;
RUN;

74

TITLE "MODELO 20 - G=AR(1)-SUB=B; R=IDENTIDADE - SUBJECT=BCDI; DUPLAS";


PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=B TYPE=AR(1);
RUN;
TITLE "MODELO 21 - G=SP(POW)-SUB=B; R=IDENTIDADE - SUBJECT=BCDI;
DUPLAS, S/B";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=B TYPE=SP(POW)(ROW SBPLT);
RUN;
TITLE "MODELO 22 - G=AR(1)-SUB=B; R=AR(1) - SUBJECT=BCD; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=B TYPE=AR(1);
REPEATED/TYPE=AR(1) SUB=B*C*D;
RUN;
TITLE "MODELO 23 - G=TOEP(3)-SUB=B; R=AR(1) - SUBJECT=BCD; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=B TYPE=TOEP(3);
REPEATED/TYPE=AR(1) SUB=B*C*D;
RUN;
TITLE "MODELO 24 - G=AR(1)-SUB=B; R=AR(1) - SUBJECT=BC; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=B TYPE=AR(1);
REPEATED/TYPE=AR(1) SUB=B*C;
RUN;
TITLE "MODELO 25 - G=TOEP(3)-SUB=B; R=AR(1) - SUBJECT=BC; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=B TYPE=TOEP(3);
REPEATED/TYPE=AR(1) SUB=B*C;
RUN;

75

TITLE "MODELO 26 - G=AR(1)-SUB=B; R=TOEP(5) - SUBJECT=BCD; DUPLAS";


PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=B TYPE=AR(1);
REPEATED/TYPE=TOEP(5) SUB=B*C*D;
RUN;
TITLE "MODELO 27 - G=AR(1)-SUB=B; R=TOEP(5) - SUBJECT=BC; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=B TYPE=AR(1);
REPEATED/TYPE=TOEP(5) SUB=B*C;
RUN;
TITLE "MODELO 28 - G=SP(POW)-SUB=D; R=IDENTIDADE - SUBJECT=BCDI;
DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=D TYPE=SP(POW)(ROW SBPLT);
RUN;
TITLE "MODELO 29 - G=SP(POW)-SUB=1; R=IDENTIDADE - SUBJECT=BCDI;
DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=INTERCEPT TYPE=SP(POW)(ROW SBPLT);
RUN;

76

Programao: Exemplo B
DATA EXEMPLO B;
INPUT B C I D PROD;
CARDS;
1 1 1 1 2.3
1 2 2 1 4.3
1 1 3 1 6.7
1 3 4 1 6.1
1 1 5 1 6.8
1 2 5 2 6.2
1 1 4 2 6.3
1 2 3 2 5.3
1 1 2 2 6.4
1 2 1 2 5.4
1 2 1 1 2.5
1 1 2 1 5.2
1 3 3 1 6.9
1 1 4 1 7.3
1 2 5 1 7.1
1 1 5 2 5.5
1 3 4 2 6.5
1 1 3 2 6.6
1 2 2 2 5.2
1 1 1 2 3.4
1 3 1 1 3.2
1 3 2 1 5.1
1 2 3 1 6.3
1 2 4 1 7.9
1 3 5 1 7.5
1 3 5 2 5.6
1 2 4 2 5.3
1 3 3 2 6.6
1 3 2 2 5.3
1 3 1 2 4.1
2 3 1 1 2.7
2 1 2 1 3.7
2 3 3 1 6.9
2 1 4 1 5.8
2 2 5 1 6.8
2 2 5 2 6.3
2 1 4 2 6.2
2 2 3 2 6.6
2 3 2 2 6.6
2 3 1 2 3.0
2 1 1 1 1.9
2 2 2 1 5.7

77

2 2 3 1 6.4
2 3 4 1 6.8
2 1 5 1 5.9
2 1 5 2 6.8
2 3 4 2 7.3
2 3 3 2 5.9
2 1 2 2 5.9
2 2 1 2 4.2
2 2 1 1 3.1
2 3 2 1 4.3
2 1 3 1 5.4
2 2 4 1 7.7
2 3 5 1 8.0
2 3 5 2 6.5
2 2 4 2 6.2
2 1 3 2 6.1
2 2 2 2 6.5
2 1 1 2 3.4
3 1 1 1 1.8
3 2 2 1 3.7
3 2 3 1 5.8
3 3 4 1 5.2
3 2 5 1 6.3
3 1 5 2 5.3
3 2 4 2 5.7
3 3 3 2 6.0
3 2 2 2 4.5
3 3 1 2 3.1
3 2 1 1 2.3
3 3 2 1 4.0
3 1 3 1 4.6
3 1 4 1 4.9
3 3 5 1 5.2
3 2 5 2 6.5
3 3 4 2 6.1
3 1 3 2 5.2
3 1 2 2 4.6
3 2 1 2 2.7
3 3 1 1 2.8
3 1 2 1 3.4
3 3 3 1 5.0
3 2 4 1 6.3
3 1 5 1 4.7
3 3 5 2 5.9
3 1 4 2 4.3
3 2 3 2 5.8
3 3 2 2 4.3
3 1 1 2 3.6
;

78

TITLE "MODELO 1 - G=VC(B); AR(1)-SUB=B; BC; R=IDENTIDADE - SUBJECT=BCDI;


DUPLAS";
PROC MIXED ORD IC;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM INTERCEPT/SUBJECT=B;
RANDOM I/SUBJECT=B*C TYPE=AR(1);
RUN;
TITLE "MODELO 2 - G=VC(B); SP(POW)-SUB=B; BC; R=IDENTIDADE SUBJECT=BCDI; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM INTERCEPT/SUBJECT=B;
RANDOM I/SUBJECT=B*C TYPE=SP(POW)(C I);
RUN;
TITLE "MODELO 3 - G=VC(B); TOEP(4)-SUB=B; BC; R=I - SUBJECT=BCDI; DUPLA";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM INTERCEPT/SUBJECT=B;
RANDOM I/SUBJECT=B*C TYPE=TOEP(4);
RUN;
TITLE "MODELO 4 - G=VC(B); AR(1)-SUB=B; BC; R=AR(1) - SUBJECT=BDI; DUPLA";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM INTERCEPT/SUBJECT=B;
RANDOM I/SUBJECT=B*C TYPE=AR(1);
REPEATED/TYPE=AR(1) SUB=B*D*I;
RUN;
TITLE "MODELO 5 - G=VC(B); AR(1)-SUB=B; BC; R=AR(1) - SUBJECT=BI; DUPLA";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM INTERCEPT/SUBJECT=B;
RANDOM I/SUBJECT=B*C TYPE=AR(1);
REPEATED/TYPE=AR(1) SUB=B*I;
RUN;

79

TITLE "MODELO 6 - G=VC(B); TOEP(4)-SUB=B; BC; R=AR(1) - SUBJECT=BDI;


DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM INTERCEPT/SUBJECT=B;
RANDOM I/SUBJECT=B*C TYPE=TOEP(4);
REPEATED/TYPE=AR(1) SUB=B*D*I;
RUN;
TITLE "MODELO 7 - G=VC(B); TOEP(4)-SUB=B; BC; R=TOEP(4) - SUBJECT=BDI;
DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM INTERCEPT/SUBJECT=B;
RANDOM I/SUBJECT=B*C TYPE=TOEP(4);
REPEATED/TYPE=TOEP(4) SUB=B*D*I;
RUN;
TITLE "MODELO 8 - G=VC(B); TOEP(4)-SUB=B; BC; R=SP(POW) - SUBJECT=1;
DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM INTERCEPT/SUBJECT=B;
RANDOM I/SUBJECT=B*C TYPE=TOEP(4);
REPEATED/TYPE=SP(POW)(C I) SUB=INTERCEPT;
RUN;
TITLE "MODELO 9 - G=AR(1)-SUB=BC; R=IDENTIDADE - SUBJECT=BCDI; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=B*C TYPE=AR(1);
RUN;
TITLE "MODELO 10 - G=SP(POW)-SUB=BC; R=IDENTIDADE - SUBJECT=BCDI;
DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=B*C TYPE=SP(POW)(C I);
RUN;

80

TITLE "MODELO 11 - G=TOEP(4)-SUB=BC; R=I - SUBJECT=BCDI; DUPLA";


PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=B*C TYPE=TOEP(4);
RUN;
TITLE "MODELO 12 - G=AR(1)-SUB=BC; R=AR(1) - SUBJECT=BDI; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=B*C TYPE=AR(1);
REPEATED/TYPE=AR(1) SUB=B*D*I;
RUN;
TITLE "MODELO 13 - G=AR(1)-SUB=BC; R=AR(1) - SUBJECT=BI; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=B*C TYPE=AR(1);
REPEATED/TYPE=AR(1) SUB=B*I;
RUN;
TITLE "MODELO 14 - G=TOEP(4)-SUB=BC; R=AR(1) - SUBJECT=BDI; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=B*C TYPE=TOEP(4);
REPEATED/TYPE=AR(1) SUB=B*D*I;
RUN;
TITLE "MODELO 15 - G=TOEP(4)-SUB=BC; R=AR(1) - SUBJECT=BI; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=B*C TYPE=TOEP(4);
REPEATED/TYPE=AR(1) SUB=B*I;
RUN;
TITLE "MODELO 16 - G=TOEP(4)-SUB=BC; R=TOEP(4) - SUBJECT=BDI; DUPLAS";
PROC MIXED ORD;
CLASS B C D I;
MODEL PROD=C|D|I@2;
RANDOM I/SUBJECT=B*C TYPE=TOEP(4);
REPEATED/TYPE=TOEP(4) SUB=B*D*I;
RUN;

REFERNCIAS BIBLIOGRFICAS
ANDERSON, C. R.; BANCROFT, T. A. Statistical theory in research. New York:
McGraw-Hill, 1952. 339p.
ANDREONI, S. Modelos de efeitos aleatrios para anlise de dados longitudinais no
balanceados em relao ao tempo. So Paulo, 1989. Dissertao (Mestrado) Instituto de Matemtica e Estatstica , Universidade de So Paulo.
BARBIN, D. Componentes de varincia: teoria e aplicaes. Piracicaba: ESALQ,
1993. 108p.
BOZDOGAN, H. Model selection and Akaikes information criterion (AIC): the general
theory and its analytical extensions. Psychometrika, v. 52, 345-370, 1987.
CAMARINHA FILHO, J.A. Teste de hipteses em modelos lineares com dados
desbalanceados e caselas vazias. Piracicaba, 1995, 142p. Dissertao (Mestrado) Escola Superior de Agricultura Luiz de Queiroz, Universidade de So Paulo.
CUNNINGHAM, E.P.; HENDERSON, C.R. An iterative procedure for estimating fixed
effects and variance components in mixed model situations. Biometrics, v.24, 13-25,
1968.
DIGGLE, P.J. An approach to the analysis of repeated measurements. Biometrics, v.44,
p.959-971, 1988.
FERNANDEZ, G. C. J. Repeated measures analysis of line-source sprinkler
experiments. HortScience, v.26, n.4, p.339-342, 1991.
GRAYBILL, F.A. Theory and application of the linear model. Massachusetts:
Duxbury Press, North Scituate, 1976. 704p.

82

HANKS , R.J.; SISSON, D.V.; HURST, R.L. et al. Statistical analysis of results from
irrigation experiments using the line-source sprinkler system. Soil Science Society of
America Journal, v.44, p.886-888, 1980.
HARTLEY, H.O.; RAO, J.N.K.

Maximum-likelihood

estimation for the mixed

analysis of variance model. Biometrika, v.54, p.93-108, 1967.


HARVILLE, D.A. Maximum likelihood approaches to variances component estimation
and to relates problems. Journal of the American Statistical Association, v.72,
p.320-340, 1977.
HENDERSON, C.R. Estimation of variance and variance components. Biometrics, v.9,
p.226-252, 1953.
HENDERSON, C. R. Applications of linear models in animal breeding. Guelph:
University of Guelph, 1984. 462p.
HENDERSON, C. R. Recent developments in variance and covariance estimation.
Journal of Animal Science, v. 63, 208-216, 1986.
HENDERSON, C.R.; KEMPTHORNE, O.; SEARLE, S. R. et al. Estimation of
environmental and genetic trends from records subject to culling. Biometrics, v. 15,
p.192-218, 1959.
HICKS,C.R. Fundamental concepts in the design of experiment. 2. ed. New York:
Holt, Rinehart and Winston, 1973. 349p.
HOCKING, R. R. The analysis of linear models. Monterey: Brooks/Cole Publ., 1985.
385p.
JENNRICH, R. I. E SCHLUCHTER, M. D. Unbalanced repeated-measures models with
structure covariance matrices. Biometrics, v.42, p.805-820, 1986.
JOHNSON, D.E.; CHAUDHURI, U.N.; KANEMASU, E.T. Statistical analysis of linesource sprinkler irrigation experiments and other non-randomized experiments using
multivariate methods. Soil Science Society of America Journal, v.47, p.309-312,
1983.
LAIRD, N.; WARE, J. H. Random-effects models for longitudinal data. Biometrics,
v.38, p.963-974, 1982.

83

LIANG, K.-Y; ZEGER, S. L. Longitudinal data analysis using generalized linear


models. Biometrika, v.73, p.13-22, 1986.
LINDSTROM, M.J.; BATES, D.M. Newton-Raphson and EM algorithms for linear
mixed-effects models for repeated-measures data. Journal of the American
Statistical Association, v.83, p.1014-1022, 1988.
LITTEL, R. C.; MILLIKEN, G. A.; STROUP, W. W. et al. SAS system for mixed
models. Cary: SAS Institute, 1996. 633p.
LOPES, P. S.; MARTINS, E. N.; SILVA, M. A. et al. Estimao de componentes de
varincia. Viosa: Universidade Federal de Viosa, 1993. 61p.
MARTINS, E. N.; LOPES, P. S.; SILVA, M. A et al. Modelo linear misto. Viosa:
Universidade Federal de Viosa, 1993. 46 p.
MARTINS, E. N.; LOPES, P. S.; SILVA, M. A. et al. Uso de modelos mistos na
avaliao gentica animal. Viosa: Universidade Federal de Viosa, 1997. 121 p.
MOOD, A. M.; GRAYBILL, F. A.; BOES, D. C. Introduction to the theory of
statistics. New York: McGraw-Hill, 1974. 564p.
MRODE, R. A. Linear models for the prediction of animal breeding values.
Wallingford: Cab International, 1996. 187p.
NETER, J.;WASSERMAN, W.; KUTNER, M.H. Applied linear statistical models,
regression, analysis of variance and experimental designs. Burr Ridge: Richard D.
Irwing, 1985. 1127p.
OGLIARI, P. J. Modelos no lineares para dados longitudinais provenientes de
experimentos em blocos casualizados. Piracicaba, 1998. 156p. Tese (Doutorado) Escola Superior de Agricultura Luiz de Queiroz, Universidade de So Paulo.
PATTERSON, H.D.; THOMPSON, R. Recovery of inter-block information when block
sizes are unequal. Biometrika, v.58, p.545-554, 1971.
PEREZ, L.A.L. Estimao e predio nos modelos mistos no balanceados. Piracicaba,
1992. 83p. Tese (Doutorado) - Escola Superior de Agricultura Luiz de Queiroz,
Universidade de So Paulo.

84

PERRI, S.H.V. Ajuste de modelos mistos de classificao dupla: procedimentos do


sistema estatstico SAS.

Piracicaba, 1998.

126p.

Tese (Doutorado) - Escola

Superior de Agricultura Luiz de Queiroz, Universidade de So Paulo.


RAO, C.R. Estimation of heterocedastic variances in linear models. Journal of the
American Statistical Association, v.65, p.161-172, 1970.
RAO, C.R. Estimation of variance and covariance components MINQUE Theory.
Journal of Multivariate Analysis, v.1, p.257-275, 1971a.
RAO, C.R. Minimum variance quadratic unbiased estimation of variance components.
Journal of Multivariate Analysis, v.1, p.445-456, 1971b.
RAO, C.R. Linear statistical inference and its applications. 2. ed. New York: John
Wiley, 1973.
RUSSEL, T. S.; BRADLEY, R. A. One-way variances in a two-way classification.
Biometrika, v.45, p.111-129, 1958.
SAS INSTITUTE. SAS/STAT software: changes and enhancements through release
6.12. Cary, 1997. cap. 18, p.533-656: The MIXED procedure.
SCHAALJE, B.; ZHANG, J.; PANTULA, S.G. et al. Analysis of repeatedmeasurements data from randomized block experiments. Biometrics, v.47, p.813824, 1991.
SCHEFF, H. The analysis of variance. New York: John Wiley, 1959. 477p.
SEARLE, S.R. Another look at Hendersons methods of estimating variance
components. Biometrics, v.24, p.749-778, 1968.
SEARLE, S.R. Linear models. New York: John Wiley, 1971. 532p.
SEARLE, S.R. Linear models for unbalanced data. New York: John Wiley, 1987.
536p.
SEARLE, S.R. Mixed models and unbalanced data: wherefrom, whereat, and whereto?
Communications in Statistics-Theory and Methods, v.17, p.935-968, 1988.
SEARLE, S.R.; CASELLA, G.; MCCULLOCH, C.E. Variance components. New
York: John Wiley, 1992. 501p.
THOMPSON Jr., W. A., The problem of negative estimates of variance components.
The Annals of Mathematical Statistics, v. 33, p. 273-289, 1962.

85

VIEIRA, S.; HOFFMAN, R. Estatstica experimental. So Paulo: Editora Atlas, 1998.


178p.
WOLFINGER, R.D. Covariance structure selection in general mixed models.
Communications in Statistics, v.22, p.1079-1106, 1993a.
WOLFINGER, R.D. A tutorial on mixed models. Cary: SAS Institute, 1993b.
XAVIER, L. H. Modelos univariado e multivariado para anlise de medidas repetidas e
verificao da acurcia do modelo univariado por meio de simulao. Piracicaba,
2000. 91p. Dissertao (Mestrado) - Escola Superior de Agricultura Luiz de
Queiroz, Universidade de So Paulo.