Você está na página 1de 52

UNIVERSIDADE DE SÃO PAULO

Escola Superior de Agricultura “Luiz de Queiroz”

O uso de Modelos Mistos na análise de dados com


medidas repetidas em experimentos com animais

LCE5872 - Estatística Experimental II e Modelos Mistos


Gilson Silvério da Rocha
João Vitor Teodoro
Naimara Vieira do Prado
CANADIAN JOURNAL OF ANIMAL SCIENCE
Introdução
 Medidas repetidas referem-se às múltiplas medições feitas na
mesma unidade experimental, podem ser observadas tanto ao
longo do tempo ou espaço.

 Exemplo: Alguns dos projetos mais comuns em ciências


animais incluem:
 Medições de peso, crescimento, parâmetros sanguíneos e produtos do
metabolismo e da digestibilidade dos nutrientes.
Introdução
 Em modelos de medidas repetidas, a prática usual é aplicar
tratamentos em unidades experimentais de um
delineamento, e as medições são feitas sequencialmente ao
longo do tempo;

 Assim, existem basicamente dois efeitos fixos (tratamento e


tempo) e duas fontes de variação aleatória (entre e dentro
dos animais).
Introdução
 Medições feitas sobre o mesmo animal são mais susceptíveis
de serem correlacionadas do que duas medições tomadas em
animais diferentes;

 Medições efetuadas em tempos próximos no mesmo animal


são susceptíveis de serem mais correlacionadas, que
medições efetuadas em intervalos de tempos mais distantes.

 Os pressupostos habituais sobre independência dos erros e


homogeneidade de variâncias não são mais válidos.
Métodos comumente utilizados

 Separar a análise em períodos de tempo;

 Análise univariada e multivariada de variáveis com contrastes


no tempo;

 Metodologia dos Modelos Mistos;


Objetivos do trabalho

 Apresentar o uso de Modelos Mistos na análise de medidas


repetidas em ciência animal usando dados de um estudo de
crescimento de novilhos para demonstrar o uso do PROC
MIXED do sistema SAS.
Dados experimentais
 60 novilhos;
 6 dietas (1-6);
 10 animais por dieta, atribuídos aleatoriamente;
 Os pesos corporais foram medidos a cada 21 dias (3
semanas);
 0, 21, 42, 63, 84 e 105 dias → 0, 1, 2, 3, 4, 5;
Dados experimentais
 Estes dados foram analisados ​usando o PROC GLM e o PROC
MIXED;

 O peso inicial foi adicionado como covariável, e os pesos


subsequentes como medidas repetidas;

 Estruturas de covariâncias comumente usadas, SIMPLE, CS,


AR(1), ANTE (1) e UN foram utilizadas no ajuste do modelo.
Análise univariada
 Tem sido utilizado em pesquisa com animais por muitos anos;

 A análise trata os dados de medidas repetidas como esquema


de parcelas subdivididas;

 Parcelas: novilhos

 Subparcelas: novilhos nos tempos específicos


Análise univariada
 Modelo estatístico:

Em que:
é o peso corporal medido no tempo t no j-ésimo novilho na
i-ésima dieta
: média geral
: efeito fixo de dieta
: efeito aleatório do j-ésimo novilho dentro da i-ésima dieta

15:43 11
Análise univariada
efeito fixo do t-ésimo tempo
: efeito fixo de interação entre dieta e tempo
: erro aleatório associado ao j-ésimo novilho dentro da i-
ésima dieta no tempo t

 Var( Var( +
 Cov(, ) = Cov(para

15:43 12
Análise univariada

PROC GLM DATA=IN_STEERS;


CLASS ANIM DIET TIME;
MODEL FNWT = DIET ANIM(DIET) TIME
DIET*TIME;
RANDOM ANIM(DIET)/TEST;
RUN;
QUIT;

15:43 13
Análise multivariada
 A análise de variância multivariada é utilizada quando a
hipóteses impostas pela ANOVA (medidas em cada tempo
têm variâncias iguais e as correlações entre quaisquer duas
medidas são as mesmas) não são válidas;

 A análise MANOVA requer dados balanceados, se uma


repetição está faltando, todos os dados para este tempo será
eliminado a partir da análise;
Análise multivariada
 O método MANOVA assume a matriz de covariância não
estruturada (UN);

 Desconsidera algumas informações inerentes aos dados de


medidas repetidas e os resultados dos testes são menos
potentes;

 A escolha inadequada de erros padrão para comparação de


médias pode resultar em erros do tipo I (rejeição da
hipótese nula quando ela é verdadeira).
Análise multivariada

PROC GLM DATA=IN_MULT;


CLASS DIET;
MODEL BW2-BW6 = DIET BW1/SS3;
REPEATED TIME/PRINTE SUMMARY;
RUN;
QUIT;
Modelos Mistos
 O procedimento de Modelos Mistos (PROC MIXED)
permite uma maior flexibilidade na modelagem de
estruturas de covariância para os dados;

 Permite trabalhar com observações ausentes em


dados de medidas repetidas;
Modelos Mistos
 PROC MIXED utiliza o método GLS (método dos
Mínimos Quadrados Generalizados) para estimar e
testar os efeitos fixos do modelo, que é considerado
superior ao método OLS (método dos Mínimos
Quadrados Ordinários) utilizado pelo PROC GLM;

 O método GLS modela todos os parâmetros de


covariância para os dados, enquanto que o OLS
não. Devido a isso, a análise modelo misto é mais
precisa.
Modelos Mistos
Modelo estatístico:

Em que:
é o coeficiente de regressão comum ao peso corporal inicial
de
: desvio de inclinação da i-ésima dieta de inclinação comum
: peso corporal inicial medido no novilho j e na dieta i no
início do estudo
Modelos Mistos
E(

Cov(, ) =

é a matriz de covariâncias as medidas repetidas.


Estrutura de covariância SIMPLES

 Assume que todas as observações


são independentes
 Raramente verdadeira para medidas repetidas
Estrutura de covariância SIMÉTRICA
COMPOSTA (CS)
 Pressupõe correlação constante entre as observações,
independentemente da distância entre os pontos no tempo
 Parcelas subdivididas no tempo (grande uso no século passado)
 Apropriado quando a condição HF for atendida
Estrutura de covariância AUTO-REGRESSIVA DE
PRIMEIRA ORDEM - AR(1)
A correlação entre as observações é uma função da distância no
tempo
 Enquanto as observações se distanciam no tempo as
covariâncias correspondentes diminuem
 Requer tempos igualmente espaçados e ordenados
Estrutura de covariância de PRIMEIRA
ANTEDEPENDÊNCIA - ANTE(1)
 A magnitude da covariância depende dos valores das
correlações e desvios padrão associados
 t + (t - 1) parâmetros, em que t é o número de vezes que a
medida é repetida
 Os tempos devem ser ordenados corretamente, sem a
necessidade de mesmo espaçamento
Estrutura de covariância NÃO ESTRUTURADA (UN)
 Permite variâncias desiguais ao longo do tempo e covariâncias
desiguais para cada combinação de tempo
 Estrutura mais complexa
 t(t – 1)/2 parâmetros, em que t é o número de vezes que a
medida é repetida
Estrutura de covariância NÃO ESTRUTURADA (UN)

 Estrutura modelada pela análise de medidas


repetidas MANOVA
 Difícil ajuste
 Problemas de convergência
 Testes menos poderosos
Seleção da estrutura de covariância apropriada

Littell et al. (2000) recomenda os seguintes passos para


selecionar uma estrutura de covariância apropriada na
análise de dados de medidas repetidas usando:

a) Calcular a esperança do modelo, especificando os efeitos


fixos para ajuste com medidas repetidas;
Neste passo, tentar inserir todos os possíveis efeitos fixos na
média do modelo e utilizando o teste de significância,
reduzir o modelo para obter uma média conveniente do
modelo utilizando PROC GLM.
b) Especificar uma estrutura mais próxima de
covariância para os efeitos entre e intra-
sujeito.
 Geralmente, a covariância dentro de sujeitos
são complexas para medidas repetidas
 Assumir que as medidas repetidas dentro de
sujeitos estão correlacionadas e entre
indivíduos são independentes
c) Usar a estrutura de covariância identificada
em (b) e adaptar o modelo de média usando
o PROC MIXED
 É possível reduzir ainda mais o modelo de
média para se obter um modelo mais
parcimonioso com base nos ensaios para os
efeitos fixos e as informações dos critérios de
ajustes do modelo
d) Com base nos resultados obtidos em (c),
fazer inferências estatísticas e tirar
conclusões sobre a análise com base nos
objetivos do estudo
Estrutura de covariância adequada
 Ignorar a correlação intra-sujeito usando um
modelo muito simples aumentará taxa de
erro Tipo I para os testes de efeitos fixos

 Utilizar uma estrutura de covariância muito


complexa comprometerá o poder e a
eficiência dos testes de efeitos fixos
Exclusão de estrutura de covariância
inadequadas
 Excluir estruturas de covariância que não fazem
sentido para os dados
 Estruturas de covariância para tempos igualmente
espaçados, tais como AR (1), não devem ser
consideradas para tempos desigualmente
espaçados
 Estruturas de covariância homogêneas, tais como
AR (1), devem ser excluídas se os dados mostram
variâncias heterogêneas ao longo do tempo
Estrutura de covariância adequada (a)
 Calcular a estrutura de covariâncias UN
 Examinar o padrão da matriz de covariância (muitas vezes
sugere uma estrutura mais simples de covariâncias que
melhor se adeque aos dados)

 Analisar os dados usando o procedimento de MANOVA

Matriz de correlações
 O padrão da matriz de correlações pode fornecer uma
indicação de uma estrutura mais simples de covariância
que se ajusta aos dados mais adequadamente
Estrutura de covariância adequada (b)
 Com base no padrão obtido em (a), na
biologia do estudo e no conhecimento
experimental sobre os dados, algumas
poucas estruturas de covariância que
parecem ser razoável para os dados podem
ser julgadas
Estrutura de covariância adequada (c)
 Comparar os modelos candidatos
 Selecionar o modelo que melhor se ajuste
aos dados
 Em geral, uma estrutura mais simples de
covariância que melhor se adapta aos dados
deve ser escolhida
Comparação de modelos
 Comparação de modelos → PROC MIXED
– Critérios de Informação de Akaike (AIC)

– Critério de informação de Akaike corrigido para amostras


pequenas (AICC)

– Critério de Informação Bayesiano de Schwarz (BIC)

p parâmetros e n amostras
 Quanto menor, melhor o ajuste do modelo aos dados
Comparação de modelos
 AICC reduz o vício de AIC
 Para grandes amostras AICC cnverge para o AIC
 É preferível o AICC ao AIC
 O BIC tende a escolher um modelo mais simples do que a AIC
(maior penalidade)
 Se o poder do teste é a principal preocupação usa-se o BIC
 Em geral um resultado plausível para medidas repetidas é
dado pelo AICC ou BIC
 Se AICC e BIC são próximos, então o modelo mais simples é
preferido
Examinando os dados de novilhos

Peso corporal (kg)

Tempo (3 semanas)

Figura 1. Peso corporal de 17 novilhos durante um estudo de crescimento.

 A variação no peso corporal está aumentando à medida que o peso aumenta;


 Para cada novilho o perfil de crescimento aproxima-se de um modelo linear ao longo
do tempo;
 Variabilidade de sujeito para sujeito no crescimento de novilhos ao longo do tempo;
 Medidas tomadas sobre o mesmo animal são prováveis de ser mais correlacionadas
do que medidas tomadas em animais diferentes;
 Modelo linear misto com uma estrutura de covariância apropriada.
15:43 38
Examinando os dados de novilhos
Peso corporal (kg)

Tempo (3 semanas)

Figura 3. Médias dos pesos corporais dos novilhos nas seis dietas durante o
período de ensaio (105 dias).

 As médias dos pesos corporais nas seis dietas são semelhantes no início do
estudo, mas a magnitude das diferenças entre as dietas começa a diferenciar
ao longo do tempo;
 Conclusões gerais sobre as médias das dietas não podem ser feitas
independentes do tempo.
15:43 39
Analisando a estrutura de covariância
(dados de novilhos)
Modelo ajustado

yijt    i  d j ( i )   t   it  b   i  xij  eijt

Estrutura de covariância  UN

15:43 40
Analisando a estrutura de covariância
(dados de novilhos)

 O método ANOVA convencional não é apropriado para analisar esse conjunto


de dados;
 Um modelo linear misto com estrutura de covariâncias heterogêneas e
15:43 correlacionadas deve ser considerado para estes dados. 41
Ajuste com diferentes estruturas de
covariância
 A fim de ilustrar as vantagens da utilização de modelos mistos
sobre as abordagens convencionais, o mesmo conjunto de dados
de crescimento de novilhos foi analisado com cinco diferentes
estruturas de covariância:

 SIMPLE
 CS
 AR(1)
 ANTE(1)
 UN

15:43 42
Ajuste com diferentes estruturas de
covariância
 Comandos no programa SAS:

/*ANALYSIS THE STEER GROWTH DATA*/

PROC MIXED DATA=IN_STEERS COVTEST;


CLASS ANIM DIET TIME;
MODEL FNWT = DIET | TIME INWT / DDFM=KR;
REPEATED TIME / SUBJECT=ANIM (DIET) TYPE = SIMPLE
R RCORR; TYPE = CS
RUN; TYPE = AR(1)
QUIT; TYPE = ANTE(1)
TYPE = UN

15:43 43
Ajuste com diferentes estruturas de
covariância

 O modelo com estrutura de covariância ANTE (1) fornece o melhor


ajuste para os dados entre os cinco modelos utilizados. Portanto é o
modelo escolhido.
15:43 44
Teste dos efeitos fixos para os Modelos com
diferentes estruturas de covariâncias

 O valor F para ANTE(1) e UN são similares pois ambas estruturas


modelam a covariância dos dados e portanto resultam em testes
válidos;

 ANTE (1) tem o menor AICC e BIC e portanto é a estrutura escolhida.

15:43 45
Efeito das estruturas de covariância nas médias
para Efeitos Fixos
 As médias para efeitos fixos podem ser obtidas no PROC MIXED adicionando o
comando LSMEANS:
LSMEANS DIET DIET*TIME/PDIFF;

 As médias são semelhantes para cada dieta, independentemente da estrutura de


covariância, pois os dados do exemplo são balanceados.
 Os erros padrão das estimativas das médias diferem para as estruturas de
covariância diferentes, porque eles são ajustados pelos parâmetros de covariância
no modelo misto (Littell et al. 1998).
15:43 46
Efeito das estruturas de covariância em
combinações lineares de efeitos fixos
 Exame das diferentes estruturas de covariância nas comparações da dieta 1
com a dieta 3 nos cinco períodos de tempo considerados.

 Comandos no programa SAS:

ESTIMATE ‘D1-D3 at T1’ DIET 1 0 -1 0 0 0 DIET*TIME


1 0 0 0 0 0 0 0 0 0 -1 0 0 0 0;
ESTIMATE ‘D1-D3 at T2’ DIET 1 0 -1 0 0 0 DIET*TIME
0 1 0 0 0 0 0 0 0 0 0 -1 0 0 0;
ESTIMATE ‘D1-D3 at T3’ DIET 1 0 -1 0 0 0 DIET*TIME
0 0 1 0 0 0 0 0 0 0 0 0 -1 0 0;
ESTIMATE ‘D1-D3 at T4’ DIET 1 0 -1 0 0 0 DIET*TIME
0 0 0 1 0 0 0 0 0 0 0 0 0 -1 0;
ESTIMATE ‘D1-D3 at T5’ DIET 1 0 -1 0 0 0 DIET*TIME
0 0 0 0 1 0 0 0 0 0 0 0 0 0 -1;

15:43 47
Efeito das estruturas de covariância em
combinações lineares de efeitos fixos
 Exame das diferentes estruturas de covariância nas comparações da dieta 1 com a
dieta 3 nos cinco períodos de tempo considerados.

 Portanto, as estruturas de covariância ANTE (1) e UN descrevem adequadamente os


dados do exemplo, enquanto que as estruturas SIMPLES, CS e AR (1) não.
15:43 48
Conclusões
 O método ANOVA não considera as correlações dependentes no tempo de
forma adequada em dados de medidas repetidas e pode muitas vezes
resultar em um erro do tipo I;

 O método MANOVA assume uma matriz de covariância não estruturada, que


é muito mais geral do que é exigido por dados de medidas repetidas.
Também perde grande quantidade de informação, reduzindo assim o poder
do teste e não trabalha com dados perdidos de forma eficaz;

 Modelos Mistos permitem uma abordagem flexível para modelar estruturas


de covariância adequadas que representam adequadamente correlações
dentro de sujeitos ao longo do tempo;

 PROC MIXED utilizam método dos mínimos quadrados generalizados para


estimar e testar os efeitos fixos, que geralmente é superior ao método dos
quadrados mínimos ordinários utilizado pelo PROC GLM.

15:43 49
Conclusões
 Modelos Mistos tem a capacidade de trabalhar com dados perdidos e com
espaçamento desigual. Além disso, permite o uso de covariáveis no modelo;

 Recomenda-se a utilização de Modelos Mistos para análises com medidas


repetidas em estudos com animais;

 No estudo de crescimento de novilhos considerado:


 A estrutura de covariância ANTE (1) apresentou o melhor ajuste
dentre as cinco estruturas;
 Os testes F foram adequados para efeitos fixos;
 Foram obtidas estimativas adequadas para as médias e os erros
padrão.

15:43 50
Referências bibliográficas

 Littell, R. C., Henry, R. C. and Ammerman, C. B. 1998. Statistical analysis of


repeated measures data using SAS procedures. J. Anim. Sci. 76: 1216–1231.

 Littell, R. C., Pendergast, J. and Natarajan, R. 2000. Modeling covariance


structure in the analysis of repeated measures data. Stat. Med. 19: 1793–1819.

 Littell, R. C., Milliken, G. A., Stroup, W. W. and Wolfinger, R. D. 2006. SAS


system for mixed models. SAS Institute, Inc., Cary, NC.

 Mir, Z., Mir, P. S., Acharya, S. N., Zaman, M. S., Taylor, W. G., Mears, G. W.,
McAllister, T. A. and Goonewardene, L. A. 1998. Comparison of alfalfa and
fenugreek (Trigonella foenum graecum) silages supplemented with barley grain
on performance of growing steers. Can. J. Anim. Sci. 78: 343–349.

15:43 51
Agradecemos pela
atenção

15:43 52

Você também pode gostar