Você está na página 1de 8

ANLISE MULTIVARIADA APLICADA AS CINCIAS AGRRIAS

PS-GRADUAO EM AGRONOMIA CINCIA DO SOLO: CPGA-CS

ANLISE DE VARINCIA MULTIVARIADA


Carlos Alberto Alves Varella1

NDICE
INTRODUO.......................................................................................................................2
MODELO ESTATSTICO.......................................................................................................2
MATRIZES DE SISTEMAS DE EQUAES NORMAIS...................................................3
DECOMPOSIO DA SOMA DE QUADRADOS E PRODUTOS TOTAIS......................4
TESTE PARA A HIPTESE NULA H0..................................................................................4
TESTE PARA VETORES DE MDIAS.................................................................................5
EXEMPLO DE APLICAO................................................................................................6
BIBLIOGRAFIA.....................................................................................................................6

Professor. Universidade Federal Rural do Rio de Janeiro, IT-Departamento de Engenharia, BR 465 km 7 - CEP 23890-000 Seropdica
RJ. E-mail: varella@ufrrj.br.

INTRODUO
A anlise de varincia multivariada utilizada para comparar vetores de mdias. Os dados
normalmente so provenientes de delineamentos estatsticos. A formulao de um teste
estatstico para comparar vetores de mdias, depende da partio do total da varincia em:
varincia devido ao efeito de tratamentos e varincia devido ao erro. Est partio da varincia
total denominada de MANOVA, anlise de varincia multivariada (JOHNSON &
WICHERN, 1999). Em experimentos que envolvem variveis aleatrias contnuas, medidas na
mesma unidade experimental, pode-se pressupor a multinormalidade e realizar uma anlise
multivariada. Um ponto relevante da anlise multivariada o aproveitamento da informao
conjunta das variveis envolvidas (REGAZZI, 2000).
As pressuposies para realizao da MANOVA so as seguintes:
1)

Modelo aditivo para efeitos de tratamentos, blocos (se houver) e erro;

2)

Independncia dos erros;

3)

Igualdade da matriz de covarincia para todas as amostras;

4)

Distribuio multinormal dos erros, com varincia .

MODELO ESTATSTICO
O modelo estatstico para um delineamento em blocos casualizados com b blocos e k
tratamentos em que so medidas p variveis :
Yijr r tir b jr eijr
i 1,2, , k ;

em que,
r
Yijr
r
t ir
b jr

eijr

j 1,2, , b;

r 1,2, , p

= indexador das variveis;


valor observado da r-sima varivel sob o efeito do i-simo tratamento no j=
simo bloco;
= mdia geral da r-sima varivel;
= efeito do i-simo tratamento na r-sima varivel;
= efeito do j-simo bloco na r-sima varivel;
= efeito aleatrio associado observao Yijr

Na forma matricial o modelo estatstco :


Y X

em que,

Y
X

=
=
=
=

matriz de observaes de dimenses bk x p;


matriz do delineamento de dimenses bk x (1+k+b);
matriz de parmetros de dimenses (1+k+b) x p;
matriz de erros de dimenses bk x p.

Podemos tambm escrever da seguinte forma:

~
~
~
Y ~
y1 , ~
y2 , , ~
y p X1 , X 2 , , X p ~
e1 , ~
e2 , , ~
ep

Para a varivel r (r=1,2,...,p) temos que:


~
~
y r X r ~
er

MATRIZES DO SISTEMA DE EQUAES NORMAIS


Considerando-se o modelo linear multivariado Y X , as matrizes do sistema de
equaes normais :
X 'Y
X ' X

A soluo de mnimos quadrados do sistema de equaes normais dada pela matriz:

, , , X ' X 1 X ' Y

1
2
p
possui dimenses (1+k+b) x p, onde X a matriz de valores das
A matriz de solues

p variveis independentes e Y a matriz de valores resposta para os efeitos de tratamentos. Da


mesma forma que no modelo univariado, sendo posto de (XX)=k+b-1, o sistema admite mais
de uma soluo, isto , a matriz (XX) no possui inversa verdadeira.

Impondo-se as

restries de que os somatrios dos efeitos de tratamentos e blocos sejam igual a zero, o
sistema apresenta soluo nica que denotaremos por:

X ' X AA' 1 X ' Y , , ,

1
2
p

em que,
= melhor estimador linear ou BLUE de

X'X

AA'

= inversa condicional de XX.

DECOMPOSIO DA SOMA DE QUADRADOS E PRODUTOS TOTAIS


Considerando-se o modelo linear multivariado Y X , tem-se, do mtodo dos
mnimos quadrados, que:
' X 'Y
' Y ' Y

em que,
' = matriz da soma de quadrados e produtos do resduo que denotaremos por E,

com ne= n-Posto[X] graus de liberdade. No modelo de blocos ao acaso temos que:
ne kb k b 1 kb k b 1 k 1 b 1

Y ' Y = matriz da soma de quadrados e produtos de totais que denotaremos por A;


' X ' Y = matriz da soma de quadrados e produtos de parmetros;

Da mesma forma que no modelo univariado temos que:

A H BE
onde,
A, H , B e E

so matrizes de dimenses p x p, de soma de quadrados e produtos de


totais, tratamentos, blocos e resduo, respectivamente.
TESTE PARA A HIPTESE NULA H0
A hiptese H0 ser testada, considerando k tratamentos e p variveis, a de que os vetores
de mdias de tratamentos so iguais, isto :
~
~
~
H0 :
1
2
k

ou

1 21 k1

1 2 2 k2
H0:


1p 2p kp
Essa hiptese o mesmo que testar se os vetores de efeito de tratamentos so nulos, isto :
H0 : ~
t1 ~
t2 ~
tk 0

ou

t1 t21 tk1 0
t t t
012 2 k2
H0 :


t1p t2p tkp 0
O teste de Wilks o mais utilizado para testar a hiptese H 0 da MANOVA. Contudo
outros testes tambm so utilizados, tais como Pillai, Hotelling-Lawley e o teste de Roy, os
quais podem apresentar resultados diferentes para a mesma anlise. O teste de Wilks
representado pela letra grega (lambda maisculo), assim definido:

E
det E

det H E
H E

Na presena de diferenas sistemticas entre tratamentos, espera-se sempre obter 1 , e


tanto mais significativo quanto menor for seu valor. Para avaliar a significncia do valor de

obtido, pode-se usar tabela prpria para o teste de Wilks, ou trnsformar o valor de em
valor F correspondente. O valor de obtido na tabela para o teste de Wilks funo de , p,
q e ne. O valaor de tabelado :
tab ; p; q; ne

A regra de deciso : rejeita-se a hiptese nula ao nvel de significncia se:


cal tab

Caso contrrio no se rejeita H0 e diz-se que o teste foi significativo ao nvel de


siginificncia .
TESTE PARA VETORES DE MDIAS
Quando rejeitamos a hiptese H0, isto , os vetores de mdias no so iguais, e temos mais
de dois tratamentos, torna-se necessrio um teste de mdias para verificar quais vetores so
diferentes entre si. Para comparar dois vetores de mdias de tratamentos, podemos usar o teste
T2 de Hotelling como apresentado a seguir:

EXEMPLO DE APLICAO
Fazer MANOVA para experimento com um fator inteiramente casualizado utilizando o
programa computacional SAS.
BIBLIOGRAFIA
FISHER, R.A. The use of multiple measurements in taxonomic problems. Annals of
Eugenics, v.7, p.179-188, 1936.
JOHNSON, R. A.; WICHERN, D. W. Applied multivariate statistical analysis. 4th ed.
Upper Saddle River, New Jersey: Prentice-Hall, 1999, 815 p.
KHATTREE, R. & NAIK, D.N. Multivariate data reduction and discrimination with SAS
software. Cary, NC, USA: SAS Institute Inc., 2000. 558 p.
REGAZZI, A.J. Anlise multivariada, notas de aula INF 766, Departamento de Informtica da
Universidade Federal de Viosa, v.2, 2000.
VARELLA, C.A.A. Estimativa da produtividade e do estresse nutricional da cultura do
milho usando imagens digitais. 2004. 92 f. Tese (Doutorado em Engenharia Agrcola)
Universidade Federal de Viosa, Viosa, 2004.

SAS. Online doc version 8. Disponvel em: http://v8doc.sas.com/sashtml/. Acesso em 14 mar.


2007.

Você também pode gostar