Você está na página 1de 24

Programa de Ps-Graduao em Engenharia Eltrica

Disciplina: Introduo ao Processo Estocstico

ANOVA:
Anlise de Varincia
APLICAO.
Prof. Hani Camille Yehia

Alunos: Augusto Filho


Clia do N. Cavalcante

Roteiro

Modelo de ANOVA

Verificao da suposio do Modelo

Simulao

Exemplo Prtico

Concluso

Bibliografia

Modelo ANOVA

yij i eij

i = 1, 2, 3, ...,k
j = 1, 2, ..., n

Yij ; valor da varivel resposta na j-sima observao do i-simo tratamento.


: a a mdia geral de todos os tratamentos;
i : o efeito do i-simo tratamento;
eij: o erro aleatrio.

Pressuposies
Bsicas:
As amostra so aleatrias e independentes;

As populaes tm distribuies normais;

As populaes tm a mesma varincia.

Hipteses e modelo
subjacente
Sob H0: 1 = 2 =...= k = 0
yij i eij

yij eij

Hipteses e modelo
subjacente
Sob H1: i 0 para algum i

yij i eij

Tabela de Anlise de Varincia (ANOVA)

Tabela de Anlise de Varincia (ANOVA)


Fonte de
Variao

Soma de
Quadrados

Tratamentos

SQTRAT
i 1

yi2. y..2

ni N

SQERRO = SQTotal - SQTRAT

Erro

Total

SQTotal

2
y
yij2 ..
N
i 1 j 1
k

gl

k-1

K(n-1)

Kn -1

Quadrados
Mdios

QM TRAT

SQTRAT
k 1

QM ERRO

SQERRO
k (n 1)

QM TRAT
QM ERRO

Simulao
Simulaes em populaes normais:

Trs populaes;

Tamanho da amostra: n=30, n=50 e n=1000;

Estrutura de Mdia

Critrio 1 - Mdias diferentes com Varincias Iguais.

Critrio 2 Mdias Iguais com Varincias Iguais;

Simulao

Simulao

Simulao

Regra de deciso: Abordagem


Clssica
Rejeito Ho se: F > F (k 1; k(n - 1)

No rejeita Ho se: F F (k 1; k(n - 1)

Valor-p

Regra de deciso: Abordagem


Valor-p
= nvel de significncia

(probab. tolervel de se rejeitar Ho quando esta for verdadeira)


Usual: = 5%

rejeita H0 (prova-se
estatisticamente H1)

Valor-p

No rejeita H0 (os dados no


mostram evidncia para afirmar
H1)

Valor-p >

Verificao da Adequao do
Modelo
Um resduo definido como:
eij yij y i

Resduo: A diferena entre uma observao e a mdia do


tratamento correspondente.

As suposies associadas ao modelo, feita atravs da analise dos resduos:


1.

Os erros tem mdia zero e a mesma varincia 2;

2.

Os erros so independentes, ou seja, um valor de um erro no depende


de qualquer outro erro;

3.

Os erros tm distribuio normal.


Logo, os erros so iid N(0, 2).

Verificao da Adequao do
Modelo
Suposio de Independncia
Grfico de Resduos vs Ordem
Suposio de Igualdade de Varincia
Grfico de Resduos vs Mdias dos Tratamentos
Suposio de Normalidade
Grfico de Probabilidade Normal

Exemplo:
Um fabricante de papel usado para fabricar sacos de papel pardo est interessado em
melhorar a resistncia do produto tenso. A engenharia de produto pensa que a resistncia
tenso seja uma funo da concentrao de madeira de lei na polpa e que a faixa pratica
de interesse das concentraes de madeira de lei esteja entre 5 e 20%. Um time de
engenheiros responsveis pelo estudo decide investigar quatro nveis de concentrao de
madeira de lei: 5%, 10%, 15% e 20%. Eles decidem fabricar seis corpos de prova, para cada
nvel de concentrao, usando uma planta piloto. Todos os 24 corpos de prova so testados,
em uma ordem aleatria, em um equipamento de teste de laboratrio. Os dados desse
experimento so:

Box-Plot
Boxplot of Madeira vs Concentracao
25

Madeira

20

15

10

5
5

10

15
Concentracao

20

Hipteses:

Continuao do teste de
hipteses:

Final do teste

Anlise dos Resduos


Residual Plots for Madeira
Normal Probability Plot of the Residuals
Standardized Residual

99

Percent

90
50
10
1

Residuals Versus the Fitted Values

-2

-1
0
1
Standardized Residual

2
1
0
-1
-2

10,0

Frequency

4,8
3,6
2,4
1,2
0,0

-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5


Standardized Residual

15,0
17,5
Fitted Value

20,0

Residuals Versus the Order of the Data


Standardized Residual

Histogram of the Residuals

12,5

2,0

2
1
0
-1
-2
2

8 10 12 14 16 18 20 22 24
Observation Order

Programa usado no Software


R.
n<-30
mi1<-19
mi2<-19
mi3<-19
sd<-3

a1<-rnorm(n,mi1,sd)
a2<-rnorm(n,mi2,sd)
a3<-rnorm(n,mi3,sd)
a=c(a1,a2,a3)
n=rep(n,3) #tamanho das amostras
group=rep(1:3,n) #Cuidado aqui.
data = data.frame(a = a, group = factor(group))
fit = lm(a ~ group, data)
anova(fit)
tmpfn = function(x) c(sum = sum(x), mean = mean(x), var = var(x),n = length(x))
tapply(a, group, tmpfn)
tmpfn(a)

Concluso
Logo a analise de varincia pode ser usada para testar a diferena
entre mdias de vrias populaes, mostrando-se que a base usada
para os testes estatisticos em analise de variancia o
desenvolvimento de duas estimativas independentes da variancia da
populao sigma ao quadrado, ao computar a razao destas duas
estimativas, desenvolvemos uma regra de rejeijo para determinar se
rejeitamos a hipotese nula de que as medias das populaes so
iguais.

Referncia:
Analysis of Variance Tables Based on Experimental Structure
C. J. Brien, Biometrics, Vol. 39, No. 1 (Mar., 1983), pp. 53-59
FISHER, R. A. The logic of inductive inference. J. R. Stat. Soc., v.98, p.34-54,
1935.
MONTGOMERY, D.C. 1988. Design and analysis of experiments. 2nd. John Wiley
& Sons, New York, USA.
SNEDECOR, C.W. and W.G. COCHRAN, 1980. Statistical Methods. 7ed. Iowa
State University Press, Amer. Iowa. USA.
FISHER, R.A. Statistical Methods for Research Workers. 11 ed. Oliver & Boyd,
Edinburgo. 1950.
Gamerman, D. & Migon, H. (1993). Inferncia estatstica: uma abordagem
integrada, Textos de mtodos matemticos, UFRJ.
James F. Reed III: Analysis of Variance (ANOVA) Models in Emergency Medicine.
The Internet Journal of Emergency and Intensive Care Medicine. 2004. Volume 7
Number 2. http://www.ispub.com/ostia/index.php?xmlFilePath=journals/ijeicm/vol7n2/anova.xml