Você está na página 1de 13

Universidade Federal do Rio Grande do Norte

Centro de Tecnologia
Departamento de Engenharia de Produção
Curso de Graduação

EXP2 - Análise de Variância


(ANOVA): fundamentos
PRO1807

Prof. Lucas Borges Leal da Silva, DSc.

2023.1
Teste de hipóteses de mais de duas médias – Análise de variância
(ANOVA) Lembrando: para testar hipóteses segundo estratégia de Neyman e Pearson é necessário
1) formular as hipóteses estatísticas;

2) fixar a probabilidade do erro tipo I;

3) calcular o tamanho da amostra necessária para detectar uma diferença que se


suspeita existente o que é equivalente a fixar a probabilidade do erro tipo II.

4) apresentar a distribuição de probabilidade da estatística do teste;

5) estabelecer a(s) região(ões) de rejeição e aceitação (regiões críticas) do teste;

6) realizar o estudo, ou seja , coletar os dados e calcular a estatística do teste;

7) confrontar a estatística observada com a região crítica;

8) tomar a decisão;

9) elaborar a conclusão.

2
Considerar a situação na qual deseja-se saber se o tipo de gordura produz efeitos diferentes, quanto a
absorção, em doughnouts fritos.

Inicialmente será apresentada a comparação de duas médias e, posteriormente, serão comparadas


três médias.

Desenho experimental:
São sorteados (aleatoriamente) doughnuts que foram fritos em cada um de dois tipos de gordura.
Quantifica-se a gordura absorvida em cada tipo.

Notação:
Tipo de gordura (fator): tipo 1 e tipo 2 (i=1,2)
Número de doughnuts sorteados em cada tipo: 6 (j=1,...,6)

Dados obtidos: quantidade de gordura (g) absorvida por doughnut, segundo tipo de gordura

doughnut Tipo (i)


(j) 1 2
1 78 55
2 91 66
3 97 49
4 82 64
5 85 70
6 77 68
média 85 62 73,5

3
H 0 : 1 =  2
Hipóteses:
H a : 1   2

Fixando-se a probabilidade de erro tipo I:


Nível de significância () = 0,05

Para nível de significância pré-fixado, define-se as áreas de aceitação e rejeição de H0 utilizando-se a


distrbuição F de Snedecor.

Calcula-se a estatística do teste e compara-se o


valor observado com a área de rejeição/aceitação 3.5
Density

H0
de H0 para tomada de decisão. 3

2.5

1.5 Aceitação de H0
Rejeição de H0
1

.5

4
Estatística do teste

Para a definição da estatística do teste, parte-se da idéia que se as médias fossem iguais, a média do
tipo 1 seria igual à media do tipo 2 e estas seriam iguais à média total. Se isto acontecesse, não
existiria variabilidade.

Assim, na análise de variância estuda-se a variabilidade dos dados. A variabilidade total dos dados é
decomposta em dois componentes: a variabilidade das observações dentro de cada tipo (em torno
de suas médias) e a variabilidade entre tipo (cada média em torno da média total).

Estrutura geral dos dados

i
Unidade de 1 2
observação
1 X11 X21
2 X12 X22
j j X1j X2j

6 X16 X26
Médias
X 1. X 2. X ..
no exemplo: n1=6 n2=6 N=12

5
2

O número total de observações é igual a N = n1 + n 2 =  ni ;


i =1

A média de cada tipo é igual a


6 ni

x + x + ... + x16
x
j =1
1j x
j =1
1j

X 1. = 11 12 = =
6 6 n1
6 n2

x + x22 + ... + x26


x
j =1
2j x
j =1
2j

X 2. = 21 = =
6 6 n2

6 ni

x + xi 2 + ... + xi 6
x j =1
ij x
j =1
ij

A média de um tipo genérico i é igual a X i. = i1 = =


6 6 ni

2 6 2 ni

x + ... + x16 + x21 + ... + x26  x ij  x ij


A média geral é igual a X .. = 11 = i =1 j =1
= i =1 j =1

6+6 12 N

6
Variabilidade dos dados

Chamando-se os tipos de gordura de k; no exemplo k=2, tem-se que o índice para tipo de gordura (i)
varia de 1 a k (i=1,..,k)

Considerando-se o número de unidades de observação (doughnuts) ni, tem-se que o índice para
unidade (j) varia de 1 a ni. No exemplo, j= 1, 2,...6 para i=1 e j= 1, 2, ...6 para i=2 pois n 1 = n2 = n
= 6 (modelo balanceado).

A variabilidade total dos dados é decomposta em duas: variabilidade dentro e variabilidade dentro:

Variação dentro de tipo de gordura

k ni Soma de quadrado dentro (SQD)

 ij i.
( x − x
i =1 j =1
) 2 Sum of squares within (SQW).
SQD também chamada resíduo (SQR)

7
Variação entre tipo

k Soma de quadrado entre (SQE)

 i i. ..
n (
i =1
x − x ) 2
Sum of squares between (SQB).

Variação total

k ni

 ij ..
( x − x
i =1 j =1
) 2 Soma de quadrado total (SQT)

SQT=SQE+SQD

8
Recapitulando-se

X:variável contínua de interesse

Populações P1 P2

Médias 1 2
Variâncias 2 2

Deseja-se comparar as médias mediante o cálculo da variabilidade dos dados. É necessário estimar

 2 (variância populacional). Para tanto, divide-se cada soma de quadrados pelo respectivo grau de
liberdade.

Graus de liberdade (número de observações necessárias)

• Graus de liberdade dentro = N-k=10

• Graus de liberdade entre = k-1=1

• Graus de liberdade total = N-1

9
SQD
Estimador de  2
: se H0 for verdade, = ̂ 2
n−k
SQD
= Quadrado médio dentro (QMD), também chamado quadrado médio do resíduo (QMR)
N −k

outro estimador de  2 : se H 0 for verdade,


SQE
= ˆ 2
k −1

SQE
= Quadrado médio entre (QME), se H0 não for verdade, o valor estimado do quadrado
k −1
1 k
médio entre será igual a QME = ̂ +
2
 i i. ..
k − 1 i =1
n ( x − x ) 2

10
Para a realização do teste confronta-se o QMD e o QME.

QME
Estatística do teste:
QMD
QME
Se H0 for verdade, =1
QMD
QME
Se H0 não for verdade, 1
QMD

Se H0 for verdade,
QME
~ F 1 , 2 onde F é a curva F de Snedecor e 1 e  2 são os graus de
QMD
liberdade do numerador e denominador, respectivamente

11
Tabela da Análise de Variância – ANOVA
Fonte de gl SQ QM F
variação
Entre k-1 SQE SQE QME
QME =
k −1 QMD
Dentro N-k SQD SQD
QMD =
N −k
Total N-1 SQT

Fórmulas operacionais:

T2
SQT =  X − , onde T =  X ij
2
ij
i j N i j

SQD = T 2 T =  X ij
i , onde i
i j X ij − i ni
2
j

Ti 2 T 2
SQE = i ni −
N

12
Prof. Lucas Borges Leal da Silva, DSc.

lucas.borges@ufrn.br

CTEC/ Sala 323

Horário de Atendimento: 24T56

13

Você também pode gostar