Você está na página 1de 12

Capítulo 1: Experimentos envolvendo um fator com dois níveis

1.1. Teste de hipóteses

É usual construir modelos estatísticos simples que gerem valores semelhantes às


observações reais da variável resposta de um experimento. Para fator único com dois níveis o modelo é
o descrito em (1.1).

i1,2
yij i  ij  (1.1)
 j1,2,...,ni

No modelo (1.1), yij é a j-ésima observação de yi , variável resposta do experimento quando o

fator único está no nível i,  i é a resposta esperada do experimento quando o fator único está no nível i,

 ij é a diferença entre a j-ésima observação do experimento com o fator único no nível i e seu valor

esperado i . Assume-se que a variável aleatória  ij tem distribuição normal com média zero e variância

 i2 , isto é,  ij ~ N (0;  i2 ) . Costuma-se dizer que  ij é a componente do erro aleatório do modelo. Para o
modelo (1.1) temos o seguinte teste de hipóteses:
H 0: 1  2
(1.2)
H1: 1  2
A hipótese H0 é conhecida como hipótese nula e a hipótese H1 como hipótese alternativa. Em um
teste de hipóteses podemos tomar decisões errada de duas maneiras; na primeira quando rejeitamos a
hipótese H0 e ela é a hipótese verdadeira, na segunda quando aceitamos a hipótese H0 e ela é a hipótese
falsa. O risco  é o risco de erroneamente se rejeitar a hipótese H0, neste caso comete-se o erro do tipo I.
O risco  é o risco de erroneamente se aceitar a hipótese H0; neste caso comete-se o erro do tipo II.

 Pr[rejeitar H 0|H 0 é verdadeir a ]Pr[aceitar H1|H1 é falso]


 Pr[aceitar H 0|H 0 é falsa ]Pr[rejeitar H1|H1 é verdadeir a] (1.3)

Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-1
Quando a hipótese H0 é a hipótese verdadeira, a estatística amostral t0 descrita em (1.4) tem
distribuição t com  n1n2 2 graus de liberdade.

Y 1Y 2 Dif
t0   (1.4)
S12 S22 S

n1 n2

Em (1.4) as variâncias de Y1 e Y2 são desconhecidas, mas iguais por hipótese, isto é, 12  22  2 .

Para a obtenção estatística amostral t0 são necessárias n1 observações da variável resposta com o fator
no nível (1) e n2 observações da variável resposta com o fator no nível (2). Com as n1 observações

calculamos a média amostral Y 1 e a variância amostral S12 e com as n2 observações calculamos a

média amostral Y 2 e a variância amostral S 22 . Na comparação da resistência de blocos de concreto de

dois fornecedores, A e B, as observações da variável resposta serão as resistências dos n1 e n2 blocos de


concretos selecionados pelos fornecedores A e B para a realização do experimento. O fornecedor A
corresponde ao nível (1) e o fornecedor B ao nível (2).
Quando a hipótese H0 é a hipótese verdadeira, 1 2 , a diferença Dif padronizada pelo desvio
padrão S, isto é Dif /S, é em geral pequena. Valores da estatística t0 distantes de zero nos levam a rejeitar
a hipótese H0, valores da estatística t0 próximos a zero nos levam a aceitar a hipótese H0. Para distinguir
valores distantes de valores próximos temos que definir um valor crítico, seja então t , . A hipótese H0

será rejeitada sempre que |t0|t , . Na Tabela 1.1 temos as tomadas de decisão acertadas e as tomadas de

decisão erradas.

Tabela 1.1 Quadro de decisões


Hipótese H0 Decisão Decisão Risco
|t0|t , Aceitar a hipótese H0 Correta
Verdadeira
|t0|t , Rejeitar a hipótese H0 Errada Alfa
|t0|t , Aceitar a hipótese H0 Errada Beta
Falsa
|t0|t , Rejeitar a hipótese H0 Correta

Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-2
A distribuição t da Figura 1.1 tem duas caudas, cada uma delas com uma área de probabilidade de /2.
.

 

- t ; 0,0 t ; t
Figura 1.1 Distribuição t com P[|t| > t ; ]=

No teste de hipóteses definido em (1.2) estabelecemos a priori, isto é, antes de realizar o teste, o
risco  de erroneamente se rejeitar a hipótese H 0 . O risco  é o nível de significância do teste. Como

t , é valor de “fronteira" para |t0| > t ; teremos 1P[t0  t  t0 ] p    O valor da probabilidade

1P[t0  t  t0 |t0|  t , ] tem nome próprio, ele se chama valor-p, vide Figura 1.2.

A forma tradicional de apresentar o resultado de um teste de hipóteses é declarar que a hipótese


nula foi rejeitada a um nível de significância  . Esta forma de apresentar as conclusões é por vezes
inadequada, pois ela não dá ao analista qualquer pista se o valor calculado do teste estatístico apenas
caiu na região de rejeição do teste, ou se ele caiu na região de rejeição do teste, e, além disso, distante da
fronteira que separa as regiões de aceitação e de rejeição. Em se rejeitando a hipótese H 0 , é sempre útil
atrelar a esta decisão o valor-p. Evidências contrárias à hipótese nula são tanto maiores quanto menor for
o valor-p.

-t0 t0
p p

- t ; 0,0 t ; t

Figura 1.2 Distribuição t com pP[|t|t0 t0 t ,a ]

Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-3
1.2. Experimento para escolha do fabricante que produz o melhor bloco de concreto

Suponha que um engenheiro civil esteja interessado em descobrir se a resistência de duas marcas
de concreto (A e B) difere significativamente. Seja  A a resistência média do concreto A,  B a
resistência média do concreto B e as hipóteses:

H 0:  A   B
(1.5)
H1:  A  B
O engenheiro civil mediu a resistência de cinco blocos do concreto A e de cinco do concreto B. Os dados
estão na Tabela 1.2.
Tabela 1.2: Resistência dos blocos
A B
54 50
55 54
58 56
51 52
57 53
X  550 X  530
S A  7,5
2
S B2  5,0
nA 5 nB 5

Para os dados da Tabela 1.2:

X AX B Dif 2
t0    1,26 (1.2)
S A2 S B2 S 1,587

n1 n2

Para  n1n2 28 e  5% , o valor crítico do teste é t8;5% 2,306 , obtido da Tabela da

distribuição t (Bicaudal) do Apêndice B. Aceitamos a hipótese H 0 , isto é a relação Dif/S não foi

Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-4
suficientemente grande para se rejeitar a hipótese H 0 ; o valor t0=1,26 não ultrapassou o valor crítico

t8;5% 2,306 . A título de ilustração construímos as Tabelas 1.3 e 1.4. Na Tabela 1.3, reduzimos as

resistências dos blocos de concreto do fornecedor B de duas unidades; já na Tabela 1.4 mudamos as
resistências dos blocos dos dois fornecedores sem alterar as médias, mas reduzindo as variâncias
S A2 e S B2 de 7,5 e 5,0 para 1,5 e 1,0.

Tabela 1.3: Resistência dos blocos- redução de X B


A B
54 48
55 52
58 54
51 50
57 51
X A 55,0 X B 51,0
S A2  7,5 S B2  5,0
nA 5 nB 5

Tabela 1.4: Resistência dos blocos – reduções em S A2 e S B2


A B
55 52
55 54
56 54
53 52
56 53
X  550 X  530
SA 1,5
2
SB2 1,0
nA 5 nB 5

Para os dados da Tabela 1.3:

X AX B Dif 4
t0    2,52 (1.3)
S A2 S B2 S 1,587

n1 n2

Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-5
Ao reduzirmos as resistências dos blocos de concreto do fornecedor B de duas unidades
aumentamos a diferença entre médias amostrais ( X A  X B ) de dois para quatro. Aumentamos assim o
numerador de t0 . O valor t0 passa de 1,86 para 2,52. Como t0 2,52  t8;5% 2,306 rejeitamos a hipótese

H 0 , neste caso por conta de uma maior diferença entre as médias amostrais, X A e X B .
Para os dados da Tabela 1.4:

X AX B Dif 2
t0    2,83 (1.4)
S A2 S B2 S 0,707

n1 n2

Ao reduzirmos as variâncias amostrais S A2 e S B2 de 7,5 e 5,0 para 1,5 e 1,0, diminuímos o

denominador de t0 . O valor t0 passa de 1,86 para 2,83. Como t0 2,83  t8;5% 2,306 novamente

rejeitamos a hipótese H 0 , neste caso por conta de uma menor variabilidade das observações.
Na Figura 1.3 temos em termos percentuais, o “tamanho” da variabilidade S em relação à
diferença das médias - Dif, para os dados das Tabelas 1.2, 1.3 e 1,4.

Figura 1.3: Variabilidade S em relação à diferença das médias - Dif

Em se rejeitando a hipótese H 0 ( |t0|t , ) torna-se interessante atrelar a esta decisão o valor-p.

Como |t0|t , t8,5% 2,306 , o valor-p será sempre menor que o risco vide Figura 1.4.

Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-6
Figura 1.4 Valor-p

Na Tabela 1.5 temos para vários valores da estatística t0 os correspondentes valores do valor-p,

onde pP[|t|t0 ] . O valor-p só existe quando a hipótese H 0 é rejeitada, isto é quando |t0|  t8,5% .

Tabela 1.5: Valores de t0 e correspondente valor-p


| t0 | Valor-p | t0 | Valor-p

2,306( t8,5% ) 0,050 2,896 0,020

2,450 0,040 3,000 0,017


2,520 0,036 4,000 0,004
2,634 0,030 5,000 0,001
2,829 0,022

Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-7
1.3 Tamanho da amostra

Para os dados da Tabela 1.2 não podemos afirmar que o concreto A é melhor que o concreto B; a
hipótese H 0 foi aceita. Será que não descobrimos que um concreto é mais resistente que o outro porque
temos poucas observações? Para responder esta pergunta fazemos uso das curvas do Apêndice B, que
além do , requer valores de três parâmetros de entrada: , 1, 2.

nD 2
2 = (1.5)
2aσ 2

1a-1 (1.6)
 2 a(n-1) (1.7)

Nas expressões (1.5), (1.6) e (1.7), n é o tamanho das amostras, a é o número de níveis (no
exemplo, n=5 e a=2) e D é a menor diferença entre as resistências médias dos concretos, | A  B |D ,
que leva o engenheiro civil a classificar um concreto i como melhor que um concreto j. Como não
conhecemos a variância  2 , utilizamos o estimador S2 (S2A SB2 )/2(7,55,0)/26,25 . Se para o

engenheiro civil um concreto é mais resistente que o outro quando sua resistência média excede a do
concorrente, em pelo menos 5 kg/cm2 (D=5), então:

nD 2 5(5) 2
=   2,24 (1.8)
2a 2 4 * 6,25

O risco  (de aceitar H 0 , sendo H 0 falso) está, segundo as curvas do apêndice A, em torno de

20%. Para se reduzir o risco  é preciso aumentar o tamanho das amostras. Suponha então que o
engenheiro civil avaliou três novos blocos dos concretos A e B e obteve as resistências cujos valores
estão em negrito na Tabela 1.5.

Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-8
Tabela 1.5: Comparação de duas médias (n=8)
A B
54 50
55 54
58 56
51 52
57 53
54 54
55 53
56 52
X  550 X  530
SA 4,57
2
SB2 3,14
nA 8 nB 8

Repetindo os cálculos, agora para as oito observações de cada concreto, obtemos:

X AX B
t0   2,04 (1.9)
S12 S22

n1 n2

Como tn A
nB 2; t882;5% 2,145 , continuamos aceitando a hipótese H 0 . Os valores críticos
t ; estão no Apêndice A, na Tabela da distribuição t (Bicaudal).

Para os novos valores1=1, 2=14 e =3,6 , o risco  é, segundo as curvas do apêndice A,


próximo de zero.

nD2 8(5) 2
=  3,6 (1.10)
2a 2 4*8

Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-9
1.4 De olho nas observações
Antes do surgimento dos computadores o uso da Estatística na solução de problemas reais ficou
meio que “latente” por conta da dificuldade dos cálculos que estas aplicações demandavam. Hoje a
situação é bem diferente, o que mais temos são softwares para estes cálculos. O perigo agora está
justamente no exagero, estes softwares são tão amigáveis que acabamos aceitando tudo o que eles nos
falam sem qualquer questionamento. Retornando ao exemplo dos concretos, mas considerando os dados
da Tabela 1.6. Para estes dados S=1,714, t=3,060 e t nA nB 2  t882  2,145 . Como 3,060 > 2,145, o

software informará que o concreto A é mais resistente que o concreto B.

Tabela 1.6: Resistências de oito blocos de concretos dos fornecedores A e B


A B
49 51
53 48
51 47
52 48
59 45
50 47
49 49
53 49
X A  52,0 X B  48,0

Na Figura 1.4 observamos uma medida de resistência do concreto A igual a 59, bem distante das
demais medidas. Será que não houve um erro de leitura? Caso a leitura tenha sido correta, cabe então
investigar as condições nas quais o quinto bloco de concreto do tipo A foi fabricado. Se descobrirmos a
causa do quinto bloco ser tão resistente, ótimo, pois podemos aplicar este novo conhecimento em
benefício de se produzir blocos de concretos mais resistentes. Se não descobrirmos o porquê, só nos
resta descartar esta observação. Sem ela, a conclusão é outra: com os dados disponíveis não podemos
afirmar que o concreto A é melhor que o concreto B.

Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-10
Concreto A Concreto B

59

57

Resistencia do concreto.
55

53

51

49

47

45
1 2 3 4 5 6 7 8
Observação

Figura 1.4: Dados da Tabela 1.3

Outro ponto importante é o estabelecimento das hipóteses em (1.1), assumimos H1: A  B . Se já


utilizamos um dos concretos, seja o concreto B, então a hipótese H1 muda para H1: A  B , isto é, só
nos interessaremos pelo concreto A se ele for mais resistente que o concreto B. Nesta mudança, o valor
crítico t ; diminui de 2,306 para 1,860. O risco  se concentra na cauda da direita, vide Figura 1.5. Se

X A  X B aceitamos a hipótese H 0 sem precisar calcular a estatística amostral t 0 . Por quê?

 

0,0 t ; t

Figura 1.5 Distribuição t com P[t > t ; ]=

Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-11
1.5 Exercícios

Exercício 1.1: Gerar dez observações de uma distribuição normal com média 50 e desvio padrão dois.
Suponha que as cinco primeiras observações são resistências de cinco blocos de concreto do fornecedor
A ( A 50 ) e as cinco últimas resistências de cinco blocos de concreto do fornecedor B ( B 50 ). Repita
este procedimento 20 vezes. Para um risco  de 5%, investigue se a hipótese H0 é sempre aceita, sendo:
H 0:  A   B
(1.5)
H1:  A  B
Exercício 1.2: Gerar cinco observações de uma distribuição normal com média 50 e desvio padrão dois
e outras cinco de uma distribuição normal com média 53 e desvio padrão dois. Suponha que as cinco
primeiras observações são resistências de cinco blocos de concreto do fornecedor A ( A 50 ) e as cinco
últimas resistências de cinco blocos de concreto do fornecedor B ( B 53 ). Repita este procedimento 20
vezes. Para um risco  de 5%, investigue se a hipótese H0 é sempre rejeitada, sendo:

H 0:  A   B
(1.5)
H1:  A  B
Exercício 1.3: Refaça o exemplo da seção 1.2 para o seguinte teste de hipóteses:

H 0 :  A  B
(1.6)
H1:  A  B

Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-12

Você também pode gostar