Capítulo 1: Experimentos Envolvendo Um Fator Com Dois Níveis

Capítulo 1: Experimentos envolvendo um fator com dois níveis
1.1. Teste de hipóteses
É usual construir modelos estatísticos simples que gerem valores semelhantes às

observações reais da variável resposta de um experimento. Para fator único com dois níveis o modelo é
o descrito em (1.1).
i1,2
yij i  ij  (1.1)
 j1,2,...,ni
No modelo (1.1), yij é a j-ésima observação de yi , variável resposta do experimento quando o
fator único está no nível i,  i é a resposta esperada do experimento quando o fator único está no nível i,
 ij é a diferença entre a j-ésima observação do experimento com o fator único no nível i e seu valor
esperado i . Assume-se que a variável aleatória  ij tem distribuição normal com média zero e variância
 i2 , isto é,  ij ~ N (0;  i2 ) . Costuma-se dizer que  ij é a componente do erro aleatório do modelo. Para o
modelo (1.1) temos o seguinte teste de hipóteses:
H 0: 1  2
(1.2)
H1: 1  2
A hipótese H0 é conhecida como hipótese nula e a hipótese H1 como hipótese alternativa. Em um
teste de hipóteses podemos tomar decisões errada de duas maneiras; na primeira quando rejeitamos a
hipótese H0 e ela é a hipótese verdadeira, na segunda quando aceitamos a hipótese H0 e ela é a hipótese
falsa. O risco  é o risco de erroneamente se rejeitar a hipótese H0, neste caso comete-se o erro do tipo I.
O risco  é o risco de erroneamente se aceitar a hipótese H0; neste caso comete-se o erro do tipo II.
 Pr[rejeitar H 0|H 0 é verdadeir a ]Pr[aceitar H1|H1 é falso]

 Pr[aceitar H 0|H 0 é falsa ]Pr[rejeitar H1|H1 é verdadeir a] (1.3)
Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-1
Quando a hipótese H0 é a hipótese verdadeira, a estatística amostral t0 descrita em (1.4) tem
distribuição t com  n1n2 2 graus de liberdade.
Y 1Y 2 Dif
t0   (1.4)
S12 S22 S

n1 n2
Em (1.4) as variâncias de Y1 e Y2 são desconhecidas, mas iguais por hipótese, isto é, 12  22  2 .
Para a obtenção estatística amostral t0 são necessárias n1 observações da variável resposta com o fator
no nível (1) e n2 observações da variável resposta com o fator no nível (2). Com as n1 observações
calculamos a média amostral Y 1 e a variância amostral S12 e com as n2 observações calculamos a
média amostral Y 2 e a variância amostral S 22 . Na comparação da resistência de blocos de concreto de
dois fornecedores, A e B, as observações da variável resposta serão as resistências dos n1 e n2 blocos de

concretos selecionados pelos fornecedores A e B para a realização do experimento. O fornecedor A
corresponde ao nível (1) e o fornecedor B ao nível (2).
Quando a hipótese H0 é a hipótese verdadeira, 1 2 , a diferença Dif padronizada pelo desvio
padrão S, isto é Dif /S, é em geral pequena. Valores da estatística t0 distantes de zero nos levam a rejeitar
a hipótese H0, valores da estatística t0 próximos a zero nos levam a aceitar a hipótese H0. Para distinguir
valores distantes de valores próximos temos que definir um valor crítico, seja então t , . A hipótese H0
será rejeitada sempre que |t0|t , . Na Tabela 1.1 temos as tomadas de decisão acertadas e as tomadas de
decisão erradas.
Tabela 1.1 Quadro de decisões

Hipótese H0 Decisão Decisão Risco
|t0|t , Aceitar a hipótese H0 Correta
Verdadeira
|t0|t , Rejeitar a hipótese H0 Errada Alfa
|t0|t , Aceitar a hipótese H0 Errada Beta
Falsa
|t0|t , Rejeitar a hipótese H0 Correta
1-2
A distribuição t da Figura 1.1 tem duas caudas, cada uma delas com uma área de probabilidade de /2.
.
 
- t ; 0,0 t ; t
Figura 1.1 Distribuição t com P[|t| > t ; ]=
No teste de hipóteses definido em (1.2) estabelecemos a priori, isto é, antes de realizar o teste, o
risco  de erroneamente se rejeitar a hipótese H 0 . O risco  é o nível de significância do teste. Como
t , é valor de “fronteira" para |t0| > t ; teremos 1P[t0  t  t0 ] p    O valor da probabilidade
1P[t0  t  t0 |t0|  t , ] tem nome próprio, ele se chama valor-p, vide Figura 1.2.
A forma tradicional de apresentar o resultado de um teste de hipóteses é declarar que a hipótese

nula foi rejeitada a um nível de significância  . Esta forma de apresentar as conclusões é por vezes
inadequada, pois ela não dá ao analista qualquer pista se o valor calculado do teste estatístico apenas
caiu na região de rejeição do teste, ou se ele caiu na região de rejeição do teste, e, além disso, distante da
fronteira que separa as regiões de aceitação e de rejeição. Em se rejeitando a hipótese H 0 , é sempre útil
atrelar a esta decisão o valor-p. Evidências contrárias à hipótese nula são tanto maiores quanto menor for
o valor-p.
-t0 t0
p p
- t ; 0,0 t ; t
Figura 1.2 Distribuição t com pP[|t|t0 t0 t ,a ]
1-3
1.2. Experimento para escolha do fabricante que produz o melhor bloco de concreto
Suponha que um engenheiro civil esteja interessado em descobrir se a resistência de duas marcas
de concreto (A e B) difere significativamente. Seja  A a resistência média do concreto A,  B a
resistência média do concreto B e as hipóteses:
H 0:  A   B
(1.5)
H1:  A  B
O engenheiro civil mediu a resistência de cinco blocos do concreto A e de cinco do concreto B. Os dados
estão na Tabela 1.2.
Tabela 1.2: Resistência dos blocos
A B
54 50
55 54
58 56
51 52
57 53
X  550 X  530
S A  7,5
2
S B2  5,0
nA 5 nB 5
Para os dados da Tabela 1.2:
X AX B Dif 2
t0    1,26 (1.2)
S A2 S B2 S 1,587

n1 n2
Para  n1n2 28 e  5% , o valor crítico do teste é t8;5% 2,306 , obtido da Tabela da
distribuição t (Bicaudal) do Apêndice B. Aceitamos a hipótese H 0 , isto é a relação Dif/S não foi
1-4
suficientemente grande para se rejeitar a hipótese H 0 ; o valor t0=1,26 não ultrapassou o valor crítico
t8;5% 2,306 . A título de ilustração construímos as Tabelas 1.3 e 1.4. Na Tabela 1.3, reduzimos as
resistências dos blocos de concreto do fornecedor B de duas unidades; já na Tabela 1.4 mudamos as
resistências dos blocos dos dois fornecedores sem alterar as médias, mas reduzindo as variâncias
S A2 e S B2 de 7,5 e 5,0 para 1,5 e 1,0.
Tabela 1.3: Resistência dos blocos- redução de X B

A B
54 48
55 52
58 54
51 50
57 51
X A 55,0 X B 51,0
S A2  7,5 S B2  5,0
nA 5 nB 5
Tabela 1.4: Resistência dos blocos – reduções em S A2 e S B2

A B
55 52
55 54
56 54
53 52
56 53
X  550 X  530
SA 1,5
2
SB2 1,0
nA 5 nB 5
X AX B Dif 4
t0    2,52 (1.3)
S A2 S B2 S 1,587

n1 n2
1-5
Ao reduzirmos as resistências dos blocos de concreto do fornecedor B de duas unidades
aumentamos a diferença entre médias amostrais ( X A  X B ) de dois para quatro. Aumentamos assim o
numerador de t0 . O valor t0 passa de 1,86 para 2,52. Como t0 2,52  t8;5% 2,306 rejeitamos a hipótese
H 0 , neste caso por conta de uma maior diferença entre as médias amostrais, X A e X B .
X AX B Dif 2
t0    2,83 (1.4)
S A2 S B2 S 0,707

n1 n2
Ao reduzirmos as variâncias amostrais S A2 e S B2 de 7,5 e 5,0 para 1,5 e 1,0, diminuímos o
denominador de t0 . O valor t0 passa de 1,86 para 2,83. Como t0 2,83  t8;5% 2,306 novamente
rejeitamos a hipótese H 0 , neste caso por conta de uma menor variabilidade das observações.
Na Figura 1.3 temos em termos percentuais, o “tamanho” da variabilidade S em relação à
diferença das médias - Dif, para os dados das Tabelas 1.2, 1.3 e 1,4.
Figura 1.3: Variabilidade S em relação à diferença das médias - Dif
Em se rejeitando a hipótese H 0 ( |t0|t , ) torna-se interessante atrelar a esta decisão o valor-p.
Como |t0|t , t8,5% 2,306 , o valor-p será sempre menor que o risco vide Figura 1.4.
1-6
Figura 1.4 Valor-p
Na Tabela 1.5 temos para vários valores da estatística t0 os correspondentes valores do valor-p,
onde pP[|t|t0 ] . O valor-p só existe quando a hipótese H 0 é rejeitada, isto é quando |t0|  t8,5% .
Tabela 1.5: Valores de t0 e correspondente valor-p

| t0 | Valor-p | t0 | Valor-p
2,306( t8,5% ) 0,050 2,896 0,020
2,450 0,040 3,000 0,017

2,520 0,036 4,000 0,004
2,634 0,030 5,000 0,001
2,829 0,022
1-7
1.3 Tamanho da amostra
Para os dados da Tabela 1.2 não podemos afirmar que o concreto A é melhor que o concreto B; a
hipótese H 0 foi aceita. Será que não descobrimos que um concreto é mais resistente que o outro porque
temos poucas observações? Para responder esta pergunta fazemos uso das curvas do Apêndice B, que
além do , requer valores de três parâmetros de entrada: , 1, 2.
nD 2
2 = (1.5)
2aσ 2
1a-1 (1.6)
 2 a(n-1) (1.7)
Nas expressões (1.5), (1.6) e (1.7), n é o tamanho das amostras, a é o número de níveis (no
exemplo, n=5 e a=2) e D é a menor diferença entre as resistências médias dos concretos, | A  B |D ,
que leva o engenheiro civil a classificar um concreto i como melhor que um concreto j. Como não
conhecemos a variância  2 , utilizamos o estimador S2 (S2A SB2 )/2(7,55,0)/26,25 . Se para o
engenheiro civil um concreto é mais resistente que o outro quando sua resistência média excede a do
concorrente, em pelo menos 5 kg/cm2 (D=5), então:
nD 2 5(5) 2
=   2,24 (1.8)
2a 2 4 * 6,25
O risco  (de aceitar H 0 , sendo H 0 falso) está, segundo as curvas do apêndice A, em torno de
20%. Para se reduzir o risco  é preciso aumentar o tamanho das amostras. Suponha então que o
engenheiro civil avaliou três novos blocos dos concretos A e B e obteve as resistências cujos valores
estão em negrito na Tabela 1.5.
1-8
Tabela 1.5: Comparação de duas médias (n=8)
A B
54 50
55 54
58 56
51 52
57 53
54 54
55 53
56 52
X  550 X  530
SA 4,57
2
SB2 3,14
nA 8 nB 8
Repetindo os cálculos, agora para as oito observações de cada concreto, obtemos:
X AX B
t0   2,04 (1.9)
S12 S22

n1 n2
Como tn A
nB 2; t882;5% 2,145 , continuamos aceitando a hipótese H 0 . Os valores críticos
t ; estão no Apêndice A, na Tabela da distribuição t (Bicaudal).
Para os novos valores1=1, 2=14 e =3,6 , o risco  é, segundo as curvas do apêndice A,

próximo de zero.
nD2 8(5) 2
=  3,6 (1.10)
2a 2 4*8
1-9
1.4 De olho nas observações
Antes do surgimento dos computadores o uso da Estatística na solução de problemas reais ficou
meio que “latente” por conta da dificuldade dos cálculos que estas aplicações demandavam. Hoje a
situação é bem diferente, o que mais temos são softwares para estes cálculos. O perigo agora está
justamente no exagero, estes softwares são tão amigáveis que acabamos aceitando tudo o que eles nos
falam sem qualquer questionamento. Retornando ao exemplo dos concretos, mas considerando os dados
da Tabela 1.6. Para estes dados S=1,714, t=3,060 e t nA nB 2  t882  2,145 . Como 3,060 > 2,145, o
software informará que o concreto A é mais resistente que o concreto B.
Tabela 1.6: Resistências de oito blocos de concretos dos fornecedores A e B

A B
49 51
53 48
51 47
52 48
59 45
50 47
49 49
53 49
X A  52,0 X B  48,0
Na Figura 1.4 observamos uma medida de resistência do concreto A igual a 59, bem distante das
demais medidas. Será que não houve um erro de leitura? Caso a leitura tenha sido correta, cabe então
investigar as condições nas quais o quinto bloco de concreto do tipo A foi fabricado. Se descobrirmos a
causa do quinto bloco ser tão resistente, ótimo, pois podemos aplicar este novo conhecimento em
benefício de se produzir blocos de concretos mais resistentes. Se não descobrirmos o porquê, só nos
resta descartar esta observação. Sem ela, a conclusão é outra: com os dados disponíveis não podemos
afirmar que o concreto A é melhor que o concreto B.
1-10
Concreto A Concreto B
59
57
Resistencia do concreto.
55
53
51
49
47
45
1 2 3 4 5 6 7 8
Observação
Figura 1.4: Dados da Tabela 1.3
Outro ponto importante é o estabelecimento das hipóteses em (1.1), assumimos H1: A  B . Se já

utilizamos um dos concretos, seja o concreto B, então a hipótese H1 muda para H1: A  B , isto é, só
nos interessaremos pelo concreto A se ele for mais resistente que o concreto B. Nesta mudança, o valor
crítico t ; diminui de 2,306 para 1,860. O risco  se concentra na cauda da direita, vide Figura 1.5. Se
X A  X B aceitamos a hipótese H 0 sem precisar calcular a estatística amostral t 0 . Por quê?
 
0,0 t ; t
Figura 1.5 Distribuição t com P[t > t ; ]=
1-11
1.5 Exercícios
Exercício 1.1: Gerar dez observações de uma distribuição normal com média 50 e desvio padrão dois.
Suponha que as cinco primeiras observações são resistências de cinco blocos de concreto do fornecedor
A ( A 50 ) e as cinco últimas resistências de cinco blocos de concreto do fornecedor B ( B 50 ). Repita
este procedimento 20 vezes. Para um risco  de 5%, investigue se a hipótese H0 é sempre aceita, sendo:
H 0:  A   B
(1.5)
H1:  A  B
Exercício 1.2: Gerar cinco observações de uma distribuição normal com média 50 e desvio padrão dois
e outras cinco de uma distribuição normal com média 53 e desvio padrão dois. Suponha que as cinco
primeiras observações são resistências de cinco blocos de concreto do fornecedor A ( A 50 ) e as cinco
últimas resistências de cinco blocos de concreto do fornecedor B ( B 53 ). Repita este procedimento 20
vezes. Para um risco  de 5%, investigue se a hipótese H0 é sempre rejeitada, sendo:
H 0:  A   B
(1.5)
H1:  A  B
Exercício 1.3: Refaça o exemplo da seção 1.2 para o seguinte teste de hipóteses:
H 0 :  A  B
(1.6)
H1:  A  B
1-12

Capítulo 1: Experimentos Envolvendo Um Fator Com Dois Níveis

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Capítulo 1: Experimentos Envolvendo Um Fator Com Dois Níveis

Enviado por

Direitos autorais:

Formatos disponíveis

Capítulo 1: Experimentos envolvendo um fator com dois níveis

1.1. Teste de hipóteses

É usual construir modelos estatísticos simples que gerem valores semelhantes às

No modelo (1.1), yij é a j-ésima observação de yi , variável resposta do experimento quando o

 Pr[rejeitar H 0|H 0 é verdadeir a ]Pr[aceitar H1|H1 é falso]

calculamos a média amostral Y 1 e a variância amostral S12 e com as n2 observações calculamos a

média amostral Y 2 e a variância amostral S 22 . Na comparação da resistência de blocos de concreto de

dois fornecedores, A e B, as observações da variável resposta serão as resistências dos n1 e n2 blocos de

Tabela 1.1 Quadro de decisões

t , é valor de “fronteira" para |t0| > t ; teremos 1P[t0  t  t0 ] p    O valor da probabilidade

A forma tradicional de apresentar o resultado de um teste de hipóteses é declarar que a hipótese

Figura 1.2 Distribuição t com pP[|t|t0 t0 t ,a ]

Para os dados da Tabela 1.2:

Tabela 1.3: Resistência dos blocos- redução de X B

Tabela 1.4: Resistência dos blocos – reduções em S A2 e S B2

Para os dados da Tabela 1.3:

Ao reduzirmos as variâncias amostrais S A2 e S B2 de 7,5 e 5,0 para 1,5 e 1,0, diminuímos o

Figura 1.3: Variabilidade S em relação à diferença das médias - Dif

Em se rejeitando a hipótese H 0 ( |t0|t , ) torna-se interessante atrelar a esta decisão o valor-p.

Tabela 1.5: Valores de t0 e correspondente valor-p

2,306( t8,5% ) 0,050 2,896 0,020

2,450 0,040 3,000 0,017

Repetindo os cálculos, agora para as oito observações de cada concreto, obtemos:

Para os novos valores1=1, 2=14 e =3,6 , o risco  é, segundo as curvas do apêndice A,

software informará que o concreto A é mais resistente que o concreto B.

Tabela 1.6: Resistências de oito blocos de concretos dos fornecedores A e B

Figura 1.4: Dados da Tabela 1.3

Outro ponto importante é o estabelecimento das hipóteses em (1.1), assumimos H1: A  B . Se já

X A  X B aceitamos a hipótese H 0 sem precisar calcular a estatística amostral t 0 . Por quê?

Figura 1.5 Distribuição t com P[t > t ; ]=

Você também pode gostar