Escolar Documentos
Profissional Documentos
Cultura Documentos
i1,2
yij i ij (1.1)
j1,2,...,ni
fator único está no nível i, i é a resposta esperada do experimento quando o fator único está no nível i,
ij é a diferença entre a j-ésima observação do experimento com o fator único no nível i e seu valor
esperado i . Assume-se que a variável aleatória ij tem distribuição normal com média zero e variância
i2 , isto é, ij ~ N (0; i2 ) . Costuma-se dizer que ij é a componente do erro aleatório do modelo. Para o
modelo (1.1) temos o seguinte teste de hipóteses:
H 0: 1 2
(1.2)
H1: 1 2
A hipótese H0 é conhecida como hipótese nula e a hipótese H1 como hipótese alternativa. Em um
teste de hipóteses podemos tomar decisões errada de duas maneiras; na primeira quando rejeitamos a
hipótese H0 e ela é a hipótese verdadeira, na segunda quando aceitamos a hipótese H0 e ela é a hipótese
falsa. O risco é o risco de erroneamente se rejeitar a hipótese H0, neste caso comete-se o erro do tipo I.
O risco é o risco de erroneamente se aceitar a hipótese H0; neste caso comete-se o erro do tipo II.
Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-1
Quando a hipótese H0 é a hipótese verdadeira, a estatística amostral t0 descrita em (1.4) tem
distribuição t com n1n2 2 graus de liberdade.
Y 1Y 2 Dif
t0 (1.4)
S12 S22 S
n1 n2
Em (1.4) as variâncias de Y1 e Y2 são desconhecidas, mas iguais por hipótese, isto é, 12 22 2 .
Para a obtenção estatística amostral t0 são necessárias n1 observações da variável resposta com o fator
no nível (1) e n2 observações da variável resposta com o fator no nível (2). Com as n1 observações
será rejeitada sempre que |t0|t , . Na Tabela 1.1 temos as tomadas de decisão acertadas e as tomadas de
decisão erradas.
Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-2
A distribuição t da Figura 1.1 tem duas caudas, cada uma delas com uma área de probabilidade de /2.
.
- t ; 0,0 t ; t
Figura 1.1 Distribuição t com P[|t| > t ; ]=
No teste de hipóteses definido em (1.2) estabelecemos a priori, isto é, antes de realizar o teste, o
risco de erroneamente se rejeitar a hipótese H 0 . O risco é o nível de significância do teste. Como
1P[t0 t t0 |t0| t , ] tem nome próprio, ele se chama valor-p, vide Figura 1.2.
-t0 t0
p p
- t ; 0,0 t ; t
Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-3
1.2. Experimento para escolha do fabricante que produz o melhor bloco de concreto
Suponha que um engenheiro civil esteja interessado em descobrir se a resistência de duas marcas
de concreto (A e B) difere significativamente. Seja A a resistência média do concreto A, B a
resistência média do concreto B e as hipóteses:
H 0: A B
(1.5)
H1: A B
O engenheiro civil mediu a resistência de cinco blocos do concreto A e de cinco do concreto B. Os dados
estão na Tabela 1.2.
Tabela 1.2: Resistência dos blocos
A B
54 50
55 54
58 56
51 52
57 53
X 550 X 530
S A 7,5
2
S B2 5,0
nA 5 nB 5
X AX B Dif 2
t0 1,26 (1.2)
S A2 S B2 S 1,587
n1 n2
Para n1n2 28 e 5% , o valor crítico do teste é t8;5% 2,306 , obtido da Tabela da
distribuição t (Bicaudal) do Apêndice B. Aceitamos a hipótese H 0 , isto é a relação Dif/S não foi
Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-4
suficientemente grande para se rejeitar a hipótese H 0 ; o valor t0=1,26 não ultrapassou o valor crítico
t8;5% 2,306 . A título de ilustração construímos as Tabelas 1.3 e 1.4. Na Tabela 1.3, reduzimos as
resistências dos blocos de concreto do fornecedor B de duas unidades; já na Tabela 1.4 mudamos as
resistências dos blocos dos dois fornecedores sem alterar as médias, mas reduzindo as variâncias
S A2 e S B2 de 7,5 e 5,0 para 1,5 e 1,0.
X AX B Dif 4
t0 2,52 (1.3)
S A2 S B2 S 1,587
n1 n2
Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-5
Ao reduzirmos as resistências dos blocos de concreto do fornecedor B de duas unidades
aumentamos a diferença entre médias amostrais ( X A X B ) de dois para quatro. Aumentamos assim o
numerador de t0 . O valor t0 passa de 1,86 para 2,52. Como t0 2,52 t8;5% 2,306 rejeitamos a hipótese
H 0 , neste caso por conta de uma maior diferença entre as médias amostrais, X A e X B .
Para os dados da Tabela 1.4:
X AX B Dif 2
t0 2,83 (1.4)
S A2 S B2 S 0,707
n1 n2
denominador de t0 . O valor t0 passa de 1,86 para 2,83. Como t0 2,83 t8;5% 2,306 novamente
rejeitamos a hipótese H 0 , neste caso por conta de uma menor variabilidade das observações.
Na Figura 1.3 temos em termos percentuais, o “tamanho” da variabilidade S em relação à
diferença das médias - Dif, para os dados das Tabelas 1.2, 1.3 e 1,4.
Como |t0|t , t8,5% 2,306 , o valor-p será sempre menor que o risco vide Figura 1.4.
Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-6
Figura 1.4 Valor-p
Na Tabela 1.5 temos para vários valores da estatística t0 os correspondentes valores do valor-p,
onde pP[|t|t0 ] . O valor-p só existe quando a hipótese H 0 é rejeitada, isto é quando |t0| t8,5% .
Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-7
1.3 Tamanho da amostra
Para os dados da Tabela 1.2 não podemos afirmar que o concreto A é melhor que o concreto B; a
hipótese H 0 foi aceita. Será que não descobrimos que um concreto é mais resistente que o outro porque
temos poucas observações? Para responder esta pergunta fazemos uso das curvas do Apêndice B, que
além do , requer valores de três parâmetros de entrada: , 1, 2.
nD 2
2 = (1.5)
2aσ 2
1a-1 (1.6)
2 a(n-1) (1.7)
Nas expressões (1.5), (1.6) e (1.7), n é o tamanho das amostras, a é o número de níveis (no
exemplo, n=5 e a=2) e D é a menor diferença entre as resistências médias dos concretos, | A B |D ,
que leva o engenheiro civil a classificar um concreto i como melhor que um concreto j. Como não
conhecemos a variância 2 , utilizamos o estimador S2 (S2A SB2 )/2(7,55,0)/26,25 . Se para o
engenheiro civil um concreto é mais resistente que o outro quando sua resistência média excede a do
concorrente, em pelo menos 5 kg/cm2 (D=5), então:
nD 2 5(5) 2
= 2,24 (1.8)
2a 2 4 * 6,25
O risco (de aceitar H 0 , sendo H 0 falso) está, segundo as curvas do apêndice A, em torno de
20%. Para se reduzir o risco é preciso aumentar o tamanho das amostras. Suponha então que o
engenheiro civil avaliou três novos blocos dos concretos A e B e obteve as resistências cujos valores
estão em negrito na Tabela 1.5.
Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-8
Tabela 1.5: Comparação de duas médias (n=8)
A B
54 50
55 54
58 56
51 52
57 53
54 54
55 53
56 52
X 550 X 530
SA 4,57
2
SB2 3,14
nA 8 nB 8
X AX B
t0 2,04 (1.9)
S12 S22
n1 n2
Como tn A
nB 2; t882;5% 2,145 , continuamos aceitando a hipótese H 0 . Os valores críticos
t ; estão no Apêndice A, na Tabela da distribuição t (Bicaudal).
nD2 8(5) 2
= 3,6 (1.10)
2a 2 4*8
Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-9
1.4 De olho nas observações
Antes do surgimento dos computadores o uso da Estatística na solução de problemas reais ficou
meio que “latente” por conta da dificuldade dos cálculos que estas aplicações demandavam. Hoje a
situação é bem diferente, o que mais temos são softwares para estes cálculos. O perigo agora está
justamente no exagero, estes softwares são tão amigáveis que acabamos aceitando tudo o que eles nos
falam sem qualquer questionamento. Retornando ao exemplo dos concretos, mas considerando os dados
da Tabela 1.6. Para estes dados S=1,714, t=3,060 e t nA nB 2 t882 2,145 . Como 3,060 > 2,145, o
Na Figura 1.4 observamos uma medida de resistência do concreto A igual a 59, bem distante das
demais medidas. Será que não houve um erro de leitura? Caso a leitura tenha sido correta, cabe então
investigar as condições nas quais o quinto bloco de concreto do tipo A foi fabricado. Se descobrirmos a
causa do quinto bloco ser tão resistente, ótimo, pois podemos aplicar este novo conhecimento em
benefício de se produzir blocos de concretos mais resistentes. Se não descobrirmos o porquê, só nos
resta descartar esta observação. Sem ela, a conclusão é outra: com os dados disponíveis não podemos
afirmar que o concreto A é melhor que o concreto B.
Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-10
Concreto A Concreto B
59
57
Resistencia do concreto.
55
53
51
49
47
45
1 2 3 4 5 6 7 8
Observação
0,0 t ; t
Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-11
1.5 Exercícios
Exercício 1.1: Gerar dez observações de uma distribuição normal com média 50 e desvio padrão dois.
Suponha que as cinco primeiras observações são resistências de cinco blocos de concreto do fornecedor
A ( A 50 ) e as cinco últimas resistências de cinco blocos de concreto do fornecedor B ( B 50 ). Repita
este procedimento 20 vezes. Para um risco de 5%, investigue se a hipótese H0 é sempre aceita, sendo:
H 0: A B
(1.5)
H1: A B
Exercício 1.2: Gerar cinco observações de uma distribuição normal com média 50 e desvio padrão dois
e outras cinco de uma distribuição normal com média 53 e desvio padrão dois. Suponha que as cinco
primeiras observações são resistências de cinco blocos de concreto do fornecedor A ( A 50 ) e as cinco
últimas resistências de cinco blocos de concreto do fornecedor B ( B 53 ). Repita este procedimento 20
vezes. Para um risco de 5%, investigue se a hipótese H0 é sempre rejeitada, sendo:
H 0: A B
(1.5)
H1: A B
Exercício 1.3: Refaça o exemplo da seção 1.2 para o seguinte teste de hipóteses:
H 0 : A B
(1.6)
H1: A B
Apostila de Estatística Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguetá.
1-12