Escolar Documentos
Profissional Documentos
Cultura Documentos
Estes testes são úteis para verificar se determinada amostra pode provir de uma
população especificada. São usualmente conhecidos como testes de aderência ou bondade do
ajuste. Neste caso, retira-se uma amostra aleatória e compara-se a distribuição amostral com a
distribuição de interesse.
2.1.1 – Pressupostos
2.1.2 – O Método
Este método irá calcular a probabilidade de obter valores mais extremos do que
os observados.
Determinar N;
Determinar as freqüências observadas;
De acordo com a hipótese, calculamos com a ajuda da Distribuição Binomial
e/ou tabela, a probabilidade de ocorrência de valores mais extremos do que o
observado (número de sucessos):
x
N N
N
P X x p i q N i ou P X x p i q N i *
i 0 i i x i
5
N 5
11
P X 5 p i q N i p i q 11i 0,5
i 0 i i 0 i
Pequenas Amostras
x
N N
N
P X x p i q N i ou P X x p i q N i
i 0 i i x i
Grandes Amostras
x np
Z e procede-se como num teste de hipótese convencional
npq
Tabela: A – SIEGEL
^ 1
Obs: note que a hipótese alternativa foi definida pelos dados amostrais, pois p .
10
x
N 1
10
P X 1 p i q N i 0,3i 0,710 i 0,1493
i 0 i i 0 i
Exemplo 3: Num ensaio de degustação de café, cada mesa era constituída de 5 amostras,
sendo duas delas de café “mole” e as 3 restantes, de café “comum”. Dos 8 degustadores que
foram utilizados, 3 classificaram corretamente os tipos de café.
Teste a hipótese de que os degustadores conseguem distinguir o café “mole” dos demais.
N
N 8
8
P X 3 p i q N i 0,10 i 0,90 8i 0,0381
i 0 i i 3 i
Exercício - A Lei de Mendel afirma que para 4 genes, 3 são dominantes e 1 é recessivo. Em
um certo experimento observou-se 54 genes dominantes e 26 recessivos. Verifique,
pelo teste Binomial, se a lei se aplica ao experimento realizado.
1 1
H0 : p versus Ha : p em que temos: N = 80 e x = 26
4 4
aprox. Normal
80
80 1 i 3 80i 26 20
P X 26 P X P Z 1,55 0,0606
i 26 i 4 4 15
Conclusão: Ao nível de significância de 5% não rejeitamos a hipótese nula. A Lei parece que
se aplica ao experimento.
NPSTAT Aproximação
2.2.2 – O Método
2 i
em que oi freqüência observada na categoria i
i
e
e freqüência esperada na categoria i
i 1 i
i
Quanto maior o valor de 2 maior será a probabilidade de as freqüências
observadas estarem divergindo das freqüências esperadas.
A estatística do teste 2 tem distribuição Qui-Quadrado com graus
de liberdade onde:
Exemplo 1: Deseja-se testar se a posição de largada de um cavalo (por dentro ou por fora)
influencia no resultado de uma corrida de cavalos.
Tabela 2.1 – Distribuição do número de vitórias dos cavalos na sua posição de largada.
Posição 1 2 3 4 5 6 7 8
Número 29 19 18 25 17 10 15 11
de
Vitórias 18* 18* 18* 18* 18* 18* 18* 18*
Fonte: Livro-Siegel
H 0 : f1 f 2 f 8 versus H a : f1 f 2 f 8
8
oi ei 2 29 18 2 19 18 2 11 18
2
2
16,3
k 1 ei 18 18 18
72 indica que o valor 16,3 acusa um p-valor = 0,02224, considerado um valor exato e
bilateral.
(Tabela C – SIEGEL)
Exemplo 2: A tabela dada a seguir apresenta o número observado de falhas mecânicas, por
hora, em uma linha de montagem a partir de um experimento com duração de 40 horas.
Tabela 2.2 – Distribuição do número de falhas mecânicas por hora em uma linha de montagem.
Falhas 0 1 2 3 4 5 6 7 + de 7
Freq. Observada 0 6 8 11 7 4 3 1 0
Freq. Esperada 1,6 5,2 8,3 8,9 7,1 4,6 2,4 1,1 0,7
Fonte: Livro-Siegel
H 0 : A distribuição das falhas mecânicas por hora se ajusta a um processo de Poisson com
3,2
H a : A distribuição das falhas mecânicas por hora não se ajusta a um processo de Poisson
com 3,2
Como a tabela dada apresenta mais de 20% das freqüências com valores inferiores a 5
devemos unir as categorias. Assim:
Tabela 2.3 – Junção das Categorias em que as freqüências são inferiores ao valor 5.
Falhas 0e1 2 3 4 5 ou mais
Freq. Observada 6 8 11 7 8
Freq. Esperada 6,8 8,3 8,9 7,1 8,8
Fonte: Livro-Siegel
5
oi ei 2
2
0,675
k 1 ei
Tabela 2.4 – Distribuição do número de famílias com 5 filhos de acordo com o sexo
Número 5 mulheres 4 mulheres 3 mulheres 2 mulheres 1 mulher 0 mulheres Total
de filhos 0 homens 1 homem 2 homens 3 homens 4 homens 5 homens
Número 18 56 110 88 40 8 320
de
famílias
ei 10 50 100 100 50 10 320
6 o e 2
2 i i 12,0 e com 52 que acusa um p-valor aproximadamente igual a 0,04.
i 1 ei
2.3.2 – O Método
D máx F0 X S n X
Exemplo 1: Num experimento para calibrar a luminosidade adequada de uma nova máquina
fotográfica, foram tiradas 5 fotos de cada uma das 10 pessoas que participaram do
experimento. A cada pessoa perguntou-se qual das fotos apresentava uma qualidade maior, de
1 a 5, onde 1 representa um grau baixo e 5 um grau alto de luminosidade.
H 0 : f1 f 2 f 5 versus H a : f1 f 2 f 5
1 2 3 4 5
F0 X 1 2 3 4 5
5 5 5 5 5
S10 X 0 1 1 6 10
1010 10 10 10
F0 X - 2 3 5 2 0
S10 X 10 10 10 10
Exemplo 2 :Verifique se os dados abaixo podem ser ajustados por uma distribuição de
Poisson com média igual a 1,2.
Xi fi
0 15
1 25
2 10
3 5
4 4
5 1
F0 X i Sn X i F0 X i - S n X i
0,3012 0,250 0,0512*
0,6626 0,666 0,0041
0,8794 0,833 0,0461
0,9661 0,917 0,0494
0,9921 0,983 0,0088
0,9983 1,000 0,0017
Conclusão: D máx F0 X i S n X i 0,0512 e com isto p > 0,20. Então não podemos
rejeitar a hipótese nula.
Como vimos no exemplo acima os dados foram agrupados em classes ( i ), onde era
associado a cada valor Xi a sua respectiva freqüência f i . Este teste também pode ser aplicado
quando as classes são definidas por intervalos; no entanto desta forma ele perde em precisão.
Classes fi xi F xi S xi F xi - S
xi
2700-3000 13 2850 0,332 0,111 0,221
3000-3300 18 3150 0,397 0,265 0,132
3300-3600 24 3450 0,465 0,478 0,012
3600-3900 32 3750 0,534 0,756 0,221
3900-4200 17 4050 0,602 0,904 0,301
4200-4500 11 4350 0,667 1,00 0,332
115
Podemos admitir que a produção média segue uma distribuição normal com média
3.600 e 2 3.000.000 ?
Conclusão: Para n = 115, a P(D 0,332) < 0,01 e os dados não se aderem à distribuição Normal
proposta.
Este teste tem procedimento análogo ao Kolmogorov – Smirnov porém utiliza uma
tabela própria e mais adequada a este tipo de situação. (Tabela 6 – Campos)
Exige-se ao menos que os dados sigam uma escala nominal e que eles possam
ser divididos em duas categorias.
2.5.2 – Método
r r
Z
r
E fazemos uso da tabela da distribuição normal padrão.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
+ - + + + + - + + + - - - - + - - + + + - - - -
1 2 3 3 3 3 4 5 5 5 6 6 6 6 7 8 8 9 9 9 10 10 10 10
N 50 2.30.20
r 1 25
n1 30 50
n2 20 2.30.20( 2.30.20 30 20)
r 3,356
r 35 (30 20) 2 (30 20 1)
35 25
Z 2,98
3,356
Conclusão: Pela Tabela da Normal Padrão temos pelo teste bilateral um p-valor igual a
0,0028. Assim, rejeitamos a hipótese nula. Na fila observada, a ordem de homens e mulheres
não foi aleatória.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Sexo H H M H M M M H M M M H H H H M
QI 125 127 128 132 133 135 136 137 140 141 142 143 144 145 146 147
Temos evidências para acreditar que a ordem dos quocientes não seja aleatória?
n1 8 n2 8 r 8 l1 4 l2 14
Conclusão: O número de iterações observado encontra-se dentro dos limites tabelados. Não
temos evidências de que os quocientes não se ordenam aleatoriamente para homens e
mulheres.
Observe neste exercício que tínhamos uma variável em escala intervalar e que
esta foi transformada em nominal, levando a uma perda considerável de observações.
Neste caso, seria mais adequada a verificação da suposição de normalidade e se
atendida aplicar um teste paramétrico.
Se não atendido o pressuposto, deveríamos tentar a aplicação de uma técnica
Não-Paramétrica para comparação de duas amostras, que veremos mais adiante.