Você está na página 1de 24

REVISANDO TESTES DE

HIPÓTESE
Revisão básica
Distribuição normal: conhecido o valor
de z, podemos dizer qual a
probabilidade de encontrar valores
entre quaisquer dois números.
Por exemplo temos que a probabilidade
de encontrar valores entre -∞ e –1,96
vale 0,025.
Entre z –1,96 e z= 1,96 temos uma
probabilidade de 0,95
Mais sobre distribuições
A distribuição normal mostrada tem média(µ) zero e desvio
padrão(σ)=1. Para distribuições com outros valores de µ e σ as
probabilidades são dadas em função destes parâmetros.
A probabilidade de encontrar valores entres a média + 1,96 σ e a
média- 1,96 σ é 0,95.
ERRO Estimando a média
Considere a nossa população como sendo todos os alunos da UFSC.
A média dos IAA é 7215
Vamos escolher aleatoriamente 10 alunos e calcular a média:
A média é: 7843 ; outros dez 8134 ;outros dez: 7022;Mais outros:
7101
O desvio Padrão das médias será:495 e a média = 7463
Este desvio Padrão chama-se erro padrão.
O erro padrão é uma medida de quanto nos afastamos da média para
um conjunto de N medidas:
Calculando o erro padrão
Quando o desvio padrão da população é conhecido usamos o desvio
padrão da população
σ
Serro =
n
Para variâncias homogêneas de dois
conjuntos de medidas usamos
S ( n1 − 1) S12
+ ( n 2 − 1) S 2 2

S erro = S =
2

N n1 + n 2 − 2

Para variâncias heterogêneas de dois S12 S 22


conjuntos de medidas usamos: S erro = +
n1 n2
Comparando Médias
1. Se um conjunto de medidas(amostra) faz parte de uma população.
1.1 Desvio padrão da população conhecido(teste –z)
1.2 Desvio padrão da população desconhecido(teste-t)
2. Se duas amostras são iguais (teste –t)
2.1 Variâncias homogêneas
2.2 Variâncias heterogêneas
3. Comparação entre itens pareados
Para os casos acima: H0: <m1> =<m2>
H1: <m1> diferente de <m2>
Cada situação pode ser direcional ou não direcional. Isto é podemos
verificar se uma média é maior (menor) do que outra.
H0:
H1: <m1>
<m1> =<m2>
> <m2>
Exemplo
1. Verificar se um conjunto de medidas(amostra) faz parte de uma
população.
1.1 Desvio padrão da população conhecido = 1

Os pontos claros,( média –0,6) fazem parte


da distribuição normal (vermelho σ=1)? E os
pontos em escuros (média –1,5)?
Escuros: 4 medidas com média – 1,5
Hipóteses: H0 :µ=0 H1: µ ≠0
Como o desvio padrão da população é conhecido usamos σ
para calcular o erro standard , O número total de observações já
realizadas é muito grande. Supomos distribuição normal e
vamos usar α=0.05
σ
Serro =
n
< x > − µ −1, 5 − 0
z= = = −3
Serro 1/2
O valor de z crítico para alfa =0,05 é 1,96 .Como o valor de z
calculado é maior do que este valor ( 3> 1,96) ( O sinal não
interessa neste teste).
REJEITAMOS H0: -1,5 = 0.
ACEITAMOS H1 –1,5 <>0
O valor de z calculado significa que os valores medidos fazem
parte de uma distribuição em que a média está muito afastada
do limite de confiabilidade aceitável da média da
distribuição em vermelho. Este limite de confiabilidade é
0 ±1,96 x ½= 0 ±0,98
< x > −µ
.
=z
Serro
Para z = z critico (1,96 neste exemplo)
<x>=µ +Serro z critico =µ +S erro1,96
Erros na conclusão
TIPO I: Rejeitamos a hipótese nula sendo ela verdadeira. (α)
α É chamado de nível de significância do teste.
TIPO II : Não rejeitamos a hipótese nula sendo ela falsa (β )
Poder : 1-β
Neste exemplo(verdes), rejeitamos a hipótese nula. Existe a possibilidade
de ele ser verdadeira. Um erro de 5% foi tomado como aceitável.
Observe que, se tivéssemos escolhido um valor de α ~0,003, ainda
iríamos rejeitar a hipótese H0. Podemos dizer que as médias são
diferentes com um nível de significância de 0,0027.
Claros: 4 medidas com média – 0,6
Hipóteses: H0 :µ=0 H1: µ ≠0
Como o desvio padrão da população é conhecido usamos σ
para calcular o erro standard , O número total de observações já
realizadas é muito grande. Supomos distribuição normal e
vamos usar α=0.05
σ
Serro =
n
.
< x > − µ −0,6 − 0
z= = = −1, 2
Serro 1/2
O valor de z crítico para alfa =0,05 é 1,96 .Como o valor de z
calculado é menor do que este valor ( 1 < 1,96)
ACEITAMOS H0: -0,5 = 0.

O valor de z calculado significa que os valores medidos fazem


parte de uma distribuição em que a média está dentro do limite
de confiabilidade aceitável da média vermelha. Este limite de
confiabilidade é 0 ±1,96 x ½= 0 ±0,98
< .x > − µ
=z
Serro
Para z = z critico (1,96 neste exemplo)
<x>=µ + Serro z critico = µ + S erro1,96
Erros na conclusão
TIPO I: Rejeitamos a hipótese nula sendo ela verdadeira. (α)
α É chamado de nível de significância do teste.
TIPO II : Não rejeitamos a hipótese nula sendo ela falsa (β )
Poder : 1-β
O valor de β para este teste é 0,78 ( 78%) de chance de termos errado. É
um número bem grande. Para usar uma “calculadora de beta” veja o
endereço:http://www.health.ucalgary.ca/~rollin/stats/ssize/n1.html
Exemplos de comparação
1.Um fabricante deseja saber se um lote de tecidos atende a
especificação de ter tensão de ruptura de 200 psi com desvio
padrão de 10psi. Quatro amostras são selecionadas
aleatoriamente obtendo-se uma média de 210psi. O lote
atende as especificações?
< x > − µ 210 − 200
z= = =2
Serro 10 / 4
para α =0,05 temos z=1,96.
Conclusão rejeitamos H0: < µ > = 200 e aceitamos H1 ¹ 200
porque z calculado é maior do que z tabelado ( z crítico) O sinal
não é importante neste teste. Poderíamos ter ido até alfa=
Teste t e Intervalo de confiabilidade
ATENÇÃO: QUANDO NÃO CONHECEMOS O DESVIO
PADRÃO DA POPULAÇÃO USAMOS O VALOR DE t EM
VEZ DE z E O DESVIO PADRÃO DAS MEDIDAS PARA
CALCULAR O INTERVALO DE CONFIABILIDADE PARA A
MÉDIA.
O valor de t é obtido de tabelas ( ou do excel)
Por exemplo, para 9 medidas( graus de liberdade = 9-1 =8) com
alfa= 0,05 o valor de t é
t= invt(0,05,8) = 2,306 . Observe que t= invt(0,05,2000) =1,96.
Determinamos os limites apartir de t e dos dados:
µ max =< x > + Serro ttabela
µ min =< x > − Serro ttabela
Teste t limite de confiabilidade
• Por exemplo com 20 medidas de tempo de
reação em segundos ( meninas) 0,161 e s=
0,022 o limite de confiabilidade para a média
fica com alfa = 0,05:
• t =2,09 ( do excel : invt( 0,05;19) )
• s
< tempo >=< media > ±t
N
0,022
< tempo >= 0,161 ± 2,03 = 0,161 ± 0,01
20
O teste-t comparando médias
É uma comparação de médias. Usamos quando não
conhecemos a variância da população ou quando
queremos comparar duas amostras. A distribuição t é usada
quando o número de observações é pequeno. O número 30
é freqüentemente usado com limitador entre amostra
pequena e grande.

Tipos de teste-t
Pareados(correlacionados) ou independentes
Testes direcional(uni-caudal) ou não direcional(bi-
caudal)
O TESTE-T
O teste t compara a diferença entre as médias de duas amostras ou de
uma amostra e uma população. O teste t verifica se a hipótese H0 é
verdadeira. Ho : <m1> = <m2>
A comparação direta das médias ( usualmente feita por percentuais )
não é adequada. É necessário considerar a dispersão das medidas.
No primeiro exemplo abaixo é mais fácil diferenciar as duas
situações do que no segundo .
Erro padrão e o teste-t

Determinamos t apartir dos dados:


< x > −µ
t=
Serro
Determinamos os limites apartir de t e dos dados:
µ max =< x > + Serro t
µ min =< x > − Serro t
( n1 − 1) S1 + ( n 2 − 1) S 2
2 2
S =
2

n1 + n 2 − 2
< m1 >− < m 2 >
tobs =
1 1
S +
n1 n 2
Comparando t calculado com tcrítico.
t crítico também é chamado de t tabelado.

Passo 2. Calcular as média das medidas e desvio padrão.


Passo3. Escolher o valor de alfa.
Passo4. Determinar tcritico ttabela =invt(alfa;df)=
Passo5: calcular Serro

Passo6: calcular tcalculado


Passo7: comparar tcalculado com tcritico. Quando menor o t
calculado maior a superposição das curvas.
Passo8: Conclusão
Exemplo
A resistência a ruptura para dois tipos de cimento são
medidas obtendo-se os seguintes resultados:
16,85 17,5
16,4 17,63
17,21 18,25
16,35 18
16,52 17,86
17,04 17,75
16,96 18,22
17,15 17,9
16,59 17,96
16,57 18,15
Existe diferença entre as duas amostras?
Hipóteses: H0: m1= m2 H1: m1 ? m2
Comparando t calculado com tcrítico.
t crítico também é chamado de t tabelado.

Veja planilha do excel : resistencia.xls


Passo 1. Calcular as média das medidas. m1 = 16,76 m2=17,92
Passo3. Escolher o valor de alfa. 0,025
Passo4. Determinar tcritico ttabela =invt(alfa;df)=2,45
Passo5: calcular Serro
( n1 − 1) S1 + ( n2 − 1) S 2
2 2
S =2
= 0, 081
n1 + n2 − 2
< m1 >− < m2 > 16, 76 − 17,92
tobs = = = −9,1
1 1 1 1
S + 0, 284 +
n1 n 2 10 10
O valor tabelado para t ( t crítico) é 2,10
no excel usar a função: t( 0,05,18).
Conclusão: as formulações não podem ser consideradas iguais.
Poderíamos ter ido até alfa < 10-8

Você também pode gostar