Você está na página 1de 20

Inferência Paramétrica

(Parte II)
Testes de Hipóteses
Quintiliano Schroden

Comentários Iniciais
 Uma hipótese estatística é uma afirmativa a respeito de um
parâmetro de uma distribuição de probabilidade.
 Hipótese que a produtividade é diferente de 2,5 peças/hora.
Formalmente isso é escrito como:
H 0 :   2,5 peças / hora
H1 :   2,5 peças/hora
 Ho (hipótese nula) e H1 (hipótese alternativa).
Anteriormente, a alternativa formulada é bilateral, mas
também podem ser estabelecidas alternativas unilaterais,
tais como:
H 0 :   2,5 peças / hora
H1 :   2,5 peças/hora

Erros e nível de significância


Verdade real de H0
Decisão

H0 verdadeira H0 falsa
Não Decisão Erro do
rejeitar H0 correta tipo II
Erro do Decisão
Rejeitar H0 tipo I correta

Erro do tipo I: A hipótese nula é realmente verdadeira,


mas optou-se por rejeitá-la.

Nível de significância,
Probabilidade máxima de se cometer um erro do tipo I.

1
Hipóteses para um diagnóstico a partir de um exame:

H0: tem câncer;


Ha: não tem câncer;
Erro tipo I: a pessoal tem câncer, mas optou-se por rejeitar H0;

Erro tipo II: a pessoal não tem câncer, mas optou-se por não rejeitar H0;

Teste monocaudal
Ha é mais provável. direito
Ha valor

Teste monocaudal
Ha é mais provável.
esquerdo
Ha valor

Ha é mais provável.
Teste bicaudal
Ha valor

Passos para realizar um Teste de Hipóteses:


Definição da Hipótese
 O primeiro passo é o estabelecimento das hipóteses:
hipótese nula e hipótese alternativa

 Hipótese Nula (Ho): É um valor suposto para um


parâmetro. Se os resultados da amostra não forem
muito diferentes de Ho, ela não poderá ser rejeitada.

 Hipótese Alternativa(Ha) : É uma hipótese que


contraria a hipótese nula, complementar de Ho, Essa
hipótese somente será aceita se for rejeitada Ho.
Fixar nível de significância:   1%,5%,10%

2
Passos para realizar um Teste de Hipótese
Calcular a estatística do Teste

 É o valor calculado a partir da amostra, que será usado


na tomada de decisão. Uma maneira de tomar-se uma
decisão é comparar o valor tabelado com a estatística
do teste.

 Para o caso de testes de médias, a estatística do teste é a


variável padronizada Z:
(X ) Variabilidade
Zcal  das médias
( n )
Estatística
do teste

Estatística de teste
 
e  Z 2  e x  x    Z 2 
n n

x 
Z Calc 

n

Passos para realizar um Teste de Hipótese

Região Crítica
 A região crítica é a região onde Ho é rejeitada. A área
), que
da região crítica é igual ao nível de significância (
estabelece a probabilidade de rejeitar Ho quando ela é
verdadeira.
 Por exemplo, se utilizarmos o nível de significância de
5%, a probabilidade de rejeitar Ho quando ela é
verdadeira é igual a 5% (erro tipo I). Na prática, os
valores usuais de alfa são  = 0,01 ou 0,05 ou 0,10.

3
Passos para realizar um Teste de Hipótese
 Unilateral à esquerda:
Ho:  = 50
H1::  > 50

 Unilateral à direita:

Ho: :  = 50
H1: :  <50

 Bilateral:
 Ho: :  = 50
 H1::   50

Passos para realizar um Teste de Hipótese


Regra de Decisão:
 Se o valor da estatística do teste cair na região crítica,
rejeita-se Ho. Ao rejeitar a hipótese nula (Ho) existe
uma forte evidência de sua falsidade.
 Ao contrário, quando aceitamos, dizemos que não
houve evidência amostral significativa no sentido de
permitir a rejeição de Ho.

Passos para realizar um Teste de Hipótese

Conclusão

 Aceitar Ho, implica que a hipótese nula não pode ser


rejeitada!

 Rejeitar Ho implica que temos evidências estatísticas


para rejeitá-la com um risco conhecido : .

4
Teste de hipótese para média
a) População infinita, normal ou aproximadamente normal,
variância populacional conhecida (amostra grande ou
pequena)
Ho H1 R. CRITICA
=o <o z<-z
>o z>z
  o z<-z/2 e z>z/2

Estatística a ser utilizada =>

X  O
Z 
 / n

Registros dos últimos anos de calouros de uma certa


escola atestam que sua média num teste de QI foi 115
e desvio padrão de 20. Para saber se uma nova turma
de calouros é típica desta escola, retirou-se uma
amostra aleatória de 50 alunos desta nova classe,
encontrado-se média de 118. Com uma confiança de
95%, teste a hipótese de que esta nova turma apresenta
a mesma característica das classes precedentes, com
relação ao QI. Com um nível de 5% de significância.

Teste de hipótese para média


b) População infinita, normal ou aproximadamente normal,
variância populacional desconhecida e amostra pequena.

Ho H1 R. CRITICA
<o t<-t
=o >o t>t
  o t<-t/2 e t>t/2

Estatística a ser utilizada =>

X  O
t com GL= n-1
S / n

5
O tempo médio gasto para profissionais da
área de Ciências Contábeis, realizarem um
determinado procedimento tem sido de 50
minutos. Um novo procedimento está sendo
implementado. Neste novo procedimento
retirou-se uma amostra de 12 pessoas, com um
tempo médio de 42 minutos e um desvio
padrão de 11,9 minutos. Teste a hipótese de
que a média populacional no novo
procedimento é menor do que 50. Com um
nível de 5% de significância.

Teste de hipótese – uma proporção

Ho H1 R. CRITICA
p=po p < po z<-z
p > po z>z
p  po z<-z/2 e z>z/2

Estatística a ser utilizada =>

pˆ  p 0
Z 
p0 q0 / n

Um investidor, deseja saber se a proporção de


empresas que apresentam alto potencial para
investimento é menor que 10%. Ele realiza uma
amostragem de 122 empresas e encontrou 11 com
alto potencial. Verifique a hipótese do investidor.
Com um nível de 5% de significância.

6
Teste de hipótese - diferença entre médias
a) População infinita, normal ou aproximadamente normal,
variância populacional conhecida (amostras grandes ou
pequenas)
Ho H1 R. CRITICA
 1   2  dO 1-2<do z<-z
1-2>do z>z
1  2  d o z<-z/2 e z>z/2

Estatística a ser utilizada =>


(X 1  X 2 )  ( 1   2 )
Z 
 1 2 / n1   2
2
/ n2

Retiradas amostras de aparelhos usados de duas marcas,


encontrou-se os resultados apresentados no quadro a
seguir. Verifique se as duas marcas tem durabilidade
iguais ou se são diferentes. Com um nível de 5% de
significância.
Marcas A B
Média 1160 1140
desvio padrão pop. 90 80
tamanho amostra 100 100

Teste de hipótese - diferença entre médias


b)Populações aproximadamente normais, amostras
pequenas, variâncias populacionais desconhecidas e
Homogêneas.
Ho H1 R. CRITICA
1-2<do t<-t
 1   2  dO 1-2>do t>t
1   2  d o t<-t/2 e t>t/2
Estatística a ser utilizada =>
( X 1  X 2 )  ( 1   2 )
t G L  v  n1  n 2  2
s p 1 / n1  1 / n 2
( n 1  1) s1 2  ( n 2  1) s 2 2
Sp 
n1  n 2  2

7
Teste de hipótese - diferença entre médias
c) Populações aproximadamente normais, amostras
pequenas, variâncias populacionais desconhecidas e
estatisticamente Heterogêneas.
Ho H1 R. CRITICA
1-2<do t<-t
 1   2  dO 1-2>do t>t
1   2  d o t<-t/2 e t>t/2

Estatística a ser utilizada =>

( X 1  X 2 )  ( 1   2 ) ( s12 / n1  s2 2 / n2 ) 2
t GL 
2
s1 / n1  s2 / n2 2 ( s12 / n1 ) 2 ( s2 2 / n2 ) 2

n1  1 n2  1

Teste de hipótese – razão entre


variâncias
H0 Ha R. CRITICA

 12   2 2  12   2 2 Fcalc > F(5%, v1, v2)

Estatística a ser utilizada:

S 2 m aior
Fcalc  2
S m enor

Um treinamento na área de comunicação de um


conglomerado é ministrado a 12 profissionais pelo
método convencional. Um segundo grupo de 10
profissionais recebeu o mesmo treinamento por um
método programado. Os resultados de notas dos dois
métodos são apresentados no quadro a seguir.
Determine se há diferença entre os dois métodos. Com
um nível de 5% de significância .

Método Convencional Programado


média 85 81
desvio padrão 4 5

8
Para estudar o efeito da certificação ambiental no
valor de empresas amostras de empresas da mesma
área, com e sem certificação ambiental. Obteve-se os
seguintes resultados. Teste a hipótese de que os dois
padrões de empresas apresentam médias de valor
diferentes. Com um nível de 5% de significância

Com certificação Sem certificação


Método ambiental ambiental
média 24,0 13,3
desvio padrão 1,7 3,7
n 8 21

Teste de hipótese – diferença entre proporções

Ho H1 R. CRITICA
p1-p2=po p1-p2<po z<-z
p1-p2>po z>z
p1  p2  p o z<-z/2 e z>z/2

Estatística a ser utilizada: n1 pˆ 1  n2 pˆ 2


p
( pˆ 1  pˆ 2 )  ( p 1  p 2 ) n1  n2
Z
p q (1 / n1  1 / n 2 ) q  1 p

Uma questão de teste é considerada boa se permitir


discriminar entre estudantes preparados e estudantes
não preparados. A primeira questão de um teste foi
respondida corretamente por 62 dentre 80 alunos
preparados, e por 23 dentre 50 alunos não preparados.
Com um nível de 5% de significância, teste a
afirmação de que esta questão foi respondida
corretamente por uma proporção maior de estudantes
preparados.

9
Diferença entre médias – amostra dependente
c) Populações aproximadamente normais, amostras
emparelhadas

Ho H1 R. CRITICA
<o t<-t
=o >o t>t
  o t<-t/2 e t>t/2

Estatística a ser utilizada =>


d 
d
d  0 n
tcalc  GL  n  1 2
Sd n  d 
 d  d 
2
d 2

n
Sd  
n 1 n 1

EXERCICIO
O fabricante de um moderador de apetite afirma que
quando o seu produto é tomado enquanto se segue uma
dieta de baixa gordura com exercícios regulares por 4
meses, a perda média de peso é de 20 libras. Para testar
a afirmação, você estudou 12 pessoas que fazem dieta,
selecionadas aleatoriamente, que tomaram um
moderador de apetite por 4 meses. As pessoas seguiram
uma dieta de baixa gordura com exercícios regulares
durante os 4 meses. Os resultados são mostrados a
seguir. O seu estudo oferece evidencia suficiente para
rejeitar a hipótese do fabricante em um nível de 0,10 de
significância?

EXERCICIO
Indivíduos Peso inicial 4º Mês
1 185 168
2 194 177
3 213 196
4 198 180
5 244 229
6 162 144
7 211 197
8 273 252
9 178 161
10 192 178
11 181 161
12 209 193

10
EXERCICIO
Um legislador estadual quer determinar se seu
índice de desempenho (0-100) mudou do ano
passado para este. A tabela a seguir mostra o
índice de desempenho do legislador para 16
eleitores selecionados aleatoriamente para o ano
passado e para este. Em 0,01 de significância, há
evidencia suficiente para concluir que o
desempenho do legislador mudou? Assuma que
os índices de desempenho são normalmente
distribuídos.

Indivíduos Passado Atual


1 60 56
2 54 48
3 78 70
4 84 60
5 91 85
6 25 40
7 50 40
8 65 55
9 68 80
10 81 75
11 75 78
12 45 50
13 62 50
14 79 85
15 58 53
16 63 60

TESTES NÃO PARAMÉTRICOS

11
Teste de hipótese – teste de qui-quadrado para
independência

H0 Ha R. CRITICA
há independentes Não há  2 calc   2 ( ,GL )
independência
Estatística a ser utilizada:
2

 2

f oi  f ei ,
calc
f ei
f e  (totallinha * totalcoluna) / total
GL  (l  1) *(c  1)

EXERCICIO
A tabela de contingência a seguir mostra os
resultados de uma amostra aleatória de 2000
vitimas de fraude no telemarketing classificados
por idade e tipo de fraude. As fraudes foram
cometidas com sweepstakes falsos ou ofertas de
cartão de crédito. Ao nível de significância igual
a 1% você pode concluir que a idade das vitimas
está relacionada ao tipo de fraudes?

Tipos de Idade das vitimas


fraudes

< 20 20 a 30 a 40 a 50 a 60 a 70 a > 80 Total


29 39 49 59 69 79

Sweepstake 10 60 70 130 90 160 280 200 1000

Cartões de 20 180 260 240 180 70 30 20 1000


crédito

Total 30 240 330 370 270 230 310 220 2000

12
Teste de hipótese – teste de qui-quadrado para
aderência

H0 Ha R. CRITICA
há aderência Não há
 2 calc   2 ( ,GL )
aderência

Estatística a ser utilizada: 2

 2

f oi  f ei ,
calc
f ei
f ei  n * pi
GL  (k  1)  p

EXERCICIO
A distribuição alegada das idades das vitimas de
fraudes no telemarketing é mostrada na
tabela. Os resultados de um levantamento de
mil vitimas selecionados aleatoriamente
também estão na tabela. Usando 1% de
significância teste o ajustamento da
distribuição alegada. O que você pode
concluir?

Idades Dist. Alegada Resultado do


levantamento
< 20 1% 30
20 a 29 13% 200
30 a 39 16% 300
40 a 49 19% 270
50 a 59 16% 150
60 a 69 13% 40
>70 22% 10
Total 100% 1000

13
EXERCICIO
Dirigentes alegam que a distribuição do número
de gols por partida em um campeonato
amador é uma Poisson. Os resultados de um
levantamento de vinte e seis partidas
selecionados aleatoriamente estão na tabela
abaixo. Usando 5% de significância teste o
ajustamento da distribuição alegada. O que
você pode concluir?

Teste de Mann-Whitney – amostra independente


Populações não-normais, teste da soma dos postos, n1+n2<20.
H0 Ha RC
md1-md2=0 md1-md2≠0 W≤Wtab

Estatística a ser utilizada =>


n1  a m o s tra m e n o r; n 2  a m o s tra m a io r
R 1 = s o m a d o s p o s to s p a ra m e n o r a m o s tra
R 2 = s o m a d o s p o s to s p a ra m a io r a m o s tra

W  n1n 2 
n1 n1
 1
 R1
1
2
n 2 n 2  1 
W 2  n1n 2   R 2
2
W = m in (W 1 , W 2 )

EXERCICIO
Para descobrir se um novo soro deterá a
leucemia, nove pacientes, que estão em
estágio avançado da doença, são
selecionados, e apenas 5 receberam o
tratamento. A mediana dos grupos são
iguais ou não ao nível de 5%. Os tempos
de sobrevivência, em anos a partir do
tempo que se inicia o experimento são:

14
EXERCICIO
Tratado Não Tratado
2,1 1,9
5,3 0,5
1,4 2,8
4,6 3,1
0,9

Teste de Mann-Whitney – amostra independente

Populações não-normais, teste da soma dos postos, n1+n2≥20.


H0 Ha R. CRITICA
Não há diferença Há diferença zcalc   z zcalc  z
2 2

Estatística a ser utilizada =>


n1  amostra menor; n2  amostra maior
R  R n1  n1  n2  1 n1n2  n1  n2  1
zcalc  ; R  ; R 
R 2 12
R  soma dos postos para menor amostra

EXERCICIO
O ganho em milhares de dólares de uma amostra
aleatória de representantes de vendas
farmacêuticas de 10 homens e 12 mulheres
encontram-se na tabela abaixo. Com nível de
significância 0,10, você pode concluir que há
uma diferença entre os ganhos de homens e
mulheres?

15
EXERCICIO
Homens Mulheres
58 66
73 57
94 81
81 73
78 65
74 78
66 71
75 67
97 64
79 77
80
70

EXERCICIO
Você está investigando a alegação de pagamento do
seguro de automóveis (em milhares de dólares)
efetuado por duas companhias de seguro. A
tabela mostra uma amostra aleatória e
independente de 12 alegações de pagamento
efetuado por duas companhias de seguro. Em
0,05 de significância, você pode concluir que há
uma diferença nas alegações de pagamento das
duas companhias?

EXERCICIO
A B
6,2 7,3
10,6 5,6
2,5 3,4
4,5 1,8
6,5 2,2
7,4 4,7
9,9 10,8
3,0 4,1
5,8 17
3,9 3
6,0 4,4
6,3 5,3

16
Teste de Wilcoxon – amostra dependente
c) Populações não-normais, amostras emparelhadas

H0 Ha R. CRITICA
Não há diferença Há diferença Wcalc  W

Estatística a ser utilizada =>


n  diferencas nao
% nulas
Wcalc  menor valor absoluto entre as
somas dos postos positivos e negativos

Teste de Wilcoxon

Teste de Wilcoxon
 Procedimento:

 Para cada par de dados, ache a diferença di, subtraindo o segundo valor
do primeiro. Conserve os sinais, mas descarte quaisquer pares para os
quais d=0.
 Ignore os sinais das diferenças, ordene-as da menor para a maior, e as
substitua-as pelo valor do posto correspondente. Ao menor di, atribuir o
posto 1; ao próximo o posto 2 e assim por diante. Quando as diferenças
tiverem o mesmo valor numérico, associe a elas a média dos postos
envolvidos no empate. Por exemplo, se três pares acusam as diferenças:
-1, -1 e +1, a cada par será atribuído o posto 2, que é a média entre 1, 2
e 3. O próximo posto, pela ordem, receberia o valor 4, porque já teriam
sido utilizados os postos 1, 2 e 3.

 Atribua a cada posto o sinal da diferença que o originou.

17
Teste de Wilcoxon

Teste de Wilcoxon

 Estatística do Teste W, para amostras


pequenas n<=25;

Rejeita-se a hipótese nula se o valor de W for


menor ou igual ao valor crítico tabelado.

18
Teste de Wilcoxon
 Para amostras grandes n>25;
A estatística do Teste W tem distribuição
aproximadamente normal (Z), com média e
desvio padrão:

A estatística de teste é comparada com os valores


tabelados da distribuição normal padrão.

EXERCICIO
Um psicólogo do esporte acredita que ouvir música
afeta a duração das sessões de exercícios de
atletas. A duração do tempo (em minutos) de 10
sessões de exercício de atletas, enquanto ouviam
música e enquanto não ouviam música, são
mostrados na tabela. Em 0,05 de significância,
você pode apoiar a afirmação do psicólogo do
esporte?

EXERCICIO
Com musica Sem musica Diferença Valor absoluto Posto Sinais dos Postos
45 38
38 40
28 33
39 36
41 42
47 41
62 54
54 47
33 28
44 35

19
EXERCICIO
Um inspetor de controle de qualidade quer testar a
afirmação de que um repelente de água em spray
é eficaz. Para testar a afirmação, ele seleciona
12 pedaços de tecido, borrifa água em cada um e
mede a quantidade de água repelida (em
milímetros). Ele então aplica o repelente e
repete o experimento. Os resultados são
mostrados na tabela. Em 0,01 de significância,
ele pode concluir que o repelente de água é
eficaz?

EXERCICIO
s/ repelente c/ repelente Diferença Valor absoluto Posto Sinais dos Postos
8 15
7 12
7 11
4 6
6 6
10 8
9 8
5 6
9 12
11 8
8 14
4 8

20

Você também pode gostar