Você está na página 1de 38

UFABC – Estatística Aplicada a Sistemas de

Gestão

Testes de hipóteses

Profa. Patrícia Belfiore Fávero


Referência Bibliográfica
Testes de hipóteses

 Parte da Inferência estatística.


 Conceito de Hipótese estatística.
 Conceito de Teste de hipótese.
 Parâmetro populacional x parâmetro de
estimativa
 Tipos de erros
Teste bilateral
 Define-se a hipótese nula (H0):
H0 : θ = θ0

 E a hipótese alternativa (H1):

H1 : θ ≠ θ 0
Teste unilateral à esquerda
 Hipótese nula (H0):
H0 : θ = θ0

 Hipótese alternativa (H1):

H1 : θ < θ 0
Teste unilateral à direita
 Hipótese nula (H0):
H0 : θ = θ0

 Hipótese alternativa (H1):

H1 : θ > θ0
Tipos de erros

P (erro do tipo I) = P (rejeitar H 0 H 0 é verdadeira) = α

P (erro do tipo II) = P (não rejeitar H 0 H 0 é falsa) = β


Construção de testes de hipóteses
Passo 1: Escolher o teste adequado.
Passo 2: Definir a hipótese nula H0 e a hipótese alternativa H1.
Passo 3: Fixar o nível de significância α.
Passo 4: Calcular o valor observado da estatística do teste com
base na amostra.
Passo 5: Fixar a região crítica do teste em função de α.
Passo 6: Decisão: se o valor da estatística pertencer à região
crítica, rejeitar H0; caso contrário, não rejeitar H0.

Passo 5: Determinar o p-value que corresponde à probabilidade


α associada ao valor da estatística do teste.
Passo 6: Se o valor de p for menor do que o nível de significância
α, rejeitar H0; caso contrário, não rejeitar H0.
Testes paramétricos

 Nos testes paramétricos, as hipóteses são


formuladas com base nos parâmetros
(característica quantitativa) da população.
 São então chamados de paramétricos, pois
exigem que a maioria dos parâmetros seja
especificada.
 Estes testes exigem suposições específicas
para sua validação.
Principais testes paramétricos

 Testes de normalidade univariada: Kolmogorov-Smirnov,


Shapiro-Wilk e Shapiro-Francia.
 Testes para comparação da homogeneidade de
variâncias entre populações: de Bartlett (1937), C de
Cochran (1947), Fmax de Hartley (1950) e o teste de
Levene (1960).
 Teste t de Student: a) testar hipóteses sobre uma média
populacional; b) testar hipóteses para comparar duas
médias emparelhadas e c) para comparar duas médias
independentes.
 ANOVA: extensão do teste t de Student e é utilizada
para comparar médias de mais de duas populações.
Testes de normalidade

 Kolmogorov-Smirnov
 Shapiro-Wilk
 Shapiro-Francia.

H 0 : a amostra provém de uma população com distribuição N ( µ,σ )



H1 : a amostra não provém de uma população com distribuição N ( µ,σ )
Teste de Kolmogorov-Smirnov

 O teste K-S é utilizado quando a média e o desvio-


padrão da população são conhecidos.
 O teste perde potência quando aplicado para
pequenas amostras (n < 30)

{
Dcal = max Fesp ( x i ) − Fobs ( x i ) ; Fesp ( x i ) − Fobs ( x i −1 ) }
Exemplo do teste K-S
Considere os dados da tabela 9.1 referentes à produção mensal
de máquinas agrícolas nos últimos 36 meses. Verifique se os
dados são provenientes de uma população com distribuição
normal, considerando α = 5% .

52 50 44 50 42 30 36 34 48 40 55 40
30 36 40 42 55 44 38 42 40 38 52 44
52 34 38 44 48 36 36 55 50 34 44 42
Teste de Shapiro-Wilk

 Uma alternativa ao teste paramétrico de K-S é o


teste de Shapiro-Wilk, que também testa se a
variável em estudo possui ou não uma
distribuição normal.
 No caso de pequenas amostras (n<30), o teste
de Shapiro-Wilk é mais apropriado do que o
teste K-S.

b =  ai ,n ⋅ (x ( n −i +1) − x ( i ) )
n/2
b2
Wcal =
 (x )
n
2
i −x i =1
i =1
.

Exemplo do teste de Shapiro-Wilk

A tabela 3 apresenta os dados de produção mensal de


aviões de uma empresa aeroespacial nos últimos 24
meses. Verifique se os dados da tabela 3 são
provenientes de uma população com distribuição normal,
considerando α = 1% .

28 32 46 24 22 18 20 34 30 24 31 29

15 19 23 25 28 30 32 36 39 16 23 36
Testes de Homogeneidade de Variâncias

 Teste para comparar duas ou mais populações


em relação à homogeneidade de variâncias.
 A hipótese nula afirma que as variâncias
populacionais são iguais; a hipótese alternativa
afirma que pelo menos uma variância
populacional é diferente das demais:

H 0 : σ 12 = σ 22 = … = σ k2
H1 : ∃i , j : σ i2 ≠ σ 2j (i , j = 1,..., k )
Testes de Homogeneidade de Variâncias

 χ2 de Bartlett (1937),
 C de Cochran (1947),
 Fmax de Hartley (1950)
 F de Levene (1960).
.
Exemplo do teste de Homogeneidade de
Variâncias

Uma rede supermercadista Dia 1


Loja 1
620
Loja 2
710
Loja 3
924
deseja avaliar o número de Dia 2 630 780 695
clientes atendidos diariamente Dia 3
Dia 4
610
650
810
755
854
802
para tomar decisões Dia 5 585 699 931
Dia 6 590 680 924
estratégicas de operações. A Dia 7 630 710 847
tabela apresenta os Dia 8 644 850 800
Dia 9 595 844 769
respectivos dados para 3 lojas Dia 10 603 730 863
ao longo de 2 semanas. Dia 11 570 645 901
Dia 12 605 688 888
Verifique se as variâncias entre Dia 13 622 718 757
os grupos são homogêneas. Dia 14 578 702 712
Desvio-padrão 24,4059 62,2466 78,9144
Considere α = 5%. Variância 595,6484 3.874,6429 6.227,4780
Testes χ2 de Bartlett
k
q = (N − k ) ln S p2 −  (ni − 1) ln Si2
i =1
k

 i
( n − 1)S i
2

S p2 = i =1

N −k

1  k 1 1 
c = 1+   − 
3(k − 1)  i =1 ni − 1 N − k 

q
Bcal = ~ χ k2−1
c
Teste C de Cochran

2
Smax
Ccal = k

 i
S 2

i =1

Exemplo 4 - Aplicação do Teste C de Cochran

Aplique o teste C de Cochran para o exemplo 3.


Teste Fmax de Hartley

2
S
Fmax, cal = max
2
S
min

Exemplo 5 - Aplicação do Teste Fmax de Hartley

Aplique o teste Fmax de Hartley para o exemplo 3.


Teste de Levene

 É um teste mais robusto e menos sensível a


desvios de normalidade.

( )
k
2

(N − k ) ⋅  ni z i − z
Fcal = i =1
~ Fk −1,N −k ,α
(k − 1)
 (z )
k ni sob H0
2
ij − zi
i =1 j =1

Exemplo 6 - Aplicação do Teste de Levene

Aplique o teste Levene para o exemplo 3.


Testes sobre uma Média Populacional
 Teste z quando σ é conhecido e a distribuição
normal
 Teste t de Student quando σ não é conhecido
 Teste t de Student para comparação de duas
médias populacionais a partir de duas amostras
aleatórias independentes
 Teste t de Student para comparação de duas
médias populacionais a partir de duas amostras
aleatórias emparelhadas
 Anova para comparação de médias de mais de
duas populações
Teste z quando σ é conhecido

H 0 : a amostra provém de uma população com uma determinad a média ( µ = µ 0 )



H1 : contesta a hipótese nula ( µ ≠ µ 0 )

x − µ0
zcal = ~ N (0, 1)
σ/ n
Aplicação do teste z para uma amostra

Exemplo 7. Um fabricante de cereais afirma que a


quantidade média de fibra alimentar em cada porção do
produto é, no mínimo, de 4,2 g com um desvio padrão de 1 g.
Uma agência de saúde vai verificar se essa afirmação
procede. Para isso, uma amostra aleatória de 42 porções foi
coletada, e a quantidade média de fibra alimentar foi de 3,9 g.
Com um nível de significância de 5%, você tem evidências
para rejeitar a afirmação do fabricante?
Teste t quando σ não é conhecido

H 0 : µ = µ 0

H1 : µ ≠ µ 0

x − µ0
Tcal = ~ t n −1
S/ n
Aplicação do teste t para uma amostra

Exemplo 8. O tempo médio de processamento de uma


determinada tarefa em uma máquina tem sido de 18
minutos. Foram introduzidos novos conceitos para reduzir
o tempo médio de processamento. Desta forma, após um
certo período, coletou-se uma amostra de 25 elementos,
obtendo-se um tempo médio de 16,808 minutos com
desvio padrão de 2,733 minutos. Verifique se esse
resultado evidencia uma melhora no tempo médio de
processamento. Considerar α = 1%.
Teste t de Student para comparar duas médias
populacionais a partir de duas amostras independentes

H 0 : µ1 = µ 2

H1 : µ1 ≠ µ 2
2
 S12 S22 
Caso 1 Tcal =
(x 1 − x2 ) ν =


+
n1 n2 


σ =σ
2
1
2
2
S12 S22
+
(
S12 / n1 ) (
2

+
S22 / n 2)2

n1 n2 (n1 − 1) (n2 − 1)

Caso 2 Tcal =
(x 1 − x2 ) Sp =
(n1 − 1)S12 + (n2 − 1)S22
1 1 n1 + n 2 − 2
σ 12 ≠ σ 22 Sp +
n1 n2
ν = n1 + n2 − 2
Aplicação do teste t para duas amostras independentes

Exemplo 9 - Um engenheiro de qualidade desconfia que o tempo médio de


fabricação de um determinado produto plástico pode depender da matéria-
prima utilizada que é proveniente de dois fornecedores. Uma amostra com 30
observações de cada fornecedor foi coletada para teste e os resultados
encontram-se nas tabelas 12 e 13. Para um nível de significância de 5%,
verifique se há diferença entre as médias.

Tabela 12: Tempo de fabricação utilizado para matéria-prima 1


22,8 23,4 26,2 24,3 22,0 24,8 26,7 25,1 23,1 22,8
25,6 25,1 24,3 24,2 22,8 23,2 24,7 26,5 24,5 23,6
23,9 22,8 25,4 26,7 22,9 23,5 23,8 24,6 26,3 22,7

Tabela 13: Tempo de fabricação utilizado para matéria-prima 2


26,8 29,3 28,4 25,6 29,4 27,2 27,6 26,8 25,4 28,6
29,7 27,2 27,9 28,4 26,0 26,8 27,5 28,5 27,3 29,1
29,2 25,7 28,4 28,6 27,9 27,4 26,7 26,8 25,6 26,1
Teste t de Student para comparar duas médias
populacionais a partir de duas amostras emparelhadas

H 0 : µ d = 0, µ d = µ antes − µ depois

H1 : µ d ≠ 0

d − µd
Tcal = ~ tν =n −1
Sd / n

 (d )
n
n 2
−d
d i
Sd = i =1
i

d= i =1
n −1
n
.

Aplicação do teste t para duas amostras emparelhadas

Exemplo 10 - Um grupo de 10 operadores de máquinas realizava uma


determinada tarefa. O mesmo grupo de operadores foi treinado a executar a
mesma tarefa de forma mais eficiente. Para verificar se houve redução no tempo de
execução da tarefa, mediu-se o tempo gasto por cada operador, antes e depois do
treinamento. Teste a hipótese de que as médias populacionais das duas amostras
emparelhadas são semelhantes, isto é, de que não houve redução no tempo de
execução da tarefa após o treinamento. Considere α = 5% .

Tabela 15: Tempo gasto por cada operador antes do treinamento

3,2 3,6 3,4 3,8 3,4 3,5 3,7 3,2 3,5 3,9

Tabela 16: Tempo gasto por cada operador depois do treinamento

3,0 3,3 3,5 3,6 3,4 3,3 3,4 3,0 3,2 3,6
ANOVA de um fator (One-Way ANOVA)

H 0 : µ1 = µ 2 = ... = µ k
H 1 : ∃ (i , j ) µ i ≠ µ j , i ≠ j

Fonte de Graus de Quadrados


Soma dos quadrados F
variação liberdade médios

 ( )
k
Entre os SQF = ni Y i − Y
2 SQF
F =
QMF
k −1 QMF =
grupos i =1 k −1 QME

( )
k ni
Dentro dos SQE =   Yij − Y i
2 SQE
N −k QME =
grupos i =1 j =1 N −k

  (Y )
k ni
2
Total SQT = ij −Y N −1
i =1 j =1

SQF
= k −1 =
QMF
Fcal
SQE QME
N −k
.

Aplicação do teste ANOVA de um fator

Exemplo 11 - Uma amostra de 32 produtos foi coletada para


analisar a qualidade do mel de três fornecedores. Uma das
medidas de qualidade do mel é a porcentagem de sacarose
que normalmente varia de 0,25 a 6,5%. A tabela 21 apresenta
a porcentagem de sacarose para a amostra coletada de cada
fornecedor. Verifique se há diferenças desse indicador de
qualidade entre os 3 fornecedores, considerando um nível de
significância de 5%.
S132132 ==
Y

Tabela 21: Porcentagem de Sacarose dos Três Fornecedores


Fornecedor 1 (n1 = 12) Fornecedor 2 (n2 = 10) Fornecedor 3 (n3 = 10)
0,33 1,54 1,47
0,79 1,11 1,69
1,24 0,97 1,55
1,75 2,57 2,04
0,94 2,94 2,67
2,42 3,44 3,07
1,97 3,02 3,33
0,87 3,55 4,01
0,33 2,04 1,52
0,79 1,67 2,03
1,24
3,12
Y 1 = 1,316 Y 2 = 2,285 Y 3 = 2,338
S1 = 0,850 S2 = 0,948 S3 = 0,886
Testes não paramétricos

 São aplicados para dados de natureza nominal e ordinal.


 Os testes não-paramétricos não exigem suposições
numerosas ou restringentes em relação à distribuição dos
dados.
 São, portanto, uma alternativa aos testes paramétricos
quando as condições de aplicações destes não se
verificam.
 Desvantagens: a) tendem a perder informação, já que os
dados quantitativos são reduzidos a uma escala qualitativa;
b) os testes paramétricos são mais poderosos (menor
probabilidade de erro).
Classificação dos testes não-paramétricos

Dimensão Nível de Mensuração Teste Não-Paramétrico


Binária Binomial
Uma amostra Nominal ou Ordinal Qui-quadrado
Ordinal Teste dos sinais
Binária Teste de McNemar
Duas amostras
Teste dos sinais
emparelhadas Ordinal
Teste de Wilcoxon
Duas amostras Nominal ou Ordinal Qui-quadrado
independentes Ordinal U de Mann-Whitney
K amostras Binária Q de Cochran
emparelhadas Ordinal Teste de Friedman
K amostras Nominal ou Ordinal Qui-quadrado
independentes Ordinal Teste de Kruskal-Wallis
Teste qui-quadrado
H 0 : não há diferença significativa entre as frequências observadas e esperadas

H1 : há diferença significativa entre as frequências observadas e esperadas

r c (Oij − E ij )2
χ2 = 
i =1 j =1 E ij

ν = (r − 1)(c − 1)
Aplicação do teste qui-quadrado para duas amostras
.

independentes

Exemplo 8 - Considere novamente o exemplo 1 do capítulo 4. Um


estudo foi feito com 200 indivíduos buscando analisar o
comportamento conjunto da variável x (operadora de plano de saúde)
com a variável y (nível de satisfação). A tabela de contingência
exibindo a distribuição conjunta de frequências absolutas das
variáveis, além dos totais marginais, está representada na tabela 21.
α = 5 %

Teste a. hipótese de que não há associação entre as categorias das


duas variáveis, considerando

Nível de satisfação
Operadora Baixo Médio Alto Total
Total Health 40 16 12 68
Viva Vida 32 24 16 72
Mena Saúde 24 32 4 60
Total 96 72 32 200

Você também pode gostar