Você está na página 1de 49

Capítulo 1

Testes de Hipóteses
X REP Y

x1 1 y1

x1 2 y2

... ... ...

x1 n yn
Relação entre Uma População e Uma Amostra


População x1 Amostra x1


  

Parâmetros Inferência Estimativas

  

Distribuição de Distribuições de probabilidades Distribuição de


probabilidades de Y amostrais dos estimadores frequências de Y


Intervalos de confiança para os parâmetros (x1)
Testes de hipóteses sobre os parâmetros (x1)
Medida Parâmetro Estimativa
(Valor numérico) (Valor numérico)
n
 yi
Média Y y i1
n
n
 (yi  y)2
Variância  Y2 s2Y  i1
n 1

Desvio-padrão Y s Y  s2Y

sY
Coeficiente de
CVY cvY  100
variação y
sY
Erro-padrão da Y sY 
média n
N n
y
i1
i Y i
Y  Y i1
N n

População Amostra Aleatória


(y1, y2, ..., yN) (Y1, Y2, ..., Yn)

n
N
 (Yi  Y)2
 (y i   Y )2
SY  i1

Y  i1 n 1
N

Probabilidade Inferência Estatística


n
Amostra Particular
(y1, y2, ..., yn)
 yi
i1 n
y
n  i1
(y i  y)2
Estatística Descritiva sY 
n 1
Exercício de Aplicação
x rept y
1 1 2,59
1 2 2,70
1 3 2,44
1 4 2,65
1 5 2,77
1 6 2,81
1 7 2,53
1 8 2,31
1 9 2,37
1 10 2,57
1 11 2,46
1 12 2,76
1 13 2,24
1 14 2,69
1 15 2,85
1 16 2,32
1 17 2,70
1 18 2,57
1 19 2,50
1 20 2,60
1 21 2,38
1 22 2,44
1 23 2,41
1 24 2,51
1 25 2,22
1 26 2,71
1 27 2,32
1 28 2,44
1 29 2,49
1 30 2,28
1 31 2,52
1 32 2,45
1 33 2,47
1 34 2,63
1 35 2,56
1 36 2,61
1 37 2,46
1 38 2,62
1 39 2,49
1 40 2,53
Distribuição de Probabilidades
• Y = variável aleatória
• v.a contínua
• Y ~ Normal (Y;  Y2 )

2
1 yY 
  
1 2  Y 
f(y)  e
 Y 2
f (y)

LIN LSN
      
y
0,6827

0,9545

0,9973
Distribuição
Normal

Distribuição Distribuição Distribuição


qui-quadrado t de Student F
Infinitas Amostras Aleatórias de Uma População

Uma estimativa para cada


 Amostra x1 
parâmetro

 Amostra x12 

População
x1 Dedução teórica da distribuição de
 Amostra x13 
probabilidades amostral associada
ao estimador com base na
suposição da retirada de infinitas
...
amostras da população x1

 Amostra x1 

PRECISÃO DA ESTIMATIVA
Inferência Estatística
• Não será possível conhecer exatamente o parâmetro
com base na retirada de uma única amostra.
• Estimativa pontual do parâmetro  NÃO RECOMENDA
• Estimativas dos limites inferior e superior
• Intervalo de confiança
• Teste de hipóteses
• Amostra
• Fornecer valores representativos dos populacionais e
que sejam capazes de possibilitar estimativas próximas
dos parâmetros e, consequentemente, da realidade da
população.
Inferência Estatística
• Testes de hipóteses
• Para uma variância populacional
• Para uma média populacional
 O QUE EU QUERO PARA A POPULAÇÃO?

• Intervalos de confiança
• Para uma variância populacional
• Para uma média populacional
 COMO É A POPULAÇÃO?
Teste de Hipóteses
• As hipóteses de um teste são formuladas para
confirmarem ou não, a qualidade, os benefícios das
alterações ou das inovações a serem implantadas no
processo, de acordo com a precisão das estimativas dos
parâmetros.
• O teste de hipóteses fornece uma regra de decisão para
rejeitar ou não uma especificação para o parâmetro
estabelecida por critérios técnicos e independentes dos
resultados amostrais.
Hipótese Estatística
• É uma afirmativa a respeito de um parâmetro de
uma distribuição de probabilidades.
• Exemplos:
• A média do peso é de 2,5 kg (0);
• O desvio-padrão do peso é de 0,12 kg (0).
• H0: hipótese nula.
• H1: hipótese alternativa.
Decisão

H0 Aceitar H0 Rejeitar H0


1–
Verdadeira P (RH0 / H0V)
P (AH0 / H0V)
P (erro tipo I)


Pd = 1 – 
Falsa P (AH0 / H0F)
P (RH0 / H0F)
P (erro tipo II)
Regra de Decisão
Se o valor da estatística do teste cair na região
crítica, rejeita-se H0
Ho
Unilateral à direita
• H0: Y = 0
• H1: Y > 0

Unilateral à esquerda
• H0: Y = 0
• H1: Y < 0

Bilateral
• H0: Y = 0
• H1: Y  0
Para Uma Média
H0: Y = 0
E ( Y ) = 0
H1: Y  0

Teste t de Student
y  0 y  0
t cal  
sY sY
n
ttab (, n – 1 gl)
Graus de liberdade = 9
0,4

0,3
f (t)

0,2

0,1
0,025 0,025
0,0
-2,26 0 2,26
t

Graus de liberdade = 99
0,4

0,3
f (t)

0,2

0,1
0,025 0,025
0,0
-1,98 0 1,98
t
Exemplo de Aplicação

• H0: Y = 2,5

• H1: Y  2,5

• Teste t de Student
RHo a
RHo

AHo

alf a / 2 alf a / 2

v alor tabelado à esquerda zero v alor tabelado à direita

p-v alor / 2 p-v alor / 2

v alor calculado à esquerda v alor calculado à direita

p-v alor / 2 p-v alor / 2

v alor calculado à esquerda v alor calculado à direita


 = P (V  |valor tabelado|)
p-valor = P (V  |valor calculado|)
p-valor
• É o menor nível de significância que considera o resultado do teste como
significativo.
• É o menor nível de significância que rejeita a hipótese H0.
• Quanto menor for o seu valor, menor será a probabilidade de H0 ser
verdadeira e mais significativo será o resultado do teste.
• Quanto menor for o seu valor, maior será o valor calculado, em módulo,
situado mais à extremidade das caudas e mais distante do valor de H0.
• Rejeita-se H0:
• |valor calculado do teste|  valor tabelado do teste;
• p-valor  .
• Não se rejeita H0 (Aceita-se H0):
• |valor calculado do teste| < valor tabelado do teste;
• p-valor > .
Intervalo de Confiança

• Para uma média populacional

sY
IC(Y)1– = y  t/2,n–1
n

Se H0 (0) pertence ao IC  TH AH0.


Distribuição Normal de Probabilidades

• Testes de normalidade
• Qui-quadrado
• Anderson-Darling
• Cramér-von Mises
• Shapiro-Wilk
• Kolmogorov-Smirnov
• Lilliefors
• Gráfico de probabilidade normal

• H0: Y ~ N (Y = y;   s
2 2
Y Y)
A equipe técnica de uma empresa testou a durabilidade (Y) das
lâmpadas, em horas, da marca x1 em um experimento (n = 30)
com as seguintes estimativas: y = 996 e sY = 36. Com base nos
testes apresentados, pode-se concluir que x1 satisfaz à
exigência da empresa, para  = 0,05?

Teste H0 H1 p-valor

t de Student Y = 1.000 Y  1.000 0,5475


• A equipe técnica de uma empresa testou a
durabilidade (Y) das lâmpadas, da marca x1 em
um experimento (n = 30), obtendo-se o seguinte
intervalo com 95% de confiança para Y:
• 982,56  Y  1.009,44
• Sabendo-se que os valores de Y são
normalmente distribuídos, pode-se concluir que
x1 satisfaz à exigência da empresa ( = 0,05)?
• Y = 1.000 (H0)
Questionário
1. Qual é a diferença entre parâmetro e estimativa?
2. Qual é a diferença entre as distribuições de probabilidades e de
frequências?
3. Quais são os objetivos dos cálculos de probabilidades, da
inferência estatística e da estatística descritiva?
4. Por que a distribuição de probabilidades normal é a mais utilizada
na inferência estatística?
5. Qual é o objetivo do teste de hipóteses?
6. Qual é o objetivo do intervalo de confiança?
8. Defina e dê exemplos das hipóteses H0 e H1.
9. Defina nível de significância e p-valor.
10. Quando se recomenda fazer experimento com um nível de um
fator?
Um Fator Controlável de Interesse com Dois Níveis
Independentes

X REP Y
x1 1 y11
x1 2 y12
... ... ...
x1 n1 y1n1
x2 1 y21
x2 2 y22
... ... ...
x2 n2 y2n2
Níveis Independentes

População x1  x1 vs. x2  População x2


    
Parâmetros Inferência Parâmetros
  

Distribuição de Distribuições de probabilidades Distribuição de


probabilidades de Y1 amostrais dos estimadores probabilidades de Y2

  
Amostra x1 Amostra x2
 
Estimativas Estimativas
 
Distribuição de Distribuição de frequências
frequências de Y1 de Y2

Intervalos de confiança para os parâmetros (x1 vs. x2)
Testes de hipóteses sobre os parâmetros (x1 vs. x2)
Medidas de Posição e de Variação
Nível xi

ni ni
 yij  (y ij  yi )2
yi 
j1
s2Yi 
j1 s Yi  2
s Yi
ni ni  1

s Yi s Yi
cv Yi  100 sY 
yi i
ni
Exercício de Aplicação
x rept y
1 1 2,59
1 2 2,70
1 3 2,44
1 4 2,65
1 5 2,77
1 6 2,81
1 7 2,53
1 8 2,31
1 9 2,37
1 10 2,57
1 11 2,46
1 12 2,76
1 13 2,24
1 14 2,69
1 15 2,85
1 16 2,32
1 17 2,70
1 18 2,57
1 19 2,50
1 20 2,60
2 1 2,88
2 2 2,94
2 3 2,91
2 4 3,01
2 5 2,72
2 6 3,21
2 7 2,82
2 8 2,94
2 9 2,99
2 10 2,78
2 11 3,02
2 12 2,95
2 13 2,97
2 14 3,13
2 15 3,06
2 16 3,11
2 17 2,96
2 18 3,12
2 19 2,99
2 20 3,03
Infinitas amostras aleatórias de duas populações independentes

Uma estimativa para


cada comparação
 Amostra x1   Amostra x2 
estabelecida entre as
duas populações

 Amostra x12   Amostra x22 

População População
x1 Dedução teórica da x2
 Amostra x13  distribuição de  Amostra x23 
probabilidades
amostral associada
ao estimador com
base na suposição
da retirada de
... ...
infinitas amostras de
x1 e x2

 Amostra x1   Amostra x2 


Inferência Estatística
Dois Níveis Independentes
• Testes de hipóteses
• Para duas variâncias
• Para duas médias

• Intervalo de confiança
• Para a diferença entre duas médias
x1 x2 x1 x1

x2 x2

y y y
Teste de Hipóteses
Para Duas Variâncias

• Teste F  2

1
Y1
• Hipótese H0:
 2
Y2
s2Y1
fcal  2
ftab (, n1 – 1, n2 – 1)
s Y2
  2
• AH0  Y = Y2 (Y1 = Y2)
2
1

 2
 2
• RH0  Y  Y2 1
Teste de Hipóteses
Para Duas Médias Independentes

• Teste t de Student

• Hipótese H0: Y1 – Y2 = 0 (Y1 = Y2)

• Variâncias homogêneas

• Variâncias heterogêneas
Teste de Hipóteses
Para Duas Médias Independentes
Variâncias Homogêneas

y1  y 2
t cal  ttab (, n1 + n2 – 2)
 1 1
s  
2
Y 
 n1 n2 

(n1  1)s  (n2  1)s


2 2

s 
2 Y1 Y2

(n1  1)  (n2  1)
Y
Intervalo de Confiança
Dois Níveis Independentes

• Para a diferença entre duas médias

2 1 1 
• IC (Y1 – Y2)1– = y1  y 2  t/2,n1+n2–2 s Y   
 n1 n2 

Se H0 pertence ao IC  TH AH0.
X REP Y
x1 1 y11
x1 2 y12
... ... ... H01: Y1 ~ N (Y1 = y 1 ; Y1 = sY1)
x1 n1 y1n1
x2 1 y21 Gráfico de Probabilidade Normal
Teste de Lilliefors
x2 2 y22
... ... ... H02: Y2 ~ N (Y2 = y 2 ; Y2 = sY2)
x2 n2 y2n2
Com o objetivo de escolher uma marca de lâmpadas (X) que
atenda às especificações de maior média e de menor variância
paramétricas possíveis, a equipe técnica resolveu comparar a
durabilidade (Y), em dias, das marcas x1 e x2. Se Y1 e Y2 forem
consideradas variáveis aleatórias normais, qual das marcas é a
melhor, para  = 0,05?

Marca ni yi sYi p-valor

x1 30 506 20,6 fcal 2,55 0,0070

x2 30 498 12,9 tcal 1,80 0,0818


• A equipe técnica de uma empresa resolveu
comparar a resistência (Y) do concreto das marcas
x1 e x2, por meio da construção do intervalo com
95% de confiança para a diferença das médias:

• –0,77  Y1 – Y2  1,77

• Se Y1 e Y2 forem consideradas variáveis aleatórias


normais, qual(is) deve(m) ser a(s) marca(s)
escolhida(s)?
Níveis Dependentes
População x1  D = Y1 – Y2  População x2

Parâmetros

Distribuição de probabilidades de D
 
Amostra x1  d = y1 – y2  Amostra x2

Estimativas

Distribuição de frequências de D

Distribuições de probabilidades amostrais


dos estimadores

Intervalos de confiança para os parâmetros (D)
Testes de hipóteses sobre os parâmetros (D)
Um Fator Controlável de Interesse com Dois Níveis
Dependentes

REP Y1 Y2 D

1 y11 y21 d1

2 y12 y22 d2

... ... ... ...

n y1n y2n dn
Teste de Hipóteses
Para Duas Médias Dependentes

• Teste t de Student
• Hipótese H0: D = 0

d d
t cal  
sD sD
n
ttab (, n – 1)
Distribuição Normal de Probabilidades

• Teste de normalidade
• Lilliefors
• Gráfico de probabilidade normal

• H0: D ~ N (D = d ; D = sD)


Exercício de Aplicação
rept y1 y2
1 2,59 2,88
2 2,70 2,94
3 2,44 2,91
4 2,65 3,01
5 2,77 2,72
6 2,81 3,21
7 2,53 2,82
8 2,31 2,94
9 2,37 2,99
10 2,57 2,78
11 2,46 3,02
12 2,76 2,95
13 2,24 2,97
14 2,69 3,13
15 2,85 3,06
16 2,32 3,11
17 2,70 2,96
18 2,57 3,12
19 2,50 2,99
20 2,60 3,03
Um experimento, com o objetivo de testar um novo tratamento
anticorrosivo para chapas de aço, foi realizado usando-se nove chapas
diferentes, em que cada uma delas foi dividida em duas metades. A uma
das metades aplicou-se o tratamento já utilizado pela indústria ou antigo
(x1) e, à outra metade, o tratamento novo (x2), o qual, no entanto,
apresenta maior custo de aplicação. Posteriormente, anotou-se o tempo
até o início da corrosão (Y) em cada metade. Para este caso, considera-se
que tal aumento de custo será compensado, caso o tratamento novo (x2)
proporcione maior média populacional do que o tratamento antigo (x1). De
acordo com os resultados obtidos e  = 0,05, qual teste t de Student
(independentes ou dependentes) deve ser utilizado para decidir sobre qual
dos dois tratamentos deve ser recomendado?

Chapa 1 2 3 4 5 6 7 8 9

Y1 50,5 39,7 35,1 33,2 40,4 36,6 38,4 42,5 39,3

Y2 52,1 48,5 35,7 39,6 41,9 37,2 39,1 43,8 44,2


Questionário
1. É melhor fazer estatística descritiva, testes de hipóteses
ou intervalos de confiança para comparar duas variâncias
e para comparar duas médias?
2. Qual é a diferença entre amostras independentes e
dependentes?
3. Por que é importante que a variável-resposta Y se
manifeste como uma variável aleatória dentro das duas
populações independentes x1 e x2, separadamente?
4. Quando se recomenda fazer experimento com dois níveis
de um fator?

Você também pode gostar