Você está na página 1de 67

Capítulo 1

Testes de Hipóteses

Prof. José Ivo Ribeiro Júnior


Um Nível
X REPT Y
x1 1 y1
x1 2 y2
... ... ...
x1 n yn

Y é uma variável.
Y é uma variável aleatória?
Relação entre Uma População e Uma Amostra

⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯→
População x1 Amostra x1
⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯

  

Parâmetros Inferência Estimativas

  

Distribuição de Distribuições de probabilidades Distribuição de


probabilidades de Y amostrais dos estimadores frequências de Y


Intervalos de confiança para os parâmetros (Y)
Testes de hipóteses sobre os parâmetros (Y)
Medida Parâmetro Estimativa
(Valor numérico) (Valor numérico)

Média Y ӯ
2 2
Variância σY sY
Desvio-padrão Y sY
Coeficiente de
variação CVY cvY
Erro-padrão da
média σYഥ sYഥ
População
(y1, y2, ..., yN)
→ O que eu tenho (Y e Y)
Parâmetros

Inferência O que eu quero (0 e 0)


estatística

Amostra particular
→ O que eu sei (ӯ e sY)
(y1, y2, ..., yn)
Estimativas
Estimativas

n n
(yi − yത ) 2
(yi − yത ) 2
s2Y =෍ sY2 =෍
n n− 1
i=1 i=1

n
(yi − yത )2
sY = ෍
n−1
i=1

n
|yi − yത |
DMA = ෍
n
i=1
Distribuição de Probabilidades
• Y = variável aleatória
• v.a. contínua
• Y  Normal (Y;  Y2 )

2
1 y−Y 
−  
1 2  Y 
f(y) = e
 Y 2
f (y)

LIN LSN
− − −  + + +
y
0,6827

0,9545

0,9973
Medida Parâmetro Estimativa
(Valor numérico) (Valor numérico)
n
 yi
Média Y y= i=1
n
n
 (yi − y)2
Variância  Y2 s2Y = i=1
n −1

Desvio-padrão Y sY = s2Y

sY
Coeficiente de
CVY cv Y = 100
variação y
sY
Erro-padrão da Y sY =
média n
População Amostra aleatória
(y1, y2, ..., yN) (Y1, Y2, ..., Yn)

n n

Y i  i
(Y − Y) 2

Y= i=1
SY = i=1

n n −1
Estimadores
Amostra particular
(y1, y2, ..., yn)
População

Amostra 1 Amostra 2 ... Amostra m

ȳ1 ȳ2 ȳm
sY1 sY2 sYm
m
(തyi −ധy)2
sYഥ = ෍
m−1
i=1

Erro-padrão da média
Infinitas Amostras Aleatórias de Uma População

Uma estimativa para cada


→ Amostra x1 →
parâmetro

→ Amostra x12 →

População
x1 Dedução teórica da distribuição de
→ Amostra x13 →
probabilidades amostral associada
ao estimador com base na
suposição da retirada de infinitas
...
amostras da população x1

→ Amostra x1 →

O erro-padrão da média estima o grau de variação das estimativas de Y ao longo das


possíveis amostras aleatórias que podem ser retiradas de uma mesma população.
f (y)
Y
Y =
n

Y
− Y
− Y
−  Y
+ Y
+ Y
+
y
0,6827

0,9545

0,9973
Distribuição Normal

Distribuição Distribuição Distribuição


qui-quadrado t de Student F
Distribuições Amostrais
População
(y1, y2, ..., yN)

Inferência Estatística

Amostra particular
(y1, y2, ..., yn)

Concluir sobre o todo com base em parte,


de acordo com as distribuições de probabilidades amostrais.
Inferência Estatística
• Testes de hipóteses
• Para uma variância populacional
• Para uma média populacional
❖ O QUE EU QUERO PARA A POPULAÇÃO?

• Intervalos de confiança
• Para uma variância populacional
• Para uma média populacional
❖ COMO É A POPULAÇÃO?
Hipóteses Estatísticas
• É uma afirmativa a respeito de um parâmetro
de uma distribuição de probabilidades.
• Exemplo de uma variável-resposta Y:

• Y = 0.

• H0: hipótese de igualdade ou de nulidade.


• H1: hipótese alternativa.
Hipóteses Estatísticas
• H0: Y = 0 vs.
• H1: Y  0 ou Y  0 ou Y  0

• Eu quero que a média do envase do leite seja de


1.000 mL (H0).
• Eu quero que a média da produção seja de, no
mínimo, 1.000 kg/ha (H1).
• Eu quero que a média da incidência da doença seja
de, no máximo, 1% (H1).
Regra de Decisão (H0)
Se o valor da estatística do teste cair na região
crítica, rejeita-se H0.
H0
Unilateral à direita
• H0: Y = 0
• H1: Y  0

Unilateral à esquerda
• H0: Y = 0
• H1: Y  0

Bilateral
• H0: Y = 0
• H1: Y  0
H0
RHo a
RHo

AHo

alf a / 2 alf a / 2

v alor tabelado à esquerda zero v alor tabelado à direita

p-v alor / 2 p-v alor / 2

v alor calculado à esquerda v alor calculado à direita

p-v alor / 2 p-v alor / 2

v alor calculado à esquerda v alor calculado à direita


p-valor
• É o menor nível de significância que considera o resultado do teste como
significativo.
• É o menor nível de significância que rejeita a hipótese H0.
• Quanto menor for o seu valor, menor será a probabilidade de H0 ser
verdadeira e mais significativo será o resultado do teste.
• Quanto menor for o seu valor, maior será o valor calculado, em módulo,
situado mais à extremidade das caudas e mais distante do valor de H0.
• Rejeita-se H0:
• |valor calculado do teste|  valor tabelado do teste;
• p-valor  .
• Não se rejeita H0 (Aceita-se H0):
• |valor calculado do teste| < valor tabelado do teste;
• p-valor > .
0
0 1

Ӯ
Decisão

H0 Aceitar H0 Rejeitar H0


1−
Verdadeira P (RH0 | H0V)
P (AH0 | H0V)
P (erro tipo I)


Pd = 1 − 
Falsa P (AH0 | H0F)
P (RH0 | H0F)
P (erro tipo II)
Para Uma Média
H0: Y = 0
H1: Y  0

Y  Normal
Teste t de Student
y − 0 y − 0
t cal = =
sY sY
n

ttab (, n – 1 gl)


E ( Y ) = 0
Tabela Bilateral de t (0,001    0,10)
Teste t de Student
Graus de liberdade = 9
0,4

0,3
f (t)

0,2

0,1
0,025 0,025
0,0
-2,26 0 2,26
t

Graus de liberdade = 99
0,4

0,3
f (t)

0,2

0,1
0,025 0,025
0,0
-1,98 0 1,98
t
Exemplo de Aplicação

• H0: Y = 0  Y = 2,5

• H1: Y  2,5

• H1: Y  2,5

• H1: Y  2,5
/ /
tab1 tab2

tab

tab
ӯ sY

2,5 2,6 2,7 2,8 2,9 2,7 0,1581

H0: Y = 2,5
H1: Y  2,5
Teste t de Student

yത − 2,5
t cal = s ttab ( = 0,05; n − 1 = 4 gl)
Y
n

tcal t/2,gl p-valor


2,83 2,78 0,0474
p1ex1.xlsx
x rept y
1 1 2,5
1 2 2,6
1 3 2,7
1 4 2,8
1 5 2,9
setwd ("C:/.../Rtrab")
library (openxlsx)
dp1ex1 = read.xlsx ("p1ex1.xlsx")
attach (dp1ex1)
dp1ex1

help (t.test)
t.test (x, mu = 0, alternative = "two.sided", conf.level
= 0.95, ...)

t.test (y, mu = 2.5)


Intervalo de Confiança
• Para uma média populacional

sY
IC(Y)1– = y  t/2,n–1
n

Se H0 (0) pertence ao IC  TH AH0.

E(Y) = Y
A equipe técnica de uma empresa testou a durabilidade (Y) das
lâmpadas, em horas, da marca x1 em um experimento (n = 30)
com as seguintes estimativas: y = 996 e sY = 36. Com base nos
testes apresentados e dado que Y  normal, pode-se concluir
que x1 satisfaz à exigência da empresa, para  = 0,05?

Teste H0 H1 p-valor

t de Student Y = 1.000 Y  1.000 0,5475


• A equipe técnica de uma empresa testou a
durabilidade (Y) das lâmpadas, da marca x1 em
um experimento (n = 30), obtendo-se o seguinte
intervalo com 95% de confiança para Y:
• 982,56  Y  1.009,44
• Sabendo-se que os valores de Y são
normalmente distribuídos, pode-se concluir que
x1 satisfaz à exigência da empresa ( = 0,05)?
• H0: Y = 1.000
Dois Níveis Independentes
Níveis Independentes
População x1 → x1 vs. x2  População x2
    
Parâmetros Inferência Parâmetros
  

Distribuição de Distribuições de probabilidades Distribuição de


probabilidades de Y1 amostrais dos estimadores probabilidades de Y2

  
Amostra x1 Amostra x2
 
Estimativas Estimativas
 
Distribuição de Distribuição de frequências
frequências de Y1 de Y2

Intervalos de confiança para os parâmetros (Y1 vs. Y2)
Testes de hipóteses sobre os parâmetros (Y1 vs. Y2)
Um Fator Controlável de Interesse com Dois Níveis
Independentes

X REPT Y
x1 1 y11
x1 2 y12
... ... ...
x1 n1 y1n1
x2 1 y21
x2 2 y22
... ... ...
x2 n2 y2n2
Medidas de Posição e de Variação
Nível xi (i = 1 e 2)

ni ni
 yij  (y ij − y i )2
yi =
j=1
s 2Yi =
j=1 s Yi = s 2Yi
ni ni − 1

s Yi s Yi
cv Yi = 100 sY =
yi i
ni
Infinitas amostras aleatórias de duas populações independentes

Uma estimativa para


cada comparação
→ Amostra x1 →  Amostra x2 
estabelecida entre as
duas populações

→ Amostra x12 →  Amostra x22 

População População
x1 Dedução teórica da x2
→ Amostra x13 → distribuição de  Amostra x23 
probabilidades
amostral associada
ao estimador com
base na suposição
da retirada de
... ...
infinitas amostras de
x1 e x2

→ Amostra x1 →  Amostra x2 


Inferência Estatística
Dois Níveis Independentes
• Testes de hipóteses
• Para duas variâncias populacionais
• Para duas médias populacionais independentes

• Intervalo de confiança
• Para a razão entre duas variâncias populacionais
• Para a diferença entre duas médias
populacionais independentes
Hipóteses Estatísticas
• Eu quero verificar qual entre os dois tratamentos
(x1 e x2) apresenta a melhor média (H1: Y1  Y2)
e/ou a melhor variabilidade (H1: Y1  Y2).

• Eu quero verificar se o tratamento x1 apresenta


melhor média (H1: Y1  Y2 ou H1: Y1  Y2) e/ou
melhor variabilidade (H1: Y1  Y2) que o x2.
x1 x2 x1 x1

x2 x2

y y y
Teste de Hipóteses
Para Duas Variâncias

• Teste F  2

=1
Y1
• Hipótese H0:
 2

Y2  Normal
Y1  Normal
Y2

s 2Y1
fcal = 2
ftab (, n1 − 1, n2 − 1)
s Y2

• H0:  = (Y1 = Y2)


2 2
Y1 Y2
s 2Y1
fcal =
s 2Y2

Tabela unilateral de F  1

1/f = f1–/2,n1–1,n2–1 f = f/2,n1–1,n2–1


n1 = n2
sYi
2,1 2,3 2,5 2,7 2,9 0,3162
2,5 2,6 2,7 2,8 2,9 0,1581

H0: Y1 = Y2


H1: Y1  Y2
Teste F
2
sY1
fcal = 2 ftab ( = 0,05; n1 − 1 = 4 gl; n2 − 1 = 4 gl)
sY2

fcal f1–/2,n1–1,n2–1 f/2,n1–1,n2–1 p-valor


4,00 0,10 9,60 0,2080
sYi
2,1 2,3 2,5 2,7 2,9 0,3162
2,5 2,6 2,7 2,8 2,9 0,1581

H0: Y1 = Y2


H1: Y1  Y2
Teste F
2
sY1
fcal = 2 ftab ( = 0,05; n1 − 1 = 4 gl; n2 − 1 = 4 gl)
sY2

fcal f,n1–1,n2–1 p-valor


4,00 6,39 0,1040
p1ex2.xlsx
x rept y
1 1 2,1
1 2 2,3
1 3 2,5
1 4 2,7
1 5 2,9
2 1 2,5
2 2 2,6
2 3 2,7
2 4 2,8
2 5 2,9

setwd ("C:/.../Rtrab")
library (openxlsx)
dp1ex2 = read.xlsx ("p1ex2.xlsx")
attach (dp1ex2)
dp1ex2

help (var.test)
var.test (y ~ x, ratio = 1, alternative = "two.sided",
conf.level = 0.95, ...)

var.test (y ~ x, alternative = "greater")


Teste de Hipóteses
Para Duas Médias (Independentes)

• Teste t de Student

Y2  Normal
Y1  Normal
• Hipótese H0: Y1 − Y2 = 0 (Y1 = Y2)

• Variâncias homogêneas

• Variâncias heterogêneas
Teste de Hipóteses
Para Duas Médias (Independentes)
Variâncias Homogêneas

y1 − y 2
t cal = ttab (, n1 + n2 − 2)
 1 1
s  +
2
Y 
 n1 n2 

(n1 − 1)s + (n2 − 1)s


2 2

s =
2 Y1 Y2

(n1 − 1) + (n2 − 1)
Y
ӯi sYi
2,1 2,3 2,5 2,7 2,9 2,5 0,3162
2,5 2,6 2,7 2,8 2,9 2,7 0,1581

H0: Y1 = Y2 sY2 = 0,0625


H1: Y1  Y2
Teste t de Student (var. homogêneas)
y1 − y 2
t cal =
 1 1 ttab ( = 0,05; n1 + n2 − 2 = 8 gl)
s  +
2
Y 
 n1 n2 

tcal t/2,gl p-valor


−1,26 2,31 0,2415
p1ex2.xlsx
x rept y
1 1 2,1
1 2 2,3
1 3 2,5
1 4 2,7
1 5 2,9
2 1 2,5
2 2 2,6
2 3 2,7
2 4 2,8
2 5 2,9

setwd ("C:/.../Rtrab")
library (openxlsx)
dp1ex2 = read.xlsx ("p1ex2.xlsx")
attach (dp1ex2)
dp1ex2

help (t.test)
t.test (y ~ x, mu = 0, alternative = "two.sided", paired
= FALSE, var.equal = FALSE, conf.level = 0.95, ...)

t.test (y ~ x, var.equal = T)
Intervalo de Confiança
Para Duas Médias (Independentes)
Variâncias Homogêneas

• Para a diferença entre duas médias


2 1 1 
• IC (Y1 – Y2)1– = y1 − y 2  t/2,n1+n2–2 s Y  + 
 n1 n2 

Se H0 pertence ao IC  TH AH0.
Com o objetivo de escolher uma marca de lâmpadas (X) que
atenda às especificações de maior média e de menor variância
paramétricas possíveis, a equipe técnica resolveu comparar a
durabilidade (Y), em dias, das marcas x1 e x2. Se Y1 e Y2 forem
consideradas variáveis aleatórias normais, qual das marcas é a
melhor ( = 0,05)?

Marca ni yi sYi p-valor

x1 30 506 15,5 fcal 1,70 0,0799

x2 30 498 20,2 tcal 1,72 0,0906


Agar-agar, um gel preparado a partir das paredes celulares de várias
algas vermelhas, é usado como meio de cultura em laboratórios e
também como espessante, estabilizante ou adesivo nas indústrias de
alimentos, de cosméticos e de fármacos. Geyer et al. (1990)
estudaram o efeito da localidade onde as amostras eram colhidas,
na costa próxima a Arraial do Cabo (RJ), sobre o teor de agar-agar
extraído da alga Pterocladia capillacea (Rhodophyceae). De acordo
com os resultados obtidos em dois locais, um com pouca atividade
urbana e com atividade industrial (x1), e o outro com muita atividade
urbana e sem atividade industrial (x2), a mudança do local de coleta
(X) muda a variabilidade e a média do teor de agar-agar (Y) ( =
0,05)? Por quê?

x1 39,75 36,40 33,88 27,85 31,42 34,40 36,62 36,50 38,04 23,80

x2 42,37 45,23 34,14 37,00 29,96 31,82 34,58 42,58 42,38 –


Dois Níveis Dependentes
Níveis Dependentes
População x1 → D = Y1 – Y2  População x2

Parâmetros

Distribuição de probabilidades de D
 
Amostra x1 → d = y1 – y2  Amostra x2

Estimativas

Distribuição de frequências de D

Distribuições de probabilidades amostrais


dos estimadores

Intervalos de confiança para os parâmetros (D)
Testes de hipóteses sobre os parâmetros (D)
Um Fator Controlável de Interesse com Dois Níveis
Dependentes

REP Y1 Y2 D = Y1 − Y2

1 y11 y21 d1 = y11 − y21

2 y12 y22 d2 = y12 − y22

... ... ... ...

n y1n y2n dn = y1n − y2n


Hipóteses Estatísticas
• Eu quero verificar qual entre os dois tratamentos
(x1 e x2) apresenta a melhor média (H1: D  0),
para D = Y1 − Y2. Se H1 for verdadeira, então tem-
se: Y1  Y2.

• Eu quero verificar se o tratamento x1 apresenta


melhor média que o x2 (H1: D  0 ou H1: D  0),
para D = Y1 − Y2. Se H1 for verdadeira, então tem-
se: Y1  Y2 ou Y1  Y2.
Teste de Hipóteses
Para Duas Médias Dependentes

• Teste t de Student
• Hipótese H0: D = 0

D  Normal
d d
t cal = =
sD sD
n

ttab (, n − 1)
ƌ sD
2,1 2,3 2,5 2,7 2,9
2,5 2,6 2,7 2,8 2,9
−0,4 −0,3 −0,2 −0,1 0 −0,2 0,1581
H0: D = 0
H1: D  0
Teste t de Student
dሜ
t cal = s
D ttab ( = 0,05; n − 1 = 4 gl)
n

tcal ttab p-valor


−2,83 2,78 0,0474
p1ex3.xlsx
rept y1 y2
1 2,1 2,5
2 2,3 2,6
3 2,5 2,7
4 2,7 2,8
5 2,9 2,9
setwd ("C:/.../Rtrab")
library (openxlsx)
dp1ex3 = read.xlsx ("p1ex3.xlsx")
attach (dp1ex3)
dp1ex3

help (t.test)
t.test (y1, y2, mu = 0, alternative = "two.sided", paired
= FALSE, var.equal = FALSE, conf.level = 0.95, ...)

t.test (y1, y2, paired = T)


Intervalo de Confiança
• Dois níveis dependentes

• IC(Y)1– = d  t/2,n–1 sD
n

Se H0 (zero) pertence ao IC  TH AH0.


A contagem de coliformes totais (Y), em log, pode ser medida por
um método padrão (x1) ou por um método alternativo (x2). Para
comparar as médias paramétricas dos dois métodos, duas porções
de cada um dos cinco queijos foram avaliadas pelos métodos x1 e x2,
respectivamente. Nesse estudo, o objetivo é verificar se o método x2,
mais barato e rápido, pode ser utilizado no lugar do método x1 que
tem precisão já determinada cientificamente. De acordo com os
resultados e  = 0,05, o método x2 pode ser utilizado no lugar do
método x1?

1 2 3 4 5
x1 3,3010 3,2553 3,2430 3,2788 3,2672
x2 3,3012 3,2555 3,2433 3,2790 3,2674

Você também pode gostar