Você está na página 1de 42

Testes de hipoteses

Metodos Numericos e Estatsticos


Parte II-Metodos Estatsticos
Testes de hipoteses
Lusa Morgado
Lic. Eng. Biomedica e Bioengenharia-2009/2010
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Ate ao momento, adiantamos um valor razoavel, ou um intervalo
de valores razoaveis para um parametro desconhecido de interesse,
tirando partido da informacao contida numa amostra recolhida.

E altura de tirarmos partido dessa mesma informa cao para nos


pronunciarmos sobre armacoes relativas a esse parametro
desconhecido ou a outros aspectos da nossa variavel de interesse.
Exemplo
Estamos interessados em comparar a proporcao de fumadores entre
homens e mulheres. Uma hipotese de investigacao seria, e.g., a
proporcao de fumadores e diferente nos homens e nas mulheres.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
A qualquer armacao/conjectura sobre
um parametro desconhecido;
distribuicao da v.a de interesse, etc,
da-se o nome de hipotese estatstica.
Hipotese estatstica
Trata-se de uma armacao/conjectura sobre um parametro
desconhecido, assumindo que se conhece a distribuicao da
v.a. de interesse (a menos de um, ou mais, parametros de-
sconhecidos.
Hipotese parametrica
Lusa Morgado Testes de hipoteses
Testes de hipoteses
De um modo geral confrontamos duas hipoteses
parametricas:
a hipotese mais relevante, normalmente designada por
hipotese nula e representada por H
0
;
a hipotese dita alternativa, representada por H
1
.
A estas duas hipoteses parametricas estao associados dois
subespa cos disjuntos do espaco parametrico.
Hipotese nula e alternativa
Uma hipotese diz-se
simples, caso especique um unico valor para o
parametro desconhecido;
composta, caso contrario.
Hipotese simples e composta
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Uma hipotese alternativa diz-se
unilateral inferior, se possuir um sinal de menor;
unilateral superior, se possuir um sinal de maior;
bilateral, se possuir um sinal de diferente.
Hipotese alternativa unilateral e bilateral
Exemplo
Um preparado farmaceutico com o objectivo de reduzir dores de cabeca, foi
administrado a 20 mulheres durante seis semanas, tendo sido registada variacao de
peso.
Sendo H
0
: = 0kg (a media de variacao de peso na populacao e zero),
podemos considerar as hipoteses alternativas:
H
1
1
: > 0, unilateral superior
H
1
2
: < 0, unilateral inferior
H
1
3
: = 0, bilateral
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Um teste de hipoteses nao passa de um procedimento es-
tatstico que conduz a uma decisao acerca das hipoteses
nula e alternativa, tirando partido da informacao contida na
amostra recolhida. Assim sendo, de um modo geral, tomamos
uma de duas decisoes:
rejeitar H
0
;
nao rejeitar H
0
.
Hipotese alternativa unilateral e bilateral
As decisoes tomadas podem ou nao ser correctas.
Decisao H
0
verdadeira H
0
falsa
Rejeitar H
0
Erro de 1
a
especie Decisao correcta
Nao rejeitar H
0
Decisao correcta Erro de 2
a
especie
Lusa Morgado Testes de hipoteses
Testes de hipoteses

E habitual delinear o teste de hipoteses de modo a minimizar as


probabilidades de ocorrencia de erros de 1
a
e 2
a
especie. Estas
probabilidades costumam ser designadas por e ,
respectivamente, e denem-se por
= P(Erro de 1
a
especie)=P(Rejeitar H
0
|H
0
e verdadeira)
= P(Erro de 2
a
especie)=P(Nao rejeitar H
0
|H
0
e falsa)
Analogia com o teste de diagnostico:
O erro de 1
a
especie e semelhante a um teste falso-positivo (que
incorrectamente indica presenca da doenca quando ela nao esta presente).
Assim sendo, 1 e analogo `a especicidade de teste auxiliar de diagnostico
(proporcao de testes negativos em indivduos nao doentes).
O erro de 2
a
especie e semelhante a um teste falso-negativo (que
incorrectamente indica que nao existe doen ca quando ela esta presente).
Assim, 1 e analogo `a sensibilidade do teste auxiliar de diagnostico
(proporcao de testes positivos em indivduos doentes).
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Normalmente, estabelece-se um limite superior para a proba-
bilidade de ocorrer um erro de 1
a
especie. A esse limite da-se
o nome de nvel de signicancia (n.s.) do teste e representa-
se por
0
(
0
(0, 1)). Assim sendo, o teste e delineado de
modo a que
P(Rejeitar H
0
|H
0
e verdadeira)
0
.
Os valores mais comuns para o n.s. sao 10%, 5% e 1%.
Qualquer decisao devera basear-se na informa cao recolhida,
muito em particular, no
valor esperado daquilo a que chamaremos estatstica de
teste.
Nvel de signicancia
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Uma estatstica de teste, que daqui em diante sera represen-
tada por T, e que sera utilizada no confronto de um par de
hipoteses que digam respeito a um parametro desconhecido
, devera
reectir a discrepancia entre o estimador de e o valor
conjecturado para em H
0
(
0
);
poder obter-se `a custa da v.a. fulcral Z que usaramos
para construir um intervalo de conan ca para
(substituindo por
0
em Z);
ter distribuicao (exacta ou aproximada) conhecida, sob
a validade de H
0
.
Estatstica de teste
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Representa-se por W e e escolhida de modo a que
P(Rejeitar H
0
|H
0
e verdadeira)=
0
(
0
);
seja um intervalo real (ou uma reuniao de intervalos
reais) de probabilidade relacionada com
0
e
respeitantes `a distribuicao da estatstica de teste sob
H
0
;
o seu aspecto dependa da hipotese alternativa.
Regiao de rejei cao de H
0
Para decidir rejeitar ou nao H
0
, e necessario calcular
t = valor observado da estatstica de teste.
Deve depois tomar-se uma de duas decisoes
Rejeitar H
0
ao n.s.
0
se t W;
Nao rejeitar H
0
ao n.s.
0
se t / W.
Decisao
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Note que
1
Armar que H
0
nao foi rejeitada ao n.s.
0
, nao signica que
H
0
seja verdadeira;
2
Armar que H
0
foi rejeitada ao n.s.
0
, nao signica que H
0
seja falsa, mas que H
0
nao e consistente com os dados ao n.s.

0
;
3
Podemos rejeitar H
0
ao n.s.
0
e nao rejeitar esta mesma
hipotese a outro n.s.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Um teste de hipoteses bilateral com um n.s.
0
pode ser
efectuado a partir de um intervalo de conanca a
(1
0
) 100%;
A partir de um intervalo de conanca a (1
0
) 100%,
rejeitamos todas as hipoteses H
0
associadas a valores das
estatsticas de teste observadas, que estejam fora do
intervalo.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Testes de hipoteses para a media, variancia conhecida
Exemplo
Voltemos ao exemplo anterior, em que um farmaco para reduzir as dores de cabeca e
administrado a um gupo de 20 mulheres durante seis semanas. Vericou-se que a
alteracao media do peso corporal foi de 1.1Kg. Assumindo que a amostra foi
retirada de uma populacao em que a variacao de peso segue uma distribui cao normal
de desvio padrao = 2.8Kg, pretendemos saber se o farmaco tem um efeito
signicativo na variacao de peso dessa populacao.
V.a. de interesse: X = varia cao de peso na populacao.
X normal (, 2.8
2
), desconhecido.
Hipoteses
H
0
: =
0
= 0
H
1
: = 0
Nvel de signicancia:
0
= 5% (por exemplo)
Estatstica de teste: T =
X
0

n
normal(0, 1)
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Exemplo (cont.)
Regiao de rejei cao de H
0
: Por estarmos a lidar com um teste bilateral, a regiao
de rejeicao de H
0
sera uma reuniao de intervalos do tipo
W = (, c) (c, +)
onde c =P(Rejeitar H
0
|H
0
e verdadeira)=
0
, i.e.,
c =
1
_
1

0
2
_
=
1
_
1
0.05
2
_
= 1.96
Decisao: Uma vez que
t =
X
0

n
=
1.1 0
2.8

20
= 1.76
e 1.76 / W, devemos aceitar H
0
, i.e., nao existe evidencia de que o farmaco
tenha um efeito signicativo na variacao do peso.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Ao confrontar duas popula coes independentes, e usual testar a
igualdade dos seus valores esperados, sejam eles
1
e
2
.
Repare-se que a hipotese de igualdade de valores esperados
H

0
:
1
=
2
e equivalente a
H
0
:
1

2
=
0
= 0.
No que respeita a testes de hipoteses sobre a igualdade de duas
medias, distinguiremos o caso em que as duas populacoes
independentes tem distribuicao normal (caso 1), do caso em que
tem distribuicao arbitraria (e nao normal), e as dimensoes das
amostras sao sucientemente grandes (caso 2).
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Testes de hipoteses para a igualdade de duas medias,
variancias conhecidas
Exemplo
Caso 1.
Pretende-se comparar a resistencia de dois aparelhos fabricados com materiais
diferentes (do tipo I e do tipo II). Para tal recolheram-se duas amostras (uma
contendo aparelhos do tipo I e outra contendo aparelhos do tipo II) e registaram-se as
respectivas durac oes (em anos):
Tipo I: x
1
= (26, 24, 22, 30)
Tipo II: x
2
= (25, 31, 33, 29)
Admitindo que a dura cao (em anos) dos aparelhos de tipo I e II sao v.a.
independentes, com distribuicao normal de desvios-padrao
1
= 7 e
2
= 3,
respectivamente, testemos a hipotese de serem iguais os seus tempos medios de
duracao, contra a hipotese de ser menor a duracao dos aparelhos de tipo I.
V.a. de interesse:
X
1
=duracao do aparelho do tipo I
X
2
=duracao do aparelho do tipo II
X
1
normal(
1
, 7
2
), X
2
normal(
2
, 3
2
)
(
1

2
) desconhecido
Hipoteses:
H
0
:
1

2
=
0
= 0
H
1
:
1

2
<
0
= 0
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Exemplo (cont.)
Nvel de signicancia:
0
= 5%
Estatstica de teste: T =
(X
1
X
2
)
0


2
1
n1
+

2
2
n2
normal(0, 1)
Regiao de rejei cao: Tratando-se de um teste unilateral inferior, concluimos que
quanto menor for a estimativa de MV de
1

2
(que e dada por x
1
x
2
),
mais razoes temos para rejeitar H
0
, e portanto, a regiao de rejeicao (para valores
da estatstica de teste) e um intervalo `a esquerda:
W = (, c)
onde c =
1
(
0
) =
1
(1
0
) =
1
(1 0.05) = 1.65.
Decisao: O valor observado da estatstica de teste e
t =
(25.5 29.5) 0
_
7
2
4
+
3
2
4
= 1.05
e como t / W, nao devemos rejeitar H
0
ao n.s. de 5%.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Testes de hipoteses para a igualdade de duas medias,
variancias conhecidas
Caso 2.
Para efectuar um teste de hipoteses sobre a igualdade de valores esperados de
popula coes independentes com distribuicao arbitraria, variancia conhecida, e dimensao
amostral sucientemente grande, procede-se como no exemplo anterior, i.e.,
considera-se a
Estatstica de teste:
T =
(X
1
X
2
)
0
_
V
2
(X
1
)
n1
+
V
2
(X
2
)
n2
,
cuja distribuicao e, aproximadamente,
normal(0, 1)
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Testes de hipoteses para a media, variancia desconhecida

E obviamente mais realista efectuar um teste de hipoteses sobre o


valor medio assumindo que a variancia e igualmente desconhecida.
Tal como anteriormente, ha que distinguir os caso da amostra ser
proveniente de uma populacao normal do caso em que provem de
uma populacao com distribuicao arbitraria e com dimensao
amostral sucientemente grande.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Testes de hipoteses para a media, variancia desconhecida
Exemplo
Tendo com objectivo comparar a ingestao energetica media diaria numa populacao
(que se sup oe seguir uma distribui cao normal), com o valor recomendado (7725Kj ),
recolheu-se uma amostra de 11 mulheres saudaveis tendo-se registado uma media e
desvio padrao amostrais de 6753.6KJ e 11421Kj , respectivamente. Pretende-se saber
se, na populacao, as mulheres fazem ou nao uma ingestao energetica diaria de acordo
com a recomendada.
V.a. de interesse: X =ingestao energetica diaria
X normal(,
2
), e desconhecidos
Hipoteses
H
0
: = 7725
H
0
: = 7725
Nvel de signicancia:
0
= 5%
Estatstica de teste: T =
X
0
s

n
t
(n1)
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Exemplo (cont.)
Regiao de rejei cao de H
0
: Por estarmos a lidar com um teste bilateral, sera
uma reuniao de intervalos do tipo
W = (, c) (c, +)
onde c =P(Rejeitar H
0
|H
0
e verdadeira)=
0
, i.e.,
c = F
1
X
_
1

0
2
_
=
1
_
1
0.05
2
_
= 2.2281
(no scilab, cdft(T, 10, 1
0.05
2
,
0.05
2
))
Decisao: Uma vez que
t =
X
0
s

n
=
6753.6 7725
11421

11
= 2.821
e 2.821 W, devemos rejeitar H
0
,ao n.s. de 5%, i.e., a ingestao diaria e
signicativamente diferente da recomendada.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Metodo alternativo de decisao em testes de hip oteses:
calculo do p-value
A decisao pela rejei cao ou nao da hipotese H
0
depende
crucialmente do n.s.
0
que se tenha considerado.
Assim, em vez de xarmos o n.s. do teste, identicarmos a regiao
de rejeicao e vericarmos se a estatstica de teste pertence ou nao
a tal regiao, podemos simplesmente, determinado t, averiguar para
que n.s. de decide pela rejei cao de H
0
e para que n.s. de decide
pela nao rejeicao de H
0
.
Dado o valor observado da estatstica de teste, o p-value e o maior
nvel de signicancia que leva `a nao rejeicao de H
0
.
Assim sendo, devemos agir do seguinte modo:
nao rejeitar H
0
a qualquer n.s.
0
p-value;
rejeitar H
0
a qualquer n.s.
0
> p-value.
p-value
Lusa Morgado Testes de hipoteses
Testes de hipoteses
O calculo do p-value depende obviamente do aspecto da regiao de
rejeicao de H
0
(para valores da estatstica de teste):
W Teste p-value
(, c) unilateral inferior P(T < t|H
0
)
(c, +) unilateral superior P(T > t|H
0
)
(, c) (c, +)
bilateral
T com dist. simetrica
em relacao `a origem
P(T < |t| ou T > |t||H
0
)
Exemplo
No exemplo anterior, como o teste e bilateral e a distribui cao de T e de t-student (e
portanto simetrica em relacao `a origem) e t = 2.821:
p-value= P(T < 2.821 ou T > 2.821|
0
) = P(T < 2.821|
0
) + P(T >
2.821|
0
) = 0.018.
(No scilab: cdft(PQ,-2.821,10)+1-cdft(PQ,2.821,10))
Como
0
= 0.05 > 0.018, decidimos rejeitar H
0
.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Testes de hipoteses sobre a igualdade de medias, variancias
desconhecidas
Vamos mais uma vez distinguir o csao em que as amostras provem de populacoes
normais (caso 1) do caso em que provem de popula coes com distribuicao arbitraria e
em que as dimens oes amostrais sao sucientemente grandes (caso 2). No ambito
desta disciplina, caso pretendamos confrontar os valores esperados de duas populacoes
normais independentes com variancias desconhecidas, e estejamos a lidar com
amostras de dimensoes que nao sao sucientemente grandes (para justicar o recurso
a um resultado assimptotico), teremos que assumir que as variancias sao iguais.
Exemplo
Caso 1. Foram efectuados estudos em Los Angeles e New York com o objectivo de
determinar a concentracao de mon oxido de carbono (CO) perto das vias rapidas. Para
tal, foram recolhidas amostras de ar, para as quais se determinaram as respectivas
concentacoes de CO. Os resultados (em ppm) forma, no perodo de uma semana:
Los Angeles: x
1
= (112.2, 118.4, 114.1)
New York: x
2
= (101.1, 102.2, 100.4, 98.6, 88.2)
Testemos a hipotese de que a media de concentra cao de CO em Los Angeles e
superior ou igual `a de New York.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Exemplo (cont.)
V.a. de interesse:
X
1
=concentracao de CO em Los Angeles
X
2
=concentracao de CO em New York
X
1
normal(
1
,
2
1
), X
2
normal(
2
,
2
2
)
(
1

2
) e
1
=
2
= desconhecidos
Hipoteses: H
0
:
1

2

0
= 0 vs. H
1
:
1

2
<
0
= 0
Estatstica de teste: T =
(X
1
X
2
)
0

(n
1
1)S
2
1
+(n
2
1)S
2
2
n
1
+n
2
2

1
n
1
+
1
n
2

t
n
1
+n
2
2
Decisao: t =
(114.998.1)0

(31)10.09+(51)32.34
3+52
(
1
3
+
1
5
)
= 3.237
Como o p-value e, neste caso, dado por
p-value= P(T < T|
1

2
=
0
) = F
(3+52
(3.237) = 99.11 (no scilab
cdft(PQ,3.237,3+5-2)) que e um valor muito alto e portanto nao devemos
rejeitar H
0
a qualquer nvel de signicancia
0
99.11%.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Exemplo
Caso 2.
Para comparar a resistencia de dois tipos de utenslios hospitalares, foram instalados
no mesmo hospital 81 do 1
o
tipo e 121 do 2
o
tipo, tendo-se medido o seu desgaste
numa escala conveniente. Para os utenslios do 1
o
tipo, obteve-se x
1
= 290 e s
1
= 12;
para os do 2
o
tipo, os resultados foram x
2
= 321 e s
2
= 14. O fabricante dos utenslios
do 1
o
tipo arma que o desgaste dos seus aparelhos e inferior ao dos aparelhos do 2
o
tipo. Testemos a consistencia desta arma cao de acordo com os dados obtidos.
V.a. de interesse:
X
1
=desgate dos utenslios do 1
o
tipo
X
2
=desgate dos utenslios do 2
o
tipo
X
i
com distribuicoes arbitrarias (possivelmente normais), i = 1, 2
E(X
i
) =
i
, V(X
i
) =
i
(
1

2
) desconhecidos

1
e
2
desconhecidos nao necessariamente iguais
n
1
= 81 > 30, n
2
= 121 > 30 sucientemente grandes
Hipoteses: H
0
:
1

2
=
0
= 0 vs. H
1
:
1

2
<
0
= 0
Nvel de signicancia:
0
= 1% (por exemplo)
Estatstica de teste: T =
(X
1
X
2
)
0

S
2
1
n
1
+
S
2
2
n
2
normal(0, 1) (aproximadamente)
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Exemplo (cont.)
Regiao de rejei cao de H
0
: Uma vez que se trata de um teste unilateral inferior,
a regiao de rejeicao de H
0
e da forma W = (, c), onde
c =
1
(
0
) = 2.326.
Decisao: O valor observado da estatstica de teste e
t =
(290 321) 0
_
12
2
81
+
14
2
121
= 16.2
Como t W, devemos rejeitar H
0
ao n.s. de 1%, i.e., concluir que a este n.s. a
armacao do fabricante e consistente com os dados.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Testes de hipoteses para a variancia de uma populacao
normal
Exemplo
Sabendo que o peso (em gramas) de uma certa especie de mamfero possui
distribuicao normal, averiguemos a hipotese de a variancia ser igual a 50gr
2
, ou se e
superior a este valor, `a luz da amostra
(1018, 982, 1015, 1007, 978)
ao n.s. de 5%.
V.a. de interesse: X =peso (em gramas) de uma certa especie de mamferos.
X normal(,
2
)
e desconhecidos
Hipoteses: H
0
:
2
=
2
0
= 50 vs. H
1
:
2
>
2
0
Nvel de signicancia:
0
= 5%
Estatstica de teste: T =
(n1)S
2

2
0

2
(n1)
(seria
2
(n)
caso fosse conhecido)
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Exemplo (cont.)
Regiao de rejei cao de H
0
: Tratando-se de um teste unilateral superior, a regiao
de rejeicao de H
0
sera um intervalo do tipo W = (c, +), onde c : P(Rejeitar
H
0
|H
0
verdadeira)=
0
, ou seja
c = F
1

2
(n1)
(1
0
) = F
1

2
(51)
(1 0.05) = 9.488 (cdfchi (X, 4, 0.95, 0.05))
Decisao: O valor observado da estatstica e
t =
(5 1) 351.5
50

2
(n1)
= 28.12
e como t W, devemos rejeitar H
0
ao n.s. de 5%.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Testes de hipoteses para uma proporcao
Exemplo
Suponhanhos que se recolheu uma a.a. de dimensao 500, dos nascimentos ocorridos
numa certa populacao, vericou-se que 275 eram rapazes. Sera que nessa populacao a
proporcao de nascimentos de rapazes e signicativamente diferente da propor cao de
raparigas?
V.a. de interesse X =
_
1, o recem-nascido e rapaz
0, o recem-nascido e rapariga
X Bernoulli(p), p desconhecido
n = 500 > 30 sucientemente grande
Hipoteses: H
0
= p
0
= 0.50 vs. H
1
= p
0
= 0.50
Estatstica de teste: T =
Xp
0

p
0
(1p
0
)
n
normal(0, 1) (distribuicao aproximada)
p-value: O valor observado da estatstica de teste e t =
0.550.50

0.5(10.5)
500
= 2.24. O
p-value e
P(T < 2.24 ou T > 2.24|H
0
) = 2 [1 (2.24)] = 0.025 = 2.5%
Decisao: Nao se deve rejeitar H
0
a qualquer n.s.
0
0.025 e deve rejeitar-se a
qualquer n.s superior a 2.5%
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Teste de ajustamento do qui-quadrado
Este teste permite vericar a adequa cao de
uma distribuicao com todos os parametros conhecidos
(hipotese simples)
uma distribuicao com pelo menos um parametro desconhecido
(hipotese composta)
Para ser usado e necessario que
haja um grande n
o
de observacoes (uma vez que se baseia
num resultado assimptotico)
os dados estejam agrupados em classes e disponhamos de
uma tabela de frequencias
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Ajustamento a uma distribuicao discreta, hipotese simples
Exemplo
Um dado e lancado 1000 vezes, tendo conduzido `a seguinte tabela de frequencias
Resultado Freq. Obs.
1 174
2 174
3 154
4 179
5 154
6 165
A questao que se coloca e, naturalmente, sera este dado perfeito/equilibrado?
Vamos responder a esta questao considerando para o efeito um n.s. de, por exemplo,
5%.
V.a. de interesse: X =resultado do lancamento do dado
Hipoteses:
H
0
: X uniforme({1, 2, 3, 4, 5, 6}) vs. H
1
: X uniforme({1, 2, 3, 4, 5, 6})
ou ainda, ao considerarmos p
i
= P(X = X
i
), i = 1, . . . , 6,
H
0
: p
i
= p
0
i
=
1
6
, i = 1, . . . , 6 vs. H
1
: i : p
i
= p
0
i
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Exemplo (cont.)
Nvel de signicancia:
0
= 5%
Estatstica de teste: T =

k
i =1
(O
i
E
i
)
2
E
i

2
(k1)
(aproximadamente)
onde
k = n
o
de classes em que estao organizados os dados
O
i
= frequencia absoluta observada na classe i
E
i
= n p
0
i
frequencia absoluta esperada, sob H
0
, da classe i
=n
o
de parametros a estimar (neste caso note que = 0 uma vez que
temos uma hipotese simples)
Regiao de rejei cao de H
0
: Quanto maior for a discrepancia entre a frequencia
absoluta observada na classe i e a frequencia esperada sob H
0
, menos
consistente e a hipotese H
0
. Logo a rejei cao de rejeicao de H
0
e um intervalo `a
direita W = (c, +), onde
c = F
1

2
(k1)
(1
0
)
Neste caso c = F
1

2
(601)
(1 0.05) = 11.07
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Exemplo (cont.)
Decisao: o valor observado da estatstica de teste e
t =
6

i =1
(o
i
E
i
)
2
E
i
=
(174 1000
1
6
)
2
1000
1
6
+
(174 1000
1
6
)
2
1000
1
6
+
(154 1000
1
6
)
2
1000
1
6
+
(179 1000
1
6
)
2
1000
1
6
+
(154 1000
1
6
)
2
1000
1
6
+
(165 1000
1
6
)
2
1000
1
6
= 3.499 / W
Logo nao devemos rejeitar a hipotese de estarmos a lidar com um dado perfeito
ao n.s. de 5%.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Ajustamento a uma distribuicao discreta, hipotese
composta
Exemplo
Pretende-se saber a distribui cao de probabilidade do n
o
de falhas de um dado aparelho
uasado em unidades de rastreio. Com esse objectivo, foram recolhidos dados relativos
a 500 intervencoes de rastreio de doencas cardio-vasculares (missoes), tendo-se obtido
os seguintes resultados
N
o
de avarias 0 1 2 3 4
N
o
de missoes (com tal n
o
de falhas) 185 180 95 30 10
Testemos, ao n.s. de 5%, a hipotese de os dados seguirem uma distribuicao de
Poisson.
V.a. de interesse: X =n
o
de falhas do aparelho
Hipoteses: H
0
: X Poisson() vs. H
1
: X Poisson()
Nvel de signicancia:
0
= 0.05
Estatstica de teste: T =

k
i =1
(O
i
E
i
)
2
E
i

2
(k1)
(aproximadamente)
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Exemplo (cont.)
Estima cao de :

E necessaria pois as estatsticas de teste nao podem conter
nenhum valor desconhecido.
A estimativa de MV de e dada por

=
0 185 + 1 180 + 2 95 + 3 30 + 4 10
500
= 1
Regiao de rejei cao de H
0
: W = (c, +), onde
c = F
1

2
(k1)
(1
0
)
Neste caso c = F
1

2
(511)
(1 0.05) = 7.815
Decisao: Como e desconhecido, o mesmo acontece a p
0
i
e com a frequencia
absoluta esperada, sob H
0
, da classe i : n p
0
i
. Temos assim
Classe i Freq. absol. da classe i , o
i
{0} 185
{1} 180
{2} 95
{3} 30
{4, 5, . . .} 10
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Exemplo (cont.)
Ora
n p
0
i
= n
_
e

i 1
(i 1)!
, i = 1, 2, 3, 4
1 (p
0
1
+ p
0
2
+ p
0
3
+ p
0
4
), i = 5
Mas uma vez que

= 1, as estimativas das frequencias absolutas esperadas sob H
0
sao dadas por
n p
0
i
= n
_
e
1
(i 1)!
, i = 1, 2, 3, 4
1 (p
0
1
+ p
0
2
+ p
0
3
+ p
0
4
), i = 5
Assim sendo, o valor observado da estatstica de teste e
t = 0.2321 / W
concluindo-se que ao n.s. de 5%, e razoavel armar que os dados provem de uma
distribuicao de Poisson.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Agrupamento de classes
Embora hajam autores que defendam que se registarmos, para
algum i , E
i
< 5, devemos agrupar esta classe `a classe adjacente
com menor frequencia absoluta esperada sob H
0
, outros autores
armam que nao ha a necessidade de qualquer agrupamento de
classes se
em pelo menos 80% das classes se vericar E
i
5 e
nas restantes classes E
i
1.
Sera este o criterio que vamos utilizar no ambito desta disciplina.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Para v.a. contnuas, o procedimento de teste deve ser analogo, ou
seja, as observa coes devem estar organizadas em classes, i.e., em
intervalos disjuntos que cubram todo o contardomnio da v.a. de
interesse.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Teste de independencia do qui-quadrado em tabelas de
contingencia
Exemplo
Num estudo clnico seleccionaram-se aleatoriamente n = 1000 indivduos para
determinar se a presen ca de daltonismo estava ou nao relacionada com o genero,
tendo-se obtido os seguintes resultados:
Masculino Feminino
Daltonicos 39 6
Nao daltonicos 461 494
V.a. de interesse:
X =
_
1, indivduo daltonico
2, c.c
Y =
_
1, indivduo do genero masculino
2, c.c
p
ij
= P(X = i , Y = j ) desconhecido;
p
i
= P(X = i ) desconhecido;
p
j
= P(Y = j ) desconhecido;
para i = 1, . . . , r e j = 1, . . . , s (r = s = 2 neste caso.)
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Exemplo (cont.)
Hipoteses:
H
0
: p
ij
= p
i
p
j
vs. H
1
: (i , j ) : p
ij
= p
i
p
j
Nvel de signicancia:
0
= 10%
Estatstica de teste: T =

r
i =1

s
j =1

O
ij

O
i
O
j
n

2
O
i
O
j
n

2
(r 1)(s1)
onde, para i = 1, . . . , r e j = 1, . . . , s:
O
ij
=frequencia absoluta observada na celula (i , j ) da tabela de contingencia
O
i
=

s
j =1
O
ij
=frequencia absoluta observada na linha i da tabela
O
j
=

r
i =1
O
ij
=frequencia absoluta observada na coluna j da tabela
Regiao de rejei cao do H
0
: Quanto maior for a discrepancia entre as frequencias
das celulas da tabela e a estimativa da frequencia absoluta esperada dessa
mesma celula, sob a hipotese de independencia (dada por
o
i
o
j
n
), mais
inconsisrente sera H
0
com os dados. Assim, a regiao de rejeicao e um intervalo
`a direita: W = (c, +), onde
c = F
1

2
(r 1)(s1)
(1
0
)
Neste caso c = F
1

2
(21)(21)
(1 0.1) = 2.706.
Lusa Morgado Testes de hipoteses
Testes de hipoteses
Exemplo (cont.)
Decisao: O valor observado da estatstica de teste e igual a
t =
_
39
45500
1000
_
2
45500
1000
+
_
6
45500
1000
_
2
45500
1000
+
_
461
955500
1000
_
2
955500
1000
+
_
499
955500
1000
_
2
955500
1000
= 25.34 W
Concluimos assim, que a presenca de daltonismo parece depender do respectivo
genero a qualquer n.s. superior ou igual a 10%.
Lusa Morgado Testes de hipoteses