Você está na página 1de 18

Captulo 4

Testes de Hipoteses
Neste captulo discutimos um metodo inferencial designado por teste de hip oteses, o qual
constitui uma outra an alise do problema inferencial atacado no captulo anterior, na es-
tima cao parametrica.
Deni cao 1 Uma hip otese e uma armac ao sobre a distribuic ao e/ou os par ametros de
uma popula c ao.
Quando a forma da distribui cao ou, equivalentemente, a forma da fun cao densidade
de probabilidade, e conhecida e as arma coes dizem respeito ao par ametro, fala-se em
hip oteses parametricas. Caso contrario diz-se hip oteses n ao parametricas. O objectivo de
um teste de hip oteses e decidir, com base na informa cao contida numa amostra retirada
da popula cao em causa, qual de duas hip oteses complementares e verdadeira.
Deni cao 2 As duas hip oteses complementares de um problema de teste de hip oteses s ao
designadas por hip otese nula e hip otese alternativa, denotadas por H
0
e H
1
, respectiva-
mente.
No caso de uma hip otese parametrica, a forma geral das hip oteses e H
0
:
0
vs
H
1
:
1
0
, onde
0
. H
0
diz-se hip otese simples quando especica completamente
a f.d.p conjunta de (X
1
, X
2
, . . . , X
n
); diz-se hip otese composta no caso contrario. Existem
v arias hip oteses compostas. Hipoteses que armem que um par ametro univariado e grande
(e.g., H
0
:
0
) ou pequeno (e.g., H
0
:
0
) dizem-se hip oteses unilaterais; se
H
0
: =
0
entao a hip otese diz-se bilateral.
Exemplo 3 Se X
i
Poisson(), para i = 1, . . . , n, ent ao H
0
: = 143 e hip otese
simples, H
0
: 143 e hip otese composta. Se X
i
, i = 1, 2, . . . , n s ao tambem i.i.d. ent ao
H
0
: X
i
Poi(), IR
+
e tambem uma hip otese composta.
Note-se que inclusivamente a hip otese de independencia pode ser testada, sendo que esta
hip otese e composta (e mais vaga que a maior parte das hip oteses testadas).
Deni cao 4 Um teste de hip oteses e uma regra que especica:
43
CAP

ITULO 4. TESTES DE HIP

OTESES 44
(i) Para que valores amostrais a decis ao deve levar ` a aceitac ao de H
0
como verdadeira;
(ii) Para que valores H
0
e rejeitada e H
1
e aceite.
Numa linguagem comumente aceite pela comunidade estatstica, dir-se-`a n ao rejeitar H
0
em vez de aceitar H
0
, uma vez que a primeira expressao tem um caracter menos conclusivo
e denitivo que a segunda.
As hip oteses estatsticas sao avaliadas atraves de procedimentos que utilizam a in-
forma cao contida nos dados, qualicando a consistencia dos mesmos com a decisao sobre
a (nao) rejei cao da hip otese nula.
De seguida abordamos duas perspectivas de certa forma distintas de analisar um ensaio
de hip oteses. Em particular discutiremos os ensaios de signic ancia vs testes de hip oteses.
4.1 Ensaios de signicancia e Testes de hipoteses
Num ensaio de signicancia o problema e colocado da seguinte forma: considere-se a amos-
tra de vari aveis aleatorias (X
1
, X
2
, . . . , X
n
) (quaisquer; n ao necessariamente independente
e identicamente distribudas) cuja f.d.p. conjunta se admite pertencer ` a famlia F, e seja
H
0
a hip otese estatstica que envolve F. O objectivo de um ensaio de signicancia e avaliar
o suporte que uma observa cao (x
1
, x
2
, . . . , x
n
) de (X
1
, X
2
, . . . , X
n
) d a a H
0
.
Nos ensaios de signicancia puros existem caractersticas que os distinguem dos testes
de hip oteses, os quais focaremos nesta sec cao. Em particular num ensaio de signic ancia
n ao h a interven cao de hip oteses que n ao decorram da hip otese H
0
; n ao sao tidas em conta
quaisquer hip oteses alternativas. A teoria associada aos ensaios de signicancia assenta
na constru cao de Fisher, e basiea-se na inferencia indutiva.
De seguida recordamos alguma terminologia e nota cao referentes aos ensaios (e igual-
mente comum aos testes de hip oteses - ou ensaios de hip oteses) usada j a no decorrer de
cadeiras anteriores. Assim:
(a) A chave de um ensaio de signicancia e encontrar uma estatstica de teste T =
T(X
1
, X
2
, . . . , X
N
) (que na verdade e uma medida de afastamento, e que e uma
fun cao das observa coes), com as seguintes propriedades:
A distribui cao de T quando H
0
e verdadeira e (aproximadamente) conhecida.
Quanto maior for o valor de T, maior sera a evidencia para rejeitar H
0
, i.e.,
quanto maior for a medida de afastamento das observa coes em rela cao `a hip otese,
mais concludente e a impugna cao de H
0
. Da que T deva ser adequadamente
escolhida, traduzindo a tal medida de afastamento em rela cao ` a hipotese H
0
.
(b) Seja t
obs
= T(x
1
, x
2
, . . . , x
n
) o valor observado da estatstica de teste T para uma
dada amostra concreta (x
1
, x
2
, . . . , x
n
). Dene-se a seguinte probabilidade:
p
obs
= P(T t
obs
|H
0
)
CAP

ITULO 4. TESTES DE HIP

OTESES 45
O valor p
obs
(ou, como e h abito designar-se, o valor-p) mede a evidencia que os dados
fornecem para aceitar H
0
e tem a seguinte interpreta cao: quanto menor for o valor
de p
obs
, menor sera a consistencia da hip otese H
0
face aos dados observados.
Note-se que a conclusao de um ensaio de hip oteses n ao e necessariamente a rejei cao ou
a n ao-rejei cao de uma hip otese, embora muitas vezes se tome como decisao a rejei cao de
H
0
quando p
obs
e menor que determinado limiar (que n ao e universal, dependendo muitas
vezes do tipo de hip otese que esta em jogo).
Por vezes a partir do mesmo conjunto de dados efectuam-se v arios testes, cada um
dos quais correspondendo a uma medida de afastamento (ou a uma estatstica de teste).
Nesse caso pode-se optar como nvel de signicancia associado ` a combina cao dos ensaios
o valor menos favor avel ` a hip otese, i.e.,
p
com
= mmin{p
1,obs
, p
2,obs
, . . . , p
m,obs
}
onde p
i,obs
representa o valor-p referente ` a utiliza cao do i-esimo ensaio de signicancia. Por
exemplo, se tanto valores elevados da estatstica de teste como valores baixos conduzirem
a um afastamento em rela cao ` a hip otese H
0
entao podemos tomar a estatstica de teste T
como dando igual (ou aproximadamente igual...) importancia a valores +t e t, pelo que
nesse caso dever-se-a optar como estatstica de teste |T|, donde em ambos os casos o nvel
de signicancia p
obs
passa a ser
p
obs
= P(|T| |t
obs
||H
0
)
No caso de valores elevados de T n ao terem o mesmo signicado que valores baixos, entao
n ao se deve dar igual importancia aos dois casos, sendo prefervel tomar como nvel de
signicancia o que resulta da combina cao dos dois testes. Assim tomando
p
1,obs
= P(T t
obs
|H
0
), p
2,obs
= P(T t
obs
|H
0
)
entao vem que o nvel de signicancia do teste combinado e
p
obs
= 2 min(p
1,obs
, p
1,obs
).
No caso dos testes de hip oteses (ou ensaios de hip oteses) existe um caracter essencialmente
decisional, dando lugar ` a decisao entre o aceitar e o rejeitar da hip otese nula H
0
. Assim
sendo num teste de hip oteses a hip otese alternativa H
1
desempenha um papel fundamental,
ao contrario do que se passa nos ensaios de signicancia.
Um ensaio de hip oteses e descrito da seguinte forma: seja (X
1
, X
2
, . . . , X
n
) uma amos-
tra (nao necessariamente i.i.d.) da popula cao em causa, com espa co amostral
X
, com
f.d.p. conjunta pertencente ` a famlia F. Seja ainda W
X
tal que
(X
1
, X
2
, . . . , X
n
) W rejei cao de H
0
(X
1
, X
2
, . . . , X
n
) / W n ao rejei cao de H
0
CAP

ITULO 4. TESTES DE HIP

OTESES 46
O subconjunto W designa-se por regi ao crtica ou regi ao de rejeic ao.
X
W = W
c
e a
regi ao de aceitac ao.
Uma vez que o ensaio de hip oteses leva a uma decisao sobre a rejei cao ou n ao, existe
a possibilidade de se tomar uma decisao errada. Ao proceder ao ensaio de H
0
podem
cometer-se dois tipos de erros: rejeitar H
0
, sendo porem H
0
verdadeira ou, pelo contrario,
n ao rejeitar H
1
, sendo H
0
falsa. No primeiro caso diz-se que se cometeu um erro de primeira
especie (erro tipo I) enquanto que no segundo caso se cometeu um erro de segunda especie
(erro tipo II). O aspecto fundamental reside na escolha de um procedimento que minimize
a probabilidade de ocorrencia de cada um destes tipos de erros.
Um dado procedimento ou ensaio e designado por , sendo W

a regiao crtica associ-


ada. A probabilidade de cometer um erro tipo I e dada por
= P{(X
1
, X
2
, . . . , X
n
) W

|H
0
} =
_
. . .
_
W

f
X
(x|
0
)dx
enquanto que a probabilidade de ocorrer um erro tipo II e dada por
1 = P{(X
1
, X
2
, . . . , X
n
) / W

|H
1
} = 1
_
. . .
_
W

f
X
(x|
1
)dx
Ao valor (probabilidade de cometer um erro de primeira especie) chama-se dimens ao do
teste (ou tamanho do teste) enquanto que (probabilidade de n ao cometer um erro de
segunda especie) chama-se potencia do teste.
Quando as hip oteses H
0
e H
1
sao hip oteses compostas do tipo H
0
:
0
vs H
1
:

1
, entao o calculo de e de depende do particular espa co parametrico
0
ou
1
,
respectivamente. Se H
0
for uma hip otese composta, por exemplo, entao a dimens ao do
teste e com
= sup

0
P{(X
1
, X
2
, . . . , X
n
) W

|}
Em vez de potencia, passa a falar-se func ao potencia, com

() = P{(X
1
, X
2
, . . . , X
n
) W

|},
Note-se que a fun cao potencia esta denida em todo o espa co parametrico, embora seja
particularmente interessante quando
1
.
Recomenda-se reler e estudar a materia referente a testes de hip oteses dada em PE1 e
PE2.
4.2 Propriedades dos testes
Como j a vimos na sec cao anterior, quando se toma uma decisao respeitante ` a validade de
uma hip otese podemos cometer erros. Nesta sec cao discutimos como esses erros podem
ser controlados.
CAP

ITULO 4. TESTES DE HIP

OTESES 47
4.2.1 Funcao potencia
Idealmente a fun cao potencia (), denida para todo o , tal como foi introduzida na
sec cao anterior, deveria ser zero para todo o
0
. Porem so em casos triviais e que se
regista esta situa cao. Qualitativamente, um bom teste deve ter fun cao potencia proxima
de zero para quase todo o
0
, e proxima de um para quase todo o
1
. Nessa
situa cao e facilmente discernvel qual a decisao a adoptar face ` a veracidade das hipoteses.
Exemplo 5 Seja X Bin(5, ), e considere-se o teste H
0
:
1
2
vs H
1
: >
1
2
. A
regra de decis ao face ` a validade das hip oteses e: rejeitar H
0
se e s o se s o se observarem 5
sucessos nas 5 observa c oes. Ent ao a func ao potencia do teste e

1
() = P(X = 5|) =
5
Suponhamos agora que damos outra regra de decis ao: rejeitar H
0
se X 3. Ent ao

2
() = P(X 3|) =
_
5
3
_

3
(1 )
2
+
_
5
4
_

4
(1 ) +
_
5
5
_

5
(1 )
0
Representando
1
e
2
em func ao de vem: Logo dado que
2
() >
1
() para
1
2
,
0.2 0.4 0.6 0.8 1
0.2
0.4
0.6
0.8
1
teste 2
teste 1
a probabilidade de erro tipo I e maior para o segundo teste, enquanto que a probabilidade
de erro tipo II e maior para o primeiro teste. Para decidir qual dos dois testes e melhor,
ter ao de ser feitas considera c oes sobre a estrutura de erro pretendida, i.e., ter a de ser
decidido se se priveligia os erros tipo I ou os erros tipo II.
Tipicamente a fun cao potencia depende da dimensao amostral n, uma vez que a dis-
tribui cao da estatstica de teste depende igualmente da dimensao amostral. Para uma
dimensao amostral xa, e virtualmente impossvel fazer ambas as probabilidades de erro
arbitrariamente pequenas. Geralmente d a-se primazia aos erros tipo I, pelo que neste
sentido os testes n ao sao simetricos, i.e, tende-se a minorar a probabilidade de erro tipo I.
Assim sendo a estrategia mais usual e xar um nvel para a probabilidade de erro tipo I
e, de entre todos os testes que obedecem a esta restri cao, escolher aquele que minimiza a
probabilidade de erro tipo II.
Doravante, nesta sec cao respeitante ` as propriedades dos testes, assumiremos que o
par ametro desconhecido sobre o qual e conduzido o teste de hip oteses e uniparametrico.
CAP

ITULO 4. TESTES DE HIP

OTESES 48
Eventualmente podera haver outro(s) par ametro(s) desconhecido(s) que nesta situa cao
sao designados por par ametros perturbadores. O caso de hip oteses multiparametricas sera
eventualmente tratado em trabalhos.
Deni cao 6 Para 0 1, um teste com func ao potencia () diz-se ser um teste
de tamanho se sup

0
() = . Um teste com nvel e um teste para o qual
sup

0
() .
Assim sendo o conjunto de testes de nvel contem o conjunto de testes de tamanho . A
distin cao entre estes dois conceitos nem sempre e clara. Mas e especialmente importante
quando n ao e possvel construir testes com tamanho , pelo que nessas situa c oes ha um
compromisso que leva a aceitar testes de nvel .
Em aplica coes e corrente considerar-se = 0.01, 0.05, 0.10. Quando se xa o valor de
, n ao estamos a controlar necessariamente a probabilidade de erro tipo II!
Quando se xa o nvel de signicancia , uma decisao tem de ser tomada, i.e., tem de
ser concluda ou a rejei cao ou a n ao rejei cao de H
0
. Claramente que quanto menor for
, a decisao de rejeitar H
0
e mais convincente (com obvias implica coes na probabilidade
de erro tipo II); mas se e elevado, a decisao de rejeitar H
0
n ao e muito convincente
pois o teste tem elevada probabilidade de estar a tomar uma decisao incorrecta. Uma
outra forma de concluir sobre a aceitabilidade da hip otese nula e atraves do valor-p, ja
discutido a proposito dos ensaios de signicancia. O valor-p para uma amostra particular
x e o menor valor de para o qual os resultados amostrais levam ` a rejei cao de H
0
. Note-
se que o valor-p depende intrinsecamente da amostra, pelo que nova an alise tem de ser
realizada na sua integralidade se nova amostra for recolhida. Alem disso um valor-p n ao
e um nvel de signicancia; em particular, e dado que depende das observa coes, nao tem a
interpreta cao como taxa de erro que o valor tem. Quando se analisa a veracidade de um
par de hip oteses atraves do valor-p, a conclusao sobre aceita cao de H
1
, quando tal ocorre,
e sempre mais convincente que a conclusao sobre a n ao rejei cao de H
0
, quando tal ocorre:
se p for pequeno, maior sera a evidencia da veracidade de H
1
.
Para alem do nvel de signicancia e do valor-p, existem outras caractersticas que
denem um teste. Por exemplo, seria desejavel que um teste rejeitasse H
0
com maior
evidencia quando o verdadeiro valor
c
0
do que quando
0
.
Deni cao 7 Um teste com func ao potencia () e centrado se (

) (

),

c
0
,


0
.
Exemplo 8 Seja X N(,
2
), com conhecido. Ao efectuar o teste H
0
:
0
vs
H
1
: >
0
, considera-se a estatstica de teste

X
0
/

n

H
0
N(0, 1)
e a regi ao crtica
W

= {

X
0
/

n
> c}
CAP

ITULO 4. TESTES DE HIP

OTESES 49
onde c e uma constante positiva. Para este teste a func ao potencia e dada por
() = P(Z > c +

0
/

n
|Z N(0, 1))
Como () e, para
0
xo, uma func ao crescente de , ent ao segue-se que
() > (
0
) = sup
t
0
(t), >
0
pelo que o teste e centrado.
4.2.2 Testes UMP
J a vimos que na elabora cao de testes de hip oteses considera-se frequentemente mais im-
portante minorar a probabilidade de erro tipo I que a de tipo II. Porem um bom teste sera
certamente um para o qual n ao so a probabilidade de erro tipo I e baixa mas tambem a de
tipo II, i.e., devera ter uma fun cao potencia elevada para
c
0
. Um teste com tamanho
para o qual a fun cao potencia tenha esta caracterstica e certamente um bom candidato
para melhor teste.
Deni cao 9 Seja C a classe de testes para o conjunto de hip oteses H
0
:
0
vs H
1
:

c
0
. Um teste pertencente a C, com func ao potencia () e um teste uniformemente
mais potente (UMP, de uniformly most powerful) se ()

() para todo o
c
0
e
para todo o

(.) (func ao potencia de algum teste pertencente ` a classe C).


Nesta deni cao C e a classe de todos os testes com nvel .
O problema dos testes UMP e que raramente existem em problemas reais; mas quando
existem, entao sao os melhores testes na classe em questao. O problema reside entao em
determinar em que condi coes existem testes UMP e como identica-los.
Antes de duduzir o resultado, tentaremos motiva-lo. Considere-se o teste H
0
: =
0
vs
H
1
: =
1
, e suponhamos que = {
0
,
1
}. A melhor regiao crtica (i.e., a regiao crtica
correspondente a um teste UMP) de tamanho deve certamente satisfazer as seguintes
condi coes:
P(X W

|
0
) =

xW

f
X
(x|
0
) =
P(X W

|
1
) =

xW

f
X
(x|
1
) = maxima
a primeira das quais estabelece a probabilidade de cometer erro tipo I e a segunda maximiza
a potencia (i.e., a probabilidade de n ao cometer erro tipo II).

E pois necessario identicar os pontos x que W

deve conter. Para isso cada ponto


do espa co e avaliado segundo dois criterios: contabiliza-se f
X
(X|
0
) (i.e. H
0
e verdadeira)
e f
X
(X|
1
) (i.e. H
0
e falsa). No seu conjunto os pontos includos em W

n ao devem ter
pontua cao superior a quando avaliados pelo primeiro criterio e devem ter pontua cao
CAP

ITULO 4. TESTES DE HIP

OTESES 50
maxima quando avaliados pelo segundo criterio. Assim a atribui cao de um ponto x a W

deve ser feita de acordo com a razao:


(x|
0
,
1
) =
f
X
(x|
0
)
f
X
(x|
1
)
atribuindo entao a W

tantos pontos x (por ordem decrescente da razao) tantos quantos


o permita a condi cao P(X W

|
0
) = ou, na impossibilidade de atingir a igualdade,
P(X W

|
0
) . Assim estaremos a procurar a melhor regiao crtica de tamanho n ao
superior a .
Exemplo 10 Uma urna contem bolas pretas e bolas brancas, na proporc ao de 3 : 1,
desconhecendo-se porem qual a cor dominante. Seja a probabilidade de tirar uma bola
preta da urna. A experiencia aleat oria consiste em retirar 3 bolas da urna, ao acaso
e com reposi c ao, registando o n umero de bolas pretas observadas. Seja ent ao X a v.a.
que indica o n umero de bolas pretas observadas na experiencia aleat oria. Segue-se que
X Binomial(3, ). Pretendemos testar H
0
: =
1
4
vs H
1
: =
3
4
. Ent ao
x 0 1 2 3
f
X
(x|
1
4
) 0.421875 0.421875 0.140625 0.015625
(x|
1
4
,
3
4
) =
1
4
x
3
4
3x
3
4
x
1
4
3x
0.0037 0.333 3 27
Suponhamos que = 0.2. Ent ao f
X
(2| =
1
4
) + f
X
(3| =
1
4
) = 0.15625, sendo a unica
combinac ao cuja soma de probabilidades d a menor ou igual a 0.2, segue-se que W

=
{2, 3} = {x : (x|
1
4
,
3
4
) < c}, onde c e um valor qualquer entre 0.333 e 3.
O teorema que se segue descreve os testes UMP para um tamanho desde que tanto H
0
como H
1
sejam hip oteses simples.
Teorema 11 (Lema de Neyman-Pearson) Seja X uma amostra de uma popula c ao
com f.d.p. f
X
(.|), com {
0
,
1
}, c um n umero real positivo e W

um conjunto do
espa co amostral, tais que

n
i=1
f(x
i
|
1
)

n
i=1
f(x
i
|
0
)
c, (x
1
, . . . , x
n
) W

n
i=1
f(x
i
|
1
)

n
i=1
f(x
i
|
0
)
c, (x
1
, . . . , x
n
) W
c

P{(X
1
, . . . , X
n
) W

| =
0
) =
Ent ao W

e a melhor regi ao crtica de tamanho para ensaiar H


0
: =
0
vs H
1
: =
1
.
Demonstra cao: (Considera-se apenas o caso contnuo, sendo porem obvia a extensao ao
caso discreto).
Seja e

dois testes, ambos de nvel , e com fun cao potencia () e (

), respecti-
vamente para e para

. Suponhamos ainda que o teste tem regiao crtica W

para a
CAP

ITULO 4. TESTES DE HIP

OTESES 51
qual

n
i=1
f(x
i
|
1
)

n
i=1
f(x
i
|
0
)
c, (x
1
, . . . , x
n
) W

n
i=1
f(x
i
|
1
)

n
i=1
f(x
i
|
0
)
c, (x
1
, . . . , x
n
) W
c

tal como enunciado no teorema.


Seja agora
(x) =
_
_
_
1 x W

0 c.c.

(x) =
_
_
_
1 x W

0 c.c.
duas fun coes de teste (i.e., sao as indicatrizes da rejei cao correspondende aos testes e

). Dado que

[0, 1], entao


_
(x)

(x)
_
(f(x|
1
) cf(x|
0
)) 0, x
uma vez que = 1 se f(x|
1
) > cf(x|
0
) e = 0 caso contrario. Logo o seu integral
tambem deve ser n ao negativo, i.e.,
0
_
__
(x)

(x)
_
(f(x|
1
) cf(x|
0
))

dx
=
_
W

__
(x)

(x)
_
(f(x|
1
) cf(x|
0
))

dx
+
_
(W

)
__
(x)

(x)
_
(f(x|
1
) cf(x|
0
))

dx
+
_
W

W
c

__
(x)

(x)
_
(f(x|
1
) cf(x|
0
))

dx
+
_
W
c

__
(x)

(x)
_
(f(x|
1
) cf(x|
0
))

dx
=
_
W

W
c

[(f(x|
1
) cf(x|
0
))] dx
_
W
c

[(f(x|
1
) cf(x|
0
))] dx
= (
1
)

(
1
) c
_
(
0
)

(
0
)
_
Logo
0 (
1
)

(
1
) c
_
(
0
)

(
0
)
_
(
1
)

(
1
)
pelo que (
1
)

(
1
) pelo que tem mais potencia que

. Como

e um teste arbitrario
de nvel , e
1
e o unico ponto de
c
0
, entao e um teste UMP de nvel .
A constante c referida no teorema de Neyman-Pearson deve escolher-se de forma a que
a regiao crtica tenha tamanho ; porem em muitos casos n ao e necessario determinar esta
constante (o que aconteceu no exemplo anterior referente ao teste da propor cao de uma
Bernoulli), sendo por isso possvel determinar a regiao crtica sem necessitar de c. No caso
da popula cao ter distribui cao discreta pode n ao ser possvel encontrar uma regiao crtica
CAP

ITULO 4. TESTES DE HIP

OTESES 52
W

para a qual P{(X


1
, . . . , X
n
) W

| =
0
) = ; nesse caso esta condi cao e substituda
por
P{(X
1
, . . . , X
n
) W

| =
0
)
Teorema 12 Se T = T(X
1
, . . . , X
n
) e uma estatstica suciente para , a regi ao crtica
W

UMP dada pelo lema de Neyman-Pearson pode exprimir-se em func ao de T.


Demonstra cao: O resultado decorre do lema de Neyman-Pearson, usando o criterio da
factoriza cao para estatsticas sucientes.
Exemplo 13 Seja X N(,
2
), com conhecido. Pretende-se testar
H
0
: =
0
versus H
1
: =
1
com
1
>
0
, a partir de uma amostra x de dimens ao n. A f.d.p. conjunta de x e dada
por
f
X
(x|
j
) =
_
1

2
_
n
e

n
i=1
(x
i

j
)
2
2
2
, j = 0, 1
pelo que a raz ao das f.d.p. e dada por
(x|
0
,
1
) = e

n
i=1
(x
i

1
)
2

n
i=1
(x
i

0
)
2
2
2
c
se e s o se

n
i=1
(x
i

1
)
2

n
i=1
(x
i

0
)
2
2
2
ln c
n

i=1
(x
i

1
)
2

i=1
(x
i

0
)
2
2
2
ln c
n

i=1
x
2
i
+n
2
1
2
1
n

i=1
x
i

i=1
x
2
i
n
2
0
2
0
n

i=1
x
i
2
2
ln c
n

i=1
x
i

2
2
ln c + (n/2)(
2
1

2
0
)

1

0
= c

pelo que a regi ao crtica vem em func ao de

n
i=1
X
i
ou, equivalementemente, em fun c ao
de

X. Seja c

=
c

n
. Ent ao c

pode ser calculada a partir de


P(

X c

| =
0
) =
donde
c

=
0
+

1
(1 )
Note-se que no exemplo anterior n ao foi preciso determinar c, uma vez que se consegue
determinar a regiao crtica ` a custa da estatstica suciente

X. Note-se ainda que a regiao
crtica W

e independente de
1
, desde que este seja maior que
0
. Logo o lema de Neyman-
Pearson serve n ao so para determinar o teste UMP para o par de hip oteses H
0
: =
0
vs
CAP

ITULO 4. TESTES DE HIP

OTESES 53
H
1
: =
1
mas tambem para determinar o teste UMP para H
0
: =
0
vs H
1
: >
0
,
passando assim a ser um teste de hip otese simples contra hip otese composta unilateral.
Mas a conclusao anterior pode ainda ser estendida. Note-se que
P(

X c

| =

) < P(

X c

| =
0
) = ,

<
0
em virtude das propriedades da f.d.p. Normal. Entao conclumos que e possvel determinar
um teste UMP para o conjunto de hip oteses
H
0
:
0
vs H
1
: >
0
sendo a regiao crtica igual ` a do teste H
0
: =
0
vs H
1
: =
1
(>
0
).
O mesmo raciocnio se aplica ao teste H
0
: =
0
vs H
1
: =
1
(com
0
>
1
), mas
sendo que a regiao de rejei cao e agora da forma
W

= {

X < a}
com
a =
1
+

1
()
resultado este extensvel aos testes H
0
: =
0
vs H
1
: <
0
e H
0
:
0
vs H
1
: <
0
.
Porem se se pretender ensaiar H
0
: =
0
vs H
1
: =
0
entao n ao existe teste UMP,
uma vez que se <
0
a regiao de rejei cao e a aba esquerda da v.a.

X enquanto que se
>
0
e a aba direita, como acab amos de ver.
Uma grande classe de problemas que admitem testes UMP de tamanho envolvem
testes de hip oteses unilaterais e f.d.p. com fun cao de verosimilhan ca monotona.
Deni cao 14 Uma famlia de f.d.p. G = {g(.|), } para uma v.a. T unidimensional
com par ametro real diz-se ter raz ao de verosimilhanca mon otona (MLR, de monotone
likelihood ratio) de para qualquer
2
>
1
, a raz ao
g(t|
2
)
g(t|
1
)
e uma func ao mon otona em t
para todo o t pertencente ao suporte da f.d.p. g.
As f.d.p. que pertencem ` a famlia exponencial sao MLR, por exemplo, pelo que esta
propriedade verica-se nas distribui coes mais vulgares.
J a vimos pois que embora o teorema de Neyman-Pearson seja aplicavel, tal como
e enunciado, a testes de hip oteses simples vs simples, com alguns argumentos podemos
provar que exustem regioes UMP para testes n ao necessariamente nestas condi coes, como
o exemplo anterior demonstra. Na verdade
Corolario 15 Para testar H
0
:
0
vs H
1
:
c
0
admita que existe um teste
de nvel baseado numa estatstica suciente T, com regi ao de rejeic ao W

, para o qual
existe um
0

0
tal que
P(T W

| =
0
) =
CAP

ITULO 4. TESTES DE HIP

OTESES 54
Seja ainda g(.|) a f.d.p. de T. Se existir c 0 tal que
g(t|

) >kg(t|
0
), t W

g(t|

) <kg(t|
0
), t W
c

para qualquer


c
0
, ent ao e um teste UMP de tamanho .
Note-se que um teste pode ter tamanho sem que exista pelo menos um
0

0
para
o qual P(T W

| =
0
) = , pelo que no teorema anterior as condi coes exigidas sao
consideravelmente fortes.
Se a famlia de f.d.p. for MLR, entao o resultado anterior pode ser enunciado da
seguinte forma:
Corolario 16 (teorema de Karlin-Rubin) Considere-se o par de hip oteses H
0
:
0
vs H
1
: >
0
. Seja T uma estatstica suciente para a famlia em causa, e suponhamos
que a famlia de f.d.p. de T, G = {g
T
(.|), } e MLR. Ent ao para qualquer t
0
o teste
que rejeita H
0
se e s o se T > t
0
e um teste UMP de tamanho , onde = P(T > t
0
|
0
).
Claramente que o corolario anterior tambem pode ser enunciado se em vez do par de
hip oteses apontado tivermos H
0
:
0
vs H
1
: <
0
. Nesse caso o teste que rejeita H
0
sempre que T < t
0
(para qualquer t
0
) e um teste UMP de tamanho , com = P(T <
t
0
|
0
).
4.2.3 Testes UMPU
Um teste UMP e na pratica muito difcil de obter. Assim xado um nvel de signicancia
, a classe de testes de nvel e tao extensa que muitas vezes n ao h a nenhum teste que
domine, em termos de fun cao potencia, todos os restantes testes da mesma classe. Nessa
situa cao uma estrategia possvel e restringir a classe de testes, considerando uma subclasse
e procurando a um teste UMP. Vejamos de seguida um exemplo em que n ao existe teste
UMP.
Exemplo 17 Sejam X
1
, . . . , X
n
n v.a. i.i.d., com distribuic ao N(,
2
), sendo conhe-
cido. Considere-se o conjunto de hip oteses H
0
: =
0
vs H
1
: =
0
. Para um dado
valor , um teste de nvel e tal que satisfaz
P( rejeitar H
0
| =
0
)
Note-se que a hip otese alternativa e bilateral. Suponhamos que consideramos primeiro
um ponto
1
<
0
. Ent ao e possvel deduzir, com a ajuda do lema de Neyman-Pearson,
que o teste a que corresponde a regi ao W
1
= {

X <
1
(1 /2)/

n +
0
} tem a
potencia m axima em
1
. Logo trata-se de um teste UMP e que, a menos de um regi ao de
probabilidade nula, dene a unica regi ao UMP.
CAP

ITULO 4. TESTES DE HIP

OTESES 55
Suponhamos agora que consideramos um outro teste para o qual a regi ao de rejei c ao
e {

X >
1
(1 /2)/

n +
0
, o qual e igualmente um teste com nvel . Seja
i
(.) a
fun c ao potencia para o i-esimo (i = 1, 2) teste. Para qualquer
2
>
0
:

2
(
2
) = P(

X >
1
(1 /2)/

n +
0
| =
2
)
= P(

X
2
/

n
>
1
(1 /2) +

0

2
/

n
| =
2
)
> P(Z >
1
(1 /2)|Z N(0, 1)) pois
0

2
< 0
= P(Z
1
(1 /2))
> P(

X
2
/

n
<
1
(1 /2) +

0

2
/

n
| =
2
)
= P(

X <
1
(1 /2)/

n +
0
| =
2
)
=
1
(
2
)
i.e., o segundo teste tem potencia superior ` a do teste 1 pelo menos para um dos pontos

c
0
; logo o teste 1 n ao e UMP, pelo que n ao existe nenhum teste UMP de nvel para
este problema.
Na verdade quando se testam hip oteses compostas bilaterais do tipo H
0
: =
0
vs
H
1
: =
0
ou H
0
: (
1
,
2
) vs H
1
: <
1
ou >
2
(com
2
>
1
), impor
restri coes ` a famlia de distribui coes n ao permite estabelecer a existencia, em termos gerais,
de testes UMP, sendo particularmente importante neste caso restringir a classe de testes
de determinado nvel.
J a vimos anteriormente a no cao de teste centrado (ou n ao enviesado). Recordemos que
num teste centrado () (

),
0
,


c
0
. A interpreta cao de um teste centrado
e a seguinte: se T e um teste de tamanho n ao enviesado, a probabilidade de rejeitar
H
0
quando falsa nunca e inferior ` a probabilidade de rejeitar H
0
quando verdadeira. Um
teste que seja uniformemente mais potente de entre os testes centrados diz-se ser um teste
uniformemente mais potente centrado (UMPU, de uniformly most powerful unbiased).
O teorema que se segue e uma generaliza cao do lema de Neyman-Pearson, podendo
ser aplicado a fun coes arbitrarias (e n ao somente fun coes densidade de probabilidade).
Teorema 18 Sejam c
1
, c
2
, . . . , c
m
constantes e f
1
(x), f
2
(x), . . . , f
m+1
(x) fun c oes reais.
Seja ainda C a classe de func oes (.) para as quais 0 (x) 1 para todo o x e
_
(x)f
i
(x)dx = c
i
, i = 1, 2, . . . , m
Se

(.) e uma fun c ao de C para a qual


(x) =
_
_
_
1 f
m+1
(x) >

m
i=1
k
i
f
i
(x)
0 f
m+1
(x) <

m
i=1
k
i
f
i
(x)
para algumas constantes k
1
, . . . , k
m
ent ao

maximiza
_
(x)f
m+1
(x)dx de entre todas as
fun c oes de C.
CAP

ITULO 4. TESTES DE HIP

OTESES 56
Note-se que se m = 1, f
1
(.) = f(.| =
0
) e f
2
(.) = f(.| =
1
) entao o teorema anterior
corresponde ao lema de Neyman-Pearson.
As fun coes deste teorema no caso das fun coes f
i
serem f.d.p. correspondem a fun c oes
de teste aleat orias, com a seguinte interpreta cao: suponhamos que temos um teste que
leva ` a rejei cao ou ` a n ao-rejei cao de uma hip otese H
0
. Se a decisao do teste for n ao rejeitar
H
0
, entao e efectuada uma experiencia de Bernoulli, independente da decisao do teste,
sendo p a probabilidade de se observar um sucesso. Se o sucesso for observado, entao
a decisao nal e rejeitar H
0
; caso contrario n ao se rejeita H
0
. Assim sendo este teste
depende n ao so do teste original como tambem do resultado de uma experiencia de Ber-
noulli independente. Reportando-nos ao teorema anterior, (x) designa a probabilidade
de rejeitar H
0
quando a amostra observada e x.
Vejamos como aplicar este resultado na determina cao de testes UMPU. Seja X uma
popula cao com f.d.p. f
X
(.|), onde e um par ametro desconhecido. Considere-se o
conjunto de hip oteses H
0
: =
0
vs H
1
: =
0
. Por argumentos similares ao teorema
de Karlin-Rubin, o teste UMPU devera pertencer ` a classe de testes cuja regiao crtica
depende de uma estatstica suciente T, com f.d.p. f
T
(.). Seja
1
=
0
, x uma amostra
de X e t = T(x) o valor observado da estatstica de teste. Tome-se:
f
3
(x) = f
T
(t| =
1
), f
2
(x) =

f
T
(t|)

=
0
, f
1
(x) = f
T
(t| =
0
)
Entao o teste

, com

(x) =
_
_
_
1 f
T
(t| =
1
) > k
1
f
T
(t| =
0
) +k
2

f
T
(t|)

=
0
0 c.c.
para algumas constantes k
1
, k
2
e um teste UMPU.
Na verdade a regiao crtica W

= {t
T
: t a ou t b}, onde a e b sao tais que
P(T a T b| =
0
=
E [T.I
W

(T)| =
0
] = E [T| =
0
]
onde I
W

(T) designa a fun cao indicatriz da regiao crtica no domnio de T e UMPU.


Exemplo 19 Seja X uma amostra proveniente de uma popula c ao N(0,
2
), para a qual
se pretende testar H
0
: =
0
vs H
1
: =
0
, usando para tal uma regi ao crtica da forma
W = {t : t a t b}.
Para esta famlia uma estatstica suciente e T(X) =

n
i=1
X
2
i
, sendo que a sua
distribuic ao quando H
0
e verdadeira dada por
T

2
0

2
n
. Ent ao os valores a e b s ao
CAP

ITULO 4. TESTES DE HIP

OTESES 57
calculados atraves de
P(
n

i=1
X
2
i
a
n

i=1
X
2
i
b| =
0
) = P(

n
i=1
X
2
i

2
0

2
0

n
i=1
X
2
i

2
0

2
0
| =
0
)
= 1
_
b/
2
0
a/
2
0
f

2
n
(s)ds
=
E[T.I
W

(T)| =
0
] =
2
0
E
_
n
i=1
X
2
i

2
0
.I
W

(T)| =
0
_
=
2
0
E
_
n
i=1
X
2
i

2
0
| =
0
_

2
2
_
b/
2
0
a/
2
0
tf

2
n
(s)ds
= n
2
0

2
0
_
b/
2
0
a/
2
0
tf

2
n
(s)ds
Decorre de propriedades da distribuic ao do qui-quadrado que
sf

2
n
(s) = nf

2
n+2
(s)
pelo que
_
b/
2
0
a/
2
0
tf

2
n
(s)ds =
_
b/
2
0
a/
2
0
f

2
n+2
(s)ds = 1
Logo os valores a e b s ao obtidos ` a custa da soluc ao das equac oes
_
b/
2
0
a/
2
0
f

2
n
(s)ds = 1
E[T.I
W

(T)| =
0
] = (n 1 )
2
0
ou, equivalentemente,
_
b/
2
0
a/
2
0
f

2
n
(s)ds = 1
_
b/
2
0
a/
2
0
f

2
n+2
(s)ds = n(1 )
Exemplo 20 Consideramos a mesma situac ao que no exemplo anterior, sendo porem
que agora as hip oteses s ao H
0
:
2
1

2

2
2
vs H
1
: <
2
1
ou >
2
2
, para o qual se
considera uma regi ao crtica da forma {W : t a t b}. Ent ao as constantes a e b
correspondentes aos testes UMPU s ao determinadas a partir das equac oea:
_
b/
2
1
a/
2
1
f

2
n
(s)ds = 1
_
b/
2
2
a/
2
2
f

2
n
(s)ds = 1
CAP

ITULO 4. TESTES DE HIP

OTESES 58
4.3 Metodos de constru cao de testes
Nesta sec cao discutimos metodos de constru cao de testes, os quais permitem lidar com
diferentes situa coes.
4.3.1 Teste da razao de verosimilhancas
Trata-se do metodo mais geral, sendo quase sempre aplicavel. Esta relacionado com os
estimadores de maxima verosimilhan ca, tema explorado no captulo anterior. Tem ainda
a vantagem de resultar em testes a que correspondem regioes crticas intuitivas, embora
n ao conduza necessariamente a testes UMP ou UMPU. Podem ainda estar denidos no
caso multi-parametrico.
Seja X uma popula cao com f.d.p. f
X
(.|), onde e um par ametro desconhecido, e x =
(x
1
, . . . , x
n
) uma amostra proveniente de X. Recordemos que a fun cao de verosimilhan ca,
denida para todo o espa co parametrico , e dada por
L(|x) = f(x|) =
n

i=1
f
X
(x
i
|)
Deni cao 21 A raz ao de verosimilhancas para testar H
0
:
0
vs H
1
:
c
0
baseada
numa amostra x e dada por
(x) =
sup

0
L(|x)
sup

L(|x)
.
Um teste da raz ao de verosimilhancas e um teste cuja regi ao de rejeic ao W e dada por
{x : (x) c}, onde c [0, 1].
Note-se que por constru cao (x) (0, 1], uma vez que 0 < sup

0
L(|x) sup

L(|x).
Quanto maior for (x) mais plausvel e a hip otese H
0
; pelo contrario se esta pr oximo de
zero e depositada pouca conan ca na veracidade da hip otese nula.
Se T(X) for uma estatstica suciente para com f.d.p. g
T
(.|), entao pode ser acon-
selhavel construir o teste da razao de verosimilhan cas com base em T e na sua fun cao de
verosimilhan ca L

(|t) = g
T
(t|). A questao pertinente e saber se os testes construidos
com base na razao (x) e com base em

=
sup

0
L

(|T(x)=t)
sup

(|T(x)=t)
se sao equivalentes ou n ao.
De facto
Teorema 22 Se T(X) e uma estatstica suciente para e se

(T(x) = t) e (x) s ao as
raz oes de verosimilhan cas baseadas em T e em X, respectivamente, ent ao

(T(x) = (x)
para todo o x
X
, pelo que o teste baseado na raz ao de verosimilhancas de T e identico
ao teste baseado na raz ao de verosimilhancas de X.
CAP

ITULO 4. TESTES DE HIP

OTESES 59
Demonstra cao: Decorre do teorema de factoriza cao que f(x|) = g
T
(T(x)|)h(x). Logo
(x) =
sup

0
L(|x)
sup

L(|x)
=
sup

0
f(x|)
sup

f(x|)
=
sup

0
g
T
(T(x)|)h(x)
sup

g
T
(T(x)|)h(x)
=
sup

0
g
T
(T(x)|)
sup

g
T
(T(x)|)
=
sup

0
L

(|T(x))
sup

(|T(x))
=

(T(x))
Exemplo 23 Seja X N(,
2
), e X
1
, . . . , X
n
uma amostra aleat oria proveniente de X.
Suponhamos que H
0
:
0
vs H
1
: >
0
, sendo pois (desconhecido) uma par ametro
perturbador. A func ao de verosimilhanca e dada por
L(, |x) =
_
1

2
2
_
n
e

n
i=1
(x
i
)
2
2
2
Ent ao
(x) =
sup
{,
2
:<
0
,
2
>0}
L(, |x)
sup
{,
2
:IR,
2
>0}
L(, |x)
=
sup
{,
2
:<
0
,
2
>0}
L(, |x)
L(

, |x)
onde

e s ao os estimadores de m axima verosimilhanca de e , respectivamente. Se


0
ent ao o m aximo restrito e igual ao m aximo irrestrito; caso contr ario o m aximo
restrito e igual a L(
0
, |x), com
2
=

n
i=1
(x
i

0
)
2
n
. Note-se que
L(
0
, |x) =
_
1

2
2
_
n
e

n
i=1
(x
i

0
)
2
2
2
=
_
n
2

n
i=1
(x
i

0
)
2
_n
2
e

n
2
L(

, |x) =
_
1

2
2
_
n
e

n
i=1
(x
i

)
2
2
2
=
_
n
2

n
i=1
(x
i
x)
2
_n
2
e

n
2
Logo
(x) =
_
_
_
1


0
L(
0
, |x)
L(

, |x)
c.c.
=
_
_
_
1


0
_
n
i=1
(x
i
x)
2

n
i=1
(x
i

0
)
2
_
n/2
c.c.
CAP

ITULO 4. TESTES DE HIP

OTESES 60
Dado que
n

i=1
(x
i

0
)
2
=
n

i=1
(x
i
x)
2
+n( x
0
)
2
vem que no caso de

>
0
,
(X) =
_
_
1
1 +n
(

X
0
)
2

n
i=1
(X
i


X)
2
_
_
n/2
=
_
_
1
1 +
t
2
n1
n1
_
_
n/2
onde t
n1
designa uma v.a. com distribuic ao T-student com n 1 graus de liberdade.
Conclumos assim que a raz ao de verosimilhancas e, no caso de

>
0
, uma fun c ao
mon otona de t
n1
pelo que a regi ao crtica vem determinada em func ao de quantis de
probabilidade de uma T-Student, como estamos habituados a fazer.
Existem outros metodos de constru cao de testes, que serao oportunamente estudados, no
ambito de trabalhos fornecidos aos alunos.

Você também pode gostar