Você está na página 1de 30

Cap tulo 6 Testes de Hip oteses

6.1 Introdu c ao e nota c ao

Em geral, intervalos de conan ca s ao a forma mais informativa de apresentar os achados principais de um estudo. Contudo, algumas vezes existe um particular interesse em vericar determinadas arma c oes ou conjecturas. Por exemplo, podemos estar interessados em determinar se uma moeda e honesta, se certas quantidades s ao independentes, ou se popula c oes distintas s ao similares do ponto de vista probabil stico. Cada uma destas arma c oes constitui uma hip otese que pode ser associada a um modelo, i.e. pode ser parametrizada. O material deste cap tulo e fortemente baseado em DeGroot (1989), Migon and Gamerman (1999) e DeGroot and Schervish (2002). A teoria cl assica de testes de hip oteses e apresentada a um n vel mais formal em Lehman and Romano (2005). Chamamos de hip otese estat stica qualquer arma c ao que se fa ca sobre um par ametro populacional desconhecido. A id eia b asica e que a partir de uma amostra da popula c ao iremos estabelecer uma regra de decis ao segundo a qual rejeitaremos ou n ao a hip otese proposta. Esta regra de decis ao e chamada de teste. Normalmente existe uma hip otese que e mais importante para o pesquisador que ser a denotada por H0 e chamada hip otese nula. Qualquer outra hip otese diferente de H0 ser a chamada de hip otese alternativa e denotada por H1 . Exemplo 6.1 : (Teste Binomial) Um professor aplica um teste do tipo certoerrado com 10 quest oes. Queremos testar a hip otese de que o aluno est a advinhando. Nossa hip otese nula e que o aluno acerta as quest oes ao acaso e a hip otese alternativa e que ele tem algum conhecimento da mat eria. Denotando por p a probabilidade (desconhecida) do aluno acertar cada quest ao a hip otese estat stica de interesse pode ser formulada como H0 : p = 1/2. Neste caso, a hip otese alternativa mais adequada e H1 : p > 1/2 indicando que o aluno tem algum conhecimento 88

E NOTAC 6.1. INTRODUC AO AO

89

sobre o assunto. Temos ent ao 10 repeti c oes do experimento com p constante e vamos assumir tamb em que as quest oes s ao resolvidas de forma independente. Portanto a vari avel aleat oria X = n umero de acertos tem distribui c ao binomial com par ametros n = 10 e p desconhecido. Suponha que adotamos a seguinte regra de decis ao: o aluno n ao est a advinhando se acertar 8 ou mais quest oes. Isto equivale a

rejeitar H0 se X 8 (regi ao de rejei c ao ou regi ao cr tica) e aceitar H0 se X < 8 (regi ao de aceita c ao).

No entanto, e poss vel que um aluno acerte 8 ou mais quest oes e esteja advinhando, ou seja podemos rejeitar H0 quando ela e verdadeira. A probabilidade de que isto ocorra e
10

P (X 8 | p = 1/2) =
k=8

0.5k (1 0.5)10k 0.055.

Esta probabilidade e chamada n vel de signic ancia e ser a denotada por . Fica claro ent ao que o valor de depende da regra de decis ao, por exemplo se a regi ao cr tica fosse X 7 teriamos 0, 171. No pr oximo exemplo veremos como usar o n vel de signic ancia para construir uma regra de decis ao. Exemplo 6.2 : Um fornecedor garante que 90% de sua produ c ao n ao apresenta defeito. Para testar esta arma c ao selecionamos ao acaso 10 itens de um lote e contamos o n umero de defeituosos. Com base nesta amostra tomaremos uma bem intuitivo que devemos decidir decis ao: comprar ou n ao comprar o lote. E n ao comprar o lote se o n umero observado de n ao defeituosos for muito pequeno. O nosso problema e denir o qu ao pequeno. Seja a vari avel aleat oria X = n umero de n ao defeituosos na amostra de 10 itens. Temos ent ao uma distribui c ao binomial com par ametros n = 10 e p desconhecido, e queremos testar H0 : p = 0.9. Aqui p e a propor c ao de itens n ao defeituosos no lote e portanto a hip otese alternativa deve ser H1 : p < 0.9. Suponha que decidimos manter 0.025 e a partir deste valor vamos estabelecer a nossa regra de decis ao, ou seja obter o valor da constante c tal que H0 e rejeitada

90

CAP ITULO 6. TESTES DE HIPOTESES

(a)

0.00
0

0.15

10

(b)
0.4 0.0
0

0.2

10

Figura 6.1: Probabilidades binomiais e regi oes criticas para os Exemplos 6.1 e 6.2. se X c. Para isto vamos calcular para diferentes regi oes cr ticas,
5

P (X 5 | p = 0.9) =
k=0 6

0.9k (1 0.9)10k = 0.002 0.9k (1 0.9)10k = 0.013


k=0 7

P (X 6 | p = 0.9) = P (X 7 | p = 0.9) =
k=0

0.9k (1 0.9)10k = 0.07.

Portanto, devemos usar a regi ao cr tica X 6. Isto e, vamos rejeitar o lote se o n umero de itens defeituosos na amostra for maior ou igual a 4. Nestes dois exemplos os testes s ao chamados de unilaterais porque somente valores de um lado do espa co amostral foram utilizados para construir a regi ao cr tica. As regi oes cr ticas s ao mostradas nos gr acos da Figura 6.1. Podemos ter tamb em testes bilaterais aonde os dois extremos do espa co amostral s ao usados como regi ao cr tica. A vari avel aleat oria X e chamada estat stica de teste, sua distribui c ao deve ser conhecida e ela deve depender do par ametro que est a sendo testado. No caso geral ent ao temos uma amostra aleat oria X = (X1 , . . . , Xn ) tomada de uma distribui c ao que envolve um par ametro desconhecido, denido em um

E NOTAC 6.1. INTRODUC AO AO espa co param etrico . Assim, as hip oteses podem ser denidas como H0 : 0 H1 : 1

91

sendo que 0 e 1 s ao subconjuntos disjuntos de . Um teste e especicado particiondo-se o espa co amostral em dois subconjuntos. Um sobconjunto cont em os valores de X para os quais H0 ser a rejeitada e e chamado regi ao cr tica do teste, e o outro contem os valores de X para os quais H0 ser a aceita e e chamado regi ao de aceita c ao do teste. Em resumo, um teste ca determinado quando especicamos sua regi ao cr tica. Al em disso, uma hip otese pode ser classicada da seguinte maneira. Se o subconjunto i , i = 0 ou i = 1 cont em um u nico valor ent ao Hi e uma hip otese simples. Caso contr ario, se i cont em mais de um valor ent ao Hi e uma hip otese composta. Nos Exemplos 6.1 e 6.2 H0 e uma hip otese simples enquanto H1 e composta. Ou seja, se C e C denotam a regi ao de rejei c ao e aceita c ao respectivamente ent ao P (X C | 0 ) = e P (X C | 1 ) =

6.1.1

Tipos de Decis ao

Ao tomar uma decis ao a favor ou contra uma hip otese existem dois tipos de erros que podemos cometer. Podemos rejeitar a hip otese nula quando de fato ela e verdadeira (erro tipo I) ou podemos falhar em rejeitar H0 quando de fato ela e falsa (erro tipo II). Frequentemente denotamos as probabilidades destes dois tipos de erro como e respectivamente. Existe um balan co entre esses dois tipos de erros, no sentido de que ao tentar-se minimizar , aumenta-se . Isto e, n ao e poss vel minimizar estas duas probabilidades simultaneamente e na pr atica e costume xar um valor (pequeno) para . Na Tabela 6.1 est ao descritos as decis oes que podemos tomar e os tipos de erro associados. Tabela 6.1: Tipos de decis ao e tipos de erro associados a testes de hip oteses. Decis ao Verdade Aceitar H0 Rejeitar H0 H0 verdadeira Decis ao correta Erro Tipo I (probabilidade 1 ) (probabilidade ) H0 falsa Erro Tipo II Decis ao correta (probabilidade ) (probabilidade 1 )

92

CAP ITULO 6. TESTES DE HIPOTESES

6.1.2

A Fun c ao Poder

As caracter sticas probabil sticas de um teste podem ser descritas atrav es de uma fun c ao que associa a cada valor de a probabilidade () de rejeitar H0 . A fun c ao () e chamada fun c ao de poder (ou pot encia) do teste. Assim, denotando por C a regi ao cr tica a fun c ao de poder e denida como () = P (X C | ), .

A fun c ao de poder e a ferramenta utilizada para vericar a adequa c ao de um teste ou para comparar dois ou mais testes. E claro que uma fun c ao de poder ideal seria tal que () = 0 para satisfazendo H0 e () = 1 para satisfazendo H1 . Em um problema pr atico no entanto raramente existir a um teste com estas caracter sticas. Na Figura 6.2 abaixo est a representada a fun c ao poder para o Exemplo 6.2, i.e. P (X 6 | p), para 0 < p < 1 com X Binomial(10, p). Note que neste exemplo se p for maior do que digamos 0,8 ent ao o teste quase certamente aceitar a H0 , indicando que o teste e adequado. Por outro lado, para valores de p entre 0,7 e 0,8 o teste ainda rejeita H0 com probabilidade baixa.

(p) 0.0
0.0

0.2

0.4

0.6

0.8

1.0

0.2

0.4 p

0.6

0.8

1.0

Figura 6.2: Gr aco da fun c ao de poder para o Exemplo 6.2. O tamanho ou n vel de signic ancia de um teste e denido como sup ().
0

Assim como no caso de n veis de conan ca na Se c ao 5.1, a desigualdade acima e

E NOTAC 6.1. INTRODUC AO AO

93

essencialmente t ecnica j a que estaremos interessados em valores de t ao pequenos quanto poss vel. Na pr atica isto implicar a em usar uma igualdade e o tamanho do teste ent ao ser a a probabilidade m axima, para 0 , de tomar uma decis ao errada. A desigualdade ser a u til principalmente no caso de espa cos amostrais discretos. Exemplo 6.3 : Seja X1 , . . . , Xn uma amostra aleat oria da distribui c ao N (, 2 ) com 2 = 25 e suponha que queremos testar H0 : 17. Suponha que a regra de decis ao consiste em rejeitar H0 se somente se X > 17 + / n. Neste caso a fun c ao poder e dada por 17 + / n () = P (rejeitar H0 | ) = P (X > 17 + / n) = P Z > / n onde Z N (0, 1). Para n = 25 segue que, () = P (Z > 18 ) e calculando esta probabilidade para v arios valores de podemos construir o gr aco da Figura 6.3 para a fun c ao poder do teste. Note que o valor m aximo da fun c ao quando H0 e verdadeira ( 17) e obtido para = 17 e portanto o tamanho do teste e dado por 17 + / n sup P Z > = (17) = P (Z > 1) 0, 159. / n 17

Coment ario
Fica claro que os testes de hip oteses cl assicos dependem basicamente da probabilidade de X pertencer a uma determinada regi ao do espa co amostral. Isto signica que os testes dependem da probabilidade de dados que poderiam ter sido observados mas na realidade n ao foram. Portanto, estes testes violam o princ pio da verossimilhan ca.

6.1.3

Problemas

1. Suponha que X1 , . . . , Xn e uma amostra aleat oria da distribui c ao U (0, ), > 0 e queremos testar as hip oteses H0 : 2 H1 : < 2. Seja Yn = max(X1 , . . . , Xn ) e um teste que rejeita H0 se Yn 1. (a) Determine a fun c ao poder do teste. (b) Determine o tamanho do teste.

94

CAP ITULO 6. TESTES DE HIPOTESES

() 0.0
14

0.2

0.4

0.6

0.8

1.0

16

18

20

22

Figura 6.3: Gr aco da fun c ao de poder para o Exemplo 6.3. 2. Um aluno faz um teste de m ultipla escolha com 10 quest oes, cada uma com 5 alternativas (somente uma alternativa correta). O aluno acerta 4 poss quest oes. E vel deduzir (estatisticamente) que este aluno sabe alguma coisa da mat eria? 3. Suponha que a propor c ao p de itens defeituosos em uma popula c ao de itens e desconhecida e queremos testar as hip oteses H0 : p = 0, 2 H1 : p = 0, 2. Uma amostra aleat oria de 20 itens e tomada desta popula c ao e a regra de decis ao consiste em rejeitar H0 se o n umero amostral de defeituosos for menor ou igual a 1 ou maior ou igual a 7. (a) Fa ca um esbo co do gr aco da fun c ao poder para p = 0; 0, 1; 0, 2, . . . , 1 (b) Determine o tamanho do teste.

6.2

Testando Hip oteses Simples

mais u E til come car o estuda da teoria de testes de hip oteses considerando apenas hip oteses simples. Isto equivale a dizer que uma amostra aleat oria X1 , . . . , Xn foi tomada de uma dentre duas poss veis distribui c oes e queremos decidir de qual delas vem a amostra. Neste caso o espa co param etrico cont em apenas dois

6.2. TESTANDO HIPOTESES SIMPLES pontos, digamos 0 e 1 e queremos testar H0 : = 0 H1 : = 1 . Neste caso, as probabilidades dos dois tipo de erro s ao dadas por = P (rejeitar H0 | = 0 ) = P (aceitar H0 | = 1 )

95

e gostariamos de poder construir um teste para o qual estas probabilidades fossem as menores poss veis. Na pr atica e imposs vel encontrar um teste que minimize e simultaneamente mas pode-se construir testes que minimizam combina c oes lineares destas probabilidades. Assim, para constantes positivas a e b queremos encontrar um teste para o qual a( ) + b ( ) seja m nima. Teorema 6.1 (Teste Otimo) Seja X1 , . . . , Xn uma amostra aleat oria de uma distribui c ao com fun c ao de (densidade) de probabilidade p(x|) e dena pi = p(x|i ). Se um teste rejeita H0 quando p0 /p1 < k , aceita H0 quando p0 /p1 > k e nada decide se p0 /p1 = k , ent ao qualquer outro teste e tal que a( ) + b ( ) a( ) + b ( ).

A raz ao p0 /p1 e chamada raz ao de verossimilhan cas (RV). O teorema estabelece ent ao que um teste otimo, no sentido de minimizar a( ) + b ( ), rejeita H0 quando a raz ao de verossimilhan cas e pequena e aceita H0 quando esta raz ao e grande. Outro resultado vem do fato de que a hip otese H0 e o erro tipo I s ao em geral privilegiados em problemas pr aticos. Assim, e usual considerar testes tais que ( ) n ao seja maior do que um n vel especicado, digamos 0 , e tentar minimizar (). Lema 6.1 (Neyman-Pearson) Seja X1 , . . . , Xn uma amostra aleat oria de uma distribui c ao com fun c ao de (densidade) de probabilidade p(x|) e dena pi = p(x|i ). Se um teste rejeita H0 quando p0 /p1 < k , aceita H0 quando p0 /p1 > k e nada decide se p0 /p1 = k , ent ao para qualquer outro teste tal que ( ) ( ), ( ) ( ). E tamb em, ( ) < ( ) implica em ( ) > ( ). Exemplo 6.4 : Seja X1 , . . . , Xn uma amostra aleat oria da distribui c ao N (, 1) e queremos testar H0 : = 0 H1 : = 1. Neste caso a raz ao de verossimilhan cas

96 e dada por

CAP ITULO 6. TESTES DE HIPOTESES

(2 )n/2 exp((1/2) p0 = p1 (2 )n/2 exp((1/2) = exp 1 2


n n

n 2 i=1 xi ) n i=1 (xi

1)2 )

x2 i
i=1 i=1

(xi 1)2 .

1 = exp n x 2

Portanto rejeitar H0 quando p0 /p1 < k e equivalente a rejeitar H0 quando x > (1/2) (1/n) log k = c. N ao e dif cil obter o valor da constante c tal que P (X > c | = 0) = P (Z > c n) = com Z N (0, 1). Por exemplo para = 0, 05 obtemos da tabela da normal padronizada que c n = 1, 645 e o teste otimo (que minimiza ) consiste em rejeitar H0 se X > 1, 645/ n. Exemplo 6.5 : Seja X1 , . . . , Xn uma amostra aleat oria da distribui c ao exponencial com par ametro e queremos testar H0 : = 0 H1 : = 1 , com 1 > 0 . A raz ao de verossimilhan cas e dada por p0 = p1 0 1
n n

exp (0 1 )
i=1

xi

ent ao, pelo lema de Neyman-Pearson, o teste mais poderoso (teste otimo) rejeita H0 se p0 /p1 < k ou equivalentemente se
n

xi <
i=1

1 log k 0 1

1 0

=c

A constante c e obtida xando-se o valor de , ou seja calcule c tal que


n

=P
i=1

Xi < c | = 0

.
n i=1

Note que se Xi Exp() ent ao quando = 0 temos que n c ao 2 e portanto 20 i=1 Xi tem distribui 2n .

Xi Gama(n, 0 )

Exemplo 6.6 : Seja X1 , . . . , X10 Exp() uma amostra aleat oria de tempos

6.2. TESTANDO HIPOTESES SIMPLES

97

(em horas) at e a falha de equipamento eletr onicos. Suponha que queremos testar H0 : = 1 H1 : = 2 ao n vel de 5%. Do exemplo anterior, devemos obter o valor de uma constante c tal que
n

2
i=1

Xi < 2c

= 0, 05

2 sendo que 2 n c ao qui-quadrado i=1 Xi 20 . Usando uma tabela da distribui com 20 graus de liberdade obtemos que 2c = 10.85. Assim, a regra de decis ao n consiste em rejeitar H0 se i=1 Xi < 5.425, ou equivalentemente se X < 0.5425.

6.2.1

Problemas

1. Sejam as hip oteses H0 : = 1/2 e H1 : = 2/3 sendo a probabilidade de sucesso em um experimento de Bernoulli. O experimento e repetido 2 vezes e aceita-se H0 se forem obtidos 2 sucessos. Calcule as probabilidades de erro tipo I e II. 2. Sabe-se que uma caixa cont em 3 bolas vermelhas e 5 pretas ou 5 vermelhas e 3 pretas. Um experimento consiste em retirar 3 bolas da caixa. Se menos do que 3 bolas retiradas forem vermelhas a decis ao ser a que a caixa cont em 3 bolas vermelhas e 5 pretas. Calcule as probabilidades de erro (tipo I e tipo II). 3. Com base em uma amostra de tamanho n da vari avel aleat oria X sendo f (x|) = ( + 1)x I[0,1] (x), > 0, deseja-se testar as hip oteses H0 : = 0 contra H1 : = 1 com 0 > 1 . Construa um teste otimo (use o Lema de Neyman-Pearson). 4. Deseja-se testar H0 : = 0 contra H1 : = 1 (1 > 0 ) com base em uma amostra de tamanho n da vari avel aleat oria X sendo f (x|) = exp(x)I[0,) (x), > 0. Construa um teste otimo usando o Lema de Neyman-Pearson. 5. Uma v.a. X e tal que f (x|) = (1 )x1 , para x {1, 2, . . . } e (0, 1). Encontre uma regi ao cr tica para testar H0 : = 3/4 contra H1 : = 2/3 com base em um u nico valor de X e que satisfa ca 0, 5. 6. Disp oe-se de uma amostra aleat oria de tamanho 50 da v.a. X N (, 25). Sabendo que a m edia amostral foi x = 28 teste H0 : = 30 contra H1 : =

98 29 com = 0, 05.

CAP ITULO 6. TESTES DE HIPOTESES

6.3

Probabilidade de signic ancia (P -valor)

Vimos que a escolha do n vel de signic ancia do teste e completamente arbitr aria. Al em disso, quando a distribui c ao da estat stica de teste e discreta, como no Exemplo 6.2 da binomial, o n vel escolhido pode nem mesmo ser atingido. Por outro lado, a decis ao de aceitar ou rejeitar H0 claramente depende desta escolha. Na maioria das aplica c oes pr aticas o valor escolhido e 0,05 ou 0,01 mas n ao h a nada que justique formalmente o uso destes valores em particular. Um enfoque alternativo consiste em calcular uma quantidade chamada n vel cr tico, probabilidade de signic ancia ou p-valor. Em geral, se T e uma estat stica de teste e H0 e rejeitada por exemplo para T > c ent ao o p-valor e a probabilidade P (T > t | H0 ) onde t e o valor observado de T . Exemplo 6.7 : No Exemplo 6.1 suponha que o n umero observado de quest oes certas foi X = 9. Ent ao o p-valor ser a P (X 9 | p = 1/2) = 10 10 0, 510 = 0, 0107 0, 510 + 10 9

e rejeitaremos H0 para todo n vel de signic ancia maior do que este valor. Por exemplo, rejeitaremos H0 para os valores usuais = 0, 025 ou = 0, 05. Por outro lado, H0 seria aceita para = 0, 01. Exemplo 6.8 : No Exemplo 6.2 suponha que o n umero observado de n ao defeituosos foi X = 4. Neste caso o p-valor e dado por P (X 4 | p = 0, 90) = 0, 000146 ou seja, rejeitaremos H0 para praticamente todos os n veis de signic ancia usuais.

Portanto, o p-valor e a probabilidade de observar resultados t ao extremos quanto aqueles que foram obtidos se a hip otese nula for verdadeira. A id eia e que se o p-valor for grande ele fornece evid encia de que H0 e verdadeira, enquanto que um p-valor pequeno indica que existe evid encia nos dados contra H0 . As seguintes interpreta c oes de p-valores (P ) podem ser u teis,

6.4. TESTES UNIFORMEMENTE MAIS PODEROSOS P 0, 10 0, 05 P < 0, 10 0, 01 P < 0, 05 0, 001 P < 0, 01 P < 0, 001 N ao existe evid encia contra H0 Fraca evid encia contra H0 Evid encia signicativa . . . Evid encia altamente signicativa . . . Evid encia extremamente signicativa . . .

99

Coment arios
Da forma como a metodologia cl assica de testes de hip oteses foi desenvolvida podemos ter a impress ao de que estamos calculando probabilidades a respeito de uma hip otese. De fato, algumas vezes e incorretamente armado que rejeitar H0 ao n vel indica que a probabilidade de H0 ser verdadeira e menor do que . Esta interpreta c ao n ao e v alida e o p-valor calculado em um teste n ao fornece nenhuma indica c ao sobre qualquer probabilidade a respeito de H0 . Por exemplo, um p-valor pr oximo de zero nos fornece (do ponto de vista cl assico) muita evid encia contra H0 por em isto n ao signica de maneira alguma que P (H0 ser verdadeira) seja tamb em pr oxima de zero. Esta u ltima arma c ao probabil stica sequer faz sentido na infer encia cl assica, embora seja exatamente isto que gostariamos de calcular. Para que esta interpreta c ao fosse v alida teriamos que usar a abordagem Bayesiana. Basicamente, ter amos que atribuir uma probabilidade a priori, i.e. antes de observar os dados, para a hip otese H0 . Ap os a observa c ao dos dados amostrais esta probabilidade seria atualizada, segundo regras da infer encia Bayesiana, e ter amos uma probabilidade a posteriori para a hip otese H0 . Para maiores detalhes ver por exemplo Migon and Gamerman (1999) ou DeGroot (1989).

6.4

Testes Uniformemente mais Poderosos

Na Se c ao 6.2 foram denidos testes otimos para testar hip oteses simples. Nesta se c ao os resultados ser ao generalizados para hip oteses compostas. Considere ent ao um teste em que H0 pode ser uma hip otese simples ou composta e H1 e sempre uma hip otese composta. Deni c ao 6.1 Um teste de H0 : 0 H1 : 1 e dito ser uniformemente mais poderoso (UMP) de tamanho se e somente se
0

sup () =

100

CAP ITULO 6. TESTES DE HIPOTESES

e para qualquer outro teste que satisfa ca esta igualdade (| ) (| ), 1 .

Assim, de acordo com esta deni c ao, precisamos especicar um teste cuja probabilidade m axima de rejeitar H0 quando ela e verdadeira seja e que ao mesmo tempo maximize a probabilidade de rejeitar H0 quando ela e falsa. Veremos a seguir que os testes UMP s o existem em situa c oes especiais, por exemplo quando a distribui c ao pertence ` a fam lia exponencial vista na Se c ao 1.3.1.

Teorema 6.2 Se X1 , . . . , Xn e uma amostra aleat oria de um membro da fam lia exponencial e for estritamente crescente em ent ao o teste UMP de n vel para testar H0 : 0 H1 : > 0 rejeita H0 se T (x) > c. Se as hip oteses forem invertidas ou for estritamente decrescente em ent ao o teste UMP rejeita H0 se T (x) < c. Se ambas as condi c oes ocorrerem o teste ca inalterado. Um fato importante e que, em qualquer condi c ao estes testes t em fun c ao poder crescente em e portanto seu valor m aximo sob H0 e atingido em = 0 . Assim a constante c acima e obtida de modo que P (rejeitar H0 | = 0 ) , com igualdade no caso cont nuo. Exemplo 6.9 : Seja X1 , . . . , Xn uma amostra aleat oria da distribui c ao de Bernoulli com par ametro . Suponha que queremos testar H0 : 0, 1 H1 : > 0, 1 ao n vel m aximo de 5% com base em uma amostra de tamanho n = 15. Ent ao, denindo t(x) = n i=1 xi p(x|) = t(x) (1 )nt(x) = exp[t(x) log + (n t(x)) log(1 )] = exp t(x) log + n log(1 ) . 1 Logo, a distribui c ao pertence ` a fam lia exponencial e () = log(/(1 )) e uma fun c ao estritamente crescente de . Assim, um teste UMP deve rejeitar n e tal que P ( n H0 se i=1 Xi > c onde c i=1 Xi > c | = 0, 1) . Como n Y = i=1 Xi Binomial(n, ) segue que P (Y > 3 | = 0, 1) = 0, 056 P (Y > 4 | = 0, 1) = 0, 013 P (Y > 5 | = 0, 1) = 0, 002 P (Y > 6 | = 0, 1) = 0, 0003. e a regra de decis ao consiste em rejeitar H0 se
n i=1

Xi > 4.

6.4. TESTES UNIFORMEMENTE MAIS PODEROSOS

101

Exemplo 6.10 : Seja X1 , . . . , Xn uma amostra aleat oria da distribui c ao exponencial com par ametro e queremos testar H0 : 0 H1 : > 0 . Denindo n t(x) = i=1 xi a fun ca o de densidade conjunta e p(x|) = n e t(x) = exp(n log t(x)). Portanto a distribui c ao pertence ` a fam lia exponencial e () = e uma fun c ao estritamente decrescente de . Ent ao pelo Teorema 6.2 o teste UMP deve ren jeitar H0 se i=1 Xi < c. Fixando o valor de a constante c e a solu c ao da n n equa c ao P ( i=1 Xi < c | = 0 ) = com i=1 Xi Gama(n, 0 ) e portanto 2 20 n i=1 Xi 2n . Exemplo 6.11 : No exemplo anterior deseja-se testar se 10 ao n vel de 5% com base em uma amostra de tamanho n = 10. Devemos ent ao obter o valor de c tal que, P (Y < 20c) = 0.05, Y 2 20 . Da tabela qui-quadrado com 20 graus de liberdade obtemos que P (Y < n 10.8508113941826) = 0.05, portanto o teste UMP rejeita H0 se i=1 Xi < 10.8508113941826/20. A propriedade que garante a exist encia de testes UMP na fam lia exponencial pode ser estendida a fam lias de distribui c oes com raz ao de verossimilhan ca mon otona. Deni c ao 6.2 A fam lia de distribui c oes com fun c ao de (densidade) de probabilidade p(x|) e dita ter raz ao de verossimilhan ca mon otona se existe uma estat stica T (X ) tal que 1 , 2 , com 1 < 2 , a raz ao p(x|2 )/p(x|1 ) e uma fun c ao mon otona em t(x). Intuitivamente, quanto maior for a raz ao de verossimilhan ca mais plaus vel e o valor 2 em rela c ao a 1 . Assim, se queremos testar H0 : 0 H1 : > 0 e se a RV for uma fun c ao crescente de T (X ) ent ao e razo avel rejeitar H0 para valores grandes de T (X ). Pode-se mostrar que neste caso o teste UMP rejeita H0 se T (X ) > c. Analogamente, se as hip oteses forem invertidas ou se a RV for uma fun c ao decrescente de T (X ) ent ao o teste UMP rejeita H0 se T (X ) < c. Se ambas as condi c oes ocorrerem o teste ca inalterado. Em qualquer destas condi c oes o fato importante e que a fun c ao poder e sempre crescente em . Portanto, a constante c acima e obtida de modo que P (rejeitar H0 | = 0 ) , com igualdade no caso cont nuo. Exemplo 6.12 : Seja X1 , . . . , Xn uma amostra aleat oria da distribui c ao de Bernoulli com par ametro e queremos testar H0 : 0 H1 : > 0 . Ent ao,

102 denindo t(x) =


n i=1

CAP ITULO 6. TESTES DE HIPOTESES xi temos que p(x|) = t(x) (1 )nt(x)

e para 1 < 2 a raz ao de verossimilhan ca ca 2 2 (1 1 ) (1 2 )nt(x) = t(x) 1 (1 2 ) 1 (1 1 )nt(x)


t(x) t

1 2 1 1

= t n .

Como 2 > 1 e 1 1 > 1 2 ent ao > 1 e a RV e uma fun c ao crescente em t. n Portanto, o teste UMP rejeita H0 se i=1 Xi > c conrmando assim o resultado no Exemplo 6.9.

6.4.1

Problemas

1. Para cada uma das distribui c oes abaixo considere uma amostra aleat oria X1 , . . . , Xn e obtenha o teste UMP para testar as hip oteses H0 : 0 H0 : > 0 . (a) Poisson com par ametro . (b) Normal com m edia conhecida e vari ancia desconhecida. (c) Gama com par ametro desconhecido e conhecido. (d) Gama com par ametro conhecido e desconhecido. 2. Seja X1 , . . . , Xn uma amostra aleat oria da distribui c ao N (0, 2 ) com 2 desconhecido. Obtenha o teste UMP para testar as hip oteses H0 : 2 2 H0 : 2 > 2 com n = 10 e = 0, 05. 3. Suponha que X1 , . . . , Xn seja uma amostra aleat oria da distribui c ao exponencial com par ametro e queremos testar H0 : 1/2 H0 : < 1/2. Obtenha o teste UMP para estas hip oteses com n = 10 e = 0, 05. 4. Suponha que X1 , . . . , Xn seja uma amostra aleat oria da distribui c ao de Poisson com par ametro e queremos testar H0 : 1 H0 : > 1. Obtenha o teste UMP para estas hip oteses com n = 10 e = 0, 05. 5. Seja X1 , . . . , Xn uma amostra aleat oria da distribui c ao com fun c ao de den 1 sidade p(x|) = x , para x (0, 1) e > 0 desconhecido. Encontre o teste UMP para as hip oteses H0 : 1 H1 : > 1 com n vel de signic ancia = 0, 05. 6. A propor c ao p de itens defeituosos em um grande lote de manufaturados e desconhecida. Uma amostra aleat oria de 20 itens foi selecionada e in-

6.5. TESTES BILATERAIS

103

specionada, e queremos testar as hip oteses H0 : p 0, 1 H1 : p > 0, 1. Obtenha o teste UMP. 7. Suponha que X1 , . . . , Xn seja uma amostra aleat oria da distribui c ao de Poisson com m edia desconhecida e queremos testar H0 : 1 H1 : < 1. Para n = 10, verique para quais n veis de signic ancia no intervalo 0 < < 0, 03 existem testes UMP. 8. Seja X1 , . . . , Xn uma amostra aleat oria da distribui c ao N (, 1) com desconhecido e queremos testar as hip oteses H0 : 0 H1 : > 0. Sejam o teste UMP ao n vel = 0, 025 e (| ) fun c ao poder do teste. (a) Determine o menor valor de n para o qual (| ) 0, 9 para 0, 5. (b) Determine o menor valor de n para o qual (| ) 0, 001 para 0, 1. 9. Seja X1 , . . . , Xn uma amostra aleat oria da distribui c ao 2 com n umero de graus de liberdade desconhecido, = 1, 2, . . . . Suponha que queremos testar as hip oteses H0 : 8 H1 : 9 ao n vel de signic ancia . n Mostre que existe um teste UMP que rejeita H0 se i=1 log Xi > k para uma constante k .

6.5

Testes Bilaterais

Suponha agora que queremos testar hip oteses do tipo H0 : = 0 H1 : = 0 , (6.1)

ou seja H0 e uma hip otese simples e H1 e uma alternativa bilateral. Como veremos nas pr oximas se c oes este tipo de teste pode ser u til na compara c ao de tratamentos. O problema e que neste caso n ao existe um teste UMP para estas hip oteses, i.e. n ao e poss vel construir um teste cuja probabilidade de rejeitar H0 seja maximizada quando ela e falsa. Um procedimento alternativo seria construir testes tais que as chances de rejeitar H0 sejam maiores quando ela e falsa do que quando ela e verdadeira. Isto nos leva ` a deni c ao de testes n ao viesados a seguir. Deni c ao 6.3 Um teste e dito ser n ao viesado para as hip oteses H0 : 0 H1 : 1 se 0 e 1 ent ao () ( ). Caso contr ario o teste e dito viesado.

104

CAP ITULO 6. TESTES DE HIPOTESES

Ou seja, em testes n ao viesados a probabilidade de rejeitar H0 quando ela e falsa e no m nimo t ao grande quanto para H0 verdadeira. Podemos agora tentar construir testes para hip oteses bilaterais que sejam UMP dentro da classe de testes n ao viesados. Se a distribui c ao pertence ` a fam lia exponencial, pode-se mostrar que se () for uma fun c ao estritamente crescente em ent ao o teste UMP n ao viesado de n vel para as hip oteses (6.1) aceita H0 quando c1 < T (X ) < c2 . As constantes c1 e c2 s ao obtidas de modo que P (c1 < T (X ) < c2 | = 0 ) = 1 . Note que existe uma innidade de valores de c1 e c2 satisfazendo a esta condi c ao. Em muitas situa c oes e conveniente tomar valores tais que P (T (X ) < c1 | = 0 ) = P (T (X ) > c2 | = 0 ) = /2 e se T (X ) tem uma distribui c ao sim etrica em torno de um ponto isto implica em escolher c1 e c2 simetricamente em rela c ao a este ponto. No entanto, nada impede que outros valores possam ser considerados. Por exemplo, o pesquisador pode considerar mais grave aceitar H0 quando < 0 do que quando > 0 e neste caso e melhor considerar testes com fun c ao poder assim etrica.

6.5.1

Testes Gerais

Em muitas situa c oes n ao e poss vel obter nem mesmo um teste n ao viesado. Um procedimento geral para testar H0 : 0 H1 : 1 e baseado na estat stica da raz ao de m axima verossimilhan ca (RMV) dada por (X ) = sup0 p(X |) . sup1 p(X |)

Deste modo estaremos comparando o valor m aximo atingido pela fun c ao de verossimilhan ca quando 0 com o valor m aximo atingido quando 1 . Neste caso, e razo avel decidir pela rejei c ao de H0 se (X ) < c onde a constante c e obtida de modo que
0

sup P ((X ) < c | ) .

Novamente, a igualdade ser a usada sempre que poss vel cando a desigualdade para o caso de distribui c oes discretas. Equivalentemente, podemos usar o logaritmo da verossimilhan ca 2 log = 2(
1

0)

e neste caso, a regi ao de rejei c ao ser a {X : 2 log (X ) > k }.

6.6. TESTES DE HIPOTESES NO MODELO NORMAL Existem duas diculdades pr aticas associadas a estes testes:

105

0 e 1 que maximizam a verossimilhan X obter os valores ca sob H0 e H1 .


X determinar a distribui c ao amostral de (X ) (ou 2 log (X )).

Este segundo problema ser a discutido em mais detalhes quando falarmos de testes assint oticos na Se c ao 6.7.

6.6

Testes de Hip oteses no Modelo Normal

Os resultados desenvolvidos nas se c oes anteriores ser ao aplicados ao modelo normal para testes sobre m edia e vari ancia em problemas de uma ou mais amostras e em modelos de regress ao linear. Nesta se c ao considere uma amostra aleat oria X1 , , Xn tomada da distribui c ao N (, 2 ). Suponha que queremos testar H0 : = 0 H1 : = 0 e inicialmente vamos assumir que 2 e conhecida. Neste caso, p(x|) = (2 )
2 n/2

1 exp 2 2 1 2 2

(xi )2
i=1 n

= (2 2 )n/2 exp

x2 exp i
i=1

xn n2 2 2 2

e como n e uma fun ca o estritamente crescente de segue que o teste UMP n ao viesado rejeita H0 se X < c1 ou X > c2 . Ao n vel de signic ancia podemos obter as constantes c1 e c2 tais que P (X < c1 | = 0 ) + P (X > c2 | = 0 ) = . Conforme discutido anteriormente, existe uma innidade de valores que satisfazem esta condi c ao. Na maioria dos experimentos envolvendo o modelo normal ser a conveniente tomar c1 e c2 sim etricos em rela c ao a E (X ). Assim, usando uma tabela da distribui c ao normal padronizada podemos obter o valor do percentil z/2 tal que n(X 0 ) P z/2 z/2 = 1 e o teste bilateral UMP n ao viesado rejeita H0 se X < 0 z/2 / n ou X > 0 + z/2 / n. No caso em que a vari ancia populacional e tamb em desconhecida o espa co dos 2 2 par ametros e = {(, ) : R, > 0} e vamos obter o teste da RMV. Note

106

CAP ITULO 6. TESTES DE HIPOTESES

que, como H0 e uma hip otese simples ent ao 0 = {(0 , 2 ) : 2 > 0} e n ao e 2 dif cil vericar que o valor de que maximiza a verossimilhan ca para 0 xo e n 2 2 0 = i=1 (xi 0 ) /n (fa ca as contas). Portanto, sup
(, 2 )0 2 p(X |, 2 ) = p(x|0 , 0 ).

= x e Para = 0 a fun c ao de verossimilhan ca e maximizada em (, 2 ) onde n 2 2 = i=1 (xi x) /n. Portanto sup
(, 2 )1

p(X |, 2 ) = p(x|, 2 ).

Assim, a estat stica da RMV e dada por (X ) =


2 n/2 (2 0 ) exp{ (2 2 )n/2 exp{ n i=1 (Xi n i=1 (Xi 2 0 )2 /2 0 } X )2 /2 2}

2 e substituindo as somas de quadrados obtemos que (X ) = ( 0 / 2 )n/2 . Mas, 2 0 = 2 n i=1 (Xi

X )2 + n(X 0 )2 n(X 0 )2 T2 = 1 + = 1 + n 2 (n 1)S 2 n1 i=1 (Xi X )

onde T =

n(X 0 )/S e ent ao podemos reescrever a RMV como (X ) = 1+ T2 n1


n/2

Finalmente, o teste da RMV rejeita H0 se (X ) < c ou equivalentemente se T 2 > c ou |T | > c. Como T tn1 a constante c e simplesmente o percentil t/2,n1 desta distribui c ao. O teste desenvolvido acima e conhecido como teste t e talvez um dos mais utilizados em Estat stica. Pode-se mostrar que o teste t e n ao viesado j a que o valor m nimo da fun c ao poder ocorre em = 0 . Al em disso, as propriedades do teste n ao s ao afetadas pelo valor de 2 (par ametro de dist urbio) j a que 2 foi substituido pelo seu estimador S 2 e T e uma quantidade pivotal. O teste tamb em e invariante a transforma c oes lineares das observa c oes.
2 2 para a vari ancia podem H 1 : 2 = 0 Testes bilaterais do tipo H0 : 2 = 0 ser constru dos fazendo-se analogia com intervalos de conan ca. Vimos na Se c ao 2 5.2.1 do Cap tulo 5 que o intervalo de conan ca de 100(1 )% para e dado por (n 1)s2 (n 1)s2 , q2 q1

6.6. TESTES DE HIPOTESES NO MODELO NORMAL

107

sendo q1 e q2 s ao os quantis /2 e 1 /2 da distribui c ao 2 n1 . Assim, o teste 2 deve aceitar H0 se e somente se 0 estiver contido neste intervalo. Ser a deixado como exerc cio mostrar que este e o teste da raz ao de m axima verossimilhan ca para as hip oteses acima.

6.6.1

Testes para V arias M edias

Para come car vamos assumir que temos duas amostras aleat orias X11 , . . . , X1n1 2 2 e X21 , . . . , X2n2 das distribui c oes N (1 , 1 ) e N (2 , 2 ) respectivamente e que as 2 2 )e amostras s ao independentes. Neste caso o vetor de par ametros e (1 , 2 , 1 , 2 em geral estaremos interessados em testar as hip oteses
2 2 H0 : 1 = 2 , 1 > 0, 2 >0 2 2 H1 : 1 = 2 , 1 > 0, 2 >0

(6.2)

2 2 Se pudermos assumir que as vari ancias populacionais s ao iguais, i.e. 1 = 2 = , o problema de constru c ao do teste se torna relativamente simples usando a estat stica da raz ao de m axima verossimilhan ca. Neste caso, como as amostras s ao independentes, podemos escrever a fun c ao de verossimilhan ca como 2

p(x1 , x2 |1 , 2 , 2 ) = p(x1 |1 , 2 )p(x2 |2 , 2 ) e ap os algum algebrismo segue que a verossimilhan ca de (1 , 2 , 2 ) e dada por (2 2 )(n1 +n2 )/2 exp 1 2 2 (n1 1)S1 + n1 (1 x1 )2 + (n2 1)S2 + n2 (2 x2 )2 2 2 .

Quando 1 = 2 as estimativas de m axima verossimilhan ca de 1 , 2 e 2 s ao respectivamente x1 , x2 e 2 =


2 2 + (n2 1)S2 (n1 1)S1 n1 + n2 2

2 2 s ao as vari ancias amostrais. Quando 1 = 2 = segue que as e S2 onde S1 estimativas de m axima verossimilhan ca de e 2 s ao

= n 1 x1 + n 2 x 2 n1 + n2

2 = 2 + e 0

n1 n2 (x1 x2 )2 . 2 (n1 + n2 )

Substituindo estas express oes na raz ao de verossimilhan cas pode-se mostrar

108 que o teste da RMV rejeita H0 se

CAP ITULO 6. TESTES DE HIPOTESES

|T | =

(X 1 X 2 ) > c. 1 1 + n1 n2

Pode-se mostrar que T tem distribui c ao t de Student com = n1 + n2 2 graus de liberdade de modo que a constante c e simplesmente o percentil t/2, desta distribui c ao. Este teste e conhecido como teste t para duas amostras.

6.6.2

Vari ancias Desconhecidas e Desiguais

O procedimento visto na se c ao anterior para vari ancias iguais pode ser estendido facilmente para o caso de vari ancias desconhecidas e desiguais, desde que a raz ao 2 2 2 2 de vari ancias 1 /2 seja conhecida. Suponha por exemplo que 1 = k2 onde k e uma constante positiva conhecida. Denindo-se 2 =
2 2 (n1 1)S1 + (n2 1)S2 /k n1 + n2 2

ent ao pode-se mostrar que quando 1 = 2 a vari avel aleat oria U= (X 1 X 2 ) k 1 + n1 n2

tem distribui c ao t de Student com n1 + n2 2 graus de liberdade. Finalmente, se mesmo a raz ao de vari ancias for desconhecida ent ao o problema de testar as hip oteses 6.2 torna-se bastante complexo. Este problema e conhecido na literatura como o problema de Behrens-Fisher. V arios procedimentos de teste j a foram propostos e a maioria foi objeto de controv ersia em rela c ao a sua utilidade e corre c ao.

6.6.3

Compara c ao de Vari ancias

Em problemas com duas ou mais amostras de distribui c oes normais e natural que se tenha interesse em comparar as vari ancias populacionais. Neste caso, a distribui c ao F e utilizada para testar as hip oteses associadas. No caso de duas amostras suponha que queremos testar
2 2 2 H0 : 1 2 2 H1 : 1 > 2

6.6. TESTES DE HIPOTESES NO MODELO NORMAL

109

Pode-se mostrar que n ao existe teste UMP para estas hip oteses e e pr atica comum utilizar-se o chamado teste F . Este teste e n ao viesado e na verdade e UMP dentro da classe de testes n ao viesados. Usando a estat stica da raz ao de m axima verossimilhan ca pode-se mostrar que o teste F rejeita H0 se
n1 i=1 (x1i n2 i=1 (x2i

x1 )2 /(n1 1) s2 1 = > c. s2 x2 )2 /(n2 1) 2

Vimos na Se c ao 5.2.4 que


2 2 S1 2 F (n1 1, n2 1). 2 2 S 2 1

e portanto a constante c pode ser obtida tal que P


2 2 S1 2 2 2 > c | 1 = 2 2 2 S 2 1

=P

2 S1 >c 2 S2

usando os valores tabelados da distribui c ao F com n1 1 e n2 1 graus de liberdade. No caso de testes bilaterais, i.e.
2 2 H0 : 1 = 2 2 2 H1 : 1 = 2 2 2 2 2 o teste F rejeita H0 se S1 /S2 < c1 ou S1 /S2 > c2 onde as constantes c1 e c2 s ao mais uma vez obtidas como percentis da distribui c ao F com n1 1 e n2 1 graus de liberdade. Analogamente ao teste t, e pr atica comum escolher c1 e c2 tal que as probabilidades nas caudas sejam iguais, i.e. /2.

6.6.4

Problemas

1. Suponha que X1 , . . . , Xn e uma amostra aleat oria da distribui c ao N (, 1) e queremos testar as hip oteses H0 : = 0 H1 : = 0 . Considere um teste que rejeita H0 se X c1 ou X c2 . (a) Determine os valores de c1 e c2 tais que (0 ) = 0, 10 e () seja sim etrica em torno de 0 . (b) Determine os valores de c1 e c2 tais que (0 ) = 0, 10 e o teste seja n ao viesado. (c) Suponha que c1 = 0 1, 96/ n. Determine c2 tal que (0 ) = 0, 10. (d) Determine o menor valor de n para o qual (0 ) = 0, 10 e (0 + 1) = (0 1) 0, 95.

110

CAP ITULO 6. TESTES DE HIPOTESES

2. Suponha que X1 , . . . , Xn e uma amostra aleat oria da distribui c ao N (, 1) e queremos testar as hip oteses H0 : 0, 1 0, 2 H1 : < 0, 1 ou > 0, 2. Considere um teste que rejeita H0 se X c1 ou X c2 . (a) Para n = 25 determine c1 e c2 tais que tais que (0, 1) = (0, 2) = 0, 07. (b) Idem para (0, 1) = 0, 02 e (0, 2) = 0, 05. 3. Os comprimentos de bras met alicas (em mil metros) produzidas por uma m aquina t em distribui c ao normal com m edia e vari ancia 2 desconhecidos. Suponha que queremos testar as seguintes hip oteses H 0 : 5, 2 H1 : > 5, 2. Os comprimentos de 15 bras selecionadas ao acaso foram medidos e obteve2 se a m edia amostral x = 5, 4 e n i=1 (xi x) = 2, 5. (a) Construa um teste t ao n vel de 0,05 baseado nestes resultados. (b) Repita o item anterior para as hip oteses H0 : = 5, 2 H1 : = 5, 2. Qual a conclus ao do exerc cio? 4. Suponha que foi selecionada uma amostra aleat oria de 9 observa c oes da 2 distribui c ao N (, ) com par ametros desconhecidos. Obteve-se X = 22 e n 2 i=1 (Xi X ) = 72. (a) Teste as hip oteses H0 : 20 H1 : > 20 ao n vel de signic ancia 0,05. (b) Teste as hip oteses H0 : = 20 H1 : = 20 ao n vel de signic ancia 0,05. Use um teste sim etrico com probabilidade 0,025 em cada cauda. 5. O tempo m edio, por oper ario, para executar uma tarefa, tem sido de 100 minutos com desvio padr ao de 15 minutos. Foi introduzida uma modica c ao para reduzir este tempo e ap os alguns meses foi selecionada uma amostra de 16 oper arios medindo-se o tempo de execu c ao de cada um. Obteve-se um tempo m edio amostral de 90 minutos e um desvio padr ao amostral de 16 minutos. Estabele ca claramente as suposi c oes que precisam ser feitas.

6.6. TESTES DE HIPOTESES NO MODELO NORMAL

111

(a) Verique se existem evid encias, ao n vel de signic ancia 0,05, de que a modica c ao surtiu efeito? (b) Verique se h a evid encias, ao n vel de signic ancia 0,05, de que a modica c ao alterou a vari ancia populacional. 6. Uma ind ustria compra componentes eletr onicos dos fornecedores A e B , mas o fornecedor A garante que o tempo m edio de vida (em horas) do seu produto supera o da marca B em 300 horas. Para testar esta arma c ao foram selecionadas duas amostras de componentes, uma de cada fornecedor, e obteve-se os seguintes tempos de vida: marca A 1500 1450 1480 1520 1510 marca B 1100 1200 1180 1250 Ap os estabelecer claramente as suposi c oes que precisam ser feitas, (a) teste a hip otese de igualdade das vari ancias dos tempos de vida, ao n vel de signic ancia 0,02; (b) teste a arma c ao do fornecedor A, ao n vel de signic ancia 0,05. 7. Uma droga A foi administrada em um grupo de 8 pacientes selecionados ao acaso. Ap os um per odo xo de tempo a concentra c ao da droga em certas c elulas de cada paciente foi medida (em unidades apropriadas). O procedimento foi repetido em um outro grupo de 6 pacientes selecionados ao acaso usando uma droga B . As concentra c oes obtidas foram droga A 1,23 1,42 1,41 1,62 1,55 1,51 1,60 1,76 droga B 1,76 1,41 1,87 1,49 1,67 1,81 Ap os estabelecer claramente as suposi c oes que precisam ser feitas, (a) teste a hip otese de que a concentra c ao m edia de droga A entre todos os pacientes e pelo menos t ao grande quanto da droga B ; (b) teste a hip otese de que as concentra c oes m edias das duas drogas s ao iguais. 8. Mostre que o teste bilateral para a vari ancia dado na Se c ao 6.6 e o teste da RMV.

112

CAP ITULO 6. TESTES DE HIPOTESES

6.7

Testes Assint oticos

Vimos que a constru c ao de um teste envolve a obten c ao de constantes atrav es da distribui c ao de probabilidades de uma estat stica. Em muitas situa c oes, particularmente para a raz ao de m axima verossimilhan ca, estas distribui c oes n ao podem ser determinadas de forma exata e precisamos recorrer a resultados aproximados. Nesta se c ao ser ao desenvolvidos testes baseados em distribui c oes assint oticas das estat sticas de teste envolvidas. Iremos nos concentrar em testes baseados na distribui c ao assint otica da raz ao de m axima verossimilhan ca, do estimador de m axima verossimilhan ca e da fun c ao escore. Suponha que uma amostra aleat oria X1 , . . . , Xn e tomada de uma distribui c ao com par ametro R desconhecido e queremos testar H0 : = 0 . Expandindo em s erie de Taylor a fun c ao L(0 ) = log p(x|0 ) em torno do estimador de m axima verossimilhan ca obtemos ) + U (x; )(0 ) 1 J ( )(0 )2 L(0 ) L( 2 sendo que J e a informa c ao observada de Fisher e podemos desprezar os termos est de ordem mais alta j a que, sob H0 , 0 e ao pr oximos para n grande. Mas a fun c ao escore avaliada em e igual a zero por deni c ao. Al em disso, a raz ao de m axima verossimilhan ca neste caso e (X ) = e podemos escrever ent ao que 2 log (X ) = 2 log p(X |0 ) ) p(X | )] J ( )(0 )2 . = 2[L(0 ) L( p(X |0 ) ) p(X |

Lembrando que e assint oticamente normal com m edia e usando o fato de que )/n converge quase certamente para o seu valor esperado I (0 )/n quando H0 J ( e verdadeira ent ao a distribui c ao assint otica de 2 log (X ) e 2 1 . Assim, um teste com n vel de signic ancia assint otico rejeita H0 se 2 log (X ) > c onde c e tal que P (2 log (X ) > c| = 0 ) = . Este resultado pode ser generalizado para o caso de um vetor de par ametros = (1 , . . . , k ) de dimens ao k . Neste caso, a estat stica 2 log (X ) tem 2 distribui c ao assint otica k .

6.7. TESTES ASSINTOTICOS

113

6.7.1

Teste Qui-quadrado

Um caso de particular interesse em Estat stica e quando os dados s ao tais que cada observa c ao pode ser classicada de acordo com um n umero nito de poss veis categorias. Por isso, observa c oes deste tipo s ao chamadas dados categ oricos e estaremos interessados em fazer infer encia sobre as probabilidades de cada categoria. Suponha que uma popula c ao consiste de itens que podem ser classicados em k diferentes categorias. Seja i a probabilidade de que um item selecionado ao acaso perten ca ` a categoria i, i = 1, . . . , k . Assumimos tamb em que i 0, n 0 0 tais que i = 1, . . . , k e i=1 i = 1. Sejam agora os valores espec cos 1 , . . . , k n 0 0 i > 0, i = 1, . . . , k e i=1 i = 1 e queremos testar as hip oteses
0 H0 : i = i , 0 H0 : i = i ,

i = 1, . . . , k para ao menor um valor de i. (6.3)

Suponha agora que uma amostra aleat oria de tamanho n e tomada desta popula c ao e as hip oteses (6.3) ser ao testadas com base nesta amostra. Para isto vamos denotar por Ni o n umero amostral de observa c oes na categoria i, k i.e. N1 , . . . , Nk s ao inteiros n ao negativos tais que i=1 Ni = n. Quando H0 0 e verdadeira, o n umero esperado de observa c oes do tipo i e ni e a diferen ca entre o n umero observado e o n umero esperado tende a ser menor quando H0 e verdadeira do que quando ela e falsa. Parece razo avel ent ao basear o teste nas magnitudes relativas destas diferen cas. Neste caso, usando-se a fun c ao escore pode-se mostrar que o teste assint otico rejeita H0 se
k

Q=
i=1

0 2 (Ni ni ) >c 0 ni

onde a estat stica Q tem distribui c ao assint otica 2 em s ao k1 . Estes testes tamb conhecidos na literatura como testes de qualidade de ajuste ou testes de ader encia e est ao entre os mais utilizados em Estat stica.
0 n ao Uma observa c ao de ordem pr atica e que as frequ encias esperadas ni 2 devem ser muito pequenas para que a distribui c ao seja uma boa aproxima c ao da distribui c ao de Q. Especicamente, pode-se mostrar que a aproxima c ao ser a 0 0 avel ni 1, 5. muito boa se ni 5 e apenas razo

V arias aplica c oes para dados categ oricos e m etodos n ao param etricos que utilizam testes qui-quadrado podem ser vistas por exemplo em DeGroot (1989).

114

CAP ITULO 6. TESTES DE HIPOTESES

Testes de Ader encia


Suponha agora que deseja-se testar a hip otese de que a amostra foi tomada de uma certa distribui c ao indexada por um vetor de par ametros = (1 , . . . , m ). Neste caso a hip otese alternativa e que a amostra foi tomada de alguma outra distribui c ao. Al em disso, suponha que foram observados k valores de uma vari avel categ orica ou os dados foram agrupados em k classes de valores. Agora, para calcular as probabilidades de que um item perten ca a cada uma das classes ou categorias precisamos dos valores estimados dos par ametros 1 , . . . , m . Se usarmos estimativas de m axima verossimilhan ca pode-se mostrar que a estat stica Q tem distribui c ao assint otica qui-quadrado com k 1 m graus de liberdade sendo m o n umero de par ametros estimados no modelo te orico. Uma condi c ao de validade desta distribui c ao e que ei 5, i = 1, . . . , k . Exemplo 6.13 : A propor c ao p de itens defeituosos em um grande lote e desconhecida e deseja-se testar as hip oteses H0 : p = 0, 1 H1 : p = 0, 1 com base em uma amostra aleat oria de 100 itens dos quais 16 s ao defeituosos. Podemos usar o teste qui-quadrado com duas categorias (defeituoso e n ao defeituoso) reformulando as hip oteses acima como H0 : p1 = 0, 1 e p2 = 0, 9 H1 : H0 e falsa sendo p1 e p2 as probabilidades de um item ser defeituoso ou n ao defeituoso respectivamente. As frequ encias observadas e esperadas sob H0 s ao
0 N1 = 16, N2 = 84, np0 1 = 10, np2 = 90

e portanto o valor observado da estat stica de teste e Q= (16 10)2 (84 90)2 + = 4. 10 90

Usando uma tabela da distribui c ao qui-quadrado com 1 grau de liberdade obt emse que 0,025 < P -valor < 0,05 e assim H0 deve ser rejeitada ao n vel de 5% e aceita ao n vel de 2,5%. Exemplo 6.14 : O teste 2 tamb em pode ser aplicado no estudo da rela c ao entre duas variaveis categ oricas com p e k poss veis categorias. Neste caso queremos

6.7. TESTES ASSINTOTICOS

115

testar se as vari aveis s ao independentes (hip otese nula). A estat stica de teste e a mesma por em com n umero de graus de liberdade igual a (p 1)(k 1) Considere por exemplo a Tabela 6.3 na qual est ao apresentados os n umero de alunos matriculados nos col egios A e B, em rela c ao ` a sua classe social. Se as Tabela 6.2 Classe social Col egio Alta Media Baixa A 20 40 40 B 50 40 30 Total 70 80 70

Total 100 120 220

vari aveis Col egio e Classe social forem independentes espera-se que as frequ encias de alunos das 3 classes sejam as mesmas nos 2 col egios, i.e. 70/220, 80/220 e 70/220. As frequ encias esperadas sob a hip otese de independ encia s ao ent ao dadas por Col egio A: 100 Col egio B: 120 70 80 70 = 31, 82 100 = 36, 36 100 = 31, 82 220 220 220

70 80 70 = 38, 18 120 = 43, 64 120 = 38, 18 220 220 220 e podemos construir a tabela abaixo. Tabela 6.3: Frequ encias esperadas sob a hip otese de independ encia. Classe social Col egio Alta Media Baixa A 31,82 36,36 31,82 B 38,18 43,64 38,18

Podemos agora avaliar a estat stica de teste T = (20 31, 82)2 (40 36, 36)2 (40 31, 82)2 + + + 31, 82 36, 36 31, 82 (50 38, 18)2 (40 43, 64)2 (30 38, 18)2 + + = 12, 57. 38, 18 43, 64 38, 18

Ao n vel de signic ancia 0,05 obtemos da tabela 2 com (p 1)(k 1) = 2 graus de liberdade que P (T > 5, 99) = 0, 05 e como 12, 57 > 5, 99 a hip otese

116

CAP ITULO 6. TESTES DE HIPOTESES

de independ encia e rejeitada. Para calcular o P -valor, note que a tabela quiquadrado com 2 graus de liberdade nos fornece, P (T > 12, 429) = 0, 002 e portanto podemos concluir que P -valor < 0,002. Ou seja, existe forte evid encia contra a hip otese de independ encia entre as vari aveis Col egio e Classe social.

6.8

Problemas

1. Em uma amostra de 100 lotes com 5 itens cada um, vericou-se que o n umero de itens defeituosos tem a distribui c ao de frequ encias abaixo. Teste a adequa c ao do modelo binomial. no de defeituosos 0 1 2 3 4 5 total no de lotes 75 21 3 1 0 0 100 2. Em uma amostra de 300 itens, o n umero de defeitos observados em cada um deles tem a distribui c ao de frequ encias dada na tabela abaixo. Teste a adequa c ao do modelo Poisson. no de defeitos 0 1 2 3 4 total no de itens 80 122 53 31 14 300 3. Em seus experimentos com ervilhas, Mendel ao cruzar plantas de sementes amarelas lisas com plantas de sementes verdes enrugadas observou a seguinte descend encia na 2a gera c ao: 315 plantas com sementes amarelas lisas, 108 com sementes amarelas enrugadas, 101 com sementes verdes lisas e 32 com sementes verdes enrugadas. De acordo com os postulados de Mendel a segrega c ao esperada nesta gera c ao deveria seguir a propor c ao de 9:3:3:1. Verique se a teoria de Mendel explica a segrega c ao observada. 4. Em uma amostra de 1800 valores no intervalo (0,1) obteve-se 391 valores entre 0 e 0,2, 490 valores entre 0,2 e 0,5, 580 entre 0,5 e 0,8; e 339 maiores do que 0,8. Teste a hip otese de que a amostra foi tomada de uma distribui c ao uniforme no intervalo (0,1) (neste caso a probabilidade de um valor cair no intervalo (a, b) e b a).

6.9. TESTES BAYESIANOS

117

6.9

Testes Bayesianos

Do ponto de vista Bayesiano, podemos atribuir probabilidades a priori p(H0 ) e p(H1 ) para um par de hip oteses estat sticas H0 e H1 . Ap os observar uma amostra aleat oria X1 , . . . , Xn e aplicando o teorema de Bayes obtemos as probabilidades a posteriori das hip oteses, p(H0 |x) = p(x|H0 )p(H0 ) p(x) e p(H1 |x) = p(x|H1 )p(H1 ) . p(x)

Tomando-se a raz ao das probabilidades a posteriori (e notando que o termo p(x) se cancela) obtemos P (H0 |x) P (H1 |x)
raz ao de chances a posteriori

P (x|H0 ) P (x|H1 )

P (H0 ) . P (H1 )
a priori

fator de Bayes raz ao de chances

O fator de Bayes (FB) ser a usado para testar as hip oteses e pode ser reescrito como p(|H0 )p(x|, H0 )d P (x|H0 ) FB = = . P (x|H1 ) p(|H1 )p(x|, H1 )d Note que o fator de Bayes e similar ` a raz ao de verossimilhan cas por em ao inv es de maximizar a verossimilhan ca toma-se uma m edia ponderada com pesos p(|Hi ). Na escala logar tmica o fator de Bayes e algumas vezes chamado de for ca (ou peso) da evid encia fornecido pelos dados para H0 contra H1 . Um fator de Bayes grande indica evid encia a favor de H0 e a seguinte escala pode ser usada, FB <1 [1, 3] (3, 12] (12, 150] > 150 log FB <0 [0, 5] (5, 11] (11, 22] > 22 For ca da evid encia negativa (suporta H1 ) fraca positiva forte muito forte