Você está na página 1de 15

INFERNCIA ESTATSTICA

INFERNCIA ESTATSTICA

3. TESTES DE HIPTESES
3.1 INTRODUO
Os testes de hiptese so uma metodologia de inferncia estatstica diferente da que foi abordada na estimao de parmetros (estimao pontual e por intervalos). Trata-se de um processo estatstico que, a partir de dados amostrais, permite obter uma de duas respostas (afirmativa ou negativa), sobre uma determinada conjectura previamente realizada sobre a populao (nos testes de hipteses paramtricos essa conjectura sobre os parmetros da populao).1

Assim, pretende avaliar a necessidade de investir num novo balco, recorrendo a uma amostra que permita estimar a verdadeira mdia do tempo de espera por cliente. A hiptese que se pretende testar designada por hiptese nula (a designao de nula, indica que se trata de uma hiptese que no difere da situao real). Neste exemplo, a hiptese nula, H0 , revela a informao detida pelo director at ao momento (o tempo mdio de espera inferior ou no mximo igual a 5 minutos). A hiptese alternativa, Ha , coloca-se em contraposio hiptese nula: caso o tempo mdio de espera no verifique a condio definida em H0 , ento a alternativa que este seja superior a 5 minutos. A observao de uma amostra vai fornecer informao que torna possvel a deciso por uma das duas hipteses. Se a amostra for favorvel hiptese nula, decide-se no rejeitar H0 , o que, neste caso, corresponde a decidir no abrir um novo balco de atendimento. Caso a amostra contenha evidncia factual no favorvel a H0 , rejeitamos esta hiptese, o que quer dizer que estamos a optar pela hiptese alternativa - vamos decidir abrir um novo balco para fazer face ao aumento indesejado do tempo mdio de espera por cliente. Mas no esqueamos que a inferncia probabilstica, o que nos obriga a considerar o risco de tomar decises erradas. De facto, dependendo da situao realmente verdadeira,

Ao realizar um teste de hipteses o objectivo validar ou no determinadas hipteses sobre a populao, com base na informao amostral. No caso particular dos testes de hipteses paramtricos, a validao diz respeito aos parmetros da populao.

Em diversas reas da cincia, colocam-se questes inerentes s quais esto opes alternativas. A deciso, qualquer que ela seja, comporta um risco, o risco de errar. A metodologia de realizao dum teste de hipteses permite controlar e at minimizar o risco de errar. Vejamos o seguinte exemplo: Exemplo 3.1: O director de uma loja dos CTT dimensionou o nmero de balces de atendimento de modo a garantir que o tempo mdio de espera por cliente no ultrapassa-se cinco minutos. No entanto, a zona urbana em que a loja est inserida tem crescido e o director tem dvidas se na realidade os clientes continuam em mdia a esperar no mximo cinco minutos. Caso verifique que esperam mais tempo, o director ir proceder abertura de um novo balco.

assim a deciso de abrir/no abrir um novo balco pode estar errada.

3.2 HIPTESES E DECISES


Uma hiptese estatstica uma conjectura que caracteriza a distribuio duma ou mais populaes. Num teste estatstico temos duas hipteses em alternativa, relativas a um parmetro desconhecido da populao:

Existem os testes de hiptese no paramtricos que se utilizam quando os pressupostos de utilizao dos testes paramtricos no se verificam. Por exemplo, no caso de populaes no normais e amostras de pequena dimenso os testes no paramtricos so uma opo possvel. Tambm no caso dos dados estarem na escala de intervalos ou rcios e no terem distribuio especificada, ou sendo esta conhecida a menos de um nmero infinito de parmetros desconhecidos e tambm quando os dados esto na escala nominal ou ordinal.

H0 : Hiptese nula Ha : Hiptese alternativa

___________________________________________________________________ 1
ISEL DEETC

___________________________________________________________________ 2
ISEL DEETC

INFERNCIA ESTATSTICA

INFERNCIA ESTATSTICA

A hiptese nula geralmente aquela que revela a informao que detemos no momento em que se decide realizar o teste estatstico. O teste servir para se concluir se a conjectura dada pela hiptese nula ou no correcta. A hiptese nula considerada verdadeira ao longo do procedimento do teste, at ao momento em que haja evidncia estatstica clara apontando em sentido contrrio. A hiptese nula: reflecte a situao em que no h mudana (pode ser resultado de uma experincia passada); o que se aceita por defeito; contm sempre uma igualdade e deve ser formulada por forma a ser possvel conhecer a distribuio da estatstica amostral a utilizar (designada por estatstica de teste), no pressuposto de que H0 verdadeira.

unilateral direito quando Ha tiver a desigualdade>; unilateral esquerdo quando Ha tiver a desigualdade <; bilateral quando Ha tiver a desigualdade . Para o exemplo 3.1, tem-se um teste unilateral direito, onde as hipteses a testar so: H0 : 5 Ha : > 5 A Deciso Num teste de hipteses o objectivo o de tomar uma deciso, em consequncia da existncia de razes para rejeitar ou no a hiptese nula. Esta deciso baseada na informao disponvel, obtida a partir da amostra recolhida da populao. No caso de se rejeitar H0 , aceita-se como vlida a hiptese alternativa.

Voltando ao exemplo dos CTT, s ser aberto um novo balco se a amostra evidenciar essa necessidade, at l damos crdito hiptese nula. A hiptese alternativa a hiptese que contm a informao relativa dvida que suscitou a realizao do teste. Vai reflectir o conjunto de valores que o parmetro poder assumir, caso a hiptese nula seja rejeitada. Contm sempre uma desigualdade (>, <ou ). As hipteses podem ser simples ou compostas: A Hiptese simples quando identifica um valor exacto para o parmetro em causa. Por exemplo, H0 : = 5 , uma hiptese simples. A Hiptese composta quando identifica um conjunto de possibilidades para o domnio do parmetro em causa. Por exemplo, H0 : 5 , uma hiptese composta. Um teste de hipteses pode classificar-se em: ___________________________________________________________________ 3
ISEL DEETC

3.3 ERROS NOS TESTES DE HIPTESES


A uma deciso (rejeitar ou no H0 ) est sempre associado um risco, o risco de tomar uma deciso errada. No caso dos testes de hipteses a tomada de deciso, para a populao, baseada na informao amostral, pelo que se podem cometer erros. Uma caracterstica favorvel dos testes de hipteses a possibilidade de controlar ou minimizar o risco associado s decises erradas. Vamos supor que o parmetro populacional a testar . Para nos referirmos ao domnio do parmetro proposto pela hiptese nula utilizamos 0 e pela hiptese alternativa a . Na figura 3.1 apresentam-se, de modo resumido, as situaes possveis relativas tomada de deciso, quando se realiza um teste de hipteses.

___________________________________________________________________ 4
ISEL DEETC

INFERNCIA ESTATSTICA

INFERNCIA ESTATSTICA

Tipos de erros associados deciso tomada Deciso Rejeitar H0 Situao Real H0 verdadeira
P (rejeitar H0 | H0 verdadeira)

Erro de Tipo I: Decide-se abrir um novo balco, no entanto a realidade no o justifica. H0 falsa Deciso correcta Erro de Tipo II: No se abre um novo balco, mantm-se tudo como est e no entanto as pessoas esperam em mdia mais do que cinco minutos. Deveria terse decidido abrir um novo balco.

Deciso incorrecta

No rejeitar H0

Erro Tipo I Deciso correcta P (No rejeitar H0 | H0 verdadeira)> 1

P (Rejeitar H0 | H0 falsa) = 1-

Deciso incorrecta
P (No rejeitar H0 | H0 falsa) =

importante notar que, em geral, se atribui mais importncia ao erro de Tipo I, uma vez que em H0 que acreditamos, at que exista evidncia estatstica em contrrio. Rejeitar a hiptese nula como abandonar um hbito, e consequentemente a possibilidade de cometer um erro do Tipo I (rejeitar H0 incorrectamente) encarada com preocupao. Consideramos mais grave abrir um novo balco de forma injustificada (fazer um investimento desnecessrio), do que no realizar o investimento quando o deveramos ter feito. Potncia do Teste A potncia do teste, = 1 , com 0 < < 1 , a probabilidade ou risco de rejeitar a hiptese nula H0 , quando esta falsa, decidindo de forma acertada.

Erro Tipo II

Erro do Tipo I ou erro de 1 espcie O erro de Tipo I ocorre quando se decide rejeitar H0 , sendo H0 verdadeira, ou seja, rejeita-se indevidamente a hiptese nula. A probabilidade de ocorrncia do erro de Tipo I chama-se nvel de significncia do teste e representa-se por .
P [Erro de Tipo I] = P [rejeitar Ho | Ho verdadeira ]

Ao fixarmos o valor mximo de , estamos a limitar os custos incorridos ao poder tomar a deciso errada associada a este tipo de erro. Erro do Tipo II ou erro de 2 espcie O erro de Tipo II ocorre quando se decide no rejeitar H0 , sendo H0 falsa. A probabilidade de ocorrncia do erro de Tipo II representa-se por . Se H0 falsa, o verdadeiro valor do parmetro ser compatvel com a hiptese alternativa e como tal o valor de calculado em funo dos valores ( a ) que o parmetro toma, segundo a hiptese alternativa.

( a ) = 1 ( a ) = P [rejeitar Ho | Ho falsa] = P [rejeitar Ho | = a ] .


Quanto mais prximo a estiver de 0 , menos potente o teste, pois esta proximidade dificulta a distino entre os verdadeiros e os falsos valores.

( a ) = P [Erro de tipoII] = P [no rejeitar Ho | Ho falsa] = P [no rejeitar Ho | = a ]


O valor desta probabilidade diminui medida que o verdadeiro valor do parmetro , neste caso a se afasta de 0 . Voltando ao exemplo, vamos ver o significado dos erros possveis. Recordemos as hipteses a testar: H0 : 5 Ha : > 5 ___________________________________________________________________ 5
ISEL DEETC

3.4 ESTATSTICA DE TESTE E REGIES CRTICAS


A Estatstica de Teste uma funo das observaes amostrais cujo valor vai determinar a deciso a tomar, rejeitar ou no H0 . A estatstica de teste tem que ter distribuio conhecida, quando a hiptese nula verdadeira, e o seu valor calculado nesse pressuposto.

___________________________________________________________________ 6
ISEL DEETC

INFERNCIA ESTATSTICA

INFERNCIA ESTATSTICA

Regra de Deciso Estatstica uma regra que nos indica a deciso a tomar (rejeitar ou no H0 ), a partir da comparao do valor da estatstica de teste com um ou mais valores crticos (ser um valor critico para os testes unilaterais e dois para os testes bilaterais). 2) Fixar o nvel de significncia do teste ; 3) Escolher a estatstica de teste e identificar a respectiva distribuio amostral, no pressuposto de que a hiptese nula verdadeira; 4) Determinar a regio de rejeio (R. R.), de acordo com o valor fixado para , e com o tipo de teste. Definir a regra de deciso; Regio crtica ou de rejeio (R.C. ou R.R.) constituda por um conjunto de valores tomados pela estatstica de teste, que conduzem rejeio da hiptese nula. 5) Calcular o valor observado para a estatstica de teste. Por comparao deste valor com as regies de aceitao e de rejeio, proceder tomada de deciso rejeitar ou no H0 .

Regio de aceitao (R.A.) constituda por um conjunto de valores tomados pela estatstica de teste, que conduzem no rejeio da hiptese nula. Valor de prova - p ou p-value O valor de prova, p, define-se como o menor nvel de significncia, , a partir do qual se rejeita a hiptese nula. Calcular o valor de prova p, calcular a probabilidade do erro de 1 espcie, correspondente a rejeitar a hiptese nula para a amostra observada, ou seja, para o valor da estatstica de teste que foi observado. Fixado o nvel de significncia , a deciso de rejeitar a hiptese nula verifica-se se e s se p .

3.6 MINIMIZAO DOS ERROS


O ponto de separao entre uma diferena significativa e uma diferena no significativa depende do risco de cometer um erro de tipo I. Por exemplo, fixar = 0,05 significa que de 0,05 a probabilidade admitida para que a deciso de rejeitar H0 tenha sido errada. Ou seja, admite-se ser de 5% a probabilidade de que a amostra que deu origem ao valor da estatstica de teste pertencente regio de rejeio, no ter sido gerada por uma populao com as caractersticas definidas em H0 , quando realmente o foi. O ptimo seria conseguir simultaneamente minimizar os dois erros (erro de tipo I e erro de tipo II). No entanto, verifica-se que: Reduzir , significa diminuir a regio de aceitao, e portanto aumenta o valor da probabilidade associada ao erro de tipo I, . Reduzir , significa diminuir a regio de rejeio, e portanto aumenta o valor da probabilidade do erro de tipo II, . A nica forma de minimizar os dois tipos de erro em simultneo aumentar a dimenso da amostra. Esta possibilidade deve ser equacionada em termos da relao custo/benefcio, j que obter uma amostra de dimenso superior implica custos.

3.5 METODOLOGIA
A metodologia a utilizar na realizao de um teste de hipteses, envolve as seguintes etapas:

1) Formulao das hipteses H0 e Ha ; Consoante as hipteses formuladas, identificar o teste como:


Unilateral direito, quando Ha contiver a desigualdade>; Unilateral esquerdo quando Ha contiver a desigualdade <; Bilateral se Ha contiver a desigualdade ;

___________________________________________________________________ 7
ISEL DEETC

___________________________________________________________________ 8
ISEL DEETC

INFERNCIA ESTATSTICA

INFERNCIA ESTATSTICA

Para que seja mais acessvel entender como se realiza um teste de hipteses, vamos comear por dar um exemplo que retrata o caso mais simples A populao tem distribuio normal de parmetros e . A partir da populao que se caracteriza por X N ( , ) , obteve-se uma amostra aleatria de dimenso n, composta por variveis i.i.d. X1,..., X n , da qual se obtm uma realizao concreta, ( x1,..., xn ) .

caso de rejeitar Ho . A hiptese alternativa reflecte a posio do comprador.

2) Fixar o nvel de significncia do teste; Nvel de significncia do teste: = 0,05 (valor fixado partida) Na ausncia de informao sobre o valor de , os valores geralmente utilizados so 5%, 2,5% e 1%. 3) Escolha da estatstica de teste e identificao da respectiva distribuio

Exemplo

3.2:

Uma

empresa de

apresentou bolachas e

uma

nova

mquina que

para o

amostral; Neste caso estamos a realizar inferncia sobre a mdia populacional , numa populao com distribuio normal, com desvio padro conhecido. Recordando as distribuies amostrais abordadas, sabemos que a estatstica amostral a utilizar para inferir sobre o parmetro populacional a mdia amostral, X . Na condio da hiptese nula ser verdadeira, sabemos tambm que a distribuio amostral da estatstica :

empacotamento

automtico

divulgou

garantia

empacotamento de uma mdia de 60 pacotes por minuto, com um desvio padro de 3 pacotes. O nmero de pacotes embalados por minuto segue uma distribuio aproximadamente normal. Uma fbrica de bolachas ps a mquina experincia nas suas instalaes e, registando o nmero de pacotes embalados em 25 perodos de um minuto, constatou uma mdia de 58 pacotes embalados. O comprador potencial diz que a mquina no garante atingir a mdia de 60 pacotes por minuto. Por seu lado, o vendedor garante que a diferena encontrada se deve apenas ao acaso e que de modo nenhum pe em causa a mdia publicitada. 1) Formulao das hipteses;

X N 0 , o que, procedendo estandardizao equivalente a n X 0 Z= N ( 0,1) .


n
Atendendo aos dados fornecidos neste exemplo, e considerando verdadeira a 3 hiptese nula, temos X N 60, . 5 Por outro lado, o valor observado de X , para a amostra dada x = 58 . O que se pretende averiguar se de facto o valor mdio da amostra de 58

Ho : = 60 vs Ha : < 60
Pretende-se verificar se a diferena encontrada mesmo devido ao acaso, isto , se no h evidncia estatstica para rejeitar a hiptese de que a mdia seja igual a 60. A hiptese nula reflecte a posio do vendedor. At prova em contrrio, o comprador deposita confiana na informao dada pelo vendedor. A metodologia do teste procurar validar Ho . Se a evidncia da amostra fornecer informao (mdia amostral) significativamente inferior a 60, ento rejeita-se

pacotes por minuto compatvel com a veracidade da hiptese nula. Como a hiptese alternativa, Ha : < 60 , aponta para valores que se encontram esquerda do valor dado pela hiptese nula, tendo fixado a probabilidade de rejeitar indevidamente H0 em 0,05 (nvel de significncia de 5%), a regio crtica vai situar-se na aba esquerda. 4) Determinar a regio de rejeio de acordo com o valor fixado para , e definir a regra de deciso; ___________________________________________________________________ 10
ISEL DEETC

Ho .
A hiptese alternativa consistir naquilo que se considera razovel aceitar, no ___________________________________________________________________ 9
ISEL DEETC

INFERNCIA ESTATSTICA

INFERNCIA ESTATSTICA

A regra de deciso consiste em definir a aco a tomar (rejeio ou no da hiptese nula) face ao resultado da amostra. Vamos determinar duas regies complementares: regio crtica ou de rejeio e regio de no rejeio ou de aceitao.

Se z > -1.645, no rejeitar H0

Com os dados deste exemplo obtemos o valor observado da estatstica de teste: 58 60 Zobs = = 3,333 < 1 ,645 , pelo que se decide rejeitar H0 , dado que o 3/5 valor observado pertence regio critica. Na tomada de deciso, em alternativa ao processo anterior, podemos definir a

Com Z =

X 0

N ( 0,1) , por consulta da tabela da funo de distribuio da

regra de deciso em funo de X , determinando o valor crtico xc , que por comparao com o valor observado de X , permite tomar a deciso de rejeitar ou no a hiptese nula. Regra de deciso em funo da mdia amostral X :

n
Normal reduzida, obtemos o valor de z para o qual a probabilidade acumulada igual a 0,05, ou seja, por inverso:

(0,05) = (1 0,05) = (0,95) = 1,645 , logo z0,05 = 1,645.


Na figura 3.1 identificamos a tracejado a regio crtica deste teste unilateral esquerdo. Temos assim R.R. :] , 1,645] e R.A. :] 1,645, +[ .
densidade da N (0,1)

Na figura 3.2 apresenta-se esquerda a regio crtica (a tracejado) e direita a regio de aceitao, agora em funo do valor crtico xc .

Figura 3.2

Figura 3.1

Vamos ver como proceder para calcular xc : Fixar o nvel de significncia em 5% ( = 0,05 ), quer dizer que a probabilidade de rejeitar a hiptese nula quando ela verdadeira de 0,05.
P [rejeitar H0 | H0 verdadeira ] = 0,05 P X xc | = 0 = 60 = 0,05 X 0 xc 60 x 60 x 60 P = 0,05 P Z c = 0,05 c = 1(0,05) 0,6 0,6 0,6 n xc 60 = 1,645 xc = 59,01. 0,6

A deciso tem origem na comparao do valor da estatstica de teste (o valor da abcissa dado por

x 0

) com o quantil da funo de distribuio da normal

n
reduzida. Vamos rejeitar a hiptese nula se o valor observado da estatstica de teste pertencer regio crtica. O facto de utilizarmos o valor da abcissa estandardizada facilita, dado assim ser possvel consultar os valores crticos da tabela da distribuio normal. Regra de deciso em funo da varivel Z: Se z -1.645, rejeitar H0 ___________________________________________________________________ 11
ISEL DEETC

Com x o valor observado de X , temos as seguintes possibilidades: - se x 59.01, deve rejeitar-se H0 ; ___________________________________________________________________ 12
ISEL DEETC

INFERNCIA ESTATSTICA

INFERNCIA ESTATSTICA

- se x > 59.01, no se deve rejeitar H0 .

alterao pode conduzir a outras decises, quando se utiliza a mesma evidncia da realidade, isto , a mesma amostra.

O valor fornecido pela amostra, x = 58 <59,01, pertence regio crtica, o que nos leva a decidir rejeitar a hiptese nula, como j se sabia pela primeira alternativa de resoluo apresentada. A diferena entre o valor da mdia amostral (58), e o valor proposto para o valor mdio da populao (60), suficientemente grande, para, face ao nvel de significncia pr-estabelecido, concluirmos que a populao de onde proveio a amostra no a mesma que o vendedor caracterizou.

Interpretao do Erro de Tipo II e da potncia do teste para este exemplo tambm importante conhecer a probabilidade de no rejeitar H0 , quando esta falsa, ou seja, conhecer a probabilidade de cometer um erro do Tipo II, tambm designado por erro de 2 espcie. Ao nvel de 5%, no rejeitamos H0 , se o valor observado para X for superior a 59,01. Uma vez que a hiptese alternativa composta, para calcular a probabilidade do erro de 2 espcie, , fazemo-lo para trs valores alternativos da verdadeira mdia do nmero de pacotes embalados, Se a = 59 temos:

Regra de deciso em funo do valor de prova p: Quando se opta por utilizar o valor de prova p para tomar a deciso, o que vamos fazer comparar o nvel de significncia pr-fixado com a probabilidade de cometer um erro de tipo I, associado ao valor observado para a estatstica de teste.

( a = 59) = P [norejeitar H0 | a = 59] = P [ X > 59,01| a = 59] =


X a 59,01 59 =P > = 1 P (Z 0,0167) = 1 (0,0167) = 0,493. 0,6 n
Com = 0,05 , a potncia do teste, para este valor da hiptese alternativa ser dada por:

valor-p = P (Z < Zobs ) = P (Z < 3,333) = ( 3,333) = 0,00043 = 0,043% .


Para o nvel de significncia de 0,05, rejeita-se a hiptese nula, j que o valor da abcissa estandardizada corresponde a uma probabilidade muito inferior a 5%.

Quando se utiliza um software especfico para estatstica ou a folha de clculo Excel para realizar o ensaio de hipteses, decide-se em funo de valor de prova-p, j que este aparece sempre no output. Interpretao do Erro de Tipo I para este exemplo Associada a esta deciso temos uma probabilidade de 0,05 de cometer um erro do Tipo I, ou seja, estamos dispostos a decidir rejeitar a hiptese nula (no adquirir a mquina), mesmo que esta na realidade empacote uma mdia de 60 pacotes por minuto, com uma probabilidade de 0,05. Podemos ser um pouco mais exigentes e procurar reduzir a probabilidade de cometer um erro do Tipo I, o que se consegue fixando o nvel de significncia num valor inferior. Esta

P [rejeitar H0| H0 falsa] = 1 0,493 = 0,507.


Se a = 58 temos:

( a = 58) = P [norejeitar H0 | a = 58] = P [ X > 59,01| a = 58] =


X a 59,01 58 =P > = 1 P (Z 1,683) = 1 (1,683) = 1 0,953 = 0,046. 0,6 n
Com = 0,05 , a potncia do teste, para este valor da hiptese alternativa ser o completar desta probabilidade, ou seja:

P [rejeitar H0| H0 falsa] = 1 0,0462 = 0,9538.


Se a = 57 temos:

___________________________________________________________________ 13
ISEL DEETC

___________________________________________________________________ 14
ISEL DEETC

INFERNCIA ESTATSTICA

INFERNCIA ESTATSTICA

( a = 57) = P [norejeitar H0 | a = 57] = P [ X > 59,01| a = 57] =


X a 59,01 57 =P > = 1 P (Z 3,35) = 1 (3,35) = 0,0004. 0,6 n
A potncia do teste vai por consequncia aumentar. Para este valor da hiptese alternativa temos:

de dimenso n, composta por variveis i.i.d. X1,..., X n , da qual resultou uma realizao concreta ( x1,..., xn ) . Pretende-se realizar um teste de hipteses para a mdia da populao .

Se a varincia for conhecida (caso do exemplo tratado), e a distribuio da populao normal, a estatstica de teste a utilizar :

P [rejeitar H0| H0 falsa] = 1 0,0004 = 0,9996.

Z=

X 0

N ( 0,1)

Concluses para o teste unilateral esquerdo: Verifica-se que o valor de diminuiu medida que o verdadeiro valor de se afasta de 0 . Realmente torna-se mais difcil errar medida que o valor verdadeiro do parmetro se afasta do valor proposto pela hiptese nula. Ao contrrio do que foi observado para , quanto mais prximo do valor de
amostral.)

n
(Note-se que neste caso a estatstica de teste e a sua distribuio independente da dimenso

Se a distribuio da populao no for conhecida, com a varincia conhecida e a amostra grande, n > 30 , a estatstica de teste a utilizar :

0 estiver o valor de a , menos potente o teste, o que quer dizer que tem
menos capacidade para decidir de modo acertado. Nota: Se realizarmos este tipo de estudo para um teste unilateral direito ou para um teste bilateral constatamos que o tipo de hiptese alternativa condiciona a forma da funo potncia.

Z=

X 0

N ( 0,1) (esta distribuio amostral um resultado do Teorema do

n
Limite Central)

Apresentam-se esquematicamente na figura 3.3 as regies crticas, definidas em termos da varivel Z, para o teste de hipteses para a mdia, H0 : = 0 , considerando os trs tipos de teste: bilateral e unilateral direito e esquerdo. Tipo de Teste

Ha : 0
Bilateral

H a : > 0
Unilateral direito

H a : < 0
Unilateral esquerdo

3.7 TESTES DE HIPTESE PARA UMA POPULAO


Vamos agora apresentar e caracterizar os testes de hiptese para um parmetro Teste Z
Quando a estatstica de teste tem distribuio exacta ou aproximadamente normal reduzida.

de uma populao. A estatstica de teste que vamos utilizar e a sua


distribuio amostral depende da distribuio da populao, do conhecimento ou no do parmetro de escala e da dimenso da amostra.

Figura 3.3

3.7.1 Teste de Hiptese para a mdia Vamos supor uma populao a partir da qual se obteve uma amostra aleatria ___________________________________________________________________ 15
ISEL DEETC

Se a varincia for desconhecida, que o caso que mais prximo est da ___________________________________________________________________ 16
ISEL DEETC

INFERNCIA ESTATSTICA

INFERNCIA ESTATSTICA

realidade, teremos de estimar o desvio padro da populao pois necessitamos dele para calcular o valor do desvio padro do estimador X . Um processo bastante intuitivo ser utilizar como estimador de , no caso de amostras
2

Ha : 0
Tipo de Teste
Bilateral

H a : > 0
Unilateral direito

H a : < 0
Unilateral esquerdo

pequenas, a varincia amostral corrigida


S 2 =

( X
i =1

X )2 S 2' =

X
i =1

2 i

nX 2

Teste T
Quando a estatstica de teste tem distribuio T-Student.

n 1

n 1
' 2'

e respectivo desvio padro amostral corrigido S = S . No caso de amostras grandes utilizamos a varincia amostral

Figura 3.4

S2 =

( X
i =1

X )2 S2 =

X
i =1

2 i

nX 2

Exemplo 3.3: Teste de Hipteses para a mdia de uma populao normal com varincia desconhecida ( n 30 ) Foram medidos em quilogramas os aumentos de peso (da nascena aos seis meses) de 7 crianas do sexo feminino escolhidas ao acaso entre um grupo de

e respectivo desvio padro amostral S = S 2 .

Neste caso a estatstica de teste que se utiliza, j no tem a mesma distribuio amostral, sob a veracidade da hiptese nula, ver Pestana, D. (2006). Temos agora uma outra varivel aleatria cuja distribuio amostral a T-Student, (Student 1908). Assim, para pequenas amostras ( n 30 ), utiliza-se a estatstica de teste

crianas com seis meses de idade. 3,6 2,8 3,6 4,1 4,1 4,5 3,2 (a) Ao nvel de significncia de 5%, poder dizer-se que o aumento mdio de peso superior a 3,1Kg? (b) A partir de que nvel de significncia a hiptese testada na alnea anterior rejeitada? (c) Calcula a potncia do teste para a = 3,4 .

X 0 T = t n 1, S n
e para amostras grandes, n > 30 , utiliza-se a distribuio amostral limite da TStudent que aproximadamente normal,

Resoluo:

T =

X 0 N (0,1) . S n

Seja a varivel X : aumento de peso, em Kg, numa criana do sexo feminino com seis meses de idade.

A figura 3.4 apresenta esquematicamente as regies crticas definidas em termos da varivel T, para o teste de hipteses mdia H0 : = 0 , considerando os trs tipos de teste: bilateral e unilateral direito e esquerdo.

X N ( , ) = 0,05
Sobre a amostra: n = 7 x = 3,7 s 2 = 0,34 s = 0,34 = 0,5831 (a) Vamos testar H0 : 3,1 vs Ha : > 3,1 Trata-se de um teste unilateral direito

___________________________________________________________________ 17
ISEL DEETC

___________________________________________________________________ 18
ISEL DEETC

INFERNCIA ESTATSTICA

INFERNCIA ESTATSTICA

Estatstica de teste: T =

X 0 t n 1 S n

3.7.2 Teste de Hiptese para a varincia Considerando uma populao normal podemos estar interessados em realizar um teste de hipteses varincia da populao. Sendo S 2 um estimador no enviesado de 2 , e conhecida a distribuio amostral da estatstica

Regio de aceitao (R.A.): ] , t 6;0,95 [ =] ,1,943[ Regio de rejeio ou crtica (R.R.): [t 6;0,95 , +[ = [1 ,943, +[ Valor observado para a estatstica de teste no pressuposto da veracidade da hiptese nula: Tobs =

3,7 3,1 = 2,7225 R.R. 0,5831/ 7

Q=

(n 1).S 2
2 0

2 n 1 , esta a estatstica a utilizar.

Deve rejeitar-se a hiptese nula, ao nvel de significncia de 5%, o que quer dizer que a amostra contm evidncia estatstica de que o aumento mdio de peso nas crianas do sexo feminino com seis meses de idade de facto superior a 3,1Kg.

A figura 3.5 apresenta esquematicamente as regies crticas definidas em


2 , termos da varivel Q, para o teste de hipteses varincia H0 : 2 = 0

considerando os trs tipos de teste: bilateral e unilateral direito e esquerdo.

(b) O que se pede o valor de prova p.

Tipo de Teste

2 Ha : 2 0

2 Ha : 2 > 0

2 Ha : 2 < 0

Bilateral

Unilateral direito

Unilateral esquerdo

P (T > Tobs ) = P (T > 2,7225) = 1 P (T 2,7225) = 1 0,9827 = 0,0173.

Teste 2
Quando a estatstica de teste tem distribuio do Qui-quadrado.

Para valores do nvel de significncia superiores a 1,73% a hiptese nula rejeitada, o que quer dizer que valor-p 0,0173. (c) (3,4) = 1 (3,4) = P (rejeitar H0 | H0 ser falsa) . Como o teste unilateral direito, rejeita-se a hiptese nula quando

Figura 3.5

Exemplo 3.4: Teste de Hipteses para a varincia Para verificar se um determinado aparelho de medio de alta preciso ainda funciona com as caractersticas exigidas foram observadas 20 medies e calculado o desvio padro amostral corrigido, s = 0,013 mm . Admitindo que as referidas medies se podem considerar gaussianas, ao nvel de significncia de 5%, poder-se- concluir que o verdadeiro desvio padro populacional de 0,01mm? Resoluo: Seja a varivel X : medies efectuadas pelo aparelho em mm.

Tobs > t n 1;1

x 0 0,5831 > 1,9432 x > 1,9432 + 3,1 x > 3,528 , 7 s / n

logo

xc = 3,528 , vindo para a potncia correspondente a a = 3,4 ,

(3,4) = P ( X > 3,528 | a = 3,4) = 1 P (T


= 0,7087.

3,528 3,4 0,5831/ 7

) = 1 P (T 0,580786) = 1 0,291 =

A potncia do teste de aproximadamente 71%, ou seja, de 71% a probabilidade de tomar uma deciso acertada, rejeitar a hiptese nula quando esta falsa. ___________________________________________________________________ 19
ISEL DEETC

X N ( , ) = 0,05
___________________________________________________________________ 20
ISEL DEETC

INFERNCIA ESTATSTICA

INFERNCIA ESTATSTICA

Sobre a amostra: n = 20

s = 0,013

(a) Vamos testar H0 : = 0,01 vs Ha : 0,01 Trata-se de um teste bilateral Estatstica de teste: Q =

Z0 =

p0 (1 p0 ) n

p0 p

N ( 0;1) .

(n 1).S 2

2 0

2 n 1

Como a estatstica de teste tem distribuio aproximadamente normal, temos um teste Z tal como se verificou no teste de hipteses para a mdia com varincia conhecida. A figura 3.6 apresenta esquematicamente as regies crticas definidas em termos da varivel Z, para o teste de hipteses proporo populacional,

Regio de aceitao (R.A.): ]8,907,32,85[ Regio crtica (R.R.): [0,8.907] [32.85, +[ , onde
2 2 8,907 = 19;0,025 e 32,85 = 19;0,975 .

Valor observado para a estatstica de teste no pressuposto da veracidade da hiptese nula: Qobs =

H0 : p = p0 , considerando os trs tipos de teste: bilateral e unilateral direito e


esquerdo.

(n 1).S 2
2 0

= 19

0,0132 = 32,11 0,012

Como 32,11 se encontra na regio de aceitao, conclui-se ao nvel de significncia de 5%, que o verdadeiro desvio padro de 0,01 mm.

Tipo de Teste

Ha : p p0
Bilateral

Ha : p > p0
Unilateral direito

Ha : p < p0
Unilateral esquerdo

Para calcular o valor de prova p, como temos um teste bilateral, procede-se da seguinte forma:
= 2 min {P (Q < 32,11), P (Q > 32,11)} = 2 min{0,9696;0,0304} = 0,0607. p value = P (rejeitar H0 | H0 verdadeira) = P (Qobs R.C. | = 0 ) =

Teste Z
Quando a estatstica de teste tem distribuio exacta ou aproximadamente normal reduzida.

Para este teste a hiptese nula rejeitada para nveis de significncia superiores a 6,07%.

Figura 3.6

3.8 TESTES DE HIPTESE PARA DUAS POPULAES


Vamos, no que se segue, apresentar o teste de hipteses a utilizar quando o objectivo comparar duas populaes.

3.7.3 Teste de Hiptese para a proporo Considerando agora uma populao de Bernoulli, a partir da qual se obteve uma amostra aleatria de dimenso grande (n> 30), composta por variveis i.i.d. X1,..., X n , da qual resultou uma realizao concreta ( x1,..., xn ) . Pretende-se realizar um teste de hipteses para a mdia da populao, que neste caso a proporo populacional p, o parmetro da distribuio de Bernoulli que representa a probabilidade de sucesso numa prova de Bernoulli. Assim, para amostras grandes, a distribuio amostral do estimador de p,

3.8.1 Teste de Hiptese para a diferena de duas mdias Vamos considerar duas populaes X1 e X 2 , cujas mdias so respectivamente

1 e 2 . Destas populaes so retiradas de forma aleatria duas amostras


independentes de dimenso n1 e n2 , cujas mdias amostrais so X1 e X 2 respectivamente. ___________________________________________________________________ 22
ISEL DEETC

, X=p
___________________________________________________________________ 21
ISEL DEETC

INFERNCIA ESTATSTICA

INFERNCIA ESTATSTICA

Pretende-se realizar um teste de hipteses para comparar as duas mdias populacionais, portanto vamos realizar um teste relativo diferena 1 2 . As nossas hipteses, tendo em conta os trs tipos de teste so:
H0 : 1 2 = 0 vs Ha : 1 2 0 teste bilateral

amostras tenham dimenso superior a 30, utiliza-se a mesma estatstica de teste, no entanto a sua distribuio amostral, obtida pelo Teorema do Limite central, aproximadamente normal.) (Nota 2: Se as duas populaes tiverem distribuio normal ou outra, caso as varincias sejam desconhecidas, para amostras grandes ( n1> 30 e n2 > 30 ), usam-se as varincias amostrais, e a estatstica

1 2 > 0 teste unilateral direito 1 2 < 0 teste unilateral esquerdo

Z0 =
2 conhecidas a Se as populaes forem normais com varincias 12 e 2

(X

X 2 ( 1 2 )0
2 S12 S2 + n1 n2

N ( 0;1) ).

distribuio amostral do estimador, X1 X 2 , da diferena, 1 2 , :

2 no so Deve ter-se conscincia que frequentemente, as varincias 12 e 2

Z0 =

(X

X 2 ( 1 2 )0

12
n1

2 2

N ( 0;1)

conhecidas. Nesse caso, temos de ter um teste que nos permita testar a igualdade das mdias populacionais sem conhecer os verdadeiros valores
2 12 e 2 . bastante mais simples desenvolver este teste, quando, embora

n2

desconhecidas, as varincias se podem admitir iguais (caso em que se diz existir O que se passa neste caso, de facto simples pois sabemos do estudo das distribuies amostrais que:
2 ). homocedasticidade 2 = 12 = 2

X1 N 1, 1 e X 2 N 2 , 2 n n2 1

No caso em que as varincias so desconhecidas, parece mais lgico primeiramente testar a igualdade das varincias e num segundo passo optar com racionalidade pela estatstica de teste mais favorvel para testar a hiptese nula de igualdade das mdias. 3.8.2 Teste de Hiptese para a igualdade de duas varincias em Populaes Normais Vamos considerar duas populaes normais X1 e X 2 , cujas mdias so respectivamente 1 e 2 . Destas populaes so retiradas de forma aleatria duas amostras independentes de dimenso n1 e n2 , respectivamente. Vamos realizar um teste que permita comparar as duas varincias. Dado que conhecemos os estimadores amostrais das varincias populacionais
2 12 e 2 :

por outro lado, estas ltimas so mdias de amostras aleatrias independentes, o que nos permite escrever a distribuio amostral da diferena,
2 2 X1 X 2 N 1 2 , 1 + 2 , n1 n2

que, quando a hiptese nula verdadeira ( 1 2 = 0 ), vem,


2 2 X1 X 2 N 0, 1 + 2 . n1 n2

Mais uma vez temos um teste Z, cujas regies de rejeio e aceitao j foram estudadas anteriormente.

(Nota 1: este resultado vlido para amostras grandes ou pequenas. No caso em que as duas populaes no tenham distribuio normal, mas as duas ___________________________________________________________________ 23
ISEL DEETC

___________________________________________________________________ 24
ISEL DEETC

INFERNCIA ESTATSTICA

INFERNCIA ESTATSTICA

= S1
2

( X
i =1

n1

1i

X1 )2

n1 1

S =
2 1

X
i =1 n2

n1

2 1i

nX12

Kg, dessas crianas.


Sup. A Sup. B

n1 1

2,7 3,2 3,6 4,1 2,7 3,2 4,5 3,6 2,7 4,1 4,5 3,6 2,7 3,6 3,2 4,1

S =
2 2

( X
i =1

n2

2i

X 2 )2

n2 1

= S2
2

X
i =1

2 2i

nX 22

n2 1

bem como a distribuio amostral da estatstica hiptese nula vem:


2 S 2 F= 2 F ( n1 1; n2 1) . S 1 0 2 1 2 2

2 S1 , que sob a veracidade da 2 S2

Supondo que as referidas crianas tinham nascena pesos idnticos e que os seus pesos se podem considerar normais, pretende-se: (a) Ao nvel de significncia de 5%, concluir se a variabilidade populacional dos dois grupos igual; (b) Determinar o valor de prova - p e a sua interpretao;

A figura 3.7 apresenta esquematicamente as regies crticas definidas em


2 termos da varivel F, para o teste igualdade das varincias, H0 : 12 = 2

Resoluo: (a) Considerem-se as variveis:

considerando os trs tipos de teste: bilateral e unilateral direito e esquerdo.

X1 : ganho em peso medido em Kg das crianas sujeitas ao suplemento A X 2 : ganho em peso medido em Kg das crianas sujeitas ao suplemento B
Tipo de Teste
2 Ha : 12 2

Bilateral

Ha :

2 1

>

2 2

Ha : <
2 1

2 2

X1 N ( 1, 1 ) e X 2 N ( 2 , 2 )
Sobre as amostras temos:
2 = 0,4150 n1 = 9 x1 = 3,3667 s1 2 = 0,3714 n2 = 7 x2 = 3,6857 s2

Unilateral direito

Unilateral esquerdo

Teste F
Quando a estatstica de teste tem distribuio F-Snedcor.

Vamos testar as hipteses:


2 2 2 H0 : 1 = 1 vs Ha : 12 2 H0 :

12 2 = 1 vs Ha : 1 1 (temos um teste bilateral) 2 2 2 2

Estatstica de teste:

F=
Figura 3.7

2 2 2 S1 F ( n1 1; n2 1) , com n1 1 = 15 e n2 1 = 20 2 12 0 S2

Exemplo 3.5: Teste de Hipteses para o quociente de duas varincias No primeiro ano de vida dois grupos aleatrios de crianas foram sujeitos a diferentes suplementos vitamnicos designados por suplemento A e suplemento B. Os dados que se seguem representam duas amostras dos ganhos de peso, em

Regio de aceitao (R.A.): ]F8;6;0,025 ; F8;6;0,975 [ = ]0,215;5,6[ Regio de rejeio (R.R.): [0; F8;6;0,025 ] [F8;6;0,975 , +[ = [0;0,215] [5,6; +[ Valor observado para a estatstica de teste no pressuposto da veracidade da hiptese nula: F0 bs =

0,4150 1 = 1,1173 R.A. 0,3714

___________________________________________________________________ 25
ISEL DEETC

___________________________________________________________________ 26
ISEL DEETC

INFERNCIA ESTATSTICA

INFERNCIA ESTATSTICA

Como 1,1173 se encontra na regio de aceitao, conclui-se ao nvel de significncia de 5%, que a verdadeira variabilidade nos pesos no diferente quando se utiliza o suplemento A ou B. (b) valor de prova p:
p value = P (rejeitar H0 | H0 verdadeira) = P (Fobs R.C. |

vo fornecer informao para estimar 2 . As dimenses amostrais so utilizadas como factores de ponderao, pois a amostra de maior dimenso contribui com mais informao para estimar 2 . A estatstica de teste a utilizar :

= 2 min {P (F < 1,1173);1 P (F < 1,1173)} = 2 min{0,5409;0,4591} = 0,9181.

12 = 1) = 2 2

T =

(X

X 2 ( 1 2 )0
2 1

( n1 1) s

A hiptese nula s rejeitada para nveis de significncia superiores a 91,81%. 3.8.3 Teste de Hiptese para a igualdade de mdias em Populaes normais com varincias desconhecidas 3.8.3.1 Varincias desconhecidas mas iguais = =
2 1 2 2 2

2 + ( n2 1) s2 n1 + n2 2

1 1 + n1 n2

t n1 + n2 2

Exemplo 3.6: Teste de Hipteses para a comparao de mdias com varincias


2 2 = 2 =2 desconhecidas mas iguais 1

(Exerccio proposto) Para estudar dois tipos de combustvel, foram recolhidas duas amostras aleatrias de 15 carros do mesmo modelo. Todos os carros da amostra 1 foram abastecidos com o combustvel A e todos os carros da amostra 2 foram abastecidos com o combustvel B. Obtiveram-se os seguintes resultados

Vamos considerar duas populaes normais X1 e X 2 , cujas mdias so respectivamente 1 e 2 . Destas populaes so retiradas de forma aleatria duas amostras independentes cujas mdias so X1 e X 2 e as dimenses

n1 30 e n2 30 , respectivamente.
Pretende-se realizar um teste de hipteses para comparar as duas mdias populacionais, portanto vamos realizar um teste relativo diferena 1 2 . As nossas hipteses, tendo em conta os trs tipos de teste so:
H0 : 1 2 = 0 vs Ha : 1 2 0 teste bilateral

2 = 2,97 s2 2 = 2,41 . Pretende-se realizar amostrais: x1 = 19,13 x2 = 19,467 s1


um teste de hipteses igualdade das duas mdias populacionais, utilizando um nvel de significncia de 1% e supondo que as populaes so normais.

2 3.8.3.2 Varincias desconhecidas mas diferentes 12 2

Consideramos agora que temos duas populaes normais X1 e X 2 , cujas mdias so 1 e 2 e desvio-padro 1 e 2 , desconhecidos e diferentes (concluso obtida para um determinado nvel de significncia, atravs de um teste igualdade das varincias). Destas populaes so retiradas de forma aleatria duas amostras independentes de pequena dimenso

1 2 > 0 teste unilateral direito 1 2 < 0 teste unilateral esquerdo


Neste caso a hiptese de igualdade das mdias populacionais conjugada com a igualdade das varincias (usualmente este pressuposto testado previamente com o teste de quociente de varincias), conduz a considerarmos que as duas populaes so homogneas. Vamos utilizar uma vez mais os estimadores
2 2 e S2 2 , das varincias populacionais 12 e 2 . As duas amostras amostrais, S1

( n1 30 e n2 30 ), com as mdias amostrais X1 e X 2 respectivamente. Utilizando a aproximao de Welch-Satterthwaite, vamos utilizar a estatstica de teste:

___________________________________________________________________ 27
ISEL DEETC

___________________________________________________________________ 28
ISEL DEETC

INFERNCIA ESTATSTICA

s1 2 s 2 2 + X1 X 2 ( 1 2 )0 n1 n2 = T = . tv , com v 4 s1 s 4 2 s 2 2 s1 + 2 2 + 2 n1 (n1 1) n2 (n2 1) n1 n2

___________________________________________________________________ 29
ISEL DEETC