Você está na página 1de 32

INE 7002 - Inferncia Estatstica Testes de Hipteses 1

10 INFERNCIA ESTATSTICA Testes de Hipteses

10.1 - Introduo

Viu-se anteriormente que uma determinada populao pode ser descrita atravs de um
modelo probabilstico, que apresenta caractersticas e parmetros. Muitas vezes estes parmetros
so desconhecidos e h interesse em estim-los para obter um melhor conhecimento sobre a
populao: retira-se ento uma amostra aleatria da populao e atravs das tcnicas de Estimao
de Parmetros1 procura-se obter uma estimativa de algum parmetro de interesse, e associamos
uma probabilidade de que a estimativa esteja correta. A Estimao de Parmetros uma subdiviso
da Inferncia Estatstica (que consiste em fazer afirmaes probabilsticas sobre o modelo
probabilstico da populao a partir de uma amostra aleatria desta populao), a outra grande
subdiviso constitui os Testes de Hipteses.

Contrariamente Estimao de Parmetros os Testes de Hipteses permitem fazer


inferncias sobre outras caractersticas do modelo probabilstico da populao alm dos parmetros
(como, por exemplo, a forma do modelo probabilstico da populao). Quando os Testes so feitos
sobre os parmetros da populao so chamados de Testes Paramtricos, e quando so feitos sobre
outras caractersticas so chamados de Testes No Paramtricos2. No obstante vamos nos restringir
aos Testes Paramtricos3.

10.2 - Lgica dos Testes de Hipteses

Imagine-se que um determinado pesquisador est interessado em alguma caracterstica de


uma populao. Devido a estudos prvios, ou simplesmente por bom senso (melhor ponto de partida
para o estudo) ele estabelece que a caracterstica ter um determinado comportamento. Formula
ento uma hiptese estatstica sobre a caracterstica da populao, e esta hiptese aceita como
vlida at prova estatstica em contrrio.

Para testar a hiptese coletada uma amostra aleatria representativa da populao, sendo
calculadas as estatsticas necessrias para o teste. Naturalmente (devido ao fato de ser utilizada uma
amostra aleatria) haver diferenas entre o que se esperava (sob a condio da hiptese verdadeira)
e o que realmente foi obtido na amostra. A questo a ser respondida : as diferenas so
significativas o bastante para que a hiptese estatstica estabelecida seja rejeitada? Esta no uma
pergunta simples de responder: depender do que est sob teste (que parmetro, por exemplo), da
confiabilidade desejada para o resultado, etc. Basicamente, porm, ser necessrio comparar as
diferenas com uma referncia (a distribuio amostral de um parmetro, por exemplo), que supe
que a hiptese sob teste verdadeira: a comparao costuma ser feita atravs de uma estatstica de
teste que envolve os valores da amostra e os valores sob teste.

A tomada de deciso feita da seguinte forma:

1
Ver o Captulo 9.
2
Na realidade a denominao correta deveria ser Testes dependentes de distribuio de referncia (porque para fazer
inferncias sobre os parmetros devemos supor que o modelo probabilstico populacional normal, por exemplo, ou
que a distribuio amostral do parmetro pode ser aproximada por uma normal), e Testes livres de distribuio
(porque os Testes No Paramtricos no exigem que os dados tenham uma aderncia a um certo modelo).
3
Ao leitor interessado em Testes No Paramtricos recomenda-se a referncia: SIEGEL, S. Estatstica No Paramtrica
(para as Cincias do Comportamento); McGraw-Hill, So Paulo, 1975. uma boa referncia no assunto, em portugus.
INE 7002 - Inferncia Estatstica Testes de Hipteses 2

- se a diferena entre o que foi observado na amostra e o que era esperado (sob a condio da
hiptese verdadeira) no for SIGNIFICATIVA a hiptese ser aceita.
- se a diferena entre o que foi observado na amostra e o que era esperado (sob a condio da
hiptese verdadeira) for SIGNIFICATIVA a hiptese ser rejeitada.

O valor a partir do qual a diferena ser considerada significativa ser determinado pelo
Nvel de Significncia do teste. O Nvel de Significncia geralmente fixado pelo pesquisador,
muitas vezes de forma arbitrria, e tambm ser a probabilidade de erro do Teste de Hipteses: a
probabilidade de cometer um erro no teste, rejeitando uma hiptese vlida. Como a deciso do teste
tomada a partir dos dados de uma amostra aleatria da populao h SEMPRE a probabilidade de
estar cometendo um erro, mas com a utilizao de mtodos estatsticos possvel calcular o valor
desta probabilidade4. O Nvel de Significncia uma probabilidade, portanto um nmero real que
varia de 0 a 1 (0 a 100%), e como a probabilidade de se cometer um erro no teste interessante
que seja o mais prximo possvel de zero: valores tpicos so 5%, 10%, 1% e at menores
dependendo do problema sob anlise. Contudo, no possvel usar um Nvel de Significncia igual
a zero porque devido ao uso de uma amostra aleatria sempre haver chance de erro, a no ser que a
amostra fosse do tamanho da populao. O complementar do Nvel de Significncia chamado de
Nvel de Confiana, pois ele indica a confiabilidade do resultado obtido, a probabilidade de que a
deciso tomada esteja correta5.

10.3 - Tipos de Hipteses

Para realizar um Teste de Hipteses necessrio definir (enunciar) duas Hipteses


Estatsticas complementares (que abrangem todos os resultados possveis): a chamada Hiptese
Nula (denotada por H0) e a Hiptese Alternativa (denotada por H1 ou Ha). Enunciar as hipteses
o primeiro e possivelmente mais importante passo de um Teste de Hipteses, pois todo o
procedimento depender dele.

A Hiptese Nula (H0) a hiptese estatstica aceita como verdadeira at prova estatstica em
contrrio: pode ser o ponto de partida mais adequado para o estudo, ou exatamente o contrrio do
que o pesquisador quer provar (ou o contrrio daquilo que o preocupa).

A Hiptese Alternativa (H1), que ser uma hiptese complementar de H0, fornecer uma
alternativa hiptese nula: muitas vezes justamente o que o pesquisador quer provar (ou o que o
preocupa).

Quando as hipteses so formuladas sobre os parmetros do modelo probabilstico da


populao o Teste de Hipteses chamado de Paramtrico. Quando as hipteses so formuladas
sobre outras caractersticas do modelo o Teste chamado de No Paramtrico.

A deciso do teste consiste em ACEITAR ou REJEITAR a Hiptese Nula (H0): vai-se


aceitar ou no a hiptese at ento considerada verdadeira.

importante ter a noo exata do que significa ACEITAR ou REJEITAR a Hiptese Nula
(H0). A deciso tomada sobre esta hiptese e no sobre a Hiptese Alternativa porque a

4
Usando outros mtodos (empricos) no h como ter idia da chance de erro (pode ser um erro de 0% ou de 5000%...).
5
O leitor deve estar lembrado destes dois conceitos de Estimao de Parmetros: Nvel de Confiana era a
probabilidade de que o Intervalo de Confiana contivesse o valor real do parmetro, e Nvel de Significncia,
complementar daquele, era a probabilidade de que o Intervalo NO contivesse o parmetro, em suma a probabilidade
da Estimao estar correta ou no, respectivamente.
INE 7002 - Inferncia Estatstica Testes de Hipteses 3

Hiptese Nula que considerada verdadeira (at prova em contrrio). Quando se aceita a Hiptese
Nula significa que no h provas suficiente para rejeit-la. J quando a deciso por rejeitar a
Hiptese Nula h evidncias suficientes de que as diferenas obtidas (entre o que era esperado e o
que foi observado na amostra) no ocorreram por acaso. Usando uma analogia com o direito dos
EUA, aceitar H0 seria comparvel a um veredito de no culpado (not guilty), ou seja, no h
provas suficientes para condenar o ru... Por outro lado rejeitar H0 seria comparvel a um veredito
de culpado (guilty), ou seja, as provas reunidas so suficientes para condenar o ru. O Nvel de
Significncia ser a probabilidade assumida de Rejeitar H0 sendo H0 verdadeira.

10.4 - Tipos de Testes Paramtricos

A formulao das hipteses o ponto inicial do problema, e deve depender NICA E


EXCLUSIVAMENTE das concluses que se pretende obter com o teste. A formulao da hiptese
alternativa determinar o tipo de teste: se Unilateral ou Bilateral.

Se a formulao da hiptese alternativa indicar que o parmetro maior ou menor do que o


valor de teste (valor considerado verdadeiro at prova em contrrio) o teste ser Unilateral:
somente h interesse se as diferenas entre os dados da amostra e o valor de teste forem em uma
determinada direo. Se a formulao da hiptese alternativa indicar que o parmetro diferente
do valor de teste o teste ser Bilateral: h interesse nas diferenas em qualquer direo. As
hipteses ento seriam:
Testes Unilaterais
H0 : parmetro = valor de teste
H1 : parmetro < valor de teste

H0 : parmetro = valor de teste


H1 : parmetro > valor de teste

Testes Bilaterais
H0 : parmetro = valor de teste
H1 : parmetro valor de teste
A escolha do tipo de teste depender das condies do problema sob estudo, sejam as trs
situaes abaixo:
a) Um novo protocolo de atendimento foi implementado no Banco RMG, visando reduzir o tempo
que as pessoas passam na fila do caixa. O protocolo ser considerado satisfatrio se a mdia do
tempo de fila for menor do que 30 minutos. Um teste Unilateral seria o adequado.
b) Cerca de 2000 formulrios de pedidos de compra esto sendo analisados. Os clientes podem ficar
insatisfeitos se houver erros nos formulrios. Neste caso admite-se que a proporo mxima de
formulrios com erros seja de 5%. Ou seja, um valor maior do que 5% causaria problemas. Um
teste Unilateral seria o adequado.
c) Uma pea automotiva precisa ter 100 mm de dimetro, exatamente. Neste caso, a dimenso no
pode ser maior ou menor do que 100 mm (em outras palavras no pode ser diferente de 100 mm),
pois isso indicar que a pea no est de acordo com as especificaes. Um teste Bilateral seria o
adequado.

Aps definir as hipteses coletada uma amostra aleatria da populao para test-las.
importante ressaltar novamente:
A MONTAGEM DAS HIPTESES DEVE DEPENDER APENAS DAS
CONCLUSES QUE SE PRETENDE OBTER E JAMAIS DE UMA EVENTUAL
EVIDNCIA AMOSTRAL DISPONVEL.
INE 7002 - Inferncia Estatstica Testes de Hipteses 4

A deciso de aceitar ou rejeitar H0 depender das regies de aceitao e rejeio de H0,


que por sua vez dependem dos seguintes fatores:
- do parmetro sob teste (e da estatstica ou varivel de teste usada para test-lo).
- do tipo de teste, se Unilateral ou Bilateral.
- do valor de teste (valor do parmetro considerado verdadeiro at prova em contrrio).
- do Nvel de Significncia () ou Nvel de Confiana (1 - ) adotado.
- de um valor crtico da estatstica ou varivel de teste a partir do qual a hiptese ser rejeitada, e
este valor depender por sua vez do Nvel de Significncia, do tipo de teste e da Distribuio
Amostral do parmetro.

A Regio de Aceitao de H0 ser a faixa de valores da estatstica (ou da varivel de teste)


associada ao parmetro em que as diferenas entre o que foi observado na amostra e o que era
esperado no so significativas.

A Regio de Rejeio de H0 ser a faixa de valores da estatstica (ou da varivel de teste)


associada ao parmetro em que as diferenas entre o que foi observado na amostra e o que era
esperado so significativas.

Para entender melhor os conceitos acima observe o exemplo a seguir:

H interesse em realizar um teste de hipteses sobre o comprimento mdio de uma das dimenses
de uma pea mecnica. O valor nominal da mdia (aceito como verdadeiro at prova em contrrio)
igual a b (valor genrico), H0: = b. Supondo que a distribuio amostral do parmetro
(distribuio de x ) seja normal6, e ser centrada em b: possvel fazer a converso para a
distribuio normal padro (mdia zero e desvio padro 1, varivel Z).

H0 : = b H0 : = 0
O valor de b (mdia da dimenso e mdia de x ) corresponde a zero, mdia da varivel Z.
Dependendo da formulao da Hiptese Alternativa haveria diferentes Regies de Rejeio de H0.

Se a Hiptese Alternativa fosse H1: < b (H1 : < 0), ou seja, se o teste fosse Unilateral esquerda
a Regio de Rejeio de H0 seria:

6
Ver o Captulo 9 para maiores detalhes.
INE 7002 - Inferncia Estatstica Testes de Hipteses 5

Observe que h um valor crtico


de x : abaixo dele a Hiptese
Nula ser rejeitada, acima ser
aceita. A determinao do valor
feita com base no Nvel de
Significncia, a rea abaixo da
curva normal at o valor crtico
de x . Geralmente obtm-se o
valor crtico da varivel de teste
(Z neste caso, na segunda figura)
atravs de uma tabela, que
corresponde ao valor crtico de
x , faz-se a transformao de
(x 0 )
variveis Z e

obtm-se o valor crtico de x .
0 o valor sob teste (b no
exemplo) e um desvio padro
(cujo valor ser explicitado
posteriormente).
A deciso ser tomada
comparando valor da mdia
amostral x com o valor crtico
desta mesma mdia: se for menor
do que o valor crtico xcritico
(ou seja, est na regio de Rejeio de H0) ento rejeita-se a Hiptese Nula. muito comum
tambm tomar a deciso comparando o valor da varivel de teste (Z neste caso), obtido com base
nos dados da amostra, com o valor crtico Zcritico desta mesma varivel (obtido de uma tabela ou
programa computacional): se for menor do que o valor crtico rejeita-se a Hiptese Nula. Observe
que o valor do Nvel de Significncia colocado na curva referente Hiptese Nula, porque
esta que aceita como vlida at prova em contrrio. Observe tambm que a faixa de valores da
regio de Rejeio PERTENCE curva da Hiptese Nula, assim o valor a probabilidade de
Rejeitar H0 sendo H0 verdadeira7.

Neste ponto importante ressaltar um ponto que costuma passar despercebido. Se a deciso
for tomada com base na varivel de teste (Z, por exemplo) interessante notar que, como o teste
Unilateral esquerda o valor Zcritico ser NEGATIVO, uma vez que a regio de Rejeio de H0 est
ESQUERDA de 0 (menor do que zero). No teste Unilateral direita, que veremos a seguir, o
valor de Zcritico ser positivo, pois a regio de Rejeio de H0 estar DIREITA de 0 (maior do que
zero). Se por exemplo o Nvel de Significncia fosse de 5% (0,05) o valor de Zcritico para o teste
Unilateral esquerda seria -1,645. Se houvesse interesse em obter o valor de x critico correspondente
bastaria usar a expresso Z (x 0 ) / substituindo Z por -1,6458.

Se a Hiptese Alternativa fosse H1: > b (H1: > 0), ou seja, se o teste fosse Unilateral direita a
Regio de Rejeio de H0 seria

7
Probabilidade de tomar uma deciso errada FIXADA pelo pesquisador.
8
O sinal correto importante para que o valor de xcritico coerente com a posio da regio de Rejeio de H0.
INE 7002 - Inferncia Estatstica Testes de Hipteses 6

Neste caso o valor crtico


est direita: se a mdia amostral
x ou a varivel de teste Z
tiverem valores superiores aos
respectivos valores crticos a
Hiptese Nula ser rejeitada, pois
os valores caram na regio de
Rejeio de H0. Como foi notado
anteriormente o valor de
Zcritico ser POSITIVO, pois
maior do que zero: usando o
mesmo Nvel de Significncia de
5% o valor de Z critico seria
1,645, igual EM MDULO ao
anterior, uma vez que a
distribuio normal padro
simtrica em relao sua mdia
que igual a zero.

Se a Hiptese Alternativa fosse H1: b (H1: 0), ou seja, o teste fosse Unilateral direita a
Regio de Rejeio de H0 seria:
Neste caso a regio de
Rejeio se divide em duas
IGUAIS (probabilidades iguais
metade do Nvel de
Significncia ), semelhante ao
que acontece na Estimao por
Intervalo. Existiro 2 valores
crticos, um abaixo do valor de
teste e outro acima: se a mdia
amostral x ou a varivel de
teste Z tiverem valores acima
do valor crtico superior ou
abaixo do valor crtico
inferior a Hiptese Nula ser
rejeitada, pois os valores
caram em uma das 2 regies
de Rejeio. Se for usada a
varivel de teste Z os valores
crticos sero iguais em mdulo,
pois esto mesma distncia do
valor sob teste (zero).

Recordando as trs situaes que foram abordadas anteriormente, seria interessante definir
completamente as Hipteses Estatsticas. Nos dois primeiros casos optou-se por um Teste Unilateral
e no terceiro por um Teste Bilateral.
INE 7002 - Inferncia Estatstica Testes de Hipteses 7

a) Um novo protocolo de atendimento foi implementado no Banco RMG, visando reduzir o tempo
que as pessoas passam na fila do caixa. O protocolo ser considerado satisfatrio se a mdia do
tempo de fila for menor do que 30 minutos. Um teste Unilateral seria o adequado. Mas Unilateral
Esquerda ou Direita? Como est grifado na frase anterior haver problema se a mdia do tempo
fosse menor do que 30, resultando:
Teste UNILATERAL ESQUERDA
H0 : = 30 onde 0 = 30 (valor de teste)
H1 : < 30 Teste Unilateral Esquerda.

b) Cerca de 2000 formulrios de pedidos de compra esto sendo analisados. Os clientes podem ficar
insatisfeitos se houver erros nos formulrios. Neste caso admite-se que a proporo mxima de
formulrios com erros seja de 5%. Ou seja, um valor maior do que 5% causaria problemas. Um
teste Unilateral seria o adequado. Neste caso, um teste de proporo, o problema ser um valor
maior do que 5%, resultando:
Teste UNILATERAL DIREITA
H0 : = 5% onde 0 = 5% (valor de teste)
H1 : > 5%

c) Uma pea automotiva precisa ter 100 mm de dimetro, exatamente. Neste caso, a dimenso no
pode ser maior ou menor do que 100 mm (em outras palavras no pode ser diferente de 100 mm)
pois isso indicar que a pea no est de acordo com as especificaes. Um teste Bilateral seria o
adequado, resultando:
Teste BILATERAL
H0 : = 100 mm onde 0 = 100 mm (valor de teste)
H1 : 100 mm

Para a definio correta das hipteses imprescindvel a correta identificao do valor de


teste, pois se trata de um dos aspectos mais importantes do teste: o resultado da amostra ser
comparado ao valor de teste.

Lembrando novamente que a tomada de deciso depende da correta determinao da regio


de Rejeio (e, por conseguinte, de Aceitao) da Hiptese Nula, e isso, por sua vez, depende
diretamente da formulao das Hipteses Estatsticas.

10.4.1 - Testes de Hipteses sobre a Mdia de uma Varivel em uma Populao

Neste caso h interesse em testar a hiptese de que o parmetro mdia populacional () de


uma certa varivel QUANTITATIVA seja maior, menor ou diferente de um certo valor. Para a
realizao deste teste necessrio que uma das duas condies seja satisfeita:
- sabe-se, ou razovel supor, que a varivel de interesse segue uma distribuio normal na
populao: isso significa que a distribuio amostral da mdia tambm ser normal, permitindo
realizar a inferncia estatstica paramtrica.
- a distribuio da varivel na populao desconhecida, mas a amostra retirada desta populao
considerada suficientemente grande9 o que, de acordo com o Teorema Central do Limite, permite
concluir que a distribuio amostral da mdia normal.
Supe-se tambm que a amostra representativa da populao e foi retirada de forma aleatria.

9
H muita controvrsia a respeito do que seria uma amostra suficientemente grande, mas geralmente uma amostra
com pelo menos 30 elementos costuma ser considerada grande o bastante para que a distribuio amostral da mdia
possa ser aproximada por uma normal.
INE 7002 - Inferncia Estatstica Testes de Hipteses 8

Tal como na Estimao de Parmetros por Intervalo existiro diferenas nos testes
dependendo do conhecimento ou no da varincia populacional da varivel.
2
a) Se a varincia populacional ( ) da varivel (cuja mdia populacional queremos testar)for
conhecida.
Neste caso a varincia amostral da mdia poder ser calculada atravs da expresso:
2
V( x ) , e, por conseguinte, o desvio padro10 ser desvio padrao
n n
A varivel de teste ser a varivel Z da distribuio normal padro, lembrando que:
valor " mdia "
Z
"desvio padro"
A "mdia" ser o valor de teste (suposto verdadeiro at prova em contrrio), denotado por 0. O
valor (obtido pela amostra) ser a mdia amostral (que o melhor estimador da mdia
populacional11) denotada por x , e o "desvio padro" ser o valor obtido anteriormente. Sendo
assim a expresso da varivel de teste Z:
x 0
Z
/ n
Compara-se o valor da varivel de teste com o valor crtico (Zcrtico que depende do Nvel de
Significncia adotado) de acordo com o tipo de teste (as expresses abaixo tambm esto no
apndice):
Se H1: > 0 Rejeitar H0 se Z > Zcrtico ( x > x crtico)
Se H1: < 0 Rejeitar H0 se Z < Zcrtico12( x < x crtico)
Se H1: 0 Rejeitar H0 se |Z| |Zcrtico|
2
b) Se a varincia populacional da varivel for desconhecida.
Naturalmente este o caso mais encontrado na prtica. Como se deve proceder? Depender do
tamanho da amostra.
b.1 - Grandes amostras (mais de 30 elementos)
Nestes casos procede-se como no item anterior, apenas fazendo com que = s, ou seja,
considerando que o desvio padro da varivel na populao igual ao desvio padro da
varivel na amostra (suposio razovel para grandes amostras).
b.2 - Pequenas amostras (at 30 elementos)
Nestes casos a aproximao do item b.1 no ser vivel. Ter que ser feita uma correo na
distribuio normal padro (Z) atravs da distribuio t de Student. Esta distribuio j
conhecida (ver texto sobre Estimao de Parmetros). Trata-se de uma distribuio de
probabilidades que possui mdia zero (como a distribuio normal padro, varivel Z), mas
sua varincia igual a n/(n-2), ou seja, a varincia depende do tamanho da amostra. Quanto
maior for o tamanho da amostra mais o quociente acima se aproxima de 1 (a varincia da
distribuio normal padro), e mais a distribuio t de Student aproxima-se da distribuio
normal padro. A partir de n = 30, j possvel considerar a varincia da distribuio t de
Student aproximadamente igual a 113.
A varivel de teste ser ento tn-1 (t com n - 1 graus de liberdade):
x 0
t n 1
s/ n

10
O desvio padro a raiz quadrada positiva da varincia.
11
Ver o Captulo 9 Estimao de Parmetros.
12
Neste caso Zcrtico ser NEGATIVO, j que a regio de Rejeio de H0 est esquerda de zero.
13
E talvez este seja o motivo de se considerar mais de 30 elementos como sendo uma amostra suficientemente grande.
INE 7002 - Inferncia Estatstica Testes de Hipteses 9

onde s o desvio padro amostral e os outros valores tm o mesmo significado da expresso


anterior.

Compara-se o valor da varivel de teste com o valor crtico (tn-1,crtico que depende do Nvel
de Significncia adotado) de acordo com o tipo de teste (as expresses abaixo tambm esto
no Apndice):
Se H1: > 0 Rejeitar H0 se tn-1 > tn-1,crtico ( x > x crtico)
Se H1: < 0 Rejeitar H0 se tn-1 < tn-1,crtico14
( x < x crtico)
Se H1: 0 Rejeitar H0 se |tn-1| |tn-1,crtico|

A correta identificao dos valores crticos, decorrente da correta identificao da regio de


rejeio de H0, por sua vez decorrente da adequada formulao das hipteses estatsticas,
indispensvel para que o resultado obtido seja coerente.

10.4.2 - Testes de Hipteses sobre a Proporo de um dos Valores de uma Varivel


em uma Populao

Neste caso h interesse em testar a hiptese de que o parmetro proporo populacional ()


de um dos valores de uma certa varivel seja maior, menor ou diferente de um certo valor. Para a
realizao deste teste, tal como ser descrito necessrio que DUAS condies sejam satisfeitas:
- que o produto n x 0 seja maior ou igual a 5;
- que o produto n x (1 - 0) seja maior ou igual a 5.
Onde n o tamanho da amostra e 0 a proporo sob teste (de um dos valores da varivel). Se
AMBAS as condies forem satisfeitas a distribuio amostral da proporo que binomial (uma
Bernoulli repetida n vezes) pode ser aproximada por uma normal. Obviamente supe-se que a
amostra representativa da populao e foi retirada de forma aleatria, e que a varivel pode
assumir apenas dois valores, aquele no qual h interesse e o seu complementar15.

Se as condies acima forem satisfeitas a distribuio amostral da proporo poder ser


aproximada por uma normal com:
0 (1 0 )
Mdia = 0 Desvio Padro =
n
Lembrando-se da expresso da varivel Z:
valor " mdia "
Z
"desvio padro"
O valor ser a proporo amostral (que o melhor estimador da proporo populacional) do
valor da varivel denotada por p. A "mdia" e o "desvio padro" so os valores definidos acima,
ento a expresso de Z ser:
p 0
Z
0 (1 0 )
n
Compara-se o valor da varivel de teste com o valor crtico (Zcrtico que depende do Nvel de
Significncia adotado) de acordo com o tipo de teste:
Se H1: > 0 Rejeitar H0 se Z > Zcrtico (p > pcrtico)

14
Neste caso tn-1,crtico ser NEGATIVO, j que a regio de Rejeio de H0 est esquerda de zero.
15
Ou seja, que se trata de um experimento de Bernoulli. Praticamente qualquer experimento pode ser reduzido a um
experimento de Bernoulli, simplesmente isolando o valor da varivel no qual h interesse e agrupando todos os outros
como seu valor complementar.
INE 7002 - Inferncia Estatstica Testes de Hipteses 10

Se H1: < 0 Rejeitar H0 se Z < Zcrtico16(p < pcrtico)


Se H1: 0 Rejeitar H0 se |Z| |Zcrtico|

Exemplo 10.1- Uma pea automotiva precisa ter 100 mm de dimetro, exatamente. Foram medidas
15 peas, aleatoriamente escolhidas. Obteve-se mdia de 100,7 mm e varincia de 0,01 mm2.
Supe-se que a dimenso segue distribuio normal na populao. A pea est dentro das
especificaes? Usar 1% de significncia.
Este problema j foi estudado anteriormente. Seguindo o roteiro:
1) Enunciar as hipteses.
Conforme visto no item 10.4 o teste mais adequado para este caso um Teste Bilateral:
H0 : = 100 mm onde 0 = 100 mm (valor de teste)
H1 : 100 mm
2) Nvel de significncia.
O problema declara que necessrio usar 1% de significncia (se no fosse especificado,
outro valor poderia ser usado).
3) Varivel de teste.
Uma vez que a varincia populacional da varivel DESCONHECIDA (o valor fornecido
a varincia AMOSTRAL), e a amostra retirada apresenta apenas 15 elementos (portanto
menos de 30) a varivel de teste ser tn-1 da distribuio t de Student.
4) Definir a regio de aceitao de H0. Observe que por ser um teste Bilateral
o Nvel de Significncia foi dividido
em dois, metade para cada regio de
rejeio de H0. Para encontrar o valor
crtico devemos procurar na tabela da
distribuio de Student, na linha
correspondente a n-1 graus de
liberdade, ou seja, em 15 - 1 = 14
graus de liberdade. O valor da
probabilidade pode ser visto na figura
ao lado: os valores crticos sero
t14;0,005 e t14;0,995 os quais sero iguais
em mdulo. E o valor de tn-1,crtico ser
igual a 2,977 (em mdulo).
5) Atravs dos valores da amostra avaliar o valor da varivel.
Neste ponto preciso encontrar o valor da varivel de teste:
x 0
t n 1
s/ n
O valor de teste 0 igual a 100 mm, a mdia amostral x vale 100,7 mm, o tamanho de
amostra n igual a 15 e o desvio padro amostral s a raiz quadrada de 0,01 mm 2.
Substituindo na equao acima:
x 0 100,7 100
t n1 t151 t14 27,11 ento |t14| = 27,11
s/ n 0,01 / 15
6) Decidir pela aceitao ou rejeio de H0.
Como se trata de um teste bilateral:
Rejeitar H0 se |tn-1| |tn-1,crtico|
Como |t14| = 27,11 > |tn-1,crtico| = |t14,0,995|= 2,977
REJEITAR H0 a 1% de Significncia (h 1% de chance de erro)

16
Neste caso Zcrtico ser NEGATIVO, j que a regio de Rejeio de H0 est esquerda de zero.
INE 7002 - Inferncia Estatstica Testes de Hipteses 11

7) Interpretar a deciso no contexto do problema.


H provas estatsticas suficientes de que a dimenso da pea no est dentro das
especificaes17.

Exemplo 10.2 - Um novo protocolo de atendimento foi implementado no Banco RMG, visando
reduzir o tempo que as pessoas passam na fila do caixa. O protocolo ser considerado satisfatrio se
a mdia do tempo de fila for menor do que 30 minutos. Suponha que o tempo que 35 clientes
(selecionados aleatoriamente) passaram na fila foi monitorado, resultando em uma mdia de 29
minutos e desvio padro de 5 minutos. O protocolo pode ser considerado satisfatrio a 5% de
significncia?
Este problema j foi estudado anteriormente. Seguindo o roteiro do Apndice.
1) Enunciar as hipteses.
Conforme visto no item 10.4 o teste mais adequado para este caso um Teste Unilateral
Esquerda:
H0 : = 30 onde 0 = 30 (valor de teste)
H1 : < 30
2) Nvel de significncia.
O problema declara que necessrio usar 5% .
3) Varivel de teste.
Uma vez que a varincia populacional da varivel DESCONHECIDA (o valor fornecido
o desvio padro AMOSTRAL), mas a amostra retirada apresenta 35 elementos (portanto
mais de 30) a varivel de teste ser Z da distribuio normal.
4) Definir a regio de aceitao de H0. Observe que por ser um teste
Unilateral Esquerda o Nvel de
Significncia est todo concentrado
em um dos lados da distribuio,
definindo a regio de rejeio de H0.
Para encontrar o valor crtico devemos
procurar na tabela da distribuio
normal, pela probabilidade acumulada
0,95. Ou procurar a probabilidade
complementar 0,05 e mudar o sinal do
valor encontrado, pois o Zcrtico aqui
menor do que zero. O valor crtico
ser igual a -1,645.
5) Atravs dos valores da amostra avaliar o valor da varivel.
Neste ponto preciso encontrar o valor da varivel de teste:
x 0
Z
s/ n
O valor de teste 0 igual a 30, a mdia amostral x vale 29, o tamanho de amostra n
igual a 35 e o desvio padro amostral s 5. Substituindo na equao acima:
x 0 29 30
Z 1,183
s / n 5 / 35
6) Decidir pela aceitao ou rejeio de H0.
Como se trata de um teste Unilateral Direita:
Rejeitar H0 se Z < Zcrtico

17
Cuidado com os casos de FRONTEIRA, em que o valor da varivel de teste muito prximo do valor crtico. Nesses
casos a rejeio ou aceitao de H0 pode ocorrer por acaso. Sempre que apresentar o resultado recomende que uma
nova amostra seja retirada para avaliar novamente o problema. Mas neste caso rejeita-se H0 com folga.
INE 7002 - Inferncia Estatstica Testes de Hipteses 12

Como Z = -1,185 > Zcrtico = -1,645


ACEITAR H0 a 5% de Significncia (h 5% de chance de erro)
7) Interpretar a deciso no contexto do problema.
No h provas estatsticas suficientes para concluir que o protocolo tem um desempenho
satisfatrio.

EX.10.3 - Cerca de 2000 formulrios de pedidos de compra esto sendo analisados. Os clientes
podem ficar insatisfeitos se houver erros nos formulrios. Neste caso admite-se que a proporo
mxima de formulrios com erros seja de 5%. Suponha que dentre os 2000 formulrios 7%
apresentavam erros. A proporo mxima foi ultrapassada a 1% de significncia?
Este problema j foi estudado anteriormente. Seguindo o roteiro do Apndice:
1) Enunciar as hipteses.
Conforme visto no item 10.4 o teste mais adequado para este caso um Teste Unilateral
Direita:
H0 : = 5% onde 0 = 5% (valor de teste)
H1 : > 5%
2) Nvel de significncia.
O problema declara que necessrio usar 1% de significncia (se no fosse especificado,
outro valor poderia ser usado).
3) Varivel de teste.
Como se trata de um teste de proporo necessrio verificar o valor dos produtos:
n x 0 = 2000 x 0,05 = 100 e n x (1 - 0) = 2000 x 0,95 = 1900. Como ambos so maiores
do que 5 possvel fazer uma aproximao pela normal, e a varivel de teste ser Z.
4) Definir a regio de aceitao de H0. Observe que por ser um teste Unilateral
Direita o Nvel de Significncia est
todo concentrado em um dos lados da
distribuio, definindo a regio de
rejeio de H0. Para encontrar o valor
crtico devemos procurar na tabela da
distribuio normal, pela probabilidade
acumulada 0,01 (o Zcrtico aqui maior
do que zero). O valor crtico ser igual a
2,326.

5) Atravs dos valores da amostra avaliar o valor da varivel.


Neste ponto preciso encontrar o valor da varivel de teste:
p 0
Z
0 (1 0 )
n
O valor de teste 0 igual a 0,05 (5%), a proporo amostral p vale 0,07 (7%), e o
tamanho de amostra n igual a 2000. Substituindo na equao acima:
p 0 0,07 0,05
Z 4,104
0 (1 0 ) 0,05 (0,95)
n 2000
6) Decidir pela aceitao ou rejeio de H0.
Como se trata de um teste Unilateral Esquerda:
Rejeitar H0 se Z > Zcrtico
Como Z = 4,104 > Zcrtico = 2,326
INE 7002 - Inferncia Estatstica Testes de Hipteses 13

REJEITAR H0 a 1% de Significncia (h 1% de chance de erro)


7) Interpretar a deciso no contexto do problema.
H provas estatsticas suficientes de que a proporo est acima do mximo admitido18.
Provavelmente os vendedores/compradores precisaro passar por novo treinamento.

10.4.3 - Teste de diferenas entre as Propores de um dos Valores de uma Varivel


em duas Populaes independentes

Frequentemente precisamos avaliar se a proporo de um dos valores de certa varivel em


uma populao apresenta uma diferena significativa da mesma proporo em outra populao (ou
seja, comparar duas populaes independentes). Por exemplo, se a proporo de eleitores
favorveis a um candidato em uma regio de SC diferente da proporo em outra regio. Temos
uma situao ento em que queremos realizar um teste de diferena entre duas propores
populacionais, que chamaremos 1 e 2.

Neste caso h interesse em testar a hiptese de que a diferena entre o parmetro proporo
populacional de um dos valores de uma certa varivel, em duas populaes independentes ( )
seja maior, menor ou diferente de um certo valor (que chamaremos 0), a partir dos dados
coletados em duas amostras aleatrias das respectivas populaes. Vamos chamar as propores
amostrais do valor de interesse de p1 e p2, e os respectivos tamanhos de amostra de n 1 e n2. Para a
realizao deste teste, tal como ser descrito necessrio que QUATRO condies sejam
satisfeitas:
- que o produto n1 x p1 seja maior ou igual a 5; que o produto n1 x (1 - p1) seja maior ou igual a 5.
- que o produto n2 x p2 seja maior ou igual a 5; que o produto n2 x (1 - p2) seja maior ou igual a 5.
Se TODAS as condies forem satisfeitas as distribuies amostrais das propores, que so
binomiais, podem ser aproximadas por uma normal. Obviamente supe-se que as amostras so
representativas das populaes e foram retiradas de forma aleatria, e que a varivel pode assumir
apenas dois valores, aquele no qual h interesse e o seu complementar.

Se as condies acima forem satisfeitas a distribuio amostral da diferena entre as


propores poder ser aproximada por uma normal com:
1 (1 1 ) 2 (1 2 )
Mdia =
Desvio Padro =
n1 n2
Onde 0 o valor da diferena entre as propores populacionais 1 e 2 que queremos testar19.
Como no conhecemos 1 e 2 vamos estim-las atravs das propores amostrais, assim o "desvio
padro" passa a ser:
p1 (1 p1 ) p 2 (1 p 2 )

Desvio Padro =
n1 n2
valor " mdia "
Lembrando-se da expresso da varivel Z: Z
"desvio padro"
O valor ser a diferena entre as propores amostrais do valor da varivel, denotada por p1 - p2. A
"mdia" e o "desvio padro" so os valores definidos acima, ento a expresso de Z ser:

18
Este NO um caso de fronteira.
19
Usualmente 0 igual a zero, queremos saber se h qualquer diferena significativa entre as propores.
INE 7002 - Inferncia Estatstica Testes de Hipteses 14

p1 p 2 0
Z
p1 (1 p1 ) p 2 (1 p 2 )

n 1 n 2
Compara-se o valor da varivel de teste com o valor crtico (Zcrtico que depende do Nvel de
Significncia adotado) de acordo com o tipo de teste:
Se H1: > 0 Rejeitar H0 se Z > Zcrtico
Se H1: < 0 Rejeitar H0 se Z < Zcrtico20
Se H1: 0 Rejeitar H0 se |Z| |Zcrtico|

EX. 10.4 - Uma lei extremamente polmica est em tramitao na Assembleia Legislativa de Santa
Catarina. Parece que homens e mulheres apresentam opinies divergentes. Para avaliar se os dois
grupos apresentam propores de favorveis diferentes realizou-se uma pesquisa, em que foi
entrevistada uma amostra de 200 homens e uma amostra de 300 mulheres de todo o estado. Na
amostra de homens 50% declaram-se favorveis lei, enquanto que na amostra das mulheres houve
47% de favorveis. Usando 5% de significncia, h diferena entre as propores populacionais de
favorveis nos dois grupos?
Chamamos a populao masculina de grupo 1 e a feminina de 2. H interesse em verificar
apenas se as propores populacionais de favorveis so diferentes, ou seja, se a diferena
entre elas igual a zero: ento 0 = 0. O teste ser bilateral, pois no interessa qual das
propores ser maior ou menor. Seguindo o roteiro do Apndice:
1) Enunciar as hipteses. Rearranjando as hipteses:
H0 : = 0 onde 0 = 0 H0 :
H1 : 0 H1 :
2) Nvel de significncia. O problema declara que necessrio usar 5% de significncia.
3) Varivel de teste.
Como se trata de um teste de diferena entre propores necessrio verificar o valor dos
produtos:
n1 x p1 = 200 x 0,5 = 100 n1 x (1 - p1) = 200 x 0,50 = 100.
n2 x p2 = 300 x 0,47 = 147 n2 x (1 - p2) = 300 x 0,53 = 153.
Como todos so maiores do que 5 possvel fazer uma aproximao pela normal, e a
varivel de teste ser Z.
4) Definir a regio de aceitao de H0. Observe que por ser um teste Bilateral
o Nvel de Significncia foi dividido
em dois, metade para cada regio de
rejeio de H0. Para encontrar o valor
crtico devemos procurar na tabela da
distribuio normal padro pela
probabilidade 0,025 e 0,975 (0,95+
0,025) O valor da probabilidade pode
ser visto na figura ao lado: os valores
crticos sero Z0,025 e Z0,975 os quais
sero iguais em mdulo. P(Z >
Zcrtico)= 0,025. Ento Zcrtico ser
igual a 1,96 (em mdulo).
5) Atravs dos valores da amostra avaliar o valor da varivel.
Neste ponto preciso encontrar o valor da varivel de teste:

20
Neste caso Zcrtico ser NEGATIVO, j que a regio de Rejeio de H0 est esquerda de zero.
INE 7002 - Inferncia Estatstica Testes de Hipteses 15

p1 p 2 0
Z
p1 (1 p1 ) p 2 (1 p 2 )

n 1 n 2
O valor de teste 0 igual a 0, a proporo amostral p1 vale 0,5 (50%), a proporo
amostral p2 vale 0,47 (47%), o tamanho de amostra n1 igual a 200, e o tamanho de
amostra n2 igual a 300. Substituindo na equao acima:
p1 p 2 0 0,5 0,47 0
Z 0,6577
p1 (1 p1 ) p 2 (1 p 2 ) 0,5 (0,5) 0,47 0,53

n 1 n 2 200 300
6) Decidir pela aceitao ou rejeio de H0.
Como se trata de um teste Bilateral:
Rejeitar H0 se |Z| > |Zcrtico|
Como |Z| = 0,6577 < |Zcrtico| = 1,96
ACEITAR H0 a 5% de Significncia (h 5% de chance de erro)
7) Interpretar a deciso no contexto do problema.
No h provas estatsticas suficientes que indiquem diferenas nas propores de
favorveis nas populaes de homens e mulheres.

10.5 - Teste do Qui-Quadrado de independncia

O teste do Qui-Quadrado est vinculado anlise bidimensional de variveis qualitativas.


No Captulo 3 de INE7001 estudamos as tabelas de contingncias e o coeficiente de contingncia
modificado, que permitia mensurar a fora do relacionamento entre duas variveis qualitativas.
Vamos rever alguns daqueles conceitos antes de apresentar o teste do Qui-Quadrado de
independncia.

10.5.1 - Variveis qualitativas e tabelas de contingncia

comum haver interesse em saber se duas variveis quaisquer esto relacionadas, e o


quanto esto relacionadas, seja na vida prtica, seja em trabalhos de pesquisa, por exemplo:
- se a satisfao com um produto est relacionada faixa etria do consumidor;
- o quanto o nvel de pluviosidade em uma certa regio influencia a produtividade de uma cultura
agrcola;
- se a funo exercida por uma pessoa em uma organizao est associada a seu sexo.

A Anlise Bidimensional (vista no Captulo 3, em INE7001) prope-se a tentar responder as


perguntas do pargrafo anterior. As duas variveis abordadas podem ser qualitativas ou
quantitativas, e para cada tipo haver tcnicas apropriadas.

Variveis Qualitativas so as variveis cujas realizaes so atributos, categorias. Como


exemplo de variveis qualitativas tem-se: sexo de uma pessoa (duas categorias, masculino e
feminino), grau de instruo (analfabeto, primeiro grau incompleto, etc.), opinio sobre um assunto
(favorvel, desfavorvel, indiferente).

Em estudos sobre variveis qualitativas extremamente comum registrar as frequncias de


ocorrncia de cada valor que as variveis podem assumir, e quando h duas variveis envolvidas
comum registrar-se a frequncia de ocorrncia dos cruzamentos entre valores: por exemplo, quantas
INE 7002 - Inferncia Estatstica Testes de Hipteses 16

pessoas do sexo masculino so favorveis a uma certa proposta de lei, quantas so desfavorveis,
quantas pessoas do sexo feminino so favorveis. E, para facilitar a anlise dos resultados estes
resultados costumam ser dispostos em uma Tabela de Contingncias. A Tabela de Contingncias
relaciona os possveis valores de uma varivel qualitativa com os possveis valores da outra,
registrando quantas ocorrncias foram verificadas de cada cruzamento.

Exemplo 10.5 - Seja a tabela de contingncias abaixo, que relaciona as funes exercidas e o sexo
de 474 funcionrios de uma organizao.
Funo
Sexo Escritrio Servios gerais Gerncia Total
Masculino 157 27 74 258
Feminino 206 0 10 216
Total 363 27 84 474
Fonte: hipottica

Podemos apresentar os percentuais calculados em relao aos totais das colunas:

Funo
Sexo Escritrio Servios gerais Gerncia Total
Masculino 43,25% 100% 88,10% 54%
Feminino 56,75% 0% 11,90% 46%
Total 100% 100% 100% 100%
Fonte: hipottica
Seria interessante saber se as duas variveis so estatisticamente dependentes, e o quo forte esta
associao. Repare que os percentuais de homens e mulheres em cada funo so diferentes dos
percentuais marginais (de homens e mulheres no total de funcionrios), sendo que em duas funes
as diferenas so bem grandes.

O Teste do Qui-Quadrado uma das ferramentas estatsticas mais utilizadas quando se


deseja estudar o relacionamento entre duas variveis QUALITATIVAS. Permite verificar se duas
variveis qualitativas so independentes, se as propores de ocorrncia dos valores das variveis
observadas esto de acordo com o que era esperado, etc. Neste texto haver interesse em usar o
teste para avaliar se duas variveis qualitativas so independentes.

Como todo teste de hipteses o Teste do Qui-Quadrado consiste em comparar os valores


observados em uma amostra com os valores de uma referncia (referncia esta que supe que a
hiptese nula seja vlida).

As frequncias observadas da varivel so representadas em uma tabela de contingncias, e


a Hiptese Nula (H0) do teste ser que as duas variveis no diferem em relao s frequncias com
que ocorre uma caracterstica particular, ou seja, as variveis so independentes, que ser testada
contra a Hiptese Alternativa (H1) de que as variveis NO SO independentes21.

O teste pode ser realizado porque o grau de dependncia pode ser quantificado
2
descritivamente atravs de uma estatstica, que se chama justamente Qui-Quadrado ( ), cuja
expresso :

21
O roteiro deste teste est no apndice.
INE 7002 - Inferncia Estatstica Testes de Hipteses 17

L O ij E ij 2
C

2

i 1 j1
E ij
total da linha i total da coluna j
E ij
total geral
Onde
- Eij a frequncia esperada, sob a condio de independncia entre as variveis, em uma clula
qualquer da tabela de contingncias. TODAS as frequncias esperadas precisam ser MAIORES OU
IGUAIS A 5 para que o resultado do teste seja vlido22.
- Oij a frequncia observada em uma clula qualquer da tabela de contingncias.
- L o nmero total de linhas da tabela de contingncias (nmero de valores que uma das variveis
pode assumir)
- C o nmero total de colunas da tabela (nmero de valores que a outra varivel pode assumir).
Ento, para cada clula da tabela de contingncias calcula-se a diferena entre a frequncia
observada e a esperada. Para evitar que as diferenas positivas anulem as negativas as diferenas
so elevadas ao quadrado. E para evitar que uma diferena grande em termos absolutos, mas
pequena em termos relativos, "inflacione" a estatstica, ou que uma diferena pequena em termos
absolutos, mas grande em termos relativos, tenha sua influncia reduzida, divide-se o quadrado da
diferena pela frequncia esperada. Somam-se os valores de todas as clulas e obtm-se o valor da
2
estatstica: quanto maior , mais o Observado afasta-se do Esperado, portanto maior a
dependncia.
2
Sob a hiptese de independncia a estatstica ter distribuio Qui-Quadrado, uma
distribuio assimtrica, que tem valores diferentes dependendo do seu nmero de graus de
liberdade.

Figura 1 - Distribuio Qui-Quadrado com 2, 5, 10, 20 e 30 graus de liberdade

22
Se isso no ocorrer recomenda-se agrupar as categorias (de uma ou outra varivel, ou de ambas) at obter todas as
frequncias pelo menos iguais a 5.
INE 7002 - Inferncia Estatstica Testes de Hipteses 18

A figura 14 mostra as curvas da distribuio Qui-Quadrado para 2, 5, 10, 20 e 30 graus de


liberdade. Observe que as figuras so assimtricas, e como variam de forma dependendo do nmero
de graus de liberdade da estatstica.

O Teste do Qui-Quadrado para avaliar se duas variveis so independentes ser


2 2
UNILATERAL: ou seja a Hiptese Nula ser rejeitada se > crtico , para um certo nmero de
graus de liberdade. Por exemplo, para o caso em que h 3 graus de liberdade, e o Nvel de
Significncia fosse de 5% (a regio de Rejeio de H0 ficar DIREITA), o valor crtico seria:
O valor crtico para a
2
estatstica para 5% de
Significncia e 3 graus de
liberdade ser igual a
2
7,81. Se for maior do
que 7,81 (para 3 graus de
liberdade) deve-se rejeitar
a Hiptese Nula (H0) de
que as variveis so
independentes.
Figura 2 - Distribuio Qui-Quadrado para 3 graus de liberdade, com = 0,05
O nmero de graus de liberdade da estatstica calculado da seguinte forma:
graus de liberdade = (L - 1) (C - 1)
Sendo o nmero de linhas e o nmero de colunas referentes tabela de contingncias (o nmero de
valores que cada varivel pode assumir).

O nmero de graus de liberdade assume este valor porque para calcular as frequncias esperadas
no necessrio calcular os valores de TODAS as clulas, as ltimas podem ser calculadas por
diferena j que os totais so fixos. Por exemplo, para duas variveis que somente podem assumir 2
valores cada, o nmero de graus de liberdade seria igual a 1 [(2-1)(2-1)]: bastaria calcular a
frequncia esperada de uma clula e obter as outras por diferena em relao ao total.

Exemplo 10.6 - Para o conjunto do Exemplo 10.5, supondo que os resultados so uma amostra
aleatria, verificar se as variveis so independentes a 1% de significncia.
Seguindo o roteiro que est no Apndice:
1) Enunciar as Hipteses:
H0: as variveis sexo e funo so independentes
H1: as variveis sexo e funo no so independentes
2) Nvel de significncia: determinado pelo problema, = 0,01; 1 - = 0,99
3) Retirar as amostras aleatrias e montar a tabela de contingncias (isso j foi feito):
Funo
Sexo Escritrio Servios gerais Gerncia Total
Masculino 157 27 74 258
Feminino 206 0 10 216
Total 363 27 84 474
Fonte: hipottica
Na tabela acima encontram-se os totais marginais e o total geral:
L1 = total Masculino = 258 L2 = total Feminino = 216 C1 = total Escritrio = 157
C2 = total S.Gerais = 27 C3 = total gerncia = 84 N = total geral =474
Repare que somando os totais das linhas o resultado o total geral, e que somando os totais das
colunas o resultado o total geral tambm.
4) Calcular as frequncias esperadas:
INE 7002 - Inferncia Estatstica Testes de Hipteses 19

Calculando as frequncias esperadas de acordo com a frmula vista anteriormente:


Masculino - Escritrio E = (258 363)/ 474 = 197,58
Masculino - Servios Gerais E = (258 27)/ 474 = 14,70
Masculino - Gerncia E = (258 84)/ 474 = 45,72
Feminino - Escritrio E = (216 363)/ 474 = 165,42
Feminino - Servios Gerais E = (216 27)/ 474 = 12,30
Feminino - Gerncia E = (216 84)/ 474 = 38,28
Observe que os resultados so os mesmos obtidos no Exemplo 3.2.
2
5) Calculando a estatstica para cada clula:
Agora podemos calcular as diferenas entre as frequncias e as demais operaes, que
sero mostradas nas tabelas a seguir.
O-E Funo
Sexo Escritrio Servios gerais Gerncia
Masculino 157 - 197,58 27 - 14,70 74 - 45,72
Feminino 206 - 165,42 0 - 12,30 10 - 38,28

(O-E)2 Funo
Sexo Escritrio Servios gerais Gerncia
Masculino 1646,921 151,383 799,672
Feminino 1646,921 151,383 799,672

Finalmente:
(O-E)2/E Funo
Sexo Escritrio Servios gerais Gerncia
Masculino 8,336 10,301 17,490
Feminino 9,956 12,304 20,891

Agora podemos somar os valores:


2 = 8,336 + 10,301 + 17,490 + 9,956 + 12,304 + 20,891 = 79,227
Os graus de liberdade: (nmero de linhas -1)x(nmero de colunas - 1) = (2 -1)(3-1)= 2
2
Ento 2 = 79,227
2
6) O crtico ser: procurando na tabela do Apndice, ou em um programa, para 2 graus de
2
liberdade e 99% de confiana (1% de significncia): 2,crtico = 6,63
Ver figura abaixo, 2
7)8) Como 2 maior do que
2
2,crtico REJEITAMOS H0 a
1% de significncia. H
evidncia estatstica suficiente
que indicam que as variveis
funo e sexo no so
independentes. Isso confirma
nossas suspeitas iniciais,
devido s grandes diferenas
nas frequncias da tabela.
importante ressaltar que ao calcularmos o Coeficiente de Contingncia Modificado para os
mesmos dados (Exemplo 3.4), obtivemos um valor igual a 0,54 (indicando uma associao
moderada para forte). Ele pode ser usado em conjunto com o teste do Qui-Quadrado. O teste do
Qui-Quadrado provou que h associao, e o coeficiente a quantificou.
INE 7002 - Inferncia Estatstica Testes de Hipteses 20

10.6 - Testes de diferenas entre as mdias de uma varivel em duas


populaes (testes t)

extremamente comum comparar as mdias de uma varivel QUANTITATIVA em duas


populaes23, atravs das mdias de duas amostras aleatrias de valores da varivel retiradas destas
populaes, geralmente com um dos dois objetivos abaixo:
- comparar as mdias dos valores da varivel provenientes do MESMO grupo, mas medidas em
ocasies diferentes (estudos do tipo antes-depois), procurando verificar se houve diferena;
- comparar as mdias provenientes de grupos DISTINTOS (INDEPENDENTES), para verificar se a
varivel possui a mesma mdia nas duas populaes.

Estes testes so TESTES PARAMTRICOS. Exigem que uma das duas condies abaixo
seja satisfeita:
- sabe-se, ou razovel supor, que a varivel de interesse segue uma distribuio normal em ambas
as populaes: isso significa que a distribuio amostral das mdias tambm ser normal,
permitindo realizar a inferncia estatstica paramtrica.
- as distribuies da varivel nas populaes so desconhecidas, mas as amostras retiradas destas
populaes so consideradas suficientemente grandes24 o que, de acordo com o Teorema Central
do Limite, permite concluir que a distribuio amostral das mdias normal.
Supe-se tambm que as amostras so representativas das populaes e foram retiradas de forma
aleatria.

O teste t para 2 amostras pareadas ser visto no item 10.6.1. Se os grupos forem
independentes preciso avaliar se as varincias populacionais so conhecidas. Se forem, deve ser
utilizado o teste Z para 2 amostras independentes (item 10.6.2). Se no forem conhecidas preciso
avaliar se podem ser consideradas iguais ou no: isso ser feito atravs do teste F de diferena entre
2 varincias (no item 10.6.3). Finalmente, no item 10.6.4 ser apresentado o teste t para 2 amostras
independentes: se o teste F (item 10.6.3) indicar que as varincias podem ser consideradas iguais a
varivel de teste t ter n1+n2-2 graus de liberdade (onde n 1 e n2 so os tamanhos das amostras); caso
contrrio a varivel de teste t ter graus de liberdade ( calculado atravs de uma expresso que
envolve os valores dos desvios padres amostrais e os prprios tamanhos de amostra).

A Figura 3 mostra os possveis cursos de ao.

23
Alis, muito comum comparar as mdias de vrios grupos, o que consiste um captulo especial da Estatstica a
ANLISE DE VARINCIA (ANOVA) que no ser vista nesta disciplina.
24
H muita controvrsia a respeito do que seria uma amostra suficientemente grande, mas geralmente uma amostra
com pelo menos 30 elementos costuma ser considerada grande o bastante para que a distribuio amostral da mdia
possa ser aproximada por uma normal.
INE 7002 - Inferncia Estatstica Testes de Hipteses 21

Varivel de
interesse
quantitativa

Duas amostras

SIM
Relacionadas?

NO

Teste t para 2 Avaliar varincias


amostras pareadas populacionais

SIM NO
Conhecidas?

Teste Z para 2
amostras Teste F de
independentes diferena entre 2
varincias

Usar Z como
varivel de teste
SIM Varincia NO
semelhantes?

Teste t para 2 Teste t para 2


amostras amostras
independentes independentes

Usar t com
Usar t com n1+n2 -2
graus de liberdade graus de
liberdade

Figura 3 - Teste de diferena entre 2 mdias - resumo

10.6.1 - Teste t para 2 amostras pareadas

Os resultados das 2 amostras so relacionados 2 a 2 segundo algum critrio, acarretando em


que as amostras precisam ter o mesmo tamanho. Calculam-se as diferenas entre cada par de
valores, obtendo uma nica amostra com n diferenas. O roteiro para a realizao deste tipo de teste
est na pgina 5 do Apndice.

EX 10.7 - Dez cobaias foram submetidas ao tratamento de engorda com certa rao. Os pesos em
gramas, antes e aps o teste so dados a seguir (supe-se que provenham de distribuies normais).
A 1% de significncia, podemos concluir que o uso da rao contribuiu para o aumento do peso
mdio dos animais?
INE 7002 - Inferncia Estatstica Testes de Hipteses 22

Cobaia 1 2 3 4 5 6 7 8 9 10
Antes 635 704 662 560 603 745 698 575 633 669
Depois 640 712 681 558 610 740 707 585 635 682
Trata-se de uma situao em que queremos comparar as MDIAS DE UMA VARIVEL EM
DUAS distribuies normais, supondo que se trata da MESMA populao, mas em dois momentos
diferentes: antes e aps um tratamento de engorda. H interesse em verificar se a dieta contribuiu
para o aumento do peso mdio dos animais: ou seja, queremos verificar se a mdia de peso antes
do tratamento MENOR do que a mdia de peso aps o tratamento (se a dieta fez efeito os animais
estaro em mdia mais pesados ao final do tratamento). Reparem que exigido que se tome uma
deciso, o que configura um problema de TESTE DE HIPTESES.
Iremos ento aplicar um TESTE DE DIFERENAS ENTRE AS MDIAS DE UMA
VARIVEL EM 2 POPULAES. E como as amostras so relacionadas (MESMA POPULAO:
ANTES E DEPOIS), usaremos o teste t para 2 amostras pareadas.. Supe-se que se ambas as
distribuies populacionais so normais a distribuio da diferena entre os valores tambm ser.
1) Enunciar as hipteses
De acordo com o que foi dito acima queremos verificar se a mdia antes menor do que a mdia
depois; o melhor ponto de partida, que servir para a definio da hiptese H0, que a dieta NO
FAZ EFEITO, ou seja, as mdias antes e aps o tratamento so iguais (costumamos colocar em H0
o CONTRRIO do que queremos provar), ou seja, a DIFERENA ENTRE AS MDIAS DEVE
SER SUPOSTA IGUAL A ZERO, teremos ento:
H 0 : d 0
onde d antes depois
H1 : d 0
2) Estabelecer o nvel de significncia ou nvel de confiana.
Conforme foi estabelecido no enunciado do problema:
0,01 1 0,99
3) Identificar a varivel de teste.
No presente problema temos uma amostra de apenas 10 elementos. Como a amostra tem menos de
30 elementos a varivel de teste que ser utilizada ser a varivel tn-1 da distribuio t de Student.
4) Definir a regio de aceitao de H0, de acordo com o tipo de teste e varivel.
Trata-se de um teste unilateral esquerda (com 1% de significncia), e a varivel de teste tn-1 (a
amostra tem 10 elementos), ento o valor crtico (obtido da tabela da distribuio t de Student)
ser:
t n 1,critico t101;0,01 t 9;0,99 t 9;0,01 2,821
Observe a regio de aceitao de H0:
INE 7002 - Inferncia Estatstica Testes de Hipteses 23

Para valores maiores do que -2,821 aceitaremos H0 (ou seja, a dieta no faz efeito, a diferena
entre as mdias nula). Se tn-1 for menor do que -2,821 rejeitaremos H0 (a mdia DEPOIS
aumentou demais em relao mdia ANTES da dieta para que a diferena seja devida apenas ao
acaso). Claro que h uma chance de 1% de que venhamos a rejeitar H0 sendo ela verdadeira.
5) Atravs dos valores das amostras antes e depois, calcular a diferena di entre cada par de
valores, onde di = Xantes - Xdepois.

Para o conjunto sob anlise teremos:


Cobaia 1 2 3 4 5 6 7 8 9 10
Antes 635 704 662 560 603 745 698 575 633 669
Depois 640 712 681 558 610 740 707 585 635 682
di -5 -8 -19 2 -7 5 -9 -10 -2 -13
2 25 64 361 4 49 25 81 100 4 169
di
6)e 7) Calcular a diferena mdia e o desvio padro da diferena mdia.

Para o presente problema: d i


d 66
6,6 gramas
n 10
d [( d i ) 2 / n ]
2
882 [(66) 2 / 10]
sd i
7,04 gramas
n 1 10 1
8) Calcular o valor da varivel de teste. Neste problema a varivel tn-1:
d 6,6
t n 1 t101 t 9 2,96
(sd / n ) (7,04 / 10 )
9) Decidir pela aceitao ou rejeio de H0.
Conforme foi visto anteriormente, se o valor da varivel de teste fosse MENOR do que -2,82 a
hiptese H0 seria rejeitada:
t n 1 t 9 2,96 t n 1,critico t 9;0,01 2,82
Assim, REJEITAMOS H0 a 1% de significncia.
10) Interpretar a deciso dentro do contexto do problema.
Assim, conclumos com 99% de confiana (ou uma chance de erro de 1%) que a dieta contribuiu
para o aumento do peso mdio dos animais.

10.6.2 Teste Z para 2 amostras independentes varincias populacionais


CONHECIDAS.

Neste caso h interesse em comparar as mdias de uma varivel quantitativa em dois grupos
(populaes) distintas, independentes, atravs de duas amostras aleatrias retiradas de cada grupo,
respectivamente. Alm disso, as varincias da varivel nas duas populaes (1 e 2 ) so
2 2

conhecidas25. O roteiro para este teste est nas pginas 6 e 7 do Apndice: observe que a partir do
item 3 do roteiro deve-se seguir sempre as frmulas e procedimentos do item b.1, especficos para o
caso em que as varincias populacionais so conhecidas.

EX.10.8 A Jabyl Circuits est avaliando o tempo de montagem de um novo modelo de circuito em
2 de suas unidades. Suspeita-se que o desempenho da fbrica 1 seja pior do que o da fbrica 2
(aquela seria mais lenta). Sabe-se que a varincia populacional do tempo na fbrica 1 de 1,5
minutos2 e na fbrica 2 de 2,5 minutos2, alm disso, supe-se que as distribuies dos tempos
podem ser consideradas normais. Foram coletadas duas amostras de tempos de montagem: 8 na

25
Este caso muito raro na prtica, mas a compreenso do seu procedimento til.
INE 7002 - Inferncia Estatstica Testes de Hipteses 24

fbrica 1, resultando em mdia de 2,35 minutos, e 10 na fbrica 2, resultando em mdia de 1,85


minutos. A suspeita procedente a 1% de significncia?
Trata-se de uma situao em que queremos comparar as MDIAS DE DUAS distribuies
normais, supondo que se tratam de duas populaes distintas, podemos supor que as amostras so
independentes: est sendo avaliado o tempo de montagem dos circuitos em 2 fbricas
DIFERENTES. H interesse em verificar se a mdia da populao da fbrica 1 maior do que a de
fbrica 2 (ou seja, que leve mais tempo para montar os circuitos na fbrica 1, significando um
desempenho pior). Reparem que exigido que se tome uma deciso, o que configura um problema
de TESTE DE HIPTESES.
Iremos ento aplicar um TESTE DE DIFERENA ENTRE AS MDIAS DE UMA
VARIVEL EM 2 POPULAES. O roteiro encontra-se nas pginas 6 e 7 do Apndice. E como as
amostras so independentes, e as varincias populacionais so CONHECIDAS, deve-se usar o
teste Z para 2 amostras independentes.
1) Enunciar as hipteses
De acordo com o que foi dito acima queremos verificar se a mdia da fbrica 1 maior do que a
da fbrica 2; o melhor ponto de partida, que servir para a definio da hiptese H0, ser
considerar que NO H DIFERENA entre as mdias, ou seja, A MDIA DO TEMPO DE
MONTAGEM NA FBRICA 1 IGUAL AO TEMPO DE MONTAGEM NA FBRICA 2
(costumamos colocar em H0 o CONTRRIO do que queremos provar), teremos ento:
H 0 : 1 2
onde 1 FBRICA1 e 2 FBRICA2
H 1 : 1 2
2) Estabelecer o nvel de significncia ou nvel de confiana.
Conforme foi estabelecido no enunciado do problema:
0,01 1 0,99
3) Identificar a varivel de teste.
Neste ponto do roteiro necessrio ter muito cuidado. H 3 variveis de teste possveis,
dependendo das condies do problema, mais especificamente das varincias das duas populaes.
Como as varincias de ambas as populaes so conhecidas dever ser usada a varivel Z da
distribuio normal padro.
4) Definir a regio de aceitao de H0, de acordo com o tipo de teste e varivel.
Trata-se de um teste Unilateral Direita (com 1% de significncia), e a varivel de teste Z ento
o valor crtico (obtido da tabela da distribuio normal padro) ser:
Zcrtico Z 0,01 2,326
Observe a regio de aceitao de H0 na figura abaixo:

Para valores de Z maiores do


que 2,326, deve-se REJEITAR H0, ou
seja a mdia do tempo de montagem
dos circuitos na Fbrica 1 maior do
que a mdia da Fbrica 2 (claro que h
1% de chance de que venhamos a
rejeitar H0 sendo ela verdadeira): as
diferenas entre o que era esperado e o
que foi encontrado na amostra sero
consideradas grandes demais para
serem casuais.

5) Calcular o desvio padro das diferenas.


INE 7002 - Inferncia Estatstica Testes de Hipteses 25

Como as duas varincias so conhecidas, iremos utilizar a primeira expresso para calcular o
desvio padro das diferenas que est no roteiro (no item 5 do roteiro do TESTE DE DIFERENA
ENTRE MDIAS: teste Z e t para 2 amostras independentes, no apndice, letra b.1)
12 22 1,5 2,5
d 0,6614 min
n1 n2 8 10
6) Calcular a varivel de teste.
Novamente, como as duas varincias so conhecidas, iremos utilizar a primeira expresso para
calcular o valor da varivel de teste que est no roteiro (no item 5 do roteiro do teste de diferena
entre as mdias de uma varivel em 2 populaes amostras independentes, no apndice, letra b.1)
x1 x 2 2,35 1,85
Z => Z 0,7559
d 0,6614
7)Decidir pela aceitao ou rejeio de H0.
Conforme foi visto anteriormente se o valor da varivel de teste fosse maior do que 2,326 a
hiptese H0 seria rejeitada:
Z 0,7559 Z crtico 2,326
Assim, ACEITAMOS H0 a 1% de significncia..
8) Interpretar a deciso dentro do contexto do problema.
Assim, conclumos com 99% de confiana (ou uma chance de erro de 1%) que NO h evidncias
estatsticas suficientes para declarar que a mdia do tempo de montagem dos circuitos na Fbrica
1 maior do que a mdia na Fbrica 2. A suspeita NO procedente.

10.6.3 Teste F de diferena entre 2 varincias.

Para realizar um teste de diferena entre as mdias de uma varivel em 2 populaes, sendo
as amostras independentes, e as varincias populacionais da varivel DESCONHECIDAS, preciso
avaliar se tais varincias podem ser consideradas iguais ou no. Tal avaliao necessria, pois
dependendo da sua concluso a varivel de teste t ter diferentes graus de liberdade, o que implicar
em valores crticos diferentes, o que influenciar diretamente a deciso de aceitao ou rejeio da
hiptese nula. Portanto, preciso realizar um teste para avaliar se h diferenas entre as varincias
populacionais, a partir das varincias amostrais. O roteiro para este teste est na pgina 8 do
Apndice.

As hipteses do teste so sempre as mesmas: na hiptese nula supe-se que as duas


varincias populacionais (estimadas a partir das respectivas varincias amostrais) so iguais, e na
hiptese alternativa declara-se que elas so diferentes (trata-se ento de um teste BILATERAL).
H0: 12 = 22
H1: 12 22

Para realizar o teste preciso calcular o quociente entre a maior e a menor varincia
2
amostral, que ser chamada de s A (e, por conseguinte, o tamanho de amostra associado nA) e a
2
menor que ser chamada s B (e por conseguinte, o tamanho de amostra associado nB). Ento a
varivel de teste do teste F ser:

s A2
Fn A 1, nB 1 sB 2
INE 7002 - Inferncia Estatstica Testes de Hipteses 26

Esta varivel segue uma distribuio amostral chamada F de Fisher (ou de Snedecor), trata-
se de uma distribuio assimtrica, que somente pode assumir valores positivos, e que possui graus
de liberdade associados ao numerador e ao denominador de um quociente. Veja a figura abaixo, de
uma distribuio F com 9 e 7 graus de liberdade:

Figura 4 - Distribuio F - 14 graus de liberdade no numerador e denominador

O resultado do quociente ento comparado a um valor crtico, que ser F9,7; 0,025: bastaria
procur-lo em uma tabela adequada (como a tabela que est na pgina 13 do Apndice, sendo 9 o
nmero de graus de liberdade do numerador da estatstica e 9 o nmero de graus de liberdade do
denominador da estatstica). Se o resultado for maior do que o valor crtico REJEITA-SE H0, h
evidncias estatsticas suficientes de que as varincias populacionais da varivel so diferentes: ao
realizar o teste de diferena entre as mdias a varivel t dever ter graus de liberdade. Se o
resultado for menor, ACEITA-SE H0, no h evidncia estatstica suficiente de diferena entre as
varincias populacionais: ao realizar o teste de diferena entre as mdias a varivel t ter n 1 + n2 2
graus de liberdade (onde n 1 e n2 so os tamanhos das respectivas amostras).

Exemplos de aplicao do teste F sero apresentados na prxima seo.

10.6. 4 - Teste t para 2 amostras independentes varincias populacionais


DESCONHECIDAS.

Neste caso h interesse em comparar as mdias de uma varivel quantitativa em dois grupos
(populaes) distintas, independentes, atravs de duas amostras aleatrias retiradas de cada grupo,
respectivamente. Mas, as varincias da varivel nas duas populaes (1 e 2 ) so
2 2

DESCONHECIDAS: ento preciso verificar se tais varincias podem ser consideradas iguais ou
no, para definir quantos graus de liberdade ter a varivel de teste t. O roteiro para este teste est
nas pginas 6 e 7 do Apndice: observe que a partir do item 3 do roteiro deve-se seguir sempre as
frmulas e procedimentos do item b.2 ou b.3, especficos para os casos em que as varincias
populacionais so desconhecidas, supostas iguais ou diferentes, respectivamente.

Se as varincias forem supostas iguais, o nmero de graus de liberdade ser n1 + n2 2


(onde n1 e n2 so os tamanhos das amostras). Se as varincias forem supostas diferentes, o nmero
de graus de liberdade ser igual a , cuja expresso :
INE 7002 - Inferncia Estatstica Testes de Hipteses 27



(1 2 ) 2 2 s 2 s 2
Onde 1 1 2 2
2 22 n1 n2
1
( n 1 1) ( n 2 1)
n1 e n2 so os tamanhos das amostras e s12 e s22 so as varincias AMOSTRAIS.

Exemplo 10.9 - A Jabyl Circuits est avaliando o tempo de montagem de um novo modelo de
circuito em 2 de suas unidades. Suspeita-se que o desempenho da fbrica 1 seja pior do que o da
fbrica 2 (aquela seria mais lenta). Supe-se que as distribuies dos tempos podem ser
consideradas normais. Foram coletadas duas amostras de tempos de montagem: 8 na fbrica 1,
resultando em mdia de 3,52 minutos, varincia de 1,5 minutos 2 e 10 na fbrica 2, resultando em
mdia de 1,85 minutos e varincia de 1,7 minutos 2. A suspeita procedente a 1% de significncia?
Trata-se de uma situao em que queremos comparar as MDIAS DE DUAS distribuies
normais, supondo que se trata de duas populaes distintas, podemos supor que as amostras so
independentes: est sendo avaliado o tempo de montagem dos circuitos em 2 fbricas
DIFERENTES. H interesse em verificar se a mdia da populao da fbrica 1 maior do que a de
fbrica 2 (ou seja, que leve mais tempo para montar os circuitos na fbrica 1, significando um
desempenho pior). Reparem que exigido que se tome uma deciso, o que configura um problema
de TESTE DE HIPTESES.
Iremos ento aplicar um TESTE DE DIFERENA ENTRE AS MDIAS DE UMA
VARIVEL EM 2 POPULAES. O roteiro encontra-se nas pginas 6 e 7 do Apndice. Como as
amostras so independentes, e as varincias populacionais so DESCONHECIDAS, vamos usar o
teste t para 2 amostras independentes. Antes, porm precisamos saber se as varincias
populacionais podem ser consideradas iguais ou no: preciso aplicar o teste F de diferena entre
2 varincias.
TESTE F
H 0 : 21 2 2
H 1 : 21 2 2
Queremos apenas verificar se h DIFERENA entre as varincias, por isso o teste ser
sempre BILATERAL.
Nvel de significncia: como a tabela da distribuio F (que est na pgina 13 do Apndice)
apresenta valores apenas para 5% de significncia (teste bilateral) este ser o nvel
adotado em todos os testes F.
2
Encontrar a maior varincia amostral, que ser chamada de s A (e, por conseguinte, nA) e
a menor que ser chamada s B (e por conseguinte nB). Neste problema teremos26:
2

s A s2 1,7 min 2 e n A 10
2 2

sB s1 1,5 min e nB 8
2 2 2

Ento a varivel de teste do teste F ser:


2 1,7
FnA 1,nB 1 ss A2 F9,7 1,133
B 1,5
Procurando o valor crtico na tabela da distribuio F (pgina 13 do Apndice), para 9
graus de liberdade no numerador e 7 no denominador: F9,7;0,025 = 5,52. Como o valor da
varivel F9,7 (1,133) MENOR do que o valor crtico podemos ACEITAR a hiptese de que
as varincias populacionais, desconhecidas, so iguais, com uma chance de erro de 5%.
Sendo assim, a nossa varivel t de Student ter n1+n2-2 graus de liberdade.

26
A varincia o quadrado do desvio padro. Se forem dados os desvios padres amostrais basta elev-los ao quadrado.
INE 7002 - Inferncia Estatstica Testes de Hipteses 28

Agora podemos partir para o teste t propriamente dito.


1) Enunciar as hipteses
De acordo com o que foi no enunciado do problema queremos verificar se a mdia da fbrica 1
maior do que a da fbrica 2; o melhor ponto de partida, que servir para a definio da hiptese
H0, ser considerar que NO H DIFERENA entre as mdias, ou seja, A MDIA DO TEMPO
DE MONTAGEM NA FBRICA 1 IGUAL AO TEMPO DE MONTAGEM NA FBRICA 2
(costumamos colocar em H0 o CONTRRIO do que queremos provar), teremos ento:
H 0 : 1 2
onde 1 FBRICA1 e 2 FBRICA2
H 1 : 1 2
2) Estabelecer o nvel de significncia ou nvel de confiana.
Conforme foi estabelecido no enunciado do problema:
0,01 1 0,99
3) Identificar a varivel de teste.
Como as varincias de ambas as populaes so desconhecidas, e o teste F de diferena entre 2
varincias indicou que podem ser supostas iguais, dever ser usada a varivel t da distribuio t
de Student com n1+n2-2 graus de liberdade.
4) Definir a regio de aceitao de H0, de acordo com o tipo de teste e varivel.
Trata-se de um teste Unilateral Direita (com 1% de significncia), e a varivel de teste t tem
n1+n2-2 (8 + 10 2 = 16) graus de liberdade. Ento o valor crtico (obtido da tabela da
distribuio normal padro) ser:
tcrtico t16;0,01 2,583
Observe a regio de aceitao de H0 na figura abaixo:
Para valores de t maiores do que
2,583,deve-se REJEITAR H0, ou seja, a
mdia do tempo de montagem dos circuitos
na Fbrica 1 maior do que a mdia da
Fbrica 2 (claro que h 1% de chance de
que venhamos a rejeitar H0 sendo ela
verdadeira): as diferenas entre o que era
esperado e o que foi encontrado na
amostra sero consideradas grandes
demais para serem casuais.

5) Calcular o desvio padro das diferenas.


Como as duas varincias so desconhecidas e supostas iguais, iremos utilizar a segunda expresso
para calcular o desvio padro das diferenas que est no roteiro (no item 5 do roteiro do TESTE
DE DIFERENA ENTRE MDIAS: teste Z e t para 2 amostras independentes, no apndice, letra
b.2)

(n 1) s
1 1 1 1
(n2 1) s2
2 2
1 1
(8 1) 1,5 (10 1) 1,7
sd n1 n2 8 10 0,6023
n1 n2 2 8 10 2
6) Calcular a varivel de teste.
Novamente, como as duas varincias so desconhecidas e supostas iguais, iremos utilizar a
segunda expresso para calcular o valor da varivel de teste que est no roteiro (no item 5 do
roteiro do TESTE DE DIFERENA ENTRE MDIAS: teste Z e t para 2 amostras independentes,
no apndice, letra b.2)
INE 7002 - Inferncia Estatstica Testes de Hipteses 29

x1 x2 3,52 1,85
t16 => t16 2,772
sd 0,6023
7)Decidir pela aceitao ou rejeio de H0.
Conforme foi visto anteriormente se o valor da varivel de teste fosse maior do que 2,583 a
hiptese H0 seria rejeitada:
t16 2,772 t16;crtico 2,583
Assim, REJEITAMOS H0 a 1% de significncia..
8) Interpretar a deciso dentro do contexto do problema.
Assim, conclumos com 99% de confiana (ou uma chance de erro de 1%) que H evidncias
estatsticas suficientes para declarar que a mdia do tempo de montagem dos circuitos na Fbrica
1 maior do que a mdia na Fbrica 2. A suspeita procedente. Observe que uma concluso
diferente daquela obtida no Exemplo 10.8.

Exemplo 10.10 - A Jabyl Circuits est avaliando o tempo de montagem de um novo modelo de
circuito em 2 de suas unidades. Suspeita-se que o desempenho da fbrica 1 seja pior do que o da
fbrica 2 (aquela seria mais lenta). Supe-se que as distribuies dos tempos podem ser
consideradas normais. Foram coletadas duas amostras de tempos de montagem: 8 na fbrica 1,
resultando em mdia de 3,52 minutos, varincia de 0,6 minutos 2 e 10 na fbrica 2, resultando em
mdia de 1,85 minutos e varincia de 3,5 minutos 2. A suspeita procedente a 1% de significncia?
Situao semelhante a do Exemplo 10.9, apenas os valores das varincias amostrais
sofreram modificao.

Trata-se de uma situao em que queremos comparar as MDIAS DE DUAS distribuies


normais, supondo que se trata de duas populaes distintas, podemos supor que as amostras so
independentes: est sendo avaliado o tempo de montagem dos circuitos em 2 fbricas
DIFERENTES. H interesse em verificar se a mdia da populao da fbrica 1 maior do que a de
fbrica 2 (ou seja, que leve mais tempo para montar os circuitos na fbrica 1, significando um
desempenho pior). Reparem que exigido que se tome uma deciso, o que configura um problema
de TESTE DE HIPTESES.
Iremos ento aplicar um TESTE DE DIFERENA ENTRE AS MDIAS DE UMA
VARIVEL EM 2 POPULAES. O roteiro encontra-se nas pginas 6 e 7 do Apndice. Como as
amostras so independentes, e as varincias populacionais so DESCONHECIDAS, vamos usar o
teste t para 2 amostras independentes. Antes, porm precisamos saber se as varincias
populacionais podem ser consideradas iguais ou no: preciso aplicar o teste F de diferena entre
2 varincias.

TESTE F
H 0 : 21 2 2
H 1 : 21 2 2
Queremos apenas verificar se h DIFERENA entre as varincias, por isso o teste ser
sempre BILATERAL.
Nvel de significncia: como a tabela da distribuio F (que est na pgina 13 do Apndice)
apresenta valores apenas para 5% de significncia (teste bilateral) este ser o nvel
adotado em todos os testes F.
2
Encontrar a maior varincia amostral, que ser chamada de s A (e, por conseguinte, nA) e
2
a menor que ser chamada s B (e por conseguinte, nB). Neste problema teremos:
s A s2 3,5 min 2 e n A 10
2 2

sB s1 0,6 min e nB 8
2 2 2

Ento a varivel de teste do teste F ser:


INE 7002 - Inferncia Estatstica Testes de Hipteses 30

s A23,5
FnA 1,nB 1 sB 2
F9,7
5,833
0,6
Procurando o valor crtico na tabela da distribuio F (pgina 14 do Apndice), para 9
graus de liberdade no numerador e 7 no denominador: F9,7;0,025 = 5,52. Como o valor da
varivel F9,7 (1,133) MAIOR do que o valor crtico podemos REJEITAR a hiptese de que
as varincias populacionais, desconhecidas, so iguais, com uma chance de erro de 5%.
Sendo assim, a nossa varivel t de Student ter graus de liberdade.

Agora podemos partir para o teste t propriamente dito.


1) Enunciar as hipteses
De acordo com o que foi no enunciado do problema queremos verificar se a mdia da fbrica 1
maior do que a da fbrica 2; o melhor ponto de partida, que servir para a definio da hiptese
H0, ser considerar que NO H DIFERENA entre as mdias, ou seja, A MDIA DO TEMPO
DE MONTAGEM NA FBRICA 1 IGUAL AO TEMPO DE MONTAGEM NA FBRICA 2
(costumamos colocar em H0 o CONTRRIO do que queremos provar), teremos ento:
H 0 : 1 2
onde 1 FBRICA1 e 2 FBRICA2
H 1 : 1 2
2) Estabelecer o nvel de significncia ou nvel de confiana.
Conforme foi estabelecido no enunciado do problema:
0,01 1 0,99
3) Identificar a varivel de teste.
Como as varincias populacionais so desconhecidas e supostas diferentes (de acordo com o teste
F) a varivel t ter graus de liberdade, que ser calculado a seguir:


( 2 )
2 2 2
s1 0,6 s2 3,5
21 2 onde 0,075 0,35
1 2
2 1
n1 8
2
n2 10

n1 1 n 2 1


(0,075 0,35) 2
2 2
2 13 assim, 13
(0,075) (0,35)
8 1 10 1
Ento a varivel de teste t de Student ter 13 graus de liberdade27.
4) Definir a regio de aceitao de H0, de acordo com o tipo de teste e varivel.
Trata-se de um teste Unilateral Direita (com 1% de significncia), e a varivel de teste t tem
= 13 graus de liberdade. Ento o valor crtico (obtido da tabela da distribuio normal padro)
ser:
tcrtico t13;0,01 2,650
Observe a regio de aceitao de H0 na figura abaixo:

27
Observe que um processo razoavelmente trabalhoso.
INE 7002 - Inferncia Estatstica Testes de Hipteses 31

Para valores de t maiores do


que 2,650, deve-se REJEITAR H0, ou
seja a mdia do tempo de montagem
dos circuitos na Fbrica 1 maior do
que a mdia da Fbrica 2 (claro que h
1% de chance de que venhamos a
rejeitar H0 sendo ela verdadeira): as
diferenas entre o que era esperado e o
que foi encontrado na amostra sero
consideradas grandes demais para
serem casuais.
5) Calcular o desvio padro das diferenas.
Como as duas varincias so desconhecidas e supostas diferentes, iremos utilizar a terceira
expresso para calcular o desvio padro das diferenas que est no roteiro (no item 5 do roteiro do
TESTE DE DIFERENA ENTRE MDIAS: teste Z e t para 2 amostras independentes, no apndice,
letra b.3)

2 2
s s 0,6 3,5
sd 1 2 sd 0,6519
n1 n2 8 10
6) Calcular a varivel de teste.
Novamente, como as duas varincias so desconhecidas e supostas diferentes, iremos utilizar a
terceira expresso para calcular o valor da varivel de teste que est no roteiro (no item 5 do
roteiro do TESTE DE DIFERENA ENTRE MDIAS: teste Z e t para 2 amostras independentes,
no apndice, letra b.3)

x1 x 2 3,52 1,85
t13 => t13 2,562
sd 0,6519
7)Decidir pela aceitao ou rejeio de H0.
Conforme foi visto anteriormente se o valor da varivel de teste fosse maior do que 2,650 a
hiptese H0 seria rejeitada:

t13 2,562 t13;crtico 2,650


Assim, ACEITAMOS H0 a 1% de significncia..

8) Interpretar a deciso dentro do contexto do problema.


Assim, conclumos com 99% de confiana (ou uma chance de erro de 1%) que NO h evidncias
estatsticas suficientes para declarar que a mdia do tempo de montagem dos circuitos na Fbrica
1 maior do que a mdia na Fbrica 2. A suspeita NO procedente.
INE 7002 - Inferncia Estatstica Testes de Hipteses 32

BIBLIOGRAFIA
1. BARBETTA,P. A. Estatstica Aplicada s Cincias Sociais. Ed. da UFSC, 7 ed. Florianpolis,
2007.
2. STEVENSON, Willian J. Estatstica Aplicada Administrao. So Paulo: Harbra, 2001
3. MOORE, D.S., McCABE, G.P., DUCKWORTH, W.M., SCLOVE, S. L., A prtica da estatstica
empresarial: como usar dados para tomar decises. Rio de Janeiro: LTC, 2006.
4. TRIOLA, M. F. Introduo Estatstica, 9 ed., Rio de Janeiro: LTC, 2005.
5. SOARES, J. F., FARIAS, A. A., CESAR, C. C. Introduo Estatstica, 2 ed., Rio de Janeiro:
LTC, 2003.
6. BRAULE, Ricardo. Estatstica Aplicada com Excel: para cursos de administrao e economia.
Rio de Janeiro: Campus, 2001.
7. LEVINE, D. M., STEPHAN, D., KREHBIEL, T. C., BERENSON, M. L. Estatstica: Teoria e
Aplicaes - Usando Microsoft Excel em Portugus. 5 ed. Rio de Janeiro: LTC, 2005.
8. DOWNING, D., CLARK, J. Estatstica Aplicada. So Paulo: Saraiva, 2000.
9. SILVA, Paulo Afonso Lopes da, Probabilidades & Estatstica. Rio de Janeiro: Reichmann &
Affonso Editores, 1999.
10. BARBETTA, P.A., REIS, M.M., BORNIA, A.C. Estatstica para Cursos de Engenharia e
Informtica, 3 ed., So Paulo: Atlas, 2010.

Muitas das figuras foram feitas utilizando os seguintes programas computacionais:


SILA - Statistical Inference Laboratory - Autor: Sytse Knypstra, Universidade de Groningen,
Holanda.
PQRS - Autor: Sytse Knypstra, Universidade de Groningen, Holanda.