Escolar Documentos
Profissional Documentos
Cultura Documentos
1.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Populao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.2 Intervalo de confiana para a mdia de uma populao normal com varincia
conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
i
CONTEDO
3.5 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.2 Teste de hiptese sobre a mdia de uma N(; 2 ): procedimento geral para 2
conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.3 Teste de hiptese sobre uma proporo populacional: procedimento geral para
grandes amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.4 Valor P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
6.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.4 Intervalo de confiana para a mdia de uma populao normal com varincia
desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.5 Teste de hiptese sobre a mdia de uma populao normal com varincia
desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
1.1 Introduo
No estudo da estatstica descritiva na primeira parte do curso, vimos que populao o con-
junto de elementos para os quais se deseja estudar determinada(s) caracterstica(s). Vimos
tambm que uma amostra um subconjunto da populao.
EXEMPLO 1.1
Como vimos, essa a definio de varivel aleatria: uma funo que associa a cada
ponto do espao amostral um nmero real. Dessa forma, a nossa populao pode ser re-
presentada pela varivel aleatria X = altura do adulto brasileiro. Como essa uma v.a.
contnua, a ela est associada uma funo densidade de probabilidade f e da literatura,
sabemos que razovel supor que essa densidade seja a densidade normal. Assim, nossa
populao, nesse caso, representada por uma v.a. X N ; 2 . Conhecendo os valores
de e , teremos informaes completas sobre a nossa populao.
CAPTULO 1. INFERNCIA ESTATSTICA CONCEITOS BSICOS
Suponhamos que essa amostra seja retirada com reposio e que os sorteios sejam
feitos de forma independente, isto , o resultado de cada extrao no altera o resultado das
demais extraes. Ao sortearmos o primeiro elemento, estamos realizando um experimento
que d origem v.a. X1 = altura do primeiro elemento; o segundo elemento d origem
v.a. X2 = altura do segundo elemento e assim por diante. Como as extraes so feitas
com reposio, todas as v.a. X1 , X2 , . . . tm a mesma distribuio, que reflete a distribuio
da altura de todos os brasileiros adultos. Para uma amostra especfica, temos os valores
observados x1 , x2 , . . . dessas variveis aleatrias.
EXEMPLO 1.2
Para obtermos informao sobre p, retira-se uma amostra da populao e, como an-
tes, vamos supor que essa amostra seja retirada com reposio. Ao sortearmos o primeiro
elemento, estamos realizando um experimento que d origem v.a. X1 = voto do primeiro
elemento; o segundo elemento d origem v.a. X2 = voto do segundo elemento e assim
por diante. Como as extraes so feitas com reposio, todas as v.a. X1 , X2 , . . . tm a mesma
distribuio de Bernoulli populacional, isto , Xi Bern(p), i = 1, 2, . . ..
1.2 Populao
DEFINIO Populao
Embora existam vrios mtodos de seleo de amostras, vamos nos concentrar, aqui, no
caso mais simples, que a amostragem aleatria simples. Segundo tal mtodo, toda amostra
de mesmo tamanho n tem igual chance (probabilidade) de ser sorteada. possvel extrair
amostras aleatrias simples com e sem reposio. No entanto, para populaes grandes
ou infinitas extraes com e sem reposio levam a resultados muito semelhantes. Assim,
no estudo da Inferncia Estatstica, vamos sempre lidar com amostragem aleatria simples
com reposio. Esse mtodo de seleo atribui a cada elemento da populao a mesma
probabilidade de ser selecionado e esta probabilidade se mantm constante ao longo do
processo de seleo da amostra (se as extraes fossem sem reposio isso no aconteceria).
No restante desse curso, vamos omitir a expresso com reposio, ou seja, o termo
amostragem (ou amostra) aleatria simples sempre se referir amostragem com reposio.
Por simplicidade, muitas vezes abreviaremos o termo amostra aleatria simples por a.a.s..
Uma forma de se obter uma amostra aleatria simples escrever os nmeros ou no-
mes dos elementos da populao em cartes iguais, colocar esses cartes em uma urna
misturando-os bem e fazer os sorteios necessrios, tendo o cuidado de colocar cada carto
sorteado na urna antes do prximo sorteio. Na prtica, em geral, so usados programas de
computador, uma vez que as populaes tendem a ser muito grandes.
Seja uma populao representada por uma varivel aleatria X . De tal populao
ser sorteada uma amostra aleatria simples com reposio de tamanho n. Como visto nos
exemplos anteriores, cada sorteio d origem a uma varivel aleatria Xi e, como os sorteios
so com reposio, todas essas variveis tm a mesma distribuio de X . Isso nos leva
seguinte definio.
Obtida uma a.a.s., possvel calcular diversas caractersticas desta amostra, como, por exem-
plo, a mdia, a mediana, a varincia etc. Qualquer uma destas caractersticas uma funo
de X1 , X2 , ..., Xn e, portanto, o seu valor depende da amostra sorteada. Sendo assim, cada
uma dessas caractersticas ou funes tambm uma v.a. Por exemplo, a mdia amostral
a v.a. definida por
X1 + X2 + + Xn
X=
n
Isso nos leva seguinte definio.
DEFINIO Estimador
mdia amostral
X1 + X2 + + Xn
X= (1.1)
n
varincia amostral n
1 X 2
S =
2
Xi X (1.2)
n 1 i=1
Para uma amostra especfica, o valor obtido para o estimador ser denominado estima-
tiva e eesas estimativas, em geral, sero representadas por letras minsculas. Por exemplo,
temos as seguintes notaes correspondentes mdia e varincia amostrais: x e s2 .
DEFINIO Parmetro
Mdia X
Varincia 2 S2
Nmero de elementos N n
EXEMPLO 1.3
Consideremos a populao {1, 3, 6, 8}, isto , este o conjunto dos valores da caracte-
rstica de interesse da populao em estudo. Assim, para esta populao, ou seja, para essa
v.a. X , temos
1
E(X ) = = (1 + 3 + 6 + 8) = 4, 5
4
1h i
V ar(X ) = 2 = (1 4, 5)2 + (3 4, 5)2 + (6 4, 5)2 + (8 4, 5)2 = 7, 25
4
Suponha que o objetivo do estudo seja estimar a mdia populacional a partir de uma
a.a.s. de tamanho dois. Para isso, usaremos a estatstica mdia amostral X .
Como o sorteio feito com reposio, em cada um dos sorteios temos quatro possibili-
dades. Logo, o nmero total de amostras aleatrias simples 4 4 = 16. Por outro lado, em
cada sorteio, cada elemento da populao tem a mesma chance de ser sorteado; como so
quatro elementos, cada elemento tem probabilidade 1/4 de ser sorteado. Finalmente, como
os sorteios so independentes, para obter a probabilidade de um par de elementos pertencer
amostra, basta multiplicar as probabilidades (lembre-se que P(A B) = P(A) P(B) quando
A e B so independentes).
Na tabela a seguir, listamos todas as possveis amostras, com suas respectivas proba-
bilidades e para cada uma delas, apresentamos o valor da mdia amostral.
x 1 2 3 3, 5 4, 5 5, 5 6 7 8
P(X = x) 1/16 2/16 1/16 2/16 4/16 2/16 1/16 2/16 1/16
1 2 1 2
E(X ) = 1 +2 +3 + 3, 5 +
16 16 16 16
5 2 1 2 1
+4, 5 + 5, 5 +6 +7 +8
16 16 16 16 16
= 4, 5 =
1 2 1
Var(X ) = (1 4, 5)2 + (2 4, 5)2 + (3 4, 5)2 +
16 16 16
2 5 2
+(3, 5 4, 5)2 + (4, 5 4, 5)2 + (5, 5 4, 5)2 +
16 16 16
1 2 1
+(6 4, 5)2 + (7 4, 5)2 + (8 4, 5)2
16 16 16
7, 25 2 2
= 3, 625 = = =
2 2 n
amostra. Esses resultados esto nos dizendo que a mdia (esperana) da estatstica X
igual mdia da populao e que sua varincia igual varincia da populao dividida
pelo tamanho da amostra.
EXEMPLO 1.4
Da mesma forma que fizemos para a mdia amostral, vamos calcular o valor dessas
estatsticas para cada uma das amostras.
2
P
Amostra x (x1 x)2 (x2 x)2 (xi x)2 S2 b 2
i=1
(1, 1) 1 (1 1)2 (1 1)2 0 0 0
(1, 3) 2 (1 2)2 (3 2)2 2 2 1
(1, 6) 3, 5 (1 3, 5)2 (6 3, 5)2 12, 5 12, 5 6, 25
(1, 8) 4, 5 (1 4, 5)2 (8 4, 5)2 24, 5 24, 5 12, 25
(3, 1) 2 (3 2)2 (1 2)2 2 2 1
(3, 3) 3 (3 3)2 (3 3)2 0 0 0
(3, 6) 4, 5 (3 4, 5)2 (6 4, 5)2 4, 5 4, 5 2, 25
(3, 8) 5, 5 (3 5, 5)2 (8 5, 5)2 12, 5 12, 5 6, 25
(6, 1) 3, 5 (6 3, 5)2 (1 3, 5)2 12, 5 12, 5 6, 25
(6, 3) 4, 5 (6 4, 5)2 (3 4, 5)2 4, 5 4, 5 2, 25
(6, 6) 6 (6 6)2 (6 6)2 0 0 0
(6, 8) 7 (6 7)2 (8 7)2 2 2 1
(8, 1) 4, 5 (8 4, 5)2 (1 4, 5)2 24, 5 24, 5 12, 25
(8, 3) 5, 5 (8 5, 5)2 (3 5, 5)2 12, 5 12, 5 6, 25
(8, 6) 7 (8 7)2 (6 7)2 2 2 1
(8, 8) 8 (8 8)2 (8 8)2 0 0 0
s2 0 2 4, 5 12, 5 24, 5
P(S 2 = s2 ) 4/16 4/16 2/16 4/16 2/16
Vemos, ento que a mdia de S 2 igual varincia populacional, o que no ocorre com
b .
2
Estes dois exemplos ilustram o fato de que qualquer estatstica amostral T uma
varivel aleatria, que assume diferentes valores para cada uma das diferentes amostras.
Tais valores nos forneceriam, juntamente com a probabilidade de cada amostra, a funo de
distribuio de probabilidades de T , caso fosse possvel obter todas as a.a.s. de tamanho n
da populao.
Isso nos leva seguinte definio, que um conceito central na Inferncia Estatstica.
Dada uma populao, existem vrias a.a.s. de tamanho n que podem ser sorteadas.
Cada uma dessas amostras resulta em um valor diferente da estatstica de interesse (X e
S 2 , por exemplo). O que esses resultados esto mostrando como esses diferentes valores
se comportam em relao ao verdadeiro (mas desconhecido) valor do parmetro.
Nas partes (a) e (b) da figura, os tiros esto distribudas em torno do alvo, enquanto
nas partes (c) e (d) isso no acontece. Comparando as partes (a) e (b), podemos ver que na
parte (b), os tiros esto mais concentrados em torno do alvo, isto , tm menor disperso.
Isso reflete uma pontaria mais certeira do atirador em (b).
(a) (b)
(c) (d)
Analogamente, nas partes (c) e (d), embora ambos os atiradores estejam com a mira
deslocada, os tiros do atirador (d) esto mais concentrados em torno de um alvo; o desloca-
mento poderia at ser resultado de um desalinhamento da arma. J o atirador (c), alm de
estar com o alvo deslocado, ele tem os tiros mais espalhados, o que reflete menor preciso.
Nas partes (a) e (b), temos dois estimadores que fornecem estimativas centradas em
torno do verdadeiro valor do parmetro, ou seja, as diferentes amostras fornecem valores
distribudos em torno do verdadeiro valor do parmetro. A diferena que em (a) esses
valores esto mais dispersos e, assim, temos mais chance de obter uma amostra infeliz,
ou seja, uma amostra que fornea um resultado muito afastado do valor do parmetro.
Essas duas propriedades esto associadas esperana e varincia do estimador, que
so medidas de centro e disperso, respectivamente.
Nas partes (c) e (d), as estimativas esto centradas em torno de um valor diferente do
parmetro de interesse e, na parte (c), a disperso maior.
Como nos exemplos vistos, essa esperana calculada ao longo de todas as possveis
amostras, ou seja, a esperana da distribuio amostral de T . Nas partes (a) e (b) da Figura
1.3 os estimadores so no-viesados e nas partes (c) e (d), os estimadores so viesados.
Na Figura 1.3, o estimador da parte (b) mais eficiente que o estimador da parte (a).
2.1 Introduo
Na Inferncia Estatstica, o objetivo obter informao sobre uma populao a partir de uma
amostra. Vimos, no captulo anterior, que uma populao estatstica representada por uma
varivel aleatria X e, assim, um dos parmetros de interesse a mdia (ou esperana) dessa
varivel. Neste captulo estudaremos as propriedades da mdia amostral X como estimador
da mdia populacional . Como visto anteriormente, tais propriedades so definidas a partir
da distribuio amostral de X , que a distribuio de probabilidade ao longo de todas as
possveis amostras aleatrias simples de tamanho n.
No captulo anterior, vimos, por meio de exemplos, que a mdia amostral X um estimador
no-viesado da mdia populacional . Na verdade, temos o seguinte resultado geral.
! Mdia e Varincia de X
E(X ) = (2.1)
2
Var(X ) = (2.2)
n
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA
importante notar que esse resultado se refere a qualquer populao X . O que ele
estabelece que as mdias amostrais das diferentes amostras aleatrias simples de tamanho
n tendem a acertar o alvo da mdia populacional ; lembre-se da Figura 1.3, partes (a) e
(b). Alm disso, medida que o tamanho amostral n aumenta, a disperso em torno do alvo,
medida por V ar(X ), vai diminuindo e tende a zero quando n .
Na prtica estatstica, vrias populaes podem ser descritas, aproximadamente, por uma
distribuio normal. Obviamente, o teorema anterior continua valendo no caso de uma po-
pulao normal, mas temos uma caracterstica a mais da distribuio amostral da mdia: ela
tambm normal.
Soluo
Podemos considerar os sete passageiros como uma amostra aleatria simples da po-
pulao de todos os usurios, representada pela v.a. X N(70; 100). Seja, ento, X1 , . . . , X7
uma aas de tamanho n = 7. Se o peso mximo 500kg, para que sete pessoas ultrapassem
o limite de segurana temos de ter
7
X 7
1X 500
Xi > 500 Xi > X > 71, 729
i=1
7 i=1 7
Podemos ver que existe uma probabilidade alta (0,32 ou 32% de chance) de sete pessoas
ultrapassarem o limite de segurana. J com seis pessoas, essa probabilidade bastante
pequena. Assim, o nmero mximo de pessoas no elevador deve ser estabelecido como seis
ou menos.
EXEMPLO 2.2
(d) Que tamanho deveria ter a amostra para que P(90 < X < 110) = 0, 95?
Soluo
(a)
90 100 110 100
P(90 < X < 110) = P <Z < = P(1 < Z < 1)
10 10
= 2 P(0 < Z < 1) = 2 tab(1, 0) = 0, 68268
(b) Com n = 16, resulta que X N 100; 100
16
90 100 110 100
P(90 < X < 110) = P q <Z < q
100 100
16 16
= P(4 < Z < 4) = 2 P(0 < Z < 4) = 2 tab(4, 0) 1, 00
(c) Veja a Figura 2.2. Como visto, a distribuio amostral com n = 16 menos dispersa que
a distribuio populacional e, ento, podemos ver que, entre 90 e 110, temos concentrada
praticamente toda a distribuio de X .
(d)
(a) Em quanto deve ser regulado o peso mdio para que apenas 10% dos pacotes tenham
menos do que 500g?
(b) Com a mquina assim regulada, qual a probabilidade de que o peso total de quatro
pacotes escolhidos ao acaso seja inferior a 2kg?
Soluo
(a) Seja X a varivel aleatria que representa o peso dos pacotes. Sabemos, ento, que
X N(; 100). Queremos que
500
P Z< = 0, 10
10
500
P Z > = 0, 10
10
500
P Z> = 0, 10
10
500
P 0Z = 0, 40
10
500
tab = 0, 40
10
500
= 1, 28 = 512, 8 g
10
4
P
(b) Sejam X1, X2 , X3 , X4 os pesos dos 4 pacotes da amostra. Queremos que Xi < 2000g.
i=1
Isso equivalente a X < 500. Logo,
X 512, 8 500 512, 8
P(X < 500) = P q < q
100 100
4 4
= P(Z < 2, 56) = P(Z > 2, 56)
= 0, 5 P(0 Z 2, 56)
= 0, 5 tab(2, 56)
= 0, 5 0, 49477 = 0, 00523
Com a mquina regulada para 512,8g, h uma probabilidade de 0,00523 de que uma
amostra de 4 pacotes apresente peso mdio inferior a 500g. Note que com um pacote
apenas, essa probabilidade de 10%. Por isso, as inspees de controle de qualidade
so sempre feitas com base em amostras de tamanho n > 1.
Volte ao Exemplo 2.3. Depois de regulada a mquina, prepara-se uma carta de controle de
qualidade. Uma amostra de 4 pacotes ser sorteada a cada hora. Se a mdia da amostra for
inferior a 497g ou superior a 520g, a produo deve ser interrompida para ajuste da mquina,
isto , ajuste do peso mdio.
Soluo
(a) Parada desnecessria: amostra indica que o processo est fora de controle (X < 497 ou
X > 520), quando, na verdade, o processo est ajustado ( = 512, 8). Neste caso, pode-
mos usar a notao de probabilidade condicional para auxiliar na soluo do exerccio.
Queremos calcular
P X < 497 X > 520 | X N 512, 8; 100 4
= P X < 497 | X N (512, 8; 25) + P X > 520 | X N (512, 8; 25)
497 512, 8 520 512, 8
= P Z < +P Z >
5 5
= P(Z < 3, 16) + P(Z > 1, 44)
= P(Z > 3, 16) + Pr(Z > 1, 44)
= [0, 5 tab(3, 16)] + [0, 5 tab(1, 44)]
= 1, 0 0, 49921 0, 42507
= 0, 07572
Note que a probabilidade de uma parada desnecessria pequena, custa de uma alta
probabilidade de se operar fora de controle.
Quo grande deve ser a amostra para se obter uma boa aproximao depende das
caractersticas da distribuio populacional. Se a distribuio populacional no se afastar
muito de uma distribuio normal, a aproximao ser boa, mesmo para tamanhos pequenos
de amostra. Na Figura 2.5 ilustra-se esse teorema para uma distribuio exponencial com
parmetro = 1 (essa distribuio faz parte de uma outra famlia de distribuies contnuas).
O grfico superior representa a distribuio populacional e os histogramas representam a
distribuio amostral de X ao longo de 5.000 amostras de tamanhos 10, 50, 100 e 5000.
Assim, podemos ver que, embora a populao seja completamente diferente da normal, a
distribuio amostral de X vai se tornando cada vez mais prxima da normal medida que
n aumenta.
Figura 2.5 Ilustrao do Teorema Limite Central para uma populao X exp(1)
Em termos prticos, esse teorema de extrema importncia, por isso chamado teorema
central e, em geral, amostras de tamanho n > 30 j fornecem uma aproximao razovel.
Soluo
Neste caso, a populao pode ser representada por uma varivel de Bernoulli X com
parmetro p, isto , X assume o valor 1 com probabilidade p na ocorrncia de cara e assume
o valor 0 com probabilidade 1 p na ocorrncia de coroa. Para uma varivel de Bernoulli,
temos que E(X ) = p e Var(X ) = p(1 p). Como so feitos 50 lanamentos, o tamanho da
amostra 50 (n grande!) e, pelo Teorema Limite Central, X aproximadamente normal com
mdia E(X ) = p e varincia Var(X ) = p(1p)
50
.
Suponhamos que a moeda seja honesta, isto , que p = 1/2. Nessas condies, qual
a probabilidade de obtermos 36 caras em 50 lanamentos? Com a hiptese de honestidade
da moeda, o Teorema Limite Central nos diz que
!
1 12 21
X N ;
2 50
A probabilidade de se obter 36 ou mais caras em 50 lanamentos equivalente probabili-
dade de X ser maior ou igual a 50
36
= 0, 72 e essa probabilidade
X 0, 5 0, 72 0, 5
P(X 0, 72) = P q q
1 1
200 200
= P(Z 3, 11) = 0, 5 Pr(0 Z < 3, 11) =
= 0, 5 tab(3, 11) = 0, 5 0, 49906 = 0, 00094
Note que essa probabilidade bastante pequena, ou seja, h uma pequena probabili-
dade de obtermos 36 ou mais caras em 50 lanamentos de uma moeda honesta. Isso pode
nos levar a suspeitar sobre a honestidade da moeda!
Soluo
A probabilidade de se obter esse valor nas condies dadas pelo gerente muito
pequena, o que pode nos fazer suspeitar da veracidade das afirmativas. provvel que ou a
mdia no seja 2 (e, sim, menor que 2), ou o desvio-padro no seja 0,05 (e, sim, maior que
0,05).
Consideremos, agora, uma populao em que cada elemento classificado de acordo com
a presena ou ausncia de determinada caracterstica. Por exemplo, podemos pensar em
eleitores escolhendo entre dois candidatos, pessoas classificadas de acordo com o sexo,
trabalhadores classificados como trabalhador com carteira assinada ou no, e assim por
diante. Em termos de varivel aleatria, essa populao representada por uma varivel de
Bernoulli, isto :
X=
1, se elemento possui a caracterstica de interesse
0, se elemento no possui a caracaterstica de interesse
P(X = 1) = p
E(X ) = p
Var(X ) = p(1 p)
E(X ) = E(X ) = p
Var(X ) p(1 p)
Var(X ) = =
n n
Mas, note que X nada mais que a proporo dos elementos da amostra que possuem
a caracterstica de interesse, ou seja, X a proporo amostral, que denotaremos por P.
b
Resulta, ento, que Pb um estimador no-viesado para a proporo populacional p.
A aproximao dada pelo Teorema Limite Central ser melhor para valores grandes de n.
Existe uma seguinte regra emprica para nos ajudar a decidir o que grande, conforme
explicado a seguir.
1. np 10
2. n(1 p) 10
Soluo
b 0, 12) = P rP 0, 1 r 0, 12 0, 1
b
P(P 0, 1 0, 9
0, 1 0, 9
200 200
P(Z 0, 9428) = 0, 5 + tab(0, 94) = 0, 8264
(a) 0,995
(b) 0,85
Soluo
(b) Se a confiabilidade 0,85, ento a probabilidade de o item ser defeituoso 0,15. Note
que 2500 0, 15 = 375 e 1.000 0, 85 = 2125, de modo que podemos usar a aproximao
normal.
b 0, 03) = P r P 0, 15 0, 03 0, 15
b
P(P 0, 15 0, 85 r 0, 15 0, 85
2500 2500
P(Z 16, 8) 1
O objetivo central da Inferncia Estatstica obter informaes para uma populao a partir
do conhecimento de uma nica amostra. Em geral, a populao representada por uma
varivel aleatria X , com funo de distribuio ou densidade de probabilidade fX .
Dessa populao, ento, extrai-se uma amostra aleatria simples com reposio, que d
origem a um conjunto X1 , X2 , . . . , Xn de n variveis aleatrias independentes e identicamente
distribudas, todas com a mesma distribuio fX . Se fX depende de um ou mais parmetros,
temos de usar a informao obtida a partir da amostra para estimar esses parmetros, de
forma a conhecermos a distribuio.
Nos captulos anteriores, por exemplo, vimos que a mdia amostral X um bom esti-
mador da mdia populacional , no sentido de que ela tende a acertar o alvo da verdadeira
mdia populacional. Mas vimos, tambm, que existe uma variabilidade nos valores de X , ou
seja, cada possvel amostra d origem a um valor diferente do estimador.
Na prtica, temos apenas uma amostra e, assim, importante que se d alguma in-
formao sobre essa possvel variabilidade do estimador. Ou seja, importante informar o
valor do estimador b obtido com uma amostra especfica, mas importante informar tambm
que o verdadeiro valor do parmetro poderia estar em um determinado intervalo, digamos,
no intervalo [
b ,
b + ]. Dessa forma, informamos a nossa margem de erro no processo
de estimao; essa margem de erro consequncia do processo de seleo aleatria da
amostra.
O que vamos estudar agora como obter esse intervalo, de modo a acertar na maioria
das vezes, isto , queremos um procedimento que garanta que, na maioria das vezes (ou das
amostras possveis), o intervalo obtido conter o verdadeiro valor do parmetro. A expresso
CAPTULO 3. INTERVALOS DE CONFIANA BASEADOS NA DISTRIBUIO NORMAL
na maioria das vezes ser traduzida como probabilidade alta. Veja a Figura 3.1: a os
intervalos so representados pelas linhas horizontais e podemos ver que 2 deles no acertam
o alvo, no sentido de no conterem o verdadeiro valor do parmetro , representado pela
linha vertical.
Figura 3.1 Interpretao dos intervalos de confiana
! Intervalo de confiana
h i
P b ;
b+ =1 (3.1)
Mais uma vez, a probabilidade se refere probabilidade dentre as diversas possveis amos-
tras, ou seja, a probabilidade est associada distribuio amostral de .
b Note que os
limites do intervalo dependem de ,
b que depende da amostra sorteada, ou seja, os limites
do intervalo de confiana so variveis aleatrias. Cada amostra d origem a um intervalo
diferente, mas o procedimento de obteno dos intervalos garante probabilidade 1 de
acerto.
Em um estudo sobre o ndice de Massa Corporal (IMC), foi reportado o seguinte intervalo de
confiana de 95% para o IMC mdio de determinada populao, com base em uma amostra
de 650 mulheres: [26, 8 0, 6; 26, 8 + 0, 6]. O que podemos dizer e o que no podemos dizer
com base nesse intervalo?
Soluo
O que podemos dizer sobre o intervalo dado que ele foi gerado a partir de uma
amostra especfica com um mtodo que tem 95% de chance de gerar intervalos anlogos,
baseados em outras amostras, que contero o parmetro populacional .
Vamos agora, introduzir os mtodos para obteno do intervalo de confiana para a mdia
de uma populao. Como visto, a mdia populacional um parmetro importante, que pode
ser muito bem estimado pela mdia amostral X . Para apresentar as ideias bsicas, vamos
considerar um contexto que pouco frequente na prtica. O motivo para isso que, em
termos didticos, a apresentao bastante simples. Como o fundamento o mesmo para
contextos mais gerais, essa abordagem se justifica.
Consideremos, ento, uma populao descrita por uma varivel aleatria normal com
mdia e varincia 2 : X N(; 2 ). Vamos supor que o valor de 2 seja conhecido
e que nosso interesse seja estimar a mdia a partir de uma amostra aleatria simples
X1 , X2 , . . . , Xn . Como visto no Captulo 6.1, a distribuio amostral de X normal com mdia
e varincia n , ou seja
2
2
X N ; = X N ;
2
n
ou equivalentemente,
X
Z= n N(0; 1) (3.3)
Consideremos, agora, o valor crtico z/2 , conforme ilustrado na Figura 3.3. Da podemos
ver que, se Z N(0; 1), ento
P (z/2 Z z/2 ) = 1 (3.4)
Note que isso vale para a distribuio normal padro, em geral. Ento, usando os
resultados das Equaes 3.3 e 3.4, obtemos que
X
P z/2 n z/2 = 1
Na prtica, temos apenas uma amostra e o intervalo obtido com essa amostra especfica,
ou contm ou no contm o verdadeiro valor de . A afirmativa
P X z/2 ; X + z/2 =1
n n
vlida porque ela envolve a varivel aleatria X , que tem diferentes valores para as dife-
rentes amostras. Quando substitumos o estimador X por uma estimativa especfica x obtida
a partir de uma amostra particular, temos apenas um intervalo e no faz mais sentido falar
em probabilidade.
Soluo
Analisando a Figura 3.3, vemos que nas duas caudas da distribuio normal padro
temos de ter 5% da rea; logo, em cada cauda temos de ter 2,5% da rea total. Em termos
da Tabela 1 da distribuio normal padro, isso significa que entre 0 e z0,025 temos de ter
(50 2, 5)% = 47, 5% e, assim, temos de procurar no corpo da tabela o valor de 0,475 para
determinar a abscissa z0,025 . Veja a Figura 3.4.
Procurando no corpo da tabela da distribuio normal padro, vemos que o valor 0,475
corresponde abscissa z0,025 = 1, 96. Logo, nosso intervalo de confiana
78, 2 1, 96 ; 78, 2 + 1, 96
16 16
= [72, 9733 ; 83, 4267]
36 36
Vamos, agora, analisar a margem de erro do intervalo de confiana para a mdia de uma
populao normal com varincia conhecida. Ela dada por
= z/2 (3.7)
n
Analisando a equao (3.7), vemos que a margem de erro depende diretamente do valor
crtico e do desvio-padro populacional e inversamente proporcional raiz quadrado do
tamanho da amostra.
0 = = n0 = 2 n n0 = 4n
1 1 1
2 n 0 2 n
Soluo
que pode ser achada observando-se que o intervalo de confiana simtrico em torno de x.
Logo, x o ponto mdio do intervalo:
1, 79 + 3, 01
x= = 2, 4
2
Da conclui-se que a margem de erro = 2, 4 1, 79 = 0, 61. Outra informao importante
o nvel de confiana, que deve ser encontrado a partir da abscissa z/2 na margem de erro:
0, 61 45
0, 61 = z/2 z/2 =
3
= 1, 36
45 3
Consultando a tabela da distribuio normal, vemos que tab(1, 36) = 0, 4131. Logo, o nvel
de confiana 2 0, 4131 = 0, 8262 0, 83. Veja a Figura 3.7.
e, portanto
r r !
p(1 p) p(1 p)
P z/2 P
b p z/2 = 1 =
n n
r r !
p(1 p) p(1 p)
P P
b z/2 p P
b + z/2 = 1 =
n n
r r !
p(1 p) p(1 p)
P Pb z/2 pP b + z/2 = 1
n n
Soluo
O primeiro fato a observar que a amostra grande, com sucessos e fracassos sufici-
entes. Com um nvel de significncia de = 0, 05, o nvel de confiana 1 = 0, 95 e,
da tabela da normal padro, obtemos que z/2 = 1, 96. Como no temos estimativa prvia da
proporo de defeituosas p, temos de usar a proporo amostral p b = 0, 30. Assim, a margem
de erro r
0, 3 0, 7
= 1, 96 = 0, 0898
100
e o intervalo de confiana
= z/2 EP
cb
P
Na Figura 3.8 temos o grfico da funo f(p) = p(1 p) para p [0, 1]. Note que
o mximo da funo atingido quando p = 0, 5; ento, mantidos o nvel de confiana e o
tamanho da amostra fixos, a margem de erro ser mxima quando p = 0, 5 e, nesse caso,
teremos o maior intervalo de confiana possvel. Essa uma abordagem conservadora, que
pode ser usada quando no se tem qualquer conhecimento sobre o valor p para gerar uma
estimativa razovel p
b0 .
Para estimao da mdia de uma populao nomal com varincia conhecida, temos
2
= z/2 = n = z/2 = n = z/2 (3.9)
n
Trabalhando com o pior cenrio, isto , com p = 0, 5, essa frmula se simplifica para
2 z 2
0, 5 /2
n = z/2 = n = (3.11)
2
De uma populao normal com varincia 25 extrai-se uma amostra aleatria simples de
tamanho n com o objetivo de se estimar a mdia populacional com um nvel de confiana
de 90% e margem de erro de 2. Qual deve ser o tamanho da amostra?
Soluo
0,05 e, portanto, para encontrarmos o valor de z0,05 temos que procurar no corpo da tabela
o valor 0,45 (se necessrio, consulte a Figura 3.4). Resulta que z0,05 = 1, 64. Temos, ento,
todos os valores necessrios:
1, 64 5
2 = 1, 64 n =
5
= 4, 1 n = 16, 71
n 2
Como o valor de n tem de ser um inteiro, uma estimativa apropriada n = 17 (devemos
arredondar para cima para garantir um nvel de confiana no mnimo igual ao desejado).
(a) De posse das informaes dadas, o consultor calcula o tamanho da amostra necessrio
no pior cenrio. O que significa pior cenrio nesse caso? Qual o tamanho de amostra
obtido pelo consultor?
(b) O gerente acha que o custo de tal amostra seria muito alto e autoriza o consultor a
realizar um estudo piloto com uma amostra de 100 pessoas para obter uma estimativa
da verdadeira proporo. O resultado desse estudo piloto uma estimativa p
b = 0, 76 de
aceitao do novo produto. Com base nessa estimativa, o consultor recalcula o tamanho
da amostra necessrio. Qual esse tamanho?
(c) Selecionada a amostra com o tamanho obtido no item anterior, obteve-se uma proporo
de 72% de clientes favorveis ao produto. Construa um intervalo de confiana para a
verdadeira proporo com nvel de confiana de 90%.
Soluo
(a) O pior cenrio quando a populao est dividida meio-a-meio em suas preferncias,
ou seja, quando p = 0, 5. Com nvel de confiana de 80%, obtemos z0,10 = 1, 28 essa
abscissa deixa 10% em cada cauda da distribuio normal padro. Nesse caso,
r 2
0, 5 0, 5 1, 28
0, 01 = 1, 28 = n = 0, 25 = 4096
n 0, 01
3.5 Resumo
Vamos, agora, apresentar um resumo baseado nos resultados que sero fornecidos na prova,
a saber:
E(X ) =
2
Populao X N(; ) = 2
= X N ;
n
Var(X ) = 2
E(X ) = p
Populao X Bern(p) = b N p; p
= P
b0 (1 p
b0 )
n
Var(X ) = p(1 p) p
b0 (1 p
b0 )
4.1 Introduo
Na teoria de estimao, vimos que possvel, por meio de estatsticas amostrais adequadas,
estimar parmetros de uma populao, dentro de um certo intervalo de confiana.
Vamos trabalhar com alguns exemplos para ilustrar os conceitos bsicos de que preci-
samos para construir testes de hipteses estatsticos.
Uma empresa compra anis de vedao de dois fabricantes. Segundo informaes dos
fabricantes, os anis do fabricante 1 tm dimetro mdio de 14 cm com desvio padro de
1,2 cm e os anis do fabricante 2 tm dimetro mdio de 15 cm com desvio padro de
2,0 cm. Ambos os processos de produo geram anis com dimetros cuja distribuio
aproximadamente normal.
Uma caixa com 16 anis sem identificao encontrada pelo gerente do almoxarifado.
Embora ele suspeite que a caixa seja oriunda do fabricante 1, decide fazer uma medio dos
anis e basear sua deciso no dimetro mdio da amostra: se o dimetro mdio for maior que
14,5 cm, ele identificar a caixa como oriunda do fabricante 2; caso contrrio, ele identificar
a caixa como oriunda do fabricante 1.
isso, precisamos formular uma hiptese nula, que uma afirmao sobre um parmetro da
populao.
Neste exemplo, existem apenas duas possibilidades para a origem dos anis de vedao.
Como o gerente suspeita que a caixa venha do fabricante 1, vamos estabelecer a hiptese
nula de forma que o resultado desejado seja rejeit-la. Definimos, ento, a hiptese nula
como sendo
H0 : anis vm do fabricante 2
e, obviamente, a hiptese alternativa ser
H1 : anis vm do fabricante 1
Se denotamos por X a varivel aleatria que representa o dimetro dos anis, essas hipteses
se traduzem como
H0 : X N(15; 2, 02 )
H1 : X N(14; 1, 22 )
x 14, 5 = rejeito H0
x > 14, 5 = no rejeito H0
Se H0 falsa, a amostra vem de uma populao normal com mdia 14 e desvio padro
1,2. Nesse caso, a mdia amostral com base em amostra de tamanho 16 tambm normal
com mdia 14 e desvio padro 1,2
16
.
1
Mais adiante, veremos um procedimento objetivo para estabelecimento das hipteses nula e alternativa em
contextos mais complexos.
!
1, 22 14, 5 14
= P(Erro II) = P X > 14, 5|X N 14; =P Z > 1.2
16 4
= P(Z > 1, 67) = 0, 5 tab(1, 67) = 0, 04746
Vemos a que a probabilidade do erro tipo I maior. Analisando a Figura 4.1, podemos
ver tambm que, se mudarmos a regra de deciso escolhendo um valor de corte diferente de
14,5, essas probabilidades se alteraro. Aumentando , diminui e vice-versa.
Vamos, agora, estabelecer uma nova regra de deciso de modo que a probabilidade do
erro tipo I passe a ser 0,05. A nossa regio de rejeio, ou regio crtica, continua tendo a
forma X k. Pela Figura 4.1, vemos que k tem de ser menor que 14,5.
2, 02
= 0, 05 P X k | X N 15; = 0, 05
16
!
k 15 k 15
P Z 2
= 0, 05 P Z = 0, 05
4
0, 5
k 15 k 15
0, 5 tab = 0, 05 tab = 0, 45
0, 5 0, 5
k 15
= 1, 64 k = 14, 18
0, 5
Com essa nova regra de deciso, o erro tipo II passa a ter probabilidade
1, 22
= P(Erro II) = P X > 14, 18|X N 14;
16
!
14, 18 14
= P Z > 1,2
= P(Z > 0, 6)
4
= 0, 5 tab(0, 6) = 0, 27425
Suponha, agora, que o gerente queira igualar as probabilidades de erro. Qual a regra
de deciso?
=
2, 02 1, 22
P X k | X N 15; = P X > k | X N 14;
16 16
! !
k 15 k 14 k 15 k 14
P Z 2.0 = P Z > 1.2 =
4 4
0, 5 0, 3
0, 3k 4, 5 = 0, 5k + 7 0, 8k = 11, 5 k = 14, 375
Suponha, nos dois exemplos anteriores, que a empresa compre anis de diversos fabri-
cantes mas, pelas caractersticas de produo do fabricante 2, os anis produzidos por ele
sejam especiais para a empresa. Assim, importante identificar corretamente a origem, caso
eles sejam oriundos do fabricante 2. Nesta situao, nossas hipteses passariam a ser:
H0 : anis so produzidos pelo fabricante 2
H1 : anis no so produzidos pelo fabricante 2
Queremos que a probabilidade seja pequena; assim, podemos fixar como 0,05 ou mesmo
0,01. De posse do valor dessa probabilidade, poderamos estabelecer a regio crtica ou
regio de rejeio. A diferena fundamental aqui est no clculo da probabilidade do erro
tipo II: no existe um nico valor de , j que, sob H1 , a distribuio pode ter qualquer mdia.
Seja X = nmero de coroas nos trs lanamentos. Ento, X bin(3; p). Nossa regra
de deciso rejeitar H0 se X = 3. A probabilidade do erro tipo I :
1
= P X = 3|X bin 3;
2
1 1 1 1
= =
2 2 2 8
A hiptese nula, representada por H0 , a hiptese bsica que queremos testar. Nesse texto
consideraremos apenas hipteses nulas simples, isto , hipteses que estabelecem que o
parmetro de interesse igual a um determinado valor. A forma geral :
H 0 : = 0
Alguns exemplos so:
H0 : = 6 H0 : p = 0, 5 H0 : 2 = 25
O procedimento de teste de hiptese resultar em uma regra de deciso que nos permitir
rejeitar ou no rejeitar H0 .
Em algumas situaes, podemos ter informao que nos permita restringir o domnio
da hiptese alternativa. Por exemplo, se uma empresa farmacutica est testando um novo
medicamento para enxaqueca no intuito de reduzir o tempo entre a ingesto do medicamento
e o alvio dos sintomas, uma possvel hiptese alternativa
H1 : < 10
A escolha entre essas formas de hiptese alternativa se faz com base no conhecimento
sobre o problema sendo considerado.
Soluo
(a)
Afirmativa dada: 15
Complementar: > 15
A desigualdade que no contm o sinal de = ( > 15) torna-se a hiptese alternativa:
H0 : = 15
H1 : > 15
(b)
Afirmativa dada: 15
Complementar: < 15
H0 : = 15
H1 : < 15
(c)
Afirmativa dada: p 60%
Complementar: p < 60%
H0 : p = 0, 6
H1 : p < 0, 6
(d)
Afirmativa dada: p < 5%
Complementar: p 5%
H0 : p = 0, 05
H1 : p < 0, 05
Assim como na construo dos intervalos de confiana, usaremos uma estatstica amostral
apropriada para construir o nosso teste de hiptese, e, nesse contexto, essa estatstica
chamada estatstica de teste. As estatsticas de teste que consideraremos aqui so a mdia
amostral X e a proporo amostral P, b que sero usadas na construo de testes sobre a
mdia e a proporo populacionais, respectivamente.
Deciso
Rejeitar H0 No rejeitar H0
Possibi- H0 verdadeira Erro I OK
lidades H0 falsa OK Erro II
A deciso sobre a hiptese nula tomada com base em uma regra que estabelece um
conjunto de valores, chamado regio crtica ou regio de rejeio, de modo que, se o valor
observado da estatstica amostral cair nessa regio, rejeitaremos H0 ; caso contrrio, no
rejeitaremos H0 . Vamos denotar por RC a regio crtica.
Vamos considerar o seguinte exemplo: se, ao lanarmos uma moeda 30 vezes, obtivermos
28 caras, iremos desconfiar da hiptese de honestidade da moeda, porque a probabilidade de
obtermos 28 caras ou mais em 30 lanamentos de uma moeda honesta de 0,000000433996,
uma probabilidade bastante pequena. claro que o evento 28 caras ou mais em 30 lana-
mentos um evento possvel (acertar a sena no jogo da mega-sena tambm ...), mas, sob o
ponto de vista do teste de hiptese, a obteno de tal evento ser uma evidncia de que a
nossa hiptese nula de honestidade da moeda no muito plausvel.
Nesse caso, no diremos que a moeda no honesta (no podemos dizer que im-
possvel acertar a sena!); nossa concluso que no h evidncia suficiente para apoiar a
hiptese nula. (Situao anloga ocorre quando um jri diz que o ru no-culpado.)
5.1 Introduo
Neste captulo, aplicaremos os conceitos bsicos sobre a teoria de teste de hiptese situa-
o especfica em que a estatstica de teste tem, pelo menos aproximadamente, distribuio
normal. Veremos inicialmente testes para a mdia de uma populao normal e, depois, testes
para uma proporo populacional baseados em grandes amostras.
Depois de uma pane geral no sistema de informao de uma empresa, o gerente ad-
ministrativo deseja saber se houve alterao no tempo de processamento de determinada
atividade. Antes da pane, o tempo de processamento podia ser aproximado por uma varivel
aleatria normal com mdia de 100 minutos e desvio padro de 10 minutos. O gerente acre-
dita que a pane no tenha alterado a variabilidade do processo. Uma amostra de 16 tempos
de processamento aps a pane revela uma mdia de 105,5 minutos. Ao nvel de significncia
de 5%, qual a concluso sobre a alterao do tempo mdio de processamento?
Soluo
H0 : = 100
H1 : 6= 100
Estatstica de teste
Como a populao normal, sabemos que a distribuio da mdia amostral tambm
normal, e como no deve ter havido alterao na variabilidade do processo, resulta que
o desvio padro de 10 minutos em qualquer situao.
Logo,
100 X
X N ; N(0; 1)
16 2, 5
X
Z= N(0; 1)
2, 5
Nvel de significncia e regio crtica
Pelo enunciado do problema, o nvel de significncia de 5%. Isso significa que a
probabilidade de erro tipo I 0,05. Como visto, o erro tipo I consiste em rejeitar a
hiptese nula quando ela verdadeira. Logo,
= Pr(rejeitar H0 | H0 verdadeira) = 0, 05
X 100
H0 verdadeira = Z0 = N(0; 1)
2, 5
RC : Z0 > 1, 96 ou Z0 < 1, 96
Deciso e concluso
Os dados observados fornecem o valor x = 105, 5 minutos, que resulta no seguinte
valor da estatstica de teste:
105, 5 100
z0 = = 2, 2 > 1, 96
2, 5
Como o valor da estatstica de teste para a amostra observada est na regio cr-
tica, devemos rejeitar a hiptese nula, ou seja, as evidncias amostrais indicam uma
alterao do tempo de processamento da tarefa aps a pane.
Na mesma situao do exemplo anterior, bastante razovel supor que o gerente esteja
interessado apenas no caso de aumento do tempo de processamento. Afinal, se o tempo
diminuir, isso significa que a tarefa vai ser executada mais rapidamente, o que representa
um ganho.
Soluo
100 OK!
> 100 Problema!
H0 : = 100
H1 : > 100
Estatistica de teste
A estatstica de teste continua sendo
X 100
Z0 = N(0; 1)
2, 5
RC : Z0 > z0,05
Deciso e concluso
O valor da estatstica de teste no se altera:
105, 5 100
z0 = = 2, 2 > 1, 64
2, 5
e como antes, devemos rejeitar a hiptese nula, ou seja, as evidncias amostrais indicam
um aumento do tempo de processamento da tarefa aps a pane.
Uma pesquisa foi realizada com alunos da UFF visando, entre outras coisas, estimar a
proporo dos alunos que tm conhecimento do Regulamento dos Cursos de Graduao dessa
universidade (dados fictcios). Foram entrevistados 952 alunos, selecionados aleatoriamente,
dos quais 132 afirmaram ter lido o Regulamento dos Cursos de Graduao. Suponha que
a universidade decida lanar uma campanha de esclarecimento se a verdadeira proporo
de alunos que conhecem o regulamento for inferior a 15%. H razo para se lanar essa
campanha? Justifique sua resposta atravs de um teste de hiptese com nvel de significncia
de 5%.
Soluo
Nosso problema agora fazer um reste de hiptese sobre uma proporo populacional.
Vimos que a proporo amostral um bom estimador da proporo populacional e, para
amostras grandes,
p(1 p)
P N p,
b
n
Estatistica de teste
Sob a hiptese de que H0 verdadeira,
P
b 0, 15
Z0 = q N(0, 1)
0,15(10,15)
952
RC : Z0 < z0,05
RC : Z0 < 1, 64
Deciso e concluso
O valor da estatstica de teste
132
0, 15
z0 = q
952 = 0, 9803 1, 64
0,15(10,15)
952
H 0 : = 0
a um nvel de significncia .
X
Z= q N(0, 1)
2
n
X 0
Z0 = q N(0, 1)
2
n
A seguir apresentamos os resultados para cada uma das possiveis hipteses alternati-
vas.
Teste bilateral
H0 : = 0
H1 : 6= 0
X 0
Z0 = n N(0, 1)
Regio crtica:
Z0 < z/2 ou Z0 > z/2
H 0 : = 0
H1 : > 0
X 0
Z0 = n N(0, 1)
Regio crtica:
Z0 > z
H 0 : = 0
H1 : < 0
X 0
Z0 = n N(0, 1)
Regio crtica:
Z0 < z
O Exemplo 5.3 acima ilustra o procedimento para construo de um teste de hiptese so-
bre uma proporo populacional p. De posse de uma grande amostra aleatria simples
X1 , X2 , . . . , Xn extrada de uma populao X Bern(p), nosso interesse est em testar a
hiptese nula
H0 : p = p0
a um nvel de significncia .
P
b p
Z=q N(0, 1)
p(1p)
n
Pb p0
Z0 = q N(0, 1)
p0 (1p0 )
n
A seguir apresentamos os resultados para cada uma das possiveis hipteses alternati-
vas.
Teste bilateral
H0 : p = p0
H1 : p 6= p0
Pb p0
Z0 = q N(0, 1)
p0 (1p0 )
n
Regio crtica:
Z0 < z/2 ou Z0 > z/2
H0 : p = p0
H1 : p > p0
Pb p0
Z0 = q N(0, 1)
p0 (1p0 )
n
Regio crtica:
Z0 > z
H0 : p = p0
H1 : p < p0
Pb p0
Z0 = q N(0, 1)
p0 (1p0 )
n
Regio crtica:
Z0 < z
5.4 Valor P
Nos exemplos anteriores, a determinao da regio crtica foi feita com base no nvel de
significncia, isto , fixado o nvel de significncia, encontramos o valor crtico que definia os
limites entre valores provveis (aqueles que levam no-rejeio de H0 ) e pouco provveis
(aqueles que levam rejeio de H0 ).
P = P(Z > 2, 2) + P(Z < 2, 2) = 2 P(Z > 2, 2) = 2 [0, 5 tab(2, 2)] = 0, 0278
Na Figura 5.4 ilustra-se esse valor. O que esse resultado est nos dizendo o seguinte:
se H0 for verdadeira, a probabilidade de obtermos um valor to extremo quanto 2,2 na direo
da hiptese altervativa, ou seja, em qualquer direo, j que H1 bilateral, 0, 0278. Essa
uma probabilidade pequena, o que significa que pouco provvel obtermos um valor to
extremo quando H0 verdadeira. Logo, razovel supormos que a hiptese nula no seja
verdadeira, a mesma concluso obtida ao trabalharmos com o nvel de significncia de 5%.
Na Figura 5.5 ilustra-se esse valor. O que esse resultado est nos dizendo o seguinte:
se H0 for verdadeira, a probabilidade de obtermos um valor to oui mais extremo que 2,2
0, 0139. Novamente, essa uma probabilidade pequena, o que significa que pouco provvel
obtermos um valor to extremo quando H0 verdadeira. Logo, razovel supormos que a
hiptese nula no seja verdadeira, a mesma concluso obtida ao trabalharmos com o nvel
de significncia de 5%. Como antes, rejeitaramos a hiptese nula para qualquer nvel de
significncia maior que 0,0139.
Na Figura 5.6 ilustra-se esse valor. O que esse resultado est nos dizendo o seguinte:
se H0 for verdadeira, h uma probabilidade alta de obtermos um valor to ou mais extremo
que 0, 9803. Assim, no h evidncia que indique que H0 seja falsa.
Teste bilateral
H0 : = 0
H1 : 6= 0
H0 : = 0
H1 : > 0
P = P(Z > z0 )
H0 : = 0
H1 : < 0
Vimos que o nvel de significncia a probabilidade do erro tipo I e o valor crtico cor-
respondente delimita a regio de rejeio, ou seja, valores da estatistica de teste que caem
na regio crtica levam rejeio de H0 . O valor P, por sua vez, a probabilidade de se
obter valores to estremos quanto o observado e essa probabilidade, sendo pequena, leva
rejeio da hiptese nula.
Uma empresa fabricante de balas afirma que o peso mdio de suas balas de pelo menos 2
gramas. Pela descrio do processo de produo, sabe-se que o peso das balas distribui-se
normalmente com desvio padro de 0,5 grama. Uma amostra de 25 balas apresenta peso
mdio de 1,81 gramas. O que se pode concluir sobre a afirmao do fabricante? Estabelea
sua concluso usando um nvel de significncia de 5% e tambm o valor P.
Soluo
Seja X a varivel aleatria que representa o peso das balas. Ento, X N(; 0, 25).
Como n = 25, resulta que
X
Z= q N(0, 1)
0,25
25
H0 : = 2
H1 : < 2
RC : Z0 < z0,05 = 1, 64
Assim, rejeitaramos H0 para qualquer nvel de significncia maior que 2,87%, o que inclui
5%.
6.1 Introduo
Considere, ento, uma populao descrita por uma varivel aleatria normal com mdia
e varincia 2 : X N(; 2 ). Nosso interesse estimar a mdia a partir de uma amostra
aleatria simples X1 , X2 , . . . , Xn . Como visto no Captulo 2, a distribuio amostral de X
normal com mdia e varincia n , ou seja
2
2
X N(; ) = X N ;
2
n
Assim, se o valor de conhecido, resulta que
X
Z= n N(0; 1)
e esse resultado foi utilizado na construo de intervalos de confiana e testes de hipteses
sobre a mdia de uma populao normal com varincia conhecida.
Suponha, agora, que a varincia 2 no seja conhecida. Neste caso, temos que estim-
la com os dados amostrais. No Captulo 1, vimos, atravs de um exemplo numrico, que
n
" n #
1 X 1 X
S2 = (Xi X )2 = X 2 nX
2
n 1 i=1 n 1 i=1 i
CAPTULO 6. INFERNCIA SOBRE A MDIA DA N(; 2 ), 2 DESCONHECIDA
X
T = n
S
na construo de intervalos de confiana e testes de hipteses para . Isso exatamente o
que faremos, mas, ao introduzirmos S no lugar de , a distribuio amostral de T deixa de
ser normal e passa a ser uma distribuio t de Student.
+1
+1
x2 2
1
f(x) = 2
, < x <
2
1 +
R
onde () = 0
ex x 1 dx.
Essa expresso, certamente, assustadora! Mas eis uma boa notcia: no precisaremos
dela para calcular probabilidades! No entanto, interessante notar duas caractersticas b-
sicas dessa expresso: o argumento x da funo aparece elevado ao quadrado e a expresso
de f(x) depende de um parmetro representado pela letra grega ni: .
Da primeira observao resulta o fato de que f(x) simtrica em torno de zero, ou seja
f(x) = f(x).
O parmetro chamado graus de liberdade (s vezes abreviado por gl) e est as-
sociado ao nmero de parcelas independentes em uma soma. Para entender esse conceito,
considere o seguinte exemplo: se conhecemos a mdia de um conjunto de n dados, podemos
atribuir valores livremente a apenas n 1 desses dados, ou seja, conhecida a mdia e conhe-
cidos n 1 dos valores, o n-simo valor fica automaticamente determinado. Suponha n = 10
e x = 80; se conhecemos os valores de x1 , . . . , x9 o valor de x10 obtido pela expresso
P9
10 80 xi . Dizemos, ento, que h 9 graus de liberdade.
i=1
Nas Figuras 6.1 a 6.4 comparam-se as distribuies t (em vermelho) com = 1, 2, 10, 30
com a distribuio normal padro. Nos dois grficos superiores ( = 1, 2) fica mais ntido o
fato de a distribuio t ter maior disperso (consequncia do fato de substituirmos pela
sua estimativa s). Nos dois grficos inferiores ( = 10, 30), o que chama a ateno a quase
coincidncia da densidade t com a densidade N(0; 1).
Figura 6.1 Comparao das distribui- Figura 6.2 Comparao das distribui-
es N(0, 1) e t(1) es N(0, 1) e t(2)
Figura 6.3 Comparao das distribui- Figura 6.4 Comparao das distribui-
es N(0, 1) e t(10) es N(0, 1) e t(30)
didticos comum apresentar uma tabela com os valores crticos de diferentes distribuies
t. A razo para isso que a maioria das aplicaes da distribuio t envolve a construo
de intervalos de confiana ou de testes de hipteses.
Nessas aplicaes, nosso interesse est no valor crtico associado a um nvel de sig-
nificncia que, como visto, o valor da abscissa que deixa probabilidade (rea) acima
dela. Vamos representar por t; o valor crtico da distribuio t(). Veja a Figura 6.5.
Soluo
(a) Como o nmero de graus de liberdade 15, temos de nos concentrar na linha correspon-
dente a gl = 15. A abscissa t0,05 deixa rea 0,05 acima dela; logo, t15;0,05 = 1, 753.
O intervalo de confiana para a mdia de uma populao normal com varincia desconhecida
obtido com base no seguinte resultado:
i=1 i=1
Como o resultado (6.2) vale para qualquer distribuio t, usando o resultado (6.1),
obtemos:
X
P tn1; /2 n tn1; /2 = 1 =
S
S S
P tn1; /2 X tn1; /2 = 1 =
n n
S S
P X tn1; /2 X + tn1; /2 =1
n n
X
Vimos que, para populaes normais, a distribuio exata da estatstica T = n
S
t(n 1). Mas vimos tambm que, quando o nmero de graus de liberdade grande, a
diferena entre as distribuies t e N(0; 1) torna-se desprezvel.
Por outro lado, se a populao no normal, mas tem mdia e varincia 2 , o Teorema
X
Limite Central nos diz que a distribuio de n se aproxima de uma N(0; 1) medida
que n . Pode-se mostrar que esse resultado continua valendo se substituirmos por
seu estimador S.
X
n N(0; 1)
S
para n suficientemente grande. Nesse caso, o intervalo de confiana apro-
ximado de nvel de confiana 1 para
S S
X z/2 ; X + z/2
n n
EXEMPLO 6.2
De uma populao normal com mdia e varincia desconhecidas, extrai-se uma amostra
de tamanho 15 obtendo-se x = 12 e s2 = 49. Obtenha um intervalo de confiana para a
verdadeira mdia populacional, utilizando o nvel de confiana de 95%.
Soluo
t14;0,025 = 2, 145
A margem de erro
= 2, 145 = 3, 8769
7
15
e o intervalo de confiana, [12 3, 8769; 12 + 3, 8769] = [8, 1231; 15, 8769]
EXEMPLO 6.3
A seguinte amostra foi extrada de uma populao normal: 6, 6, 7, 8, 9, 9, 10, 11, 12. Construa
o intervalo de confiana para a mdia populacional, com nvel de significncia de 10%.
Soluo
Como antes, temos uma amostra pequena de uma populao normal; logo, temos que
usar a distribuio t-Student. Como n = 9, gl = n 1 = 8.
A mdia amostral
P
xi
x =
n
6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12 78
= = = 8, 667
9 9
e a varincia amostral
" P 2#
1 X 1 X ( xi )
S2 = (xi x)2 = xi2 =
n1 n1 n
1 2 782
= 6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12
2 2 2 2 2 2 2 2
8 9
1 6084 36
= 712 = = 4, 5
8 9 8
Como o nvel de significncia = 10%, o nvel de confiana 1 = 90%. Em cada
cauda da distribuio t(8) temos que ter rea igual a 5%. Assim, temos que procurar na linha
correspondente a 8 graus de liberdade a abscissa relativa rea superior de 0,05. Obtemos
t8;0,05 = 1, 860. A margem de erro
r
4, 5
= 1, 860 = 1, 395
8
e o intervalo de confiana [8, 667 1, 395; 8, 667 + 1, 395] = [7, 272; 10, 062]
EXEMPLO 6.4
A partir de uma amostra aleatria simples de tamanho n = 100, os seguintes valores foram
obtidos: x = 12, 36 e S 2 = 132, 56. Obtenha um intervalo de confiana de nvel de confiana
90% para a mdia populacional .
Soluo
X 0
T0 = n t(n 1)
S
A seguir apresentamos os resultados pertinentes para cada um dos tipos de hiptese alter-
nativa.
Teste bilateral
H0 : = 0
H1 : 6= 0
X 0
T0 = n t(n 1)
S
Regio crtica:
T0 < tn1,/2 ou T0 > tn1,/2
H0 : = 0
H1 : > 0
X 0
T0 = n t(n 1)
S
Regio crtica:
T0 > tn1,
H0 : = 0
H1 : < 0
X 0
T0 = n t(n 1)
S
Regio crtica:
T0 < tn1,
Para finalizar a parte relativa construo de intervalos de confiana que veremos neste
curso, vamos resumir os resultados vistos anteriormente. importante notar que existem
procedimentos para construo de intervalos de confiana para outros parmetros, tal como
a varincia de uma populao normal. O procedimento anlogo; o que muda a distribuio
amostral.
O contexto bsico analisado na seo 3.2 e neste captulo o seguinte: de uma populao
normal extrai-se uma amostra aleatria simples X1 , X2 , . . . , Xn com o objetivo de se obter uma
estimativa intervalar para a mdia . Foram consideradas duas situaes: (i) 2 conhecida e
(ii) 2 desconhecida. Em ambos os casos, a expresso para o intervalo de confiana de nvel
de confiana 1
X
com a margem de erro assumindo a forma geral
= /2 EP(X )
2 conhecida
/2 = z/2 N(0; 1)
EP(X ) =
n
2 desconhecida
/2 = tn1; /2 t(n 1)
S
EP(X ) =
n
O contexto bsico considerado na Seo 3.3 foi o seguinte: de uma populao representada por
uma varivel aleatria X Bern(p) extrai-se uma amostra aleatria simples X1 , X2 , . . . , Xn
com o objetivo de se estimar a proporo populacional p dos elementos que possuem de-
terminada caracterstica de interesse. Se a amostra suficientemente grande (em geral,
n > 30), o intervalo de confiana para p tem a forma
P
b
= z/2 EP(P)
b
com r
p
b0 (1 p
b0 )
EP(P)
b =
n
Aqui, p
b0 uma estimativa prvia da proporo populacional p ou a prpria proporo amostral
p
b obtida a partir da amostra.
Dada uma aas de tamanho grande de uma populao qualquer com mdia , o intervalo de
confiana de nvel de confiana aproximado 1
S
X z/2
n
X
Mdia da 2 conhecida n N(0; 1) = z/2 n
populao X
N(; )
2
X
2 desconhecida n t(n 1) = tn1; /2 Sn
S
Proporo
Pb p q
[ mdia Bern(p)] np N(0; 1) = z/2 pb0 (1b
n
p0 )
P
b
p(1 p)
X
Mdia de uma (amostra grande) n N(0; 1) = z/2 Sn X
S
populao X
83
APNDICE A. TABELA DA DISTRIBUIO NORMAL
Tabela 1
Distribuio normal padro
p = P(0 Z z)
Tabela 2
Distribuio acumulada da normal padro
p = P(Z z)
Tabela 3
Valores crticos da t-Student
p = P(T > tp )