Você está na página 1de 23

Probabilidade Estatstica - Professor: Hiron Pereira Farias

Inferncia Estatstica

Seja X uma varivel aleatria com funo de densidade( ou de probabilidade) que abreviaremos
por f.d.p. (f.p.) e que denotaremos por f(x|). Chamaremos de inferncia estatstica o problema
que consiste em especificar um ou mais valores para , baseado em um conjunto de valores observados de X. No caso de um problema de estimao, o objetivo procurar, segundo algum critrio
especificado, valores que representem adequadamente os parmetros desconhecidos. No caso de
testes de hipteses, o objetivo verificar a validade de afirmaes sobre o valor do parmetro desconhecido. Por exemplo, quando o interesse verificar se a proporo de eleitores de determindo
candidato igual a 50%, as hipteses a serem testadas so H0 : = 0,5 versus H1 : 6= 0,5.
1.1

Definies importantes

1) O conjunto de valores de uma caracterstica (observvel) associada a uma coleo de indivduos


ou objetos de interesse dito ser uma populao.
2) Uma amostra aleatria simples (AAS) de tamanho n de uma varivel aleatria X, com dada
distribuio, o conjunto de n variveis independentes X1 , X2 , . . . , Xn , cada uma com a mesma
distribuio de X.
3) As quantidades da populao, em geral desconhecidas e sobre as quais temos interesse, so denominados parmetros e geralmente denotados por letras gregas tais como , , 2 entre outros.
4) O conjunto em que toma valores denominado espao paramtrico.
5) Qualquer estatstica que assuma valores em um estimador para .
6) Qualquer estatstica que assuma valores somente no conjunto dos possveis valores de g() um
estimador para g().
7) Qualquer funo da amostra que no depende de parmetros desconhecidos denominada uma
estatstica.
8) combinao dos elementos da amostra, construdos com a finalidade de representar, ou estimar, um parmetro de interesse na populao, denominamos estimador. Em geral, denotamos os

b
estimadores por smbolos com acento circunflexo: ,
b,
b2 e Pb. Aos valores nmericos assumidos pelos estimadores denominamos estimativas pontuais ou simplesmente estimativas.
Notamos que um estimador, digamos , uma funo das variveis aleatrias constituinte da
amostra, isto , b = f (X1 , X2 , . . . , Xn ). Logo, um estimador tambm uma varivel aleatria.
a correspondente distribuio de probabilidade formar a base das argumentaes probabilsticas
utilizadas na extrapolao da informao da amostra para os parmetros da populao.
Os estimadores mais comuns so:
n
X1 + X2 + . . . + Xn
1X
X=
=
xi mdia amostra ;
n
n i=1
n1
1 X
(Xi X)2 varincia amostral .
S2 =
n 1 i=1
Y
Pb =
proporo amostral .
n

em que, Y uma varivel aleatria que determina o nmero de elementos na amostra com a
caracterstica de interesse.

1.2

Propriedades dos Estimadores


Uma propriedade desejvel de um estimador que ele esteja prximo", de alguma maneira

do verdadeiro valor do parmetro desconhecido. Formalmente, dizemos que b um estimador


no-viciado do parmetro se
b = .
E()
Isto , b um estimador no-viciado de se, "na mdia", seus valores forem iguais a . Note que
isso equivalente a se exigir que a mdia da distribuio amostral de b seja igual a .
Se o estimador for viesado, ento a diferena
b
E()
denominada de Vis do estimador b .
Muito embora seja desejvel que uma estimativa seja no-viesada (ou tendenciosa), haver ocasies

em que poderemos preferir estimativa tendnciosa. possvel encontrar mais de uma estimativa
no tendenciosa para o parmetro desconhecido. a fim de realizar a escolha plausvel em tais
situaes, introduziremos o conceito.
Definio: Seja b uma estimativa no tendenciosa de . Diremos que b uma estimativa notendenciosa de varincia mnima (ENTVM) de , se para todas as estimativas tais que E( ) =
b V ( ) para todo . Isto , dentre todas as estimativas no-tendenciosas de , b
, tivermos V ()
tem a varincia menor de todas.
possvel obter um limite inferior para a varincia de todos os estimadores no-viesados do
parmetro . Seja b um estimador no viciado do parmetro , com base em uma amostra aleatria
de n observaes, e denote por f(x, ) a distribuio de probabilidade da varivel aleatria X. Ento,
o limite inferior da varincia dos estimadores no viciados de :
1

LI() =

"
nE

lnf (X|)

2 #

Definio: Se X1 , X2 , . . . , Xn for uma amostra de tamanho n, proviniente de uma distribuio com


mdia e varincia 2 , ento a mdia da amostra, X , ser o ENTVM para .
Definio: O erro-padro de um estimador b o seu desvio-padro, dado por
bb =

q
b Se
V ().

o erro-padro envolver parmetros desconhecidos que possam ser estimados, ento a substituio
b
daquele(s) valor(es) em
bb produzir um erro padro estimado, denotado por Sb ou e.p.().
Definio: O erro quadrtico mdio (EQM) de um estimador b do parmetro dado por






b = E (b )2 = E b E()
b + E()
b 2 = E (b E())
b + (E()
b )) 2 =
EQM []




b 2 + E E()
b ) 2 2E(b E())(E(
b
b )) = V ar[]
b + B 2 (),
b em que
E b E()
)
b = E[]
b
B()
b Dizemos que um estimador b no viciado para se
denominado o vcio do estimador .
b = ,
E[]
b 0, para todo . No caso em que b um estimador no viciado
para todo , ou seja B()=
para , temos que
b = Var[ ],
b
EQM[ ]
ou seja, o erro quadrtico mdio de b reduz sua varincia.

b no viciado para o parmetro , o quoDefinio: Chamamos de eficincia de um estimador ,


ciente
LI()
,
b
V ar()
onde LI() o limite inferior da varincia dos estimadores no viciados de .

b =
e()

b ou seja, quando a varincia de b coincide com o limite inferior da


e()= 1 quando LI()= Var(),
varincia dos estimadores no viciados de . Nesse caso, b dito ser eficiente.

1.3

O Mtodo de Mxima Verossimilhana


Definio: Sejam X1 , X2 , . . . , Xn uma amostra aleatria de tamanho n da varivel aleatria X

com funo de densidade ( ou de probabilidade) f(x| ), com , onde o espao paramtrico.


A funo de verossimilhana de correspondente amostra aleatria observada dada por
m
Y
L(; x) =
f (xi |).
j=1

Definio: O estimador de mxima verossimilhana de o valor que maximiza a funo


de verossimilhana L(; x).
O logaritmo natural da funo de verossimilhana de denotado por
l(; x)=ln L(; x).
No dificil verificar que o valor de que maximiza a funo de verossimilhana L(; x), tambm
maximiza l(; x).

1.4

Verossimilhana para Amostras Independentes


Existem situaes em que temos duas ou mais amostras independentes de distribuies que

dependem de um parmetro de interesse. No caso de duas amostras aleatrias independentes,


X1 , X2 , . . . , Xn e Y1 , Y2 , . . . , Yn , podemos escrever
L(; x, y) = L(; x) L(; y),
devido independncia entre as amostras. Portanto a verossimilhana conjunta igual ao produto
da verossimilhana correspondente amostra X1 , X2 , . . . , Xn pela verossimilhana correspondente
amostra Y1 , Y2 , . . . , Yn . De modo que podemos escrever
l(; x, y) = l(; x) + l(; y),
de modo que o logaritmo da verossimilhana conjunta igual ao produto da verossimilhanas

correspondentes a cada uma das amostras.

1.5

Teorema Limite Central


No que foi estudado at o presente momento, consideramos a distribuio amostral da mdia

X , calculada em uma amostra cuja elementos so constitudos por variveis aleatrias independentes e com distribuio normal. Na prtica, muitas vezes no temos informaes a respeito da
distribuio das variveis constituintes da amostra, o que nos impede de utilizar o resultado apresentado. Felizmente satisfeitas certas condies, pode ser mostrado que, para um tamanho de
amostra suficientemente grande, a distribuio de probabilidade da mdia amostral pode ser aproximada por uma distribuio normal.
Esse resultado, fundamental na teoria da Inferncia Estatstica, conhecido como Teorema Limite
Central.
definio: Para amostras aleatrias simples (X1 , X2 , . . . , Xn ), retiradas de uma populao com
mdia e varincia 2 finita, a distribuio amostral da mdia X aproxima-se, para n grande, de
2
uma distribuio normal, com mdia e varincia .
n
Esse resultado sugere que, quando o tamanho da amostra aumenta, independentemente da forma
da distribuio da populao, a distribuio amostral de X aproxima-se cada vez mais de uma
distribuio normal.

1.6

Determinao do tamanho de uma amostra


Em nossas consideraes anteriores fizemos a suposio que o tamanho da amostra, n, era

conhecido e fixo. Podemos, em certas ocasies, querer determinar o tamanho da amostra a ser
escolhida de uma populao, de modo a obter um erro de estimao previamente estipulado, com
determinado grau de confiana.
Suponha que estejamos estimando a mdia populacional e para tanto usaremos a mdia amostral,
X , baseada numa amostra de tamanho n. Suponha que se queira determinar o valor de n de modo
que
P (|X | ) ,

com 0 < < 1 e o erro amostral mximo que podemos suportar, ambos valores fixados.
Sabemos que
2
2
X N (; ) , logo X N (0; ) e portanto
n
n



n
n(X )
n
P ( X ) = P

n
= z
de modo que

do que obtemos finalmente n =

1.7

2 z2
2

Estimao por Intervalos


At aqui, somente estimadores pontuais foram considerados, pois fornecem como estimativa

um nico valor numrico para o parmetro de interesse. Em muitos problemas de estimao,


entretanto, prefere-se um intervalo que expresse a preciso do estimador. Por serem variveis
aleatrias, os estimadores possuem uma distribuio d probabilidade e, levando este fato em considerao, podemos apresentar uma estimativa mais informativa para o parmetro de interesse que
inclua uma medida de preciso do valor obtido. Esse mtodo de estimao, denominado intervalo
de confina, incorpora, estimativa pontual do parmetro, informaes a respeito de sua variabilidade. Intervalos de confina so obtidos atrves da distribuio amostral dos estimadores. A
interpretao de um intervalo de confina de que se muitas amostras forem coletadas e se for
calculado um intervalo de confina de 100(1 )% de confiana para o parmetro a partir de
cada amostra, ento 100(1 )% desses intervalos contero o verdadeiro valor de . Na prtica,
obtemos apenas uma amostra aleatria e calculamos um intervalo de confina. Como esse intervalo conter, ou no, o verdadeiro valor de , no razoavel atribuir um nvel de probabilidade a
esse evento especfico.
O comprimento do intervalo de confina bilateral uma medida importante da qualidade da informao obtida da amostra. O comprimento do semi-intervalo, chamado de preciso do estimador.
Quanto maior o intervalo de confina, mais confiantes estaremos de que o intervalo contenha realmente o verdadeiro valor de . Por outro lado, quanto maior o intervalo, menos informao temos

sobre o verdadeiro valor de . Em uma situao ideal, obtemos um intervalo relativemente pequeno
com alta confina. como o comprimento do intervalo de confina mede a preciso da estimao,
vemos que a preciso est inversamente relacionada ao nvel de confina. altamente desejvel
obter um intervalo de confina que seja pequeno o bastante para o proposito de tomada de deciso,
mas que tenha, tambm, a confina adequada. Uma maneira de conseguir isso escolhendo-se o
tamanho n da amostra grande o suficiente para resultar em um intervalo de tamanho especificado
com a confina prescrita.

1.7.1

Intervalo de Confina para Populaes Normais

Suponha-se que X tenha distribuio N(; 2 ), onde se supe 2 conhecido, enquanto


o parmetro desconhecido. Seja X1 , X2 , . . . , Xn uma amostra aleatria de X e seja X a mdia
amostral.

n(X )
tem distribuio N(0;1).

Observa-se que, muito embora Z depende de , sua distribuio de probabilidade no depende.


Sabemos que X tem distribuio N(;

2
),
n

portanto, Z =

Empregamos este fato a nosso favor da seguinte maneira:


Fixado um valor tal que 0 < < 1, podemos encontrar um valor tal que :
P (|Z| < z 2 ) = P (z 2 < Z < z 2 ) = .
Para fixo o valor z 2 pode ser obtido da tabela normal padro.

n(X )
z) = P (z n X z n ) =
P (z Z z) = P (z

P (X z n X + z n ) = 2(z) 1
Assim o intervalo de confiana para , com coeficiente de confiana , dadao por
IC(; ) = [X z 2 n ; X + z 2 n ].
A amplitude do intervalo de confiana dada pela diferena entre o extremo superior e inferior,
isto , X + z 2 n X + z 2 n = 2z 2 n , o que claramente indica que ela depende da confiana
, do desvio-padro e do tamanho da amostra n. usual se referir semi-amplitude, como o erro
envolvido na estimao.
De modo geral o intervalo de confiana para um parmetro dado por
b b + vt ep()]
b
IC(; )= [b vt ep();
b o erro-padro do estimador .
b
em que vt um valor tabelado da distribuio de b e ep()
Sabemos que sabemos que a proporo amostral, Pb, tem distribuio normal com mdia P e vari-

ncia

P (1 p)
P (1 p) 
Pb P
N (0; 1).
, isto , Pb N P,
e que q
n
n
p(1p)
n

Assim o intervalo de confiana para P , com coeficiente de confiana , dado por


q
q
h
i
b + z p(1p) .
IC(P ; ) = Pb z 2 p(1p)
;
P
n
n
2
Como no conhecemos P, que o parmetro a ser estimado, primeiro ao fazermos P = Pb, temos
q
q
h
i
b(1Pb)
P
b + z Pb(1Pb) .
IC(P ; ) = Pb z 2
;
P
n
n
2
e para P = 12 , obtemos
q
q i
h
1 b
1
; P + z 2 4n
.
IC(P ; ) = Pb z 2 4n
Consideremos o caso em que temos X1 , X2 , . . . , Xn , uma amostra aleatria da varivel aleatria
X N (1 ; 12 ) e Y1 , Y2 , . . . , Ym , uma amostra aleatria da varivel aleatria Y N (2 ; 22 ), onde
X e Y so independentes. Sabemos que
2 
2
(X Y ) N 1 2 ; n1 + m2
de modo que , sendo = 1 2 , consideremos a quantidade
(X Y ) (1 2 )
q
N (0; 1)
12
22
+m
n
Sendo 12 e 22 conhecidas, temos , como no caso anterior, o intervalo
q
q
h
i
12
22
2
2

IC(1 2 ; ) = (X Y ) z 2 n + m ; (X Y ) + z 2 n1 + m2
Se as varincias 12 e 22 so conhecidas, e se os tamanhos amostrais n e m so iguais, ento para
determinar o tamanho amostral necessrio tal que o erro na estimativa de 1 2 usando X 1 X 2
seja menor do que com % de confina. O tamanho de cada amostra
 z 2
2
n=
(12 + 22 ).

Suponha que X seja normalmente distribuda, com mdia e varincia desconhecidas. Seja
X1 , X2 , . . . , Xn uma amostra aleatria de tamanho n, e seja S 2 a varincia amostral. J demostrouse que a distribuio amostral de
(n 1)S 2
2(n1) .
2
Portanto dado , podemos determinar q1 e q2 de modo que
h
i
(n 1)S 2
P q1

q
= .
2
2

Considerando o intervalo simtrico, ou seja, P [2n1 q2 ] = P [2n1 q1 ] =

1
,
2

temos o

intervalo de confiana para 2 , dado por


IC( 2 ; ) =

1.8

h (n 1)S 2 (n 1)S 2 i
;
q2
q1

Distribuio t de Student
Sejam Z N (0, 1) e V 2n variveis aleatrias independentes. A varivel aleatria
Z
T = q tn
V
n

tem distribuio t com n graus de liberdade, denotado por T tn .


Teorema: Se (X1 , X2 , . . . , Xn ) uma amostra aleatria de tamanho n da distribuio N(0,1), ento

n(X )
t(n1) .
s
Prova:
Notemos que podemos
escrever

n(X )
X

n(X )
n

q
=
=
t(n1)
s
(n1)S 2
s

(n1) 2

1.8.1

Intervalo de confiana para com varincia desconhecida

Quando a varincia desconhecida, construmos intervalos de confina para a mdia populacional utilizando a distribuio t-Student. Supondo uma amostra aleatria (X1 , X2 , . . . , Xn ) obtida
de uma populao com distribuio Normal com mdia e varncia desconhecidas, temos que

n(X )
t(n1) .
s

Desta forma, fixando-se o coeficiente de confiana (0 < < 1) e utilizando a tabela da distribuio t-Student com n-1 graus de liberdade, obteremos o valor de t 2 tal que



n(X )
P t 2
t 2 .
S

Logo, o intervalo com coeficiente de confiana para , com varncia desconhecida, ser dado
por
i
h
IC(; ) = X t 2 Sn ; X + t 2 Sn .

1.8.2

Intervalo de confiana para diferena entre mdias

Seja (X1 , X2 , . . . , Xn ) uma amostra aleatria de tamanho n de uma distribuio normal com
mdia 1 e varincia 12 desconhecida, e seja (Y1 , Y2 , . . . , Ym ) uma amostra aleatria de tamanho
m de uma distribuio normal com mdia 2 e varincia 22 desconhecida. Assumiremos que
as duas amostras so independentes uma da outra e que h homogeneidade das varincias, isto ,
12 = 22 = 2 . Queremos uma estimao intervalar da diferena das mdias populacionais 2 1 .
Sabemos que (Y X) normalmente distribuda com mdia 2 1 e varincia
2 
2
(X Y ) N 1 2 ; n1 + m2

2
n

2
,
m

e
(X Y ) (1 2 )
q
N (0; 1)
2
2
+m
n
Sabemos tambm que
X
(Xi X)2

(n 1)S 2
2

tem distribuio qui-quadrado com n-1 graus de liberdade, e


X
(Yi Y )2
2

(m 1)S 2
2

tem distribuio qui-quadrado com m-1 graus de liberdade, ento

V =

X
(Xi X)2
2

X
(Yi Y )2
2

(n 1)S 2 (m 1)S 2
+
t(m+n2)
2
2

. Finalmente, temos que a varivel aleatria


T =q

Z
V
m+n2

t(m+n2)

isto

tem distribuio t com (m+n-2) graus de liberdade.


Fazendo
Sp2 =

(m 1)S 2 + (n 1)S 2
,
m+n2

temos que a estatstica


T =

(X Y ) (1 2 )
q
,
SP n1 + m1

tem distribuio t com m+n-2 graus de liberdade. Dai


q
q
h
IC(1 2 ; ) = (X Y ) t 2 SP n1 + m1 ; (X Y ) + t 2 SP n1 +

1
m

O estimador combinado de 2 , denotado por SP2 e definido por


Sp2 =

(m 1)S 2 + (n 1)S 2
,
m+n2

pode ser escrito como


Sp2 =

(n 1)S 2
(m 1)S 2
+ Sp2 =
= wS12 + (1 w)S22 ,
m+n2
m+n2

sendo 0 < w 1. Logo, SP2 uma mdia ponderada das duas varincias das amostras S12 e
S22 , em que os pesos w e 1-w dependeram dos tamanhos das amostras n1 e n2 . Obviamente, se
n1 = n2 = n , ento w = 0,5 e SP2 ser exatamente igual mdia aritmtica entre S12 e S22 .

1.9

Distribuio F de Snedecor
Sejam U e V variveis aleatrias independentes com m e n graus de liberdade respectivamente.

Ento a varivel aleatria


X=

U
m
V
n

tem distribuio F com m graus de liberdade no numerador e n graus de liberdade no denominador,


denotaremos por X F(m, n).
Se X1 , X2 , . . . , Xm uma amostra aleatria de tamanho m de uma populao normal com mdia
2
X e varincia X
, e seja tambm Y1 , Y2 , . . . , Yn uma amostra aleatria de tamanho n de uma

populao Normal com mdia Y e varincia Y2 , e se as duas amostras so independentes, ento

isto resulta que


m
1 X
(Xi X)2
2
i=1

tem distribuio qui-quadrado com m-1 graus de liberdade, e


n
1 X
(Yi Y )2
2 j=1

tem distribuio qui-quadrado com n-1 graus de liberdade, assim a estatstica

F =

m
X
1
(Xi X)2
2
(m 1)X
i=1
n
X
1
(Yi Y )2
(n 1)Y2 j=1

2
SX
2
X

SY2
2
Y

tem uma distribuio F com m-1 e n-1 graus de liberdade.


Um procedimento de teste de hipteses para a igualdade de duas varincias baseado no seguinte
2
resultado. Sujeita a hiptese nula H0 : X
= Y2 , a estatstica

F =
distribuio F com m-1 e n-1 graus de liberdade.

2
SX
,
SY2

EXERCCIOS
Professor: Hiron Pereira Farias
Disciplina: Probabilidade e Estatstica
Questo 1: Uma amostra de 25 observaes de uma Normal (; 16) foi coletada e forneceu uma
mdia amostral de 8. Construa intervalos com confiana 80%, 85%, 90% e 95%
Resp. a) [6,97; 9,03] ; b) [6,85; 9,15] ; c) [6,69; 9,31] d) [6,43; 9,57].
Questo 2: Por analogia a produtos similares, o tempo de reao de um novo medicamento pode
ser considerado como tendo distribuio Normal com desvio padro igual a 2 minutos. Vinte
pacientes foram sorteados, receberam o medicamento e tiveram seu tempo de reao anotado. Os
dados foram os seguintes ( em minutos ): 2,9; 3,4; 3,5; 4,1; 4,6; 4,7; 4,5; 3,8; 5,3; 4,9; 4,8; 5,7; 5,8;
5; 3,4; 5,9; 6,3; 4,6; 5,5 e 6,2. Obtenha um intervalo de confiana para o tempo mdio de reao.
Use = 96%
Resp. IC(; 96%) = [3,83 ; 5,67]
Questo 3: Ser coletada uma amostra de uma populao Normal com desvio-padro igual a 9.
Para uma confiana de = 90%, determine a amplitude do intervalo de confiana para a mdia
populacional nos casos em que o tamanho da amostra 30, 50 ou 100.
Resp. para n = 30 A = 5,42; para n = 50 A = 4,2; para n = 100 A = 2,97;
Questo 4: Para uma Normal (5; 10) coletou-se uma amostra de tamanho 25. Calcule:
a) P(X 4,8); ( Resp. 0,3745 )
b) P(4,5 X 5,3); ( Resp. 0,466 )
c) P(X 4,7 ou X 5,1) ( Resp. 0,7556 ).
Questo 5: Qual deve ser o tamanho de uma amostra cujo desvio padro 10 para que a diferena
da mdia amostral para a mdia da populao, em valor absoluto, seja menor que 1. com coeficiente de confiana igual a:
(a) 95% (Resp. n = 385 )

(b) 99% (Resp. n = 666 )

Questo 6: Uma populao tem desvio padro igual a 10.


(a) Que tamanho deve ter uma amostra para que, com probabilidade 8%, o erro em estimar a mdia
seja superior a uma unidade?( Resp. n = 307)
(b) Supondo-se colhida a amostra no caso anterior, qual o intervalo de confiana, se X = 5? Resp.
[49 ; 51]

Questo 7: A vida de um componente usado em um motor de uma turbina de um avio a jato uma
varivel aleatria, com mdia de 5.000 h e desvio-padro de 40h. A distribuio da vida efetiva
razoavelmente prxima da distribuio Normal. O fabricante do motor introduz uma melhoria no
processo de fabricao para esse componente, que aumenta a vida mdia para 5.050 h e diminui
o desvio-padro para 30h. Suponha que uma amostra aleatria de n1 = 16 componentes seja selecionada do processo antigo e uma amostra aleatria de n2 = 25 componentes seja selecionada
do processo melhorado. Considere que o processo antigo e o melhorado possam ser considerados
como populaes independentes.
i) Qual a probabilidade de que a diferena nas duas mdias amostrais X2 X1 seja no mnimo de
25h? ii) Construir um intervalo de confiana para a diferena entre as mdias populacionais dos
dois processos?
Questo 8: Suponha que amostras de tamanho n = 25 sejam selecionadas, ao acaso, de uma populao normal, com mdia igual a 100 e desvio-padro igual a 10. Qual a probabilidade de que a
mdia amostral caia no intervalo de X 1,8X a X + 1,0X ?
Questo 9: Numa pesquisa de mercado para estudar a preferncia da populao de uma cidade em
relao a um determinado produto, colheu-se uma amostra aleatria de 300 indivduos, dos quais
180 preferiam esse produto.
(a) Determine o intervalo de confiana para a proporo da populao que prefere o produto em
estudo; tome = 0,90. (Resp. [0,553 ; 0,647] )
(b) Determine a probabilidade de que a estimativa pontual dessa proporo no difira do verdadeiro
valor em mais de 0,001. (Resp. 2,7%)
Questo 10: Antes de uma eleio em que existam dois candidatos, A e B, foi feita uma pesquisa
com 400 eleitores escolhidos ao acaso, e verificou-se que 208 deles pretendiam votar no candidato
a. Construa um intervalo de confiana, com c.c. = 0,95, para a porcentagem de eleitores favorveis ao candidato A na poca das eleies. (Resp. [0,471 ; 0,569])
Questo 11: Uma amostra aleatria de 625 donas de casa revela que 70% delas preferem a marca
A de detergente. Construir um intervalo de confiana para p = proporo das donas de casa que
preferem A. Utilize ( = 90%).
Questo 12: Numa pesquisa com 50 eleitores o candidato Jos Joo obteve 35% da preferncia
dos eleitores. Construa, para a confiana de 94%, os intervalos otmista e conservador de confiana

para a proporo de votos a serem recebidos pelo candidato mencionado, supondo que a eleio
fosse nesse momento.
Questo 13: Antes de uma eleio, um determinado partido est interessado em estimar a proporo p de eleitores favorveis ao seu candidato. Uma amostra piloto de tamanho 100 revelou que
60% dos eleitores eram favorveis ao candidato em questo.
a) Determine o tamanho da amostra necessrio para que o erro cometido na estimao seja de , no
mximo, 0,01 com probabilidade de 80%; (Resp. n = 3.994)
b) Se na amostra final, com tamanho igual ao obtido em (a), observou-se que 55% dos eleitores
eram favorveis ao candidato em questo, construa um intervalo de confiana para a proporo p.
Utilize ( = 95%).
Questo 14: Suponha que estejamos interessados em estimar a porcentagem de consumidores de
um certo produto. Se a amostra de tamanho 300 forneceu 100 indivduos que consomem o dado
produto, determine:
a) o intervalo de confiana de p, com coeficiente de confiana de 95%; (Resp. [0,280 ; 0,386])
b) o tamanho da amostra para que o erro da estimativa no exceda a 0,02 unidades com probabilidade de 95%. (Resp. n = 2.133 ou n = 2.401)
Questo 15: Com auxlio da tabela t-Student calcule:
a) P(3,365 t5 3,365); (Resp. 0,98)
b) P(|t8 | < 1,4); (Resp. 0,80)
c) O valor de b tal que P(t16 b) = 0,05; (Resp. -1,746)
d) O valor de c tal que P(|t11 | c) = 0,10; (Resp. 0,129)
Questo 16: Uma amostra com 10 observaes de uma varivel aleatria Normal forneceu mdia
de 5,5 e varincia amostral 4. Determine o intervalo de confiana para com coeficiente de confiana = 95%
Questo 17: Admitindo que a presso sangunea arterial em homens siga o mdelo Normal, 7 pacientes foram sorteados e tiveram sua presso medida com os seguintes resultados: 84, 81, 77, 85,
69, 80 e 79. Determine o intervalo de confiana para com coeficiente de confiana = 98%
Questo 18: Uma amostra com 10 observaes de uma varivel aleatria Normal forneceu mdia
de 5,5 e varincia amostral 4. Determine o intervalo de confiana para com coeficiente de confiana = 95%

Questo 19: Encontre o c.c. de um intervalo de confiana para p, se n = 100, pb= 0,6 e a amplitude
do intervalo deve ser igual a 0,090. (Resp. = 0,64)
Questo 20: Esto sendo estudados dois processos para conservar alimentos, cuja principal varivel de interesse o tempo de durao destes. No processo A, o tempo X de durao segue a
distribuio N(A ; 100), e processo B o tempo Y obedece distribuio N(B ; 100). Sorteiam-se
duas amostras independentes: a de A, com 16 latas, apresentou tempo mdio de durao igual a 50,
e a de B, com 25 latas, durao mdia igual a 60.
(a) Construa um IC para A e B , separadamente.
(b) Para verificar se os dois processos podem ter o mesmo desempenho, decidiu-se construir um IC
para a diferena A B . Caso o zero pertena ao intervalo, pode-se concluir que existe evidncia
de igualdade dos processos. Qual seria sua resposta?
Questo 21: O tempo de reao de uma pessoa a certa droga uma varivel aleatria com mdia
5 minutos e desvio padro 3 minutos. Esse tempo foi medido em uma amostra de 80 pessoas escolhidas, sem reposio, na cidade de So Paulo. Pergunta-se a probabilidade:
(a) O tempo mdio amostral ser inferior a 5,5? (Resp. 0,9319)
(b) O tempo mdio na amostra no diferir da verdadeira mdia por mais de 0,4? (Resp. 0,7660)
Questo 22: Numa pesquisa de mercado desejamos estimar a proporo de pessoas que compram
o sabonete Bom-cheiro.
(a) Que tamanho de amostra devemos colher para que, com probabilidade 0,9; a estimativa no se
desvie do verdadeiro valor por mais de 0,05? (Resp. n ' 269)
(b) Se tivermos a informao adicional de que a aceitao do sabonete Bom-cheiro no mnimo
0,8, qual deve ser ento o tamanho da amostra? (Resp. n ' 173)
(c) Decidimos colher uma amostra de tamanho 81. Qual o erro mximo cometemos com probabilidade 0,9? (Resp. 0,09 )
(d) Para uma amostra de tamanho 81, qual a probabilidade de que o erro mximo seja 0,08? (Resp.
0,8502 )

Questo 23: Um pesquisador est estudando a resistncia de um determinado material sob determinadas condies. Ele sabe que essa varivel normalmente distribuda com desvio padro de
duas unidades.
(a) Utilizando os valores 4,9; 7; 8,1; 4,5; 5,6; 6,8; 7,2; 5,7; 6,2 unidades, obtidos de uma amostra
de tamanho 9, determine o intervalo de confiana para a resistncia mdia com um coeficiente
= 0,90.
(Resp. [5,13 ; 7,32])
(b) Qual o tamanho da amostra necessrio para que o erro cometido, ao estimarmos a resistncia
mdia, no seja superior a 0,01 unidade com probabilidade 0,90? (Resp. n = 108.900)
(c) Suponha que no item (a) no fosse conhecido o desvio padro, determine o intervalo de confiana para a resistncia mdia com um coeficiente = 0,90.
Questo 24: Uma amostra aleatria de n1 = 49 selecionada de uma populao 1 normal com
uma mdia de 75 e um desvio -padro igual a 8. Uma segunda amostra aleatria de tamanho
n2 = 9 retirada de uma outra populao 2 normal com mdia 70 e desvio-padro 12. Faa X1 e
X2 serem duas mdias amostrais. Encontre:
a) a probabilidade de X1 X2 exceder 4;
b) a probabilidade de 3,5 6 X1 X2 6 5,5;
c) construir um intervalo de confiana para a diferena 1 2

Teste de Hipteses

Em muitas situaes temos interesse em tomar a deciso de aceitar ou rejeitar determinda afirmao baseando-se em um conjunto de evidncias.
A construo de um teste de hipteses, para um parmetro populacional, pode ser colocado do
seguinte modo. Existe uma varivel X associada a dada populao e tem-se uma hiptese sobre
determinado parmetro dessa populao. Por exemplo, afirmamos que o verdadeiro valor de
0 . Colhe-se uma amostra aleatria de elementos dessa populao, e com ela deseja-se comprovar
ou no tal hiptese.
Qualquer que seja a deciso tomada, estamos sujeitos a cometer erros. So dois os erros que
podem ser cometidos ao se realizar um teste de hiptese, so eles:
Erro tipo I: rejeitar a hiptese nula quando essa verdadeira. Chamaremos de a probabilidade
de cometer esse erro, isto ,
= P(erro tipo I) = P(rejeitar H0 |H0 verdadeira).
Erro tipo II: no rejeitar H0 quando H0 falsa. A probabilidade de cometer esse erro denotado
por , logo
= P(erro tipo II) = P(no rejeitar H0 |H0 falsa).
b se a hiptese H0 ou no
O objetivo do teste de hiptese dizer, usando uma estatstica ,
aceitvel. Essa deciso tomada atravs da considerao de uma regio crtica RC. Caso o valor
observado da estatstica pertena a essa regio, rejeitamos H0 ; caso contrrio, no rejeitamos H0 .
Esta regio construda de modo que P(b RC|H0 verdadeira) seja igual a , fixado a priori.
A probabilidade de cometer um erro de tipo I um valor arbitrrio e recebe o nome de nvel
de significncia ou tamanho do teste. O resultado da amostra tanto mais significante para rejeitar H0 quanto menor for esse nvel , ou seja, quanto menor menor a probabilidade de se
obter uma amostra com estatstica (estimativa) pertencente regio crtica, sendo pouco provvel
a obteno de uma amostra da populao para a qual H0 seja verdadeira. Geralmente, o valor de
fixado em 10%, 5% ou 1%.

Passos para construo de um teste de hipteses:


I) Estabelecer as hipteses nula e alternativa;
II) Fixar ;
III) Definir a forma da regio crtica, com base na hiptese alternativa;
IV) Identificar a distribuio do estimador e obter sua estimativa;
V) Concluir o teste com base na estimativa e na regio crtica.

2.1

P-valor
Ao realizarmos um teste de hipteses, partimos de um valor de , pr-fixado, para construir

a regra de deciso uma alternativa deixar a cargo de quem vai utilizar as concluses do teste a
escolha do valor para a probabilidade , que no precisar ser fixado priori. A idia consiste em
calcular, supondo que a hiptese nula seja verdadeira, a probabilidade de se obter estimativas mais
desfavorveis ou extremas ( luz da hiptese alternativa) do que a que est sendo fornecida pela
amostra. Esta probabilidade ser o P-valor, denotado por P. Valores pequenos de P evidenciam que
a hiptese nula falsa, pois, sendo a amostra nossa ferramenta de inferncia sobre a populao,
ela fornece uma estimativa que teria probabilidade muito pequena de acontecer, se H0 fosse verdadeira. O conceito do que pequeno"fica a cargo do pesquisador, que assim decide qual usar
para comparar com o valor P. Daremos agora uma definio formal de um valor P.
definio: O P-valor o menor nvel de significncia que conduz rejeio da hiptese nula H0
com dados fornecidos pela amostra. Assim, um valor P carrega informao sobre o peso da evidncia contra H0 .

2.2

Distribuio F de Snedecor
Sejam U e V variveis aleatrias independentes tendo ambas distribuio qui-quadrado com m

e n graus de liberdade respectivamente. Ento a varivel aleatria


X=

U
m
V
n

tem distribuio F com m graus de liberdade no numerador e n graus de liberdade no denominador,


denotaremos por X F(m, n).
Se X1 , X2 , . . . , Xm uma amostra aleatria de tamanho m de uma populao normal com mdia
2
X e varincia X
, e seja tambm Y1 , Y2 , . . . , Yn uma amostra aleatria de tamanho n de uma

populao Normal com mdia Y e varincia Y2 , e se as duas amostras so independentes, ento


isto resulta que
m
1 X
(Xi X)2
2
i=1

tem distribuio qui-quadrado com m-1 graus de liberdade, e


n
1 X
(Yi Y )2
2 j=1

tem distribuio qui-quadrado com n-1 graus de liberdade, assim a estatstica

F =

m
X
1
(Xi X)2
2
(m 1)X
i=1
n
X
1
(Yi Y )2
(n 1)Y2 j=1

2
SX
2
X

SY2
2
Y

tem uma distribuio F com m-1 e n-1 graus de liberdade.


Um procedimento de teste de hipteses para a igualdade de duas varincias baseado no seguinte
2
= Y2 , a estatstica
resultado. Sujeita a hiptese nula H0 : X
2
SX
F = 2,
SY

distribuio F com m-1 e n-1 graus de liberdade.

EXERCCIOS
Questo 1: Uma mquina automtica para encher pacotes de caf enche-os segundo uma distribuio normal, com mdia e varincia sempre igual a 400 g 2 . A mquina foi regulada para
= 500g. Desejamos, periodicamente, escolher uma amostra de 16 pacotes e verificar se a produo est sob controle, isto , se = 500g ou no. Se uma dessas amostras apresentasse uma
mdia x= 492 g, voc pararia ou no a produo para regular a mquina?
Questo 2: Um relatrio de uma companhia afirma que 40% de toda a gua obtida, atravs de
poos artesianos no nordeste, salobra. H muitas controvrsias sobre essa informao, alguns
dizem que a proporo maior, outros que menor. Para dirimir as dvidas, 400 poos foram
sorteados e observou-se, em 120 deles, gua salobra. Qual a concluso ao nvel de 3%.
Questo 3: Deseja-se investigar se uma certa molstia que ataca o rim altera o consumo de oxignio desse rgo. Para indivduos sadios, admite-se que esse consumo tem distribuio Normal
com mdia 12cm3 /min. Os valores medidos em cinco pacientes com a molstia foram: 14,4; 12,9;
15; 13,7 e 13,5. Qual seria a concluso, ao nvel de 1% de significncia?
Questo 4: Uma estao de televiso afirma que 60% dos televisores estavam ligados no seu programa especial da ltima segunda-feira. Uma rede competidora deseja contestar essa afirmao e
decide usar uma amostra de 200 famlias para um teste. Admitindo que, da pesquisa realizada com
as 200 famlias, obtivemos 104 pessoas que estavam assistindo ao programa. Qual a concluso ao
nvel de 5% de significncia?
Questo 5: Um pesquisador deseja estudar o efeito de certa substncia no tempo de reao de
seres vivos a um certo tipo de estmulo. Um experimento desenvolvido com cobaias, que so
inoculadas com a substncia e submetidas a um estimulo eltrico, com seus tempos de reao (em
segundos) anotados. Os seguintes valores foram obtidos: 9,1; 9,3; 7,2; 7,5; 13,3; 10,9; 7,2; 9,9; 8;
8,6. Admite-se que o tempo de reao segue, em geral, o modelo Normal com mdia 8 e desviopadro = 2 segundos. O pesquisador desconfia, entretanto, que o tempo mdio sofre alterao
por influncia da substncia. Qual a concluso ao nvel de 6% de significncia?
Questo 6: Um fabricante afirma que seus cigarros contm no mais que 30 mg de nicotina. Uma
amostra de 25 cigarros forneceu mdia de 31,5 mg e desvio padro de 3 mg. No nvel de 5%, os
dados refutam ou no a afirmao do fabricante?

Questo 7: Para verificar se duas populaes tm a mesma mdia,amostras independntes foram


retiradas. Sabendo que a populao I Normal (1 , 25) e a populao II Normal (2 , 40), que concluso pode ser retirada, ao nvel 2% ? Os valores obtidos foram:
Populao

Dados

12

14

15

14

13

17

14

13

II

13

17

14

13

16

17

18

16

Questo 8: As variveis X e Y seguem a distribuio Normal com mesma varincia. Deseja-se


testar se, tambm, tm a mesma mdia. Doze observaes de cada varivel foram escolhidas e os
resultados foram os seguintes:
12
12
12
12
X
X
X
X
xi = 48 ;
yi = 56 ;
x2i = 4.900 ;
yi2 = 5.650.
i=1

i=1

i=1

i=1

Qual a concluso ao nvel de significncia de 5% ?


Questo 9: Para comparar as mdias de duas populaes Normais, amostras aleatrias foram obtidas. Sabe-se que as varincias populacionais so diferentes, sendo seus valores desconhecidos.
Amostra I

11

Amostra II 2 7 5 15 9 16 8
O que pode ser dito a respeito das mdias das populaes, com = 0,05 ?
Questo 10: Dois medicamentos para tratamento de infeces bucais esto sendo sendo estudados
e o melhor desempenho definido pela rapidez em eliminar a infeco. Pacientes escolhidos ao
acaso receberam um dos medicamentos e tiveram a sua cura classificada em rpida ou no. Desejase testar, ao nvel 10% , se os medicamentos so equivalentes. os dados obtidos so apresentados a
seguir.
Amostra Pacientes com cura rpida
Medicamento A

50

32

Medicamento B
100
48
Qual sua concluso? Indique as hipteses do teste e as suposies necessrias.

Questo 11: Para comparar o grau de diversidade de duas populaes primitivas, uma medida
antropomtrica foi obtida em fsseis coletados em stios arqueolgicos, fornecendo a tabela a
seguir.
caracterstica

Stio A (n = 17)

Stio B (n = 23)

Mdia (cm )

15,12

12,21

Varincia (cm2 )
0,124
0,184
O que pode ser concludo a respeito das varincias? E das mdias populacionais?
Questo 12: Um fabricante de esferas para rolamentos desenvolveu um novo mtodo de produo,
mais barato. Entretanto, ele desconfia que os novos lotes apresentam variabilidade diferente daqueles produzidos pelo mtodo, ele selecionou aleatoriamente 15 esferas que forneceram os seguintes
dimetros ( em mm):
X

29,9

29,8

29,8

29,7

29,9

29,8

29,9

29,9

30,1

29,9

30,0

30,0

29,6

30,4

29,9

29,8

29,8

30,4

29,8

30,5

29,6

29,3

29,4

30,3

29,9

29,7

30,3

30,4

29,1

30,0

Questo 13: Uma linha de montagem produz peas cujos pesos, em gramas, obedecem ao modelo
Normal com varincia 30 g 2 . Os equipamentos foram modernizados e, para verificar se o processo
continua sob controle, foi tomada uma amostra de 23 peas, forneceu s2obs = 40g 2 . Existem evidncias indicando que a varincia mudou, considerando = 10% ?
Questo 14: Para avaliar o nvel de tenso ocasionada por exames escolares, doze alunos foram
escolhidos e sua pulsao medida antes e depois do exame.
Estudante

10

11

12

Antes

87

78

85

93

76

80

82

77

91

74

76

79

Depois
83 84 79 88 75 81 74 71 78 73 76 71
Faa um teste, com nvel de significncia de 1% , para verificar se existe maior tenso (isto , maior
pulsao) antes da realizao dos exames. Indique as suposies necessrias.

Você também pode gostar