Você está na página 1de 24

Introduo Inferncia Estatstica

A amostragem
Principais Distribuies por Amostragem
Tpicos de Estimao e de Inferncia
estimao pontual
estimao por intervalos
testes de hipteses
Manuela Neves - ISA - 07/08 p. 127/150
Conceitos em Infer encia Estatstica
A infer encia estatstica tem como objectivos tirar concluses sobre os
parmetros da populao a partir da recolha, tratamento e anlise
dos dados de uma amostra, obtida nessa populao.
Conceitos b asicos:
Populao conjunto completo de todas as observaes
possveis;
Amostra conjunto dos valores efectivamente observados
Parmetro de uma populao constante desconhecida, cujo
verdadeiro valor se pretende estimar ou validar.
Manuela Neves - ISA - 07/08 p. 128/150
Introduc ao ` a Teoria da Amostragem
A amostragem um procedimento de recolha de elementos da
populao a incluir na amostra.
De uma dada populac ao podemos retirar muitas amostras:
Amostra 1
Amostra 2
. . .
Amostra k
. . .
Mas quase sempre recolhemos s uma amostra para
estudarmos uma caracterstica X da populao.
Seja x
1
, x
2
, x
n
uma amostra de n observaes da
caracterstica, obtidas aps um processo de amostragem.
Manuela Neves - ISA - 07/08 p. 129/150
Introduc ao ` a Teoria da Amostragem
Vamos considerar a amostra x
1
, x
2
, x
n
como uma realizao
de n variveis que so cpias da varivel X
Sejam X
1
, X
2
, X
n
Recapitulando:
Antes da amostragem ser realizada temos n
variveis aleatrias X
1
, X
2
, ..., X
n
Depois de efectuada a amostragem temos um conjunto de
dados que constituem a amostra observada, x
1
, ..., x
n
.
Denio Chama-se amostra aleat oria de dimenso n a um
conjunto de n variveis aleatrias X
1
, X
2
, ..., X
n
independentes e
semelhantes, i.e., tendo todas a mesma distribuio, a da
caracterstica X em estudo na populao.
Manuela Neves - ISA - 07/08 p. 130/150
T opicos de Estimac ao
O que que nos pode interessar como parmetros desconhecidos
da populao e que procedimentos podemos usar para os estimar?
Os procedimentos so mtodos adequados (os melhores ...) para
se estimar os parmetros desconhecidos. Chamam-se
estimadores.
Os valores que eles permitem obter chamam-se estimativas.
Denio Chama-se estimador de um par ametro a uma funo da
amostra aleatria X
1
, X
2
, ..., X
n
, que permite obter um valor para
o parmetro desconhecido.
Um estimador portanto uma v.a. com uma dada distribuio.
Estimativa de um parmetro um valor concreto assumido pelo
estimador.
Manuela Neves - ISA - 07/08 p. 131/150
T opicos de Estimac ao
Dada a amostra aleatria, X
1
, X
2
, ..., X
n
, i.e., v.a. i.i.d. a X,
vejamos os parmetros que nos vo interessar, os seus
estimadores e estimativas
Parmetro a estimar Estimador Estimativa
X =

n
i=1
X
i
n
x =

n
i=1
x
i
n

2
S
2
=

n
i=1
(X
i
X)
2
n1
s
2
=

n
i=1
(x
i
x)
2
n1
p

P =
X
n
p =
x
n

1
??
2
X
1
?? X
2
x
1
?? x
2

2
1
??
2
2
S
2
1
?? S
2
2
s
2
1
?? s
2
2
p
1
?? p
2

P
1
??

P
2
p
1
?? p
2
X - v.a. que conta ... e x - nmero observado de sucessos na amostra de dimenso n.
?? signica que teremos que escolher a melhor operao para fazer a comparao
Manuela Neves - ISA - 07/08 p. 132/150
T opicos de Estimac ao
O que vamos fazer com o estudo das amostras?
Estimao dos parmetros
Estimao pontual
Estimao intervalar intervalos de conana
Testes de hipteses estatsticas.
Estimac ao pontual indicar um nico valor como estimativa
exemplos de estimativas: x, s
2
, p, .
Estimac ao por intervalos neste caso calcula-se um intervalo
(aleatrio) que com uma probabilidade elevada contenha o
verdadeiro valor do parmetro.
Para a construo deste intervalo necessrio conhecer a
distribuio - exacta ou aproximada - do estimador (ou qualquer
expresso dele).
Manuela Neves - ISA - 07/08 p. 133/150
Estimac ao por intervalos
Denic ao Chama-se intervalo de conana ao intervalo que
resulta da concretizao do intervalo (aleatrio) e portanto um
intervalo (a, b), onde a e b so nmeros reais e a < b.
Relembre-se que para obter o intervalo de conana ento
necessrio conhecer a lei do estimador do parmetro
desconhecido.
Comecemos ento por ver como se construiria um intervalo de
conana para , (valor mdio de uma caracterstica X.)
Precisamos de procurar a distribuio do estimador de X
Seja X v.a. c/ dist. Normal , i.e., X N(, )
Para uma amostra de dimenso n tem-se X
n
N(, /

n)
Ento . . .
Manuela Neves - ISA - 07/08 p. 134/150
Intervalo de conanc a
Intervalo de conana a (1 ) 100% para
Seja X v.a. c/ dist. Normal , i.e., X N(, )
Se conhecido considera-se
X
/

n
N(0, 1)
o intervalo a (1 ) 100% de conana para
x z
/2

n
< < x +z
/2

n
(z
/2
valor da v.a. Z tal que P(Z > z
/2
) = /2)
Observac oes: Chama-se precis ao da estimativa semi-amplitude do intervalo de conana e
conanc a ou grau de conanc a a (1 ) 100%
Quanto maior for o intervalo, maior o grau de conana, mas menor a preciso da
estimativa.
Manuela Neves - ISA - 07/08 p. 135/150
Exerccio
Um mtodo utilizado na determinao do pH de uma dada soluo
fornece medies que se admite terem distribuio normal de valor mdio
igual ao verdadeiro valor do pH da soluo e desvio padro de 0.02.
Para avaliar o pH de uma soluo, efectuaram-se 10 medies
independentes tendo-se obtido os seguintes valores:
8.18 8.16 8.17 8.22 8.19 8.17 8.15 8.21 8.16 8.18
a) Indique uma estimativa do valor mdio do pH da soluo.
b) Com base nestas 10 medies, determine um intervalo a 95% de
conana para o valor mdio do pH da soluo.
c) Para um certo processo quimico muito importante que uma dada
soluo tenha um pH de exactamente 8.20. Com base no resultado
da alnea anterior, o que pode concluir relativamente utilizao
desta soluo no referido processo qumico?
Manuela Neves - ISA - 07/08 p. 136/150
Distribuic oes por amostragem
A determinao de intervalos de conana para os parmetros
,
2
, p,
1

2
,
2
1
/
2
2
e p
1
p
2
, necessita do conhecimento
da distribuio dos estimadores envolvidos distribuic oes por
amostragem

isto , so distribuies de funes da amostra aleatria


(X
1
, X
2
, , X
n
), que vamos usar para obter Intervalos de
Conana
J vimos
Se X N(, ) e conhecido
X
/

n
N(0, 1)
Manuela Neves - ISA - 07/08 p. 137/150
Distribuic oes por amostragem
Para obter o Intervalo de Conana para
2
Varivel usada Condies Distribuio
(n1)S
2

2
X
i
N(, )
2
(n1)
S
2
=

n
i=1
(X
i
X)
2
n1
i = 1, 2, , n
Denic ao da distribuic ao
2
Se Z
1
, Z
2
, , Z
n
X = Z
2
1
+ +Z
2
n
v.a. N(0, 1) X
2
(n)
independentes E[X] = n; V ar[X] = 2n
Ver quadro das distribuies contnuas.
Manuela Neves - ISA - 07/08 p. 138/150
Intervalo de conanc a para
2
0 5 10 15
0
.
0
0
.
2
0
.
4
0
.
6
f. densidade da Quiquadrado(n=4)
x
0 5 10 15
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
f. densidade da Quiquadrado(n=10)
x
0 5 10 15
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
0
.
2
5
f. densidade da Quiquadrado(n=20)
x
Intervalo a (1 ) 100% de conana para
2
numa populao
normal
(n1)s
2

2
/2,(n1)
<
2
<
(n1)s
2

2
1/2,(n1)
Manuela Neves - ISA - 07/08 p. 139/150
Distribuic oes por amostragem
Para obter o I.C. para com desconhecido
Varivel usada Condies Distribuio
X
S/

n
X
i
N(, ) t
(n1)
S
2
=

n
i=1
(X
i
X)
2
n1
i = 1, 2, , n
Denic ao da distribuic ao t Student
Se Z N(0, 1)
e X
2
(n)
T =
Z

X/n
t
(n)
e so v.a. ind.
Ver quadro das distribuies contnuas.
Manuela Neves - ISA - 07/08 p. 140/150
Intervalo de conanc a para
6 4 2 0 2 4 6
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
Gr acos da func ao densidade de uma v.a. com distribuic ao N(0, 1), t
(2)
e t
(10)
.
Intervalo a (1 ) 100% de conana para numa populao
normal com desconhecido
x t
/2,(n1)
s

n
< < x +t
/2,(n1)
s

n
Manuela Neves - ISA - 07/08 p. 141/150
Intervalos de conanc a
Intervalo de conana a (1 ) 100% para
Se X tem dist. qualquer no normal
necessrio dispor de uma amostra de dimenso elevada, i.e., n
grande aplicao do Teorema Limite Central
X
/

n
N(0, 1) se conhecido
Ou, que o caso mais frequente,
X
s/

n
N(0, 1) se desconhecido
Intervalo a (1 ) 100% de conana para
x z
/2
s

n
< < x +z
/2
s

n
Manuela Neves - ISA - 07/08 p. 142/150
Intervalo de conanc a para proporc oes
Dada X com distribuio binomial de parmetros (n, p)
(p parmetro desconhecido).
Um estimador de p

P =
X
n
(X o nmero de sucessos em n provas)
Sendo a estimativa p =
x
n
(x o nmero observado de sucessos em n provas)
Se X B(n, p)
e n grande X N(np,

npq)
Intervalo de conana (1 ) 100% para p
p z
/2
_
p(1 p)
n
< p < p +z
/2
_
p(1 p)
n
Manuela Neves - ISA - 07/08 p. 143/150
Intervalos de conanc a - duas populac oes
Intervalos de conana para
1

2
(amostras independentes)
Caso de duas populaes normais i.e.,
X
1
N(
1
,
1
) e X
2
N(
2
,
2
) com varincias conhecidas
Retiram-se duas amostras aleatrias independentes com
dimenses n
1
e n
2
, respectivamente.
Um estimador para
1

2
X
1
X
2
e
X
1
X
2
N
_

2
,
_

2
1
n
1
+

2
2
n
2
_
.
Intervalo de conana a (1 ) 100% para
1

2
(x
1
x
2
) z
/2
_

2
1
n
1
+

2
2
n
2
<
1

2
<(x
1
x
2
) +z
/2
_

2
1
n
1
+

2
2
n
2
Manuela Neves - ISA - 07/08 p. 144/150
Intervalos de conanc a - duas populac oes
Caso de populaes normais i.e., X
1
N(
1
,
1
) e X
2
N(
2
,
2
)
com varincias desconhecidas.
Amostras independentes:
Se n
1
, n
2
grandes (e neste caso no necessrio ter-se
normalidade) pode substituir-se no intervalo anterior
2
1
por s
2
1
e
2
2
por s
2
2
.
Se n
1
e n
2
so pequenos, podemos contruir intervalos de
conana sob certas hipteses
ambas as distribuies normais;
admitir-se varincias populacionais iguais.
Ento
Manuela Neves - ISA - 07/08 p. 145/150
Intervalos de conanc a - duas populac oes
A varivel aleatria agora usada
(X
1
X
2
) (
1

2
)
S
p
_
(
1
n
1
+
1
n
2
)
t
(n
1
+n
2
2)
com S
2
p
=
(n
1
1)S
2
1
+(n
2
1)S
2
2
n
1
+n
2
2
Intervalo de conana a (1 ) 100% para
1

2
para duas
populaes normais, com varincias desconhecidas mas supostas
iguais
(x
1
x
2
) t
/2
s
p
_
1
n
1
+
1
n
2
<
1

2
<(x
1
x
2
) +t
/2
s
p
_
1
n
1
+
1
n
2
(t
/2
t
/2,(n
1
+n
2
2)
)
Manuela Neves - ISA - 07/08 p. 146/150
Quociente de duas vari ancias
Sejam duas populaes normais X
1
N(
1
,
1
) e
X
2
N(
2
,
2
) das quais retiramos duas amostras independentes
de dimenses n
1
e n
2
, respectivamente.
O estimador para

2
1

2
2

S
2
1
S
2
2
e considera-se a varivel aleatria
S
2
1
/
2
1
S
2
2
/
2
2
F
(n
1
1,n
2
1)
ver Nota
Intervalo de conana a (1 ) 100% para

2
1

2
2
s
2
1
s
2
2
f
/2;(n
1
1,n
2
1)
<

2
1

2
2
<
s
2
1
f
/2;(n
2
1,n
1
1)
s
2
2
Nota: Dadas U
2
(m)
e V
2
(n)
v.a. independentes, a v.a. denida como
X =
U/m
V/n
tem distribuic ao F com (m, n) graus de liberdade.
Manuela Neves - ISA - 07/08 p. 147/150
Intervalos de conanc a (amostras emparelhadas)
Intervalos de conana para
1

2
(amostras emparelhadas)
Consideremos que numa dada experincia as observaes esto
relacionadas, i.e, emparelhadas pelo indivduo.
Consideremos a amostra emparelhada (X
i
, Y
i
) (i = 1, ..., n)
Seja
D
1
= X
1
Y
1
; D
2
= X
2
Y
2
; ... D
n
= X
n
Y
n
, isto ,
seja (D
1
, D
2
, ..., D
n
) a amostra aleatria das diferenas
Manuela Neves - ISA - 07/08 p. 148/150
Intervalos de conanc a (amostras emparelhadas)
Se D
1
, D
2
, ..., D
n
so variveis aleatrias provenientes de uma lei
normal com
D
=
X

Y
valor mdio e
varincia
2
D
, desconhecida tem-se
D
D
S
D
/

n
t
(n1)
Intervalo de conana a (1 ) 100% para
D
d t
/2,(n1)
s
D

n
<
D
< d +t
/2,(n1)
s
D

n
Se no for possvel admitir D
i
normais, mas se tenha n grande o
intervalo de conana (1 ) 100% para
D
d z
/2
s
D

n
<
D
< d +z
/2
s
D

n
Manuela Neves - ISA - 07/08 p. 149/150
Intervalos de conanc a para p
1
p
2
Sejam X
1
e X
2
variveis aleatrias tais que
X
1
B(n
1
, p
1
) e X
2
B(n
2
, p
2
).
n
1
e n
2
dimenses de amostras aleatrias independentes
Os estimadores de p
1
e p
2
so

P
1
= X
1
/n
1
e

P
2
= X
2
/n
2
Se n
1
e n
2
grandes temos

P
1


P
2
N
_
p
1
p
2
,
_
p
1
q
1
n
1
+
p
2
q
2
n
2
_
Intervalo de conana a (1 ) 100% para p
1
p
2
quando as
dimenses das amostras so elevadas
( p
1
p
2
) z
/2
_
p
1
q
1
n
1
+
p
2
q
2
n
2
<p
1
p
2
<( p
1
p
2
) +z
/2
_
p
1
q
1
n
1
+
p
2
q
2
n
2
Manuela Neves - ISA - 07/08 p. 150/150

Você também pode gostar