Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Introduo
At agora o que fizemos foi desenvolver modelos probabilsticos que se adequavam a
situaes reais. Em particular, indicmos quando os modelos Binomial e Normal eram
adequados. Todos estes modelos se referem a distribuies, de probabilidade, que envolvem
parmetros, que at agora foram supostos conhecidos. Para que as probabilidades associadas
a eventos sejam calculadas necessrio conhecer o valor destes parmetros.
No estudo das probabilidades realizado at agora, o nosso objectivo era calcular a
probabilidade de acontecimentos pr-especificados, mas do ponto de vista prtico
importante poder deduzir informaes, relativas a uma populao, mediante a utilizao de
amostras dela extradas. Esta a grande diferena entre Probabilidade e Estatstica. No estudo
de Probabilidade estamos interessados em definir modelos que possam ser aplicados a
situaes reais. Estes modelos envolvem distribuies de probabilidade totalmente
conhecidas, isto , no apenas a forma da densidade, mas tambm os seus parmetros so
conhecidos. No estudo da Estatstica supe-se que o modelo probabilstico conhecido, isto
, sabe-se qual a distribuio de probabilidade que modela a situao real, mas os parmetros
desta distribuio so desconhecidos, e devem ser estimados a partir dos dados.
O objectivo principal da Inferncia estatstica, estimar os parmetros populacionais (mdia,
varincia etc), deduzidos a partir da estatstica amostral correspondente. Os mecanismos mais
usuais para "inferir" alguma coisa sobre estes parmetros so:
Estimao pontual - o objectivo "encontrar" os valores do parmetro desconhecido.
Estimao por intervalos - o objectivo encontrar um intervalo que contenha o
parmetro de interesse com uma probabilidade especificada.
Testes de hipteses: o objectivo criar conjecturas sobre os valores possveis do
parmetro e verificar se, estas conjecturas, so muito ou pouco provveis (isto , testar
as hipteses).
2. Distrbuio amostral
a distribuio de probabilidade de um estimador ( ou estatstica) da amostra formada
quando amostras de tamanho n so colhidas varias vezes de uma populao.
Por exemplo, se o estimador da amostra for a sua mdia, a distribuio ser uma distribuio
amostral de mdias das amostras.
Um estimador uma caracterstica da amostra.
Como a amostra aleatria um estimador uma varivel aleatria. Assim tudo o que foi visto
em probabilidade sobre variveis aleatrias, aplica-se aos estimadores. A distribuio de
probabilidade de um estimador denominada de distribuio amostral.
Os principais estimadores so:
(I) A mdia da amostra,
Estimativa
Uma estimativa um valor particular de um estimador
Assim
X =2
X1
X2
, ...,
populao, ento:
Xn
X =
n
a)
Xi
X =
agrupada e
f i Xi
uma estimativa da mdia da amostra quando a amostra
n
( X i X )
S = i=1
n1
est agrupada e
f i ( X i X )
S 2= i=1
n1
amostra est agrupada em uma distribuio de frequncias. Note-se que agora a varincia
calculada
Com n1 no denominador. Isto se deve ao facto de que a varincia for calculada com
n no denominador, a mdia de sua distribuio amostral no ser igual a varincia
N 1
. Evidentemente esta correco s
N
ser necessria se a populao for pequena, caso contrrio o quociente acima ser
aproximadamente igual a um e a correco no precisar ser feita.
Assim se a populao for finita (e pequena) e a amostragem for realizada sem reposio a
varincia dever ser calculada por:
N1 2
2
S^ =
S
N
P=
c)
f
n , onde f
Observao:
Funes no estatsticas:
n
( X i X )
S 2= i=1
Xi
n1
n
( X i X )
ou S '2= i=1
X i
Quais as razes que nos podem levar a preferir uma das estatsticas relativamente
outra?
2
'2
Qual o estimador preferido? S ou S ?
Um critrio que costuma ser aplicado o de escolher um bom estimador como sendo
aquele que centrado e que tem uma boa preciso. Escolhido um plano de amostragem,
define-se:
Estimador centrado Um estimador diz-se centrado quando a mdia das estimativas
obtidas para todas as amostras possveis que se podem extrair da Populao, segundo o
esquema considerado, coincide com o parmetro a estimar. Quando se tem um estimador
centrado, tambm se diz que no enviesado.
2
Uma das razes que nos levam a preferir o estimador S para a varincia, relativamente a
'2
Por outro lado, temos que ter outra preocupao com o estimador escolhido, que diz respeito
preciso:
Preciso - Ao utilizar o valor de uma estatstica para estimar um parmetro, temos que cada
amostra fornece um valor para a estatstica que se utiliza como estimativa desse parmetro.
Estas estimativas no so iguais devido variabilidade presente na amostra. Se, no entanto,
os diferentes valores obtidos para a estatstica forem prximos, e o estimador for centrado,
podemos ter confiana de que o valor calculado a partir da amostra recolhida (na prtica
recolhe-se uma nica amostra) est prximo do valor do parmetro (desconhecido).
A falta de preciso e o problema do enviesamento da amostra so dois tipos de erro com
que nos defrontamos num processo de amostragem (mesmo que tenhamos escolhido um
bom estimador).
Seja
{ 2 ; 3; 4 ; 5 } .Vamos
( 2; 2 )( 2 ; 3 )( 2 ; 4 ) ( 2; 5 ) ( 3 ; 2 )( 3 ; 3 ) ( 3 ; 4 )( 3 ; 5 ) ( 4 ; 2 )( 4 ; 3 ) ( 4 ; 4 ) ( 4 ; 5 )( 5 ; 2 ) (5 ; 3 )( 5 ; 4 ) (5 ; 5 )
Se calcularmos para cada amostra sua mdia obteremos:
( 2+2 2 =2) ;( 2+32 =2,5) ;( 2+42 =3); ( 2+2 5 =3,5); ( 3+2 2=2,5) ;( 3+32 =3) ;( 3+2 4 =3,5) ;( 3+52 =4) ;( 4 +22 =3)
A distribuio de probabilidade
Mdia
2,5
1
16
Probabilidad
e da Mdia
2
16
:
3
3,5
3
16
4
16
4,5
3
16
2
16
1
16
X
X
E ) e Var ) da seguinte maneira:
Calculamos a
X
X =E ) =
X i P ( X i ) =3,5
i=1
E ( 2 ) =0,625
7
Var ( X )=
(
i=1
X i2 P ( X i )
Xi
x = i=1
n
2+3+ 4+5 14
= =3,5
4
4
X
2
( i x )
=1,25
n
n
2
Var ( X )= =
i=1
Var ( X ) a metade
X = X
Var ( X )
e Var ( X )= n = n
Ser que foi coincidncia o facto de que a mdia das mdias amostrais ter coincidido com a
, ...,
Xn
e varincia
e seja (
n
),
i=1
Xi
n
X1
X2
, temos os
E ( X ) = X e Var ( X )=
n
Teorema 1
Teorema: Consideremos uma amostra aleatria, (
n
N ( ; 2 ) . A mdia amostral
i=1
Xi
n
X1
X2
, ...,
Xn
), de distribuio
2
n
( ).
N ;
Este teorema pode ser generalizado para uma amostra aleatria de uma distribuio qualquer.
Teorema2
Teorema: Consideremos uma amostra aleatria, (
distribuio qualquer tal que
E ( X i ) =
X1
X2
Var ( X i ) = 2 . Seja
Xn
, ...,
X
), de uma
a mdia amostral.
Ento:
1.
E ( X ) =
2.
Var ( X )=
n
X
N (0 ; 1)
Xi
X poderia ser uma coisa estranha, que nada tem a ver com a distribuio
original de cada
Xi
n>30
X , aproximadamente
X1
N ( ; ) . Seja
podemos
N ( 0 ;1 ) .
X2
, ...,
Xn
) , de distribuio
. A princpio a
( X i X )
S 2= i=1
n1
. Ento
9
n
( n1 ) S
2
( X i X )
i=1
liberdade.
A partir deste teorema podemos deduzir facilmente a mdia e varincia de s2.
X1
X2
, ...,
Xn
) , de distribuio
24
2
E ( S 2 )= 2 e Var ( S )=
n1
Os mecanismos mais usuais para "inferir" alguma coisa sobre estes parmetros so:
Considere-se a populao
n=2
(1;3)
1;5)
(1;6)
(3;5)
(3;6)
(5;6)
Mdia
3,5
4,5
5,5
10
2
3
3,5
4
4,5
5,5
X )
f ( X )=P ( X=
)
X f ( X
X 2 f ( X )
1
6
2
6
4
6
1
6
3
6
9
6
1
6
3,5
6
12,25
6
1
6
4
6
16
6
1
6
4,5
6
20,25
6
1
6
5,5
6
30,25
6
22,5
6
91,75
6
Da tabela segue:
22,25
E ( X ) = X f ( X ) E ( X ) =
=3,75=
6
()
isto , a varincia entre as mdias amostrais n vezes (neste caso 2 vezes) menor que a
varincia populacional multiplicada pelo factor de correco de populao finita. Este factor,
pode ser considerado como o factor de eficincia da amostragem sem reposio sobre a
( N=4 e n=2 )
vale
2
3 . Como na
amostragem sem reposio no possvel retirar o mesmo elemento duas vezes, as mdias
no podem assumir valores to extremos, como por exemplo, o valor um ou seis que
assumiram na amostragem com reposio. Isto faz com que a erro padro na amostragem
sem reposio seja menor do que na amostragem com reposio.
11
N n
N1
Pode-se perceber facilmente que quanto maior for a diferena entre o tamanho da populao e
o tamanho da amostra mais prximo de um ser este factor. Ento, como regra prtica,
pode-se admitir como necessria a correco para a varincia das mdias amostrais sempre
que o tamanho da amostra exceder a 5% do tamanho da populao. Caso isto no ocorra no
necessrio fazer-se a distino entre os dois procedimentos (com e sem reposio).
Evidentemente as consideraes acima valem para populaes pequenas. Se a populao
bastante grande ou infinita, no mais ser possvel pensar em construir tabelas para
representar a distribuio das mdias amostrais. Neste caso necessrio procurar por
modelos probabilsticos que descrevam a distribuio da mdia amostral. Neste caso,
tambm, como declarado acima a distino entre amostragem com e sem reposio no ser
necessrio, pois o factor de correco ser aproximadamente um e no necessitar ser
utilizado.
Os modelos probabilsticos so conhecidos a partir dos dois seguintes resultados:
a)
Se
normal de mdia
e desvio padro
( X ) ter
uma distribuio tambm normal com a mesma mdia da populao e com desvio
padro (erro padro) raiz de n vezes menor que o desvio padro da populao,
isto :
Se
N ( ; ) ento,
ser
N ;
( X1 ; X2 ; Xn)
distribuio de mdia
e desvio padro
(X)
ter uma
12
padro (erro padro) raiz de n vezes menor que o desvio padro da populao medida que
o tamanho da amostra aumenta.
Observao: Para amostras de 30 ou mais valores, em geral, a aproximao j ser suficiente
boa, para se poder utilizar este resultado.
Assim:
X
Se
N ;
para n grande ( n 30 ) .
Exemplos:
1. Uma populao
P ( 95< X <105 ) ?
a) Qual
(b) Se
a mdia de
16
P ( 95< X <105 ) ?
Soluo:
Como
a)
X uma
N (100 ; 10 ) , vem:
6 s .m e desvio
13
Soluo:
Neste caso, como no foi declarado que a populao normal necessrio aplicar o teorema
central do limite, uma vez que
2
=0,2
, uma vez que o erro padro da mdia raiz de
100
( (
6,36
P ( Z >1,5 )= (1,5 ) =6,68
0,2
))
P={1; 3 ; 5 ; 6 }
extradas com reposio. Para cada amostra vai-se calcular a varincia. Ter-se-
assim um conjunto de
16
(1;1)
1
(1;3)
2
(1;5)
3
(1;6)
3,5
(3;1)
2
(3;3)
3
(3;5)
4
(3;6)
4,5
12,5
4,5
(5;1)
(5;3)
(5;5)
(5;6)
(6;1)
(6;3)
(6;5)
(6;6)
Amostra
s
14
Mdias
S2
5,5
3,5
4,5
5,5
0,5
12,5
4,5
0,5
0
0,5
2
4,5
8
12,5
f ( S2 ) =P ( S 2=S2 )
S2 f (S2)
4
16
0
16
2
16
1
16
4
16
8
16
2
16
9
16
2
16
16
16
2
16
25
16
59
16
E ( S 2 )= S 2 f ( S 2 )
59
=3,6875= 2 , isto a expectncia (mdia) de todas as varincias
16
varincia populacional
(parmetro populacional varincia). Em outras palavras, pode-se dizer que quando a
amostragem com reposio a varincia amostral
S 2 um estimador no tendencioso da
2
varincia populacional .
Desta forma, sempre que se desejar estimar a varincia de uma populao onde as amostras
foram retiradas com reposio, pode-se usar a varincia amostral como estimador.
15
Considere-se a populao
P={1; 3 ; 5 ; 6 }
(1;3)
2
(1;5)
3
(1;6)
3,5
(3;5)
4
(3;6)
4,5
(5;6)
5,5
12,5
4,5
0,5
0,5
2
4,5
8
12,5
E= S f ( S ) E=
f ( S2 ) =P ( S 2=S2 )
S2 f (S2)
1
16
0,5
6
2
6
4
6
1
6
4,5
6
1
6
8
6
1
6
12,5
6
29,5
2
3,6875=
6
29,5
6
P , no
igual a varincia populacional (parmetro populacional varincia). Neste caso, para que se
16
0,375
1,500
3,375
6,000
9,375
N 1
=0,75
N=3
4
ento, se ter:
f ( S^ 2 ) =P ( S^ 2= ^S2 )
S^ 2 f ( S^ 2 )
1
6
0,375
6
2
6
3,000
6
1
6
3,375
6
1
6
6,000
6
1
6
9,375
6
22,125
6
22,125
E ( S^ 2 )= S^ 2 f ( S^ 2 )
=3,6875= 2
6
factor
N 1
, para que ela seja um bom estimador da varincia populacional. claro que
N
esta correco s ser importante para populaes pequenas. Se a populao for grande, por
exemplo, N=1000
, ento o factor
N 1
=0,999
N=999
o que aproximadamente 1. Neste
1000
17
caso, no necessrio usar esta correo e a amostragem sem reposio pode ser considerada
equivalente a com reposio para efeitos de estimao da varincia populacional.
Evidentemente as consideraes acima valem para populaes pequenas. Se a populao
bastante grande ou infinita, no mais ser possvel pensar em construir tabelas para
representar a distribuio das varincias amostrais. Neste caso necessrio procurar por
modelos probabilsticos (funes) que descrevam a distribuio da varincia amostral. Para a
2
varincia este modelo existe e denominado de distribuio Qui-quadrado ( ) .
P={1; 3 ; 5 ; 6 }
(1;1)
0
(1;3)
0
(1;5)
0
(1;6)
0,5
(3;3)
0
(3;5)
0
(3;6)
0,5
(5;5)
0
s
P
(5;6)
0,5
(6;6)
1
(3;1)
0
(5;1)
0
(6;1)
0,5
(5;3)
0
(6;3)
0,5
(6;5)
0,5
f ( P )=P ( P= p )
Pf ( P )
P2 f ( P )
0,0
9
16
0
16
0
16
0,5
6
16
3
16
1,5
16
1
16
1
16
1
16
18
4
16
2,5
16
4
=0,25= , isto o valor esperado (mdia) de todas as propores
16
um estimador no
, quando as amostras so
( 1 )
2,5
2
0,25 =0,09375=
16
n
O valor
( 1 )
=0,09375
n
P={1; 3 ; 5 ; 6 }
(1;3)
(1;5)
(1;6)
(3;5)
(3;6)
(5;6)
0,5
0,5
0,5
19
0,5
0,5
0,5
E ( P )= pf ( p )
Pf ( P )
P2 f ( P )
0
2
0
2
0,5
2
0,25
2
0,5
2
0,25
2
0,5
=0,25=
, isto a expectncia (mdia) de todas as propores
2
um estimador no
, quando as amostras so
( 1 ) N n
0,25
0,252=0,0625
2
2
N 1
vezes)
menor que a varincia populacional multiplicada pelo factor de correco de populao finita.
Este factor, pode ser considerado como o factor de eficincia da amostragem sem reposio
sobre a amostragem com reposio que, neste exemplo, ( N=4 ;n=2 ) vale
2
3 .
20
( X1 ; X2 ; Xn)
proporo ,
ento a distribuio da proporo amostral ser aproximadamente normal com mdia
P=
e desvio padro P=
( 1 )
n
Observao:
Para amostras de 30 ou mais valores, em geral, a aproximao j ser suficiente boa, para se
poder utilizar este resultado. Para amostras pequenas a distribuio da proporo amostral
Binomial.
Exemplo:
1.
Como
P=
( 1 )
n
P=
0,2 ( 10,2 )
=0,04=4
100
Ento:
a)
b)
= =20
e desvio padro
21
3. Estimao
A inferncia estatstica tem por objetivo fazer generalizaes sobre uma populao com base
em valores amostrais. A inferncia pode ser feita estimando os parmetros:
(a) Por ponto
(b) Por intervalo.
A estimao por ponto feita atravs de um nico valor, enquanto que a estimao por
intervalo
fornece um intervalo de valores em torno do valor da estimativa pontual.
Exemplo:
Uma amostra aleatria simples de
400
300
300
=75
400
administrao boa ou ptima. Esta mesma estimativa poderia ser enunciado como de:
70 a 80
das pessoas da cidade acham a administrao boa ou tima. Neste caso, teramos
uma estimativa por intervalo da proporo. Note-se que o centro do intervalo o valor
75 da estimativa pontual.
e seja ( X 1 , X 2 , ...,
um estimador do
parmetro , ento:
(i) Se
E ( ^ ) =^
diz-se que
, diz-se que
22
(iii) Um estimador
de um parmetro
informao da amostra.
(iv) Um estimador
mnima.
Seja
uma proporo
e seja (
X1
X2
, ...,
Xn
S2
p .
2 , a menos que a
S ' 2=
n1 2
S
n
n
X i ; i=1; ; n
Sendo
S n= X i
i=0
Xi
X n = i=0
n
seja (X 1, X 1 , , X n )
23
(a)
(b)
2
(c) S estimador no-tendencioso e consistente da varincia da populao
.
.
2 , a menos
que a
extrao seja sem reposio de populao finita. Neste caso, o estimador
N1 2
2
S^ =
S
.
N
'
parmetros desconhecidos
'
Seja m r
'
1 ; 2 ; k
k
1
'
r
xi
o r-simo momento amostral, isto : m r = n
i=1
equaes
Observao:
'
O primeiro momento amostral m 1 representado por
x .
. Em particular, se
f ( x 1 ; x 2 ; xn ; )
X1 ; X2 ; Xn
24
densidade
f ( x; ) ,
ento
funo
de
verossimilhana
L ( ; x 1 ; x 2 ; x n) =f ( x 1 ; ) f ( x 2 ; ) f ( x n ; )
Estimador de verossimilhana
L ( )=L ( ; x 1 ; x2 ; x n )
Seja
Se
o valor de
que maximiza
mxima verossimilhana de
L ( ) ento
^ ( X 1 ; X 2 ; X n )
^ ( x 1 ; x 2 ; x n )
x1 ; x2 ; xn
X1 ; X2 ; Xn
o estimador de
a estimativa de mxima
X1 ; X2 ; Xn
formam uma
f ( x1 ; ) f ( x2 ; ) f ( xn ; ) .
amostra aleatria de uma densidade f ( x ; ) de tal modo que
Ento, o estimador de mxima verossimilhana a soluo da equao
Alm disso,
L( )
log L ( )
dL ( )
=0
d
,e
parmetros
1 ; 2 ; k
os estimadores de
L ( 1 ; 2 ; k )
=0
1
L ( 1 ; 2 ; k )
k
L ( 1 ; 2 ; k )
=0
2
=0
25
parmetro. Para que se possa associar uma confiana (probabilidade) a uma estimativa
necessrio construir um intervalo em torno da estimativa por ponto. Este intervalo
construdo baseado na distribuio amostral do estimador.
4. Da mdia populacional
de que o intervalo
construdo contenha o parmetro populacional. Desta forma, ser a probabilidade de que
o intervalo obtido no contenha o valor do parmetro, isto , ser a probabilidade de
erro. Sabe-se que a mdia da amostra tem distribuio normal de mdia
e desvio padro
n
se a populao de onde for extrada a amostra for normal (ou se a amostra for superior a
30
e de desvio padro
, pode-se
ento utilizar a curva normal para estabelecer os limites para o intervalo de confiana.
Lembrando que o que se quer um intervalo que contenha o parmetro populacional
com
probabilidade 1
Z < Z < Z
2
Mas
Z=
, onde
( X)
tem-se ento:
Z
2
2 .
26
Z <
( X )
<Z =1
2
. Trabalhando esta desigualdade, segue que:
n
P
X Z
< < X + Z
=1
2 n
2 n
. Que o intervalo procurado. Assim o intervalo
P
de confiana (probabilidade) de 1
Z ; X + Z
X
2 n
2 n
onde:
Z
2
2 , isto , o
valor de
Z
tal que:
P( Z> Z )=
2
Z =
2
2 , ou ento:
2
Exemplo:
10
tamanho
n=100
=5 e =2,5
Tem-se 1 =95 , ento
2
buscado na normal padro valor
Z
2
de Z
tal que:
27
P Z >Z =2,5
, ou ento:
Z =2,5
95
populao
ser:
][
valor
2 n
=Z
estatstico
ingls W. S. Gosset, conhecido por Student o comportamento do quociente:
28
( X )
S
n
v =n1=
linha da tabela.
Neste caso, o intervalo de confiana com probabilidade 1
t S ; X + t S
X
2 n
2 n
onde:
o valor da distribuio t
tal que:
P(t> t )=
2
Exemplo:
t
2 , isto , o valor de
29
25
X =50
95
de
Tem-se
buscado na distribuio
com
=2,5
. O coeficiente de confiana que deve ser
2
poder ser o
valor
=5
ou ento o valor
=2,5
, dependendo do tipo de tabela. Em qualquer
2
24 , isto , o valor
tal que:
Este valor vale 2,064 . (Note-se que na a normal este mesmo valor valia
1,96 ). Ento o
intervalo
de confiana de 95
][
95
desta populao.
Convm notar que a ltima linha da tabela da distribuio t apresenta valores
coincidentes com aqueles que seriam obtidos se fosse utilizado a distribuio normal padro.
Isto ocorre porque a distribuio t tende a distribuio normal medida que o tamanho
30
30
n>30 . Assim se a
t , isto , pode-se ler os valores na normal padro, ou ento na ltima linha da tabela
t .
5. Intervalos de confiana
Eis outra maneira de calcularmos uma estimativa de um parmetro desconhecido. Vamos
construir um intervalo de confiana para o parmetro desconhecido com uma probabilidade
95
^ 1 << ^ 2
contm
ser de
5.
31
Exemplo
Seja
a durao de vida de uma pea de equipamento que tem distribuio normal com
desvio padro
durao mdia de
populacional
Soluo:
100
95
para a mdia
32
n=100; X=500
; =5 ; (1 ) =95 ; z=1,96
Os intervalos de confiana so:
Li=5001,96
5
=499,02 ;
100
Ls=500+1,96
5
=500,98
100
Logo, o intervalo de 95
IC [ ; 95 ] =[ 499,02; 500,98 ]
95
[ 499,02 ; 500,98 ]
contm a
b) Se no conhecemos a distribuio de
Assim, o intervalo de
( 1 )
X , ento para
( )
N ;
, quando n .
de forma
IC [ ; ( 1 ) ] =[ Li ; Ls ]
Em que:
Li= X - Z
n
Ls= X + Z
n
33
Assim, a estatstica
t t (n1)
, isto , a estatstica
tstudent
de forma
em que:
Li= X
t (n 1 )
S
n
Ls= X
+t (n1)
S
n
Sendo
t ( n1)
34
Exemplo:
Suponha que se extraia uma amostra de tamanho 25 de uma populao com mdia
desvio padro desconhecido. Suponha que a mdia amostral seja 4,004 e o desvio padro
amostral seja 0,366. Determinar intervalos com 95% e 99%de confiana para
Solucao:
Temos que
t 0,025;24 =2,064
L1=4,0042, o 64.
0,366
=3,853
25
0,366
=4,155
25
t 0,005;24 =2,797
L1=4,0042,797.
0,366
=3,799
25
L2=4,004 +2,797.
0,366
=4,209
25
35
36
b) Se no conhecemos a distribuio de
central de limite e o intervalo de
forma
( 1 )
X , ento, para
da
IC [ ; ( 1 ) ] =[ Li ; Ls ] em que:
Li= X
t (n 1 )
S
n
Ls= X
+t (n1)
S
n
37
Anexo
38
XA1
XA2
, ...,
XA
X B1
X B2
, ...,
XB
nA
nB
)
)
39
nA
Com
nB
AeB ,
e varincias
B =
respectivamente.
Sejam:
nA
X A =
XA
nA
i=1
nB
X B =
i=1
XB
nB
X B X B ; : ; X B
1;
com
nA
nA
nB
nB
X A =
2
e varincias A
nB
xA
i=1
nA
xB
e X A= i=1
nB
A 2 B2
N ( A B ,
+
) Portanto,
nA nB
Temos tambem
(n A 1) s A
2
A
Xn
2
A1
(n 1) s
,e B 2 B
B
Xn
2
B1
Logo
(n A 1) s A 2 (n B1) s B2
+
X n 2+ Xn
2
2
A
B
A
2
A+n B 2
( X A X B )( A B )
A B
+
n A nB
N ( 0,1)
B2= 2
40
B =
temos que:
( X A X B ) ( A B )
1 1
+
n A nB
2
( n A 1 ) s A +(nB 1) s B
tn
A+n B2
n A +n 2
B
Distribuicao F
X 2 com
ento
8.
1
X
Suponha que
com mdia
e varincia
12
41
m
(X i X )2
i=1
s12
21
Logo
(m1)s1
S22
(Y iY )2
2
m1
i=1
2
2
(n1)S 22
X 2n1
Fm 1,n1 se 1=
Ento
s1
F m1,n1
2
S2
22
Exemplo:
Suponha que uma amostra de tamanho 6 seja retirada de uma populao normalmente
distribuda com mdia
2
2
probabilidade de s 1 > s 2 ?
Soluo:
s
( )
( )
s
2
1
2
1
2
2
2
2
2
P( s 1> s 2 =P s 2 >1 =P s > 2
2
1
Vimos que
(n1)S 2 2
X n1
2
Logo, podemos determinar pela tabela da distribuio
X2
, [ n1]
2
( )
1
X2
e X2
(1 2 ),[ n1]
, [ n1 ]
(n1)S
X2
=1
2
, [ n1 ]
ou seja
42
(n1)S 2 2 (n1) S2
2
=1 ,
2
X
X
2
(1 2 ), [ n1 ]
, [ n1]
( n1)S 2 (n1) S 2
, 2
2
X
X
(1 2 ) ,[ n1 ]
, [ n1]
portanto o intervalo
2
um intervalo de confiana para com coeficiente de confiana ( 1 .
Exemplo:
Suponha que seja retirada uma amostra de tamanho cinco de uma populao normalmente
distribuida, e que se tenha encontrado uma varincia amostral de 13,52.
Construa um intervalo com 95% de confiana para a varincia populacional.
Soluo:
Temos que
2
superior do I.C. de 95% para so:
L1 =
(n1)S 2 4 (13,52)
=
=4,83
11,143
X2
2
, [ n1 ]
L2 =
( n1) S
4(13,52)
=
=111,74
2
0,484
X
(1 2 ), [ n1]
2
Portanto,P(4,85 111,74 =0,95
Varincias 1 e
Como
2
2
Conhecidas
43
11
X
N (0,1)
1
n1
22
X
N (0,1)
2
n2
Logo
X
( 1 X 2)( 1 2)
1 2
+
n1 n 2
N ( 0,1)
12
dado por
X
X
( 1 X 2)+ Z
2
1 2
+
,
n1 n2
21 22
(1 X 2)Z
+
,
n1 n2
2
2
2
2
2
2- 1 e 2 Desconhecidas mas 1 = 2
Vimos que
44
x
n
n
( 21) S 22
n1+ n22
( 1 x 2)( 12 )
( 11) S 21 +
1 1
+
n1 n 2
12
, quando
21
22 , com coeficiente de
dado por
x
n
n
( 21) S 22 1 1
2
( 11) S 1 +
.
+
n1+ n22
n1 n 2
( 1 x 2) t , [ n 1+ n22 ] .
Exemplo:
Uma amostra de 10 lmpadas eltricas, da marca A, apresentou a vida mdia de
1400 horas e desvio padro de 120 horas. Uma amostra de 20 lmpadas eltricas,
da marca B, apresentou a vida mdia de 1200 horas e o desvio padro de 100 horas.
Supondo que
A = B
ser:
t 0,025,28 =2,048
45
9(120)2 +19(100)2
1 1
14001200 2,048.
.
+
=(200 67,77)
28
10 20
Ou seja
A B 291,43 =0,99
P(108,57
2
2
10. Intervalo de Confiana para Razo das Varincias 1 / 2
Vimos que
S21
22
Fn 1,n 1
S21
21
Logo, podemos determinar pela tabela da distribuio F com
F
os nmeros
[
[
( 1 2 ), [n 1 ], [n 1 ]
2
e F , [ n21 ] , [ n11 ]
2
S 22
F
, [ n 1] , [ n 1]
(1
2 )
2
21
S 21
F
2
, [ n21] , [ n11 ]
22
1
F
2
, [ n21] , [ n11]
S 21
S 22
21
22
F
2
, [ n21] , [ n11 ]
S 21
S 22
n21 e n11
g.l.,
tal que:
ou
Exemplo:
Duas mquinas A e B produzem parafusos com o mesmo tamanho mdio. Duas
amostras de tamanho
n A =61 e n b=41
A
2
B .
46
Soluo:
F0,975,40, 60=
Tem-se que
[
[
1
F 0,025,60,40
1
=O ,556 e F0,025,60,40 =1,74
. Logo
1,80
2
3,5 A
3,5
P 0,556.
2 1,75.
=0,95
4,5 B
4,5
P 0,432
1,353 =0,95
^p
de sucessos.
Vimos que
E( ^p )= p
Var ( ^p )=
p(1 p)
n
^p N p
p(1 p)
n
(
2
p(1p)
p(1p)
^p + Z p
n
n
2
P ^pZ
2
^p
dado por:
)
p por
^p , resultando em:
^p (1^p )
^p (1 ^p )
p ^p +Z
=1
n
n
2
47
p1 e p 2
^p1^p2 N p1 p2 ,
p(1 p1 ) p(1 p 2)
+
n1
n2
^p1 e ^p 2
)
p1 p2
dado por:
( ^p1 ^p2 ) Z
2
^p 1 ( 1 ^p 1 ) ^p2 ( 1 ^p2 )
+
n1
n2
Z
padronizadas, isto , n=
i=1
2
A distribuio
2
i
parmetro
. Sabe-se tambm que:
E ( 2 )=v e que V ( 2 ) =2 v .
2
A comportamento, distribuio de probabilidade, apresentado pela varincia amostral ( S )
est
relacionado com a distribuio (modelo)
2n1=
(n1) S2
2
de liberdade a
menos de uma constante. Neste caso v =n1 .
Tabelas
48
A distribuio
n1=v
(linha da
uma determinada probabilidade (rea), a tabela fornece um valor da varivel (abscissa) tal
que a probabilidade direita (rea) deste valor seja igual a rea especificada.
O intervalo
Suponha que seja fixado um nvel de confiana de 1
2 tais que
valores da distribuio
e que
2 1 e 22
sejam dois
P 21 <
( n1 ) S 2 2
< 2 =1
2
1
2
1
<
< 2 =1
2
2
2 ( n1 ) S 1
( n1 ) S 2 2 ( n1 ) S 2
< <
=1
22
21
dado por:
( n1 ) S2 ( n1 ) S2
;
22
21
49
padro populacional basta apenas tomar a raiz quadrada positiva dos termos do intervalo para
a varincia populacional.
Assim o intervalo ser:
( n1 ) S2 ( n1 ) S 2
;
22
21
( n1 ) S 2
( n1 ) S2
<
<
=1
22
21
Exemplo:
2
S =8,38 .
um intervalo de confiana de
, de modo,
que
21 tenha uma rea (probabilidade) direita igual a 95
1=3,940 e 2 =18,307
O intervalo de confiana, para a varincia, ser:
( n1 ) S2 ( n1 ) S2
;
22
21
22
. Estes valores so:
50
[ 4,58 ; 21,27 ]
O intervalo de confiana, para o desvio padro, ser:
13. Amostragem
A inferncia estatstica consiste em fazer previses a partir de uma parte para o todo,
ou seja, com base na anlise de um conjunto limitado de dados (amostra) recolhidos junto de
um conjunto total de elemento (populao), pretende-se caracterizar a populao. A aplicao
da amostragem possui relevncia pelo facto de facultar a realizao de um estudo em menos
tempo em relao ao censo, visto que, somente alguns dos indivduos so criteriosamente
abrangidos. Aliado a este facto, um estudo feito mediante as tcnicas da amostragem acarreta
menos custos.
Definies
1. Populao - o conjunto dos indivduos de entre os quais se poderia escolher a amostra,
ou seja, o conjunto de elementos que possuem as caractersticas que queremos observar
(DHainaut, 1997).
1.1Finita - quando o nmero de unidades de observao pode ser contado e limitado;
1.2 Infinita - quando a quantidade de unidades de observao ilimitada
Amostra poro ou fraco da populao, retirada segundo algumas tcnicas especficas,
que mantm as mesmas caractersticas da populao.
Amostragem - a operao que consiste em tomar um certo nmero de elementos (ou seja,
uma amostra) no conjunto dos elementos que queremos observar ou tratar (populao).
Parmetro uma medida associada uma caracterstica populacional. Assim se P uma
populao, os principais parmetros so:
51
2
ii. A varincia de P, anotada por
Exemplo:
P={1,3, 5,6 } os parmetros acima seriam:
Para a populao
n
xi
= i=1
N
(i)
2=
(1+3+5+6) 15
= =3,75
4
4
xi2 2
N
(1+9+25+36)
(3,752)2
4
2 =
(ii)
17,7514,0625=3,6875 3,69.
= 2
(iv)
(v)
=
1
4
3,69
1,92
populao
52
E0
. Este
erro o valor mximo que o pesquisador admite ter na estimativa de uma caracterstica da
populao. razovel imaginar que, quanto menor o erro amostral tolervel escolhido, maior
ser o tamanho da amostra necessrio para obt-lo.
53
Isso fica mais claro ao ver a frmula para obteno da primeira estimativa do tamanho de
amostra:
n0 =
1
E20
Onde:
E0
n0
N n 0
N +n0
Exemplo: Obtenha o tamanho mnimo de uma amostra aleatria simples, admitindo com alto
grau de confiana um erro amostral mximo de 2%, supondo que a populao tenha 200
elementos.
Sendo
n0
apenas uma vez. Devemos dividir o 2% por 100 antes de substituir na frmula:
n0=
1
1
=2500
2
2
E 0 (0,02)
N n 0 200 2500
=185,185
N +n0 200+2500
Precisamos arredondar, sempre para cima, o tamanho mnimo da amostra. Ento, a amostra
dever ter pelo menos 186 elementos para garantir um erro amostral de 2%.
Determinao do tamanho de uma amostra com base na Estimativa da mdia
populacional
Em muitos casos possvel determinar o tamanho mnimo de uma amostra para estimar um
parmetro estatstico, como por exemplo, a mdia populacional
54
n=
Z /2
E0
Z /2=1,65 ( 1 )=90
Z /2=1,96 ( 1 )=95
Z /2=2,0 (1)=95.5
Z /2=2,57 (1)=99
Soluo
55
95
0,05 de confiana) e
Z / 2=1,96
Desejamos que a mdia amostral seja a menos de
E0=1000.
forma que
Supondo
obtemos:
n=
Z /2
E0
)(
1,96 6250 2
=150,0625
1000
150
interessados em estudar.
q
E0
56
E se p e q no forem conhecidos?
A Equao anterior exige que se substituam os valores populacionais p e q
amostrais
^p e
e , por valores
^p
e q^
necessrio para
determinar a proporo da populao atendida por uma Unidade de Sade, que pertence ao
municpio de Quelimane. No foi feito um levantamento prvio da proporo amostral e,
portanto, seu valor desconhecido. Ela quer ter 90% de confiana que sua o erro mximo de
estimativa seja de 5 (ou 0,05). Quantas pessoas necessitam ser entrevistadas?
Z /2 p q (1,65)2 0,25
n=
=270,6=271
2
2
E0
(0,05)
Devemos, portanto, obter uma amostra de 271 pessoas para determinar a proporo da
populao atendida na Unidade de Sade, que se origina do municpio de Quelimane.
maior ou igual a 5%
57
mdia populacional:
N 2 (Z / 2)2
n=
( N1)E 20+ 2 ( Z /2 )2
proporo populacional:
n=
N ^p q^ Z /2
( N1)E 20+ ^p q^ (Z /2 )2
3 , 5 ou
97 ,95 ou
directamente relacionada com a forma como a amostra foi recolhida, portanto, a primeira e a
ltima operao da tcnica da amostragem esto directamente relacionadas. S se pode
quantificar o erro se a amostra for recolhida de uma forma aleatria, isto , se a probabilidade
de todos os elementos da populao fazerem parte da amostra for conhecida e diferente de
zero.
58
59
Figure 1 Roda
A roda deve ser desenhada numa superfcie lisa e deve rodar em torno do centro. A
circunferncia deve ser dividida em 10 sectores iguais e numerados: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9.
Fixa-se um ponteiro, como o que est representado na figura. De cada vez que a roda girar,
ela parar e o ponteiro indicar um sector, por exemplo o 2. Cada sector (nmero) tem a
mesma oportunidade de sair e, como a roda no tem memria, o resultado obtido de cada vez
que a roda gira no vai afectar as tentativas seguintes. Podemos construir, assim, uma tabela
de dgitos aleatrios.
Mtodo 3:
Usar uma tabela de nmeros aleatrios (Consta em anexo)
A tabela de nmeros aleatrios apresenta agrupamento de cinco dgitos e tem as linhas
numeradas, com o objectivo de facilitar na sua consulta.
Propriedades
1. Qualquer par de dgitos na tabela tem a mesma oportunidade de ser (qualquer) um dos
100 possveis pares 00, 01, 02, 03, ..., 97, 98, 99.
2. Qualquer trio de dgitos na tabela tem a mesma oportunidade de ser um dos
1000 possveis trios 000, 001, 002, 003, ..., 997, 998, 999.
3. E assim por adiante, para grupos de 4 ou mais dgitos da tabela.
Exemplo: Se precisarmos de uma a.a.s. de tamanho 5, de um lote de 100 iogurtes para
verificarmos contaminaes bacterianas, devemos
a) Enumerar os 100 iogurtes de 00, 01, 02, ..., 99;
b) Escolher aleatoriamente uma linha na tabela de nmeros aleatrios (por exemplo, a
linha 143 temos 88565, 42628, 17797, 49376)
60
e 15
correspondncia na populao.
Observao: Se aparecerem grupos (neste caso, de dois dgitos) repetidos, devemos ignorlos. Mas se a coincidncia for movida pela repetio do elemento da populao e no do
nmero aleatrio, ento ser considerada mera coincidncia sendo que o elemento dever ser
seleccionado. Este procedimento deve ser repetido at atingir n elementos requeridos para a
amostra.
Amostragem aleatria com e sem reposio
A retirada de elementos de uma populao para comporem a amostra pode ser com ou
sem reposio. Se a populao for infinita ento as retiradas com e sem reposio sero
equivalentes, isto , o facto de recolocar o elemento retirado de volta na populao, no vai
afectar em nada a probabilidade de extraco do elemento seguinte.
Se, no entanto, a populao for finita ser necessrio fazer uma distino entre os dois
procedimentos, pois a extraco com reposio as diversas retiradas sero independentes,
mas no processo sem reposio haver dependncia entre as retiradas, isto , o facto de no
colocar o elemento retirado afecta a probabilidade do elemento seguinte ser retirado.
A amostragem sem reposio mais eficiente e reduz a variabilidade uma vez que no
possvel um elemento mais do que uma vez. Assim se
populao e
nN
representa o tamanho da
61
Com reposio
k =N n ; onde k
P=
1
n
M
Sem reposio
k =CnN
N!
n! (Nn) !
P=
1
CnM
P=
1
42
Sem reposio
Como
Exemplo : Quatro funcionrios de uma empresa (Alberto, Marcos, Catarina, Telma, Nelson e
Judite) pretendem tirar frias no ms de Junho, mas apenas dois deles podem ir nesse
62
1 1
1
=
M
6
15
Cn C2
N
N
n
susceptvel de arredondamento;
Sorteia-se usando a Tabela de Nmeros Aleatrios de um valor compreendido entre
k ;este ser o 1
d) Partindo de
63
an=a 1+(n1)k
Exemplo Suponha uma rua com 300 casas, das quais desejamos obter uma amostra
formada por 30 casas para uma pesquisa de opinio
3 , a amostra seria:
3 casa,
13
300
=10
30
casa, 23
casa, 33 casa,
43
casa, e
ni
qi =
ni
n ;
N
64
n
q i=n
i=1
54
10
so meninos e
meninas. Qual o
Sexo
Populao
10
Amostra
Masculino
54
5,4
Feminino
26
2,6
Total
80
Exerccio 1: uma franquia de fast food com foco em sanduches, apresenta lojas em todo o
mundo. Para fazer uma pesquisa de satisfao dos clientes, dividiu-se a populao de lojas
em trs estratos (pases desenvolvidos, pases em desenvolvimento e pases do grupo
asitico). Pretende-se trabalhar com uma amostra de tamanho
n=200 . Com as
qi =
Pases
i =1
de lojas)
Pases desenvolvidos
em
n1
700
q1 =
700
200 101
1390
n2
420
q 2=
420
200 60
1390
270
q3 =
270
200 39
1390
desenvolvimento
Pases do grupo Asitico
n ;
ni
n3
n
N ni=1390
i=1
n q i=200
i=1
65
66
Amostragens no probabilsticas
So amostragens em que h uma escolha deliberada dos elementos amostrais. No
possvel generalizar os resultados das pesquisas para a populao, pois as amostras noprobabilsticas no garantem a representatividade da populao.
Amostragem Acidental
Trata-se de uma amostra formada por aqueles elementos que vo aparecendo e que
so possveis de se obter at completar o tamanho da amostra. Geralmente este tipo de
amostragem utilizado em pesquisa de opinio, em que os entrevistados so acidentalmente
escolhidos.
Exemplo: pesquisas de opinio em praas pblicas, ruas movimentadas de grandes cidades.
67
Amostragem Intencional
So amostragens realizadas de acordo com determinado critrio. Escolhe-se
intencionalmente um grupo de elementos que iro compor a amostra e intencionalmente o
investigador coleta a opinio desses elementos.
Exemplo: Numa pesquisa sobre a preferncia por determinado cosmtico, o pesquisador se
dirige a um grande salo de beleza e entrevista as pessoas que ali s encontram.
Amostragem por Quotas
Este o mtodo de amostragem mais comumente utilizado em pesquisas de
mercado e em prvias eleitorais. Ela abrange trs fases:
1 - Classificao da populao em termos de propriedades que se sabe ou presume serem
relevantes para a caracterstica a ser estudada;
2 - Determinao da proporo da populao para cada caracterstica, com base na
constituio conhecida, presumida ou estimada da populao;
3 - Fixao de quotas para cada entrevistador, a quem caber a responsabilidade de
selecionar os entrevistados, de modo que a amostra total observada ou entrevistada contenha
a proporo de cada classe, tal como determinada na 2 fase.
Exemplo: Numa pesquisa sobre o trabalho da mulher na actualidade. Provavelmente se
ter interesse em considerar: a diviso, cidade e campo, a habitao, moradia, idade dos
filhos, renda mdia, as faixas etrias, etc.
A primeira tarefa descobrir as propores dessas caractersticas na populao. Imagina-se
que haja 47% de homens e 53% de mulheres na populao. Logo uma amostra de 50 pessoas
dever ter 23 homens e 27 mulheres. Ento o pesquisador receber uma quota para entrevistar
27 mulheres. A considerao de vrias categorias exigir uma composio amostral que
atenda ao n determinado e s propores populacionais estipuladas.
68
Amostragem Snowball
Consiste em localizar indivduos com caractersticas desejadas ou prximas das
requeridas no estudo que se pretende fazer. A amostra vai aumentando na medida em que um
elemento da amostra da caracterstica desejada encontre mais um com as mesmas
caractersticas. Geralmente usado este tipo de amostragem quando se pretende estudar uma
caracterstica especfica, com a certeza de difcil localizao dos possveis constituintes da
amostra.
A maior desvantagem reside no facto de que os amigos podem se indicar, resultando numa
amostra em que todos elementos recolhidos tenham um pensamento ou respostas similares.
Exemplo: Esta amostragem mais usada pela polcia quando pretende localizar mais
companheiros de uma quadrilha de assaltantes depois de capturar o primeiro.
Amostragem por Convenincia
uma amostragem de uma pura coincidncia, porque os elementos que possam ser
constituintes da amostra se localizam na zona onde o inqurito est a decorrer passando a
fazer parte dela por convenincia. Esta uma das amostragens que resulta num grande
enviesamento (viciao). muito importante ser usada quando pretendemos captar ideias
gerais ou identificar aspectos crticos. Neste caso deve-se ter o cuidado de no se assumir
qualquer tipo de objectividade cientfica.
Usualmente denominada de amostragem de pr teste do questionrio.
69
16. Concluso
Alm da Estatstica Descritiva h a Estatstica Indutiva ou Estatstica Inferencial que
consiste, fundamentalmente, das tcnicas de anlise e interpretao dos dados. A partir de um
conjunto restrito de dados, chamado de amostra, organizado e descrito pela Estatstica
Descritiva, a Estatstica Indutiva procura fazer inferncias ou, em outras palavras, tirar
concluses sobre a natureza desses dados e estender essas concluses a conjuntos maiores de
dados, chamados de populaes.
evidente que, para que a Estatstica Indutiva possa deduzir concluses vlidas, necessrio
que se tomem alguns cuidados para a escolha da amostra a ser utilizada.
Esses cuidados, mais propriamente chamados de critrios, so estabelecidos por uma tcnica
chamada de amostragem.
Contudo, para permitir que a Estatstica Indutiva proporcione concluses vlidas no basta
utilizar as tcnicas de organizao e descrio dos dados da Estatstica Descritiva e as
tcnicas correctas de amostragem. Fica ainda faltando uma ltima ferramenta que o clculo
de probabilidades. O clculo de probabilidades um conjunto de tcnicas matemticas que
visa determinar as chances de ocorrncia de eventos regidos pelas leis do acaso.
70
71
[NET74] NETO, Pedro Luiz de Oliveira Costa. Estatstica. So Paulo, Edgard Blcher, 1977.
[STE81] STEVENSON, William J. Estatstica Aplicada Administrao. So Paulo. Editora
Harbra, 1981.
[WON85] WONNACOTT, Ronald J., WONNACOTT, Thomas. Fundamentos de Estatstica.
Rio de Janeiro. Livros Tcnicos e Cientficos Editora S. A., 1985.
ANEXOS