Escolar Documentos
Profissional Documentos
Cultura Documentos
UNIVERSIDADE DE FRANCA
CURSO: ENGENHARIA MECNICA
9 Introduo
A Estatstica se interessa por concluses e predies originadas de resultados eventuais que
ocorrem em experimentos ou investigaes cuidadosamente planejados.
Esses resultados eventuais constituem um subconjunto ou amostra de medidas ou observaes
de um conjunto maior de valores, chamado populao. No entanto, nem todas as amostras prestam para
validar generalizaes a respeito de populaes, das quais foram obtidas.
Muitos dos mtodos de inferncia so baseados em amostragens aleatrias simples (AAS) com
reposio, ou seja, permitido que uma unidade possa ser sorteada mais de uma vez. Na AAS sem
reposio, a unidade sorteada removida da populao.
Amostrar sem reposio mais adequado, do ponto de vista da quantidade de informao contida
na amostra. Porm, a amostragem com reposio conduz a um tratamento terico mais simples, pois ela
implica que se tem independncia entre as unidades selecionadas, o que facilita o desenvolvimento das
propriedades dos estimadores que sero considerados nas aulas seguintes.
x2 = 161,
x3 = 168,
x4 = 173,
x5 = 173
Se formos gerar uma outra amostra de cinco alturas, poderemos obter valores diferentes da
amostra acima. Observe que o primeiro elemento a ser observado (que podemos indicar por X1) pode ser
qualquer valor da populao N (167; 25). Podemos, ento, concluir que X1 ~ N (167; 25). Como a gerao
do segundo nmero aleatrio feita independentemente do primeiro, temos que a v.a. X2 (valor observado
na segunda extrao), tambm segue uma distribuio N (167; 25), e assim sucessivamente.
Formalizando: uma amostra aleatria simples com reposio de tamanho n, de uma varivel aleatria
X com uma dada distribuio, o conjunto de n variveis aleatrias independentes X1, X2, ..., Xn, cada
uma com a mesma distribuio de X.
2
n
Mdia da amostra: x = 1 x
i
n i=1
n
Varincia da amostra: s 2 = 1
(x i x )2
n 1 i=1
Proporo da amostra: p = x , onde:
n
(9.1)
(9.2)
(9.3)
Parmetro
Mdia
Varincia
Nmero de elementos
Proporo
Tabela 9.2 Amostra de 30 gerentes, com os salrios anuais e participao em treinamento gerencial
Elemento da amostra
x1
49.094,30
Sim
x2
53.263,90
Sim
x3
49.643,50
Sim
x4
49.894,90
Sim
x5
47.621,60
No
x6
55.924,00
Sim
x7
49.092,30
Sim
x8
51.404,40
Sim
x9
50.957,70
Sim
x10
55.109,70
Sim
x11
45.922,60
Sim
x12
57.268,40
No
x13
55.688,80
Sim
x14
51.564,70
No
x15
56.188,20
No
x16
51.766,00
Sim
x17
52.541,30
No
x18
44.980,00
Sim
x19
51.932,60
Sim
x20
52.973,00
Sim
x21
45.120,90
Sim
x22
51.753,00
Sim
x23
54.391,80
No
x24
50.164,20
No
x25
52.973,60
No
x26
50.241,30
No
x27
52.793,90
No
x28
50.979,40
Sim
x29
55.860,90
Sim
x30
57.309,10
No
Tabela 9.3 Amostra de 30 gerentes, com os salrios anuais e participao em treinamento gerencial
Nmero da amostra Mdia da amostra ( x ) Desvio padro da amostra (s) Proporo da amostra ( p )
1
51.814,00
3.347,72
0,63
52.669,70
4.239,07
0,70
51.780,30
4.433,43
0,67
51.587,90
3.985,32
0,53
500
51.752,00
3.857,82
0,50
Frequncia absoluta ni
Frequncia relativa fi
49.500,00 | 49.999,99
0,004
50.000,00 | 50.499,99
16
0,032
50.500,00 | 50.999,99
52
0,104
51.000,00 | 51.499,99
101
0,202
51.500,00 | 51.999,99
133
0,266
52.000,00 | 52.499,99
110
0,220
52.500,00 | 52.999,99
54
0,108
53.000,00 | 53.499,99
26
0,052
53.500,00 | 53.999,99
0,012
500
1,000
Total
Frequncia
relativa
0,30
0,25
0,20
0,15
0,10
0,05
50.000
51.000
52.000
53.000
54.000
Figura 9.1 Histograma da distribuio de frequncia relativa de x , a partir de 500 amostras de 30 gerentes
O histograma dos 500 valores de x nos fornece uma aproximao da forma da distribuio
amostral. Ela se assemelha forma de sino de uma distribuio normal. Notamos uma maior concentrao
dos valores de x e da mdia dos 500 valores de x em torno da mdia da populao = 51.800,00. As
propriedades desta distribuio amostral sero detalhadas adiante.
As figuras 9.2 e 9.3 apresentam os histogramas das distribuies de frequncia dos 500 valores
do desvio padro da amostra e da proporo da amostra, respectivamente.
Frequncia
relativa
0,30
0,25
0,20
0,15
0,10
0,05
Figura 9.2 Histograma da distribuio de frequncia relativa de s, a partir de 500 amostras de 30 gerentes
Frequncia
relativa
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,32
0,40
0,48
0,56
0,64
0,72
0,80
0,88
Figura 9.3 Histograma da distribuio de frequncia relativa de p , a partir de 500 amostras de 30 gerentes
Como no caso de x , tanto s quanto p so variveis aleatrias que fornecem descries
numricas do resultado de uma AAS. Portanto, s e p tm uma mdia ou valor esperado, uma varincia e
uma distribuio amostral de probabilidade. Os histogramas das figuras 9.2 e 9.3 mostram uma
aproximao da forma dessas distribuies amostrais.
Formalizando: toda estatstica, sendo uma funo de uma amostra aleatria X1, X2, ..., Xn, tambm
uma v.a. e tem uma distribuio, pois, em relao a vrias amostras, a estatstica muda de valor de
acordo com a distribuio determinada a partir daquela que controla a amostra aleatria. Com isso, o
comportamento da estatstica pode ser descrito por alguma distribuio de probabilidade. Assim, cada
estatstica uma v.a. e sua distribuio de probabilidade chamada de distribuio amostral da
estatstica.
Populao
Amostras
h1
1
Populao da estatstica H
h1, h2,..., hk
h2
2
.
.
.
hk
k
= mdia da populao.
(9.4)
Ou seja, com a AAS, o valor esperado ou mdia para x igual mdia da populao da qual a
amostra foi retirada.
No exemplo dos salrios dos gerentes:
Como: = 51.800 E(x ) = 51.800
(9.5)
2. Se a populao infinita: =
x
n
A diferena entre as equaes 9.5 e 9.6 a existncia do fator
(9.6)
N n para populao finita. Este
N 1
fator chamado de fator de correo da populao finita. Em alguns casos prticos, apesar da populao
ser finita, o tamanho da amostra considerado pequeno em relao ao tamanho da populao (n << N).
Nestes casos, a populao pode ser considerada infinita. Assim, usa-se a equao 9.6 nas seguintes
situaes:
1. quando a populao infinita;
2. quando a populao finita e n 0,05 .
N
No exemplo dos salrios dos gerentes:
Como: = 4.000 e n = 30 = 0,012 0,05 , ento: = = 4.000 = 730,30 .
x
N 2.500
n
30
Finalmente, observando as equaes 9.5 e 9.6, conforme o tamanho da amostra n aumenta, o
desvio padro x tende a diminuir. Isto significa que quando n torna-se grande, pode-se esperar valores de
x mais prximos de , a quantidade que se pretende estimar. Em funo disso, o desvio padro x
chamado de erro padro da mdia. Ele til para determinar a distncia que a mdia da amostra pode
estar da mdia da populao, conforme veremos adiante.
N ,
n
n
Para o segundo caso, contamos com um dos mais importantes teoremas em estatstica o
Teorema do Limite Central (TLC). O TLC pode ser anunciado da seguinte forma:
palavras: z =
aproximadamente uma N (0,1).
/ n
A figura 9.5 ilustra graficamente o TLC. As populaes I, II e III possuem distribuies diversas.
Para n = 2, nenhuma das trs distribuies amostrais se aproxima de uma distribuio normal.
Assim, voltando ao exemplo dos salrios dos gerentes, j havamos determinado que E(x) = 51.800
e x = 730,30 . Como a AAS de 30 gerentes, pelo TLC, a distribuio amostral de x aproximadamente
normal (figura 9.6).
x = 730,30
51.800
Figura 9.6 Distribuio amostral de x , para o salrio mdio anual de uma AAS de 30 gerentes
x = 730,30
rea = 0,25175
51.300
rea = 0,25175
51.800
52.300
Figura 9.7 Probabilidade da mdia da amostra estar dentro de US$500,00 da mdia da populao
Como a distribuio normal, com mdia de 51.800 e desvio padro de 730,30, podemos usar a
tabela da distribuio normal padro para encontrar a probabilidade desejada. Para x = 51.300, temos:
51.300 51.800
z=
= 0,68
730,30
Na tabela da distribuio normal padro:
Para z = 0,68 rea = 0,25175. Portanto, a probabilidade do valor de x estar entre 51.300 e
52.300 de 0,25175 + 0,25175 (por simetria) = 0,50350.
De outro modo: existe uma probabilidade de 1 0,50350 = 0,49650 de que x ficar fora da mdia
da populao por mais do que US$500,00.
10
Para melhorar a probabilidade de 0,50350, pode-se tomar uma amostra de tamanho maior. Esta
relao ser descrita a seguir.
n = 100
x = 400
n = 30
x = 730,30
51800
Figura 9.8 Comparao das distribuies amostrais de x para AASs de n = 30 e n = 100 gerentes
Com a definio da nova distribuio amostral de x com n = 100, podemos recalcular o valor de z
para x = 51.800. Assim:
51.300 51.800
z=
= 1,25
400
Na tabela da distribuio normal padro:
Para z = 1,25 rea = 0,39435. Portanto, a nova probabilidade do valor de x estar entre 51.300
e 52.300 de 0,39435 + 0,39435 (por simetria) = 0,78870.
Assim, aumentando o tamanho da amostra de 30 para 100 gerentes, aumentamos a probabilidade
de obter uma mdia de amostra dentro de US$500,00 da mdia da populao de 0,5035 para 0,7887.
11
(9.7)
p = proporo da populao.
Ou seja, com a AAS, o valor esperado ou mdia para p igual proporo p da populao da
qual a amostra foi retirada.
No exemplo da proporo de gerentes que participaram do treinamento gerencial:
Como: p = 0,60 E(p) = 0,60
Ento:
1. Se a populao finita: = N n p (1 p)
p
N 1
n
2. Se a populao infinita: = p (1 p)
p
n
A diferena entre as equaes 9.8 e 9.9 a existncia do fator
(9.8)
(9.9)
N n para populao finita.
N 1
Como no caso da mdia amostral x , este fator chamado de fator de correo da populao finita. Em
alguns casos prticos, apesar da populao ser finita, o tamanho da amostra considerado pequeno em
relao ao tamanho da populao (n << N). Nestes casos, a populao pode ser considerada infinita.
Assim, usa-se a equao 9.9 nas seguintes situaes:
1. quando a populao infinita;
2. quando a populao finita e n 0,05 .
N
No exemplo da proporo de gerentes que participaram do treinamento gerencial:
Como: n = 30 = 0,012 0,05 , ento: = p (1 p) = 0,60 (1 0,60) = 0,0894.
p
N 2.500
n
30
Finalmente, observando as equaes 9.8 e 9.9, conforme o tamanho da amostra n aumenta, o
desvio padro p tende a diminuir. Isto significa que quando n torna-se grande, pode-se esperar valores de
p mais prximos de p, a quantidade que se pretende estimar. Em funo disso, o desvio padro p
chamado de erro padro da proporo. Ele til para determinar a distncia que a proporo da amostra
pode estar da proporo da populao, conforme veremos adiante.
12
p p
p (1 p ) n
p (1 p ) . Em outras palavras:
n
p = 0,0894
0,60
Figura 9.9 Distribuio amostral de p , para a proporo de participao em treinamento gerencial de uma
AAS de 30 gerentes
p = 0,0894
rea = 0,21226
rea = 0,21226
0,55
0,60
0,65
Figura 9.10 Probabilidade da proporo da amostra estar dentro de 0,05 da proporo da populao
13
Como a distribuio normal, com mdia de 0,60 e desvio padro de 0,0894, podemos usar a
tabela da distribuio normal padro para encontrar a probabilidade desejada. Para p = 0,55, temos:
0,55 0,60
z=
= 0,56
0,0894
Na tabela da distribuio normal padro:
Para z = 0,56 rea = 0,21226. Portanto, a probabilidade do valor de p estar entre 0,55 e 0,65
de 0,21226 + 0,21226 (por simetria) = 0,42452.
De outro modo: existe uma probabilidade de 1 0,42452 = 0,57548 de que p ficar fora da mdia
da populao por mais do que 0,05.
Para melhorar a probabilidade de 0,42452, pode-se tomar uma amostra de tamanho maior.
Suponha, ento, que, ao invs de selecionarmos uma AAS de 30 gerentes, ns tenhamos selecionado uma
AAS de 100 gerentes. Vamos verificar de que forma o aumento no tamanho da amostra (de 30 para 100)
afeta a anlise realizada anteriormente.
Primeiramente, temos que E(p) = p = 0,60 , independentemente do tamanho da amostra.
J o erro padro da proporo afetado pelo tamanho da amostra. O novo valor dado por:
p (1 p)
0,60 (1 0,60)
p =
=
= 0,0490 , ou seja, p diminuiu de 0,0894 para 0,0490.
n
10
Com a definio da nova distribuio amostral de p com n = 100, podemos recalcular o valor de z
para p = 0,55. Assim:
0,55 0,60
z=
= 1,02
0,0490
Na tabela da distribuio normal padro:
Para z = 1,02 rea = 0,34614. Portanto, a nova probabilidade do valor de p estar entre 0,55 e
0,65 de 0, 34614 + 0, 34614 (por simetria) = 0,69228.
Assim, aumentando o tamanho da amostra de 30 para 100 gerentes, aumentamos a probabilidade
de obter uma proporo de amostra dentro de 0,05 da proporo da populao de 0,42452 para 0,69228.