Escolar Documentos
Profissional Documentos
Cultura Documentos
INDUTIVA
PROFA. MS DANIELA BRASSOLATTI
Em princpio, a melhor forma de obter uma amostra aleatria de tamanho n ter uma lista de todos os
membros da populao, dar a todos um nmero digamos de 1 a N, e ento escolher aleatoriamente n
nmeros de 1 a N para definir a amostra. claro que na prtica isto no vivel, especialmente quando
a populao infinita.
Na maioria dos casos difcil obter amostras aleatrias. Considere o seguinte diagrama que mostra a
`populao' de crculos. Pense neles como se fossem grnulos de tamanhos diferentes. O dimetro
mdio destes crculos mm.
Suponha que selecionemos uma amostra de 5 destes crculos jogando um lpis sobre o papel
repetidamente at que tenhamos atingido 5 crculos. Qual o dimetro mdio de nossos 5
crculos? O valor est perto de mm?
No exemplo acima, o esquema amostral causou um vcio. Um vcio similar seria obtido por
exemplo na amostragem de um particular tipo de animal - pode ser que os animais que se
consegue capturar e medir so aqueles que no podem correr to rpido, ou ao usar uma
armadinha, voc pode amostrar somente os animais mais famintos, etc.
Sempre que uma amostra obtida, o processo de amostragem deve estar bem documentado
de tal forma que quais inferncias retiradas acerca da populao pode avaliadas luz da
estratgia amostral.
Geralmente as pesquisas so realizadas atravs de estudos dos elementos que compem uma amostra
extrada da populao que se pretende analisar.
4
informaes de todos os elementos da populao. Limitaes de tempo, custo e vantagens do uso
de tcnicas de inferncia justifica o uso de amostras. Torna-se claro que a representatividade da
amostra depender do seu tamanho e da forma como coletada visando obter uma amostra
significativa que de fato represente toda a populao.
Se uma populao for muito grande , o pesquisador poder ter um trabalho astronmico para
estud-la e em alguns casos os resultados sero sempre falhos. s pensar por exemplo no nmero
de nascimentos e mortes dirios, isto , na entrada e sada de informaes, para avaliar a
dificuldade e a impreciso do trabalho.
A anlise de dados o fornecimento de respostas claras a questes especficas sobre um cenrio
amplo demais para que seja completamente detalhado. Ser que os consumidores brasileiros
esto desejando gastar menos?, Que anncio de TV vender mais pasta de dente?, Se os
universitrios experimentarem pepsi e coca sem que haja identificao da bebida, ser que a
maioria vai preferir a primeira ?
Populao pequena
Populao grande
H necessidades de rapidez
Reduo de custo
5
1) Riscar um por um e ao cabo de algum tempo concluir que a falha da ordem de 2% por
exemplo, o que significa queimar todo estoque.
2) Colher uma amostra com critrio, riscar um por um da amostra e ao cabo de algum
tempo concluir que a falha por exemplo da ordem de 1,8% ou 2,2%
A aparente diferena de 0,2% para mais ou para menos fica compensada pelo fato de que o
estoque de fsforos foi preservado bem como o bolso.
REPRESENTATIVIDADE: Uma amostra para ser boa tem que ser representativa, ou seja, deve conter
em proporo tudo o que a populao possui.
IMPARCIALIDADE: Todos os elementos da populao devem ter igual oportunidade de fazer parte
da amostra.
Mtodos Probabilsticos: Cada elemento da populao tem a mesma chance de ser selecionado. Tratase do mtodo que garante cientificamente a aplicao de tcnicas estatsticas. Somente com base em
amostragens probabilsticas que se podem realizar inferncias ou indues sobre a populao a partir
do conhecimento de uma amostra.Existem alguns tipos de amostragens probabilsticas que garantem a
imparcialidade acima discutida:
6
Amostragem Aleatria Simples: Atribui-se a cada elemento da populao um
nmero distinto. Efetuam-se sucessivos sorteios at completar o tamanho da amostra
n. Para realizar o sorteio, utilizar a tbua de nmeros aleatrios (anexo) que consistem
em tabelas que apresentam dgitos de 0 9 distribudos aleatoriamente.
Amostragem Estratificada:No caso da populao em que se podem distinguir subpopulaes mais ou menos homogneas denominadas estratos. Aps a determinao
dos estratos, seleciona-se uma amostra aleatria simples de cada estrato.As varveis
de estratificao mais comuns so: classe social, idade, sexo, profisso.
7
Mtodos No - Probabilsticos: So amostragens em que h uma escolha deliberada dos elementos da
amostra. No possvel generalizar os resultados da pesquisa para a populao, pois as amostras noprobabilsticas no garantem a representatividade da populao.
DEFINIO:
Quando a varivel aleatria pode assumir qualquer valor dentro do conjunto dos nmeros
Reais, denominada como varivel aleatria contnua.
A distribuio de uma varivel aleatria contnua dada por uma curva contnua e no por
pontos discretos. Essa curva denominada funo distribuio de probabilidade (f.d.p)
P(X)
P(X)
0.1
0.2
0.4
0.2
0.1
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
1
9
Como a soma das probabilidades igual a 1 temos que a soma das reas igual 1. Para calcularmos
P(1 X 3) basta calcular a soma das reas A1+A2+A3 = 0,1 + 0,2 + 0,4 = 0,7
Se representarmos a distribuio de probabilidade acima por uma curva , teremos X varivel aleatria
contnua.
DISTRIBUIO NORMAL:
Astrnomos e outros cientistas observaram que mensuraes repetidas de uma mesma quantidade
tendiam a variar e quando se coletava grande nmero de mensuraes dispondo-as numa distribuio
de freqncias , elas se apresentavam com a forma:
Constatou-se que a distribuio podia ser bem aproximada por uma distribuio matemtica como a
figura suavizada acima, chamada Distribuio Gaussiana ou Distribuio Normal (1777 1855).
Pelo fato de tantos fenmenos terem essa caracterstica , pesquisadores de diferentes campos tem feito
uso extensivo da curva Normal, aplicando-a aos dados que coletam e analisam.
Um fenmeno Normal quando os valores da varivel que o exprimem encontram abrigo sob a curva
Normal.
Exemplos:
Altura: A maioria dos brasileiros se encontram em torno de um mdia de 152 183 cm,
poucos apresentam muito mais ou muito menos que isso.No h pessoa por baixa ou alta
que no se abriga sob a curva Normal.
QI: A maioria se encontra em torno de 90 110. Poucos apresentam mais que 140 ou
menos que 60.
CARACTERSTICAS DA NORMAL:
10
Se assemelha a um sino
Suave, unimodal e simtrica em relao mdia
f(x) tende a zero quando x tende ao infinito positivo ou negativo
completamente especificada pelos parmetros mdia e desvio-padro
Existe uma nica distribuio Normal para combinao de cada mdia e desvio-padro
E(X) = e V(X) =
A curva simtrica ao redor da mdia e a rea total sob a curva definida como 100%, logo
cada metade da curva tem 50% da rea total
f (x)
1
2
1 x
e 2
Felizmente, voc no tem que memorizar esta equao. O importante que voc entenda como a curva
afetada pelos valores numricos de e .
Exemplo:
-
11
Se mdia = 40 e desvio-padro maior que 10 (15 por exemplo) , a distribuio se alonga na
Mdia 40 e DP 10
50
40
30
20
10
0
Mdia 40 e DP 15
40
40
30
30
20
20
10
10
20
30
40
50
20
60
30
40
50
60
10
20
30
40
50
60
70
60
50
40
30
20
10
0
10
20
30
40
50
60
70
A deciso de que uma varivel tem distribuio Normal envolve a opinio pessoal. Voc deve se
perguntar se fosse desenhado a distribuio de probabilidades de uma varivel analisada, ela teria
forma de sino?
Exemplo : A vida mdia de uma bateria de determinada marca de 20 horas com desvio-padro de 0,5
horas. Quero calcular a probabilidade da bateria durar menos do que 21 horas.
12
Chamamos de X a vida da bateria e entendemos X como uma varivel aleatria com distribuio Normal
pois algumas baterias iro durar mais do que 20 horas, outras menos do que 20 horas. Algumas poucas
iro durar muito mais ou muito menos do que a mdia.
PROBLEMA: Como vimos a forma da distribuio pode mudar de acordo com o valor de mdia e desviopadro obtidos e ento sero necessrias tabelas para todas as combinaes de mdia e desvio-padro,
o que cobre um enorme intervalo de X e para o clculo da integral, podemos cair em integrais muito
complicadas.
SOLUO: Distribuio Normal Padronizada: Consiste em fornecer uma tabela para uma nica
combinao de mdia e desvio-padro, isto , para mdia zero e desvio-padro 1, fazendo com que a
varivel aleatria X tenha que sofrer uma converso de X para Z, onde
X mdia
desvio padro
como transformar minutos em horas mas no caso traduzimos o valor em quantidades de desviospadro da mdia.
Exemplos:
1) Se x = 6, mdia = 3 e desvio-padro = 2
Fazendo ( X mdia) = 6 est 3 unidades acima da mdia
Dividindo essa distncia pelo DP = (3/2) = 1.5 o que significa que 6 est 1,5 desvios-padro
acima da mdia
13
10
15
20
25
30
-10
-5
P(X 21)
10
P(Z 2)
Transformao
O desenho de Z tem a mesma forma e rea que o desenho de X pois uma transformao de variveis
ou mudana de valores do eixo X para o eixo Z. As infinitas distribuies Normais reduzem-se apenas
distribuio Normal com mdia zero e desvio-padro 1 .
Para Z vrias Bibliografias disponibilizam uma tabela que nos d a probabilidade desejada, ou seja, o
valor da rea ou a porcentagem de lmpadas que duraro menos que 21 horas (para o exemplo citado).
Em anexo temos a tabela Z que fornece P(Z a) , que indica a probabilidade de Z ser menor ou igual a
determinado valor a.
P(Z a)
1 P(Z a)
P(Z -a)
1-P(Z a)
P(Z -a)
P(Z a)
P(a Z b)
P(Z b) P(Z a)
Para o exemplo:
a)
b) P(X 21)
c)
P(X 19)
d) P(19 X 20,85)
d) P( X 22)
Outros Exemplos
14
1) Os depsitos mensais na caderneta de poupana tem distribuio Normal com mdia 500 reais
e desvio-padro 150 reais. Se um depositante realiza um depsito, pede-se calcular a
probabilidade que esse depsito seja:
a)
2) Um fabricante de baterias sabe por longa experincia que as baterias de sua fabricao tem
vida mdia de 600 dias e desvio-padro de 100 dias sendo que a durao tem
aproximadamente distribuio Normal. Oferece uma garantia de 312 dias, isto , troca as
baterias que apresentarem falha nesse perodo. Fabrica 10.000 baterias mensalmente.
a)
b) Qual deve ser a garantia para que a porcentagem de baterias substitudas seja inferior
a 0,1%?
3) Uma fbrica de carros sabe que os motores de sua fabricao tem durao Normal com mdia
150.000 Km e devio-padro de 5.000 Km. Qual a probabilidade de que um carro, escolhido ao
acaso, dos fabricados por essa firma, tenha um motor que dure:
a)
Se a fbrica substitui o motor que apresenta durao inferior garantia, qual deve ser
esta garantia para que a porcentagem de motores substitudos seja inferior 0,2%?
4) No ano passado o vendedor Jota de uma grande empresa de alimentos conseguiu vender $
1.350.000,00. O vendedor afirma que com essa venda, ele est entre os 5% dos vendedores da
empresa que mais venderam no ano passado. Se as vendas realizadas por todos os vendedores
tem distribuio Normal com mdia $ 1.250.000,00 e desvio-padro $ 100.000,00, pede-se
verificar se a afirmao do vendedor correta.
15
TABELA NORMAL PADRO P(Z a)
Z
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,00
0.5000
0.5040
0.5080
0.5120
0.5160
0.5199
0.5239
0.5279
0.5319
0.5359
0,10
0.5398
0.5438
0.5478
0.5517
0.5557
0.5596
0.5636
0.5675
0.5714
0.5753
0,20
0.5793
0.5832
0.5871
0.5910
0.5948
0.5987
0.6026
0.6064
0.6103
0.6141
0,30
0.6179
0.6217
0.6255
0.6293
0.6331
0.6368
0.6406
0.6443
0.6480
0.6517
0,40
0.6554
0.6591
0.6628
0.6664
0.6700
0.6736
0.6772
0.6808
0.6844
0.6879
0,50
0.6915
0.6950
0.6985
0.7019
0.7054
0.7088
0.7123
0.7157
0.7190
0.7224
0,60
0.7257
0.7291
0.7324
0.7357
0.7389
0.7422
0.7454
0.7486
0.7517
0.7549
0,70
0.7580
0.7611
0.7642
0.7673
0.7704
0.7734
0.7764
0.7794
0.7823
0.7852
0,80
0.7881
0.7910
0.7939
0.7967
0.7995
0.8023
0.8051
0.8078
0.8106
0.8133
0,90
0.8159
0.8186
0.8212
0.8238
0.8264
0.8289
0.8315
0.8340
0.8365
0.8389
1,00
0.8413
0.8438
0.8461
0.8485
0.8508
0.8531
0.8554
0.8577
0.8599
0.8621
1,10
0.8643
0.8665
0.8686
0.8708
0.8729
0.8749
0.8770
0.8790
0.8810
0.8830
1,20
0.8849
0.8869
0.8888
0.8907
0.8925
0.8944
0.8962
0.8980
0.8997
0.9015
1,30
0.9032
0.9049
0.9066
0.9082
0.9099
0.9115
0.9131
0.9147
0.9162
0.9177
1,40
0.9192
0.9207
0.9222
0.9236
0.9251
0.9265
0.9279
0.9292
0.9306
0.9319
1,50
0.9332
0.9345
0.9357
0.9370
0.9382
0.9394
0.9406
0.9418
0.9429
0.9441
1,60
0.9452
0.9463
0.9474
0.9484
0.9495
0.9505
0.9515
0.9525
0.9535
0.9545
1,70
0.9554
0.9564
0.9573
0.9582
0.9591
0.9599
0.9608
0.9616
0.9625
0.9633
1,80
0.9641
0.9649
0.9656
0.9664
0.9671
0.9678
0.9686
0.9693
0.9699
0.9706
1,90
0.9713
0.9719
0.9726
0.9732
0.9738
0.9744
0.9750
0.9756
0.9761
0.9767
2,00
0.9772
0.9778
0.9783
0.9788
0.9793
0.9798
0.9803
0.9808
0.9812
0.9817
2,10
0.9821
0.9826
0.9830
0.9834
0.9838
0.9842
0.9846
0.9850
0.9854
0.9857
2,20
0.9861
0.9864
0.9868
0.9871
0.9875
0.9878
0.9881
0.9884
0.9887
0.9890
2,30
0.9893
0.9896
0.9898
0.9901
0.9904
0.9906
0.9909
0.9911
0.9913
0.9916
2,40
0.9918
0.9920
0.9922
0.9925
0.9927
0.9929
0.9931
0.9932
0.9934
0.9936
2,50
0.9938
0.9940
0.9941
0.9943
0.9945
0.9946
0.9948
0.9949
0.9951
0.9952
2,60
0.9953
0.9955
0.9956
0.9957
0.9959
0.9960
0.9961
0.9962
0.9963
0.9964
2,70
0.9965
0.9966
0.9967
0.9968
0.9969
0.9970
0.9971
0.9972
0.9973
0.9974
2,80
0.9974
0.9975
0.9976
0.9977
0.9977
0.9978
0.9979
0.9979
0.9980
0.9981
2,90
0.9981
0.9982
0.9982
0.9983
0.9984
0.9984
0.9985
0.9985
0.9986
0.9986
3,00
0.9987
0.9987
0.9987
0.9988
0.9988
0.9989
0.9989
0.9989
0.9990
0.9990
3,10
0.9990
0.9991
0.9991
0.9991
0.9992
0.9992
0.9992
0.9992
0.9993
0.9993
3,20
0.9993
0.9993
0.9994
0.9994
0.9994
0.9994
0.9994
0.9995
0.9995
0.9995
3,30
0.9995
0.9995
0.9995
0.9996
0.9996
0.9996
0.9996
0.9996
0.9996
0.9997
3,40
0.9997
0.9997
0.9997
0.9997
0.9997
0.9997
0.9997
0.9997
0.9997
0.9998
3,50
0.9998
0.9998
0.9998
0.9998
0.9998
0.9998
0.9998
0.9998
0.9998
0.9998
3,60
0.9998
0.9998
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
3,70
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
3,80
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
3,90
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
4,00
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
16
Podemos obter intervalos de confiana de 95% para: mdias, diferenas de mdias, propores,
diferenas em propores, etc.
Podemos tambm criar intervalos de confiana de 90%, 99%, 99.9%, etc, mas os intervalos de confiana
de 95% so os mais utilizados.
Teorema Central do Limite
Uma razo para a distribuio Normal ser considerada to importante porque qualquer que seja a
distribuio da varivel de interesse para grande amostras, a distribuio das mdias amostrais sero
aproximadamente normalmente distribudas, e tendero a uma distribuio normal medida que o
tamanho de amostra crescer. Ento podemos ter uma varivel original com uma distribuio muito
diferente da Normal (pode at mesmo ser discreta), mas se tomarmos vrias amostras grandes desta
distribuio, e ento fizermos um histograma das mdias amostrais, a forma se parecer como uma
curva
A aproximao para a normal melhora medida que o tamanho amostral cresce. Este resultado
conhecido como o Teorema Central do Limite e notvel porque permite-nos conduzir alguns
procedimentos de inferncia sem qualquer conhecimento da distribuio da populao.
17
Definies
1.
Inferncia: Trata-se do processo de obter informaes sobre uma populao a partir dos
resultados observados na amostra
2.
3.
Mdia amostral = x
Proporo amostral = p
2
Varincia amostral = S
Desvio-padro amostral = S
4.
EXEMPLO
Varivel: Quantitativa
Parmetro: Mdia
Suponha a populao de estaturas:
1,60
1,76
1,62
1,76
1,65
1,78
1,66
1,78
1,70
1,80
1,72
1,82
1,73
1,85
1,73
1,92
1,75
1,75
1,76
1,60
1,76
1,66
1,78
1,80
1,75
1,82
1,92
1,76
1,66
1,70
1,78
AMOSTRA 3
AMOSTRA 1
x = 1,718
x = 1,78
x = 1,76
1,73
1,72
1,85
AMOSTRA 4
AMOSTRA 5
AMOSTRA 2
18
Para que voc entenda o teorema do limite central, considere que temos uma populao com N = 4
salrios mnimos:
1,3,5,7
Onde = 4 e = 2,236
Vamos tirar todas as amostras possveis, com reposio de tamanho n = 2 e depois calcular as mdias
relativas a todas as amostras.
1
2
3
4
2
3
4
5
3
4
5
6
4
5
6
7
Sorteio 2
Soteio1
1
3
5
7
A tabela mostra que a mdia uma varivel aleatria, afinal no quadro acima ela assumiu
valores de 1,0 a 6,0
Comparando os resultados, verificamos que a mdia das mdias amostrais rigorosamente igual a
mdia populacional
(x )
64
4
16
(x ) =
Diante disso, poderamos pensar que o mesmo raciocnio se aplica ao clculo do desvio-padro e da
varincia mas o que de fato ocorre que :
(x ) =
19
20
INTERVALO DE CONFIANA PARA MDIA
Como saber o valor da populao, quando tomamos uma amostra?
Podemos estimar o valor da populao usando intervalos de confiana, que d o
intervalo dentro do qual se espera que esteja o valor da populao com uma dada
probabilidade ou nvel de confiana.
Quanto maior o intervalo, maior a segurana da estimativa.
O TLC nos diz que se n suficientemente grande ( n > 30) , a mdia amostral tem
x-
; x +
]
n
n
; x +2
]
n
n
; x +3
]
n
n
OBSERVAO:
E = z
S
n
x +z
S
n
21
Exemplo 1: Um fabricante de baterias afirma que a vida til mdia de seu produto de 50 meses com
desvio-padro de 4 meses e distribuio Normal. Um revendedor comprou um lote de 36 baterias.
a) Qual a probabilidade que a vida mdia dessa amostra seja inferior a 48 meses?
b) Qual a probabilidade que a vida mdia seja inferior a 51 meses se o lote comprado for
de 64 baterias?
Exemplo 2: Quer-se estimar a vida til mdia de uma determinada marca de tubo de imagem de TV .
Supe-se que a vida til dos tubos de imagem tem distribuio Normal. Pegou-se uma amostra de n = 35
tubos de imagem e identificou-se mdia da amostra = 8900 com s = 500. Estimar a mdia da populao
com um IC 90%
Exemplo 3: Uma companhia de computadores, deseja estimar o nmero mdio de horas semanais
gastos por adultos em frente ao computador em casa. Em uma amostra aleatria de n = 50 adultos, o
tempo mdio de uso de computadores em casa foi de 5,3 horas com desvio-padro de 0,9 horas.
Estimar com 95% de confiana , a mdia populacional.
22
Na vida real, no prtico coletar amostras de tamanho n < 30 porm se a populao tiver uma
distribuio normal e o desvio-padro desconhecido, para pequenas amostras usaremos a
distribuio t de student
T=
x
S
n
23
Uma famlia de curvas, cada uma delas depende de um parmetro chamado graus de
liberdade
Para estimar a mdia populacional, o nmero de graus de liberdade igual a n-1
Para cada possvel valor dos graus de liberdade, h uma diferente distribuio t;
As distribuies com menores graus de liberdade so mais espalhadas;
GRAUS DE LIBERDADE
Graus de liberdade, normalmente simbolizados por gl, so um parmetro da distribuio t que pode ser
qualquer nmero real maior que zero. Fixando o valor de gl definimos uma situao particular da famlia
de distribuies t. Uma distribuio t com um gl menor tem mais rea nas caudas da distribuio que
uma distribuio com um gl maior.
O efeito dos gl na distribuio de t est ilustrado nas trs distribuies t mostradas na figura abaixo.
Note-se que quanto menor o nmero de gl, mais aplainada (platocrtica) a forma da distribuio,
resultando em maior rea nas caudas da distribuio.
24
25
TABELA T-STUDENT
GL
001
002
003
004
005
006
007
008
009
010
011
012
013
014
015
016
017
018
019
020
021
022
023
024
025
026
027
028
029
030
040
050
060
080
100
120
0,50
1,000
0,816
0,765
0,741
0,727
0,718
0,711
0,706
0,703
0,700
0,697
0,695
0,694
0,692
0,691
0,690
0,689
0,688
0,688
0,687
0,686
0,686
0,685
0,685
0,684
0,684
0,684
0,683
0,683
0,683
0,681
0,679
0,679
0,678
0,677
0,677
0,674
0,80
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,303
1,299
1,296
1,292
1,290
1,289
1,282
0,90
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,684
1,676
1,671
1,664
1,660
1,658
1,645
0,95
12,710
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
2,021
2,009
2,000
1,990
1,984
1,980
1,960
0,98
31,820
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,423
2,403
2,390
2,374
2,364
2,358
2,326
0,99
63,660
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,704
2,678
2,660
2,639
2,626
2,617
2,576
26
A linha = indica o limite da distribuio t-student, onde ela se iguala distribuio normal
padro
Para amostras pequenas, onde S uma estimativa menos confivel de , devemos construir nosso
intervalo de confiana de uma forma ligeiramente diferente.
Ao invs de usar o valor 1.96 ( em um intervalo de confiana 95%), usamos um valor ligeiramente maior,
para refletir nossa reduo na confiana. Obtemos o valor requerido da tabela de distribuio t.
Tomamos o valor correspondente n-1 graus de liberdade. Note que quanto menor n, maiores os valores
de t.
Note ainda que medida que n cresce, o valor de t torna-se prximo a 1.96.
Repare que se a distribuio da varivel original muito distante de ser normalmente distribuda, e o
tamanho amostral muito pequeno, ento as mdias amostrais no tero uma distribuio
aproximadamente normal e portanto este tipo de intervalo de confiana no ser muito preciso e no
deveria ser utilizado.
x t n 1
S
n
27
Da mesma forma que um conjunto de mdias amostrais so distribudas nas proximidades da mdia
populacional, as propores amostrais p so distribudas ao redor da verdadeira proporo
populacional . Devido ao Teorema Central do Limite, para n grande e no muito prximo de 0 ou 1, a
distribuio de p ser aproximadamente normalmente distribuda com mdia e um desvio padro
dado por
p(1 p)
n
B1
B2
B3
Com reposio
B1 B3
100%
B3 B1
100%
B1 D
50%
B3 B2
100%
B1 B1
100%
B3 B3
100%
B2 B3
100%
D B1
50%
B2 D
50%
D B2
50%
B2 B1
100%
D B3
50%
B2 B2
100%
DD
0%
1200
= 75% idntica a = 75%
16
p
100
50
0
total
freq
9
6
1
P - mdia
25
-25
-75
(P mdia)
625
625
5625
15000
30,62 %
16
p.q
75(25)
30,62
2
(P mdia) .freq
5625
3750
5625
15000
28
b) Sem reposio
B1 B2
100%
B3 D
50%
B1 B3
100%
B3 B1
100%
B1 D
50%
B3 B2
100%
B2 B3
100%
D B1
50%
B2 D
50%
D B2
50%
B2 B1
100%
D B3
50%
900
= 75% idntica a = 75%
12
freq
6
6
P - mdia
25
-25
(P mdia)
625
625
(P mdia) .freq
3750
3750
7500
7500
25 %
12
p.q N n
.
n
N 1
75(25) 4 2
.
25 %
2
4 1
Concluso
( p) =
( p) =
p.q N n
.
para amostras sem reposio
n
N 1
( p) =
p.q
. para amostras com reposio
n
Distribuio das mdias se aproxima da distribuio normal, quanto maior for o tamanho
da amostra. (n 30)
Exemplo:
29
1) Se a proporo de eleitores que votam para o PT numa eleio presidencial 40%, qual a
probabilidade , de uma amostra de 70 eleitores apresentar uma proporo de menor que 30%?
Da mesma forma, sabendo que o erro-padro para proporo pode ser dado por
pq
, o intervalo de
n
pq
n
pq
n
Nn
N 1
Exemplo1: Vamos admitir que 57% de uma amostra de 2000 pessoas votem para o SERRA para
presidente. Calcule um intervalo de confiana de 99% e de 90% para proporo da populao
TAMANHO DA AMOSTRA
MARGEM DE ERRO:
Divulgar uma margem de erro em uma pesquisa uma boa prtica no sentido de que lembra aos
leitores que as porcentagens ou valores produzidos pelas pesquisas de opinio no so as verdadeiras
porcentagens e que h incerteza das verdadeiras porcentagens ou mdias
O que uma margem de erro?
o termo adicionado e subtrado do estimador para formar um intervalo de confiana.
Exemplo: Com 95% de confiana:
Para Mdia: 1,96
S
n
Queremos dizer que a mdia amostral estimador da populao com erro para mais ou para menos
dos termos mencionados acima.
30
S
n
z 2S2
Isolando n, temos: n
m2
S = estimativa amostral do DP populacional
Para designar S no clculo do tamanho da amostra, sendo que ainda no o conhecemos:
1) Desvio-padro coletado em estudo passado
2) Estudo piloto
3) Conjecturas
Exemplo: Determinar o tamanho da amostra para estimar a idade mdia dos alunos da UNIP Araraquara
no ano 2010
Isolando n, temos:
S
n
Nn
N 1
Nn
N 1
z 2S2 N
m 2 ( N 1) z 2S2
Exemplo: Determinar o tamanho da amostra para estimar a idade mdia dos alunos do curso da UNIP
Araraquara, ano 2010
31
Se as amostras fossem sem reposio, pode-se provar que os resultados do teorema do limite central
permanecem idnticos , exceto para o desvio-padro das mdias
Exemplo:
1
1,5
2,0
2,5
2,5
3,0
3,5
3,0
3,5
4,0
4,5
Sorteio
2
Soteio1
1
2
3
4
5
1,5
2,0
2,5
3,0
2,5
3,0
3,5
3,5
4,0
(x )
x
1,5
2
2,5
3
3,5
4
4,5
total
60
3
20
x-mdia
-1,5
-1
-0,5
0
0,5
1
1,5
(x-mdia)
2,25
1
0,25
0
0,25
1
2,25
(x-mdia) .freq
4,5
2
1
0
1
2
4,5
15
15
0,866
20
(x ) =
(x ) =
freq
2
2
4
4
4
2
2
4,5
1,4 5 2
N n
=
= 0,866
N 1
2 5 1
Concluso:
Se pegssemos todas as possveis amostras sem reposio:
(x ) =
(x ) =
Distribuio das mdias se aproxima da distribuio normal, quanto maior for o tamanho
da amostra.
N n
N 1
32
Isolando n, temos:
pq
n
z 2 pq
m2
P = valor adivinhado para proporo ou analisado atravs de uma amostra piloto. Se nenhuma
informao tivermos sobre p, usamos p = 50%
Z = multiplicador apropriado para um nvel de confiana fixado
M = margem de erro ou mxima diferena que se admite suportar entre a proporo da populao e da
amostra
Quanto maior a confiana e menor a margem de erro, maior o tamanho da amostra
Exemplo: Calcule o tamanho da amostra dos colegas da faculdade, para estimar a proporo de pessoas
que usam culos.
Isolando n, temos:
pq
n
Nn
N 1
z 2 pqN
m 2 ( N 1) z 2 pq
Exemplo: Calcule o tamanho da amostra dos colegas da faculdade, para estimar a proporo de pessoas
que usam culos com N = 500 pessoas.