Você está na página 1de 32

ESTATSTICA

INDUTIVA
PROFA. MS DANIELA BRASSOLATTI

AMOSTRAGEM - CONCEITOS BSICOS


ESTATSTICA A ARTE DE TORTURAR OS DADOS AT QUE ELES CONFESSEM
Inferncia estatstica
Inferncia estatstica o processo pelo qual estatsticos tiram concluses acerca da populao usando
informao de uma amostra.
Princpios de estimao
Utilizamos estimativas de uma amostra como nosso ``melhor chute'' para os verdadeiros valores
populacionais. Exemplos so a mdia amostral, o desvio padro amostral, a mediana amostral, os quais
estimam a verdadeira mdia, desvio padro e mediana da populao (que so desconhecidos). Os
verdadeiros (desconhecidos) valores populacionais so chamados parmetros.
Note que estatsticas so usualmente representadas por letras Romanas,enquanto que parmetros so
usualmente representados por letras Gregas.
claro que medida que a amostra aumenta, mais informao ns teremos acerca da populao de
interesse, e portanto mais precisa sero as estimativas dos parmetros de interesse.
Obtendo uma amostra
Obtemos uma amostra para fazer inferncias de uma populao. Nossas inferncias so vlidas somente
se a amostra representativa da populao. Na prtica no existe forma de garantir isto sem ter
informao da populao inteira para comparar com a amostra. E em tais circunstncias no haveria
necessidade de amostragem!
Ao invs disso, podemos assegurar que no existem vcios sistemticos em nossa amostra atravs de
uma seleo aleatria dos membros da populao. Uma amostra aleatria independente uma
amostra selecionada de tal forma que
1.
2.

todos os membros da populao tm a mesma chance de serem selecionados;


cada combinao possvel de um dado nmero de membros tem a mesma chance de ser
selecionada.

Em princpio, a melhor forma de obter uma amostra aleatria de tamanho n ter uma lista de todos os
membros da populao, dar a todos um nmero digamos de 1 a N, e ento escolher aleatoriamente n
nmeros de 1 a N para definir a amostra. claro que na prtica isto no vivel, especialmente quando
a populao infinita.
Na maioria dos casos difcil obter amostras aleatrias. Considere o seguinte diagrama que mostra a
`populao' de crculos. Pense neles como se fossem grnulos de tamanhos diferentes. O dimetro
mdio destes crculos mm.

Suponha que selecionemos uma amostra de 5 destes crculos jogando um lpis sobre o papel
repetidamente at que tenhamos atingido 5 crculos. Qual o dimetro mdio de nossos 5
crculos? O valor est perto de mm?
No exemplo acima, o esquema amostral causou um vcio. Um vcio similar seria obtido por
exemplo na amostragem de um particular tipo de animal - pode ser que os animais que se
consegue capturar e medir so aqueles que no podem correr to rpido, ou ao usar uma
armadinha, voc pode amostrar somente os animais mais famintos, etc.
Sempre que uma amostra obtida, o processo de amostragem deve estar bem documentado
de tal forma que quais inferncias retiradas acerca da populao pode avaliadas luz da
estratgia amostral.

Geralmente as pesquisas so realizadas atravs de estudos dos elementos que compem uma amostra
extrada da populao que se pretende analisar.

Populao: Conjunto de indivduos ou objetos que apresentam em comum determinadas


caractersticas definidas para o estudo.
Amostra: Reduo da populao dimenses menores sem perda das caractersticas essenciais.

compreensvel que o estudo de todos os elementos da populao possibilita preciso


conhecimento das variveis que esto sendo pesquisadas; todavia, nem sempre possvel obter as

4
informaes de todos os elementos da populao. Limitaes de tempo, custo e vantagens do uso
de tcnicas de inferncia justifica o uso de amostras. Torna-se claro que a representatividade da
amostra depender do seu tamanho e da forma como coletada visando obter uma amostra
significativa que de fato represente toda a populao.

Se uma populao for muito grande , o pesquisador poder ter um trabalho astronmico para
estud-la e em alguns casos os resultados sero sempre falhos. s pensar por exemplo no nmero
de nascimentos e mortes dirios, isto , na entrada e sada de informaes, para avaliar a
dificuldade e a impreciso do trabalho.
A anlise de dados o fornecimento de respostas claras a questes especficas sobre um cenrio
amplo demais para que seja completamente detalhado. Ser que os consumidores brasileiros
esto desejando gastar menos?, Que anncio de TV vender mais pasta de dente?, Se os
universitrios experimentarem pepsi e coca sem que haja identificao da bebida, ser que a
maioria vai preferir a primeira ?

Censo: Pesquisa de todos os elementos da populao. usada quando

Populao pequena

Variveis fceis de serem medidas ou observadas

Necessitamos de resultados exatos

Amostragem : o processo de coletar amostras. usada quando:

Populao grande

As observaes ou mensuraes tem alto custo

H necessidades de rapidez

Quando o processo de pesquisa destrutivo.

Reduo de custo

Exemplo: Populao de Fsforos:

Se quisermos avaliar na populao de fsforos a porcentagem de falhas, temos dois caminhos:

5
1) Riscar um por um e ao cabo de algum tempo concluir que a falha da ordem de 2% por
exemplo, o que significa queimar todo estoque.
2) Colher uma amostra com critrio, riscar um por um da amostra e ao cabo de algum
tempo concluir que a falha por exemplo da ordem de 1,8% ou 2,2%
A aparente diferena de 0,2% para mais ou para menos fica compensada pelo fato de que o
estoque de fsforos foi preservado bem como o bolso.

COMO RETIRAR UMA AMOSTRA:


O plano de uma amostra refere-se ao mtodo utilizado para escolhe-la a comear da populao.
Planos ineficazes de amostra podem resultar em concluses enganosas. Devemos levar em conta
duas questes importantes na retirada de uma amostra: Representatividade e Imparcialidade.

REPRESENTATIVIDADE: Uma amostra para ser boa tem que ser representativa, ou seja, deve conter
em proporo tudo o que a populao possui.
IMPARCIALIDADE: Todos os elementos da populao devem ter igual oportunidade de fazer parte
da amostra.

Representatividade: Anlise da populao para ver se seus elementos


distribuem-se homogeneamente ou se formam grupos com caractersticas
peculiares. Se for esse caso temos que respeitar as propores com que esses
grupos integram a populao.

Imparcialidade: Devemos fazer um sorteio usando a tbua de nmeros


aleatrios ou utilizar um dos critrios de amostragem que ser visto
posteriormente.

DELINEAMENTO DA AMOSTRA TIPOS DE AMOSTRAGENS:

Existem dois mtodos para composio de uma amostra: probabilstico e no-probabilstico

Mtodos Probabilsticos: Cada elemento da populao tem a mesma chance de ser selecionado. Tratase do mtodo que garante cientificamente a aplicao de tcnicas estatsticas. Somente com base em
amostragens probabilsticas que se podem realizar inferncias ou indues sobre a populao a partir
do conhecimento de uma amostra.Existem alguns tipos de amostragens probabilsticas que garantem a
imparcialidade acima discutida:

6
Amostragem Aleatria Simples: Atribui-se a cada elemento da populao um
nmero distinto. Efetuam-se sucessivos sorteios at completar o tamanho da amostra
n. Para realizar o sorteio, utilizar a tbua de nmeros aleatrios (anexo) que consistem
em tabelas que apresentam dgitos de 0 9 distribudos aleatoriamente.

Amostragem Sistemtica: Conveniente quando a populao est ordenada


segundo algum critrio como fichas, lista telefnica.
Exemplo:
Se N = 5.000 tamanho da populao e precisamos de uma amostra de n = 250,
dividimos N/n = 20. Selecionamos ao acaso um nmero de 1 20. Suponha que saiu o
nmero 7:
a

1 unidade a ser selecionada 7

2 unidade ser selecionada 20 + 7 = 27

3 unidade ser selecionada 27 + 20 = 47

67 , 87 , ..., 4987 dando um total de 250 unidades

Amostragem Estratificada:No caso da populao em que se podem distinguir subpopulaes mais ou menos homogneas denominadas estratos. Aps a determinao
dos estratos, seleciona-se uma amostra aleatria simples de cada estrato.As varveis
de estratificao mais comuns so: classe social, idade, sexo, profisso.

Amostragem Estratificada Proporcional: A proporcionalidade do tamanho de cada


estrato da populao mantida na amostra. Exemplo: Se um estrato abrange 20% da
populao, ele tambm deve abranger 20% da amostra.

Amostragem por conglomerados: H subdiviso da rea ser pesquisada por


bairros, quarteires, domiclios, famlias que sero sorteados para composio dos
elementos da amostra e a pesquisa ser realizada de forma sistemtica ou simples.

Cuidados com as pesquisas por amostragem:


A sub-representao: ocorre quando alguns grupos da populao so excludos do processo de seleo
da amostra. Ex: Uma pesquisa feita por telefone exclui domiclios que no tem telefones
A no-resposta: ocorre quando um indivduo escolhido para entrar na amostra no pode ser contatado
ou se recusa a cooperar.

7
Mtodos No - Probabilsticos: So amostragens em que h uma escolha deliberada dos elementos da
amostra. No possvel generalizar os resultados da pesquisa para a populao, pois as amostras noprobabilsticas no garantem a representatividade da populao.

Amostragem Acidental: Os entrevistados so acidentalmente escolhidos.


Exemplo: Para pessoas no supermercado e colher opinies; Programa de TV ao vivo,
registrando automaticamente opinies contra ou favor de uma situao.
Amostragem Intencional: O investigador se dirige intencionalmente a um grupo de
elementos dos quais deseja saber opinio.
Exemplo: Numa pesquisa sobre preferncia por determinado cosmtico, o
pesquisador se dirige a um salo de beleza e entrevista as pessoas que ali se
encontram.
Amostragem por Quotas: Amplamente utilizada em pesquisa de mercado e em
pesquisa de opinio poltica em que tempo e dinheiro so escassos.
Exemplo: Admita-se que se deseja pesquisar o trabalho das mulheres. A primeira
tarefa descobrir uma proporo de caractersticas na populao. Imagine que haja
47% de homens e 53% de mulheres na populao. Logo uma amostra de 50 pessoas
dever ter 23 homens e 27 mulheres. Ento o pesquisador receber uma quota para
entrevistar 27 mulheres.

DISTRIBUIES CONTNUAS DE PROBABILIDADE

DEFINIO:
Quando a varivel aleatria pode assumir qualquer valor dentro do conjunto dos nmeros
Reais, denominada como varivel aleatria contnua.

Exemplos: preos de carros usados, salrio, rentabilidades mensais das aes.

A distribuio de uma varivel aleatria contnua dada por uma curva contnua e no por
pontos discretos. Essa curva denominada funo distribuio de probabilidade (f.d.p)

P(X)

Exemplo: Considere a distribuio da varivel aleatria X:


X

P(X)

0.1

0.2

0.4

0.2

0.1

0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
1

Perceba que as reas dos retngulos do grfico so:

A1= b1 x h1 = 0,1= P(X =1)


A2 = b2 x h2 = 0,2 = P(X =2)
A3 = b3 x h3 = 0,4 = P(X=3)
A4 = b4 x h4 = 0,2 = P(X=4)
A5 = b5 x h5 = 0,1 = P(X=5)

9
Como a soma das probabilidades igual a 1 temos que a soma das reas igual 1. Para calcularmos
P(1 X 3) basta calcular a soma das reas A1+A2+A3 = 0,1 + 0,2 + 0,4 = 0,7
Se representarmos a distribuio de probabilidade acima por uma curva , teremos X varivel aleatria
contnua.

DISTRIBUIO NORMAL:

Astrnomos e outros cientistas observaram que mensuraes repetidas de uma mesma quantidade
tendiam a variar e quando se coletava grande nmero de mensuraes dispondo-as numa distribuio
de freqncias , elas se apresentavam com a forma:

Constatou-se que a distribuio podia ser bem aproximada por uma distribuio matemtica como a
figura suavizada acima, chamada Distribuio Gaussiana ou Distribuio Normal (1777 1855).

Pelo fato de tantos fenmenos terem essa caracterstica , pesquisadores de diferentes campos tem feito
uso extensivo da curva Normal, aplicando-a aos dados que coletam e analisam.

Um fenmeno Normal quando os valores da varivel que o exprimem encontram abrigo sob a curva
Normal.

Exemplos:

Altura: A maioria dos brasileiros se encontram em torno de um mdia de 152 183 cm,
poucos apresentam muito mais ou muito menos que isso.No h pessoa por baixa ou alta
que no se abriga sob a curva Normal.

QI: A maioria se encontra em torno de 90 110. Poucos apresentam mais que 140 ou
menos que 60.

CARACTERSTICAS DA NORMAL:

10

Se assemelha a um sino
Suave, unimodal e simtrica em relao mdia
f(x) tende a zero quando x tende ao infinito positivo ou negativo
completamente especificada pelos parmetros mdia e desvio-padro
Existe uma nica distribuio Normal para combinao de cada mdia e desvio-padro
E(X) = e V(X) =

A curva simtrica ao redor da mdia e a rea total sob a curva definida como 100%, logo
cada metade da curva tem 50% da rea total

uma das mais importantes distribuies de freqncia e apresenta a seguinte funo:

f (x)

1
2

1 x

e 2

Onde = mdia , = desvio-padro e = 3,1415...

Felizmente, voc no tem que memorizar esta equao. O importante que voc entenda como a curva
afetada pelos valores numricos de e .

INFLUNCIA DOS PARMETROS NA FORMA NORMAL:

Os parmetros da distribuio Normal so a mdia e o desvio-padro. Conhecendo esses dois valores


temos a oportunidade de calcular qualquer probabilidade de uma varivel aleatria cuja distribuio
Normal ou Gaussiana. Conforme o valor da mdia e do desvio-padro a distribuio pode assumir uma
forma mais alongada ou achatada ou ainda pode ter sua posio deslocada pois a mdia informa onde a
distribuio est centrada e o desvio-padro mostra a disperso.
A mdia refere-se ao centro da distribuio e o desvio padro ao espalhamento de curva. A distribuio
normal simtrica em torno da mdia o que implica que e mdia, a mediana e a moda so todas
coincidentes.

Exemplo:
-

Se mdia = 40 e desvio-padro menor que 10 (8 por exemplo) , a distribuio se estreita na


base e aumenta a altura de seu pico.

Se mdia = 40 e desvio-padro igual a 10, a distribuio no nem muito estreita e nem


muito achatada.

11
Se mdia = 40 e desvio-padro maior que 10 (15 por exemplo) , a distribuio se alonga na

base e diminui a altura de seu pico.


Mdia 40 e DP 8

Mdia 40 e DP 10

50
40
30
20
10
0

Mdia 40 e DP 15

40

40

30

30

20

20

10

10

20

30

40

50

20

60

30

40

50

60

10

20

30

40

50

60

70

Se desvio-padro = 10 e mdia maior que 40 (50 por exemplo), a distribuio se desloca


para direita

Se desvio-padro = 10 e mdia igual a 40, a distribuio est centrada em 40.

Se desvio-padro = 10 e mdia menor que 40 (30 por exemplo), a distribuio se desloca


para esquerda

60
50
40
30
20
10
0
10

20

30

40

50

60

70

A deciso de que uma varivel tem distribuio Normal envolve a opinio pessoal. Voc deve se
perguntar se fosse desenhado a distribuio de probabilidades de uma varivel analisada, ela teria
forma de sino?

COMO APLICAR A DISTRIBUIO NORMAL:

Exemplo : A vida mdia de uma bateria de determinada marca de 20 horas com desvio-padro de 0,5
horas. Quero calcular a probabilidade da bateria durar menos do que 21 horas.

12
Chamamos de X a vida da bateria e entendemos X como uma varivel aleatria com distribuio Normal
pois algumas baterias iro durar mais do que 20 horas, outras menos do que 20 horas. Algumas poucas
iro durar muito mais ou muito menos do que a mdia.

Para calcular essa probabilidade temos duas possibilidades:

Integral - Ferramenta do clculo que calcula a rea sob a curva Normal


Usar tabelas que j esto prontas

PROBLEMA: Como vimos a forma da distribuio pode mudar de acordo com o valor de mdia e desviopadro obtidos e ento sero necessrias tabelas para todas as combinaes de mdia e desvio-padro,
o que cobre um enorme intervalo de X e para o clculo da integral, podemos cair em integrais muito
complicadas.

SOLUO: Distribuio Normal Padronizada: Consiste em fornecer uma tabela para uma nica
combinao de mdia e desvio-padro, isto , para mdia zero e desvio-padro 1, fazendo com que a
varivel aleatria X tenha que sofrer uma converso de X para Z, onde

X mdia
desvio padro

como transformar minutos em horas mas no caso traduzimos o valor em quantidades de desviospadro da mdia.
Exemplos:

1) Se x = 6, mdia = 3 e desvio-padro = 2
Fazendo ( X mdia) = 6 est 3 unidades acima da mdia
Dividindo essa distncia pelo DP = (3/2) = 1.5 o que significa que 6 est 1,5 desvios-padro
acima da mdia

2) Para o exemplo anterior:


Exemplo : A vida mdia de uma bateria de determinada marca de 20 horas com desviopadro de 0,5 horas. Quero calcular a probabilidade da bateria durar menos do que 21 horas.
Se X = 21, mdia =20 e desvio-padro = 0,5 ento Z = 2 e queremos calcular P(Z 2), ou seja ,
queremos calcular a rea abaixo:

13

10

15

20

25

30

-10

-5

P(X 21)

10

P(Z 2)

Transformao

O desenho de Z tem a mesma forma e rea que o desenho de X pois uma transformao de variveis
ou mudana de valores do eixo X para o eixo Z. As infinitas distribuies Normais reduzem-se apenas
distribuio Normal com mdia zero e desvio-padro 1 .

Para Z vrias Bibliografias disponibilizam uma tabela que nos d a probabilidade desejada, ou seja, o
valor da rea ou a porcentagem de lmpadas que duraro menos que 21 horas (para o exemplo citado).
Em anexo temos a tabela Z que fornece P(Z a) , que indica a probabilidade de Z ser menor ou igual a
determinado valor a.

PROCEDIMENTO DE CLCULO DE PROBABILIDADE:


P(Z a)

Valor direto na tabela

P(Z a)

1 P(Z a)

P(Z -a)

1-P(Z a)

P(Z -a)

P(Z a)

P(a Z b)

P(Z b) P(Z a)

Para o exemplo:
a)

P(X 21) = P(Z 2) = 0,9772 ou 97,72%

b) P(X 21)
c)

P(X 19)

d) P(19 X 20,85)
d) P( X 22)

Outros Exemplos

14

1) Os depsitos mensais na caderneta de poupana tem distribuio Normal com mdia 500 reais
e desvio-padro 150 reais. Se um depositante realiza um depsito, pede-se calcular a
probabilidade que esse depsito seja:
a)

menor ou igual a 650 reais

b) maior ou igual a 650 reais


c)

Esteja entre 250 e 650 reais

2) Um fabricante de baterias sabe por longa experincia que as baterias de sua fabricao tem
vida mdia de 600 dias e desvio-padro de 100 dias sendo que a durao tem
aproximadamente distribuio Normal. Oferece uma garantia de 312 dias, isto , troca as
baterias que apresentarem falha nesse perodo. Fabrica 10.000 baterias mensalmente.
a)

Quantas dever trocar pelo uso da garantia mensal?

b) Qual deve ser a garantia para que a porcentagem de baterias substitudas seja inferior
a 0,1%?

3) Uma fbrica de carros sabe que os motores de sua fabricao tem durao Normal com mdia
150.000 Km e devio-padro de 5.000 Km. Qual a probabilidade de que um carro, escolhido ao
acaso, dos fabricados por essa firma, tenha um motor que dure:
a)

Menos que 170.000 Km

b) Entre 140.000 e 165.000 Km.


c)

Se a fbrica substitui o motor que apresenta durao inferior garantia, qual deve ser
esta garantia para que a porcentagem de motores substitudos seja inferior 0,2%?

4) No ano passado o vendedor Jota de uma grande empresa de alimentos conseguiu vender $
1.350.000,00. O vendedor afirma que com essa venda, ele est entre os 5% dos vendedores da
empresa que mais venderam no ano passado. Se as vendas realizadas por todos os vendedores
tem distribuio Normal com mdia $ 1.250.000,00 e desvio-padro $ 100.000,00, pede-se
verificar se a afirmao do vendedor correta.

15
TABELA NORMAL PADRO P(Z a)
Z

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,00

0.5000

0.5040

0.5080

0.5120

0.5160

0.5199

0.5239

0.5279

0.5319

0.5359

0,10

0.5398

0.5438

0.5478

0.5517

0.5557

0.5596

0.5636

0.5675

0.5714

0.5753

0,20

0.5793

0.5832

0.5871

0.5910

0.5948

0.5987

0.6026

0.6064

0.6103

0.6141

0,30

0.6179

0.6217

0.6255

0.6293

0.6331

0.6368

0.6406

0.6443

0.6480

0.6517

0,40

0.6554

0.6591

0.6628

0.6664

0.6700

0.6736

0.6772

0.6808

0.6844

0.6879

0,50

0.6915

0.6950

0.6985

0.7019

0.7054

0.7088

0.7123

0.7157

0.7190

0.7224

0,60

0.7257

0.7291

0.7324

0.7357

0.7389

0.7422

0.7454

0.7486

0.7517

0.7549

0,70

0.7580

0.7611

0.7642

0.7673

0.7704

0.7734

0.7764

0.7794

0.7823

0.7852

0,80

0.7881

0.7910

0.7939

0.7967

0.7995

0.8023

0.8051

0.8078

0.8106

0.8133

0,90

0.8159

0.8186

0.8212

0.8238

0.8264

0.8289

0.8315

0.8340

0.8365

0.8389

1,00

0.8413

0.8438

0.8461

0.8485

0.8508

0.8531

0.8554

0.8577

0.8599

0.8621

1,10

0.8643

0.8665

0.8686

0.8708

0.8729

0.8749

0.8770

0.8790

0.8810

0.8830

1,20

0.8849

0.8869

0.8888

0.8907

0.8925

0.8944

0.8962

0.8980

0.8997

0.9015

1,30

0.9032

0.9049

0.9066

0.9082

0.9099

0.9115

0.9131

0.9147

0.9162

0.9177

1,40

0.9192

0.9207

0.9222

0.9236

0.9251

0.9265

0.9279

0.9292

0.9306

0.9319

1,50

0.9332

0.9345

0.9357

0.9370

0.9382

0.9394

0.9406

0.9418

0.9429

0.9441

1,60

0.9452

0.9463

0.9474

0.9484

0.9495

0.9505

0.9515

0.9525

0.9535

0.9545

1,70

0.9554

0.9564

0.9573

0.9582

0.9591

0.9599

0.9608

0.9616

0.9625

0.9633

1,80

0.9641

0.9649

0.9656

0.9664

0.9671

0.9678

0.9686

0.9693

0.9699

0.9706

1,90

0.9713

0.9719

0.9726

0.9732

0.9738

0.9744

0.9750

0.9756

0.9761

0.9767

2,00

0.9772

0.9778

0.9783

0.9788

0.9793

0.9798

0.9803

0.9808

0.9812

0.9817

2,10

0.9821

0.9826

0.9830

0.9834

0.9838

0.9842

0.9846

0.9850

0.9854

0.9857

2,20

0.9861

0.9864

0.9868

0.9871

0.9875

0.9878

0.9881

0.9884

0.9887

0.9890

2,30

0.9893

0.9896

0.9898

0.9901

0.9904

0.9906

0.9909

0.9911

0.9913

0.9916

2,40

0.9918

0.9920

0.9922

0.9925

0.9927

0.9929

0.9931

0.9932

0.9934

0.9936

2,50

0.9938

0.9940

0.9941

0.9943

0.9945

0.9946

0.9948

0.9949

0.9951

0.9952

2,60

0.9953

0.9955

0.9956

0.9957

0.9959

0.9960

0.9961

0.9962

0.9963

0.9964

2,70

0.9965

0.9966

0.9967

0.9968

0.9969

0.9970

0.9971

0.9972

0.9973

0.9974

2,80

0.9974

0.9975

0.9976

0.9977

0.9977

0.9978

0.9979

0.9979

0.9980

0.9981

2,90

0.9981

0.9982

0.9982

0.9983

0.9984

0.9984

0.9985

0.9985

0.9986

0.9986

3,00

0.9987

0.9987

0.9987

0.9988

0.9988

0.9989

0.9989

0.9989

0.9990

0.9990

3,10

0.9990

0.9991

0.9991

0.9991

0.9992

0.9992

0.9992

0.9992

0.9993

0.9993

3,20

0.9993

0.9993

0.9994

0.9994

0.9994

0.9994

0.9994

0.9995

0.9995

0.9995

3,30

0.9995

0.9995

0.9995

0.9996

0.9996

0.9996

0.9996

0.9996

0.9996

0.9997

3,40

0.9997

0.9997

0.9997

0.9997

0.9997

0.9997

0.9997

0.9997

0.9997

0.9998

3,50

0.9998

0.9998

0.9998

0.9998

0.9998

0.9998

0.9998

0.9998

0.9998

0.9998

3,60

0.9998

0.9998

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

3,70

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

3,80

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

3,90

1.0000

1.0000

1.0000

1.0000

1.0000

1.0000

1.0000

1.0000

1.0000

1.0000

4,00

1.0000

1.0000

1.0000

1.0000

1.0000

1.0000

1.0000

1.0000

1.0000

1.0000

16

DISTRIBUIO AMOSTRAL PARA MDIA


INTERVALOS DE CONFIANA PARA MDIA

A idia bsica de intervalos de confiana


Suponha que estejamos interessados num parmetro populacional verdadeiro (mas desconhecido) .
Podemos estimar o parmetro , usando informao de nossa amostra. Chamamos o nico nmero que
representa o valor mais plausvel do parmetro (baseado nos dados amostrais) de uma estimativa
pontual de . Contudo, sabemos que o valor estimado na maior parte das vezes no ser exatamente
igual ao valor verdadeiro. Ento, tambm seria interessante encontrar um intervalo de confiana que
fornea um intervalo de valores plausveis para o parmetro baseado nos dados amostrais.
Um intervalo de confiana 95% para um parmetro populacional fornece um intervalo no qual
estaramos 95% confiantes de cobertura do verdadeiro valor do parmetro.
Tecnicamente, 95% de todos os intervalos de confiana que construirmos contero o verdadeiro valor
do parmetro (dado que todas as suposies envolvidas estejam corretas). Ento se obtivermos um
intervalo de confiana para o parmetro para cada uma dentre 100 amostras aleatrias da populao,
somente 5, em mdia destes intervalos de confiana no contero .

Podemos obter intervalos de confiana de 95% para: mdias, diferenas de mdias, propores,
diferenas em propores, etc.
Podemos tambm criar intervalos de confiana de 90%, 99%, 99.9%, etc, mas os intervalos de confiana
de 95% so os mais utilizados.
Teorema Central do Limite
Uma razo para a distribuio Normal ser considerada to importante porque qualquer que seja a
distribuio da varivel de interesse para grande amostras, a distribuio das mdias amostrais sero
aproximadamente normalmente distribudas, e tendero a uma distribuio normal medida que o
tamanho de amostra crescer. Ento podemos ter uma varivel original com uma distribuio muito
diferente da Normal (pode at mesmo ser discreta), mas se tomarmos vrias amostras grandes desta
distribuio, e ento fizermos um histograma das mdias amostrais, a forma se parecer como uma
curva
A aproximao para a normal melhora medida que o tamanho amostral cresce. Este resultado
conhecido como o Teorema Central do Limite e notvel porque permite-nos conduzir alguns
procedimentos de inferncia sem qualquer conhecimento da distribuio da populao.

17

Definies
1.

Inferncia: Trata-se do processo de obter informaes sobre uma populao a partir dos
resultados observados na amostra

2.

Parmetro: a medida usada para descrever uma caracterstica numrica populacional.


Mdia =
Proporo =
2
Varincia =
Desvio-padro =

3.

Estatstica da amostra: O estimador de um parmetro populacional uma caracterstica


determinada na amostra.

Mdia amostral = x
Proporo amostral = p
2
Varincia amostral = S
Desvio-padro amostral = S
4.

Distribuio Amostral: a distribuio de probabilidade de uma estatstica da amostra que


formada quando amostras de tamanho n so repetidamente colhidas de uma populao. Se a
estatstica da amostra sua mdia, teremos a distribuio amostral da mdia.

EXEMPLO
Varivel: Quantitativa
Parmetro: Mdia
Suponha a populao de estaturas:
1,60
1,76

1,62
1,76

1,65
1,78

1,66
1,78

1,70
1,80

1,72
1,82

1,73
1,85

1,73
1,92

1,75

1,75

1,76

N = 19, = 1,74, = 7,8


Se retirarmos vrias amostras com n = 5 estaturas:
Amostra I:
Amostra II:
Amostra III:

1,60
1,76
1,66

1,78
1,80
1,75

1,82
1,92
1,76

1,66
1,70
1,78

AMOSTRA 3

AMOSTRA 1

x = 1,718
x = 1,78
x = 1,76

1,73
1,72
1,85

AMOSTRA 4
AMOSTRA 5

AMOSTRA 2

O RETNGULO REPRESENTA A POPULAO E CADA CRCULO REPRESENTA UMA AMOSTRA DE


TAMANHO n . AS MDIAS PODEM DIFERIR.

18

Podemos obter estimativas da mdia populacional muito prximas porm no iguais.


Quando a amostragem aleatria, podemos fazer inferncias sobre a populao com
base no estudo de uma amostra.
Uma estatstica uma varivel aleatria e sua distribuio de probabilidade chamada
distribuio amostral.
Quando se considera todas as possveis mdias amostrais, a probabilidade de se obter
valores prximos mdia populacional alta e a probabilidade de se obter valores
distantes mdia populacional baixa.

Para que voc entenda o teorema do limite central, considere que temos uma populao com N = 4
salrios mnimos:
1,3,5,7
Onde = 4 e = 2,236

Vamos tirar todas as amostras possveis, com reposio de tamanho n = 2 e depois calcular as mdias
relativas a todas as amostras.

1
2
3
4

2
3
4
5

3
4
5
6

4
5
6
7

Sorteio 2
Soteio1
1
3
5
7

A tabela mostra que a mdia uma varivel aleatria, afinal no quadro acima ela assumiu
valores de 1,0 a 6,0
Comparando os resultados, verificamos que a mdia das mdias amostrais rigorosamente igual a
mdia populacional

(x )

64
4
16

(x ) =
Diante disso, poderamos pensar que o mesmo raciocnio se aplica ao clculo do desvio-padro e da
varincia mas o que de fato ocorre que :

(x ) =

Desvio-padro das mdias chamado de erro-padro

19

Distribuio das Mdias:

medida que n ( tamanho das amostras) cresce, as mdias amostrais vo


progressivamente tendendo a uma distribuio limite que a distribuio Normal.
Para efeitos prticos, n 30, uma aproximao muito boa.
As relaes que acabamos de examinar constituem a base de um importante teorema
chamado TEOREMA DO LIMITE CENTRAL
TEOREMA DO LIMITE CENTRAL

Se amostras de tamanho n30 forem tiradas de uma populao qualquer , ento a


distribuio das mdias das amostras se aproximam de uma distribuio Normal.
Quanto maior o tamanho da amostra , melhor a aproximao.
Se a prpria populao for distribuda normalmente, a distribuio amostral das
mdias das amostras ser tambm normalmente distribudas para qualquer tamanho
n de amostra.
A mdia das possveis mdias amostrais igual a mdia populacional
O desvio-padro das mdias amostrais igual o desvio-padro da populao dividido
pela raiz do tamanho da amostra, ou seja, o desvio-padro das mdias tem o mesmo
centro da populao mas no est to espalhado, no varia tanto.
Como raramente conhecemos o desvio-padro populacional, utilizamos o desvio-padro amostral para
o clculo do erro-padro, desde que n 30
ESTIMAO
Se tomarmos a mdia amostral ou proporo amostral como estimativa da mdia populacional, teremos
uma estimativa pontual mas como vimos, cada uma das possveis amostras ter uma mdia ou
proporo diferentes do valor real.
Desse modo, devemos apresentar um intervalo de variao para a mdia e a proporo.Na estimativa
por ponto, a partir das observaes,calcula-se uma estimativa , usando as estatsticas.

20
INTERVALO DE CONFIANA PARA MDIA
Como saber o valor da populao, quando tomamos uma amostra?
Podemos estimar o valor da populao usando intervalos de confiana, que d o
intervalo dentro do qual se espera que esteja o valor da populao com uma dada
probabilidade ou nvel de confiana.
Quanto maior o intervalo, maior a segurana da estimativa.

O TLC nos diz que se n suficientemente grande ( n > 30) , a mdia amostral tem

distribuio Normal com mdia e erro-padro


n
Nvel de confiana a probabilidade de que o intervalo estimado contenha o
parmetro populacional.
Quando estudamos a distribuio Normal , percebemos que se X tem distribuio
Normal com mdia e desvio-padro , ento:

X tem aproximadamente 68% de chance de estar entre o intervalo


[ - ; + ]
X tem aproximadamente 95% de chance de estar entre o intervalo
[ - 2 ; + 2]
X tem aproximadamente 99% de chance de estar entre o intervalo
[ - 3 ; + 3]

Devido a mdia amostral ter distribuio Normal:

A mdia populacional tem aproximadamente 68% de chance de estar entre o


intervalo
[

x-

; x +
]
n
n

A mdia amostral tem aproximadamente 95% de chance de estar entre o intervalo


[x -2

; x +2
]
n
n

A mdia amostral tem aproximadamente 99% de chance de estar entre o intervalo


[x -3

; x +3
]
n
n

OBSERVAO:

Um problema com a construo do intervalo de confiana, que no sabemos o verdadeiro


desvio=padro populacional. Para grandes tamanhos amostrais, contudo, o desvio-padro
amostral S, pode ser usado no lugar do desvio-padro populacional

E = z

a margem de erro, que a maior distncia possvel entre a estimativa pontual e o


n

valor do parmetro a ser estimado.

IC para populaes infinitas: [ x - z

S
n

x +z

S
n

21
Exemplo 1: Um fabricante de baterias afirma que a vida til mdia de seu produto de 50 meses com
desvio-padro de 4 meses e distribuio Normal. Um revendedor comprou um lote de 36 baterias.
a) Qual a probabilidade que a vida mdia dessa amostra seja inferior a 48 meses?
b) Qual a probabilidade que a vida mdia seja inferior a 51 meses se o lote comprado for
de 64 baterias?
Exemplo 2: Quer-se estimar a vida til mdia de uma determinada marca de tubo de imagem de TV .
Supe-se que a vida til dos tubos de imagem tem distribuio Normal. Pegou-se uma amostra de n = 35
tubos de imagem e identificou-se mdia da amostra = 8900 com s = 500. Estimar a mdia da populao
com um IC 90%
Exemplo 3: Uma companhia de computadores, deseja estimar o nmero mdio de horas semanais
gastos por adultos em frente ao computador em casa. Em uma amostra aleatria de n = 50 adultos, o
tempo mdio de uso de computadores em casa foi de 5,3 horas com desvio-padro de 0,9 horas.
Estimar com 95% de confiana , a mdia populacional.

22

INTERVALOS DE CONFIANA PARA MDIA AMOSTRAS PEQUENAS

Na vida real, no prtico coletar amostras de tamanho n < 30 porm se a populao tiver uma
distribuio normal e o desvio-padro desconhecido, para pequenas amostras usaremos a
distribuio t de student

Quando o desvio padro da populao no for conhecido, a estimativa da mdia da


populao dever ser realizada com a distribuio t.
O procedimento similar ao apresentado com a distribuio Z.

Em alguns casos, no possvel retirar amostras grandes, pois os dados disponveis so


poucos, o custo unitrio da amostragem alto, o tempo disponvel no suficiente
etc.
Como a forma da distribuio das mdias de amostras pequenas depender da forma
da distribuio da populao, o desvio padro da amostra no ser uma boa
estimativa do desvio padro da populao.

Portanto, para realizar a estimativa da mdia da populao com amostras pequenas, a


distribuio da populao dever ser normal.
o recomendado verificar a forma da distribuio para confirmar a premissa de
normalidade da amostra, por exemplo, construindo seu histograma.
o Se a inclinao da distribuio da populao no for acentuada e o tamanho
da amostra for pequeno, poder ser utilizada a distribuio t com (n-1) graus
de liberdade e desvio da populao desconhecido.
Nessas condies, a estimativa da mdia da populao ser realizada com a
distribuio t, conhecida como distribuio de Student.

T=

x
S
n

Quando o nmero de graus de liberdade cresce, a distribuio tende para distribuio


Normal
As caudas na distribuio t so mais gordas que a normal

Dependendo de n, temos um formato de curva, quando n < 30


Tem forma de sino

23

rea total da curva 1


simtrica em torno da mdia

Uma famlia de curvas, cada uma delas depende de um parmetro chamado graus de
liberdade
Para estimar a mdia populacional, o nmero de graus de liberdade igual a n-1

Tem caudas mais densas do que a distribuio normal;


Valores extremos so mais provveis de ocorrer com a distribuio t do que com a
normal padro;

Para cada possvel valor dos graus de liberdade, h uma diferente distribuio t;
As distribuies com menores graus de liberdade so mais espalhadas;

Conforme o tamanho da amostra aumenta, s se torna uma estimativa mais confivel


de ; se n muito grande, conhecer o valor de s quase equivalente a conhecer .

GRAUS DE LIBERDADE
Graus de liberdade, normalmente simbolizados por gl, so um parmetro da distribuio t que pode ser
qualquer nmero real maior que zero. Fixando o valor de gl definimos uma situao particular da famlia
de distribuies t. Uma distribuio t com um gl menor tem mais rea nas caudas da distribuio que
uma distribuio com um gl maior.

O efeito dos gl na distribuio de t est ilustrado nas trs distribuies t mostradas na figura abaixo.
Note-se que quanto menor o nmero de gl, mais aplainada (platocrtica) a forma da distribuio,
resultando em maior rea nas caudas da distribuio.

RELAO COM A CURVA NORMAL


Pode-se observar ainda que a distribuio t muito semelhante curva normal. medida em que
aumentam os gl, a distribuio t aproxima-se da distribuio normal padronizada (mdia = 0, desviopadro = 1). A curva normal padronizada um caso particular da distribuio t quando gl tende ao
infinito. Para os propsitos prticos, os valores distribuio t aproximam-se dos valores da distribuio
normal padronizada relativamente depressa, tal que quando gl = 30, esses valores so quase idnticos.

24

25
TABELA T-STUDENT
GL
001
002
003
004
005
006
007
008
009
010
011
012
013
014
015
016
017
018
019
020
021
022
023
024
025
026
027
028
029
030
040
050
060
080
100
120

0,50
1,000
0,816
0,765
0,741
0,727
0,718
0,711
0,706
0,703
0,700
0,697
0,695
0,694
0,692
0,691
0,690
0,689
0,688
0,688
0,687
0,686
0,686
0,685
0,685
0,684
0,684
0,684
0,683
0,683
0,683
0,681
0,679
0,679
0,678
0,677
0,677
0,674

0,80
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,303
1,299
1,296
1,292
1,290
1,289
1,282

0,90
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,684
1,676
1,671
1,664
1,660
1,658
1,645

0,95
12,710
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
2,021
2,009
2,000
1,990
1,984
1,980
1,960

0,98
31,820
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,423
2,403
2,390
2,374
2,364
2,358
2,326

0,99
63,660
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,704
2,678
2,660
2,639
2,626
2,617
2,576

26
A linha = indica o limite da distribuio t-student, onde ela se iguala distribuio normal
padro
Para amostras pequenas, onde S uma estimativa menos confivel de , devemos construir nosso
intervalo de confiana de uma forma ligeiramente diferente.
Ao invs de usar o valor 1.96 ( em um intervalo de confiana 95%), usamos um valor ligeiramente maior,
para refletir nossa reduo na confiana. Obtemos o valor requerido da tabela de distribuio t.
Tomamos o valor correspondente n-1 graus de liberdade. Note que quanto menor n, maiores os valores
de t.
Note ainda que medida que n cresce, o valor de t torna-se prximo a 1.96.
Repare que se a distribuio da varivel original muito distante de ser normalmente distribuda, e o
tamanho amostral muito pequeno, ento as mdias amostrais no tero uma distribuio
aproximadamente normal e portanto este tipo de intervalo de confiana no ser muito preciso e no
deveria ser utilizado.

Exemplo1: Selecionamos 16 restaurantes e medimos a temperatura do caf vendido de cada um. A


temperatura mdia amostral de 162 com desvio-padro 10 . Um intervalo de confiana para a
temperatura mdia com 95% de credibilidade ?

x t n 1

S
n

Exemplo2: No se conhece o consumo mdio e o desvio padro do consumo de combustvel de


automveis da marca W. Sabe-se, no entanto, que a distribuio do consumo de combustvel de
automveis dessa marca aproximadamente normal. Na anlise de 10 automveis da marca W, obtevese consumo mdio de combustvel de 8 km/l com um desvio padro igual a 10 km/l. Encontre um
intervalo de confiana para o consumo mdio de combustvel dessa marca de carro. Adote um
coeficiente de confiana igual a 95%.

INTERVALOS DE CONFIANA PARA PROPORO


Intervalos de confiana para uma proporo
Pesquisadores frequentemente expressam a frequncia de ocorrncia de um item numa amostra como
uma proporo do total. Por exemplo, uma amostra de larvas de mosquito coletadas de um lago com
gua limpa parada contem 80 larvas das quais 60 so Aedes detritus. A proporo daquela espcie na
60
amostra
0,75 ou 75%. Considerando esta amostra uma amostra aleatria, esta proporo uma
80
estimativa da proporo total populacional.
Seja n o tamanho da amostra e seja x o nmero observado do evento de interesse. Ento estimamos a
x
proporo populacional com a proporo observada p .
n

27
Da mesma forma que um conjunto de mdias amostrais so distribudas nas proximidades da mdia
populacional, as propores amostrais p so distribudas ao redor da verdadeira proporo
populacional . Devido ao Teorema Central do Limite, para n grande e no muito prximo de 0 ou 1, a
distribuio de p ser aproximadamente normalmente distribuda com mdia e um desvio padro
dado por

p(1 p)
n

DISTRIBUIO AMOSTRAL PARA PROPORO


Varivel: Qualitativa
Parmetro: Proporo desconhecida
Exa) Universitrios Rezam? Amostra de 127 alunos, 107 disseram que rezam, pelo menos de
vez em quando. P = 84,25%
Exb) 606 de 1318 usariam a internet para obter informaes de sade e medicina.. p = 45,98%
Os mesmos resultados valem quando se deseja estimar o parmetro proporo da populao e
a varivel de interesse qualitativa
Exemplo:
Uma caixa contm 3 peas boas e 1 defeituosa. Considere todas as possveis amostras de
tamanho 2 e sucesso a extrao de uma peo boa
= 75%
a)
B1 B2
100%
B3 D
50%

B1

B2

B3

Com reposio
B1 B3
100%
B3 B1
100%

B1 D
50%
B3 B2
100%

Mdia das propores =

B1 B1
100%
B3 B3
100%

B2 B3
100%
D B1
50%

B2 D
50%
D B2
50%

B2 B1
100%
D B3
50%

B2 B2
100%
DD
0%

1200
= 75% idntica a = 75%
16

Desvio-padro das propores desvio-padro da populao

p
100
50
0
total

freq
9
6
1

Desvio=padro das mdias =

P - mdia
25
-25
-75

(P mdia)
625
625
5625

15000
30,62 %
16

Uma forma mais fcil de calcular:

p.q

75(25)
30,62
2

(P mdia) .freq
5625
3750
5625
15000

28

Onde p = proporo de sucesso


q= proporo de fracassos

b) Sem reposio
B1 B2
100%
B3 D
50%

B1 B3
100%
B3 B1
100%

Mdia das propores =

B1 D
50%
B3 B2
100%

B2 B3
100%
D B1
50%

B2 D
50%
D B2
50%

B2 B1
100%
D B3
50%

900
= 75% idntica a = 75%
12

Desvio-padro das propores desvio-padro da populao


p
100
50
total

freq
6
6

P - mdia
25
-25

Desvio=padro das mdias =

(P mdia)
625
625

(P mdia) .freq
3750
3750
7500

7500
25 %
12

Uma forma mais fcil de calcular:

p.q N n
.

n
N 1

75(25) 4 2
.
25 %
2
4 1

Onde p = proporo de sucesso


q= proporo de fracassos
N = tamanho populao
N = tamanho da amostra

Concluso

( p) =

( p) =

p.q N n
.
para amostras sem reposio
n
N 1

( p) =

p.q
. para amostras com reposio
n

Distribuio das mdias se aproxima da distribuio normal, quanto maior for o tamanho
da amostra. (n 30)

Exemplo:

29
1) Se a proporo de eleitores que votam para o PT numa eleio presidencial 40%, qual a
probabilidade , de uma amostra de 70 eleitores apresentar uma proporo de menor que 30%?

INTERVALO DE CONFIANA PARA PROPORO

Da mesma forma, sabendo que o erro-padro para proporo pode ser dado por

pq
, o intervalo de
n

confiana para proporo pode ser dado por:

IC para populaes infinitas: p z.

IC para populaes finitas: p z.

pq
n

pq
n

Nn
N 1

Exemplo1: Vamos admitir que 57% de uma amostra de 2000 pessoas votem para o SERRA para
presidente. Calcule um intervalo de confiana de 99% e de 90% para proporo da populao

TAMANHO DA AMOSTRA

MARGEM DE ERRO:
Divulgar uma margem de erro em uma pesquisa uma boa prtica no sentido de que lembra aos
leitores que as porcentagens ou valores produzidos pelas pesquisas de opinio no so as verdadeiras
porcentagens e que h incerteza das verdadeiras porcentagens ou mdias
O que uma margem de erro?
o termo adicionado e subtrado do estimador para formar um intervalo de confiana.
Exemplo: Com 95% de confiana:
Para Mdia: 1,96

S
n

Queremos dizer que a mdia amostral estimador da populao com erro para mais ou para menos
dos termos mencionados acima.

QUE TAMANHO MINHA AMOSTRA DEVE TER?

30

A representatividade da amostra depender de seu tamanho ( quanto maior, melhor) e de outras


consideraes metodolgicas no estudo da amostragem.
A pergunta freqente que se faz um estatstico : qual deve ser o tamanho da amostra?
medida que o nvel de confiana cresce, o intervalo de confiana se alarga.
A medida que o intervalo de confiana se alarga, a preciso da estimativa diminui.
Uma forma de aumentar a preciso de uma estimativa sem a reduo do nvel de confiana ampliar o
tamanho da amostra. Mas quo grande precisa ser o tamanho da amostra para assegurar um certo nvel
de confiana para um erro mximo da estimativa?
Quanto maior a confiana e menor a margem de erro, maior o tamanho da amostra
TAMANHO DA AMOSTRA PARA MDIA
Sabemos que a margem de erro para a proporo com N desconhecido : m = z

S
n

z 2S2
Isolando n, temos: n
m2
S = estimativa amostral do DP populacional
Para designar S no clculo do tamanho da amostra, sendo que ainda no o conhecemos:
1) Desvio-padro coletado em estudo passado
2) Estudo piloto
3) Conjecturas
Exemplo: Determinar o tamanho da amostra para estimar a idade mdia dos alunos da UNIP Araraquara
no ano 2010

FATOR DE CORREO PARA POPULAO FINITA


Se uma populao for finita, a frmula que determina o erro-padro da mdia precisa ser ajustada
usando um fator de correo:

Logo a margem de erro com N conhecido : m = z

Isolando n, temos:

S
n

Nn
N 1

Nn
N 1

z 2S2 N
m 2 ( N 1) z 2S2

Exemplo: Determinar o tamanho da amostra para estimar a idade mdia dos alunos do curso da UNIP
Araraquara, ano 2010

EXPLICAO PARA O FATOR DE CORREO

31

Se as amostras fossem sem reposio, pode-se provar que os resultados do teorema do limite central
permanecem idnticos , exceto para o desvio-padro das mdias

Exemplo:
1

1,5

2,0
2,5

2,5
3,0
3,5

3,0
3,5
4,0
4,5

Sorteio
2
Soteio1
1
2
3
4
5

1,5
2,0
2,5
3,0

2,5
3,0
3,5

3,5
4,0

(x )

x
1,5
2
2,5
3
3,5
4
4,5
total

60
3
20

x-mdia
-1,5
-1
-0,5
0
0,5
1
1,5

(x-mdia)
2,25
1
0,25
0
0,25
1
2,25

(x-mdia) .freq
4,5
2
1
0
1
2
4,5
15

15
0,866
20

(x ) =

(x ) =

freq
2
2
4
4
4
2
2

4,5

1,4 5 2
N n
=
= 0,866
N 1
2 5 1

Concluso:
Se pegssemos todas as possveis amostras sem reposio:

(x ) =

(x ) =

Distribuio das mdias se aproxima da distribuio normal, quanto maior for o tamanho
da amostra.

N n
N 1

32

TAMANHO DA AMOSTRA PARA PROPORO


Exemplo: Vamos supor que queiramos estimar a proporo da populao portadora de hepatite B,
usando uma amostra aleatria. Queremos que o tamanho da amostra seja grande o suficiente de modo
que a margem de erro de nossa estimativa seja de 3%.

Sabemos que a margem de erro para a proporo com N desconhecido : m = z

Isolando n, temos:

pq
n

z 2 pq
m2

P = valor adivinhado para proporo ou analisado atravs de uma amostra piloto. Se nenhuma
informao tivermos sobre p, usamos p = 50%
Z = multiplicador apropriado para um nvel de confiana fixado
M = margem de erro ou mxima diferena que se admite suportar entre a proporo da populao e da
amostra
Quanto maior a confiana e menor a margem de erro, maior o tamanho da amostra
Exemplo: Calcule o tamanho da amostra dos colegas da faculdade, para estimar a proporo de pessoas
que usam culos.

Sabemos que a margem de erro para a proporo com N conhecido : m = z

Isolando n, temos:

pq
n

Nn
N 1

z 2 pqN
m 2 ( N 1) z 2 pq

Exemplo: Calcule o tamanho da amostra dos colegas da faculdade, para estimar a proporo de pessoas
que usam culos com N = 500 pessoas.

Você também pode gostar