Você está na página 1de 116

Modelagem

Estatística
População
e Amostra
 População: Conjunto dos elementos que se
deseja abranger no estudo considerado.
 Amostra: Subconjunto dos elementos da
população.
População

 Finita - Alunos do mestrado, funcionários de


uma empresa, eleitores etc.
 Infinita - Nascimentos em um cidade, produção
de uma máquina etc.
População
e Amostra

 Censo: Estudo através do exame de todos os


elementos da população.
 Amostragem: Estudo por meio do exame de
uma amostra.
Técnicas de
Amostragem

 Amostragem probabilística (aleatória) - a


probabilidade de um elemento da população ser
escolhido é conhecida.
 Amostragem não probabilística (não aleatória) - Não
se conhece a probabilidade de um elemento da
população ser escolhido para participar da amostra.
Amostragem
Aleatória
Simples
 Faz-se uma lista da população e sorteiam-se os
elementos que farão parte da amostra.
 Cada subconjunto da população com o mesmo
nº de elementos tem a mesma chance de ser
incluído na amostra.

pr = n/N
DISTRIBUIÇÕES AMOSTRAIS
Parâmetro e
Estatística

 Parâmetro - característica relacionada à


população.
 Estatística - característica relacionada à
amostra.
Parâmetros

 Média 
 Proporção p
 Desvio Padrão 
 etc
Estatísticas

 Média X
 Proporção p
 Desvio Padrão s
 etc
Distribuições
Amostrais

 Qualquer característica de uma amostra


aleatória (estatística) é uma variável aleatória.
 Em outras palavras, se tomarmos várias
amostras de forma parecida, os resultados da
característica (estatística) que nos interessa
variarão por causa da aleatoriedade do sorteio.
Distribuições
Amostrais

 Distribuição Amostral - Distribuição de


probabilidades de uma estatística.
Exemplo

 A população de um estudo é composta de 4


pessoas (N=4) e a variável de interesse é a
altura.

X1=1,50m X2=1,60m

X3=1,70m X4=1,80m
Parâmetros

N=4 X1=1,50m X2=1,60m


X3=1,70m X4=1,80m

 Média populacional: = 1,65m

 Desvio Padrão:  = 0,1118m


Exemplo

 Retira-se uma amostra aleatória simples com 2


elementos (n=2), com reposição.
 Qual será a média amostral?

 Qual é a distribuição de probabilidades da média


amostral?
Exemplo
Amostra Amostra
X1 X1 X3 X1
X1 X2 X3 X2
X1 X3 X3 X3
X1 X4 X3 X4
X2 X1 X4 X1
X2 X2 X4 X2
X2 X3 X4 X3
X2 X4 X4 X4
Exemplo
Amostra X Amostra X
X1 X1 1,50 X3 X1 1,60
X1 X2 1,55 X3 X2 1,65
X1 X3 1,60 X3 X3 1,70
X1 X4 1,65 X3 X4 1,75
X2 X1 1,55 X4 X1 1,65
X2 X2 1,60 X4 X2 1,70
X2 X3 1,65 X4 X3 1,75
X2 X4 1,70 X4 X4 1,80
Exemplo
Amostra X Prob. Amostra X Prob.
X1 X1 1,50 1/16 X3 X1 1,60 1/16
X1 X2 1,55 1/16 X3 X2 1,65 1/16
X1 X3 1,60 1/16 X3 X3 1,70 1/16
X1 X4 1,65 1/16 X3 X4 1,75 1/16
X2 X1 1,55 1/16 X4 X1 1,65 1/16
X2 X2 1,60 1/16 X4 X2 1,70 1/16
X2 X3 1,65 1/16 X4 X3 1,75 1/16
X2 X4 1,70 1/16 X4 X4 1,80 1/16
Total - 1
Distribuição
Amostral da
Média
X P(X) P(X)
1,50 1/16 0,0625
1,55 2/16 0,1250
1,60 3/16 0,1875
1,65 4/16 0,2500
1,70 3/16 0,1875
1,75 2/16 0,1250
1,80 1/16 0,0625
Total 1
Distribuição
Amostral da
Média
4/16

3/16 3/16

2/16 2/16

1/16 1/16

1,50 1,55 1,60 1,65 1,70 1,75 1,80


Distribuição
Amostral da
Média

 Calcular o valor esperado (média) e o desvio


padrão da média amostral.
Média e
Variância

X P(X)
x1 p1
E(X) = x =  (xi.pi)
x2 p2
... ...
xn pn VAR(X) = x =  pi.(xi-x)2

Total 1
Distribuição Amostral
da Média
X P(X) P(X)
1,50 1/16 0,0625
1,55 2/16 0,1250
1,60 3/16 0,1875
1,65 4/16 0,2500
1,70 3/16 0,1875
1,75 2/16 0,1250
1,80 1/16 0,0625
Total 1
Distribuição Amostral
da Média

X = E(X) = 1,65 m

X = 0,0791 m
Distribuição Amostral
da Média
Características

a) x =
Distribuição
Amostral da Média
Características

b)

 x=  população infinita ou
muito grande ou
n amostragem com reposição

 x=  N-n população
n N-1 finita
Distribuição Amostral
da Média
Características
 c1) Se a população apresentar distribuição normal, a
distribuição das médias amostrais também será
normal para todos os tamanhos de amostra.
 c2) Se a população não apresentar distribuição
normal, a distribuição de médias amostrais será
aproximadamente normal para grandes amostras
(teorema central do limite).
Exercício

 Uma fábrica de pneus alega que a vida média


dos pneus é 30.000 Km, com desvio padrão de
2.000 Km. Tomando-se como verdadeiros
estes dados, qual é a probabilidade de uma
amostra com 40 pneus apresentar vida média
de menos que 29.500 Km?
Exercício

 x= 
n

 x= 2000
x = 316,22777
40
Exercício

P(X<29500)

X
29,5 30
Exercício

29.500 - 30.000
 29500 = = -1,58
316,23

0,057053

Z
-1,58 0
Exercício 1

 Se a vida útil média de uma peça é 5.000 horas,


com desvio padrão de 200 horas, qual é a
probabilidade de que uma amostra com 25
produtos apresente média superior a 5.100
horas?
0,00621
Exercício 2

 Um banco informa que o saldo médio das 2000


contas de pessoas físicas é $ 500, com desvio
padrão de $ 100. Se uma amostra aleatória de
50 correntistas (pessoa física) daquele banco for
retirada, qual é a probabilidade do saldo médio
ser menor que $ 480?
Exercício

 População finita : Resp = 0,076359

 População infinita: Resp = 0,079270


Modelagem
Estatística

Distribuição Amostral

da Proporção
Distribuição
Amostral da
Proporção

p - prop. populacional p - prop. amostral


População
Amostra
Plano de
amostragem
p p
Exemplo

 A população de um estudo é composta de 4


pessoas (N=4) e a variável de interesse é a
proporção de pessoas altas (altura > 1,75m).

N=4 X1=1,50m X2=1,60m


X3=1,70m X4=1,80m
Parâmetro

N=4 X1=1,50m X2=1,60m


X3=1,70m X4=1,80m

Proporção populacional: 1/4 = 0,25


Exemplo

 Retira-se uma amostra aleatória simples com 2


elementos (n=2), com reposição.
 Qual será a proporção amostral?

 Qual é a distribuição de probabilidades da


proporção amostral?
Distribuição
Amostral da
Proporção

Binomial (n=2 , p=1/4)

número de pessoas altas


proporção =
tamanho da amostra
Distribuição Amostral
da Proporção
Características

a) p =p
Distribuição Amostral
da Proporção
Características
b)
p.(1-p)
 p= população infinita ou
muito grande ou
n amostra com reposição

 p= p.(1-p) N-n população


N-1 finita
n
Distribuição Amostral
da Proporção
Características
c1) A distribuição das proporções amostrais é binomial no
caso de população infinita. Quando o tamanho da amostra
for grande, esta distribuição pode ser aproximada por uma
distribuição normal.
c2) A distribuição das proporções amostrais é
hipergeométrica no caso de população finita. Quando o
tamanho da amostra for grande, esta distribuição pode ser
aproximada por uma distribuição normal.
Exercício

 Uma fábrica de pneus alega que 99% de seus


produtos possuem vida útil longa (duram mais
que 30.000 Km). Tomando-se como
verdadeiros estes dados, qual é a
probabilidade de uma amostra com 400 pneus
apresentar menos que 2% dos pneus com vida
útil menor que 30.000 Km?
Exercício

p.(1-p)
 p=
n

 p= 0,01.0,99 p = 0,004975
400
Exercício

P(p<0,02)

P
0,01 0,02
Exercício

0,02 - 0,01
= 2,01
0,004975
Z 0,02 =
0,977784

0 2,01 Z
Exercício 3

 Um banco informa que apenas 10% dos 5000


clientes possuem saldo médio acima de $500.
Se uma amostra aleatória de 100 correntistas
daquele banco for retirada, qual é a
probabilidade de haver mais de 15 clientes na
amostra com saldo acima de $500?
Exercício

 População finita : Resp = 0,046479

 População infinita: Resp = 0,047460


Modelagem
Estatística

Estimação
Estimação de
Parâmetros

População Amostra

 
X
2  S2
p 
P
Estimação
 Conhecidas as estatísticas
(amostra), estimar quais são os
parâmetros (população).

Amostra População


X
S2
?

P
Estimação

 Pontual  Estima-se apenas um valor


para o parâmetro.

 Intervalar  Estima-se um intervalo de


valores onde deve-se encontrar o parâmetro
(intervalo de confiança).
Propriedades
Desejáveis de um
Estimador
 Não-tendenciosidade ou justeza: um
estimador é justo (não tendencioso, não
viesado; não viciado) se sua média (ou valor
esperado) for o próprio parâmetro que se
pretende estimar.
Tendenciosidade

 Ex:Média

 Xi 
X= E( X ) =  X = 
n
 Não-tendencioso
Tendenciosidade
 Ex: Proporção

 Xi 
P= E( P) =  P = p
n
 Não-tendencioso
Tendenciosidade


^ 2 ni (Xi -
X
 =  E (^
2
 )=
n -1 
2
n n
 Tendencioso
Tendenciosidade


^ 2 = ni (Xi -
X n -1 
2
 E (^ ) =
2
n n
 Tendencioso

^ 2   ni (Xi -
X ^
 =S =
2
n-1
2
 E( ) = E(s ) = 
2
2

 Não-tendencioso
Consistência

 Um estimador é consistente se o aumento do


tamanho da amostra leva a uma redução da
variância.
Eficiência

 Um estimador não-tendencioso (E1) é mais


eficiente que outro estimador não-tendencioso
(E2) se a variância de E1 for menor que a
variância de E2.

E 2
1
< E
2
2
Eficiência
E1 é mais eficiente que E2
x x xxx x
x x xx x xx
x x x xx x x xxx xxx x x
x x xxx x x x x x x x x x x xxxx
x xx x x x x xx xx
x x xxx x xx xx x x x xx x xxx xxxx x x x x
x xx x xx
x xxx xxx x x
x x x
xx xx x x xx xxx x xx
xxxx
xx xx
x x x x x xxxx
x x xx xx x x xxxx xxx xxxx xxxx
xx x xxxx x x x x x xx x x x x
xxx x xx x x xxx xxx x x x x
xxxx x xxxx x x x
xxx x xxxxxx
x xx x x x x
xx xxxx

E1 E2 E3
Não-tendenciosos Tendencioso
Métodos de
Estimação

 Como selecionar o melhor estimador?

 Método da Máxima Verossimilhança

 Método dos Mínimos Quadrados

 Métodos Bayesianos

 ...
Intervalos de
Confiança

 Problema: Estimar 2 limites, dentro dos quais


deve se encontrar o valor real, com um
determinado nível de confiança.
Exemplo: Média

População infinita (valor real = ) (desconhecido)


Exemplo: Média


 Amostra: média amostral ( X)

X= 
n


E( X ) = 
Exemplo

População infinita (valor real = ) (desconhecido)

 = 10


Exemplo
Distribuição Amostral


 Amostra: média amostral ( X)

10
X= =2
25


Exemplo


 Qual a probabilidade de X ser maior que ?
Exemplo


 Qual a probabilidade de X ser maior que ?

0,50


Exemplo

 Qual a probabilidade de X -  ser maior que


1,96 vezes o desvio padrão?
 Qual a probabilidade da distância entre a média
populacional (p) e a média amostral (X) ser
maior do que 1,96 vezes o desvio padrão da
distribuição amostral da média?
Exemplo

10
X= =2 1,96 . 2 = 3,92
25

 Qual a probabilidade da distância entre a média


populacional (p) e a média amostral (X) ser
maior do que 3,92?
Exemplo

 Qual a probabilidade de X -  ser maior que


1,96 vezes o desvio padrão?

Resp: 5%
0,025 0,025

-1,96 0 1,96
Exemplo: Média

 Se alguém afirmar que X estará a menos de


1,96 vezes o desvio padrão da média (para
mais ou para menos), terá 95% de
probabilidade de estar certo e 5% de
probabilidade de estar errado.
Simbologia

 Probabilidade de erro admitida


(probabilidade do parâmetro encontrar-
se fora do intervalo a ser criado).
 No exemplo, 
Simbologia

 Grau de confiança(probabilidade
do parâmetro encontrar-se no
intervalo)
 No exemplo, 
Simbologia

  Limite do I.C. na distribuição


padronizada.

 No exemplo, 
Limites

 O intervalo é construído somando-se e


diminuindo-se Z vezes o desvio padrão da média
amostral obtida.
Limites

A média da amostra não se diferenciará da


média populacional em mais que Z vezes o
desvio padrão (da distribuição amostral)
_
Int. Conf.: X +-   x
Limites
_
Int. Conf.: X +-   x

 x = 
n População infinita

 
x=
 N -n
n N -1 População finita
Exemplo

 Foi retirada uma amostra com 64


elementos de uma população com desvio
padrão igual a 100. A média encontrada foi
300. Construir um intervalo para a média
com:
 a) 90% de confiança
Exemplo

 

5%

Z0,05 0

 
Exemplo

 
 Xn

100 Linf = 279,4


Lim= 300 +-1,645
64
Lsup = 320,6
20,5625
Exemplo
 b) 99% de confiança
 

 

100 Linf = 332,2


Lim= 300 +-2,575
64 Lsup = 267,8
32,1875
Exemplo

 Encontrar, na tabela da normal reduzida, os


valores de Z para:
 
 
 
 
Exemplo

 Encontrar, na tabela da normal reduzida, os


valores de Z para:
 
 
 
 
Intervalo de Confiança
Média ( conhecido)
_
Int. Conf.: X +-   x

 x = n População infinita

 x =  N -n
n N -1 População finita
Intervalo de Confiança
Média
( desconhecido)

 Normalmente, não se conhece o desvio


padrão da população cuja média se deseja
estimar.
 Então, utiliza-se um estimador pontual para
o desvio padrão populacional.
Intervalo de Confiança
Média
( desconhecido)

 s = Desvio padrão da amostra

Xi - X)2
s n-1
Intervalo de Confiança
Média
( desconhecido)
 Nesta situação, a distribuição correta a ser utilizada é a
distribuição “t” de Student, com (n-1) graus de
liberdade. (supondo que a população seja normal).
 Obs: se a amostra for grande, pode utilizar-se a
distribuição normal como aproximação.
Intervalo de Confiança
Média
( desconhecido)

normal t

0 t
Interv.Conf. Média (
desconhecido)
_ ^
Int. Conf.: X - t  x
+

^ s
x= n População infinita

^ s N -n
x= n N -1 População finita
Limites do
Intervalo

 t - valor limite da distribuição t, para a


probabilidade de erro , com (n-1) graus de
liberdade.
 tabela t.
Exemplo

Encontrar o valor limite de t/2 para:

a)  = 1%, com 19 graus de liberdade (amostra


com 20 elementos)

2,861
Exemplo

Encontrar o valor limite de t/2 para:

a)  = 10%, com 19 graus de liberdade (amostra


com 20 elementos)

1,729
Exemplo

Encontrar o valor limite de t/2 para:

a)  = 5%, com 19 graus de liberdade (amostra


com 20 elementos)

2,093
Exemplo

Encontrar o valor limite de t/2 para:

a)  = 5%, com 29 graus de liberdade (amostra


com 30 elementos)

2,045
Exemplo

Encontrar o valor limite de t/2 para:

a)  = 5%, com graus de liberdade


8

1,960

Comparar este resultado com Z0,025.


Exemplo

 Na construção de um motor, o diâmetro dos cilindros é


de grande importância. Em uma pesquisa feita com 5
blocos com 4 cilindros cada (20 furos), o diâmetro
médio encontrado foi 82 mm e o desvio padrão 0,1 mm.
Construir um intervalo com 95% de confiança para este
parâmetro.
Exemplo

 n = 20 (19 graus de liberdade)

 s = 0,1 mm

 X = 82 mm
 = 5% - da tabela: t19 = 2,093
Exemplo

_ s 0,1
 IC : X +- tc 82 +- 2,093
n 20

0,05
 LS = 82,05 mm
 LI = 81,95 mm

 81,98 < X < 82,05 com 95% de confiança


Intervalo de
confiança para
a proporção

 População com proporção p (desconhecida).

 Amostra com n elementos e proporção p


conhecidos.
Distribuição
Amostral da
Proporção

 p (1-)

LI P LS
Intervalo de
Confiança

 Limites:

_ P(1-P)
P +-  (População infinita)
n
Exemplo

 Foi retirada uma amostra com 100 itens de


um grande lote de peças, sendo
encontrados 10 defeituosos. Construa um
intervalo de confiança com 3% de erro para
a percentagem de defeituosos no lote.
Exemplo

 
1,5%

Z0,05 0

 
Exemplo

 
 pn

0,10.0,90 Linf = 0,035


Lim= 0,10 +- 2,17
100 Lsup = 0,165
0,0651
Tamanho de Amostras
Intervalo de Confiança
Média

_ 
X +- Z/2 (população infinita)
n
erro máximo (e)
Tamanho de
Amostras

 Média

e = Z/2 n (erro máximo ou margem de erro)

2
Z/2 x 
n= (População infinita)
e
Tamanho de
Amostras

 Média

2
Z/2 x 
n= (População infinita)
e

2 2
n= Z/2 x  x N (População finita)
2 2 2
Z/2 x  +e (N-1)
Tamanho de
Amostras

 Estimação “a priori” do desvio padrão:

 Estudos passados

 Amostra piloto

 Fixando-se um valor teórico


Intervalo de
Confiança
Proporção

_ p(1-p)
P +-  (População infinita)
n
erro máximo (e)
Tamanho de
Amostras

 Proporção

p (1-p)
e = Z/2 n

2
n = Z/2 p (1-p) (População infinita)
e2
Tamanho de
Amostras

 Proporção

2
n = Z/2 p (1-p) (População infinita)
e2

Z2 x p (1-p) x N
n= /2 (População finita)
Z2/2 x p (1-p) + e 2 (N-1)
Tamanho de
Amostras

 Estimação “a priori” da proporção:

 Estudos passados

 Amostra piloto

 Fixando-se um valor teórico (0,5)


Tamanho de
Amostras

 Se p = 0,5 máximo tamanho de amostra.

n=
Z 2
x 0,25 (população infinita)
e2

0,25 x Z 2 x N (população finita)


n=
0,25 x Z2 + e 2 x (N-1)