Você está na página 1de 38

Estatística

Estimativa pontual
Intervalo de Confiança
Tamanho da amostra
Estimativa pontual para a média
Como podemos estimar o verdadeiro valor da média da
população se temos em mãos a média de uma amostra?

ESTIMAR A MÉDIA DA
POPULAÇÃO

Média amostral
(média das médias)

Como foi visto anteriormente a média da população é igual


à média das médias
Intervalo de Confiança
É uma faixa de possíveis valores em torno da média amostral, e a
probabilidade de que esta faixa realmente contenha o valor real da média
da população
O Intervalo de confiança terá uma certa probabilidade chamada de nível
de confiança (simbolizada por 1 – ) de conter a média da população.

Há uma probabilidade de 1 –  da
1 – α = nível de confiança
média estar contida no intervalo
definido α = nível de significância (probabilidade de erro)

Há uma probabilidade  de a média


amostral estar fora do intervalo definido
(área hachurada)
1–α
/2 /2
Se usarmos um desvio padrão em
torno da média (Z = 1), a chance de

x erro ao estimar a média será de


31,74%. Mas, se usarmos dois (Z =
Intervalo de confiança 2), a chance de erro será de 4,56%.
Intervalo de Confiança
Distribuição das médias amostrais

1–α
α /2 α /2

x s = desvio padrão da população


(μ)
1 - α = grau de confiança
Erro = z . Desvio padrão amostral
z1 z2
intervalo e = z. s
n
x  erro x  erro

P( x  e    x  e) = 1  
Intervalo de Confiança
Se o desvio padrão da população é conhecido:

 : X  z.s X
s
sX =
n
A estimativa intervalar da média populacional se baseia na hipótese de que
a distribuição amostral das médias amostrais é normal. Para grandes
amostras isto não apresenta dificuldade especial, pois se aplica o teorema
do limite central.
Todavia, para amostras de 30 ou menos observações, é importante saber se
a população tem distribuição normal ou aproximada.
Intervalo de Confiança
Se o desvio padrão da população é desconhecido:
SX
 = X  z.
n
Quando o desvio padrão da população não é conhecido (o que é o caso,
geralmente), usa-se o desvio padrão da amostra como estimativa, substituindo-se
sx por Sx nas equações. Isto não acarreta maiores dificuldades, pois o desvio
padrão amostral dá uma aproximação bastante razoável do verdadeiro valor, na
maioria dos casos.
Além disso, pelo teorema do limite central, sabemos que, quando a amostra é
maior que 30, a distribuição das médias é aproximadamente normal.
Para amostras menores que 30, a aproximação normal não é adequada. Devemos
então usar a distribuição t. A forma da distribuição t é bem parecida com a
normal.
Intervalo de Confiança
x  e    x  e ou  = x  e
Quando tem n > 30 e Quando tem n > 30 e
s é conhecido σ é desconhecido

SX
 : X  z.s X 1-α
 = X  z.
n
s
sX = Z/2 x Z/2
n Região Região
Crítica Zcrítico Zcrítico Crítica

s SX
e = z. e = z.
n n
Substitui o desvio padrão da
população s pelo desvio
padrão da amostra s
Intervalo de Confiança
Interpretação: Se em um estudo, forem
retiradas várias amostras
aleatórias de tamanho n da
população e que, para cada
Amostra 20 30 40 50 60 70 80 X amostra, seja construído
1 um intervalo de (1-) de
confiança para a variável
2
desejada.
3
...
45
46 Os intervalos obtidos
47 serão diferentes, mas
... (1-)% destes intervalos
98 conterão entre os seus
99 intervalos o valor real do
100
=50 parâmetro.

Ao nível de 95% de confiança espera-se que em 100


intervalos para as amostras, 95 deles contenham a média μ
Intervalo de Confiança
E quando o tamanho da amostra é menor que 30
(n < 30) e o desvio padrão da população (s) é
desconhecido?

 Neste caso não podemos usar a distribuição normal (a


distribuição das médias não é normal).
 Devemos usar a distribuição t (t de student).
 A distribuição t é similar à distribuição normal, mas tem
maior variação nas caudas (nas pontas da curva).
Distribuição t de Student
Distribuição normal Distribuição t de
padronizada student com n = 12

Distribuição t de
student com n = 3

A curva t nos dá a probabilidade de ocorrer um evento a t desvios padrão da média (para


mais ou para menos)
 os valores de t (valores correspondentes à área sob a curva nas caudas) são tabelados e dependem
de dois fatores:
 n-1 = graus de liberdade

 grau de confiança desejado (1- α)


Intervalo de Confiança
x  e    x  e ou  = x  e
Quando tem n < 30 e σ é desconhecido

s s s
e=t ou e = t / 2,n 1 ou e = tcrítico ,n 1
n n n

Substitui o desvio padrão da população s pelo desvio padrão da amostra s


Intervalo de Confiança

Imagine que tivéssemos uma amostra de tamanho tão


grande que tendesse ao infinito. O que ocorreria?

O erro seria próximo de zero (desconsiderável) e a média da


amostra seria igual a média da população, sem a necessidade
de estimar um intervalo.
Escolha a distribuição adequada
Início
Pelo teorema do limite central podemos
sim usar a distrib. normal (use s se s não
for conhecido)
n > 30? s
e = z / 2
não n
população tem não usar métodos não-paramétricos ou de
distr. normal? reamostragem

sim

s população sim usar a distribuição normal


é conhecido s
e = z / 2
não n
Usar distribuição t
s
e = t n 1, / 2
n
Exercícios

Determine o valor crítico Z / 2 que corresponde ao


grau de confiança indicado:

a) 99%
b) 94%
c) 92%
d) 90%
Exercícios
Resolução:

Grau de Confiança Valor Crítico


(1 – α)

(Z α/2)

99% 0,01 2,58


94% 0,06 1,88
92% 0,08 1,75
90% 0,10 1,65
Exercícios
Um dos principais produtos de uma indústria siderúrgica é a
folha de flandres. Havia uma preocupação com a
possibilidade de haver um número de folhas fora da faixa de
especificação de dureza (LIE = 58,0 HR e LSE = 64,0 HR). A
partir desta informação a empresa decidiu estimar a dureza
média das folhas de flandres () coletando uma amostra
aleatória de 49 folhas.
Medidas de dureza (HR) das folhas-de-flandres fabricadas pela
siderúrgica
61,0 60,2 60,3 60,3 60,0 61,0 60,3
60,0 60,0 60,9 61,0 61,2 59,2 60,9
60,0 60,5 59,8 59,3 61,0 59,6 59,8 X = 60,21
59,6 60,1 58,0 59,8 58,9 57,6 58,0
60,5 60,1 61,6 61,1 59,7 58,3 61,6
s = 0,61
59,5 59,0 60,3 58,7 59,6 54,2 60,3
61,0 59,7 59,9 59,9 60,0 58,6 59,9

Para um grau de confiança de 95%, determine a margem de erro (E) e o


intervalo de confiança para média populacional ().
Exercícios
Dados:
X = 60,21
s = 0,61
/2 1-α /2
n = 49
-Z/2 0 Z/2

Grau de confiança de 95% implica em: 1 –  = 95%,


logo α = 5% = 0,05 e α/2 = 0,025. Z α/2 = Z0,025 = 1,96

Margem de erro:
s
E = Z
2 n
0,61
E = 1,96. = 0,1708 = 0,17
49
Exercícios
Intervalo de confiança:
xE    xE
60,21  0,17    60,21  0,17
60,04    60,38
[60,04 ; 60,38]HR

Interpretação:

Se fôssemos selecionar muitas amostras de 49 elementos da


produção de folhas e construíssemos um intervalo de 95% de
confiança para cada amostra, 95% desses intervalos conteriam a
média populacional .
Exercícios
Uma máquina automática de suco industrial é regulada de modo que a quantidade
suprida de cada vez, tenha distribuição aproximadamente normal com desvio-
padrão de 35ml. Determine um intervalo de 96% de confiança para a quantidade
média de toda produção, sabendo que uma amostra de 30 embalagens teve um
conteúdo médio de 290 ml.
Grau de confiança de 96%
Dados: implica em:
1 -  = 96%
X = 290 ml  = 4% = 0,04
s = 35ml /2 1-α /2
n = 30
-Z/2 0 Z/2
Z  = Z 0,02 = 2,05
2
s
E = Z . xE    xE
n
2
290  13,10    290  13,10
E = 2,05.
35
= 13,10 276,90    303,10
30 [276,90 ; 303,10] ml
Cálculo do Tamanho da Amostra
• O conceito de nível de confiança pode ser utilizado para o cálculo do
tamanho da amostra, necessário para fazermos inferências confiáveis.

2
E = Z .
s  Z / 2 .s 
n n= 
2
 E 

Como o tamanho da amostra afeta o erro de amostragem?

• Se a amostra empregada for muito pequena, a margem de erro será


grande, o que impossibilita ou inviabiliza a tomada de decisão.

• Por outro lado, se a amostra for muito grande, o intervalo obtido


pode ser mais estreito do que o necessário (gastos desnecessários);
Cálculo do Tamanho da Amostra
Tamanho de amostra e margens de erro
3,0 mantendo fixos (s=10 e 95% de confiança)
Margem de erro (E)

2,5

2,0

1,5

1,0

0,5

500 1000 1500 2000 2500 3000


Tamanho da amostra

• Os ganhos em precisão conseguidos com aumentos fixos dos tamanhos das


amostras não são constantes;
• Tamanho de amostra 5.000 podem ser um perda de tempo e dinheiro porque
elas fornecem pouca precisão adicional;
Exercícios
Em um estudo para a determinação do perfil dos alunos da Faculdade
Pitágoras, a característica de maior interesse tem s = 0,3. Qual deve ser o
tamanho da amostra para que tenhamos 95% de confiança em que o erro
da estimativa da  correspondente a esta característica não supere 0,05?
Dados:
E = 0,05 2
s = 0,3  Z / 2 .s 
 =0,05 n= 
 E 
2 2
 Z / 2 .s   (1,96).(0,3) 
n=  =  = 139
 E   0,05 

Refaça o cálculo supondo que se deseja ter 98% de


confiança.
Conclusões
• Intervalos de confiança são muito mais informativos do que
as estimativas pontuais;
• Toda estimativa intervalar está associada a um grau de
confiança;
• Quando se tem n < 30 ou não se conhece o desvio-padrão
da população usamos a distribuição t.

Referência Bibliográfica
Triola – Introdução a Estatística, p.144-158;
Stevenson - Estatística aplicada à Administração
Slack – Estatística para Administração; p. 262-277.
Soares et al.; - Introdução a Estatística; p.132 –155
Estimativa pontual para proporção
• A estimativa de proporções populacionais é muito semelhante à de
médias populacionais;

Estimadores

Estimativa pontual de Estimativa intervalar de


uma proporção uma proporção
• 21% das peças são defeituosas; • Entre 18 e 23% das peças são
•45% dos eleitores votariam defeituosas;
novamente no Presidente Lula • A proporção de votos para reeleição
do Presidente está entre 15 a 25%.

• A média de uma distribuição amostral de proporções amostrais


é sempre igual a verdadeira proporção da população.
Intervalo de Confiança
O QUE É PROPORÇÃO?
Num lote de 1000 peças foram encontradas 150 peças defeituosas, logo

Proporção de peças defeituosas é P = (150/1000)*100 = 15%


Existem 15% de peças defeituosas no lote.

Nos outros lotes a proporção é a mesma? Possivelmente serão diferentes.

O que podemos falar sobre esta proporção na população?

Precisamos estimar

Intervalo de confiança
Estimativa pontual para a média
Sendo:
π = p = proporção da população
p̂ = proporção média das proporções amostrais (x/n)
q̂ = 1- p̂
Desvio padrão da distribuição
Erro das médias das proporções
pˆ qˆ
pˆ qˆ sp =
e = z / 2 n
n
1- α = grau de confiança
Intervalo de confiança
α = nível de significância
p = pˆ  e (probabilidade de erro)

pˆ  e  p  pˆ  e
Intervalo de Confiança
Estimativa pontual Estimativa intervalar

 pˆ .qˆ 
O estimador da proporção amostral:

Sendo X o número de  pˆ  Z  . 
x  2 n 
pˆ =
elementos da amostra
(n) que apresenta a • Intervalo de (1-)% de confiança;
n característica de estudo;
• Supondo amostras grandes (n > 40);

O erro-padrão da estimativa: • Se população for finita e n > 5% de N:

pˆ .qˆ
Sendo:  pˆ .qˆ N  n 
EP( p ) = qˆ = 1  pˆ  pˆ  Z  . . 
n  2 n N  1 

Para o cálculo  pˆ .qˆ 


A proporção populacional é igual a
do tamanho da n = Z  2 
2

2  E 
proporção amostral!
amostra:
Intervalo de Confiança
Populações grandes Populações finitas ou quando
ou infinitas amostra é superior a 5% da
população ( n/ N > 5%)
Não há necessidade de Não se faz a reposição;
reposição A probabilidade de cada prova
Probabilidades de cada varia
prova é constante Os desvios padrões das
distribuições amostrais devem ser
multiplicados pelo fator de
correção finita
N n N – população
N 1 n - amostra
Correções p/ Populações Finitas

Desvio padrão das médias amostrais


s N n
sx =
n N 1

Desvio padrão das proporções amostrais


pˆ qˆ N  n
sp =
n N 1
Exercícios
Uma amostra de 200 observações acusou 20 baterias
defeituosas numa remessa. Usando uma confiança de 99%,
determine o erro de estimação máximo provável.

x 20
pˆ = = = 0,10 qˆ = 1  pˆ = 1  0,10 = 0,90
n 200

Grau de confiança de 95% implica em:


1 -  = 99% Z  = Z 0, 005 = 2,58
 = 1% = 0,010 2

pˆ .qˆ (0,10).(0,90)
E ( pˆ ) = Z  . = 2,58 = 0,0547 5,47%
2 n 200
Exercícios
Um fabricante de cintos de segurança deseja estimar a probabilidade
dos cintos resistirem a um esforço. Como o teste é destrutível, ele
deseja manter o tamanho da amostra o menor possível. Determine o
número de observações que devem ser feitas para estimar a
probabilidade a menos de 0,04 com 95% de confiança, se ele crê
(baseando-se em experimentos anteriores) que a percentagem de
defeituosos não supere a 6%.

 pˆ .qˆ  2  0,06.(0,94) 
n = Z  2  = 1,96 .
2
 = 135,4 = 136
E 
2
 0,04 
Exercícios
Qual o tamanho da amostra necessária para estimar o tempo médio que um
vendedor de uma loja de móveis gasta com cada cliente, a menos de 2
minutos do verdadeiro valor, para obter um nível de confiança de 99% de
confiança? Suponha o desvio da população igual a 12 minutos (obs.:
sempre arredondamos a resposta para o próximo número inteiro superior.)
E = 2 minutos
s = 12 minutos
Grau de confiança de 99% implica em:
1 -  = 99%
 = 1% = 0,01 Z  = Z 0,0050  2,58
2

 Z / 2 .s   (2,58).(12) 
2 2

n=  =  = 239,63 = 240


 E   2 
Exercícios
A Polícia Rodoviária faz mensalmente uma pesquisa para avaliar a velocidade
desenvolvida nas rodovias durante o período de 2 às 4 horas da madrugada. Num
período de observação e em um trecho específico, 100 carros passaram por um
aparelho de radar a uma velocidade média de 115 Km/h, com desvio padrão de
10 Km/h.
a) Estime a verdadeira média (estimativa pontual) da população; 115 Km/h
b) Construa um intervalo de 98% de confiança para a média da população;
Grau de confiança de 98% implica em: Intervalo de confiança
1 -  = 98%
 = 2% = 0,02
Z  = Z 0, 01  2,33 xE    xE
2

115  2,33    115  2,33


Margem de erro:
s 10 [112,67 ;117,33]Km/h
E = Z . = 2,33. = 2,33
2 n 100
Exercícios
Uma amostra aleatória de 40 contas não-comerciais na filial de um banco
acusou saldo médio de R$140,00 com desvio-padrão de R$30,00.
a) Construa um intervalo de 95% confiança para a verdadeira média.
b) Construa um intervalo de 99% confiança para a verdadeira média.
c) A que conclusão podemos chegar com os resultados das letras anteriores?
Z  = Z 0, 025  1,96 Z  = Z 0, 005  2,58
2 2

Margem de erro: Margem de erro:


s 30 s 30
E = Z . = 1,96. = 9,30 E = Z . = 2,58. = 12,24
2 n 40 2 n 40

Intervalo de confiança Intervalo de confiança

140  9,30    140  9,30 140  12,24    140  12,24


[130,70 ; 149,30] R$ [127,76 ; 152,24]R$

140+9,30 140+12,24
Exercícios
Um grupo de pesquisa de mercado constatou que 25% dos 200 fregueses
recentemente entrevistados num grande shopping center de Belo Horizonte
residem a mais de 5 Km deste local.
a) Construa um intervalo de 95% de confiança para a percentagem efetiva
de fregueses que moram a mais de 5 km do Shopping Center;
b) Qual é o erro provável máximo associado ao intervalo?
X
pˆ = = 0,25 qˆ = 1  pˆ = 1  0,25 = 0,75
n
pˆ .qˆ (0,25).(0,75)
E = Z = 1,96. = 0,0600
2 n 200
Erro máximo 6%.

pˆ  E  p  pˆ  E
Intervalo de
confiança 0,250  0,0600  p  0,250  0,0600
0,190  p  0,310
Estimativa pontual para a média
A Biblioteca da faculdade deseja estimar a percentagem de livros de seu
acervo que são publicados até 1995. Qual deve ser o tamanho da amostra
aleatória para se ter 90% de confiança de ficar menos de 5% da verdadeira
proporção?
Grau de confiança de 90% implica em:
1 -  = 90%
Z  = Z 0, 05 = 1,65
 = 10% = 0,10 2

Quando, o enunciado do problema não contém informação sobre o tamanho


possível da proporção populacional, os cálculos devem basear-se no
intervalo mais amplo possível, o que ocorre quando o valor amostral da
proporção é igual à: pˆ = 0,50
A proporção de uma amostra piloto seria uma 2ª opção

 pˆ .qˆ  2  0,5.(1  0,5) 


n = Z  E 2  = 1,65 . 0,05 2  = 272,25 = 273
2

2  
www.matematiques.com.br

Você também pode gostar