Você está na página 1de 37

UFSC- UNIVERSIDADE FEDERAL

CMIP- DE
Centro de SANTA eCATARINA
Metrologia Inovação em Processos

TEORIA DA ESTIMAÇÃO

Profª Andréa
Estimação de Parâmetros

Conceito :

Estimação é o procedimento usado para obter informações


sobre os parâmetros desconhecidos de uma população com
base nos dados da amostra.

As estatísticas das amostras (médias, proporções,


variâncias e desvios padrões) são estimadores naturais dos
equivalentes populacionais.
Propriedades Desejáveis de um Estimador

• Não-tendenciosidade: um estimador é não tendencioso (não


viesado; não viciado) se sua média (ou valor esperado) for o próprio
parâmetro que se pretende estimar.
Não Tendenciosidade

−  Xi −
X= E( X ) =  X− = 
n
 Não-tendencioso
Número de ocorrências
(binomial)

X
pˆ = 1 1
E ( pˆ ) = E ( X ) = .np = p
n n n

 Não-tendencioso
Estimação de Parâmetros
Existem dois tipos fundamentais de estimação de um parâmetro
populacional: por ponto e por intervalo.

Estimação pontual

Quando utilizamos dados amostrais calcula-se um valor da estimativa do


parâmetro populacional e com isso tem-se uma estimativa por ponto do
parâmetro analisado.
Assim, a estatística amostral x , média da amostra, pode ser usada como
um estimador do parâmetro , média da população

Por exemplo, uma amostra aleatória de 200 alunos de uma universidade


de 20.000 estudantes revelou uma média amostral de 5,2. Logo x = 5,2
é uma estimativa pontual da verdadeira nota média dos 20.000 alunos.
Estimação de Parâmetros
Estimativa por Intervalo

Quando, a partir da amostra procura-se construir um intervalo de


variação, de modo que esse intervalo tem uma probabilidade conhecida
de conter o verdadeiro parâmetro populacional.

Ao estimar um parâmetro populacional através de uma amostra,


evidentemente estamos cometendo um erro. Portanto, a deficiência da
estimação pontual reside no fato de que, neste procedimento, não ficamos
conhecendo a medida do possível erro cometido na estimação do
parâmetro de interesse. Desta limitação surge a idéia da estimação por
intervalo.

P(Linf <  < Lsup) = 1-


Estimação de Parâmetros
Estimativa por Intervalo

 = é o parâmetro populacional de interesse

= nível de incerteza ou grau de desconfiança ou nível de significância.

1 -  = coeficiente de confiança ou nível de confiabilidade ou grau


de confiança ou nível de confiança.
Intervalos de Confiança (IC) para a Média Populacional

A questão de quão próxima determinada média amostral pode estar da


média da distribuição amostral, em unidades efetivas, depende da
variabilidade na distribuição amostral (isto é, do desvio padrão da
distribuição amostral). À medida que aumenta o tamanho amostral, o
desvio padrão da distribuição amostral diminui.

Logo, grandes amostras tenderão a produzir médias amostrais que


estão mais próximas da média da população do que pequenas
amostras. Além disso, quanto maior a variabilidade na população,
maior a variabilidade na distribuição amostral.
Intervalos de Confiança para a Média Populacional

Utilizando a Distribuição Normal:

n  30 (Grandes Amostras),  conhecido

n < 30 (Pequenas Amostras),  conhecido

P = (X - z / 2 . x    X + z / 2 . x )
sendo:
σ
σx = População Infinita ou Amostragem com Reposição
n

σ N−n População Finita ou Amostragem sem Reposição


σx =
n N −1
Intervalos de Confiança para a Média Populacional

O gráfico da função da variável normal padronizada “Z” é simétrico.


Logo, o intervalo de confiança para um nível de significância é:

X - z / 2 . x    X + z / 2 . x f(x)
/2 /2
ou 1-
X  z / 2 . x -z/2 z/2

onde :
z / 2 . x =  ( erro de estimação ou erro máximo permissível )
Intervalos de Confiança para a Média Populacional

zα/2, é chamado de Valor Crítico, devido a ser o limite que separa


proporções amostrais que são prováveis de ocorrer daquelas que são
improváveis.
f(x)
/2 /2
1-
-z/2 z/2

Valores Críticos
Intervalos de Confiança para a Média Populacional

Intervalos de Confiança para 20 amostras diferentes

Este intervalo não contem a


média
Intervalos de Confiança para a Média Populacional
Valores selecionados para Zα/2 da tabela da distribuição Normal
padronizada

1-0,025=0,975 =1,9 –coluna = 0,06 linha


1,96

 0.01 0.02 0.05 0.10

Z/2 2.58 2.33 1.96 1.64

Nível de confiança 99% 98% 95% 90%


Intervalo de Confiança para 

Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média  também
desconhecida e variância 2 = 16. Retira-se uma amostra de 25 valores e calcula-se a
média amostral. Construa um IC de 95% para  supondo que X = 12,7.
X - z / 2 . x    X + z / 2 .0,14
x N (0,1)
0,12

0,1
4 4
P (12,7 − 1,96    12,7 + 1,960,08 ) = 0,95
25 25
0,06
2,5% 95% 2,5%
0,04

P(12,7 − 1,568    12,7 + 1,568) =0,02


0,95
0
0 - 5 -z 10
0 z 15 +
Estamos 95% confiantes que o intervalo de -1,96 1,96
P(11,132    14,268) = 0,95

realmente contém o verdadeiro valor de µ. Isto significa que se construíssemos


intervalos de confiança a partir de muitas amostras diferentes de mesmo tamanho,
95% deles conteriam efetivamente a média populacional µ
Intervalos de Confiança para a Média Populacional
EX: Uma população tem um desvio padrão igual a 10 e média
desconhecida. Uma amostra de tamanho n = 100 é retirada e fornece uma
média x = 50. Qual o intervalo de 95% de confiança para a média desta
população?
Solução:
Têm-se 1 - α = 95%, então α = 5% e α / 2 = 2,5%.

X - z / 2 . x    X + z / 2 . x
10 10
50 − 1,96    50 + 1,96
100 100
48,04    51,96
Intervalos de Confiança para a Média Populacional

Utilizando a Distribuição Normal:

n  30,  desconhecido

P = (X - z / 2 .S x    X + z / 2 .Sx )
sendo:
s
sx = População Infinita ou Amostragem com Reposição
n

s N−n
sx = População Finita ou Amostragem sem Reposição
n N −1
Intervalos de Confiança para a Média Populacional

Ex.: Com a intenção de estimar o número de ações negociadas por dia na


bolsa de valores foi realizada uma amostragem aleatória de tamanho n=81
dias. A amostra apresentou média de 12,8 milhões de ações por dia e
desvio padrão s= 2,7 milhões de ações por dia. Estimar a média da
população com intervalo de confiança de 95%.

2,7 2,7
P = (12,8- 1,96.    12,8 + 1,96. ) = 12,8  0,59
81 81
Pequenas Amostras (Distribuição de Student “t” n<30)

Foi desenvolvida por William S. Gosset que trabalhava na


indústria de cervejas Guinness, em Dublin, na Irlanda.
Gosset publicou suas descobertas utilizando o pseudônimo
de Student. A distribuição t é chamada de distribuição t de
Student.
Intervalo de Confiança (IC) para Média Populacional 
Distribuição t de Student, tem forma parecida com a normal
padrão, mas é um pouco mais dispersa. Essa dispersão varia
com o tamanho da amostra. É bastante dispersa para amostras
pequenas, ma se aproxima da normal para amostras grandes.
Pequenas Amostras (Distribuição de Student “t” n<30)

Propriedades da Distribuição t de Student

•A distribuição t aproxima-se da distribuição normal à medida que “n”


aumenta. Para n > 30 as diferenças são tão pequenas que podemos utilizar
os valores críticos z;

•A distribuição t tem a mesma forma geral simétrica (forma de sino) que a


distribuição normal, mas reflete a maior variabilidade (com distribuições
mais amplas) que é esperada em pequenas amostras
Pequenas Amostras (Distribuição de Student “t” n<30)

Condições para utilização da Distribuição t de Student

• O tamanho da amostra é pequeno (n < 30)


•  é desconhecido
• A população original tem distribuição essencialmente normal (Como
a distribuição da população original em geral é desconhecida,
estimamo-la construindo um histograma de dados amostrais).
Pequenas Amostras (Distribuição de Student “t” n<30)

Utilizando a distribuição t :

s s
X - t / 2 .    X + t / 2 .
n n

s
sx = População Infinita ou Amostragem com Reposição
n

s N −n
sx = População Finita ou Amostragem sem Reposição
n N −1
Pequenas Amostras (Distribuição de Student “t” n<30)

Utilizando a distribuição t :

s s
X - t / 2 .    X + t / 2 .
n n

número de desvio padrões utilizando a distribuição de Student (“t”).


t / 2 =
Para usar uma tabela t devemos conhecer o nível de confiança
desejado, e o número de graus de liberdade (). O número de graus de
liberdade, para um conjunto de dados, corresponde ao número de
valores que podem variar após terem sido impostas certas restrições a
todos os valores. Assim:

= n – 1
=gl (algumas bibliografias)
Pequenas Amostras (Distribuição de Student “t” n<30)

Sabendo-se que uma amostra tem 20 elementos, que a sua média 120 e desvio
padrão igual a 30. Represente um intervalo de confiança em nível de confiança
de 95%.

=(n - 1) = 20-1 = 19 referente aos graus de liberdade


IC= 95% = alfa=0,05 /2 = 0,025
s s
X - t / 2 .    X + t / 2 . =
n n
30 30
120 − 2,09    120 + 2,09
20 20

105,98h    134,02 h
Pequenas Amostras (Distribuição de Student “t” n<30)

 /  0,1 0,05 0,025 0,01 0,005


1 3,0777 0,3137 12,7062 31,8210 63,6559
2 1,8856 2,9200 4,3027 6,9645 9,9250
3 1,6377 2,3534 3,1824 4,5407 5,8408
4 1,5332 2,1318 2,7765 3,7469 4,6041
5 1,4759 2,0150 2,5706 3,3649 4,0321
6 1,4398 1,9432 2,4469 3,1427 3,7074
7 1,4149 1,8946 2,3646 2,9979 3,4995
8 1,3968 1,8595 2,3060 2,8965 3,3554
9 1,3830 1,8331 2,2622 2,8214 3,2498
10 1,3722 1,8125 2,2281 2,7638 3,1693
11 1,3634 1,7959 2,2010 2,7181 3,1058
12 1,3562 1,7823 2,1788 2,6810 3,0545
13 1,3502 1,7709 2,1604 2,6503 3,0123
14 1,3450 1,7613 2,1448 2,6245 2,9768
15 1,3406 1,7531 2,1315 2,6025 2,9467
16 1,3368 1,7459 2,1199 2,5835 2,9208
17 1,3334 1,7396 2,1098 2,5669 2,8982
18 1,3304 1,7341 2,1009 2,5524 2,8784
19 1,3277 1,7291 2,0930 2,5395 2,8609
20 1,3253 1,7247 2,0860 2,5280 2,8453
21 1,3232 1,7207 2,0796 2,5176 2,8314
Intervalo de Confiança para Proporção
A utilização da distribuição normal como aproximação da binomial para
construção do intervalo de confiança para proporções é apropriada se:

n  30 n.p5 e n . q  5,

Seja a proporção observada de “sucessos” numa amostra aleatória de n


observações de uma população com proporção p de sucessos. Então, se n é
suficientemente grande para um intervalo de confiança para a proporção
populacional de 100(1 - )% que é dado por

p(1 − p) p(1 − p)
pˆ − Z  / 2  p  pˆ + Z  / 2
n n
A proporção populacional p não é conhecida , pois este é o valor que está sendo
estimado. Portanto
X característica
pˆ = =
n número de elementos da amostra
Intervalo de Confiança para Proporção

Ex: Em 65 lances de uma moeda foram obtidas 26 caras. Determinar os limites de


confiança de 90% para a proporção de caras que seria obtida em um grande
número de lances da moeda.

X 26
pˆ = = = 0,4
n 65

p.(1 − p) 0,24
 pˆ = =
n 65
0,24 0,24
0,4 − 1,64  p  0,4 + 1,64 = 0,4  0,0996
65 65
Dimensionamento do Tamanho da Amostra
A determinação do tamanho de uma amostra é um problema de grande importância,
porque amostras desnecessariamente grandes acarretam desperdício de tempo e
dinheiro; e amostras demasiadamente pequenas podem levar a resultados não
confiáveis. O cálculo do tamanho da amostra para cada caso, é feito sempre em
função das fórmulas já estabelecidas para os Intervalos de Confiança

Para determinação do tamanho da amostra, algumas considerações iniciais devem ser


feitas:
a) Identificação da variável mais importante para o estudo a ser feito.
b) Identificação da escala de mensuração da variável: nominal, ordinal ou intervalar.
Isto direciona o tipo de estimativa que se vai fazer: variáveis categóricas admitirão
estudo apenas de PROPORÇÕES, enquanto que para variáveis intervalares
normalmente estaremos interessados na determinação da MÉDIA.

c) Identificação do tamanho da população: infinita ou finita.

d) Estabelecimento da variância da população: conhecida ou desconhecida.


.
Dimensionamento do Tamanho da Amostra
Média

 Z / 2 . 
2

n=  População Infinita


 e 

Z / 2   2  N
2
n= 2 População Finita
e ( N − 1) + Z / 2   2
2

onde:
n – tamanho da amostra;
z/2 – número de desvios padrões
utilizando a distribuição normal;
 - desvio padrão da população;
e – erro amostral (máxima
diferença admitida
. entre  e x
N – tamanho da população
Dimensionamento do Tamanho da Amostra
Média

EX:
Um economista deseja estimar a renda média para o primeiro ano de
trabalho de um bacharel em direito. Quantos valores de renda devem ser
tomados, se o economista deseja ter 95% de confiança em que a média
amostral esteja a menos de R$500,00 da verdadeira média populacional?
Suponha que saibamos, por um estudo prévio, que para tais rendas, 
=R$ 6250,00.

 Z / 2 .   1,96.6250 
2 2

n=  =  = 600,25 = 601


 e   500 
Dimensionamento do Tamanho da Amostra
Média

EX:
Uma população composta por 200 elementos apresenta um desvio
padrão de 5,04. Qual deve ser o tamanho de uma amostra aleatória que
nos permita afirmar com 98% de confiança que não erraremos por mais
que 1,8 unidades ao estimar a média populacional.

Z / 2   2  N (2,33) 2  (5,04) 2  200


2
n= 2 = = 36
e ( N − 1) + z / 2  
2 2
(1,8) (200 − 1) + (2,33)  (5,04)
2 2 2

A amostra deve conter 36 eltos


.
Dimensionamento do Tamanho da Amostra
Proporção

NA AMOSTRAGEM COM REPOSIÇÃO (pop. infinita)


(Z 2
) .[ pˆ . (1 − pˆ ) ]
n=  /2
2
e
NOTA:
No cálculo do tamanho da amostra para estimar a proporção (p), uma informação
necessária é a estimativa preliminar da proporção p . Esta estimativa pode ser
obtida por meio de:

•dados históricos sobre a população de interesse;


•resultados obtidos em estudos similares ao que está sendo realizado;
•extração de uma amostra piloto.
2
Z 
n=  /2
 . 0,25
 e 
Dimensionamento do Tamanho da Amostra
Proporção

NA AMOSTRAGEM COM REPOSIÇÃO (pop. infinita)

Ex: Um instituto de pesquisa pretende avaliar a proporção de eleitores que


votarão em determinado candidato com 95% de confiança de que não errará por
mais de 3%. Para isto levantou-se uma pré-amostra de 100 eleitores selecionados
ao acaso da população. A proporção de eleitores deste candidato foi de 20%.
Determine o tamanho da amostra necessário para atingir precisão desejada

( Z / 2 ) 2 .[ pˆ . (1 − pˆ ) ] (1,96) 2 (0,2).(0,8)
n= 2
= 2
= 683
e (0,03)
Dimensionamento do Tamanho da Amostra
Proporção

EX: Um assistente social deseja saber o tamanho da amostra (n) necessário


para determinar a proporção da população atendida por uma Unidade de Saúde,
que pertence ao município de Cariacica. Não foi feito um levantamento prévio da
proporção amostral e, portanto, seu valor é desconhecido. Ela quer ter 90% de
confiança que sua o erro máximo de estimativa (E) seja de ±5% (ou 0,05).
Quantas pessoas necessitam ser entrevistadas?

2
  /2 
2
Z 1,64 .0,25
n=  . 0,25 = = 268,96 = 269
 e 
2
0,05
Devemos, portanto, obter uma amostra de 269 pessoas para determinar a
proporção da população atendida na Unidade de Saúde, que se origina do
município de Cariacica.
Dimensionamento do Tamanho da Amostra
Proporção

NA AMOSTRAGEM SEM REPOSIÇÃO (pop. finita)

( Z / 2 ) . pˆ . (1 − pˆ ) . N
2
n= 2
e . ( N − 1) + (Z / 2 ) . pˆ . (1 − pˆ )
2
Dimensionamento do Tamanho da Amostra
Proporção
Um despachante que cuida da documentação de automóveis está
interessado em estimar a proporção de clientes que trocaram de carro no
último ano para oferecer seus serviços. Para isto amostrou 80 do seu
cadastro de 400 clientes e consultou-os por telefone verificando que 30
deles haviam trocado de carro no último ano. Determine o tamanho da
amostra necessário para estimar com 90% de confiança esta proporção
com erro máximo de 4%

( Z / 2 ) . pˆ . (1 − pˆ ) . N
2
n= 2
e . ( N − 1) + (Z / 2 ) . pˆ . (1 − pˆ )
2
Dimensionamento do Tamanho da Amostra
Proporção
Um despachante que cuida da documentação de automóveis está
interessado em estimar a proporção de clientes que trocaram de carro no
último ano para oferecer seus serviços. Para isto amostrou 80 do seu
cadastro de 400 clientes e consultou-os por telefone verificando que 30
deles haviam trocado de carro no último ano. Determine o tamanho da
amostra necessário para estimar com 90% de confiança esta proporção
com erro máximo de 4%
N= 400 X 30
pˆ = = = 0,375
n= 80 n 80
X= 30

2
(1,64) . (0,375) . (0,625) . 400
n= = 199
0,04 . (399) + (1,64) . (0,375) . (0,625.
2 2

Você também pode gostar