Você está na página 1de 44

UFSC- UNIVERSIDADE FEDERAL

CMIP- DE
Centro de SANTA eCATARINA
Metrologia Inovação em Processos

TEORIA
DA
ESTIMAÇÃO

Profª Andréa
Introdução

O campo da inferência estatística consiste naqueles


métodos usados para tomar decisões ou tirar conclusões a
cerca de uma população. Esses métodos utilizam a
informação contida em uma amostra da população para tirar
conclusões.

POPULAÇÃO HISTOGRAMA
média populacional média amostral
Amostra
desvio padrão desvio padrão
populacional amostral

Figura 1: Relação entre uma população e uma amostra


Inferência Estatística

POPULAÇÃO: todos os
amostragem
possíveis consumidores
AMOSTRA: um subconjunto
dos consumidores

inferência
Definições

• População: é um conjunto de indivíduos ou objetos que


apresentam, pelo menos, uma característica em comum.
• Amostra: parte da população com as mesmas
características. O objetivo de selecionar uma amostra é de
obter conclusões que possam ser generalizadas para a
população, isto é, possam ser inferidas.
• Parâmetro: é uma descrição numérica de uma característica
da população. Alguma medida descritiva (média, variância,
proporção, etc.)
• Estimador ou Estatística Amostral: é uma descrição
numérica de uma característica da amostra, que será usada
no processo de estimação de um parâmetro populacional.
Alguma medida descritiva (média, variância, proporção, etc.)
Definições

• Erro amostral: é o erro que ocorre justamente pelo uso da


amostra. Ele representa a diferença entre o resultado
amostral e o verdadeiro resultado da população. O erro
amostral ocorre devido às variações amostrais.

Exemplo: A média da turma A é 8,5 e a média da amostra com


cinco estudantes é 7,8. O erro amostral é a diferença entre o
parâmetro populacional e a média amostral (8,5 – 7,8), ou
seja, 0,7.
Parâmetros e Estatísticas
População
Amostra
(x1, x2, x3,..., xN)
(X1, X2, ..., Xn)

Parâmetros Estatísticas

Proporção
n o de elementos com o atributo ˆ n o de elementos com o atributo
p P
N n

Média
1 N
1 n

N
 xi X   Xi
i 1
n i 1
Variância
1 N
1 n
 2
 xi   
2
S 2
 i X  X 2

N i 1 n  1 i 1
Estimação de Parâmetros

Conceito :

Estimação é o procedimento usado para obter informações


sobre os parâmetros desconhecidos de uma população com
base nos dados da amostra.
Estimação de Parâmetros
Existem dois tipos fundamentais de estimação de um parâmetro
populacional: por ponto e por intervalo.

Estimação pontual

Quando utilizamos dados amostrais calcula-se um valor da estimativa do


parâmetro populacional e com isso tem-se uma estimativa por ponto do
parâmetro analisado.
Assim, a estatística amostral x , média da amostra, pode ser usada como
um estimador do parâmetro , média da população

Por exemplo, uma amostra aleatória de 200 alunos de uma universidade


de 20.000 estudantes revelou uma média amostral de 5,2. Logo x = 5,2
é uma estimativa pontual da verdadeira nota média dos 20.000 alunos.
Estimação de Parâmetros
Estimativa por Intervalo

Quando, a partir da amostra procura-se construir um intervalo de


variação, de modo que esse intervalo tem uma probabilidade conhecida
de conter o verdadeiro parâmetro populacional.

Ao estimar um parâmetro populacional através de uma amostra,


evidentemente estamos cometendo um erro. Portanto, a deficiência da
estimação pontual reside no fato de que, neste procedimento, não ficamos
conhecendo a medida do possível erro cometido na estimação do
parâmetro de interesse. Desta limitação surge a idéia da estimação por
intervalo.

P(Linf <  < Lsup) = 1-


Estimação de Parâmetros
Estimativa por Intervalo

 = é o parâmetro populacional de interesse

= nível de incerteza ou grau de desconfiança ou nível de significância.

1 -  = coeficiente de confiança ou nível de confiabilidade ou grau


de confiança ou nível de confiança.
Intervalos de Confiança (IC) para a Média Populacional

A questão de quão próxima determinada média amostral pode estar da


média da distribuição amostral, em unidades efetivas, depende da
variabilidade na distribuição amostral (isto é, do desvio padrão da
distribuição amostral). À medida que aumenta o tamanho amostral, o
desvio padrão da distribuição amostral diminui.

Logo, grandes amostras tenderão a produzir médias amostrais que


estão mais próximas da média da população do que pequenas
amostras. Além disso, quanto maior a variabilidade na população,
maior a variabilidade na distribuição amostral.
Intervalos de Confiança para a Média Populacional

Utilizando a Distribuição Normal:

n  30 (Grandes Amostras),  conhecido

n < 30 (Pequenas Amostras),  conhecido

P  (X - z / 2 . x    X  z / 2 . x )
sendo:
σ
σx  População Infinita ou Amostragem com Reposição
n

σ Nn População Finita ou Amostragem sem Reposição


σx 
n N 1
Intervalos de Confiança para a Média Populacional

O gráfico da função da variável normal padronizada “Z” é simétrico.


Logo, o intervalo de confiança para um nível de significância é:

f(x)
X - z / 2 . x    X  z / 2 . x /2 /2
ou 1-
-z/2 z/2
X  z / 2 . x
Intervalos de Confiança para a Média Populacional

Valores selecionados para Zα/2 da tabela da distribuição Normal


padronizada

 0.01 0.02 0.05 0.10

Z/2 2.58 2.33 1.96 1.64

Nível de confiança 99% 98% 95% 90%


Intervalo de Confiança para 

Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média  também
desconhecida e variância 2 = 16. Retira-se uma amostra de 25 valores e calcula-se a
média amostral. Construa um IC de 95% para  supondo que X  12,7.
X - z / 2 . x    X  z / 2 . x
0,14
N (0,1)
4 4
P(12,7  1,96    12, 7  1,96
0,12
)  0,95
25 0,1
25
0,08

P(12, 7  1,568    12, 7  1,568)  0,95


0,06
2,5% 2,5%
0,04
95%
0,02

0
- -z z +
0 5
0
10 15

P(11,132    14, 268)  0,95


?
1,96
Intervalo de Confiança Média Populacional

Exemplo: Em uma indústria de cerveja a quantidade de


cerveja inserida em latas tem se comportado como uma
variável aleatória com média 350 ml e desvio padrão 3 ml.
Após alguns problemas na linha de produção suspeita-se
que teve alteração na média. Uma amostra de 20 latas
acusou média 346 ml. Construa um intervalo de confiança
para o novo valor da quantidade média de cerveja inseridas
em latas, com nível de confiança de 95%, supondo que não
tenha ocorrido alteração no desvio padrão do processo.
Interprete os resultados.
Intervalo de Confiança para Média Populacional

X - z / 2 . x    X  z / 2 . x

Interpretação: A quantidade média μ de cerveja inseridas em


latas, após os problemas na linha de produção, é 346 ml,
tolerando, com 95% de confiança, uma margem de erro de 1,31
ml. Assim, o intervalo (344,69; 347,31) contém, com, 95% de
confiança, o valor μ. Isso mostra que estatisticamente houve
alteração na média do processo, pois o valor da média antiga
(350 ml) não pertence ao intervalo.
Intervalo de Confiança (IC) para Média Populacional 

Caso o desvio padrão populacional  seja conhecido

X - z / 2 . x    X  z / 2 . x

O intervalo de confiança acima somente poderá ser usado nas


situações em que o conhecemos o desvio padrão da população,
o que não é comum na prática. Caso contrário, o procedimento
usual é substituir  pelo desvio padrão calculado com os
dados da amostra quando n  30

P  (X - z / 2 .S x    X  z / 2 .S x )
Intervalos de Confiança para a Média Populacional

Utilizando a Distribuição Normal:

n  30,  desconhecido

P  (X - z / 2 .S x    X  z / 2 .S x )
sendo:
s
sx  População Infinita ou Amostragem com Reposição
n

s Nn
sx  População Finita ou Amostragem sem Reposição
n N 1
Intervalos de Confiança para a Média Populacional

Ex.: Com a intenção de estimar o número de ações negociadas por dia na


bolsa de valores foi realizada uma amostragem aleatória de tamanho n=81
dias. A amostra apresentou média de 12,8 milhões de ações por dia e
desvio padrão s= 2,7 milhões de ações por dia. Estimar a média da
população com intervalo de confiança de 95%.

P  (X - z / 2 .S x    X  z / 2 .S x )
2,7 2,7
P  (12,8 - 1,96.    12,8  1,96. )  12,8  0,59
81 81
Pequenas Amostras (Distribuição de Student “t” n<30)

Foi desenvolvida por William S. Gosset que trabalhava na


indústria de cervejas Guinness, em Dublin, na Irlanda.
Gosset publicou suas descobertas utilizando o pseudônimo
de Student. A distribuição t é chamada de distribuição t de
Student.
Intervalo de Confiança (IC) para Média Populacional 

Distribuição t de Student, tem forma parecida com a normal


padrão, mas é um pouco mais dispersa. Essa dispersão varia
com o tamanho da amostra. É bastante dispersa para amostras
pequenas, ma se aproxima da normal para amostras grandes.
Pequenas Amostras (Distribuição de Student “t” n<30)

Propriedades da Distribuição t de Student

•A distribuição t aproxima-se da distribuição normal à medida que “n”


aumenta. Para n > 30 as diferenças são tão pequenas que podemos utilizar
os valores críticos z;

•A distribuição t tem a mesma forma geral simétrica (forma de sino) que a


distribuição normal, mas reflete a maior variabilidade (com distribuições
mais amplas) que é esperada em pequenas amostras
Pequenas Amostras (Distribuição de Student “t” n<30)

Condições para utilização da Distribuição t de Student

• O tamanho da amostra é pequeno (n < 30)


  é desconhecido
• A população original tem distribuição essencialmente normal (Como
a distribuição da população original em geral é desconhecida,
estimamo-la construindo um histograma de dados amostrais).
Pequenas Amostras (Distribuição de Student “t” n<30)

Utilizando a distribuição t :

s s
X - t / 2 .    X  t / 2 .
n n

s População Infinita ou Amostragem com Reposição


sx 
n

s N n
sx  População Finita ou Amostragem sem Reposição
n N 1
Pequenas Amostras (Distribuição de Student “t” n<30)

Utilizando a distribuição t :
s s
X - t / 2 .    X  t / 2 .
n n

número de desvio padrões utilizando a distribuição de Student (“t”).


t / 2 
Para usar uma tabela t devemos conhecer o nível de confiança
desejado, e o número de graus de liberdade (). O número de graus de
liberdade, para um conjunto de dados, corresponde ao número de
valores que podem variar após terem sido impostas certas restrições a
todos os valores. Assim:

= n – 1
=gl (algumas bibliografias)
Pequenas Amostras (Distribuição de Student “t” n<30)

Sabendo-se que uma amostra tem 20 elementos, que a sua média 120 e desvio
padrão igual a 30. Represente um intervalo de confiança em nível de 95%.

=(n - 1) = 20-1 = 19 referente aos graus de liberdade

s s
X - t / 2 .    X  t / 2 . 
n n
30 30
120  2,09    120  2,09
20 20

105,98h    134,02 h
Pequenas Amostras (Distribuição de Student “t” n<30)

 /  0,1 0,05 0,025 0,01 0,005


1 3,0777 0,3137 12,7062 31,8210 63,6559
2 1,8856 2,9200 4,3027 6,9645 9,9250
3 1,6377 2,3534 3,1824 4,5407 5,8408
4 1,5332 2,1318 2,7765 3,7469 4,6041
5 1,4759 2,0150 2,5706 3,3649 4,0321
6 1,4398 1,9432 2,4469 3,1427 3,7074
7 1,4149 1,8946 2,3646 2,9979 3,4995
8 1,3968 1,8595 2,3060 2,8965 3,3554
9 1,3830 1,8331 2,2622 2,8214 3,2498
10 1,3722 1,8125 2,2281 2,7638 3,1693
11 1,3634 1,7959 2,2010 2,7181 3,1058
12 1,3562 1,7823 2,1788 2,6810 3,0545
13 1,3502 1,7709 2,1604 2,6503 3,0123
14 1,3450 1,7613 2,1448 2,6245 2,9768
15 1,3406 1,7531 2,1315 2,6025 2,9467
16 1,3368 1,7459 2,1199 2,5835 2,9208
17 1,3334 1,7396 2,1098 2,5669 2,8982
18 1,3304 1,7341 2,1009 2,5524 2,8784
19 1,3277 1,7291 2,0930 2,5395 2,8609
20 1,3253 1,7247 2,0860 2,5280 2,8453
21 1,3232 1,7207 2,0796 2,5176 2,8314
Intervalo de Confiança para Proporção

Em muitas situações, o principal parâmetro de interesse é


alguma proporção p, por exemplo:

-A proporção de itens defeituosos em uma linha de produção;


-A proporção de consumidores que vão comprar determinado
produto;
-A proporção de mensagens que chegam adequadamente a
seu destino.
Intervalo de Confiança para Proporção
A utilização da distribuição normal como aproximação da binomial para
construção do intervalo de confiança para proporções é apropriada se:

n  30 n.p5 e n . q  5,

Seja a proporção observada de “sucessos” numa amostra aleatória de n


observações de uma população com proporção p de sucessos. Então, se n é
suficientemente grande para um intervalo de confiança para a proporção
populacional de 100(1 - )% que é dado por

p(1  p) p(1  p)
pˆ  Z  / 2  p  pˆ  Z  / 2
n n
A proporção populacional p não é conhecida , pois este é o valor que está sendo
estimado. Portanto
X característica
pˆ  
n número de elementos da amostra
Intervalo de Confiança para Proporção

Ex: Em 65 lances de uma moeda foram obtidas 26 caras. Determinar os limites de


confiança de 90% para a proporção de caras que seria obtida em um grande
número de lances da moeda.

X 26
pˆ    0,4
n 65

p.(1  p ) 0,24
 pˆ = 
n 65
0,24 0,24
0,4  1,64  p  0,4  1,64  0,4  0,0996
65 65
Dimensionamento do Tamanho da Amostra

A determinação do tamanho de uma amostra é um


problema de grande importância, porque amostras
desnecessariamente grandes acarretam desperdício de
tempo e dinheiro; e amostras demasiadamente pequenas
podem levar a resultados não confiáveis.
O cálculo do tamanho da amostra para cada caso, é feito
sempre em função das fórmulas já estabelecidas para os
Intervalos de Confiança.

.
Dimensionamento do Tamanho da Amostra
Para determinação do tamanho da amostra, algumas
considerações iniciais devem ser feitas:

a)Identificação da variável mais importante para o estudo.

b)Identificação da escala de mensuração da variável:


nominal, ordinal ou intervalar.
- Variáveis nominais: não existe ordenação dentre
as categorias. Exemplos: sexo, cor dos olhos, fumante/não
fumante, doente/sadio.
- Variáveis ordinais: existe uma ordenação entre as
categorias. Exemplos: escolaridade (1º, 2º, 3º graus), estágio
da doença (inicial, intermediário, terminal), mês de
observação (janeiro, fevereiro,..., dezembro).
.
Dimensionamento do Tamanho da Amostra

c) Isto direciona o tipo de estimativa a se fazer: variáveis


categóricas (ou qualitativas) admitirão estudo apenas de
PROPORÇÕES, enquanto que variáveis intervalares
normalmente estaremos interessados na determinação da
MÉDIA.

d) Identificação do tamanho da população: infinita ou finita.

e) Estabelecimento da variância da população: conhecida


ou desconhecida.

.
Dimensionamento do Tamanho da Amostra
Média
2
 Z / 2 .  População Infinita
n 
 e 

2
Z / 2   2  N População Finita
n 2 2
e ( N  1)  Z / 2   2
onde:
n – tamanho da amostra;
z/2 – número de desvios padrões
utilizando a distribuição normal;
 - desvio padrão da população;
e – erro amostral
N – tamanho da população
Dimensionamento do Tamanho da Amostra
A dificuldade operacional para calcularmos o tamanho da amostra é
que o cálculo depende da variância populacional  2 que em geral é
2
desconhecida. Em alguns problemas,  pode ser avaliada por meio
de estudos anteriores ou pela experiência do pesquisador; ou em
outras situações,  2 é obtida de uma amostra piloto, isto é, alguns
elementos da população são examinados e a variância encontrada é
usada no lugar de  .2

.
Dimensionamento do Tamanho da Amostra
Média

EX:
Um economista deseja estimar a renda média para o primeiro ano de
trabalho de um bacharel em direito. Quantos valores de renda devem ser
tomados, se o economista deseja ter 95% de confiança em que a média
amostral esteja a menos de R$500,00 da verdadeira média
populacional? Suponha que saibamos, por um estudo prévio, que para
tais rendas,  =R$ 6250,00.

2 2
 Z / 2 .   1,96.6250 
n     600,25  601
 e   500 
Dimensionamento do Tamanho da Amostra
Média

EX:
Uma população composta por 200 elementos apresenta um desvio
padrão de 5,04. Qual deve ser o tamanho de uma amostra aleatória que
nos permita afirmar com 98% de confiança que não erraremos por mais
que 1,8 unidades ao estimar a média populacional.

2
Z / 2   2  N (2,33) 2  (5,04) 2  200
n 2 2
 2 2 2
 36
e ( N  1)  z / 2   2
(1,8) (200  1)  (2,33)  (5,04)

A amostra deve conter 36 eltos


Dimensionamento do Tamanho da Amostra
Proporção

NA AMOSTRAGEM COM REPOSIÇÃO (pop. infinita)


2
(Z
 /2 ) .[ pˆ . (1  pˆ ) ]
n 2
e
NOTA:
No cálculo do tamanho da amostra para estimar a proporção (p), uma informação
necessária é a estimativa preliminar da proporção p . Esta estimativa pode ser
obtida por meio de:

•dados históricos sobre a população de interesse;


•resultados obtidos em estudos similares ao que está sendo realizado;
•extração de uma amostra piloto.
2
Z   /2
n  . 0,25
 e 
Dimensionamento do Tamanho da Amostra
Proporção

NA AMOSTRAGEM COM REPOSIÇÃO (pop. infinita)

Ex: Um instituto de pesquisa pretende avaliar a proporção de eleitores que


votarão em determinado candidato com 95% de confiança de que não errará por
mais de 3%. Para isto levantou-se uma pré-amostra de 100 eleitores selecionados
ao acaso da população. A proporção de eleitores deste candidato foi de 20%.
Determine o tamanho da amostra necessário para atingir precisão desejada

( Z / 2 ) 2 .[ pˆ . (1  pˆ ) ] (1,96) 2 (0,2).(0,8)
n 2
 2
 683
e (0,03)
Dimensionamento do Tamanho da Amostra
Proporção

EX: Um assistente social deseja saber o tamanho da amostra (n) necessário


para determinar a proporção da população atendida por uma Unidade de Saúde,
que pertence ao município de Cariacica. Não foi feito um levantamento prévio da
proporção amostral e, portanto, seu valor é desconhecido. Ela quer ter 90% de
confiança que sua o erro máximo de estimativa (E) seja de ±5% (ou 0,05).
Quantas pessoas necessitam ser entrevistadas?

2 2
Z
  /2  1,64 .0,25
n  . 0,25  2
 268,96  269
 e  0,05
Devemos, portanto, obter uma amostra de 269 pessoas para determinar a
proporção da população atendida na Unidade de Saúde, que se origina do
município de Cariacica.
Dimensionamento do Tamanho da Amostra
Proporção

NA AMOSTRAGEM SEM REPOSIÇÃO (pop. finita)

2
( Z / 2 ) . pˆ . (1  pˆ ) . N
n 2
e . ( N  1)  Z / 2  . pˆ . 1  pˆ 
2

.
Dimensionamento do Tamanho da Amostra
Proporção
Um despachante que cuida da documentação de automóveis está
interessado em estimar a proporção de clientes que trocaram de carro no
último ano para oferecer seus serviços. Para isto amostrou 80 do seu
cadastro de 400 clientes e consultou-os por telefone verificando que 30
deles haviam trocado de carro no último ano. Determine o tamanho da
amostra necessário para estimar com 90% de confiança esta proporção
com erro máximo de 4%

2
( Z / 2 ) . pˆ . (1  pˆ ) . N
n 2
e . ( N  1)  Z / 2  . pˆ . 1  pˆ 
2

.
Dimensionamento do Tamanho da Amostra
Proporção
Um despachante que cuida da documentação de automóveis está
interessado em estimar a proporção de clientes que trocaram de carro no
último ano para oferecer seus serviços. Para isto amostrou 80 do seu
cadastro de 400 clientes e consultou-os por telefone verificando que 30
deles haviam trocado de carro no último ano. Determine o tamanho da
amostra necessário para estimar com 90% de confiança esta proporção
com erro máximo de 4%
N= 400 X 30
pˆ    0,375
n= 80 n 80
X= 30

(1,64) 2 . (0,375) . (0,625) . 400


n  199
0,04 . (399)  1,64 . (0,375) . (0,625)
2 2

Você também pode gostar