Você está na página 1de 20

3.

Intervalos de confiança 3-1

F.E.U.C. Estatística - MBA

Inferências baseadas numa única amostra:


estimativa com intervalos de confiança

Objectivos:
1. Determinar o que é estimado.
2. Distinguir estimador pontual e estimador de intervalo.
3. Explicar estimadores de intervalo.
4. Calcular os intervalos de confiança para a média da população e proporção.
5. Calcular o tamanho da amostra.

Rodrigo Martins 1

F.E.U.C. Estatística - MBA

Introdução à estimativa
Métodos estatísticos

Métodos
estatísticos

Estatística Estatística
descritiva inferencial

Teste de
Estimativa
hipóteses

Rodrigo Martins 2

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-2

F.E.U.C. Estatística - MBA

Processo de estimativa

População Amostra aleatória A média da


Média amostra vai ser um
Média,  é  X = ? estimador pontual
desconhecida de .

 
 
Amostra 

 

Rodrigo Martins 3

F.E.U.C. Estatística - MBA

Parâmetros desconhecidos da população são estimados

Estimar o parâmetro …com a estatística


da população... da amostra

Média  𝑿
Proporção p ^
p
2
Variância  s2
Diferenças 𝝁𝟏 − 𝝁𝟐 𝑿𝟏 − 𝑿𝟐

Rodrigo Martins 4

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-3

F.E.U.C. Estatística - MBA

Métodos de estimativa

Estimativa

Estimativa Estimativa
pontual de intervalo

Rodrigo Martins 5

F.E.U.C. Estatística - MBA

O que é um estimador pontual?

- Para estimar, por exemplo, a média salarial da população, , uma alternativa é


usar a média aritmética 𝒙. Portanto o nosso estimador tem como REGRA a
soma dos salários 𝑋 e posterior divisão pelo número de elementos da nossa
𝟏
amostra: 𝒙 = ∑𝒏𝒊 𝟏 𝑿𝒊 , 𝒊 = 𝟏, … , 𝒏.
𝒏
- MAS, nada nos impede de escolher outro estimador para . Por exemplo:
𝟏 𝒙
W= ∑𝒏 𝑿 , 𝒊 = 𝟏, … , 𝒏. 𝒐𝒖 𝑽 =
𝒏 𝟏 𝒊 𝟏 𝒊 𝟐

- Questão: Então, que estimador escolhemos para analisar o parâmetro ?

Rodrigo Martins 6

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-4

F.E.U.C. Estatística - MBA

Breve noção das propriedades de um estimador

1. Centricidade ou não enviesamento


Um estimador Z de q diz-se cêntrico ou não enviesado se E(Z)= q.

- A média da amostra é um estimador cêntrico da média da população  .


𝐸 𝑥̅ = 𝜇 𝑥̅
- Exemplo de um estimador não cêntrico da média da população : 𝑣 =
2
𝜇 𝜇 𝜇
𝐸(𝑉) = 𝐵𝑖𝑎𝑠 𝑉 = 𝐸 𝑉 − 𝜇 = −𝜇 =−
2 2 2

Rodrigo Martins 7

F.E.U.C. Estatística - MBA

Breve noção das propriedades de um estimador

2. Eficiência relativa
Se Z1 e Z2 são dois estimadores cêntricos de q, Z1 é eficiente
relativamente a Z2 se 𝑽𝒂𝒓(𝒁𝟏 ) ≤ 𝑽𝒂𝒓(𝒁𝟐 ) para todo q.

Exemplo de eficiência:
- Suponha dois estimadores da média da população  :
1 1
𝑊= 𝑥 𝑥̅ = 𝑥
𝑛−2 𝑛
𝑛 𝜎
𝑉𝑎𝑟 𝑊 = 𝜎 𝑉𝑎𝑟 𝑥̅ =
𝑛−2
𝑛

O estimador da média (𝑥̅ ) é mais eficiente que W dado que:


𝜎 𝑛
𝑉𝑎𝑟(𝑥̅ ) ≤ 𝑉𝑎𝑟(𝑊) pois ≤ 𝜎
𝑛 𝑛−2

Rodrigo Martins 8

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-5

F.E.U.C. Estatística - MBA

Breve noção das propriedades de um estimador


(Propriedades assimptóticas)

3. Consistência
Seja Z um estimador de q, então Z é um estimador consistente de q se,
para qualquer 𝜺 > 0 : 𝑃 𝑍 − 𝜃 > 𝜀 → 0 𝑐𝑜𝑚 𝑛 → ∞ .

Quando Z é consistente dizemos que q é o limite de probabilidade de Z, e


escrevemos Plim (Z) = q.

-Lei dos grandes números:


Sejam x1, x2,…,xn variáveis aleatórias independentes, identicamente
distribuidas com média 𝜇, então: 𝑷𝒍𝒊𝒎 𝒙 = 𝝁
𝑥̅
-Exemplo de um estimador de 𝜇 não consistente: 𝑣 =
2
-A consistência é requerimento mínimo para qualquer estimador.

Rodrigo Martins 9

F.E.U.C. Estatística - MBA

Breve noção das propriedades de um estimador


(Propriedades assimptóticas)
4. Normalidade Assimptótica
Seja Zn uma sequência de variáveis aleatórias tal que, para todos os
números z, 𝑃 𝑍 ≤ 𝑧 → 𝜙 𝑧 quando 𝑛 → ∞.
Com 𝜙 𝑧 é a função cumulativa de distribuição (cdf) Normal (0,1).
- A propriedade significa que à medida que n aumenta a função de
distribuição de Zn aproxima-se da cdf da distribuição normal.
Teorema do limite central:
Seja {x1, x2,…,xn } uma amostra aleatória com média 𝜇 e variância 𝜎 ,
̅
então: 𝑍 = ⁄ tem uma distribuição assimptótica normal
estandardizada.
O teorema conclui que a média de uma amostra aleatória para qualquer
população com variância finita, quando estandardizada, segue uma
distribuição normal com média zero e variância unitária.
Rodrigo Martins 10

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-6

Distribuição normal e média

 Quando uma variável segue uma lei normal isto permite utilizar a tabela da lei
normal para saber probabilidades sobre um determinado evento que a envolva.

Qual a probabilidade da próxima pessoa a entrar na sala ter entre 1,73 e 1,80
metros de altura?
 Mas sabemos que todas as variáveis têm uma média e uma variância.

 Muitas vezes, estamos interessados em saber coisas não sobre a variável, mas
sobre a sua MÉDIA.
 O que fizemos com a discussão sobre as propriedades dos estimadores,
particularmente a NORMALIDADE ASSIMPTÓTICA foi mostrar que a média
aritmética segue uma lei normal. (vejam a média como se fosse uma nova variável
que também tem média e variância).
• O pressuposto da CENTRICIDADE verifica-se para a média ou seja 𝑬 𝒙 = 𝝁
𝝈𝟐
• Também apresentámos a variância da média aritmética: 𝑽𝒂𝒓 𝒙 =
𝒏

𝝈𝟐
Voltando ao exemplo da altura, 𝝈𝟐 é a variância da altura, é a variância da média
𝒏
de altura. 11

F.E.U.C. Estatística - MBA

Métodos de estimativa

Estimativa

Estimativa Estimativa
pontual de intervalo

Rodrigo Martins 12

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-7

F.E.U.C. Estatística - MBA

Estimador pontual
1. Fornece um único valor.
• Baseado em observações de uma única amostra.
2. Não dá nenhuma informação sobre o quão próximo está o valor
encontrado do parâmetro desconhecido da população.

 Uma forma de avaliar a incerteza de um estimador é encontrando o


desvio padrão da amostra, no entanto este nada nos diz sobre onde
pode estar o valor populacional em relação à estimativa.

 Esta limitação é ultrapassada construindo um intervalo de confiança


para a estimativa.

Um estimador de intervalo é a regra, ou fórmula, que nos diz como usar os


dados para calcular um intervalo que estime o parâmetro da população.

Rodrigo Martins 13

F.E.U.C. Estatística - MBA

Estimativa de intervalo ou intervalo de confiança


1. Fornece uma variedade de intervalos.
• Baseados nas observações de uma única amostra.
2. Dá informações sobre a proximidade do parâmetro desconhecido da população.
• Formulado em termos de probabilidade.
– Saber que a proximidade exacta requer o conhecimento do parâmetro
desconhecido da população.
Elementos-chave do intervalo de confiança
Estatística da amostra
(estimador pontual)

Limite de confiança (mais baixo) Limite de confiança (mais alto)

A probabilidade do parâmetro da população estar em algum lugar dentro do intervalo:


(1 – )%
Rodrigo Martins 14

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-8

F.E.U.C. Estatística - MBA

Intervalos de confiança para a média da população 


Parâmetro = estatística ± erro
𝜇 = 𝑋 ∓ 𝑒𝑟𝑟𝑜
Esta relação implica que: 𝑒𝑟𝑟𝑜 = 𝑋 − 𝜇 ou 𝑒𝑟𝑟𝑜 = 𝜇 − 𝑋

Como 𝑍= então:

𝑍=
𝑉𝑎𝑟 𝑥̅ = , logo
logo:
𝑒𝑟𝑟𝑜 = 𝑍 × 𝜎
Obtendo-se: 𝜇 =𝑋∓𝑍×𝜎

Z ~ N(0,1) para
amostras grandes
Rodrigo Martins 15

F.E.U.C. Estatística - MBA

Nível de confiança
1. Probabilidade que o parâmetro desconhecido da população esteja dentro
do intervalo.
2. Representado (1 – )%.
• é a probabilidade de que não esteja dentro do intervalo.
3. Os valores típicos são 99%, 95% e 90%.
4. (1 – )% dos intervalos contêm μ ,  % não.

Distribuição amostral da média da amostra.

/2 1- /2


_
X
𝜎̅ =𝜎

Rodrigo Martins 16

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-9

F.E.U.C. Estatística - MBA

Factores que afectam o tamanho dos intervalos

1. Dispersão de dados.
• Medida por .
é o desvio padrão da
população, que nem
2. Tamanho da amostra.
sempre é conhecido.
𝜎
𝜎̅=
𝑛
3. Nível de confiança.
(1 –  )
• Afecta Z

Rodrigo Martins 17

F.E.U.C. Estatística - MBA

Intervalos de confiança

Intervalos de
confiança

Média Proporção

Amostra grande
(n  30) Amostra pequena

Rodrigo Martins 18

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-10

F.E.U.C. Estatística - MBA

Intervalo de confiança para a média (n  30)


Suposições:
• Amostra aleatória.
• O tamanho da amostra é grande (n  30). Devido ao teorema do
limite central, esta condição garante que a distribuição amostral
de 𝑥̅ é aproximadamente normal. Além disso, para n grande S
será um bom estimador de  .

Intervalo de confiança:

𝜎 𝜎
𝑋−𝑍 . ≤ 𝜇 ≤ 𝑋+𝑍 .
𝑛 𝑛

Rodrigo Martins 19

F.E.U.C. Estatística - MBA

Intervalo de confiança para a média

A média de uma amostra aleatória aproximadamente normal de n = 30 é


𝑋 = 50. Estabeleça um intervalo de confiança de 95% para  se  = 10.

Encontrar o 𝒁𝜶⁄𝟐 a 95% :


𝜎 𝜎
𝑋−𝑍 . ≤𝜇≤𝑋+𝑍 .
𝑛 𝑛
Sabemos que α=0,05, logo fica 𝑍 , . Vamos à tabela da distribuição
de t-Student com 𝑔. 𝑙. = ∞ :

𝑍 , = 1,96

Rodrigo Martins 20

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-11

F.E.U.C. Estatística - MBA

Intervalo de confiança para a média

A média de uma amostra aleatória aproximadamente normal de n = 30 é


𝑋 = 50. Estabeleça um intervalo de confiança de 95% para  se  = 10.

𝜎 𝜎
𝑋−𝑍 . ≤𝜇 ≤𝑋+𝑍 .
𝑛 𝑛

10 10
50 − 1,96 × ≤ 𝜇 ≤ 50 + 1,96 ×
Valor que também
30 30
encontramos na tabela da
distribuição normal. 46,43 ≤ 𝜇 ≤ 53,57

A média da população  encontra-se dentro deste intervalo com um


grau de confiança de 95%.
Se retirarmos repetidamente 100 amostras aleatórias da população e
construirmos 100 intervalos, 95 destes intervalos conterão .
Rodrigo Martins 21

F.E.U.C. Estatística - MBA

Intervalo de confiança para a média (n  30)

Exercício 21:

Suponha que trabalha no Controle de Qualidade da


Dão-Norte e que a empresa tem um novo vinho em
garrafas de 2 litros. O  para garrafas de 2 litros é
0,05 litros. Uma amostra aleatória de 100 mostrou
que 𝑿 = 𝟏, 𝟗𝟗 litros. Qual é o intervalo de confiança
de 90% da verdadeira quantidade média nas garrafas
de 2 litros? 2 litros

População: Garrafas de 2 litros da Dão-Norte.

Atributo: Quantidade de liquido nas garrafas de 2 litros.

𝜎 𝜎
Valor crítico para é 1,645. 𝑋−𝑍 . ≤ 𝜇 ≤ 𝑋+𝑍 .
𝑛 𝑛
Rodrigo Martins 22

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-12

F.E.U.C. Estatística - MBA

Intervalo de confiança para a média (n  30)


Solução do intervalo de confiança:
𝜎 𝜎
𝑋−𝑍 . ≤𝜇≤𝑋+𝑍 .
𝑛 𝑛

, ,
1,99−1,645. ≤ 𝜇 ≤ 1,99 + 1,645.

1,982≤ 𝜇 ≤ 1,998

Valor crítico:

Intervalo de confiança a 90% implica α=0,1 logo = 0,05. O valor crítico encontrado é:

Rodrigo Martins 23

F.E.U.C. Estatística - MBA

Intervalo de confiança para a média (n < 30)


Suposições:
• Amostra aleatória.
• A população deve ser normalmente distribuída (como a amostra é pequena
não podemos recorrer ao TLCentral para garantir a normalidade).

O desvio-padrão da população não está disponível (o que acontece quase


sempre), e dado o tamanho da amostra o desvio-padrão da amostra (S)
deixa de ser uma boa aproximação de  .
Neste caso usa-se a distribuição t-student:

𝜎 𝜎
𝑋−𝑡 . ≤𝜇 ≤𝑋+𝑡 .
𝑛 𝑛
Graus de liberdade
df = n-1

Rodrigo Martins 24

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-13

F.E.U.C. Estatística - MBA

Intervalo de confiança para a média (n < 30)

Exemplo:
Uma amostra aleatória de 𝒏 = 𝟐𝟓 tem 𝒙 = 𝟓𝟎 e 𝒔 = 𝟖. Estabeleça
um intervalo de confiança de 95% para .
𝜎 𝜎
df = 25-1=24 𝑋−𝑡 . ≤ 𝜇 ≤𝑋+𝑡 .
𝑛 𝑛
8 8
50 − 2,064 × ≤ 𝜇 ≤ 50 + 2,064 ×
25 25
46,69 ≤ 𝜇 ≤ 53,30
A média da população  encontra-se dentro deste intervalo com um
grau de confiança de 95%. Se retirarmos repetidamente 100 amostras
aleatórias da população e construirmos 100 intervalos, 95 destes
intervalos conterão .
Rodrigo Martins 25

F.E.U.C. Estatística - MBA

Intervalo de confiança no SPSS


A tabela seguinte contém informação sobre 177 CEOs de empresas
americanas para o ano de 1990, incluindo o intervalo de confiança a 95%
para a média salarial dos CEO’s.

Desvio padrão da média:


𝜎 587,589
𝑆̅= =
𝑛 177

778,70 ≤ 𝜇 ≤ 953,03
Rodrigo Martins 26

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-14

F.E.U.C. Estatística - MBA

Problema: Sondagens de opinião

Entre 29 de Outubro e 3 de Novembro de 2021, o Centro de Estudos


e Sondagens de Opinião (CESOP) da Universidade Católica, inquiriu
878 eleitores sobre as suas intenções de voto nas próximas eleições.

Como fazemos para calcular um


intervalo de confiança simples
para a projecção associada a um
dos partidos ?

NOTA: Quando se faz a distribuição proporcional de registo de não respondentes, sem opinião e abstenção
passa-se a usar a expressão projecção.
Rodrigo Martins 27

F.E.U.C. Estatística - MBA

Intervalo de confiança da proporção

Intervalos de
confiança

Média Proporção
(Amostra grande)
Amostra Amostra
grande pequena

Rodrigo Martins 28

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-15

F.E.U.C. Estatística - MBA

Intervalo de confiança da proporção (p)


Suposições:
• Amostra aleatória selecionada.
• Aproximação normal pode ser usada se:
𝑛 × 𝑝̂ ≥ 15 e 𝑛 × 𝑞 ≥ 15
𝑝̂ = , com x o número de eventos para a proporção de interesse.
𝑞 = 1 − 𝑝̂
Desvio padrão da
Intervalo de confiança: distribuição amostral de 𝑝̂

𝑝̂ × 𝑞 𝑝̂ × 𝑞
𝑝̂ − 𝑍 × ≤ 𝑝 ≤ 𝑝̂ + 𝑍 ×
𝑛 𝑛

NOTA: Não se foca o caso da aproximação normal não poder ser usada (𝑛 × 𝑝̂ < 15 ou 𝑛 × 𝑞 < 15) . Para
essas situações existe um intervalo de confiança específico para amostras pequenas.

Rodrigo Martins 29

F.E.U.C. Estatística - MBA

Intervalo de confiança simples a 95% para a


projecção da percentagem de votos no PS

𝑛 = 878

𝑝̂ = 39% 𝑞 = 100 − 39 = 61%

( 𝑝̂ × 𝑛 = 332,4 𝑞 × 𝑛 = 535,58 )

𝑝̂ = 0,39 𝑞 = 0,61

39 × 61 39 × 61
39 − 1,96 ≤ 𝑝 ≤ 39 + 1,96
878 878

35,8 ≤ 𝑝 ≤ 42,2

Rodrigo Martins 30

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-16

F.E.U.C. Estatística - MBA

Exercício
Uma amostra aleatória de 400 licenciados mostrou que 32 tiraram, pelo
menos, uma pós-graduação. Estabeleça um intervalo de confiança a 95%
para a proporção de licenciados que tira uma pós-graduação, p.
32
𝑝̂ = = 0,08 𝑞 = 1 − 0,08 = 0,92
400

𝑝̂ × 𝑞 𝑝̂ × 𝑞
𝑝̂ − 𝑍 × ≤ 𝑝 ≤ 𝑝̂ + 𝑍 ×
𝑛 𝑛

0,08 × 0,92 0,08 × 0,92


0,08 − 1,96 × ≤ 𝑝 ≤ 0,08 + 1,96 ×
400 400

0,053 ≤ 𝑝 ≤ 0,107

Rodrigo Martins 31

Técnicas Quantitativas de Investigação Sociológica

Intervalo de confiança da proporção


• Estamos a assumir que, na população, a proporção segue uma lei normal. Este
tipo de intervalo é tambem conhecido como intervalo de Wald.

• Note-se que quando há uma acumulação perto dos extremos (0 ou 1) a


amostra necessária para assumir esta hipótese aumenta dramaticamente.
Ex: 𝑝̂ =0,03 implica uma amostra de, no mínimo, 500 observações.

• Na realidade, este tipo de intervalos não funciona tão bem nos casos em que
as observações se acumulam muito perto dos extremos.

• Existem outros ICs alternativos para estas situações e/ou para os casos em
que não se consegue assumir normalidade.

Rodrigo Martins 32

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-17

Técnicas Quantitativas de Investigação Sociológica

Intervalo de confiança da proporção: SPSS


Uma amostra aleatória de 400 licenciados mostrou que 32 tiraram, pelo
menos, uma pós-graduação. Estabeleça um intervalo de confiança a 95%
para a proporção de licenciados que tira uma pós-graduação, p.

32
𝑝̂ = = 0,08 𝑞 = 1 − 0,08 = 0,92
400
0,053 ≤ 𝑝 ≤ 0,107

Output SPSS:

Rodrigo Martins 33

F.E.U.C. Estatística - MBA

Encontrando o tamanho das amostras


Quando pretendemos recolher dados para fazer inferência a respeito da
média ou proporção de determinada população, uma das decisões mais
importantes é seleccionar o tamanho adequado da amostra.

O tamanho adequado da amostra vai depender do grau de confiança que


nós pretendemos.

Não quero usar uma


amostra nem muito

  grande nem muito


pequena!

 
Amostra

 

Rodrigo Martins 34

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-18

F.E.U.C. Estatística - MBA

Encontrando o tamanho das amostras


(Estimando a média)

𝑆𝐸
Z= <=> 𝑍 =
𝜎
SE = Erro de amostragem

Não esquecer:
Resolvendo em ordem a SE, vem:
𝜎
𝜎 =
𝑆𝐸 = 𝑍 .𝜎 𝑛

𝜎
𝑆𝐸 = 𝑍 .
𝑛
Resolvendo em ordem a n, vem:

(𝑍 ) 𝜎
𝑛=
(𝑆𝐸)
Rodrigo Martins 35

F.E.U.C. Estatística - MBA

Exercício 18:

Considere que trabalha no Recursos Humanos da


Merrill Lynch e quer examinar os funcionários
para elaborar uma estimativa dos seus gastos
com medicamentos.
Pretende 95% de confiança e que a média da
amostra esteja entre ± $50. Um estudo piloto
mostrou que  era cerca de $400.

Qual o tamanho da amostra a usar?

“Merrill Lynch is one of the world's leading financial management and advisory companies, providing
financial advice and investment banking services.”
Rodrigo Martins 36

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-19

F.E.U.C. Estatística - MBA

Solução para problema da Merrill Lynch

𝑍 = 1,96 𝜎 = 400 SE= 50

(𝑍 ) 𝜎
𝑛=
(𝑆𝐸)

(1,96) (400)
𝑛=
(50)

𝑛 = 245,86 ≈ 246

Rodrigo Martins 37

F.E.U.C. Estatística - MBA

Encontrando o tamanho das amostras


(Estimando a proporção)
É semelhante ao método anterior, só que agora usamos o desvio padrão
da distribuição amostral de 𝑝̂ .
𝑝̂ − 𝑝 <=> 𝑍 = 𝑆𝐸 SE = Erro de amostragem
𝑍= 𝜎
𝜎 Desvio padrão da
distribuição amostral de 𝑝̂
Resolvendo em ordem a SE, vem: 𝑝×𝑞
𝜎 =
𝑆𝐸 = 𝑍 .𝜎 𝑛

𝑝×𝑞
𝑆𝐸 = 𝑍 .
𝑛
Resolvendo em ordem a n, vem:
(𝑍 ) ×𝑝×𝑞
𝑛=
(𝑆𝐸)
Se não houver nenhum estimador de p disponível, usamos p = q = 0,5.
Rodrigo Martins 38

Rodrigo Martins MBA- FEUC


3.Intervalos de confiança 3-20

F.E.U.C. Estatística - MBA

Exemplo do tamanho da amostra


Que tamanho de amostra é necessário para estimar p com 90% de
confiança e largura de 0,03?

p= 𝑞 = 0,5 𝑍 = 1,645

(𝑍 ) ×𝑝×𝑞 1,645 (0,5 × 0,5)


𝑛= = = 3006,69 ≈ 3007
(𝑆𝐸) (0,015)

Rodrigo Martins 39

Rodrigo Martins MBA- FEUC

Você também pode gostar