Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTATÍSTICA
Intervalos de Confiança
Francisca Mendonça Souza
5. INTERVALOS DE CONFIANÇA
Parâmetro
Uma empresa pretende lançar um novo produto no mercado nacional. Ao estudar a
população constituída por todos os potenciais clientes do novo produto considerou-se
importante analisar
• idade média dos potenciais clientes do novo produto
• percentagem de clientes que estão decididos a adquirir o novo produto
Geralmente há "quantidades" acerca de uma população que se pretendem conhecer ⇒
parâmetros. Os parâmetros são estimados por estatísticas que são calculadas a partir da
amostra.
Parâmetro - Valor exato, mas desconhecido.
Estatística - Valor conhecido, mas que contém certo erro.
Objetivo: utilizar as estatísticas para inferir sobre a população subjacente à amostra. Isto
significa que as estatísticas permitem obter determinados valores que servem de
estimativas dos parâmetros (desconhecidos) - estimativas pontuais.
Amostra representativa - Para se poder utilizar as estatísticas para estimar os parâmetros
é necessário que as amostras sejam representativas da população de onde foram retiradas.
Uma amostra que não seja representativa da população diz-se enviesada.
Estimador - É uma variável aleatória, função da amostra aleatória, que para valores
observados da amostra fornece estimativas pontuais ou intervalares do parâmetro
populacional desconhecido.
Estimativa - É um valor concreto assumido pelo estimador para uma particular amostra.
• Estimador pontual (privilegia a precisão)
• Estimador intervalar (privilegia a confiança)
Estimação Pontual
O que é um "bom" estimador?
Propriedades (Critério)
• Valor esperado do estimador deve ser igual ao verdadeiro valor do parâmetro a
estimar (estimador centrado ou não enviesado).
• Entre os que satisfazem a condição anterior deve ter variância mínima.
Ex.: Nas populações simétricas podem existir vários estimadores centrados para o valor
médio (média e mediana) mas é a média que tem variância mínima.
Parâmetros Estimadores
Teorema 5.1 Se X1, X2, …. Xn são variáveis aleatórias independentes em que X ~ N(,),
i = 1,2,..., n, então
𝑋 − 𝜇
𝑃 (−𝑍1− 𝛼 ≤ 𝜎 ≤ 𝑍1− 𝛼 ) = 1 − 𝛼 ⇔
2 2
√𝑛
𝜎 𝜎
⇔ 𝑃 (−𝑍1− 𝛼 ≤ 𝑋 − 𝜇 ≤ 𝑍1− 𝛼 )= 1− 𝛼 ⇔
2 √𝑛 2 √𝑛
𝜎 𝜎
⇔ 𝑃 (− 𝑋 − 𝑍1− 𝛼 )= 1− 𝛼 ⇔
≤ − 𝜇 ≤ − 𝑋 + 𝑍1− 𝛼
√𝑛 2 2 √𝑛
𝜎 𝜎
⇔ 𝑃 ( 𝑋 + 𝑍1− 𝛼 ≥ 𝜇 ≥ 𝑋 − 𝑍1− 𝛼 )= 1− 𝛼 ⇔
2 √𝑛 2 √𝑛
𝜎 𝜎
⇔ 𝑃 ( 𝑋 − 𝑍1− 𝛼 ≤ 𝜇 ≤ 𝑋 + 𝑍1− 𝛼 )= 1− 𝛼 ⇔
2 √𝑛 2 √𝑛
𝑍1 −𝛼 = 𝑍0,975 = 1,96
2
𝛼
1− α = 0,99 ⇔ 1 − 2 = 0,995
𝑍1 −𝛼 = 𝑍0,95 = 2,576
2
5.2. Intervalo de confiança para o valor médio () com população normal e desvio
padrão da população desconhecido
Teorema 5.2 Se X1, X2, …. Xn são variáveis aleatórias independentes em que X ~ N(,),
i = 1,2,..., n, então
Teorema 5.3 Se X1, X2, …. Xn são variáveis aleatórias independentes em que X ~ N(,),
i = 1,2,..., n, então
Demonstração
Para um grau de confiança de 1−α,
𝑋 − 𝜇
𝑃 (−𝑡𝑛−1; 1− 𝛼 ≤ ≤ 𝑡𝑛−1; 1− 𝛼 ) = 1 − 𝛼 ⇔
2 𝑆′ 2
√𝑛
𝑆′ 𝑆′
⇔ 𝑃 (−𝑡𝑛−1; 1− 𝛼 ≤ 𝑋 − 𝜇 ≤ 𝑡𝑛−1; 1− 𝛼 )= 1− 𝛼 ⇔
2 √𝑛 2 √𝑛
𝑆′ 𝑆′
⇔ 𝑃 (− 𝑋 − 𝑡𝑛−1; 1− 𝛼 ≤ − 𝜇 ≤ − 𝑋 + 𝑡𝑛−1; 1− 𝛼 )= 1− 𝛼 ⇔
2 √𝑛 2 √𝑛
𝑆′ 𝑆′
⇔ 𝑃 ( 𝑋 + 𝑡𝑛−1; 1− 𝛼 ≥ 𝜇 ≥ 𝑋 − 𝑡𝑛−1; 1− 𝛼 )= 1− 𝛼 ⇔
2 √𝑛 2 √𝑛
𝑆′ 𝑆′
⇔ 𝑃 ( 𝑋 − 𝑡𝑛−1; 1− 𝛼 ≤ 𝜇 ≤ 𝑋 + 𝑡𝑛−1; 1− 𝛼 )= 1− 𝛼 ⇔
2 √𝑛 2 √𝑛
O intervalo de confiança para o valor médio () :
𝑆′ 𝑆′
[𝑋 − 𝑡𝑛−1; 1− 𝛼 ; 𝑋 + 𝑡𝑛−1; 1− 𝛼 ]
2 √𝑛 2 √𝑛
5.2 Exercício
• Construção do intervalo
IC para µ com σ desconhecido a (1 − α)100%
𝑆′ 𝑆′
[𝑋 − 𝑡𝑛−1; 1− 𝛼 ; 𝑋 + 𝑡𝑛−1; 1− 𝛼 ]
2 √𝑛 2 √𝑛
Retomando o exercício
𝑥̅ = 10, 06
S’ = 1, 8
tn−1;1− α /2 = t7;0,975 = 2, 365
5.3. Intervalo de confiança para o valor médio () com população desconhecida e
desvio padrão da população conhecido
Se X1, X2, …. Xn são variáveis aleatórias independentes em que E(Xi) = µ, i = 1,2,..., n,
(Xi) i = 1,2,..., n, então
𝑍1 −𝛼 = 𝑍0,975 = 1,96
2
O intervalo de confiança:
10 10
[125 − 1,96 ; 125 + 1,96 ] = [121,73; 128,27]
√36 √36
𝜎 𝜎
[𝑋 − 𝑍1− 𝛼 ; 𝑋 + 𝑍1− 𝛼 ]
2 √𝑛 2 √𝑛
• População normal, com σ desconhecido
𝑆′ 𝑆′
[𝑋 − 𝑡𝑛−1; 1− 𝛼 ; 𝑋 + 𝑡𝑛−1; 1− 𝛼 ]
2 √𝑛 2 √𝑛
• População qualquer, n > 30 e σ desconhecido
𝑆′ 𝑆′
[𝑋 − 𝑍1− 𝛼 ; 𝑋 + 𝑍1− 𝛼 ]
2 √𝑛 2 √𝑛
2
(𝑛 − 1)𝑆′2
𝑃 (𝜒 𝛼 ≤ ≤ 𝜒 2 𝑛−1; 1− 𝛼 ) = 1 − 𝛼 ⇔
𝑛−1;
2 𝜎2 2
1 𝜎2 1
⇔ 𝑃( ≤ ≤ 2 )= 1− 𝛼 ⇔
𝜒 2 𝑛−1; 1− 𝛼 (𝑛 − 1)𝑆′ 2 𝜒 𝑛−1; 𝛼
2 2
(𝑛 − 1)𝑆′2 2
(𝑛 − 1)𝑆′2
⇔ 𝑃( 2 ≤ 𝜎 ≤ )= 1− 𝛼 ⇔
𝜒 𝑛−1; 1− 𝛼 𝜒 2 𝑛−1; 𝛼
2 2
(𝑛 − 1)𝑆′2 (𝑛 − 1)𝑆′2
[ ; ]
𝜒 2 𝑛−1; 1− 𝛼 𝜒 2 𝑛−1; 𝛼
2 2
(𝑛 − 1)𝑆′2 (𝑛 − 1)𝑆′2
[√ ; ]
𝜒 2 𝑛−1; 1− 𝛼 √ 𝜒 2 𝑛−1; 𝛼
2 2
Exemplo 5.5 Num determinado período, foram selecionados aleatoriamente alguns
clientes de uma superfície comercial para estimar a despesa efetuada. Verificou- -se, numa
amostra de 30 clientes, que o desvio padrão corrigido era de 25,18€. Admitindo que a
despesa efetuada tem uma distribuição normal, determine um intervalo de confiança a
99% para:
a) A variância da população.
b) O desvio padrão da população.
Resolução:
Desvio padrão da amostra S’= 25,18
Dimensão da amostra n=30
Grau de confiança 1−α = 0,99
1− α = 0,99
α =0,01
𝛼
1 − 2 = 0,995
Substituindo os valores:
(30−1)25,182 (30−1)25,182
[ ; ] = [351,567; 1403,583]
52,3 13,1
(𝑛 − 1)𝑆′2 (𝑛 − 1)𝑆′2
𝑃( < 𝜎2 < ) = 0,95
16 1,69
No seu exemplo, você quer encontrar o valor da qui-quadrado com 49 graus de liberdade
e um nível de significância de 10% (ou seja, alfa = 0.10) e 95% (ou seja, alfa = 0.95) .
# Definindo os parâmetros
graus_de_liberdade <- 49
nivel_de_significancia <- 0.10
# Definindo os parâmetros
graus_de_liberdade <- 49
nivel_de_significancia <- 0.95
Ao executar o código acima no R Studio, você obterá o valor crítico da qui-quadrado com
49 graus de liberdade para um nível de significância de 10% e 95%. Lembre-se que a
função "qchisq()" utiliza como argumento o valor de probabilidade complementar a alfa
(1 - alfa), por isso utilizamos "1 - nivel_de_significancia". Isso porque a função retorna o
valor da cauda direita da distribuição qui-quadrado.
5.6 Intervalo de confiança para a proporção
Se X1, X2, …. Xn são variáveis aleatórias independentes em que X ~ Ber(p), i = 1,2,..., n,
então
𝑋 − 𝑝
𝑃 −𝑍1− 𝛼 ≤ ≤ 𝑍1− 𝛼 = 1− 𝛼 ⇔
√𝑝(1 − 𝑝)
2 2
( 𝑛 )
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
⇔ 𝑃 (−𝑍1− 𝛼 √ ≤ 𝑋 − 𝑝 ≤ 𝑍1− 𝛼 √ )= 1− 𝛼 ⇔
2 𝑛 2 𝑛
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
⇔ 𝑃 (− 𝑋 − 𝑍1− 𝛼 √ ≤ − 𝑝 ≤ − 𝑋 + 𝑍1− 𝛼 √ )= 1− 𝛼 ⇔
2 𝑛 2 𝑛
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
⇔ 𝑃 ( 𝑋 + 𝑍1− 𝛼 √ ≥ 𝑝 ≥ 𝑋 − 𝑍1− 𝛼 √ )= 1− 𝛼 ⇔
2 𝑛 2 𝑛
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
⇔ 𝑃 ( 𝑋 − 𝑍1− 𝛼 √ ≤ 𝑝 ≤ 𝑋 + 𝑍1− 𝛼 √ )= 1− 𝛼 ⇔
2 𝑛 2 𝑛
Substituindo p pelo seu estimador 𝑋 obtemos o intervalo de confiança para a proporção (p):
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
( 𝑋 − 𝑍1− 𝛼 √ ; 𝑋 + 𝑍1− 𝛼 √ )
2 𝑛 2 𝑛
Exemplo 5.6 Num estudo de mercado efetuado numa determinada localidade, 45% dos
inquiridos afirmou que era cliente da empresa de telecomunicações A.
a) Sabendo que o número de inquiridos foi de 300, determine um intervalo de confiança
(95%) para a proporção de clientes da empresa A.
b) Sabendo que nessa localidade vivem 20000 clientes das empresas de
telecomunicações, determine um intervalo de confiança a 95% para estimar o número de
clientes da empresa A.
Resolução
n=300
̅ = 𝟎, 𝟒𝟓
𝒙
a) Grau de confiança
1-α = 0,95
α = 1-0,95 = 0,05
𝑍1− 𝛼 = 𝑍0,975 = 1,96
2
Exercício 5.6
Uma empresa pretende lançar um novo produto no mercado nacional. O respetivo estudo
de mercado tem por principal objetivo estimar a proporção de potenciais clientes para o
novo produto. Dos 1000 potenciais clientes inquiridos 845 responderam que pretendem
adquirir o novo produto. Utilizando um grau de confiança de 99% estime o referido
parâmetro.
• Parâmetro a estimar
p proporção de clientes que pretende adquirir o novo produto
𝑋 − 𝑝
𝑃 −2, 576 ≤ ≤ 2, 576 = 0,99 ⇔
√𝑝(1 − 𝑝)
( 𝑛 )
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑃 (−2, 576 √ ≤ 𝑋 − 𝑝 ≤ 2, 576 √ ) = 0,99 ⇔
𝑛 𝑛
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑃 (− 𝑋 − 2, 576 √ ≤ − 𝑝 ≤ − 𝑋 + 2, 576 √ ) = 0,99 ⇔
𝑛 𝑛
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑃 ( 𝑋 + 2, 576 √ ≥ 𝑝 ≥ 𝑋 − 2, 576 √ ) = 0,99 ⇔
𝑛 𝑛
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
⇔ 𝑃 ( 𝑋 − 2, 576√ ≤ 𝑝 ≤ 𝑋 + 2, 576 √ ) = 0,99 ⇔
𝑛 𝑛
𝑋 (1 − 𝑋 ) 𝑋 (1 − 𝑋 )
( 𝑋 − 2, 576√ ; 𝑋 + 2, 576 √ )
𝑛 𝑛
Demonstração:
Exemplo 5.7 Numa amostra de 20 empregados de uma grande empresa, verificou-se que
o salário médio era de 700 u.m. Noutra empresa verificou-se que, em 25 empregados, o
seu salário médio era de 750 u.m.. Admitindo a normalidade, determine um intervalo de
confiança a 95% para a diferença dos salários médios, sabendo que o desvio padrão dos
salários nas duas empresas é, respectivamente, de 110 e 130 u.m..
Resposta
n1= 20 n2= 25
𝑥̅1 = 700 𝑥̅2 = 750
𝜎1 = 110 𝜎2 = 130
Grau de confiança
1-α = 0,95
α = 1-0,95 = 0,05
𝑍1− 𝛼 = 𝑍0,975 = 1,96
2
Exercício 5.7
• Construção do intervalo
A dedução do intervalo é semelhante aos casos anteriores e conduz a
IC para µ1 − µ2 a (1 − α)100%
Resolução:
Grau de confiança
1-α = 0,95
α = 1-0,95 = 0,05
𝑍1− 𝛼 = 𝑍0,975 = 1,96
2
Como o valor 0 (zero) não pertence ao intervalo de confiança pode-se concluir que
existem diferenças entre os salários médios das duas regiões.
Demonstração
Atendendo que:
e que
• Construção do intervalo
Resolução:
Grau de confiança
1-α = 0,95
α = 1-0,95 = 0,05
𝑍1− 𝛼 = 𝑍0,975 = 1,96
2