Você está na página 1de 39

INTERVALOS DE

CONFIANÇA

Adaptado de “Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc”
Intervalos de confiança

1. Conceitos
2. Intervalo de confiança para o valor médio, m,
de populações normais
3. Intervalo de confiança para a variância, s2, e
desvio padrão, s, de populações normais
4. Intervalo de confiança para a proporção, p, de
populações com distribuição Binomial
(amostras de grande dimensão)
5. Determinação da dimensão da amostra, n
Objectivos
Depois desta unidade, os alunos devem ser capazes de:

 Explicar os conceitos de amostra e população


 Perceber o que é uma amostra aleatória simples e quão importante é a
amostragem
 Explicar as diferenças entre Estatística Descritiva e Inferência
Estatística (ou Estatística Indutiva)
 Perceber o conceito de distribuição de amostragem
 Distinguir entre estimativa pontual e estimativa intervalar ou intervalo
de confiança (IC)
 Construir e interpretar IC para o valor médio, variância, desvio padrão e
proporção
Conceitos: Estatística Descritiva
vs Inferência Estatística
 Estatística Descritiva
Recolher, representar, organizar os dados e calcular medidas
amostrais de acordo com o tipo de dados.

 Inferência Estatística
Tirar conclusões e/ou tomar decisões sobre a população com base
no estudo da amostra recolhida.
Permite obter informações sobre parâmetros populacionais
desconhecidos com base em estatísticas amostrais.
Conceitos: População e amostra
 Uma População é o conjunto formado por todos os
objectos, indivíduos ou resultados experimentais com uma
característica em comum, a qual se pretende estudar.
Exemplos:
 Todos os votantes na próxima eleição;
 Todos os salários auferidos no mês de Março;
 Notas de todos alunos da Universidade Lusófona;
 etc.

 Uma Amostra é um qualquer subconjunto da população


Exemplos:
 Mil votantes na próxima eleição seleccionados numa entrevista aleatória;
 Salários auferidos no mês de Março, pelos trabalhadores de certo banco;
 Notas dos alunos da ECEO da Universidade Lusófona;
 etc.
Porquê uma Amostra?

 Menos tempo despendido do que num censo.

 Menos custos do que num censo.

 É possível obter resultados estatísticos com


uma precisão relativamente elevada baseada
em amostras.
Conceitos

Amostras Aleatórias (a.a.) Simples


 Todos os objectos da população têm igual possibilidade
de serem seleccionados
 Os objectos são seleccionados de forma independente
 As amostras podem ser obtidas a partir de uma tabela
de números aleatórios ou criando, no computador,
geradores de números aleatórios.
Conceitos
 Inferência Estatística: Estabelecer conclusões sobre uma
população analisando os resultados de uma sua amostra
Estatísticas amostrais Parâmetros Populacionais
(conhecidas) Inferência (desconhecidos, mas
podem ser estimados
a partir da amostra)

Sample
Amostra
Population
População
Conceitos
 Parâmetro populacional – é uma medida numérica fixa que
caracteriza uma população. Baseia-se nos valores de todos os
elementos da população (Exemplos: μ, s2 , s e p).

 Estatística – São características de amostra, i.e., são valores que


caracterizam determinada amostra e que são variáveis de amostra para
amostra, por isso são variáveis aleatórias (Exemplos: 𝑋, S´2, S´ e 𝑝).
Para cada amostra selecionada, é obtido um valor observado da
estatística (Exemplos: 𝑥, 𝑠 ´2 , 𝑠´ e 𝑝).

 Estimador – É uma estatística e portanto uma v.a. função da amostra


e que fornece um valor concreto para o parâmetro desconhecido.

 Estimativa - É um valor concreto assumido pelo estimador para uma


amostra em particular.
Conceitos

População X Estatística
Amostra média por exemplo

x1
Valores
E(X) observados
x2
da variável
… … aleatória
valor médio X
xk

variabilidade
Conceitos
Distribuição de amostragem de uma estatística é a
distribuição dos valores que a estatística assume para todas as
possíveis amostras, da mesma dimensão, da população.

Inferência sobre os parâmetros populacionais


correspondentes

por exemplo A distribuição de amostragem da média vai-nos


permitir fazer inferência sobre o valor médio da
população de onde foi retirada a amostra que
serviu para calcular a média.
Inferência estatística

Inferência
Estatística

Estimação Teste de
de Hipóteses
Parâmetros

Estimação Estimação
Pontual intervalar
Estimação

 Estimação pontual
 Estimar o valor médio da população através da media
da amostra
 Estimação intervalar
 Estimar o valor médio da população através de um
intervalo (intervalos de confiança a 100 (1-a)%)
Estimação
Parâmetro populacional Estatística Amostral Estimativa pontual
Estimador Pontual
𝑛
Valor médio m 𝑖=1 𝑋𝑖 𝑥
𝑋=
𝑛

Variância s2 𝑛
𝑖=1(𝑋𝑖 −𝑋)
2
𝑠 ´2
𝑆´2 =
𝑛−1
𝑛 2
𝑖=1 𝑋𝑖− 𝑛𝑋 2
=
𝑛−1

Desvio s 𝑛 2
padrão 𝑖=1(𝑋𝑖 −𝑋) 𝑠´
𝑆´ = =
𝑛−1
𝑛 2
𝑖=1 𝑋𝑖 − 𝑛𝑋 2
𝑛−1
Proporção p 𝑁º 𝑑𝑒 "sucessos"
𝑝 = 𝑛𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 𝑝
𝑛
Estimação
 Uma estimativa pontual é um único valor (Exemplo: uma
estimativa pontual para o valor médio é a média da amostra).
 Uma estimativa intervalar fornece um conjunto de valores, na
forma de um intervalo que, com certo grau de certeza,
previamente estipulado, contém o parâmetro que se pretende
estimar.

Limite 𝑀𝑎𝑟𝑔𝑒𝑚 𝑑𝑒 𝑒𝑟𝑟𝑜 𝑀𝑎𝑟𝑔𝑒𝑚 𝑑𝑒 𝑒𝑟𝑟𝑜 Limite


Inferior do Superior do
IC Estimativa Pontual IC

Amplitude do IC
Intervalo de Confiança e Grau de
Confiança
Seja  um parâmetro desconhecido. Suponha-se que com base na
informação amostral, pode-se encontrar as estatísticas 𝑊1 (𝑋1 , 𝑋2 , …, 𝑋𝑛 )
e 𝑊2 (𝑋1 , 𝑋2 , …, 𝑋𝑛 ), sendo 𝑊1 (𝑥1 , 𝑥2 , …, 𝑥𝑛 ) < 𝑊2 (𝑥1 , 𝑥2 , …, 𝑥𝑛 ), tais que:

𝑃(𝑊1 (𝑋1 , 𝑋2 , …, 𝑋𝑛 ) < 𝜃 < 𝑊2 (𝑋1 , 𝑋2 , …, 𝑋𝑛 )) = 1 − 𝛼 , 0 < 𝛼 < 1.

Sejam 𝑤1 e 𝑤2 realizações amostrais específicas de 𝑊1 (𝑋1 , 𝑋2 , …, 𝑋𝑛 ) e


𝑊2 (𝑋1 , 𝑋2 , …, 𝑋𝑛 ). Então o intervalo ]𝑤1 , 𝑤2 [ é chamado intervalo de
confiança (I.C.) a 100(1 - a)% para .

A quantidade 100(1 - a)% é designada por grau de confiança do intervalo


e a o nível de significância (a compreendido entre 0 e 1).

Os graus de confiança mais comuns são 90%, 95%, e 99%


Construção do IC

 Com base em variáveis fulcrais


 Variável fulcral é uma v.a. função da amostra e do
parâmetro desconhecido que se pretende estimar
 Variáveis fulcrais que vamos utilizar para a construção dos
IC:
𝑋−𝜇 𝑋−𝜇 𝑋−𝜇
𝑍= 𝜎 ~𝑁 0,1 T= ~𝑡𝑛−1 Z= ~𝑁(0,1)
𝑆´ 𝑆´
𝑛 𝑛 𝑛

(𝑛 − 1)𝑆 ´2 𝑝−𝑝
Q= 2
~𝜒𝑛−1 𝑍= ~𝑁(0,1)
𝜎 2
𝑝(1 − 𝑝)
𝑛
Intervalos de Confiança
 IC para valor médio, μ, de populações com distribuição
N(m, s2)
𝑋−𝜇
 σ2 conhecida: 𝑍 = 𝜎 ~𝑁(0,1)
𝑛
𝑋−𝜇
 σ2 desconhecida: T = 𝑆´ ~𝑡𝑛−1 para n≤30
𝑛
𝑋−𝜇
ou Z = 𝑆´ ~𝑁(0,1) para n>30
𝑛
(𝑛−1)𝑆 ´2
 IC para a variância, s2 :Q= 𝜎 2
2
~𝜒𝑛−1
 IC para a proporção populacional, p (amostras de
𝑝−𝑝
dimensão elevada): 𝑍 = ~𝑁(0,1)
𝑝(1−𝑝)
𝑛
Intervalos de Confiança

Intervalos de
Confiança

Valor Variância e Proporção


médio Desvio
padrão

σ2 (ou σ) σ2 (ou σ)
conhecida desconhecida
Intervalo de Confiança para μ
(σ2 conhecida)
 Hipóteses
 Variância da População, σ2, é conhecida
 População N(m,s2)

 Intervalo de Confiança:

𝜎 𝜎
𝐼𝐶 1−𝛼 100% 𝜇 = 𝑥 − 𝑧1−𝛼 , 𝑥 + 𝑧1−𝛼
2 𝑛 2 𝑛
onde z1-a/2 é o quantil de probabilidade 1-a/2 de uma N(0,1), ou
seja, é o valor tal que F(z) igual 1-a/2 .
Nota: z1-a/2 = - za/2
(continuação)

 IC a (1-a)100% ou 100(1-a)% para o valor médio com


variância conhecida

1−𝛼

𝛼 𝛼
2 2

Z units: −𝒛𝟏−𝜶 0 𝒛𝟏−𝜶


𝟐 𝟐
X units: Limite inferior Estimativa Limite superior
do IC do IC
pontual
𝜎
A amplitude do IC é: 𝑎 = 2 × 𝑧1−𝛼 ×
2 𝑛
Interpretação do IC
O verdadeiro valor de um parâmetro populacional é
desconhecido
Intervalo entre cujos limites se
tem uma confiança (por exemplo Intervalo de
95%) de que se encontre o confiança
verdadeiro valor do parâmetro
populacional.

Ao recolher 100 amostras da mesma dimensão e ao calcular os


intervalos de confiança correspondentes, em média 95 (por
exemplo) destes intervalos contêm o verdadeiro valor do
parâmetro populacional.
Exemplo
Uma amostra de 11 circuitos, selecionada de uma
população Normal, tem uma resistência média de 2.20
ohms. Sabe-se de testes passados que o desvio padrão
da população é igual a 0.35 ohms.
Determine o intervalo de confiança a 95% para a
resistência de todos os circuitos.

X – v.a. que representa a resistência dos circuitos em


ohms.
X ~ N(m; 0.352)
n = 11
𝑥 = 2.20 𝜎 = 0.35
Exemplo (continuação)

Como s2 ou s é conhecido, a expressão do IC a utilizar é:


𝜎 𝜎
𝑥 − 𝑧1−𝛼 , 𝑥 + 𝑧1−𝛼
2 𝑛 2 𝑛
100 × 1 − 𝛼 % = 95% ⇔ 1 − 𝛼 = 0.95 ⇔ 𝛼 = 0.05
z F(-z) F(z) D(z)

𝑧1−𝛼 = 𝑧 0.05 = 𝑧0.975 = 1.96 1.96 0.0250 0.9750 0.9500
2 1− 2

Substituindo os valores na fórmula anterior:


0.35 0.35
2.20 − 1.96 , 2.20 + 1.96 = 1.9932; 2.4068
11 11
Tem-se uma confiança de 95% que a verdadeira resistência média esteja
compreendida entre 1.9932 e 2.4068 ohms
Apesar da verdadeira resistência média poder estar ou não neste intervalo, em
média, 95% dos intervalos construídos desta forma conterão a verdadeira
resistência média.
Intervalos de Confiança

Intervalos de
Confiança

Valor médio Variância e Proporção


Desvio
padrão

σ2 (ou σ)
σ2 (ou σ) desconhecida
conhecida
Intervalo de Confiança para μ
(σ2 desconhecida)
 Se o desvio padrão da população, σ, é
desconhecido, pode ser substituído pelo seu
estimador pontual, o desvio padrão amostral
corrigido, S´.
 Neste caso usa-se a distribuição t-Student em
vez da distribuição Normal.
Intervalo de Confiança para μ
(σ2 desconhecida e n ≤ 30)
 Hipóteses
 Variância da População, σ2, é desconhecida
 População N(m,s2)
 n ≤ 30

 Intervalo de Confiança:

𝑠′ 𝑠′
𝐼𝐶 1−𝛼 100% 𝜇 = 𝑥 − 𝑡𝑛−1,1−𝛼 , 𝑥 + 𝑡𝑛−1,1−𝛼
2 𝑛 2 𝑛
onde tn-1,1-a/2 é o quantil de probabilidade 1-a/2 de uma t-Student com (n-1)
𝛼
graus de liberdade, tn-1, ou seja, é o valor tal 𝑃 𝑡𝑛−1 < 𝑡𝑛−1;1−𝛼 = 1 − 2 .
2

Nota: t1-a/2 = - ta/2


Distribuição t-Student
 Considere uma amostra aleatória de n observações
 com média X e desvio padrão S´:
𝑛 𝑛 2 𝑛 𝑋 2 −𝑛𝑋 2
𝑖=1 𝑋𝑖 𝑖=1(𝑋𝑖 −𝑋) 𝑖=1 𝑖
𝑋= 𝑆´ = =
𝑛 𝑛−1 𝑛−1
 de uma população normalmente distribuída com valor
médio, μ
𝑋−𝜇
 Então a variável aleatória 𝑇 = 𝑆´
𝑛

segue uma distribuição t-Student com (n - 1) graus de


liberdade
Distribuição t-Student
Nota: t Z quando n aumenta

Normal (0,1)
(t com g.l. = ∞)

As distribuições t-Sudent
têm forma de campânula t (g.l. = 13)
de sino, simétrica, mas
com caudas mais ‘leves’
do que a distribuição t (g.l. = 5)
Normal

0 t
Distribuição t-Student

Nº de graus de liberdade
Seja: n = 3
1 2 3
g.l. = n - 1 = 2
F(x)
a = 0.10
… … …
a/2 =0.05

1-a/2 =0.95
0,9 3.08 1.89 1.64
𝛼
1− = 0.95
0,95 6.31 2.92 2.35 2

𝑃 𝑡 ≤ 2.92 = 0.95 0 2.92 t


Exemplo
Uma amostra de dimensão n = 25 tem x = 50 e s´= 8. Construa
um IC a 95% para μ, supondo que a população tem distribuição
Normal.
Como s2 ou s é desconhecido e n=25≤30, a expressão do
IC a utilizar é:
𝑠′ 𝑠′
𝑥 − 𝑡𝑛−1,1−𝛼 , 𝑥 + 𝑡𝑛−1,1−𝛼
2 𝑛 2 𝑛
100 × 1 − 𝛼 % = 95% ⇔ 1 − 𝛼 = 0.95 ⇔ 𝛼 = 0.05
𝑡𝑛−1,1−𝛼 = 𝑡 0.05 = 𝑡24,0.975 = 2.06
2 25−1,1−
2
Substituindo os valores na fórmula anterior:
8 8
50 − 2.06 , 50 + 2.06 = 46.704; 53.296
25 25
Intervalo de Confiança para μ
(σ2 desconhecida e n > 30)
 Hipóteses
 Variância da População, σ2, é desconhecida
 População N(m,s2)
 n > 30

 Intervalo de Confiança:

𝑠′ 𝑠′
𝐼𝐶 1−𝛼 100% 𝜇 ≈ 𝑥 − 𝑧1−𝛼 , 𝑥 + 𝑧1−𝛼
2 𝑛 2 𝑛
onde z1-a/2 é o quantil de probabilidade 1-a/2 de uma N(0,1), ou seja,
é o valor tal que F(z) igual 1-a/2 .
Nota: z1-a/2 = - za/2
Intervalos de Confiança

Intervalos de
Confiança

Valor Variância e Proporção


médio Desvio
padrão

σ2 (ou σ) σ2 (ou σ)
conhecida desconhecida
IC para a variância
 S´2 é o estimador para a variância populacional, s2
 Uso da distribuição Qui-Quadrado, 𝜒 2 , que é a
distribuição da v. fulcral:
(𝑛 − 1)𝑆 ´2 2
Q= ~𝜒𝑛−1
𝜎2
 Intervalo de Confiança:

𝑛 − 1 𝑠′2 𝑛 − 1 𝑠′2
𝐼𝐶 1−𝛼 100% 𝜎2 = 2 , 2
𝜒 𝛼 𝜒 𝛼
𝑛−1;1− 𝑛−1;
2 2
Exemplo
Estamos a testar a velocidade de um processador de um computador.
Obtiveram-se os seguintes resultados (em Mhz): n=17, 𝑥 = 3004 e
s´=74. Supondo que a população tem distribuição Normal, determine o
IC a 95% para s2.

100 × 1 − 𝛼 % = 95% ⇔ 1 − 𝛼 = 0.95 ⇔ 𝛼 = 0.05

2 2 2
𝜒𝑛−1;𝛼 =𝜒 0.05 = 𝜒16;0.025 = 6.91
2 17−1;
2

2 2 2
𝜒𝑛−1;1− 𝛼 =𝜒 0.05 = 𝜒16;0.975 = 28.85
2 17−1;1− 2
𝑠´2 = 742

Substituindo os valores na fórmula do slide anterior, tem-se:


17 − 1 742 17 − 1 742
, = 3036.997; 12679.595
28.85 6.91
Encontrar os valores da
Distribuição Qui-Quadrado
2 2 Nº de g.l.
𝜒𝑛−1;𝛼 = 𝜒16;0.025 = 6.91
2 F(x) … 16 …

2 2 0.025 6.91
𝜒𝑛−1;1− 𝛼 = 𝜒16;0.975 = 28.85 …
2 0.975 28.85

2(16)
α/2 = .025 α/2 = .025

216;0.025 = 6.91 216;0.975 = 28.85


IC para o desvio padrão
 Se pretendêssemos calcular o IC a 95% para o desvio padrão,
s, bastaria calcular a raiz quadrada dos extremos do IC a 95%
obtido para a variância.
 Assim, o Intervalo de Confiança:

𝑛 − 1 𝑠′2 𝑛 − 1 𝑠′2
𝐼𝐶 1−𝛼 100% 𝜎 = ,
𝜒2 𝛼 𝜒2 𝛼
𝑛−1;1− 2 𝑛−1; 2

Substituindo os valores na fórmula anterior, tem-se:


17 − 1 742 17 − 1 742
, = 55.109; 112.604
28.85 6.91
Intervalos de Confiança

Intervalos de
Confiança

Valor Variância e
médio Proporção
Desvio
padrão

σ2 (ou σ) σ2 (ou σ)
conhecida desconhecida
IC para proporção, p, de uma
população Binomial
Para deduzir o IC para a proporção, p, de uma população com
distribuição B(n,p), usa-se a v. fulcral:

𝑝−𝑝
𝑍= ~𝑁(0,1)
𝑝(1 − 𝑝)
𝑛

Assim, o Intervalo de Confiança é:

𝑝 1−𝑝 𝑝 1−𝑝
𝐼𝐶 1−𝛼 100% 𝑝 ≈ 𝑝 − 𝑧1−𝛼 , 𝑝 + 𝑧1−𝛼
2 𝑛 2 𝑛

onde p̂ é a proporção amostral de “sucessos”.

Você também pode gostar