Escolar Documentos
Profissional Documentos
Cultura Documentos
1 / 48
Módulo 2: Inferência Estatı́stica
1. Conceitos Fundamentais
1.1 População e amostra
1.2 Parâmetros e estimadores
2. Intervalos de confiança (IC)
2.1 IC para a média com variância populacional conhecida
2.2 IC para a média com variância populacional desconhecida
2.3 IC para a proporção
3. Testes de hipóteses
3.1 Testes de hipóteses para a média com variância populacional conhecida
3.2 Testes de hipóteses para a média com variância populacional desconhecida
2 / 48
Inferência Estatı́stica
3 / 48
Inferência Estatı́stica
Dados
Censo Amostra
4 / 48
Inferência Estatı́stica
2. Estatística descritiva:
População
Tabelas
Gráficos
Dados Estatísticas
...
1. Produção de dados:
Amostragem
4. Inferência:
Intervalos de confiança 3. Probabilidade
Testes de hipótese
5 / 48
Inferência Estatı́stica
6 / 48
Inferência Estatı́stica
Estatı́stica: é um número que caracteriza uma amostra. Uma estatı́stica é uma função
apenas dos valores da amostra.
Exemplos:
1 Pn
• Média amostral: X̄ = Xi ;
n i=1
1 Pn
• Variância amostral: S 2 = (Xi − X̄)2 ;
n − 1 i=1
X
• Proporção amostral p̂ = , em que X é o número de elementos com a
n
caracterı́stica de interesse na amostra.
7 / 48
Inferência Estatı́stica
Note que:
8 / 48
Inferência Estatı́stica
Estimador: é uma estatı́stica que tem propriedades ótimas para tentar adivinhar o valor
de um parâmetro.
Exemplos:
• X̄ é o estimador da média µ;
• S 2 é o estimador da variância σ 2 ;
• p̂ é o estimador do parâmetro p da Binomial.
Estimação: quando utilizamos um estimador, com base nos dados da amostra, para tentar
adivinhar (estimar/inferir) o valor do parâmetro.
Estimativa: é o valor da estatı́stica para uma particular amostra. Quando a estatı́stica é
o estimador do parâmetro, então temos uma estimativa do parâmetro.
9 / 48
Inferência Estatı́stica
Exemplo: Suponha que estejamos interessados em analisar o número médio de horas de
sono dos alunos da turma de CPE 1. Para responder essa pergunta, selecionamos uma
amostra de 5 alunos e registramos suas horas de sono por noite. Supondo que as horas
de sono da turma tem distribuição normal com parâmetros µ e σ 2 , desejamos obter uma
estimativa para as horas de sono de toda a turma.
Neste caso, temos:
Parâmetro: Uma vez que estamos interessados na média de sono da turma, o parâmetro de
interesse é µ.
10 / 48
Inferência Estatı́stica
População: horas de sono dos 50 alunos de CPE 1:
8 8 8 9 8 8 7 9 12 9 8 7 7 9 8
8 7 9 6 9 8 9 9 9 8 8 7 8 10 8
10 7 7 9 7 8 9 8 9 8 6 7 7 9 10
8 7 7 10 7
9 8 7 8 8
Problema: estimar as horas de sono dos alunos de CPE 1 a partir da amostra acima.
Mas isso também quer dizer que não temos nenhuma garantia, ou melhor, medida de
incerteza, sobre uma estimação pontual.
Então, precisamos conhecer a distribuição de probabilidade de, por exemplo, X̄, para então
utilizar uma metodologia de estimação que nos dê uma medida de incerteza sobre a es-
timação pontual da média.
12 / 48
Distribuição da média amostral (X̄)
Amostragem aleatória é o processo que consiste em retirar elementos da população de
forma aleatória para compor uma amostra.
Estatística amostral
amostra
População
13 / 48
Distribuição da média amostral (X̄)
Defina a variável X como o valor assumido pelo elemento na população. Então, X pode
assumir os valores 1, 3, 5, 5, 7.
x 1 3 5 7
P (X = x) 1/5 1/5 2/5 1/5
14 / 48
Distribuição da média amostral (X̄)
{(1, 1), (1, 3), (1, 5), (1, 7),(3, 1), (3, 3), (3, 5), (3, 7),
(5, 1), (5, 3), (5, 5), (5, 7),(7, 1), (7, 3), (7, 5), (7, 7)}
1
Considerando que todos os elementos da população são igualmente prováveis
15 / 48
Distribuição da média amostral (X̄)
X1
1 3 5 7
X2
16 / 48
Distribuição da média amostral (X̄)
X1 + X2
X̄ = .
2
Note que a variável X̄ pode assumir os valores 1, 2, 3, 4, 5, 6 e 7 com as seguintes
probabilidades:
x̄ 1 2 3 4 5 6 7
P (X̄ = x̄) 1/25 2/25 5/25 6/25 6/25 4/25 1/25
17 / 48
Distribuição da média amostral (X̄)
0.20
0.15
0.10
0.05
0.00
18 / 48
Distribuição da média amostral (X̄)
Teorema 1: Seja {X1 , X2 , . . . , Xn } uma amostra aleatória simples de tamanho n retirada
de uma população com distribuição normal com média µ e variância σ 2 finita e conhecida.
Então, a média amostral X̄ possui distribuição normal com média µ e variância σ 2 /n. Ou
seja:
σ2
X̄ ∼ N µ, .
n
σ2
2
A partir do Teorema 1, temos que: X ∼ N (µ, σ ) ⇒ X̄ ∼ N µ, .
n
σ2
Note que, se X̄ ∼ N µ, , então
n
√
X̄ − µ n(X̄ − µ)
Z= σ = ∼ N (0, 1).
√ σ
n
19 / 48
IC para a média populacional (µ): σ 2 conhecido
Vamos agora pensar numa solução para o problema da estimação pontual não ter uma
medida de incerteza associada. Que tal encontrar dois limites, por exemplo, Li e Ls que
satisfaçam
P (Li ≤ µ ≤ Ls) = confiança?
Isto é, a probabilidade do intervalo [Li, Ls] conter o parâmetro µ é igual ao nosso nı́vel de
confiança. Agora temos como resolver isso, porque sabemos que
√
X̄ − µ n(X̄ − µ)
Z= σ = ∼ N (0, 1),
√ σ
n
20 / 48
IC para a média populacional (µ): σ 2 conhecido
Desta forma, considere que X̄ é a média amostral de uma amostra aleatória simples de
tamanho n de uma população normal com σ conhecido. Então,
confiança = P (−z ≤ Z ≤ z)
√
n(X̄ − µ)
=P −z ≤ ≤z
σ
−zσ zσ
=P √ ≤ X̄ − µ ≤ √
n n
zσ zσ
= P X̄ − √ ≤ µ ≤ X̄ + √ .
n n
21 / 48
IC para a média populacional (µ): σ 2 conhecido
Intervalo de confiança para média de uma população com distribuição normal com
variância conhecida.
Seja {X1 , X2 , . . . , Xn } uma amostra aleatória simples de tamanho n retirada de uma
população com distribuição normal com média µ e variância σ 2 finita e conhecida. Então,
o intervalo de confiança para o parâmetro média µ é dado por
IC = [X̄ − e; X̄ + e],
em que
zσ 1 + confiança
e= √ e z é tal que P (Z ≤ z) =
n 2
22 / 48
IC para a média populacional (µ): σ 2 conhecido
Exemplo: Considere que X, o número de vezes que uma pessoa toca o rosto por
hora, tenha distribuição normal com média µ e desvio-padrão igual a 37.5 vezes por
hora. Num experimento com 26 estudantes, observou-se uma média de 23 toques no
rosto por hora. Encontre o intervalo de confiança, com 94% de confiança para média
de vezes que uma pessoa toca o rosto por hora.
23 / 48
IC para a média populacional (µ): σ 2 conhecido
Exemplo: Considere que X, o número de vezes que uma pessoa toca o rosto por
hora, tenha distribuição normal com média µ e desvio-padrão igual a 37.5 vezes por
hora. Num experimento com 26 estudantes, observou-se uma média de 23 toques no
rosto por hora. Encontre o intervalo de confiança, com 94% de confiança para média
de vezes que uma pessoa toca o rosto por hora.
Solução: Dados do problema:
• n = 26
• x̄ = 23
• σ = 37.5 (parâmetro populacional: variância conhecida)
• Confiança= 0.94
23 / 48
IC para a média populacional (µ): σ 2 conhecido
1 + confiança 1 + 0.94
Note que P (Z ≤ z) = = = 0.97.
2 2
Portanto, z = 1.88.
z·σ 1.88 × 37.5
Logo, e = √ = √ ≈ 13.8.
n 26
IC[µ; 94%] = [X̄ − e; X̄ + e] = [23 − 13.8; 23 + 13.8] = [9.2; 36.8].
Há evidências estatı́sticas, com 94% de confiança, de que uma pessoa toca o rosto entre 9
e 37 vezes por hora.
24 / 48
IC para a média populacional (µ): σ 2 conhecido
25 / 48
IC para a média populacional (µ): σ 2 conhecido
25 / 48
IC para a média populacional (µ): σ 2 conhecido
1 + confiança 1 + 0.98
Temos que P (Z ≤ z) = = = 0.99.
2 2
Portanto, z = 2.33.
z·σ 2.33 × 0.05
Logo, e = √ = √ ≈ 0.04.
n 8
IC[µ; 98%] = X̄ − e; X̄ + e = [0.92 − 0.04; 0.92 + 0.04] = [0.88; 0.96].
26 / 48
IC para a média populacional (µ): σ 2 conhecido
27 / 48
IC para a média populacional (µ): σ 2 conhecido
27 / 48
IC para a média populacional (µ): σ 2 conhecido
1 + confiança 1 + 0.95
Temos que P (Z ≤ z) = = = 0.975.
2 2
Portanto, z = 1.96.
z·σ 1.96 × 3
Logo, e = √ = √ ≈ 1.31.
n 20
IC[µ; 95%] = X̄ − e; X̄ + e = [346 − 1.31; 346 + 1.31] = [344.69; 347.31].
Há evidências estatı́sticas, com 95% de confiança, de que a quantidade de cerveja após a
alteração varia entre 345ml e 347ml.
28 / 48
IC para a média populacional (µ): σ 2 desconhecido
Notação: X̄ ∼ t(n−1) .
29 / 48
IC para a média populacional (µ): σ 2 desconhecido
Distribuição t−Student
0.4
N(0,1)
gl=1
gl=5
gl=30
0.3
0.2
f(x)
0.1
0.0
−4 −2 0 2 4
30 / 48
IC para a média populacional (µ): σ 2 desconhecido
31 / 48
Uso da Tabela t-Student
Tabela t-Student: P (T ≤ t)
gl 0,995 0,99 0,985 0,98 0,975 0,97 0,965 0,96 0,955 0,95 0,945 0,94 0,935 0,93 0,925 0,92 0,915 0,91 0,905 0,9
1 63,66 31,82 21,20 15,89 12,71 10,58 9,06 7,92 7,03 6,31 5,73 5,24 4,83 4,47 4,17 3,89 3,66 3,44 3,25 3,08
2 9,92 6,96 5,64 4,85 4,30 3,90 3,58 3,32 3,10 2,92 2,76 2,62 2,50 2,38 2,28 2,19 2,10 2,03 1,95 1,89
3 5,84 4,54 3,90 3,48 3,18 2,95 2,76 2,61 2,47 2,35 2,25 2,16 2,07 2,00 1,92 1,86 1,80 1,74 1,69 1,64
4 4,60 3,75 3,30 3,00 2,78 2,60 2,46 2,33 2,23 2,13 2,05 1,97 1,90 1,84 1,78 1,72 1,67 1,62 1,58 1,53
5 4,03 3,36 3,00 2,76 2,57 2,42 2,30 2,19 2,10 2,02 1,94 1,87 1,81 1,75 1,70 1,65 1,60 1,56 1,52 1,48
6 3,71 3,14 2,83 2,61 2,45 2,31 2,20 2,10 2,02 1,94 1,87 1,81 1,75 1,70 1,65 1,60 1,56 1,52 1,48 1,44
7 3,50 3,00 2,71 2,52 2,36 2,24 2,14 2,05 1,97 1,89 1,83 1,77 1,72 1,66 1,62 1,57 1,53 1,49 1,45 1,41
8 3,36 2,90 2,63 2,45 2,31 2,19 2,09 2,00 1,93 1,86 1,80 1,74 1,69 1,64 1,59 1,55 1,51 1,47 1,43 1,40
9 3,25 2,82 2,57 2,40 2,26 2,15 2,06 1,97 1,90 1,83 1,77 1,72 1,67 1,62 1,57 1,53 1,49 1,45 1,42 1,38
10 3,17 2,76 2,53 2,36 2,23 2,12 2,03 1,95 1,88 1,81 1,75 1,70 1,65 1,60 1,56 1,52 1,48 1,44 1,41 1,37
11 3,11 2,72 2,49 2,33 2,20 2,10 2,01 1,93 1,86 1,80 1,74 1,69 1,64 1,59 1,55 1,51 1,47 1,43 1,40 1,36
12 3,05 2,68 2,46 2,30 2,18 2,08 1,99 1,91 1,84 1,78 1,73 1,67 1,63 1,58 1,54 1,50 1,46 1,42 1,39 1,36
13 3,01 2,65 2,44 2,28 2,16 2,06 1,97 1,90 1,83 1,77 1,72 1,66 1,62 1,57 1,53 1,49 1,45 1,42 1,38 1,35
14 2,98 2,62 2,41 2,26 2,14 2,05 1,96 1,89 1,82 1,76 1,71 1,66 1,61 1,56 1,52 1,48 1,45 1,41 1,38 1,35
15 2,95 2,60 2,40 2,25 2,13 2,03 1,95 1,88 1,81 1,75 1,70 1,65 1,60 1,56 1,52 1,48 1,44 1,41 1,37 1,34
16 2,92 2,58 2,38 2,24 2,12 2,02 1,94 1,87 1,80 1,75 1,69 1,64 1,60 1,55 1,51 1,47 1,44 1,40 1,37 1,34
17 2,90 2,57 2,37 2,22 2,11 2,02 1,93 1,86 1,80 1,74 1,69 1,64 1,59 1,55 1,51 1,47 1,43 1,40 1,37 1,33
18 2,88 2,55 2,36 2,21 2,10 2,01 1,93 1,86 1,79 1,73 1,68 1,63 1,59 1,54 1,50 1,47 1,43 1,39 1,36 1,33
19 2,86 2,54 2,35 2,20 2,09 2,00 1,92 1,85 1,79 1,73 1,68 1,63 1,58 1,54 1,50 1,46 1,43 1,39 1,36 1,33
20 2,85 2,53 2,34 2,20 2,09 1,99 1,91 1,84 1,78 1,72 1,67 1,62 1,58 1,54 1,50 1,46 1,42 1,39 1,36 1,33
21 2,83 2,52 2,33 2,19 2,08 1,99 1,91 1,84 1,78 1,72 1,67 1,62 1,58 1,53 1,49 1,46 1,42 1,39 1,35 1,32
22 2,82 2,51 2,32 2,18 2,07 1,98 1,90 1,84 1,77 1,72 1,67 1,62 1,57 1,53 1,49 1,45 1,42 1,38 1,35 1,32
23 2,81 2,50 2,31 2,18 2,07 1,98 1,90 1,83 1,77 1,71 1,66 1,61 1,57 1,53 1,49 1,45 1,42 1,38 1,35 1,32
24 2,80 2,49 2,31 2,17 2,06 1,97 1,90 1,83 1,77 1,71 1,66 1,61 1,57 1,53 1,49 1,45 1,41 1,38 1,35 1,32
25 2,79 2,49 2,30 2,17 2,06 1,97 1,89 1,82 1,76 1,71 1,66 1,61 1,57 1,52 1,49 1,45 1,41 1,38 1,35 1,32
26 2,78 2,48 2,30 2,16 2,06 1,97 1,89 1,82 1,76 1,71 1,65 1,61 1,56 1,52 1,48 1,45 1,41 1,38 1,35 1,31
27 2,77 2,47 2,29 2,16 2,05 1,96 1,89 1,82 1,76 1,70 1,65 1,61 1,56 1,52 1,48 1,44 1,41 1,38 1,34 1,31
28 2,76 2,47 2,29 2,15 2,05 1,96 1,88 1,82 1,76 1,70 1,65 1,60 1,56 1,52 1,48 1,44 1,41 1,38 1,34 1,31
29 2,76 2,46 2,28 2,15 2,05 1,96 1,88 1,81 1,75 1,70 1,65 1,60 1,56 1,52 1,48 1,44 1,41 1,37 1,34 1,31
30 2,75 2,46 2,28 2,15 2,04 1,95 1,88 1,81 1,75 1,70 1,65 1,60 1,56 1,52 1,48 1,44 1,41 1,37 1,34 1,31
32 / 48
IC para a média populacional (µ): σ 2 desconhecido
Intervalo de Confiança para média de uma população normal com variância desco-
nhecida.
Seja {X1 , X2 , . . . , Xn } uma amostra aleatória simples de tamanho n retirada de uma
população com distribuição normal com média µ e variância σ 2 finita e desconhecida.
Então, o intervalo de confiança para o parâmetro média µ é dado por
t·S
IC = [X̄ − e; X̄ + e], em que e= √ ,
n
33 / 48
IC para a média populacional (µ): σ 2 desconhecido
Exemplo: Considere que X, o número de vezes que uma pessoa toca o rosto por
hora, tenha distribuição normal. Num experimento com 26 estudantes, observou-se
uma média de 23 toques no rosto por hora, com variância igual à 625. Encontre o
intervalo de confiança, com 96% de confiança para média de vezes que uma pessoa
toca o rosto por hora.
34 / 48
IC para a média populacional (µ): σ 2 desconhecido
Exemplo: Considere que X, o número de vezes que uma pessoa toca o rosto por
hora, tenha distribuição normal. Num experimento com 26 estudantes, observou-se
uma média de 23 toques no rosto por hora, com variância igual à 625. Encontre o
intervalo de confiança, com 96% de confiança para média de vezes que uma pessoa
toca o rosto por hora.
Solução: Dados do problema:
• n = 26
• X̄ = 23
√
• S 2 = 625 ⇒ S = 625 = 25
• Confiança de 96%.
Uma vez que a variância é obtida da amostra, temos que a distribuição de X̄ é t-Student
com n − 1 graus de liberdade (gl).
Neste caso, temos que gl = n − 1 = 26 − 1 = 25.
34 / 48
IC para a média populacional (µ): σ 2 desconhecido
1 + confiança 1 + 0,96
(Continuação:) Temos que P (T ≤ t) = = = 0.98.
2 2
Portanto, na linha gl = 25 e coluna P (T ≤ t) = 0, 98 da Tabela t-Student encontramos
t = 2.17.
t·S 2.17 × 25
e= √ = √ ≈ 10.64.
n 26
IC[µ; 96%] = [X̄ − e; X̄ + e] = [23 − 10.64; 23 + 10.64] = [12.36; 33.64].
Há evidências estatı́sticas, com 96% de confiança, de que uma pessoa toca o rosto entre
12 e 34 vezes por hora.
35 / 48
IC para a média populacional (µ): σ 2 desconhecido
Exemplo: Numa cidade, a velocidade de caminhada recomendada para atravessar
o semáforo é de 1.2m/s. Um estudo preliminar foi realizado com oito idosos desta
localidade, obtendo um velocidade médio para atravessar a rua de 0.92m/s com
desvio-padrão de 0.1m/s. Considerando que a velocidade de caminhada de idosos
para atravessar a rua segue distribuição normal, encontre o intervalo com 92% de
confiança para a velocidade de caminhada do idoso para atravessar a rua.
36 / 48
IC para a média populacional (µ): σ 2 desconhecido
Exemplo: Numa cidade, a velocidade de caminhada recomendada para atravessar
o semáforo é de 1.2m/s. Um estudo preliminar foi realizado com oito idosos desta
localidade, obtendo um velocidade médio para atravessar a rua de 0.92m/s com
desvio-padrão de 0.1m/s. Considerando que a velocidade de caminhada de idosos
para atravessar a rua segue distribuição normal, encontre o intervalo com 92% de
confiança para a velocidade de caminhada do idoso para atravessar a rua.
Solução: Dados do problema:
• n=8
• X̄ = 0.92
• S = 0.1 (desvio-padrão amostral)
• Confiança de 92%.
1 + confiança 1 + 0.92
(Continuação:) Temos que P (T ≤ t) = = = 0.96.
2 2
Portanto, na linha gl = 7 e coluna P (T ≤ t) = 0.96 da Tabela t-Student encontramos
t = 2.05.
t·S 2.05 × 0.1
e= √ = √ ≈ 0.07.
n 8
IC[µ; 92%] = [X̄ − e; X̄ + e] = [0.92 − 0.07; 0.92 + 0.07] = [0.85; 0.99].
Há evidências estatı́sticas, com uma confiança de 92%, de que os idosos atravessam a rua
com um velocidade entre 0.85 e 0.99 m/s, que é inferior a velocidade recomendada de 1.2
m/s.
37 / 48
IC para a proporção populacional (p)
variável dicotômica:
tipo de variável que assume apenas dois valores possı́veis.
Exemplos:
• Gênero: masculino ou feminino.
• Lançamento de uma moeda: cara ou coroa.
• Tipo de imóvel: residencial ou comercial.
• Status do atleta: profissional ou amador.
• Resultados do exame: aprovado ou reprovado.
38 / 48
IC para a proporção populacional (p)
P (X = 1) = p e P (X = 0) = 1 − p.
39 / 48
IC para a proporção populacional (p)
Exemplo: Em ano eleitoral, vemos artigos nos jornais que estabelecem intervalos de con-
fiança em termos de proporções ou porcentagens.
Muitas vezes, as pesquisas eleitorais são calculadas com 95% de confiança, portanto, os
pesquisadores estariam 95% confiantes de que a verdadeira proporção de eleitores que
favorecem o candidato estaria entre 0.37 e 0.43.
40 / 48
IC para a proporção populacional (p)
• Suponha que queremos estimar a porcentagem de adultos que acreditam que os pais
devem ser obrigados a vacinar seus filhos contra doenças como sarampo, caxumba e rubéola.
41 / 48
Distribuição da proporção amostral (p̂)
···
42 / 48
Distribuição da proporção amostral (p̂)
43 / 48
IC para a proporção populacional (p)
44 / 48
IC para a proporção populacional (p)
Exemplo: Um estudo foi feito para determinar a proporção de famı́lias que tem telefone
em uma certa comunidade. Uma amostra de 200 famı́lias é selecionada ao acaso, e 160
afirmam ter telefone. Qual o intervalo para p com 95% de confiança?
45 / 48
IC para a proporção populacional (p)
Exemplo: Um estudo foi feito para determinar a proporção de famı́lias que tem telefone
em uma certa comunidade. Uma amostra de 200 famı́lias é selecionada ao acaso, e 160
afirmam ter telefone. Qual o intervalo para p com 95% de confiança?
45 / 48
IC para a proporção populacional (p)
1 + confiança 1 + 0.95
(Continuação) Temos que P (Z ≤ z) = = = 0.975.
2 2
Portanto, z = 1.96.
Logo, p p
z· p̂(1 − p̂) 1.96 × 0.8(1 − 0.8)
e= √ = √ ≈ 0.06.
n 200
Há evidências estatı́sticas, com 95% de confiança, de que a porcentagem de famı́lias que
possuem telefone varia entre 74% e 86%.
46 / 48
IC para a proporção populacional (p)
47 / 48
IC para a proporção populacional (p)
47 / 48
IC para a proporção populacional (p)
1 + confiança 1 + 0.90
(Continuação) Temos que P (Z ≤ z) = = = 0.95.
2 2
Portanto, z = 1.64.
Logo, p p
z· p̂(1 − p̂) 1.64 × 0.86(1 − 0.86)
e= √ = √ ≈ 0.02.
n 1200
48 / 48