Você está na página 1de 55

Cálculo das Probabilidades e Estatı́stica I

DEPARTAMENTO DE ESTATÍSTICA / UFPB

Prof. Rodrigo B. Silva


rodrigo@de.ufpb.br

1 / 48
Módulo 2: Inferência Estatı́stica

1. Conceitos Fundamentais
1.1 População e amostra
1.2 Parâmetros e estimadores
2. Intervalos de confiança (IC)
2.1 IC para a média com variância populacional conhecida
2.2 IC para a média com variância populacional desconhecida
2.3 IC para a proporção
3. Testes de hipóteses
3.1 Testes de hipóteses para a média com variância populacional conhecida
3.2 Testes de hipóteses para a média com variância populacional desconhecida

2 / 48
Inferência Estatı́stica

Fazer inferência (ou inferir) = tirar conclusões.

Inferência Estatı́stica: conjunto de métodos de análise estatı́stica que permitem tirar


conclusões sobre uma população com base em somente uma parte dela (uma amostra).

3 / 48
Inferência Estatı́stica

Dados

Censo Amostra

Estatı́stica Descritiva Inferência Estatı́stica

Resultados podem ser generalizados para toda a população

4 / 48
Inferência Estatı́stica

2. Estatística descritiva:
População
Tabelas
Gráficos
Dados Estatísticas
...
1. Produção de dados:
Amostragem

4. Inferência:
Intervalos de confiança 3. Probabilidade
Testes de hipótese

5 / 48
Inferência Estatı́stica

Algumas definições de Inferência Estatı́stica:

Parâmetros: são números que caracterizam uma população.


Exemplos:
• Se X ∼ N (µ, σ 2 ), os parâmetros são µ e σ 2 ;
• Se X ∼ Binomial(n, p), o parâmetro é p.

6 / 48
Inferência Estatı́stica

Estatı́stica: é um número que caracteriza uma amostra. Uma estatı́stica é uma função
apenas dos valores da amostra.
Exemplos:
1 Pn
• Média amostral: X̄ = Xi ;
n i=1
1 Pn
• Variância amostral: S 2 = (Xi − X̄)2 ;
n − 1 i=1
X
• Proporção amostral p̂ = , em que X é o número de elementos com a
n
caracterı́stica de interesse na amostra.

7 / 48
Inferência Estatı́stica

Importante não confundir parâmetro com estatı́stica.

Note que:

• µ é a média da população (parâmetro), enquanto que X̄ é a média da amostra


(estatı́stica);
• σ 2 é a variância da população (parâmetro), enquanto que S 2 é a variância da
amostra (estatı́stica);
• σ é o desvio-padrão da população (parâmetro), enquanto que S é o desvio-padrão
da amostra (estatı́stica);

8 / 48
Inferência Estatı́stica

Estimador: é uma estatı́stica que tem propriedades ótimas para tentar adivinhar o valor
de um parâmetro.
Exemplos:
• X̄ é o estimador da média µ;
• S 2 é o estimador da variância σ 2 ;
• p̂ é o estimador do parâmetro p da Binomial.
Estimação: quando utilizamos um estimador, com base nos dados da amostra, para tentar
adivinhar (estimar/inferir) o valor do parâmetro.
Estimativa: é o valor da estatı́stica para uma particular amostra. Quando a estatı́stica é
o estimador do parâmetro, então temos uma estimativa do parâmetro.

9 / 48
Inferência Estatı́stica
Exemplo: Suponha que estejamos interessados em analisar o número médio de horas de
sono dos alunos da turma de CPE 1. Para responder essa pergunta, selecionamos uma
amostra de 5 alunos e registramos suas horas de sono por noite. Supondo que as horas
de sono da turma tem distribuição normal com parâmetros µ e σ 2 , desejamos obter uma
estimativa para as horas de sono de toda a turma.
Neste caso, temos:

População: A turma de CPE 1, composta por 50 alunos;

Amostra: Conjunto de 5 alunos sorteados aleatoriamente da turma de CPE 1.

Parâmetro: Uma vez que estamos interessados na média de sono da turma, o parâmetro de
interesse é µ.

Estimador: Um estimador para µ é dado por X̄.

10 / 48
Inferência Estatı́stica
População: horas de sono dos 50 alunos de CPE 1:
8 8 8 9 8 8 7 9 12 9 8 7 7 9 8
8 7 9 6 9 8 9 9 9 8 8 7 8 10 8
10 7 7 9 7 8 9 8 9 8 6 7 7 9 10
8 7 7 10 7

Amostra: horas de sono de 5 alunos sorteados aleatoriamente (sem reposição):

9 8 7 8 8

Problema: estimar as horas de sono dos alunos de CPE 1 a partir da amostra acima.

Estimador: média aritmética da amostra: X̄.


9+8+7+8+8
Estimativa: x̄ = = 8.
5
11 / 48
Estimação pontual

O problema da estimação pontual é que diferentes levantamentos sobre a mesma população,


com as mesmas condições, geram amostras diferentes. Este é um princı́pio de fenômenos
aleatórios.

Mas isso também quer dizer que não temos nenhuma garantia, ou melhor, medida de
incerteza, sobre uma estimação pontual.

Então, precisamos conhecer a distribuição de probabilidade de, por exemplo, X̄, para então
utilizar uma metodologia de estimação que nos dê uma medida de incerteza sobre a es-
timação pontual da média.

12 / 48
Distribuição da média amostral (X̄)
Amostragem aleatória é o processo que consiste em retirar elementos da população de
forma aleatória para compor uma amostra.

Estatística amostral
amostra

amostra Estatística amostral

População

amostra Estatística amostral

amostra Estatística amostral

13 / 48
Distribuição da média amostral (X̄)

Exemplo: Considere a população S = {1, 3, 5, 5, 7}.

Defina a variável X como o valor assumido pelo elemento na população. Então, X pode
assumir os valores 1, 3, 5, 5, 7.

A distribuição de X é dada pela tabela abaixo:

x 1 3 5 7
P (X = x) 1/5 1/5 2/5 1/5

14 / 48
Distribuição da média amostral (X̄)

(Continuação) Suponha que colhemos todas as amostras possı́veis de tamanho 2 com


reposição desta população1 (S).

Indicando por X1 o número selecionado na primeira extração e por X2 o número


selecionado na segunda extração, temos o seguinte conjunto de pares:

{(1, 1), (1, 3), (1, 5), (1, 7),(3, 1), (3, 3), (3, 5), (3, 7),
(5, 1), (5, 3), (5, 5), (5, 7),(7, 1), (7, 3), (7, 5), (7, 7)}

1
Considerando que todos os elementos da população são igualmente prováveis
15 / 48
Distribuição da média amostral (X̄)

(Continuação) Distribuição das probabilidades das possı́veis amostras de tamanho 2 que


podem ser selecionadas com reposição da população {1, 3, 5, 5, 7}.

X1
1 3 5 7
X2

1 1/25 1/25 2/25 1/25


3 1/25 1/25 2/25 1/25
5 2/25 2/25 4/25 2/25
7 1/25 1/25 2/25 1/25

16 / 48
Distribuição da média amostral (X̄)

(Continuação) Vejamos qual a distribuição de probabilidade da estatı́stica

X1 + X2
X̄ = .
2
Note que a variável X̄ pode assumir os valores 1, 2, 3, 4, 5, 6 e 7 com as seguintes
probabilidades:

x̄ 1 2 3 4 5 6 7
P (X̄ = x̄) 1/25 2/25 5/25 6/25 6/25 4/25 1/25

17 / 48
Distribuição da média amostral (X̄)

0.20
0.15
0.10
0.05
0.00

0.04 0.08 0.2 0.24 0.24 0.16 0.04

18 / 48
Distribuição da média amostral (X̄)
Teorema 1: Seja {X1 , X2 , . . . , Xn } uma amostra aleatória simples de tamanho n retirada
de uma população com distribuição normal com média µ e variância σ 2 finita e conhecida.
Então, a média amostral X̄ possui distribuição normal com média µ e variância σ 2 /n. Ou
seja:
σ2
 
X̄ ∼ N µ, .
n

σ2
 
2
A partir do Teorema 1, temos que: X ∼ N (µ, σ ) ⇒ X̄ ∼ N µ, .
n
σ2
 
Note que, se X̄ ∼ N µ, , então
n

X̄ − µ n(X̄ − µ)
Z= σ = ∼ N (0, 1).
√ σ
n
19 / 48
IC para a média populacional (µ): σ 2 conhecido

Vamos agora pensar numa solução para o problema da estimação pontual não ter uma
medida de incerteza associada. Que tal encontrar dois limites, por exemplo, Li e Ls que
satisfaçam
P (Li ≤ µ ≤ Ls) = confiança?

Isto é, a probabilidade do intervalo [Li, Ls] conter o parâmetro µ é igual ao nosso nı́vel de
confiança. Agora temos como resolver isso, porque sabemos que

X̄ − µ n(X̄ − µ)
Z= σ = ∼ N (0, 1),
√ σ
n

quando nossa amostra vem de uma população normal.

20 / 48
IC para a média populacional (µ): σ 2 conhecido
Desta forma, considere que X̄ é a média amostral de uma amostra aleatória simples de
tamanho n de uma população normal com σ conhecido. Então,

confiança = P (−z ≤ Z ≤ z)
 √ 
n(X̄ − µ)
=P −z ≤ ≤z
σ
 
−zσ zσ
=P √ ≤ X̄ − µ ≤ √
n n
 
zσ zσ
= P X̄ − √ ≤ µ ≤ X̄ + √ .
n n

21 / 48
IC para a média populacional (µ): σ 2 conhecido
Intervalo de confiança para média de uma população com distribuição normal com
variância conhecida.
Seja {X1 , X2 , . . . , Xn } uma amostra aleatória simples de tamanho n retirada de uma
população com distribuição normal com média µ e variância σ 2 finita e conhecida. Então,
o intervalo de confiança para o parâmetro média µ é dado por

IC = [X̄ − e; X̄ + e],

em que
zσ 1 + confiança
e= √ e z é tal que P (Z ≤ z) =
n 2

Usamos a Tabela da Normal Padrão para encontrar z.

22 / 48
IC para a média populacional (µ): σ 2 conhecido

Exemplo: Considere que X, o número de vezes que uma pessoa toca o rosto por
hora, tenha distribuição normal com média µ e desvio-padrão igual a 37.5 vezes por
hora. Num experimento com 26 estudantes, observou-se uma média de 23 toques no
rosto por hora. Encontre o intervalo de confiança, com 94% de confiança para média
de vezes que uma pessoa toca o rosto por hora.

23 / 48
IC para a média populacional (µ): σ 2 conhecido

Exemplo: Considere que X, o número de vezes que uma pessoa toca o rosto por
hora, tenha distribuição normal com média µ e desvio-padrão igual a 37.5 vezes por
hora. Num experimento com 26 estudantes, observou-se uma média de 23 toques no
rosto por hora. Encontre o intervalo de confiança, com 94% de confiança para média
de vezes que uma pessoa toca o rosto por hora.
Solução: Dados do problema:
• n = 26
• x̄ = 23
• σ = 37.5 (parâmetro populacional: variância conhecida)
• Confiança= 0.94

23 / 48
IC para a média populacional (µ): σ 2 conhecido

1 + confiança 1 + 0.94
Note que P (Z ≤ z) = = = 0.97.
2 2
Portanto, z = 1.88.
z·σ 1.88 × 37.5
Logo, e = √ = √ ≈ 13.8.
n 26
IC[µ; 94%] = [X̄ − e; X̄ + e] = [23 − 13.8; 23 + 13.8] = [9.2; 36.8].

Há evidências estatı́sticas, com 94% de confiança, de que uma pessoa toca o rosto entre 9
e 37 vezes por hora.

24 / 48
IC para a média populacional (µ): σ 2 conhecido

Exemplo: Numa cidade, a velocidade de caminhada recomendada para atravessar o


semáforo é de 1.2m/s. A partir de um estudo preliminar com oito idosos desta localidade,
se obteve uma velocidade média para atravessar a rua de 0.92m/s. Considerando que a
velocidade de idosos para atravessar a rua segue distribuição normal com desvio-padrão de
0.05m/s, encontre um intervalo com 98% de confiança para a velocidade de caminhada
do idoso para atravessar a rua.

25 / 48
IC para a média populacional (µ): σ 2 conhecido

Exemplo: Numa cidade, a velocidade de caminhada recomendada para atravessar o


semáforo é de 1.2m/s. A partir de um estudo preliminar com oito idosos desta localidade,
se obteve uma velocidade média para atravessar a rua de 0.92m/s. Considerando que a
velocidade de idosos para atravessar a rua segue distribuição normal com desvio-padrão de
0.05m/s, encontre um intervalo com 98% de confiança para a velocidade de caminhada
do idoso para atravessar a rua.
Solução: Dados do problema:
• n=8
• x̄ = 0.92
• σ = 0.05 (parâmetro populacional: variância conhecida)
• Confiança= 98%

25 / 48
IC para a média populacional (µ): σ 2 conhecido

1 + confiança 1 + 0.98
Temos que P (Z ≤ z) = = = 0.99.
2 2
Portanto, z = 2.33.
z·σ 2.33 × 0.05
Logo, e = √ = √ ≈ 0.04.
n 8
 
IC[µ; 98%] = X̄ − e; X̄ + e = [0.92 − 0.04; 0.92 + 0.04] = [0.88; 0.96].

Há evidências estatı́sticas, com 98% de confiança, de que a velocidade de caminhada do


idoso varia entre 0.88m/s e 0.96m/s.

26 / 48
IC para a média populacional (µ): σ 2 conhecido

Exemplo: Em uma indústria de cerveja, a quantidade de cerveja inserida em latas se


comporta como uma distribuição normal com média 350ml e desvio padrão 3ml. Após
alguns problemas na linha de produção, suspeita-se que houve alteração na média. Uma
amostra de 20 latas acusou uma média de 346ml. Obtenha um intervalo de 95% para a
quantidade média de cerveja inserida em latas, supondo que não tenha ocorrido alteração
na variabilidade.

27 / 48
IC para a média populacional (µ): σ 2 conhecido

Exemplo: Em uma indústria de cerveja, a quantidade de cerveja inserida em latas se


comporta como uma distribuição normal com média 350ml e desvio padrão 3ml. Após
alguns problemas na linha de produção, suspeita-se que houve alteração na média. Uma
amostra de 20 latas acusou uma média de 346ml. Obtenha um intervalo de 95% para a
quantidade média de cerveja inserida em latas, supondo que não tenha ocorrido alteração
na variabilidade.
Solução: Dados do problema:
• n = 20
• x̄ = 346
• σ = 3 (parâmetro populacional: variância conhecida)
• Confiança= 95%

27 / 48
IC para a média populacional (µ): σ 2 conhecido

1 + confiança 1 + 0.95
Temos que P (Z ≤ z) = = = 0.975.
2 2
Portanto, z = 1.96.
z·σ 1.96 × 3
Logo, e = √ = √ ≈ 1.31.
n 20
 
IC[µ; 95%] = X̄ − e; X̄ + e = [346 − 1.31; 346 + 1.31] = [344.69; 347.31].

Há evidências estatı́sticas, com 95% de confiança, de que a quantidade de cerveja após a
alteração varia entre 345ml e 347ml.

28 / 48
IC para a média populacional (µ): σ 2 desconhecido

Distribuição da média de uma população com distribuição normal com variância


desconhecida

Teorema 2: Seja {X1 , X2 , . . . , Xn } uma amostra aleatória simples de tamanho n retirada


de uma população com distribuição normal com média µ e variância σ 2 finita e desconhe-
cida. Então, X̄ tem distribuição t-Student com n − 1 graus de liberdade (gl).

Notação: X̄ ∼ t(n−1) .

29 / 48
IC para a média populacional (µ): σ 2 desconhecido
Distribuição t−Student

0.4
N(0,1)
gl=1
gl=5
gl=30

0.3
0.2
f(x)

0.1
0.0

−4 −2 0 2 4

30 / 48
IC para a média populacional (µ): σ 2 desconhecido

Neste caso, usamos a Tabela da distribuição t-Student, na qual as linhas correspondem ao


parâmetro grau de liberdade gl e as colunas as probabilidade P (T ≤ t). Quando cruzamos
linhas e colunas, encontramos o valor de t.

Observe que aqui é o contrário da Tabela da Normal padrão, onde os valores de z


são as linhas e colunas e as probabilidades estão no meio da tabela!

31 / 48
Uso da Tabela t-Student
Tabela t-Student: P (T ≤ t)
gl 0,995 0,99 0,985 0,98 0,975 0,97 0,965 0,96 0,955 0,95 0,945 0,94 0,935 0,93 0,925 0,92 0,915 0,91 0,905 0,9
1 63,66 31,82 21,20 15,89 12,71 10,58 9,06 7,92 7,03 6,31 5,73 5,24 4,83 4,47 4,17 3,89 3,66 3,44 3,25 3,08
2 9,92 6,96 5,64 4,85 4,30 3,90 3,58 3,32 3,10 2,92 2,76 2,62 2,50 2,38 2,28 2,19 2,10 2,03 1,95 1,89
3 5,84 4,54 3,90 3,48 3,18 2,95 2,76 2,61 2,47 2,35 2,25 2,16 2,07 2,00 1,92 1,86 1,80 1,74 1,69 1,64
4 4,60 3,75 3,30 3,00 2,78 2,60 2,46 2,33 2,23 2,13 2,05 1,97 1,90 1,84 1,78 1,72 1,67 1,62 1,58 1,53
5 4,03 3,36 3,00 2,76 2,57 2,42 2,30 2,19 2,10 2,02 1,94 1,87 1,81 1,75 1,70 1,65 1,60 1,56 1,52 1,48
6 3,71 3,14 2,83 2,61 2,45 2,31 2,20 2,10 2,02 1,94 1,87 1,81 1,75 1,70 1,65 1,60 1,56 1,52 1,48 1,44
7 3,50 3,00 2,71 2,52 2,36 2,24 2,14 2,05 1,97 1,89 1,83 1,77 1,72 1,66 1,62 1,57 1,53 1,49 1,45 1,41
8 3,36 2,90 2,63 2,45 2,31 2,19 2,09 2,00 1,93 1,86 1,80 1,74 1,69 1,64 1,59 1,55 1,51 1,47 1,43 1,40
9 3,25 2,82 2,57 2,40 2,26 2,15 2,06 1,97 1,90 1,83 1,77 1,72 1,67 1,62 1,57 1,53 1,49 1,45 1,42 1,38
10 3,17 2,76 2,53 2,36 2,23 2,12 2,03 1,95 1,88 1,81 1,75 1,70 1,65 1,60 1,56 1,52 1,48 1,44 1,41 1,37
11 3,11 2,72 2,49 2,33 2,20 2,10 2,01 1,93 1,86 1,80 1,74 1,69 1,64 1,59 1,55 1,51 1,47 1,43 1,40 1,36
12 3,05 2,68 2,46 2,30 2,18 2,08 1,99 1,91 1,84 1,78 1,73 1,67 1,63 1,58 1,54 1,50 1,46 1,42 1,39 1,36
13 3,01 2,65 2,44 2,28 2,16 2,06 1,97 1,90 1,83 1,77 1,72 1,66 1,62 1,57 1,53 1,49 1,45 1,42 1,38 1,35
14 2,98 2,62 2,41 2,26 2,14 2,05 1,96 1,89 1,82 1,76 1,71 1,66 1,61 1,56 1,52 1,48 1,45 1,41 1,38 1,35
15 2,95 2,60 2,40 2,25 2,13 2,03 1,95 1,88 1,81 1,75 1,70 1,65 1,60 1,56 1,52 1,48 1,44 1,41 1,37 1,34
16 2,92 2,58 2,38 2,24 2,12 2,02 1,94 1,87 1,80 1,75 1,69 1,64 1,60 1,55 1,51 1,47 1,44 1,40 1,37 1,34
17 2,90 2,57 2,37 2,22 2,11 2,02 1,93 1,86 1,80 1,74 1,69 1,64 1,59 1,55 1,51 1,47 1,43 1,40 1,37 1,33
18 2,88 2,55 2,36 2,21 2,10 2,01 1,93 1,86 1,79 1,73 1,68 1,63 1,59 1,54 1,50 1,47 1,43 1,39 1,36 1,33
19 2,86 2,54 2,35 2,20 2,09 2,00 1,92 1,85 1,79 1,73 1,68 1,63 1,58 1,54 1,50 1,46 1,43 1,39 1,36 1,33
20 2,85 2,53 2,34 2,20 2,09 1,99 1,91 1,84 1,78 1,72 1,67 1,62 1,58 1,54 1,50 1,46 1,42 1,39 1,36 1,33
21 2,83 2,52 2,33 2,19 2,08 1,99 1,91 1,84 1,78 1,72 1,67 1,62 1,58 1,53 1,49 1,46 1,42 1,39 1,35 1,32
22 2,82 2,51 2,32 2,18 2,07 1,98 1,90 1,84 1,77 1,72 1,67 1,62 1,57 1,53 1,49 1,45 1,42 1,38 1,35 1,32
23 2,81 2,50 2,31 2,18 2,07 1,98 1,90 1,83 1,77 1,71 1,66 1,61 1,57 1,53 1,49 1,45 1,42 1,38 1,35 1,32
24 2,80 2,49 2,31 2,17 2,06 1,97 1,90 1,83 1,77 1,71 1,66 1,61 1,57 1,53 1,49 1,45 1,41 1,38 1,35 1,32
25 2,79 2,49 2,30 2,17 2,06 1,97 1,89 1,82 1,76 1,71 1,66 1,61 1,57 1,52 1,49 1,45 1,41 1,38 1,35 1,32
26 2,78 2,48 2,30 2,16 2,06 1,97 1,89 1,82 1,76 1,71 1,65 1,61 1,56 1,52 1,48 1,45 1,41 1,38 1,35 1,31
27 2,77 2,47 2,29 2,16 2,05 1,96 1,89 1,82 1,76 1,70 1,65 1,61 1,56 1,52 1,48 1,44 1,41 1,38 1,34 1,31
28 2,76 2,47 2,29 2,15 2,05 1,96 1,88 1,82 1,76 1,70 1,65 1,60 1,56 1,52 1,48 1,44 1,41 1,38 1,34 1,31
29 2,76 2,46 2,28 2,15 2,05 1,96 1,88 1,81 1,75 1,70 1,65 1,60 1,56 1,52 1,48 1,44 1,41 1,37 1,34 1,31
30 2,75 2,46 2,28 2,15 2,04 1,95 1,88 1,81 1,75 1,70 1,65 1,60 1,56 1,52 1,48 1,44 1,41 1,37 1,34 1,31
32 / 48
IC para a média populacional (µ): σ 2 desconhecido

Intervalo de Confiança para média de uma população normal com variância desco-
nhecida.
Seja {X1 , X2 , . . . , Xn } uma amostra aleatória simples de tamanho n retirada de uma
população com distribuição normal com média µ e variância σ 2 finita e desconhecida.
Então, o intervalo de confiança para o parâmetro média µ é dado por
t·S
IC = [X̄ − e; X̄ + e], em que e= √ ,
n

S é o desvio padrão amostral e t é obtido da Tabela t-Student com gl = n − 1.


Distribuição normal com variância/desvio-padrão desconhecido é o único caso que
usa a Tabela t-Student!

33 / 48
IC para a média populacional (µ): σ 2 desconhecido
Exemplo: Considere que X, o número de vezes que uma pessoa toca o rosto por
hora, tenha distribuição normal. Num experimento com 26 estudantes, observou-se
uma média de 23 toques no rosto por hora, com variância igual à 625. Encontre o
intervalo de confiança, com 96% de confiança para média de vezes que uma pessoa
toca o rosto por hora.

34 / 48
IC para a média populacional (µ): σ 2 desconhecido
Exemplo: Considere que X, o número de vezes que uma pessoa toca o rosto por
hora, tenha distribuição normal. Num experimento com 26 estudantes, observou-se
uma média de 23 toques no rosto por hora, com variância igual à 625. Encontre o
intervalo de confiança, com 96% de confiança para média de vezes que uma pessoa
toca o rosto por hora.
Solução: Dados do problema:
• n = 26
• X̄ = 23

• S 2 = 625 ⇒ S = 625 = 25
• Confiança de 96%.

Uma vez que a variância é obtida da amostra, temos que a distribuição de X̄ é t-Student
com n − 1 graus de liberdade (gl).
Neste caso, temos que gl = n − 1 = 26 − 1 = 25.
34 / 48
IC para a média populacional (µ): σ 2 desconhecido

1 + confiança 1 + 0,96
(Continuação:) Temos que P (T ≤ t) = = = 0.98.
2 2
Portanto, na linha gl = 25 e coluna P (T ≤ t) = 0, 98 da Tabela t-Student encontramos
t = 2.17.
t·S 2.17 × 25
e= √ = √ ≈ 10.64.
n 26
IC[µ; 96%] = [X̄ − e; X̄ + e] = [23 − 10.64; 23 + 10.64] = [12.36; 33.64].
Há evidências estatı́sticas, com 96% de confiança, de que uma pessoa toca o rosto entre
12 e 34 vezes por hora.

35 / 48
IC para a média populacional (µ): σ 2 desconhecido
Exemplo: Numa cidade, a velocidade de caminhada recomendada para atravessar
o semáforo é de 1.2m/s. Um estudo preliminar foi realizado com oito idosos desta
localidade, obtendo um velocidade médio para atravessar a rua de 0.92m/s com
desvio-padrão de 0.1m/s. Considerando que a velocidade de caminhada de idosos
para atravessar a rua segue distribuição normal, encontre o intervalo com 92% de
confiança para a velocidade de caminhada do idoso para atravessar a rua.

36 / 48
IC para a média populacional (µ): σ 2 desconhecido
Exemplo: Numa cidade, a velocidade de caminhada recomendada para atravessar
o semáforo é de 1.2m/s. Um estudo preliminar foi realizado com oito idosos desta
localidade, obtendo um velocidade médio para atravessar a rua de 0.92m/s com
desvio-padrão de 0.1m/s. Considerando que a velocidade de caminhada de idosos
para atravessar a rua segue distribuição normal, encontre o intervalo com 92% de
confiança para a velocidade de caminhada do idoso para atravessar a rua.
Solução: Dados do problema:
• n=8
• X̄ = 0.92
• S = 0.1 (desvio-padrão amostral)
• Confiança de 92%.

Uma vez que o desvio-padrão é obtido da amostra, temos que a distribuição de X̄ é t-


Student com n − 1 graus de liberdade. Neste caso, temos gl = n − 1 = 8 − 1 = 7.
36 / 48
IC para a média populacional (µ): σ 2 desconhecido

1 + confiança 1 + 0.92
(Continuação:) Temos que P (T ≤ t) = = = 0.96.
2 2
Portanto, na linha gl = 7 e coluna P (T ≤ t) = 0.96 da Tabela t-Student encontramos
t = 2.05.
t·S 2.05 × 0.1
e= √ = √ ≈ 0.07.
n 8
IC[µ; 92%] = [X̄ − e; X̄ + e] = [0.92 − 0.07; 0.92 + 0.07] = [0.85; 0.99].
Há evidências estatı́sticas, com uma confiança de 92%, de que os idosos atravessam a rua
com um velocidade entre 0.85 e 0.99 m/s, que é inferior a velocidade recomendada de 1.2
m/s.

37 / 48
IC para a proporção populacional (p)

variável dicotômica:
tipo de variável que assume apenas dois valores possı́veis.

Exemplos:
• Gênero: masculino ou feminino.
• Lançamento de uma moeda: cara ou coroa.
• Tipo de imóvel: residencial ou comercial.
• Status do atleta: profissional ou amador.
• Resultados do exame: aprovado ou reprovado.

38 / 48
IC para a proporção populacional (p)

Distribuição de Bernoulli (com parâmetro p):

Seja X variável aleatória que toma dois valores, 0 e 1, com probabilidades p e 1 − p,


respectivamente. Ou seja,

P (X = 1) = p e P (X = 0) = 1 − p.

Em resumo, P (X = x) = px (1 − p)1−x , x ∈ {0, 1}.


Em geral, (
1 se o evento A ocorre
X=
0 caso contrário
Por exemplo, A = aluno foi aprovado.

39 / 48
IC para a proporção populacional (p)

Exemplo: Em ano eleitoral, vemos artigos nos jornais que estabelecem intervalos de con-
fiança em termos de proporções ou porcentagens.

Por exemplo, uma pesquisa para um determinado candidato concorrendo à presidência


pode mostrar que o candidato tem 40% dos votos dentro de três pontos percentuais (se a
amostra for grande o suficiente).

Muitas vezes, as pesquisas eleitorais são calculadas com 95% de confiança, portanto, os
pesquisadores estariam 95% confiantes de que a verdadeira proporção de eleitores que
favorecem o candidato estaria entre 0.37 e 0.43.

40 / 48
IC para a proporção populacional (p)

Outras situações envolvendo variáveis dicotômicas:

• Suponha que queremos estimar a porcentagem de adultos que acreditam que os pais
devem ser obrigados a vacinar seus filhos contra doenças como sarampo, caxumba e rubéola.

• Suponha que queremos calcular a proporção de indivı́duos em medicação anti-hipertensiva


em João Pessoa.

• Suponha que queremos estimar a proporção de empresários da rede hoteleira da Paraı́ba


que estão em conformidade com as leis ambientais.

41 / 48
Distribuição da proporção amostral (p̂)

···

Seja {X1 , X2 , . . . , Xn } uma amostra aleatória simples de tamanho n retirada de uma


população com distribuição Bernoulli(p), em que

1, se a i-ésima amostra possui uma caracterı́stica especı́fica,
Xi =
0, se a i-ésima amostra não possui uma caracterı́stica especı́fica,

com P (Xi = 1) = p e P (Xi = 0) = (1 − p),Psendo p portanto, a probabilidade da


i-ésima amostra ter a caracterı́stica. Seja Y = ni=1 Xi o número de amostras com a
caracterı́stica. Então, Y tem distribuição Binomial(n, p).

42 / 48
Distribuição da proporção amostral (p̂)

Teorema 2: Seja {X1 , X2 , . . . , Xn } uma amostra aleatória simples de tamanho n retirada


de uma população com distribuição Bernoulli(p), então
Pn
Y Xi
p̂ = = i=1 = X,
n n
a proporção de amostras com uma caracterı́stica, é o estimador do parâmetro p. Além
disso, para n suficientemente grande
 
p(1 − p)
p̂ ∼ N p; .
n

43 / 48
IC para a proporção populacional (p)

Seja {X1 , X2 , . . . , Xn } uma amostra aleatória simples de tamanho n retirada de uma


população com distribuição Bernoulli(p), então, o intervalo de confiança para p é definido
por
p
z · p̂(1 − p̂)
IC = [p̂ − e; p̂ + e], em que e = √
n
e z é tal que
1 + confiança
P (Z ≤ z) = .
2

Usamos a tabela da distribuição normal padrão para encontrar z.

44 / 48
IC para a proporção populacional (p)

Exemplo: Um estudo foi feito para determinar a proporção de famı́lias que tem telefone
em uma certa comunidade. Uma amostra de 200 famı́lias é selecionada ao acaso, e 160
afirmam ter telefone. Qual o intervalo para p com 95% de confiança?

45 / 48
IC para a proporção populacional (p)

Exemplo: Um estudo foi feito para determinar a proporção de famı́lias que tem telefone
em uma certa comunidade. Uma amostra de 200 famı́lias é selecionada ao acaso, e 160
afirmam ter telefone. Qual o intervalo para p com 95% de confiança?

Solução: Dados do problema:


• Tamanho da amostra: n = 200
• Estimador pontual para a proporção: p̂ = 160/200 = 0.8
• Confiança de 95%.

45 / 48
IC para a proporção populacional (p)

1 + confiança 1 + 0.95
(Continuação) Temos que P (Z ≤ z) = = = 0.975.
2 2
Portanto, z = 1.96.
Logo, p p
z· p̂(1 − p̂) 1.96 × 0.8(1 − 0.8)
e= √ = √ ≈ 0.06.
n 200

IC[p; 95%] = [p̂ − e; p̂ + e] = [0.8 − 0.06; 0.8 + 0.06] = [0.74; 0.86].

Há evidências estatı́sticas, com 95% de confiança, de que a porcentagem de famı́lias que
possuem telefone varia entre 74% e 86%.

46 / 48
IC para a proporção populacional (p)

Exemplo: Uma empresa que gerencia concursos públicos, através de um sistema de


avaliação do nı́vel das questões, considera fácil uma questão do tipo múltipla escolha
se ao menos 80% das respostas são corretas. Uma amostra aleatória de 1200 respostas
a determinada questão apresenta 86% de respostas corretas. Construa o intervalo de
confiança de 90% para a verdadeira porcentagem de respostas corretas.

47 / 48
IC para a proporção populacional (p)

Exemplo: Uma empresa que gerencia concursos públicos, através de um sistema de


avaliação do nı́vel das questões, considera fácil uma questão do tipo múltipla escolha
se ao menos 80% das respostas são corretas. Uma amostra aleatória de 1200 respostas
a determinada questão apresenta 86% de respostas corretas. Construa o intervalo de
confiança de 90% para a verdadeira porcentagem de respostas corretas.

Solução: Dados do problema:


• Tamanho da amostra: n = 1200
• Estimador pontual para a proporção: p̂ = 0.86
• Confiança de 90%.

47 / 48
IC para a proporção populacional (p)

1 + confiança 1 + 0.90
(Continuação) Temos que P (Z ≤ z) = = = 0.95.
2 2
Portanto, z = 1.64.
Logo, p p
z· p̂(1 − p̂) 1.64 × 0.86(1 − 0.86)
e= √ = √ ≈ 0.02.
n 1200

IC[p; 90%] = [p̂ − e; p̂ + e] = [0.86 − 0.02; 0.86 + 0.02] = [0.84; 0.88].

Há evidências estatı́sticas, com 90% de confiança, de que a porcentagem de questões


respondidas corretamente varia entre 84% e 88%.

48 / 48

Você também pode gostar