Escolar Documentos
Profissional Documentos
Cultura Documentos
Apostila Estatistica Basica
Apostila Estatistica Basica
Estatı́stica Básica
1
Capı́tulo 1
Estatı́stica Descritiva
1.1 Somatório
a) Somatório simples:
n
X
xi = x1 + x2 + · · · + xn .
i=1
b) Somatório de quadrados:
n
X
x2i = x21 + x22 + · · · + x2n .
i=1
c) Quadrado do somatório:
n
!2
X
xi = (x1 + x2 + · · · + xn )2 .
i=1
2
Estatı́stica Básica
d) Somatório de produtos:
n
X
xi y i = x1 y 1 + x2 y 2 + · · · + xn y n .
i=1
e) Produto de somatórios:
n
X k
X
xi yi = (x1 + x2 + · · · + xn )(y1 + y2 + · · · + yk ).
i=1 i=1
f) Somatório duplo:
n X
X k n
X
zij = (zi1 + zi2 + · · · + zik ) = (z11 + z12 + · · · + z1k )+· · ·+(zn1 + zn2 + · · · + znk ) .
i=1 j=1 i=1
A seguir, apresentamos algumas propriedades do somatório que podem ser úteis quando
estamos operando.
Exemplo 1. Considere três conjuntos com 6 elementos cada descritos na tabela abaixo:
i 1 2 3 4 5 6
xi 2 3 4 3 2 1
fi 4 5 6 8 10 12
gi 10 6 12 4 5 10
3
Estatı́stica Básica
a) 6i=1 xi = x1 + x2 + x3 + x4 + x5 + x6 = 2 + 3 + 4 + 3 + 2 + 1 = 15.
P
6 + 12) + (3 + 8 + 4) = 14 + 22 + 15 = 41.
Exercı́cio:
A tabela a seguir apresenta a variação do preço do dólar no mês de setembro de 2008 e a
compra da moeda realizada por duas empresas. A variável c(x) representa a compra de
dólares pelas duas empresas.
Qual foi a empresa que investiu mais nestes cinco dias do mês de setembro de 2008? E
quanto investiu em reais?
• População: conjunto de indivı́duos (ou objetos, elementos) que tem em comum pelo
menos uma variável observável.
4
Estatı́stica Básica
5
Estatı́stica Básica
Podemos tabular um conjunto de dados a fim de obter um resumo e/ou uma apresentação
dos dados. A tabulação pode ser feita para variáveis qualitativas ou quantitativas. Se-
guem alguns exemplos.
A tabela abaixo é simples e não faz nenhum tipo de redução dos dados, apenas organiza.
6
Estatı́stica Básica
7
Estatı́stica Básica
Considere que:
• k é o número de classes;
• ni é a frequência absoluta, n1 + n2 + · · · + nk = n;
ni
• fi é a frequência relativa, fi = ;
n
i
X
• fiac é a frequência relativa acumulada, fiac = fj .
j=1
Importante: O número de classes (k) para uma tabela de frequências pode ser obtido
utilizando os seguintes métodos:
√
n, se n > 25;
k =
5, caso contrário.
• Método de Sturges:
k = 1 + 3, 22 log10 n (1.1)
8
Estatı́stica Básica
Exemplo 2. Variável: Nı́vel de Instrução= fundamental (ni = 12, fi = 0, 33), médio (ni =
18, fi = 0, 50) e superior (ni = 6, fi = 0, 17).
em que:
ni : frequência absoluta;
fi : frequência relativa;
%: porcentagem;
fac : frequência relativa acumulada.
Exemplo 3. Considere a quantia de empréstimos diários (em milhares) de quatro diferentes bancos
(B1, B2, B3 e B4) com agências de mesmo porte em três avenidas (A1, A2 e A3) de uma cidade:
9
Estatı́stica Básica
Exemplo 4. Foi realizada uma pesquisa com 20 funcionários de uma empresa para avaliar a pre-
ferência entre dois produtos (A e B). A tabela abaixo apresenta os resultados das seguintes carac-
terı́sticas investigadas: Renda do trabalho em número de salários mı́nimos (X); Sexo (F - feminino
e M - masculino); Preferência entre os produtos A ou B.
Entrevistado 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
N o salários (X) 2 3,7 1,7 3 4 5 1,4 3 3 1,8 6 4,8 2,3 1,5 3,2 2,2 1 4,4 2 2
Sexo M M F M F M M F F F M M F M F F M F M F
Preferência A B A B B B A B A A B B A A A A A B A A
10
Estatı́stica Básica
• Qualitativas:
– gráfico de colunas/barras;
– gráfico de setores;
• Quantitativas:
– gráfico de colunas/barras;
– gráfico de linhas;
– gráfico de dispersão;
– ramo e folhas;
– ogiva;
– histograma;
– polı́gono de frequências.
Todos os gráficos a seguir foram gerados utilizando o software livre R. Você pode fazer o
download do programa pela site oficial: https://cran.r-project.org/
Exemplo 5. Variável: Nı́vel de Instrução= fundamental (ni = 12, fi = 0, 33), médio (ni =
18, fi = 0, 50) e superior (ni = 6, fi = 0, 17).
11
Estatı́stica Básica
15
Frequência
10
5
0
Exemplo 6. Variável: Nı́vel de Instrução= fundamental (ni = 12, fi = 0, 33), médio (ni =
18, fi = 0, 50) e superior (ni = 6, fi = 0, 17).
1(33.3%)
2(50%) 3(16.7%)
Pode vir acompanhado com uma legenda ou porcentagens ao lado das respostas.
12
Estatı́stica Básica
{0, 1, 2, 0, 0, 0, 0, 0, 1, 0, 2, 0, 0, 3, 0, 0, 1, 2, 0, 0, 1, 0, 0, 0, 2, 2, 0, 0, 5, 2, 0, 1, 3, 0, 2, 3}.
5
4
Nº de filhos
3
2
1
0
0 5 10 15 20 25 30 35
Estudantes
Figura 1.3: Gráfico de linhas para variável número de filhos por estudante.
13
Estatı́stica Básica
Exemplo 8. Útil para séries temporais ou para relacionar duas variáveis quantitativas. Variáveis:
Velocidade (4, 4, 7, 7, 8, 9, 10, 10, 10, ..., 24, 25) e Distância (10, 4, 22, 16, 10, 18, 26, 34, ..., 120,
85).
120
●
100
●
●
● ●
80
●
●
Distância
●
●
●
●
60
●
● ●
● ●
●
●
●
● ●
●
40
● ●
● ●
● ●
● ● ●
● ●
● ● ● ●
●
●
20
● ●
● ●
●
●
● ●
●
●
0
5 10 15 20 25
Velocidade
Vejamos um exemplo.
14
Estatı́stica Básica
9 | 168
10 | 4588
11 | 2223345566668889
12 | 0111113334666667788999
13 | 00012223344444455566678
14 | 11123344445666677889
15 | 000344447788
1.4.6 Ogiva
Exemplo 10. Variável: Velocidade (4, 4, 7, 7, 8, 9, 10, 10, 10, 11, 11,..., 24, 24, 24, 24, 25), com
frequências relativas = 0.03703704, 0.03703704, 0.01851852, 0.01851852, 0.05555556, 0.03703704,
..., 0.01851852, 0.07407407, 0.09259259).
1.0
●
0.8
Proporção Acumulada (Fac)
●
●
●
0.6
●
●
●
0.4
●
0.2
●
●
●
●
●
●
0.0
5 10 15 20 25
Velocidade
15
Estatı́stica Básica
1.4.7 Histograma
∆ 19, 30
∆i = = = 3, 86 ≈ 4,
5 5
(sempre arredondar para mais, garantindo que o último valor seja incluı́do).
Classes xi ni fi % fac di
[4,8) 6 10 0,28 28 0,28 0,0700
[8,12) 10 12 0,33 33 0,61 0,0825
[12,16) 14 8 0,22 22 0,83 0,0550
[16,20) 18 5 0,14 14 0,97 0,0350
[20,24) 22 1 0,03 3 1,00 0,0075
Total - 36 1,00 100 - -
em que:
xi : ponto médio do i-ésimo intervalo de classe;
ni : frequência absoluta do i-ésimo intervalo de classe;
fi : frequência relativa do i-ésimo intervalo de classe;
%: porcentagem do i-ésimo intervalo de classe;
fac : frequência relativa acumulada até o i-ésimo intervalo de classe;
16
Estatı́stica Básica
Note que:
• os histogramas são formados por retângulos cujas bases são os intervalos de classes
dos dados agrupados e as alturas são as densidades de cada classe (di ).
ni fi
• podemos ter histogramas de frequências (di = δi
), de proporção (di = δi
) e de por-
100fi
centagem (di = δi
).
33%
0.08
Densidade de Frequência
28%
0.06
22%
0.04
14%
0.02
3%
0.00
0 4 8 12 16 20 24
Salário
Figura 1.6: Histograma.
17
Estatı́stica Básica
0.10
0.08
●
●
0.06
Densidade
●
0.04
●
0.02
●
0.00
● ●
0 5 10 15 20 25 30
Salário
Figura 1.7: Polı́gono de frequências.
●
Densidade de Frequência
●
0.06
●
0.04
●
0.02
●
0.00
● ●
0 4 8 12 16 20 24
Salário
Figura 1.8: Histograma e polı́gono de frequências.
18
Estatı́stica Básica
Exercı́cio: Considere um conjunto com os dados de idade (em meses) de uma determinada
planta.
1 2 2 6 8 9 15 17 20 20
20 21 27 29 29 35 37 37 43 48
Faça o histograma com 5 classes iniciando no menor valor do conjunto. E, em seguida, o
polı́gono de frequência.
19
Estatı́stica Básica
{2, 3, 4, 5, 7, 9, 10},
{2, 3, 4, 5, 7, 7, 9, 10},
– Média Geométrica:
√
x̄g = n
x1 × x2 × · · · x n .
– Média Harmônica:
n
x̄h = Pn 1 .
i=1 xi
Exemplo 13. Seja o conjunto de observações X = {4, 7, 5, 3, 9, 10, 2}. Vamos determinar
cada uma das médias apresentadas acima.
4 + 7 + 5 + 3 + 9 + 10 + 2
1. x̄ = ≈ 5, 72;
7
2. Considere o conjunto de pesos W = {1, 3, 2, 1, 3, 2, 1}, logo:
4 ∗ 1 + 7 ∗ 3 + 5 ∗ 2 + 3 ∗ 1 + 9 ∗ 3 + 10 ∗ 2 + 2 ∗ 1
x̄p = ≈ 6, 69;
13
√
7
3. x̄g = 4 × 7 × 5 × 3 × 9 × 10 × 2 ≈ 4, 98;
7
4. x̄h = 1 ≈ 4, 28.
4
+ + + + 19 +
1
7
1
5
1
3
1
10
+ 1
2
Podemos utilizar a seguinte fórmula para encontrar a posição dos quantis de forma
geral:
s(n + 1)
,
r
em que s é a ordem do quantil (quartil {1, 2, 3}; decil {1, 2, · · · , 9}; percentil {1, 2, · · · , 99}),
r é o quantil desejado (4,10 ou 100) e n é o tamanho do conjunto de dados.
Exemplo 14. Seja X = {160, 145, 133, 144, 152, 167, 200, 156, 143, 144, 167, 177, 160, 153, 155}
com n = 15 observações. Encontre os quartis, D3 , P25 e P10 .
Ordenando, obtemos:
{133, 143, 144, 144, 145, 152, 153, 155, 156, 160, 160, 167, 167, 177, 200}.
1. D3 : encontrando a posição
s(n + 1) 3 ∗ (15 + 1)
= = 4, 8 ≈ 5,
r 10
logo D3 = 145;
25 ∗ (15 + 1)
= 4,
100
10 ∗ (15 + 1)
= 1, 6 ≈ 2,
100
• Média Aritmética: PK K
i=1 xi ni X
x̄ = = x i fi .
n i=1
Exemplo 15. Seja X = {4, 00; 4, 56; 5, 25; 5, 73; 6, 26; 6, 66; 6, 86; 7, 39; 7, 59; 7, 44; 8, 12; 8, 46; 8, 74;
8, 95; 9, 13; 9, 35; 9, 77; 9, 80; 10, 53; 10, 76; 11, 06; 11, 59; 12, 00; 12, 79; 13, 23; 13, 60; 13, 85; 14, 69;
14, 71; 15, 99; 16, 22; 16, 61; 17, 26; 18, 75; 19, 40; 23, 30}, agrupado em 5 intervalos de classes:
33%
0.08
Densidade de Frequência
28%
0.06
22%
0.04
14%
0.02
3%
0.00
0 4 8 12 16 20 24
Salário
1. Moda = 10.
23
Estatı́stica Básica
2. Mediana = 10,67 (obtida via histograma). Como determinar? A mediana deixa 50%
dos dados abaixo dela. No primeiro retângulo do histograma, temos 28% dos dados
(f1 ) que não é suficiente, então temos que somar mais a proporção de 33% do se-
gundo retângulo, que já ultrapassa os 50% da mediana. Logo, a mediana é um valor
no intervalo de 8 até 12, que determina um retângulo de área 22% para somar com
os 28% do retângulo anterior e totalizar 50%. Temos a seguinte equação:
• Suponha que queremos pensar em dispersão dos dados em torno da sua média
aritmética. Então, poderı́amos olhar para as diferenças de cada xi , para i = 1, · · · , n,
em relação à média x̄, isto é,
xi − x̄,
que é sempre igual a zero para qualquer que seja X. Para contornar esse problema,
temos as seguintes propostas:
• DM A(X) =
|4 − 5, 72| + |7 − 5, 72| + |5 − 5, 72| + |3 − 5, 72| + |9 − 5, 72| + |10 − 5, 72| + |2 − 5, 72|
≈
7
2, 53;
42 + 72 + 52 + 32 + 92 + 102 + 22
• V AR(X) = − 5, 722 ≈ 7, 92;
7
p
• DP (X) = 7, 92 ≈ 2, 81;
3+4 7+9
• IQ(X) = 8 − 3, 5 = 4, 5, pois Q1 (X) = 3, 5 e Q3 (X) = 8 extraı́dos
2 2
do conjunto ordenado {2, 3, 4, 5, 7, 9, 10} com 7 observações;
2, 81
• CV (X) = ≈ 0, 49.
5, 72
PK K K
i=1 (xi − x̄)2 ni X X
• V ar(X) = = (xi − x̄)2 fi = x2i fi − (x̄)2 .
n i=1 i=1
25
Estatı́stica Básica
Exemplo 17. Calcule todas as medidas de dispersão apresentadas para o conjunto de dados agru-
pados da tabela abaixo.
33%
0.08
Densidade de Frequência
28%
0.06
22%
0.04
14%
0.02
3%
0.00
0 4 8 12 16 20 24
Salário
Calculando:
PK
|xi − x̄|ni
i=1
• DM A(X) = =
n
|6 − 11, 24| × 10 + |10 − 11, 24| × 12 + |14 − 11, 24| × 8 + |18 − 11, 24| × 5 + |22 − 11, 24| × 1
=
36
3, 72;
K
X
• V ar(X) = x2i fi − (x̄)2 = (62 × 0, 28 + 102 × 0, 33 + 142 × 0, 22 + 182 × 0, 14 + 222 ×
i=1
0, 03) − (11, 24)2 ≈ 19, 74;
26
Estatı́stica Básica
p
• DP (X) = 19, 7 ≈ 4, 44;
• IQ(X) = Q3 (X) − Q1 (X) = 14, 545455 − 7, 571429 = 6, 974026, pois através do histo-
grama determinamos os quartis:
• Se Y = {a, a, · · · , a}, então todas as medidas de posição são iguais a ”a”e todas as
medidas de dispersão são iguais a zero.
• Seja o conjunto Y = {ax1 , ax2 , · · · , axn }, então ȳ = ax̄, M o(Y ) = aM o(X), M d(Y ) =
aM d(X); DM A(Y ) = |a|DM A(X), V ar(Y ) = a2 V ar(X), DP (Y ) = |a|DP (X),
IQ(Y ) = |a|IQ(X).
• as médias de Y , Z, e W :
z̄ = x̄ + 4 = 5, 72 + 4 = 9, 72;
• as medianas de Y , Z, e W :
M d(Z) = M d(X) + 4 = 5 + 4 = 9;
M d(W ) = 2M d(X) − 1 = 2 × 5 − 1 = 9.
• as variâncias de Y , Z, e W :
• os desvios padrões de Y , Z, e W :
p √
DP (Y ) = V ar(Y ) = 71, 28 = 8, 442748;
p √
DP (Z) = V ar(Z) = 7, 92 = 2, 814249;
p √
DP (W ) = V ar(W ) = 31, 68 = 5, 628499.
2. Encontre a média e a variância destes ı́ndices, supondo que houve um erro de medição
de 10 mg/dL para menos em todos os pacientes.
3. Supondo, ainda, que houve um erro de medição de 10 mg/dL para menos em todos
os pacientes, determine a média e a variância dos ı́ndices multiplicados por -2.
29
Estatı́stica Básica
Vamos falar agora de duas formas de classificação de um conjunto de dados que auxiliam
na sua descrição e entendimento, a assimetria e a curtose.
1.6.1 Assimetria
Um conjunto de dados é dito ser simétrico se sua moda, mediana e média são iguais.
Da mesma forma, se os lados direito e esquerdo do diagrama/gráfico de pontos (ou de
barras), ou do histograma, são a imagem espelhada um do outro. Observe que, para
discutirmos assimetria o conjunto de dados deve ser unimodal.
Caso seja não seja simétrico, dizemos que é assimétrico. Um conjunto de dados é as-
simétrico à direita se a cauda direita do histograma se estende muito mais do que a cauda
esquerda, ou seja, a cauda declina para direita. Nesse caso, temos média>mediana>moda.
E um conjunto de dados é assimétrico à esquerda se a cauda esquerda do histograma
se estende muito mais do que a cauda direita, ou seja, a cauda declina para esquerda.
Nesse caso, temos média<mediana<moda. Seja um conjunto de dados com n observações
Figura 1.9: Possı́veis casos de assimetria. A seta representa a média da distribuição. Fonte:
Apostila de Estatı́stica Descritiva da Ana Maria Farias-UFF
x̄ − M o(X)
e= .
DP (X)
Note que:
2. se e > 0, então x̄ − M o(X) > 0 (lembre que DP (X) ≥ 0, sempre), daı́ x̄ > M o(X),
logo a distribuição de valores é assimétrica à direita;
3. se e < 0, então x̄ − M o(X) < 0 (lembre que DP (X) ≥ 0, sempre), daı́ x̄ < M o(X),
logo a distribuição de valores é assimétrica à esquerda.
2 3 4 5 6 7 8 9 10
X
x̄ − M o(X) 5, 56 − 4
e= = = 0, 69 > 0,
DP (X) 2, 27
1.6.2 Curtose
m4 (X)
c= − 3,
DP (X)4
Pn
i=1 (xi − x̄)4
em que m4 (X) = .
n
Como a curtose da normal padrão é 3, o valor limiar para a classificação da curtose é o
zero. Portanto, dizemos que X é:
1. Leptocúrtica: se c > 0;
2. Mesocúrtica: se c = 0;
32
Estatı́stica Básica
3. Platicúrtica: se c < 0.
m4 (X) 55, 24
c= 4
−3= − 3 = −0, 92 < 0,
DP (X) 2, 274
33
Estatı́stica Básica
1.7 Boxplot
O Boxplot é uma representação gráfica que para ser construı́do e entendido precisa dos
conhecimentos apresentados anteriormente sobre medidas de posição e dispersão. Por
isso, dapresentaremos esse gráfico somente agora. Esta representação gráfica é bastante
rica no sentido de informar a variabilidade e simetria dos dados, envolvendo os quar-
tis do conjunto observado. Além disso, podemos observar se os dados possuem valores
discrepantes (outliers).
1.7.1 Construção:
O Boxplot é construı́do a partir de um retângulo em que o nı́vel superior é dado pelo ter-
ceiro quartil e o nı́vel inferior pelo primeiro quartil. A mediana é representada por um
traço no interior do retângulo e os segmentos de reta são colocados do retângulo até os
valores máximo e mı́nimo, que não sejam observações discrepantes.
As observações que estiverem acima do limite superior (LS ) ou abaixo do limite inferior
3
(LI ) são denominadas de valores discrepantes (pontos exteriores). LI = Q1 − IQ , LS =
2
3
Q3 + IQ e IQ = Q3 − Q1 .
2
60.0 60.5 63.0 63.5 66.0 67.0 68.5 70.0 71.0 71.0 72.8 73.0 73.0 75.0 79.0 80.9 84.0 85.2 86.0 87.0
95.0 97.0
Primeiro, precisamos verificar se os dados estão ordenados. Nesse caso, estão em ordem
crescente. Precisamos calcular:
52 + 52 58 + 58 68, 5 + 70
• Q1 = = 52, Q2 = = 58 e Q3 = = 69, 25;
2 2 2
• IQ = Q3 − Q1 = 69, 25 − 52 = 17, 25;
3 3
• LI = Q1 − IQ = 52 − 17, 25 = 26, 125;
2 2
3 3
• LS = Q3 + IQ = 69, 25 + 17, 25 = 95, 125.
2 2
Assim, determinamos as alças superior igual a 44 e inferior igual 95, levando ao dado
discrepante 97 que é maior do que o LS de 95,125.
●
90
80
Peso (Kg)
70
60
50
Podemos também ter vários boxplots juntos a fim de comparar diferentes conjuntos de
dados. O eixo y das ordenadas continua igual e apenas usamos o eixo x das abscissas para
distanciarmos os boxplots, sem nenhuma interpretação numérica.
35
Estatı́stica Básica
Exercı́cio 1 Suponha que no exercı́cio anterior, sobre os ritmos cardı́acos de repouso, uma
das 10 observações foi corrigida (devido a um erro de registro), sendo 105 bpm ao invés
de 99 bpm, obtendo-se o novo conjunto de dados (dados fictı́cios): 51, 55, 77, 105, 60, 75,
77, 85, 65, 62. Construa o boxplot.
Exercı́cio 2 Considere o tempo (em minutos) de atendimento em um determinado banco
para um conjunto de 20 pessoas: 2; 2; 2; 3; 3; 4; 4; 4; 4; 4; 5; 5; 6; 6; 10; 12; 15; 17; 23; 25.
Construa o gráfico de boxplot e interprete.
36
Estatı́stica Básica
Quando temos disponı́vel duas variáveis quantitativas pareadas (mesmo número de observações),
inicialmente, uma inspeção visual pode ser feita através de um gráfico de dispersão. Va-
mos desenvolver o conceito dentro de um exemplo.
Exemplo 22. Suponha as variáveis: Anos de Estudo (6, 4, 8, 8, 9, 12, 13, 9, 25, 15) e Salário Médio
(1, 0.9, 1.2, 1.5, 1.8, 3, 2.5, 2, 10, 4) em milhares.
10
●
Salário Médio (em milhares)
8
6
●
4
●
●
●
2
●
●
●
● ●
5 10 15 20 25
Anos de Estudo
Figura 1.13: Gráfico de Dispersão das variáveis Anos de Estudo e Salário Médio.
Podemos ainda, utilizar o coeficiente de correlação linear de Pearson para verificar se há
indı́cios de uma relação linear significativa entre essas duas variáveis.
Para utilizar esse coeficiente, precisamos de observações de variáveis pareadas, da forma
{(x1 , y1 ), (x2 , y2 ), · · · , (xn , yn )}. Isso ocorre no caso do exemplo.
37
Estatı́stica Básica
tal que cov(X, Y ) = n1 ni=1 [(xi − x̄)(yi − ȳ)] , representa a covariância entre X e Y .
P
Assim definido, o coeficiente somente assume valores no intervalo [−1, 1]. E, sua interpretação
segue:
• valores do coeficiente mais próximos de -1, indicam maior relação linear negativa/decrescente;
x̄ = 10, 9 e ȳ = 2, 79;
em que X representa a variável Anos de Estudo e Y representa o Salário Médio.
Assim, obtemos que
Pn
xi yi − nx̄ȳ
cor(X, Y ) = p Pn 2 i=1
( i=1 xi − nx̄2 ) ( ni=1 yi2 − nȳ 2 )
P
443, 9 − 10 ∗ 10, 9 ∗ 2, 79
= p = 0, 944116,
(1505 − 10 ∗ (10, 9)2 ) (143, 99 − 10 ∗ (2, 79)2 )
38
Estatı́stica Básica
Banco/Avenida A1 A2 A3 Total
B1 25 35 24 84
B2 32 28 27 87
B3 27 33 31 91
B4 41 60 25 126
Total 125 156 107 388
Será que a quantia de empréstimos varia de acordo com o banco? Podemos calcular o
coefiente de contingência para começar a responder essa pergunta. Para esse cálculo,
precisamos primeiro construir a tabela de contingência dos dados que contempla tanto a
frequência observada (oij ) quanto a esperada(eij ), caso haja independência entre as variáveis.
A frequência esperada de cada casela da tabela é dada por:
Banco/Avenida A1 A2 A3 Total
oij eij oij eij oij eij
B1 25 27,06 35 33,77 24 23,17 84
B2 32 28,03 28 34,98 27 23,99 87
B3 27 29,32 33 36,59 31 25,10 91
B4 41 40,59 60 50,66 25 34,75 126
Total 125 - 156 - 107 - 388
39
Estatı́stica Básica
s
χ2
C= ,
χ2 + total geral
X X (oij − eij )2
tal que χ2 = é a medida de qui-quadrado e o total geral é o número
i j
eij
total de observações.
(25 − 27, 06)2 (35 − 33, 77)2 (24 − 23, 17)2 (32 − 28, 03)2 (25 − 34, 75)2
χ2 = + + + +· · ·+ = 8, 95.
27, 06 33, 77 23, 17 28, 03 34, 75
Logo, r
8, 95
C= = 0, 15
8, 95 + 388
indicando que não há relação entre as variáveis.
Uma medida mais robusta é obtida pelo coeficiente de contingência corrigido:
C
C∗ = p ,
(t − 1)/t
Exercı́cios.
1. Uma amostra de 10 casais e seus respectivos salários anuais (em salários mı́nimos)
foi colhida em um certo bairro conforme abaixo:
Casal 1 2 3 4 5 6 7 8 9 10 Total
Homem (X) 10 10 10 15 15 15 15 20 20 20 150
Mulher (Y ) 5 10 10 5 10 10 15 10 10 15 100
2. Uma companhia de seguros analisou a frequência com que 150 segurados usaram
(ou não) o hospital. Os resultados foram os seguintes:
Queremos verificar se existe ou não relação entre o sexo e o uso do hospital, isto é,
se as variáveis são dependentes.
41
Capı́tulo 2
Probabilidade
Definição 1. Um experimento aleatório () é um experimento cujo resultado não pode ser previsto,
com certeza, antes de sua ocorrência.
Exemplo 23. (i) Lançar um dado equilibrado duas vezes e observar a soma dos pontos obtidos.
(ii) Taxa de desemprego.
(iii) Ocorrência de chuva amanhã;
(iv) As condições climáticas do próximo domingo;
(v) Selecionar um estudante da UFRRJ e medir a sua altura em metros.
(3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, 1),
(6, 2), (6, 3), (6, 4), (6, 5), (6, 6)}.
3 : medir a vida útil de uma lâmpada. Ω = [0, ∞).
A ∩ B = {x ∈ Ω; x ∈ A e x ∈ B}.
A ∪ B = {x ∈ Ω; x ∈ A ou x ∈ B}.
AC = A = {x ∈ Ω; x ∈
/ A}.
4. Diferença:
A − B = A ∩ B C = {x ∈ Ω; x ∈ A e x ∈
/ B}.
43
Estatı́stica Básica
2.1.4 Probabilidade
nA
P (A) = ,
nΩ
área A
P (A) = .
área Ω
Exemplo 28. (i) Jogar um dado equilibrado com 6 faces e observar a face superior. Logo, P ({1, 2}) =
2
6
.
(ii) Escolher, ao acaso, um ponto do cı́rculo unitário de raio 1 centrado na origem. Então
Ω = {(x, y) ∈ R2 ; x2 + y 2 ≤ 1}.
E,
π(1/2)2
P ({distância entre o ponto escolhido e a origem é ≤ 1/2}) = .
π
Definição 5 (Definição Frequentista). Seja o evento A ⊂ Ω, sendo Ω espaço amostral associado a
um experimento aleatório, então podemos definir probabilidade como o limite da frequência relativa
da ocorrência de A em n repetições independentes do experimento, quando n tende ao infinito, isto
é,
nA
P (A) = lim ,
n→∞ n
Observe que não é possı́vel repetir o experimento infinitas vezes, logo não podemos ava-
liar de fato essa probabilidade.
Exemplo 29. Seja A o evento ´´está chovendo no RJ”. Para alguém que está, por exemplo, em
Portugal e não sabe nada sobre o clima no RJ, provavelmente essa probabilidade seria de 0,5. Por
44
Estatı́stica Básica
outro lado, alguém em Seropédica poderia estabelecer que essa probabilidade é de 0,7, se também
está chovendo em Seropédica. Finalmente, para uma pessoa no RJ, essa probabilidade é 1 se está
chovendo no RJ.
(1) P (A) ≥ 0, ∀A ⊂ Ω;
(2) P (Ω) = 1;
∞
X
(3) Se A1 , A2 , · · · ⊂ Ω são disjuntos, então P (∪∞
i=1 Ai ) = P (Ai ).
i=1
45
Estatı́stica Básica
Exemplo 33. Uma carta de um baralho com 52 cartas é retirada. Considere os eventos, O={carta
é de ouros} e R={carta é um rei}. Encontre P (O), P (O ∩ R), P (R) e P (O|R).
Teorema 1 (Regra do Produto). Sejam os eventos A1 , A2 , ... , An definidos em Ω, com P (∩ni=1 Ai ) >
0, então
n−1
P (∩ni=1 Ai ) = P (A1 )P (A2 |A1 )P (A3 |A1 ∩ A2 ) · · · P (An | ∩i=1 Ai ).
Uma definição alternativa é que A e B são ditos ser eventos independentes se P (A|B) =
P (A) e P (B|A) = P (B).
1
Exemplo 34. Sejam A e B dois eventos de um espaço amostral, tais que P (A) = p, P (B) = e
5
1
P (A ∪ B) = . Determine o valor de p para que os eventos A e B sejam independentes.
2
Definição 10. A sequência de eventos A1 , A2 , ... , An é dita formar uma partição do espaço
amostral Ω, se
(i) Ai ∩ Aj = , para todo i 6= j;
(ii) ∪ni=1 Ai = Ω.
46
Estatı́stica Básica
Exemplo 35. Uma fábrica produz três tipos de circuitos, sendo: 20% do tipo I, 50% do tipo II e
30% do tipo III. A probabilidade de defeito é, respectivamente, 2%, 8% e 5%.
a) Qual é a probabilidade de um circuito testado não ser defeituoso?
b) Um circuito foi testado aleatoriamente e verificou-se que estava com defeito, qual é a probabilidade
do circuito ser do tipo II?
C
1. ( ni=1 Ai ) = ni=1 AC
S T
i ;
C
2. ( ni=1 Ai ) = ni=1 AC
T S
i .
47
Capı́tulo 3
Variáveis Aleatórias
Uma variável aleatória (v.a.) é uma função real X que associa elementos do espaço amos-
tral a valores reais, i.e., X : Ω → <.
Exemplo 36. Suponha 2 lançamentos de uma moeda. Represente por c cara e por k coroa, então
Ω = {cc, ck, kc, kk}. O número de caras observadas nesses 2 lançamentos é uma quantidade
numérica e podemos definir X = ´´nº de caras observadas”. Note que X pode assumir valores no
conjunto finito {0, 1, 2}.
Definição 12 (Função de probabilidade (fp)). A função p(·) que atribui a cada valor da variável
aleatória discreta X sua probabilidade é denominada função de probabilidade. Assim, se X assume
valores x1 , x2 , · · · temos
para i = 1, · · · , n.
X x1 x2 ...
pi p1 p2 ...
Exemplo 37. Descreva o comportamento da variável aleatória X que conta o número de caras em
dois lançamentos independentes de uma moeda.
Espaço amostral: Ω = {cc, ck, kc, kk}
Variável aleatória discreta X:
X = xi 0 1 2
1 1 1
p(xi ) 4 2 4
Definição 13 (Função de Distribuição (acumulada) (fda)). Seja X uma v.a.d. em Ω, então sua
função de distribuição acumulada é definida por
Exemplo 38. Considere o lançamento de uma moeda. Então Ω = {c, k} e a função probabilidade
é dada por P (c) = P (k) = 1/2. Defina X : Ω → < como:
1, se ω = c
X= (3.1)
0, se ω = k
Portanto,
0, se x < 0
F (x) = 1/2, se 0 ≤ x < 1 (3.2)
se x ≥ 1
1,
49
Estatı́stica Básica
O comportamento de uma variável aleatória e toda informação sobre ela podem ser obti-
dos através de sua função de distribuição acumulada. Além disso, toda função real que
satisfaça as propriedades acima é a função de distribuição acumulada de uma variável
aleatória.
Funções de Variáveis Aleatórias Seja X uma v.a.d. definida em Ω, então a função ou
transformação g : X → < também é uma v.a.d.. Assim, dada a distribuição de X, o
interesse consiste em conhecer o comportamento probabilı́stico de sua transformação.
Exemplo 39. Seja X uma v.a.d. com função de probabilidade dada abaixo:
X = xi -1 0 1
1 1 1
p(xi ) 3 2 6
X = xi -1 0 1
Y = yi = 2xi + 1 -1 1 3
1 1 1
p(yi ) 3 2 6
Exemplo 40. Considerando X como no exemplo anterior, definamos Z = X 2 . Logo, temos que
considerar que tanto X = −1 quanto X = 1 levam a Z = 1, portanto temos que a função de
probabilidade de Z é dada por:
Z = zi = x2i 1 0
1 1 1 1
p(zi ) 3
+ 6
= 2 2
Definição 14 (Esperança ou Valor Esperado). Seja X uma v.a.d. com função de probabilidade
p, então a esperança (matemática) de X é dada por
X
E[X] = xp(x),
x
Exemplo 41. Como no exemplo anterior, seja X uma v.a.d. com função de probabilidade dada
abaixo:
Determine a esperança de X:
X = xi -1 0 1
1 1 1
p(xi ) 3 2 6
Vale que:
3.1 Momentos
E[(X − c)k ],
Exemplo 42. O primeiro momento ordinário (de ordem k = 1) de uma v.a. X é o seu valor
esperado.
51
Estatı́stica Básica
Definição 16 (Variância). Seja X uma variável aleatória discreta, então a variância de X é defi-
nida por
V ar(X) = E[(X − E[X])2 ] = E[X 2 ] − (E[X])2 ,
que é segundo momento central de X. Sua raiz quadrada é o desvio padrão de X, que possui a
mesma unidade dos dados.
Exemplo 44. O número X de mensagens enviadas por hora, através de uma rede de compu-
tadores, tem a seguinte distribuição: X assume os valores {10, 12, 15, 20} com probabilidades
{0, 1; 0, 3; 0, 5; 0, 1}, respectivamente. Determine o desvio-padrão de X.
E[X 2 ] = 102 (0, 1) + 122 (0, 3) + 152 (0, 5) + 202 (0, 1) = 205, 7;
p
V ar(X) = 205, 7 − 14, 12 = 6, 89 ⇒ DP (X) = 6, 89 = 2, 624881.
Definição 17 (Coeficiente de Variação). Seja X uma v.a.d. com esperança µ e desvio padrão σ,
o coeficiente de variação de X é dado por
σ
CV (X) = .
µ
52
Estatı́stica Básica
Exemplo 45. Uma rifa tem 100 bilhetes numeradas de 1 a 100. Tenho 5 bilhetes consecutivos e
meu amigo tem outros 5 bilhetes quaisquer. Quem tem maior possibilidade de ser sorteado?
Note que sua função de distribuição acumulada é do tipo escada com saltos nos pontos
{x1 , x2 , · · · , xn }.
Exercı́cio: Determine sua fda, sua esperança e sua variância.
Notação: X ∼ Bernoulli(p).
A função de distribuição de X é dada por
0, se x < 0,
FX (x) = (1 − p), se 0 ≤ x < 1,
se x ≥ 1.
1,
Exercı́cio: Faça o gráfico desta função e determine sua esperança e sua variância.
Exemplo 48. A taxa de imunização de uma vacina é de 80%. Um grupo com 10 pessoas foi
selecionado, desejamos saber o comportamento probabilı́stico do número de pessoas imunizadas
deste grupo. Determine a probabilidade:
a) de 8 pessoas estarem imunizadas;
b) de pelo menos 8 estarem imunizadas;
c) de no máximo 7 estarem imunizadas;
c) de todas estarem imunizadas.
54
Estatı́stica Básica
Notação: X ∼ Geo(p).
Exemplo 50. Um atirador acerto o alvo na mosca em 30% dos tiros. Qual é a probabilidade de que
somente no vigésimo tiro o atirador acerte na mosca 2 vezes?
55
Estatı́stica Básica
tamanho n, sem reposição. Seja X o número de sucessos obtidos, então X segue o modelo
Hipergeométrico com parâmetros N, n, e r, e tem função de probabilidade dada por
r N − r
x n −x
, se max{0, n − (N − r)} ≤ x ≤ min{n, r}
p(x) = P (X = x) = N
n
0, c.c.,
Exemplo 51. Considere um conjunto com 20 pessoas, das quais 7 são mulheres. Selecionando-se
5 pessoas deste conjunto, sem reposição, qual seria a probabilidade de:
a) 2 mulheres serem escolhidas?
b) 1 homem ser escolhido?
c) apenas mulheres serem escolhidas?
d) pelo menos 5 mulheres serem escolhidas?
e) no máximo 2 homens serem escolhidos?
f) Fernando e Paula serem escolhidos?
g) Paula e Maria serem escolhidas, dado que as pessoas selecionadas foram mulheres?
h) Paula e Maria serem escolhidas, dado que as pessoas selecionadas foram homens?
Exemplo 52. (1) número de chamadas recebidas por uma central telefônica durante um perı́odo de
40 minutos; (2) número de bactérias em um litro de água.
56
Estatı́stica Básica
Exemplo 53 (Bombas em Londres). Durante a Segunda Guerra Mundial a cidade de londres foi
bombardeada por aviões alemães. Um interesse é sobre a aleatoriedade dos alvos, se houve tendência
em lançar em alguns pontos especı́ficos ou não. Subdivindindo-se a parte do sul da cidade em 576
partes, é contado o número de regiões que receberam x bombas, denotado por nx . O total de bombas
nas parte sul foi de 537, levando a uma taxa de 537/576 ≈ 0, 93 bombas por região. Uma maneira
de verificarmos se o modelo Poisson seria aplicável para modelar o número de bombas lançadas
por região, é calcular as frequências de bombas que ocorreram (observadas) fo e comparar com as
frequências esperadas de bombas que seriam lançadas supondo o modelo Poisson válido fe .
Assim, se X representa o nº de bombas em uma região da parte sul, então suponha que X ∼
P oisson(0, 93).
X=x 0 1 2 3 4 5 ou mais
fo 229 211 93 35 7 1
p(x) 0,395 0,367 0,171 0,053 0,012 0,003
fe 227,520 211,392 98,496 30,528 6,912 1,728
57
Estatı́stica Básica
Uma v.a.c. possui uma função de densidade de probabilidade f com a qual podemos cal-
cular probabilidades associadas a variável aleatória.
Para obtermos a probabilidade de uma v.a.c. assumir valores em um intervalo (a, b], para
a < b, basta calcular Z b
P (a < X ≤ b) = f (x)dx.
a
P (X = c) = 0, c ∈ <.
1. Esboce o gráfico da fX .
Seja X uma v.a.c. com função densidade de probabilidade f (x), podemos definir:
Z x
• Função de distribuição acumulada: F (x) = P (X ≤ x) = f (x)dx, para todo
−∞
x ∈ <.
Z
• Esperança: E[X] = xf (x)dx.
x
Exemplo 55. O rótulo de refrigerante indica que o conteúdo é de 350 ml. Suponha que a linha
de produção encha as latas de forma que o conteúdo seja uniformemente distribuı́do no intervalo
[345,355].
1. Qual é a probabilidade de que uma lata tenha conteúdo superior a 353 ml?
2. Qual é a probabilidade de que uma lata tenha conteúdo inferior a 346 ml?
3. O controle de qualidade aceita uma lata com conteúdo dentro de 4 ml do conteúdo exibido na
lata. Qual é a proporção de latas rejeitadas nessa linha de produção?
Uma v.a.c. X tem distribuição Normal com parâmetros µ e σ 2 , se sua f.d.p. é dada por
2
1 x−µ
1 −
fX (x; µ, σ 2 ) = √ e 2 σ , −∞ < x < +∞.
2πσ 2
• Propriedades:
59
Estatı́stica Básica
Para calcular probabilidades associadas a uma v.a.c. normal, terı́amos que resolver inte-
grais que envolvem a f descrita acima. Porém, isto não é possı́vel analiticamente, mas
somente de forma numérica. Sem o auxı́lio de um programa computacional que rea-
lize tal tarefa, não seria possı́vel tabular todas as probabilidades associadas a qualquer
distribuição normal, isto é, para quaisquer valores de µ e σ 2 possı́veis. Entretanto, é
possı́vel mostrar que a partir de qualquer normal chegamos em uma normal, chamada
padrão, com parâmetros µ = 0 e σ 2 = 1.
1.0
0.8
0.3
0.6
Densidade
FDA
0.2
0.4
0.1
0.2
0.0
0.0
−4 −2 0 2 4 −4 −2 0 2 4
x x
Uma v.a. X tem distribuição Normal padrão ou Normal reduzida, se X ∼ N (0, 1).
Importante:
X −µ
Z= ∼ N (0, 1).
σ
Exemplo 56.
Suponha que Z tenha distribuição N(0; 1). Usando a tabela da distribuição normal padrão, deter-
mine o valor de probabilidade de:
a)P (0 ≤ Z ≤ 1, 65) b)P (Z ≤ 1, 29) c)P (0 ≤ Z ≤ 1, 34) d)P (−1 ≤ Z ≤ 1)
e)P (Z ≤ 2, 45) f)P (Z ≥ −2, 01) g)P (Z ≥ 1, 65) h)P (Z > 2, 13) i)P (|Z| > 1, 61)
60
Estatı́stica Básica
Exemplo 57.
Suponha que Z tenha distribuição N(0; 1). Empregando a tábua da distribuição normal, determine
o valor de z:
a)P (Z ≥ z) = 0, 5 b)P (0 ≤ Z ≤ z) = 0, 3264 c)P (0 ≤ Z ≤ z) = 0, 3461
d)P (z ≤ Z ≤ 1) = 0, 6826 e)P (−1, 05 ≤ Z ≤ z) = 0, 7280 f)P (Z ≥ z) = 0, 0640
Exemplo 58.
Em determinado laboratório de pesquisa de células tronco para problemas motores nos membros
inferiores estuda a recuperação total dos movimentos. O responsável pelo procedimento afirma
que o tempo que o paciente leva para obter melhoras significativas nos movimento, após cirurgia,
segue uma distribuição Normal com média de 10 meses e desvio padrão de 4 meses. Segundo estas
informações, qual é a probabilidade de um paciente obter melhoras significativas nos movimentos
de 9 a 12 meses após a cirurgia? Até 6 meses? E após 10 meses?
61
Estatı́stica Básica
62
Capı́tulo 4
Inferência
Definição 19. População: conjunto de indivı́duos (ou objetos, elementos) que tem em comum
pelo menos uma variável observável que pode ser representada por uma v.a. X.
Definição 21. Parâmetro: é uma medida usada para descrever uma caracterı́stica da população.
Definição 22 (Inferência Estatı́stica). É o uso de técnicas estatı́sticas para gerar afirmações sobre
uma dada caracterı́stica da população a partir de uma amostra.
Por exemplo, a média, a variância, o desvio padrão, a moda, etc.
Em geral, nosso interesse é estimar o valor de um parâmetro ou estimar o valor de uma função de
um parâmetro.
Definição 23. Amostra Aleatória Simples (aas): Uma aas de tamanho n de uma v.a. X (po-
pulação) é um conjunto de n v.a.’s X1 , X2 , · · · , Xn independentes e identicamente distribuı́das
(iid). Isto é, quando escolhemos ao acaso um subconjunto de tamanho n da população de forma que
cada elemento da amostra seja v.a. com a mesma distribuição da população.
Quando a população tem tamanho finito, então o sorteio é feito com reposição mantendo chance
igual de qualquer elemento ser sorteado.
Definição 24. Estatı́stica: qualquer função da amostra X1 , X2 , · · · , Xn é dita ser uma estatı́stica,
isto é, T é estatı́stica se T = g(X1 , X2 , · · · , Xn ), para g sendo uma função qualquer.
63
Estatı́stica Básica
Exemplo 59. Exemplos de estatı́sticas: Seja X1 , · · · , Xn uma aas de uma população X, podemos
considerar as estatı́sticas
n
X Xi
X̄ = Média amostral
i=1
n
n 2
2
X Xi − X̄
σ̂ =
i=1
n
n 2
2
X Xi − X̄
S = Variância amostral
i=1
n−1
X(1) = min{X1 , · · · , Xn } Mı́nimo
Definição 25. Estimador: uma estatı́stica T é dita ser estimador de um parâmetro θ se utilizamos
T para estimar θ.
Notação: T = θ̂
Algumas propriedades dos estimadores nos ajudam a escolher qual estimador utilizar
para fazer a inferência.
1
Pn
Exemplo 62. E[X̄] = µ e E(S 2 ) = σ 2 , com S 2 = n−1 i=1 (Xi − X̄)2 .
Teorema 4. Seja X1 , X2 , · · · , Xn uma aas de tamanho n de uma população representada pela v.a.
σ2
X com média µ e variância σ 2 . Então, E(X̄) = µ e V ar(X̄) = .
n
σ2
Importante: Se X ∼ N (µ, σ 2 ), então X̄ ∼ N (µ, ).
n
Teorema 5. Teorema Central do Limite
Seja X1 , X2 , · · · , Xn uma aas de tamanho n de uma população X com média µ e variância σ 2 .
σ2
Então, a distribuição de X̄ aproxima-se de uma distribuição Normal com média µ e variância
n
X̄ − µ
quando n tende ao infinito (n → ∞). Assim, √ ≈ N (0, 1).
σ/ n
Observação: Geralmente amostras de tamanho n > 30 fornecem uma aproximação razoável.
Exemplo 63. A capacidade máxima de um elevador é de 600Kg. Se a distribuição dos pesos dos
usuários é N (70, 100), qual é a probabilidade de que 8 pessoas ultrapassem esse limite?
Motivação Uma empresa deseja estimar a média de vendas, por estabelecimento, du-
rante o último ano de um determinado produto. Sabemos que o desvio padrão populaci-
onal é de 200 reais. Suponha que temos disponı́vel uma amostra de 25 estabelecimentos,
com média de vendas de 5000 reais.
Queremos obter uma estimação intervalar fornecendo uma margem de erro, além da esti-
mativa pontual que obtemos através dos estimadores dos parâmetros.
• 1 − α é o nı́vel de confiança, que em geral é um valor alto (por exemplo, 0,90; 0,95;
0,99);
• Mesmo quando a população não é Normal, podemos utilizar este intervalo para a
média se n > 30.
A ideia é que o intervalo contenha o verdadeiro valor do parâmetro na maioria das vezes
(ou na maioria das amostras possı́veis), isto é, com probabilidade (1 − α). Após a amostra
ser observada, ou o intervalo inclui o verdadeiro valor do parâmetro ou não inclui.
66
Estatı́stica Básica
Normal Padrão
0.4
0.3
95%
0.2
0.1
2,5% 2,5%
0.0
−4 −1.96 0 1.96 4
Exemplo 64. Uma empresa deseja estimar a média de vendas, por estabelecimento, durante o
último ano de um determinado produto. Sabemos que o desvio padrão populacional é de 200 reais.
Suponha que temos disponı́vel uma amostra de 25 estabelecimentos, com média de vendas de 5000
reais.
Solução:
σ 200
= zα/2 √ = 1, 96 √ = 78, 4;
n 25
Podemos definir α tal que P (−zα/2 < Z < zα/2 ) = 1 − α (intervalo simétrico é o de menor
comprimento).
67
Estatı́stica Básica
√
n(X̄ − µ)
Sabemos que Z = ∼ Normal(0, 1), logo podemos escrever
σ
√
(X̄ − µ) n
P −zα/2 < < zα/2 = 1−α⇔
σ
σ σ
P −zα/2 √ < (X̄ − µ) < zα/2 √ = 1−α⇔
n n
σ σ
P −zα/2 √ − X̄ < −µ < zα/2 √ − X̄ = 1−α⇔
n n
σ σ
P X̄ − zα/2 √ < µ < X̄ + zα/2 √ = 1 − α.
n n
Portanto, supondo σ 2 conhecido, o intervalo para µ com coeficiente de confiança 1 − α é
dado por
σ
[X̄ − ; X̄ + ], em que a margem de erro = zα/2 √ .
n
Exemplo 65. Um levantamento com 1018 adultos, concluiu que 255 deles planejaram gastar me-
nos dinheiro em presentes durante a época de férias de 2018 em comparação ao ano anterior.
a) Qual é a estimativa da proporção de todos os adultos que planejaram gastar menos dinheiro em
presentes durante a época de férias de 2018?
b) Usando uma confiança de 95%, qual é a margem de erro associada a essa estimativa?
Intervalo de confiança para média de uma população normal com variância desconhe-
cida
(X̄ − µ)
T = √ ∼ t(n−1) ,
S/ n
isto é, a variável T tem distribuição t-Student com n − 1 graus de liberdade. Logo, o
intervalo de confiança para média µ (variância desconhecida) com (1 − α)% de confiança
é dado por
S S
IC (µ; (1 − α)) = X̄ − t(n−1);α/2 √ ; X̄ + t(n−1);α/2 √ .
n n
Definição 27. Uma variável aleatória contı́nua Y é dita seguir a distribuição t-Student com ν
graus de liberdade se sua função de densidade de probabilidade é dada por
Γ( ν+1
2
)ν ν/2 2 −(ν+1)/2
p(y | ν) = ν ν + y , para − ∞ < y < ∞, (4.1)
Γ( 2 )(π)1/2
com ν > 0.
O gráfico da t-Student também é simétrico, podemos definir α tal que P (−t(n−1,α/2) < T <
t(n−1,α/2) ) = 1 − α.
69
Estatı́stica Básica
Importante:
Exemplo 66. Um empresa deseja estimar o intervalo de confiança de vendas, por estabelecimento,
durante o último ano de um determinado produto. Para uma amostra de 25 estabelecimentos,
obteve-se uma média de 5000 reais e S 2 = 160000 reais2 . Determine o intervalo de confiança de
95%, dado que os valores de venda são considerados normalmente distribuı́dos com desvio padrão
desconhecido.
Solução:
400 400
IC (µ; 95%) = 5000 − 2, 06 √ ; 5000 + 2, 06 √
25 25
70