Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTATÍSTICA
Thays Souza
E-book 3
Neste E-Book:
INTRODUÇÃO����������������������������������������������������������� 3
MEDIDAS DE DISPERSÃO E
DISTRIBUIÇÃO DE PROBABILIDADE���������������� 4
Medidas de dispersão��������������������������������������������������������������4
Distribuições de probabilidade discretas������������������������������17
Distribuição de probabilidade contínua��������������������������������33
2
INTRODUÇÃO
Neste e-book, aprenderemos a calcular a esperança,
variância e a covariância. Em seguida, abordaremos
as principais distribuições de probabilidade discreta,
tais quais Poisson, Bernoulli, Binomial, Geométrica
e Uniforme Discreta. Feito isso, passamos ás princi-
pais distribuições de probabilidade contínua, como
Exponencial, Gama, Normal e Uniforme contínua.
Vamos lá?
3
MEDIDAS DE DISPERSÃO
E DISTRIBUIÇÃO DE
PROBABILIDADE
Neste ponto, já estudamos as medidas de localiza-
ção, dispersão e de associação para uma variável.
Ademais, conceituamos as classes e frequências.
Mais adiante, estudamos os conceitos referentes
à probabilidade e às distribuições de probabilidade
para uma variável aleatória discreta e para uma va-
riável contínua. Descobrimos, ainda, que podemos
aplicar o conceito de probabilidade para mais de
uma variável, com isso, estudamos o conceito de
probabilidade conjunta.
Medidas de dispersão
Aprendemos as medidas de localização para uma
variável x qualquer, que são a média, a moda e a
mediana, conforme proposto por Martins (2015a).
Também estudamos as medidas de dispersão, sen-
do que a medida de dispersão mais importante foi
a variância, com base em Martins (2015b).
4
damos a forma da distribuição de probabilidade para
a variável aleatória discreta e para a variável aleatória
contínua. Ainda assim, vamos retomar esses dois
tipos de distribuição de probabilidade.
5
Com base nessa afirmação, vamos definir as medi-
das mais importantes para as distribuições de pro-
babilidade para variáveis aleatórias.
6
Número de empregados Frequência absoluta - ni
40 ├ 60 50
60 ├ 80 30
80 ├ 100 20
100 ├ 140 20
140 ├ 180 15
180 ├ 260 15
7
Nessa tabela, a somatória do produto x if(x i) resultou
em 68,4. Ou seja, a esperança matemática dessa
distribuição de probabilidade para uma variável ale-
atória discreta será:
10
E ( X ) = å xi f ( xi ) = 68, 4
i =1
2 + 𝑥𝑥, −2 ≤ 𝑥𝑥 ≤ 0
𝑓𝑓 𝑥𝑥 = $
2 − 𝑥𝑥, 0 ≤ 𝑥𝑥 ≤ 2
8
f(x)
2,5
1,5
f(x)
0,5
-3 -2 -1 0 1 2 3
0 2
E(X ) = ò x ( 2 + x )dx + ò x ( 2 - x )dx
-2 0
0 2
E(X ) = ò x ( 2 + x )dx + ò x ( 2 - x )dx
-2 0
0 2
E ( X ) = ò 2 x + x 2 dx + ò 2 x - x 2 dx
-2 0
9
0 2
æ x3 ö æ x3 ö
E ( X ) = ç x2 + ÷ + ç x2 - ÷
è 3 ø -2 è 3 ø0
æ 2 03 ( -2 ) ö æ 2 23 ( 0) ö
3 3
E ( X ) = ç 0 + - ( -2 ) - ÷ + ç 2 - - ( 0) -
2 2
÷
ç 3 3 ÷ø çè 3 3 ÷ø
è
8 8
E(X ) = 0+0-4+ +4- = 0
3 3
Número de Ponto ni f (x i) x if (x i)
empregados médio xi
0 ├ 10 5 5 0,02 0,10
10 ├ 20 15 20 0,08 1,2
20 ├ 30 25 35 0,14 3,5
30 ├ 40 35 40 0,16 5,6
40 ├ 60 50 50 0,20 10,0
60 ├ 80 70 30 0,12 8,4
10
Número de Ponto ni f (x i) x if (x i)
empregados médio xi
80 ├ 100 90 20 0,08 7,2
100 ├ 140 120 20 0,08 9,6
140 ├ 180 160 15 0,06 9,6
180 ├ 260 220 15 0,06 13,2
Somatória 250 1,00 68,4
11
Número de Ponto ni f (x i) x if (x i) 𝑥𝑥"# 𝑥𝑥"# 𝑓𝑓(𝑥𝑥" )
empregados médio
xi
40 ├ 60 50 50 0,20 10,0 2500 500
60 ├ 80 70 30 0,12 8,4 4900 588
80 ├ 100 90 20 0,08 7,2 8100 648
100 ├ 140 120 20 0,08 9,6 14400 1152
140 ├ 180 160 15 0,06 9,6 25600 1536
180 ├ 260 220 15 0,06 13,2 48400 2904
Somatória 250 1,00 68,4 7630
)
Var [ X ] = E ( X 2 ) - éë E ( X ) ùû
2
DP ( X ) = Var ( X ) (5)
12
Para a distribuição de probabilidade discreta da
Tabela 3, o desvio-padrão será:
DP ( X ) = Var ( X )
DP ( X ) = 7561, 6
DP ( X ) = 86,96
2 + 𝑥𝑥, −2 ≤ 𝑥𝑥 ≤ 0
𝑓𝑓 𝑥𝑥 = $
2 − 𝑥𝑥, 0 ≤ 𝑥𝑥 ≤ 2
0 2
E(X 2
) = ò x ( 2 + x )dx + ò x ( 2 - x )dx
2 2
-2 0
13
Acompanhe o cálculo dessa integral passo a passo:
0 2
E(X2) = ò x ( 2 + x )dx + ò x ( 2 - x )dx
2 2
-2 0
0 2
E ( X 2 ) = ò 2 x 2 + x 3dx + ò 2 x 2 - x 3dx
-2 0
0 2
æ2 x4 ö æ2 x4 ö
E ( X 2 ) = ç x3 + ÷ + ç x3 - ÷
è3 4 ø -2 è 3 4 ø0
( -2 ) + 2 2 3 - 24 - 2 0 3 + 04
4
2 3 04 2
E(X2) = ( 0 ) + - ( -2 ) - ( ) ( )
3
3 4 3 4 3 4 3 4
16 16 16 16
E(X2) = 0+0+ - + - +0+0
3 4 3 4
64 - 48 + 64 - 48 32
E(X2) = =
12 12
8
E(X ) =
2
3
8
Como obtivemos 𝐸𝐸 𝑋𝑋# = e E( X )= 0. A variância
3
Var [ X ] = E ( X 2 ) - éë E ( X ) ùû
2
8
Var [ X ] = - [ 0]
2
3
8
Var [ X ] =
3
DP ( X ) = Var ( X )
8
DP ( X ) =
3
14
2 2
DP ( X ) =
3
2 2æ 3ö
DP ( X ) = ç ÷
3 çè 3 ÷ø
2 6
DP ( X ) =
3
15
Para a equação (8), temos esta explicação para os
termos:
16
Não vamos fazer o cálculo da covariância aqui, mas
estamos explicando de que maneira deve ser feito,
caso tenha que resolver um problema de covariân-
cia para duas variáveis aleatórias discretas ou duas
variáveis aleatórias contínuas.
Distribuições de probabilidade
discretas
Neste item, estudaremos as distribuições de probabi-
lidade para variáveis aleatórias discretas e suas apli-
cações. Para isso, abordaremos as distribuições de
probabilidade discretas: Poisson, Bernoulli, Binomial,
Geométrica e Uniforme Discreta.
Distribuição de Poisson
● Acidentes automotivos.
● Erros de digitação.
● Chegada de um cliente em um banco etc.
l x e- l
P ( X = x) = (10)
x!
17
Para a distribuição de probabilidade de Poisson, a
esperança é igual a:
E[ X ]= λ=np (11)
A probabilidade p é igual a:
l
p= (12)
n
Var[ X ]= λ (13)
DP [ X ] = l (14)
P( X>0)=1– P( X= 0)
18
E como obter a probabilidade P( X= 0) ? Basta aplicar
a fórmula da equação (10) assim:
l x e- l
P ( X = x) =
x!
l 0e- l
P ( X = 0) =
0!
l 0e- l
P ( X = 0) =
0!
30 e -3
P ( X = 0) =
0!
1( e )
-3
P ( X = 0) =
1
P ( X = 0 ) = 0, 05
P ( X > 0) = 1 - P ( X = 0)
P ( X > 0 ) = 1 - 0, 05
P ( X > 0 ) = 0,95
19
P( X>0)= 0,95. Assim, pode-se calcular a probabi-
lidade de o vendedor vender o número de seguros
desejado ao aplicar a fórmula da equação (10).
Distribuição de Bernoulli
20
𝑝𝑝, 𝑠𝑠𝑠𝑠 𝑘𝑘 = 1
𝑓𝑓 𝑘𝑘; 𝑝𝑝 = &
1 − 𝑝𝑝, 𝑠𝑠𝑠𝑠 𝑘𝑘 = 0
E[ X ]=p (15)
DP [ X ] = p (1 - p ) (17)
21
20
p=
50
p = 0, 4
1–p
1–p=1– 0,4
1–p= 0, 6
E[ X ]=p
E[ X ]= 0,4
Var[ X ]=p(1–p)
Var [ X ] = p (1 - p )
Var [ X ] = 0, 4 (1 - 0, 4 )
Var [ X ] = 0, 4 ( 0, 6 )
Var [ X ] = 0, 24
22
DP [ X ] = p (1 - p )
DP [ X ] = 0, 4 (1 - 0, 4 )
DP [ X ] = 0, 4 ( 0, 6 )
DP [ X ] = 0, 24
DP [ X ] = 0, 489
Distribuição binomial
Símbolo Descrição
n O número de vezes em que uma tenta-
tiva é repetida
p = P(S ) A probabilidade de sucesso em uma
tentativa única
p =P( F ) A probabilidade de fracasso em uma
tentativa única
k Variável que apresenta o total de su-
cessos encontrado ou buscado.
Varia de 0 a n.
ænö
f ( x ) = P ( X = x ) = ç ÷ p k q n-k (18)
èk ø
23
𝑛𝑛
O termo 𝑘𝑘 é igual ao coeficiente binomial de n
sobre k, conforme explicam os autores supracitados.
Assim, esse coeficiente binomial é escrito:
ænö n!
ç ÷= (19)
è k ø ( n - k ) !k !
n!
f ( x) = P ( X = k ) = p k q n-k (20)
( n - k ) !k !
E [ X ] = µ = np (21)
Var [ X ] = s 2 = npq (22)
DP [ X ] = s 2 = s = npq (23)
24
1 2
Então, nesse caso, temos p = e q = . Temos n= 6
3 3
n!
f ( x) = P ( X = k ) = p k q n-k (20)
( n - k ) ! k !
4 6-4
6! æ1ö æ 2ö
f ( x ) = P ( X = 4) =
( 6 - 4 ) çè 3 ÷ø çè 3 ÷ø
!4!
4 6-4
6! æ1ö æ 2ö
f ( x ) = P ( X = 4) =
( 6 - 4 ) çè 3 ÷ø çè 3 ÷ø
!4!
4 2
6! æ 1 ö æ 2 ö
f ( x ) = P ( X = 4) = ç ÷ ç ÷
2!4! è 3 ø è 3 ø
6.5.4! æ 1 öæ 4 ö
f ( x ) = P ( X = 4) = ç ÷ç ÷
2!4! è 81 øè 9 ø
6.5 æ 1 öæ 4 ö
f ( x ) = P ( X = 4) = ç ÷ç ÷
2.1 è 81 øè 9 ø
6.5.4
f ( x ) = P ( X = 4) =
2.81.9
120
f ( x ) = P ( X = 4) =
1458
20
f ( x ) = P ( X = 4) = = 0, 0823
243
25
Portanto, a probabilidade de o time A ganhar quatro
jogos é:
20
f ( x ) = P ( X = 4) = = 0, 0823
243
SAIBA MAIS
Para gerar a distribuição binomial no MS Excel,
existe o comando DIST.BINOM. Experimente usar
o comando no Excel, mas antes consulte quais
são os parâmetros que se deve informar na linha
de comando do Excel para que o cálculo funcione
corretamente.
Saiba mais ao consultar o suporte da função bino-
mial, cujo endereço está disponível clicando aqui.
Distribuição geométrica
26
repetidamente até acertarmos. A partir desse
experimento, temos interesse em calcular al-
gumas probabilidades. Dessa forma, suponha
que iremos conduzir repetidos experimentos
de Bernoulli, observando as falhas e sucessos.
pX ( x ) = p (1 - p ) , em que x = 0,1, 2!
x
(24)
1
E[X ] = (25)
p
1- p
Var [ X ] = 2 (26)
p
1- p
DP [ X ] = (27)
p2
27
requeira exatamente quatro tentativas? Determine a
esperança matemática, variância e o desvio-padrão
para o alinhamento.
p X ( x = 4 ) = 0,8 (1 - 0,8 )
4
p X ( x = 4 ) = 0,8 ( 0, 2 )
4
p X ( x = 4 ) = 0,8 ( 0, 0016 )
p X ( x = 4 ) = 0, 00128
pX ( x = 4) = 0,00128
1
E[X ] =
p
1
E[X ] = = 1, 25
0,8
1- p
Var [ X ] = 2
p
1 - 0,8
Var [ X ] =
0,82
0, 2
Var [ X ] =
0, 64
Var [ X ] = 0,3125
28
DP [ X ] = Var [ X ]
DP [ X ] = 0,3125
DP [ X ] = 0,559
29
de é dada por f(xi) = 0, 1 para cada xi em R
(RODRIGUES, 2011).
1
f ( xi ) =
n
1
f ( xi ) = = 0,1
10
1
f ( xi ) = (28)
b - a +1
b+a
E[X ] = (29)
2
( b - a + 1) - 1
2
Var [ X ] = (30)
12
( b - a + 1)
2
-1
DP [ X ] = (31)
12
30
Passemos, então, a um exemplo de aplicação. Um
sistema de comunicação tem 58 linhas externas.
Seja X o número de linhas em uso. Considere que X é
um variável uniforme discreta e que assume valores
de 0 a 58. Determine a probabilidade, a esperança
matemática, a variância e o desvio-padrão para o
caso em questão.
1
f ( xi ) =
b - a +1
1
f ( xi ) =
58 - 0 + 1
1
f ( xi ) =
59
b+a
E[X ] =
2
58 + 0
E[X ] =
2
E [ X ] = 29
31
( b - a + 1)
2
-1
Var [ X ] =
12
( 58 - 0 + 1)
2
-1
Var [ X ] =
12
592 - 1
Var [ X ] =
12
3481 - 1 3480
Var [ X ] = =
12 12
Var [ X ] = 290
( b - a + 1)
2
-1
DP [ X ] =
12
( 58 - 0 + 1)
2
-1
DP [ X ] =
12
2
59 - 1
DP [ X ] =
12
3481 - 1
DP [ X ] =
12
3480
DP [ X ] =
12
DP [ X ] = 290
DP [ X ] = 17, 02
Podcast 1
32
Distribuição de probabilidade
contínua
Anteriormente, estudamos os casos particulares
de distribuição de probabilidade para as variáveis
aleatórias discretas. Neste tópico, estudaremos as
distribuições de probabilidade para o caso de termos
as variáveis aleatórias contínuas. Portanto, aborda-
remos as distribuições de probabilidades contínuas
exponencial, gama, uniforme contínua e normal.
Distribuição exponencial
33
Segundo Zabetti (2019c), podemos simplificar essa
notação e escrever a função densidade de probabili-
dade da distribuição exponencial como:
f x(x)= λ e –λ x , 0≤ x ≤∞ (32)
1
E[X ] = (33)
l
1
Var [ X ] = (34)
l2
1
DP [ X ] = (35)
l2
34
f X ( x ) = le-l x ,0 £ x < ¥
f X ( x ) = 2e-2 x ,0 £ x < ¥
1
E[X ] =
l
1
E[X ] =
l
1
E[X ] = = 0,5
2
1
Var [ X ] =
l2
1
Var [ X ] = = 0, 25
22
1
DP [ X ] =
l2
1
DP [ X ] =
22
1
DP [ X ] = = 0,5
2
FX ( x ) = P ( X £ x ) = 1 - e- l x
FX ( x ) = P ( X £ x ) = 1 - e-2 x
f X ( x ) = 2e-2 x ,0 £ x < ¥
FX ( x ) = P ( X £ x ) = 1 - e-2 x
E [ X ] = 0,5
Var [ X ] = 0, 25
DP [ X ] = 0,5
35
Distribuição gama
Segundo Liberal (2013c), a variável aleatória contínua
X tem distribuição gama quando sua função densi-
dade de probabilidade é dada por:
ì b a a -1 b x
ï f ( x) = G a x e , x > 0
í ( ) (37)
ï f x = 0, x ³ 0
î ( )
¥
G (a ) = ò xa -1e - x dx (a > 0 )
0
36
a
E(X ) = (38)
b
a
Var ( X ) = 2 (40)
b
a
DP ( X ) = (41)
b2
1
, 𝑎𝑎 ≤ 𝑥𝑥 ≤ 𝑏𝑏,
𝑓𝑓 𝑥𝑥 = $𝑏𝑏 − 𝑎𝑎
0, 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑞𝑞𝑞𝑞𝑞𝑞𝑞𝑞𝑞𝑞𝑞𝑞𝑞𝑞𝑞𝑞 𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣
37
f(x)
x
a b
d
d -c
P ( c £ X £ d ) = ò f ( x )dx =
c
b-a
38
Podemos entender que se trata de uma convenção
para quando estamos trabalhando com uma variável
aleatória contínua,
+¥
matematicamente comprovada
pelo valor ò f ( x )dx = 1 da integral mostrada no item 1.
-¥
b+a
E(X ) = (41)
2
(b - a )
2
Var ( X ) = (42)
12
(b - a )
2
DP ( X ) = (43)
12
39
Densidade de
Probabilidade
1/80
x
20 100
b+a
E(X ) =
2
100 + 20
E(X ) =
2
120
E(X ) =
2
E ( X ) = 60m
40
(b - a )
2
Var ( X ) =
12
(100 - 20 )
2
Var ( X ) =
12
( 80 )
2
Var ( X ) =
12
6400
Var ( X ) =
12
Var ( X ) = 533,33m 2
(b - a )
2
DP ( X ) =
12
(100 - 20 )
2
DP ( X ) =
12
2
80
DP ( X ) =
12
6400
DP ( X ) =
12
DP ( X ) = 23, 09m
Distribuição normal
41
Assim, a função densidade de probabilidade para a
variável aleatória contínua normal é:
2
1 æ x-µ ö
1 - ç ÷
fX ( x) = e 2è s ø
, -¥ < x < +¥ (44)
2ps 2
E( X )=µ (45)
Var( X )= σ 2 (46)
DP ( X ) = s 2 = s (47)
2
b 1 æ x-µ ö
1 - ç ÷
P (a < X < b) = ò e 2è s ø
dx (48)
a 2ps 2
42
f(x)
μ - 3σ μ - 2σ μ-σ μ μ + σ μ + 2σ μ + 2σ x
68%
95%
99,7%
43
que a média µ menos três vezes o desvio-padrão e
que esse valor seja menor que a média mais três
vezes o desvio-padrão.
Faixa Probabilidade
µ– σ< x<µ+ σ 68,3%
µ–2 σ< x<µ+2 σ 95%
44
Faixa Probabilidade
µ–3 σ< x<µ+3 σ 99.7%
σ=50 0 g
2σ=1.0 0 0 g
3σ=1. 50 0 g
µ– σ< x<µ+σ
2 . 30 0< x<3 . 30 0
µ–2σ< x<µ+2σ
1. 8 0 0< x<3 . 8 0 0
45
Para µ–3 σ< x<µ+3 σ, teremos neste caso:
µ–3 σ< x<µ+3 σ
1. 30 0< x<4. 30 0
Faixa Probabilidade
2 . 3 0 0 < x< 3 . 3 0 0 68,3%
1 . 8 0 0 < x< 3 . 8 0 0 95%
1 . 3 0 0 < x<4 . 3 0 0 99.7%
Podcast 2
46
NOÇÕES SOBRE O TEOREMA
DO LIMITE CENTRAL
No desenvolver do tópico Distribuição Normal
Contínua, mencionamos o modelo Gaussiano.
Segundo Pitard (1993), o Gaussiano é o modelo mais
comumente utilizado na estatística convencional, por
isso, o autor fornece a seguinte explicação:
47
ginal com uma distribuição muito diferente da
Normal (pode até mesmo ser discreta), mas
se tomarmos várias amostras grandes desta
distribuição, e então fizermos um histograma
das médias amostrais, a forma se parecerá
como uma curva Normal (SHIMAKURA, 2016).
SAIBA MAIS
Para gerar a distribuição normal no MS Excel,
existe o comando DIST.NORMAL. Clique aqui para
acessar caso queira usá-la, sugerimos antes uma
consulta ao suporte. Fique à vontade para gerar
suas distribuições normais no Excel.
48
Processos de amostragem
Há muitos processos de amostragem, mas abordare-
mos apenas os três tipos de técnicas de amostragem
mais comumente utilizados, que segundo Bonafini
(2015, p. 11) são:
1. A amostragem estratificada.
2. A amostragem por agrupamento.
3. A amostragem sistemática.
49
Suponha que se deseja abrir uma balada nas proxi-
midades da FAM, desejando-se apenas fazer a pes-
quisa com os alunos que se encontram na faculdade
nesses três dias, assim, podemos investigar se eles
frequentarão o novo estabelecimento que se deseja
abrir.
50
ESTIMADORES E
ESTIMATIVAS PONTUAIS
Vamos definir o último assunto do presente módulo:
estimadores e estimativas pontuais. Temos a seguin-
te definição para o conceito de estimador:
51
uma variável aleatória com uma distribuição
de probabilidade. Quando uma variável alea-
tória é selecionada de uma população e 𝜃𝜃" é
calculado a partir dos dados, o valor numérico
obtido é chamado de estimativa da amostrada
considerada (USP [s. d.]).
52
mamos o desvio-padrão (σ) por meio do estimador
pontual Desvio-padrão Amostral (S).
53
CONSIDERAÇÕES FINAIS
Aprendemos, neste e-book, a obter a esperança, a
variância, covariância e o desvio-padrão para as dis-
tribuições de variáveis aleatórias contínuas e das
variáveis aleatórias discretas. Aprendemos quais são
as principais distribuições para as variáveis aleatórias
discretas: Poisson, Bernoulli, Binomial, Geométrica
e Uniforme Discreta.
54
SÍNTESE
PROBABILIDADE
ESTATÍSTICA
Neste módulo, estudamos os seguintes aspectos:
• Calcular a média, a variância e a covariância�
• Entender a aplicação das principais distribuições de probabilidade discretas: Poisson,
Bernoulli, Binomial, Geométrica, Uniforme Discreta�
• Entender os principais tipos de processo de amostragem�
• Compreender o uso do Teorema do Limite Central�
Cálculo
Tipos Distribuições
Uniforme
Poisson Bernoulli Binomial Geométrica
Distreta
Tipos de amostragem
Aleatória
Estratificada Por Conglomerados Sistemástica
Simples