Escolar Documentos
Profissional Documentos
Cultura Documentos
Matemáticos
Probabilidade e Estatística
• Teleaula nº: 3
Contextualização
https://bityli.com/IYbog
Conceitos básicos
A origem da palavra Estatística
Amostra
Fonte:https://bityli.com/qmjSr
Tipos de variáveis
Variável
Qualitativa Quantitativa
Planejamento
𝑖(𝑛 + 1)
𝑃𝑄𝑖 =
4
Atividade
Identifique qual a população e qual a amostra da
seguinte situação:
𝑛
1
𝑥ҧ = 𝑥𝑖
𝑛
𝑖=1
Exemplo
2 - 2 - 3 - 4 - 4 - 4 - 6 - 8 - 10 - 10 - 10 - 10 - 15 - 17
2 + 2 + 3+ . . +15 + 17 105
𝑥ҧ = = = 7,5
14 14
Mediana
A mediana (Md), é a medida que divide um conjunto de
dados ordenados em duas partes iguais: 50% dos
valores ficam abaixo e 50% ficam acima da mediana.
Em seguida conta-se até a metade deles:
2 - 2 - 3 - 4 - 4 - 4 - 6 - 8 - 10 - 10 - 10 - 10 - 15 - 17
Moda
A moda (Mo) é o é o valor de maior ocorrência num
conjunto de dados.
É a única medida que pode não existir e, existindo, pode
não ser única.
Um conjunto de dados pode:
▪ não apresentar moda;
▪ apresentar uma moda;
▪ apresentar duas modas (bimodal);
▪ apresentar três modas (trimodal);
▪ apresentar mais modas (polimodal).
Exemplo
65, 87, 49, 58, 65, 65, 67, 83, 87, 79.
Média
7,56 + 7,64 + 5,81 + 10,80 + 10,07 + 7,85 + 9,29 + 10,34 + 10,16 + 10,95
𝑥ҧ =
10
90,47
𝑥ҧ =
10
𝑥ҧ ≅ 9,05
Mediana
Para amostras com número par de unidades a mediana é
a média dos dois valores centrais
9,29 + 10,07
𝑀𝑑 =
2
19,36
𝑀𝑑 = → 𝑀𝑑 = 9,68
2
5,81 7,56 7,64 7,85 9,29 10,07 10,16 10,34 10,80 10,95
Moda
Distribuição não apresenta moda → amodal.
5,81 7,56 7,64 7,85 9,29 10,07 10,16 10,34 10,80 10,95
Medidas de dispersão
DISPERSÃO
Absoluta Relativa
Coeficiente
Amplitude Desvio Variância
de Variação
(A) Padrão (S) (s²)
(CV)
Amplitude (A)
𝐴𝑇 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
Exemplo
A 80 80 80 80 80 80
B 76 77 78 79 80 81
𝐴𝑇 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
𝐴𝑇 𝐴 = 80 − 80 = 0
𝐴𝑇 𝐵 = 81 − 76 = 5
Variância
• Variância é a média aritmética dos quadrados dos desvios
de cada valor em relação à média: proporciona uma
mensuração da dispersão dos dados em torno da média.
Variância Amostral
σ 𝒙−𝒙
ഥ 𝟐
𝟐
𝑺 =
𝒏−𝟏
Desvio padrão
Desvio padrão é a raiz quadrada positiva da variância,
apresentando a mesma unidade dos dados e da média,
permitindo avaliar melhor a dispersão.
Amostral
σ 𝒙−𝒙
ഥ 𝟐
𝑺= 𝑺𝟐 =
𝒏−𝟏
Coeficiente de variação
É a medida relativa de dispersão útil para fazer comparação
em termos relativos do grau de concentração. É calculado
pela relação entre o desvio padrão (s) e a média x da média
de séries distintas.
Amostral
𝒔
𝑪𝑽 = × 𝟏𝟎𝟎
ഥ
𝒙
Situação-problema
Ana fez um levantamento sobre a idade de alguns filhos
dos funcionários de uma indústria. Observe o resultado:
Idade 𝒇𝒊
𝒙𝒊 Considerando esses dados,
8 2 determine a variância, desvio
12 3 padrão e o coeficiente de
13 5 variação.
𝑓𝑖 = 10
Resolvendo
2.8 + 3.12 + 5.13
ഥ=
𝒙 = 11,7
10
Idade 𝒇𝒊 ഥ
𝒙𝒊 − 𝒙 ഥ
𝒙𝒊 − 𝒙 𝟐 ഥ 𝟐 . 𝒇𝒊
𝒙𝒊 − 𝒙
𝒙𝒊
8 2 -3,7 13,69 27,38
12 3 0,3 0,09 0,27
13 5 1,3 1,69 8,45
𝑓𝑖 = 10 ഥ 𝟐 . 𝒇𝒊 ≅ 36,1
𝒙𝒊 − 𝒙
Idade 𝒇𝒊 ഥ
𝒙𝒊 − 𝒙 ഥ
𝒙𝒊 − 𝒙 𝟐 ഥ 𝟐 . 𝒇𝒊
𝒙𝒊 − 𝒙
𝒙𝒊
8 2 -3,7 13,69 27,38
12 3 0,3 0,09 0,27
13 5 1,3 1,69 8,45
𝑓𝑖 = 10 ഥ 𝟐 . 𝒇𝒊 ≅ 36,1
𝒙𝒊 − 𝒙
σ 𝑥 − 𝑥ҧ 2 36,1 𝒔
𝑆2 = = = 4,01 𝑪𝑽 = × 𝟏𝟎𝟎
𝑛−1 10 − 1 ഥ
𝒙
2
𝐶𝑉 = × 100
11,7
𝑆= 𝑆2 = 4,01 ≅ 2 𝐶𝑉 = 17,1%
Diagrama de
dispersão
Diagrama de dispersão
O diagrama de dispersão é um gráfico em que pontos no
espaço cartesiano XY são usados para representar
simultaneamente os valores de duas variáveis
quantitativas medidas em cada elemento do conjunto de
dados.
Coeficiente de Correlação
Apesar do diagrama de dispersão nos fornecer uma ideia
do tipo e extensão do relacionamento entre duas
variáveis x e y, há um número que mede essa relação,
chamado de coeficiente de correlação.
𝑛 σ 𝑥𝑖 . 𝑦𝑖 − σ 𝑥𝑖 . (σ 𝑦𝑖 )
𝑟=
𝑛. σ 𝑥²𝑖 − (σ 𝑥𝑖 )² . 𝑛. σ 𝑦²𝑖 − (σ 𝑦𝑖 )²
Fonte: Ribeiro, 2015.
Coeficiente de determinação
• As variações da variável Y são 100% explicadas pelas
variações da variável X, não ocorrendo desvios em
torno da função estimada.
• Por outro lado, se 𝑅2 = 0 , isto quer dizer que as
variações de Y são exclusivamente aleatórias e
explicadas pelas variações de outros fatores que não
X.
• Se R2 for igual a 1, isto significa que todos os pontos
observados se situam “exatamente” sobre a reta de
regressão → ajuste perfeito.
Atividade
Ao se realizar um estudo para determinar a relação entre
os salários diários recebidos (x) e as despesas diárias (y),
foi realizada uma amostragem com três famílias,
computando-se os seguintes valores:
𝒙𝒊 = 𝟏𝟎𝟖 𝒚𝒊 = 𝟔𝟓 𝒙𝒊 . 𝒚𝒊 = 𝟐𝟑𝟗𝟏
𝑛 σ 𝑥𝑖 . 𝑦𝑖 − (σ 𝑥𝑖 )(σ 𝑦𝑖 )
𝑟=
𝑛 σ 𝑥𝑖2 − σ 𝑥𝑖 2 𝑛 σ 𝑦𝑖2 − σ 𝑦𝑖 2
25
20
Quantidade de acidentes
20
15
15
10
10
7
5
3
0
jan/08 jan/09 jan/10 jan/11 jan/12
Mês/Ano
jan/12 20
jan/11 3
Mês/Ano
jan/10 7
jan/09 10
jan/08 15
0 5 10 15 20 25
Quantidade de Acidentes
36,4 27,3
jan/08
jan/09
jan/10
jan/11
18,2 jan/12
5,5 12,7
20
Quantidade de acidentes
20
15
15
10
10
7
5
3
0
jan/08 jan/09 jan/10 jan/11 jan/12
Mês/Ano
✓ Tipos de amostragem
✓ Medidas de posição
✓ Medidas de dispersão
✓ Diagrama de dispersão
✓ Tipos de gráficos
Fonte: Google Imagens. Disponível em encurtador.com.br/psGNX
Acesso em: 01 fev. 2021.