Escolar Documentos
Profissional Documentos
Cultura Documentos
Probabilidade e Estatística
Medidas de Tendência Central - Semestre 2021.2
Medidas de dispersão.
As medidas de tendência central são indicadores que permitem que se tenha uma primeira
ideia, um resumo, de como se distribuem os dados de um experimento, informando o valor (ou
faixa de valores) da variável aleatória que ocorre mais tipicamente.
a média;
a mediana, e
a moda.
A média aritmética
É a soma de todos os resultados dividida pelo número total de casos, podendo ser
considerada como o ponto de equilíbrio dos dados.
localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 1/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central
Dados discretos
Dada a lista x 1
, x2 , x3 , ⋯ , xn , a média aritmética é definida como:
x1 + x2 + x3 + ⋯ + xn
x̄ =
n
Exemplo 1
A média aritmética de 19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5 é:
19 + 5 + 14 + 5 + 25 + 5 + 10 + 12 + 14 + 5 + 16 + 4 + 20 + 21 + 5
x̄ =
15
180
x̄ = = 12
15
In [1]:
lista = c(19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5)
mean(lista)
12
localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 2/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central
xi fi xi fi
x1 f1 x1 f1
x2 f2 x2 f2
⋮ ⋮ ⋮
xn fn xn fn
n n
Total ∑ fi ∑ xi fi
i=1 i=1
∑ xi ⋅ fi
i=1
x̄ =
n
∑ fi
i=1
Exemplo 2
Os dados 19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5 podem ser agrupados:
xi fi xi fi
4 1 4
5 5 25
10 1 10
12 1 12
14 2 28
16 1 16
19 1 19
20 1 20
21 1 21
25 1 21
10 10
Total ∑ fi = 15 ∑ xi fi = 180
i=1 i=1
logo,
∑ xi ⋅ fi
i=1 180
x̄ = = = 12
n
15
∑ fi
i=1
No python pode a média aritmética pode ser calculada diretamente com os dados brutos:
In [2]:
lista = c(19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5)
localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 3/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central
mean(lista)
12
ou pode-se construir um dataframe e calcular a média:
In [3]:
library(dplyr)
library(tidyverse)
filter, lag
v readr 2.0.0
-- Conflicts -----------------------------------------------------------------------
----------- tidyverse_conflicts() --
In [4]:
tabela_freq <- function(lista){
return(tabe)
In [5]:
lista = c(19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5)
tabela
A data.frame: 11 × 3
Xi Fi Xi.Fi
4 1 4
5 5 25
10 1 10
12 1 12
14 2 28
localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 4/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central
Xi Fi Xi.Fi
16 1 16
19 1 19
20 1 20
21 1 21
25 1 25
Total 15 180
In [6]:
n = nrow(tabela)
media
12
Dados Contínuos
Em muitos casos não dispomos dos dados brutos de uma variável contínua e sim de classes
de intervalos com sua frequência em cada classe;
pelo qual temos que calcular a média para este tipo dados distribuidos em classes de
intervalos;
em outros casos o pesquisador explica seus dados com um histograma (com os dados
distribuidos em classes de intervalos) e complementa sua explicação com medidas de
tendência central e de dispersão.
Classes xi fi xi fi
a 1 ⊢ b1 x1 f1 x1 f1
a 2 ⊢ b2 x2 f2 x2 f2
⋮ ⋮ ⋮ ⋮
a n ⊢ bn xn fn xn fn
n n
Total ∑ fi ∑ xi fi
i=1 i=1
logo,
localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 5/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central
n
∑ xi ⋅ fi
i=1
x̄ =
n
∑ fi
i=1
Exemplo 3
Calcular a média da seguinte distribuição de dados:
Classes fi
1, 5 ⊢ 2, 0 3
2, 0 ⊢ 2, 5 16
2, 5 ⊢ 3, 0 31
3, 0 ⊢ 3, 5 34
3, 5 ⊢ 4, 0 11
4, 0 ⊢ 4, 5 4
4, 5 ⊢ 5, 0 1
Solução
Calculamos o ponto médio x de cada classe;
i
ai + b 1
xi =
2
Classes xi fi
1, 5 ⊢ 2, 0 1,75 3
2, 0 ⊢ 2, 5 2,25 16
2, 5 ⊢ 3, 0 2,75 31
3, 0 ⊢ 3, 5 3,25 34
3, 5 ⊢ 4, 0 3,75 11
4, 0 ⊢ 4, 5 4,25 4
4, 5 ⊢ 5, 0 4,75 1
Classes xi fi xi fi
1, 5 ⊢ 2, 0 1,75 3 5, 25
localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 6/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central
2, 0 ⊢ 2, 5 2,25 16 36, 00
2, 5 ⊢ 3, 0 2,75 31 85, 25
3, 0 ⊢ 3, 5 3,25 34 110, 50
3, 5 ⊢ 4, 0 3,75 11 41, 25
4, 0 ⊢ 4, 5 4,25 4 17, 00
4, 5 ⊢ 5, 0 4,75 1 4, 75
Classes xi fi xi fi
1, 5 ⊢ 2, 0 1,75 3 5, 25
2, 0 ⊢ 2, 5 2,25 16 36, 00
2, 5 ⊢ 3, 0 2,75 31 85, 25
3, 0 ⊢ 3, 5 3,25 34 110, 50
3, 5 ⊢ 4, 0 3,75 11 41, 25
4, 0 ⊢ 4, 5 4,25 4 17, 00
4, 5 ⊢ 5, 0 4,75 1 4, 75
logo, a média é:
∑ xi ⋅ fi
i=1 300
x̄ = = = 3 ■
n
100
∑ fi
i=1
In [7]:
library(tidyverse)
library(plotly)
last_plot
filter
localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 7/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central
layout
In [8]:
gapminder <- readRDS('../8_Examinando_dados/gapminder_dados.rds')
https://colab.research.google.com/#create=true&language=r
de um clique no simbolo do arquivo com uma seta para cima (fazer upload para o
armazenamento da sessão)
In [9]:
names(gapminder)
In [10]:
ev_2017 <- gapminder %>%
select(continente, expectativa_vida)
In [11]:
head(ev_2017)
A tibble: 6 × 2
continente expectativa_vida
<fct> <dbl>
Asia 63.38
Europa 78.23
África 77.74
Europa 82.70
África 64.19
Américas 77.02
localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 8/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central
In [13]:
media_ev <- mean(ev_2017$expectativa_vida)
media_ev
72.8367724867725
In [14]:
hist(ev_2017$expectativa_vida, main = 'Expectativa de vida global: ano 2017',
localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 9/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central
group_by(continente) %>%
summarise(Média = mean(expectativa_vida))
A tibble: 4 × 2
continente Média
<fct> <dbl>
África 65.35815
Américas 75.52471
Asia 73.71071
Europa 78.69267
In [16]:
rpc_2017 <- gapminder %>%
select(continente, renda_per_capita)
In [17]:
head(rpc_2017)
A tibble: 6 × 2
continente renda_per_capita
localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download… 10/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central
continente
<fct> renda_per_capita
<dbl>
<fct> <dbl>
Asia 1758
Europa 11803
África 13876
Europa 49768
África 6045
Américas 22856
In [19]:
media_rpc <- mean(rpc_2017$renda_per_capita)
media_rpc
18491.4871794872
In [20]:
hist(rpc_2017$renda_per_capita, main = 'Renda per capita global: ano 2017',
localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=… 11/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central
group_by(continente) %>%
summarise(Média = mean(renda_per_capita))
A tibble: 4 × 2
continente Média
<fct> <dbl>
África 5471.741
Américas 15873.486
Asia 20106.729
Europa 33372.277
localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download… 12/12