Você está na página 1de 12

20/05/2022 22:41 12_Medidas_de_Tendência_Central

UNIVERSIDADE FEDERAL DO AMAPÁ


Curso de Ciência da Computação

Probabilidade e Estatística
Medidas de Tendência Central - Semestre 2021.2

Dr. José Walter Cárdenas Sotil

Os dados apresentados em tabelas ou gráficos permitem analisar o comportamento de


uma o várias variáveis;

entretanto testes estatísticos precisam de um ou mais números que simplifiquem os dados


e sejam representativos destes.
Entre eles temos:

Médidas de tendência central;

Medidas de dispersão.

As medidas de tendência central são indicadores que permitem que se tenha uma primeira
ideia, um resumo, de como se distribuem os dados de um experimento, informando o valor (ou
faixa de valores) da variável aleatória que ocorre mais tipicamente.

Entre as medidas de tendência central temos

a média;

a mediana, e

a moda.

A média aritmética
É a soma de todos os resultados dividida pelo número total de casos, podendo ser
considerada como o ponto de equilíbrio dos dados.

A média aritmética como ponto de equilíbrio:

localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 1/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central

Usualmente a média para populações é denotada pela letra grega μ;

enquanto a média aritmética para amostras é denotada por x̄.

Dados discretos
Dada a lista x 1
, x2 , x3 , ⋯ , xn , a média aritmética é definida como:

x1 + x2 + x3 + ⋯ + xn
x̄ =
n

Exemplo 1
A média aritmética de 19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5 é:

19 + 5 + 14 + 5 + 25 + 5 + 10 + 12 + 14 + 5 + 16 + 4 + 20 + 21 + 5
x̄ =
15

180
x̄ = = 12
15

No R a média é calculada com a função mean()

In [1]:
lista = c(19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5)

mean(lista)

12

Dados discretos agrupados


Dados os valores x com frequência f , estes podem ser tabulados:
i i

localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 2/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central

xi fi xi fi

x1 f1 x1 f1

x2 f2 x2 f2

⋮ ⋮ ⋮

xn fn xn fn

n n

Total ∑ fi ∑ xi fi
i=1 i=1

logo, a média aritmética é calculada como:

∑ xi ⋅ fi
i=1
x̄ =
n

∑ fi
i=1

Exemplo 2
Os dados 19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5 podem ser agrupados:

xi fi xi fi

4 1 4

5 5 25

10 1 10

12 1 12

14 2 28

16 1 16

19 1 19

20 1 20

21 1 21

25 1 21

10 10

Total ∑ fi = 15 ∑ xi fi = 180
i=1 i=1

logo,

∑ xi ⋅ fi
i=1 180
x̄ = = = 12
n
15
∑ fi
i=1

No python pode a média aritmética pode ser calculada diretamente com os dados brutos:

In [2]:
lista = c(19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5)

localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 3/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central

mean(lista)

12
ou pode-se construir um dataframe e calcular a média:

In [3]:
library(dplyr)

library(tidyverse)

Attaching package: 'dplyr'

The following objects are masked from 'package:stats':

filter, lag

The following objects are masked from 'package:base':

intersect, setdiff, setequal, union

-- Attaching packages --------------------------------------------------------------


----------------- tidyverse 1.3.1 --

v ggplot2 3.3.5 v purrr 0.3.4

v tibble 3.1.2 v stringr 1.4.0

v tidyr 1.1.3 v forcats 0.5.1

v readr 2.0.0

-- Conflicts -----------------------------------------------------------------------
----------- tidyverse_conflicts() --

x dplyr::filter() masks stats::filter()

x dplyr::lag() masks stats::lag()

In [4]:
tabela_freq <- function(lista){

tabe <- data.frame(t(table(lista)))[,-1]

names(tabe) <- c('Xi', 'Fi')

tabe <- tabe %>%

mutate(Xi.Fi = as.numeric(levels(Xi))*Fi) %>%

add_row(Xi = 'Total', Fi = sum(.$Fi), Xi.Fi = sum(.$Xi.Fi))

return(tabe)

In [5]:
lista = c(19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5)

tabela <- tabela_freq(lista)

tabela

A data.frame: 11 × 3

Xi Fi Xi.Fi

<chr> <int> <dbl>

4 1 4

5 5 25

10 1 10

12 1 12

14 2 28

localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 4/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central

Xi Fi Xi.Fi

<chr> <int> <dbl>

16 1 16

19 1 19

20 1 20

21 1 21

25 1 25

Total 15 180

In [6]:
n = nrow(tabela)

media <- tabela$Xi.Fi[n]/tabela$Fi[n]

media

12

Dados Contínuos
Em muitos casos não dispomos dos dados brutos de uma variável contínua e sim de classes
de intervalos com sua frequência em cada classe;

pelo qual temos que calcular a média para este tipo dados distribuidos em classes de
intervalos;

em outros casos o pesquisador explica seus dados com um histograma (com os dados
distribuidos em classes de intervalos) e complementa sua explicação com medidas de
tendência central e de dispersão.

No caso de dados contínuos,

agrupamos os dados em classes;

cada classe é representada pelo seu ponto médio;

calculamos a média de forma similar aos dados agrupados.

Classes xi fi xi fi

a 1 ⊢ b1 x1 f1 x1 f1

a 2 ⊢ b2 x2 f2 x2 f2

⋮ ⋮ ⋮ ⋮

a n ⊢ bn xn fn xn fn

n n

Total ∑ fi ∑ xi fi
i=1 i=1

logo,

localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 5/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central
n

∑ xi ⋅ fi
i=1
x̄ =
n

∑ fi
i=1

onde, x é o ponto médio da i-ésima classe

Nota: A notação a i ⊢ bi equivale ao intervalo [a i, bi ) fechado a esquerda e aberto a direita.

Exemplo 3
Calcular a média da seguinte distribuição de dados:

Classes fi

1, 5 ⊢ 2, 0 3

2, 0 ⊢ 2, 5 16

2, 5 ⊢ 3, 0 31

3, 0 ⊢ 3, 5 34

3, 5 ⊢ 4, 0 11

4, 0 ⊢ 4, 5 4

4, 5 ⊢ 5, 0 1

Solução
Calculamos o ponto médio x de cada classe;
i

o ponto médio da classe a i


⊢ bi é:

ai + b 1
xi =
2

Classes xi fi

1, 5 ⊢ 2, 0 1,75 3

2, 0 ⊢ 2, 5 2,25 16

2, 5 ⊢ 3, 0 2,75 31

3, 0 ⊢ 3, 5 3,25 34

3, 5 ⊢ 4, 0 3,75 11

4, 0 ⊢ 4, 5 4,25 4

4, 5 ⊢ 5, 0 4,75 1

calculamos para cada clase o produto x i


⋅ fi :

Classes xi fi xi fi

1, 5 ⊢ 2, 0 1,75 3 5, 25

localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 6/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central

2, 0 ⊢ 2, 5 2,25 16 36, 00

2, 5 ⊢ 3, 0 2,75 31 85, 25

3, 0 ⊢ 3, 5 3,25 34 110, 50

3, 5 ⊢ 4, 0 3,75 11 41, 25

4, 0 ⊢ 4, 5 4,25 4 17, 00

4, 5 ⊢ 5, 0 4,75 1 4, 75

calculamos as somas das colunas f e x i i fi :

Classes xi fi xi fi

1, 5 ⊢ 2, 0 1,75 3 5, 25

2, 0 ⊢ 2, 5 2,25 16 36, 00

2, 5 ⊢ 3, 0 2,75 31 85, 25

3, 0 ⊢ 3, 5 3,25 34 110, 50

3, 5 ⊢ 4, 0 3,75 11 41, 25

4, 0 ⊢ 4, 5 4,25 4 17, 00

4, 5 ⊢ 5, 0 4,75 1 4, 75

Total 100 300

logo, a média é:

∑ xi ⋅ fi
i=1 300
x̄ = = = 3 ■
n
100
∑ fi
i=1

Expectativa de vida do ano 2017 - Dados Gapminder


Analisaremos a média da expectativa de vida da população mundial e dos continentes

In [7]:
library(tidyverse)

library(plotly)

Attaching package: 'plotly'

The following object is masked from 'package:ggplot2':

last_plot

The following object is masked from 'package:stats':

filter

The following object is masked from 'package:graphics':

localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 7/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central

layout

In [8]:
gapminder <- readRDS('../8_Examinando_dados/gapminder_dados.rds')

Usuarios do google colab


Para usar o R no google colab na sua conta do google acesse o link:

https://colab.research.google.com/#create=true&language=r

no lado direito clique sobre a pasta arquivos

de um clique no simbolo do arquivo com uma seta para cima (fazer upload para o
armazenamento da sessão)

baixe o arquivo gapminder_dados.rds de seu computador, este arquivo ficará disponível


enquanto a sessão ficara ativa

digite na linha de comando: gapminder <- readRDS('gapminder_dados.rds')

In [9]:
names(gapminder)

'pais' · 'continente' · 'região' · 'nivel_de_renda' · 'ano' · 'renda_per_capita' · 'mortalidade_infantil' ·


'expectativa_vida'

In [10]:
ev_2017 <- gapminder %>%

filter(ano == 2017, !is.na(expectativa_vida) & !is.na(continente)) %>%

select(continente, expectativa_vida)

In [11]:
head(ev_2017)

A tibble: 6 × 2

continente expectativa_vida

<fct> <dbl>

Asia 63.38

Europa 78.23

África 77.74

Europa 82.70

África 64.19

Américas 77.02

Média global da expectativa de vida no ano 2017


In [12]:
hist(ev_2017$expectativa_vida, main = 'Expectativa de vida global: ano 2017',

xlab = 'Expectativa de vida', ylab = 'Frequência', col = 'green')

localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 8/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central

In [13]:
media_ev <- mean(ev_2017$expectativa_vida)

media_ev

72.8367724867725

In [14]:
hist(ev_2017$expectativa_vida, main = 'Expectativa de vida global: ano 2017',

xlab = 'Expectativa de vida', ylab = 'Frequência', col = 'green')

abline(v=media_ev, col="red", lwd=3)

text(media_ev, 20, "média", col='red')

localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=f… 9/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central

Média por continente da expectativa de vida no ano 2017


In [15]:
ev_2017 %>%

group_by(continente) %>%

summarise(Média = mean(expectativa_vida))

A tibble: 4 × 2

continente Média

<fct> <dbl>

África 65.35815

Américas 75.52471

Asia 73.71071

Europa 78.69267

Renda per capita do ano 2017 - Dados Gapminder


Analisaremos a média da renda per capita da população mundial e dos continentes

In [16]:
rpc_2017 <- gapminder %>%

filter(ano == 2017, !is.na(renda_per_capita) & !is.na(continente)) %>%

select(continente, renda_per_capita)

In [17]:
head(rpc_2017)

A tibble: 6 × 2

continente renda_per_capita

localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download… 10/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central

continente
<fct> renda_per_capita
<dbl>

<fct> <dbl>

Asia 1758

Europa 11803

África 13876

Europa 49768

África 6045

Américas 22856

Média global da renda per capita no ano 2017


In [18]:
hist(rpc_2017$renda_per_capita, main = 'Renda per capita global: ano 2017',

xlab = 'Renda per capita', ylab = 'Frequência', col = 'green')

In [19]:
media_rpc <- mean(rpc_2017$renda_per_capita)

media_rpc

18491.4871794872

In [20]:
hist(rpc_2017$renda_per_capita, main = 'Renda per capita global: ano 2017',

xlab = 'Renda per capita', ylab = 'Frequência', col = 'green')

abline(v=media_rpc, col="red", lwd=3)

text(media_rpc, 50, "média", col='red')

localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download=… 11/12
20/05/2022 22:41 12_Medidas_de_Tendência_Central

Média por continente da renda per capita no ano 2017


In [21]:
rpc_2017 %>%

group_by(continente) %>%

summarise(Média = mean(renda_per_capita))

A tibble: 4 × 2

continente Média

<fct> <dbl>

África 5471.741

Américas 15873.486

Asia 20106.729

Europa 33372.277

localhost:8888/nbconvert/html/PE-2021.2-em-2022/12_Medidas_de_Têndência_Central/12_Medidas_de_Tendência_Central.ipynb?download… 12/12

Você também pode gostar