Você está na página 1de 26

Estatística Descritiva

Prof. Tiago Dias


Medidas de dispersão
Analisando duas amostras
Uma pesquisa de popularidade entre
dois artistas, um do Rock e outro do
Sertanejo, foi realizada tomando
como base a quantidade de
“streamings” das cinco músicas mais
populares de cada um na famosa
plataforma de músicas “PoteFire”.
Como base nestas informações,
quem é mais popular?

Músicas da Ozzita Streamings (em milhões) Músicas do Bruno Vênus Streamings (em milhões)
Envolver na briga 14 Falando com a lua 30
Vai metalandra 12 Trancado fora do céu 4
Boys Cry Sim 10 Tesouro 2
Bang pow paw 12 Deixa a porta aberta 12
Show das Trevosas 12 Do seu jeitinho 12
Calculando as medidas de centro
Músicas da Ozzita Streamings (em milhões) Músicas do Bruno Vênus Streamings (em milhões)
Envolver na briga 14 Falando com a lua 30
Vai metalandra 12 Trancado fora do céu 4
Boys Cry Sim 10 Tesouro 2
Bang pow paw 12 Deixa a porta aberta 12
Show das Trevosas 12 Do seu jeitinho 12

𝑥 = 12,0 𝑥 = 12,0
𝑥 = 12,0 𝑥 = 12,0
𝑀𝑜 = 12 𝑀𝑜 = 12

As medidas de centro não conseguem diferenciar tais amostras!


Medidas de dispersão ou variação
• São medidas estatística usadas para definir a variabilidade de
determinada variável em relação a média;
• Indicam também qual a representatividade da média em
relação ao conjunto de dados;
• Principais medidas: amplitude, variância, desvio padrão e
coeficiente de variação.
Amplitude total
A amplitude de um conjunto de dados é a diferença entre o
maior valor e o menor valor.

𝑅 = 𝑣𝑎𝑙𝑜𝑟 𝑚𝑎𝑥 − 𝑣𝑎𝑙𝑜𝑟 𝑚𝑖𝑛


Conceito de desvio
Para determinar quão distante os dados estão da média, calculamos a diferença entre
cada valor e a média.
Valores Desvios Valores Desvios
14 2 30 18
12 0 4 -8
10 -2 2 -10
12 0 12 0
12 0 12 0

𝑥 = 12,0 𝑥 = 12,0

Obs.: valores menores que a média terão desvios negativos.


E como resumir os desvios?
• Ao calcular a média dos desvios obtemos sempre zero, pois os
valores negativos anulam os positivos;

• Para resolver esta questão assumimos então os quadrados dos


desvios e assim definimos a VARIÂNCIA.
Fórmulas para Variância
• Variância populacional:
2
2
Σ 𝑥𝑖 − 𝜇
𝜎 =
𝑁

• Variância amostral:
2
2
Σ 𝑥𝑖 − 𝑥
𝑠 =
𝑛−1
Características da Variância
• O valor da variância pode aumentar drasticamente com a
inclusão de um ou mais outliers;
• A variância é não negativa, sendo zero apenas quando todos os
dados são iguais;
• A variância amostral 𝑠 2 é um estimador não viesado da
variância populacional 𝜎 2 .
A variância é suficiente?
• A variância não possui a mesma unidade de medida dos dados
originais e, por isso, dificulta a análise a ser feita;
• Tomando a raiz quadrada da variância retornamos a medida
para a unidade original e obtemos assim o DESVIO PADRÃO.
Fórmulas para o desvio padrão
• Desvio padrão populacional:
𝜎= 𝜎2

• Desvio padrão amostral:


𝑠= 𝑠2
Propriedades do desvio padrão
• É a principal medida de variação de um conjunto de dados e
indica quanto os valores se afastam da média;
• Possui a mesma unidade de medida dos dados originais;
• Dados com valores próximos entre si possuem desvio padrão
pequeno;
• Ao se comparar a variação de dois conjuntos de dados só
podemos usar o desvio padrão se as variáveis tiverem a mesma
unidade de medida e média próxima.
Calculando as medidas de dispersão
Músicas da Ozzita Streamings (em milhões) Músicas do Bruno Vênus Streamings (em milhões)
Envolver na briga 14 Falando com a lua 30
Vai metalandra 12 Trancado fora do céu 4
Boys Cry Sim 10 Tesouro 2
Bang pow paw 12 Deixa a porta aberta 12
Show das Trevosas 12 Do seu jeitinho 12

𝑥 = 12,0 𝑥 = 12,0
𝑠 2 = 2,0 𝑠 2 = 122,0
𝑠 = 1,4 𝑠 = 11,0

As medidas de dispersão conseguiram diferenciar estas amostras!


Regras empíricas
1. Pode-se fazer uma primeira aproximação (grosseira) do desvio
padrão utilizando a quarta parte da amplitude total.
𝑅
𝑠≈
4
2. Todos os valores que estão a até 2 desvio padrão da média
(para mais ou para menos) são chamados valores usuais.
Intervalo usual: [𝑥 − 2𝑠, 𝑥 + 2𝑠]
Estas regras não são exatas e se prestam à análises preliminares.
Coeficiente de variação
• Para comparar a dispersão entre conjuntos de dados distintos
fazemos uso do chamado Coeficiente de Variação ou dispersão
relativa:
𝜎
– Coeficiente de variação populacional: 𝐶𝑉 = ∙ 100%
𝜇
𝑠
– Coeficiente de variação amostral: 𝐶𝑉 = ∙ 100%
𝑥
Classificação da amostra
• Classificamos da seguinte maneira a dispersão de um conjunto
de dados:
– Baixa dispersão: 𝐶𝑉 ≤ 15%
– Média dispersão: 15% < 𝐶𝑉 < 30%
– Alta dispersão: 𝐶𝑉 ≥ 30%

• Estes limites não são consenso entre todos autores, sendo aqui
usadas as referências de TRIOLA (2013).
QUAL AMOSTRA POSSUI MAIOR DISPERSÃO?
Histograma – Notas Turma A – 2020/Tri1
Histograma – Notas Turma B – 2020/Tri1
Histograma – Notas Turma A – 2020/Tri1

𝑥 = 24,7
𝑠 = 4,6
𝐶𝑉 = 18%
Histograma – Notas Turma B – 2020/Tri1

𝑥 = 23,3
𝑠 = 6,0
𝐶𝑉 = 26%
IDENTIFIQUE AS ESTATÍSTICAS CALCULADAS
Histograma – Turma A – 2022/Tri1 Os 10% melhores
resultados estão a
18% do total de notas está abaixo da média partir de 29,3

8% entre 15 e 18

Os 10% piores resultados


se limitaram até 14,7

A nota média da turma foi de 21,9 e há alta dispersão em torno deste valor (desempenho
heterogêneo), sendo que metade das notas estão entre 19,0 e 26,4.
Os 10% melhores
9º decil resultados estão a
18% do total de notas está abaixo da média partir de 29,3

8% entre 15 e 18

Os 10% piores resultados


1º decil se limitaram até 14,7

A nota média da turma foi de 21,9 e há alta dispersão em torno deste valor (desempenho
heterogêneo), sendo que metade das notas estão entre 19,0 e 26,4.
Atividade Prática
Tabela 2 – Público diário do Rock in Rio
Determinar, média, mediana, moda, Ano Edição Público diário
variância, desvio padrão e coeficiente 1985 Rock in Rio I 138.000
1991 Rock in Rio II 77.780
de variação (classificando a amostra) 2001 Rock in Rio III 176.430
da seguinte amostra de dados 2011 Rock in Rio IV 100.000
referentes ao público diário do 2013 Rock in Rio V 85.000
2015 Rock in Rio VI 85.000
Festival Rock in Rio no Brasil.
2017 Rock in Rio VII 100.000
2019 Rock in Rio VIII 100.000
Fonte: www.forbes.com.br

Você também pode gostar