Você está na página 1de 25

ESTATÍSTICA APLICADA AOS NEGÓCIOS

Estatísticas descritivas
ESTATÍSTICAS DESCRITIVAS

• Organizam e descrevem as características de um


conjunto de dados

• Tabulares

• Gráficos

• Numéricos (posição, dispersão, associação)


MEDIDAS TABULARES DADOS
QUALITATIVOS
Tabela de frequências para estado civil

Fonte: Autora
GRÁFICO DE BARRAS

Gráfico de frequências para estado civil

Fonte: Autora
GRÁFICO DE LINHAS
Gráfico de evolução
de frequência de
usuários de Internet
ao longo do tempo

TIC Domicílios 2020


https://cetic.br/media/docs/publicacoes/2/20211124201505/resumo_exec
utivo_tic_domicilios_2020.pdf
GRÁFICO DE PIZZA

Ilustra a proporção
de cada categoria
em uma série de
dados

Fonte: Autora
HISTOGRAMA
35
Histograma da variável Salário
30
Fornece informações
sobre o formato da
25 distribuição

20
Frequency

15 Frequency

10

Fonte: Autora
DIAGRAMA DE DISPERSÃO
GRÁFICO DE DISPERSÃO
PARA GASTOS COM
CARTÃO VERSUS
SALÁRIO MENSAL

Apresenta a relação
entre duas variáveis
numéricas

Fonte: Autora
TABULAÇÃO CRUZADA

Apresenta o cruzamento
de duas variáveis
qualitativas, indicando a
frequência de cada
combinação de
categorias

Fonte: Autora
MEDIDAS NUMÉRICAS / MEDIDAS DE
POSIÇÃO

• É um valor que melhor representa


(resume) a informação contida em um
grupo de dados

• Média (aritmética):
MEDIDAS NUMÉRICAS / MEDIDAS DE
POSIÇÃO

• MEDIANA: ponto central de um conjunto de dados, “divisor de


águas”, 50% dos valores estão acima e abaixo da mediana

n= número de
observações

Xn= valor do
último elemento

• MODA: valor que se repete com maior frequência


E QUAL EU USO?

• Média  séries com pouca variabilidade

• Mediana  não é influenciada por valores extremos e


alta variabilidade

• Valores extremos  valores muito discrepantes, para


cima ou para baixo

• Calcular ambas as medidas e avaliar qual melhor


representa o centro da série
E QUAL EU USO?

• Moda  caso todos os valores apareçam com a


mesma frequência, não há uma moda – dados
categóricos e classes mutuamente excludentes

• Caso mais de um valor apareça com a mesma


frequência, a série é multimodal

1) Média: dados métricos e sem a presença de extremos


2) Moda: dados categóricos
3) Mediana: dados métricos com a presença de extremos
EXEMPLO

Média = 5.137

Média = 1.299
EXEMPLO

Colocar em ordem
crescente

Mediana = (F +E)/2 =
(1.457+1475)/2 = 1.466
MEDIDAS DE DISPERSÃO

• AMPLITUDE: diferença entre o menor e o maior valor


de uma série de dados

Não oferece qualquer informação sobre os valores entre


os extremos, nem sua variação em torno da média
QUARTIS

• Úteis para representar dados que possuam valores


discrepantes
• Dividem o conjunto de dados em quatro partes
• Indicam como os dados estão distribuídos
• Posição dos Quartis (K), onde n = tamanho da
amostra:
𝑛+1 3 𝑛+1
𝐾𝑄1 = 𝐾𝑄3 =
4 4
𝑛+1
𝐾𝑄2 = 𝐾𝑄4 = n
2
QUARTIS

1 𝐾𝑄1 =
6+1
= 1,75 Valor do Q1 = P1 + 0,75* (P2 – P1) = 1 + 0,75* (2-1) = 1,75
4
2
6+1
3 𝐾𝑄2 =
2
= 3,5 Valor do Q2 = P3 + P4/2 = 3 + 4/3,5

4 𝐾𝑄3 =
3 6+1
=5,25 Valor do Q3 = P5 + 0,25* (P6 – P5)= 5 +
4
5 0,25* (6-5)= 5,25

6 𝐾𝑄4 = n = 6 Valor do Q4 = 6
BOX PLOT OU GRÁFICO DE CAIXAS

• Percentis/Quartis
• Indica como os dados estão distribuídos

Box Plot padrão

Fonte: Autora
BOX PLOT

• Primeiro Quartil (Q1)


Percentil 25%  valor da amostra, tal que 25% das observações
são menores do que ele.

• Segundo Quartil (Q2)


Percentil 50%  valor da amostra, tal que 50% das observações
são menores que ele (mediana).

• Terceiro Quartil (Q3)


Percetil 75%  valor da amostra, tal que 75% das observações
são menores que ele.
BOX PLOT
Box Plot para Salário Mensal por gênero

Inferior = 𝑄1 − 1,5(𝑄3 − 𝑄1)

Superior = 𝑄3 + 1,5(𝑄3 − 𝑄1)

Fonte: Autora
MEDIDAS DE DISPERSÃO
(VARIABILIDADE)

• Como os dados diferem entre si?

• Quanto cada dado difere da média?

𝑎)7,6,3,3,1 → 𝑥 = 4
𝑏)2,4,4,5,5 → 𝑥 = 4
𝑐)4,4,4,4,4 → 𝑥 = 4
MEDIDAS DE DISPERSÃO

• Variância: quadrado do desvio-padrão

• Medida quadrática  difícil interpretação

σ(𝑥 − 𝑥) 2
𝑠2 =
𝑛−1
∗ ෍(𝑥 − 𝑥) = 0!! 𝑠 2 = var 𝑖 â𝑛𝑐𝑖𝑎
𝑥 = 𝑒𝑠𝑐𝑜𝑟𝑒 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑎𝑙
𝑥 = 𝑚é𝑑𝑖𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎
𝑛 = 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑎𝑚𝑜𝑠𝑡𝑟𝑎
MEDIDAS DE DISPERSÃO

• Desvio-padrão: distância média em relação à


média (é também sensível a valores extremos).
• Quanto mais elevado o desvio-padrão, maior a
distância dos pontos individuais em relação à
media.
σ(𝑥 − 𝑥)2
𝑠=
𝑛−1
𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑜 − 𝑝𝑎𝑑𝑟ã𝑜
𝑥 = 𝑒𝑠𝑐𝑜𝑟𝑒 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑎𝑙
𝑥 = 𝑚é𝑑𝑖𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 ∗ ෍(𝑥 − 𝑥) = 0!!
𝑛 = 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑎𝑚𝑜𝑠𝑡𝑟𝑎
*  ( x  x)  0!!
MEDIDAS DE DISPERSÃO

• Coeficiente de variação: mede a homogeneidade


dos dados em relação à média

𝑑𝑒𝑠𝑣𝑖𝑜 − 𝑝𝑎𝑑𝑟ã𝑜
𝑐𝑣 = ∗ 100%
𝑚é𝑑𝑖𝑎

Até 30% pode se considerar uma


distribuição homogênea

*  ( x  x)  0!!

Você também pode gostar