Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística Descritiva
Profª. Angelica Nakagawa Lima
angelica.lima@ufabc.edu.br
Outubro/2020
Tópicos
• Pesquisa Científica e Estatística
• Distribuição de frequências
• Medidas de tendência central e de dispersão
• Relação entre variáveis
Pesquisa Científica e Estatística
Onde usamos estatística na Ciência?
Tipos de variáveis
• Independente: sofre uma intervenção/manipulação e/ou
exerce influência sobre uma variável de resposta.
• Dependente: medida de interesse da pesquisa; Varia em
resposta a uma variável manipulada.
Pesquisa científica
• Determinar objetivo;
• Coletar dados relevantes;
• Analisar os dados; Cálculo de valores sobre as
• Tirar conclusões (e definir variáveis medidas.
continuidade da pesquisa).
Pesquisa científica
• Determinar objetivo;
• Coletar dados relevantes;
• Analisar os dados; Cálculo de valores sobre as
• Tirar conclusões (e definir variáveis medidas.
continuidade da pesquisa).
Análise estatística
• Estatística descritiva: apresentação, organização e resumo das
variáveis medidas;
• Estatística inferencial: métodos para generalizar as medidas
para a população.
Tipos de dados
Nominal
Categórico
(qualitativo)
Ordinal
Contínuo
Numérico
(quantitativo)
Discreto
Distribuição de frequências
Distribuição de frequências
• Frequência: contagem dos elementos de uma categoria.
Número de
Curso
estudantes
Economia 10
Matemática 20
Computação 40
Engenharia 15
Quantidade de alunos por curso (dados aleatórios)
Taxa / Porcentagem
Número de Número de
Curso 𝑓 Curso
estudantes 𝑃= estudantes
Economia 10 𝑁 Economia 11,8%
Matemática 20 Matemática 23,5%
Computação 40 Computação 47,1%
Engenharia 15 Engenharia 17,6%
𝑓 é a frequência na categoria
𝑁 é o total de elementos (soma de todas as categorias)
10 20
𝑃(𝐸𝑐𝑜𝑛𝑜𝑚𝑖𝑎) = 𝑃(𝑀𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎) =
10 + 20 + 40 + 15 10 + 20 + 40 + 15
40 15
𝑃(𝐶𝑜𝑚𝑝𝑢𝑡𝑎çã𝑜) = 𝑃(𝐸𝑛𝑔𝑒𝑛ℎ𝑎𝑟𝑖𝑎) =
10 + 20 + 40 + 15 10 + 20 + 40 + 15
Intervalos
• Quando lidamos com dados numéricos, também
podemos utilizar intervalos para cálculo de
frequências.
Frequência
Frequência Frequência
Tabela de (Bases Computacionais da Ciência -
31 |-| 35 2 6% 31 100%
Total 31
Histograma
• Gráfico de barras com a frequência de cada intervalo;
• Permite visualizar a distribuição de valores.
Histograma
• Utilizamos plt.hist para gerar um histograma.
import pylab as plt
plt.hist(notas, bins=5)
plt.show()
bins=3
Histograma
• O parâmetro bins define a
quantidade de intervalos:
plt.hist(notas, bins=5) bins=5
bins=7
Histograma
• O parâmetro opcional “facecolor” permite mudar a cor do
histograma:
import pylab as plt
UFABC, 2013)
𝑥= = 5,45
11
Medidas de tendência central
• Mediana: valor central de um conjunto. A
mediana divide a distribuição em duas partes
iguais.
• Primeiro, ordenamos os dados;
• Depois, obtemos a mediana.
Para N ímpar:
𝑁+1
𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = 𝑥𝑖 , 𝑒𝑚 𝑞𝑢𝑒 𝑖 =
2
Para N par:
𝑥𝑖 + 𝑥𝑖+1 𝑁
𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = , 𝑒𝑚 𝑞𝑢𝑒 𝑖 =
2 2
Medidas de tendência central
• Moda: valor/categoria de maior frequência nos dados.
• Desvio padrão:
2
𝑠= 𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎
https://www.spss-tutorials.com/standard-deviation/
Mediana
1º quartil 2º quartil 3º quartil
2, 5 6, 7 8, 9 12, 18
25% 25% 25% 25%
Valor máximo
• Gráfico que permite
visualizar a distribuição de
valores de uma variável. Ele
é baseado nos quartis,
3º quartil
conforme mostrado a
seguir:
IQR
Mediana
1º quartil
Valor mínimo
Valor máximo
Comprimento máximo:
1,5 * IQR
3º quartil (q3)
IQR = q3 – q1
2º quartil = Mediana
1º quartil (q1)
Comprimento máximo:
1,5 * IQR Valor mínimo
Adaptado de: https://pro.arcgis.com/en/pro-
app/help/analysis/geoprocessing/charts/box-plot.htm
Referências
• Bases computacionais da ciência / Organizado por
Maria das Graças Bruno Marietto, Mário Minami,
Pieter Willem Westera. — Santo André: Universidade
Federal do ABC, 2013. 242 p. ISBN: 987-85-65212–21
• http://editora.ufabc.edu.br/matematica-e-ciencias-da-
computacao/16-bases-computacionais-da-ciencia
• Slides do Prof. Vladimir Rocha – Bases Computacionais
da Ciência – UFABC 2019