Você está na página 1de 19

ANÁLISE DE DADOS

Já tenho um monte de números, o que eu faço?


Sobre o que vamos
falar?

• Distribuição de frequência ou
histograma

• Estatísticas de tendência central

• Estatísticas de dispersão

• Adequando um modelo estatístico aos


dados
Análise dos dados coletados
• É a etapa final do processo de pesquisa
que subdivide-se em duas subetapas:

• Olhar para os dados graficamente para


identificar tendências; e

• Construir um modelo estatístico


adequado aos dados.
Buscando tendências nos dados – É a verificação de quantas
vezes cada valor ocorre nos
Frequência de distribuição dados coletados de uma
amostra.

A representação gráfica de
uma distribuição de
frequência é chamada de
histograma.

Em um histograma os valores
observados são colocados no
eixo horizontal e as barras
indicam quantas vezes cada
valor ocorre.
Histogramas têm diferentes tamanhos e formatos.

Buscando tendências Em um mundo ideal, onde todos os desejos de um estatístico se


nos dados – Frequência tornam realidade, os histogramas são distribuídos
de distribuição simetricamente em torno do centro de todos os valores.

Distribuição normal
•Uma distribuição normal
Buscando tendências nos dados – implica:
Frequência de distribuição
• A maioria dos valores estão
ao redor do centro da
distribuição;

• Valores que desviam do


centro são menos frequentes;

• Alguns fenômenos
naturalmente têm esse
formato de distribuição. Ex.:

• Estatura de uma
população.
Buscando tendências nos dados – Frequência
de distribuição
No mundo real, os dados coletados de
uma amostras podem apresentar
distribuição assimétrica.
Análise descritiva – medidas de tendência central
• Usado na estatística para calcular um modelo
representativo dos dados trabalhados.

• As medidas de tendência central expressam qual


a tendência dos dados em questão.

• Mais utilizados: média, mediana e moda.


Análise descritiva – medidas de tendência central
• Moda
• O valor mais frequente nos dados coletados
• Dados podem ser bimodais, trimodais ou multimodais
• Útil quando há interesse pela característica mais comum de uma amostra.
Análise descritiva – medidas de tendência central
• Mediana
• É o valor do meio quando os dados obtidos são organizados em ordem crescente

• Menos sujeita a valores extremos do que a média

• A mediana é encontrada pelo cálculo da posição do meio na distribuição


• Se quantidade ímpar de valores -> mediana = (n +1)/2
• Se quantidade par de valores -> mediana (n+1)/2, média dos valores adjacentes
Análise descritiva – medidas de tendência central
• Mediana

• Ex. 1: Notas turma A


7.0 7.5 7.7 8.0 8.3 8.8 9.0 9.1 9.4 9.8 10.0
Média = 8.6
Mediana = 8.8

• Ex. 2: Notas turma B


1.0 7.0 7.5 7.7 8.0 8.3 8.8 9.0 9.1 9.4 9.8 10.0
Média = 8.0
Mediana =8.6
Estatísticas de tendência central
Média: É o mais utilizado valor de tendência
central e representa o valor médio.

Fórmula:

Exemplo das notas:


Média TA (sem valor extremo) = 8.6
Média TB (com valor extremo) = 8.0

A média é muito suscetível a problemas de


distribuição.
Por que é mais usada:
- Utiliza todos os dados coletados
- Tende a ser estável em diferentes amostras da
mesma população.
Estatísticas de Dispersão
Na estatística descritiva, também se
quantifica a dispersão dos dados coletados.

Quanto maior a medida de dispersão menor


é a adequação da medida de de tendência
central para explicar os dados

Medias de dispersão são úteis para


quantificar o quanto os dados desviam da
medida de tendência central.
Análise descritiva – medidas de dispersão
• Usadas para calcular a dispersão de um escore a partir da tendência central

• Amplitude:
• Maior escore – menor escore
• Considera apenais dois escores dos dados trabalhados
• Muito afetado por valores extremos (percentis)

1.0 7.0 7.5 7.7 8.0 8.3 8.8 9.0 9.1 9.4 9.8 10.0
Amplitude com valor extremo = 9.0
Amplitude sem valor extremo = 3.0
Análise descritiva – medidas de dispersão
Desvio:
O quão diferente um escore é da
tendência central

Cálculo: desvio = escore – média

1.0 7.0 7.5 7.7 8.0 8.3 8.8 9.0 9.1


9.4 9.8 10.0
Média = 8.0

O desvio total da amostra pode ser


calculada somando-se os desvios de cada
valor.
Análise descritiva – medidas de dispersão
Nota Média Desvio Desvio2
1.0 8.0 -7.0 49
7.0 8.0 -1.0 1
7.5 8.0 -0.5 0.25
7.7 8.0 -0.3 0.09
8.0 8.0 0.0 0.0
8.3 8.0 0.3 0.09
8.8 8.0 0.8 0.64
9.0 8.0 1.0 1.0
9.1 8.0 1.1 1.21
9.4 8.0 1.4 1.96
9.8 8.0 1.8 3.24
10.0 8.0 2.0 4.0
Soma 0.0 62.48
Análise descritiva – medidas de dispersão
Soma dos quadrados dos erros (soma dos quadrados)

Usado para cálculo do desvio total

SQ = (escore1 – média)2 + (escore2 – média)2 + ... (escoren – média)2

Problema é que a soma dos quadrados não permite comparação entre


amostras de tamanhos diferentes.

A alternativa é trabalhar não com a soma dos quadrados dos erros, mas com
a média dos quadrados dos erros (Variância).
Análise descritiva – medidas de dispersão

Variância:

É a média da soma dos quadrados.

Calculada pela soma dos quadrados dos erros dividido pela quantidade de dados -1

Variância = SQ / N -1

Usada para comparar a dispersão em amostras de diferentes tamanhos.

Problema – o resultado está em unidades ao quadrado


Ex.: a variância da turma é de x “Notas quadradas”
Análise descritiva –
medidas de dispersão NADA TEMA! COM O DESVIO-
PADRÃO NÃO HÁ PROBLEMA!

Desvio padrão:

É a raiz quadrada da
variância.

Permite a comparação entre


amostras de diferentes
tamanhos e mantendo a
unidade padrão.

Você também pode gostar