Você está na página 1de 5

Tratamento e Análise de Dados

“Ciência que dispõe de processo apropriados para recolher, organizar, classificar, apresentar e
interpretar conjuntos de dados”.

A Estatística, divide-se em:

⮚ Estatística Descritiva: Consiste na recolha, apresentação, análise e interpretação dos


dados relativos a um dado evento, através dos quadros, gráficos e medidas.
⮚ Inferência Estatística: Aplicação de métodos científicos para inferir, tirar conclusões,
tomar decisões sobre uma população com base numa amostra. (Testes de Hipóteses)

As variáveis podem ser:

⮚ Qualitativas: Associadas a uma qualidade, não são passiveis de ser medidas.


o Nominais: Variáveis que não se podem ordenar (ex: sexo, nacionalidade, raça,
tipo sanguíneo, número das camisolas dos futebolistas).
o Ordinais: Variáveis que se podem ordenar (ex: Classificação do peso – Pouco
pesado, pesado ou muito pesado).

⮚ Quantitativas: Associadas a uma quantidade numérica, são passiveis de ser medidas.


o Discretas: Número finito de valores (ex: nº acidentes de trabalho um ano, nº
de filhos por casal, nº de cigarros fumados).
o Contínuas: Número infinito de valores (ex: Peso, altura, idade, a distância entre
dois pontos, temperatura corporal).

Representação Gráfica

● Gráfico de Barras (utilizado para dados discretos)


● Gráfico de Dispersão
● Pictograma
● Gráfico Circular
● Histograma (Utilizado para dados contínuos)
● Caixa de Bigodes

Um bom gráfico deve:

● Completar ou demonstrar os factos apresentados


● Ter um título e legenda
● Ser simples e objetivo
● Mostrar a informação sem a alterar ou deturpar
● Visualmente ser correto
Agrupar dados em Classes:

1º Passo: Determinar o valor máximo e o valor mínimo da amostra

2º Passo: Determinar o nº de classes

🡺 Regra da raiz: Raiz quadrada da amostra (N)

3º Passo: Determinar a amplitude das classes

4º Passo: Determinar as classes.


Medidas de Tendência Central

⮚ Média
o Sensível a alterações
o Sensível a Outliers
o Facilidade de cálculo

⮚ Média em Classes

⮚ Mediana
o Não é tão sensível a valores extremos
o Divide a amostra em 50%
● 1º Passo: Ordenar os dados
● 2º Passo: Determinar o K
▪ Se n for ímpar 🡪 K = N + 1 / 2
▪ Se n for par 🡪 K = N / 2

⮚ Moda (Mo)
o Valor que se repete mais vezes
o Caso tenha duas modas, é considerado bimodal
o Caso tenha várias modas, é considerado multimodal

Outliers

Os Outliers classificam-se de acordo com o seu afastamento em relação às restantes


observações.

Medidas de Tendência Não Central

➢ Os quartis são os valores da variável que dividem a distribuição em quatro partes iguais.

➢ Os decis são os valores da variável que dividem a distribuição em dez partes iguais.

➢ Os percentis são os valores da variável que dividem a distribuição em 100 partes iguais.
Medidas de Dispersão

Servem para verificarmos a representatividade das medidas de localização, pois é comum


encontrarmos variáveis que, apesar de terem a mesma média, são compostas de valores bem
distintos.

Amplitude: (Δx) é a medida de dispersão mais simples. É a diferença entre os valores máximo e
mínimo da variável. Muito sensível a valores extremos. É uma medida de dispersão muito
imperfeita.

Amplitude Interquartil: É definido como sendo a diferença entre o terceiro e o primeiro quartis
e corresponde a um intervalo que engloba 50% das observações centrais. IQ = Q3 – Q1

Variância: Para dados desagregados, a variância é a soma do quadrado das diferenças entre os
valores da variável e a média, dividida pelo número total de observações.

Desvio Padrão:

Coeficiente de Variação: Quanto maior o coeficiente de variação, maior é a dispersão.

Medidas de Assimetria

⮚ Distribuições simétricas unimodais onde: Mo = Mediana= Media

⮚ Distribuição assimétrica positiva: Mo < Mediana < Media

⮚ Distribuições assimétricas negativa: Mo > Mediana > Media


Existem ainda outros indicadores quantitativos que nos permitem estimar, com maior
precisão, o grau de assimetria de uma distribuição. Um deles é o Coeficiente de Pearson que
mede o grau de assimetria através da comparação da média e da moda:

⮚ G1 = a distribuição é simétrica

⮚ G1 > a distribuição é assimétrica positiva

⮚ G1 < a distribuição é assimétrica negativa

Medidas de Achatamento ou Curtose

Entende-se por curtose o grau de achatamento de uma distribuição. As medidas de


achatamento dão-nos, uma indicação da intensidade das frequências na vizinhança dos valores
centrais.

Para medir o grau de achatamento pode ser utilizada a seguinte medida:

⮚ K = 0,263 a distribuição de frequências é mesocúrtica


⮚ K > 0,263 a distribuição diz-se platicúrtica
⮚ K < 0,263 a distribuição diz-se leptocúrtica

Você também pode gostar