Você está na página 1de 43

ESTATISTICA\01 Cap I Estatistica Descritiva

Estatística Experimental
Estatística Descritiva
e Análise de Dados

ESTAT - Estatística Descritiva_20_21 pág.1/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Estatística descritiva e Inferência estatística

• O ramo da Estatística que diz respeito à descrição e


redução dos dados é denominada por Estatística
Descritiva.

• O ramo da Estatística relacionada com a tirada de


conclusões dos dados é denominada por Inferência
Estatística.

ESTAT - Estatística Descritiva_20_21 pág.2/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Usa a Estatística do mesmo modo que um bêbado os


postes: mais pelo apoio do que propriamente pela
iluminação.

Andrew Lang

ESTAT - Estatística Descritiva_20_21 pág.3/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

População e amostra

• A ideia subjacente a todas as estatísticas é a de


que temos n observações de uma amostra proveniente da
população-alvo que consiste em N indivíduos .

• Nesta unidade, iremos sempre considerar que as amostras são


aleatórias (cada indivíduo tem uma probabilidade igual de ser
selecionado).

ESTAT - Estatística Descritiva_20_21 pág.4/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

DADOS

ESTAT - Estatística Descritiva_20_21 pág.5/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

“Estatística é a arte de aprender com os dados. Ela

diz respeito à recolha de dados, a sua consequente

descrição e análise, as quais levam frequentemente à

extracção de conclusões. “

Ross, 2005

ESTAT - Estatística Descritiva_20_21 pág.6/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Dados

Os objectos de estudo da Estatística são os dados

estatísticos e o objectivo da Estatística é obter dados,

descrevê-los, sumarizá-los, agrupá-los, organizá-los,

analisá-los e interpretar os resultados da análise.

ESTAT - Estatística Descritiva_20_21 pág.7/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva
Escala nominal
(sem ordenação)
Qualitativos Ex: raça, género
(Valores
numéricos
codificados)
Escala ordinal
(com ordenação)
Ex: extrato social

Dados

Discretos
(medidas com valores
específicos)
Quantitativos Ex: número de filhos
(Valores
numéricos) Contínuos
(medidas que tomam valores
num intervalo)
Ex: peso, altura, temperatura

ESTAT - Estatística Descritiva_20_21 pág.8/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Estatística descritiva

• O principal objetivo da estatística é fazer uma


inferência a partir de uma amostra para toda
a população.
• Como etapa preliminar que deve ser
tomada, a amostra deve ser simplificada e
reduzida para alguns números descritivos
denominados estatísticas amostrais.

ESTAT - Estatística Descritiva_20_21 pág.9/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Estatística descritiva

O tipo de estatística descritiva a ser usado depende


da escala de medida das variáveis.

No SPSS

ESTAT - Estatística Descritiva_20_21 pág.10/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Escala Nominal
Organização dos dados Medidas de tendência Representação gráfica
central
Distribuição de Moda (classe modal) • Gráfico de barras
frequências (absolutas e • Diagrama circular
relativas)

Escala Ordinal
Organização dos dados Medidas de tendência Representação gráfica
central
Distribuição de Moda • Gráfico de barras
frequências (absolutas, Mediana • Diagrama circular
relativas e frequências Estatísticas de ordem
acumuladas) Amplitude interquartis

ESTAT - Estatística Descritiva_20_21 pág.11/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Escala de intervalo/rácio
Medidas de tendência Medidas de Representação
central dispersão gráfica
• Moda • Desvio padrão • Caixa de bigodes
• Mediana • Variância • Histograma
• 1º e 3º Quartil • Coeficiente de variação •Diagrama de
• Média • Amplitude interquartis caule e folhas
• Média aparada a 5% (AI) (steam and leaf)
• Amplitude total

ESTAT - Estatística Descritiva_20_21 pág.12/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Tabelas de frequências

Uma tabela de frequências distribui os valores

da variável estatística em frequências simples e

acumuladas que tanto podem ser absolutas

como relativas.

ESTAT - Estatística Descritiva_20_21 pág.13/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Média

Mediana
Tendência
central
Moda

Média aparada
Medidas de a 5%
localização
1º e 3º Quartis

Tendência
Outliers
não central

Percentis

ESTAT - Estatística Descritiva_20_21 pág.14/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

As medidas de localização são usadas para determinar onde a distribuição de


dados está concentrada.

MEDIDAS DE LOCALIZAÇÃO

ESTAT - Estatística Descritiva_20_21 pág.15/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Média, mediana e moda

• Média ( x ) é a soma de todas as observações a dividir pelo


número de observações.
• Mediana é a observação que é maior do que metade das
observações e menor do que a outra metade. É o valor que
corresponde à observação de ordem (n+1)/2, se n for ímpar e
é o valor que corresponde à média entre as observações de
ordens n/2 e n/2+1 se n for par.
• Moda é a observação que ocorre com maior frequência.

ESTAT - Estatística Descritiva_20_21 pág.16/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Média vs Mediana

• Usar ambas. Se a distribuição for simétrica, deverão ser próximas uma da


outra.

• A média tem melhor desempenho quando a distribuição é simétrica ou


moderadamente assimétrica.

• Se a distribuição for enviesada, usar a mediana. A média é mais afetada por


valores aberrantes.

• A moda pode ser mais informativa numa distribuição bimodal.

ESTAT - Estatística Descritiva_20_21 pág.17/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Média aparada a 5%

• A média aparada a 5% (5% trimmed mean) utiliza-se


como alternativa à média aritmética quando a
distribuição é muito assimétrica ou quando os
resultados sofrem grandes alterações com os outliers.

• Outliers são aqueles valores que se afastam


significativamente da maioria dos valores observados.

ESTAT - Estatística Descritiva_20_21 pág.18/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Quantis

• Os quartis (Q1, Q2, Q3) são medidas que dividem a distribuição


em quarto partes iguais. Diferentes pacotes de software
estatístico usam diferentes algoritmos para calculá-los.

• Os percentis e os decis são medidas que dividem a distribuição,


respetivamente em 100 ou 10 partes iguais.

ESTAT - Estatística Descritiva_20_21 pág.19/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Outliers

• Valores que difiram, do 1º Quartil ou do 3º


Quartil, mais do que 1.5 * AI mas menos do
que 3 * AI, são considerados outliers
moderados. Valores que difiram, do 1º Quartil
ou do 3º Quartil, mais do 3 * AI, são
considerados outliers severos.
• AI é a Amplitude Interquartis.

ESTAT - Estatística Descritiva_20_21 pág.20/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

As medidas de dispersão dão uma indicação de quão concentrados estão


os dados numa distribuição.

MEDIDAS DE DISPERSÃO

ESTAT - Estatística Descritiva_20_21 pág.21/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Amplitude

Amplitude
interquartis
Medidas de
dispersão
Variância e
desvio padrão

Coeficiente
de variação

ESTAT - Estatística Descritiva_20_21 pág.22/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Amplitudes

• Amplitude = Valor max – Valor min

• Amplitude interquartis = Q3 – Q1

ESTAT - Estatística Descritiva_20_21 pág.23/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Variância e desvio padrão

x −x 2
Desvio padrão = 
 

=s
 
 
 i 

n−1
2
 xi − x
 
 

Variância =
 
 
 

n−1

Erro padrão = s
n

ESTAT - Estatística Descritiva_20_21 pág.24/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Coeficiente de variação

Coeficiente de variação = Desvio padrão100%


Média

ESTAT - Estatística Descritiva_20_21 pág.25/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Assimetria e curtose. Dão uma indicação da forma da distribuição.

MEDIDAS DE ASSIMETRIA

ESTAT - Estatística Descritiva_20_21 pág.26/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Assimetria

• A assimetria quantifica a simetria duma distribuição.


• Uma distribuição simétrica tem uma assimetria nula.
• Uma distribuição assimétrica com uma longa cauda à
direita (maiores valores) tem uma assimetria
positiva.
• Uma distribuição assimétrica com uma longa cauda
para a esquerda (menores valores) tem uma
assimetria negativa.
• A assimetria é adimensional.

ESTAT - Estatística Descritiva_20_21 pág.27/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Curtose

• A curtose quantifica o quanto a forma


duma distribuição se aproxima da
distribuição Gaussiana.
• Uma distribuição Gaussiana tem uma
curtose nula.
• Uma distribuição mais achatada tem
uma curtose negativa.
• Uma distribuição com maior pico tem
uma curtose positiva.
• A curtose é adimensional.

ESTAT - Estatística Descritiva_20_21 pág.28/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Assimetria e curtose

Analyze – Descriptive Statistics - Explore


Se -1.96 < assimetria/erro padrão < 1.96

• Aproximadamente simétrica

Se -1.96 < curtose/erro padrão < 1.96

• Próxima da distribuição Normal

ESTAT - Estatística Descritiva_20_21 pág.29/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Distribuição simétrica

média ≈ moda ≈ mediana

ESTAT - Estatística Descritiva_20_21 pág.30/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Distribuição assimétrica negativa

média < mediana < moda

ESTAT - Estatística Descritiva_20_21 pág.31/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Distribuição assimétrica positiva

moda < mediana < média

ESTAT - Estatística Descritiva_20_21 pág.32/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

GRÁFICOS

ESTAT - Estatística Descritiva_20_21 pág.33/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Gráficos circulares

• A representação gráfica
permite-nos ver o
comportamento de
uma variável.
• Para variáveis
qualitativas, uma
representação gráfica
adequada é o gráfico
circular.

ESTAT - Estatística Descritiva_20_21 pág.34/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Gráficos de barras

O gráfico de barras é uma


representação gráfica
adequada a variáveis
qualitativas ou quantitativas
discretas.

ESTAT - Estatística Descritiva_20_21 pág.35/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Utilidade dos histogramas

O histograma é uma representação gráfica das frequências


de variáveis quantitativas contínuas.

• Quão simétricos são os dados?


• Quão dispersos estão os dados?
• Estão os intervalos com um alto nível de
concentração dos dados?
• Há intervalos por entre os dados?
• Há valores distantes de outros (outliers)?

ESTAT - Estatística Descritiva_20_21 pág.36/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Outros gráficos

• Outras representações gráficas são o diagrama


de caule e folhas (Stem-and-leaf diagram) e a
caixa de bigodes (Boxplot).

ESTAT - Estatística Descritiva_20_21 pág.37/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Caixa de bigodes (Boxplot)

• Um dos conjuntos fundamentais da


estatística descritiva é o sumário dos
cinco valores: mínimo, 1º quartil,
mediana (2º quartil), 3º quartil e
máximo.

• A caixa de bigodes mostra-nos estes


valores dando-nos informações
importantes sobre o centro, a
dispersão e o enviesamento dos
dados, para além da existência de
outliers.

ESTAT - Estatística Descritiva_20_21 pág.38/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Caule e folhas (Stem-and-leaf)

Quando os dados não são numerosos, a análise fica mais fácil


com o diagrama de caule e folhas.

Esta construção permite


ao observador, sem
perda de informação, ser
mais sensível ao aspeto
dos dados.

ESTAT - Estatística Descritiva_20_21 pág.39/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

EXEMPLOS

ESTAT - Estatística Descritiva_20_21 pág.40/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Exemplo 1

• Num teste à fiabilidade de uma máquina, um técnico mediu repetidamente a


viscosidade de uma amostra de petróleo bruto. Em cada um de três dias,
efetuou 10 medições.

Dia 1 60 65 65 70 70 70 70 85 85 90
Dia 2 65 65 70 60 70 65 65 90 85 80
Dia 3 70 80 85 75 70 70 65 65 70 75

a) Para cada um dos três dias, calcule a media, a mediana e a moda.


b) Para cada um dos três dias, calcule as cinco medidas sumárias representadas numa caixa
de bigodes.
c) Para cada um dos três dias, calcule a amplitude, o desvio padrão e o coeficiente de
variação.
d) Resolva as questões anteriores considerando o conjunto dos valores dos três dias (use
um diagrama de caule e folhas).
ESTAT - Estatística Descritiva_20_21 pág.41/ 43
ESTATISTICA\01 Cap I Estatistica Descritiva

Exemplo 2
• Funcionários de uma empresa na Grã Bretanha recebem os seus
salário em Libras esterlinas. Um departamento da empresa será
recolocado em França durante um ano, onde os seus salário serão
pagos em Euros. Uma Libra esterlina é igual a 1,27 Euros. Enquanto em
França, os funcionários terão um bónus mensal de 325€.
• A tabela seguinte mostra as estatísticas dos salários originais dos
funcionários na Grã Bretanha:

Mínimo £ 800
1º Quartil £ 1250
Mediana £ 1470
3º Quartil £ 2250
Máximo £ 4500
Média £ 2025
Desvio padrão £ 475

ESTAT - Estatística Descritiva_20_21 pág.42/ 43


ESTATISTICA\01 Cap I Estatistica Descritiva

Exemplo 2

a) Um empregado ganha £ 1600 por mês na Grã Bretanha. Calcule o


salário deste funcionário em Euros (incluindo o bónus) depois de este
ser recolocado em França.
b) Calcule a media e o desvio padrão dos salários dos funcionários após a
mudança para França.
c) Baseando-se nos salários auferidos na Grã Bretanha, há outliers nesses
valores? Explique por que sim ou porque não.

ESTAT - Estatística Descritiva_20_21 pág.43/ 43

Você também pode gostar