Você está na página 1de 72

03/10/2022

2. Estatísticas
ESGHT -Descritivas
UAlg

Estatística I

2. Estatísticas Descritivas e
Apresentação de Dados
Lara Noronha Ferreira
Lnferrei@ualg.pt

Estatística I 1 Lara N. Ferreira

1
03/10/2022

2. Estatísticas Descritivas
2.1. Introdução
Existem diferentes tipos de dados: (1)

 Dados Seccionais:
Quando os valores se referem a um conjunto de indivíduos num certo
momento do tempo (por exemplo, os valores referentes à população
de vários países no ano de 2015).

 Dados Temporais ou Cronológicos:


Quando os valores se referem a um indivíduo ao longo de vários
períodos do tempo (por exemplo, valores da população do país A de
1995 a 2018).

Estatística I 2 Lara N. Ferreira

2
03/10/2022

2. Estatísticas Descritivas
2.1. Introdução

Existem diferentes tipos de dados: (2)

 Dados em Painel:
Quando os valores se referem a um conjunto de indivíduos ao longo
de vários períodos do tempo (por exemplo, a população anual de
vários países de 1975 a 1998).

Consoante o tipo de dados e de variáveis, diferentes métodos


de sintetização de dados podem ser aplicados usando:
• Tabelas
• Gráficos
• Medidas descritivas
Estatística I 3 Lara N. Ferreira

3
03/10/2022

2. Estatísticas Descritivas

2.2. Tabelas

As tabelas apresentam um sumário dos dados do ficheiro,


normalmente em forma de frequências, e podem ser de
dois tipos:

1 – Tabelas simples
Apresentam informação para as categorias (ou valores) de
uma única variável qualitativa ou quantitativa
2 – Tabelas de dupla entrada (ou de contingência)
Apresentam informação para duas (ou mais) variáveis em
simultâneo, resultante do cruzamento das suas categorias

Estatística I 4 Lara N. Ferreira

4
03/10/2022

2. Estatísticas Descritivas

2.2. Tabelas

É desejável que as tabelas incluam:

• Título, indicando de modo preciso e sintético o


campo de informação;
• Designação para as linhas e colunas;
• Fonte de informação para permitir o controlo da
fiabilidade da informação;
• Período de tempo a que respeita a informação;
• Unidade de medida utilizada

Estatística I 5 Lara N. Ferreira

5
03/10/2022

2. Estatísticas Descritivas

2.2. Tabelas

Exemplo: Tabela simples com informação sobre o número de


empregados por sector de atividade:

Tabela 1 – Emprego civil segundo o sector de atividade em


Portugal durante o ano de 2021

Sector de Actividade Efectivos (milhares)

Sector Primário 845,1


Sector Secundário 1624,5
Sector Terciário 2225,4
TOTAL 4695

Fonte: INE; Inquérito ao Emprego, citado em INE, Portugal Social, p.41

Estatística I 6 Lara N. Ferreira

6
03/10/2022

2. Estatísticas Descritivas

2.2. Tabelas

Exemplo: Tabela de dupla entrada com informação sobre o número de


empregados por sector de atividade e sexo:

Tabela 2 – Emprego civil por sector de atividade e género em


Portugal durante o ano de 2021

Sector de Actividade (milhares)


Sexo
Género Primário Secundário Terciário TOTAL

Homens 427,2 1108 1164,4 2699,6

Mulheres 417,9 516,5 1061 1995,4

TOTAL 845,1 1624,5 2225,4 4695

Fonte: INE; Inquérito ao Emprego

Estatística I 7 Lara N. Ferreira

7
03/10/2022

2. Estatísticas Descritivas

2.3. Gráficos
Os gráficos são utilizados para ilustrar de modo simples e intuitivo
a distribuição da informação.

Existem vários tipos de gráficos, que devem ser aplicados em


função do tipo de dados e de variáveis.

Alguns tipos de gráficos:


1 – Gráfico de barras
2 – Gráfico circular
3 – Histograma
4 – Polígonos de frequências
5 – Diagrama de dispersão
6 – Cronograma

Estatística I 8 Lara N. Ferreira

8
03/10/2022

2. Estatísticas Descritivas

2.3. Gráficos
2.1. Gráficos de Barras

São gráficos em que as categorias (os valores) da variável em


estudo são representados por barras cuja altura ou comprimento
representa a frequência (absoluta ou relativa).

Podem ser usados para representar dados seccionais de


variáveis qualitativas ou quantitativas discretas.

Estatística I 9 Lara N. Ferreira

9
03/10/2022

2. Estatísticas Descritivas

2.3. Gráficos
2.1. Gráficos de Barras

Exemplo: Gráfico de barras para Exemplo: Gráfico de barras para


uma variável qualitativa duas variáveis qualitativas
2225,4
2500
2500
2000 1624,5
2000
milhares

1500

Milhares
845,1 1500
1000
1000
500
500

0
0
Sector Primário Sector Secundário Sector Terciário
Primário Secundário Terciário
Sector de Actividade Sector de Actividade

Homens Mulheres
Gráfico 1 – Emprego em Portugal Gráfico 2 – Emprego em Portugal segundo
segundo o sector de actividade, em 2021 o sector de actividade e sexo, em 2021

Estatística I 10 Lara N. Ferreira

10
03/10/2022

2. Estatísticas Descritivas

2.3. Gráficos
2.2. Gráficos Circulares

Nestes gráficos um círculo é dividido em partes (“fatias”)


proporcionais à frequência (número ou percentagem) de cada
categoria da característica em estudo.

Podem ser usados para representar dados seccionais de


variáveis qualitativas ou quantitativas discretas.

Estatística I 11 Lara N. Ferreira

11
03/10/2022

2. Estatísticas Descritivas

2.3. Gráficos
2.2. Gráficos Circulares

Exemplo: Gráfico circular para uma variável qualitativa

Sector Terciário
Sector Primário
47%
18%

Sector
Secundário
35%

Gráfico 2 – Emprego em Portugal segundo


o sector de actividade, em 2021 (em%)

Estatística I 12 Lara N. Ferreira

12
03/10/2022

2. Estatísticas Descritivas

2.3. Gráficos
2.3. Histogramas
São gráficos usados para representar a distribuição de
frequências de uma variável quantitativa em classes, nos
quais as frequências são representadas por retângulos.
Exemplo: Distâncias percorridas por vendedores
40
Distâncias Frequência
35
Frequencia
400-419 12 30
25
420-439 27
20
440-459 34 15

460-479 24 10
5
480-499 15
0
400-419 420-439 440-459 460-479 480-499 500-519
500-519 8
Distância
Estatística I 13 Lara N. Ferreira

13
03/10/2022

2. Estatísticas Descritivas

2.3. Gráficos
2.4. Polígono de frequências
É um gráfico formado a partir do histograma, através da união
dos pontos médios da parte superior dos retângulos.

Exemplo: Distâncias percorridas por vendedores


40
Distâncias Frequência
35
400-419 12 30
Frequency 25
420-439 27
20

440-459 34 15
10
460-479 24 5
0
480-499 15 409,5 429,5 449,5 469,5 489,5 509,5
Class mid-point miles
500-519 8

Estatística I 14 Lara N. Ferreira

14
03/10/2022

2. Estatísticas Descritivas

2.3. Gráficos
2.5. Diagrama de dispersão
São gráficos de pontos usados para ilustrar a forma da relação
existente entre duas variáveis quantitativas (dados seccionais).

Exemplo: Diagrama de dispersão entre o volume de vendas e o


salário dos vendedores
1400
Salário dos vendedores

1200
1000
800
600
400
200
0
0 10 20 30 40 50 60
Volume de vendas
Estatística I 15 Lara N. Ferreira

15
03/10/2022

2. Estatísticas Descritivas

2.3. Gráficos
2.6. Cronograma
São gráficos de linhas que ilustram a evolução de variáveis
quantitativas ao longo do tempo (dados temporais).

Exemplo: Cronograma do volume de vendas mensal


1200

Volume de 1000
vendas
800

600

400

200

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Meses (período temporal)


Estatística I 16 Lara N. Ferreira

16
03/10/2022

2. Estatísticas Descritivas

2.4. Medidas descritivas


Existem algumas medidas que permitem representar um conjunto de
dados quantitativos de forma resumida

possibilitam também comparar diferentes conjuntos de dados

Medidas Descritivas

Estas medidas descritivas (parâmetros se se referirem à população


e estatísticas se se referirem à amostra):

 permitem sumariar os dados através de um só valor


 devem obedecer a algumas propriedades para serem
consideradas boas medidas de descrição dos fenómenos em estudo

Estatística I 17 Lara N. Ferreira

17
03/10/2022

2. Estatísticas Descritivas

2.4. Medidas descritivas


 objectividade
 dependência de todas as observações
 significado bem preciso para a sua
interpretação
Propriedades  facilidade de cálculo
 pouca variabilidade às flutuações da
amostragem
 facilidade de manejo no cálculo
algébrico.

mas, não existem medidas descritivas que satisfaçam todas as propriedades.

As que verificam umas propriedades, não satisfazem em geral as outras.

Estatística I 18 Lara N. Ferreira

18
03/10/2022

2. Estatísticas Descritivas

2.4. Medidas descritivas

As medidas descritivas classificam-se em:

• Tendência central
1 – Medidas de localização
• Tendência não central

2 – Medidas de dispersão
Observação:
3 – Medidas de assimetria Vai ser apresentada a indicação de
como estas medidas são
4 – Medidas de curtose denominadas em SPSS

5 – Medidas de concentração Descriptive Statistics

Estatística I 19 Lara N. Ferreira

19
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização
Medidas de localização de tendência central:
São as medidas descritivas que nos dão uma indicação dum valor central
ou médio em torno do qual se encontram os valores da variável.

Estas medidas descritivas classificam-se em:

 Aritmética (simples ou ponderada);


1 – Média  Geométrica;
 Harmónica.

2 – Mediana

3 – Moda

Estatística I 20 Lara N. Ferreira

20
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização

Moda Mode
É o valor de um conjunto de dados que apresenta maior frequência.
O seu cálculo torna-se mais fácil se os dados estiverem ordenados.
Exemplo 2.1:
Considere os seguintes dados: 12 14 9 13 15 12

Mo = 12

Estatística I 21 Lara N. Ferreira

21
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização

Mediana Median
É o valor central dum conjunto ordenado de dados, isto é, é o valor
que divide a distribuição em duas partes iguais.
Ao contrário da média, a mediana não é afectada por valores extremos.

Cálculo da mediana:
1. ordenar os dados
2. calcular a estatística de ordem do(s) elemento(s) central(is):
 se n for ímpar a mediana corresponde ao valor do elemento de
ordem: n  1
2
 se n for par a mediana será a média dos elementos centrais de
ordens: n e n  1
2 2
Estatística I 22 Lara N. Ferreira

22
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização
Exemplo 2.2:

Considere os seguintes dados: 12 14 9 13 12

Passos para o cálculo da Mediana:

1. ordenação dos dados: 9 12 12 13 14

2. n=5 (n é ímpar)

n  1 5  1 6
   3 Me x3 Me =12
2 2 2

Estatística I 23 Lara N. Ferreira

23
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização

Exemplo 2.3:

Considere os seguintes dados: 12 14 9 13 15 12

Passos para o cálculo da Mediana:

1. ordenação dos dados: 9 12 12 13 14 15

2. n=6 (n é par)
n 6
  3
2 2 x  x 12  13
Me 3 4 Me   12 . 5
n 6 2 2
 1   1  4
2 2

Estatística I 24 Lara N. Ferreira

24
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização

Média aritmética simples Mean

É a soma de todos os valores observados dividida pelo número de


observações.

Para uma amostra de n elementos tem-se:

n - dimensão da amostra
xi - i-ésima observação da variável aleatória X

Estatística I 25 Lara N. Ferreira

25
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização

Média aritmética ponderada Mean

Indica o valor médio de uma distribuição quando existem observações


que se repetem no conjunto de dados.

Para uma amostra de n elementos tem-se:

wi - ponderador da i-ésima observação

Frequentemente esta expressão toma a forma:

n - dimensão da amostra
xi - i-ésima observação da variável aleatória X
ni - número de vezes que a observação xi se repete (frequência absoluta)
Estatística I 26 Lara N. Ferreira

26
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização
Exemplo 2.4:
As classificações que seis alunos x1 x2 x3 x4 x5 x6
obtiveram num teste de estatística
12 10 13 11 14 15
foram:

A média aritmética simples 12  10  13  11  14  15


x   12 , 5
é dada por: 6

Exemplo 2.5:
As classificações que seis alunos x1 x2 x3 x4 x5 x6 x7 x8
obtiveram num teste de estatística 10 14 12 12 14 18 12 10
foram:

A média aritmética ponderada 2  10  3  12  2  14  18


x   12 , 75
é dada por: 8
Estatística I 27 Lara N. Ferreira

27
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização
Propriedades da Média aritmética:
1. A adição de uma constante, c, a todos os valores de uma variável X tem
como resultado uma média que vem adicionada da mesma constante

2. A multiplicação por uma constante, c, de todos os valores de uma


variável X tem como resultado uma média que vem multiplicada pela
mesma constante

3. A soma dos desvios em relação à média é nula


n
 (x  x)  0
i
i  1

4. A soma dos quadrados dos desvios em relação a um ponto a é


mínima quando o ponto a coincide com a média:
n
 (x i  a)2 é m in im o quando a  x
i  1
Estatística I 28 Lara N. Ferreira

28
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização

Média geométrica
A média geométrica (Mg) é a raiz de índice n do produto dos dados.
Para uma amostra de n elementos tem-se:
n
Mg  n x1  x2  ...  xn  n x
i 1
i

 A Mg é utilizada quando se está em presença de fenómenos cujas


variações são proporcionais a um valor inicial;

 A utilidade e o significado da Mg podem ser ilustrados através de um


exemplo.

Estatística I 29 Lara N. Ferreira

29
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização
Exemplo 2.6:
Admita-se que, nos últimos 4 anos, o PIB de um determinado país cresceu
2,5%; 1,7%; 2,2% e 3,5%. Se se denotar por PIB0 o valor do PIB no ano
anterior a este período, o seu valor no último ano será dado por:

PIB4 = (R1.R2.R3.R4).PIB0
Onde as razões de crescimento, Rn, são: R1 = 1 + 0,025
R2 = 1 + 0,017
R3 = 1 + 0,022
R4 = 1 + 0,035

Qual é a taxa média anual de crescimento do PIB?

Mg  4 1,025  1,017  1,022 1,035  1,0247  Taxa média anual = 2,47%


Estatística I 30 Lara N. Ferreira

30
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização

Média harmónica
A média harmónica (Mh) é o inverso da média aritmética dos inversos
dos dados, xi (i=1, 2, ..., n).
Para uma amostra de n elementos tem-se:
1
Mh 
1 n 1

n i 1 xi
 A Mh é utilizada em situações onde a proporcionalidade inversa esteja
presente;

 A utilidade e o significado da Mh são igualmente ilustrados através de


um exemplo.
Estatística I 31 Lara N. Ferreira

31
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização
Exemplo 2.7:
Um empreiteiro dispõe de 4 camiões cuja tarefa consiste em transportar
pedra desde uma pedreira até um porto. A pedra destina-se a formar o
ancoramento de um molhe em construção. Na tabela seguinte apresenta-se
o número de cargas efectuadas por cada camião num determinado turno de
8 horas e o valor correspondente do tempo médio por carga.

Camião Nº de cargas Tempo médio por


carga (minutos)
1 10 48
2 16 30
3 12 40
4 15 32

Relativamente ao conjunto de 4 camiões, qual é o tempo médio por carga?


Estatística I 32 Lara N. Ferreira

32
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização
Pode-se calcular através de dois métodos:

1
1º método: Mh   36,2
1 1 1 1 1 
    
4  48 30 40 32 

2º método: X  4  8  60 1920 minutos


  36,2
10  16  12  15 53 camiões

Estatística I 33 Lara N. Ferreira

33
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização
Medidas de localização de tendência central:
São as medidas descritivas que nos dão a localização relativa de certas
observações na distribuição.

Estas medidas descritivas são normalmente denominadas por quantis,


que podem ser:

1 – Quartis
São os valores que dividem a distribuição em 4 partes iguais.

2 – Decis
São os valores que dividem a distribuição em 10 partes iguais.

3 – Percentis
São os valores que dividem a distribuição em 100 partes iguais.

Estatística I 34 Lara N. Ferreira

34
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização

Quantis Percentiles

O método geral de cálculo do quantil de ordem p (0<p<1) é o seguinte:


1. ordenar os dados;
2. calcular a posição do quantil, (n+1)p, e aplicar a seguinte regra:

- se (n+1)p = r , onde r é um inteiro, qp = xr;

- se (n+1)p não é um inteiro, seja (n+1)p = r + a, onde r é a parte


inteira e a é a parte fraccionária, então

qp = (1-a)xr + axr+1

Estatística I 35 Lara N. Ferreira

35
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização

Quartis Quartiles

São os valores que dividem um conjunto ordenado de dados em quatro


partes iguais.

Q1, o primeiro quartil, é o valor tal que 25% das observações são mais
pequenas e 75% são maiores.

Q2, o segundo quartil, é o valor tal que 50% das observações são
menores e 50% são maiores, logo, coincide com a mediana.

Q3, o terceiro quartil, é o valor tal que 75% das observações são mais
pequenas e 25% são maiores.

Estatística I 36 Lara N. Ferreira

36
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização

Quartis

Apesar de se poder o método geral de cálculo dos quantis, no caso dos


quartis pode usar o mesmo método de cálculo que é usado na mediana:
1. ordenar os dados;
2. determinar a estatística de ordem que contém cada quartil, utilizando as
seguintes fórmulas:

n  1 3 (n  1)
Q1  ; Q 2  Mediana ; Q 3 
4 4

Estatística I 37 Lara N. Ferreira

37
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização
Exemplo 2.8:

Considere uma amostra de dimensão 11:


x1 2 Resolução:
x2 3
x3 4
x4 5 Q1 
n  1 11  1
4

4
 3 x 3   Q
1
 4
x5 5
x6 7
x7
x8
18
21
Q2 
n  1 11  1
2

2
 6 x 6   Q
2
 7
x9 22
x10 32
x11 41 Q3 
3 n  1  36
4

4
 9 x 9   Q
3
 22

Como n é ímpar, calcula-se a posição a que corresponde cada um dos


quartis e em seguida identifica-se o valor do quartil.

Estatística I 38 Lara N. Ferreira

38
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização
Exemplo 2.9:
Considere uma amostra de dimensão 12:
x 2
Resolução:
1
x2 3
Para o 1.º quartil tem-se p=1/4
x3 4
x4 5 n  1 12  1
x5 5 Q1    3 , 25 
4 4
x6 7
x7 18
x8 21 Logo r=3 e a=0,25
x9 22
x10 32 Q 1  ( 1  0 , 25 )  4  0 , 25  5  4 , 25
x11 41
x12 48

Calcula-se a posição de cada um dos quartis e em seguida usa-se o


método geral de cálculo dos quantis.

Estatística I 39 Lara N. Ferreira

39
03/10/2022

2. Estatísticas Descritivas
2.5. Medidas de Localização
Resolução:

Para o 2.º quartil tem-se p=2/4


n  1 12  1
Q1    6 ,5 
2 2

Logo r=6 e a=0,50

Q 2  ( 1  0 , 5 )  7  0 , 5  18  12 , 5

Para o 3.º quartil tem-se p=3/4

Q 
n  1 3

13  3
 9 , 75 
3
4 4

Logo r=9 e a=0,75

Q 3  ( 1  0 , 75 )  22  0 , 75  32  29 , 5
Estatística I 40 Lara N. Ferreira

40
03/10/2022

2. Estatísticas Descritivas
2.6. Medidas de Dispersão
As medidas de localização não são suficientes, por si só, para caracterizar de
forma adequada um conjunto de dados

é necessário conhecer medidas que nos indiquem a dispersão ou variabilidade


dos dados - medidas de dispersão

que servem para verificar a representatividade das medidas de localização, pois


pode acontecer estarmos perante grupos de dados com a mesma média, e com
valores bastante diferentes

As medidas de dispersão são as seguintes:

1 – Intervalo de variação 3 - Variância 5 – Coeficiente variação

2 – Intervalo interquartil 4 – Desvio-padrão


Estatística I 41 Lara N. Ferreira

41
03/10/2022

2. Estatísticas Descritivas
2.6. Medidas de Dispersão

Intervalo de variação ou amplitude total Range

É a diferença entre o maior e o menor valor dos dados observados.


AT  X maior  X menor
Exemplo 2.10:

Considere os dados: 25 7 22 33 18 15
AT = 33 – 7 = 26

Observações:
• É fácil de calcular, mas nada nos diz como os dados estão distribuídos
entre o valor mais baixo e o valor mais alto, não devendo ser utilizada
quando os valores extremos são invulgares.
• Duas distribuições, tendo a mesma amplitude, podem ser bastante
diferentes.
Estatística I 42 Lara N. Ferreira

42
03/10/2022

2. Estatísticas Descritivas
2.6. Medidas de Dispersão

Intervalo interquartil Interquartile Range

É a diferença entre o terceiro e o primeiro quartis. Corresponde a um


intervalo que engloba 50% das observações centrais.
IQ  Q 3  Q 1

Variância Variance

Variância corrigida de uma amostra é aproximadamente a média dos


quadrados dos desvios entre cada uma das observações e a média.

Para uma amostra de dimensão n, a variância será:


n

( x1  x )  ( x 2  x )  ...  ( x n  x )
2 2 2  (x i  x)2
s  2
 i 1
n 1 n 1
Estatística I 43 Lara N. Ferreira

43
03/10/2022

2. Estatísticas Descritivas
2.6. Medidas de Dispersão

Desvio padrão Std. deviation

O desvio padrão é a raiz quadrada da variância.

 ( xi  x)2
s  s 2
 i1
n  1

Observações:
• A variância e o desvio padrão avaliam a variabilidade dos dados em torno
da média.
• A variância pode ser calculada a partir do desvio padrão e vice-versa.
• Para amostras de grande dimensão então no denominador usa-se n.
Estatística I 44 Lara N. Ferreira

44
03/10/2022

2. Estatísticas Descritivas
2.6. Medidas de Dispersão

O resultado da variância vem em unidades quadradas.


Assim, em termos práticos, a principal medida de dispersão é o desvio padrão,
cujo valor vem nas mesmas unidades das variável inicial.

O desvio padrão indica-nos o valor médio que os dados se encontram


distanciados da média.

Por vezes pode tornar-se mais prático utilizar as seguintes fórmulas no


cálculo da variância:
2
 n 
p   xi 
  i 1 
n
ni ( xi  x ) 2
 xi2 
n
s  2 i 1
s 
2 i 1
n 1 n 1
Estatística I 45 Lara N. Ferreira

45
03/10/2022

2. Estatísticas Descritivas
2.6. Medidas de Dispersão

As Medidas de Dispersão
apresentadas anteriormente, Medidas de Dispersão
são expressas na mesma Absolutas
unidade da variável

Quando se comparam 2 ou mais distribuições


deve-se usar Medidas de Dispersão Relativa.

Estatística I 46 Lara N. Ferreira

46
03/10/2022

2. Estatísticas Descritivas
2.6. Medidas de Dispersão

Coeficiente de variação
O coeficiente de variação é uma medida de dispersão relativa, expressa
em percentagem, que relaciona o desvio padrão com a média.

 s 
CV      100
 x 

Observações:
• Se CV = 0%, então não existe dispersão.
• Se CV < 50%, então a dispersão é baixa.
• Se CV  50%, então a dispersão é elevada.

Estatística I 47 Lara N. Ferreira

47
03/10/2022

2. Estatísticas Descritivas
2.6. Medidas de Dispersão
Exemplo 2.11:

Considere os dados: 25 7 22 33 18 15

Sabendo que x  20 , então calcula-se a variância, o desvio padrão e o CV.

Variância:
( 7  20 ) 2  (15  20 ) 2  (18  20 ) 2  ( 22  20 ) 2  ( 25  20 ) 2  (33  20 ) 2
s 
2

5
s2  79,2
Desvio Padrão: Coeficiente de variação:
8,9
s  s2  79,2  8,9 CV   100%  44,5%
20
Estatística I 48 Lara N. Ferreira

48
03/10/2022

2. Estatísticas Descritivas
2.7. Medidas de Assimetria

Indicam-nos a forma como os dados estão distribuídos.

Para se determinar o tipo de simetria duma distribuição podemos


comparar os valores da média com os da mediana:

Assimetrica Se x > Me a distribuição diz-se assimétrica positiva; a


Positiva média é aumentada por valores extremos elevados;

Assimetrica Se x < Me a distribuição diz-se assimétrica negativa; a


Negativa média é reduzida por valores extremos baixos;

Estatística I 49 Lara N. Ferreira

49
03/10/2022

2. Estatísticas Descritivas
2.7. Medidas de Assimetria

Simetrica Se x = Me a distribuição diz-se simétrica; não existem


valores extremos em qualquer direcção.

Estatística I 50 Lara N. Ferreira

50
03/10/2022

2. Estatísticas Descritivas
2.7. Medidas de Assimetria
Existem várias medidas para avaliar o grau de assimetria, sendo uma
delas o coeficiente de assimetria dado por:

m3 1 1 n 3
g  3  3    xi  x   Skewness
S S  n i 1 

Para valores grandes de n (n  50), o primeiro e segundo coeficientes


de assimetria de Pearson constituem uma maneira,
computacionalmente simples, de avaliar o grau de assimetria

x  Mo 3 x  Me 
g1  g1 
S S

Estatística I 51 Lara N. Ferreira

51
03/10/2022

2. Estatísticas Descritivas
2.7. Medidas de Assimetria

Assimetrica
Se g 0
Positiva

Assimetrica
Se g 0
Negativa

Se g 0 Simetrica

Estatística I 52 Lara N. Ferreira

52
03/10/2022

2. Estatísticas Descritivas
2.8. Medidas de Achatamento

Indicam-nos também a forma como os dados estão distribuídos.

Kurtosis
O achatamento mede-se da seguinte forma:
1 n
 xi  x 4

n i 1
g 2  b2  3 onde: b2  2
1 n
2
 n xi  x  
 i 1 

Estatística I 53 Lara N. Ferreira

53
03/10/2022

2. Estatísticas Descritivas
2.8. Medidas de Achatamento
As distribuições classificam-se em:
- leptocúrticas: g2 > 0
- mesocúrticas: g2 = 0
- platicúrticas: g2 < 0

Estatística I 54 Lara N. Ferreira

54
03/10/2022

2. Estatísticas Descritivas
2.9. Outliers
100

75

São observações anormais,

QoL
50
inconsistentes ou aberrantes.

Podem ser severos ou moderados, 25 


consoante o seu afastamento em 



0
relação às observações seja mais ou < 45 45-59 60-74 >74
Age groups
menos pronunciado.

Os outliers moderados são marcados por um círculo no gráfico Box-


and-Whiskers (caixa de bigodes) e os outliers severos são
marcados por uma estrela.
Estatística I 55 Lara N. Ferreira

55
03/10/2022

2. Estatísticas Descritivas
2.9. Outliers
Outliers Moderados:

Q1  3Q3  Q1   xi  Q1  1,5Q3  Q1 

Q3  1,5Q3  Q1   xi  Q3  3Q3  Q1 

Outliers Severos:

xi  Q1  3Q3  Q1 

xi  Q3  3Q3  Q1 

Estatística I 56 Lara N. Ferreira

56
03/10/2022

2. Estatísticas Descritivas
2.9. Outliers
Exemplo 2.12 (continuação de 2.9):

x1 2
x2 3 Outliers moderados:
x3 4

4,25  329,5  4,25  xi  4,25  1,529,5  4,25


x4 5
x5 5
x6 7  71,5  xi  33,6
x7 18
x8 21
x9
x10
22
32
29,5  1,529,5  4,25  xi  29,5  329,5  4,25
x11 41 67,4  xi  105,3
x12 48

Conclusão: Não existem outliers


Q1= 4,25 moderados nem severos
Q2= 12,50
Q3= 29,50

Estatística I 57 Lara N. Ferreira

57
03/10/2022

2. Estatísticas Descritivas
2.10. Diagrama de Caule e Folhas
Os dígitos correspondentes a cada dado dividem-se em caule
("leading digits“) e em folhas ("trailing digits“).
Steam-and-leaf

Os primeiros vão fazer parte do caule e colocam-se em coluna à


esquerda duma linha vertical; os segundos vão constituir as folhas e
colocam-se em linha à direita dessa linha vertical.

 Se um dado tem o valor de 47, o caule é 4 e a folha é 7.


 Para um dado cujo valor seja de 2, o caule é 0 e a folha é 2.
 No caso de o valor de um dado ser de 153, o caule será 15 e a folha 3.

Estatística I 58 Lara N. Ferreira

58
03/10/2022

2. Estatísticas Descritivas
2.10. Diagrama de Caule e Folhas 16
20
10
Exemplo 2.13: 15
32
Considere uma amostra de dimensão 24. Construa o Diagrama 33
44
de Caule e Folhas: 24
2
Diagrama 6
41
de Caule e Folhas 59
55
0 26 60
39
1 001356 13
2 02334457 25
24
3 239 23
23
4 14 10
5 59 11
22
6 0 27

Para o valor 2, o caule é 0 e a folha é 2

Para o valor 39, o caule é 3 e a folha é 9


Estatística I 59 Lara N. Ferreira

59
03/10/2022

2. Estatísticas Descritivas
2.11. Gráfico Caixa de Bigodes
Boxplot
Fornece uma representação gráfica de 5 medidas:

X menor Q 1 Mediana Q 3 X maior

possibilitando estudar a configuração da distribuição (assimetria), quer


através da comparação da posição relativa destas medidas, quer através
do diagrama "Box-and-Whisker“.
É também muito utilizado para comparar conjuntos de dados.

Estatística I 60 Lara N. Ferreira

60
03/10/2022

2. Estatísticas Descritivas
2.11. Gráfico Caixa de Bigodes
Exemplo 2.14:

x1 10
x2 12 Q1 
n  1 15  1
4

4
 4 x 4   Q
1
 13
x3 13
x4 13
x5 14
x6 14 n  1 15  1
Q  Me    8
x7 16 2 2 2
x8
x9
17
17
x 8   Me  Q
2
 17
x10 18
x11 21
x12 21
x13
x14
27
29
Q3 
3 n  1  48
4

4
 12 x 12   Q
3
 21
x15 30

Estatística I 61 Lara N. Ferreira

61
03/10/2022

2. Estatísticas Descritivas
2.11. Gráfico Caixa de Bigodes
X  10 X  30
menor maior

X  10 Q  13 M e  17 Q  21 X  30
menor 1 3 maior

X  10 Q  21 X  30
menor Q  13 M e  17 3 maior
1

Estatística I 62 Lara N. Ferreira

62
03/10/2022

2. Estatísticas Descritivas
2.11. Gráfico Caixa de Bigodes
             Distribuição
D is trib u iç ã o Simétrica
s im é tric a

               Distribuição
D i s t r i b u i ç ã o Assimétrica
a s s s i m é t r i c Positiva
a p o s itiv a

               Distribuição
D i s t r i b u i ç ã o Assimétrica
a s s s i m é t r i c Negativa
a n e g a tiv a

Se a distribuição for simétrica, a linha vertical que representa a mediana, situa-


se no centro da caixa e a caixa está posicionada ao meio da linha a tracejado;

Se a distribuição for assimétrica positiva, a linha vertical dentro da caixa não


está centrada, desloca-se para a esquerda e a caixa também se desloca para a
esquerda ao longo da linha a tracejado;

Se a distribuição é assimétrica negativa, a linha vertical dentro da caixa não está


centrada, desloca-se para a direita e a caixa também se desloca para a direita ao
longo da linha a tracejado.
Estatística I 63 Lara N. Ferreira

63
03/10/2022

2. Estatísticas Descritivas
2.12. Medidas descritivas para uma população

 É praticamente igual ao cálculo das medidas descritivas


apresentadas para uma amostra, gozando das mesmas
propriedades e características.
 As medidas descritivas para a população passam a designar-se por
parâmetros.
 A notação e cálculo difere somente nalguns casos

Estatística I 64 Lara N. Ferreira

64
03/10/2022

2. Estatísticas Descritivas
2.12. Medidas descritivas para uma população
Medidas descritivas para uma população de dimensão N:

N
 xi
Média Aritmética:  x  i 1
N

Me igual ao método apresentado


Mediana:
anteriormente, substituindo n por
N

Moda: Mo igual ao método apresentado


anteriormente

Estatística I 65 Lara N. Ferreira

65
03/10/2022

2. Estatísticas Descritivas
2.12. Medidas descritivas para uma população

Q1; Q2; Q3 igual ao método


Quartis: apresentado anteriormente,
substituindo n por N

IQ igual ao método apresentado


Intervalo Interquartis: anteriormente

Variância:  (x i   x ) 2
i 1
 2x 
N

Estatística I 66 Lara N. Ferreira

66
03/10/2022

2. Estatísticas Descritivas
2.12. Medidas descritivas para uma população

N
Desvio Padrão:  (x i   x ) 2
i 1
x 
N

 
 x 
CV     100
Coeficiente de Variação:  x 

igual ao método apresentado


Assimetria e curtose:
anteriormente, substituindo x por μ x

Estatística I 67 Lara N. Ferreira

67
03/10/2022

2. Estatísticas Descritivas
2.13. Cálculo de medidas descritivas

Excel:
O cálculo de medidas descritivas em Excel pode ser feito através da
utilização das Funções ou através do suplemento de Análise de Dados:

Seleccionar Dados
Seleccionar Análise de Dados
Clicar em Estatística Descritiva e em seguida OK
Introduzir o Intervalo de entrada (quadro de dados)
Indicar se os dados estão em linha ou em coluna: Agrupado por (…)
Escolher o Intervalo de saída (para onde vão os resultados)
Clicar em OK

Estatística I 68 Lara N. Ferreira

68
03/10/2022

2. Estatísticas Descritivas
2.13. Cálculo de medidas descritivas

SPSS:
O cálculo de medidas descritivas, sobretudo para variáveis quantitativas,
pode ser feita em:

Analyze – Descriptive Statistics – Descriptives…

E depois:

1. Seleccionar a variável

2. Escolher opções (medidas descritivas)

3. Clicar em Ok
Estatística I 69 Lara N. Ferreira

69
03/10/2022

2. Estatísticas Descritivas
2.13. Cálculo de medidas descritivas

SPSS:
O cálculo de medidas descritivas e a produção de gráficos, para variáveis
qualitativas e quantitativas, pode ser feita em:

Analyze – Descriptive Statistics – Frequencies…

E depois:

1. Seleccionar a variável

2. Escolher as medidas descritivas em Statistics…

3. Escolher o gráfico adequado em Charts…

4. Clicar em Ok
Estatística I 70 Lara N. Ferreira

70
03/10/2022

2. Estatísticas Descritivas
2.13. Cálculo de medidas descritivas
Exemplo 2.15: Uma empresa de compra e venda de imóveis registou o
preço de venda de todos os imóveis de uma determinada tipologia na mesma
cidade, de forma a fazer recomendações aos seus clientes.

Com os dados disponíveis nos ficheiros em SPSS e em Excel, calcule todas


as medidas descritivas e interprete os resultados.
𝑋 = 173839
𝐴𝑇 = 90927
𝑀𝑒 = 175144 𝑆 = 23120

𝑄1 = 155332 𝐶𝑉 = 13,3%
𝐴𝑠𝑠𝑖𝑚𝑒𝑡𝑟𝑖𝑎 = −0,164
𝑄3 = 193021,5
𝐶𝑢𝑟𝑡𝑜𝑠𝑒 = −0,765
Estatística I 71 Lara N. Ferreira

71
03/10/2022

2. Estatísticas
ESGHT -Descritivas
UAlg

Estatística I
2. Estatísticas Descritivas e
Apresentação de Dados
Dúvidas?
1. Tutorias
2. Lnferrei@ualg.pt
3. Gabinete 40
Estatística I 72 Lara N. Ferreira

72

Você também pode gostar