Você está na página 1de 39

3.

Medidas resumo

0
Medidas resumo (valores de estatísticas)
Caracterizam e descrevem uma amostra. São representadas por letras do alfabeto romano.

 Medidas de localização  estas medidas "localizam" os valores observados.

o Medidas de tendência central: média, moda e mediana


o Medidas de tendência não central: quantis (quartis, decis, percentis)

 Medidas de dispersão  medem o grau de concentração ou dispersão dos valores observados


em torno das medidas de tendência central. Medem o grau de variabilidade.

o Absolutas:
 Distância: amplitude, amplitude interquartis
 Comparação: desvio médio absoluto, variância, desvio padrão
o Relativas: coeficiente de variação

 Medidas de assimetria  forma como os dados se distribuem na horizontal

 Medidas de achatamento ou curtose  forma como os dados se distribuem na vertical

1
Uma "boa" medida (segundo Yale)
1. Ser definida de forma objetiva

2. Depender de todas as observações

3. Ter um significado concreto

4. Ser simples de calcular

5. Ser pouco sensível às flutuações da amostragem.

6. Prestar-se facilmente ao cálculo algébrico.

A escolha das medidas varia consoante o objetivo pretendido, visto as


diferentes medidas possuírem diferentes propriedades.
2
Medidas de tendência central
Fornece a ordem de grandeza da variável estatística, caracterizada pelos valores da variável
situados no centro da distribuição.
1 p p
 Média aritmética: x   ni xi   f i xi (para dados agrupados em classes, xi representa o
n i 1 i 1
ponto médio da i-ésima classe). Satisfaz bem as condições de Yule, embora possa ser
mais sensível que a mediana às flutuações da amostragem, já que é muito sensível a
valores extremos, valores excecionais que se encontram nas extremidades da
distribuição. As suas vantagens principais são ter um significado concreto e prestar-se ao
cálculo algébrico (o parâmetro populacional representa-se pela letra grega 𝜇).
A média pode ser vista como sendo o centro de massa dos valores das observações,
i.e, o ponto de equilíbrio após dispormos as observações sobre uma régua. Pontos
afastados ou erros nas observações podem afastar a média do grosso das observações.

3
 Moda: valor mais frequente da variável estatística. No caso da variável ser contínua,
define-se classe modal como a classe onde a frequência média por unidade de amplitude
é mais elevada. Satisfaz as condições 1, 3 e 4 de Yule. Presta-se mal ao cálculo algébrico
e é mais sensível do que a mediana às flutuações da amostragem. A existência de mais
do que uma moda (máximos locais da curva de frequência) indicam, geralmente, que a
população observada é heterogénea (bimodal, multimodal).

No caso de variáveis agrupadas recorre-se ao histograma para estimar o valor da moda no


h3  h2 b  Mo
interior do intervalo modal: 
h3  h1 Mo  a

4
Métodos alternativos para estimar a moda:

5
 Mediana: valor que divide o conjunto de dados, ordenados por ordem crescente, em duas
partes iguais. Satisfaz as condições 1, 3, 4 e 5 de Yule. Visto não ser sensível a valores
extremos é adequada quando os dados são assimétricos. O seu maior defeito é prestar-se
mal ao cálculo algébrico.

Cálculo da mediana no caso de uma variável discreta:


𝑛+1
Se n for ímpar, a mediana será o elemento central de ordem
2
𝑛 𝑛+2
Se n for par, a mediana será a média entre os elementos centrais de ordem e
2 2

x~  x ( k ) n 1
Se n ímpar, , sendo k 
2
x ( k )  x ( k  1) n
Se n par, x~  , sendo k 
2 2

6
No caso de variáveis agrupadas recorre-se à curva de frequências acumuladas para
F b   F a  ba
estimar o valor da mediana no interior do intervalo mediano: 
0.5  F a  Med  a

7
Medidas de ordem

 Mediana
Divide ao meio a série ordenada

 Quartis Designam-se
Dividem em quatro a série ordenada
genericamente por
 Decis
Dividem em dez a série ordenada quantis
 Percentis
Dividem em cem a série ordenada

8
 Quantil de ordem 𝛼, 0    1 ( q ): tem como caso particular a mediana ( q1 2 ). Para
variáveis contínuas trata-se do valor da variável estatística para a qual se tem F q    .
Quando o conjunto de dados ordenados é dividido em 4 partes iguais, os pontos de
divisão são chamados de quartis. Podemos ainda calcular os decis, percentis.
Exemplo: quantil 0.5 = 2º quartil = percentil 50 = mediana

Exemplo: 5% dos recém-nascidos têm um peso demasiado baixo. Um peso será


demasiado baixo se for inferior ao percentil 5 (quantil 0.5).
Exemplo: 80% dos indivíduos têm um valor normal de um determinado componente
sanguíneo. Valores demasiado baixos ou demasiado elevados são patológicos. Suponha
que a percentagem de indivíduos com valores demasiado baixos é igual à percentagem
de indivíduos com valores demasiado altos. Os indivíduos normais terão valores entre o
percentil 10 e o percentil 90.
9
Estimação do quantil de ordem p para variáveis discretas:


 X  np 1, se np não é inteiro

Qp  
1
 
 X  np   X  np 1 , se np é inteiro
2

sendo [𝑛𝑝] o maior inteiro inferior ou igual a np.

p
1 p
 Média geométrica: G   xini
n
ou log G   ni log xi
i 1 n i 1

n
 Média harmónica: H  p
1
 ni xi
i 1

10
Medidas de dispersão
 Amplitude ( x ): é a diferença entre o maior e o menor dos valores observados. As suas
vantagens são ter um significado simples e ser de cálculo extremamente rápido. Muito
sensível a valores extremos. É uma medida de dispersão muito imperfeita.

 Distancia interquartis ( q3 4  q1 4 ): O intervalo interquartis q3 4 , q1 4  compreende 50% das


observações centrais. As suas vantagens são ter um significado simples e ser simples de
calcular. Elimina as observações mais extremas. É uma medida robusta de dispersão mas
ainda muito imperfeita.

11
1 p
 Desvio médio absoluto: d x   ni xi  x . Satisfaz bem as 3 primeiras condições de
n i 1
Yule. A sua principal desvantagem é prestar-se mal ao cálculo algébrico.

1 p
 Variância ( s x2 ): s x2   ni  xi  x 2 . As unidades da variância são o quadrado das unidades
n i 1
da variável o que torna a sua interpretação difícil. Por isso recorre-se à sua raiz quadrada
a que se dá o nome de desvio padrão ( s x ): s x  s x2 (o parâmetro populacional representa-
se pela letra grega 𝜎). Tal como a média, o desvio padrão satisfaz bem as condições de
Yule. Sendo uma média quadrática, não tem um significado muito concreto
isoladamente, ainda que seja exprimido nas mesmas unidades que a variável estatística.
O seu significado torna-se mais claro quando se comparam duas distribuições. A sua
maior vantagem é prestar-se ao cálculo algébrico (o parâmetro populacional representa-
se pela letra grega 𝜎 2 ).
Cálculo prático da variância: s x2  x 2  x 2 .
12
sx
 Coeficiente de dispersão (de variação se em percentagem): cv  . Trata-se duma
x
medida de dispersão relativa representada frequentemente em percentagem. Mede a
homogeneidade da distribuição. Como não tem dimensão permite a comparação de
dispersões de duas ou mais distribuições em que as unidades da variável estatística são
diferentes ou em que a ordem de grandeza das médias são distintas. Somente se emprega
quando a variável toma valores de um só sinal.
Exemplo: para uma média de 50 e desvio padrão de 10, tem-se um coeficiente de variação
de 20%.

Nota: Existem diferentes causas para a variabilidade dos dados. No planeamento duma
experiência pretende-se eliminar toda a variabilidade que não esteja relacionada com o
objetivo da mesma.

13
Parâmetros versus Estatísticas

 Parâmetros de uma população: descrição numérica de uma característica


populacional, valor numérico fixo que caracteriza uma população (na
abordagem bayesiana os parâmetros são variáveis). Exemplo: altura média
da população portuguesa.

 Estatísticas: descrição numérica de uma característica amostral, valor


numérico variável de amostra para amostra. Se uma estatística é utilizada
para aproximar um valor de um parâmetro populacional é designada por
estimador. Ao valor tomado para uma determinada amostra dá-se o nome
de estimativa.

14
 Parâmetro (população)

x Estatística (amostra)

15
16
Medidas de Forma
Por vezes, o padrão global de um grande número de observações é tão
regular que podemos descrevê-lo por uma curva suave, simétrica, em
forma de sino, denominada distribuição normal ou de Laplace-Gauss
300

200

100

0
1,19 1,31 1,44 1,56 1,69 1,81 1,94 2,06 2,19
1,25 1,38 1,50 1,63 1,75 1,88 2,00 2,13

Altura do aluno

17
18
Esta distribuição é caracterizada pelos parâmetros média  e variância  2 (ou
desvio-padrão  )

19
 Aos intervalos    ,     ,   2 ,   2  e   3 ,   3  correspondem
respetivamente a 68.27%, 95.45% e 99.73% da área total sob a curva de Gauss:

P    X       0.6827
P  2  X    2   0.9545 Regra 70-95-100
P  3  X    3   0.9973

20
 Uma variável aleatória contínua X diz-se que tem distribuição normal, se X é o resultado
de um grande número de causas independentes de efeitos aditivos, tendo cada uma
destas causas um efeito negligenciável quando comparado com o efeito global. É
também utilizada como aproximação de outras distribuições.

 É uma distribuição especialmente importante quer por abranger um grande número de


variáveis que segue esta distribuição, quer por que muitas variáveis são passíveis de
serem aproximadas a esta distribuição, quer por que certas estatísticas e estimadores
segue esta distribuição. É muito utilizada nos processos de amostragem e inferência
estatística.

21
Propriedades da curva normal ou de Gauss

 O gráfico da função densidade de probabilidade é uma curva em forma de sino unimodal,


denominada curva de Gauss ou curva normal.

 A curva de Gauss é simétrica e unimodal, donde a média, a moda e a mediana terem


valores idênticos e os momentos centrais de ordem ímpar serem nulos.

 Os coeficientes de assimetria e achatamento  1 e  2 são nulos (simétrica e mesocúrtica).

 A reta y  0 é uma assimptota horizontal. A curva de Gauss tem dois pontos de inflexão
de abcissas    e    .

22
Comparação gráfica:

 Distribuições normais com desvios padrões iguais mas com médias diferentes (média
como fator de translação):

 Distribuições normais com médias iguais mas com desvios padrões diferentes (desvio
padrão como fator de escala):

23
 Distribuições normais com médias e desvios padrões diferentes:

24
Assimetria
 Posição relativa da moda, mediana e média

Distribuições simétricas unimodais 


𝑀𝑜 = 𝑀𝑒𝑑 = 𝜇.

Para distribuições assimétricas estendidas para a


esquerda (distribuição assimétrica negativa),
tem-se geralmente 𝑀𝑜 > 𝑀𝑒𝑑 > 𝜇.

Para distribuições assimétricas estendidas para a


direita (distribuição assimétrica positiva), tem-
se geralmente 𝑀𝑜 < 𝑀𝑒𝑑 < 𝜇.

25
 Diferenças entre os quartis. Distribuições simétricas  q0.75  Med  Med  q0.25

𝜇−𝑀𝑜
 Coeficiente de assimetria de Pearson:
𝜎

 Coeficiente de assimetria baseado em momentos 𝛾1

o Distribuições simétricas  𝛾1 = 0.

o Distribuições assimétricas, estendidas para a direita (distribuição assimétrica positiva) 


𝛾1 > 0.

o Distribuições assimétricas, estendidas para a esquerda (distribuição assimétrica negativa) 


𝛾1 < 0.

26
Achatamento ou curtose

Grau de achatamento de uma distribuição considerado sempre em


relação ao da distribuição normal

27
Coeficientes de achatamento

 Coeficiente de curtose

𝑸𝟏 = 𝟏º 𝒒𝒖𝒂𝒓𝒕𝒊𝒍
𝑸𝟑 −𝑸𝟏 𝑸𝟑 = 𝟑º 𝒒𝒖𝒂𝒓𝒕𝒊𝒍
𝑲= {
𝟐(𝑷𝟗𝟎 −𝑷𝟏𝟎 ) 𝑷𝟏𝟎 = 𝟏𝟎º 𝒑𝒆𝒓𝒄𝒆𝒏𝒕𝒊𝒍
𝑷𝟗𝟎 = 𝟗𝟎º 𝒑𝒆𝒓𝒄𝒆𝒏𝒕𝒊𝒍

𝑲 = 𝟎. 𝟐𝟔𝟑 → distribuição mesocúrtica


Atenção: Estamos a
𝑲 > 𝟎. 𝟐𝟔𝟑 → distribuição platicúrtica comparar com a
𝑲 < 𝟎. 𝟐𝟔𝟑 → distribuição leptocúrtica distribuição normal

28
 Coeficiente de curtose baseado em momentos 𝛾2

𝛾2 = 0 → distribuição mesocúrtica Atenção: Desigualdades


𝛾2 > 0 → distribuição leptocúrtica
invertidas em relação
𝛾2 < 0 → distribuição platicúrtica
ao coeficiente anterior

29
Outliers
 São observações anormais relativamente às restantes, pouco frequentes. Podem resultar de erros
na introdução dos dados.

 Não há regras fixas para os identificar. Depende do investigador a decisão de os incluir ou não na
análise. Só deverão ser excluídos se o investigador considerar que não são membros válidos da
população.

 Como referência, os outliers classificam-se de acordo com o seu afastamento em relação às


restantes observações (amplitude interquartis  ( q3 4  q1 4 )).

o Valores normais situam-se no intervalo:


 
q1 4  1.5  q3 4  q1 4 , q3 4  1.5  q3 4  q1 4 

o Outliers moderados situam-se no intervalo:


  
q1 4  3  q3 4  q1 4 , q1 4  1.5  q3 4  q1 4   q3 4  1.5  q3 4  q1 4 , q3 4  3  q3 4  q1 4  
o Outliers severos situam-se no intervalo:
  
  , q1 4  3  q3 4  q1 4   q3 4  3  q3 4  q1 4 ,   
30
Caixa de bigodes (Boxplot)
Existem diversas variações para este tipo de diagrama.

 Permite apresentar graficamente os dados através de 5 medidas: o valor mínimo, o 1º quartil, a


mediana, o 3º quartil e o valor máximo.
 A caixa (representa o intervalo interquartis) contém 50% das observações centrais.
 A mediana está assinalada no interior da caixa.
 A posição da mediana no interior da caixa e o comprimento dos bigodes dão indicações sobre a
simetria da distribuição.
 Os bigodes estendem-se até os valores mínimo e máximo dos dados.
 Nos boxplots com representação de outliers os valores mínimo e máximo têm como limite um
máximo de 1.5 vezes a amplitude da caixa (a amplitude interquartis) a contar a partir do 1º e 3º
quatis respetivamente, servindo para indicar a possível presença de outliers.
 Permite visualizar a localização e dispersão de uma variável de uma forma rápida.
 A representação destes gráficos segundo os valores de uma segunda variável discreta, permite
realçar de uma forma eficaz as principais diferenças entre os grupos.
 O boxplot não permite a visualização de clusters (contrariamente aos histogramas).

31
Sem representação de outliers:

Com representação de outliers:

32
Caixas de bigodes paralelos (forma de representar a distribuição duma variável contínua segundo
uma variável categórica, discreta ou contínua agrupada em classes)

50
47

40
36

30
Score

20

10

1 2
Anxiety

33
A dispersão em distribuições normais
 A distribuição normal é uma distribuição simétrica que fica totalmente caracterizada pela sua
média e desvio padrão. Aproximadamente 68% dos valores centrais estão a uma distância da
média de um desvio padrão. Aproximadamente 95% dos valores centrais estão a uma distância
da média de dois desvios padrões.
 Relação entre desvio padrão, amplitude interquartis e outliers em dados aproximadamente
normais:

34
Simetria e boxplots
Assimétrica negativa Simétrica Assimétrica positiva
Neste exemplo  x  s, x  s  Neste exemplo  x  s, x  s  Neste exemplo  x  s, x  s 
contém 78% das observações. contém 66% das observações. contém 78% das observações.

35
Curtose e boxplots

Platicúrtica. Neste exemplo  x  s, x  s  contém 57% das observações.

36
Mesocúrtica. Neste exemplo  x  s, x  s  contém 68% das observações.

37
Leptocúrtica. Neste exemplo  x  s, x  s  contém 82% das observações.

38

Você também pode gostar