Você está na página 1de 20

2.4.

Medidas de localização

Recapitulando:
Parâmetro [população]: qualquer característica da população que seja mensurável.
Exemplo: percentagem de votantes de um determinado partido no total de
portugueses em idade de votar.
Estatística [amostra]: número que resulta da aplicação de procedimentos específicos aos dados
originais. Normalmente é calculada a partir de uma amostra, sendo utilizada como
base para estimar os parâmetros da população.
Exemplo: Uma amostra de eleitores portugueses pode ser utilizada para estimar a
percentagem de votantes num determinado partido.

Medidas de tendência ou localização central: “Qual é a observação “típica”?”


Medidas de dispersão: “Todos têm aproximadamente o mesmo rendimento ou há uma
grande variabilidade nos rendimentos?”

Dispersão Dispersão

Tendência central Tendência central

Acetatos de apoio a EACP | LCP + LRI |2023/2024 40


Média aritmética

a) Dados desagregados:
– O parâmetro da população representa-se por  [média da população]:

x1 + x2 + ... + x N 1 N
=
N
=
N
x
i =1
i

onde:
xi = valores observados na população
N = dimensão da população
– A estatística referente à amostra representa-se por x [média de uma amostra da
população]:

x1 + x2 + ... + xn 1 n
x= =  xi
n n i =1
onde:
xi = valores observados na amostra
n = dimensão da amostra

Exemplo de cálculo da média aritmética com dados não agregados: Livraria vende cinco
manuais de Ciência Política aos seguintes preços.
Manual Preço [euros] - xi
A 50
B 20
C 25
D 30
E 10

O preço médio de um manual é de €27:

50 + 20 + 25 + 30 + 10
x= = 27
5
Este preço médio é apenas a média dos cinco preços anunciados.

Acetatos de apoio a EACP | LCP + LRI |2023/2024 41


b) Dados agregados simples

Exemplo: Livraria vende cinco manuais de Ciência Política aos preços e quantidades que
se seguem (quantidades vendidas num dado mês):
Manual Preço [euros] - xi Quantidades [unidades] - ni
A 50 2
B 20 5
C 25 3
D 30 4
E 10 6

O preço médio é €22,75:

50  2 + 20  5 + 25  3 + 30  4 + 10  6
x= ou
2 + 5 + 3 + 4 + 6 = 20
= 50  0.1 + 20  0.25 + 25  0.15 + 30  0.2 + 10  0.3
= 22.75
Nota: este preço médio diz respeito ao que foi efetivamente vendido nesse mês.

Formalmente,
1 n 1 k k
x =  xi =  xi ni =  xi f i
n i =1 n i =1 i =1
Nota:
1 k x1n1 + x2 n2 + ... + xk nk x1n1 x2 n2 xk nk
ii
n i=1
x n =
n
=
n
+
n
+ ... +
n
k
= x1 f1 + x2 f 2 + x3 f 3 + ... + xk f k =  xi f i
i =1

ni
onde:
fi =
n
k = número de observações distintas ou categorias da variável

Acetatos de apoio a EACP | LCP + LRI |2023/2024 42


Exemplo de cálculo de média de dados qualitativos relativos a uma variável categórica
em escala ordinal:

A pergunta original no questionário era: “E em que medida diria que está interessado
pelo que se passa a nível da política local, nacional, europeia e internacional: 4 muito, 3
bastante, 2 pouco ou 1 nada?”

Fonte: Magalhães e Moral, 2008, Os jovens e a Política


http://www.presidencia.pt/archive/doc/Os_jovens_e_a_politica.pdf

Propriedades matemáticas (considere que c é uma constante):


n

1. Dados desagregados:  (x
i =1
i − x) = 0

2. Dados agregados:  f (x − x ) = 0
i =1
i i

3. media ( x1 , x2 ,..., xn ) = x  media ( x1 + c, x2 + c,..., xn + c ) = x + c

4. media ( x1 , x2 ,..., xn ) = x  media ( cx1 , cx2 ,..., cxn ) = cx

5. media ( x1 , x2 ,..., xn ) = x e media ( y1 , y2 ,..., yn ) = y

 media ( x1 + y1 , x2 + y2 ,..., xn + yn ) = x + y

Acetatos de apoio a EACP | LCP + LRI |2023/2024 43


A média aritmética é muito influenciada por valores extremos da variável (outliers) como
se vê nos exemplos seguintes.

Exemplo 1: média de salários mensais.

Coleção 1: € 1000 800 700 1200 1000


4700 / 5 = 940

Coleção 2: € 1000 800 700 1200 6000


9700 / 5 = 1940

Exemplo 2:

Conceito de Média “ponderada”:

 x *w i i
xw = i

w i
i

– wi são os ponderadores.
– A média aritmética simples é também uma média ponderada, onde implicitamente
se assume wi = 1.

Exemplo: classificações
Disciplina Nota
A 10
B 13
C 12
D 15
E 12
F 12

Acetatos de apoio a EACP | LCP + LRI |2023/2024 44


10 + 13 + 12 + 15 + 12 + 12
Média aritmética = = 12.33
6
Disciplina Nota [xi] Unidades de xi wi
crédito
[wi]
A 10 3 30
B 13 4 52
C 12 2 24
D 15 3 45
E 12 3 36
F 12 3 36
Total 18 223
10  3 + 13  4 + 12  2 + 15  3 + 12  3 + 12  3
Média “ponderada” = = 12.39
18

c) Dados agregados em [k] classes:

Exemplo: Alturas dos alunos de Estatística:


Alturas [m] Centro da classe [ci] Frequência absoluta [ni]
]1.50, 1.60] 1.55 12
]1.60, 1.70] 1.65 18
]1.70, 1.80] 1.75 22
]1.80, 1.90] 1.85 14
]1.90, 2.00] 1.95 4
n 70

c n i i k
ni k
x= i =1
=  ci =  ci f i
n i =1 n i =1
onde:
k = número de classes
LimiteSuperior + LimiteInferior
ci = centro da classe: ci =
2
(limite inferior e superior da classe)
k

Nota:  f (c − x ) = 0
i =1
i i

Acetatos de apoio a EACP | LCP + LRI |2023/2024 45


Nota: nestes casos trata-se de um valor aproximado da verdadeira média [obtida
através dos dados não agrupados]. O erro cometido chama-se Erro de tabulagem ou
erro de agrupamento.

A altura média é de 1m e 72cm:


k
ni
x =  ci
i =1 n
12 18 22 14 4
= 1.55  + 1.65  + 1.75  + 1.85  + 1.95  =
70 70 70 70 70
1.55 12 + 1.65 18 + 1.75  22 + 1.85 14 + 1.95  4 120.5
= = = 1.72
70 70

Acetatos de apoio a EACP | LCP + LRI |2023/2024 46


Mediana

– Valor central da distribuição.


– Valor que divide a distribuição [depois de ordenada] ao meio, isto é, se as
observações estiverem ordenadas de forma crescente [ou decrescente], a mediana
separa a metade das observações que está abaixo e a metade que está acima da
mediana.
– O valor da mediana não é influenciado pelos valores das extremidades da série,
sendo útil na análise de distribuições assimétricas, como seja a distribuição do
rendimento.

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

Mediana=3 Mediana=3

a) Dados desagregados ou agrupados simples


Número de observações é ímpar:

Mediana = xk +1 se n = 2k+1

Número de observações é par:

xk + xk +1
Mediana = se n = 2k
2

Exemplo com dados desagregados:


Notas de 5 alunos de Estatística: 10 11 12 13 15
→ mediana é 12
Notas de 6 alunos de Estatística: 10 12 13 14 15 15
→ mediana é (13+14)/2=13.5

Acetatos de apoio a EACP | LCP + LRI |2023/2024 47


Exemplo com dados agrupados: Notas de Estatística

Frequências
Frequência Frequência Freq. Relativa
Notas (Xi) absoluta
absoluta relativa acumulada
acumulada
10 2 2 0.04 0.04
11 5 7 0.1 0.14
12 8 15 0.16 0.3
13 15 30 0.3 0.6 ""nota 13" acumula 50% das notas"
14 5 35 0.1 0.7
15 15 50 0.3 1
Total 50 1

Observações não agrupadas a que correspondem estes dados?

10 10 11 11 11 11 11 12 ... 12 13 ... 13 14 ... 14 15 ... 15


n
2 observ 5 observações 8 observ 15 observ 5 observ 15 observ = 50

mediana corresponde ao valor entre a 25ª e 26ª observação

b) Dados agrupados por classes

Nota: nos dados agrupados em classes, nesta UC, vamos apenas identificar a classe
mediana, ou seja a classe onde se localiza a mediana [existem fórmulas para calcular
de forma aproximada o valor da mediana].

Exemplo com dados em classes


Frequências
Frequência Frequência Freq. Relativa
Salário (Xi) absoluta
absoluta relativa acumulada
acumulada
[500 , 750] 40 40 0.4 0.4
]750 , 1000] 25 65 0.25 0.65
]1000 , 1500] 12 77 0.12 0.77
]1500 , 2000] 23 100 0.23 1
Total 100 1

Acetatos de apoio a EACP | LCP + LRI |2023/2024 48


Moda
– O valor mais comum, mais frequente, valor típico.
– Problemas:
1. Nem sempre se pode determinar:
a. Quando existe mais do que um valor da variável com a mesma frequência (dizemos que
não há uma moda nesse caso).
b. Podemos não encontrar valores da varável que ocorram mais do que uma vez.

2. É um valor instável, podendo mudar radicalmente com a forma como os


dados são arredondados;
3. A moda pode ser um valor extremo, sendo nesta situação dificilmente
considerado uma medida de tendência central.

– nos dados agrupados em classes, nesta UC vamos apenas identificar a classe

modal, ou seja a classe com maior frequência absoluta mediana [existem


fórmulas para calcular de forma aproximada o valor da moda].

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6

Moda = 9 Não tem moda

− A moda é o valor que ocorre mais frequentemente.

Aplicação: Número de irmãos dos alunos de RI


Número de irmãos # alunos
0 3
1 8
2 5
3 3
4 1

a) Determine a moda.
b) Calcule a média e a mediana do número de irmãos.
c) Assumindo que nenhum dos alunos tem irmãos que também frequentam a
mesma turma, qual o número médio de filhos por família?

Acetatos de apoio a EACP | LCP + LRI |2023/2024 49


Relação entre as medidas de tendência/ localização central
Depende do nível de simetria da distribuição
Histograma simétrico

Moda = Média = Mediana

Histograma assimétrico à direita ou assimetria positiva Mediana à esquerda da Média

em inglês "positively skewed"


(dados da cauda da distribuição
estendem-se para a direita, para
o lado dos valores positivos)
Moda Mediana Média

Histograma assimétrico à esquerda ou assimetria negativa Mediana à direita da Média

em inglês "negatively skewed"


(dados da cauda da distribuição
estendem-se para a esquerda,
para o lado dos valores
negativos)
Média Moda

Mediana

Acetatos de apoio a EACP | LCP + LRI |2023/2024 50


(a) Distribuição simétrica: média = mediana

(b) e (c) Distribuição assimétrica:


Numa distribuição assimétrica, tipicamente a mediana é afastada da moda na direção
da cauda mais longa da distribuição. A média é afastada na mesma direção, mas para
um ponto mais distante.
Assimetria positiva [ou à direita]: a “cauda” mais longa da representação estende-
se para a direita. Neste caso: mediana < média
Assimetria negativa [ou à esquerda]: média < mediana

Exemplos com médias, modas e medianas

Exemplo 1: média, mediana, moda


Idades no Grupo A: 11, 12, 13, 13, 14, 15
Idades no Grupo B: 11, 12, 13, 13, 14, 27
A: média = 13.0 B: média = 15.0
mediana = 13 mediana = 13
moda = 13 moda = 13

Logo, a média é a medida afetada neste caso.

Exemplo 2: Dados categóricos

Um estudo pretende avaliar o efeito de um medicamento novo no crescimento de um


tumor. O medicamento novo (A) é ministrado a um grupo de doentes, enquanto que o
medicamento antigo (B) é aplicado noutro grupo de doentes. No final do tratamento o
tamanho do tumor é medido em todos os indivíduos.
Tamanho do tumor: 1 = pequeno 2 = médio 3 = grande
Grupo A: 1, 1, 2, 2, 2, 2, 2, 3
Grupo B: 1, 2, 2, 3, 3, 3, 3, 3

Acetatos de apoio a EACP | LCP + LRI |2023/2024 51


Média = Podemos calcular obtendo média para A = 1.87 e B= 2.5, mas temos que
pensar bem no que isso quer dizer efetivamente?
Mediana: A=2
B=3
Moda: A=2
B=3

Exemplo 3: (informação que cada indicador dá)

5 casas numa colina perto da praia

$2,000 K
Preços das casas:

$2,000,000
500,000 $500 K
300,000 $300 K
100,000
100,000

$100 K

$100 K

Preços casas:
◼ Média: ($3,000,000/5)
= $600,000
$2,000,000
500,000
◼ Mediana: Valor do meio de dados ordenados
300,000
= $300,000
100,000
100,000
◼ Moda: Valor mais frequente
Soma 3,000,000
= $100,000

Acetatos de apoio a EACP | LCP + LRI |2023/2024 52


Fonte: Chaves et al (2000), p. 207

Nota: reparem que neste manual, na Média é indicado que se aplica a dados
quantitativos apenas, mas na prática aplica-se também a dados qualitativos ordinais –
com os devidos cuidados na interpretação.

Aplicação: Desigualdade na distribuição do rendimento e risco de pobreza em Portugal


Fonte: INE (2019) Rendimento e condições de vida
https://www.ine.pt/ngt_server/attachfileu.jsp?look_parentBoui=406634754&att_display=n&att_download=y

➢ Linha ou limiar de pobreza: limiar do rendimento abaixo do qual se considera


que uma família se encontra em risco de pobreza. Este valor foi convencionado
pela Comissão Europeia como sendo o correspondente a 60% da mediana do
rendimento por adulto equivalente* de cada país.

➢ Genericamente, Taxa de risco de pobreza: proporção da população cujo


rendimento equivalente, após transferências sociais, se encontra abaixo da linha
de pobreza. Em 2013 19.5% da população e em 2018 17.2%.

➢ À data do relatório (2018), a taxa de risco de pobreza corresponde à proporção


de habitantes com rendimentos anuais por adulto equivalente inferiores a “6 014

Acetatos de apoio a EACP | LCP + LRI |2023/2024 53


euros anuais (501 euros por mês, mais 34 euros que no ano anterior)” [nota: em
2013 era <4937 em 2013 (cerca de <411 por mês).]

Este limiar, ou linha de pobreza relativa, corresponde a 60% da mediana da


distribuição dos rendimentos monetários líquidos equivalentes.

Medidas de localização não central: quantis

Quantis: Dividem a distribuição de frequências em partes iguais.

Qp (quantil de ordem p) – é um valor tal que divide a amostra em duas partes, tal que
100% x p elementos da amostra estão abaixo de Qp inclusive (são ≤ Qp), e os restantes
100% (1-p) são de pelo menos Qp.
Podem ser:
Quartis: dividem a distribuição de frequências em 4 partes iguais.
Quintis: dividem a distribuição de frequências em 5 partes iguais.
Decis: dividem a distribuição de frequências em 10 partes iguais.
Percentis: dividem a distribuição de frequências em 100 partes iguais.

Nota: Percentil de ordem p (p vai de 1 a 100) – é o mesmo que um quantil mas a


proporção é dada em percentagem.

Acetatos de apoio a EACP | LCP + LRI |2023/2024 54


Ex.: Percentil70: 70% das observações correspondem a esse valor ou menos.

70%
30%

P70

Quartis: São os valores que dividem a distribuição dos dados, depois de ordenados, em
4 partes iguais, correspondendo a 25%, 50% e 75% da distribuição.
Assim,
Q1: 1º Quartil (Q0.25 ou p25)– É o valor da variável tal que 25% das observações
têm um valor até Q1.
Q2: 2º Quartil (Q0.50 ou p50)– É o valor da variável tal que metade das observações
apresentam valores até Q2 (é a mediana).
Q3: 3º Quartil (Q0.75 ou p75)– É o valor da variável tal que o número de 75% das
observações têm um valor até Q3.

25% 25% 25% 25%

Mínimo Q1 Q2 Q3 Máximo

Mediana
Percentil 25 Percentil 50 Percentil 75

Amplitude ou intervalo inter-quartil: diferença entre o valor do 3º e o valor do 1º


quartil:

Q3 − Q1 .
No intervalo que vai de Q1 a Q3 encontram-se 50% das observações (as mais centrais).
A amplitude inter-quartil será tanto maior quanto maior variabilidade se verificar entre
os dados.

Acetatos de apoio a EACP | LCP + LRI |2023/2024 55


Quartil empírico de ordem p (0 < p < 1): Fórmula genérica:

 x(np +1) , np não inteiro



Q p =  x(np ) + x(np +1)
 , np inteiro
 2
onde [np] representa a parte inteira de np.

Determinar os três quartis em termos da observação a que correspondem:


Exemplo 1: n=9 (np é não inteiro para p=0.25, 0.5, 0.75))

Q0.25 Q0.5 Q0.75 Q1 4 = x(2.5+


Observação nº 1 2 3 4 5 6 7 8 9

x(5) + x(
p= 0.25 --> np= 9x0.25=2.25 --> [np]=2 --> [np]+1=3 --> Q 0.25 = valor da 3ª observação da variável
Q2 4 =
p= 0.5 --> np= 9x0.5=4.5 --> [np]=4 --> [np]+1=5 --> Q 0.5 = valor da 5ª observação da variável 2
p= 0.75 --> np= 9x0.75=6.75 --> [np]=6 --> [np]+1=7 --> Q 0.75 = valor da 7ª observação da variável

Q3 4 = x(7.5+1
Exemplo 2: n=10 (np é não inteiro para p=0.25 e 0.75)

Q0.25 Q0.5 Q0.75

Observação nº 1 2 3 4 5 6 7 8 9 10

p= 0.25 --> np=10x0.25=2.5 --> [np]= 2 --> [np] + 1 = 3 --> Q 0.25 = valor da 3ª observação da variável
p= 0.5 --> Q 0.5 = (X5 + X6 )/2 --> Q0.5 = média entre a 5ª e 6ª observação da variável
p= 0.75 --> np= 10x0.75=7.5 --> [np]=7 --> [np]+1=8 --> Q 0.75 = valor da 8ª observação da variável

Nota: Neste caso, o método de cálculo de quartis é o mesmo que foi usado para calcular a mediana. No
entanto, convém notar que este é apenas um de vários métodos possíveis de cálculo de quantis em geral
e quartis especificamente (com fórmulas diferentes e resultados diferentes). Reparem na diferença de
resultados reportados por dois softwares estatísticos:

Acetatos de apoio a EACP | LCP + LRI |2023/2024 56


Exemplo 1:

Observação nº 1 2 3 4 5 6 7 8 9
Valor observado 10 15 20 25 30 35 40 45 50

Cálculo em Excel Cálculo em SPSS


Analyze -- descriptive statistics - frequencies -- escolher a variável -- statistics
(escolher quartiles, median, minimum e maximum)

Legenda p Qp Statistics
Min 0 10 * VAR00002
Q0.25 1 20 N Valid 9
Q0.5 = mediana 2 30 Missing 0
Q0.75 3 40 Median 30.0000
Max 4 50 * Minimum 10.00
Mediana 30 * Maximum 50.00
Percentile 25 17.5000
Nota: comando de Q 0.25 é: +QUARTILE($B$9:$J$9;B62) s 50 30.0000
Comando da mediana: +MEDIAN(B54:J54) 75 42.5000
* valores apenas para confirmar se não há erros

Exemplo:
Registou-se a taxa de aprovação dos 10 últimos presidentes do País Inventado na altura
da tomada de posse.

#1. Arranjar os dados por ordem crescente


1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª
68.86 68.97 72.25 74.55 76.85 76.86 79.87 80.9 86.91 88.06

Nota: Média: 77.408


#2. Determinar o 1.º Quartil

 x(np +1) , np não inteiro



Q p =  x(np ) + x(np +1)
 , np inteiro
 2
1 1
p=  np = 10  = 2.5 não é inteiro.
4 4
Então,

Q1 4 = x(2.5+1) = x( 2+1) = x(3) = 72.25

Acetatos de apoio a EACP | LCP + LRI |2023/2024 57


[3º valor da amostra ordenada]
Interpretação: 25% dos presidentes apresentam uma taxa de aprovação até 72.25%.

#3. Determinar o 2.º Quartil (Mediana)

2 2
p=  np = 10  = 5 é inteiro.*
4 4
Então,

x( 5) + x( 6)
Q2 4 = = 76.855 [média do 5º e 6º valores da amostra ordenada]
2
Interpretação: 50% dos presidentes apresentam uma taxa de aprovação até 76.855%.

xk + xk +1
*Nota: n é par: n = 2k  10 = 2k  k = 5, logo Mediana =
2

#4. Determinar o 3.º Quartil


3 3
p=  np = 10  = 7.5 não é inteiro.
4 4
Então,

Q3 4 = x(7.5+1) = x( 7 +1) = x(8) = 80.90 [8º valor observado na amostra


ordenada]
Interpretação: 75% dos presidentes apresentam uma taxa de aprovação até 80.90%.

Aplicação: percentis de peso e comprimento das meninas do nascimento aos 36 meses.

Diagrama do tipo caixa (caixas de bigodes)


– Em inglês, “box plot” ou “box-and-whisker plot”.
– Representa graficamente a mediana, o primeiro quartil, o terceiro quartil, e os
valores máximo e mínimo dos dados.

Acetatos de apoio a EACP | LCP + LRI |2023/2024 58


Valor 1.º Quartil Mediana 3.º Quartil Valor
Mínimo Máximo
– Dão informação sobre:
o A localização central: mediana.
o Outras localizações: 1º e 3º quartis e mínimo e máximo.
o Dispersão: amplitude e distância inter-quartil.
o Assimetria: posição relativa da mediana na caixa, comprimento dos
“bigodes”:

Assimetria positiva Simetria Assimetria negativa

Acetatos de apoio a EACP | LCP + LRI |2023/2024 59

Você também pode gostar