Você está na página 1de 41

MEDIDAS DE LOCALIZAÇÃO

Organização e tratamento de dados

Medidas de localização
Moda
• Para dados não agrupados, a moda é o valor da variável a que
corresponde maior frequência.

• Uma distribuição pode ter mais do que uma moda. Isto


acontece quando há dois ou mais valores que têm a maior
frequência (distribuição bimodal; distribuição multimodal ou
plurimodal).

• Uma distribuição pode não ter moda (distribuição amodal).

• Se os dados estão agrupados, com a mesma amplitude, a


classe com maior frequência diz-se classe modal e o seu valor
central é o valor modal.

• O valor modal dá-nos um valor aproximado da moda.


Organização e tratamento de dados

Medidas de localização
Moda
• É possível obter a localização aproximada, por via gráfica,
da moda na classe modal. A partir do histograma das
frequências absolutas (ou das frequências relativas) unem-
se os vértices superiores do retângulo correspondente à
classe modal aos vértices dos retângulos adjacentes, como
sugere a figura.
Organização e tratamento de dados

Tarefa
Indique a moda de cada uma das distribuições:
a)

b) 14 14 12 13 15 15 16 11 10 9

c)

d) 14 15 16 17 19 33
Organização e tratamento de dados

Tarefa
Indique a moda de cada uma das distribuições:
a)

moda

b) 14 14 12 13 15 15 16 11 10 9

Nesta distribuição a moda é o 14 e o 15 (é bimodal)

c)

Esta distribuição é bimodal (tem duas modas): 47 e 53

d) 14 15 16 17 19 33
Esta distribuição é amodal
Organização e tratamento de dados

Tarefa
Classe Frequência absoluta (ni) Frequência relativa (fi)

[130, 135[ 7 0,14


[135, 140[ 9 0,18
[140, 145[ 11 0,22
[145, 150[ 14 0,28
[150, 155[ 5 0,10
[155, 160[ 4 0,08
Total 50 1

a) Indique a classe modal. 145 - 150

b) Calcule o valor modal. 145+150 a dividir por 2

c) Determine graficamente um valor aproximado da moda. 146,5


Organização e tratamento de dados

Tarefa
Classe Frequência Frequência
absoluta (ni) relativa (fi)

[130, 135[ 7 0,14 a) A classe modal é [145, 150[.


[135, 140[ 9 0,18
[140, 145[ 11 0,22
[145, 150[ 14 0,28
b) O valor modal é:
[150, 155[ 5 0,10
145+ 150
[155, 160[ 4 0,08 =147,5
2
Total 50 1
Organização e tratamento de dados

Tarefa
Classe Frequência c) Determinar graficamente um valor
absoluta (ni)
aproximado para a moda:
[130, 135[ 7
[135, 140[ 9
[140, 145[ 11
[145, 150[ 14
[150, 155[ 5
[155, 160[ 4
Total 50

Um valor aproximado para a moda pode ser 146,5


Organização e tratamento de dados

Medidas de localização
Média
• A média é o quociente entre a soma de todos os valores
observados e a dimensão da amostra (ou efetivo da
população).

• Representa-se por:
− no caso dos dados corresponderem a uma amostra

− no caso dos dados corresponderem a uma população


Organização e tratamento de dados

Medidas de localização
Média
Se os dados estiverem organizados numa tabela de
frequências, a soma dos valores observados pode ser obtida
adicionando os produtos de cada valor pela respetiva
frequência absoluta. Neste caso a média é dada por:

A média também pode ser dada por:

+…+=
Organização e tratamento de dados

Medidas de localização
Média

 Não existe média quando a variável é qualitativa;

 A média dá uma ideia da ordem de grandeza dos


elementos da população;

 A média é muito sensível a valores extremos;

 Quando os dados estão agrupados em classes,


obtemos um valor aproximado da média através da
marca da classe (ou representante da classe).
Organização e tratamento de dados

Tarefas

1. Há 10 pessoas num elevador, 4 mulheres e 6 homens. O peso


médio das mulheres é 60 kg e o dos homens é 80 kg. Qual é o
peso médio das 10 pessoas que estão no elevador?

ou

2. Determine o valor da média dos seguintes conjuntos de dados:

a) 14 14 12 13 15 15 16 11 10 9

14 +14+12+13+15+ 15+16+11+10+9
𝑥= =12,9
10
Organização e tratamento de dados

Tarefas

b) Valores Frequência Frequência


observados (xi) absoluta (ni) relativa (fi)

45 3 0,091
47 10 0,303
50 7 0,212
53 10 0,303
54 3 0,091
Total 33 1
Organização e tratamento de dados

Tarefas
Valores Frequência Frequência
observados (xi) absoluta (ni) relativa (fi)
b)
45 3 0,091
47 10 0,303
50 7 0,212
53 10 0,303
54 3 0,091
Total 33 1

3× 45 +10 × 47+7 ×50+10 × 53+3 ×54


𝑥= ¿ 49,909
33
ou
𝑥=0,091 × 45+0,303 × 47+ 0,212× 50+0,303 ×53+ 0,091× 54=49,909
Organização e tratamento de dados

Tarefas

Classe Representante da Frequência Frequência


classe (x’i) absoluta (ni) relativa (fi)
c)
[130, 135[ 132,5 7 0,14
[135, 140[ 137,5 9 0,18
[140, 145[ 142,5 11 0,22
[145, 150[ 147,5 14 0,28
[150, 155[ 152,5 5 0,10
[155, 160[ 157,5 4 0,08
Total 50 1
Organização e tratamento de dados

Tarefas
Classe Representante Frequência Frequência
da classe (x’i) absoluta (ni) relativa (fi)
c)
[130, 135[ 132,5 7 0,14
[135, 140[ 137,5 9 0,18
[140, 145[ 142,5 11 0,22
[145, 150[ 147,5 14 0,28
[150, 155[ 152,5 5 0,10
[155, 160[ 157,5 4 0,08
Total 50 1

7 × 132,5+9 ×137,5 +11×142,5 +14 ×147,5+5 × 152,5+4 ×157,5


𝑥= = 143,8
50
ou

𝑥=0,14 × 132,5+0,18 ×137,5 +0,22 ×142,5+0,28 × 147,5+0,10 ×152,5+ ¿

+0,08 ×157,5=143,8
Organização e tratamento de dados

Medidas de localização
Mediana
A mediana representa-se por .

A mediana é o valor que ocupa a posição central quando se ordenam os


dados estatísticos. Isto é, a mediana é o valor que separa as 50% das
observações inferiores das 50% superiores.

Quando o número de dados N é ímpar, há um dado estatístico que


está exatamente a meio, ocupando essa posição.
Quando o número de dados N é par, não há nenhum dado a meio.
Neste caso, consideram-se os dois valores centrais e a mediana é a
média destes dois valores.

Não existe mediana quando a variável é qualitativa.


No entanto, há quem considere que é possível calcular a mediana
no caso da variável ser qualitativa ordinal.

Ao contrário da média, a mediana é uma medida de localização


resistente a valores extremos.
Adaptado de Martins & Ponte (2011)
Organização e tratamento de dados

Medidas de localização
Mediana
n – dimensão da Posição da
N ímpar amostra mediana

Há um dos elementos
da amostra ordenada
que tem tantos
elementos para a
esquerda como para a
direita e esse elemento
central é a mediana.

Adaptado de Martins & Ponte (2011)


Organização e tratamento de dados

Medidas de localização
Mediana
n – dimensão da Posição da
N par amostra mediana

Não há nenhum 2ª e 3ª
elemento que tenha a
propriedade de a dividir
ao meio. Há dois
valores centrais e
define-se a mediana
como sendo a média
aritmética desses dois
valores.

Adaptado de Martins & Ponte (2011)


Organização e tratamento de dados

Medidas de localização
Para determinar a mediana, depois dos dados
devidamente ordenados, procedemos do seguinte modo:

Quando a dimensão da amostra é ímpar (N ímpar):


~
𝑥=𝑥 𝑁 +1
2

Quando a dimensão da amostra é par (N par):

𝑥𝑁 +𝑥𝑁
+1
~
𝑥= 2 2
2
Organização e tratamento de dados

Tarefa
Determine a mediana de cada uma das seguintes distribuições
a)
14 14 12 13 15 15 16 11 10 9

Ordenar os dados:
9 10 11 12 13 14 14 15 15 16
N = 10, N é par.
~ 𝑥(5 )+ 𝑥 (6 ) 13+14
𝑥= = =13,5
2 2

b) 219 226 222 229 224 226 221 228 223 230 225

Ordenar os dados:
219 221 222 223 224 225 226 226 228 229 230
N = 11, N é ímpar.
=225
Organização e tratamento de dados

Medidas de localização
No caso de termos dados organizados numa tabela, a mediana pode
ser determinada a partir dos valores da frequência relativa acumulada.

Se existir um valor com frequência relativa acumulada igual a 0,50, ou


seja, 50%, a mediana é a média aritmética entre esse valor e o
seguinte.

Se não existir nenhum valor com frequência relativa acumulada igual a


0,50, a mediana é o primeiro valor cuja frequência relativa acumulada
ultrapassa 0,50.
Exemplo: x Frequência relativa x Frequência relativa
i i
acumulada (Fi) acumulada (Fi)
11 0,20 11 0,20
12 0,35 12 0,50
13 0,70 13 0,70
14 1 14 1
~
𝑥=13 ~ 12+13
𝑥= =12,5
2
Organização e tratamento de dados

Medidas de localização
Quando os dados estão agrupados em classes, podemos obter
um valor aproximado da mediana através do representante da
classe da mediana.

Para dados agrupados em classes, um valor aproximado para a


mediana pode ser determinado graficamente com recurso à
função cumulativa (polígono de frequências acumuladas).
Organização e tratamento de dados

A relação entre a média a mediana e a moda

Se a distribuição dos dados for


aproximadamente simétrica, a média
aproxima-se da mediana e da moda.

Se a distribuição dos dados for


enviesada para a direita (ou positiva),
a média tende a ser superior à
mediana e à moda.

Se a distribuição dos dados for


enviesada para a esquerda (ou
negativa), a média tende a ser inferior
à mediana e à moda.
Organização e tratamento de dados

Tarefa
Considere os seguintes dados:
219 226 222 229 224 620 226 221 228 223 230 225

a) Calcule a média, a moda e a mediana.


média = 257,75; mediana = 225,5; moda = 226.

b) Se mudarmos o dado 620 para 220, quais serão as medidas de localização


que ficarão mais afetadas por esta mudança?
média = 224,42; mediana = 224,5; moda = 226;
a medida mais afetada será a média.

c) Que valor mudaria se quisesse alterar a moda e manter a mediana?


Por exemplo, alterar um dos 226 para 228.
Organização e tratamento de dados

Medidas de localização
QUARTIS
Tal como a mediana separa o conjunto de dados em duas
partes igualmente numerosas, podemos procurar valores
que decomponham o conjunto de dados em quatro partes
igualmente numerosas. Esses valores chamam-se
quartis, sendo um deles a própria mediana.

1º Quartil Q1 – é um número que tem,


aproximadamente, 25% dos dados antes dele e 75%
dos dados depois dele.

2º Quartil Q2 – Coincide com a mediana: Q2= Me

3º Quartil Q3 – é um número que tem,


aproximadamente, 75% dos dados antes dele e 25%
dos dados depois dele.
Organização e tratamento de dados

Medidas de localização
Há vários métodos para calcular os quartis, nem todos conducentes
aos mesmos valores, mas a valores aproximados.

MÉTODO I
Começar por calcular a mediana (= Q2), pois como vimos esta divide o conjunto de dados
em duas partes iguais;

Depois calcular a mediana dos dados que ficam à esquerda de Q2 e obtém-se o 1º quartil;

De seguida calcular a mediana dos dados que ficam à direita de Q2 e obtém-se o 3º quartil.

No caso da dimensão da amostra ser ímpar, a mediana coincide com um dos elementos da
amostra. Este método permite duas opções:
considerar que a mediana fica incluída nas duas metades em que fica dividida a amostra ou não considerá-la em
nenhuma das metades. Aqui não será considerada em nenhuma das metades.
Organização e tratamento de dados

Medidas de localização
Método I
Organização e tratamento de dados

Medidas de localização
Método II
Quando a dimensão da amostra é múltiplo de 4:

𝑥 +𝑥 𝑥 +𝑥
( )
𝑁
4 ( 𝑁
4
+1 ) ( 𝑁−
𝑁
4 ) ( 𝑁 − 𝑁4 +1)
𝑄1= 𝑄3 =
2 2

Quando a dimensão da amostra não é múltiplo de 4:


Calcular onde K corresponde à parte inteira de . Então:

𝑄1= 𝑥 ( 𝐾 +1 ) 𝑄3 =𝑥 ( 𝑁 − 𝐾 )
Organização e tratamento de dados

Tarefa
Calcule o 1.º quartil, a mediana e o 3.º quartil:

a) 14 14 12 13 15 15 16 11 10 9 9 16

Ordenar os dados:

9 9 10 11 12 13 14 14 15 15 16 16

N = 12, N é múltiplo de 4
𝑁 12
= =3
4 4

𝑥( 3) + 𝑥( 4) 10+11
𝑄1= = =10,5
2 2
𝑥 (12 −3) + 𝑥( 12− 3+1) 𝑥( 9) +𝑥 (10) 15+15
𝑄3 = = = =15
2 2 2
Organização e tratamento de dados

Tarefa
Calcule o 1.º quartil, a mediana e o 3.º quartil:

a) 14 14 12 13 15 15 16 11 10 9 9 16

Ordenar os dados:

9 9 10 11 12 13 14 14 15 15 16 16

N = 12, N é par
𝑁 12
= =6
2 2

𝑥( 6 )+ 𝑥( 7) 13+14
𝑄2 =~
𝑥= = =13,5
2 2
Organização e tratamento de dados

Tarefa
Calcule o 1.º quartil, a mediana e o 3.º quartil:

a) 219 226 222 229 224 226 221 228 223 230 225
Ordenar os dados:

219 221 222 223 224 225 226 226 228 229 230

N = 11, N não é múltiplo de 4


𝑁 11
= =2,75
4 4
𝐾 =2
𝑄1=𝑥 (2 +1 )= 𝑥( 3)= 222

𝑄3 =𝑥(11− 2)=𝑥(9) =228


Organização e tratamento de dados

Tarefa
Calcule o 1.º quartil, a mediana e o 3.º quartil:

a) 219 226 222 229 224 226 221 228 223 230 225
Ordenar os dados:

219 221 222 223 224 225 226 226 228 229 230

N = 11, N é ímpar
𝑁 +1 12
= =6
2 2

𝑄2 =~
𝑥=𝑥(6)=225
Organização e tratamento de dados

Medidas de localização
No caso dos dados organizados numa tabela, os quartis podem ser
determinados a partir dos valores da frequência relativa acumulada.

• Se existir um valor com frequência relativa acumulada igual a 0,25,


ou seja, 25%, o 1.º Quartil é a média aritmética entre esse valor e
o seguinte.
• Se não existir um valor com frequência relativa acumulada igual a
0,25, o 1.º Quartil é o primeiro valor cuja frequência relativa
acumulada ultrapassa 0,25.

• Se existir um valor com frequência relativa acumulada igual a 0,75,


ou seja, 75%, o 3.º Quartil é a média aritmética entre esse valor e
o seguinte.
• Se não existir um valor com frequência relativa acumulada igual a
0,75, o 3.º Quartil é o primeiro valor cuja frequência relativa
acumulada ultrapassa 0,75.
Organização e tratamento de dados

Medidas de localização
Quartis: exemplos.
xi Frequência relativa
xi Frequência relativa acumulada (Fi)
acumulada (Fi)
11 0,25
11 0,20
12 0,75
12 0,35
13 0,90
13 0,80
14 1
14 1
11+12
𝑄1= 12 𝑄1= =11,5
2
xi Frequência relativa xi Frequência relativa
acumulada (Fi) acumulada (Fi)
11 0,20 11 0,25
12 0,35 12 0,75
13 0,80 13 0,90
14 1 14 1

3 12+13
𝑄3 = =12,5
2
Organização e tratamento de dados

Medidas de localização
Quando os dados estão agrupados em classes, podem ser obtidos,
graficamente, valores aproximados dos quartis com recurso ao
polígono de frequências acumuladas (função cumulativa).

Valor
aproximado
do 1.º Q
Valor
aproximado
do 2.º Q
Valor
aproximado
do 3.º Q
Organização e tratamento de dados

Medidas de localização

O diagrama de extremos e quartis (BoxPlot) é uma forma


esquemática de representar uma distribuição por cinco dos
seus valores estatísticos: extremo inferior, 1.º quartil,
mediana (ou 2.º quartil), 3.º quartil e extremo superior.

Ficam definidas quatro zonas: duas centrais, representadas por


retângulos, e duas caudas. Em cada uma destas zonas está
aproximadamente um quarto da distribuição (ou seja, 25% dos
dados).
Organização e tratamento de dados

Tarefa
Construa o diagrama de extremos e quartis:

40 53 60 72 65 54 60 92 48 87

Ordenar os dados:

40 48 53 54 60 60 65 72 87 92

Extremo inferior = mínimo dos dados = 40


Extremo superior = máximo dos dados = 92

~ 𝑥(5 )+ 𝑥 (6 ) 60 +60
𝑥= = =60
2 2

𝑄1= 𝑥 (3 )=53
𝑄3 =𝑥(8)=72
Organização e tratamento de dados

Medidas de localização

• Quanto mais estreita for uma zona, maior é a concentração


de dados aí existente. Por isso, este diagrama dá também
algumas indicações gerais sobre o tipo de distribuição.
• O diagrama permite-nos analisar a distribuição quanto à
dispersão dos dados.
Organização e tratamento de dados

Tarefa
1 2

3
4

A B

C D

• A cada um dos gráficos anteriores associe o


respetivo diagrama de extremos e quartis.
Organização e tratamento de dados

Tarefa
1 2

3
4

A B

C D

• A cada um dos gráficos anteriores associe o


respetivo diagrama de extremos e quartis.

Você também pode gostar