Você está na página 1de 35

Medidas de Tendência

Central e de Dispersão
Nome do Curso: Especialização em Economia Rural
Nome da Componente Curricular: Métodos Quantitativos Aplicados à
Economia Rural
Nome da/do docente: Prof. Dr. Carlos Alberto Gonçalves Junior
Medidas de Tendência Central

• Uma medida de tendência central de um conjunto de dados mostra o


valor em torno do qual se agrupam as observações.

• As principais medidas de tendência central são a média aritmética, a


mediana e a moda. Também são bastante utilizadas a média ponderada
e a média geométrica.

• As medidas de tendência central, com as medidas de dispersão, de


assimetria, de desigualdade, permitem caracterizar, de maneira
bastante concisa, um conjunto de dados.
A média Aritmética
• A média aritmética de n dados (X1, X2, ..., Xn) é por definição, o valor:

• Se os dados estiverem classificados em uma distribuição de


frequências com k classes, e Xj (j = 1, 2,...,k) são os valores centrais
das classes ou os diferentes valores observados (no caso de uma
variável discreta) e se fi são as respectivas frequências, a média
aritmética é dada por:
A Mediana
• Por definição, mediana de um conjunto de dados é o valor ao qual metade dos
dados são iguais ou inferiores e metade dos dados são iguais ou superiores.

• Então, se os dados estão dispostos em ordem crescente ou decrescente, chamamos


de mediana o valor que é precedido e seguido pelo mesmo número de dados.

• Assim, se o número de dados de um conjunto ordenado é ímpar, a mediana é o


valor central, se o numero de dados é par, a mediana é, por convenção, a média
aritmética dos dois valores centrais

• Exemplos:
• P = {59, 61, 68, 69, 74} ímpar
• P = {2, 3, 5, 6, 7, 10} par
A Moda
• Por definição, moda de um conjunto de dados é o valor que ocorre com
maior frequência, ou seja, é o valor mais comum.

• Um conjunto de observações pode não ter moda, pode ter uma única moda
(unimodal), duas modas (bimodal) ou mais de duas modas (multimodal).

• Assim, por exemplo:


• O conjunto A = {2, 3, 5, 6, 7} não tem moda;
• O conjunto B = {1, 2, 2, 3, 4} é unimodal;
• O conjunto C = {1, 1, 2, 3, 4, 4} é bimodal;
Posição relativa da média, da moda e da mediana
e a assimetria da distribuição
• Examinemos a distribuição de frequências representada pelo gráfico:

Esse é um exemplo de
distribuição simétrica. Na
representação gráfica, a
primeira metade é igual à
imagem, refletida em um
espelho plano, da segunda
metade da distribuição

• 𝑋ത = 𝐷 = 𝑀 = 3
Posição relativa da média, da moda e da mediana
e a assimetria da distribuição
• Examinando esta outra distribuição de frequências

Essa é a posição relativa típica


dessas medidas de tendência
central no caso de distribuições
unimodais assimétricas à direita,
ou positivamente assimétricas

Assimétrico à direita é quando a


cauda da distribuição fica para o
lado direito.
Exemplo: distribuição de renda
no Brasil
• 𝑋ത = 2,5; 𝐷 = 2; 𝑀 = 1
• 𝑀 < 𝐷 < 𝑋ത
Posição relativa da média, da moda e da mediana
e a assimetria da distribuição
• Consideremos agora uma distribuição de frequências assimétrica à esquerda ou negativamente assimétrica.

Essa é a posição relativa típica


dessas medidas de tendência
central no caso de distribuições
unimodais assimétricas à
esquerda, ou negativamente
assimétricas

Assimétrico à esquerda é
quando a cauda da distribuição
fica para o lado esquerdo.
• 𝑋ത = 4,5; 𝐷 = 5; 𝑀 = 6
• 𝑋ത < 𝐷 < 𝑀
A Média Geométrica e a Média Harmônica

• Por definição, a média geométrica de n valores não-negativos (X1, X2,...,Xn)


é:

• Aplicando logaritmo temos que:

• Para qualquer conjunto de n números não negativos, temos G≤ 𝑋, ത com G=


𝑋ത apenas se os n números forem todos iguais. No próximo slide é
apresentada essa demonstração para o caso de apenas duas observações, X1
e X2
A Média Geométrica e a Média Harmônica
A Média Geométrica e a Média Harmônica
• Um exemplo para a utilização da média geométrica é:
• Digamos que uma categoria de operários tenha aumento salarial de 20%, 12% e 7%
respectivamente, a cada mês sobre o valor de seu salário. Qual o aumento médio do
trimestre?

• Utilizando a média aritmética o aumento foi de 13%.

• Mas utilizando a média geométrica:


3
•𝐺= 1,20.1,12.1,07 − 1 = 0,128

• Para o caso específico da porcentagem, é necessário inserir o número 1, considerando que o


aumento foi sobre 100% do valor, sendo 100%=100/100=1. Depois torna-se necessário
retirar o 1 que for inserido, para que sobre o aumento, descontado o valor inicial.
A Média Geométrica e a Média Harmônica

• A média Harmônica é o recíproco da média aritmética dos recíprocos


valores, isto é:

• Que também pode ser escrito como:


𝑛
•𝐻= 1 1 1
+ ⋯
𝑋1 𝑋2 𝑋𝑛

• É utilizada para grandezas como por exemplo, distância em relação ao


tempo (Km/h)
A Média Geométrica e a Média Harmônica
• Exemplo: Metade da distância de uma viagem é feita a 40 km/h e a outra
metade da distância a 60 km/h. Qual foi a velocidade média da viagem?

• Se tivesse viajado metade do tempo a 40 km/h e a outra metade do tempo a


60 km/h a média deveria ser a aritmética 50 km/h.

• Mas no caso foi a distância, então utiliza-se a média harmônica:

2
•𝐻= 1 1 = 48 𝐾𝑚/ℎ
+
40 60
A média Ponderada
• Dado um conjunto de n valores observados (X1, X2, ..., Xn ) e conhecidos os respectivos
fatores de ponderação (q1, q2, ..., qn) a média ponderada de X é:

• Exemplo:

Qual o preço médio?

10 200 +8 700 +12(100)


• 𝑊= = 8,80
1000
A média ponderada
• Quem, inadvertidamente, calculasse a média aritmética dos preços
obteria 𝑋ത = 10. Esse valor não é o preço médio correto, por não levar
em consideração o fato de que aos preços menores correspondem
maiores quantidades vendidas.

• Utilizando as quantidades vendidas como fatores de ponderação,


obtivemos W=8,80. Note que a média ponderada é, nesse caso, o
quociente do valor total das transações pela quantidade total vendida.
Medidas de Dispersão
Amplitude, Variância e Desvio Padrão
• Consideremos os seguintes conjuntos:

• A média aritmética dos elementos do conjunto C é 15, e para todos os demais conjuntos a
média aritmética dos seus elementos é 5.
Amplitude, Variância e Desvio Padrão
• Com base no simples exame desses conjuntos, podemos fazer as seguintes
afirmativas, relativas à dispersão dos valores dos elementos de cada conjunto:

i) No conjunto A a dispersão é nula;


ii) Os conjuntos B e C apresentam a mesma dispersão, só diferindo quanto a
média;
iii) A dispersão de D é maior do que a dispersão de B, ainda, como para o conjunto
D a diferença entre dois valores consecutivos é sempre igual a 2 e B igual a 1,
parece lícito afirmar que a dispersão de D é o dobro da dispersão em B;
iv) A dispersão de E é maior que a dispersão de A e menor que a dispersão de B;
v) O conjunto F apresente dispersão igual à de B, pois esses conjuntos só diferem
quanto ao número de elementos (F é a duplicação de B).
Amplitude, Variância e Desvio Padrão
• Uma medida de dispersão é a “Amplitude Total”, que é a diferença entre o maior e
o menor valor observado. A Amplitude Total é zero para o conjunto A, 4 para os
conjuntos B, C, E e F, e 8 para o conjunto D.

• Nota-se que os valores da amplitude não obedecem à quarta afirmativa, pois eles
indicam, erroneamente, que os conjuntos B e E apresentam o mesmo grau de
dispersão.

• Isso acontece porque a amplitude só leva em consideração os valores extremos!

• Uma boa medida de dispersão deve levar em consideração todos os dados, não
apenas o maior e o menor valor observado.
Amplitude, Variância e Desvio Padrão
• Os valores dos desvios em relação à média mostram o grau de dispersão dos
dados.

• No entanto, não podemos utilizar a soma dos desvios em relação à média


como medida de dispersão, pois essa soma será sempre zero. Para resolver
esse problema, podemos utilizar a soma dos desvios independente do sinal,
o que pode ser obtido elevando os desvios ao quadrado.

• Porém, apenas a soma dos quadrados dos desvios pode não ser uma boa
medida, pois a dispersão aumentará conforme aumenta o número de
observações do conjunto de dados.
Amplitude, Variância e Desvio Padrão
• Dividindo-se a soma de quadrados dos desvios pelo número de
observações, obtemos a variância dos dados:

• Se X1, X2,..., Xn são os valores observados em uma amostra, 𝜎ො 2 é o


“estimador de máxima verossimilhança” da variância de X. Veremos
também que o “estimador não-tendencioso da variância de X” é:
Graus de Liberdade
• Pode-se considerar que (n-1) é o número de graus de liberdade das observações
em uma amostra de tamanho n.
• Graus de liberdade são, em estatística, o número de observações independentes
(dimensão da amostra) menos o número de parâmetros a serem estimados.
Imagine 3 observações Imagine agora uma situação em que são tirados 3
independentes de uma elementos da população e não se conhece 𝜇, então
população com média 𝜇 = 8 utiliza-se 𝑋ത para estumar, sabe-se que 𝑋=5

Perdemos um grau
i Xi Xi - 𝜇 i Xi Xi - 𝜇 Isso indica que com
de liberdade quando
1 9 9–8=1 calculamos 𝑋ത e 1 9 9–5=4 3 observações na
utilizamos como amostra temos
2 4 4 – 8 = -4 2 4 4 – 5 = -1
estimador de 𝜇 apenas 2 graus de
3 x 3 2 2-5 = -3 liberdade, pois uma
Como são 3 observações Como sabemos a soma dos das observações tem
independentes e 𝜇 é conhecido a desvios é zero, a última valor definido
terceira observação pode observação obrigatoriamente
assumir qualquer valor. tem que ser 2.
Amplitude, Variância e Desvio Padrão
• A variância, como medida de dispersão, tem o inconveniente de apresentar
unidade de medida igual ao quadrado da unidade de medida dos dados. Assim, por
exemplo, se X é medido em kg, a variância é medida em kg2.

• O desvio padrão é, por definição, a raiz quadrada, com sinal positivo, da variância.
A unidade de medida do desvio padrão é igual à unidade de medida dos dados.

• A seguinte igualdade, cuja demonstração deixamos para o leitor, pode ser bastante
útil no cálculo da soma dos quadrados dos desvios:
Amplitude, Variância e Desvio Padrão
• No caso de os dados estarem agrupados em uma distribuição de frequências, cada
valor distinto ou valor central da classe (Xj, com j = 1, 2, ..., k) deve ser ponderado
pela respectiva frequência (fj), e as expressões ficam:

Você também pode gostar