Você está na página 1de 45

Medidas de tendência central

ACH0021 – Tratamento e Análise de Dados/Informações


Prof. Regis Rossi A. Faria
1º sem. 2020

Créditos: parte do conteúdo baseado em slides dos profs. Ana Amélia Benedito Silva e Marcelo Lauretto
Etapas da análise estatística
ANÁLISE DESCRITIVA
• tabelas
• gráficos
• medidas
– média, mediana, moda
– desvio-padrão, coeficiente de variação
– percentis, quartis, decis
Medidas de Tendência Central

• média
• mediana
• moda
Quanto ganha quem tem curso superior?

Entrevistamos 15 pessoas com curso superior que


informaram seus salários (milhares de R$/mês):

11 2,5 5,0 5,0 5,5 3,0 3,5 3,0 0,4 3,2 5,0 3,0 3,2 7,4 6,0

colocando em ordem

0,4 2,5 3,0 3,0 3,0 3,2 3,2 3,5 5,0 5,0 5,0 5,5 6,0 7,4 11
Gráfico de pontos dos salários das 15 pessoas com
curso superior (milhares de R$/mês):

0 1 2 3 4 5 6 7 8 9 10 11

0,4 2,5 3,0 3,0 3,0 3,2 3,2 3,5 5,0 5,0 5,0 5,5 6,0 7,4 11

Como resumir esta informação?


Média
• Média aritmética: é a medida mais utilizada
∑)"'( !"
$# =
*
onde !" é o valor de cada observação, n é o tamanho da
amostra, e $# é a média calculada.

No nosso exemplo teremos:


MÉDIA= [(11+2,5+5+5+5,5+3+3,5+3+0,4+3,2+5+3+3,2+7,4+6)/15]
MÉDIA = 66,7/15
MÉDIA= R$ 4.450,00
A média representa o quanto cada um receberia se o
total de salários fosse distribuído igualmente.

0 1 2 3 4 5 6 7 8 9 10 11

média = R$4.450,00
O que aconteceria com a média se removêssemos o
salário discrepante (outlier) da amostra de salários?
outlier

0 1 2 3 4 5 6 7 8 9 10 11

média = R$4.450,00
outlier

0 1 2 3 4 5 6 7 8 9 10 11

R$3980,00
R$4.450,00
E o que aconteceria com a média se o salário mais alto da
amostra fosse de 200 mil reais ao invés de 11 mil reais?

MÉDIA=(200+2,5+5+5+5,5+3+3,5+3+0,4+3,2+5+3+3,2+7,4+6)/15=255,7/15=17,05

Salário de Salário de
14 sujeitos 1 sujeito

0 10 100 200

ATENÇÃO! A média é
R$17.050,00 uma medida sensível a
valores extremos!
R$4.450,00
alternativa

MEDIANA
para a média

• divide uma distribuição ordenada


de dados em 2 metades iguais
• é um índice de posição
MEDIANA
Quando o n0 de elementos n é ímpar,
obtém-se a mediana “pegando-se” o
elemento central.

Exemplo: 2 5 9 14 21

Logo: MEDIANA = 9
MEDIANA
• Quando o n0 de elementos n é par,
obtém-se a mediana “pegando-se”
os elementos centrais

Exemplo: 2 5 9 14 21 28

Logo: MEDIANA = (9+14)/2 = 11,5


voltando aos
salários

0,4 2,5 3 3 3 3,2 3,2 3,5 5 5 5 5,5 6 7,4 11

0,4 2,5 3 3 3 3,2 3,2 3,5 5 5 5 5,5 6 7,4 200

A troca de 11 por 200 mudou a média de 4,45 para 17,05

porém
....
A troca de 11 por 200 não mudou a mediana que se
manteve em 3,5!!!
salários com salários com salários sem
11mil 200mil 11mil
0.40 0.40 0.40
2.50 2.50 2.50
3.00 3.00 3.00
3.00 3.00 3.00
3.00 3.00 3.00
3.20 3.20 3.20
3.20 3.20 3.20
3.50 3.50 3.50
5.00 5.00 5.00
5.00 5.00 5.00
5.00 5.00 5.00
5.50 5.50 5.50
6.00 6.00 6.00
7.40 7.40 7.40 a média mudou
11.00 200.00

média 4.45 17.05 3.98

3.50 3.50 3.35 a mediana não mudou


mediana
MÉDIA E MEDIANA

50% dos valores 50% dos valores

0 10 20 30 40 50 60 70

M d = 22,5 média = 24,7


MÉDIA E MEDIANA

(a) Distribuição
simétrica
50% 50%
(b) Distribuição
assimétrica
média = mediana
50%

50%

mediana média
moda=mediana moda<mediana média<mediana
mediana=média mediana<média mediana<moda
Moda
• valor que ocorre com maior freqüência
• obtida por inspeção da tabela de
distribuição de freqüências
• útil para medidas qualitativas
Exemplo: candidatos numa eleição
times de futebol
Moda
• Ex: no conjunto de escores 58, 82, 82, 90, 98, a
moda é 82 porque ocorre duas vezes, enquanto os
demais escores ocorrem apenas uma vez.
• Útil para sumarizar variáveis qualitativas.
– Ex: preferências de religiões (dados fictícios)

Moda da distribuição: Protestante


Moda
Candidatos a Prefeitura de SP:
Marta (M), Doria (D), Haddad (H), Russomano (R)

DDDDDHHHHHHHMDDDDMMRRRDDD

candidato N %
Doria 12 48
Haddad 6 24
Marta 4 16
Russomano 3 12
TOTAL 25 100
MODA
Moda
TIME FAVORITO
Corinthians (C), Palmeiras (P), São Paulo (SP), Santos (S)

C C C C C C P P P P SP SP P S S SP SP S C C

candidato N %
Corinthians 8 40
Palmeiras 5 25
São Paulo 4 20
Santos 3 15
TOTAL 20 100
MODA
Limitações da moda
• Algumas distribuições não possuem moda
– Ex:
Limitações da moda
• Algumas distribuições
possuem tantas modas
que a estatística deixa
de ter significado.
– Ex: distribuição de
escores de testes.
• Modas
identificadas:
55,66,78,82,90,97.
• Qual dessas
representa um
valor "típico"?
Limitações da moda
• Em variáveis quantitativas
ou qualitativas ordinais, a
moda pode não ser central
na distribuição como um
todo.
– Ex: distribuição de escores
de testes.
• Moda: 93
• Esse valor é um bom
representante da
distribuição?
Exercícios
Veremos agora exercícios para calcular a
média, a mediana e a moda para 2
situações diferentes:
(a) quando temos acesso às observações
da amostra;
(b) quando temos acesso a tabelas de
dados sobre a amostra
Exercício 1

O número de dias que sete pacientes


submetidos a um transplante renal
sobreviveram, após cirurgia em determinado
hospital, foi:
17, 5, 48, 120, 651, 64, 150.
• Apresente os dados em um gráfico de pontos.
• Calcule a média, a mediana e a moda.
Cálculo da média: com acesso às
observações
• Este é o caso de uso da média aritmética simples
• É dada pela divisão entre a soma dos escores observados (x1, x2,
... , xn) e o número total de observações (n):
∑(%&' )%
"! =
*
• Este tipo de média é calculado quando os valores não estão
tabulados, ou seja, quando os escores são conhecidos
individualmente.
• Ex: Suponha uma mostra de 10 crianças de 5 anos de idade,
com dados referentes a seus pesos (em Kg):
– 23.0, 20.0, 22.0, 19.0, 25.0, 28.2, 24.0, 21.0, 27.0, 21.0
∑.
+,- /+ 012032002'4205206.020820'20920'
– "! = (
= '3
≅ 23.0
Cálculo da mediana: com acesso
às observações
1. Ordene os escores em ordem crescente (ou decrescente)
2. Se o número de elementos (n) for ímpar:
– A mediana será o elemento localizado exatamente no centro.
– O índice do elemento central é dado por (n+1) / 2.
3. Se o número de elementos (n) for par:
– A mediana será exatamente o valor central dos dois casos do
meio da distribuição.
– Os índices do primeiro e do segundo casos centrais são
dados por
n/2 e n/2 + 1.
4. Por exemplo, se n=14, a mediana é o escore situado no centro
dos escores do sétimo e oitavo casos.
Cálculo da mediana: com acesso
às observações
• Neste caso abaixo temos acesso às
observações
Cálculo da mediana com sete Cálculo da mediana com oito casos
casos (n ímpar) (n par)
Acompanhe solução do
Exercício 1 em planilha
Exercício 2
• Distribuição de
freqüências do número de Número de pessoas
pessoas residentes no Frequência
por domicílio
domicílio, numa amostra 1 1
de 40 residências (Ref. 2 3
Conjunto Residencial 3 6
Monte Verde, 4 13
5 11
Florianópolis – SC, 1988)
6 4
• Calcule a média, a 7 0
mediana e a moda do 8 2
Total 40
número de pessoas por
domicílio.
Cálculo da média: com acesso a
tabelas de frequências dos dados
• Quando temos acesso às frequências dos valores das observações, isto
é, quando os dados estão agrupados em distribuições de frequência,
usamos a media aritmética ponderada
• Os valores x1, x2, ... , xn são ponderados pelas respectivas frequências
absolutas f1, f2, ... , fn

Pessoas/domicílio Frequência A média será:


xi fi ∑(%&' )% *%
1 1 "! =
+
2 3
3 6 onde n é a soma das frequências: + = ∑(,&' ),
4 13
5 11 No exemplo, fica:
6 4 ∑(%&' )% *%
"! =
7 0 +
8 2 1×1 + 3×2 + 6×3 + ⋯ + 0×7 + 2×8 172
= =
Total 40 40 40
= 4,3
Cálculo da mediana: com acesso a
tabelas de frequências dos dados
• Quando temos acesso às frequências dos valores das observações
a) Calcula-se inicialmente a posição do elemento original dos dados
correspondente à mediana, isto é, qual observação é a mediana
b) Determinada a posição da mediana, localiza-se na tabela de
frequências a linha que contém essa posição.

Freq.
Pessoas/domicílio Frequência
acumulada • Como n=40 é par, a mediana é a
1 1 1 média dos elementos de ordem
2 3 4 (40/2)= 20 e (40/2)+1= 21.
3 6 10 • Analisando as frequências
4 13 23 acumuladas na tabela ao lado,
5 11 34 conclui-se que a mediana tem
6 4 38 valor 4
7 0 38 • Med = 4 pessoas/domicílio
8 2 40
Total 40 40
Acompanhe solução do
Exercício 2 em planilha
Cálculo da mediana para dados
agrupados em classes
• Neste caso temos acesso a • Ex: distribuição das notas obtidas
faixas de valores das por candidatos em um vestibular.
respostas e suas frequências
• Determina-se a linha da
tabela que contém a
mediana na tabela de forma
similar àquela mostrada no
slide anterior (cálculo da
mediana para dados
organizados em tabelas de
frequências)
• Uma vez determinada a
classe, deve-se calcular o
valor da mediana por método
de interpolação.
Cálculo da mediana para dados
agrupados em classes
• Após calcular a posição da mediana, localiza-se, a partir das
frequências acumuladas na tabela, a classe na qual a mesma se
encontra.
Cálculo da mediana para dados
agrupados em classes
• O valor da mediana é obtido aplicando-se a fórmula:
' )
!" = $% + − ,%-.
(% 2
onde:
– ℎ = linha da tabela que contém a mediana;
– $% = limite inferior da classe que contém a mediana;
– a = amplitude do intervalo de classe;
– (% = frequência da classe que contém a mediana;
– ) = quantidade total de elementos;
– ,%-. = Frequência acumulada até a classe anterior à classe
que contém a mediana.
Cálculo da mediana para dados
agrupados em classes
Acompanhe cálculo da
mediana por interpolação
(onde se tem acesso aos
intervalos de valores das
classes dos dados)
Exercício 3 (trabalho)
Os dados abaixo referem-se ao número de dias de permanência de pacientes
em um hospital. Pede-se:
1. Calcule a média, a mediana e a moda do tempo de internação destes
pacientes.
2. Construa uma tabela de distribuição de frequências usando intervalos de 2
dias.
3. Recalcule a média, a mediana e a moda a partir da tabela acima.
4. Justifique as diferenças encontradas.

7 8 1 7 13 6
12 12 3 17 4 2
4 15 2 14 3 5
10 8 9 8 5 3
2 7 14 12 10 8
1 6 4 7 7 11
Exercício 4 (em classe)
• Você está procurando emprego para o próximo ano. As
empresas A e B são totalmente equivalentes a menos de suas
políticas de remuneração. As características de remuneração de
cada uma são resumidas na tabela a seguir:

Empresa A B
Média 2500 2000
Mediana 1700 1900
Moda 1500 1900

• Qual das duas empresas você escolheria? Justifique.


Exercício 4 (resposta)
• Resposta: Depende de sua qualificação.
– A empresa A tem metade dos funcionários ganhando até
1700, sendo o valor mais comum 1500. Como a média é
2500, há alguns poucos funcionários ganhando muito.
– A empresa B tem as três medidas muito próximas a 1900,
indicando uma política salarial mais homogênea.
• Se você é altamente qualificado, as chances são de ganhar mais
na empresa A. Se você tem qualificação igual ou inferior à média,
a melhor escolha é a empresa B.

Empresa A B
Média 2500 2000
Mediana 1700 1900
Moda 1500 1900
Fim

Você também pode gostar