Escolar Documentos
Profissional Documentos
Cultura Documentos
Créditos: parte do conteúdo baseado em slides dos profs. Ana Amélia Benedito Silva e Marcelo Lauretto
Etapas da análise estatística
ANÁLISE DESCRITIVA
• tabelas
• gráficos
• medidas
– média, mediana, moda
– desvio-padrão, coeficiente de variação
– percentis, quartis, decis
Medidas de Tendência Central
• média
• mediana
• moda
Quanto ganha quem tem curso superior?
11 2,5 5,0 5,0 5,5 3,0 3,5 3,0 0,4 3,2 5,0 3,0 3,2 7,4 6,0
colocando em ordem
0,4 2,5 3,0 3,0 3,0 3,2 3,2 3,5 5,0 5,0 5,0 5,5 6,0 7,4 11
Gráfico de pontos dos salários das 15 pessoas com
curso superior (milhares de R$/mês):
0 1 2 3 4 5 6 7 8 9 10 11
0,4 2,5 3,0 3,0 3,0 3,2 3,2 3,5 5,0 5,0 5,0 5,5 6,0 7,4 11
0 1 2 3 4 5 6 7 8 9 10 11
média = R$4.450,00
O que aconteceria com a média se removêssemos o
salário discrepante (outlier) da amostra de salários?
outlier
0 1 2 3 4 5 6 7 8 9 10 11
média = R$4.450,00
outlier
0 1 2 3 4 5 6 7 8 9 10 11
R$3980,00
R$4.450,00
E o que aconteceria com a média se o salário mais alto da
amostra fosse de 200 mil reais ao invés de 11 mil reais?
MÉDIA=(200+2,5+5+5+5,5+3+3,5+3+0,4+3,2+5+3+3,2+7,4+6)/15=255,7/15=17,05
Salário de Salário de
14 sujeitos 1 sujeito
0 10 100 200
ATENÇÃO! A média é
R$17.050,00 uma medida sensível a
valores extremos!
R$4.450,00
alternativa
MEDIANA
para a média
Exemplo: 2 5 9 14 21
Logo: MEDIANA = 9
MEDIANA
• Quando o n0 de elementos n é par,
obtém-se a mediana “pegando-se”
os elementos centrais
Exemplo: 2 5 9 14 21 28
porém
....
A troca de 11 por 200 não mudou a mediana que se
manteve em 3,5!!!
salários com salários com salários sem
11mil 200mil 11mil
0.40 0.40 0.40
2.50 2.50 2.50
3.00 3.00 3.00
3.00 3.00 3.00
3.00 3.00 3.00
3.20 3.20 3.20
3.20 3.20 3.20
3.50 3.50 3.50
5.00 5.00 5.00
5.00 5.00 5.00
5.00 5.00 5.00
5.50 5.50 5.50
6.00 6.00 6.00
7.40 7.40 7.40 a média mudou
11.00 200.00
0 10 20 30 40 50 60 70
(a) Distribuição
simétrica
50% 50%
(b) Distribuição
assimétrica
média = mediana
50%
50%
mediana média
moda=mediana moda<mediana média<mediana
mediana=média mediana<média mediana<moda
Moda
• valor que ocorre com maior freqüência
• obtida por inspeção da tabela de
distribuição de freqüências
• útil para medidas qualitativas
Exemplo: candidatos numa eleição
times de futebol
Moda
• Ex: no conjunto de escores 58, 82, 82, 90, 98, a
moda é 82 porque ocorre duas vezes, enquanto os
demais escores ocorrem apenas uma vez.
• Útil para sumarizar variáveis qualitativas.
– Ex: preferências de religiões (dados fictícios)
DDDDDHHHHHHHMDDDDMMRRRDDD
candidato N %
Doria 12 48
Haddad 6 24
Marta 4 16
Russomano 3 12
TOTAL 25 100
MODA
Moda
TIME FAVORITO
Corinthians (C), Palmeiras (P), São Paulo (SP), Santos (S)
C C C C C C P P P P SP SP P S S SP SP S C C
candidato N %
Corinthians 8 40
Palmeiras 5 25
São Paulo 4 20
Santos 3 15
TOTAL 20 100
MODA
Limitações da moda
• Algumas distribuições não possuem moda
– Ex:
Limitações da moda
• Algumas distribuições
possuem tantas modas
que a estatística deixa
de ter significado.
– Ex: distribuição de
escores de testes.
• Modas
identificadas:
55,66,78,82,90,97.
• Qual dessas
representa um
valor "típico"?
Limitações da moda
• Em variáveis quantitativas
ou qualitativas ordinais, a
moda pode não ser central
na distribuição como um
todo.
– Ex: distribuição de escores
de testes.
• Moda: 93
• Esse valor é um bom
representante da
distribuição?
Exercícios
Veremos agora exercícios para calcular a
média, a mediana e a moda para 2
situações diferentes:
(a) quando temos acesso às observações
da amostra;
(b) quando temos acesso a tabelas de
dados sobre a amostra
Exercício 1
Freq.
Pessoas/domicílio Frequência
acumulada • Como n=40 é par, a mediana é a
1 1 1 média dos elementos de ordem
2 3 4 (40/2)= 20 e (40/2)+1= 21.
3 6 10 • Analisando as frequências
4 13 23 acumuladas na tabela ao lado,
5 11 34 conclui-se que a mediana tem
6 4 38 valor 4
7 0 38 • Med = 4 pessoas/domicílio
8 2 40
Total 40 40
Acompanhe solução do
Exercício 2 em planilha
Cálculo da mediana para dados
agrupados em classes
• Neste caso temos acesso a • Ex: distribuição das notas obtidas
faixas de valores das por candidatos em um vestibular.
respostas e suas frequências
• Determina-se a linha da
tabela que contém a
mediana na tabela de forma
similar àquela mostrada no
slide anterior (cálculo da
mediana para dados
organizados em tabelas de
frequências)
• Uma vez determinada a
classe, deve-se calcular o
valor da mediana por método
de interpolação.
Cálculo da mediana para dados
agrupados em classes
• Após calcular a posição da mediana, localiza-se, a partir das
frequências acumuladas na tabela, a classe na qual a mesma se
encontra.
Cálculo da mediana para dados
agrupados em classes
• O valor da mediana é obtido aplicando-se a fórmula:
' )
!" = $% + − ,%-.
(% 2
onde:
– ℎ = linha da tabela que contém a mediana;
– $% = limite inferior da classe que contém a mediana;
– a = amplitude do intervalo de classe;
– (% = frequência da classe que contém a mediana;
– ) = quantidade total de elementos;
– ,%-. = Frequência acumulada até a classe anterior à classe
que contém a mediana.
Cálculo da mediana para dados
agrupados em classes
Acompanhe cálculo da
mediana por interpolação
(onde se tem acesso aos
intervalos de valores das
classes dos dados)
Exercício 3 (trabalho)
Os dados abaixo referem-se ao número de dias de permanência de pacientes
em um hospital. Pede-se:
1. Calcule a média, a mediana e a moda do tempo de internação destes
pacientes.
2. Construa uma tabela de distribuição de frequências usando intervalos de 2
dias.
3. Recalcule a média, a mediana e a moda a partir da tabela acima.
4. Justifique as diferenças encontradas.
7 8 1 7 13 6
12 12 3 17 4 2
4 15 2 14 3 5
10 8 9 8 5 3
2 7 14 12 10 8
1 6 4 7 7 11
Exercício 4 (em classe)
• Você está procurando emprego para o próximo ano. As
empresas A e B são totalmente equivalentes a menos de suas
políticas de remuneração. As características de remuneração de
cada uma são resumidas na tabela a seguir:
Empresa A B
Média 2500 2000
Mediana 1700 1900
Moda 1500 1900
Empresa A B
Média 2500 2000
Mediana 1700 1900
Moda 1500 1900
Fim