Escolar Documentos
Profissional Documentos
Cultura Documentos
MÉDIA VARIÂNCIA
TENDÊNCIA
MEDIANA
CENTRAL DESVIO-PADRÃO
MODA
MEDIDAS de MEDIDAS de
AMPLITUDE
LOCALIZAÇÃO DISPERSÃO
QUARTIS
TENDÊNCIA NÃO AIQ
CENTRAL ou QUANTIS DECIS
PARTIÇÃO
COEFICIENTE
PERCENTIS DE VARIAÇÃO
MEDIDAS de MEDIDAS de
COEFICIENTE DE ASSIMETRIA COEFICIENTE DE CURTOSE
ASSIMETRIA CURTOSE
MÉDIA
A média de uma amostra constituída pelos valores x1, x2, x3, … , xN designa-se por e
define-se pela expressão:
A média, medida de localização das mais empregues, é muitas vezes usada como valor
representativo de uma amostra ou do centro de uma distribuição.
A média pode ser pensada como o centro de massa dos valores das observações, isto é, o
ponto de equilíbrio após dispormos as observações sobre uma régua.
Pontos afastados ou erros nas observações podem afastar a média do grosso das
observações.
Sempre que possível deve calcular-se a média a partir dos dados não classificados. Mas se
o observador só dispõe dos dados classificados?
Ou seja,
Com :
xi Valor das variáveis observadas
ni Frequência absoluta
N Nº total de dados
fi Frequência relativa
Neste caso,
Com :
Ci Ponto médio da i-ésima classe
ni Frequência absoluta
N Nº total de dados
fi Frequência relativa
MEDIANA
A mediana de uma amostra é a principal concorrente da média como medida de
localização em distribuições com tendência central, sobretudo simétricas. Enquanto a
média (centro de gravidade) é calculada a partir de todas as observações a mediana
(centro posicional) é definida pela sua posição na sucessão ordenada das observações.
Quando os dados x1, x2,…, xN se ordenam diz-se que se calcularam as estatísticas de
ordem: x(1) ≤ x(2) ≤… ≤ x(N).
Grosso modo, a mediana ocupa o lugar central na sucessão das estatísticas de ordem.
Designando a mediana por M, Med ou X~ tem-se a seguinte definição:
N +1
Se N ímpar, x~ = x(k ) , sendo k =
2
x ( k ) + x ( k + 1)
Se N par, x~ = , sendo k = N
2 2
1º Ordenar os dados:
1 1 1 1 2 2 2 3 3 3 3 4 4 4 4 4 4 5 5 5 5 5 6 6 6
x(1) x(2) x(3) x(24) x(25)
2º N=25, ímpar
25 + 1 26
Logo o valor mediano é x = x( k )
~ , sendo k =
2
= = 13.
2
Med = M = x~ = x(13 ) = 4
EXEMPLO 1 (cont):
No caso dos dados estarem representados numa tabela de frequências temos que
localizar a mediana através das frequências absolutas ou relativas acumuladas.
b−a Med − a
=
F (b) − F (a) 0.5 − F (a)
X ni fi Ni Fi
[760;780[ 4 0,008 4 0,008
[780;800[ 43 0,086 47 0,094
[800;820[ 118 0,236 165 0,330
Classe Mediana [820:840[ 168 0,336 333 0,666
[840;860[ 117 0,234 450 0,900
[860;880[ 39 0,078 489 0,978
[880;900[ 11 0,022 500 1
TOTAL 500 1
MODA
A Moda é a medida de localização menos usada. De facto, para dados não classificados, a
moda define-se como o valor mais frequente. Como em amostras pequenas é improvável
haver repetições, a moda não faz sentido nesse caso. Em amostras grandes de uma variável
discreta a moda já pode fazer sentido.
Com dados agrupados de uma variável contínua, embora seja bastante fácil determinar a
classe modal, isto é, a classe com frequência mais elevada, o cálculo da moda dentro da
classe modal é feito por regras empíricas cujos resultados aproximados devem interpretar-
se com grandes cautelas.
A moda é a única medida de localização central que pode ser utilizada para dados numa
escala nominal.
Algumas considerações
Assim, não se pode dizer em termos absolutos qual destas medidas de localização é
preferível, dependendo do contexto em que estão a ser utilizadas. Em geral, a melhor
política é utilizar os dois parâmetros: média e mediana.
Quantil de ordem p (0≤ p ≤ 1), Qp, é um valor que divide a amostra em duas partes, tal
que à esquerda está a proporção p da amostra e à direita a proporção 1- p.
Quantil de ordem p, 0 < p < 1: tem como caso particular a mediana (Q0.5).
Quando o conjunto de dados ordenados é dividido em 4 partes iguais, os pontos de
divisão são chamados de quartis. Podemos ainda calcular os decis, percentis.
QUARTIS
Os quartis são os valores da variável observada que dividem a distribuição de frequências
em 4 partes iguais:
DECIS E PERCENTIS
Os decis são os valores da variável que dividem a distribuição em 10 partes iguais.
Os percentis dividem a distribuição em 100 partes iguais.
O número de decis é 9 (de D1 a D9) e o de percentis é 99 (de P1 a P99) .
Exemplo:
O terceiro decil D3 deixa pelo menos 30% das observações abaixo e pelo menos 70%
acima;
O quinto decil e o 50º percentil são a mediana;
O octogésimo percentil deixa pelo menos 80% das observações abaixo e pelo menos 20%
acima.
EXEMPLO 1: O editor de uma obra literária pretende estudar as idades dos leitores da
obra tendo obtido, numa amostra de 15 leitores, as seguintes respostas:
15 15 15 16 17 17 17 17 18 19 19 20 20 20 20
Q1: Q3:
Np=15*0,25=3,75 não é inteiro Np=15*0,75=11,25 não é inteiro
Q p = li Q p + ( ) ( ) a (Q )
np − N Q p − 1
n (Q )
p
p
Onde:
▪ li (Qp) – limite inferior da classe a que pertence o quantil
▪ p – ordem do quantil
▪ n – dimensão da amostra
▪ N(Qp-1) – frequência absoluta acumulada da classe anterior à classe a que pertence o quantil
▪ n(Qp) – frequência absoluta da classe a que pertence o quantil
▪ a(Qp) – amplitude da classe a que pertence o quantil
EXERCÍCIOS
25
26
Ponto médio Frequência relativa Frequência
Frequências
Salário Absolutas relativa
acumulada
0 + 25 20 0,2
[0, 25 [ 20 = 12,5 = 0, 2
2 100
0,2+0,4=0,6
25 + 50 40
= 0, 4
[25, 50[ 40 = 37,5
2 100
0,6+0,1=0,7
50 + 75 10
[50, 75[ 10 = 62,5 = 0,1
2 100
10 0,7+0,1=0,8
75 + 100 = 0,1
[75, 100[ 10
= 87,5
2 100
0,8+0,15=0,95
100 + 125 15
= 0,15
[100,125[ 15 = 112,5
2 100
5 0,95+0,05=1
125 + 150 = 0, 05
[125,150[ 5 = 137,5
2 100
TOTAL 100 27
a)
Média
20 × 12,5 + 40 × 37,5 + 10 × 62,5 + 10 × 87,5 + 15 × 112,5 + 5 × 137,5
𝑥ҧ =
100
5625
𝑥ҧ = 100
⇔ 𝑥ҧ = 56,25
Mediana
⇔ 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = 43,75
Moda
Classe modal: [25,50[
Então,
100−75 80 −75 25 5 5×0,1
= ⇔ = ⇔ ? −0,7 = ⇔ ? −0,7 = 0,02 ⇔ ? = 0,72
0,8−0,7 ? −0,7 0,1 ?−0,7 25
2
Variância ( s x ): N
s =
2
x
1
(
ix − x )2
N i =1
As unidades da variância são o quadrado das unidades da variável o que torna a sua
interpretação difícil. Por isso recorre-se à sua raiz quadrada a que se dá o nome de desvio
padrão (sx):
sx = s x2
Sendo uma média quadrática, não tem um significado muito concreto isoladamente, ainda
que seja exprimido nas mesmas unidades que a variável estatística. O seu significado
torna-se mais claro quando se comparam duas distribuições.
Cálculo prático da variância:
s =x −x
2
x
2 2
s x2 = x 2 − x 2
[140,145[ 142,5 3 3
[145,150[ 147,5 3 3
Total 100 100 %
3. Multiplicando por uma constante real k cada um dos valores observados xi, a
variância é multiplicada por k2 e o desvio-padrão por |k|.
Coeficiente de variação:
sx
cv =
x
Trata-se duma medida de dispersão relativa representada frequentemente em
percentagem. Mede a homogeneidade da distribuição.
Como não tem dimensão permite a comparação de dispersões de duas ou mais
distribuições em que as unidades da variável estatística são diferentes ou em que a
ordem de grandeza das médias são distintas. Somente se emprega quando a variável
toma valores de um só sinal.
Exemplo: para uma média de 50 e desvio padão de 10, tem-se um coeficiente de
variação de 20%.
Exemplo: Uma mesma peça é fornecida por dois fornecedores, A e B. A peça destina-se à
indústria automóvel e o seu diâmetro deve ser de 1,3 cm. Tanto o fornecedor A como o
B garantem estas dimensões no diâmetro médio das peças e estas são vendidas por
ambos ao mesmo preço. De modo a decidir qual o fornecedor a escolher, com base nas
garantias de qualidade oferecidas, o comprador recolheu uma amostra de 6 peças junto
de cada fornecedor, tendo medido o diâmetro de cada uma. Os resultados obtidos
encontram-se na tabela seguinte.
Amplitude (x)
É a diferença entre o maior e o menor dos valores observados As suas vantagens são ter
um significado simples e ser de cálculo extremamente rápido. Muito sensível a
valores extremos. É uma medida de dispersão muito imperfeita.
AIQ = Q3 − Q1
Mínimo
Minimum 1º Quartil
1st Mediana
Median 3º QuartilMaximum
3rd Máximo
Quartile Quartile
• Marcar o valor adjacente inferior → é o menor valor do conjunto dos dados (podendo
ser o mínimo) maior ou igual à barreira inferior;
• Marcar o valor adjacente superior → é o maior valor do conjunto dos dados (podendo
ser o máximo) menor ou igual à barreira superior.
• Marcar a mediana, primeiro e terceiro quartis (que vão permitir desenhar uma “caixa”)
e marcar os candidatos a “outliers”
EXERCÍCIOS
39
40
a)
Média:
25 + 27 + 37 + 32 + 40 + 22 + 19 + 30 + 24 + 26 + 13 + 17
𝑥ҧ =
12
𝑥ҧ = 26
Variância:
252 + 272 + 372 + 322 + 402 + 222 + 192 + 302 + 242 + 262 + 132 + 172
𝑥2 =
12
8802
𝑥2 = =733,5
12
𝑆= 𝑆 2 = 57,5 = 7,58
41
b)
42
43
Ponto médio Frequência relativa Frequência
Frequências
Salários Absolutas relativa
acumulada
2+4 5 0,0625
5 =3 = 0, 0625
[2, 4 [ 80
2
4+6 10 0,1875
[4, 6[ 10 =5 = 0,125
2 80
6+8 15
= 0,1875
0,375
[6, 8[ 15 =7
2 80
8 + 10 20
= 0, 25
0,625
[8, 10[ 20 =9 80
2
15 0,8125
10 + 12 = 0,1875
[10,12[ 15 = 11 80
2
12 + 14 9 0,925
[12,14[ 9 = 13 = 0,1125
2 80
14 + 16 6 1
[14,16[ 6 = 15 = 0, 075
2 80
TOTAL 80
44
a)
Média
5 × 3 + 10 × 5 + 15 × 7 + 20 × 9 + 15 × 11 + 9 × 13 + 6 × 15
𝑥ҧ =
80
722
𝑥ҧ = 80
⇔ 𝑥ҧ = 9,025
𝑆= 𝑆 2 = 3,2014
Coeficiente de variação
3,2014
cv = = 0,35 Logo a dispersão é elevada.
9,025
45
1.5.3. MEDIDAS DE ASSIMETRIA E ACHATAMENTO
Mo = Med = x
Mo Med x
Mo Med x
GESTÃO PÚBLICA | ESTATÍSTICA APLICADA
47
Assimetria
Platicúrtica – achatada
Leptocúrtica – alongada
EXERCÍCIOS
51
52
Ponto médio Frequência relativa Frequência
Frequências
Salário Absolutas relativa
acumulada
0,02
[35,38 [ 2 36,5 0,02
0,1
[38, 41[ 8
39,5 0,08
42,5 0,21 0,31
[41,44[ 21
0,6
[44, 47[ 29 45,5 0,29
0,84
48,5 0,24
[47,50[ 24
0,96
[50,53[ 12 51,5 0,12
1
54,5 0,04
[53,56[ 4
TOTAL 100
53
a)
Média
2 × 36,5 + 8 × 39,5 + 21 × 42,5 + 29 × 45,5 + 24 × 48,5 + 12 × 51,5 + 4 × 54,5
𝑥ҧ =
100
4601
𝑥ҧ = 100
⇔ 𝑥ҧ = 46,01
Mediana
⇔ 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 ≈ 45,96
Moda
Classe modal: [44,47[
55
b)
𝑄3 − 𝑄1
O coeficiente de achatamento é dado por: 𝑘=
2(𝑃90 − 𝑃10 )
Calculo de 𝑄1
Classe a que pertence 𝑄1 : [41,44[
100×0,25−10
𝑄1 = 41 + × 3=43,14
21
Calculo de 𝑄𝟑
Classe a que pertence 𝑄3 : [47,50[
100×0,75−60
𝑄3 = 47 + × 3=48,875
24
Calculo de 𝐏𝟗𝟎
Classe a que pertence 𝑃90 : [50,53[
100×0,90−84
𝑃90 = 𝑄0,90 = 50 + × 3= 51,5
12
56
Calculo de 𝐏𝟏𝟎
Classe a que pertence 𝑃10 : [38,41[
100×0,10−2
𝑃10 = 𝑄0,10 = 38 + × 3= 41
8
Então,
𝑄3 − 𝑄1 48,875 − 43,14 5,735
𝑘= = = = 0,273
2(𝑃90 − 𝑃10 ) 2(51,5 − 41) 21
57
3. Referências
• B. Murteira: Análise Exploratória de Dados, McGraw-Hill, 1999
• R. Guimarães, J. Sarsfield Cabral: Estatística, 2º Ed., McGraw-Hill, 2007.
• M. Berenson, D. Levine et al: Basic Business Statistics: Concepts and Applications,
Prentice Hall, 2004
• F. Galvão de Mello: Probabilidades e Estatística, Conceitos e Métodos Fundamentais,
Vol.1 e 2, Escolar Editora, 1997
• P.Newbold; W. L. Carlson; B. Thorne: Statistics for Business and Economics, Pearson
Higher Education, 2002
• D. Levine, T. Krehbiel, M.Berenson: Business Statistics, A First Course, Prentice-Hall,
2006
Internet
• ALEA - Acção Local de Estatística Aplicada: alea-estp.ine.pt
Apontamentos IPCA
• Professor Mário Basto, apontamentos leccionados na cadeira de Probabilidades e
Estatística.