Você está na página 1de 58

Estatística Aplicada

1.5. Medidas de:


• Localização;
• Dispersão;
• Assimetria e achatamento.
Medidas Resumo

As medidas resumo (também designadas medidas descritivas) caracterizam e descrevem


uma amostra:

MÉDIA VARIÂNCIA

TENDÊNCIA
MEDIANA
CENTRAL DESVIO-PADRÃO

MODA
MEDIDAS de MEDIDAS de
AMPLITUDE
LOCALIZAÇÃO DISPERSÃO
QUARTIS
TENDÊNCIA NÃO AIQ
CENTRAL ou QUANTIS DECIS
PARTIÇÃO
COEFICIENTE
PERCENTIS DE VARIAÇÃO

MEDIDAS de MEDIDAS de
COEFICIENTE DE ASSIMETRIA COEFICIENTE DE CURTOSE
ASSIMETRIA CURTOSE

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


2
✓ Medidas de localização: estas medidas "localizam" os valores observados.
Medidas de tendência central: média, moda e mediana
Medidas de tendência não central: quantis (quartis, decis, percentis)
✓ Medidas de dispersão: medem o grau de concentração ou dispersão dos valores
observados em torno das medidas de tendência central. Medem o grau de variabilidade
independentemente das causas.
Absolutas:
Distância: amplitude, amplitude interquartis
Comparação: desvio médio absoluto, variância, desvio padrão
Relativas: coeficiente de variação
✓ Medidas de assimetria: forma como os dados se “distribuem na horizontal”.
✓ Medidas de achatamento ou curtose: forma como os dados se “distribuem na vertical”.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


3
1.5.1. Medidas de Localização
Tendência Central

As medidas de localização de tendência central fornecem a ordem de grandeza da


variável estatística, caracterizada pelos valores da variável situados no centro da
distribuição.

MÉDIA

A média de uma amostra constituída pelos valores x1, x2, x3, … , xN designa-se por e
define-se pela expressão:

A média, medida de localização das mais empregues, é muitas vezes usada como valor
representativo de uma amostra ou do centro de uma distribuição.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


4
Média

A média pode ser pensada como o centro de massa dos valores das observações, isto é, o
ponto de equilíbrio após dispormos as observações sobre uma régua.
Pontos afastados ou erros nas observações podem afastar a média do grosso das
observações.

Pode em determinados casos mais sensível que a mediana às flutuações da amostragem,


já que é muito sensível a valores extremos, valores excecionais que se encontram nas
extremidades da distribuição a influenciam. As suas vantagens principais são ter um
significado concreto e prestar-se ao cálculo algébrico.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


5
Média

Sempre que possível deve calcular-se a média a partir dos dados não classificados. Mas se
o observador só dispõe dos dados classificados?

EXEMPLO 1: Dados discretos agrupados


A tabela abaixo apresenta as idades de 15 funcionários de um banco
Idade das pessoas Frequência Absoluta Frequência Relativa
39 7 0,47
41 2 0,13
43 4 0,27
45 2 0,13
Total 15 1

A idade média do grupo é dada por:

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


6
Média

Ou seja,

Com :
xi Valor das variáveis observadas
ni Frequência absoluta
N Nº total de dados
fi Frequência relativa

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


7
Média

EXEMPLO 2: Dados Agrupados em Classe


Pretende-se calcular o preço médio das habitações T2 numa cidade em 1993. Os dados são
apresentados na tabela abaixo:
Preço (contos) Frequência Absoluta Ponto médio
[13600, 14800[ 7 14200
[14800, 16000[ 15 15400
[16000, 17200[ 24 16600
[17200, 18400[ 27 17800
[18400, 19600[ 17 19000
Total 90

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


8
Média

Neste caso,

Com :
Ci Ponto médio da i-ésima classe
ni Frequência absoluta
N Nº total de dados
fi Frequência relativa

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


9
Medidas de Localização
Tendência Central

MEDIANA
A mediana de uma amostra é a principal concorrente da média como medida de
localização em distribuições com tendência central, sobretudo simétricas. Enquanto a
média (centro de gravidade) é calculada a partir de todas as observações a mediana
(centro posicional) é definida pela sua posição na sucessão ordenada das observações.
Quando os dados x1, x2,…, xN se ordenam diz-se que se calcularam as estatísticas de
ordem: x(1) ≤ x(2) ≤… ≤ x(N).

Grosso modo, a mediana ocupa o lugar central na sucessão das estatísticas de ordem.
Designando a mediana por M, Med ou X~ tem-se a seguinte definição:

N +1
Se N ímpar, x~ = x(k ) , sendo k =
2
x ( k ) + x ( k + 1)
Se N par, x~ = , sendo k = N
2 2

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


10
Mediana

EXEMPLO 1: Pretende-se determinar a mediana para os pontos obtidos em 25


lançamentos de um dado com os seguintes resultados:
1112223455445666133344455

1º Ordenar os dados:
1 1 1 1 2 2 2 3 3 3 3 4 4 4 4 4 4 5 5 5 5 5 6 6 6
x(1) x(2) x(3) x(24) x(25)

2º N=25, ímpar
25 + 1 26
Logo o valor mediano é x = x( k )
~ , sendo k =
2
= = 13.
2

 Med = M = x~ = x(13 ) = 4

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


11
Mediana

EXEMPLO 1 (cont):
No caso dos dados estarem representados numa tabela de frequências temos que
localizar a mediana através das frequências absolutas ou relativas acumuladas.

Pontos Frequência Absoluta Frequência Absoluta Acumulada


1 4 4
2 3 7
3 4 11
4 6 17
5 5 22
6 3 25

Considerando o exemplo anterior temos: 17 contém 13 logo Med=4.


No caso de frequências relativas acumuladas devemos determinar o valor em
percentagem ao qual corresponde a posição da mediana (50%).
Pontos Frequência Relativa Frequência Relativa Acumulada
1 0,16 0,16
2 0,12 0,28
3 0,16 0,44
4 0,24 0,68
5 0,20 0,88
6 0,12 1
GESTÃO PÚBLICA | ESTATÍSTICA APLICADA
12
Para dados agrupados em classes, recorre-se à curva de frequências relativas acumuladas
para estimar o valor da mediana no interior do intervalo mediano, tem-se:

b−a Med − a
=
F (b) − F (a) 0.5 − F (a)

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


13
Mediana

EXEMPLO 2 : Distribuição do peso de 500 cigarros “SG Filtro”

X ni fi Ni Fi
[760;780[ 4 0,008 4 0,008
[780;800[ 43 0,086 47 0,094
[800;820[ 118 0,236 165 0,330
Classe Mediana [820:840[ 168 0,336 333 0,666
[840;860[ 117 0,234 450 0,900
[860;880[ 39 0,078 489 0,978
[880;900[ 11 0,022 500 1
TOTAL 500 1

A mediana é o valor que corresponde à frequência relativa acumulada 0,50.


Esse valor corresponde à classe [820,840[.

840 − 820 Med − 820


=  Med = x~ = 830.12
0.666 − 0.330 0.5 − 0.330
GESTÃO PÚBLICA | ESTATÍSTICA APLICADA
14
Medidas de Localização
Tendência Central

MODA

A Moda é a medida de localização menos usada. De facto, para dados não classificados, a
moda define-se como o valor mais frequente. Como em amostras pequenas é improvável
haver repetições, a moda não faz sentido nesse caso. Em amostras grandes de uma variável
discreta a moda já pode fazer sentido.

Com dados agrupados de uma variável contínua, embora seja bastante fácil determinar a
classe modal, isto é, a classe com frequência mais elevada, o cálculo da moda dentro da
classe modal é feito por regras empíricas cujos resultados aproximados devem interpretar-
se com grandes cautelas.

A moda é a única medida de localização central que pode ser utilizada para dados numa
escala nominal.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


15
Moda

Fórmulas Empíricas para o cálculo da moda para variáveis agrupadas

Recorre-se ao histograma para estimar o valor da


moda no interior do intervalo modal:
h3 − h2 b − Mo
=
h3 − h1 Mo − a

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


16
Quando dois valores ocorrem com a mesma frequência, cada um deles é chamado de uma
moda, e o conjunto se diz BIMODAL .
Se mais de dois valores ocorrem com a mesma frequência máxima, cada um deles é uma
moda e o conjunto é MULTIMODAL .
Quando nenhum valor é repetido o conjunto não tem moda.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


17
Medidas de Localização
Tendência Central

Algumas considerações

A escolha das medidas varia consoante o objectivo pretendido, visto as diferentes


medidas possuírem diferentes propriedades

É necessário ser cauteloso em relação à medida de localização utilizada para representar


um conjunto de dados. A média é muito afectada por valores extremos. A mediana não é
tão sensível, como a média, às observações que são muito maiores ou muito menores do
que as restantes (outliers). Por outro lado a média reflete o valor de todas as
observações.

Assim, não se pode dizer em termos absolutos qual destas medidas de localização é
preferível, dependendo do contexto em que estão a ser utilizadas. Em geral, a melhor
política é utilizar os dois parâmetros: média e mediana.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


18
Medidas de Localização
Tendência NÃO Central

Quantil de ordem p (0≤ p ≤ 1), Qp, é um valor que divide a amostra em duas partes, tal
que à esquerda está a proporção p da amostra e à direita a proporção 1- p.

Quantil de ordem p, 0 < p < 1: tem como caso particular a mediana (Q0.5).
Quando o conjunto de dados ordenados é dividido em 4 partes iguais, os pontos de
divisão são chamados de quartis. Podemos ainda calcular os decis, percentis.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


19
Medidas de Localização
Tendência Não Central

QUARTIS
Os quartis são os valores da variável observada que dividem a distribuição de frequências
em 4 partes iguais:

Q1 – Primeiro Quartil – é o valor da variável observada tal que o nº de observações para


valores inferiores ou iguais a Q1 será de 25% e o nº de observações para valores
superiores ou igual a Q1 será de 75%.
Q2 – Segundo Quartil – é o valor da variável tal que metade das observações encontram-se
à sua esquerda e a outra metade à sua direita, logo, coincide com a mediana.
Q3 – Terceiro Quartil – è o valor da variável observada tal que o nº de observações para
valores inferiores ou iguais a Q3 será de 75% (3/4) e o nº de observações para valores
superiores ou iguais a Q3 será de 25% (1/4).

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


20
Medidas de Localização
Tendência Não Central

DECIS E PERCENTIS
Os decis são os valores da variável que dividem a distribuição em 10 partes iguais.
Os percentis dividem a distribuição em 100 partes iguais.
O número de decis é 9 (de D1 a D9) e o de percentis é 99 (de P1 a P99) .

Exemplo:
O terceiro decil D3 deixa pelo menos 30% das observações abaixo e pelo menos 70%
acima;
O quinto decil e o 50º percentil são a mediana;
O octogésimo percentil deixa pelo menos 80% das observações abaixo e pelo menos 20%
acima.

Relação entre Decis e Percentis

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


21
Quantis - cálculo

Para determinar os quantis, tal como ocorre na determinação da mediana, é necessário


ordenar os dados. Uma fórmula de cálculo , para dados desagregados, pode ser:

Onde [a] representa o maior inteiro contido em a.

EXEMPLO 1: O editor de uma obra literária pretende estudar as idades dos leitores da
obra tendo obtido, numa amostra de 15 leitores, as seguintes respostas:
15 15 15 16 17 17 17 17 18 19 19 20 20 20 20
Q1: Q3:
Np=15*0,25=3,75 não é inteiro Np=15*0,75=11,25 não é inteiro

Logo, Q1 = X([0,25X15]+1)=X(3+1)=X4=16 Logo, Q3 = X([0,75X15]+1)=X(11+1)=X(12)=20

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


22
Quantis - Cálculo

Nas situações em que os dados se encontram agrupados em classes, após identificar a


classe a que corresponde o quartil que pretendemos determinar, aplica-se a fórmula do
cálculo dos quantis para dados agrupados em classes.

Para dados agrupados em classes uma fórmula de cálculo dos quantis é:

Q p = li Q p + ( ) ( )  a (Q )
np − N Q p − 1
n (Q )
p
p

Onde:
▪ li (Qp) – limite inferior da classe a que pertence o quantil
▪ p – ordem do quantil
▪ n – dimensão da amostra
▪ N(Qp-1) – frequência absoluta acumulada da classe anterior à classe a que pertence o quantil
▪ n(Qp) – frequência absoluta da classe a que pertence o quantil
▪ a(Qp) – amplitude da classe a que pertence o quantil

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


23
Quantis - Cálculo

EXEMPLO 2: Estudou-se a distância em Km, percorrida em 6 anos, por 100 carros

Distâncias (em Frequências Frequências Frequências absolutas Frequências relativas


milhares de km) Absolutas Relativas (%) acumuladas acumuladas
[105;110[ 1 1 1 1
[110,115[ 1 1 2 2
[115;120[ 6 6 8 8
D2 [120,125[ 17 17 25 25
[125,130[ 22 22 47 47
Q3 e Med P77 [130,135[ 32 32 79 79
D9 [135,140[ 15 15 94 94
[140,145[ 3 3 97 97
P98 [ 145, 150[ 3 3 100 100 %
Total 100 100 %
A que classe pertence Q3? E a Mediana?
A que classe pertence D2? E D9?
A que classe pertence P77? E P98?

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


24
Medidas de Localização

EXERCÍCIOS

25
26
Ponto médio Frequência relativa Frequência
Frequências
Salário Absolutas relativa
acumulada

0 + 25 20 0,2
[0, 25 [ 20 = 12,5 = 0, 2
2 100
0,2+0,4=0,6
25 + 50 40
= 0, 4
[25, 50[ 40 = 37,5
2 100
0,6+0,1=0,7
50 + 75 10
[50, 75[ 10 = 62,5 = 0,1
2 100

10 0,7+0,1=0,8
75 + 100 = 0,1
[75, 100[ 10
= 87,5
2 100
0,8+0,15=0,95
100 + 125 15
= 0,15
[100,125[ 15 = 112,5
2 100

5 0,95+0,05=1
125 + 150 = 0, 05
[125,150[ 5 = 137,5
2 100
TOTAL 100 27
a)
Média
20 × 12,5 + 40 × 37,5 + 10 × 62,5 + 10 × 87,5 + 15 × 112,5 + 5 × 137,5
𝑥ҧ =
100
5625
𝑥ҧ = 100
⇔ 𝑥ҧ = 56,25

Mediana

Classe mediana: [25,50[

50−25 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 −25 25 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 −25 25×0,3


= ⇔ = ⇔ 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 − 25 =
0,6−0,2 0,5−0,2 0,4 0,3 0,4

⇔ 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = 43,75

Moda
Classe modal: [25,50[

Pelo método de King:


𝑓𝑝𝑜𝑠𝑡 10
Moda = 𝑙𝑖𝑚𝑖𝑛𝑓 + 𝑓 × ℎ = 25 + 10+20 × 25 = 33,33 3 . Então, Moda = 33, 33
𝑎𝑛𝑡 +𝑓𝑝𝑜𝑠𝑡
28
b)

“Metade dos indivíduos têm um salário inferior a ___ u.m”

Como a mediana é 43,75.


Metade dos indivíduos têm um salário inferior a 43,75 u.m

“__% dos indivíduos têm um salário inferior a 80 u.m”

80 u.m pertence a [75, 100[

Então,
100−75 80 −75 25 5 5×0,1
= ⇔ = ⇔ ? −0,7 = ⇔ ? −0,7 = 0,02 ⇔ ? = 0,72
0,8−0,7 ? −0,7 0,1 ?−0,7 25

Ou seja, 72% dos indivíduos têm um salário inferior a 80 u.m.


1.5.2 Medidas de Dispersão
A dispersão é outro aspeto importante a considerar quando se analisam amostras ou
distribuições de frequências.
Existem diferentes causas para a variabilidade dos dados. No planeamento duma
experiência pretende-se eliminar toda a variabilidade que não esteja relacionada com o
objetivo da mesma.
A dispersão deve definir-se tendo em conta a
posição das observações em relação a uma
referência fixa que, como é natural, deve ser o valor
escolhido para localizar a amostra ou a distribuição
empírica.
Quando a medida de localização escolhida é a
média esta deve ser tomada para referenciar a
dispersão das observações. Assim, sob esta
hipótese, uma medida de dispersão deve sintetizar
o comportamento do conjunto de desvios em
relação à média. Se há pouca dispersão os desvios
devem ser globalmente pequenos, caso contrário
devem ser globalmente grandes.
GESTÃO PÚBLICA | ESTATÍSTICA APLICADA
30
Medidas de Dispersão

2
Variância ( s x ): N
s =
2
x
1
(
 ix − x )2

N i =1

As unidades da variância são o quadrado das unidades da variável o que torna a sua
interpretação difícil. Por isso recorre-se à sua raiz quadrada a que se dá o nome de desvio
padrão (sx):

sx = s x2

Sendo uma média quadrática, não tem um significado muito concreto isoladamente, ainda
que seja exprimido nas mesmas unidades que a variável estatística. O seu significado
torna-se mais claro quando se comparam duas distribuições.
Cálculo prático da variância:

s =x −x
2
x
2 2

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


31
Medidas de Dispersão

EXEMPLO: Estudou-se a distância em Km, percorrida em 6 anos, por 100 carros.


Calcule da variância e o desvio-padrão.

Distâncias (em Frequências Frequências


Ponto médio (ci)
milhares de km) Absolutas Relativas (%)
[105,110[ 107,5 1 1
[110,115[ 112,5 1 1
[115;120[ 6 6 Como os dados estão
117,5
agrupados em classes para o
[120,125[ 122,5 17 17 cálculo da média e variância
[125,130[ 127,5 22 22 utiliza-se como representante
[130,135[ 132,5 32 32 da classe o ponto médio, ci.
[135,140[ 137,5 15 15

s x2 = x 2 − x 2
[140,145[ 142,5 3 3
[145,150[ 147,5 3 3
Total 100 100 %

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


32
Medidas de Dispersão

PROPRIEDADES DA VARIÂNCIA E DO DESVIO PADRÃO

1. A variância e o desvio padrão tomam sempre valores não negativos

2. Somando ou subtraindo uma constante real k a cada um dos valores


observados xi, a variância e o desvio-padrão não se alteram.

3. Multiplicando por uma constante real k cada um dos valores observados xi, a
variância é multiplicada por k2 e o desvio-padrão por |k|.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


33
Medidas de Dispersão

Coeficiente de variação:
sx
cv =
x
Trata-se duma medida de dispersão relativa representada frequentemente em
percentagem. Mede a homogeneidade da distribuição.
Como não tem dimensão permite a comparação de dispersões de duas ou mais
distribuições em que as unidades da variável estatística são diferentes ou em que a
ordem de grandeza das médias são distintas. Somente se emprega quando a variável
toma valores de um só sinal.
Exemplo: para uma média de 50 e desvio padão de 10, tem-se um coeficiente de
variação de 20%.

De modo geral considera-se que:


Dispersão reduzida CV ≤ 10 %
Dispersão moderada 10%< CV ≤ 30%
Dispersão elevada CV > 30%

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


34
Medidas de Dispersão

Exemplo: Uma mesma peça é fornecida por dois fornecedores, A e B. A peça destina-se à
indústria automóvel e o seu diâmetro deve ser de 1,3 cm. Tanto o fornecedor A como o
B garantem estas dimensões no diâmetro médio das peças e estas são vendidas por
ambos ao mesmo preço. De modo a decidir qual o fornecedor a escolher, com base nas
garantias de qualidade oferecidas, o comprador recolheu uma amostra de 6 peças junto
de cada fornecedor, tendo medido o diâmetro de cada uma. Os resultados obtidos
encontram-se na tabela seguinte.

Pode-se verificar a partir da tabela que

Porém, sA=0,16 cm e sB = 0,37 cm.

Sendo assim cvA=12% e cvB=28% pelo que se pode


concluir que as peças do fornecedor A terão diâmetros
mais uniformes, optando-se então pelo fornecedor A.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA 35


Medidas de Dispersão

Amplitude (x)

x = x(N) - x(1) , i.e, x= Max(xi)-Min(xi) , i=1,.., N

É a diferença entre o maior e o menor dos valores observados As suas vantagens são ter
um significado simples e ser de cálculo extremamente rápido. Muito sensível a
valores extremos. É uma medida de dispersão muito imperfeita.

Amplitude interquartis (AIQ):

AIQ = Q3 − Q1

O intervalo interquartis compreende 50% das observações centrais. As suas vantagens


são ter um significado simples e ser simples de calcular. Elimina as observações mais
extremas. É uma medida de robusta de dispersão mas ainda muito imperfeita.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


36
Caixa de Bigodes

O Diagrama de extremos e quartis ou Caixa de Bigodes ( do inglês Box Plot ou Box-and-


whisker Plot) é uma representação gráfica que permite facilmente interpretar a
localização e a dispersão de um conjunto de dados, efectuando em simultâneo a sua
síntese.
Neste gráfico podem ainda identificar-se observações que se afastam do padrão geral dos
dados - são candidatos a outliers.
Existem variações para este tipo de gráfico. Para uma das formas mais comum apresenta
as seguintes características:
•Permite apresentar graficamente os dados através de 5 medidas, as quais são geralmente: o valor
mínimo, o 1º quartil, a mediana, o 3º quartil e o valor máximo.
•A caixa (o intervalo interquartis) contém 50% das observações centrais.
•A mediana está assinalada no interior da caixa, e não estando no centro desta, indica que os dados
são enviesados (assimétricos).

Mínimo
Minimum 1º Quartil
1st Mediana
Median 3º QuartilMaximum
3rd Máximo
Quartile Quartile

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


37
Diagrama de Extremos e Quartis

Como desenhar uma caixa de bigodes considerando outliers?

• Marcar o valor adjacente inferior → é o menor valor do conjunto dos dados (podendo
ser o mínimo) maior ou igual à barreira inferior;
• Marcar o valor adjacente superior → é o maior valor do conjunto dos dados (podendo
ser o máximo) menor ou igual à barreira superior.
• Marcar a mediana, primeiro e terceiro quartis (que vão permitir desenhar uma “caixa”)
e marcar os candidatos a “outliers”

Quando se pretende comparar várias amostras, o


recurso a caixas de bigodes paralelas é uma
ferramenta muito útil. Permite de forma fácil
obter uma primeira interpretação e comparação
dos conjuntos de dados.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


38
Medidas de dispersão

EXERCÍCIOS

39
40
a)

Média:
25 + 27 + 37 + 32 + 40 + 22 + 19 + 30 + 24 + 26 + 13 + 17
𝑥ҧ =
12

𝑥ҧ = 26

Variância:

252 + 272 + 372 + 322 + 402 + 222 + 192 + 302 + 242 + 262 + 132 + 172
𝑥2 =
12
8802
𝑥2 = =733,5
12

𝑆 2 =733,5 – 262 = 57,5

𝑆= 𝑆 2 = 57,5 = 7,58

Portanto, 𝑥ҧ = 26 minutos, 𝑆 2 = 57,5 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 2 e 𝑆 = 7,58 𝑚𝑖𝑛𝑢𝑡𝑜𝑠

41
b)

Como o relógio estava adiantado 2 minutos, temos que:

𝑥ҧ = 28 minutos, 𝑆 2 = 57,5 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 2 e 𝑆 = 7,58 𝑚𝑖𝑛𝑢𝑡𝑜𝑠

42
43
Ponto médio Frequência relativa Frequência
Frequências
Salários Absolutas relativa
acumulada
2+4 5 0,0625
5 =3 = 0, 0625
[2, 4 [ 80
2

4+6 10 0,1875
[4, 6[ 10 =5 = 0,125
2 80

6+8 15
= 0,1875
0,375
[6, 8[ 15 =7
2 80

8 + 10 20
= 0, 25
0,625
[8, 10[ 20 =9 80
2
15 0,8125
10 + 12 = 0,1875
[10,12[ 15 = 11 80
2
12 + 14 9 0,925
[12,14[ 9 = 13 = 0,1125
2 80

14 + 16 6 1
[14,16[ 6 = 15 = 0, 075
2 80
TOTAL 80
44
a)
Média
5 × 3 + 10 × 5 + 15 × 7 + 20 × 9 + 15 × 11 + 9 × 13 + 6 × 15
𝑥ҧ =
80
722
𝑥ҧ = 80
⇔ 𝑥ҧ = 9,025

Variância e Desvio Padrão


32 × 5 + 52 × 10 + 72 × 15 + 92 × 20 + 112 × 15 + 132 × 9 + 152 × 6
𝑥2 =
80
7336
𝑥2 = =91,7
80

𝑆 2 =91,7 – (9,025)2 = 10,25

𝑆= 𝑆 2 = 3,2014

Coeficiente de variação

3,2014
cv = = 0,35 Logo a dispersão é elevada.
9,025

45
1.5.3. MEDIDAS DE ASSIMETRIA E ACHATAMENTO

A assimetria de uma distribuição pode avaliar-se através de medidas de


assimetria absoluta e relativa.

Uma distribuição de frequências diz-se simétrica


quando os valores da moda, de média e da
mediana coincidem entre si. O histograma
seguinte representa uma distribuição simétrica.

Mo = Med = x

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


46
Assimetria

Quando o valor da moda é inferior ao da


mediana que, por sua vez, possui um valor
menor que a média, a distribuição diz-se
assimétrica positiva ou assimétrica à direita:

Mo  Med  x

Quando o valor da moda é superior ao da


mediana que, por sua vez, possui um valor
superior ao da média, a distribuição diz-se
assimétrica negativa ou assimétrica à
esquerda :

Mo  Med  x
GESTÃO PÚBLICA | ESTATÍSTICA APLICADA
47
Assimetria

A assimetria é fácil de determinar graficamente, podendo dizer-se se uma distribuição é


simétrica ou assimétrica (positiva ou negativa) pelo aspecto do seu histograma. Quando
não se dispõem de meios gráficos o grau de assimetria de uma distribuição pode ser
medido utilizando indicadores:

Grau de assimetria de Pearson:


Diz-se que a distribuição é: x − Mo
✓ Simétrica se G=0
G=
sx
✓ Assimétrica à direita se G >0
✓ Assimétrica à esquerda se G<0

Assimétrica à esquerda Simétrica Assimétrica à direita

Caixa de Bigodes e Assimetria

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA 48


2. Curtose ou Achatamento

As medidas de curtose dão uma indicação da intensidade das frequências na vizinhança


dos valores de tendência central, por comparação com a distribuição Normal (ver slide 7).

Coeficiente de achatamento ou curtose:

Diz-se que é uma distribuição com:

✓ Distribuição com achatamento igual ao da distribuição normal (distribuição


mesocúrtica): se K=0,263.

✓ Distribuição com achatamento inferior ao da distribuição normal (distribuição


leptocúrtica): se K < 0,263.

✓ Distribuição com achatamento superior ao da distribuição normal (distribuição


platicúrtica) se K > 0.263.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


49
Mesocúrtica – normal.
Nem achatada, nem alongada

Platicúrtica – achatada

Leptocúrtica – alongada

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


50
Medidas de assimetria e achatamento

EXERCÍCIOS

51
52
Ponto médio Frequência relativa Frequência
Frequências
Salário Absolutas relativa
acumulada
0,02
[35,38 [ 2 36,5 0,02

0,1
[38, 41[ 8
39,5 0,08
42,5 0,21 0,31
[41,44[ 21

0,6
[44, 47[ 29 45,5 0,29

0,84
48,5 0,24
[47,50[ 24

0,96
[50,53[ 12 51,5 0,12

1
54,5 0,04
[53,56[ 4

TOTAL 100
53
a)
Média
2 × 36,5 + 8 × 39,5 + 21 × 42,5 + 29 × 45,5 + 24 × 48,5 + 12 × 51,5 + 4 × 54,5
𝑥ҧ =
100
4601
𝑥ҧ = 100
⇔ 𝑥ҧ = 46,01

Mediana

Classe mediana: [44,47[

47−44 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 −44 3 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 −44 3×0,19


= ⇔ = ⇔ 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 − 44 =
0,6−0,31 0,5−0,31 0,29 0,19 0,29

⇔ 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 ≈ 45,96

Moda
Classe modal: [44,47[

Pelo método de King:


𝑓𝑝𝑜𝑠𝑡 24
Moda = 𝑙𝑖𝑚𝑖𝑛𝑓 + 𝑓 × ℎ = 44 + 21+24 × 3 = 45,6 . Então, Moda = 45,6
𝑎𝑛𝑡 +𝑓𝑝𝑜𝑠𝑡
54
Como

Moda < Mediana < Média

A distribuição é assimétrica à direita

55
b)
𝑄3 − 𝑄1
O coeficiente de achatamento é dado por: 𝑘=
2(𝑃90 − 𝑃10 )

Calculo de 𝑄1
Classe a que pertence 𝑄1 : [41,44[
100×0,25−10
𝑄1 = 41 + × 3=43,14
21

Calculo de 𝑄𝟑
Classe a que pertence 𝑄3 : [47,50[
100×0,75−60
𝑄3 = 47 + × 3=48,875
24

Calculo de 𝐏𝟗𝟎
Classe a que pertence 𝑃90 : [50,53[
100×0,90−84
𝑃90 = 𝑄0,90 = 50 + × 3= 51,5
12

56
Calculo de 𝐏𝟏𝟎
Classe a que pertence 𝑃10 : [38,41[
100×0,10−2
𝑃10 = 𝑄0,10 = 38 + × 3= 41
8

Então,
𝑄3 − 𝑄1 48,875 − 43,14 5,735
𝑘= = = = 0,273
2(𝑃90 − 𝑃10 ) 2(51,5 − 41) 21

Como o coeficiente de achatamento é 0,273, superior a 0,263, a distribuição é


platicúrtica ou achatada.

57
3. Referências
• B. Murteira: Análise Exploratória de Dados, McGraw-Hill, 1999
• R. Guimarães, J. Sarsfield Cabral: Estatística, 2º Ed., McGraw-Hill, 2007.
• M. Berenson, D. Levine et al: Basic Business Statistics: Concepts and Applications,
Prentice Hall, 2004
• F. Galvão de Mello: Probabilidades e Estatística, Conceitos e Métodos Fundamentais,
Vol.1 e 2, Escolar Editora, 1997
• P.Newbold; W. L. Carlson; B. Thorne: Statistics for Business and Economics, Pearson
Higher Education, 2002
• D. Levine, T. Krehbiel, M.Berenson: Business Statistics, A First Course, Prentice-Hall,
2006

Internet
• ALEA - Acção Local de Estatística Aplicada: alea-estp.ine.pt

Apontamentos IPCA
• Professor Mário Basto, apontamentos leccionados na cadeira de Probabilidades e
Estatística.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


58

Você também pode gostar