Você está na página 1de 17

5 - MEDIDAS DE TENDÊNCIA CENTRAL

São medidas representativas das características avaliadas pelos seus valores


centrais, em torno dos quais tendem a concentrar-se os dados. Tais medidas
possibilitam comparações de séries de dados pelo confronto de seus valores. As
medidas de tendência centrais mais utilizadas são: média aritmética, moda e mediana.

5.1 MÉDIA

5.1.1 ARITMÉTICA ( X )
A média aritmética é obtida pela soma de todos os valores de uma variável X
̅ = 𝑋1 +𝑋2 +⋯+𝑋𝑛 = ∑ 𝑋𝑖
dividida pelo número total de observações (n): 𝑋
𝑛 𝑛
.
Ex.: Sabendo-se que o atendimento diário em uma empresa de arquitetura, durante
uma semana foi de 10, 14, 13, 15, 16, 18 e 12 pessoas, temos para atendimento médio
10  14  13  15  16  18  12
diário na semana de: X   14 pessoas.
7

Se os dados estão agrupados em uma distribuição de frequência, devem ser


consideradas duas possibilidades:
a) Sem intervalos de classe: Consideremos a distribuição relativa a 34 famílias de
quatro filhos, tomando para variável o número de filhos do gênero masculino.
Calcularemos a quantidade média de meninos por família:
Nº de meninos Nº de famílias ( f i )
0 2
1 6
2 10
3 12
4 4
Total 34

Como as frequências são números indicadores da intensidade de cada valor da


variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a
média aritmética ponderada, dada pela fórmula:
k
 (f i  X i ) k
f X  f X  ...  fk X k
X  1 1 2 2  i 1 em que f
i 1
i n
f1  f 2  ...  fk k
 fi
i 1

Que na prática pode ser determinado como:


xi fi xi.fi
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
Total 34 78
k
 X i  fi 
Logo X  i 1
k
 78/34 = 2,3  2
 fi
i 1

b) Com intervalos de classe: Neste caso, convencionamos que todos os valores


incluídos em um determinado intervalo de classe coincidem com o seu ponto médio,

e determinamos a média aritmética ponderada por meio da fórmula com X i agora


sendo o ponto médio da classe.

Exemplo: Calcular a altura média de bebês conforme a tabela abaixo.


Altura (cm) Frequência ( f i ) Ponto médio ( X i ) X i fi
50 |─ 54 4 52 208
54 |─ 58 9 56 504
58 |─ 62 11 60 660
62 |─ 66 8 64 512
66 |─ 70 5 68 340
70 |─ 74 3 72 216
Total 40 2.440
k
 fi  X i 
Aplicando a fórmula acima temos: X  i 1 2440
  61  X  61cm
k 40
 fi
i 1

5.1.2 Média Harmônica: equivale ao inverso da média aritmética dos inversos de n


valores. Utilizada para representação da média de um conjunto de valores que está
ligada a situações que envolvem grandezas inversamente proporcionais, por exemplo
a velocidade média, a vazão da água, a densidade, entre outras aplicações na física
𝑛 𝑛
e na química. 𝐻= 1 = 1 1 1
∑𝑛
𝑖=1𝑥 + +⋯+
𝑖 𝑥1 𝑥2 𝑥𝑛

5.1.3 Média Geométrica: é a raiz de ordem n do produto dos valores da amostra. Ela
é útil para representação de um conjunto que possui dados que se comportam próximo
1
a uma progressão geométrica. 𝐺 = (∏𝑛𝑖=1 𝑥𝑖 )𝑛 = 𝑛√𝑥1 ⋅ 𝑥2 ⋅ … ⋅ 𝑥𝑛
Relação entre as Médias: 𝐻 ≤ 𝐺 ≤ 𝑋̅
- A média geométrica e a média harmônica são menores, ou no máximo, iguais, à
aritmética.
- A igualdade só ocorre no caso em que todos os valores da amostra são idênticos.
- Quanto maior a variabilidade, maior será a diferença entre as médias harmônica e
geométrica e a média aritmética.
Exemplo: Para a amostra 12, 14, 16 temos: 13,81 < 13,90 < 14,00
3
Média harmônica: 𝐻 = 1 1 1 = 13,81
+ +
12 14 16
3
Média geométrica: 𝐺 = √12 ⋅ 14 ⋅ 16 = 13,90
12+14+16
Média aritmética: 𝑋̿ = = 14
3

5.2 MEDIANA ( M d )

Colocados os valores em ordem crescente de grandeza (rol), a mediana ( M d )

será o valor que ocupa a posição central da série de dados, ou seja, é o valor que
divide a série em duas partes com números iguais de elementos. A mediana é
preferível à média quando se está interessado em conhecer exatamente o centro da
distribuição dos dados, ou ainda, quando os valores extremos podem afetar
sensivelmente a média. O cálculo da mediana é feito sob duas condições:

5.2.1 A MEDIANA EM DADOS NÃO-AGRUPADOS


Dada uma série de valores como, por exemplo: {5, 2, 6, 13, 9, 15, 10}.
De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação
(crescente ou decrescente) dos valores: {2, 5, 6, 9, 10, 13, 15}.
O valor que divide a série acima em duas partes iguais é igual a 9, logo M d = 9.

i) Método prático para o cálculo da Mediana:


a) Se a série de dados tiver número ímpar de termos: O valor mediano será o termo
que ocupa a posição central do rol, ou seja, o termo cuja posição é dada pela fórmula:
(n + 1)/2
Ex: Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 2, 5}
1º - ordenar a série {0, 0, 1, 1, 2, 2, 3, 4, 5}
2º - calcular a posição: n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º
elemento da série ordenada será a mediana.
Portanto, a mediana será o 5º elemento, então M d = 2.
b) Se a série dada tiver número par de termos: O valor mediano será a média
aritmética dos valores centrais do rol, ou seja, os termos que ocupam a posição n/2 e
n/2+1
Ex: Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 3, 5, 6}
1º - ordenar a série {0, 0, 1, 1, 2, 3, 3, 4, 5, 6}
2º - calcular a posição: n = 10 logo a mediana será a média aritmética do termo que
ocupa a posição n/2 = 10/2 =5, ou seja, o 5º termo e do termo que ocupa a posição
n/2+1 = 10/2+1 = 6, ou seja, o 6º termo.
No rol: 5º termo = 2 e 6º termo = 3
A mediana será a média aritmética do 5º e 6º termos da série, ou seja = (2+3) / 2 ou
seja, M d = 2,5.

5.2.2 A MEDIANA EM DADOS AGRUPADOS


a) Sem intervalos de classe: Neste caso, é o bastante identificar a frequência
acumulada ( FAc ) imediatamente superior à metade da soma das frequências. A

mediana será o valor da variável que corresponde a tal frequência acumulada.


Exemplo: conforme distribuição de frequências abaixo:
Variável ( X i ) Frequência ( f i ) Frequência acumulada ( FAc (i ) )
0 2 2
1 6 8
2 9 17
3 13 30
4 5 35
Total 35 -

Quando o somatório das frequências for ímpar o valor mediano será o termo que

ocupa a posição dada pela fórmula:  fi  1  n  1


2 2
Como o somatório das frequências é 35 a fórmula ficará: (35+1)/2 = 18º termo.
Localizando na coluna da variável (Xi), Md  3 .

Quando o somatório das frequências for par o valor mediano será a média aritmética
dos valores centrais da distribuição, ou seja, o valor médio dos termos que ocupam a
 fi n  fi n
posição  e 1 1
2 2 2 2
Exemplo: Calcule a Mediana da distribuição de frequências abaixo:
Variável ( X i ) Frequência ( f i ) Frequência acumulada ( FAc (i ) )
12 2 2
14 5 7
15 8 15
16 12 27
17 7 34
20 6 40
Total 40 -

Localizando a posição da mediana na frequência acumulada teremos: 40/2 = 20º


termo e (40/2+1) = 21º termo. Localizando na coluna da variável (Xi), o 20º termo = 16
e o 21º termo = 16. Logo M d = (16 + 16) / 2 = 16.

b) Com intervalos de classe: Devemos seguir os seguintes passos:


1º) Determinamos as frequências acumuladas;
∑ 𝑓𝑖 𝑛
2º) Calculamos = para localizar a classe mediana;
2 2
3º) Marcamos a classe correspondente à frequência acumulada que contém o
∑ 𝑓𝑖
elemento . Tal classe será a classe mediana;
2
(𝑛/2)−𝐹𝐴𝑐
(𝐴𝑛𝑡)
4º) Calculamos a Mediana pela fórmula: 𝑀𝑑 = 𝑙 + [ ]×ℎ
𝑓

onde: 𝑙 = Limite inferior da classe da mediana;


𝐹𝐴𝑐(𝐴𝑛𝑡) = Frequência acumulada anterior à classe mediana;

𝑓 = Frequência simples da classe da mediana;


h = Intervalo de classe.

Ex.:
Classes Frequência ( f i ) Frequência acumulada (𝐹𝐴𝑐(𝑖) )
50 |─ 54 4 4 (1º, 2º, 3º, 4º)
54 |─ 58 9 13 (5º, 6º, ..., 13º)
58 |─ 62 11 24 (14º, 15º, ..., 24º)
62 |─ 66 8 32 (25º, 26º, ..., 32º)
66 |─ 70 5 37 (33º, 34º,..., 37º)
70 |─ 74 3 40 (38º, 39º, 40º)
Total 40 -

1º Localizar a classe mediana:


f i

40
 20º . A classe mediana será 58 |─ 62
2 2
2º Identificar os elementos da fórmula na classe mediana:
l i = 58; FAc(ant ) = 13; h = 4 e f i = 11;
20 13.  4  60,54
3º Substituindo esses valores na fórmula, obtemos: Md  58 
11
Obs: Esta mediana é estimada, pois não temos os 40 valores da distribuição.

5.3 MODA ( M o )

O valor modal, ou moda ( M o ) é o valor que ocorre com maior frequência ou o valor

que mais se repete. Quando a série de dados é tal que as frequências são maiores
nos extremos, ou quando se quer destacar um valor de alta frequência ou quando se
pretende obter uma medida rápida e aproximada da tendência central, a moda pode
então, ser considerada para a interpretação dos dados. Com relação à moda, uma
série de dados pode ser classificada em amodal (não possui moda), unimodal (possui
apenas uma moda), bimodal (possui duas modas) ou multimodal (possui mais de duas
modas).
5.3.1 Moda quando os dados não estão agrupados
A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor
que mais se repete.
Ex: Na série {7, 8, 9, 10, 10, 10, 11, 12} a moda é igual a 10.

Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça
mais vezes que outros.
Ex: {3, 5, 8, 10, 12} ou {2, 2, 5, 5, 10, 10} não apresentam moda. Séries amodais.

Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então,
que a série tem dois ou mais valores modais.
Ex: {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 } apresenta duas modas: 4 e 7. A série é bimodal.

5.3.2 A Moda quando os dados estão agrupados


a) Sem intervalos de classe: Uma vez agrupados os dados, é possível determinar
imediatamente a moda: basta localizar o valor da variável de maior frequência.

Ex: Qual a temperatura mais comum medida no mês abaixo:


Temperatura Frequência
0º C 3
1º C 9
2º C 12
3º C 6

Resp: 2º C é a temperatura modal, pois é a de maior frequência.

b) Com intervalos de classe: A classe que apresenta a maior frequência é denominada


classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor
dominante que está compreendido entre os limites da classe modal. O método mais
simples para o cálculo da moda consiste em tomar o ponto médio da classe modal.
Damos a esse valor a denominação de moda bruta M o  (li  ls ) / 2 .

onde li = limite inferior da classe modal e l s = limite superior da classe modal.

Exemplo: Calcule a altura modal conforme a tabela abaixo.


Altura (cm) Nº de Pessoas
54 |─ 58 9
58 |─ 62 11
62 |─ 66 8
66 |─ 70 5
Resposta: a classe modal é 58|─ 62, pois é a de maior frequência. li = 58 e l s = 62
M o = (58+62) / 2 = 60 cm (este valor é estimado, pois não conhecemos o valor real

da moda).

Método mais elaborado pela fórmula de CZUBER:


𝑓𝑀𝑜 −𝑓𝑎𝑛𝑡 𝑓𝑀𝑜 −𝑓𝑎𝑛𝑡
𝑀𝑜 = 𝑙𝑖 + [ ] × ℎ ou 𝑀𝑜 = 𝑙𝑖 + [2×𝑓 ]×ℎ
2×𝑓𝑀𝑜 −(𝑓𝑎𝑛𝑡 +𝑓𝑝𝑜𝑠𝑡 ) 𝑀𝑜 −𝑓𝑎𝑛𝑡 −𝑓𝑝𝑜𝑠𝑡

onde: li = Limite inferior da classe modal (a classe de maior frequência);

f Mo = Frequência da classe modal;

f ant = Frequência simples anterior à classe modal;

f post = Frequência simples posterior à classe modal;

h = Intervalo de classe.
Ex.: Calcule a Moda, da tabela do exemplo anterior, pelo processo de CZUBER
𝑓𝑀𝑜 −𝑓𝑎𝑛𝑡 11 − 9
𝑀𝑜 = 𝑙𝑖 + [ ] × ℎ = 58 + [ ] × 4 = 59,6
2 × 𝑓𝑀𝑜 − (𝑓𝑎𝑛𝑡 + 𝑓𝑝𝑜𝑠𝑡 ) 2 × 11 − (9 + 8)
Obs.: A moda é utilizada quando desejamos obter uma medida rápida e aproximada
de posição ou quando a medida de posição deva ser o valor mais típico da distribuição.
Já a média aritmética é a medida de posição que possui a maior estabilidade e a
mediana é a medida mais central.

Para distribuições simétricas, a média, mediana e moda são aproximadamente iguais.


Para assimétricas, temos a seguinte configuração:

̅ ) e mediana (𝑀𝑑 ) para as amostras a seguir é:


A relação entre média (𝑋
̅ = 𝑀𝑑
i) Distribuição Simétrica: 𝑋
̅ > 𝑀𝑑
ii) Distribuição Assimétrica à direita: 𝑋
̅ < 𝑀𝑑
iii) Distribuição Assimétrica à esquerda: 𝑋

5.4 MEDIDAS SEPARATRIZES


Além das medidas de posição que estudamos, há outras que, consideradas
individualmente, não são medidas de tendência central, mas estão ligadas à mediana
relativamente à sua característica de separar a série em partes que apresentam o
mesmo número de valores.
Essas medidas - os quartis, os decis e os percentis - são conhecidas pelo nome
genérico de separatrizes.

5.4.1 QUARTIS ( Qq ): Denominamos quartis os valores de uma série que a dividem

em quatro partes iguais. Precisamos portanto de 3 quartis (Q1 , Q2 e Q3) para dividir a
série em quatro partes iguais.
Obs: O quartil 2 ( Q2 ) SEMPRE SERÁ IGUAL A MEDIANA DA SÉRIE.

i) QUARTIS EM DADOS NÃO AGRUPADOS


O método mais prático é utilizar o princípio do cálculo da mediana para os 3
quartis. Na realidade serão calculadas “3 medianas” em uma mesma série.

Exemplo 1: Calcule os quartis da série: {5, 2, 6, 9, 10, 13, 15}


- O primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos
valores: {2, 5, 6, 9, 10, 13, 15}
- O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9 que
será = Q2 = 9.
- Temos agora {2, 5, 6} e {10, 13, 15} como sendo os dois grupos de valores iguais
proporcionados pela mediana (quartil 2). Para o cálculo do quartil 1 e 3 basta calcular
as medianas das partes iguais provenientes da verdadeira Mediana da série (quartil
2).
Logo em {2, 5, 6} a mediana é = 5. Ou seja: será o Quartil 2 = Q2 = 5
Em {10, 13, 15} a mediana é =13. Ou seja: será o Quartil 2 = Q2 = 13

Exemplo 2: Calcule os quartis da série: {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13}


A série já está ordenada, então calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5
O quartil 1 será a mediana da série à esquerda de Md: {1, 1, 2, 3, 5, 5}
Q1 = (2+3)/2 = 2,5
O quartil 3 será a mediana da série à direita de Md: {6, 7, 9, 9, 10, 13}
Q3 = (9+9)/2 = 9
ii) QUARTIS PARA DADOS AGRUPADOS EM CLASSES
A fórmula para determinação dos quartis para dados agrupados é semelhante
à usada para o cálculo da mediana.
Passos para Determinação do Quartil ( Qq ):
k
q   fi
1º passo: calcula-se a posição: p  i 1 q n;

4 4
2º passo: identifica-se a classe Qq pela coluna das Frequências Acumuladas;
3º passo: Aplica-se a fórmula:
 f  n
 q  i  FAc( ant )  q   FAc( ant )
Qq  l iQq  4 h  4  h , para q = 1, 2, 3
 fiQq  f
 
onde: liQq = Limite inferior da classe do Quartil;
FAc(ant) = Frequência acumulada anterior a classe do Quartil;
f iQ = Frequência simples da classe do Quartil;
q

h = Intervalo de classe.

Ex. 3 - Calcule os quartis da tabela abaixo:


Classes Frequência (fi) Frequência Acumulada
50 |─ 54 4 4
54 |─ 58 9 13
58 |─ 62 11 24
62 |─ 66 8 32
66 |─ 70 5 37
70 |─ 74 3 40
Total 40 -
O quartil 2 = M d , logo: p  2  40  20 . Logo.a classe mediana será 58 |─ 62
4
Como li = 58, FAc(ant) = 13, fi = 11, hi = 4, substituindo esses valores na fórmula,
 20  13 
obtemos: Q2  58     4  60,54  Md
 11 
 10  4 
O quartil 1: p  1 40  10  Q1  54     4  56,66
4  9 
 30  24 
O quartil 3: 3. fi / 4 = 30  Q3  62     4  65
 8 

5.4.2 DECIS ( Dd ): A definição dos decis obedece ao mesmo princípio dos quartis,

com a modificação da porcentagem de valores que ficam aquém e além do decil que
se pretende calcular. A fórmula básica será: k×fi /10 onde k é o número de ordem do
decil a ser calculado. Indicam-se os decis: D1, D2, ... , D9. Deste modo precisa-se de 9
decis para se dividir uma série em 10 partes iguais.
De especial interesse é o quinto decil, que divide o conjunto em duas partes
iguais. Assim sendo, o QUINTO DECIL É IGUAL AO SEGUNDO QUARTIL, que por
sua vez É IGUAL À MEDIANA.
Para D5 tem-se: 5. fi / 10 = fi / 2

Exemplo: Calcule o 3º decil da tabela anterior com classes.


k= 3 onde 3x (fi / 10) = 3 x 40/10 = 12.

Este resultado corresponde a 2ª classe. D3  54  12  4   4  54  3,55  57,55


 9 
5.4.3 PERCENTIL ( Pp ) ou CENTIL: Denomina-se percentis ou centis como sendo os

noventa e nove valores que separam uma série em 100 partes iguais. Indicamos: P 1,
P2, ... , P99. É evidente que P50 = Md; P25 = Q1 e P75 = Q3.
O cálculo de um centil segue a mesma técnica do cálculo da mediana, porém a
fórmula será: k×fi / 100, onde k é o número de ordem do centil a ser calculado.
Para P45 temos: 45×fi / 100

Relação entre as Medidas Separatrizes:


Uma relação importante entre as quatro Medidas Separatrizes é na verdade
uma relação até visual, que não precisamos fazer esforço para percebê-la, basta
traçar uma reta horizontal (que representará o conjunto de dados), e depois fazer as
divisões, como pode ser visto a seguir:
|-----------------------------|-----------------------------|
Md
|--------------|--------------|--------------|--------------|
Q1 Q2 Q3
|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|
D1 D2 D3 D4 D5 D6 D7 D8 D9
|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|
P10 P20 P30 P40 P50 P60 P70 P80 P90

Daí, concluí-se sem maiores dificuldades que: Md  Q2  D5  P50

6 - MEDIDAS DE DISPERSÃO

6.1 MEDIDAS DE DISPERSÃO ABSOLUTA


6.1.1 AMPLITUDE TOTAL: É a única medida de dispersão que não tem na média o
ponto de referência.
i) Quando os dados não estão agrupados a amplitude total é a diferença entre o maior

e o menor valor observado: AT  X Máx  X Mín .


Exemplo: Para os valores 40, 45, 48, 62 e 70: AT = 70 - 40 = 30.

ii) Quando os dados estão agrupados sem intervalos de classe ainda temos:
AT  X Máx  X Mín .
Ex.:
Xi fi
0 2
1 6 AT = 4 - 0 = 4
3 5
4 3

* Com intervalos de classe a AMPLITUDE TOTAL é a diferença entre o limite superior


da última classe e o limite inferior da primeira classe. Então:
AT  LMáx  LMín
Ex.:
Classes fi
4 |─ 6 6
6 |─ 8 2 AT = 10 – 4 = 6
8 |─10 3

A amplitude total tem o inconveniente de só levar em conta os dois valores


extremos da série, descuidando do conjunto de valores intermediários. Faz-se uso da
amplitude total quando se quer determinar a amplitude da temperatura em um dia, no
controle de qualidade ou como uma medida de cálculo rápido sem muita exatidão.

6.1.2 DESVIO QUARTIL: Também chamado de amplitude semi-interquatílica (ou


desvio interquartílico) é baseada nos quartis.
Símbolo: Dq e a Fórmula: Dq  (Q3  Q1 ) / 2

Obs:
1 - O desvio quartil apresenta como vantagem o fato de ser uma medida fácil de
calcular e de interpretar. Além do mais, não é afetado pelos valores extremos,
grandes ou pequenos, sendo recomendado, por conseguinte, quando entre os
dados figurem valores extremos que não se consideram representativos.
2 - O desvio quartil deverá ser usado preferencialmente quando a medida de tendência
central for a mediana.
3 - Trata-se de uma medida insensível à distribuição dos itens menores que Q1, entre
Q1 e Q3 e maiores que Q3.

Ex.: Para os valores: 40, 45, 48, 62 e 70 o desvio quartil será:


Q1 = (45+40)/2 = 42,5 Q3 = (70+62)/2 = 66 Dq = (66 - 42,5) / 2 = 11,75

6.1.3 DESVIO MÉDIO ABSOLUTO ( DM )


Para dados brutos: É a média aritmética dos valores absolutos dos desvios tomados
em relação a uma das seguintes medidas de tendência central: média ou mediana.
n
 ( xi  x )
a) Para a Média = DM  i  1 ;
n
n
 ( xi  Md )
b) Para a Mediana = DM  i  1
n

As barras verticais indicam que são tomados os valores absolutos, prescindindo do


sinal dos desvios.

Ex.: Calcular o desvio médio do conjunto de números {- 4, - 3, - 2, 3, 5}


X = - 0,2 e M d = - 2
Tabela auxiliar para cálculo do desvio médio
Xi 𝑋𝑖 − 𝑋̅ |𝑋𝑖 − 𝑋̅| 𝑋𝑖 − 𝑀𝑑 |𝑋𝑖 − 𝑀𝑑|
-4 (- 4) - (-0,2) = -3,8 3,8 (- 4) - (-2) = - 2 2
-3 (- 3) - (-0,2) = -2,8 2,8 (- 3) - (-2) = - 1 1
-2 (- 2) - (-0,2) = -1,8 1,8 (- 2) - (-2) = 0 0
3 3 - (-0,2) = 3,2 3,2 3 - (-2) = 5 5
5 5 - (-0,2) = 5,2 5,2 5 - (-2) = 7 7
= 16,8 = 15

Pela Média: DM = 16,8 / 5 = 3,36 Pela Mediana: DM = 15 / 5 = 3

6.1.4 DESVIO PADRÃO ( S )


É a medida de dispersão mais geralmente empregada, pois leva em
consideração a totalidade dos valores da variável em estudo. É um indicador de
variabilidade bastante estável. O desvio padrão baseia-se nos desvios em torno da
média aritmética e a sua fórmula básica pode ser traduzida como: a raiz quadrada da
média aritmética dos quadrados dos desvios e é representada por:
n
 (Xi  X )
2

S i 1
n
A fórmula acima é empregada quando tratamos de uma população de dados
não-agrupados.

Ex.: Calcular o desvio padrão da população representada por {-4, -3, -2, 3, 5}.
Como X = - 0,2, então:
𝑋𝑖 𝑋𝑖 − 𝑋̅ (𝑋𝑖 − 𝑋̅)2
-4 - 3,8 14,44
-3 - 2,8 7,84
-2 - 1,8 3,24
3 3,2 10,24
5 5,2 27,04
= 62,8

(Xi  X )
2
62,8
Sabe-se que n = 5 e 62,8/5 = 12,56. S    12,56  3,54
n 5
Obs: Quando nosso interesse não se restringe à descrição dos dados, mas partindo
da amostra, visamos tirar inferências válidas para a respectiva população, convém
efetuar uma modificação, que consiste em usar o divisor n - 1 em lugar de n. A fórmula

ficará então: S 
(X i  X )2
n 1

Se os dados {- 4 , -3 , -2 , 3 , 5} representassem uma amostra o desvio padrão amostral


será a raiz quadrada de 62,8 / (5 -1) = 3,96.
O desvio padrão detém algumas propriedades, dentre as quais destacamos:
1ª: Somando-se (ou subtraindo-se) uma constante a todos os valores de uma variável,
o desvio padrão não se altera.
2ª: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma
constante (diferente de zero), o desvio padrão fica multiplicado (ou dividido) por essa
constante.
Quando os dados estão agrupados (temos a presença de frequências) a fórmula do
∑(𝑋𝑖 −𝑋̅)2 ×𝑓𝑖 ∑(𝑋𝑖 −𝑋̅)2 ×𝑓𝑖
desvio padrão populacional será: 𝑆=√ ∑ 𝑓𝑖
=√
𝑛

 (X i  X )2 fi ∑(𝑋𝑖 −𝑋̅)2 ×𝑓𝑖 ∑(𝑋𝑖 −𝑋̅)2 ×𝑓𝑖


Para uma amostra: S  ou 𝑆=√ =√
 f i 1 ∑ 𝑓𝑖 −1 𝑛−1

Ex: Calcule o desvio padrão da tabela por pontos abaixo:

Xi f i Xi . f i ̅
𝑿𝒊 − 𝑿 ̅ )𝟐
(𝑿𝒊 − 𝑿 ̅ )𝟐 . 𝒇𝒊
(𝑿𝒊 − 𝑿
0 2 0 -2,1 4,41 8,82
1 6 6 -1,1 1,21 7,26
2 12 24 -0,1 0,01 0,12
3 7 21 0,9 0,81 5,67
4 3 12 1,9 3,61 10,83
Total 30 63 32,70
∑(𝑋𝑖 −𝑋̅)2 ×𝑓𝑖 32,70
Sabe-se que ∑ 𝑓𝑖 = 𝑛 = 30. Logo: 𝑆 = √ ∑ 𝑓𝑖
=√ = √1,09 = 1,044
30

Se considerar os dados como sendo de uma amostra o desvio padrão será:


∑(𝑋𝑖 −𝑋̅)2 ×𝑓𝑖 ∑ 32,70
𝑆=√ ∑ 𝑓𝑖 −1
=√ ≅ √1,128 = 1,062.
30−1

O desvio padrão pode ser calculado usando a seguinte fórmula prática:

( X i f i ) 2 ( X i f i ) 2
 X i fi   X i fi 
2 2

Para população: S  n Para uma amostra: S  n


 fi  fi  1

Ex: Calcule o desvio padrão do exemplo anterior:

𝑿𝒊 𝒇𝒊 𝑿𝒊 .𝒇𝒊 (𝑿𝒊 )𝟐 ( 𝑿 𝒊 ) 𝟐 . 𝒇𝒊
0 2 0 0 0
1 6 6 1 6
2 12 24 4 48
3 7 21 9 63
4 3 12 16 48
Total 30 63 165

(63)2
165−
Para uma população o Desvio padrão será: 𝐷𝑃(𝑋) = 𝑆 = √ 30 30 = √1,09 = 1,044.

(63)2
165−
Para uma amostra: 𝐷𝑃(𝑋) = 𝑆 = √ 30
= √1,128 = 1,062.
30−1

Obs.: Nas tabelas de distribuições de frequências com intervalos de classe a fórmula


a ser utilizada é a mesma, sendo 𝑋𝑖 o ponto médio do intervalo i.
Por exemplo:
Peso (Kg) Nº de Pessoas (fi) 𝑋𝑖 𝑋𝑖 × 𝑓𝑖 𝑋𝑖 − 𝑋̅ (𝑋𝑖 − 𝑋̅)2 (𝑋𝑖 − 𝑋̅)2 × 𝑓𝑖
50 |─ 54 4 52 208 -9 81 324
54 |─ 58 9 56 504 -5 25 225
58 |─ 62 11 60 660 -1 1 11
62 |─ 66 8 64 512 3 9 72
66 |─ 70 5 68 340 7 49 245
70 |─ 74 3 72 216 11 121 363
Total 40 - 2440 - - 1240
𝑋1 +𝑋2 +⋯+𝑋𝑛 ∑ 𝑋𝑖 2440
̅=
Média: 𝑋 = = = 61
𝑛 𝑛 40

11240
Desvio padrão: 𝐷𝑃(𝑋) = 𝑆 = √ = √31 ≅ 5,5678
40
2
6.2 VARIÂNCIA ( S ): É o desvio padrão elevado ao quadrado. A variância é uma
medida que tem pouca utilidade como estatística descritiva, porém é extremamente
importante na inferência estatística e em combinações de amostras.

6.3 COEFICIENTE DE VARIAÇÃO


É uma medida adimensional, útil para comparar variabilidades de diferentes
amostras, onde as médias são muito desiguais ou as unidades de medidas são
diferentes. O coeficiente de variação (CV) é o desvio padrão expresso em
porcentagem da média, isto é, magnitude relativa do desvio padrão quando
comparado com a média da distribuição das medidas; caracteriza a dispersão dos dados
em termos relativos a seu valor médio. O coeficiente é dado por:
Desvio Padrão S
CV(X) = × 100 = × 100
Média ̅
X
Ex.: Considere os resultados das estaturas e dos pesos de um mesmo grupo de
indivíduos:
Discriminação Média Desvio Padrão
ESTATURAS 175 cm 5,0 cm
PESOS 68 kg 2,0 kg
Qual medida (Estatura ou Peso) possui maior homogeneidade?

Resposta: Teremos que calcular o CV da Estatura e o CV do Peso. O resultado menor


será o de maior homogeneidade (menor dispersão ou variabilidade).
CV(estatura) = (5 / 175) x 100 = 2,85% e o CV(peso) = (2 / 68) x 100 = 2,94%.
Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão.

MEDIDAS DE ASSIMETRIA

As medidas de assimetria possibilitam analisar uma distribuição de acordo com as


relações entre suas medidas de moda, média e mediana, quando observadas
graficamente ou analisando apenas os valores;
Uma distribuição é dita simétrica quando apresenta o mesmo valor para a moda, a
média e a mediana; assimétrica quando essa igualdade não ocorre.
𝑋̅−𝑀𝑜
Coeficiente de assimetria de Pearson: 𝑆𝐾 = sendo −1 < 𝑆𝐾 < 1.
𝑆
Quando a cauda da curva da distribuição declina para Quando a cauda da curva da distribuição
direita, temos uma distribuição com curva assimétrica declina para esquerda, temos uma
positiva; Coeficiente > 0. distribuição com curva assimétrica negativa;
Coeficiente < 0.

MEDIDAS DE CURTOSE
Curtose significa o quanto de uma variável se encontra nas caudas da distribuição.
Não mede a forma do pico - mas sim o “peso” das caudas, ou dos extremos da curva.
Ou seja, é o grau de achatamento da distribuição. Ou o quanto uma curva de
frequência será achatada em relação a uma curva normal de referência.
4
𝑚4 ∑(𝑋𝑖 − 𝑋̅)
Coeficiente de curtose de Pearson: 𝑎4 = , onde 𝑚4 = .
𝑆4 𝑛
Pode ser: Mesocúrtica (𝑎4 = 3); Leptocúrtica (𝑎4 > 3); Platocúrtica (𝑎4 < 3).

Mesocúrtica Leptocúrtica

Platocúrtica

REFERENCIAS BIBLIOGRÁFICAS

1 - BARBETTA, Pedro Alberto. Estatística Aplicada às Ciências Sociais. 5. ed. -


Florianópolis: Ed. da UFSC, 2002.
2 - BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatística Básica. 5. ed. São
Paulo: Saraiva, 2002.
3 - DOWNING, Douglas; CLARK, Jeffrey. Estatística Aplicada. Tradução de Alfredo
Alves de Farias. 2. ed. São Paulo: Saraiva, 2002.

Você também pode gostar