Você está na página 1de 14

Faculdade de Ciências de Naturais e Matemática

Curso de Licenciatura em Ensino Básico


Estatística

Resumo III

Métodos Numéricos de Sumarização de Dados Estatísticos


Medidas de Tendência Central e de Tendência Não Central

- Média (aritmética);
- Mediana;
- Moda;
- Percentís.

Além dos métodos gráficos e tabulares de sumarização de dados estatísticos,


os métodos numéricos fornecem uma forma alternativa de sintetizar dados. As
medidas de posição (média, mediana, moda) são medidas estatísticas
amplamente usadas em Estatística Descritiva. São assim chamadas porque
geralmente, estas medidas ao serem determinadas, nos oferecem valores que
se localizam no centro do conjunto de dados.

Iniciaremos este breve resumo, pelo estudo das medidas acima propostas,
para o caso de dados não classificados, e finalizaremos com o cálculo das
mesmas medidas, para dados agrupados em intervalos.

1. Média aritmética ou simplesmente Média


Provavelmente, a medida de posição mais importante, seja a média de uma
variável. Ela fornece uma medida de posição central.
É importante tomar em conta que, se os dados são de uma amostra
__
( X 1 , ..., X n ) , a média é representada por X . E, se os dados são de uma

população, a média é representada por μ .

A média amostral, para uma amostra de dados ( X 1 , ..., X n ) é definida como


se segue:
__
1 n
X= ∑ X
n i=1 i
n

onde ∑i=1 X i =X 1+. ..+ X n .

Exemplo: Considere os seguintes dados referentes ao tamanho de turmas


para uma amostra de cinco turmas de uma faculdade:
46 54 42 46 32
Para esta amostra, supondo
X 1 =46 , X 2 =54 , X 3 =42 , X 4 =46 , X 5 =32 ,
tem-se a média amostral dada por
__
1 n 1
X = ⋅∑i=1 X i = ⋅( 46+54 +42+ 46+32 )=44
n 5
Assim, o tamanho médio das turmas da amostra é de 44 estudantes.

Observação: Se se conhece o tamanho da população e o mesmo é dado por


N, então a média populacional é dada por
1 N
μ= ⋅∑ i=1 X i
N

Observação: Se do conjunto de dados (), os mesmos são classificados de tal


forma que se obtenham k classes, a média aritmética é dada por:
k
__∑ f i Xi
X= i k
∑i f i
2. Mediana (Me)
A mediana é também uma medida de posição central de uma variável. É o
valor que fica no meio da sequência quando os dados estão arranjados em
ordem ascendente (do menor para o maior). Assim:
a) Para um número ímpar de observações, a mediana é o valor do meio.
b) Para um número par de observações, a mediana é a semi-soma (ou média
aritmética) dos dois valores do meio.

Exemplos:
(1) Em relação à amostra acima apresentada referente ao tamanho de cinco
turmas de uma faculdade os dados são:
4 5 4 4 3
6 4 2 6 2
Colocando-os em ordem ascendente, tem-se:
3 4 4 4 5
2 2 6 6 4
Então, a como o número de dados é impar (05), o valor central é o terceiro.

Portanto, é neste caso,


M e=46 , o que significa que na amostra
apresentada, pelo menos 50% das turmas têm no mínimo 46 estudantes.

(2) Os dados a seguir apresentados, são de uma amostra do salário inicial de


doze graduados de uma faculdade de Administração:

Graduado 1 2 3 4 5 6 7 8 9 10 11 12
Salário inicial
(USD) 2350 2450 2550 2380 2255 2210 2390 2630 2440 2825 2420 2380

Colocando os dados salariais em ordem ascendente, tem-se:


221 225 235 238 238 239 242 244 245 255 263 228
0 5 0 0 0 0 0 0 0 0 0 5

Visto que o número de observações é par, a mediana é a média aritmética


dos dois valores centrais (o sexto e o sétimo). Logo,
1
M e= ⋅(2390+2420 )=2405
2
Isso significa que, na amostra, pelo menos 50% dos graduados, têm um salário
inicial mínimo de 2405 USD.

Nota: Embora a média seja a medida de posição central mais comumente usada,
em algumas situações a mediana é preferida. A média é influenciada por valores
extremamente pequenos ou grandes.
Exemplo:
Um investigador tem dados do rendimento de 1000 famílias em um estudo. Os
dados variam entre 2800 e 78600 (u.m.). Por acidente o valor máximo introduzido
é 786000.
a) Este erro afecta a média? Se sim, por quanto? (Sim afecta. A verdadeira
média terá um acréscimo de 707,4)
b) Este valor afecta a mediana? Se sim, por quanto? (Não, não afecta. Neste
caso, a mediana é dada pela semi-soma dos dados nas posições 500 e 501,
após o ordenamento ascendente ou decrescente)

3. Moda (Mo)
A moda é também uma medida de posição. É por definição, o valor que ocorre
com maior frequência.
Exemplos:
(1) Em relação à amostra acima apresentada referente ao tamanho de cinco turmas
de uma faculdade os dados são:
46 54 42 46 32
Observa-se que o valor que ocorre maior frequência em relação aos demais é 46.

Então, nesse caso,


M o =46 .

Nota: Podem surgir casos em que a maior frequência ocorra em dois ou mais
valores diferentes. Nesses casos, existe mais de uma moda. Assim:
- Se os dados têm exactamente duas modas, diz-se que são bimodais.
- Se os dados têm mais de duas modas, diz-se que são multimodais.
Ora, nos casos multimodais, a moda quase nunca é considerada, porque¸
listar três ou mais modas não seria particularmente útil para descrever a
posição dos dados.

A moda é em particular uma medida de posição importante para dados


qualitativos.
(2) Considere a tabela a seguir apresentada, referente à distribuição de
frequência para a compra de refrigerantes num estabelecimento comercial:

Frequênci
Refrigerante a
Coca-cola 19
Coca-cola Light 8
Dr. Pepper 5
Pepsi-Cola 13
Sprite 5
Total 50

Observa-se através da mesma, que a moda ou o refrigerante mais comprado é


Coca-cola.

4. Percentís (Pp)
Por definição o p-ésimo percentil é um valor tal que pelo menos p porcento das
observações assumem esse valor ou menor e pelo menos (100 – p) porcento
das observações, assumem esse valor ou mais.

Como calcular o p-ésimo percentil (Pp)?


(1º) Arranje os dados em ordem ascendente.

(2º) Calcule um índice i, sendo


i= ( 100p ) n , onde p ( p=1,...,99) é o percentil
de interesse e n é a dimensão da amostra.

(3º) a) Se i não for um número inteiro, arredonde-o para cima. O próximo inteiro
maior que i indica a posição do p-ésimo percentil.
b) Se i é número inteiro, o p-ésimo percentil é a média aritmética dos dados nas
posições i e i+1.
Exemplo: Em relação aos dados acima apresentados sobre os salários iniciais
para a amostra de doze graduados de uma faculadade de administração,
calcule a) o 85º percentil (percentil 85), b) o 50º percentil.

Resolução: O ordenamento dos dados de forma ascendente é:

2210 2255 2350 2380 2380 2390 2420 2440 2450 2550 2630 2285

Ora,
i=( 85100 )⋅12=10 , 2 . Porque o valor encontrado de i é não inteiro (10,2)
usar-se-á i=11. Então, o percentil 85 (P85) é o valor na 11ª posição, no

ordenamento ascendente dos dados. Portanto,


P85=2630 . Isso significa
que na amostra, pelo menos 85% dos graduados, têm salário inicial de no
máximo 2630 USD.

4.1 Quartís (Qq)


Os quartís são percentís específicos; assim, as etapas para calcular os
percentís podem ser aplicadas directamente no cálculo dos quartís. Os quartís
dividem o conjunto de dados em quatro partes, cada uma contendo
aproximadamente 25% das observações. Deste modo:


Q1 =P 25


Q2 =P 50 e;


Q3 =P75

Exemplo: Em relação aos dados da amosta relativa aos doze salários iniciais,
acima apresentados. Calculem-se os quartís primeiro (Q1) e terceiro (Q3).
Resolução:
Q1 =P 25 , procurando o valor de i, tem-se:
( 25100 )⋅12=3 ⇒Q = 12⋅( 2350+2380)=2365
i= 1
, o que significa que na
amostra, pelo menos 25% dos graduados, têm um salário inicial de no
máximo 2365USD.

Como encontrar as medidas acima estudadas, quando os dados estão


agrupados em intervalos de classes?

Há um conjunto de técnicas próprias à considerar. Estudemos esses


casos com base num exemplo contextualizado.
Admita que um conjunto de alunos se distribui do seguinte modo, segundo os
respectivos escalões etários:
Escalão etário Número de alunos
18 - 20 5
20 - 22 10
22 - 24 12
24 - 26 8
26 - 28 3
Total 38

a) Calcule a média.
b) Encontre o valor modal.
c) Calcule o valor da mediana.
d) Qual é o terceiro quartil?

Resolução:
a)
Escalão Número de
etário alunos(fi) li Li Ci fi*Ci
18 - 20 5 18 20 19 95
20 - 22 10 20 22 21 210
22 - 24 12 22 24 23 276
24 - 26 8 24 26 25 200
26 - 28 3 26 28 27 81
Total 38 --------  --------  --------  862

Legenda: fi : frequência absoluta da classe i


li : limite inferior da classe i
Li: limite superior da classe i
Ci: ponto central da classe i
Neste caso, i=1,...,5 (porque há 05 classes) e,
5
∑ f i⋅C i 862
Média= i=15 = =22 ,68
38
∑i=1 i
f
b) Mo=?
Para o cálculo da moda, neste caso, pode-se usar a fórmula de King para
uma distribuição de frequências absolutas com intervalos de igual amplitude,
onde a moda é dada por:
f i +1
M o =l i + ⋅a
f i +1 +f i−1 i
sendo,
fi+1 : frquência absoluta da classe adjacente posterior à classe modal
fi-1 : frequência absoluta da classe adjacente anterior à classe modal
ai : amplitude (largura) da classe modal.
(Neste caso, importante identificar primeiro, a classe modal, aquela com
maior frequência)

No caso (exercício) em análise, a classe modal é a terceira, então, i=3 e,


f4 8
M o =l 3 + =22+ =22, 89
f 4+ f 2 8+10

Nota importante: Se se está perante um quadro de distribuição de


frequências absolutas com classes de amplitudes diferentes, a fórmula de
King para o cálculo da moda é definda como se segue:
f i +1
a i+1
M o =l i + ⋅a
f i +1 f i−1 i
+
a i+1 ai−1

c) Me=?
Neste caso, a mediana é dada por
n
−Fi −1
2
M e=l i + ⋅ai
fi
onde,
li : limite inferior da classe mediana
n : dimensão da amostra
Fi-1: frequência acumulada da classe adjacente anterior à classe mediana
fi : frequência absoluta da classe mediana
ai : amplitude da classe mediana

Escalão etário Número de alunos (fi) Fi


18 - 20 5 5
20 - 22 10 15
22 - 24 12 27
24 - 26 8 35
26 - 28 3 38
Total 38  -----------

A classe mediana é a que acumula até sí, a primeira metade do conjunto de


dados. No caso em análise, os primeiros 50% (isto é, as primeiras

n 38
= =19
2 2 obsevações) acumulam-se na classe 3, portanto, i=3 e,
n n 38
−F 3−1 −F 2 −15
2 2 2
M e=l 3 + .a 3=l3 + ⋅a 3=22+ ⋅2=22 , 67
f3 f3 27

d) Q3=?

Para dados classificados em intervalos, o q-ésimo quartil (i=1, 2, 3) é dado


por:
q
n⋅ −F i−1
4
Qq =li+ ⋅ai
fi
Precisamos antes, identificar a classe que acumula até sí, a correspondente
proporção de observações.

Observação: Para o caso do


Q3 a proporção correspondente é de
3
=0,75
4 .

Em relação ao exercício em análise, tem-se:

Escalão etário Número de alunos (fi) Fi fri Fri


18 - 20 5 5 0.13 0.13
20 - 22 10 15 0.26 0.39
22 - 24 12 27 0.32 0.71
24 - 26 8 35 0.21 0.92
26 - 28 3 38 0.08 1.00
Total 38  --------- 1.00  ---------

Facilmente observa-se no quadro acima, que, a classe que acumula até sí a


proporção de 0,75 é a quarta, portanto, nesse caso, i=4 e,
3 3
n⋅ −F 3 38⋅ −27
4 4
Q3 =l 4 + ⋅a 4 =24+ ⋅2=24 , 38
f4 8

Nota importante: Se os dados são classificados em intervalos e se dispõe


de frequências absolutas, a fórmula para o cálculo do p-ésimo percentil (Pp)
(com p=1,...,99) é dada por:
p
n⋅ −Fi−1
100
P p =l i + ⋅ai
fi

Referências bibliográficas:
• ANDERSON, David R. et al. Estatística Aplicada à Administração e Economia. 2ª ed, THOMSON, São
Paulo, 2003.
• KAZMIER, Leonard J. Estatística Aplicada à Economia e Administração. s/ed, Pearson Makron Books,
São Paulo, 2004.
• SAMPAIO, Eleutério et al. Exercícios de Estatística Descritiva para as Ciências Sociais. 1ª ed, Edições
Sílabo, Lda, Lisboa, 2003.
Exerícios

1. Suponha que parafusos a serem utilizados em tomadas eléctricas são


embaladas em caixas rotuladas como contendo 100 unidades. Em uma
construção, 10 caixas de um lote tiveram o número de parafusos contados,
fornecendo os valores 98, 102, 100, 100, 99, 97, 96, 95, 99 e 100. Calcule as
medidas resumo de posição (média, mediana e moda) para o número de
parafusos por caixa.

2. A incidência de doenças infecto-contagiosas num país X, num dado ano, é


apresentada a seguir. Que medida estatística (média, moda, mediana) você
usaria para descrever esta tabela? Justifique adequadamente sua resposta,
levando em conta a classificação da variável.
Doenças Nº de Casos
Aftosa 29.000
Brucelose 22.000
Tuberculose 19.000
Raiva 12.000
Leptospirose 10.000

3. Os dados que se seguem referem-se ao comprimento (em cm) de um grupo


de bebés prematuros (idade gestacional inferior a 36 semanas) nascidos
durante um mês numa maternidade.

29.9 40.2 37.8 19.7 30.0 29.7 19.4 39.2 24.7 20.4
19.1 34.7 33.5 18.3 19.4 27.3 38.2 16.2 36.8 33.1
41.4 13.6 32.2 24.3 19.1 37.4 23.8 33.3 31.6 20.1
17.2 13.3 37.7 12.6 39.6 24.6 18.6 18.0 33.7 38.2

a) Construa uma tabela de frequência para os dados.


b) Represente os dados através de um histograma com frequências relativas.
c) Calcule a média, moda e mediana para os dados.

4. Um grupo de adolescentes foi entrevistado sobre o número de vezes que


entravam no whatsaap por dia. Os resultados foram:
Nº de vezes
que usam o Nº de
WhatsApp por adolescentes
dia
0 47
1 29
2 13
3 8
Total 97

a) Qual o valor da moda desta informação? O que ela nos informa?


b) Qual é a mediana? O que ela significa?
c) Determine a média. Interprete.

5. O gráfico a seguir expressa o número de animais doentes encontrados num


levantamento de 350 propriedades rurais numa determinada cidade.

a) Classifique a variável em estudo.


b) Quantas propriedades apresentaram no máximo dois animais doentes?

c) Qual é o percentual de propriedades que apresentaram somente um animal


doente?
d) Qual é o percentual de propriedades que apresentaram pelo menos um animal
doente?
e) Qual foi a moda?
f) Determine a mediana.

6. A tabela abaixo apresenta a distribuição de frequência dos salários mensais


em meticais, de 74 empregados da companhia P & R.
Salários (Mt) Nº de Empregados
[500 , 600[ 10
[600 , 700[ 5
[700 , 800[ 8
[800 , 900[ 7
[900 , 1000[ 15
[1000 , 1100[ 20
[1100 , 1200[ 9
Total 74

a) Calcule as medidas de tendência central.


b) Para estes dados, construa o histograma com frequências absolutas

7. O salário médio anual de 1996-97 para os novos graduados em contabilidade


foi US$ 30393 (U.S. News and World Report, Dezembro de 1997). Uma amostra
dos salários anuais é apresentada a seguir. Os dados estão em milhares de
dólares:
30.7 28.8 29.1 31.1 30.1
29.7 30.7 30 30.6 30.5
31.2 32.1 30.2 30.3 32.9
32.2 29.9 28.9 30.6 31.8
32.2 30.3 30.4 32.3 33.3
32.7 29.3 30.3 30.9 30.3
a) Qual é o salário médio anual?
b) Qual é a mediana do salário anual?
c) Qual é a moda?
d) Qual é o primeiro quartil?
e) Qual é o terceiro quartil?
f) Esses dados são consistentes com o salário médio anunciado de US$ 30393?

FIM

Você também pode gostar