Escolar Documentos
Profissional Documentos
Cultura Documentos
Média aritmética
A média aritmética é, simplesmente, a soma de todos os números dividida
pela quantidade dos mesmos. O símbolo µ (a letra grega mu) é usado para
representar a média de uma população, que é um parâmetro. Os símbolos
(pronunciado “xis barra”) ou M representam a média de uma amostra, que
é uma estatística.
Estatística 39 UAB
Em que x é a soma de todos os números, ou valores, em uma amostra e n é
a quantidade de números, ou valores, nessa amostra.
37 33 33 32 29 28 28 23
22 22 22 21 21 21 20 20
19 19 18 18 18 18 16 15
14 14 14 12 12 9 6
Com esses valores, podemos calcular a média de chutes a gol dos times nes-
se campeonato, usando a fórmula acima:
Para valores contínuos, que possuem números não inteiros (como altura ou
peso), a média aritmética é muito mais acurada, representando um valor
possível de ocorrer. Em muitos casos, a melhor medida de tendência central
para uma variável discreta, como a acima, não é a média, mas uma das ou-
tras medidas que veremos a seguir.
Por exemplo, na distribuição 11, 12, 13, 16, 17, 20 e 25, a mediana é igual
a 16, pois é o valor que está, exatamente, no meio da distribuição:
4a posição.
Mas atenção: essa fórmula serve para localizar a posição da mediana e não,
o seu valor que se encontrará na posição indicada pela fórmula, quando os
dados forem organizados em ordem crescente.
Estatística 41 UAB
Se o número de dados da amostra é par, a mediana é o ponto da distribui-
ção que é antecedido e precedido por igual número de dados, mesmo que
seu valor específico não figure entre os dados, pois em um número par de
dados, há dois valores centrais. Por exemplo, na distribuição 11, 12, 13, 16,
17, 20, 25 e 26, podemos usar a fórmula acima:
Assim, a mediana da série é 16,5, apesar desse valor não existir na série em
questão.
O fato de a mediana ser uma posição a torna inadequada para certas bases
de dados. Por exemplos, para a série 1, 2, 3, 100, 200, 300, a mediana seria
3+100/2 = 51,5, o que a deixa muito mais perto dos valores menores da
série e bem distante dos maiores.
Já a média aritmética seria 606/6 = 101 e dá uma ideia mais adequada desse
grupo de dados. A mediana é ideal, no entanto, para descrever a tendência
central de um grupo de dados proporcionais ou em porcentagem, já que
esses ficarão entre 0 e 1 ou 0 e 100.
Moda
A terceira é última medida de tendência central é a moda, que consiste sim-
plesmente no valor que ocorre mais frequentemente.
Medidas de dispersão
Vimos como podemos verificar quais os valores mais comuns em uma variá-
vel, usando as medidas de tendência central. Mas sem sabermos algo sobre
como os dados estão dispersos, as medidas de tendência central podem dar
uma impressão errada da variável.
Estatística 43 UAB
Por exemplo, uma rua residencial há 20 casas com um valor médio de R$
200.000,00, mas com pouca variação entre os preços, seria muito diferente
de uma rua cujas 20 casas têm o mesmo valor médio, mas que três casas
valem R$1.000.000,00 e as outras 17 custam cerca de R$ 60.000,00.
As medidas de dispersão dão uma visão mais completa e nos fazem enten-
der melhor o tamanho da variação dos dados. Elas incluem a amplitude, o
desvio médio, a variância e o desvio padrão.
Amplitude
A mais simples medida de dispersão é a amplitude que é calculada, sim-
plesmente, tomando-se a diferença entre os valores máximo e mínimo do
conjunto de dados.
Desvio médio
Para se ter uma melhor compreensão da distribuição dos dados em uma
amostra, os valores residuais são utilizados para calcular o quanto cada
ponto de dados está afastado dos valores esperados em uma distribuição.
Esses resíduos podem ser calculados com base nas diferenças entre cada
ponto de dados e a média, ou através de valores estimados através de, por
exemplo, um cálculo de regressão, que veremos mais tarde.
ou
= média da amostra;
Variância
Uma maneira de resolver o problema que o desvio médio apresenta é usar a
variância como medida de dispersão.
Estatística 45 UAB
Lemos a fórmula como o somatório da diferença entre cada valor e a média,
ao quadrado, dividida pelo número de valores, menos um.
60 74 58 61 56
55 54 57 65 42
As fábricas, que produziram menos que 58,2 toneladas de detritos por ano,
terão desvios da média com valores negativos; esse é o problema que vimos
sobre o uso do desvio médio como uma medida de dispersão: se somarmos
todos os valores da coluna preenchida, a soma será zero.
Desvio Padrão
A variância dá a ideia da amplitude da distribuição, mas como seu resultado
é um valor ao quadrado, precisamos saber qual o desvio da média em geral,
usando uma unidade igual à unidade da variável.
Estatística 47 UAB
No nosso exemplo, precisamos saber qual o desvio geral da média em tone-
ladas de detritos por ano. Assim, devemos usar o desvio padrão, cujo resul-
tado é dado na mesma unidade da variável.
Com estas duas medidas, estamos descrevendo a maioria dos dados que
analisamos. De volta ao nosso exemplo, se subtrairmos o desvio padrão da
média, teremos o valor de 50,01 toneladas/ano; se somarmos os valores, o
resultado é de 66,39 toneladas/ano. Vamos ver quanto dos nossos dados
estão entre 50,01 e 66,39:
42 – 54 – 55 – 56 – 57 – 58 – 60 – 61 – 65 – 74
Alguns desses editores servem apenas como base para que sejam listados os
dados, para depois serem transferidos a programas estatísticos, que realizam
os cálculos. Outros editores possuem funções que permitem o cálculo de
estatísticas básicas, como as medidas de tendência central e de dispersão. O
mais popular dos editores de planilhas é o Excel da Microsoft, que apresenta
várias funções estatísticas.
É muito provável que a maioria de vocês já esteja familiarizada com esse pro-
grama, que em muito facilita a vida de quem trabalha com números. Criado,
inicialmente, para a área financeira, os editores de planilhas como o Excel
são hoje utilizados em todas as áreas do conhecimento que apresentem
dados quantificáveis.
A seguir, veremos como criar uma pequena base de dados no Excel e como
calcular as principais estatísticas de uma amostra.
O primeiro passo é criar um novo arquivo. A primeira linha será sua linha de
título, conterá o nome e a unidade de medida das variáveis. (figura 1).
Estatística 49 UAB
A partir da linha 2, comece a colocar os valores da variável, uma célula para
cada indivíduo e uma abaixo da outra. Se houver mais de uma medida de
cada indivíduo, usam-se as colunas seguintes, sempre mantendo os valores
para um mesmo indivíduo na mesma linha (figura 2).
Figura 2: Planilha de Excel contendo a altura (em cm), o peso (em kg) e a cor dos
olhos de 12 indivíduos.
Média aritmética
O Excel possui um sistema de fórmulas que podemos utilizar. Por exemplo,
para calcular a média da altura dos indivíduos da tabela vista na figura 2,
devemos ir até o fim da coluna em questão e digitar a seguinte fórmula:
=média(b2:b13)
O Excel reconhece o sinal de “=” como um aviso que vamos usar uma fór-
mula e, entre parênteses, devemos inserir o intervalo de células que contém
a variável, separado por dois pontos. No caso, da célula 2 da coluna B (b2)
até a célula 18 da coluna B (b18)( figura 4).
Estatística 51 UAB
Figura 4: Calculando a média de uma variável no Excel.
Estatística 53 UAB
Moda
Para calcular a moda, vamos usar a variável categórica nominal “cor dos
olhos”, que possui três classes (azul, castanho e verde) e está representada
na figura 2.
Como fizemos para a organização dos dados, vamos selecionar toda a tabe-
la e pedir que o programa classifique os dados pela variável “cor dos olhos”,
da mesma forma como foi vista naffigura 3. Com as classes ordenadas, po-
demos, facilmente, contar qual a classe mais abundante. Castanho é a moda
para a cor dos olhos dos indivíduos da amostra, com sete indivíduos, em
uma amostra de 12, apresentando olhos castanhos ffigura 8).
Figura 10: A variância dos valores de altura de uma amostra com 20 indivíduos.
Estatística 55 UAB
Figura 11: A fórmula do desvio padrão no Excel.
Figura 12: O desvio padrão dos valores de altura de uma amostra com 20 indivíduos.
Resumo
As medidas de tendência central são a média aritmética, a mediana e
a moda, e dão uma ideia em que está a maioria dos dados ou onde cai o
meio da distribuição, assim:
A média e o desvio padrão juntos dão uma boa ideia de como é uma va-
riável: sabemos onde estão a maioria dos dados e o quanto eles variam. O
formato ± s é a maneira mais comum de resumir uma variável.
Estatística 57 UAB
Referências
LEME, R. A. DA S.: Curso de Estatística – Elementos. Rio de Janeiro: AO LIVRO TÉCNICO.
1967.
LEVIN, J.: Estatística Aplicada às Ciências Humanas. São Paulo: HARPER & ROW DO
BRASIL. 1978.
SCHMULLER, J.: Statistical Analysis with Excel. Hoboken: Willey Publishing Inc. 2009.
SPIEGELRRAY R, Estatística. MAKRON. 1994