Estatística - Aula 2 Continuação

Tal formato deve ser usado em toda a extensão de um relatório ou trabalho
acadêmico, tendo-se o cuidado com a numeração das tabelas apresentadas.

Esse é o primeiro passo para um bom trabalho descritivo de Estatística apli-
cada a qualquer área do conhecimento.
Medidas de Tendência Central

Como vimos, podemos descrever uma amostra representativa de uma po-
pulação através das frequências das classes, ou valores, de uma variável,
criando uma distribuição de frequências. Para entendermos a distribuição
dos dados de uma variável, precisamos resumir a variável em medidas que
representem seus valores centrais e sua amplitude.
Assim, temos as medidas de tendência central, que representam os valo-

res centrais de uma distribuição e as medidas de dispersão, que represen-
tam sua amplitude, as quais estudaremos mais tarde.
As medidas de tendência central são medidas da localização do “meio” ou

“centro” de uma distribuição. A definição de “meio” ou “centro” é deixada
um tanto quanto vaga de propósito, de modo que o termo “tendência cen-
tral” pode se referir a uma larga variedade de medidas.
A média aritmética é a medida de tendência central mais comum e a que

estamos mais acostumados a usar: das nossas notas em uma disciplina até
notícias nos jornais, fala-se sempre nessa medida. As outras duas medidas
de tendência central são a mediana e a moda.
Média aritmética
A média aritmética é, simplesmente, a soma de todos os números dividida
pela quantidade dos mesmos. O símbolo µ (a letra grega mu) é usado para
representar a média de uma população, que é um parâmetro. Os símbolos
(pronunciado “xis barra”) ou M representam a média de uma amostra, que
é uma estatística.
A fórmula para a média aritmética é a mesma para uma amostra ou popu-

lação, é muito simples. Abaixo, podemos ver a fórmula da média aritmética
de uma amostra ( ):
Estatística 39 UAB
Em que x é a soma de todos os números, ou valores, em uma amostra e n é
a quantidade de números, ou valores, nessa amostra.
Por exemplo, a média dos números 1, 2, 3, 6 e 8 é igual a 4, pois a soma dos

cinco números é 20, então 20/5 = 4.
Podemos coletar dados sobre o número de chutes a gol de cada um dos 31

times de um campeonato de futebol (tabela 8); os dados estão no quadro
abaixo, organizados do maior para o menor valor:
Tabela 8: Número de chutes a gol de 31 times de futebol durante um cam-

peonato.
37 33 33 32 29 28 28 23
22 22 22 21 21 21 20 20
19 19 18 18 18 18 16 15
14 14 14 12 12 9 6
Com esses valores, podemos calcular a média de chutes a gol dos times nes-
se campeonato, usando a fórmula acima:
Mas devemos prestar atenção quando o uso da média aritmética é válido

e o quanto ela representa a realidade. Sabemos que o número de chutes
a gol é uma variável descontínua, ou seja, não existem números decimais,
apenas inteiros. Não é possível que exista meio chute a gol. Devemos, então,
lembrar que o valor 20,4516 é uma aproximação da realidade, já que esse
valor não é inteiro.
A média aritmética, obviamente, não pode ser usada em variáveis categóri-

cas, pois não podemos somar, por exemplo, azul, vermelho e verde.
Para valores contínuos, que possuem números não inteiros (como altura ou
peso), a média aritmética é muito mais acurada, representando um valor
possível de ocorrer. Em muitos casos, a melhor medida de tendência central
para uma variável discreta, como a acima, não é a média, mas uma das ou-
tras medidas que veremos a seguir.
UAB 40 Licenciatura em Matemática

Mediana
A mediana também é uma medida de tendência central, frequentemente,
usada. É o ponto central de uma distribuição: se ordenarmos os dados, há a
mesma quantidade de valores acima da mediana e abaixo dela. Se usarmos,
novamente, os dados dos chutes a gol dos times em um campeonato, no
quadro acima, sabemos que há 31 valores. O 16º valor mais alto, que corres-
ponde a 20, é a mediana, pois há 15 valores maiores e 15 valores menores
que ele. Assim, a mesma divide a amostra em duas partes iguais.
A mediana independe da amplitude da amostra. Por exemplo, se temos os

valores: 1, 23, 54, 76, 190, 379 e 1098, a mediana será 76, pois há três
valores menores e três maiores que esse número. Ainda, na série 1, 16, 53,
76, 82, 90 e 92, ela será 76, pois também há três valores maiores e menores
que ele.
No primeiro exemplo, a amplitude dos dados é maior, indo de 1 a 1098.

No segundo exemplo, vai apenas de 1 a 92. Em ambos os casos, a amostra
consiste de sete números, com o valor de 76 caindo, exatamente, no meio
da distribuição.
A mediana, no entanto, é dependente do tamanho da amostra, pois divide

a distribuição em duas partes iguais. Quanto maior a amostra, mais alta a
posição da mesma.
Para calcularmos a mediana, devemos organizar os dados por ordem de

tamanho. Se tivermos uma amostra com um número ímpar de dados, ela
será aquele, exatamente, do meio. E a sua posição pode ser calculada pela
fórmula:
Em que Me é a mediana e n o número de dados em uma variável.
Por exemplo, na distribuição 11, 12, 13, 16, 17, 20 e 25, a mediana é igual
a 16, pois é o valor que está, exatamente, no meio da distribuição:
4a posição.
Mas atenção: essa fórmula serve para localizar a posição da mediana e não,
o seu valor que se encontrará na posição indicada pela fórmula, quando os
dados forem organizados em ordem crescente.
Estatística 41 UAB
Se o número de dados da amostra é par, a mediana é o ponto da distribui-
ção que é antecedido e precedido por igual número de dados, mesmo que
seu valor específico não figure entre os dados, pois em um número par de
dados, há dois valores centrais. Por exemplo, na distribuição 11, 12, 13, 16,
17, 20, 25 e 26, podemos usar a fórmula acima:
Isso significa que a mediana se encontra entre o quarto e o quinto valor da

série, que na quarta posição é 16 e na quinta, 17. E para achá-la , tiramos a
média aritmética desses dois valores:
Assim, a mediana da série é 16,5, apesar desse valor não existir na série em
questão.
O fato de a mediana ser uma posição a torna inadequada para certas bases
de dados. Por exemplos, para a série 1, 2, 3, 100, 200, 300, a mediana seria
3+100/2 = 51,5, o que a deixa muito mais perto dos valores menores da
série e bem distante dos maiores.
Já a média aritmética seria 606/6 = 101 e dá uma ideia mais adequada desse
grupo de dados. A mediana é ideal, no entanto, para descrever a tendência
central de um grupo de dados proporcionais ou em porcentagem, já que
esses ficarão entre 0 e 1 ou 0 e 100.
Moda
A terceira é última medida de tendência central é a moda, que consiste sim-
plesmente no valor que ocorre mais frequentemente.
Assim, no nosso exemplo, lá em cima, dos chutes a gol dos 31 times em um

campeonato d futebol, a moda é 18, pois, pois quatro dos 31 times fizeram
18 chutes a gol. Para dados contínuos, que possuem valores decimais, é mui-
to difícil que se encontrem vários valores iguais, e geralmente acabamos com
vários valores da frequência de ocorrência 1, ou seja, cada valor só ocorre
uma vez. Nesses casos, o que se pode fazer é agrupar os dados em intervalos
e criar uma distribuição de frequências agrupadas.
Vejamos um exemplo: um pesquisador mediu o tempo de resolução de 20

alunos para um quebra-cabeça. Os valores, medidos em segundo, variaram

entre 500 e 1100, e nenhum aluno resolveu o quebra-cabeça, exatamen-
te, no mesmo tempo. Assim, podemos criar uma distribuição de frequência
agrupada (tabela 9).
Tabela 9: Frequência absoluta dos intervalos de tempo de resolução de um

quebra-cabeça, em segundos, por 20 alunos de uma escola.
Amplitude de tempo (segundos) Frequência absoluta

500 – 599 3
600 – 699 6
700 – 799 5
800 – 899 5
900 – 999 0
1000 – 1100 1
Nessa amostra, a amplitude de tempo que contém o maior número de regis-

tros é a de 600 a 699 segundos, com seis estudantes resolvendo o problema
nesse intervalo de tempo. A moda estará no meio do intervalo e correspon-
derá a 650 segundos.
A moda é a única medida de tendência central que pode ser utilizada em

dados categóricos, nominais ou ordinais não numéricos. Moda quer dizer
apenas o que é mais comum, e assim, o termo estatístico tem um significado
bem diferente do sentido coloquial da palavra.
Enquanto no nosso dia-a-dia, os estilistas criam peças exclusivas que poucas

pessoas vão usar e chamam isso de “moda”, já a moda estatística é o que a
maioria das pessoas está vestindo. Assim, calças jeans e camiseta formam a
moda estatística na maioria dos países ocidentais.
Medidas de dispersão
Vimos como podemos verificar quais os valores mais comuns em uma variá-
vel, usando as medidas de tendência central. Mas sem sabermos algo sobre
como os dados estão dispersos, as medidas de tendência central podem dar
uma impressão errada da variável.
Estatística 43 UAB
Por exemplo, uma rua residencial há 20 casas com um valor médio de R$
200.000,00, mas com pouca variação entre os preços, seria muito diferente
de uma rua cujas 20 casas têm o mesmo valor médio, mas que três casas
valem R$1.000.000,00 e as outras 17 custam cerca de R$ 60.000,00.
As medidas de dispersão dão uma visão mais completa e nos fazem enten-
der melhor o tamanho da variação dos dados. Elas incluem a amplitude, o
desvio médio, a variância e o desvio padrão.
Amplitude
A mais simples medida de dispersão é a amplitude que é calculada, sim-
plesmente, tomando-se a diferença entre os valores máximo e mínimo do
conjunto de dados.
No entanto, a amplitude só fornece informação sobre os valores extremos e

não diz nada sobre os valores entre eles, ou seja, se a variação é homogênea
ou se os valores estão mais agrupados próximos aos extremos. Ela é usada
apenas para ilustrar o intervalo de valores dentro do qual um grupo de dados
se encontra.
Desvio médio
Para se ter uma melhor compreensão da distribuição dos dados em uma
amostra, os valores residuais são utilizados para calcular o quanto cada
ponto de dados está afastado dos valores esperados em uma distribuição.
Esses resíduos podem ser calculados com base nas diferenças entre cada
ponto de dados e a média, ou através de valores estimados através de, por
exemplo, um cálculo de regressão, que veremos mais tarde.
Um método para calcular o desvio, ou resíduo, em uma amostra é o desvio

médio, que calcula a diferença média entre cada ponto de dados (cada va-
lor da variável) e a média dos pontos de dados, e a divide pelo número de
dados.
Ao se fazer esse cálculo, no entanto, o resultado será um desvio igual a zero,

pois os valores acima da média irão cancelar aqueles abaixo. Se esse método
for usado, o valor absoluto da diferença deve ser medido, de modo, que
apenas valores positivos são obtidos e o resultado é chamado de “desvio
médio absoluto”:
ou

Em que:
= desvio médio absoluto;
= cada ponto de dados;
= média da amostra;
n = total de pontos de dados na amostra.
O desvio médio não é difícil de calcular e tem certo apelo intuitivo.
No entanto, quando é utilizado para análises estatísticas subsequentes, os

cálculos matemáticos se tornam muito complexos, pois a maior parte dos
teoremas estatísticos se baseia na minimização da soma dos resíduos ao
quadrado, em vez da soma dos resíduos absolutos. Por causa dessa com-
plexidade, o desvio médio não é, comumente, usado como uma medida de
dispersão.
Variância
Uma maneira de resolver o problema que o desvio médio apresenta é usar a
variância como medida de dispersão.
A variância de uma variável é uma medida de dispersão estatística que tira a

média da distância ao quadrado entre todos os valores possíveis e a média
aritmética da variável. Desse modo, todos os valores são positivos e a unida-
de da variância é o quadrado da unidade da variável.
Para usarmos a medida de dispersão mais comum, o desvio padrão, que

veremos a seguir, precisamos primeiro calcular a variância.
A variância de uma população é um parâmetro representado por 2

; a vari-
ância de uma amostra é representada por s2.
Geralmente, trabalhamos com amostras que representam uma população;

por isso, devemos usar a fórmula da variância amostral:
Estatística 45 UAB
Lemos a fórmula como o somatório da diferença entre cada valor e a média,
ao quadrado, dividida pelo número de valores, menos um.
O cálculo da variância resolve um problema que o desvio médio apresenta,

que é o de criar valores residuais muito diversos. A aplicação da potência
quadrática funciona como se utiliza um logaritmo, homogeneizando as dife-
renças quando forem calculadas outras estatísticas, como o desvio padrão,
que veremos a seguir. Por esse motivo, a medida de dispersão é usada como
base na maioria dos cálculos estatísticos, inclusive em análises avançadas.
Vamos aplicar essa fórmula a um exemplo. Queremos entender quantos

quilos de detritos são produzidos em média pela indústria de tecelagem. Co-
letamos informação de dez tecelagens e conseguimos a seguinte amostra,
em toneladas de detritos por ano (tabela 10).
Tabela 10: Toneladas de detritos produzidos, por ano, em dez tecelagens.
60 74 58 61 56
55 54 57 65 42
Vamos, então, produzir uma tabela para calcular a variância.
O primeiro passo é calcular a média. A soma dos valores de nossa amostra é

582. A média será 582/10 + 58,2. A partir desse resultado, podemos calcular
a diferença entre cada valor e a média. Por exemplo, se subtrairmos a média
do primeiro número, 60, teremos 1,8.
As fábricas, que produziram menos que 58,2 toneladas de detritos por ano,
terão desvios da média com valores negativos; esse é o problema que vimos
sobre o uso do desvio médio como uma medida de dispersão: se somarmos
todos os valores da coluna preenchida, a soma será zero.
Mas sabemos que, se multiplicarmos um valor negativo por ele mesmo, ou

seja, se o fazemos ao quadrado, esse valor se tornará positivo. Por exemplo,
(-0,02) x (-0,02) = 0,04. Vamos então preencher a última coluna e fazer a
soma dos desvios ao quadrado que precisamos para calcular a variância (ta-
bela 11).

Tabela 11: Desvio da média e desvio da média ao quadrado da produção de
detritos em dez tecelagens.
Detritos Desvio da média Desvio da média ao

(Toneladas/ano) (Xi - ) quadrado (Xi - )2
60 1,8 3,24
74 15,8 249,64
58 -0,2 0,04
61 2,8 7,84
56 -2,20 4,84
55 -3,20 10,24
54 -4,20 17,64
57 -1,20 1,44
65 6,8 46,24
42 -16,20 262,44
Média: 58,2 Soma: 603,60
Agora que temos a soma de todos os desvios da média ao quadrado e sabe-

mos que (n-1) = 10-1 = 9, podemos substituir os termos da fórmula:
Nesse caso, como vimos, a unidade da variância é uma quantidade ao qua-

drado. Dizemos, então, que a variância na quantidade de detritos produzida
pelas indústrias da tecelagem é de 67,07 toneladas por ano ao quadrado.
Quando calculamos a variância de uma população, usamos a mesma fórmu-

la. A diferença é que usaremos a média da população (µ), que é um parâme-
tro, em vez da média amostral ( ), que é uma estatística.
Desvio Padrão
A variância dá a ideia da amplitude da distribuição, mas como seu resultado
é um valor ao quadrado, precisamos saber qual o desvio da média em geral,
usando uma unidade igual à unidade da variável.
Estatística 47 UAB
No nosso exemplo, precisamos saber qual o desvio geral da média em tone-
ladas de detritos por ano. Assim, devemos usar o desvio padrão, cujo resul-
tado é dado na mesma unidade da variável.
O desvio padrão é, simplesmente, a raiz quadrada da variância, sendo repre-

sentado por , quando representando um parâmetro populacional, ou por
s, quando representando uma estatística amostral. Novamente, usaremos a
estatística amostral como exemplo em nossa fórmula:
A raiz quadrada anula a potência de dois, então temos o desvio padrão.

Seguindo o exemplo que usamos até agora, teremos:
Podemos então dizer que, usando nossa amostra de indústrias de tecela-

gem, a quantidade média de resíduos é de 58,2 toneladas por ano e o des-
vio padrão é de 8,19 toneladas por ano. Para resumir, nós apresentamos os
resultados da seguinte forma: a quantidade média de resíduos da indústria
de tecelagem é de 58,2 ± 8,19 toneladas por ano.
Quando apresentamos os resultados dessa forma, damos duas ideias bási-

cas: uma é a da tendência central da variável, dada nesse caso pela média. A
outra é a ideia de dispersão, fornecida pelo desvio padrão.
Com estas duas medidas, estamos descrevendo a maioria dos dados que
analisamos. De volta ao nosso exemplo, se subtrairmos o desvio padrão da
média, teremos o valor de 50,01 toneladas/ano; se somarmos os valores, o
resultado é de 66,39 toneladas/ano. Vamos ver quanto dos nossos dados
estão entre 50,01 e 66,39:
42 – 54 – 55 – 56 – 57 – 58 – 60 – 61 – 65 – 74
Nesse caso, subtraindo ou adicionando o desvio padrão, a média é suficiente

para cobrir 80% dos dados. Por isso, o formato ± s ou µ ± serve bem
para descrever os dados de uma amostra ou população.

Estatística no Excel
Os programas de computador podem economizar muito tempo de uma pes-
quisa estatística e os editores de planilhas são ideais para a organização das
bases de dados.
Alguns desses editores servem apenas como base para que sejam listados os
dados, para depois serem transferidos a programas estatísticos, que realizam
os cálculos. Outros editores possuem funções que permitem o cálculo de
estatísticas básicas, como as medidas de tendência central e de dispersão. O
mais popular dos editores de planilhas é o Excel da Microsoft, que apresenta
várias funções estatísticas.
É muito provável que a maioria de vocês já esteja familiarizada com esse pro-
grama, que em muito facilita a vida de quem trabalha com números. Criado,
inicialmente, para a área financeira, os editores de planilhas como o Excel
são hoje utilizados em todas as áreas do conhecimento que apresentem
dados quantificáveis.
A seguir, veremos como criar uma pequena base de dados no Excel e como
calcular as principais estatísticas de uma amostra.
O primeiro passo é criar um novo arquivo. A primeira linha será sua linha de
título, conterá o nome e a unidade de medida das variáveis. (figura 1).
Figura 1: Aparência de um novo arquivo no editor de planilhas do Excel.
Estatística 49 UAB
A partir da linha 2, comece a colocar os valores da variável, uma célula para
cada indivíduo e uma abaixo da outra. Se houver mais de uma medida de
cada indivíduo, usam-se as colunas seguintes, sempre mantendo os valores
para um mesmo indivíduo na mesma linha (figura 2).
Figura 2: Planilha de Excel contendo a altura (em cm), o peso (em kg) e a cor dos
olhos de 12 indivíduos.
Os dados inseridos nas planilhas de Excel podem ser, facilmente, organizados

em ordem crescente ou decrescente, permitindo que, em um lance, possa-
mos ver que características são mais frequentes, ou mesmo qual o intervalo
(amplitude) de dados numéricos. Para isso, devemos selecionar toda a tabela
(pois se selecionarmos apenas a variável, só ela será classificada) e usar a
ferramenta “classificar dados” (Dados => Classificar) para organizá-los em
ordem crescente ou decrescente. Temos a opção de “avisar” ao programa se
temos ou não uma linha de cabeçalho (figura 3).

Figura 3: Usando a ferramenta “Classificar dados” do Excel para ordenar, alfabetica-
mente, os dados pela variável “Cor dos olhos”.
A ordenação dos dados é importante em vários testes estatísticos, como as

chamadas “correlações de postos”. Mesmo que eles não sejam realizados
pelo Excel da Microsoft, a simples ordenação automática dos dados já remo-
ve a fase mais demorada desse tipo de teste.
Medidas de tendência central no Excel

Podemos calcular as medidas de tendência central com a ajuda do programa
Excel, de forma rápida e fácil.
Média aritmética
O Excel possui um sistema de fórmulas que podemos utilizar. Por exemplo,
para calcular a média da altura dos indivíduos da tabela vista na figura 2,
devemos ir até o fim da coluna em questão e digitar a seguinte fórmula:
=média(b2:b13)
O Excel reconhece o sinal de “=” como um aviso que vamos usar uma fór-
mula e, entre parênteses, devemos inserir o intervalo de células que contém
a variável, separado por dois pontos. No caso, da célula 2 da coluna B (b2)
até a célula 18 da coluna B (b18)( figura 4).
Estatística 51 UAB
Figura 4: Calculando a média de uma variável no Excel.
O programa, automaticamente, calcula a média dos dados em questão, bas-

tando para isso que pressionemos a tecla “enter”. O valor da média aparece-
rá, de forma automática, na célula em que escrevemos a fórmula (figura 5).
Figura 5: O valor da média da variável “Altura (cm)” é calculado, automaticamente,

pelo Excel.

Mediana
Agora, usando a mesma tabela, vamos calcular a mediana para a altura dos
indivíduos. Há uma fórmula para isso e seu comando, no Excel, é MED.
Assim, para que possamos calcular a mediana de nossa variável, devemos
escrever, em uma célula livre, a fórmula “=med(b2:b13)”, como pode ser
visto na figura 6.
Figura 6: A fórmula para a mediana no Excel.
Novamente, pressionando-se a tecla “enter”, o valor da mediana é, automa-

ticamente, calculado (figura 7).
Figura 7: A mediana dos valores de altura de uma amostra com 20 indivíduos.
Estatística 53 UAB
Moda
Para calcular a moda, vamos usar a variável categórica nominal “cor dos
olhos”, que possui três classes (azul, castanho e verde) e está representada
na figura 2.
Como fizemos para a organização dos dados, vamos selecionar toda a tabe-
la e pedir que o programa classifique os dados pela variável “cor dos olhos”,
da mesma forma como foi vista naffigura 3. Com as classes ordenadas, po-
demos, facilmente, contar qual a classe mais abundante. Castanho é a moda
para a cor dos olhos dos indivíduos da amostra, com sete indivíduos, em
uma amostra de 12, apresentando olhos castanhos ffigura 8).
Figura 8: Dados nominais ordenados permitem a identificação da classe modal no

Excel.
Variância e desvio padrão com Excel

Podemos usar o Excel para calcular a variância de uma variável bem rapida-
mente; isso é muito útil, principalmente, com grandes bases de dados. O
Excel possui um comando para calcular a variância: VAR. Então, vamos usar
nosso exemplo da altura de um grupo de indivíduos, com a mesma tabela
que estamos utilizando, inserindo a fórmula “=var (b2:b13)” em uma célula
livre ffigura 9).

Figura 9: A fórmula para calcular a variância em Excel.
Novamente, o valor é calculado, automaticamente, ao se pressionar “enter”

ffigura 10).
Figura 10: A variância dos valores de altura de uma amostra com 20 indivíduos.
Há duas maneiras de se calcular o desvio padrão a partir de agora: pode-

mos, simplesmente, tirar a raiz quadrada da variância em uma calculadora
comum, ou podemos aplicar o comando DESVPAD no Excel ffigura 11).
Estatística 55 UAB
Figura 11: A fórmula do desvio padrão no Excel.
A vantagem de se utilizar a fórmula na planilha do Excel é que podemos ter

todos os cálculos em um único luga (ffigura 12). Não há problema se termi-
namos com uma sequência de valores, aparentemente, desconhecidos abai-
xo de nossos dados, pois, quando selecionamos a célula, a fórmula utilizada
aparece na caixa de função (fx) no alto da janela do Excel.
Figura 12: O desvio padrão dos valores de altura de uma amostra com 20 indivíduos.

Em nossa base de dados, estudamos a variável “Altura (cm)” e verificamos
que, em nossa amostra, os indivíduos tinham uma altura média de 164,17
± 11,38 cm. Podemos, rapidamente, calcular as mesmas estatísticas para a
variável “Peso (kg)”, ou qualquer outra, em outras bases de dados, com a
ajuda dos comandos e fórmulas do MS Excel.
Resumo
As medidas de tendência central são a média aritmética, a mediana e
a moda, e dão uma ideia em que está a maioria dos dados ou onde cai o
meio da distribuição, assim:
• a média aritmética é influenciada pelos valores extremos;
• a mediana é apenas a posição do valor central e não sofre influência dos

valores extremos;
• a moda é a classe mais comum em um grupo de dados.
A média aritmética serve como tendência central de muitos tipos de dados,

desde que a distância entre eles seja, relativamente, homogênea. Em bases
de dados cujos valores estão agrupados mais aos extremos, a mediana se
torna mais apropriada; essa medida também é ideal para variáveis propor-
cionais ou em porcentagem. A moda é usada para variáveis categóricas ou
dados contínuos agrupados.
As medidas de dispersão dão a ideia da amplitude da distribuição, que é,

simplesmente, a distância entre o menor e o maior valor.
O desvio médio parece ser adequado para descrever a amplitude, mas os

cálculos complexos necessários a seu uso o tornam inadequado para análises
estatísticas.
A variância dá o desvio ao quadrado da média; calcula-se o desvio padrão,

a partir desse valor, que é a medida de dispersão mais usada em análises
estatísticas descritivas.
A média e o desvio padrão juntos dão uma boa ideia de como é uma va-
riável: sabemos onde estão a maioria dos dados e o quanto eles variam. O
formato ± s é a maneira mais comum de resumir uma variável.
Estatística 57 UAB
Referências
LEME, R. A. DA S.: Curso de Estatística – Elementos. Rio de Janeiro: AO LIVRO TÉCNICO.
1967.
LEVIN, J.: Estatística Aplicada às Ciências Humanas. São Paulo: HARPER & ROW DO
BRASIL. 1978.
SCHMULLER, J.: Statistical Analysis with Excel. Hoboken: Willey Publishing Inc. 2009.
SPIEGELRRAY R, Estatística. MAKRON. 1994

Estatística 59 UAB

Estatística - Aula 2 Continuação

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estatística - Aula 2 Continuação

Enviado por

Direitos autorais:

Formatos disponíveis

Tal formato deve ser usado em toda a extensão de um relatório ou trabalho

acadêmico, tendo-se o cuidado com a numeração das tabelas apresentadas.

Medidas de Tendência Central

Assim, temos as medidas de tendência central, que representam os valo-

As medidas de tendência central são medidas da localização do “meio” ou

A média aritmética é a medida de tendência central mais comum e a que

A fórmula para a média aritmética é a mesma para uma amostra ou popu-

Por exemplo, a média dos números 1, 2, 3, 6 e 8 é igual a 4, pois a soma dos

Podemos coletar dados sobre o número de chutes a gol de cada um dos 31

Tabela 8: Número de chutes a gol de 31 times de futebol durante um cam-

Mas devemos prestar atenção quando o uso da média aritmética é válido

A média aritmética, obviamente, não pode ser usada em variáveis categóri-

UAB 40 Licenciatura em Matemática

A mediana independe da amplitude da amostra. Por exemplo, se temos os

No primeiro exemplo, a amplitude dos dados é maior, indo de 1 a 1098.

A mediana, no entanto, é dependente do tamanho da amostra, pois divide

Para calcularmos a mediana, devemos organizar os dados por ordem de

Em que Me é a mediana e n o número de dados em uma variável.

Isso significa que a mediana se encontra entre o quarto e o quinto valor da

Assim, no nosso exemplo, lá em cima, dos chutes a gol dos 31 times em um

Vejamos um exemplo: um pesquisador mediu o tempo de resolução de 20

UAB 42 Licenciatura em Matemática

Tabela 9: Frequência absoluta dos intervalos de tempo de resolução de um

Amplitude de tempo (segundos) Frequência absoluta

Nessa amostra, a amplitude de tempo que contém o maior número de regis-

A moda é a única medida de tendência central que pode ser utilizada em

Enquanto no nosso dia-a-dia, os estilistas criam peças exclusivas que poucas

No entanto, a amplitude só fornece informação sobre os valores extremos e

Um método para calcular o desvio, ou resíduo, em uma amostra é o desvio

Ao se fazer esse cálculo, no entanto, o resultado será um desvio igual a zero,

UAB 44 Licenciatura em Matemática

= desvio médio absoluto;

= cada ponto de dados;

n = total de pontos de dados na amostra.

O desvio médio não é difícil de calcular e tem certo apelo intuitivo.

No entanto, quando é utilizado para análises estatísticas subsequentes, os

A variância de uma variável é uma medida de dispersão estatística que tira a

Para usarmos a medida de dispersão mais comum, o desvio padrão, que

A variância de uma população é um parâmetro representado por 2

Geralmente, trabalhamos com amostras que representam uma população;

O cálculo da variância resolve um problema que o desvio médio apresenta,

Vamos aplicar essa fórmula a um exemplo. Queremos entender quantos

Tabela 10: Toneladas de detritos produzidos, por ano, em dez tecelagens.

Vamos, então, produzir uma tabela para calcular a variância.

O primeiro passo é calcular a média. A soma dos valores de nossa amostra é

Mas sabemos que, se multiplicarmos um valor negativo por ele mesmo, ou

UAB 46 Licenciatura em Matemática

Detritos Desvio da média Desvio da média ao

Média: 58,2 Soma: 603,60

Agora que temos a soma de todos os desvios da média ao quadrado e sabe-

Nesse caso, como vimos, a unidade da variância é uma quantidade ao qua-

Quando calculamos a variância de uma população, usamos a mesma fórmu-

O desvio padrão é, simplesmente, a raiz quadrada da variância, sendo repre-

A raiz quadrada anula a potência de dois, então temos o desvio padrão.

Podemos então dizer que, usando nossa amostra de indústrias de tecela-

Quando apresentamos os resultados dessa forma, damos duas ideias bási-

Nesse caso, subtraindo ou adicionando o desvio padrão, a média é suficiente

UAB 48 Licenciatura em Matemática

Figura 1: Aparência de um novo arquivo no editor de planilhas do Excel.

Os dados inseridos nas planilhas de Excel podem ser, facilmente, organizados

UAB 50 Licenciatura em Matemática

A ordenação dos dados é importante em vários testes estatísticos, como as

Medidas de tendência central no Excel

O programa, automaticamente, calcula a média dos dados em questão, bas-