Você está na página 1de 40

MATEMÁTICA E ESTATÍSTICA

Caxias do Sul, 2023-4


Professora Adriana Speggiorin

1
1- Estatística descritiva

1.1. Introdução
A Estatística é uma ferramenta fundamental de uso generalizado nas mais diversas áreas do
conhecimento. Os conceitos e métodos estatísticos são indispensáveis na compreensão do mundo ao
nosso redor.
É a ciência que nos ajuda a tirar conclusões e tomar decisões na presença de incertezas e
variações.
A palavra estatística provém do latim status, que significa estado. Há indícios de que a mais de
2.000 a.C. os chineses, babilônios e egípcios recenseavam suas populações. O 4º livro do Velho
Testamento faz referência a uma instrução dada por Moisés “Façam um recenseamento de toda a
comunidade de Israel, pelos seus clãs e famílias, alistando todos os homens, um a um, pelo nome” (Nm
1,2).
Também se tem registros que as civilizações pré-colombianas dos maias, astecas e incas
realizavam registros de caráter estatístico.
Com o Renascimento, ampliou-se o interesse pela coleta de dados estatísticos. A obra de
Francesco Sansovini (1521 – 1586) é um exemplo dessa época. A Igreja Católica Romana deu grande
importância aos registros de batismos, casamentos e óbitos, tornados compulsórios a partir do Concílio
de Trento (1545 – 1563).
Pode-se dizer que o desenvolvimento da Estatística teve origem nas aplicações, pois nenhuma
ciência tem interagido tanto com as demais em suas atividades do que ela, dado que é por sua natureza
a ciência do significado e do uso dos dados. Daí sua importância como instrumento auxiliar na pesquisa
científica.
São várias as razões para o desenvolvimento acentuado do objetivo da estatística e da
necessidade de estudá-la, nesses últimos sessenta anos. Uma delas é a abordagem crescentemente
quantitativa utilizada em todas as ciências. Isto inclui o uso de técnicas matemáticas no planejamento de
inventários, na avaliação de controles de poluição, na análise de problemas de tráfego, no estudo dos
efeitos de vários remédios, na avaliação de técnicas de ensino, na análise do comportamento de
administradores e governos, no estudo de dietas e longevidade, nos diagnósticos psicológicos e assim
por diante. Nossa capacidade de lidar com informações numéricas aumentou enormemente com o
advento de poderosos computadores. Muitos tipos de computadores são também econômicos,
possibilitando a execução por pequenas empresas, estudantes de universidade e até mesmo de cursos
secundários, de trabalhos sofisticados.
2
A ESTATÍSTICA é uma Ciência que fornece métodos para a coleta, organização, descrição,
análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.

1.2. População e amostra


A Estatística é uma ciência que pode ser entendida como um conjunto de técnicas e métodos de
pesquisa que envolve o planejamento do experimento que será realizado, a coleta dos dados e o
processamento, análise e disseminação das informações.
No processo de coleta de dados, diversos problemas podem ocorrer. Para exercer a coleta de
dados adequadamente deve-se conhecer os conceitos básicos de população e amostra.

A palavra população na sua acepção mais comum representa o conjunto de habitantes de um


município, uma região ou país. Em Estatística, população (ou universo) é entendida como o conjunto de
todos os elementos (pessoas, animais, objetos, ...) cujas propriedades o pesquisador está interessado em
estudar. Essas propriedades podem ser resultado de uma medição, uma contagem, um atributo.
Em termos de número dos elementos que compõem a população, ela pode ser classificada como
finita ou infinita.
Quando é feito um levantamento de dados relativos a todos os elementos de uma população,
temos o que denominamos censo.
Se a população é pequena, pode ser razoável estudar toda ela. Todavia, examinar a população
inteira nem sempre é viável. Em tais casos examina-se somente uma parte da população, que chamamos
de amostra.
Uma amostra é simplesmente uma seleção de elementos de uma população que têm as mesmas
características desta.
A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá
depender do conhecimento que se tem da população e da quantidade de recursos disponíveis.

3
Fonte: Estatística sem matemática para psicologia/Christine P. Dancey, John Reidy, 2006

São vários os motivos pelos quais se faz um estudo baseado numa amostra e não em todos os
elementos da população:
➢ a população é infinita;
➢ há restrição de recursos (econômicos ou humanos);
➢ há restrição de tempo;
➢ há destruição da unidade de observação. Por exemplo, se para verificar a resistência de uma
cadeira de PVC é colocado peso sobre a mesma até ela quebrar, não há sentido em fazer a
testagem que não seja por amostragem.

Geralmente os dados são coletados de uma das duas formas a seguir:


- estudo observacional – os dados são obtidos à medida que se tornam disponíveis.
- experimento planejado – observa e registra dados onde são feitas variações propositais nas variáveis
controláveis de algum processo.

1.3. Variáveis

Para ilustrar o que segue, considera-se o exemplo a seguir:


Exemplo: Para tentar incrementar as vendas do setor de entretenimento, uma associação representativa
decidiu realizar uma pesquisa de perfil e comportamento da população urbana de uma dada cidade. Em
pesquisas como essa, é comum o pesquisador estar interessado em características como:

4
- idade do respondente;
- renda mensal familiar;
- número pessoas que dependem da renda familiar citada;
- satisfação com as opções de lazer que têm na cidade.
- tipo de lazer preferido pela família.

De modo geral, a cada característica investigada tem-se associado um (ou mais de um) resultado
correspondendo à realização. Assim, no exemplo em questão, as características mencionadas, são as
variáveis de interesse da pesquisa.
Podemos atribuir uma letra, como x, y, z, t, para representar tal variável.
Outros exemplos de variáveis:
- para o fenômeno 'sexo' são 2 os resultados possíveis;
- o número de crianças em sala de aula pode ser expresso por números naturais: 0, 1, 2 , ...,n;
- para o fenômeno 'estatura' temos uma situação diferente, pois os resultados podem tomar um número
infinito de valores numéricos dentro de um intervalo (depende da precisão da medida).

Logo

Variável é um símbolo, como x, y, z, t, que pode assumir qualquer valor de um conjunto de


resultados possíveis de um fenômeno.

ou

Variável é toda a característica ou condição que pode ser contada, mensurada ou


observada.

1.3.1. Tipologia das variáveis


As variáveis são o foco principal da pesquisa em qualquer área. Pode-se notar que nos exemplos
dados que elas apresentam diferentes características. Enquanto se pode medir a estatura em centímetros
ou metros, não se pode fazer o mesmo com a variável sexo, por exemplo. Isso representa uma
característica importante das variáveis: o quão precisamente podem ser avaliadas.
De forma geral, as variáveis podem ser classificadas em tipos:

5
Nominal

Qualitativa

Ordinal
Variável

Discreta

Quantitativa

Contínua

- Variável qualitativa nominal ou categórica – são resultados possíveis são diferentes categorias
não ordenadas, em que cada observação pode ser classificada. Exemplos: cor de um objeto, religião,
naturalidade, classificação de uma lâmpada (acende ou não acende).

- Variável qualitativa ordinal – seus possíveis valores são diferentes categorias ordenadas, em que
cada observação pode ser classificada. Exemplos: classe social, nível de instrução.

- Variável quantitativa discreta – seus possíveis valores são, geralmente, resultados de contagem.
Exemplos: número de peças defeituosas num lote, número de estudantes numa sala de aula.

- Variável quantitativa contínua – seus valores possíveis podem ser expressos dentro de uma
determinada faixa de valores, e representam uma medida (em qualquer grau de precisão). Na prática,
entretanto, os mecanismos de medição têm precisão limitada, tal que os dados coletados de variáveis
contínuas são necessariamente discretos. Exemplos: volume contido numa caixa d´água, comprimento
de uma barra de aço, peso, massa.

Para cada tipo de variável existem técnicas apropriadas para resumir a informação, por isso tem-
se que ter em mente a classificação.
Em algumas situações podem-se atribuir valores numéricos às variáveis qualitativas e depois
proceder-se à análise como se esta fosse uma variável quantitativa, desde que o procedimento seja
passível de interpretação. Por exemplo, para a variável “tabagismo” atribui-se 1 para a resposta fumante
e 2 para não fumante. Nesse caso, não sentido em calcular a média dos resultados.

Observação: A variável que tem apenas dois resultados possíveis é chamada dicotômica ou binária.

6
1.4. Arredondamento de dados
Muitas vezes é necessário ou conveniente suprimir unidades inferiores às de determinada ordem.
Essa técnica é chamada arredondamento de dados.

1º ) Quando o primeiro algarismo a ser abandonado é 0, 1, 2, 3 ou 4, fica inalterado o último algarismo a


permanecer.

Exemplos: a) 92,24 passa a 92,2


b) 5,6254 passa a 5,625 (para a precisão de milésimos)
c) 5,6254 passa a 5,6 (para a precisão de décimos)

2º) Quando o primeiro algarismo a ser abandonado é 5, 6, 7, 8 ou 9, aumenta-se de uma unidade o


algarismo a permanecer.

Exemplos: a) 13,67 passa a 13,7 b) 2,99 passa a 3,0 c) 41,08 passa a 41,1
d) 2,352 passa a 2,4 e) 25,6501 passa a 25,7 f) 24,75 passa a 24,8

Observações
1) Não devemos fazer arredondamentos sucessivos.
Exemplo: 17,3452 passa a 17,3 e não a 17,35 e por fim a 17,4
Se tivermos necessidade de um novo arredondamento, fica recomendada a volta aos dados
originais.
2) Cuidado com o arredondamento em situações como:
Dado o valor 2,46 milhões de reais, se arredondarmos para 2,5 milhões de reais estamos alterando
a quantidade em R$ 40.000,00.

EXERCÍCIOS
Classificar cada variável abaixo como variável quantitativa contínua, quantitativa discreta, qualitativa
ordinal ou qualitativa nominal:

a) Peso do conteúdo de pacote de farinha: ....................


b) Diâmetro de um rolamento: .....................
c) Número médio diário de clientes potenciais visitados por um vendedor durante o último mês: ..........
d) Altura h de um indivíduo: .....................
e) Vida média de lâmpadas: .............
f) Comprimento de 1000 parafusos: ...............
g) Número de livros de uma biblioteca: .....................
h) Satisfação com o governo: excelente, bom, regular, péssimo: ....................................
i) Estilo de construção de casa: colonial, moderno, contemporâneo, europeu: ...............
j) Número de artigos defeituosos produzidos por uma determinada máquina: ................
k) Temperatura corporal .........................................
l) Densidade populacional (habitantes por km 2 ): .........................................
m) Time de futebol (Juventude, Caxias, Internacional, Grêmio): ......................................
n) Concentração de colesterol total no sangue (mg/dL) : .........................................
o) Religião (católico, protestante, evangélico, islâmico): ....................................
p) Resposta de questionário (fumante/não -fumante): .........................................
7
Respostas
a) Quantitativa contínua b) Quantitativa contínua
c) Quantitativa contínua d) Quantitativa contínua
e) Quantitativa contínua f) Quantitativa contínua
g) Quantitativa discreta h) Qualitativa ordinal
i) Qualitativa nominal j) Quantitativa discreta
k) Quantitativa contínua l) Quantitativa contínua
m) Qualitativa nominal n) Quantitativa contínua
o) Qualitativa nominal p) Dicotômica (qualitativa nominal)

1.5. Gráficos estatísticos


Os métodos gráficos têm encontrado um uso cada vez maior devido ao seu apelo visual.
Normalmente, é mais fácil para qualquer pessoa entender a mensagem de um gráfico do que aquela
embutida em tabelas ou sumários numéricos.
A representação gráfica de uma série de dados permite, ao mesmo tempo, uma visão geral e
alguma caracterização particular da população por meio de uma correspondência entre as categorias ou
valores e uma determinada figura geométrica, de tal modo que cada valor ou categoria é representado
por uma figura proporcional.
Os principais tipos de gráficos são diagramas, cartogramas e pictogramas.

1.5.1 Gráfico em linha

Os gráficos de linha são bastante utilizados na identificação de tendências de aumento ou


diminuição dos valores numéricos de um fenômeno. Assim, vamos encontrar com frequência esse tipo de
representação em análises tais como lucros de empresas, incidência de doenças, índice de crescimento
populacional ou de mortalidade infantil, índices de custo de vida, comportamento do fenômeno ao longo
do tempo etc. No eixo horizontal, marca-se o tempo.

Exemplo 1: A tabela a seguir apresenta a variação (%) do índice de preços ao consumidor amplo:

Mês No mês
Fevereiro 2010 0,78
Março 2010 0,52
Abril 2010 0,57
Maio 2010 0,43
Junho 2010 0,00
Julho 2010 0,01
Agosto 2010 0,04
Setembro 2010 0,45
Outubro 2010 0,75
Novembro 2010 0,83
Dezembro 2010 0,63
Janeiro 2011 0,83

8
0,9
0,8
0,7
0,6
0,5
%
0,4
0,3
0,2
0,1
0

Figura: Índice de Preços ao Consumidor Amplo – IPC


Fonte: IBGE

Exemplo 2: A série histórica a seguir é referente à taxa de participação, por sexo, no mercado formal de
trabalho, na Região Metropolitana de Porto Alegre.

Ano 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003

Homens 70,7 68,5 68,4 67,3 67,1 68,4 68,6 69,2 68,5 66,7 67,8

Mulheres 44,5 42,5 43,9 43,0 42,3 46,1 49,0 49,7 49,6 49,3 49,1

Ano 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Homens 66,8 66,4 65,5 65,8 66,9 66,5 66,4 65,9 65,7 65,2

Mulheres 49,8 49,3 49,0 49,0 51,4 50,7 50,0 49,3 49,4 48,9

80

70

60

50

% 40 Homens
Mulheres
30

20

10

0
1993 1995 1997 1999 2001 2003 2005 2007 2009 2011 2013

Fonte: FEE – 29/01/2014

9
1.6.2 Gráfico em colunas e gráfico em barras

É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou
horizontalmente (em barras).
Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos
respectivos dados. Um gráfico de colunas mostra as alterações dos dados em um intervalo de tempo ou
ilustra comparações entre categorias, as quais são organizadas de maneira horizontal e os valores de
maneira vertical para enfatizar a variação ao longo do tempo.
Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos
dados. Um gráfico de barras ilustra comparações entre categorias; estas são organizadas verticalmente,
enquanto os valores têm disposição horizontal, para enfatizar a comparação de valores e dar menos
ênfase ao tempo.
No gráfico de colunas e de barras, também é indiferente a ordem de apresentação dos retângulos,
por se tratar de uma série ordenada segundo uma característica qualitativa. Nesses casos, não há, em
geral, uma ordem única, técnica e logicamente admissível, podendo ocorrer diversas ordens,
correspondentes a diversos critérios.

Exemplo 3: A tabela a seguir apresenta dados relativos a uma pesquisa realizada em uma cidade da
região. A questão era “Como você fica sabendo das promoções da loja XX?”

Tabela: Como você fica sabendo das promoções da loja XX?

Fonte Frequência* %
TV 68 44,4
Amigos 65 42,5
Internet 36 23,5
Jornal 31 20,3
Rádio 28 18,3
Parentes 23 15,0
Encartes de jornal 13 8,5
Outros 1 0,7
*Respostas múltiplas – 153 respondentes

Como você fica sabendo das promoções da loja


XX?

44,4% 42,5%

23,5%
20,3% 18,3%
15%
8,5%
0,7%

TV Amigos Internet Jornal Rádio Parentes Encartes de Outros


jornal

10
Exemplo 4: O gráfico a seguir apresenta o resultado ao questionamento “Como seus estudos seriam
financiados?” relativos à pesquisa feita em Caxias do Sul.

Como seus estudos seriam financiados?


Através de financiamento estudantil 3,2%
Com ajuda da empresa em que trabalho 6,9%
Meus pais ou familiares pagariam todo o curso 8,9%
Necessitaria de bolsa de estudo 24,8%
Eu proprio pagaria o curso 25,4%
Eu pagaria uma parte e meus familiares pagariam a outra 30,8%

0% 10% 20% 30% 40%

1.6.3 Gráfico em colunas ou barras múltiplas

Este tipo de gráfico é geralmente empregado quando queremos representar, simultaneamente,


dois ou mais fenômenos estudados com o propósito de comparação.

Exemplo 5: Gráfico de colunas múltiplas

Figura: Distribuição das pessoas ocupadas de 10 anos ou mais de idade, por classes de
rendimento no trabalho principal, 2006-2008
Fonte: IBGE

11
1.6.4 Gráfico em setores (pizza)

A Estatística recorre com frequência a esse tipo de gráfico, que consiste em distribuir num círculo
setores (ou categorias) proporcionais aos dados do problema.

Exemplo 6: O gráfico a seguir apresenta dados de uma pesquisa feita com uma amostra de
microempresários da região, onde lhes foi questionado sobre o que faltava às suas empresas para serem
mais competitivas.

O que falta para sua empresa


ser mais competitiva?
Menores taxas
de financiamento
25%

Capacitação de
mão de obra
75%

O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. As
áreas dos setores são proporcionais aos dados da série.

1.6.5 Diagrama de dispersão

O gráfico de dispersão apresenta duas variáveis numéricas. Então temos pontos (pares ordenados)
representando a relação entre essas variáveis.

Exemplo 7: Um industrial do ramo de tecelagem registra, para os anos de 2001 a 2014, seus gastos com
pesquisa e desenvolvimento (P&D) e sua participação no mercado, como segue:

P&D Fatia do mercado


Ano
(milhões de dólares) (%)
2001 0,8 20,4
2002 0,5 18,6
2003 0,8 19,1
2004 1,0 18,0
2005 1,0 18,2
2006 0,9 19,6
2007 0,8 20,0
2008 1,2 20,4
2009 1,0 19,2
2010 0,9 20,5
2011 0,8 20,8
2012 1,0 18,9
2013 1,0 19,0
2014 0,8 19,8
12
Para ver se (e como) a participação no mercado está relacionada com as despesas com P&D em
anos anteriores, pode-se construir um diagrama que permite uma avaliação inicial.

25

Fatia do mercado (%)

20

15
0 0,2 0,4 0,6 0,8 1 1,2 1,4
P&D

Exemplo 8: A seguir, dados fictícios em relação à comercialização de automóveis usados. No diagrama


é apresentada a relação entre a quilometragem e o preço dos veículos.

50000

40000
Preço (reais)

30000

20000

10000

0
0 20000 40000 60000 80000 100000 120000
Quilometragem

1.6.6 Gráficos que enganam

Quando observar um gráfico ou uma tabela, particularmente como parte de um anúncio, seja
cauteloso. Observe as escalas usadas nos eixos horizontal e vertical. Pode-se distorcer a verdade com
as técnicas estatísticas.

13
No exemplo a seguir têm-se os ganhos médios mensais de certa categoria de profissionais.

Exemplo 9:
1300
1230

R$ 1100

980

900
Homens Mulheres

1400
1230
1200
980
1000

800
R$
600

400

200

0
Homens Mulheres

Exemplo 10: Os gráficos a seguir apresentam o grau de satisfação dos estudantes com o transporte
coletivo da cidade (dados fictícios).

14
Péssimo
8%

Ótimo
28% Ruim
18%

Regular
14%
Bom
32%

50

40
32%
30 28%

%
20 18%
14%

10 8%

0
Péssimo Ruim Regular Bom Ótimo

Em qual dois dois a leitura é mais fácil?

Exemplo 11: Tem-se, a seguir, o gráfico exibido pela Globo News, em janeiro de 2014, apresentando a
série histórica relativa à inflação no Brasil.
Percebe-se o erro na última coluna e também uma escala que pode ser enganadora, pois pode-se
ter a impressão que a inflação do ano de 2010 é quase o triplo da inflação de 2009.

15
Fonte: http://www.viomundo.com.br/humor/grafico-da-globo-inflaciona-a-inflacao.html

O gráfico correto é:

1.6.7 Cartograma

É a representação sobre uma carta geográfica.


Esse gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente
relacionados com áreas geográficas ou políticas.

16
Exemplo 12:

1.6.8 Pictograma

O pictograma constitui um dos processos gráficos que melhor fala ao público, pela sua forma ao
mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras.

Exemplo 13: Desmatamento da floresta amazônica em Altamira (PA)

17
Fonte: http://professorandrios.blogspot.com/2011/08/representacao-grafica-de-dados.html

1.7. Medidas descritivas


Estatística é a ciência dos dados. Um aspecto importante de lidar com dados é organizá-los e
resumi-los em maneiras que facilitem sua interpretação e análise subsequente. Os resumos visuais de
dados (tabelas e gráficos) são excelentes ferramentas para obter impressões e ideias iniciais. Uma análise
mais formal de dados frequentemente exige o cálculo e a interpretação das medidas de resumo numéricas
simples. Isto é, um conjunto de números pode reduzir-se a uma ou a algumas medidas numéricas que o
resumem todo. Tais medidas são de mais fácil manejo e compreensão do que os dados originais.
O objetivo aqui é apresentar os métodos mais úteis para resumir dados. Embora não exista um
padrão que se possa considerar o melhor, há técnicas que se prestam melhor que outras a determinadas
situações.

Medidas de tendência central

Há situações em que não estamos interessados nos padrões de um grupo, mas em caracterizá-
lo como um todo. Podemos ter questões como: Qual o salário médio do trabalhador brasileiro? Qual o tipo
sanguíneo mais comum? Qual a nota que divide os alunos de uma turma em um grupo superior e o outro
inferior? Para responder a essas questões necessitamos de um valor único, que represente todos os
valores obtidos pelo grupo. Este número possibilita a caracterização do grupo como um conjunto e tende
a se condensar no centro da série; desse fato deriva o termo "medida de tendência central". A utilização
de medidas de posição não substitui o uso de tabelas e de gráficos.
Veremos, então, três medidas de tendência central: a média, a mediana e a moda. Elas constituem
maneiras diversas de determinar um único número representativo de uma série.

1.7.1 Médias

A média de um conjunto de números é um valor que, levando em conta a totalidade dos elementos
do conjunto, pode substituir a todos sem alterar determinada característica desse conjunto.
Por exemplo, se a característica do conjunto é a soma dos seus elementos, tem-se a mais simples
de todas as médias: a média aritmética.

18
Existem vários tipos de médias, sendo a mais utilizada a aritmética; portanto, sempre que
mencionarmos simplesmente média, estaremos nos referindo à aritmética.

- Média aritmética simples (  ou x )

A média (aritmética) é, de modo geral, a mais importante de todas as mensurações numéricas


descritivas. Consiste em adicionar os elementos e dividir a soma pelo número de elementos adicionados.

Se as n observações de uma amostra forem denotadas por x1, x2, ..., xn, então a média da amostra
será
𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝒏 ∑ 𝒙
̅=
𝒙 =
𝒏 𝒏

Em notação de somatório, a média aritmética é representada da seguinte forma:

n N

 xi x i
x = i =1
ou  = i =1

n N
ou mais simples como:

x =
xi
x = i
ou
n N

onde:
x é a média aritmética amostral
 é a média aritmética populacional
xi são os valores da variável
 (letra Sigma) é o somatório dos valores da variável
n é o número de medidas efetuadas na amostra
N é o número de medidas efetuadas na população

Quando desejamos saber a média de dados não agrupados determinamos a média aritmética
simples.

Exemplo 14: Sabendo-se que o número de atendimentos num SAC (Serviço de Atendimento ao
Consumidor), durante uma semana foi de 10, 17, 13, 15, 16, 18 e 12 ligações telefônicas, temos, para o
atendimento médio da semana:

10 + 17 + 13 + 15 + 16 + 18 + 12 101
x= = = 14,4
7 7

Logo, x = 14,4 ligações/dia

19
A média aritmética de uma amostra pode não pertencer ao conjunto original de valores, nem
precisa ter significado real.

- Média aritmética ponderada

A fórmula anterior para calcular a média aritmética supõe que cada observação tenha a mesma
importância. Embora este seja o caso mais geral, há exceções.
A média aritmética ponderada é aquela resultante de um conjunto de valores, no qual alguns
valores têm importância (ou quantidade de ocorrências) maior que a dos outros.

Exemplo 15: Pesquisadores, às vezes, consideram útil obter uma “média das médias” – isto é, calcular
uma média total para um número diferente de grupos. Suponha, por exemplo, que estudantes de três
turmas de Introdução à Sociologia tenham recebido as notas médias a seguir em suas provas finais:

Turma 1 x 1 = 85 n1=28

Turma 2 x 2 = 72 n2=28

Turma 3 x 3 = 79 n3=28

Há o mesmo número de estudantes matriculados em cada uma das turmas do curso, então, torna-
se bastante simples calcular um escore médio total:

x1 + x 2 + x 3 85 + 72 + 79
= = 78 ,67
3 3

Na maioria dos casos, os grupos diferem em tamanho. Voltando às turmas de Introdução à


Sociologia, por exemplo, é provavelmente incomum encontrar precisamente o mesmo número de
estudantes matriculados em diferentes turmas de um curso. O mais provável é que o número de
estudantes que realizam uma prova final em cada uma das três turmas do curso de sociologia seja
diferente. Nesse caso,
Turma 1: x 1 = 85 n1=95

Turma 2: x 2 = 72 n2=25

Turma 3: x 3 = 79 n3=18

Tem-se que ponderar cada média de grupo por seu tamanho (n). A média ponderada pode ser
calculada da seguinte forma:
n1 x 1 + n 2 x 2 + n 3 x 3 95 .85 + 25 .72 + 18 .79 11 .297
= = = 81,86
n1 + n 2 + n 3 95 + 25 + 18 138

Podemos, então, escrever:

20
x=
(n xgrupo grupo )

n total

Exemplo 16: Os salários médios mensais dos professores de ensino fundamental em três cidades são
R$ 1.450,00, R$ 1.620,00 e R$ 1.190. Havendo 720, 660 e 520 professores de ensino elementar nessas
cidades, qual o salário médio dos professores?

Nesse exemplo, os salários médios de cada cidade são os valores da variável (x i) e o número de
professores de cada cidade são os pesos (wi). Assim,
x1 = 1.450,00 e w1 = 720
x2 = 1.620,00 e w2 = 660
x3 = 1.190,00 e w3 = 520
logo,
x1 . w1 + x2 . w2 + x3 . w3 1.450 x 720 + 1.620 x 660 + 1.190 x 520
x̅ = = = 1.437,90
w1 + w2 + w3 720 + 660 + 520

O salário médio dos professores das três cidades é R$ 1.437,90.


A situação descrita acima também é chamada de “média das médias”.

Exemplo 17: Foi aplicado um questionário aos funcionários de uma empresa, onde uma das questões
era: “Qual o grau de satisfação com a alimentação servida no refeitório?”. As respostas foram as seguintes:

Muito satisfeito: 25 funcionários Satisfeito: 88 funcionários


Nem satisfeito, nem insatisfeito: 39 funcionários Insatisfeito: 12 funcionários
Muito insatisfeito: 8 funcionários Não responderam: 19 funcionários

Qual o grau médio de satisfação em relação à alimentação servida no refeitório?


Se admitirmos Muito satisfeito = 5 a decrescermos até Muito insatisfeito = 1, teremos:

5 x 25 + 4 x 88 + 39 x 3 + 12 x 2 + 8 x 1
x̅ =
25 + 88 + 39 + 12 + 8
626
𝑥̅ =
172

𝑥̅ = 3,64
O grau médio de satisfação é 3,64.

21
Exemplo 18: Uma pesquisa amostral efetuada junto a estudantes de uma faculdade acusa os seguintes
dados sobre o conceito obtido na disciplina de Estatística.

Conceito Número de estudantes


0 4
1 28
2 41
3 29
4 12
Total 114

Baseados na tabela, qual o conceito médio?

Nessa situação, podemos entender o número de estudantes (frequência) como o fator de


ponderação. Então, podemos afirmar que o conceito médio é calculado da seguinte forma:

𝑥1 . 𝑓1 + 𝑥2 . 𝑓2 + 𝑥3 . 𝑓3 + 𝑥4 . 𝑓4 + 𝑥5 . 𝑓5 245
𝑥̅ = = = 2,15
𝑓1 + 𝑓2 + 𝑓3 + 𝑓4 + 𝑓5 114
O conceito médio obtido é 2,15.

̅)
- Média geométrica (𝒈
Para entender o conceito de média geométrica, parte-se da seguinte situação prática:
Quer-se analisar o crescimento das vendas em uma empresa ao longo de três anos. As taxas de
crescimento estão descritas na tabela a seguir:

Período 1º ano 2º ano 3º ano


Taxa de crescimento 18% 11% 4%

A partir dos dados da tabela, qual foi o crescimento médio de vendas da empresa?

Inicialmente, interpretando os dados que foram apresentados, percebe-se que as vendas da


empresa cresceram de forma diferente em cada período. Pode-se afirmar que no primeiro ano de análise,
o valor das vendas aumentou em 18%. No segundo ano, as vendas cresceram um pouco menos, 11%
mais precisamente, mas sobre o valor total das vendas do ano anterior, que já tinham sido acrescidas de
18%. Já no terceiro ano, as vendas aumentaram em cerca de 4%, mas novamente essa porcentagem se
aplica sobre o saldo do ano anterior, ou seja, do segundo ano analisado, que já tinha sido acrescido de
18% e ainda de mais 11%. Isso significa, em termos de cálculo, que sempre vamos aplicar as taxas
apresentadas sobre o valor total das vendas do período anterior, e não sempre sobre o valor inicial.

Supõe-se agora, para que o raciocínio seja conduzido ao objetivo da questão, que o valor inicial
das vendas antes da análise mostrada na tabela, era de R$100.000,00 por ano. Aplicando as taxas sobre
os valores de cada período, chega-se a situação apresentada na figura abaixo, onde encontraremos o
valor total das vendas ao final do terceiro ano.

22
100.000 + 18% 118.000 + 11% 130.980 + 4% 136.219,20

Seguindo o exercício, vê-se que em termos de valores, essa empresa teria vendido, no final do
terceiro ano de análise, um valor total de R$ 136.219,20. Mas se ao invés de aplicar todas essas taxas
diferentes a cada período, ao encontrarmos uma taxa média, que representasse todas elas, o cálculo
seria mais fácil. É isso que o exercício nos propõe!
1,18+1,11+1,04
A média aritmética entre as três taxas é 𝑥̅ = = 1,11 𝑜𝑢 11%
3
Para averiguar a veracidade do que se está supondo, será refeito todo o cálculo anteriormente
apresentado.

100.000 + 11% 111.000 + 11% 123.210 + 11% 136.763,10

Percebe-se que a média aritmética, apesar de bem simples, não ajuda a resolver problemas como
esse.
Casos como o apresentado são resolvidos com o cálculo da média geométrica.
A média geométrica de uma amostra é um número que, levando em conta o total dos elementos
dessa amostra, pode representar a todos, sem alterar o produto desses elementos. Assim sendo, a média
geométrica de uma amostra de tamanho n é igual à raiz de ordem n do produto dos n valores.

Desse modo, a média geométrica é calcula por:


𝑛
𝑔̅ = 𝑛√𝑥1 . 𝑥2 . … . 𝑥𝑛 ou 𝑔̅ = √∏ 𝑥

Para o exemplo dado, tem-se a seguinte taxa média (geométrica):


3
𝑔̅ = √1,18 ∗ 1,11 ∗ 1,04 = 1,108527 𝑜𝑢 10,8527%

100.000 + 10,8527% 110.852,70 + 10,8527% 122.883,12 + 10,8527% 136.219,20

̃)
1.7.2 Mediana (Md ou Med ou 𝒙

Diferentemente da média, a mediana não tem um símbolo específico, usado internacionalmente.


A partir da situação a seguir, será introduzido o conceito de mediana.

Exemplo 19: Consideremos a idade de nove pessoas que fizeram uma viagem de estudos.
Pessoa 1 2 3 4 5 6 7 8 9
Idade (anos) 19 21 25 21 25 22 21 59 21

23
Percebemos que a pessoa nº 8 apresenta idade muito maior que as demais.

Ao determinar a média das idades das nove pessoas, obtemos 𝑥̅ = 26 𝑎𝑛𝑜𝑠 . Comparando a média
com os demais valores, podemos notar que apenas uma pessoa tem idade superior a ela, ou seja, oito
pessoas têm idade inferior à idade média. Por isso, ela pode ser mal interpretada, pois a média leva em
conta, no seu cálculo, todos os valores do conjunto de dados.
Para evitar a possibilidade de ser induzido em erro por uma média afetada por um valor muito
pequeno ou muito grande, por vezes é preferível caracterizar o centro de um conjunto de dados por outra
medida que não a média: por exemplo, a mediana.
A mediana é aquele valor que ocupa a posição central da listagem, estando a amostra com seus
valores ordenados e com todos os valores repetidos também incluídos, individualmente, na lista. A
mediana da amostra divide o conjunto total em duas partes iguais, com metade (50%) dos valores
restantes acima da mediana da amostra e metade (50%) abaixo dela. A mediana da amostra pode não
pertencer ao conjunto original de valores.

Para o caso das idades, ordenando os valores têm-se


Pessoa 1 2 3 4 5 6 7 8 9
Idade (anos) 19 21 21 21 21 22 25 25 59

A mediana é Md = 21 anos. O valor ocupa o centro da ordenação como mostra a tabela acima.
Então, 50% das pessoas da amostra têm idade igual ou inferior a 21 anos. Ou, podemos
afirmar que 50% das pessoas da amostra têm idade igual ou superior a 21 anos.

Exemplo 20: Se o conjunto tiver número par de termos, a mediana será, por definição, qualquer número
compreendido entre os dois valores centrais da lista. Convencionaremos utilizar o ponto médio. Dado o
conjunto:
2, 6, 7, 10, 12, 13, 18, 21

temos, para mediana, a média aritmética entre 10 e 12.

10 + 12 22
Logo: Md = = = 11 → Md = 11
2 2

Exemplo 21: Em 14 dias, um laboratório realiza 40, 52, 55, 38, 40, 48, 56, 56, 60, 37, 58, 63, 46, 50 e 61
testes. Qual a média e qual a mediana para o contexto do problema?
x1 +x2 +⋯+xn 40+52+⋯+61 701
Média: x̅ = = = = 50,1 testes
n 14 14

24
Para determinar a mediana, ordenamos os valores:
37 38 40 40 46 48 50 52 55 58 56 58 60 63

50+52
Mediana: Md = = 51 testes
2

➢ Em 50% dos dias, o laboratório realizou menos de 51 testes. Logo, em 50% dos dias, o laboratório
realizou mais de 51 testes.

Características da mediana

1) Não depende de todos os valores do conjunto, podendo se manter inalterável com a modificação de
alguns deles.

2) Não é influenciada pelos valores extremos do conjunto; por isso é particularmente indicada quando
existem dados discrepantes.

3) Pode ser calculada quando os valores mais altos e mais baixos de um conjunto não podem ser
exatamente definidos.

1.7.3 Moda ( Mo)

A moda dos dados é (são) o(s) resultado(s) que mais se destaca(m), isto é, que ocorre(m) com
maior frequência no fenômeno estudado.
Moda é, portanto, o resultado mais frequente, mais típico e mais comum de um conjunto de dados.
Por exemplo, há mais católicos no Brasil do que pessoas de outra religião. Similarmente, se o curso de
engenharia é o mais popular de uma determinada universidade, ele também representa a moda. A moda
é a única medida de tendência central que se pode aplicar para variáveis nominais, como religião e curso
universitário. Pode ser usada, entretanto, para descrever o escore mais comum em qualquer conjunto de
dados.

Exemplo 22: Quando mencionamos, no início do estudo sobre medidas de tendência central, sobre o tipo
de sangue mais comum, estamos interessados na moda. Se um comerciante pretende abrir uma loja de
calçados e quer saber quais os números de sapatos femininos que deve encomendar em maior
quantidade, a medida de tendência que ele necessita para um bom planejamento administrativo é a moda.
Numa eleição, o candidato que tem o maior número de votos representa a moda. Evidentemente, o
comerciante pode constatar que não há um único número de sapato que predomine, mas que os mais
comuns são 35, 36 e 37. Terá, assim, uma distribuição multimodal, com três modas: 35, 36 e 37.

Cabe ressaltar que, apesar de ser a frequência que se destaca, a moda não representa
necessariamente a maioria no total de resultados.
Um conjunto de números pode não ter valor modal (ou moda) ou apresentar vários tipos de
repetições, recebendo então várias denominações:

25
a) amodal, quando não tem distinção entre todas as frequências que aparecem;
b) unimodal, quando há apenas uma moda;
c) bimodal, quando há duas modas;
d) multimodal, quando há três ou mais modas.

Exemplo 23:
➢ 2, 7, 5, 4, 3, 1, 1, 2, 5, 4, 3,7 → AMODAL

➢ 1, 3, 9, 2, 9, 5, 5, 5, 9, 3, 5 → UNIMODAL: Mo = 5

➢ 7,1 - 8,4 - 7,1 - 7,1 - 9,5 - 8,4 - 9,4 - 8,4 – 9,5 – 7,1 – 8,4 → BIMODAL: Mo1 = 7,1 e
Mo2 = 8,4.

Observações
➢ Comparada com a média e com a mediana, a moda é a menos útil das medidas para problemas
estatísticos, porque não se presta à análise matemática, ao contrário do que ocorre com as
outras duas medidas. A utilidade da moda se acentua quando um ou dois valores, ou um grupo
de valores, ocorrem com muito maior frequência que outros.

➢ A unidade da grandeza é a mesma para as três medidas de tendência central que um conjunto
de dados apresenta.

➢ O Excel tem uma função específica para determinar a moda, mas não identifica se tem mais
que uma moda, ou seja, tal função só é confiável quando o conjunto de dados é amodal.

EXERCÍCIOS

1) Inspecionam-se quinze caixas de biscoitos, com 15 pacotes cada caixa. Os números de pacotes
defeituosos por caixa são: 1, 0, 3, 4, 2, 1, 0, 3, 1, 2, 0, 1, 1, 0, 1. Determine o número médio, mediano
e modal de defeituosos.
2) Qual o número que devemos juntar a 2; 7; 8 e 5 de modo que sua média seja 6?
3) A média aritmética simples de um conjunto de 10 números é 35. Se o número 12 for retirado do
conjunto, qual será a média aritmética dos números restantes?
4) A nota de Estatística de uma turma seria calculada com a média aritmética de 4 testes. Dessa maneira,
Luciana obteria nota 7. O professor, no entanto, resolver anular um dos testes no qual ela havia tirado
8. Qual vai ser a nota de Luciana?
5) Se o salário médio anual pago aos três administradores de uma firma é R$ 156.000,00, algum deles
pode receber um salário anual superior a R$ 500.000,00?
6) Em um posto de controle rodoviário, doze motoristas multados por excesso de velocidade estavam
dirigindo a 8 - 11 - 14 - 6 - 8 - 10 - 20 - 11 - 13 - 18 - 9 – 15 quilômetros por hora acima do limite
regulamentar de velocidade.

26
a) Em média, em quantos quilômetros por hora esses motoristas estavam excedendo o limite?
b) Se o motorista que excedia o limite em menos de 15 quilômetros por hora foi multado em R$60,00 e
os outros foram multados em R$88,00, determine a média das multas que esses motoristas tiveram
de pagar.
7) Durante um período de uma hora uma sorveteria recebeu 20 fregueses, e os valores das compras em
reais foram:
1,25 2,50 1,25 5,50 3,25 3,75 2,75 6,25 4,00 2,50
1,25 1,25 3,75 6,00 4,50 3,25 1,25 4,50 2,50 1,50
a) Calcule o valor médio das compras.
b) Se cada compra abaixo de R$ 5,00 faz jus a um bônus de 50 centavos, e cada compra de R$5,00
ou mais faz jus a um bônus de 1 real, ache o valor médio desses 20 bônus.
8) O número de carros vendidos por cada um dos 10 vendedores de uma revenda autorizada de
automóveis durante certo mês, é 10,10,4,7,2,12,10,12,15 e 14. Determinar:
a) a venda média;
b) a venda mediana;
c) a moda para esta distribuição.

9) O número de acidentes ocorridos durante um dado mês em 13 departamentos de manufaturas de uma


indústria foi: 2, 0, 0, 3, 3, 12, 1, 0, 8, 1, 0, 5 e 1. Calcular:
a) a média;
b) a mediana;
c) a moda para o número de acidentes por departamento.

10) Suponha que os preços de varejos de alguns itens selecionados tenham variado conforme a tabela a
seguir. Determinar a mudança percentual média nos preços de varejo:

Item Porcentagem Despesa média mensal


de aumentos (antes do aumento)
Leite 10% 100,00
Carne -6% 150,00
Vestuário -8% 150,00
Gasolina 20% 250,00

11) A média pode ser zero? Pode ser negativa? Explique.

12) A mediana pode ser zero? Negativa? Explique.

RESPOSTAS
1) x = 1,33, Md = 1, Mo = 1
2) 8
3) 37,56
4) 6,7
5) Não
6) a) 11,92 b) 67
7) a) 3,14 b) 0,58

27
8) a) x = 9,6 b) Md = 10 c) Mo = 10
9) a) x = 2,77 b) Md = 1 c) Mo = 0
10) 6%
11) Sim. Sim.
12) Sim. Sim.

MEDIDAS DE DISPERSÃO

1.7.4 Dispersão ou variabilidade

Vimos anteriormente que um conjunto de valores pode ser convenientemente sintetizado, por meio
de procedimentos matemáticos, em poucos valores representativos - média aritmética, mediana, moda.
Tais valores podem servir de comparação para dar a posição de qualquer elemento do conjunto. Porém,
não é o bastante dar uma das medidas de posição para caracterizar perfeitamente um conjunto de valores.

Exemplo 23: Suponhamos que se deseja comparar o desempenho de dois funcionários, com base no
número peças sem defeitos produzidas durante uma semana.

Empregado A: 80, 81, 79, 80, 80 → x = 80 peças/dia.


Empregado B: 68, 92, 74, 73, 93 → x = 80 peças/dia.

Baseados nestes únicos resultados obtidos, diríamos que o desempenho dos dois empregados é
o mesmo, já que as médias são iguais. No entanto se formos um pouco cuidadosos, percebemos que o
desemprenho A varia de 79 a 81 peças, ao passo que o de B varia de 68 a 93 peças, o que indica que o
desempenho de A é mais homogêneo do que de B.
Um alto grau de homogeneidade costuma ser considerado como uma qualidade desejável nesta
situação.
Consideremos agora a seguinte situação:

Exemplo 24: Temos duas turmas A e B. Observe a tabela onde é mostrado o desempenho dos alunos.

Turma A Turma B Calcule a média de cada turma.


1 4
0 6
10 5
9 3
2 4
8 7
5 6
 = 35  = 35

Esses dois conjuntos possuem a mesma média. Pode-se dizer que estes conjuntos são iguais?

28
Não, porque embora ambos tenham a mesma média eles diferem na sua homogeneidade. Neste
exemplo, o conjunto A é mais heterogêneo ou mais disperso que o conjunto B. Portanto, não bastam
que conheçamos apenas a média de um conjunto, precisamos também, conhecer a dispersão do conjunto.
Daí surgem as medidas de variabilidade ou medidas de dispersão. Estas medidas medem a
dispersão do conjunto, avaliando a heterogeneidade ou a homogeneidade do mesmo.

A dispersão mede quão próximos (ou quão afastados) uns dos outros estão os
valores de um grupo.

As medidas de dispersão que trabalharemos são:

Amplitude
Variância
Desvio padrão
Coeficiente de variação

1.7.5 Amplitude

Quando pensamos em ‘amplitude térmica num certo dia”, temos em mente a variação entre os
extremos da temperatura naquele dia.
A amplitude (ou intervalo total) de um conjunto de dados é igual à diferença entre o maior e o menor
valor.

h = maior valor – menor valor

Exemplo 25: Em um hospital, onde se mede a pulsação de cada paciente três vezes por dia, o paciente
A acusou as taxas de 72, 76 e 74, e o paciente B acusou 72, 91 e 59. A taxa média de ambos é a mesma,
74; observe, entretanto, a diferença na variabilidade. Enquanto a pulsação de A é estável, a de B apresenta
grande flutuação.
A vantagem de usar a amplitude como medida de dispersão reside no fato de o intervalo ser
relativamente fácil de calcular, mesmo para um grande conjunto de números. Entretanto, a maior limitação
da amplitude é o fato dela levar em conta somente os dois valores extremos de um conjunto, nada
informando quanto aos outros valores.

1.7.6 Variância

A variância é a medida de dispersão que mede a média dos quadrados dos desvios dos valores,
de um conjunto numérico em relação a sua média.

29
Cálculo da Variância:

s 2
=
 (x i − x) 2 amostral
n −1

 2
=
 (x i − )2 populacional
N

Onde:
xi = valor da variável
x = média amostral
x i − x = desvio em relação à média
 = média populacional

No cálculo de variância divide-se a soma obtida por n-1 quando se trata de um conjunto de números
que representam uma amostra. Se um conjunto de números constitui uma população, ou se a finalidade
de somar os dados é apenas descrevê-los, e não fazer inferências sobre uma população, então deve-se
usar N em lugar de (n-1) no denominador.

Exemplo 26: Calcular a variância da produção dos dois funcionários (Exemplo 23), lembrando que a
produção média de peças é 80, para ambos os funcionários.

Funcionário 𝑥 − 𝑥̅ (𝑥 − 𝑥̅ )2 Funcionário 𝑥 − 𝑥̅ (𝑥 − 𝑥̅ )2
A B
80 80 – 80 = 0 02 = 0 68 68 – 80 = -12 (-12)2=144
81 81 – 80 = 1 12 = 1 92 92 – 80 = 12 122=144
79 79 – 80 = -1 (-1)2 = 1 74 74 – 80 = - 6 (-6)2=36
80 80 – 80 = 0 02 = 0 73 73 – 80 = - 7 (-7)2=49
80 80 – 80 = 0 02 = 0 93 93 – 80 = 13 132=169
=0 =2 =0  = 542

Calculando a variância da produção do funcionário A:

∑(𝑥 − 𝑥)2 2 2
𝑠2 = = = = 0,5 𝑝𝑒ç𝑎𝑠2
𝑛−1 5−1 4

Calculando a variância da produção do funcionário B:


∑(𝑥 − 𝑥)2 542 542
𝑠2 = = = = 135,5 𝑝𝑒ç𝑎𝑠2
𝑛−1 5−1 4

30
Exemplo 27: Calcular a variância da tabela a seguir, que representa o desempenho das duas turmas
(exemplo 24), lembrando que o desempenho médio das turmas é igual a 5.

Turma A 𝑥 − 𝑥̅ (𝑥 − 𝑥̅ )2 Turma B 𝑥 − 𝑥̅ (𝑥 − 𝑥̅ )2
1 1 – 5 = -4 (-4)2 = 16 4 4 – 5 = -1 (-1)2 = 1
0 0 – 5 = -5 (-5)2 = 25 6 6–5=1 12 = 1
10 10 – 5 = 5 52 = 25 5 5–5=0 02 = 0
9 9 – 5 = -4 (-4)2 = 16 3 3 – 5 = -2 (-2)2 = 4
2 2 – 5 = -3 (-3)2 = 9 4 4 – 5 = -1 (-1)2 = 1
8 8–5=3 32 = 9 7 7–5=2 22 = 4
5 5–5=0 02 = 0 6 6–5=1 (-1)2 = 1
=0  = 100 =0  = 12

Calculando a variância do desempenho da turma A:

2
∑(𝑥 − 𝑥)2 100 100
𝑠 = = = = 16,67 𝑝𝑜𝑛𝑡𝑜𝑠 2
𝑛−1 7−1 6

Calculando a variância da produção do funcionário B:


∑(𝑥 − 𝑥)2 12 12
𝑠2 = = = = 2 𝑝𝑜𝑛𝑡𝑜𝑠 2
𝑛−1 7−1 6

A variância é expressa na unidade de medida do conjunto numérico. Como ela é um valor ao


quadrado, torna-se difícil a interpretação prática, motivo pelo qual surge outra medida de dispersão: o
desvio padrão.

1.7.7 Desvio padrão

O desvio padrão é simplesmente a raiz quadrada positiva da variância.

s= s2  = 2
ou

s =
 (x i − x) 2
=  (xi −  )2
n −1 N
Exemplo 28: Calcular o desvio padrão para a produção de peças dos empregados A e B do exemplo 23.

∑(𝑥−𝑥)2
Empregado A: 𝑠=√ = √0,5 = 0,7 𝑝𝑒ç𝑎
𝑛−1

∑(𝑥−𝑥)2
Empregado B: 𝑠=√ = √135,5 = 11,6 𝑝𝑒ç𝑎𝑠
𝑛−1

31
Exemplo 29: Calcular o desvio padrão para o desempenho das turmas A e B, do exemplo 24:

∑(𝑥−𝑥)2
Turma A: 𝑠=√ = √16,67 = 4,1 𝑝𝑜𝑛𝑡𝑜𝑠
𝑛−1

∑(𝑥−𝑥)2
Turma B: 𝑠=√ = √2 = 1,4 𝑝𝑜𝑛𝑡𝑜
𝑛−1

O desvio padrão é uma das medidas mais comumente usadas para distribuições, e desempenha
papel relevante em toda a estatística. Cabe notar que a unidade do desvio padrão é a mesma da média.
Por exemplo, se a média é em reais, o desvio padrão também se exprime em reais. A variância, por sua
vez, se exprime em quadrados de unidades ( p. ex., reais2).

1.7.8 Coeficiente de variação ou desvio padrão relativo

Examinemos o seguinte exemplo, em que são comparados os pesos de dois grupos de indivíduos
(crianças e adultos), apresentados na tabela abaixo:

Crianças ( kg ) Adultos ( kg )
4 66
2 64
6 62

Verificamos que o peso médio para as crianças é de 4 kg, enquanto para os adultos é de 64 kg. A
dispersão dos dados em torno da média é a mesma, pois ambos têm desvio padrão s = 2 kg. Entretanto
a variação de 2 kg no grupo de crianças, cujo peso médio é de 4 kg, é mais importante do que a mesma
variação no grupo de adultos, cujo peso médio é 64 kg. Neste tipo de situação, é mais interessante o
emprego de uma medida de dispersão relativa adimensional e geralmente expressa em porcentagens: o
coeficiente de variação.

O coeficiente de variação é dado pelo quociente entre o desvio padrão e a média de um conjunto.

𝑠 𝜎
𝐶𝑉 = |𝑥| ou 𝐶𝑉 = |𝜇|

Exemplo 29: Determinar os coeficientes de variação da tabela anterior.

EXERCÍCIOS

1) O desvio padrão pode ser zero? Explique.

2) Calcule a média e o desvio padrão de uma amostra das vendas diárias, em reais;
8.100, 9.000, 4.580, 5.600, 7.680, 4.800 e 10.640.

32
3) Calcular a variância e o desvio padrão abaixo correspondente à amostra do peso de um grupo de
alunos (amostra).

Aluno A B C D E F G H I J K L Total
Peso
53,2 42,7 48,8 55 31,5 44,2 45,6 49,1 54 56,2 38,8 37,4
(kg)

4) Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão,
respectivamente, 18,3 e 1,47, calcule o coeficiente de variação.

5) Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio padrão,
0,80. Em Estatística, entretanto, o grau médio final foi 7,3 e o desvio padrão, 0,76. Em que disciplina
foi maior a dispersão?

6) Medidas as estaturas de 1.017 indivíduos, obtivemos x = 162,2 cm e s = 8,01 cm. O peso médio
desses mesmos indivíduos é 52kg, com um desvio padrão de 2,3kg. Esses indivíduos apresentam
maior variabilidade em estatura ou em peso?

7) Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 5,97cm. Outro
grupo de 125 moças tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01cm.
Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo?

8) Um grupo de cem estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação
de 3,3%. Qual o desvio padrão desse grupo?

9) Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e CV = 2,9%. Determine a média da


distribuição.

10) Foram observados os salários de quinze funcionários públicos federais (em salários mínimos). Os
resultados foram:

9,3 10,7 8,5 9,6 12,2 15,6 9,2 10,5


9,0 13,2 11,0 8,8 13,7 12,1 9,8

Determinar o salário médio da amostra acima, bem como a mediana e o desvio padrão.

11) Dois processos, medindo a espessura de materiais diferentes, obtiveram os seguintes resultados:
1 - Folha de aço: média = 2,49 mm; desvio padrão = 0,12 mm
2 - Chapa de madeira: média = 3,75 mm; desvio padrão = 0,15 mm

Qual dos dois processos é relativamente mais preciso?

RESPOSTAS

1) Sim. 2) x = 7200 s = 2284


3) s2 = 60,6 s = 7,8 (para média = 46,4)
4) 8% 5) CV em Matemática = 10,3% CV em Estatística = 10,4%
6) CV em estatura = 4,9% CV em peso = 4,4%
33
7) CV primeiro grupo = 3,72% CV segundo grupo = 3,71%

8) 5,4 9) 51,7 10) x =10,88 Md=10,5 s = 2,08

11) Processo 2 (CV1 = 4,8% e CV2 = 4,0%)

1.8. Distribuições de frequências

Anteriormente foram apresentados os métodos mais úteis para resumir dados, quando se tratava
de análise de pequenos conjuntos de dados (dados não agrupados).
Quando lidamos com grandes conjuntos de dados, podemos obter uma boa visualização e todas
as informações necessárias, agrupando os dados em certo número de classes, intervalos ou categorias.

A distribuição de frequências (D.F.) é um resumo, em forma de tabela, que mostra a frequência


(ou o número) de observações em cada uma das diversas classes não sobrepostas.

Quando se estuda uma variável, o maior interesse do pesquisador é conhecer o comportamento


dessa variável, analisando a ocorrência de suas possíveis realizações. Ao sintetizarmos os dados eles
podem ser mais facilmente entendidos e interpretados.
Como visto anteriormente as variáveis podem ser qualitativas e quantitativas. O nosso objetivo
nesse capítulo será demonstrar como realizar o agrupamento de dados quantitativos.
Como mencionado, uma distribuição de frequência é um resumo que mostra as frequências de
observações em cada uma das classes não sobrepostas.

As três etapas necessárias para definir as classes para uma distribuição de frequências com dados
quantitativos são:

1) Determinar o número de classes não sobrepostas.


2) Determinar a extensão (tamanho) de cada classe.
3) Determinar os limites de cada classe.

Exemplo 30: Vamos demonstrar essas etapas para os dados de estaturas, medidas em centímetros, de
40 alunos do colégio A.

Dados brutos (não organizados) – observações

166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161

Rol (dados organizados em ordem crescente)

150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173

34
Tabela das estaturas

i Variável frequência fi
Classe Estatura (cm) Número de alunos
1 150 |---- 154
2 154 |---- 158
3 158 |---- 162
4 162 |---- 166
5 166 |---- 170
6 170 |---- 174
------ TOTAL

OBSERVAÇÕES

1) Ao agruparmos os valores das variáveis em intervalos, ganhamos em simplicidade, mas


perdemos em pormenores. Lembremos que a Estatística tem por finalidade específica analisar
o conjunto de valores, desinteressando-se por casos isolados.

2) A escolha dos intervalos é arbitrária e a familiaridade do pesquisador com os dados é que lhe
indicará quantas e quais classes (intervalos) devem ser usadas. Entretanto, devemos observar
que, com um pequeno número de classes, perde-se informação, e com um número grande de
classes, o objetivo de resumir os dados fica prejudicado. Normalmente, sugere-se o uso de 5
a 15 classes com a mesma amplitude.

Exemplo (Continuação): Considerando, então a D.F. dada, podemos montar a seguinte tabela :

Distribuição de frequências para dados de estatura

i Variável Frequência fi Frequência relativa Frequência Frequência Ponto médio


acumulada acumulada relativa
Número de
Classe Estatura (cm) % Número de alunos % Estatura (cm)
alunos
1 150 |---- 154 4 10,0 4 10,0 152
2 154 |---- 158 9 22,5 13 32,5 156
3 158 |---- 162 11 27,5 24 60,0 160
4 162 |---- 166 8 20,0 32 80,0 164
5 166 |---- 170 5 12,5 37 92,5 168
6 170 |---- 174 3 7,5 40 100,0 172
------ TOTAL 40 100,0 ------ ------ ------

Considerando a tabela com as diversas frequências responda:

a) Quantos alunos têm estatura abaixo de 166cm?


b) Quantos alunos têm estatura igual ou superior a 170 cm?
c) Quantos alunos têm estatura abaixo de 162 cm?
d) Qual o percentual de alunos que têm estatura entre 162, inclusive, e 166 cm?
e) Qual o percentual de alunos que têm estaturas não inferior a 162 cm?

35
EXERCÍCIOS

1) As notas obtidas por 50 alunos de uma classe foram:

1 2 3 4 5 6 6 7 7 8
2 3 3 4 5 6 6 7 8 8
2 3 4 4 5 6 6 7 8 9
2 3 4 5 5 6 6 7 8 9
2 3 4 5 5 6 7 7 8 9

Complete a distribuição de frequências a seguir:

Classe Notas Número de alunos ( f ) %


1 0 |---- 2
2 2 |---- 4
3 4 |---- 6
4 6 |---- 8
5 8 |---- 10
------- Total

2) Dão-se, a seguir, as notas obtidas por 48 estudantes em um teste:

37 54 62 70 79 87
39 54 62 71 80 88
42 56 63 72 81 91
45 57 64 75 82 92
48 58 66 76 83 93
49 59 67 78 84 94
50 60 67 78 85 94
52 60 67 79 85 96

Agrupe essas notas em uma distribuição com 7 classes.

3) Os pesos, em kg, de 80 alunos de uma universidade estão relacionados abaixo. Organizar os dados
em forma de uma D.F com 8 classes e iniciar com o limite inferior da primeira classe em 45.

49 53 61 66 72 79 84 90 93 98
49 54 61 66 73 80 85 90 93 99
49 56 61 67 74 80 86 90 94 99
50 56 62 68 74 80 87 91 94 100
50 58 63 68 75 82 88 92 95 101
50 59 64 70 76 83 89 92 96 102
51 60 65 70 76 83 89 92 97 102
52 60 66 72 78 83 89 93 97 105

36
4) Em uma fábrica foram testadas 400 lâmpadas; a duração delas aparece na distribuição por frequências
abaixo:

DURAÇÂO NÚMERO DE
(em horas) LÂMPADAS
600 |---- 700 14
700 |---- 800 46
800 |---- 900 58
900 |---- 1000 76
1000 |---- 1100 68
1100 |---- 1200 62
1200 |---- 1300 48
1300 |---- 1400 22
1400 |---- 1500 6
TOTAL 400
Complete a tabela com a frequência relativa, a frequência acumulada, a frequência acumulada
relativa e o ponto médio.

A seguir, responda:
a) Qual a porcentagem de lâmpadas com durabilidade inferior a 1.000 horas?
b) Qual a porcentagem de lâmpadas com durabilidade de 1.200 horas ou mais?

Respostas

1)
Classe Notas Número de alunos ( f ) %
1 0 |---- 2 1 2,0
2 2 |---- 4 11 22,0
3 4 |---- 6 13 26,0
4 6 |---- 8 16 32,0
5 8 |---- 10 9 18,0
------- Total 50 100,0

2) Observação: A seguir, tem exemplo de uma DF com 7 classes. Mas não é a única possibilidade.

Classe Notas Número de alunos ( f )


1 30 |---- 40 2
2 40 |---- 50 4
3 50 |---- 60 8
4 60 |---- 70 10
5 70 |---- 80 9
6 80 |---- 90 9
7 90 |---- 100 6
------- Total 48

3)
Classe Peso (kg) Número de alunos ( f )
1 45 |---- 53 8
2 53 |---- 61 8
3 61 |---- 69 13
4 69 |---- 77 10
5 77 |---- 85 10
6 85 |---- 93 14
7 93 |---- 101 13

37
8 101 |---- 109 4
------- Total 80

4)

Frequência Frequência Ponto médio


Número de
Duração (em horas) Frequência acumulada (número acumulada relativa (número de
lâmpadas
relativa (%) de lâmpadas) (%) lâmpadas)
600 |---- 700 14 3,5 14 3,5 650
700 |---- 800 46 11,5 60 15 750
800 |---- 900 58 14,5 118 29,5 850
900 |---- 1000 76 19,0 194 48,5 950
1000 |---- 1100 68 17,0 262 65,5 1050
1100 |---- 1200 62 15,5 324 81 1150
1200 |---- 1300 48 12,0 372 93 1250
1300 |---- 1400 22 5,5 394 98,5 1350
1400 |---- 1500 6 1,5 400 100 1450
TOTAL 400 100,0 --- --- ---

a) 48,5% b) 19%

1.8.1 Representação gráfica de uma distribuição de frequências

Uma boa maneira de visualizar a distribuição de uma variável numérica é um histograma. Mas no
que eles consistem? Histogramas são uma forma de exibir a distribuição de um conjunto de dados,
representando o número ou porcentagem de observações cujos valores se enquadram dentro de
intervalos numéricos predefinidos e, em seguida, plotando esses números ou porcentagens em um gráfico
de barras. Ou seja, em um histograma, os dados são colocados em intervalos e a altura das barras
representa o número de casos que caem em cada intervalo. Em outras palavras, um histograma fornece
uma visão da densidade de dados.

Exemplo 31: Histograma baseado na D.F das alturas dos alunos do exemplo 3.30.

Histograma de Frequência Histograma de Frequência Relativa


f 12
f 0,3
10 0,25
8 0,2
6 0,15
4 0,1
2 0,05
0 0
150 - 154 154 - 158 158 - 162 162 - 166 166 - 170 170 - 174 150 - 154 154 - 158 158 - 162 162 - 166 166 - 170 170 - 174
x x

O polígono de frequência simples é um gráfico obtido ligando-se os pontos médios dos topos
dos retângulos de um histograma. Para realmente obtermos um polígono (linha fechada), devemos ligar
os extremos da linha aos pontos médios da classe anterior à primeira e da posterior à última, da
distribuição.

38
Exemplo 32: Polígono de frequência simples baseado na D.F das alturas dos alunos do exemplo 3.30

12

10

frequência
6

0
148 152 156 160 164 168 172 176
estatura (cm)

O polígono de frequência acumulada é traçado marcando-se as frequências acumuladas sobre


perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos
intervalos de classe.

Exemplo 33: Polígono de Frequência Acumulada baseado na D.F das alturas dos alunos.

45
40
35
30
frequência

25
20
15
10
5
0
150 154 158 162 166 170 174
estatura (cm)

Exemplo 34

39
40

Você também pode gostar