Você está na página 1de 34

Estatística Descritiva Básica

Prof. Luiz Gustavo Alves Silva

2014
Sumário
01. Conceitos Iniciais ......................................................................................................................... 01
1.1. Definição de Estatística ........................................................................................................................01
1.2. Variável .................................................................................................................................................01
1.3. População e Amostra ...........................................................................................................................01
1.4. Frequência Absoluta e Frequência Relativa .........................................................................................02
1.5. Representações Gráficas ......................................................................................................................02
1.5.1. Gráficos de Barras e de Colunas ...................................................................................................02
1.5.2. Gráficos de Setores e de Rosca ....................................................................................................03
1.5.3. Gráficos de Linhas ........................................................................................................................04
1.6. Distribuição de Frequências .................................................................................................................05

02. Medidas de Posição ..................................................................................................................... 13


2.1. Média Aritmética .................................................................................................................................13
2.1.1. Média Aritmética para Dados Agrupados - sem intervalos de classe .........................................15
2.1.2. Média Aritmética para Dados Agrupados - com intervalos de classe .........................................16
2.2. Mediana ...............................................................................................................................................20
2.3. Moda....................................................................................................................................................20
2.4. Comparando a Média, a Mediana e a Moda .......................................................................................24

03. Medidas de Dispersão ................................................................................................................. 25


3.1. Amplitude Total ...................................................................................................................................25
3.2. Desvio Médio .......................................................................................................................................25
3.3. Variância ..............................................................................................................................................26
3.4. Desvio Padrão ......................................................................................................................................26
Respostas ........................................................................................................................................... 30
Bibliografia......................................................................................................................................... 31

 Nota do autor
Esta apostila tem por interesse fornecer uma introdução ao estudo da Estatística Descritiva,
apresentando noções gerais sobre gráficos e tabelas, medidas de posição e de dispersão. Este
material serve para estudantes de nível básico e universitário, para o professor que busca por
material de apoio ou para qualquer um que se interesse pelo tema. Procurei adicionar bastante
exercícios extraídos de vestibulares e ENEM, assim como busquei expor situações práticas nos
exemplos. Desde já agradeço a atenção de todos e desejo-lhes bons estudos! Dúvidas, críticas e
sugestões são sempre bem vindas. Este material (juntamente com vários outros) está disponível
gratuitamente no sítio:
http://manualdasexatas.blogspot.com.br/
Prof. Gustavo Silva
LUIZ GUSTAVO ALVES SILVA

Estatística Descritiva Básica/ SILVA, Luiz Gustavo Alves –


Pouso Alegre: Blog Manual das Exatas, 1ª Edição, 2014.
31 f.

Apostila (Matemática)
http://manualdasexatas.blogspot.com.br/, 2015.

1. Estatística Descritiva 2. Matemática 3. Médias


4. Tabelas e Gráficos
01 Conceitos Iniciais
1.1. Definição de Estatística
Podemos definir a Estatística como a ciência que lida com métodos de coleta, organização,
descrição e análises de dados, assim como auxilia na tomada de decisões a partir da interpretação
dos mesmos.
Ao que se refere à coleta, organização e descrição dos dados, cabe à Estatística Descritiva,
enquanto a análise, interpretação e previsões de resultados ficam a cargo da Estatística Indutiva
ou Inferencial. Nesta apostila básica será trabalhada apenas a estatística descritiva.

1.2. Variável
Chamamos de variável o conjunto de aspectos que podem ser atribuídos aos objetos da
pesquisa, ou seja, representa os possíveis resultados de um fenômeno. Veja alguns exemplos:
 para o fenômeno voto eleitoral podemos ter os resultados: voto nulo, voto em branco, voto
ao candidato A ou ao candidato B, etc;
 para o fenômeno número de alunos de uma instituição existe um número de resultados
possíveis que podem ser expressos pelos números naturais: , , , , , ... , ;
 para o fenômeno tempo de duração um determinado evento temos que os resultados
podem assumir um número infinito de valores numéricos dentro de certo intervalo.
Uma variável é dita qualitativa se seus valores são expressos por entradas não numéricas,
ou seja, por atributos ou qualidades: verdadeiro ou falso, masculino ou feminino, voto nulo, voto
em branco, etc.
E a variável é dita quantitativa se seus valores são expressos por medidas numéricas:
número de pessoas, salários de funcionários, quantidade de votos, etc. Uma variável quantitativa
que pode assumir somente valores dentro de um conjunto enumerável é chamada de variável
discreta; e uma variável que pode assumir, teoricamente, qualquer valor dentro de um intervalo é
denominada variável contínua.

1.3. População e Amostra


Em estatística chamamos de população o conjunto de todos os elementos que possuem,
pelo menos, uma característica em comum e que é de interesse seu estudo. Uma amostra é um
subconjunto finito da população e que sua análise nos permite aferir sobre a totalidade, desde
que a amostra represente significativamente a população.
Por exemplo, se uma pesquisa deseja avaliar o desempenho acadêmico dos alunos de
determinado curso de uma universidade, o conjunto de todos os alunos matriculados no curso
constitui a população; todavia é muito mais prático (e menos propenso a erros de cálculos) que
seja feita uma amostragem dessa população, selecionando, a partir de algum critério específico,
certo conjunto menor de alunos.

1
1.4. Frequência Absoluta e Frequência Relativa
O número total de vezes em que ocorre certo resultado para determinada variável é
chamado de frequência absoluta que indicaremos por , o índice atribui-se ao fato de que cada
resultado aparece determinado número de vezes.
No entanto, podemos atribuir um valor comparativo a certo resultado de uma variável ao
considerarmos a razão entre sua frequência absoluta pelo número total “ ” de valores ocorridos
ao considerar todas as variáveis. Esse valor comparativo é chamado de frequência relativa ( ):

Por exemplo, uma pesquisa está avaliando a faixa etária dos habitantes de um certo
bairro caracterizando-os em criança/recém-nascido, adolescente, adulto ou idoso. Com o
levantamento obtido, pôde-se construir a seguinte tabela de frequências:
Faixa etária Frequência absoluta Frequência relativa Porcentagem

criança/recém-nascido

adolescente

adulto

idoso

Total

1.5. Representações Gráficas


As representações gráficas constituem uma importante ferramenta para descrição e
apresentação de dados coletados, facilitando na interpretação dos mesmos. Essa importância
atribuída aos gráficos se dá, principalmente, pelo apelo visual dos mesmos que facilita na absorção
e interpretação das informações.
Há uma gama bem diversificada de tipos de gráficos, a seguir discutiremos brevemente os
tipos mais utilizados. Não será dada ênfase em como construir tais gráficos, pois atualmente o que
se usa são softwares com assistentes gráficos.

1.5.1. Gráficos de Barras e de Colunas


Esses gráficos são representados por retângulos organizados na horizontal (barras) ou na
vertical (colunas), cujo tamanho dos retângulos são proporcionais aos respectivos dados. São
usados principalmente para expressar séries de dados estatísticos em função do tempo, local,
espécie, etc.
Por exemplo, a seguir temos o gráfico1 (de colunas) que associa número de inscritos no
Exame Nacional do Ensino Médio (ENEM) de distribuídos por região em (escala de milhões):

1
Dados disponíveis em <<http://portal.inep.gov.br/enem>> acesso em 02.nov.2014.
2
Número de inscritos por região no ENEM - 2014 (milhões)
3,5

3
3,08
2,88
2,5

1,5

1
0,95 1,04
0,5 0,77

0
Centro-Oeste Nordeste Norte Sudeste Sul

Fonte: Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP)

Outro exemplo é o gráfico2 (de barras) abaixo que expressa a relação entre o eleitorado por
categoria de voto e as abstenções referentes ao segundo turno da eleição presidencial de :

Eleitorado por categoria de voto - 2º turno eleição presidencial 2014


(milhões)

Votos válidos 105,54

Votos em branco 1,92

Votos nulos 5,22

Abstenções 30,14

0 20 40 60 80 100 120

Fonte: Tribunal Superior Eleitoral (TSE)

1.5.2. Gráficos de Setores e Gráficos de Rosca


Os gráficos de setores (conhecidos também como gráficos de pizza) são gráficos na forma de
um disco dividido em setores (fatias). Cada setor representa certa parte de um todo e, o tamanho
dessa fatia é proporcional a frequência de cada categoria. Já os gráficos de rosca são análogos aos
de setores, porém o aspecto se aproxima de um anel.

2
Dados disponíveis em <<http://divulga.tse.jus.br/oficial/index.html>> acesso em 03.nov.2014.
3
Esses gráficos são utilizados para expressar a relação entre as partes de um todo e,
geralmente indicam na forma de porcentagem. Por exemplo, o gráfico3 (de setores) abaixo nos
mostra a distribuição da população brasileira entre os setores urbanos e rurais:

Distribuição da população brasileira por zonas - 2014

14,57%
Residentes em área urbana

Residentes em área rural


85,43%

Fonte: Instituto Brasileiro de Geografia e Estatística (IBGE)

O índice de Desenvolvimento da Educação Básica (IDEB) é um indicador da qualidade da


educação básica criado pelo Inep, e que atribui uma nota de a . Abaixo temos o gráfico4 de
rosca que indica distribuição dos escores do IDEB nos anos iniciais do ensino fundamental
municipal e estadual avaliado em mais de mil municípios por todo o Brasil.

Distribuição dos resultados do IDEB nos anos iniciais do ensino


fundamental, desagregados segundo intervalos de escores - 2010

13,60%
23,40%
Baixo (< 4,0)
Médio-Inferior (≥ 4,0 < 5,0)
Médio-Superior (≥ 5,0 < 6,0)
33,90% Alto (≥ 6,0)
29,10%

Fonte: Instituto de Pesquisa Econômica Aplicada (IPEA)

1.5.3. Gráficos de Linhas


Os gráficos de linhas são traçados usando o sistema de coordenadas cartesianas, em que os
pontos que representam a evolução das frequências dos valores de uma variável são ligados por
segmentos. São utilizados para indicar a tendência de aumento ou diminuição dos valores de uma
dada informação ao longo do tempo.

3
Dados disponíveis em <<http://www.ibge.gov.br/paisesat/main_frameset.php>> acesso em 04.nov.2014.
4
Dados disponíveis em <<http://www.ipea.gov.br/portal/index.php?option=com_content&view=article&id=20731>>
acesso em 05.nov.2014
4
Por exemplo, o gráfico5 de linhas abaixo representa a evolução da taxa de desmatamento
florestal da Amazônia Legal entre os anos de e :

Taxa de desmatamento anual da Amazônia Legal (km2)


30000
27772
25000

20000
19014
km2/por ano

15000
14286
12911
11651
10000
7000
6418
7464
5000
4571
0
2004 2005 2006 2007 2008 2009 2010 2011 2012
Ano

Fonte: Instituto Nacional de Pesquisas Espaciais

1.6. Distribuição de Frequências


Imaginemos uma empresa fictícia que tenha uma distribuição salarial que pode ser separada
em intervalos de classes como mostra a seguinte tabela:
Distribuição salarial da empresa X
Salários (reais) Frequência

Total

O número de valores da variável pertencentes a uma classe é a frequência absoluta ( ) da


mesma e uma tabela como a indicada acima é denominada distribuição de frequência com
intervalos de classe.
Os histogramas são gráficos semelhantes aos de barras/colunas, mas que são usados para
representar dados agrupados em intervalos de classe, onde a base dos retângulos possui largura
proporcional ao tamanho do intervalo e a altura corresponde a frequência da classe.

5
Dados disponíveis em <<http://www.inpe.br/noticias/noticia.php?Cod_Noticia=3301>> acesso em 04.nov.2014.
5
Abaixo temos o histograma construído usando dados da tabela anterior:

Distribuição salarial da empresa X


160
150

140

114
120
Número de funcionários

97
100
88
79
80
66
60

40

20

0
800 ˫ 1000 1000 ˫ 1200 1200 ˫ 1400 1400 ˫ 1600 1600 ˫ 1800 1800 ˫ 2000
Faixa salarial

O gráfico de linhas que se obtém ligando os pontos médios das bases superiores de um
histograma é chamado de polígono de frequências, desse último exemplo, temos:

Distribuição salarial da empresa X

160

140

120
Número de funcionários

100

80

60

40

20

0
800 ˫ 1000 1000 ˫ 1200 1200 ˫ 1400 1400 ˫ 1600 1600 ˫ 1800 1800 ˫ 2000
Faixa salarial

6
Observe agora a seguinte distribuição de frequências de alunos de uma sala de aula,
segundo a nota obtida em uma avaliação de matemática de valor pontos:
Nota Nº de alunos ( )

Chamamos de frequência acumulada ( ) de uma dada classe a soma de todas as


frequências inferiores ao limite superior do intervalo da classe em questão. Do exemplo acima, a
frequência acumulada da terceira classe é

esse resultado significa que existem alunos com nota inferior a pontos.
Podemos representar graficamente a frequência acumulada de cada classe inserindo no
histograma segmentos verticais como segue:
30
29
28
27
26
25
24
23
22
21
20
19
18
Número de alunos

17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
0 ˫ 20 20 ˫ 40 40 ˫ 60 60 ˫ 80 80 ˫ 100
Notas

7
 Exercícios resolvidos
1. (EPCAr-MG) O gráfico, a seguir, representa o resultado de uma pesquisa sobre a preferência
por conteúdo, na área de Matemática, dos alunos do curso preparatório de cadetes do ar.
Progressões; 6%

Matriz; 14%

Geometria espacial; Combinatória; 47%


22%

Função; 11%

Sabendo-se que no gráfico o resultado por conteúdo é proporcional à área do setor que a
representa, pode-se afirmar que o ângulo central do setor do conteúdo MATRIZ é de
a) b) c) d)

Solução:
Observe que o círculo completo representa o que corresponde a . Assim, basta que
apliquemos uma regra de três simples diretamente proporcional:
Ângulo Porcentagem

Para transformar a fração de grau em minutos, basta multiplicá-lo por , pois , logo:

Resposta: alternativa c.

2. (ENEM-2005) Um estudo caracterizou ambientes aquáticos, nomeados de a , em uma


região, medindo parâmetros físico-químicos de cada um deles, incluindo o nos ambientes. O
Gráfico I representa os valores de dos ambientes. Utilizando o gráfico II, que representa a
distribuição estatística de espécies em diferentes faixas de , pode-se esperar um maior
número de espécies no ambiente:

a) b) c) d) e)

8
Solução:
Este é um típico problema de análise gráfica. Ora, basta que observemos no gráfico II, em qual intervalo
de ph ocorre a maior frequência no número de espécies e, comparar no gráfico I qual dos cinco
ambientes apresenta tal ph.
Analisando o gráfico II, observamos que a classe de ph que contém o maior número de espécies é o
intervalo de [ ] e, pelo gráfico I, percebe-se facilmente que o ambiente D é o único que possui ph em
tal intervalo.
Resposta: alternativa d.

3. (ENEM-2002) No gráfico estão representados os gols marcados e os gols sofridos por uma
equipe de futebol nas dez primeiras partidas de um determinado campeonato.
Gols sofridos Gols marcados

6
5
Número de gols

4
3
2
1
0
28/1 4/2 11/2 18/2 25/2 4/3 11/3 18/3 25/3 1/4
Data da partida

Considerando que, neste campeonato, as equipes ganham pontos para cada vitória, ponto
por empate e ponto em caso de derrota, a equipe em questão, ao final da décima partida,
terá acumulado um número de pontos igual a
a) b) c) d) e)
Solução:
É fácil perceber que o time obtém uma vitória se a diferença entre gols marcados e gols sofridos for
positiva, um empate se a diferença for nula e, uma derrota se a diferença for negativa.
Assim, por exemplo, no dia temos: , portanto representa uma vitória e
consequentemente o ganho de três pontos.
Calculando-se essa mesma diferença para os demais dias, contabilizam-se vitórias, empates e
derrotas. Logo ao final da décima partida temos um total de pontos igual a:

Resposta: alternativa c.

4. Uma pesquisa com 175 alunos de uma escola sobre qual era seu animal de estimação de
preferência resultou a seguinte tabela:
Animal Frequência Absoluta Frequência Relativa Porcentagem
Cachorro
Gato
Outros
Total

Sendo assim, determine os valores de , e .


9
Solução:
 Podemos determinar observando que o mesmo adicionado a ea deve resultar , logo:

 Já , pela definição de frequência relativa, pode ser dado pela razão entre e :

 E por fim, temos (já que é a porcentagem que falta para inteirar )

 Exercícios propostos
1. (UFLA-MG) Uma prefeitura fez uma pesquisa na comunidade sobre qual deveria ser a ordem de
prioridade do governo com relação a educação, saúde e segurança. As opções, para a ordem de
prioridades, eram:
a Educação – Saúde – Segurança d Educação – Segurança – Saúde
b Segurança – Saúde – Educação e Saúde – Educação - Segurança
c Saúde – Segurança – Educação f Segurança – Educação - Saúde
O resultado da pesquisa foi descrito pelo gráfico, em que, para cada opção, uma barra indica a
porcentagem de pessoas que optaram por ela.

25
22
20
20 18
17
Frequência (%)

15
15
8
10

0
a b c d e f

Determine a alternativa incorreta.


a) A maioria das pessoas entrevistadas priorizou Educação em detrimento da Segurança.
b) A maioria das pessoas entrevistadas priorizou Educação e Segurança em detrimento da Saúde.
c) das pessoas entrevistadas priorizaram Educação e Saúde em detrimento da Segurança.
d) das pessoas entrevistadas consideraram que a Segurança deveria ser a maior prioridade
do governo municipal.

2. Uma pesquisa com todos os funcionários de uma empresa sobre o meio de transporte que as
mesmas usam para ir ao trabalho resultou a seguinte tabela:
Transporte Frequência Absoluta Frequência Relativa Porcentagem
Carro
Motocicleta
Coletivo
Total

Dessa forma, complete a tabela com os valores que faltam.

10
3. (ENEM-2012) A figura a seguir apresenta dois gráficos com informações sobre as reclamações
diárias recebidas e resolvidas pelo Setor de Atendimento ao Cliente (SAC) de uma empresa, em
uma dada semana. O gráfico de linha tracejada informa o número de reclamações recebidas no
dia, o de linha contínua é o número de reclamações resolvidas no dia. As reclamações podem
ser resolvidas no mesmo dia ou demorarem mais de um dia para serem resolvidas.

30

20

10

0
Qui Sex Sáb Dom Seg Ter Qua

O gerente de atendimento deseja identificar os dias da semana em que o nível de eficiência


pode ser considerado muito bom, ou seja, os dias em que o número de reclamações resolvidas
excede o número de reclamações recebidas.
O gerente de atendimento pôde concluir, baseado no conceito de eficiência utilizado na
empresa e nas informações do gráfico, que o nível de eficiência foi muito bom na
a) segunda e na terça-feira. b) terça e na quarta-feira. c) terça e na quinta-feira.
d) quinta-feira, no sábado e no domingo. e) segunda, na quinta e na sexta-feira.

4. (UFPE-PE) Os gráficos a seguir ilustram a distribuição percentual do consumo de energia


elétrica no Brasil dos diversos setores e do setor industrial.

Assinale a alternativa incorreta sobre o consumo de energia elétrica no Brasil:


a) O setor de metais consome mais que o comercial.
b) O setor público consome mais que o de alimentos.
c) O setor residencial consome mais que, juntos, o químico e o de metais.
d) O setor de papel consome do total de energia.
e) O setor químico e o de alimentos consomem juntos menos que o residencial.
11
5. (ENEM-2014) Uma empresa de alimentos oferece três valores diferentes de remuneração a
seus funcionários, de acordo com o grau de instrução necessário para cada cargo. No ano de
, a empresa teve uma receita de milhões de reais por mês e um gasto mensal com a
folha de salarial de , distribuídos de acordo com o Gráfico . No ano seguinte, a
empresa ampliará o número de funcionários, mantendo o mesmo valor salarial para cada
categoria. Os demais custos da empresa permanecerão constantes de para . O
número de funcionários em e , por grau de instrução, está no Gráfico .

Número de funcionários por grau de instrução


190
180
170
160
150
140
130
120
110
100
2013
90
2014
80
70
60
50
40
30
20
10
0
Ensino fundamental Ensino médio Ensino superior

Gráfico II

Qual deve ser o aumento na receita da empresa para que o lucro mensal em seja o
mesmo de ?
a) b) c) d) e)

12
02 Medidas de Posição
 Introdução
Os dados observados em uma população tendem, em geral, a se agruparem entorno de
valores centrais e quantificamos este fenômeno a partir das chamadas medidas de posição. As
medidas de posição mais usuais são as medidas de tendência central que serão apresentadas no
decorrer deste capítulo.

2.1. Média Aritmética


A média aritmética para dados brutos (não agrupados) de uma amostra é dada pela razão
entre a soma dos valores assumidos pela variável pelo número de valores. Indicamos a média
aritmética por ̅ :

̅

 Exercícios resolvidos
1. (ENEM-2013) As notas de um professor que participou de um processo seletivo, em que a
banca avaliadora era composta por cinco membros, são apresentadas no gráfico. Sabe-se que
cada membro da banca atribuiu duas notas ao professor, uma relativa aos conhecimentos
específicos da área de atuação e outra, aos conhecimentos pedagógicos, e que a média final do
professor foi dada pela média aritmética de todas as notas atribuídas pela banca avaliadora.

Notas (em pontos)


20 19
18
18 17
16 16
16 14 14
14 13
12
12
10
8
6
4
2 1
0
Avaliador A Avaliador B Avaliador C Avaliador D Availador E

Conhecimentos específicos Conhecimentos pedagógicos

Utilizando um novo critério, essa banca avaliadora resolveu descartar a maior e a menor nota
atribuída ao professor. A nova média, em relação à média anterior, é
a) ponto maior b) ponto maior c) ponto menor
d) ponto maior e) pontos menor

13
Solução:
A média de todas as notas atribuídas pela banca é dada por:

E se descartarmos a maior e a menor nota, respectivamente e , temos:

Assim, a diferença entre nova média e a média anterior é .


Resposta: alternativa b.

2. (UFMG-MG) Define-se a média aritmética de números dados como o resultado da divisão


por da soma dos números dados. Sabe-se que é a média aritmética de ; ; e .
O número é igual a:
a) b) c) d)

Solução:
Basta determinarmos o valor de para que a equação abaixo seja verdadeira:

Resposta: alternativa d.

3. (UFAL-AL) Considere números cuja média aritmética é . Retirando-se um desses números,


a média aritmética dos restantes é . O número retirado é:
a) b) c) d) e)

Solução:
Chamando de a soma resultante dos números iniciais, temos que:

Assim, se é o número retirado, temos que:

Substituindo em , vem:

Resposta: alternativa d.

Observação: Pode-se provar que a média aritmética obedece às seguintes propriedades:


 Se a cada valor de uma variável for adicionada uma constante , a média aritmética ficará
adicionada de unidades.
̅

 Se cada valor de uma variável for multiplicado uma constante , a média aritmética ficará
multiplicada por .
̅

14
2.1.1. Média Aritmética para Dados Agrupados - sem intervalo de classe
Nesse caso tem-se a ocorrência de certa frequência absoluta para os valores de uma
variável quantitativa e, a média aritmética é dada pela razão entre a soma dos valores
multiplicados por sua frequência pela soma das frequências.


̅

Por exemplo, a tabela abaixo nos mostra a distribuição de alunos de uma turma de
administração de empresas, tomando como variável o número de disciplinas que os mesmos
pretendem cursar no próximo semestre (será mais prático abrirmos uma coluna para ):
Número de disciplinas ( ) Número de alunos ( )
14

Assim, o número médio de disciplinas a serem cursadas por aluno é dado por:

̅ ̅ ̅

É claro que o número de disciplinas que um aluno cursa deve ser inteiro, então o número
sugere que a maior parte da amostra pretende cursar disciplinas, porém com uma
tendência a optarem por disciplinas.

Observação:
Se numa amostra possui dados que devem ter maior efeito sobre a média, ou seja,
resultados que possuem pesos, então podemos calcular a média aritmética ponderada ao
considerar os pesos como a frequência absoluta de cada valor da variável, pois a frequência é um
modo de quantificar a intensidade de cada um desses valores.
Exemplo:
Em certa universidade, a nota de classificação para ingresso nos cursos é dada pela média
aritmética ponderada das notas obtidas no ENEM para cada candidato. O curso que André
pretende ingressar adota os seguintes pesos:
Linguagens Ciências humanas Ciências da natureza Matemática Redação
Peso
André obteve em linguagens, em ciências humanas, em ciências da natureza,
em matemática e na redação. Sendo assim, a nota final de André é dada pela por:

̅ ̅

15
2.1.2. Média Aritmética para Dados Agrupados - com intervalos de classe
Nesse caso, consideramos que todos os valores contidos em um determinado intervalo de
classe coincidem com o ponto médio da classe e calculamos:


̅

Considere, por exemplo, a seguinte distribuição de frequências que expressa os valores de


motocicletas disponíveis à venda em uma determinada concessionária:
Valor ( ) Frequência ( ) Ponto médio da classe ( )

Logo, a média de preço das motocicletas dessa concessionária é dada por:



̅ ̅ ̅

Ressaltando que o ponto médio de uma classe é dado pela metade soma dos valores que
limitam a mesma.

 Exercícios resolvidos
1. (UFF-RJ) Cada um dos alunos da turma obteve, na avaliação de um trabalho, nota ou
nota . A média aritmética dessas notas foi . Determine quantos alunos obtiveram nota e
quantos obtiveram nota .

Solução:
O problema solicita os valores das frequências absolutas do número de alunos segundo sua nota. Vamos
chamar de e o número de alunos que obtiveram, respectivamente, nota e , perceba que:

Usando a fórmula da média para dados agrupados, temos:



̅

Assim, temos o seguinte sistema:

{
cuja solução é e .
Resposta: alunos obtiveram a nota e alunos a nota .

2. (PUC-RJ) Um aluno fez provas com pesos , e . Se ele tirou e mas duas primeiras,
quanto precisa tirar na terceira prova para ficar com média maior ou igual a ?
a) Pelo menos b) Pelo menos c) Pelo menos d) Pelo menos e) Pelo menos
16
Solução:
Chamando de a nota da terceira prova, temos

̅ ̅

Impondo a condição ̅ , vem:

Resposta: alternativa e.

3. (FGV-SP) A tabela a seguir representa a distribuição de frequências dos salários de um grupo de


empregados de uma empresa, num certo mês.
Número de classe Salário do mês em reais Número de empregados

O salário médio desses empregados, nesse mês, foi de:


a) b) c) d) e)

Solução:
Como vimos em exemplo anterior, torna-se mais prático os cálculos se expandirmos a tabela abrindo
uma coluna para o ponto médio da classe e uma coluna para o produto , acompanhe:

Número de Salário do mês em Número de Ponto médio da


classe reais empregados ( ) classe ( )

Desse modo, o salário médio dos empregados é dado por:



̅ ̅ ̅

Resposta: alternativa e.

 Exercícios propostos
1. (UFMG-MG) No início de uma partida de futebol, a altura média dos jogadores de um dos
times era . Ainda no primeiro tempo, um desses jogadores, com de altura, foi
substituído. Em seu lugar, entrou outro que media de altura.
No segundo tempo, outro jogador do mesmo time, com de altura, foi expulso.
Ao terminar a partida, a altura média dos jogadores desse time era:
a) b) c) d)

17
2. (UERJ-RJ) Observe um demonstrativo do consumo de energia elétrica durante alguns meses:
270
268
240 257
248
210 235
215
180
182
150
kWh 150 158
120

90

60

30

0
ago.2011 set.2011 out.2011 nov.2011 dez.2011 jan.2012 fev.2012 mar.2012

Considere que o consumo médio, de agosto/ a dezembro/ , foi igual ao que ocorreu de
janeiro/2012 a abril/2012. Assim, o consumo no mês de abril de , em , foi igual a:
a) b) c) d) e)

3. (UERJ-RJ) Seis caixas-d’água cilíndricas iguais estão assentadas no mesmo piso plano e ligadas
por registros ( ) situados nas suas bases, como sugere a figura a segui:

Após a abertura de todos os registros, as caixas ficaram com os níveis de água no mesmo plano.
A altura desses níveis, em , equivale a:
a) b) c) d)

4. (ENEM-2014) Ao final de uma competição de ciências em uma escola, restaram apenas três
candidatos. De acordo com as regras, o vencedor será o candidato que obtiver a maior média
ponderada entre as notas das provas finais nas disciplinas química e física, considerando,
respectivamente, os pesos e para elas. As notas são sempre números inteiros. Por questões
médicas, o candidato II ainda não fez a prova final de química. No dia em que sua avaliação for
aplicada, as notas dos outros dois candidatos, em ambas as disciplinas, já terão sido divulgadas.
O quadro apresenta as notas obtidas pelos finalistas nas provas finais.
Candidato Química Física
I
II
III

A menor nota que o candidato II deverá obter na prova final de química para vencer a
competição é:
a) b) c) d) e)

18
5. (Fuvest-SP) A distribuição das idades dos alunos de uma classe é dada pelo gráfico seguinte:

Qual das alternativas representa melhor a média de idade dos alunos?


a) anos e meses. c) anos e meses. e) anos e meses.
b) anos e mês. d) anos e meses.

6. (FGV-SP) O gráfico de barras indica como informação principal o número de pessoas atendidas
em um pronto-socorro, por faixa etária, em um determinado dia. Outra informação
apresentada no gráfico, por meio das linhas verticais, é a frequência acumulada. Em virtude de
um rasgo na folha em que o gráfico estava desenhado, as informações referentes à última
barra, e apenas elas, foram perdidas, como se vê na figura.

A média de idade do total de pessoas de a anos que frequentou o pronto-socorro nesse


dia foi anos. Nessas condições, na folha intacta do gráfico original, o comprimento da linha
vertical posicionada na última barra, que indica a frequência acumulada até anos de idade,
em centímetros, era igual a
a) b) c) d) e)

19
2.2. Mediana
A mediana ( ) é outra medida de tendência central e é definida como o valor que divide
uma série de valores quantitativos em duas partes, de modo que a mediana se encontra no centro
da série, estando essa série disposta segundo uma ordem.
Considerando uma série de dados brutos de uma variável quantitativa e, estando ela
ordenada (em crescente ou decrescente), a mediana é o valor central da série se a mesma
contiver um número ímpar de elementos e, será a média dos dois valores centrais caso contenha
um número par de elementos.
Considere, por exemplo, a seguinte série de valores:
, , , , , , ,
pela definição de mediana, devemos primeiramente ordenar os valores dados:
, , , , , ,
Agora devemos observar o valor que se encontra ao centro da série, ou seja, aquele em que
há o mesmo número de elementos a sua direita e a sua esquerda, logo:

Porém, se acrescentarmos o número a essa série, ela terá um número par de elementos:
, , , , , , ,
Pela definição, a mediana será dada por:

2.3. Moda
A moda ( ) também é outra medida de tendência central e é definida como o valor que
possui maior frequência numa série de dados, ou seja, é o valor que mais se repete.
Assim, por exemplo, idade modal entre pessoas de um mesmo grupo é a idade possuída pelo
maior número de indivíduos desse grupo.

 Exercícios resolvidos
1. (ENEM-2013) Foi realizado um levantamento nos hotéis de uma cidade, no qual foram
anotados os valores, em reais, das diárias para um quarto padrão de casal e a quantidade de
hotéis para cada valor da diária. Os valores das diárias foram: ; ;
e . No gráfico, as áreas representam as quantidades de hotéis
pesquisados, em porcentagem, para cada valor da diária.

O valor mediano da diária, em reais, para o quarto padrão de casal nessa cidade, é
a) b) c) d) e)
20
Solução:
Primeiramente vamos determinar qual a frequência absoluta de cada valor da variável diária:

Assim, se dispormos ordenadamente os valores das diárias, temos:


⏟ ⏟ ⏟ ⏟
, , ,

Note que os dois grupos de valores, da esquerda e da direita, possuem elementos cada e, como
temos um número par de termos, a mediana será dada pela média dos dois valores centrais:

Resposta: alternativa c.

2. (UFU-MG) As medidas colhidas por um cientista num determinado experimento, todas na


mesma unidade, foram as seguintes:
, , , , , , , , , .
Ao trabalhar na análise estatística dos dados, o cientista esqueceu-se, por descuido, de
considerar uma dessas medidas. Dessa forma, comparando os resultados obtidos pelo cientista
em sua análise estatística com os resultados corretos para esta amostra, podemos afirmar que:
a) a moda e a média foram afetadas.
b) a moda não foi afetada, mas a média foi.
c) a moda foi afetada, mas a média não foi.
d) a moda e a média não foram afetadas.

Solução:
Se a média aritmética leva em conta todos os dados da amostra, então ao omitir algum dado, a média é
sempre afetada.
A moda desta amostra é o valor “ ”, pois esse possui maior frequência e, note que ao omitir qualquer
outro dado, a moda não é afetada, já que seria mantida a superioridade de “ ”. E mesmo que se omita
um desses “ ” , tal dado ainda aparecerá com maior frequência (neste caso específico).
Resposta: alternativa b.

3. Em um conjunto de observações numéricas, podemos afirmar que:


a) a média aritmética é maior que a mediana.
b) a mediana é maior que a moda.
c) dos valores estão acima da média aritmética.
d) dos valores estão abaixo da mediana.
e) dos valores estão entre a moda e a mediana.

Solução:
Ao ordenar esses números, a mediana será dada pela média entre o eo termo, assim
desses valores ficam abaixo da mediana (considerando que os dados numéricos sejam distintos).
Resposta: alternativa d.
21
 Exercícios propostos
7. (ENEM-2014) Os candidatos , , , e estão disputando uma única vaga de emprego em
uma empresa e fizeram provas de português, matemática, direito e informática. A tabela
apresenta as notas obtidas pelos cinco candidatos.
Candidatos Português Matemática Direito Informática

Segundo o edital de seleção, o candidato aprovado será aquele para o qual a mediana das
notas obtidas por ele nas quatro disciplinas for a maior. O candidato aprovado será:
a) b) c) d) e)

8. (UFU-MG) O Departamento de Comércio Exterior do


Nº de funcionários Salário (em R$)
Banco Central possui funcionários com a
distribuição salarial em reais mostrada na tabela ao
lado.
Quantos funcionários que recebem devem
ser demitidos para que a mediana desta distribuição
de salários seja de ?
a) b) c) d) e)

9. (FGV-SP) Quatro amigos calcularam a média e a mediana de suas alturas, tendo encontrado
como resultado e , respectivamente. A média entre as alturas do mais alto e do
mais baixo, em metros, é igual a:
a) b) c) d) e)

10. (ENEM-2012) O gráfico apresenta o comportamento de emprego formal surgido, segundo o


CAGED, no período de janeiro de a outubro de .

Com base no gráfico, o valor da parte inteira da mediana dos empregos formais surgidos no
período é:
a) b) c) d) e)
22
11. (UFPel-RS) Na busca de solução para o problema da gravidez na adolescência, uma equipe de
orientadores educacionais de uma instituição de ensino pesquisou um grupo de adolescentes
de uma comunidade próxima a essa escola e obteve os seguintes dados
Frequência absoluta de
Idade (em anos)
adolescentes grávidas

Com base nos textos e em seus conhecimentos, é correto afirmar, em relação às idades das
adolescentes grávidas, que:
a) a média é de anos. d) a moda é de anos.
b) a mediana é de anos. e) a média é de anos.
c) a mediana é de anos.

12. (ENEM-2011) Uma equipe de especialistas do centro meteorológico de uma cidade mediu a
temperatura do ambiente, durante dias intercalados, a partir do primeiro dia de um mês.
Esse tipo de procedimento é frequente, uma vez que os dados coletados servem de referência
para estudos e verificação de tendências climáticas ao longo dos meses e anos.
As medições ocorridas nesse período estão indicadas no quadro:
Dia do mês Temperatura (em °C)

Em relação à temperatura, os valores da média, mediana e moda são, respectivamente, iguais a


a) , e . d) , e .
b) , e . e) , e .
c) , e .

23
2.4. Comparando a Média, a Mediana e a Moda
A média é sem dúvida a medida de tendência central mais utilizada, todavia, considere a
seguinte série de valores que representa as idades de indivíduos de um grupo:
, , , , , , , , , , , , , , , , ,
a média dessas idades é de aproximadamente anos e de modo geral esse não é um valor que
representa satisfatoriamente a série se comparado a mediana ou aos valores de maior
frequência, e (bimodal).
Nesse exemplo, a média foi influenciada pela presença dos valores discrepantes e
que são entradas que estão muito afastadas das demais e, em casos como esse, podemos usar a
mediana ou moda, conforme a conveniência.
Podemos visualizar graficamente a relação entre a média, a mediana e a moda. Considere as
seguintes distribuições de frequências genéricas:
Distribuição simétrica Distribuição assimétrica negativa

Distribuição assimétrica positiva Distribuição uniforme

24
03 Medidas de Dispersão
 Introdução
Dizemos que uma série de valores quantitativos é homogênea se seus elementos são
números com pouca dispersão em relação a sua média, ou seja, são todos relativamente próximos
entre si. E dizemos que a série é heterogênea se a mesma for constituída de valores com certa
variabilidade entre si e que tendem a se afastarem da média. As medidas de dispersão ou
variabilidade são indicadores que quantificam grau de variabilidade em relação à média.
Por exemplo, observe os seguintes conjuntos de dados:
conjunto : , , , ,
conjunto : , , , ,
conjunto : , , , ,
conjunto : , , , ,
A média aritmética de todos eles é ̅ , mas perceba que o conjunto é uma série
uniforme - predominantemente homogênea - e, por outro lado, o conjunto apresenta-se
bastante disperso em relação à média.

3.1. Amplitude Total


Define-se amplitude total ( ) a medida de dispersão dada pela diferença entre o maior e o
menor valor observado.

Assim, por exemplo, a amplitude total para os valores do conjunto e do conjunto


ilustrados acima são, respectivamente:
e

OBS.: Se os dados forem agrupados com determinada frequência, sem intervalos de classe, a
amplitude é calculada da mesma forma que para dados brutos. E se houver intervalos de classe, a
amplitude total é dada pela diferença entre o limite superior da classe mais alta e o limite inferior
da classe mais baixa.

3.2. Desvio Médio


Denomina-se desvio ( ) de uma entrada de um conjunto de valores a diferença entre
essa entrada e a média aritmética desses valores:
̅

Parece razoável tentar medir a variabilidade de uma amostra a partir da média dos desvios,
todavia uma propriedade relevante do desvio é que a soma algébrica de todos os desvios de uma
amostra é sempre igual a zero e, portanto sua média também é nula.
25
No entanto, podemos considerar a média aritmética dos valores absolutos de cada desvio e
assim define-se a medida de dispersão chamada de desvio médio ( ):

∑| ̅| | ̅| | ̅| | ̅|

3.3. Variância
A variância ( ) é a medida de dispersão dada pela média aritmética dos quadrados dos
desvios:
∑ ̅ ̅ ̅ ̅

Se os dados observados forem, por exemplo, medidas do comprimento de avenidas de uma


cidade, a média será dada em metros, porém a variância será expressa em metros quadrados, o
que ocasiona uma incompatibilidade de unidades. Para unificá-las, definiremos o desvio padrão.

3.4. Desvio Padrão


O desvio padrão ( ) é a medida de dispersão definida como a raiz quadrada da variância:

∑ ̅

Observe que ao tomar os quadrados dos desvios, o desvio padrão apresenta uma espécie de
média ponderara desses desvios, pois os dados mais dispersos entram com peso maior do que os
menos dispersos.
O símbolo “ ” usado para indicar o desvio padrão é a letra grega minúscula chamada sigma.

Observação:
A variância e o desvio padrão apresentados acima se referem a medidas de dispersão
populacionais e quando se trata de dados amostrais, normalmente usamos como divisor “ ”
ao invés de “ ” e, trocamos o símbolo “ ” por “ ”:
 Variância amostral
∑ ̅

 Desvio padrão amostral

∑ ̅

26
 Exercícios resolvidos
1. (ENEM-2010) Em uma corrida de regularidade, a equipe campeã é aquela em que o tempo dos
participantes mais se aproxima do tempo fornecido pelos organizadores em cada etapa. Um
campeonato foi organizado em etapas, e o tempo médio de prova indicado pelos
organizadores foi de minutos por prova. No quadro, estão representados os dados
estatísticos das cinco equipes mais bem classificadas.
Dados estatísticos das equipes mais bem classificadas (em minutos)
Equipes Média Moda Desvio padrão
Equipe I
Equipe II
Equipe III
Equipe IV
Equipe V

Utilizando os dados estatísticos do quadro, a campeã foi a equipe:


a) I b) II c) III d) IV e) V

Solução:
O enunciado diz que a equipe campeã é aquela em que o tempo dos participantes mais se aproxima de
minutos. Bem, se olharmos pela média apenas, nada podemos concluir, pois a média de ambas as
equipes é de . A moda, por sua vez, seria determinante caso houvesse uma única equipe de moda
igual a , no entanto há duas equipes com moda . Ora, dessas equipes de moda será a campeã
aquela que apresentar menor desvio, ou seja, aquela em que os valores menos se afastam da média.
Resposta: alternativa c.

2. (FGV-SP) Um conjunto de dados tem variância igual a zero. Podemos concluir que:
a) A média também vale zero.
b) A mediana também vale zero.
c) A moda também vale zero.
d) O desvio padrão também vale zero.
e) Todos os valores desse conjunto são iguais a zero.

Solução:
Ter a variância igual a zero significa que não há afastamento dos valores em relação à média e, como o
desvio padrão é igual a raiz quadrada da variância, logo o desvio padrão também é igual a zero.
Resposta: alternativa d.

3. Os valores a seguir representam respectivamente as despesas de uma empresa nos quatro


primeiros meses de :
, , e .
Determine a amplitude total, o desvio médio, a variância e o desvio padrão para essa série de
dados.

27
Solução:
Primeiro podemos calcular a amplitude total:

Em seguida, calculemos a média:

A tabela a seguir poderá nos auxiliar nos cálculos:


| ̅| ̅

Logo, temos:

Considerando o conjunto de dados como sendo populacional, vem:

e

 Exercícios propostos
1. (UFPR-PR) Considere as seguintes medidas descritivas das notas finais dos alunos de três
turmas:
Turma Número de alunos Média Desvio padrão

Com base nesses dados, considere as seguintes afirmativas:


I. Apesar de as médias serem iguais nas três turmas, as notas dos alunos da turma foram as
que se apresentaram mais heterogêneas.
II. As três turmas tiveram a mesma média, mas com variação diferente.
III. As notas da turma se apresentaram mais dispersas em torno da média.
a) Somente a afirmativa III é verdadeira.
b) Somente a afirmativa II é verdadeira.
c) Somente as afirmativas II e III são verdadeiras.
d) Somente as afirmativas I e II são verdadeiras.
e) Somente as afirmativas I e III são verdadeiras.

28
2. (PROFMAT) Numa empresa, os salários não são todos iguais e um novo funcionário foi
contratado com um salário igual à média dos salários pagos pela empresa antes de sua
contratação. Comparando a média dos salários e o desvio padrão calculados antes da
contratação do novo funcionário com a média dos salários e o desvio padrão calculados
levando em conta o novo funcionário, podemos afirmar que:
a) a nova média é menor que a antiga e o desvio padrão permanece igual.
b) a nova média e o novo desvio padrão são ambos iguais aos antigos.
c) a nova média e o novo desvio padrão são ambos maiores que os antigos.
d) a nova média é igual a antiga e o novo desvio padrão é menor que o antigo.
e) a nova média e o novo desvio padrão são ambos menores que os antigos.

3. (PROFMAT) Em uma turma de quatro alunos, o professor aplicou duas provas e , obtendo
as seguintes notas:
e
Analisando os resultados, é possível afirmar que:
a) e possuem a mesma média aritmética e o mesmo desvio padrão.
b) e possuem médias aritméticas diferentes e desvios padrões diferentes.
c) e possuem a mesma média aritmética e desvios padrões diferentes.
d) possui maior desvio padrão que .
e) possui maior média aritmética que .

4. (ENEM-2010) Marco e Paulo foram classificados em um concurso. Para a classificação no


concurso o candidato deveria obter média aritmética na pontuação igual ou superior a 14. Em
caso de empate na média, o desempate seria em favor da pontuação mais regular. No quadro a
seguir são apresentados os pontos obtidos nas provas de Matemática, Português e
Conhecimentos Gerais, a média, a mediana e o desvio padrão dos dois candidatos.
Dados dos candidatos no concurso
Conhecimentos Desvio
Matemática Português Média Mediana
Gerais Padrão
Marco
Paulo

O candidato com pontuação mais regular, portanto mais bem classificado no concurso, é
a) Marco, pois a média e a mediana são iguais.
b) Marco, pois obteve menor desvio padrão.
c) Paulo, pois obteve a maior pontuação da tabela, em Português.
d) Paulo, pois obteve maior mediana.
e) Paulo, pois obteve maior desvio padrão.

29
Respostas dos exercícios propostos
01 Conceitos Iniciais
1. b
2. Segue a tabela completa:
Transporte Frequência Absoluta Frequência Relativa Porcentagem
Carro
Moto
Coletivo
Total
3. b
4. d
5. b

02 Medidas de Posição
1. c
2. a
3. c
4. a
5. c
6. e
7. d
8. d
9. e
10. b
11. e
12. b

03 Medidas de Dispersão
1. d
2. d
3. c
4. b

30
Bibliografia
CRESPO, A. A. Estatística Fácil. 18 ed. São Paulo: Saraiva, 2002.

DORNELLES JR, L. A. Estatística I. 6 ed. Palhoça: Unisul Virtual, 2007.

FREUND, J. E. Estatística Aplicada: economia, administração e contabilidade. 11 ed. Trad.: Claus


Ivo Doering. Porto Alegre: Bookman, 2006.

LARSON, R. Estatitica Aplicada. 4 ed. Tra.: Luciene Ferreira Paulete Viana. São Paulo: Pearson
Prentice Hall, 2010.

MORETTIN, L. G. Estatística Básica: Probabilidade. 7 ed. vol. 1. São Paulo: Makron Books, 1999.

31

Você também pode gostar