Você está na página 1de 60

MATERIAL DIDÁTICO:

FUNDAMENTOS DE ESTATÍSTICA
Veremos, nesse material didático, os conhecimentos necessários para compreensão do que é estatística e onde
é aplicada. Abordaremos os conceitos fundamentais da estatística e aspectos sobre a coleta, análise e interpretação de
dados.

Sumário
1. Fundamentos de estatística ---------------------------------------------------------------------------------------------------- 01
1.1 O que é estatística? ------------------------------------------------------------------------------------------------------------- 01
1.2 Conceitos e o método estatístico---------------------------------------------------------------------------------------------- 11
2. Apresentação dos dados -------------------------------------------------------------------------------------------------------- 19
2.1 Tabelas e séries ----------------------------------------------------------------------------------------------------------------- 19
2.2 Apresentação de dados qualitativos----------------------------------------------------------------------------------------- 27
2.3 Apresentação de dados quantitativos--------------------------------------------------------------------------------------- 39
Referências--------------------------------------------------------------------------------------------------------------------------- 60

1. Fundamentos de estatística

1.1 O que é estatística?


A palavra estatística provém da expressão em latim “statisticum collegium”, que significa um Conselho de
Estado. Desde a antiguidade, os governos têm se interessado por informações sobre suas populações e riquezas, tendo
em vista, principalmente, as questões militares e tributárias. Assim, civilizações antigas faziam levantamentos sobre
suas populações através da coleta e da apresentação de dados quantitativos, que eram de interesse do estado.
No Antigo Egito, por exemplo, o faraó realizava uma excursão bienal em todo o reino para fazer a cobrança de
receitas fiscais dos seus súditos. Já na Grécia, foi instituído o tributo administrado pelo Estado de uma forma muito
semelhante da que conhecemos hoje. Com base nos impostos recolhidos e no trabalho escravo, os gregos se tornaram
uma das maiores civilizações do mundo.

Para refletir: Mas será que a coleta e apresentação de dados quantitativos citados é o que entendemos por Estatística
hoje?

Em meados do século XVlll, o alemão Gottfried Achenwall difundiu o termo Estatística como sendo a ciência
da constituição do Estado, ou seja, a ciência dos recenseamentos (levantamento de dados referentes ao conjunto de
pessoas) dos constituintes do Estado. Apesar de Achnwall ser o pai da palavra Estatística (Statistik -
Alemão), o que ele entendia como estatística difere do conceito atual, pois ele se preocupava com a
descrição das características sócio-político-econômicas dos diferentes estados.

1
Na atualidade, a Estatística é considerada
multidisciplinar uma vez que pode ser aplicada em praticamente
todas as áreas do conhecimento humano, como: Agricultura,
Farmácia, Educação, Economia e várias outras. Na verdade,
dificilmente encontraremos alguma área do conhecimento que
não conseguimos aplicar a Estatística.
Enfim, vamos saber o que é estatística:

Estatística: É um campo do estudo centrado na produção de metodologia para coleta, organização, descrição, análise
e interpretação de dados bem como na obtenção de conclusões válidas e na tomada de decisões razoáveis baseadas
em tais análises.

No Brasil, a Estatística tem sua história associada a história do Instituto Brasileiro de Geografia e Estatística
(IBGE), cujas raízes foram fincadas ainda durante o império.
Saiba mais sobre a história da Estatística no Brasil: http://estatisticaeetag.blogspot.com/
https://www.ibge.gov.br/

Para refletir: Mas qual é a utilidade da estatística para nós hoje?

Uma das utilidades é a apresentação de dados de uma pesquisa de forma sintetizada, através de tabelas e gráficos.
Além disso, é importante saber como interpretar os dados apresentados.
EXEMPLO 1 Em 2009 foi feita uma pesquisa pelo Comitê Gestor da Internet (CGI) sobre a velocidade de
conexão à internet utilizada em domicílios no Brasil. Veja os gráficos abaixo:

Uma vez que você saiba como interpretar cada gráfico, facilmente se conclui o resultado da pesquisa:

• 34% dos domicílios pesquisados têm velocidade da internet de até 256 Kbps.

2
• 20% dos domicílios pesquisados têm velocidade da internet entre 256 Kbps e 1 Mbps.
• 15% dos domicílios pesquisados têm velocidade da internet de 1 Mbps a 2 Mbps.
• 5% dos domicílios pesquisados têm velocidade da internet entre 2 Mbps a 4 Mbps.
• 1% dos domicílios pesquisados têm velocidade da internet de 4 Mbps a 8 Mbps.
• 1% dos domicílios pesquisados têm velocidade da internet acima de 8 Mbps.
• 24% dos domicílios não sabem a velocidade da internet (ou por, de fato, não saberem a velocidade ou
por não terem respondido a pesquisa).

Para refletir: No dia a dia, somos bombardeados por informações de revistas, jornais, rádios, entre outros. Mas
para que serve tanta informação se não sabemos como interpretá-la?

Acontece que grande parte dessas informações são coletadas através de pesquisas estatísticas, veja outros
exemplos abaixo:
EXEMPLO 2 O G1(Portal de notícias brasileiro mantido pelo grupo Globo) disponibilizou um gráfico, elaborado em
30/08/2016, apresentando uma pesquisa feita sobre a taxa de desemprego por país.

Fonte: Austin Rating


EXEMPLO 3 De acordo com IBGE, a evolução da população residente no Brasil é descrita segundo o seguinte gráfico:

Fonte: Censo 2010/IBGE.


Consegue perceber a utilidade e importância da estatística no seu dia a dia?
A todo momento, se você buscar se informar, você terá acesso a informações
estatísticas, e nesse curso buscaremos te preparar para receber e interpretar essas
informações. Mas antes, precisamos entender alguns fundamentos estatísticos que

3
estão por trás desses gráficos que utilizamos para descrever e apresentar os dados obtidos numa pesquisa.
Dividimos a Estatística em dois grupos: Descritiva e Indutiva. A nossa disciplina tem como objetivo estudar
aquilo que definimos como Estatística descritiva e Estatística indutiva. Entenderemos o significado de uma e outra e
aprenderemos como utilizá-las no dia a dia.
A DIVISÃO DA ESTATÍSTICA
Para entender como a Estatística descritiva se diferencia da Estatística indutiva, vamos a seguinte situação:
Pedro é um professor de matemática e leciona em três turmas de 3°ano do ensino
médio, turma A, turma B e turma C.
Durante a manhã, Pedro aplicou uma prova para as três turmas e tirou o resto da
tarde para corrigir as provas dos alunos da turma A. No fim da tarde, ele finalizou a
correção dessas provas e fez a média das notas dos alunos da turma.
A média da turma A é um exemplo de estatística descritiva e será utilizada para
resumir ou descrever o desempenho da turma A na prova aplicada. Mas para Pedro fazer
essa descrição da turma, ele antes coletou as notas dos
alunos, pensou em como organizar essas notas (tabela de notas), calculou a média
dos alunos e analisou o resultado obtido.
Isso permitirá ao professor Pedro, interpretar o desenvolvimento da turma
A com relação às provas anteriores, além de estudar o rendimento dessa turma
durante o ano letivo, pensar em outras maneiras de avaliações para seus alunos e,
até mesmo, pensar como serão suas futuras aulas, buscando uma melhora no
entendimento dos alunos.
Por meio dessa situação apresentada acima, conseguimos entender o que a
estatística descritiva nos propõe:

Estatística Descritiva: Envolve conceitos e métodos para coletar, organizar, apresentar, analisar e interpretar dados
obtidos de uma amostra ou população.

Por outro lado, se Pedro sabe a média de uma parte de seus alunos do 3°ano, ou seja, se ele sabe a média dos
alunos da turma A, quando ele for utilizar essa média conhecida como estimativa (avaliação ou cálculo que servirá como
uma suposição) para o valor da média de todos os seus alunos do 3° ano (incluindo as turmas B e C), ele estará fazendo
o que chamamos de indução.
Essa indução, juntamente com processos de estimativa, é uma característica da outra parte da estatística, a
estatística indutiva ou inferencial.
Estatística Indutiva: Propõe processos para estimar informações sobre uma população a partir de resultados de uma
amostra dessa população.

Mas afinal, o que são população e amostra?


População: É um conjunto completo de todos os elementos a serem estudados, desde que tenham uma característica
em comum.

A população pode ser:


População finita: Quando o número de elementos a observar podem ser contados e sabemos dizer quantas unidades
são.

4
Voltando à situação inicial, se Pedro for estudar as notas de todos seus alunos do 3° ano, todos esses alunos são
um exemplo de população, ou seja, todos os alunos da turma A, da turma B e da turma C formam, juntos, uma só
população.
Mais do que isso, também podemos dizer que é uma população finita, pois a quantidade de alunos nessa
população pode ser contada, e se somarmos a quantidade de alunos de cada turma (A, B e C) teremos a quantidade de
elementos (alunos) dessa população.

Exemplos de populações finitas:

• Alunos matriculados nas escolas públicas de Curitiba.


• Aparelhos celulares dos alunos da turma B de Pedro.
• Produtos fabricados numa empresa.
• Alunos que se matricularam na disciplina “Estatística” na Universidade Federal de Goiás, em 2010.
• O conjunto {1,2,3,4,5}.
• O conjunto de letras do alfabeto.
• O conjunto de dias da semana.
Além de finita, a população também pode ser:
População infinita: Quando não sabemos dizer quantos elementos são, ou quando os elementos da população não
podem ser contados.

Exemplos de Populações infinitas:

• Animais no planeta Terra. • População de vírus.


• Habitantes do estado de São Paulo. • O conjunto dos números naturais.
• Habitantes do planeta Terra. • O conjunto dos números inteiros.
• Árvores plantadas no Brasil. • O conjunto dos números reais.
• População de bactérias.
Perceba que, em algumas ocasiões, não conseguimos fazer o levantamento de dados de toda a população.
No caso do exemplo da população do 3°ano do professor Pedro, existe uma quantidade baixa de integrantes e,
assim, conseguimos fazer o levantamento de dados de todos eles.
Mas e se nossa população fosse de todos os alunos matriculados no 3°ano no Brasil?
O Brasil conta com milhares de escolas e milhões de alunos
matriculados no 3°ano. Desse modo, seria trabalhoso, tomaria muito
tempo e seria financeiramente inviável fazer o levantamento de dados
desse tipo de população.

Mas ainda assim, temos como fazer o estudo dessa população,


através do que chamamos de amostra representativa da população.
Amostra: É um subconjunto de elementos extraídos de uma população.

5
Veja a figura abaixo:

Exemplos de amostras:
• Considerando a população “alunos matriculados nas escolas públicas de Curitiba”, podemos pegar uma escola pública
de Curitiba que chamaremos de escola A e dizer que os “alunos matriculados na escola A” são uma amostra da
população colocada.
• Pensando agora na população do Estado de São Paulo, os habitantes do município de Campinas são um exemplo de
amostra.

• Se considerarmos os alunos do 3° ano de Pedro enquanto uma população, podemos pegar, por exemplo, os alunos
da turma A e dizer que essa turma é uma amostra, pois os alunos da turma A fazem parte da população total, ou
seja, eles formam um subconjunto de alunos extraídos da população.
• Da mesma maneira, dizemos que as turmas B e C também são amostras da nossa população escolhida.

• Já naquela outra situação em que a população são todos os alunos matriculados no 3°ano no Brasil, ao
considerarmos os alunos do 3°ano de Pedro, eles são um exemplo de amostra, pois estão matriculados no 3°ano e,
portanto, fazem parte da população.
Mas será que essa amostra (alunos do 3°ano de Pedro), representa a população (todos os alunos matriculados
do 3°ano)?
Lembre-se que, estamos tentando tirar conclusões sobre uma população muito grande e a pergunta acima, no
fundo, está nos questionando o seguinte:
Se fizermos, por exemplo, a média das notas da nossa amostra escolhida (alunos do 3°ano de Pedro), podemos
utilizar essa média como estimativa para a média de toda a população, ou seja, de todos os alunos de 3° ano do Brasil?
Precisamos então, nos certificar como essa amostra (alunos do 3°ano de Pedro) foi coletada.

6
Existem técnicas de coleta de amostras representativas da população e a essa técnica damos o nome de
Amostragem:
Amostragem: É uma técnica especial usada para recolher amostras que garantem o acaso na escolha, de modo a
garantir à amostra o caráter de representatividade

Garantir o acaso na escolha da amostra é garantir que a escolha da amostra seja feita de forma aleatória (sem
que haja uma maior chance de uma amostra ser escolhida em relação a outra).

Conheça os principais tipos de técnica de coleta de amostra representativa:


Amostragem casual simples ou aleatória simples: Consiste na retirada de elementos ao acaso da população, ou
seja, consiste em selecionar a amostra através de um sorteio. Dessa maneira, todos os elementos da população terão
igual probabilidade de serem escolhidos.

Ao girar uma roleta de bingo, por exemplo, qualquer bolinha tem mesma chance de cair.
Pensando a roleta como uma forma de coleta de elementos e as bolinhas como elementos da população, se você
for girando a roleta, estará obtendo, um a um, elementos de forma aleatória para sua amostra.

A urna funciona de forma bem semelhante a roleta: serão misturados os elementos e, em seguida, retirados um
a um, compondo sua amostra.
Se preferir utilizar algum software, o Excel é uma opção, pois ele gera tabelas de números aleatórios. Assim,
cada elemento de sua população será representado por um número e poderá ser gerado um de cada vez, porém de forma
muito mais rápida que as anteriores.
Amostragem sistemática: É utilizada quando a população está naturalmente ordenada, como listas telefônicas, fichas
de cadastramento etc.

Imagine que em uma empresa existam 30 funcionários e que ao chegarem na empresa, eles assinassem seus
nomes em uma lista de acordo com a ordem de chegada. Assim, temos uma lista ordenada com 30 funcionários.
Para criarmos uma amostra de forma sistemática de, por exemplo, 5 pessoas fazemos o seguinte:

7
PASSO 1 Divida o número de funcionários (30) pelo tamanho da amostra (5):
30
=6
5
PASSO 2 Selecione aleatoriamente um número de 1 a 6. Por exemplo, tirei numa urna o número 44. Esse será seu
primeiro número da amostra.
PASSO 3 Some o número obtido no 1°passo com o número obtido no 2°passo:
6 + 4 = 10
Esse será o segundo número da sua amostra.
PASSO 4 Some o número obtido no 1°passo com o número obtido no 3°passo:
(10 + 6 = 16)
Esse será o terceiro número da sua amostra.
PASSO 5 Repita o processo até obter o último número (no nosso caso é o 5°número) de sua amostra (28).
4, 10, 16, 22, 28
Dessa forma criamos uma amostra da população, onde os integrantes são:
4°, 10°, 16°, 22°𝑒 28°
Da lista ordenada dos 30 funcionários.

Basicamente, o que fizemos foi dividir os 30 funcionários em 6 grupos:


(1° ao 5°), (6° ao 10°), (11° ao 15°), (1° ao 5°), (6° ao 10°), (11° ao 15°), (16° ao 20°), (21° ao 25°), (26° ao 30°),
(16° ao 20°), (21° ao 25°), (26° ao 30°)

Após isso, escolhemos aleatoriamente um número no primeiro grupo, ou seja, um número de 1 a 5 (por exemplo
o 4). Desse modo, coletamos aleatoriamente o 4° funcionário para ser o nosso primeiro funcionário para a amostra de 5
funcionários.

Em seguida, fomos coletando os funcionários, simplesmente somando a quantidade de grupos (6) ao número do
funcionário selecionado, veja:
4 + 6 = 10
Assim, o nosso segundo funcionário para a amostra é o 10º.
O terceiro funcionário será obtido somando 6 a 10, ou seja, o 16° funcionário é o nosso terceiro elemento da
amostra. Somando: 6 + 16. Temos o quarto funcionário da amostra (22°)
E o quinto é o: 6 + 22 = 𝟐𝟖° funcionário

Amostragem estratificada: É composta por elementos provenientes da divisão da população em subgrupos


denominados estratos como, por exemplo, sexo, renda, bairro onde reside etc.

Basicamente, fazemos a divisão da população em estratos e depois retiramos uma amostra de cada estrato.
Quando a coleta é feita de maneira proporcional, a amostragem é chamada de estratificada proporcional.

8
EXEMPLO Vamos pensar numa população com 1000 universitários, onde 70% são alunos da área de humanas,
20% biológica e 10% exatas. Se desejamos coletar uma amostra com 500 dos 1000 universitários para fazer uma
determinada pesquisa, utilizando a amostragem estratificada proporcional, precisamos considerar essa proporção dos
estratos (humanas - 70%, biológicas 20% e exatas 10% ). Desse modo, a amostra terá 70% de 500 alunos de humanas
(coletados aleatoriamente), 20% de 500 sendo alunos de biológicas (coletados aleatoriamente) e 10% de 500 sendo alunos
de exatas (coletados aleatoriamente):
350 𝑑𝑒 ℎ𝑢𝑚𝑎𝑛𝑎𝑠 + 100 𝑑𝑒 𝑏𝑖𝑜𝑙ó𝑔𝑖𝑐𝑎𝑠 + 50 𝑑𝑒 𝑒𝑥𝑎𝑡𝑎𝑠 = 500 𝑎𝑙𝑢𝑛𝑜𝑠 𝑛𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎

Você também pode fazer a coleta dos 500 alunos, que se utiliza da amostragem estratificada, sem levar em conta a
proporção. Veja abaixo:

• Dos 700 alunos de humanas vamos selecionar, aleatoriamente, 400 alunos.


• Dos 200 alunos de biológicas vamos selecionar, aleatoriamente, 75 alunos.
• Dos 100 alunos de exatas vamos selecionar, aleatoriamente, 25 alunos.
• 400 alunos de humanas + 75 alunos de biológicas + 25 alunos de exatas = 500 alunos para nossa amostra.

Dessa maneira, levamos em conta os extratos, mas não seguimos a proporção que existia nos extratos.

• 400 alunos de humanas correspondem a 80% dos 500 alunos.


• 75 alunos de biológicas correspondem a 15% dos 500 alunos.
• 25 alunos de exatas correspondem a 5% dos 500 alunos.
Portanto, utilizamos a amostragem estratificada sem levar em conta a proporção existente na população (70% - 20%
- 10%)

Amostragem por conglomerado: Na amostragem por conglomerado, começamos dividindo a área da população
em seções ou conglomerados. Em seguida, escolhemos aleatoriamente algumas dessas seções e, por fim, tomamos
todos os elementos dessas seções.

Vamos pensar nessa situação para entender a amostragem por conglomerado:


Faremos uma pesquisa num determinado bairro com 100 casas e ao invés de sair entrevistando todos os
integrantes de cada casa, vamos numerar de 1 à 100 cada casa e sortear 15 casas para entrevistar:
Resultado hipotético do sorteio:
37, 41, 15, 26, 2, 12, 19, 98, 74, 3, 9, 45, 11, 66, 84
Cada uma das 100 casas é um conglomerado e coletamos, aleatoriamente, 15 desses
conglomerados para entrevistar seus integrantes. Os integrantes desses 15 conglomerados (casas)
formarão nossa amostra.
Voltando a pergunta: Mas será que essa amostra (alunos do 3°ano de Pedro),
representa a população (todos os alunos matriculados do 3°ano)? Os alunos do 3° ano de
Pedro formam uma amostra que não foi coletada de maneira aleatória. Simplesmente
utilizamos de uma amostra que já conhecíamos seus dados. Assim, seria tendencioso
utilizar os alunos do 3° de Pedro como amostra representativa.

9
Outro exemplo de amostragem tendenciosa:
EXEMPLO Imagine que um aluno vá fazer uma pesquisa sobre pessoas que tem cabelo liso em uma escola. Seria
conveniente para esse aluno, por exemplo, coletar somente os dados dos alunos de sua turma e a partir disso concluir
sua pesquisa, porém, o resultado da pesquisa na escola, seguiria uma tendência da turma desse aluno. Basicamente o
que o aluno fez foi coletar informações sobre os alunos que estavam em seu alcance imediato (os alunos de sua classe),
não tendo nenhuma preocupação com o caráter aleatório da amostra.

Portanto, dizemos que a amostragem usada na pesquisa dos alunos 3°ano e na pesquisa sobre o tipo de cabelo
liso é uma amostragem tendenciosa.
E então, o que me diz? Ficou claro os conceitos de população, amostra e amostragem?
Exercícios
Questão 1 – Num estudo sobre o número de irmãos dos alunos de uma escola com 1000 alunos, foi feita uma entrevista
com 60 alunos dessa escola. Qual é a população em estudo e a amostra escolhida respectivamente?
(a) Irmãos dos 1000 alunos da escola e os 60 alunos (c) Os 1000 alunos da escola e os irmãos dos 60 alunos
entrevistados. entrevistados.
(b) Os 1000 alunos da escola e os 60 alunos (d) Irmãos dos 1000 alunos da escola e os irmãos dos 60
entrevistados. alunos entrevistados.
(e) Os 60 alunos entrevistados e os 1000 alunos da escola.
Questão 2 – Considere as populações abaixo:

• Pacientes de um hospital no dia 01/05/2018


• População do Rio de Janeiro
• O conjunto {3, 7, 9, 11, 13, 17}
• O conjunto dos números Pares {0, 2, 4, 6, 8, 10, ...}
• Animais de um determinado zoológico
As populações acima são classificadas como:
(a) Finita, infinita, infinita, finita, finita (d) Infinita, infinita, finita, infinita, finita
(b) Finita, finita, finita, infinita, finita (e) Infinita, finita, infinita, finita, finita
(c) Finita, infinita, finita, infinita, finita
Questão 3 – Um cabo eleitoral escreve o nome de cada senador dos EUA em cartões separados, os mistura e extrai 10
nomes. Qual é o tipo de amostragem utilizada para a coleta de nomes acima?
(a) Aleatória (c) Sistemática (e) Por conveniência
(b) Estratificada (d) Por conglomerado

10
Questão 4 – Um psicólogo da Universidade de New York faz uma pesquisa sobre todos os estudantes de cada uma das
20 turmas selecionada aleatoriamente.
Qual é o tipo de amostragem utilizada acima?
(a) Aleatória (c) Sistemática (e) Por conveniência
(b) Estratificada (d) Por conglomerado
Questão 5 – O gerente comercial da America Online testa uma nova estratégia de vendas selecionando aleatoriamente
250 consumidores com renda inferior a $50 000 e 250 consumidores com renda de ao menos $ 50 000.
Qual é o tipo de amostragem utilizada acima?
(a) Aleatória (c) Sistemática (e) Por conveniência
(b) Estratificada (d) Por conglomerado

1.2 Conceito e o método estatístico


Além de conceitos como população, amostra e amostragem temos outros conceitos que são
muito importantes na Estatística.
Dados: São observações documentadas ou resultados da medição.

EXEMPLO 1 Suponhamos que em um questionário aplicado a 30 pessoas, perguntemos o sexo, a idade e a


altura.
Uma das pessoas responde:

As respostas obtidas (Feminino, 22 anos e 1,53 cm) são os dados coletados dessa pessoa.
De outra forma, os dados são os valores obtidos das características que estamos observando, ou seja, são
resultado do que chamamos de variáveis.
No caso da variável sexo temos, feminino como dado dessa variável, 22 anos como dado da variável idade e
1,53 cm como dado da variável altura.
Censo: É uma coleção de dados relativos a todos os elementos de uma população.

Saiba mais: A palavra censo vem do latim census e quer dizer "conjunto dos dados estatísticos dos habitantes de uma
cidade, província, estado, nação". O Censo é a única pesquisa que visita todos os domicílios brasileiros (cerca de 58
11
milhões por 8.514.876,599 km²) para conhecer a situação de vida da população em cada um dos 5.565 municípios do
país. Um trabalho gigantesco, que envolve cerca de 230 mil pessoas, bem diferente da pesquisa amostral, que, como
o próprio nome indica, investiga uma amostra da população e, a partir de modelos estatísticos, chega à representação
do todo.
Site do censo nacional realizado em 2010 no Brasil pelo IBGE:
https://censo2010.ibge.gov.br/materiais/guia-do-censo/apresentacao.html

No Brasil, temos um instrumento de coleta de informações da educação básica chamado Censo Escolar. O Censo
Escolar tem por finalidade ajudar os atores da educação a compreender a situação educacional do país, das unidades
federativas, dos municípios e do Distrito Federal, bem como das escolas e, com isso, acompanhar a efetividade das
políticas públicas.
Site do censo escolar: http://portal.inep.gov.br/censo-escolar
Parâmetro: É uma medida numérica que descreve uma característica da população estudada.

EXEMPLO 1 Os alunos das três turmas de Pedro serão nossa população a ser estudada. Pedro calculou a média das
notas dos seus alunos e chegou em 6,9.
Perceba que a média é um valor numérico e que diz respeito a população estudada
(alunos das três turmas de Pedro), ou seja, descreve uma característica da população
estudada. Com isso, a média 6,9 é um parâmetro da população dos alunos das três
turmas de Pedro.

EXEMPLO 2 Se numa pesquisa feita na população composta por governadores dos


estados Brasileiros (27 governadores), resultar que 22 deles possuem motorista particular,
temos o número 22 como medida numérica descrevendo a característica “possui motorista particular”, portanto trata-se
de um parâmetro.

Uma estatística: É uma medida numérica que descreve uma característica de uma amostra.

EXEMPLO 1 Pegamos como amostra os alunos de Pedro da turma A. Pedro


calculou a média das notas dos alunos da turma A e chegou em 7,2.
Perceba que a média das notas dos alunos da turma A é uma medida
numérica que descreve a característica “nota” dessa amostra. Assim, podemos
dizer que a média das notas dos alunos da turma A de Pedro é uma estatística.

EXEMPLO 2 Numa pesquisa com 1000 pessoas, escolhidas ao acaso, de uma população, descobriram que 750 (75%)
dessas pessoas possuem celular. Como o número 750
(75%) diz respeito a uma característica (possuir
celular) da amostra coletada, então esse percentual
trata-se de uma estatística.

12
Para refletir: O que diferencia a estatística de uma estatística?

Uma estatística e A estatística se diferenciam porque a primeira refere-se à uma medida numérica que descreve uma
característica de uma Amostra (por exemplo, a média das notas dos alunos de uma turma é uma medida que descreve a
característica “nota” dessa amostra, logo a média das notas dos alunos é Uma estatística).

Já a segunda, refere-se a todo um campo de estudos centrado na produção de metodologias para coleta, organização,
descrição, análise e interpretação de dados, bem como na obtenção de conclusões válidas e na tomada de decisões razoáveis
baseadas em tais análises. A estatística também tem como uma de suas utilidades a apresentação de dados de uma pesquisa
de forma sintetizada, por meio das tabelas e dos gráficos, sendo essencial saber interpretar esses dados.

Vamos no próximo tópico aprender um pouco mais sobre as Variáveis:

Variáveis: É a característica que vai ser observada, medida ou contada nos elementos da população ou da amostra e
que pode variar, ou seja, cada membro da população pode assumir um valor diferente.

As variáveis se dividem da seguinte maneira:

Vamos entender essa divisão:


Variáveis Qualitativas: São características de uma população que não podem ser medidas.

Essas variáveis podem ser:

Variáveis qualitativas nominais: Quando os valores são expressos por atributos.


Exemplos
Sexo: Numa população qualquer de pessoas, perceba que os valores que essa
variável assume são Masculino ou Feminino (particular a cada pessoa).
Portanto, a variável Sexo é qualitativa nominal.

Nacionalidade: Imagine que a população estudada seja os alunos de Pedro.


Apesar de esperarmos “Brasileiro” como valor dessa variável para todos os
alunos, pode ser que tenha alunos de outras nacionalidades na sala como,
por exemplo, argentino, colombiano etc. De qualquer maneira, perceba que
a variável assume valores particulares a cada aluno de Pedro, assim, dizemos
que a nacionalidade é uma variável qualitativa nominal.

Da mesma forma, podemos dizer que as variáveis abaixo são


qualitativas nominais:

Curso que pretende fazer: A variável “Curso que pretende fazer” pode
assumir como valores: Medicina, Matemática, Inglês, Direito etc.

Esporte favorito: A variável “Esporte favorito” pode assumir como valores:


Basquete, Futebol, Vôlei, Natação etc.

Estado civil: A variável “Estado civil” pode assumir como valores: Casado,
Solteiro, Divorciado, Separado e Viúvo.

13
Variáveis qualitativas ordinais: Quando a variável segue uma ordem.
Exemplos

Classe social: A classificação do Instituto Brasileiro de Geografia e Estatística divide as classes sociais em 5 categorias
básicas, segundo a renda familiar mensal: Classe A (acima de 20 salários mínimos), Classe B (de 10 a 20 salários
mínimos), Classe C (de 4 a 10 salários mínimos), Classe D (de 2 a 4 salários mínimos) e a Classe E (recebe até 2 salários
mínimos) – veja mais em https://www.todamateria.com.br/classe-social/. A classe social assume uma ordem natural de
A à E.
Grau de escolaridade: São eles: educação infantil,
fundamental, médio, superior, mestrado, doutorado e
pós-doutorado. Se quisermos chegar no pós-
doutorado, antes passamos por cada grau de
escolaridade anterior e na ordem estabelecida. Assim,
o Grau de escolaridade é uma variável qualitativa
ordinal.
Da mesma maneira, podemos dizer que as variáveis abaixo são qualitativas ordinais, pois não podem ser
contadas nem medidas e além disso assumem valores que possuem uma ordenação.
Cargos em uma empresa: A variável “Cargos em uma Patente militar da marinha: A variável “Patente militar
empresa” pode assumir valores como: Gestor de da marinha” pode assumir valores como: Soldado,
marketing, Gerente, Coordenador de vendas e outros. Sargento, Cabo e outros.

Variáveis Quantitativas: São características de uma população que assumem valores numéricos, ou seja, uma
variável é dita quantitativa quando os valores da variável forem expressos em números.

As variáveis quantitativas podem ser discretas e contínuas:


Variáveis Discretas: Tem como elementos ou valores os resultados de uma contagem, em que só fazem sentido os
valores inteiros.
Exemplos Quantidade de idiomas falados: A variável “Quantidade
de idiomas falados” pode assumir como valores
Quantidade de eletrodomésticos: Perceba que as
1,2,3,4,5,...
respostas que esperamos dessa variável são: 0 se a
pessoa não possui eletrodoméstico, 1 se a pessoa possui Quantidade de esportes que
um eletrodoméstico e assim por diante. Veja também pratica: A variável “Quantidade
que os valores são obtidos através de uma contagem, de esportes que pratica” pode
pois precisamos contar a quantidade de assumir como valores 1,2,3,4,...
eletrodomésticos em nossa casa para que possamos
dizer quantos são.

Assim, temos outros exemplos de variáveis


quantitativas discretas:

Variáveis Contínuas: Pode assumir qualquer valor num intervalo razoável de variação.
Exemplos
Altura: Se a população estudada forem os jogadores de Basquete da NBA, esperamos que os valores que essa variável
assume esteja no intervalo [1,60 metro, 2,31 metros], pois o menor jogador de todos os tempos da NBA foi o Muggsy
Bogues com 1,60 metro de altura e o maior foi o Gheorghe Mureşan com 2,31 metros de altura. Outro intervalo que

14
você pode pensar é [1,50 metro, 2,40 metros] pois é um intervalo razoável de variação (de fato é aceitável esperar que
os jogadores tenham estatura nesse intervalo).
Peso corporal: A variável “Peso” pode assumir como valores: 45,60 kg , 75,05 kg , 84 kg …
Qualquer valor no intervalo [1,50 kg , 200 kg]
IMC (índice de massa corporal): A variável “IMC (índice de massa corporal)” pode assumir como
valores 19, 22.5, 24, ... Qualquer valor no intervalo [16, 60].
Cintura: A variável “Cintura” pode assumir como valores: 85 cm, 122,50 cm , 76,94 cm,...
Qualquer valor no intervalo [40 cm, 300 cm]
Você pode se questionar, por exemplo, o motivo da variável “quantidade de eletrodoméstico”, não ser uma
variável quantitativa contínua. A explicação é muito simples: apesar de conseguirmos um intervalo que contém os
valores que a variável assume, como por exemplo [0 , 200], não podemos dizer que a variável “quantidade de
eletrodoméstico”, assume qualquer valor no intervalo [0 , 200]. Tem como alguma pessoa ter em sua residência 22,37
ou 5,5 ou 73,999999... eletrodomésticos? Assim, não podemos dizer que a variável “quantidade de eletrodoméstico” é
uma variável quantitativa contínua.
Agora que entendemos os conceitos fundamentais da estatística (população, amostra, amostragem, censo etc.),
vamos compreender o método estatístico e as fases do método estatístico descritivo.
MÉTODO ESTATÍSTICO
O método científico: Podemos entender o método científico como um conjunto de regras básicas para desenvolver
uma experiência a fim de produzir um novo conhecimento, bem como corrigir e integrar conhecimentos pré-
existentes. Dos métodos científicos, podemos destacar o método experimental e o estatístico.

O MÉTODO EXPERIMENTAL: O MÉTODO ESTATÍSTICO: É utilizado quando


O método experimental baseia-se em precisamos descobrir fatos em um campo em que o
manter constantes todas as causas método experimental não se aplica (como, por exemplo,
(fatores), menos uma, e variar essa nas Ciências Sociais), já que os vários fatores que afetam
causa de modo que o pesquisador o fenômeno em estudo não podem permanecer constantes
possa descobrir seus efeitos, caso enquanto fazemos variar a causa que, naquele momento,
existam. nos interessa.

Nesses casos, lançamos mão de outro método, o método estatístico. O método estatístico, diante da
impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas
variações e procurando determinar, no resultado final, quais influências cabem a cada uma delas.
Conheça as fases do método estatístico descritivo:
DEFINIÇÃO DO PROBLEMA: Nessa fase, precisamos definir e entender o problema que
precisamos resolver.
Exemplo: Imagine que o professor Pedro queira descobrir o esporte preferido de seus alunos. Logo
vamos definir o problema: “Qual o esporte preferido pelos meus alunos?”
PLANEJAMENTO DA PESQUISA: No planejamento, precisamos saber quais dados precisamos obter, de que forma
vamos obter esses dados e se vamos fazer o levantamento de dados de toda a população (levantamento censitário) ou de
uma amostra da população.
Exemplo: Os dados que Pedro precisa obter: Os esportes que cada um de seus alunos preferem ou
se não preferem nenhum. A forma como ele vai obter os dados: Questionário no papel. O
questionário será passado para cada um dos alunos de Pedro, logo trata-se de um levantamento
populacional. Faz parte também do planejamento da pesquisa, o gasto que será preciso para executá-
la. No caso da pesquisa de Pedro, o gasto será com papéis e impressão dos questionários, ou seja,
não deve ser cara essa pesquisa.
15
COLETA DOS DADOS: A coleta de dados é o método pelo qual a informação sobre as variáveis é coletada.
Exemplo: Seguindo a linha do nosso exemplo, a coleta será feita pelo próprio professor (Pedro) e os dados obtidos vão
ser exatamente no local de pesquisa, através de questionários (Escola / sala de aula). O questionário vai conter as
seguintes perguntas:
Você gosta de algum esporte? ( ) Sim ( ) Não
Qual esporte você mais gosta ?
Assim, se a pessoa responder “não” na primeira pergunta, Pedro já entende que essa pessoa não tem preferência nenhuma
de esporte. Se a pessoa responder sim, em seguida vai responder qual é sua preferida.
CRÍTICA DOS DADOS: A crítica dos dados é um processo de detecção de erros por inspeção cuidadosa dos dados
coletados. Em geral, é tida com a responsável por retardar a conclusão dos resultados da pesquisa. No entanto, trata-se
de uma etapa fundamental para garantir a qualidade dos dados.
Exemplo: No nosso exemplo, se a pessoa responder o questionário de forma inesperada, como:
Qual esporte você mais pratica?
Resposta: Dormir.
Precisamos detectar esse erro e descartar esses dados, ou pedir que responda o questionário de forma
correta.
APURAÇÃO DOS DADOS: Consiste em resumir os dados através de uma contagem e de um agrupamento. É um
trabalho de coordenação e de tabulação.
Supondo que Pedro possui 40 alunos e que todos eles responderam corretamente a pesquisa, veja a tabela abaixo:

As tabelas são uma das formas que temos para resumir os dados obtidos na pesquisa e a tabela 1 nos diz o esporte que
cada aluno de Pedro prefere. De outra forma, poderíamos fazer uma tabela que agrupa os dados obtidos nos tipos de
esportes, veja:

16
Devemos interpretar a tabela 2 da seguinte maneira: 12 alunos têm o futebol como esporte preferido, 5 alunos
têm o vôlei como esporte preferido, 3 alunos têm a natação como esporte preferido, 8 alunos têm o basquete como
esporte preferido, 8 alunos preferem outros esportes e 4 alunos não têm preferência nenhuma de esporte.
EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS: A apresentação dos dados é de fundamental importância para
uma pesquisa. Estes devem ser apresentados de forma adequada, por meio de tabelas e/ou gráficos que permitam
sintetizar grandes quantidades de dados, tornando mais fácil a compreensão do atributo em estudo e permitindo uma
futura análise.
Logo, podemos utilizar as tabelas não só para organizar, Interpretamos o gráfico 1 da mesma maneira que
mas também para apresentar nossos dados de forma interpretamos a tabela 2, porém o gráfico é uma maneira
resumida, veja: mais ilustrativa e chamativa de sintetizar os dados obtidos.
A mesma interpretação serve para o gráfico de barras
abaixo:

Gráfico 2 - Gráfico de barras da quantidade de alunos em


função do esporte preferido – 2010

Também podemos sintetizar os dados obtidos em gráficos.


Veja o exemplo do gráfico de colunas e barras: Não precisa se preocupar em saber construir e interpretar
Gráfico 1 - Gráfico de colunas da quantidade de alunos as tabelas e gráficos agora, pois vamos estudar cada um
em função do esporte preferido - 2010 deles de forma mais detalhada.

ANÁLISE DOS RESULTADOS: O objetivo de uma análise estatística é tirar conclusões que ajudem o pesquisador a
resolver o problema proposto. O significado exato de cada um dos valores obtidos através do cálculo das várias medidas
estatísticas disponíveis deve ser bem interpretado.
As tabelas e gráficos que fizemos, já nos ajudaram a responder o problema
proposto inicialmente, pois através delas já sabemos qual é o esporte favorito dos
alunos. Porém há uma medida estatística por trás disso chamada “moda”:
A moda de um conjunto de dados é o valor que ocorre com maior frequência.

17
Perceba que a resposta para o problema do professor Pedro é exatamente a moda
do conjunto de valores que ele obteve, pois a moda é o valor que mais aparece nos conjuntos
de dados, ou seja, é o esporte favorito dos alunos.
Com ajuda das tabelas e gráficos, conseguimos perceber que o futebol é a moda do
nosso conjunto de dados, pois foi o esporte que os alunos mais responderam como favorito.
Junto a moda vamos estudar várias outras medidas estatísticas, que vão nos ajudar
a fazer as análises e tirar nossas conclusões para solucionarmos nosso problema.
Essas medidas são chamadas de medidas de posição e medidas de dispersão.
Medidas de posição - Exemplo: Moda, média e mediana.
Medidas de dispersão - Exemplo: Desvio padrão e variância.
Mas até chegar nessas medidas, precisamos entender como fazer a apresentação de nossos dados, ou seja, saber
montar tabelas e gráficos.
Exercícios
Questão 1 - Numa pesquisa feita num bairro com 300 pessoas, chegou-se à conclusão de que 70% (210 pessoas) dessas
pessoas utilizam o aplicativo uber. Qual é a população estudada e a amostra escolhida para a pesquisa? Além disso,
podemos dizer que 70% é um parâmetro ou uma estatística?
a) A população estudada são as pessoas do Bairro, a amostra são as 300 pessoas entrevistadas no bairro e 70%
corresponde a uma estatística, pois trata-se de um valor numérico que corresponde a uma característica da
amostra.
b) A população estudada são as 300 pessoas do Bairro, a amostra são todas as pessoas do bairro e 70% corresponde
a uma estatística, pois trata-se de um valor numérico que corresponde a uma característica da população.
c) A população estudada são as pessoas do Bairro, a amostra são as 300 pessoas entrevistadas no bairro e 70%
corresponde a um parâmetro, pois trata-se de um valor numérico que corresponde a uma característica da
amostra.
d) A população estudada são as 300 pessoas do Bairro, a amostra são todas as pessoas entrevistadas no bairro e
70% corresponde a uma estatística, pois trata-se de um valor numérico que corresponde a uma característica da
amostra.
e) A população estudada são as pessoas do Bairro, a amostra são as 300 pessoas entrevistadas no bairro e 70%
corresponde a um parâmetro, pois trata-se de um valor numérico que corresponde a uma característica da
população.
Questão 2 - Com o objetivo de fazer um estudo sobre o número de irmãos dos alunos de uma escola, foi feita uma
pesquisa em que responderam 60 alunos. Qual é a variável em estudo e o tipo da variável, respectivamente?
a) A variável é a “número de irmãos” e o tipo é “qualitativa ordinal”
b) A variável é a “irmãos dos alunos” e o tipo é “qualitativa nominal”
c) A variável é a “irmãos dos alunos” e o tipo é “qualitativa ordinal”
d) A variável é a “número de irmãos” e o tipo é “quantitativa contínua”
e) A variável é a “número de irmãos” e o tipo é “quantitativa discreta”
Questão 3 - Em um questionário para um concurso público recolheram-se dados referentes às variáveis

• idade
• sexo
• curso
• ano de ingresso
• peso
• grau de escolaridade
Classifique cada uma das variáveis acima respectivamente:

18
a) Quantitativa discreta, qualitativa nominal, qualitativa nominal, quantitativa contínua, quantitativa discreta,
qualitativa ordinal.
b) Quantitativa contínua, qualitativa ordinal, qualitativa nominal, quantitativa contínua, quantitativa discreta,
qualitativa ordinal.
c) Quantitativa contínua, qualitativa nominal, qualitativa nominal, quantitativa contínua, quantitativa discreta,
qualitativa ordinal.
d) Quantitativa contínua, qualitativa nominal, qualitativa nominal, quantitativa contínua, quantitativa discreta,
qualitativa ordinal.
e) Quantitativa contínua, qualitativa nominal, qualitativa nominal, quantitativa discreta, quantitativa contínua,
qualitativa ordinal.
Questão 4 - No estado de São Paulo foi feita uma pesquisa eleitoral para saber o candidato que estava a frente nas
eleições presidenciais. Foi perguntado o candidato de 1500 eleitores. Qual é a população em estudo, a amostra escolhida,
a variável estudada e a classificação da variável, respectivamente?
a) População de São Paulo, 1500 eleitores, candidato dos eleitores de São Paulo, qualitativa nominal.
b) População de São Paulo, 1500 eleitores, candidato dos eleitores de São Paulo, qualitativa ordinal.
c) População de São Paulo, eleitores de São Paulo, candidato dos eleitores de São Paulo, qualitativa nominal.
d) Eleitores de São Paulo, 1500 eleitores, candidato dos eleitores de São Paulo, qualitativa nominal.
e) Eleitores de São Paulo, 1500 eleitores, candidato dos eleitores de São Paulo, qualitativa ordinal.
Questão 5 - Numa pesquisa feita entre todos os 500 alunos de uma escola, resultou-se que 80% utilizam transporte
público. A pesquisa foi feita numa população ou amostra? Qual é essa população ou amostra? 80% corresponde a uma
estatística ou parâmetro?
a) População, a população são os 500 alunos da escola e 80% corresponde a uma estatística, pois descreve uma
característica populacional.
b) Amostra, a população são os 500 alunos da escola e 80% corresponde a uma estatística, pois descreve uma
característica populacional.
c) Amostra, a população são os 500 alunos da escola e 80% corresponde a um parâmetro, pois descreve uma
característica amostral.
d) População, a população são os 500 alunos da escola e 80% corresponde a um parâmetro, pois descreve uma
característica populacional.
e) Amostra, a população são os 500 alunos da escola e 80% corresponde a um parâmetro, pois descreve uma
característica populacional.

2. Apresentação dos dados

2.1. Tabelas e séries


TABELAS E SÉRIES ESTATÍSTICAS
Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis podem assumir para que
possamos ter uma visão global de uma variação. Para isso, a Estatística apresenta esses valores em forma de tabelas e
gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo.

19
TABELAS
Além de sintetizar e organizar dados, as tabelas nos auxiliam na observação de relações entre as variáveis.

Veja a tabela abaixo:

Destacamos algumas linhas da tabela, para que possamos fazer uma pequena análise de algumas das variáveis
da tabela. Vamos analisar as variáveis IMC e cintura da seguinte maneira:
20
✓ o indivíduo com maior IMC = 31,9 também tem
maior comprimento de cintura igual a 105,5 cm.
✓ O indivíduo com o segundo maior IMC = 31,4
também possui o segundo maior comprimento de cintura
igual a 103,3 cm.
✓ O indivíduo com menor IMC = 21,5 possui o
segundo menor comprimento de cintura igual a 78,8 cm.

Perceba que quanto maior o IMC, maior tende a ser o comprimento de cintura dos indivíduos e de forma
análoga, quanto menor o IMC, menor tende a ser o comprimento de cintura dos indivíduos. Assim, parece haver
uma relação de dependência entre as variáveis IMC e cintura.
Por outro lado, temos certeza sobre uma relação de dependência entre IMC, altura e peso, pois o IMC é
diretamente proporcional ao peso e inversamente proporcional ao quadrado da altura.
𝑝𝑒𝑠𝑜
𝐼𝑀𝐶 =
(𝑎𝑙𝑡𝑢𝑟𝑎)2
Desse modo, se pegarmos indivíduos de alturas semelhantes como 168,9 𝑐𝑚 = 1,689 𝑚 e 170,7 𝑐𝑚 =
1,707 𝑚, mas com pesos discrepantes 61,2 kg e 91,4 kg respectivamente, teremos uma grande variação no IMC, veja:
61,2 kg
𝐼𝑀𝐶(1°) = ≅ 21,5 𝑘𝑔/ m2
(1,686 m)
91,4 kg
𝐼𝑀𝐶(2°) = ≅ 31,4 𝑘𝑔/ m2
(1,070 m)
Observe que a altura dos dois indivíduos são praticamente a mesma, porém como o peso do segundo é muito
maior e o IMC é diretamente proporcional ao peso, temos que o IMC (2°) é muito maior que o IMC (1°).
Mais alguns exemplos de tabelas:

Já na tabela 4, percebemos que independente do ano (1°,2° ou 3°), grande


parte dos alunos gostam da matéria de Português.
183
Em termos percentuais, aproximadamente 89% (206 ≅ 89%) dos alunos
70
do ensino médio gostam de Português, aproximadamente 34% (206 ≅ 34%) dos
alunos do ensino médio gostam de Matemática e aproximadamente 3% dos
6
alunos do ensino médio não gostam de Português e Matemática (206 ≅ 3%).

21
Observando a tabela 5, notamos que ela dispõe o faturamento de cada produto (Arroz,
Feijão, Óleo, Farinha) de uma empresa A, em cada mês do segundo semestre
Assim, conseguimos concluir, por exemplo, que o faturamento de arroz em setembro (R$
1054,35 reais) foi inferior aos demais meses.
Conseguimos perceber que em setembro a empresa A teve o menor faturamento do
semestre com a venda de seus produtos (R$ 3592,53 reais).
Veremos agora, com quais elementos uma tabela precisa ser composta:
Título: Indica o que foi estudado, quando foi estudado e Coluna Indicadora: evidencia a natureza, conteúdo de cada
onde foi estudado. linha.
Cabeçalho: Parte da tabela na qual é designada a natureza Casa ou célula: Parte da tabela formada pelo cruzamento de
do conteúdo de cada coluna. uma linha com uma coluna.
Corpo: Parte da tabela composta por linhas e colunas. Rodapé: Espaço aproveitado em seguida ao fecho da tabela,
em que são colocadas as notas de natureza informativa
Linhas: Parte do corpo que contém uma sequência (fonte, notas e chamadas).
horizontal de informações
Fonte: Refere-se à entidade que organizou ou forneceu os
Colunas: Parte do corpo que contém uma sequência vertical dados expostos.
de informações.

As tabelas 1, 2 e 3 foram construídas de


forma hipotética (para servir de exemplo) - assim
como, um dia, você talvez precise construir uma -
nesse caso, nenhuma delas possui fonte no rodapé.
O modelo de tabela segue ao lado (tabela 1):

22
SÉRIES ESTATÍSTICAS
São todas as tabelas que apresentam a distribuição de um conjunto de dados estatísticos em função da época,
do local e da espécie, além de determinar o surgimento de quatro tipos fundamentais de séries estatísticas:

Série temporal ou cronológica: É a série cujos dados estão dispostos em correspondência com o tempo.

Veja os exemplos abaixo:

Série geográfica ou territorial: É a série cujos dados estão dispostos em correspondência com o local.

Veja os exemplos abaixo:

23
Série específica ou qualitativa: É a série cujos dados estão dispostos em correspondência com a espécie ou
qualidade.
Veja os exemplos abaixo:

Série mista ou composta: É a série cujos dados estão dispostos em correspondência com a espécie ou qualidade,
ou seja, varia o fato e permanecem constantes a época e o local.
Veja os exemplos abaixo:

24
Exercícios
Questão 1 – Para qual das fases do método estatístico descritivo, as tabelas são mais importantes?
(a) Definição do problema (d) Apresentação dos dados
(b) Coleta de dados (e) Planejamento da pesquisa
(c) Crítica dos dados
Questão 2 – Observe a tabela e responda: quais são as variáveis apresentadas, a classificação das variáveis e o tipo de
série de dados?

(a) “Anos” e “Quantidade de alunos matriculados” são (d) “Anos” e “Alunos matriculados” são as variáveis
as variáveis apresentadas na série, as duas variáveis são apresentadas na série, a variável “Ano” é quantitativa
quantitativas contínuas e a série é mista. discreta, a variável “Alunos matriculados” é
quantitativa contínua e a série é temporal.
(b) “Anos” e “Alunos matriculados” são as variáveis
apresentadas na série, as duas variáveis são (e) “Anos” e “Alunos matriculados” são as variáveis
quantitativas contínuas e a série é temporal. apresentadas na série, as duas variáveis são
quantitativas discretas e a série é específica.
(c) “Anos” e “Quantidade de alunos matriculados” são
as variáveis apresentadas na série, as duas variáveis são
quantitativas discretas e a série é temporal.

Questão 3 – Quais são as variáveis apresentadas, a classificação das variáveis e o tipo de série dados?

25
(a) “Países” e “Produto interno bruto (PIB)” são as qualitativa nominal e a variável “PIB” quantitativa
variáveis apresentadas na série, a variável “Países” é discreta e a série é mista.
qualitativa ordinal e a variável “PIB” quantitativa
(d) “Países” e “Produto interno bruto (PIB)” são as
contínua e a série é geográfica.
variáveis apresentadas na série, a variável “Países” é
(b) “Países” e “Produto interno bruto (PIB)” são as qualitativa nominal e a variável “PIB” quantitativa
variáveis apresentadas na série, a variável “Países” é contínua e a série é mista.
qualitativa nominal e a variável “PIB” quantitativa
(e) “Países” e “Produto interno bruto (PIB)” são as
discreta e a série é mista.
variáveis apresentadas na série, a variável “Países” é
(c) “Países” e “Produto interno bruto (PIB)” são as qualitativa nominal e a variável “PIB” quantitativa
variáveis apresentadas na série, a variável “Países” é contínua e a série é geográfica.
Questão 4 – Sobre a tabela abaixo responda qual é o tipo de série apresentada, qual foi o refrigerante que trouxe maior
lucro para o supermercado no 1°semestre e de quanto foi o lucro.

(a) Série temporal, pois os dados estão somente em (c) Série mista, pois os dados estão em função do tempo
função do tempo, o refrigerante que trouxe maior lucro e espécie, o refrigerante que trouxe maior lucro foi o
foi o Guaraná e o lucro foi de R$ 6.319,95 reais. Guaraná e o lucro foi de R$ 6.319,95 reais.
(b) Série específica, pois os dados estão somente em (d) Série mista, pois os dados estão em função do tempo
função da espécie ou qualidade, o refrigerante que e região, o refrigerante que trouxe maior lucro foi a
trouxe maior lucro foi a Coca-Cola e o lucro foi de R$ Fanta e o lucro foi de R$ 6.262,95 reais.
6.419,95 reais.
(e) Série mista, pois os dados estão em função do tempo
e espécie, o refrigerante que trouxe maior lucro foi a
Coca - Cola e o lucro foi de R$ 6.319,95 reais.
Questão 5 – Qual é o tipo de série apresentada, qual mês apresentou maior faturamento para a empresa A e de quanto
foi esse faturamento?

26
(a) A Série é a temporal, agosto foi o mês de maior faturamento e o faturamento foi de R$ 4.402,39 reais.
(b) A Série é a mista, dezembro foi o mês de maior faturamento e o faturamento foi de R$ 4.402,39 reais.
(c) A Série é a específica, novembro foi o mês de maior faturamento e o faturamento foi de R$ 4.111,85 reais.
(d) A Série é a mista, janeiro foi o mês de maior faturamento e o faturamento foi de R$ 4.402,39 reais.
(e) A Série é a temporal, dezembro foi o mês de maior faturamento e o faturamento foi de R$ 4.402,39 reais.

2.2. Apresentação de dados qualitativos


DISTRIBUIÇÃO DE FREQUÊNCIA PARA DADOS QUALITATIVOS:
Antes de entender o que de fato é uma distribuição de frequência, vamos entender uma das situações que ela
se faz útil por meio de um exemplo?
Exemplo: Na universidade A, foi
feita uma pesquisa relacionada ao
prato principal, sabor do suco e
sobremesa preferidos de 20
alunos no restaurante da
universidade.
O restaurante trabalha com 4 tipos
de pratos principais, 4 sabores de
suco e 3 frutas para a sobremesa.
Assim, os alunos precisavam
responder a pesquisa, com 1
desses pratos principais, 1 desses sabores de suco e 1 fruta
de sobremesa. As opções eram:
Tipos de pratos: Feijoada, estrogonofe, lasanha e
galinhada.
Sabores do suco: Tamarindo, uva, laranja e acerola.
Sobremesa: Melancia, banana e maçã.

Veja o resultado da coleta de dados na tabela ao lado (tabela


16):

De maneira mais formal, a amostra estudada são os 20


alunos da universidade A e as variáveis que estamos
estudando nessa amostra são qualitativas nominais, “prato
principal”, “sabor do suco” e “sobremesa” de preferência
desses alunos.

27
Para refletir: Perceba que a tabela sintetiza bem as respostas de cada aluno da pesquisa, porém e se a pesquisa
fosse feita com um número alto de alunos, por exemplo 150 alunos? Essa tabela de dados seria a única forma para
sintetizar os dados da pesquisa?
DISTRIBUIÇÃO DE FREQUÊNCIA
Veja na tabela 17 abaixo, como se dá a distribuição de frequência da variável “prato principal” e, em seguida,
o que é uma distribuição de frequência.

Perceba que a distribuição de frequência separa a variável estudada (prato principal) em elementos
(Feijoada, estrogonofe, lasanha e galinhada), nos diz quantas vezes cada uma delas aparecem na pesquisa
(frequência absoluta) e também nos diz qual a porcentagem correspondente a cada um dos elementos (frequência
relativa).
Veja a tabela de distribuição das variáveis "sabor do suco" e "sobremesa":

Mas a distribuição de frequência não precisa ser somente de elementos da variável.


Poderíamos separar, por exemplo, a variável sobremesa em duas classes (Doce ou Ácida):

• Doce: Melancia e banana.


• Ácida: maçã.
Como temos 7 pessoas que preferem
melancias e 8 que preferem bananas, temos 15
pessoas que preferem fruta doce como sobremesa e
as outras 5 pessoas preferem maçãs e, portanto,
fruta ácida como sobremesa.

28
Na tabela 19, fizemos a distribuição de frequência de todas as sobremesas, melancia, banana e maçã. Já na
tabela 20, fizemos a distribuição de frequência dos dados em duas classes de sobremesas, doce ou ácida.

Classes: São as categorias da variável em estudo.

No caso da variável sobremesa, temos as categorias:

Frequência absoluta(𝒇𝒊 ): São os valores que realmente representam o número de dados de cada elemento ou
classe. A soma das frequências simples é igual ao número total dos dados da distribuição.

A classe 1 (doce) tem frequência absoluta 𝒇𝟏 = 𝟏𝟓.


A classe 2 (ácida) tem frequência absoluta 𝒇𝟐 = 𝟓.
Somando as frequências das duas classes temos:
𝒇𝟏 + 𝒇𝟐 = 𝟏𝟓 + 𝟓 = 𝟐𝟎
que é o total de dados da distribuição.

Frequência relativa (𝒇𝒓𝒊 ): São os valores das razões entre as frequências absolutas de cada elemento ou classe e a
frequência total da distribuição. A soma das frequências relativas é igual a 1 (100 %).

𝒇𝒊
𝒇 𝒓𝒊 =
𝒏

A classe 1 (doce) tem frequência relativa


𝒇𝟏
𝒇 𝒓𝟏 = = 75%
𝒏

29
A classe 2 (ácida) tem frequência relativa
𝒇𝟐
𝒇 𝒓𝟐 = = 25%
𝒏

Somando 𝒇𝒓𝟏 + 𝒇𝒓𝟐 = 𝟕𝟓% + 𝟐𝟓% = 𝟏𝟎𝟎%.

Qual a importância das classes?


Para entendermos melhor as situações em que as classes são importantes, vamos a outro exemplo de pesquisa:
Imagine que você faça uma pesquisa no seu bairro, perguntando qual é o filme favorito de 200 pessoas do bairro.
Ao final da coleta de dados, você vai querer organizar os dados obtidos em uma tabela de frequência para saber qual
filme é o favorito dessas 200 pessoas, veja:

Nessa tabela, n é a quantidade de filmes obtidos como resposta. Suponhamos que você teve n = 170 filmes
como resposta, ou seja, algumas pessoas escolheram o mesmo filme como o favorito. Assim, nossa tabela de frequência
terá 170 filmes, portanto 170 linhas.
Logo não conseguimos sintetizar tão bem nossos dados da pesquisa, pois ao olhar para uma tabela de 170 linhas,
não conseguimos interpretá-la com clareza, devido ao tamanho da tabela.
E agora, como podemos sintetizar melhor os dados?
Poderíamos dividir a variável filme em classes:

• Ação • Drama
• Animação • Terror
• Aventura • Outros.
• Comédia

Veja que todos os 170 filmes obtidos podem ser agrupados nessas classes e, dessa forma,
nossa distribuição de frequência ficaria mais resumida do que a anterior.
30
Por exemplo, poderíamos ter como resposta da coleta de dados, 20 filmes de ação, 22 de animação, 3 de
aventura, 25 de comédia, 50 de drama, 15 de terror e 35 outros, totalizando os 170 filmes.

Assim, a função da distribuição de frequência é agrupar os dados ou por elementos (dados isolados) como na
tabela 11 ou por classes de ocorrência como nas tabelas 22 e 22.1, facilitando a análise de um conjunto de dados.
Note que a tabela 22.1 é muito mais apresentável que a tabela 22, porém as duas nos trazem
informações diferentes.
A tabela 22 nos diz qual o filme mais votado como favorito e a tabela 22.1 nos diz qual
gênero de filme é o favorito dos 200 entrevistados no bairro.
No exemplo acima, o gênero Drama é a preferência dos 200 entrevistados
do bairro.

Para refletir: Mas como fazemos essa distribuição de frequência ou agrupamento de dados?

31
DISTRIBUIÇÃO DE FREQUÊNCIA DOS DADOS ISOLADOS
Para fazer a distribuição de frequências para dados agrupados em classes, siga os seguintes passos:
PASSO 1: Escolha a variável que precisa estudar e a separe em elementos ou valores que a variável assume.
PASSO 2: Encontre a frequência absoluta de cada elemento.
PASSO 3: Encontre a frequência relativa de cada elemento.
PASSO 4: Organize em uma tabela de distribuição de frequência
Observe o seguinte exemplo:
PASSO 1: Variável = prato principal.
Elementos: Feijoada, estrogonofe, lasanha e galinhada.

PASSO 2: Frequência absoluta: 6 alunos preferem


feijoada (ou seja, 𝒇𝟏 = 𝟔 ), 2 preferem estrogonofe (ou
seja, 𝒇𝟐 = 𝟐), 7 preferem lasanha (ou seja, 𝒇𝟑 = 𝟕 ) e 5
preferem galinhada (ou seja, 𝒇𝟒 = 𝟓 ).

PASSO 3: Observando as frequências absolutas do passo anterior e levando em conta que temos n = 20
dados na variável prato principal, então
𝒇𝟏 𝟔
𝒇 𝒓𝟏 = = = 𝟎, 𝟑 = 𝟑𝟎%
𝒏 𝟐𝟎
𝒇𝟐 𝟐
𝒇 𝒓𝟐 = = = 𝟎, 𝟏 = 𝟏𝟎%
𝒏 𝟐𝟎
𝒇𝟑 𝟕
𝒇 𝒓𝟐 = = = 𝟎, 𝟑𝟓 = 𝟑𝟓%
𝒏 𝟐𝟎
𝒇𝟒 𝟓
𝒇 𝒓𝟒 = = = 𝟎, 𝟐𝟓 = 𝟐𝟓%
𝒏 𝟐𝟎

PASSO 4: Assim, a distribuição de frequência como na tabela 17:

32
DISTRIBUIÇÃO DE FREQUÊNCIA PARA DADOS AGRUPADOS EM CLASSES
Para fazer a distribuição de frequências para dados agrupados em classes, siga os seguintes passos:
PASSO 1: Escolha a variável que deseja estudar e a separe em classes.
PASSO 2: Encontre a frequência absoluta de cada classe.
PASSO 3: Encontre a frequência relativa de cada elemento.
PASSO 4: Organize em uma tabela de distribuição de frequência
Observe o exemplo:
PASSO 1: Variável = sobremesa
Classes: Doce e ácida

PASSO 2: Como temos 7 melancias e 8 bananas, temos 15 frutas que são doces e as outras 5 são maçãs e,
portanto, ácidas. Logo a frequência das frutas doces é 15 (ou seja, 𝒇𝟏 = 𝟏𝟓 ), e as ácidas têm frequência 5 (ou
seja, 𝒇𝟐 = 𝟓).
PASSO 3: Observando as frequências absolutas do passo anterior e levando em conta que temos n = 20
dados na variável prato principal, então
𝒇 𝟏𝟓
• Frequência relativa da classe doce 𝒇𝒓𝟏 = 𝟏 = = 𝟎, 𝟕𝟓 = 𝟕𝟓%.
𝒏 𝟐𝟎
𝒇 𝟓
• Frequência relativa da classe ácida 𝒇𝒓𝟐 = 𝟐 = = 𝟎, 𝟐𝟓 = 𝟐𝟓%
𝒏 𝟐𝟎
PASSO 4: Assim, a distribuição de frequência como na tabela 20:

Importante - Saiba mais sobre Arredondamento de Dados, cujas regras são dadas pela Portaria 36 de 06/07/1965 - INPM
- Instituto Nacional de Pesos e Medidas:

• Se o primeiro algarismo após aquele que formos conservamos o algarismo se ele for par ou
arredondar for de 0 a 4, conservamos o algarismo a ser aumentamos uma unidade se ele for ímpar,
arredondado e desprezamos os seguintes. Ex: 7,34856 desprezando os seguintes. Ex: 6,2500 (para décimos)
(para décimos) 7,3 6,2 12,350 (para décimos) 12,4
• Se o primeiro algarismo após aquele que formos • Se o 5 for seguido de outros algarismos dos quais, pelo
arredondar for de 6 a 9, acrescenta-se uma unidade no menos um é diferente de zero, aumentamos uma
algarismo a ser arredondado e desprezamos os unidade no algarismo e desprezamos os seguintes. Ex:
seguintes. Ex: 1,2734 (para décimos) 1,3 8,2502 (para décimos) 8,3 8,4503 (para décimos) 8,5
• Se o primeiro algarismo após aquele que formos
arredondar for 5, seguido apenas de zeros,

Outra utilidade da distribuição de frequência são representações gráficas que fazemos a partir dela, veja:
33
REPRESENTAÇÕES GRÁFICAS PARA VARIÁVEIS QUALITATIVAS

PICTOGRAMA: É uma representação gráfica que é ilustrada com figuras para representar, de forma simplificada,
o estudo da variável trabalhada.

Lembrando que Gráfico 3 – Pictograma da preferência do prato


principal dos 20 alunos da Universidade A - 2018

Esse pictograma foi construído de tal maneira que no


eixo horizontal temos a variável estudada (pratos principais), e no
eixo vertical temos a quantidade de alunos que preferem o prato
principal, ou seja, a frequência absoluta (Frequência). Dessa
Justamente por ser representado por figuras, o forma, para cada prato principal, temos a quantidade de vezes que
pictograma tem característica de ser bem chamativo, veja o ele foi escolhido na pesquisa, ou seja, a quantidade de pessoas
gráfico 3 abaixo: que preferem esse determinado prato.

Como esperado do pictograma, ele utiliza figuras ou


símbolos para representar a frequência. Perceba que temos 6
símbolos iguais representando a feijoada, 2 símbolos iguais
representando o estrogonofe, 7 símbolos iguais representando a
lasanha e 5 iguais símbolos representando a galinhada, onde 6, 2,
7 e 5 são as frequências de cada prato principal. Assim, a
quantidade de símbolos deve ser igual a frequência de cada
elemento.

GRÁFICO DE BARRAS OU COLUNAS: é representado por colunas retangulares e os retângulos são dispostos
verticalmente com a mesma medida de base e as alturas são correspondentes à frequência de cada dado. Os valores
da variável são colocados no eixo horizontal, e a frequência no eixo vertical.

O gráfico 4 é exemplo de gráfico de colunas:


Gráfico 4 – Gráfico de colunas da preferência do prato principal

34
Diferentemente do gráfico de colunas, o gráfico de Gráfico 7 – Gráfico de colunas da preferência do suco dos 20
barras é representado por barras horizontais, as alturas se mantêm alunos da Universidade A - 2018
constantes e as bases são correspondentes a frequência de cada
dado. Os valores da variável são colocados no eixo vertical e a
frequência no eixo horizontal.

Gráfico 5 – Gráfico de barras da preferência do prato


principal dos 20 alunos da Universidade A - 2018

Por preferência, os próximos gráficos serão


apresentados em colunas, pois o gráfico de barras difere somente
nos eixos do gráfico de colunas, e os dois nos passam a mesma
interpretação dos dados.

Vamos ver como são os pictogramas e gráfico de


colunas das variáveis sabor de suco e sobremesa:

Gráfico 8 – Pictograma da preferência da sobremesa dos 20


alunos da Universidade A - 2018

Gráfico 6 – Pictograma da preferência do suco dos 20 alunos da


Universidade A - 2018 Gráfico 9 – Gráfico de colunas da preferência da
sobremesa dos 20 alunos da Universidade A - 2018

35
GRÁFICO DE SETORES: O gráfico de setores ou gráfico circular é uma forma de apresentar a frequência
relativa dos dados, utilizando de setores proporcionais a frequência relativa de cada dado.

Veja no exemplo abaixo que o gráfico circular é


dividido em setores, onde cada setor corresponde a frequência
relativa de cada valor e o círculo corresponde a 100%, ou seja,
ao somar as frequências de cada setor o resultado é 100%.

Gráfico 11 - Gráfico de setores da preferência do suco


dos 20 alunos da Universidade A - 2018

Gráfico 10 - Gráfico de setores preferência do prato principal


dos 20 alunos da Universidade A - 2018

Veja que o gráfico de setores da preferência do prato


principal nos diz que 30% dos alunos entrevistados preferem
feijoada, 10% dos alunos entrevistados preferem estrogonofe,
35% dos alunos entrevistados preferem lasanha e 25% dos
alunos entrevistados preferem galinhada.

Lembre-se que o gráfico nos passa informações visuais,


então certifique-se de que a frequência relativa seja proporcional
Gráfico 12- Gráfico de setores da preferência da
ao setor, assim:
sobremesa dos 20 alunos da Universidade A - 2018
• Se a frequência relativa é 30%, então o setor
tem que ocupar 30% da área do círculo.
• Se a frequência relativa é 10%, então o setor
tem que ocupar 10% da área do círculo.
• Se a frequência relativa é 35%, então o setor
tem que ocupar 35% da área do círculo.
• Se a frequência relativa é 25%, então o setor
tem que ocupar 25% da área do círculo.

Veja os gráficos de setores das variáveis suco e


sobremesa de preferência:

36
Exercícios
Questão 1 – Um professor de literatura passou 3 livros literários (Dom Quixote, Guerra e Paz, A Montanha Mágica) para
seus 20 alunos lerem até o fim do ano letivo. No fim do ano, fez um questionário aos alunos sobre o livro favorito da cada um
deles e obteve como resultado, a distribuição de livros no quadro abaixo:

Qual é a frequência absoluta e relativa de cada um dos livros e qual é o livro mais votado pela turma:
(a) Dom Quixote tem frequência absoluta 8 e relativa 40%, Guerra e Paz tem frequência absoluta 6 e relativa 30%, Montanha
Mágica tem frequência absoluta 6 e relativa 30% e o livro mais votado é o Dom Quixote.
(b) Dom Quixote tem frequência absoluta 9 e relativa 40%, Guerra e Paz tem frequência absoluta 6 e relativa 30%, Montanha
Mágica tem frequência absoluta 5 e relativa 30% e o livro mais votado é o Dom Quixote.
(c) Dom Quixote tem frequência absoluta 9 e relativa 45%, Guerra e Paz tem frequência absoluta 6 e relativa 30%, Montanha
Mágica tem frequência absoluta 5 e relativa 25% e o livro mais votado é o Dom Quixote.

(d) Dom Quixote tem frequência absoluta 7 e relativa 35%, Guerra e Paz tem frequência absoluta 8 e relativa 40%, Montanha
Mágica tem frequência absoluta 5 e relativa 25% e o livro mais votado é o Guerra e Paz.

(e) Dom Quixote tem frequência absoluta 5 e relativa 25%, Guerra e Paz tem frequência absoluta 7 e relativa 35%, Montanha
Mágica tem frequência absoluta 8 e relativa 40% e o livro mais votado é o Montanha Mágica.
Questão 2 – (UFRS) Os resultados de uma pesquisa de opinião foram divulgados utilizando um gráfico de setores
circulares, como o representado na figura a seguir.

Ao setor “a” estão associadas 35% das respostas, ao setor “b”, 270 respostas e, aos setores “c” e “d”, um mesmo número de
respostas. Esse número é
(a) 45 (c) 180 (e) 900
(b) 90 (d) 450
Questão 3 – (UNESP) O número de ligações telefônicas de uma empresa, mês a mês, no ano de 2005, pode ser
representado pelo gráfico.

37
Com base no gráfico, pode-se afirmar que a quantidade total de meses em que o número de ligações foi maior ou igual a
1200 e menor ou igual a 1300 é:
(a) 2 (c) 6 (e) 8
(b) 4 (d) 7
Questão 4 – (ENEM) Uma enquete, realizada em março de 2010, perguntava aos internautas se eles acreditavam que as
atividades humanas provocam o aquecimento global. Eram três alternativas possíveis e 279 internautas responderam à
enquete, como mostra o gráfico.

Analisando os dados do gráfico, quanto internautas responderam “Não” à enquete?


(a) Menos de 23. (d) Mais 100 e menos de 190.
(b) Mais de 23 e menos de 25. (e) Mais de 200.

(c) Mais de 50 e menos de 75 .


Questão 5 – (UFPB) Segundo dados do IBGE, as classes sociais das famílias brasileiras são estabelecidas, de acordo com a
faixa de renda mensal total da família, conforme a tabela a seguir.

38
Após um levantamento feito com as famílias de um município, foram obtidos os resultados expressos no gráfico a seguir.

Com base nas informações contidas no gráfico e na tabela, conclui-se que o percentual das famílias que têm renda acima de
R$ 3060,00 é de:
(a) 45% (c) 70% (e) 90%
(b) 60% (d) 85%

2.3. Apresentação de dados quantitativos


DISTRIBUIÇÃO DE FREQUÊNCIA PARA DADOS QUANTITATIVOS
Com os dados qualitativos, você aprendeu a fazer a
distribuição de frequência do seus dados isolados, exemplo:

Dados isolados da variável sobremesa:

E aprendeu a fazer a distribuição de frequência dos


dados agrupados em classes, onde as classes da variável Essa distribuição de frequência diz respeito aos dados
sobremesa eram: isolados da variável sobremesa.

Assim, obtemos duas diferentes distribuições de


frequência, veja:
E essa é a distribuição de frequência dos dados
(melancia, banana e maçã) agrupados nas classes doce ou ácida.

39
Agora da variável filme favorito, para dados isolados e para dados agrupados em classes. Veja:

Para Refletir: Como vai funcionar a distribuição de frequência para os dados quantitativos?

Funcionará da mesma maneira que vimos para os dados qualitativos.


Podemos fazer a distribuição de frequência tanto para os dados isolados quanto para os dados agrupados em
classes.

A grande questão é: Como são as classes das variáveis quantitativas?

Vamos ver que vai depender se a variável é contínua ou discreta e vamos entender como é cada classe dessas
variáveis, como montar as classes e os gráficos, montar a distribuição de frequência e ver alguns gráficos que podemos
fazer a partir da distribuição. Vamos começar pelas variáveis quantitativas contínuas.
DISTRIBUIÇÃO DE FREQUÊNCIA PARA DADOS QUANTITATIVOS CONTÍNUOS.
Para facilitar o entendimento, vamos pensar juntos na seguinte situação:
Na universidade A, foi feita agora uma outra pesquisa com 20 alunos, em que os dados recolhidos são referentes
à altura (cm) e à idade (anos), sendo estas as variáveis quantitativas contínuas.
Veja o resultado da coleta de dados na tabela 30 na página a seguir.

40
Observação: Observe que os dados da variável
altura estão organizados do menor valor para o maior valor
(ordenado de maneira crescente). Essa ordenação dos dados
quantitativos favorece a análise dos dados, pois com os
dados ordenados podemos verificar quantas vezes cada uma
das alturas aparece nos dados, qual a maior altura, a menor
altura e em torno de qual altura se concentram os dados.
Essa ordenação dos dados, de maneira crescente ou
decrescente, recebe o nome de ROL.
Como vamos trabalhar primeiro com a variável
altura, ordenamos somente a variável altura.
Perceba que a altura 166,7 aparece 2 vezes e os outros 19
dados da variável altura, aparecem 1 vez.

Assim, teríamos uma tabela de distribuição de frequência


para dos dados isolados com 19 linhas, veja na tabela 31:

Observações: Observe que, apesar de nos dizer


quantas vezes cada valor aparece na tabela 30, construímos
uma tabela de frequência de 19 linhas para sintetizar os
dados de uma tabela de 20 linhas.
Lembrando que só estamos fazendo a tabela da
altura, ainda faltaria a tabela de frequência da variável
idade.
Mais que isso, imagine se o número de alunos
entrevistados na pesquisa fosse 150 alunos, com 5
variáveis para fazer a coleta de dados?
Poderíamos ter uma tabela
de 150 linhas para cada uma das 5
variáveis. Já pensou o trabalho que
você teria para sintetizar esses dados
numa tabela de distribuição de
frequência para cada variável, da
forma como sintetizamos a tabela
anterior?

Logo, assim como foi feito para variáveis qualitativas, vamos utilizar as classes para
agrupar uma grande quantidade de dados, de tal forma que nos possibilite a apresentação dessa quantidade

41
Mas como são as classes para variáveis quantitativas contínuas?

As classes para variáveis quantitativas contínuas são intervalos numéricos, veja as classes e suas frequências a
seguir:
𝐶𝑙𝑎𝑠𝑠𝑒 1 = [149.4 , 158.4)

𝐶𝑙𝑎𝑠𝑠𝑒 2 = [158.4 , 167.4)

𝐶𝑙𝑎𝑠𝑠𝑒 3 = [167.4 , 176.4)

𝐶𝑙𝑎𝑠𝑠𝑒 4 = [176.4 , 185.4)

𝐶𝑙𝑎𝑠𝑠𝑒 5 = [185.4 , 194.4)

Observações: Todos os dados da variável têm que estar em alguma das classes, e observe que a intercessão
das classes não possui nenhum valor (Vazio), ou seja, nenhum dos dados poderá estar em mais de uma classe.
A classe ou intervalo [ 𝑎, 𝑏) é um conjunto de valores x, onde 𝑎 ≤ 𝑥 < 𝑏. Dizemos que [𝑎, 𝑏) é o intervalo
fechado em “a” e aberto em “b”. Na estatística é comumente representado da seguinte maneira:
[𝑎, 𝑏) = 𝑎 | − − − 𝑏.

FREQUÊNCIAS ABSOLUTAS FREQUÊNCIAS RELATIVAS


𝒇𝟏 = 3 (frequência absoluta da classe 1), pois os valores 𝑓1 3
𝑓𝑟 1 = = = 0,15 = 15%
149.4 , 151.9 e 152.2 estão na 𝐶𝑙𝑎𝑠𝑠𝑒 1 = [149.4 , 158.4) 𝑛 20

𝑓2 7
𝒇𝟐 = 7, pois os valores 163.4 , 165.1 , 165.6 , 165.7 , 𝑓𝑟 2 = = = 0,35 = 35%
166.7 (duas pessoas com essa altura) e 167.1 estão na 𝑛 20
𝐶𝑙𝑎𝑠𝑠𝑒 2 = [158.4 , 167.4) 𝑓3 6
𝑓𝑟 3 = = = 0,30 = 30%
𝑛 20
𝒇𝟑 = 6, pois os valores 169.3, 171.3, 172.2, 173.7,
174.9 e 175.3 estão na 𝐶𝑙𝑎𝑠𝑠𝑒 3 = [167.4 , 176.4) 𝑓4 2
𝑓𝑟 4 = = = 0,10 = 10%
𝑛 20
𝒇𝟒 = 2, pois os valores 176.5 e 178.6 estão na
𝐶𝑙𝑎𝑠𝑠𝑒 4 = [176.4 , 185.4) 𝑓5 2
𝑓𝑟 5 = = = 0,10 = 10%
𝑛 20
𝒇𝟓 = 2, pois os valores 188.9 e 192.2 estão na
𝐶𝑙𝑎𝑠𝑠𝑒 5 = [185.4 , 194.4)

Com as classes e as frequências absolutas e relativas,


podemos montar a tabela de distribuição de frequência que
estamos acostumados a fazer temos a tabela 32.
Não tem como negar que a tabela 31 é mais rica em
detalhes do que a distribuição de frequência dos intervalos de
classe da tabela 32. Na tabela 31 conseguimos dizer a
frequência de cada um dos dados isolados, ou seja,
conseguimos dizer quantas vezes cada valor aparece na
pesquisa. Já na tabela 32, não conseguimos dizer quais valores
aparecem na pesquisa, somente que os valores estão
compreendidos nos intervalos ou classes. No entanto, lembre-
se que a apresentação dos dados é um dos objetivos na
Estatística Descritiva. Não seria apresentável para sua
pesquisa, uma tabela ou um gráfico com tantos valores como
na tabela 31.

42
Para refletir: No caso de uma tabela com 20 dados de uma variável, com esforço, conseguimos enxergar alguma
tendência , mas e a construção de gráficos para a apresentação desses 20 dados?

Agora imagina se fosse, por exemplo, 150 valores diferentes ou uma quantidade considerável
de valores diferentes. Seria fácil a apresentação desses dados através de tabelas e gráficos?

Assim, podemos notar que a tabela 32 sintetiza os 20 valores em 5 classes e isso nos permite uma tabela mais
apresentável e além disso, conseguimos fazer gráficos com menos acúmulo de informações.

Para construir uma tabela de frequência para os dados quantitativos contínuos agrupados em classes, precisamos
entender alguns elementos:

Classes: são os intervalos de variação da variável. Amplitude total da distribuição: É a diferença entre o
É simbolizada por i e o número total de classes, limite superior da última classe e o limite inferior da
simbolizada por k. primeira classe.
Na tabela 32, por exemplo, o 𝑘 = 5 e o intervalo 𝐴𝑇 = 𝐿(𝑚𝑎𝑥) − 𝑙(𝑚𝑖𝑛)
[176,4 , 185,4) é a 𝑐𝑙𝑎𝑠𝑠𝑒 4, ou seja, 𝑖 = 4.
No nosso exemplo,
Limites de classe: são os extremos de cada classe. 𝐴𝑇 = 𝐿(𝑚𝑎𝑥) − 𝑙(𝑚𝑖𝑛) = 194,4 − 149,4 = 50.
O menor número é o limite inferior de classe (𝑙𝑖 ) e o
maior número, limite superior de classe (𝐿𝑖 ). Amplitude total da amostra (AA): É a diferença entre
A 𝑐𝑙𝑎𝑠𝑠𝑒 4 = [176.4 , 185.4) tem 𝑙4 = 176.4 e o valor máximo e o valor mínimo da amostra , onde:
𝐿4 = 185.4. 𝐴𝐴 = 𝑋(𝑚𝑎𝑥) − 𝑋(𝑚𝑖𝑛)
No nosso exemplo,
Amplitude do intervalo de classe: É obtida através da
diferença entre o limite superior e inferior da classe e é 𝐴𝐴 = 𝑋(𝑚𝑎𝑥) − 𝑋(𝑚𝑖𝑛) = 192,2 − 149,4 = 42,8.
simbolizada por:
𝑙 +𝐿
ℎ𝑖 = 𝐿𝑖 − 𝑙𝑖 Ponto médio da classe: É o ponto 𝑥𝑖 = 𝑖 2 𝑖 que
A amplitude de cada classe é igual, ou seja, todo divide o intervalo da classe em duas partes iguais
intervalo tem a mesma amplitude. Na tabela 32 a .No caso da 𝑐𝑙𝑎𝑠𝑠𝑒 4 = [176.4,185.4), temos
amplitude ℎ𝑖 = 9, pois se fizer a diferença 𝐿𝑖 − 𝑙𝑖 de
qualquer uma das classes 𝑖, o resultado é 9. (185.4 − 𝑙4 + 𝐿4 1764.4 + 185.4 361.8
𝑥4 = = = = 180,9
176.4 = 9) 2 2 2

Agora podemos entender os passos para a construção das classes:

43
PASSO 1 - Organize os dados brutos em um ROL.
Vamos usar de exemplo a tabela 30 pois os dados da variável altura já estão
dispostos de maneira crescente.

PASSO 2 – Calcule a amplitude amostral AA.


Como os dados estão organizados em um ROL, fica fácil ver a maior e a menor altura: a menor é 149.9 e a maior é 192.2 e,
portanto, 𝐴𝐴 = 42.8, calculamos anteriormente.

PASSO 3 - Calcule o número de classes através da Regra de Sturges.

A Regra de Sturges nos dá o número de classes em função do tamanho da amostra


𝑘 ≈ 1 + 3,3. 𝑙𝑜𝑔(𝑛)
onde: k é o número de classe; n é o tamanho da amostra.

Como são 20 alunos entrevistados, n = 20.

Então 𝒌 = 𝟏 + 𝟑, 𝟑. 𝒍𝒐𝒈(𝟐𝟎) = 𝟏 + 𝟑, 𝟑 . (𝟏, 𝟑) ≈ 𝟓, 𝟐𝟗.

Como o número de classes tem que ser um número inteiro, então vamos arredondar para o inteiro mais próximo de 5,29 que é o
5.
Logo, k = 5.

PASSO 4 - Decidido o número de classes, calcule a amplitude do intervalo de classe dividindo a amplitude total da amostra
pelo número de classes 𝒉 ≈ 𝑨𝑨 / 𝒌.
No cálculo da amplitude do intervalo de classe, quando o resultado não é exato, devemos arredondá-lo para mais.
Temos ℎ = 42.8 /5 = 8,56 ≈ 9, logo consideramos ℎ = 9.

PASSO 5 - Monte as classes da seguinte maneira:

𝐶𝑙𝑎𝑠𝑠𝑒 1 = [𝑚𝑒𝑛𝑜𝑟 𝑣𝑎𝑙𝑜𝑟 𝑑𝑜 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜 𝑑𝑒 𝑑𝑎𝑑𝑜𝑠, 𝑚𝑒𝑛𝑜𝑟 𝑣𝑎𝑙𝑜𝑟 𝑑𝑜 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜 𝑑𝑒 𝑑𝑎𝑑𝑜𝑠 + ℎ) == [149.4 , 149.4 + 9)
== [149.4 , 158.4)
𝐶𝑙𝑎𝑠𝑠𝑒 2 = [ 𝐿1 , 𝐿1 + ℎ) = [158.4 , 158.4 + 9) = [158.4 , 167.4)

𝐶𝑙𝑎𝑠𝑠𝑒 3 = [𝐿2 , 𝐿2 + ℎ) = [167.4 , 176.4)

𝐶𝑙𝑎𝑠𝑠𝑒 𝑘 = [𝐿𝑘−1 , 𝐿𝑘−1 + ℎ), 𝑐𝑜𝑚𝑜 𝑘 = 5, 𝑡𝑒𝑚𝑜𝑠 𝐶𝑙𝑎𝑠𝑠𝑒 5 = [𝐿4 , 𝐿4 + ℎ) = [185.4 , 194.4).

PASSO 6 – Encontre as frequências das classes e faça a tabela de distribuição de frequência.

Veja como fica a tabela 32 com a notação usual dos intervalos na estatística:

44
REPRESENTAÇÕES GRÁFICAS PARA VARIÁVEIS QUANTITATIVAS CONTÍNUAS
GRÁFICOS PARA DADOS AGRUPADOS EM CLASSES: Uma vez que agrupamos os dados em classes,
podemos utilizar alguns gráficos para apresentar, de uma forma mais ilustrativa e intuitiva, o resultado da coleta de
dados, assim como fizemos com as variáveis qualitativas.
Vamos aos gráficos:
HISTOGRAMA: O histograma é um gráfico formado por um conjunto de colunas retangulares sendo que, no eixo
das abscissas, marcamos as classes, cujas amplitudes correspondem às bases dos retângulos e no eixo das ordenadas,
marcamos ou as frequências absolutas ou as frequências relativas, que correspondem às alturas dos retângulos.

Veja o histograma feito a partir da tabela 32:


Gráfico 13 – Histograma da quantidade de alunos em função da altura – 2018

Aparentemente o histograma não é diferente do gráfico de colunas que conhecemos, mas a diferença está no
fato de que o histograma é um gráfico de colunas que representa os dados quantitativos contínuos agrupados em classes.
O histograma nos permite estudar se a distribuição de frequência é simétrica ou assimétrica de maneira visual.
Vamos entender do que se trata essa simetria e como identificá-la nos gráficos a seguir:

45
Uma distribuição de frequência dos dados é Observações: Observe que a classe 1 tem a mesma
dita simétrica quando a metade esquerda do seu histograma frequência que a classe 9 (frequência = 2), a classe 2 tem
é aproximadamente uma imagem espelhada da metade frequência 5 e a classe 8 tem frequência = 4, a classe 3 tem
direita. frequência 10 e a classe 7 tem frequência 11, a classe 4 tem
frequência 18 e a classe 6 tem frequência 17.
Veja um exemplo de distribuição de frequência
simétrica no gráfico abaixo: Ou seja, as frequências das classes opostas ou são
Gráfico 14 – Histograma da quantidade de pessoas em função do
iguais ou são próximas. Assim, de forma visual, a
peso (94 pessoas de um bairro A da cidade A) – 2006 distribuição no histograma acima, parece ser simétrica.
Veja de outra forma, como se dá a distribuição de
frequência simétrica:

Se olharmos para a coluna central do histograma


como um espelho, percebemos que o lado esquerdo
(metade esquerda) é bem próximo da imagem espelhada do
lado direito (metade direita). Outra maneira de se verificar
a simetria é olhando para a frequência das classes opostas:

A distribuição de frequência dos dados é dita assimétrica quando não é simétrica, ou seja, há uma maior
distribuição de dados de um lado do que do outro.

Gráfico 15 – Histograma da quantidade de pessoas em função do No caso da distribuição de frequência no


peso. (94 pessoas de um bairro B da cidade B) - 2007
histograma acima, existe uma maior concentração de
elementos a esquerda da coluna central do que na direita.
Assim, a apresentação da distribuição no histograma
acima é assimétrica. Mais que isso, a assimetria é positiva
como na figura abaixo:

Na distribuição de frequência a seguir, existe uma maior frequência de elementos a direita da coluna central do
que na esquerda. Assim, dizemos que se trata de uma distribuição de frequência assimétrica. Mais que isso, é assimétrica
negativa como na figura abaixo:

46
Gráfico 16 – Histograma da quantidade de pessoas em função do
peso. (94 pessoas de um bairro C da cidade C) - 2008

Acontece que nem sempre fica claro, de maneira visual, a simetria ou assimetria da distribuição de frequência.
Desse modo, vamos contar com algumas medidas estatísticas para nos auxiliar a verificar a simetria ou assimetria da
distribuição de frequência. Essas medidas são chamadas de medidas de tendência central (Média, Moda e Mediana) e
vamos estudá-las mais pra frente nessa disciplina de Matemática e Estatística.

POLÍGONO DE FREQUÊNCIA: É a representação gráfica de uma distribuição de frequência por meio de um


polígono. É obtido através da ligação dos pontos médios (xi) dos intervalos de classe em um histograma de
frequências.

Veja a tabela de distribuição de frequência abaixo Na tabela, adicionamos as médias 𝑥𝑖 de cada


e o polígono de frequência dos 20 alunos da Universidade 𝑙𝑖 +𝐿𝑖
classe i, onde 𝑥𝑖 = 2
:
A, construída a partir do histograma:
158.4 + 149.4 307.8
𝑥1 = = = 153.9
2 2
167.4 + 158.4 325.8
𝑥2 = = = 162.9
2 2
176.4 + 167.4 343.8
𝑥3 = = = 171.9
2 2
185.4 + 176.4 361.8
𝑥4 = = = 180.9
2 2
194.4 + 185.4 379.8
𝑥5 = = = 189.9
2 2

Gráfico 17 – Histograma e Polígono de frequência da altura dos 20 Gráfico 18 – Polígono de frequência da altura dos 20 alunos da
alunos da Universidade A - 2018 Universidade A - 2018

47
O polígono de frequência também pode nos ajudar Gráfico 20 – Polígono de frequência e histograma do Peso de 94
pessoas de uma Bairro B de uma cidade B - 2007
de forma visual a enxergar uma possível simetria ou
assimetria da distribuição de frequência. No caso do
histograma acima, percebemos que há uma assimetria, pois
há uma discrepância entre as frequências das classes
opostas 2 e 4, e a classe 1 tem maior frequência que a
classes 5. Assim, percebemos uma maior frequência de
dados do lado esquerdo da coluna central, ou seja, a
assimetria parece ser positiva.
A seguir, veremos mais exemplos de gráficos com
histogramas e polígonos de frequência, utilizando a
variável peso. Observe que nos gráficos abaixo, a simetria Gráfico 21 – Polígono de frequência e histograma do Peso de 94
ou assimetria é bem mais clara quando utilizamos o pessoas de uma Bairro C de uma cidade C - 2008
polígono de frequência. Podemos notar nele que, assim
como fizemos com o histograma (olhando as classes
opostas), as distribuições de frequência dos Gráficos 19, 20
e 21 parecem ser simétrica, assimétrica positiva e
assimétrica negativa, respectivamente. É como se o
polígono de frequência desenhasse o formato da
distribuição, como nas figuras 1, 2 e 3.
Veja os polígonos de frequência da variável peso
de 94 pessoas das cidades A, B e C:
Gráfico 19 – Histograma e polígono de frequência da quantidade de pessoas em
função do peso. (94 pessoas de um bairro A da cidade A) - 2006

Vamos voltar um pouco e pensar agora nos dados das alturas que encontramos anteriormente nesse texto. Como
já temos as classes e as frequências relativas da variável altura, podemos utilizar o gráfico de setores para apresentação
dos dados agrupados em classes.
Gráfico 22 – Gráfico de setores da altura dos 20 alunos da Universidade A – 2018

Assim como interpretamos o gráfico de setores nas variáveis qualitativas, vamos interpretar também nas
variáveis quantitativas.

48
• 15% dos alunos têm estatura maior ou igual a 149.4cm e menor que 158.4cm.
• 35% dos alunos têm estatura maior ou igual a 158.4cm e menor que 167.4cm.
• 30% dos alunos têm estatura maior ou igual a 167.4cm e menor que 176.4cm.
• 10% dos alunos têm estatura maior ou igual a 176.4cm e menor que 185.4cm.
• 10% dos alunos têm estatura maior ou igual a 185.4cm e menor que 194.4cm.
A distribuição de frequência da tabela 32, nos diz quem são os limites inferiores (𝑙𝑖 ) e superiores (𝐿𝑖 ) de cada
classe i, mas não tem a frequência acumulada, somente a absoluta e relativa.

Então, antes de fazer uma nova ou mais completa tabela de frequência, vamos entender a frequência acumulada:
FREQUÊNCIA ACUMULADA (𝑭𝒊 ): É o total das frequências de todos os valores inferiores ao limite superior do intervalo de
cada uma das classes, ou seja, a frequência acumulada da classe k é:

𝑭𝒌 = 𝒇𝟏 + 𝒇𝟐 + ⋯ + 𝒇𝒌

Exemplo:

A 𝑐𝑙𝑎𝑠𝑠𝑒 1 = 149.4 | − − − − − 158.4 tem 𝐹1 = 𝑓1 = 3.

A 𝑐𝑙𝑎𝑠𝑠𝑒 2 = 158.4 | − − − − − 167.4 tem 𝐹2 = 𝑓1 + 𝑓2 = 3 + 7 = 10.

A 𝑐𝑙𝑎𝑠𝑠𝑒 3 = 167.4 | − − − − − 176.4 tem 𝐹3 = 𝑓1 + 𝑓2 + 𝑓3 = 3 + 7 + 6 = 16.

A 𝑐𝑙𝑎𝑠𝑠𝑒 4 = 176.4 | − − − − − 185.4 tem 𝐹4 = 𝑓1 + 𝑓2 + 𝑓3 + 𝑓4 = 3 + 7 + 6 + 2 = 18.

A 𝑐𝑙𝑎𝑠𝑠𝑒 5 = 185.4 | − − − − − 194.4 tem 𝐹5 = 𝑓1 + 𝑓2 + 𝑓3 + 𝑓4 + 𝑓5 = 3 + 7 + 6 + 2 + 2 = 20.

Observe que: 𝐹1 = 𝑓1 , 𝐹2 = 𝐹1 + 𝑓2 , 𝐹3 = 𝐹2 + 𝑓3 , 𝐹4 = 𝐹3 + 𝑓4 e 𝐹5 = 𝐹4 + 𝑓5, isto é, como 𝐹1 = 𝑓1 , podemos


calcular 𝐹𝑘 = 𝐹𝑘−1 + 𝑓𝑘 a partir das classes 𝑘 = 2.

FREQUÊNCIA ACUMULADA RELATIVA (𝑭𝒓𝒊 ): É a frequência acumulada da classe dividida pela frequência total da
𝑭𝒊
distribuição, isto é, 𝑭𝒓𝒊 = :
𝒇𝟏 +𝒇𝟐 +⋯+𝒇𝒌

Exemplo:
3 16 20
𝐹𝑟1 = = 0,15 = 15% 𝐹𝑟3 = = 0,80 = 80% 𝐹𝑟5 = = 1,00 = 100%
20 20 20
10 18
𝐹𝑟2 = = 0,50 = 50% 𝐹𝑟4 = = 0,90 = 90%
20 20

49
Agora sim podemos montar uma tabela de frequência mais completa:

Vamos entender nos gráficos, o significado da frequência acumulada e acumulada relativa.


Gráfico 23 – Ogiva da quantidade de alunos em função da altura dos 20 alunos da Universidade A - 2018.

Gráfico 24 – Ogiva da quantidade de alunos em função da altura dos 20 alunos da Universidade A - 2018.

• alunos ou 15% dos alunos têm altura maior ou igual a 149.4cm e menor que 158.4 cm.
• 10 alunos ou 50% dos alunos têm altura maior ou igual a 149.4cm e menor que 167.4cm.
• 16 alunos ou 80% dos alunos têm altura maior ou igual a 149.4cm e menor que 176.4cm.
• 18 alunos ou 90% dos alunos têm altura maior ou igual a 149.4cm e menor que 185.4cm.
• 20 alunos ou 100% dos alunos têm altura maior ou igual a 149.4cm e menor que 194.4cm.

50
DISTRIBUIÇÃO DE FREQUÊNCIA DOS DADOS
ISOLADOS DA VARIÁVEL IDADE.

Na tabela 30 tivemos que agrupar em classes os 19


diferentes dados que foram coletados da variável altura, pois
19 dados deixaria a tabela e os gráficos muito carregados.
Colocamos uma outra situação em que fossem
coletados 150 dados diferentes (ou uma quantidade
considerável de dados), para pensarmos sobre a
apresentação com a tabela de frequência e os gráficos.
Assim, conseguimos entender a utilidade e
importância das classes na apresentação de nossos dados.

Vejamos agora se a variável idade precisará ser


categorizada em classes.
Para que possamos perceber de forma mais fácil,
quantos dados diferentes a variável idade teve de resposta e
quantas vezes cada um apareceu, vamos fazer o ROL da
idade na tabela 30 ao lado.
Uma vez que foi feito o ROL da variável idade, podemos perceber que a variável idade assumiu somente 5
valores: 18, 19, 20, 21 e 22 anos. Desse modo, torna-se desnecessário dividir os elementos em classes (intervalos), pois
a tabela de distribuição de frequência dos 5 elementos já consegue sintetizar os dados obtidos da variável idade,
diferentemente da variável altura, que tivemos 19 diferentes dados.

51
GRÁFICOS MAIS USADOS PARA DADOS QUANTITATIVOS SEM AGRUPAMENTO EM CLASSES:
Gráfico 25 – Gráfico da frequência relativa acumulada em função Gráfico 26 – Gráfico de setores da idade dos 20 alunos da
da idade dos 20 alunos da Universidade A - 2018 Universidade A - 2018

DISTRIBUIÇÃO DE FREQUÊNCIA PARA DADOS QUANTITATIVOS DISCRETOS


REPRESENTAÇÕES GRÁFICAS PARA VARIÁVEIS QUANTITATIVAS DISCRETAS:
Agora, vamos pensar em
uma outra situação: Imagine que
como resultado de uma pesquisa com
50 casais, perguntando a quantidade
de filhos (variável discreta) desses 50
casais, você obtenha a seguinte tabela
de distribuição de frequência.
Perceba que você obteve 50 respostas a partir dos
casais entrevistados, uma resposta de cada casal. Os resultados
foram: 5 casais com nenhum filho, 8 casais com apenas 1 filho,
12 casais com 2 filhos, 15 casais com 3 filhos, 7 casais com 4
filhos e 3 casais que têm 5 filhos.
Apesar de serem 50 respostas, não são 50 respostas
diferentes e sim 6 respostas diferentes.
Dessa forma, não será necessário o agrupamento em
classes e a tabela de distribuição de frequência do número de filhos será a tabela 35.
REPRESENTAÇÕES GRÁFICAS PARA VARIÁVEIS QUANTITATIVAS DISCRETAS:
Gráfico 27 – Gráfico de colunas da quantidade de casais em função Gráfico 28 – Gráfico de setores da quantidade de casais em função
do número de filhos. do número de filhos.

52
Gráfico 29 – Gráfico de colunas da frequência acumulada de casais em função do número de filhos.

Por outro lado, vamos pensar no caso de precisar de uma divisão de classes para dados quantitativos discretos.
Exemplo com dados hipotéticos: O quadro abaixo possui dados relativos à quantidade de medalhas olímpicas de 50
atletas brasileiros:

O quadro já está organizado em um ROL para facilitar o agrupamento de dados nas classes.
Para refletir: Mas como são as classes para dados quantitativos discretos?
É natural achar que são intervalos, porém os dados quantitativos discretos não podem assumir qualquer valor
num intervalo.
Exemplo: No intervalo 2| − − − 4, não podemos dizer que uma pessoa
tem 2,5 filhos, 2,35 medalhas, 2,47 brinquedos etc. Assim, os intervalos são as
classes das variáveis quantitativas contínuas.

Então, ao invés de usar intervalos como classes para variáveis


quantitativas discretas, utilizamos conjuntos onde os elementos são resultados de
contagens: {2,3,4} e representamos assim “2 a 4”

Dessa forma, a variável quantitativa discreta pode assumir qualquer valor no conjunto (2 medalhas, 2 filhos, 3 filhos etc),
diferentemente dos intervalos.

Entendida a distribuição em conjuntos de números naturais da


variável quantitativa discreta, voltamos ao exemplo das medalhas. Veja a
tabela (tabela 36) de distribuição de frequência da variável “quantidade de
medalhas”. Temos o gráfico:
Gráfico 30 – Gráfico de colunas da frequência de atletas em função da quantidade
de medalhas.

53
O gráfico de setores fica:
Gráfico 31 – Gráfico de setores da frequência de atletas em função da quantidade de medalhas.

Outras representações gráficas:

Cartograma: O cartograma é a representação sobre uma carta geográfica (mapa). Este gráfico é empregado
quando o objetivo é o de figurar os dados estatísticos diretamente relacionados às áreas geográficas ou
políticas.

Gráfico 32 – Cartograma do clima de cada uma das 6 regiões do país Gráfico 33 – Cartograma da Participação por região no total da População
(milhões) e do PIB Brasileiro (%) – 2010

Gráfico 34 – Cartograma da importação e exportação de derivados do petróleo, segundo regiões geográficas (mil barris) – 2017

54
Outros gráficos também podem ser utilizados para a comparação de dados. Veja a série e o gráfico abaixo:

Gráfico 35 – Gráfico de colunas do rendimento dos funcionários de uma empresa A - 2003

A legenda, na parte inferior do gráfico, nos diz que as colunas roxas no gráfico representam o rendimento mensal
de Marcos, as colunas lilás representam o rendimento mensal da Ana Paula e a colunas rosas representam o rendimento
mensal do Paulo.
Desse modo, podemos concluir que em janeiro e abril, o rendimento da Ana Paula
foi superior ao dos seus colegas, pois foi a que mais
vendeu nesses meses.
Em fevereiro, março e maio o rendimento de
Marcos foi superior ao de seus colegas, pois foi o que
mais vendeu nesses meses.
E em junho o rendimento de Paulo foi superior aos de seus colegas, pois
vendeu mais.

GRÁFICO DE LINHAS: Neste gráfico é usada uma linha para representar a série estatística. Seu principal objetivo
é evidenciar a tendência do fenômeno ou a forma como ele está crescendo ou decrescendo através de um período de
tempo. Seu traçado deve ser realizado considerando o eixo “x”, horizontal, que representa a escala de tempo e o eixo
“y”, vertical, que representa a frequência observada dos valores.

55
Gráfico 36 – Gráfico de linhas do rendimento do Marcos no 1°semestre de 2003
(Vendas x meses).

A tabela 37 nos diz que, em janeiro, Marcos vendeu R$ 1000 reais para a empresa B e
em fevereiro R$ 1196,35 reais, ou seja, percebemos que houve um crescimento na venda de
Marcos em fevereiro com relação a janeiro.
O gráfico de linhas expressa esse crescimento através de um segmento partindo do par
ordenado (janeiro, 1000) em direção ao par ordenado (fevereiro, 1196,35) e faz o mesmo de mês em mês.
Assim, o gráfico de linhas representa uma tendência de um mês para o outro através desses segmentos. Desse
modo, percebemos que de fevereiro para março houve um crescimento na venda de Marcos, de março para abril
notamos uma queda expressiva na venda de Marcos, de abril para maio Marcos teve um crescimento expressivo na
venda e de maio para junho uma queda.

• Mês de maior venda de Marcos: março.


• Mês de menor venda de Marcos: abril.
O gráfico também nos permite dizer os meses cujas vendas foram a maior e a menor Veja como ficou o gráfico
de linha do rendimento de Ana Paula e Paulo:

• Mês de maior venda de Paulo: junho. • Mês de maior venda da Ana Paula: abril.
• Mês de menor venda de Paulo: janeiro. • Mês de menor venda da Ana Paula: fevereiro.
Gráfico 37 – Gráfico de linhas do rendimento da Ana Paula no Gráfico 38 – Gráfico de linhas do rendimento do Paulo no
1°semestre de 2003 (Vendas x meses). 1°semestre de 2003 (Vendas x meses)

Em termos de acréscimo e decréscimo nas vendas,


Ana Paula teve um decréscimo expressivo em suas
Paulo é o funcionário com maior inconstância, pois de
vendas de janeiro para fevereiro, teve um crescimento nas
janeiro para junho, as linhas de tendência do gráfico
vendas de fevereiro para março e de março para abril, e,
alternam em crescimento e decrescimento das vendas.
com isso, Ana Paula teve um crescimento expressivo de
fevereiro para abril. De abril para maio, e de maio para
junho, Ana Paula teve um decréscimo na venda,
caracterizando um decréscimo expressivo de abril para
junho.
56
Agora veja como fica o gráfico, com o rendimento dos três funcionários:
Gráfico 39 – Gráfico de linhas do rendimento dos funcionários da empresa B no 1°semestre de 2003 (Vendas x meses).

Assim, podemos comparar mês a mês as vendas de cada funcionário, ou seja, da mesma maneira que interpretamos
o gráfico de colunas 35 podemos concluir que em janeiro e abril, o rendimento da Ana Paula foi superior ao dos seus colegas,
pois foi a que mais vendeu nesses meses.
Gráfico 35 – Gráfico de colunas do rendimento dos funcionários de uma empresa A - 2003

Em fevereiro, março e maio o rendimento de Marcos foi superior ao de seus colegas, pois foi o que mais vendeu
nesses meses. E em junho o rendimento de Paulo foi superior aos de seus colegas, pois vendeu mais.

GRÁFICO POLAR OU RADAR: Neste tipo de gráfico, a série de dados é representada por meio de um polígono.
Ideal para representar séries temporais, como a variação da precipitação pluviométrica ao longo do ano.

Veja o exemplo a seguir:

57
Gráfico 40 – Gráfico polar do rendimento do Marcos no 1°semestre de 2003 (Vendas x meses).

Observações: Observe que o gráfico possui 7 hexágonos regulares (polígono de 6 lados, pois são 6 meses) e 1 hexágono
azul cujo os vértices estão direcionados aos meses e representando a venda do Marcos naquele mês.
O valor 0 da variável venda está centralizado dentro do menor hexágono regular, os R$ 200,00 reais é representado
pelo menor ou 1° hexágono, os R$ 400,00 reais é representado pelo 2° hexágono, os R$ 600,00 reais é representado pelo
3°hexágono, os R$ 800,00 reais é representado pelo 4°hexágono, os R$ 1000,00 reais é representado pelo 5°hexágono, os R$
1200,00 reais é representado pelo 6°hexágono e os R$ 1400,00 reais é representado pelo 7°hexágono. Os valores da variável
mês estão dispostos nos vértices do 7° hexágono.
Assim, em janeiro o vértice do hexágono azul está exatamente sobre 5°
hexágono que representa a venda de R$ 1000,00 reais, logo Marcos vendeu R$ 1000,00
reais em janeiro.
Em fevereiro o vértice do hexágono azul está entre o 5° e o 6° hexágono, porém
bem próximo do 6°, marcando o valor de R$ 1196,35 reais, logo Marcos vendeu R$
1196,35 reais em fevereiro.
A mesma interpretação é válida para cada mês do semestre.
Lembrando que, o polígono tem que ser correspondente a quantidade de meses, no nosso caso são 6 meses no
semestre, portanto tem que ser o hexágono. Se os dados fossem coletados em função de todos os meses do ano, teríamos que
utilizar o dodecágono (polígono de 12 lados) para representar a série de dados.
Gráfico 41 – Gráfico polar do Gráfico 42 – Gráfico polar do Gráfico 43 – Gráfico polar do
rendimento da Ana Paula no 1°semestre de 2003 rendimento do Paulo no 1°semestre de 2003 rendimento dos funcionários da empresa B no 1°
(Vendas x meses). (Vendas x meses). semestre de 2003 (Vendas x meses).

Note que o gráfico polar não ficou muito carregado de informações, e nos permite a comparação dos
rendimentos dos funcionários e a apresentação sintetizada da série (tabela 24).

58
Exercícios
Questão 1 – (UFRJ - ADAPTADA) Um professor de física (d) O número de usuários de banda larga móvel era 50% do
aplicou uma prova, valendo 100 pontos, para os seus 22 alunos e número dos usuários da banda larga fixa em 2009.
obteve como resultado a distribuição das notas, vistas no quadro
seguinte: (e) O número de usuários da banda larga era menor que 23
milhões em março de 2010.

Questão 3 – (ENEM) O termo agronegócio não se refere apenas


à agricultura e à pecuária, pois as atividades ligadas a essa
produção incluem fornecedores de equipamentos, serviços para a
zona rural, industrialização e comercialização dos produtos. O
gráfico seguinte mostra a participação percentual do agronegócio
no PIB brasileiro:

Determine, nos itens abaixo, a nota que mais apareceu (moda)


no quadro acima e sua frequência relativa (aproximadamente).

(a) A nota que mais apareceu no quadro foi 50 e a frequência


relativa é 22,7%.

(b) A nota que mais apareceu no quadro foi 50 e a frequência


relativa é 24,8%. Centro de Estudos Avançados em Economia Aplicada (CEPEA).
Almanaque abril 2010. São Paulo: abril, ano 36 (adaptado). Esse
(c) A nota que mais apareceu no quadro foi 40 e a frequência
gráfico foi usado em uma palestra na qual o orador ressaltou uma
relativa é 30%.
queda da participação do agronegócio no PIB brasileiro e a
(d) A nota que mais apareceu no quadro foi 60 e a frequência posterior recuperação dessa participação, em termos percentuais.
relativa é 13,6%. Segundo o gráfico, o período de queda ocorreu entre os anos de:

(e) A nota que mais apareceu no quadro foi 50 e a frequência (a) 1998 e 2001. (c) 2003 e 2006 (e) 2003 e 2008.
relativa é 28,7%.
(b) 2001 e 2003. (d) 2003 e 2007.

Questão 2 – (UFRS) Muitos brasileiros acessam a internet de


Questão 4 – Observe o histograma das notas obtidas de 30 alunos
banda larga via celular. Abaixo, está indicado, em milhões de
do 2° ano do ensino médio em uma prova de Matemática.
pessoas, o número de brasileiros com acesso à internet de banda
larga, fixa ou móvel, desde o ínicio do ano de 2007 até março de
2010, segundo dados publicados na imprensa.

De acordo com o histograma é correto afirmar que:

(a) 76,7% dos alunos obtiveram nota menor ou igual a 6,0

(b) 80% dos alunos obtiveram nota maior ou igual a 3,0.


(a) O número de usuários da internet de banda larga fixa (c) 40% dos alunos obtiveram nota maior que 6,0 e menor que
decresceu nesses anos. 9,0.
(b) O número de usuários de cada uma das duas bandas largas (d) 40% dos alunos obtiveram nota entre 6,0 e menor que 7,5.
cresceu igualmente nesses anos.
(e) 25% dos alunos obtiveram nota entre 4,5 e 6,0.
(c) Menos de 4% dos usuários da banda larga usavam a banda
larga móvel em 2007.

59
Questão 5 – Os 4 funcionários (Rosa, Pedro, Carlos e Cláudia) Diante do gráfico, qual do funcionário apresentou maior
de uma empresa foram avaliados pelo gerente segundo 5 dinamismo e menor objetividade? Além disso, qual é o
competências (Pontualidade, Dinamismo, Sociabilidade, funcionário menos pontual e com menor dinamismo?
Objetividade e Atendimento). Veja o gráfico abaixo:
(a) Carlos apresentou maior dinamismo e menor objetividade e
Rosa apresentou menos pontualidade e menor dinamismo.

(b) Cláudia apresentou maior dinamismo e menor objetividade e


Carlos apresentou menos pontualidade e menor dinamismo.

(c) Carlos apresentou maior dinamismo e menor objetividade e


Cláudia apresentou menos pontualidade e menor dinamismo.

(d) Cláudia apresentou maior dinamismo e menor objetividade e


Pedro apresentou menos pontualidade e menor dinamismo.

(e) Pedro apresentou maior dinamismo e menor objetividade e


Rosa apresentou menos pontualidade e menor dinamismo.

Referências
Apostila feita com base no material didático do curso “Fundamentos de Estatística” do AVAMEC (Ambiente
Virtual de Aprendizagem do Ministério da Educação), oferecido em parceria com o Laboratório de Tecnologia
da Informação e Mídias Educacionais da Universidade Federal de Goiás. Disponível em
https://avamec.mec.gov.br/#/instituicao/capes/curso/10521/informacoes. Acesso em 15/SET/2021.

60

Você também pode gostar