Você está na página 1de 52

Apresentação da unidade 1 - O

planejamento e a coleta de dados,


sua descrição e exploração
Haller Schunemann

Olá, caro estudante!

Nesta unidade, você vai compreender o papel da Estatística no trabalho escolar.

Você já pensou o que significa Estatística ou por que ela está tão presente em nossa vida? O surgimento da
Estatística está diretamente relacionado à expansão do Estado Moderno e sua ambição de controle da população,
que ficou cada vez maior. Se a ideia de censo não era uma novidade – se considerarmos que o temos é
mencionado na Bíblia, em pelo menos duas partes - a ampliação dos dados sem dúvida foi uma característica
desse momento. Assim, nesta unidade vamos pensar justamente sobre o processo de organização dos dados.

Mas, o que são dados? O dado pode ser considerado uma informação bruta que está à disposição, mas que
precisa ser coletada. Aqui temos uma interessante analogia com a atividade agrícola. Vamos pensar em uma
horta na qual você plantou, por exemplo, tomates, pepinos, melões e morangos. Cada uma das plantas vai gerar
uma quantidade diferente de frutos. E para ter conhecimento dessa informação, é necessário contar a
quantidade produzida. E como é possível contar os frutos da horta? Essa pergunta parece bem simples, mas a
tarefa pode não ser tão simples.

Você pode se perguntar: o que torna o processo de contar complexo? Contar é uma atividade muito simples
quando envolve uma pequena quantidade. Mas conforme a quantidade aumenta, a dificuldade também cresce.
Por esse motivo, não basta iniciar a contagem. É necessário, antes, saber como organizar o processo de contagem
e, consequentemente, como usar bem essas informações.

Considerando novamente a situação da horta, o ideal seria contar cada fruto separadamente. Dessa forma é
possível saber quantos tomates, pepinos, melões e morangos foram produzidos. No entanto, ao olhar para a
horta, você se dá conta de cada pé de tomate produziu dezenas de frutos. Ou seja, é fácil de se perder na
contagem. Então, você tem a ideia de acomodar os tomates em uma caixa até completar 50 unidades. Mas no
decorrer desse processo, você percebe, ainda, que nem todos possuem o mesmo tamanho, que alguns ainda
estão verdes e que talvez seja melhor deixa-los no pé para colher posteriormente, e assim por diante.

Perceba que cada nova situação e informação deixa o processo de contagem mais complexo. Nesta unidade, você
vai entender o processo de contagem e a classificação necessária para um bom uso e aplicação na Estatística!

Agora, convidamos você a assistir ao vídeo de apresentação da unidade.

-1-
Agora, convidamos você a assistir ao vídeo de apresentação da unidade.

https://www.youtube.com/embed/l7lZtGH3vOs

-2-
Introdução à estatística
Rafael Botelho, Vagner Zanin e Haller Schunemann

Introdução
Caro estudante, você sabe o que é estatística? Podemos dizer que se trata de uma coleção de métodos e
processos quantitativos utilizados para estudar e medir os fenômenos coletivos (COSTA, 2015). A forma como se
organiza esta ciência é o foco do nosso estudo neste momento.

Quando estudamos estatística, é comum dividirmos seus conteúdos em dois grandes grupos. O primeiro deles é
conhecido por Estatística Descritiva ou Dedutiva, parte em que realizamos a coleta de informações acerca dos
dados do conjunto como, por exemplo, média, desvio-padrão entre outros, e também a construção de tabelas
para que possamos ter uma visão geral do comportamento dos dados.

Já na Estatística Indutiva ou Inferencial, realizamos as generalizações de dados da população a partir de uma


amostra. Ou seja, por meio de instrumentos estatísticos, podemos deduzir informações da população com a
análise de suas amostras.

É importante destacar que estes dois grupos não trabalham sozinhos ou de modo independente. Pelo contrário:
eles atuam em conjunto, pois são áreas complementares.

Para que possamos dominar os procedimentos necessários para a utilização da estatística descritiva e indutiva, é
extremamente importante que conheçamos quais são as principais fases do método estatístico.

Nesta unidade, você aprenderá quais são os passos necessários para fazer uma análise estatística e,
consequentemente, chegar a uma conclusão a respeito de um conjunto de dados.

Vamos começar?

Estatística descritiva
Apesar da estatística, da forma como conhecemos hoje, ser relativamente recente, relatos de tempos muitos
antigos citam a utilização de instrumentos primários da estatística que conhecemos como gráficos, tabelas, entre
outros. Mas, de uma maneira geral, a estatística moderna tem origem, basicamente, em dois setores da atividade
humana que, a princípio, não possuem uma relação direta: os jogos de azar e a ciência política (governo).

De uma maneira rápida, basicamente podemos dizer que no caso dos jogos de azar foram aplicados os estudos
de probabilidade e no caso da ciência política a estatística descritiva. Os governos, para controlar e compreender
dados sobre a população, utilizam-se de ferramentas estatísticas como tabelas e gráficos. Além disso, alguns
também obtêm valores a partir dos conjuntos de dados como, por exemplo, média, mediana e moda.

-1-
Figura 1 - Exemplos de gráficos utilizados atualmente
Fonte: robuart, Shutterstock, 2019.

Todas as informações da população que compõe uma localidade eram obtidas por meio de recenseamentos de
seus indivíduos. Até então, toda a estatística conhecida e aplicada era formada por estes instrumentos que hoje
damos o nome de Estatística Descritiva. Neste momento, as informações obtidas com a análise desses dados
serviam para que o governo tivesse um panorama sobre a real situação da população e de sua economia. A ideia
era, basicamente, entender a conjuntura atual da população, com o objetivo de tomar decisões sobre a política
pública, por exemplo. Assim, não havia intenção de realizar projeções que extrapolassem informações, ou que
fossem muito além do que o aquele conjunto de dados era capaz de produzir. É importante observar que, em
determinado momento, a quantidade de habitantes de um dado local atingia um número expressivo, o que
inviabilizava a consulta, pois isso seria muito dispendioso e levaria muito tempo. Assim, era comum realizar
estudos em grupos menores, de modo que o resultado obtido com a análise estatística fosse extremamente
próximo dos dados reais de toda população.

-2-
SAIBA MAIS
No Brasil, o IBGE é responsável pela realização do censo da população brasileira. Além de
informações sobre nascimentos, óbitos, casamentos, etc., também é possível saber informações
sobre as populações rurais e agropecuárias, por exemplo. Que tal visitar o site do IBGE e fazer
uma pesquisa? Disponível em: <http://www.ibge.gov.br>.

Um exemplo bem simples de como são organizados os dados de uma determinada população pode ser visto na
tabela a seguir, onde é possível visualizar com mais rapidez algumas informações, como o total de nascidos vivos
no Brasil, no ano de 2015: 3.056.783 indivíduos.

Quadro 1 - Registros de nascidos vivos, segundo o sexo, a idade da mãe na ocasião do parto e o ano de
nascimento (unidades)
Fonte: IBGE, 2017.

A estatística descritiva é aplicada largamente em amostras, uma vez que atingir todos os elementos de uma dada
população, por vezes, torna-se inviável (seja por escassez de recursos financeiros, não financeiros ou dificuldade
de acesso). Ainda assim, sua aplicação é fundamental para municiar o pesquisador com importantes dados que
serão, posteriormente, processados para determinar comportamento de certa população.

FIQUE ATENTO
Para realizar uma amostra que seja representativa de sua população, é necessário seguir
critérios no momento de produzir uma amostragem? Ou não importa como se obtêm os dados
de uma amostra? Será que ela sempre vai representar com qualidade sua população de
origem? Existe alguma influência com o resultado final da pesquisa estatística?

Uma questão que devemos considerar é a seguinte: é possível conseguir informações sobre a população,

-3-
Uma questão que devemos considerar é a seguinte: é possível conseguir informações sobre a população,
analisando os dados de uma de suas amostras? A resposta é sim e, para isto, foi desenvolvida a segunda grande
área da estatística, conhecida como indutiva, que você vai estudar melhor a seguir.

Estatística indutiva
As técnicas existentes na estatística indutiva são de extrema importância, uma vez que seus instrumentos
permitem realizações que a descritiva não alcança. Uma situação bastante evidente é o caso de um estudo sobre
a preferência de um determinado produto pela população de uma cidade. Nesse caso, é possível entender que é
inviável perguntar para todas as pessoas.

Dessa forma, resta somente trabalhar a partir de amostras. Várias são as considerações que devemos ter nesse
momento, e uma delas é o que queremos saber sobre a população. A resposta poderá interferir na técnica
estatística que será aplicada. Além disso, é necessário considerar a forma de obter os dados dessas amostras.

FIQUE ATENTO
A compreensão do conceito de população e amostra é fundamental na organização dos dados!
È importante entender que na relação população e amostra, a população é sempre maior do
que amostra, mas isso não deve ser entendido que a população é sempre grande. Definir a
população de um estudo é o primeiro passo para fazer uma coleta de dados correta e isso é
determinado em função do objetivo do estudo.

Por exemplo: em quais locais da cidade a pesquisa deve ser realizada? Essa definição é necessária porque os vão
interferir na qualidade dos dados e, consequentemente, no resultado da pesquisa.

-4-
Figura 2 - Exemplo de população e amostra
Fonte: lamnee, Shutterstock, 2019.

Ao trabalharmos com amostras, devemos ter em mente que, em qualquer resultado obtido, mesmo com a mais
perfeita técnica estatística, sempre haverá a presença da incerteza, já que trabalhamos somente com dados
parciais, incompletos ou indiretos das amostras. Então, no momento em que realizamos a inferência estatística
nas amostras, devemos ter um critério de julgamento para determinar a precisão do valor da amostra em relação
ao valor da população da qual foi extraído.

-5-
EXEMPLO
Para compreender melhor esta situação, vamos a um exemplo: você realizará um projeto de
pesquisa em que será perguntado a cada pessoa qual é a sua renda média mensal. Como você
precisará aplicá-la a todos os alunos de uma grande faculdade, logo, fica evidente que uma
amostragem será necessária. Considerando que esta foi feita de maneira correta e ela será
representativa em relação à população, como podemos ter certeza de que a média da renda
mensal da amostra reflete de maneira confiável na média da população? Bem, a certeza é
muito difícil de obter, mas é possível determinar um valor ou um intervalo deste que contenha
com bastante aproximação a medida procurada na população. O controle do intervalo ou da
chance de que o valor encontrado está próximo do valor da população é realizado por meio do
uso da probabilidade.

Segundo Freund (2006), a probabilidade teve origem no estudo dos jogos de azar e os relatos remontam a
meados do século XVII. Alguns dos grandes matemáticos que deram início à probabilidade foram Pierre de
Fermat e Blaise Pascal.

-6-
Figura 3 - Pierre de Fermat (1601 – 1665)
Fonte: Marzolino, Shutterstock, 2019.

-7-
Figura 4 - Blaise Pascal (1623 – 1662)
Fonte: Georgios Kollidas, Shutterstock, 2019.

Mas, foi somente durante o século XIX que a probabilidade deixou de ser aplicada somente para jogos e passou a
ser aplicada em situações do dia a dia.

Atualmente, a teoria da probabilidade é amplamente aplicada em diversas ciências das exatas, humanas e
biológicas. Na física, os conhecimentos estatísticos são amplamente utilizados. Um exemplo bastante importante
é a mecânica estatística, que acontece nos estudos da termodinâmica, mecânica clássica e na mecânica quântica.
Na biologia, um bom exemplo é a bioestatística, sua aplicação se dá no desenvolvimento de remédios, produtos

químicos e no estudo de doenças. Já nas ciências humanas, a aplicabilidade ocorre na psicologia, por exemplo,

-8-
químicos e no estudo de doenças. Já nas ciências humanas, a aplicabilidade ocorre na psicologia, por exemplo,
em que é necessário o estudo de um determinado comportamento de uma população. Em geral, é sempre
aplicada aos estudos de grandes amostras e seus resultados.

Atualmente, a estatística possui um grande avanço em diversos ramos, sua influência é notória e sua atuação é
fundamental quando são necessárias a análise e a compreensão de um conjunto extenso de dados.

Para saber mais, assista à videoaula conceitual sobre o conceito de estatística.

https://www.youtube.com/embed/4FhxOIaRstI

Fechamento
A Estatística não é uma ciência exata. Ela trabalha essencialmente com problemas práticos e possui subáreas que
estão relacionadas a forma de trabalhar os dados. Nessa etapa introdutória, esperamos que tenha ficado clara a
importância da Estatística nas mais diversas áreas. Assim, é importante que os estudos sejam direcionados, pelo
menos parcialmente, a problemas específicos de cada área, para que ela se torne na sua compreensão uma
ciência aplicada.

Ao finalizar essa parte, esperamos também que tenha ficado claro que a tabulação apenas dos resultados, por
mais importante que seja, apresenta apenas dados que precisam ser interpretados. Desta forma, você verá nos
próximos tópicos como organizar os dados para poder interpretá-los de forma correta.

Referências
BECKER, J. L. Estatística básica: transformando dados em informação. Porto Alegre: Bookman, 2015. Recurso
online. Disponível em: <https://integrada.minhabiblioteca.com.br/books/9788582603130>. Acesso em: 10/03
/2017.

COSTA, G. G. de O. Curso de estatística básica: teoria e prática. 2. ed. São Paulo: Atlas, 2015.

FREUND, J. E. Estatística aplicada: economia, administração e contabilidade. 11. ed. Porto Alegre: Bookman,
2006.

IBGE. CENSO 2010. Disponível em: <http://censo2010.ibge.gov.br/ sobre-censo.html>. Acesso em: 18/08/2017.

______. Registro Civil: registros de nascidos vivos, segundo o sexo, a idade da mãe na ocasião do parto e o ano de
nascimento (unidades). Disponível em: <https://sidra.ibge.gov.br/pesquisa/registro-civil/quadros/brasil
/nascidos-vivos>. Acesso em: 13/077/2017.

MOORE, D. S.; NOTZ, W. I.; FLINGER, M. A. A estatística básica e sua prática. 6. ed. Rio de Janeiro: LTC, 2014.
Recurso online. Disponível em: <https://integrada.minhabiblioteca.com.br/books/978-85-216-2630-5>. Acesso
em: 17/07/2017.

ROCHA, R. Minidicionário: enciclopédico escolar. 8. Ed. São Paulo: Scipione, 1996.

UNICAMP. Um pouco de história. Disponível em: <http://www.ime.unicamp.br/~nancy/Cursos/me104/prob1.

-9-
UNICAMP. Um pouco de história. Disponível em: <http://www.ime.unicamp.br/~nancy/Cursos/me104/prob1.
pdf>. Acesso em: 29/07/2017.

- 10 -
Organização da pesquisa de
dados
Rafael Botelho, Vagner Zanin, Haller Shunemann

Introdução
Na parte introdutória da nossa unidade, falamos sobre coletar dados. Aqui você poderá entender os cuidados
necessários para executar um bom levantamento de dados, a partir da compreensão do método estatístico, para
que fique claro que existe um conjunto de ações necessárias quando se faz um plano de coleta de dados.

Além disso, você também será apresentado a uma questão muito importante que é o conceito de população e
amostra. Entender a relação desses dois conceitos fundamental para que seja possível organizar qualquer
trabalho de pesquisa, inclusive aqueles que você desenvolverá no seu trabalho docente.

Vamos lá!

Método estatístico
Você sabe o que é método? Método é um conjunto de meios utilizados para se chegar a um determinado fim. Por
exemplo: imagine que você esteja interessado em passar em um concurso para auditor fiscal. O método que você
poderia utilizar para alcançar esse objetivo é adquirir um material de estudo de boa qualidade, organizar um
cronograma de estudos, resolver provas anteriores, frequentar um cursinho direcionado a esse concurso, etc.
Seguindo todos esses passos, e tendo o fator sorte ao seu lado, é provável que alcance o objetivo em questão.

Costa (2015, p. 45) define método como “um conjunto de etapas, ordenadamente dispostas, a serem seguidas na
investigação da verdade, no estudo da ciência ou para alcançar determinado resultado”.

Agora que foi definido o conceito de método, é importante entender que estatística é uma ciência que fornece um
conjunto de ferramentas para a coleta, análise e interpretação de dados, com a finalidade de responder a
questões inicialmente formuladas.

O método estatístico é um conjunto de passos que devem ser seguidos com a finalidade de chegar a conclusões a
respeito de um determinado conjunto de dados.

-1-
Fases do método estatístico
Para que você consiga tirar conclusões a respeito de uma amostra de dados, é necessário seguir alguns passos,
que são chamados de fases do método estatístico.

De acordo com Costa (2015), as fases do método estatístico são: definição do problema, planejamento, coleta dos
dados, apuração dos dados, apresentação dos dados, análise e interpretação dos dados. O esquema a seguir
ilustra a sequência de fases do método estatístico.

Figura 1 - Resumo das fases do método estatístico


Fonte: Elaborada pelos autores, baseados em COSTA, 2015.

Agora que você sabe quais são as fases do método estatístico, vamos definir os conceitos, de Costa (2015), que
foram citados acima, e o que deve ser feito em cada etapa.

Definição do problema
A definição do problema consiste em delimitar, exatamente, aquilo que temos interesse em estudar, verificando
se existem estudos na área em questão. De acordo com Costa (2015), definir o problema é saber aquilo que se
quer pesquisar. Podemos dar como exemplo a seguinte situação: uma determinada fábrica de celulares está com
uma queda na quantidade de produtos vendidos. Neste caso, a definição do problema é a queda nas vendas de
produtos.

Planejamento
A etapa de planejamento é responsável por demonstrar o caminho que será seguido para a realização de um
determinado estudo. Em outras palavras, pode-se dizer que são os procedimentos necessários para que um
pesquisador consiga fazer seu estudo.

Conforme Costa (2015), nessa etapa são definidos os objetivos da pesquisa e os métodos que serão utilizados.
O autor ainda relata alguns passos que devem ser seguidos para se cumprir a etapa de planejamento, que podem
ser observados na figura a seguir.

-2-
Figura 2 - Etapas necessárias para a fase de planejamento
Fonte: Elaborada pelos autores, baseados em COSTA, 2015.

Assim, todos esses passos devem ser seguidos, de maneira prudente, para que a etapa de planejamento seja feita
com sucesso.

Vamos conhecer um exemplo para compreender melhor? Uma fábrica de chocolate quer fazer um planejamento
de vendas para saber a quantidade de ovos de páscoa que precisa fazer para poder suprir a demanda durante o
período de páscoa. O método que poderia ser utilizado para auxiliar o gerente dessa empresa é uma previsão de
demandas, utilizando dados históricos da organização para se chegar a um valor previsto de vendas para aquele
ano.

FIQUE ATENTO
Imagine que você está interessado em fazer a definição do problema e do planejamento para o
baixo rendimento da seleção brasileira de futebol na Copa do Mundo de 2014. Como você
procederia, nesse caso, considerando que a meta é melhorar o rendimento da equipe? Depois
de feito todo o processo de planejamento, é necessário proceder à etapa de coleta de dados.

-3-
Na etapa de planejamento, deve ser elaborado um cronograma com todos os procedimentos que serão
necessários para poder realizar o estudo.

Coleta dos dados


Após descritos todos os métodos necessários para se fazer o estudo, é necessário que haja uma coleta dos dados,
com o objetivo de obter uma amostra. No tópico a seguir você aprenderá sobre os principais tipos de coleta de
dados.

Tipos de coleta de dados


Costa (2015) relata que a coleta de dados pode ser classificada em direta ou indireta. A coleta direta é aquela
que é obtida diretamente na fonte, como quando entrevistamos uma pessoa, por exemplo, e coletamos os dados
diretamente com ela. Becker (2015) afirma que a coleta de dados é o registro e a mensuração das variáveis de
pesquisa.

A coleta direta pode ser realizada das seguintes formas:


• contínua: feita de forma ininterrupta. Exemplo: registro de nascimentos.
• periódica: feita de períodos em períodos de tempo. Exemplo: censo, que é realizado 10 em 10 anos para
mensurar a população de um país;
• ocasional: feita sem periodicidade. Exemplo: pesquisa de mercado para tentar entender o motivo da
queda de vendas de uma empresa.

Já a coleta indireta utiliza-se de outra pesquisa para a obtenção dos dados. É o caso em que utilizamos dados de
outros estudos para fazer a pesquisa sobre um determinado assunto.

Definidos os principais tipos utilizados de coleta de dados, é importante que saibamos definir e diferenciar dois
conceitos extremamente importantes que tange à estatística, que são população e amostra.

População e amostra
De acordo com Moore, Notz e Flinger (2014), a população de um determinado estudo estatístico é o conjunto de
todos os indivíduos sobre os quais queremos obter algumas informações. E, para os autores, amostra é a parte da
população que utilizamos para coletar informações. Os autores afirmam que a amostra é utilizada para se tirar
conclusões a respeito da população.

É importante saber diferenciar amostra de população. A população é o universo, ou seja,

-4-
É importante saber diferenciar amostra de população. A população é o universo, ou seja,
conjunto de todos os eventos possíveis. Já a amostra é apenas uma parte da população.

A figura a seguir ilustra a ideia de amostra e população.

Figura 3 - População e amostra


Fonte: hobbit, Shutterstock, 2019.

Considerando que, na figura, a população é representada pelo círculo completo, a amostra é apenas a fatia
destacada – ela faz parte do todo.

Você deve estar se perguntando, mas eu poderia utilizar qualquer tamanho de amostra para representar uma

-5-
Você deve estar se perguntando, mas eu poderia utilizar qualquer tamanho de amostra para representar uma
população?A resposta é não, pois a amostra deve ser representativa da população. Pode-se utilizar a seguinte
expressão para se calcular o tamanho da amostra, que seja representativa:

Em que:

n: tamanho da amostra, valor da variável normal padronizada que corresponde a um determinado nível de
confiança desejado. O nível de confiança é igual ao complemento do nível de significância (conhecido por α), ou
seja, NC = 1 - α ou α = 1 - NC.

σ: desvio-padrão populacional da variável estudada.

E: margem de erro, que indica a diferença máxima entre a média amostral e média populacional.

EXEMPLO
Em uma determinada época de eleição, um estatístico está interessado em calcular o número
de pessoas que devem consultar o candidato que tende a apresentar mais votos. Para tanto, ele
sabe que o desvio-padrão populacional é de 0,15. Desejando uma margem de erro de 3% e
adotando um nível de confiança de 95%, qual é o tamanho da amostra a ser pesquisado?

Devemos lembrar que o nível de confiança é o complementar do nível de significância. É necessário utilizar a
tabela da distribuição normal padronizada para resolver o problema. Utilizando a tabela de distribuição normal
padrão acumulada, apresentada a seguir, temos que o resultado encontrado é de:

Z(α/2) = Z(5/2) = Z(2,5%) = 1,96.

-6-
Tabela 1 - Tabela da distribuição normal padrão acumulada
Fonte: INSTITUTO DE MATEMÁTICA, 2019.

Em unidades posteriores você aprenderá a utilizar essa tabela, que é extremamente importante dentro do ramo
da estatística, para calcular probabilidades.

Diante do resultado encontrado, temos que o tamanho da amostra é dado por:

Dessa forma, concluímos que o tamanho da amostra necessária é de 96 pessoas para o caso em questão.

Caso o valor de σ não seja conhecido, devemos utilizar:

Em que:

p: porcentagem populacional de pessoas que possuem uma característica de interesse.

q: porcentagem populacional de pessoas que não possuem uma característica de interesse.

Caso p e q não sejam conhecidos, temos:

-7-
SAIBA MAIS
Acesse a Tabela da Distribuição Normal Padrão, que é necessária para a resolução de diversos
problemas no decorrer desta unidade. Disponível em: <http://wiki.icmc.usp.br/images/f/f9
/Tabela_Normal.pdf>.

Cada caso requer a utilização de uma expressão distinta para encontrar o tamanho da amostra. Assim, é
importante que você memorize as expressões citadas. Logo que a amostra é obtida, é necessário iniciar a etapa
de apuração dos dados.

Fechamento
Ao finalizarmos essa parte da unidade, acreditamos que você deve ter compreendido que desenvolver uma
pesquisa usando a dimensão estatística requer vários cuidados, sendo o principal ter claro qual a população a ser
estudada. Esperamos que tenha ficado claro para você também que a população pode variar muito no tamanho,
uma vez que esse conceito pode ser relativo sempre ao que se deseja estudar.

Por fim, esperamos que a presença das fórmulas não assuste você e nem deixe associar a complexidade dos
cálculos a tarefas complicadas. Hoje qualquer planilha de computador oferece amplos recursos para todos os
cálculos básicos que precisam ser feitos e estaremos indicando para você como usar essas ferramentas!

Referências
BECKER, J. L. Estatística básica: transformando dados em informação. Porto Alegre: Bookman, 2015. Recurso
online. Disponível em: <https://integrada.minhabiblioteca.com.br/books/9788582603130>. Acesso em: 10/03
/2017.

COSTA, G. G. de O. Curso de estatística básica: teoria e prática. 2. ed. São Paulo: Atlas, 2015.

FREUND, J. E. Estatística aplicada: economia, administração e contabilidade. 11. ed. Porto Alegre: Bookman,
2006.

IBGE. CENSO 2010. Disponível em: <http://censo2010.ibge.gov.br/sobre-censo.html>. Acesso em: 18/08/2017.

______. Registro Civil: registros de nascidos vivos, segundo o sexo, a idade da mãe na ocasião do parto e o ano de
nascimento (unidades). Disponível em: <https://sidra.ibge.gov.br/pesquisa/registro-civil/quadros/brasil
/nascidos-vivos>. Acesso em: 13/07/2019.

MOORE, D. S.; NOTZ, W. I.; FLINGER, M. A. A estatística básica e sua prática. 6. ed. Rio de Janeiro: LTC, 2014.

-8-
MOORE, D. S.; NOTZ, W. I.; FLINGER, M. A. A estatística básica e sua prática. 6. ed. Rio de Janeiro: LTC, 2014.
Recurso online. Disponível em: <https://integrada.minhabiblioteca.com.br/books/978-85-216-2630-5>. Acesso
em: 17/07/2017.

ROCHA, R. Minidicionário: enciclopédico escolar. 8. Ed. São Paulo: Scipione, 1996.

UNICAMP. Um pouco de história. Disponível em: <http://www.ime.unicamp.br/~nancy/Cursos/me104/prob1.


pdf>. Acesso em: 29/07/2017.

UFRJ. Universidade Federal do Rio de Janeiro. Instituto de Matemática. Tabela de Distribuição Normal Padrão
Acumulada. 2019. Disponível em: <http://www.im.ufrj.br/probest/Tabelas_de_probabilidade.pdf>. Acesso em:
18/08/2017.

-9-
Tipos de amostra
Rafael Botelho, Vagner Zanin e Haller Schunemann

Introdução
Caro estudante, em época de campanhas presidenciais as palavras amostra e pesquisa entram nos noticiários e
nas discussões. Você já deve ter observado algumas pessoas insinuando que as pesquisas são completamente
falsas e os resultados não são confiáveis. Elas normalmente alegam duas razões bem diferentes. Algumas dizem:
“eu nunca fui abordado por nenhum pesquisador e não conheço ninguém que o foi”. Logo, a pessoa conclui que
essas pesquisas não são válidas. Outras pessoas dizem: “eu e todas as pessoas que conheço vamos votar no
candidato B, não entendo como a pesquisa indica que o candidato A tem o dobro de votos”.

Essas pessoas estão afirmando informações do senso comum, que quando há alguma divergência entre a
pesquisa eleitoral e o resultado da urna, se agarram as suas convicções. No entanto, suas afirmações em nada
evidenciam que as pesquisas eleitorais não sejam confiáveis. Aliás, você deve ter observado que, atualmente,
sempre se indica outros dados como no número da amostra, grau de confiança e margem de erro. Bem, nessa
etapa, você vai entender a questão principal que é a definição da amostra.

Conceitos introdutórios sobre amostragem


Como já foi dito, a amostragem é a etapa mais importante em uma pesquisa estatística. Quando realizada de
maneira errônea, pode produzir sérias consequências em relação ao resultado da análise de seus dados.

Mas, se a amostragem é uma etapa tão importante e passível de erro, não seria possível evitá-la? Ou seja, ao
invés de analisar a amostra porque não já verificar toda a população?

Bem, na vida real, as coisas não são simples assim! Imaginemos duas situações distintas. A primeira é o seguinte:
uma professora quer verificar com seus alunos a suas preferências em relação ao tipo de prova que desejam
realizar. Fica fácil observar que a professora não tem necessidade de realizar uma amostra dos alunos para
verificar essa informação, uma vez que todos os alunos estão acessíveis, ou seja, é fácil consultar toda a
população neste caso.

Mas, agora, vejamos a segunda situação: vamos partir de situação semelhante à de cima. Considere que a mesma
professora deseja verificar a opinião de todos os alunos da escola - qual é a preferência deles em relação ao
modelo de prova. Neste caso, a situação é totalmente distinta da primeira, pois a professora terá que gastar
muito do seu tempo e até mesmo dinheiro para consultar todos os alunos. Aqui fica evidenciada a necessidade de
se realizar uma amostragem.

Uma pergunta que devemos fazer é a seguinte: como fazer uma amostragem de maneira adequada? Está é uma
pergunta bastante relevante, já que a amostragem deve ser representativa em relação à população da qual é

retirada. Assim, não é correto consultar somente os alunos do período noturno, por exemplo, ou mesmo

-1-
retirada. Assim, não é correto consultar somente os alunos do período noturno, por exemplo, ou mesmo
questionar somente as mulheres. As diferenças existentes no elemento da população devem ser consideradas.

Tipos de amostragem
Existem dois tipos de amostragem: a não probabilística e a probabilística.

A amostragem não probabilística é uma técnica de amostragem em que os elementos são incluídos na amostra
sem probabilidades previamente especificadas (ANDERSON; SWEENEY; WILLIAMS, 2011). A seleção dos
elementos da amostra depende, ao menos em parte, do julgamento da pessoa que vai buscar a informação. Em
outras palavras, podemos dizer que nessa amostragem os elementos da população não têm a mesma chance de
serem selecionados para participar dela, já que, para serem selecionados, há um critério que é aplicado pelo
entrevistador, averiguando se aquele elemento pode participar da amostra ou não. Por este motivo, ela não serve
para produzir generalizações de sua população, mas o procedimento possui sua aplicabilidade.

Amostragem não probabilística


Há, basicamente, três modalidades de amostragem não probabilística:
• amostragem por conveniência ou acidental: neste sistema, a amostra é formada por elementos que
vão surgindo diante do entrevistador. Um exemplo pode ser alguém que está parado na rua perguntando
às pessoas que passam qual é o candidato preferido delas;
• amostragem intencional ou por julgamento: aqui, a seleção dos elementos da amostra passa pelo
julgamento de quem realiza a pesquisa. Neste caso, o pesquisador seleciona somente os elementos da
população que possam dar uma resposta mais objetiva. Um exemplo disso é a consulta sobre preferência
de compra sobre imóveis de alto padrão. Em geral, o pesquisador não pergunta para qualquer pessoa,
mas sim, somente para possíveis compradores;
• amostragem por quotas ou por proporcionalidade: aqui é realizada inicialmente uma classificação
da população, de acordo com uma determinada característica. Após determinar o tamanho da cota que
deve ser realizada, selecionam-se os elementos de maneira não aleatória, ou seja, eles são escolhidos a
dedo dentro da quota. Um exemplo simples: um padeiro seleciona as clientes mulheres e, dentro desta
cota, escolhe aquelas que gostam de doce; dessas, seleciona as que preferem pudim, etc., pois o padeiro
que avaliar a receptividade do pudim que produz.

-2-
Quadro 1 - Vantagens entre os diversos tipos de amostragem não probabilística
Fonte: Elaborado pelos autores, 2017.

FIQUE ATENTO
Procure imaginar situações em que podemos realizar uma pesquisa com a amostragem não
probabilística. Procure visualizar em que situações essa técnica é aplicável ou não. Descreva o
motivo.

Estes modelos de amostragem, mesmo não sendo muito utilizados ou aplicados em pesquisas estatísticas,
possuem o seu valor. Um exemplo de sua utilidade é uma pesquisa de mercado sobre um grupo específico de
pessoas ou de clientes. Aqui, o resultado da pesquisa é usado para se ter uma ideia ou percepção das
preferências dos clientes. Isso é bom, já que permite ao empresário dar foco a uma determinada linha de
serviços ou de produtos.

Amostragem probabilística
A amostragem probabilística é a técnica que terá mais foco, já que é a modalidade mais aplicada em todas as
pesquisas que necessitam realizar generalizações da população a partir da amostra. A característica comum aqui
entre as técnicas é de que todos os elementos da população possuem uma chance real de pertencerem à amostra
(COSTA, 2015).

As principais técnicas de amostragem probabilísticas são:


• amostragem aleatória simples;
• amostragem sistemática;
• amostragem estratificada;
• amostragem de conglomerados.

-3-
• amostragem de conglomerados.

Vamos iniciar com a amostragem aleatória simples. Esta é a mais simples de se aplicar e a mais utilizada.

Figura 1 - Tabela de números aleatórios


Fonte: BARBETTA, 2010, p. 28.

Basicamente, esta técnica funciona da seguinte maneira: considere uma população de 50 pessoas, a partir da
qual precisamos criar uma amostra com exatamente 6 pessoas. Então, de uma maneira aleatória, retiramos essas
6 pessoas da população para formar a amostra. Mas um detalhe deve ser observado: como garantir que serão
selecionados 6 elementos da população sem nenhuma interferência pessoal da pessoa que realizará a seleção?
Bem, existem várias técnicas para isso, e a mais conhecida é a utilização de uma tabela de números aleatórios.

FIQUE ATENTO
A palavra ‘aleatório’ é usada de forma imprecisa; isso por que uma amostra aleatória seria
aquela em que todos os componentes da população tivessem a mesma chance de sair. Se isso
não é possível de ser garantido, essa amostra não é totalmente aleatória. Isso pode ser
observado se você deseja fazer uma pesquisa usando o telefone celular para fazer contato com
as pessoas. A maioria ter a celular não é o mesmo que todos terem. O uso desse critério,
mesmo com número sorteados para ligar, não garante a aleatoriedade total.

O que devemos fazer neste instante é utilizar os primeiros 6 pares de algarismo, iniciando da primeira linha que
estão entre 0 até 50. Analisando a tabela apresentada anteriormente, teremos os números {38, 20, 10, 07, 45,
01}. Ou seja, considerando que as 50 pessoas estejam ordenadas de 1 a 50, basta selecionar aquelas que estão
nas posições 38º, 20º, 10º, 7º, 45º e 1º.

-4-
Agora, vamos estudar outra técnica de amostragem: a sistemática. Considerando, ainda, o exemplo de uma
população de 50 pessoas e levando em conta que queremos uma amostra de 4 elementos, vamos selecionar,
aleatoriamente, o primeiro elemento. Para isso, basta determinar o tamanho do intervalo que iremos pular. Para
determinar este intervalo, vamos seguir os passos dados na figura a seguir.

Figura 2 - Intervalo de amostragem


Fonte: Elaborada pelos autores, 2017.

Esta técnica de amostragem é bastante utilizada em departamentos de controle de qualidade. Um exemplo


simples é a fabricação de um determinado produto em série, como o pão. Como eles são fabricados em uma linha
de produção, para verificar a qualidade do produto, basta selecionar o primeiro produzido e depois selecionar
outro, aplicando um determinado intervalo de pães produzidos.

A próxima técnica de amostragem é estratificada, que considera os grupos existentes dentro das populações
para formar as amostras. A estes grupos damos o nome de extratos. Vejamos um exemplo: imagine que
desejamos avaliar a preferência sobre filmes em um conjunto de 100 pessoas, sabendo que há homens e
mulheres neste grupo (logo, há duas características distintas). Neste caso, devemos separar os dois grupos em
outros menores, para que seus elementos possuam características iguais entre cada extrato. Ou seja,
construímos dois grupos: o dos homens e o das mulheres. Assim, basta realizar uma amostragem dentro de cada
um dos grupos. Esta técnica permite avaliar melhor características de grupos com características semelhantes.
Os grupos formados de homens e mulheres não necessariamente possuem preferências distintas para filmes,
mas permite exaltar uma diferença de preferência caso ela exista.

EXEMPLO
No Brasil, a maior parte das empresas de pesquisa de opinião usa a amostra estratificada para
fazer as pesquisas eleitorais. A partir de dados do censo, aspectos como sexo, idade,
escolaridade, entre outros são combinados de forma a garantir que o perfil da amostra seja o
mais próximo da população brasileira. Por isso, talvez você já tenha sido abordado por um
pesquisador na rua, e ele lhe pergunta, antes de mais nada, a sua escolaridade. Isso ocorre por
que ele, ao fazer o levantamento de dados, precisa entrevistar, por exemplo, 4 homens entre 20
a 40 anos com ensino médio completo, bem como 2 mulheres entre 40 e 60 anos com ensino
superior completo.

-5-
A última técnica que vamos estudar é a amostragem de conglomerados. Esta geralmente produz resultados
um pouco menos precisos em relação às outras, porém as suas vantagens são custos financeiros menores, bem
como um menor tempo para a sua aplicação.

Sua ideia consiste em criar grupos dentro da população e realizar a amostragem. Para entender melhor, vamos a
um exemplo. Imagine um carregamento de caixas de tomate. Ao invés de considerar como amostra uma
quantidade finita de caixas de tomates, basta avaliar produtos de uma caixa, pois esta é um conglomerado.

Quadro 2 - Vantagens entre os diversos tipos de amostragens probabilísticas


Fonte: Elaborado pelos autores, 2017.

No quadro apresentado é possível verificar as principais características entre os tipos de amostragens mais
utilizados. Vale recordar que estas técnicas possuem uma característica em comum: todos os elementos têm a
mesma probabilidade de serem escolhidos. As diferenças básicas entre elas são as situações em que devem ser
aplicadas e também as suas qualidades de precisão.

FIQUE ATENTO
Técnicas de amostragem são temas bastante longos e cheios de detalhes. Por isso, é sempre
importante verificar outras fontes para aprimorar seu conhecimento. No material do professor
Marcelo Menezes Reis, sobre amostragem, há mais informações. Disponível em: <http://www.
inf.ufsc.br/~marcelo.menezes.reis/Cap7.pdf>.

-6-
inf.ufsc.br/~marcelo.menezes.reis/Cap7.pdf>.

Para saber mais, assista á videoaula sobre os tipos de amostras.

https://www.youtube.com/embed/uVj9j3pJMjA

Fechamento
Ao encerrar essa parte você deve estar bem mais seguro sobre a questão da amostragem. Esperamos que tenha
ficado claro que apesar de toda amostra ter limitações em relação aos dados populacionais, não é possível, em
termos reais pesquisar em cada item a população toda. Você deve ter compreendido que cada forma de amostra
traz vantagens e desvantagens. Isso é importante, para você entender várias informações cientificas e notícias
jornalísticas e desenvolver um senso crítico.

Referências
ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatística Aplicada: à administração e economia. 2. ed. São
Paulo: Cengage Learning, 2011.

BARBETTA, P. A. et al. Estatística: para cursos de engenharia e informática. 3. Ed. São Paulo: Atlas, 2010.

COSTA, G. G. de O. Curso de estatística básica: teoria e prática. 2. ed. São Paulo: Atlas, 2015.

UFSC. Amostragem. Disponível em: <http://www.inf.ufsc.br/~marcelo.menezes.reis/Cap7.pdf>. Acesso em: 29


/07/2017.

-7-
Apresentação de dados
Rafael Botelho, Vagner Zanin e Haller Schunemannn

Introdução
Caro estudante, neste tópico, o desafio será entender como organizar os dados de forma adequada, para, então,
apresentarmos e avaliarmos o que eles significam. Para isso, é fundamental entender que a organização dos
dados é necessária quando eles não estão dispostos na ordem adequada para o entendimento. Assim, aqui você
vai entender como sistematizar os dados.

Apuração dos dados


É uma forma de organização dos dados, seja por meio de grupos ou de ordem crescente (caso de dados
quantitativos). A organização dos dados tem a função de facilitar o trabalho de manuseio e evitar erros que
podem ser gerados com a utilização de dados desorganizados. A figura a seguir apresenta uma forma de
organização.

Figura 1 - Apuração dos dados por meio da organização em ordem decrescente


Fonte: Elaborada pelos autores, 2017.

Finalizada a etapa de organização (apuração) dos dados, é necessário proceder à fase de apresentação. Nesse
caso, temos um exemplo bem elementar apenas para ajudar você a compreender como é possível organizar os
dados. Na figura apresentada anteriormente, os dados estão relacionados na ordem crescente, mas poderiam ter
sido organizados em ordem descrente, ou mesmo poderíamos ter agrupado os resultados para melhor apuração
dos dados.

A etapa de apuração dos dados pode ser compreendida como a necessidade de refinar ou tornar os dados mais
puros. Voltando a nossa historieta inicial da horta, para contarmos os tomates colidos, decidimos que eles seriam
classificados em grandes ou pequenos. Como esses conceitos são relativos e comparativos, o mais correto seria

ter um padrão para avaliar cada tomate e defini-los como grandes ou pequenos. Assim, teríamos a opção de

-1-
ter um padrão para avaliar cada tomate e defini-los como grandes ou pequenos. Assim, teríamos a opção de
classifica-los em diferentes tamanhos, pois caso a quantidade a ser colhida seja muito grande, classificar apenas
do maior para o menor seria uma tarefa difícil.

FIQUE ATENTO
A organização dos dados não é uma tarefa tão simples quanto parece. É muito importante que
os dados sejam organizados levando em consideração as variáveis que foram definidas para o
estudo. Se você definiu, por exemplo, que a idade é um critério importante para a sua análise, a
organização dos dados deve levar isso em consideração. O correto, quando há mais de uma
variável, é elaborar uma sistematização dos dados, ou seja, combinar as diversas variáveis e
organizar os dados de acordo com as categorias definidas.

Na figura apresentada anteriormente, sugere-se organizar os dados ordenando-os do menor para o maior. Se
precisássemos organizar os dados fornecidos, essa seria uma boa ideia. Mas como organizar as alturas dos
alunos de uma turma, por exemplo? Esse modelo seria o mais adequado?

É possível que você perceba que algumas alturas se repetem, bem como outras nem são relacionadas ou estão
nos extremos. De todo jeito, é fácil colocar essas medidas em ordem, dede que utilizada a sistematização correta.
Isso porque, ao colocar esses dados em uma tabela, as informações não ficam muito compreensíveis, pois
existem lacunas de medidas ou a existência da mesma medida repetidas vezes. Assim, os estatísticos passaram a
organizar esse tipo de dados em intervalos. Mas como isso é feito?

O processo é bem simples: é necessário pegar os dados e calcular a diferença entre o maior e o menor valor.
Depois, é preciso definir a quantidade de classes e dividir a diferença para determinar o tamanho dessas classes.

Para que a compreensão fique mais fácil, vamos supor que você tenha medido as alturas dos alunos. A turma não
é muito grande, mas existe uma diferença considerável entre os dados obtidos: o aluno mais baixo mede 1,40m e
o mais alto 1,70m, com uma diferença de 0,30 metros entre eles.

De acordo com as regras da estatística, não devemos trabalhar com menos de 4 classes de intervalo. Mas quantas
devemos escolher, nesse caso? A experiência indica que o ideal é trabalhar com 5 ou 6 classes. Aqui, vamos
seguir o processo com 6 classes.

Agora, pegamos o valor da diferença (0,30 m) e dividimos por 6, obtendo o resultado de 0,05 - o que nos indica o
tamanho que cada classe deve ter. Assim, as classes organizadas ficam da seguinte forma:

- 1,40 a 1,44

- 1,45 a 1,49

- 1,50 a 1,54

- 1,55 a 159

- 1,60 a 1,64

- 1,65 a 1,70

-2-
- 1,65 a 1,70

A partir desta classificação, os alunos serão distribuídos de acordo com a faixa de altura. Você consegue perceber
que os dados ficam organizados, facilitando a visualização das informações?

EXEMPLO
Talvez você não tenha percebido quantas vezes a estatística está presente no contexto escolar.
Nas notas, por exemplo, encontramos essa definição em duas situações: Quando uma escola
trabalha com sistema de notas por letras, A equivale entre 94 e 100 pontos, A- entre 87 e 93
pontos, assim por diante. Por outro lado, algumas escolas trabalham com o arredondamento
de notas, ou seja, lançam no boletim notas inteiras (9,0, 8,0, 7,0, etc.) ou meias (9,5, 8,5, 7,5,
etc.). Nas duas formas, existe o conceito de intervalos. Vamos analisar o sistema de notas
arredondadas: se as notas entre 7,25 e 7,74 são registradas como 7,5, essa nota representa um
intervalo.

É importante destacar que, nem sempre, é possível trabalhar com medidas que apresentam continuidade, como
medida de peso e altura. Alguns dados como sexo, convicção religiosa e nível de escolaridade são considerados
como categorias, podendo, ainda, serem coletados juntos. Assim, é fundamental entendermos como organizar os
dados nesses casos, uma vez que não é possível aplicar o conceito de intervalos.

-3-
Figura 2 - Matriz
Fonte: AnatasiaSonne, Shutterstock, 2019.

Observe que a figura apresenta uma matriz indicando três cores e duas figuras geométricas, com diferentes
tamanhos. Isso indica que a amostra em questão poderia ser classificada em 12 categorias: o quadrado grande
amarelo, o quadrado pequeno vermelho, o círculo pequeno azul, etc.

Cada uma dessas categorias terá uma quantidade de objetos e anotar essas informações de forma correta é
importante para a sistematização dos dados. Observe que, nesse caso, estamos fazendo mais do que uma simples
classificação. Estamos utilizando diferentes dados para realizar uma sistematização.

-4-
Apresentação dos dados
A apresentação dos dados é uma forma de facilitar a visualização de um determinado conjunto de dados, e pode
ser tabular ou gráfica. A apresentação tabular é feita por meio de tabelas, como representa a figura a seguir.

Quadro 1 - Representação do número de votos recebidos por candidatos


Fonte: Elaborado pelos autores, 2017.

Figura 3 - Representação do número de votos recebidos por candidatos a partir de um gráfico de pizza
Fonte: Elaborada pelos autores, 2017.

Os mesmo dados podem ser representados por meio de um gráfico de colunas.

A apresentação gráfica, por sua vez, é feita por meio de gráficos.

-5-
Figura 4 - Representação do número de votos recebidos por candidatos a partir de um gráfico de colunas
Fonte: Elaborada pelos autores, 2017.

A diferença do gráfico de pizza para o gráfico de colunas é que o primeiro nos mostra as porcentagens de
ocorrência de cada evento, ao passo que o segundo mostra o valor assumido por cada variável.

Análise e interpretação dos dados


Depois que os dados estão organizados e representados, seja em forma tabular ou gráfica, é hora de seguir para a
próxima etapa do método estatístico, que é a análise e a interpretação dos dados, com a finalidade de concluir o
estudo.

FIQUE ATENTO
A interpretação dos dados estatísticos pode ser realizada de diferentes formas e é comum que
as pessoas confundam essa etapa como uma mera descrição, o que não está correto. Em uma
pesquisa eleitoral, por exemplo, são apresentados dados de intenção de votos para os
candidatos à presidência. Informar qual candidato está à frente nas pesquisas ou qual teve um
crescimento na intenção de votos são apenas descrições. Para fazer uma análise estatística é
importante ter conhecimento de outras medidas ou, até mesmo, de referenciais teóricos para
dar sentido aos dados obtidos. O valor da estatística cresce quando aliada aos conceitos de
probabilidade.

-6-
Nesta etapa, é necessário que o pesquisador saiba interpretar o resultado fornecido a partir de um determinado
método estatístico. Isso porque de nada adianta ter os resultados em mãos e não saber interpretá-los.

SAIBA MAIS
Para aprofundar sobre o tema, indicamos a leitura do capítulo 2 do livro Estatística básica:
transformando dados em informação, do autor João Luiz Becker. Editora Bookman. Ano: 2015.
Disponível em: <https://integrada.minhabiblioteca.com.br/books/9788582603130>.

Vamos considerar que um grupo de pessoas está interessado em calcular o número de alunos que frequentarão
determinada escola particular em uma segunda-feira. Para isso, é possível utilizar dados históricos, que
permitirão fazer a previsão de um valor estimado. Ou seja, para o caso em questão, a etapa de análise e
interpretação dos dados consiste na aplicação do método de previsão de demanda.

Fechamento
Como você pode observar, a forma de organizar os dados é muito importante para nos auxiliar a compreender
como transforma-los em informações coerentes. Neste tópico, você teve a compreensão de que a apresentação
dos resultados pode ser feita de forma resumida em dois modelos: tabelas e gráficos.

Referências
BECKER, J. L. Estatística básica: transformando dados em informação. Porto Alegre: Bookman, 2015. Recurso
online. Disponível em: <https://integrada.minhabiblioteca.com.br/books/9788582603130>. Acesso em: 10/03
/2017.

COSTA, G. G. de O. Curso de estatística básica: teoria e prática. 2. ed. São Paulo: Atlas, 2015.

FREUND, J. E. Estatística aplicada: economia, administração e contabilidade. 11. ed. Porto Alegre: Bookman,
2006.

IBGE. CENSO 2010. Disponível em: <http://censo2010.ibge.gov.br/sobre-censo.html>. Acesso em: 18/08/2017.

______. Registro Civil: registros de nascidos vivos, segundo o sexo, a idade da mãe na ocasião do parto e o ano de
nascimento (unidades). Disponível em: <https://sidra.ibge.gov.br/pesquisa/registro-civil/quadros/brasil
/nascidos-vivos>. Acesso em: 13/07/2017.

-7-
MOORE, D. S.; NOTZ, W. I.; FLINGER, M. A. A estatística básica e sua prática. 6. ed. Rio de Janeiro: LTC, 2014.
Recurso online. Disponível em: <https://integrada.minhabiblioteca.com.br/books/978-85-216-2630-5>. Acesso
em: 17/07/2017.

ROCHA, R. Minidicionário: enciclopédico escolar. 8. Ed. São Paulo: Scipione, 1996.

UNICAMP. Um pouco de história. Disponível em: <http://www.ime.unicamp.br/~nancy/Cursos/me104/prob1.


pdf>. Acesso em: 29/07/2019.

-8-
Tabelas
Rafael Botelho, Vagner Zanin e Haller Schunemann

Introdução
Caro estudante, neste tópico, você vai entender como organizar as tabelas, que são uma forma de apresentação
de dados. Aqui você terá a oportunidade de ver vários exemplos de tabelas, bem como sua correta utilização.
Além disso, estudará como os nomes utilizados têm a função de facilitar a compreensão da organização dos
dados.

Apresentação de dados por meio de tabelas


As tabelas possuem a função de resumir um determinado conjunto de dados, facilitando a interpretação das
informações. Elas podem ser definidas como o estabelecimento dos resultados em uma forma de matriz, por
meio de linhas e colunas.

A organização em matrizes é uma forma interessante de apresentação de resultados porque permite uma rápida
visualização dos dados. Se você está familiarizado com a leitura da Bíblia, já percebeu que em várias partes do
Antigo Testamento há uma longa descrição de dados quantitativos que poderiam ser sintetizados em uma tabela
de forma muito fácil. Esse exemplo é apenas para lembrar que, durante muito tempo, havia apenas uma forma de
registrar alguma coisa: a forma descritiva.

Assim, as matrizes oferecem possibilitam concentrar as informações obtidas e facilitam a compreensão dos
dados. Por isso, a definição do que será indicado nas linhas e nas colunas é muito importante, a fim de
possibilitar a leitura e a comparação dos dados.

Tipos de tabela
As tabelas podem ser de diferentes tipos: cronológica ou temporal, geográfica, específica, de distribuição de
frequência, de dupla entrada, etc.
• Tabela cronológica

É organizada de acordo com aspectos temporais, que podem representar anos, meses, décadas ou, até mesmo,
as horas. O objetivo desse tipo de tabela é demonstrar mudança ou transformação no decorrer de um período de
tempo. Na área educacional, elas são utilizadas, por exemplo, para indicar mudanças de matrículas, tendências
de evasão, entre outras informações relevantes.

A figura a seguir apresenta um exemplo de utilização da tabela cronológica.

-1-
Tabela 1 - Exemplo de tabela cronológica
Fonte: Elaborada pelos autores, 2017.

Observe que a venda de celular foi segmentada de acordo com o ano.


• Tabela geográfica

Esse tipo de tabela classifica os dados de acordo com regiões pré-definidas: ruas, bairros, cidades, estados,
países, etc.

Tabela 2 - Exemplo de tabela geográfica


Fonte: Elaborada pelos autores, 2019.

É importante destacar que essa tabela não precisa, necessariamente, indicar dados percentuais. Essa informação
foi utilizada na tabela anterior para facilitar a comparação dos dados.
• Tabela específica

Nesse tipo de tabela, os dados são organizados de acordo com um critério específico, como o tipo de produto
analisado, por exemplo. Em termos educacionais, essa tabela pode ser utilizada para comparar tipos de
avaliações, de turmas, de séries, etc.

-2-
Tabela 3 - Exemplo de tabela específica
Fonte: Elaborada pelos autores, 2017.

Observe que os dados foram organizados de acordo com o tipo de produto analisado.
• Tabela de distribuição de frequência

Esse tipo de tabela apresenta os dados dentro de cada intervalo de classe, podendo ser subdividida em: sem
intervalo de classe e com intervalo de classe.

Tabela 4 - Exemplo de tabela de distribuição de frequência sem intervalo de classe


Fonte: Elaborada pelos autores, 2017.

Observe que ao existe intervalo de classe (faixa de variação de valores) para a classificação dos dados.

-3-
Tabela 5 - Exemplo de tabela de distribuição de frequência com intervalo de classe
Fonte: Elaborada pelos autores, 2017.

Observe que a tabela foi organizada de acordo com os intervalos de idade pré-definidos.

FIQUE ATENTO
Para o caso em questão, o limite superior a cada classe foi considerado “aberto”. Sendo assim,
uma pessoa que possui 20 anos seria classificada no segundo grupo, e não no primeiro. Um
intervalo que possua o limite inferior “fechado” é aquele que irá conter o valor mostrado no
limite inferior. Já o intervalo que possua um limite superior “aberto” não irá conter o valor que
está descrito no limite superior.

• Tabela de dupla entrada

É o tipo de tabela que utiliza duas variáveis.

-4-
Tabela 6 - Exemplo de tabela de dupla entrada
Fonte: Elaborada pelos autores, 2017.

As tabelas são úteis para sistematizar muitos dados em situações como essa, em que há mais de uma variável a
ser analisada. Observe que a tabela apresentada anteriormente permite compreender mais facilmente os dados
obtidos. A organização visual das tabelas, por tanto, precisa sempre ser considerada para que os resultados
sejam facilmente entendidos e interpretados.

EXEMPLO
De um modo geral, as tabelas de duas entradas são melhores. Ao consultarmos os dados do
IDEB, por exemplo, e compararmos os dados por unidade geográfica e tempo, temos a
possibilidade de fazer boas comparações, como a tendência por local, se há transformação, etc.
Esse tipo de tabela é muito frequente para estudos de sistemas escolares.

• Tabela de tripla entrada

Também é possível que exista uma tabela de tripla entrada, com três variáveis. O raciocínio é análogo ao caso da
tabela de dupla entrada. Vamos usar um exemplo escolar para que você compreenda melhor, utilizando dados
como “série”, “sexo” e “aprovação/reprovação”.

-5-
Tabela 7 - Exemplo de tabela de tripla entrada
Fonte: Elaborada pelos autores, 2017.

Você pode observar que, mesmo com o aumento de informação, ainda fica fácil compreender os dados
apresentados na tabela. Ou seja, é possível ter uma visão geral muito mais sistematizada do que quando usamos
apenas a descrição dos conceitos em frase.

FIQUE ATENTO
Na prática, é possível elaborar tabelas com mais de três entradas. Mas como os dados sempre
são apresentados em matrizes bidimensionais, não é muito prático colocar mais do que três ou
quatro entradas por tabela.

É importante destacar que as três variáveis poderiam ter sido ordenadas de forma diferente. No entanto,
devemos sempre lembrar que a tabela tem a função de apresentar dados e devemos, portanto, considerar o que
desejamos destacar. No caso da tabela apresentada anteriormente, a informação que mais se destaca é sequência
dos diferentes anos escolares. Mas poderíamos destacar a diferença entre o sexo masculino e feminino. A
questão é sempre deixar claras as classes de informação que estamos trabalhando e o que queremos destacar.

SAIBA MAIS
Para se aprofundar sobre o tema, indicamos a leitura do material Análise de Pareto, Passo a
Passo, do professor Joel Solon de Azevedo. Disponível em: <https://www.trf5.jus.br
/downloads/Artigo_22_Analise_de_Pareto_Passo_a_Passo.pdf>.

Vale destacar a ausência de exemplos percentuais nas tabelas apresentadas, e isso pode atrapalhar a
interpretação de dados. Essa situação foi apenas para facilitar a compreensão dos conceitos a serem estudados.

-6-
Fechamento
É importante ter em mente que as tabelas são um modo de apresentação dos resultados e que elas começaram a
ser organizadas para facilitar a compreensão da informação. Desta forma, há muitas informações que hoje são
postas em tabelas e que não apresentam vantagens na compreensão dos dados. Isso deve ser levado em
consideração quando se organiza os dados em tabela. É preciso ter claro o que se quer comunicar para, então,
definir qual tabela será utilizada e como ela deve ser organizada visualmente, em especial nos casos de entradas
duplas ou triplas.

Referências
BECKER, J. L. Estatística básica: transformando dados em informação. Porto Alegre: Bookman, 2015.

MOORE, D. S.; NOTZ, W. I.; FLINGER, M. A. A estatística básica e sua prática. 6. ed. Rio de Janeiro: LTC, 2014.

SALGADO, L. S. O Sistema de Excelência em gestão e sua Implantação em uma Empresa de Mineração e


Construção. Monografia - Universidade Federal do Juiz de Fora, Minas Gerais, 2008.

-7-
Gráficos
Rafael Botelho, Vagner Zanin e Haller Schunemann

Introdução
Caro estudante, assim como você está acostumado a ver tabelas científicas ou jornalísticas nos meios de
comunicação, os gráficos também são recursos utilizados para comunicar informações. A aparente simplicidade
de elaborar gráficos no computador esbarra na mesma necessidade de conceituar, que já apresentamos em
relação as tabelas. Vamos entender melhor?

Acompanhe!

Apresentação de dados por meio de gráficos


Existe uma grande quantidade de gráficos que pode ser utilizada para apresentar um conjunto de dados. Nesta
unidade, mostraremos os principais, mas existem vários outros que também podem ser utilizados.

De acordo com Becker (2015), os gráficos devem ser simples, claros e exatos e devem possuir as seguintes
finalidades: precisam exibir os dados de maneira clara e agradável; devem poupar esforço e tempo da pessoa
que está fazendo a análise; e devem exibir os dados de maneira que possam ser feitas as devidas comparações.

Histograma
De acordo com Becker (2015), o histograma é uma representação por meio de colunas justapostas de maneira
contínua, sendo que cada uma representa uma classe (intervalo de variação). Desse modo, segundo o autor, onde
termina uma classe começa a outra (ou seja, não há espaços entre as classes).

O histograma é um gráfico de colunas que utiliza uma tabela de distribuição de frequência (como aquela que foi
mostrada no tópico anterior) para fazer a devida representação.

Com a tabela de distribuição de frequência em mãos, basta inserir os dados em algum software para gerar o
histograma dos dados. Os softwares Excel e Minitab permitem criar histogramas de maneira bastante fácil.

De acordo com Moore, Notz e Fligner (2014), um histograma não é a mesma coisa que um gráfico de barras. Os
autores relatam que um histograma mostra a distribuição de uma variável quantitativa (que pode ser mensurada
por valores). Os autores destacam, ainda, que o eixo horizontal do histograma mostra as unidades de medida da
variável em análise, enquanto o eixo horizontal do gráfico de barras não precisa apresentar qualquer escala de
medida da variável. Ainda de acordo com os autores, o gráfico de barras possui a finalidade de fazer uma
comparação entre tamanhos diferentes das barras (ideia de proporção).

Moore, Notz e Fligner (2014) relatam que a escolha do número de classes pode influenciar na aparência do

-1-
Moore, Notz e Fligner (2014) relatam que a escolha do número de classes pode influenciar na aparência do
histograma. Os autores sugerem encontrar os picos maiores para poder entender como é a distribuição de um
conjunto de dados. Para eles, os histogramas devem ser construídos sem espaços, para indicar que todos os
valores da variável estão sendo considerados.

Figura 1 - Exemplo de histograma para o número de pessoas que fazem musculação em uma academia
Fonte: Elaborada pelos autores, 2017.

A partir da figura é possível perceber que os dados estão classificados de acordo com intervalos de classe (faixa
de variação das idades).

Gráfico de linhas
De acordo com Becker (2015), o gráfico de linhas é utilizado para se fazer a representação de séries temporais
(sequência de valores ao longo do tempo), onde os dados são conectados por uma única linha. Esse tipo de
gráfico deve ser utilizado quando os dados estão organizados de acordo com um período de tempo contínuo.

-2-
Figura 2 - Exemplo de um gráfico de linhas para a porcentagem de vendas de produtos por uma empresa
Fonte: Elaborada pelos autores, 2017.

Observe, na figura apresentada, que existe uma linha que conecta os dados.

Gráfico de colunas
De acordo com Becker (2015), o gráfico de colunas é a representação dos dados por meio de retângulos
dispostos verticalmente. Cada variável apresenta uma coluna para representar seu respectivo valor. São gráficos
muito úteis para comparações entre conjunto de dados.

-3-
Figura 3 - Exemplo de gráfico de colunas para o número de vendas de três produtos
Fonte: Elaborada pelos autores, 2017.

É possível perceber que os dados são classificados conforme o número de vendas, para cada produto.

Gráfico de setores (gráfico de Pizza)


De acordo com Moore, Notz e Fligner (2014), no gráfico de pizza as fatias são dimensionadas pelas contagens ou
pelos percentuais que cada categoria possui. Esse gráfico, também conhecido como gráfico, apresenta um
formato circular e o tamanho angular de cada “fatia” é proporcional à probabilidade de um determinado evento.

-4-
Figura 4 - Exemplo de gráfico de setores para produtos vendidos por uma empresa
Fonte: Elaborada pelos autores, 2017.

Observe que os produtos foram classificados de acordo com a porcentagem de vendas.

Polígono de frequência
De acordo com Becker (2015), o polígono de frequência, assim como o histograma, também representa uma
distribuição de frequência com intervalo de classe. O autor relata que a linha poligonal é obtida pela ligação dos
pontos médios de cada classe. Apesar de semelhantes, polígono de frequência e gráfico de linhas não são a
mesma coisa. O polígono de frequência é representado por uma linha que une os pontos médios das classes de
um conjunto de dados. Utilizando os dados da tabela, ou o número de pessoas que fazem musculação em uma
academia, temos o polígono de frequência na figura a seguir.

-5-
Figura 5 - Exemplo de polígono de frequência para os dados da tabela do número de pessoas que fazem
musculação em uma academia
Fonte: Elaborada pelos autores, 2017.

É possível perceber que os pontos médios das classes estão representados por pontos.

Gráfico de Pareto
O gráfico de Pareto é um gráfico de colunas justapostas, organizadas em ordem decrescente de frequência de
cada variável. É uma das sete ferramentas da qualidade, muito utilizada no meio empresarial, para detectar quais
são as causas mais importantes de ocorrência de problemas nos produtos.

Campos (2014) afirma que a Análise de Pareto divide um problema grande em problemas menores e
mais fáceis de serem resolvidos, e permite priorizar projetos e também estabelecer metas concretas
e atingíveis. O Princípio de Pareto separa os problemas em duas classes de causas: Poucas Vitais e
Muitas Triviais. Em outras palavras, significa dizer que um problema possui várias causas, mas
apenas algumas poucas representam um grande impacto ou perda. O gráfico de Pareto é constituído
por barras verticais que são as causas de um determinado problema, ordenadas em ordem
decrescente de incidência. (SALGADO, 2008, p. 14).

O gráfico de Pareto utiliza a ideia da regra do 80/20, dizendo que apenas 20% das causas são responsáveis por
cerca de 80% de defeitos nos produtos. Salgado (2008) apresenta um exemplo que mostra a contagem do
número de defeitos em produtos de uma determinada empresa em função de algumas causas.

-6-
Figura 6 - Exemplo de Gráfico de Pareto mostrando as principais causas de defeito de produtos em uma empresa
Fonte: Elaborada pelos autores, 2017.

Esse tipo de gráfico é muito utilizado nas empresas para resolver, de maneira rápida, as causas de problemas
que geram maior quantidade de defeitos nos produtos.

SAIBA MAIS
Para se aprofundar sobre o tema, indicamos a leitura do material “Análise de Pareto, Passo a
Passo”, do professor Joel Solon de Azevedo. Disponível em: <https://www.trf5.jus.br
/downloads/Artigo_22_Analise_de_Pareto_Passo_a_Passo.pdf>.

Agora, considere que uma empresa recebeu várias devoluções de seus produtos (armários) em um determinado
mês. Ao todo, foram 40 unidades devolvidas por causa de arranhão, 30 unidades devolvidas em função de
empenamento, 15 unidades devolvidas por conta de atrasos de entrega dos produtos, 10 unidades devolvidas
por falha na tintura e 5 unidades em função de outros problemas. Se fôssemos construir um gráfico de Pareto, ele
poderia ser representado da seguinte forma:

-7-
Figura 7 - Exemplo do gráfico de Pareto
Fonte: Elaborada pelos autores, 2017.

FIQUE ATENTO
Existem outros tipos de gráficos que podem ser utilizados para a representação de dados.
Pesquisa em livros, artigos científicos e e-books disponíveis na internet sobre outros gráficos
que podem ser utilizados.

Assim, foram relatados os principais tipos de gráficos e de tabelas que são utilizados para a fase de apresentação
dos dados.

Para saber mais, acesse á videoaula sobre tabelas e gráficos.

https://www.youtube.com/embed/pg-4GTxEdIU

-8-
Fechamento
Ao terminarmos este tópico, esperamos que você tenha compreendido que gráficos são outra forma de
apresentar dados, assim como as tabelas. Então cabe aqui uma consideração final: para identificar a melhor
forma de apresentar os dados coletados, é necessário considerar o princípio da clareza da informação. Assim, é
fundamental que seja avaliada a informação que se pretende destacar.

Referências
BECKER, J. L. Estatística básica: transformando dados em informação. Porto Alegre: Bookman, 2015.

MOORE, D. S.; NOTZ, W. I.; FLINGER, M. A. A estatística básica e sua prática. 6. ed. Rio de Janeiro: LTC, 2014.

SALGADO, L. S. O Sistema de Excelência em gestão e sua Implantação em uma Empresa de Mineração e


Construção. Monografia - Universidade Federal do Juiz de Fora, Minas Gerais, 2008.

-9-

Você também pode gostar