Você está na página 1de 123

Estatística

Núcleo Comum
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Créditos e Copyright

Aguiar, Aglaer de Mattos

Estatística. Aglaer de Mattos Aguiar. / Atualizado por


Auriluci Figueiredo. - Santos, 2022.

123 fls.

Universidade Metropolitana de Santos, Núcleo Comum, 2022.

1. Ensino a distância. 2. Matemática. 3. Estatística.

CDD 500

Este curso foi concebido e produzido pela Unimes Virtual. Eventuais marcas aqui
publicadas são pertencentes aos seus respectivos proprietários.
A Unimes Virtual terá o direito de utilizar qualquer material publicado neste curso
oriundo da participação dos alunos, colaboradores, tutores e convidados, em
qualquer forma de expressão, em qualquer meio, seja ou não para fins didáticos.

Copyright (c) Unimes Virtual


É proibida a reprodução total ou parcial deste curso, em qualquer mídia ou formato.

2
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

SUMÁRIO

Aula 01_A importância da Estatística nas diversas áreas: um pouco de sua história
e seus métodos ......................................................................................................... 5
Aula 02_Conceitos Básicos de Estatística: População, amostra e variáveis. .......... 10
Aula 03_Representação dos dados através de tabelas .......................................... 14
Aula 04_Como organizar dados em tabelas Sem Intervalos de Classe .................. 19
Aula 05_ Organizar dados em Tabelas Com Intervalos de Classe _ Variável Discreta
................................................................................................................................ 23
Aula 06 – Atividades sobre variáveis e sua representação em tabelas. .................. 27
Aula 07_Organizar dados em Tabelas Com Intervalos de Classe _ variável Contínua
................................................................................................................................ 30
Aula 08_A importância do cálculo das frequências nas tabelas de variáveis
qualitativas e quantitativas discretas ....................................................................... 33
Aula 09_A importância do cálculo das frequências nas tabelas de variáveis
quantitativas contínuas ............................................................................................ 36
Aula 10_ Representação dos dados através de gráficos: Gráfico de Setores ......... 40
Aula 11_ Representação dos dados através de gráficos: Gráfico de Colunas ou
Barras. ..................................................................................................................... 44
Aula 12_ Representação dos dados através de gráficos: Histograma e outros tipos
de gráficos ............................................................................................................... 48
Aula 13_ Uso de Tecnologia: Histograma ............................................................... 53
Aula 14_ A História que os Gráficos contam e Atividade de Tabelas e Gráficos .... 57
Aula 15_ Infográficos X Gráficos ............................................................................. 60
Aula 16_O Objeto de Estudo - As Medidas de Tendência Central .......................... 63
Aula 17_O Cálculo da Média em tabelas com intervalos de classe ........................ 66
Aula 18_ Exercícios de construção de tabelas e o conceito de média .................... 69
Aula 19_A Mediana como medida de tendência central.......................................... 71
Aula 20_ O cálculo da Mediana em tabelas com intervalos de classe .................... 75
Aula 21_A Moda como medida de tendência central .............................................. 78
Aula 22_ Medidas Separatrizes e a relação entre a Mediana e Quartis de uma
distribuição .............................................................................................................. 82
Aula 23_ Medidas de Dispersão: Para que servem e como se calcula ................... 85
Aula 24_ Desvio Padrão com tabelas de frequência ............................................... 89
Aula 25_A Tecnologia e o Cálculo de medidas com o uso do Excel ....................... 92

3
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 26_Média e Desvio-Padrão de uma distribuição ............................................. 94


Aula 27_ Noções básicas de Probabilidade ............................................................ 98
Aula 28_ Os Enfoques de Probabilidade e algumas propriedades ....................... 101
Aula 29_ Algumas Técnicas para o Cálculo de Probabilidade .............................. 105
Aula 31_Regressão Linear .................................................................................... 113
Aula 32_ Alguns Erros na Mídia e o Tratamento da Informação: FAKENEWS? ... 118

4
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 01_A importância da Estatística nas diversas áreas: um pouco


de sua história e seus métodos

Nessa aula vamos identificar a importância da estatística nas diversas áreas,


seu ensino, assim como fatos importantes de sua história e seus métodos.
Palavras–chave: Importância da Estatística; História da estatística; Ensino da
estatística.

A Estatística está presente nas ciências e, esta participação está cada vez
mais intensa e mais importante. Como por exemplo, a estatística auxilia a Genética,
nas questões de hereditariedade; é valiosa na Economia, na análise da
produtividade, da rentabilidade, nos estudos de viabilidade entre outros. Para as
Ciências Sociais, nas pesquisas socioeconômicas; na Engenharia Industrial, no
controle de qualidade, na comparação de fabricações; é indispensável à
Administração, à Programação à Medicina, à Psicologia, à História, e, de forma direta
ou indireta, às demais atividades.
Não é de hoje que ela está presente, e é percebido nos dias atuais, e em
particular, nos últimos anos seu desenvolvimento, pois grande parte das informações
nos chegam através da sua linguagem; como gráficos; tabelas; porcentagens;
médias e outros elementos que compõe letramento estatísticos.
Historicamente o desenvolvimento da estatística pode ser entendido a partir
de dois fenômenos – a necessidade de governos coletarem dados censitários e o
desenvolvimento da teoria do cálculo das probabilidades. Vamos compreender
alguns elementos da história que trouxeram a Estatística ao patamar que temos hoje
de importância.
Um pouco de História
Antiguidade: os povos já registravam o número de habitantes, nascimentos,
óbitos. Faziam "estatísticas".
Idade Média: as informações eram tabuladas com finalidades tributárias e
bélicas.
SÉC. XVI: surgem as primeiras análises sistemáticas, as primeiras tabelas e
os números relativos.

5
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

SÉC. XVIII: GODOFREDO ACHENWALL (1719 – 1772), intelectual que mais


contribuiu para o desenvolvimento da Estatística - uma ciência que guarda
pouquíssimas relações com a atual estatística, pois concernia à descrição
abrangente das características sociopolítico econômicas dos diferentes estados.
As tabelas ficaram mais completas e surgiram as primeiras representações
gráficas e os cálculos de probabilidades. A estatística deixa de ser uma simples
tabulação de dados numéricos para se tornar o estudo de como se chegar à
conclusão sobre uma população, partindo da observação de partes dessa
população.
Atualmente, informações numéricas são necessárias para cidadãos e
organizações de qualquer natureza, e de qualquer parte do mundo globalizado, para
a tomada de decisões que envolvem a coletividade.
O que se pode dizer que é a Estatística?
▪ Estatística é um conjunto de métodos e processos quantitativos que serve
para estudar e medir os fenômenos coletivos;
▪ pode também ser pensada como a ciência de aprendizagem a partir de dados;
▪ em linhas gerais, a Estatística fornece métodos que auxiliam o processo de
tomada de decisão;
▪ a Estatística está presente em todas as áreas da ciência que envolvam a
coleta e análise de dados;
▪ em outras palavras, é a ciência que se preocupa com a coleta, a organização,
descrição (apresentação), análise e interpretação de dados experimentais ou
não e tem como objetivo fundamental o estudo de uma população.
▪ Este estudo pode ser feito de duas maneiras.
▪ Investigando todos os elementos da população,
▪ Selecionando alguns elementos da população, ou seja: Amostragem.

O Ensino da Estatística na Educação Básica


Diante da importância da estatística nas diversas ciências e pelo
desenvolvimento historicamente comprovado como a ciência do número em
contexto, portanto, tais contextos podem ser de todas as áreas e não somente da
Matemática, pode ser na Química, Física, Geografia, Biologia, Ciências Sociais,
Pedagogia, História entre outras.

6
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Tal fato é apontado e indicado em documentos oficiais que regem a Educação


básica no nosso país, como a Base Nacional Comum Curricular. Esse documento
preconiza desde os anos iniciais seu ensino em todos os anos do Ensino
Fundamental, e não somente na área da Matemática assim como em outras áreas.
No Ensino Médio, espera-se que o professor de todas as áreas, sejam elas
das humanas ou exatas proporcionem o desenvolvimento de habilidades nos alunos,
como podemos observar abaixo algumas das habilidades a serem desenvolvidas por
alunos do Ensino Médio, que não estão relacionadas a área da Matemática e suas
tecnologias:
Quadro 1 – Habilidades em relação a Estatística no Ensino Médio

(EM13CHS103) Elaborar hipóteses, selecionar evidências e compor argumentos


relativos a processos políticos, econômicos, sociais, ambientais, culturais e
epistemológicos, com base na sistematização de dados e informações de diversas
naturezas (expressões artísticas, textos filosóficos e sociológicos, documentos
históricos e geográficos, gráficos, mapas, tabelas, tradições orais, entre outros)

(EM13CNT303) Interpretar textos de divulgação científica que tratem de temáticas das


Ciências da Natureza, disponíveis em diferentes mídias, considerando a apresentação
dos dados, tanto na forma de textos como em equações, gráficos e/ou tabelas, a
consistência dos argumentos e a coerência das conclusões, visando construir
estratégias de seleção de fontes confiáveis de informações.

(EM13CNT302) Comunicar, para públicos variados, em diversos contextos, resultados


de análises, pesquisas e/ou experimentos, elaborando e/ou interpretando textos,
gráficos, tabelas, símbolos, códigos, sistemas de classificação e equações, por meio de
diferentes linguagens, mídias, tecnologias digitais de informação e comunicação (TDIC),
de modo a participar e/ou promover debates em torno de temas científicos e/ou
tecnológicos de relevância sociocultural e ambiental.
Fonte: adaptado da Base Nacional Comum Curricular (2018)

Para desenvolver tais habilidades o aluno deverá conhecer o método


estatístico, assim como as várias formas de representar os dados.

Método Estatístico

Método: é um meio mais eficaz para atingir determinada meta.

Métodos Científicos: por exemplo, o método experimental e o método


estatístico.

Método Experimental: consistem em manter constante todas as causas,


menos uma, que sofre variação para se observar seus efeitos, caso existam.

7
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Exemplo: estudos da Química, Física, entre outros estudos.

Método Estatístico: diante da impossibilidade de manter as causas


constantes como nas ciências sociais, admitem todas essas causas presentes
variando-as, registrando essas variações e procurando determinar, no resultado, que
influências cabem a cada uma delas.

Exemplo: Quais as causas que definem o preço de uma mercadoria quando a sua
oferta diminui?

Seria impossível, no momento da pesquisa, manter constante a uniformidade


dos salários, o gosto dos consumidores, nível geral de preços de outros produtos,
entre outros.

A Estatística

Pode ser considerada uma parte da Matemática aplicada, porém ela é uma
ciência a parte: A ciência dos números em contexto. Seus métodos incluem coleta,
organização, descrição, análise e interpretação de dados e para a utilização dos
mesmos na tomada de decisões. Dois tipos de Estatística:

✓ A coleta, a organização, a descrição dos dados, o cálculo e a interpretação de


coeficientes pertencem à ESTATÍSTICA DESCRITIVA.
✓ A análise e a interpretação dos dados, associado a uma margem de incerteza,
ficam a cargo da ESTATÍSTICA INDUTIVA ou INFERENCIAL, e se
fundamenta na teoria da probabilidade.

O processo de generalização do método indutivo está associado a uma


margem de incerteza. Isto se deve ao fato de que a conclusão que se pretende obter
para o conjunto de todos os indivíduos analisados quanto a determinadas
características comuns baseia-se em uma parcela do total de observações.

Para se analisar os dados de forma estatística podem-se obter os resultados


de duas maneiras: através de um censo ou através de uma amostragem, isto é
pesquisa através de uma amostra. (pesquisa em uma amostra).

8
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.
BRASIL. Base nacional comum curricular: BNCC. Brasília: MEC, 2018.

SALERNO, S. Potencialidades Pedagógicas Da História Da Matemática Para O


Ensino De Estatística Na Educação Básica. Anais de XXIII Encontro Brasileiro de
Estudantes de Pós-Graduação em Educação Matemática, São Paulo, 2019.

9
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 02_Conceitos Básicos de Estatística: População, amostra e


variáveis.

Nessa aula vamos identificar elementos básicos da estatística, como


população, amostra, variáveis e suas classificações, e as fases do método estatístico
de uma pesquisa.
Palavras-chave: População; Amostra; Variáveis; Tipos de Variáveis; Fases do
método Estatístico.

ELEMENTOS BÁSICOS

População: É o conjunto de elementos com pelo menos uma característica em comum.

Esta característica comum deve delimitar claramente quais os elementos que pertencem à
população e quais elementos não pertencem.

Amostra: É um subconjunto de uma população, onde todos os elementos desse subconjunto


serão examinados para efeito da realização do estudo estatístico.

Uma vez definida a questão a ser respondida pelo levantamento dos dados
ou pela pesquisa a ser feita, vamos definir qual o objeto de estudo. Por exemplo,
queremos fazer o levantamento dos alunos reprovados em uma escola em um
determinado período. Nesse caso podemos considerar os reprovados nesse período
como o universo de estudo ou a população ao conjunto total de alunos reprovados.
Em uma pesquisa ou em um levantamento, nem sempre é possível ou
conveniente, por questões de tempo, custos, ou outro qualquer, realizar a coleta de
dados com todos os elementos da população.
Exemplo: Se uma empresa está estudando a proporção de peças defeituosas em
uma produção total, a população será constituída por todas as pelas produzidas no
período considerado e uma amostra pode ser constituída por qualquer subconjunto
de peças. No entanto a empresa pode querer estudar apenas as peças produzidas
por uma determinada máquina de seu equipamento. Dessa forma o conjunto de

10
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

peças produzidas por essa máquina, que no primeiro caso constituía uma amostra,
passa a ser agora considerado a população de estudo.
Vamos supor que queremos analisar os alunos que tem algum problema de
visão em uma determinada escola. Levantamos primeiro os alunos que usam óculos,
os deficientes visuais e os que os professores suspeitam que necessitem de óculos.
Ou seja, problema de visão, é uma característica que se quer observar e que pode
variar de um para outro aluno, dentro de um conjunto de possibilidades. Esse tipo de
característica recebe o nome de variável estatística, ou simplesmente variável.
Logo temos que:
Variável: É a característica dos elementos da amostra que será investigada
estatisticamente

VARIÁVEL ESTATÍSTICA

Considere que a questão formulada em uma pesquisa seja: “Qual é seu


esporte favorito?”

Neste caso, “esporte” é a variável da pesquisa.


Futebol, natação, voleibol e basquetebol são alguns valores dessa variável.

TIPOS DE VARIÁVEL

As variáveis podem ser categóricas (qualitativas) ou numéricas


(quantitativas).
➢ Variáveis qualitativas: são características de uma população que não
pode ser medidas. Se subdividem em: Ordinais e Nominais
• Ordinais: grau de gravidade de uma doença, ano da escolaridade,
entre outros.
• Nominais: sexo, gosto musical, tipo de flor, entre outros.

11
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

➢ Variáveis quantitativas: são características de uma população que


pode ser quantificada. São dos tipos:
• Discretas: número de cirurgias, número de irmãos, nº de filhos de um
casal, entre outros.
• Contínuas: idade, pressão arterial, crescimento de uma planta em cm,
tempo de decomposição de alguma substância, entre outros.

As definições das variáveis são apresentadas no esquema abaixo .

VARIÁVEL VARIÁVEL
QUALITATIVA QUANTITATIVA

Ordinal – expõe uma Discreta – expõe uma


qualidade e seus quantidade através de
valores seguem uma um número natural, pois
ordem. indica um contagem.

Nominal – expõe uma Contínua – expõe uma


qualidade, mas seus quantidade através de um
valores não seguem número real, pois indica
uma ordem. uma medida

Além de identificar a variável, para poder trabalhar os dados devemos nos


ater a todo o processo do método estatístico, veja a seguir essas fases.

FASES DO MÉTODO ESTATÍSTICO

a. Definição do problema
O que se pretende investigar, pesquisar, avaliar? É quando se define qual é o
problema que quer se resolver, delimitando-se o objeto de estudo de forma viável
em relação ao tempo e aos recursos disponíveis.
b. Planejamento
Após a definição do problema a ser estudado, o planejamento consiste em
determinar os procedimentos para a investigação e solução do problema. É a etapa

12
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

onde são estabelecidos os detalhes mais importantes do estudo: o cronograma geral,


a metodologia da coleta de dados, a definição do tamanho da amostra, entre outros.
c. Coleta ou levantamento dos dados
É a obtenção, reunião e registro sistemático de dados.
d. Crítica dos dados
Etapa onde são observadas as discrepâncias nos dados obtidos e, se
necessário, decidir se haverá uma nova coleta de dados, descarte do dado
discrepante ou complementação das informações sobre esse dado.
e. Apuração dos dados ou sumarização
É o processo de sumarização dos dados obtidos mediante critério de
classificação.
f. Apresentação dos dados
Após a apuração, os dados são organizados conforme o objetivo e
apresentados sob a forma de tabelas, gráficos e medidas.
g. Análise e interpretação dos dados
É a etapa onde são feitas medidas complementares a partir dos dados
coletados que darão suporte a deduções e/ou induções sobre as informações
obtidas, como também as conclusões sobre o estudo em questão. É o resultado do
trabalho estatístico, com solução para o problema definido na primeira fase.

Todo o processo exige conhecimento técnico, do fenômeno ou evento que se


está analisando.

REFERÊNCIA

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

13
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 03_Representação dos dados através de tabelas

Nessa aula iremos identificar os tipos de tabelas, suas características,


elementos importantes para a sua construção.
Palavras-chave: Tabelas simples; Tabelas de dupla entrada; Tabelas de frequência;
elaboração de tabelas.

A IMPORTÂNCIA DAS TABELAS E SEUS TIPOS

As tabelas atualmente são consideradas textos, onde é possível com a sua


leitura interpretar os dados, assim como diante de uma pesquisa estatística ser uma
maneira de organizá-los.
Segundo Estrella (2014), uma tabela é uma forma de representação
retangular que permite mostrar clara e resumidamente os dados correspondentes a
uma ou mais variáveis, visualizar o comportamento dos dados e facilitar o
entendimento das informações.
Lahanier-Reuter (2003) distingui três tipos de tabela.

1) Tabela de dados, que é como uma tabela simples, que não funciona em
ideias de frequência ou de distribuição, mas apenas de uma variável e um
valor.
2) Tabela de distribuição de frequência, que é uma tabela na qual as
frequências obtidas estão representadas agrupando ou contando dados,
valores ou categorias iguais de uma variável.
3) Tabela de contingência (dupla entrada) - uma tabela na qual as duas
variáveis são cruzadas.

14
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

a) Título – localizado no topo da tabela, formado por um conjunto de informações, as mais


completas possíveis, identificando o tipo de variável que está sendo analisado, o local e o
período em que os dados foram coletados. O título deve responder a três questões: O quê?
Onde? Quando?
b) Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas
c) Corpo – é o conjunto de linhas e colunas que contém as informações sobre a variável em
estudo. O espaço destinado a um único dado ou número é denominado casa ou célula.
d) Coluna indicadora – parte da tabela que especifica o conteúdo das linhas.
e) Linhas – são retas horizontais imaginárias que facilitam a leitura de dados.
f) Elementos complementares – são os elementos colocados no rodapé da tabela, tais como
fonte, notas ou chamadas. A fonte identifica quem coletou originalmente os dados

TABELA SIMPLES
Uma tabela que facilmente um professor vai montar em uma sala de aula,
pode ser chamada de uma tabela simples, indicando o nome do aluno e a nota, como
por exemplo, a tabela I abaixo.

Tabela 1: Notas de Estatística dos alunos da sala A


Aluno Nota
Alice 6,0
Eduardo 7,5
Cristian 6,5
Fonte: Dados fictícios

Observem que a tabela tem um título: Tabela 1: Notas de Estatística dos


alunos da sala A.
O cabeçalho que especifica o conteúdo das colunas: Aluno e Nota.
O corpo que discrimina o aluno e a sua respectiva nota.
A fonte como elementos que complementam a tabela, e fato muito importante
quando se lê um jornal, revista ou assisti uma reportagem na TV, pois a fonte dos
dados pode dizer sobre a confiabilidade das informações que elas geram.

Um outro exemplo de tabela simples que se encontra na mídia referente ao


índice de desenvolvimento humano no Brasil nos últimos anos, na tabela II a seguir.

15
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Tabela II - IDH do
Brasil nos Ano de referência IDH últimos
anos 2010 0,699
2011 0,718
2012 0,742
2013 0,744
2014 0,754
2015 0,757
2016 0,758
2017 0,758
2018 0,759

Fonte: Mundo educação (2019)


Disponível em: https://mundoeducacao.uol.com.br/geografia/idh-brasil.htm

TABELAS DE DUPLA ENTRADA


A tabela a seguir apresenta duas variáveis em relação a alunos de um curso
de Licenciatura de Matemática, em relação a sexo e idade.

Tabela III – Alunos da Licenciatura em Matemática

Idade
Sexo
Menor que 23 anos Maior ou igual a 23 anos Total
F 5 4 9
M 4 3 7
Total 9 7 16
Fonte: Adaptada de Figueiredo (2019)

É possível observar que temos título; cabeçalho; corpo e fonte, e também que
ao ler tabela dessa natureza podemos observar a interseção entre as duas variáveis,
como por exemplo, a quantidade de alunos menores de 23 anos que são do sexo
masculino, que é o cruzamento das duas informações pela linha e pela coluna
correspondentes, que são 4 alunos correspondentes, assim como a coluna vertical
indicando referente ao total de alunos do sexo feminino e masculino, como a linha
total horizontal que indica o total de alunos menores de 23 anos e maiores ou igual

16
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

a 23 anos. Portanto, uma tabela que traz muitas informações sobre o contexto
estudado.

TABELA DE FREQUÊNCIA
Na tabela de frequência são tabelas que organizam e resumem o conjunto de
dados coletados em uma pesquisa. Em uma tabela de frequências, geralmente
constam a frequência absoluta (Fa ou fi) 0, que corresponde ao número de vezes que
cada valor da variável aparece nos dados obtidos; a frequência relativa (Fr), que é a
razão entre a frequência absoluta e o número total de dados disponíveis; a
frequência relativa pode ser expressa também na forma de porcentagem.
Vamos observar o exemplo a seguir na tabela IV, dos elementos que
constituem uma tabela de frequência:

Tabela IV - Produção e Variação anual por Produto

Fonte: Adaptado de IBGE

Disponível em: https://censos.ibge.gov.br/2013-agencia-de-noticias/releases/22525-em-agosto-


ibge-preve-safra-6-2-menor-que-a-de-2017.html

Outro exemplo muito comum que aparecem em livros didáticos da educação


básica independente da área de conhecimento; matemática; física; química; ciências
sociais entre outras.
Tabela V- Tempo em anos de professores em
determinada escola

17
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância
Fonte: IEZZI (2016, p.123)

Percebam que a tabela está incompleta e se você conhecer as leis de sua construção
poderá facilmente preencher os dados que faltam.

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.
ESTRELLA, S. El formato tabular: una revisión de literatura. Revista Actualidades
Investigativas en Educación, 14(2), 1-23, 2014.

FIGUEIREDO, A. C. Probabilidade condicional em contexto de ensino


aprendizagem. Probabilidade condicional em contexto de ensino aprendizagem.
Educação Matemática Pesquisa, 21(5), 544-554, 2019.

LAHANIER-REUTER, D. (2003). Différents types de tableaux dans l’enseignement


des statistiques. Spirale: Revue de Recherches en Éducation, 32, 143-154.
IEZZI, G. et al. Matemática: ciências e aplicações, volume 3: ensino médio. – 9.
ed. – São Paulo: Saraiva, 2016.

18
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 04_Como organizar dados em tabelas Sem Intervalos de


Classe

Nessa aula, iremos construir tabelas de frequência com dados que


representam variáveis qualitativas e quantitativas discretas.
Palavras-chave: Rol; Tabelas de frequência; Variável Qualitativa; Variável
Quantitativa Discreta.

Denomina-se frequência o quanto (número de vezes que ela ocorre), uma


determinada variável figura em um conjunto. Podendo ser absoluta ou relativa. A
frequência absoluta é o número de vezes em que uma determinada variável assume
um valor.

VARIÁVEL QUALITATIVA
Por exemplo: numa pesquisa com 10 alunos para identificar se preferem
estudar Português ou Matemática, 6 responderam Matemática e 4 Português; logo,
a frequência absoluta para a variável Matemática é 6.
A frequência relativa é o quociente entre a frequência absoluta e o número
total de dados. Quando a multiplicamos por 100 obtemos a porcentagem de
representação da variável. No exemplo mencionado acima, a frequência relativa da
variável Matemática é de 6/10, ou seja, de 60%.
A variável aqui estuda a preferência de estudo, que podemos chamar de área
de conhecimento, se configura uma variável qualitativa nominal e vamos
representar em uma tabela com as suas respectivas frequências.

Tabela 1 – Preferência de alunos por área de conhecimento


Área de Frequência absoluta (fa) Frequência relativa Frequência relativa
Conhecimento (fr) percentual (fr%)
Português 4 0,4 40%
Matemática 6 0,6 60%
Total 10 1 100%
Fonte: dados fictícios

19
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Observem que há uma diferença entre as frequências relativas e as


frequências relativas percentuais, uma é representada por valor absoluto e a outra
em porcentagem.

VARIÁVEL QUANTITATIVA DISCRETA


Distribuição de Frequência
➔ É um tipo de tabela que condensa uma coleção de dados conforme as
frequências (repetições de seus valores).
Tabela primitiva ou dados brutos: É uma tabela ou relação de
elementos que não foram numericamente organizados. É difícil formarmos uma ideia
exata do comportamento do grupo como um todo, a partir de dados não ordenados.
Vamos tomar como exemplo a quantidade de acidentes automobilísticos
ocorridos em uma grande cidade no Brasil, durante os últimos 20 dias do ano de
2021.
É preciso destacar que estamos trabalhando com uma variável quantitativa
discreta, pois se trata de contagem de elementos, e os números se encontram
abaixo.
Exemplo: 45, 41, 42, 41, 42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60,
51
ROL: É a tabela obtida após a ordenação dos dados (crescente ou decrescente).
Dados acima em ordem crescente:
41, 41, 41, 42, 42 43, 44, 45,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60.
Distribuição de frequência SEM INTERVALOS DE CLASSE: É a simples
condensação dos dados conforme as repetições de seus valores.

Tabela 2 – Número de acidentes na cidade nos últimos 20 dias do ano


Nº de acidentes Frequência Frequência relativa %
41 3 15%
42 2 10%
43 1 5%
44 1 5%
45 1 5%
46 2 10%
50 2 10%
51 1 5%

20
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

52 1 5%
54 1 5%
57 1 5%
58 2 10%
60 2 10%
Total 20 100%
Fonte: Dados fictícios

A tabela acima está correta, mas poderíamos melhor descrever esta tabela se
usássemos intervalos de classe. Um ROL de tamanho razoável, esta distribuição de
frequência é inconveniente, já que exige muito espaço.
As tabelas de frequências são para simplificar a observação dos dados
coletados e muitas vezes temos que dividir esta tabela em classes para melhor
visualização da situação real.

Distribuição de frequência COM INTERVALOS DE CLASSE: Quando o


tamanho da amostra é elevado, é mais racional efetuar o agrupamento dos valores
em vários intervalos de classe.

Tabela 3 – Número de acidentes na cidade nos últimos 20 dias do ano


Classes Frequências
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20
Fonte: dados fictícios

Os mesmos dados apresentados na primeira tabela estão na segunda tabela,


porém estão divididos em intervalos de classe.
Esses intervalos de classe podem ser construídos para variáveis quantitativas
discretas, no qual a tabela sem os intervalos de classe não traz os dados de forma
clara, isto é, apresentam muitas linhas e a observação dos dados não é tão imediata.

21
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.

22
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 05_ Organizar dados em Tabelas com Intervalos de Classe _


Variável Discreta

Nessa aula iremos tratar dados para a construção de tabelas com intervalos
de classe de variáveis quantitativas discretas.
Palavras–chave: Amplitude de Dados; Classes; Intervalos de Classe; Tabelas de
Frequência; Variável Discreta.

Os dados referentes ao rol e à tabela gerada a seguir podem ser apresentados


por uma tabela com intervalo de classes, embora estejamos tratando de número de
acidentes automobilísticos em uma determinada cidade nos últimos dias do ano, e
se trata de uma variável quantitativa discreta. A seguir o rol da variável quantidade
de acidente de carros e a tabela de frequência sem intervalos de classe.
ROL: 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60.

Tabela 2 – Número de acidentes na cidade nos últimos 20 dias do ano


Nº de acidentes Frequência Frequência relativa %
41 3 15%
42 2 10%
43 1 5%
44 1 5%
45 1 5%
46 2 10%
50 2 10%
51 1 5%
52 1 5%
54 1 5%
57 1 5%
58 2 10%
60 2 10%
Total 20 100%
Fonte: dados fictícios

Primeiros conhecimentos para organizar os dados em tabelas com


Intervalos de Classe

23
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Para organizar um conjunto de dados referentes ao primeiro passo é


necessário estudar algumas características desses dados para que possamos
organizá-los melhor. Para isso introduziremos alguns conceitos:

➢ Amplitude Total ou Amplitude do conjunto (da amostra ou da população):


é a diferença entre o maior valor e o menor.
➢ Classe: é um intervalo que agrupa dados da amostra ou população.
➢ Número de classes: é o número de intervalos que queremos determinar
dentro da amostra ou população
➢ Amplitude da classe: é a diferença entre o maior e o menor valor dentro
dessa classe.
A Amplitude Total desses dados será 60 – 41 = 19

Precisamos, agora, descobrir quantas classes terá a nossa tabela, e para


isso temos dois processos que podem ser realizados, depende do nível dos alunos
que estamos trabalhando.
Os mesmos dados apresentados na primeira tabela estão na segunda tabela,
porém estão divididos em intervalos de classe.
Vamos apresentar duas maneiras para dividir estes dados em intervalos de
classe.
• Pelo critério da Raiz Quadrada
Para o cálculo da quantidade de classes, existem algumas fórmulas:

K = N , onde N é a quantidade total de observações.


Tomando a nossa primeira tabela como referência, temos K = 20, isto é, foram
feitas 20 observações.
√20 ≅ 4,47
Isto nos indica que podemos criar na tabela 4 ou 5 linhas, fica a critério do
professor ou pesquisador.

Este critério pode ser usado em sala de aula no 9º ano do Ensino Fundamental, ocorre
neste ano a introdução dos números irracionais.

• Pelo Critério de Sturges


Fórmula de Sturges: K  1 + 3,3. log N

24
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

No mesmo exemplo citado acima temos que K ≈ 1 + 3,3. logN


K ≈ 1 + 3,3.log20
K ≈ 1 + 3,3.1,301
K ≈ 5,2933 ≈ 5

Este critério pode ser usado em sala de aula somente no Ensino Médio, o aluno tem contato com
o logaritmo no 1º ano do Ensino Médio.

Tomaremos o Nº de classes como sendo 5


Resta calcular agora o intervalo da classe ou amplitude do intervalo de classe,
para isso dividiremos a amplitude total pelo número de classes, nesse caso, temos
19 dividido por 5 que dá aproximadamente como resultado 3,8, e, portanto
aproximadamente 4.

𝟏𝟗
𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 𝒅𝒂𝒔 𝒄𝒍𝒂𝒔𝒔𝒆𝒔 = = 𝟑, 𝟖 ≅ 𝟒
𝟓

OBS: Se os dados forem apresentados sem casas decimais, é conveniente que


os seus intervalos também sejam dessa maneira.
OBS: É aconselhável fazer uso de uma calculadora científica, pois ele fornece esses
resultados automaticamente.
Estamos, portanto, construindo nossa tabela de outra maneira para os dados
relativos aos acidentes de carro na cidade investigada.
Construindo a tabela temos que começar o intervalo da 1ª classe com 41, pois
é o menor valor e a partir dele somamos 4.
41 |------- 45 observem nesse intervalo que 41 é o limite inferior da 1ª Classe
e o 45 é o limite superior dessa classe. Outra indicação desse intervalo, é que o
símbolo 41 |, indica que o 41 está nesse intervalo, porém o 45 estará presente na
classe seguinte e assim por diante.
Para determinar a frequência de cada classe temos que contar no rol, a
quantidade de acidentes entre 41 até 44 para a primeira classe, e assim para as
demais classes.
Que gera a tabela 3 a seguir.

Tabela 3 – Número de acidentes na cidade nos últimos 20 dias do ano

25
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Classes Frequências
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20
Fonte: dados fictícios

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.

26
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 06_Atividades sobre variáveis e sua representação em tabelas

Nessa aula vamos colocar em prática alguns dos conceitos de estatísticas


aprendidos nas lições anteriores.
Palavras-chave: Classificação de Variáveis; Construção de tabelas Simples:
simples, dupla entrada e de frequência; Construção de tabelas com intervalos de
classe.

ATIVIDADES

1- Classifique as variáveis abaixo:


(a) Salários dos empregados de uma indústria.
(b) Opinião de consumidores sobre determinado produto.
(c) Número de respostas certas de alunos num teste com dez itens.
(d) Temperatura diária da cidade de Manaus.
(e) Porcentagem da receita de municípios aplicada em educação.
(f) Opinião dos empregados da Companhia MB sobre a realização ou não de
cursos obrigatórios de treinamento.
(g) QI de um indivíduo.

27
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância
Tabela 1: Informações sobre estado civil, grau de instrução, número de filhos, salário (expresso como fração
do salário-mínimo), idade (medida em anos e meses) e procedência de 36 trabalhadores da educação de um
município.

Fonte: adaptado de Morettin, Pedro Alberto, Estatística Básica/Pedro A. Morettin, Wilton O. Bussab. – 6. ed. p.11. – São

Paulo: Saraiva, 2010.

2 - Com os dados propostos na Tabela 1 construa:

a) Uma tabela simples;


b) Uma tabela de dupla entrada;
c) Uma tabela de frequência;
d) Uma tabela com intervalos de classe.
e) Identifique as variáveis escolhidas para construir as tabelas dos itens
anteriores.

OBS: Lembre-se de contemplar todos os tipos de variáveis na construção das


tabelas.

28
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.

MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.


Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

29
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 07_Organizar dados em Tabelas Com Intervalos de Classe _


variável Contínua

Nessa aula iremos tratar dados para a construção de tabelas com intervalos
de classe de variáveis quantitativas contínua.
Palavras-chave: Amplitude de Dados; Classes; Intervalos de Classe; Tabelas de
Frequência; Variável Contínua.

Lembramos a todos, que a variável contínua envolve medidas e não


contagem, e, portanto o exemplo abaixo trata-se da metragem de apartamentos
disponíveis a venda em uma determinada cidade.
Um exemplo de variável contínua

Uma pesquisa realizada com 106 apartamentos à venda em um bairro da cidade, com relação ao
tamanho, apontou os seguintes valores em metros quadrados:

100 100 101 105 105 105 110 110 110 110
115 115 115 120 120 120 120 120 120 120
125 125 125 125 125 125 125 128 128 130
132 132 132 132 135 135 135 135 135 135
140 140 140 140 140 140 140 140 140 140
140 146 146 146 146 146 146 146 150 150
155 155 155 155 155 155 155 155 155 155
160 160 160 160 160 160 160 160 160 160
185 185 190 190 190 210 210 210 210 210
220 220 250 250 250 250 270 310 310 310
310 315 315 315 315 315
Precisamos identificar esses valores:

▪ Amplitude do conjunto;
▪ Classe;
▪ Número de classes;
▪ Amplitude da classe.

número de elementos n 106


mínimo 100
máximo 315
amplitude do conjunto 215

30
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Para determinar o número de classes podemos fazer uso de duas fórmulas


(não existe uma regra que obrigue a usar uma ou outra pode ser também por
conveniência).
A primeira delas é a regra de Sturges:
𝒌=𝟏+𝟑,𝟑𝟑. 𝒍𝒐𝒈. 𝒏, onde n é o número de elementos da amostra.
A outra regra é a regra da raiz:
𝑘=√𝑛. Vejamos nesse exemplo:

a. Pela Regra de Sturges: k = 1 + 3,33.log106, ou seja, k = 7,74. Como o


número de classes deve ser um número inteiro, podemos arredondar para 7 (o maior
inteiro contido no número) ou para 8 (arredondamento científico).
b. Pela Regra da Raiz: k = √106, ou seja, k = 10,29, que pode ser
arredondado para 10 ou para 11.
c. Neste exemplo faremos k = 8 pela regra de Sturges e k = 10 pela regra
da raiz.

O que fazer com o número de classes?

Pense agora que nossa amostra é uma régua, de tamanho 215 (At = 315 -

100) e que queremos parti-la em 8 pedaços. Basta então dividir o tamanho pelo
número de pedaços e teremos o tamanho desses pedaços, que determinam as
classes.
215
➢ Pela Regra de Sturges: ℎ = = 26,875. Como os valores da amostra
8

são todos inteiros, podemos também arredondar o tamanho da classe h


para um número inteiro. Assim, assumiremos h = 27.
215
➢ Pela Regra da Raiz: ℎ = ou seja, h = 21,5. Arredondando podemos
10

assumir que h = 22.


Para estabelecer as classes:
➢ Pela Regra de Sturges: devemos tomar o menor valor da amostra e
somar, sucessivamente, o valor de h. No caso da regra de Sturges,
tomamos 100, que é o menor valor, e somamos sucessivamente 27, até
que o resultado ultrapasse o maior valor, ou seja, 315.
Menor valor: 100

31
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

100 + 27 = 127
127 + 27 = 154
154 + 27 = 181
181 + 27 = 208
208 + 27 = 235
235 + 27 = 262
262 + 27 = 289
289 + 27 = 316
(ultrapassa o maior valor)
Podemos ultrapassar um pouco o maio valor, desde que caibam valores na última
classe.

As classes ficam:
[100; 127[
[127; 154[
[154; 181[
[181; 208[
[208; 235[
[235; 262[
[262; 289[
[289; 316[

Tabela 1 – Apartamentos a venda de acordo com a metragem

Classes Metragem Número de apartamentos


1ª 100 127 27

2ª 127 154 33

3ª 154 181 20

4ª 181 208 5

5ª 208 235 7

6ª 235 262 4

7ª 262 289 1

8ª 289 316 9

Total 106

Fonte: dados fictícios

32
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 08_A importância do cálculo das frequências nas tabelas de


variáveis qualitativas e quantitativas discretas

Nessa aula estudaremos algumas frequências que podem ser relevantes para
a interpretação dos dados nas tabelas.
Palavras-chave: Frequência absoluta; Frequência relativa; Frequência acumulada;
Frequência relativa acumulada; Variável qualitativa; Variável quantitativa discreta.

Frequência absoluta (fi) - frequência absoluta de uma classe de ordem i é o


número de dados que pertencem a essa classe.
Frequência relativa (fri) - frequência relativa de uma classe de ordem i, é o
quociente da frequência absoluta dessa classe (fi), pelo total, ou seja,
fi
fri =
Total
Obs.: a soma de todas as frequências absolutas é igual ao total.

Frequência acumulada (Fi) - frequência acumulada de uma classe de ordem


i, é a soma das frequências até a classe de ordem i.
Frequência relativa acumulada (Fri) - frequência relativa acumulada de uma
classe de ordem i, é a soma das frequências relativas até a classe de ordem i.
Variável qualitativa - Tabelas e Frequência sem intervalos de classe.
Uma pesquisa de preferência musical entre alunos de uma determina sala de
aula apresentou os seguintes dados:

Preferência Musical

Clássica (C)
Pop (P)
Rock (R)
Jazz (J)
Outro (O)
Nenhum (N)

ROL

33
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

C P P P O

R J O P C

C J R R N

J P J O P

P R R P P

Esta pesquisa trata de uma variável qualitativa nominal, o fenômeno estudado


é preferência musical, variável pertinente para ser trabalhada com alunos do Ensino
Fundamental.

Tabela de Frequência das Preferências Musicais

Frequência
Preferência Frequência Frequência
Relativa
Musical Absoluta relativa
percentual

Clássica (C) 3 0,12 12%


Pop (P) 9 0,36 36%
Rock ( R) 5 0,20 20%
Jazz (J) 4 0,16 16%
Outro (O) 3 0,12 12%
Nenhum (N) 0,04
1 4%
Total 1
25 100%
Dados fictícios

OBS: Geralmente não se calcula frequências acumuladas de variáveis


qualitativas.
Além de conhecimentos da Estatística de formulação das Tabelas, os alunos
devem mobilizar, conceitos da Matemática que envolve fração e porcentagem.

Variável quantitativa discreta - Tabelas e Frequência sem intervalos de


classe.
Número de irmãos dos alunos de uma determinada sala de aula.

ROL

34
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Número de irmãos
1,0 0,0 1,0 2,0 2,0 1,0 0,0
1,0 1,0 4,0 2,0 2,0 4,0 3,0
0,0 1,0 2,0 4,0 2,0 2,0 1,0
2,0 0,0 1,0 1,0 1,0 2,0 3,0
1,0 1,0 2,0 2,0 3,0 3,0 4,0

Tabela: número de irmãos de uma determinada sala de aula

Frequência Frequência
Nº Frequência Frequência
Absoluta relativa %
Filhos absoluta relativa.
acumulada acumulada
0 4 4 0,11429 0,11429 11,43%
1 12 16 0,34286 0,45715 34,29%
2 11 27 0,31429 0,77144 31,43%
3 4 31 0,11429 0,88573 11,43%
4 4 35 0,11429 1 11,43%
Total 35 1 100%
Dados: fictícios

Número de observações (Amostra) n = 35


Maior valor do ROL = 4,0
Menor valor do ROL = 0,0
Fonte: fictícia

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.


MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.
Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

35
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 09_A importância do cálculo das frequências nas tabelas de


variáveis quantitativas contínuas

Nessa aula estudaremos algumas frequências que podem ser relevantes para
a interpretação dos dados nas tabelas com variáveis contínuas.
Palavras-chave: Frequência absoluta; Frequência relativa; Frequência acumulada;
Frequência relativa acumulada; Variável quantitativa contínua.

Variável quantitativa contínua - Tabelas e Frequência com intervalos de


classe.
Uma professora anotou todas as notas dos seus alunos de uma determinada
avaliação e registrou os seguintes dados abaixo:

Notas dos alunos na Avaliação


6,0 7,5 8,0 9,0 10,0 6,0 9,5

8,0 8,5 6,0 5,5 4,0 3,5 5,0

10,0 9,0 6,5 8,0 4,5 6,5 7,0

8,5 7,0 4,5 3,5 2,5 4,0 7,5

6,0 9,0 6,5 7,0 7,5 5,0 2,5

Rol

2,50 4,50 6,00 7,00 8,00 9,00

2,50 4,50 6,00 7,00 8,00 9,00

3,50 5,00 6,00 7,00 8,00 9,50

3,50 5,00 6,50 7,50 8,50 10,00

4,00 5,50 6,50 7,50 8,50 10,00

4,00 6,00 6,50 7,50 9,00

Número de observações n = 35,00


Maior valor do ROL = 10,0
Menor valor do ROL = 2,5
Amplitude da Amostra At = 7,5

36
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Quantidade de Classes - K K = √n = 5,92


Intervalo de Classes - IC IC=At/K = 1,268

Como o critério da raiz forneceu um número com casas decimais, podemos


optar tanto para considerar 5 classes como 6 classes.
Na tabela abaixo consideramos 5 classes.
Tabela 1 - Notas de alunos na Avaliação
Frequência
Frequência Frequência
Frequência Frequência relativa
Classes K IC Absoluta relativa
absoluta relativa percentual
acumulada percentual
acumulada
1 2,5 Ⱶ 4,0 4 4 0,1143 11,43% 11,43%
2 4,0 Ⱶ 5,5 6 10 0,1714 17,14% 28,57%
3 5,5 Ⱶ 7,0 8 18 0,2286 22,86% 51,43%
4 7,0 Ⱶ 8,5 9 27 0,2571 25,71% 77,14%
5 8,5 Ⱶ 10 8 35 0,2286 22,86% 100%
Total 35 1 100%
Fonte: Dados fornecidos pela professora

Amplitude da amostra = Maior valor do rol - o menor valor do rol.


Intervalo de classes (Ic) = Amplitude da amostra/ Quantidade de Classes.

Algumas possíveis leituras sobre os dados que podemos fazer ao ler a tabela
construída acima:

1) Ao observar a tabela de frequência relativa a notas dos 35 alunos podemos


concluir lendo a coluna relativa à frequência relativa acumulada percentual que
51,43% dos alunos obtiveram notas menores do que 7 na avaliação.

2) Se a média de aprovação for 7,0 nessa escola, somente 48,57% dos alunos
seriam aprovados, pois seria a soma de 25, 71% + 22,86%, que representam os
valores da coluna da frequência relativa percentual referentes a 4ª e a 5ª Classe.

37
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Muitas outras constatações poderíamos levantar, ao ler essa tabela de


frequência, e dependendo do contexto que está sendo analisado, poderíamos ter
várias considerações sobre a variável estudada.

Atividade Proposta

1) Fez-se uma pesquisa com 45 turistas que frequentam as praias do litoral


norte, que buscava identificar qual a praia preferida por eles. O resultado
aparece na lista seguinte.

Toninhas Cocanha Toninhas Lagoinha Toninhas


Maranduba Lagoinha Maranduba Maranduba Cocanha
Lagoinha Toninhas Maranduba Pereque Maranduba
Maresias Maranduba Cocanha Lagoinha Maranduba
Maranduba Lagoinha Lagoinha Toninhas Cocanha
Maranduba Lagoinha Toninhas Maranduba Lagoinha
Maranduba Toninhas Cocanha Lagoinha Maranduba
Lagoinha Cocanha Cocanha Toninhas Maranduba
Toninhas Cocanha Maresias Maranduba Lagoinha

a) Qual é a variável de interesse nessa pesquisa? Classifique – a, justificando sua


resposta.
b) Construa a tabela de distribuição de frequências que representa os dados
coletados.
c) O número de turista que frequenta Toninhas e Cocainha, juntos, supera o dos que
frequentam Maraduba? Qual a diferença observada entre esses totais?

38
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

2) Em uma região da cidade de São Paulo, existem algumas escolas estaduais nas
quais a evasão escolar ocorre já há cinco anos. As autoridades das escolas
divulgaram os dados de evasão bimestral em números de alunos, conforme dados
abaixo:
16 10 12 17 14 18 25 37 29 14
13 12 17 43 18 10 23 15 10 11
11 17 15 16 10 28 39 33 08 09

a) Que variável estamos estudando?


b) Monte um Rol.
c) Construa uma tabela com intervalos de classe, com título e rodapé.
d) Utilize o Critério da Raiz e compare o número de classes com o critério de
Sturges.
e) Distribua os dados na Tabela, com suas respectivas frequências.
f) O estudo desse conteúdo você considera relevante para um professor?
Justifique.

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.
LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.
MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.
Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

39
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 10_Representação dos dados através de gráficos: Gráfico de


Setores

Nessa aula iremos identificar elementos importantes para a construção do


gráfico de setores para representar dados de variáveis qualitativas.

Palavras–chave: Gráfico de Setores; Relação entre tabela e gráficos; regra de três;


Ângulos.

GRÁFICOS
Os gráficos constituem importantes instrumentos de análise e interpretação de
um conjunto de dados. A importância dos gráficos está diretamente relacionada à
facilidade na absorção e interpretação das informações e, também às inúmeras
possibilidades de ilustração e resumo dos dados apresentados. Passaremos agora
a analisar alguns tipos de gráficos.

Gráfico de Setores: também conhecido como pizza, tem forma de círculo, onde os
dados são representados proporcionalmente ao ângulo central correspondente.
Observe o gráfico de setores a seguir retirado de uma tabela apresentada nas aulas
anteriores.
Lembrando que gráfico também deve ter título e legenda assim como as
tabelas. A varável que estamos apresentando é uma variável qualitativa nominal.

Preferências Musicais
Nenhum (N)
4%
Clássica (C)
Outro (O)
12% Clássica (C)
12%
Pop (P)

Jazz (J) Rock ( R)


16% Jazz (J)
Pop (P)
Outro (O)
36%
Nenhum (N)
Rock ( R)
20%

Fonte: Dados fictícios

40
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Como montar este gráfico?


Vamos tomar como ponto de início a tabela de frequência que foi construída
sobre as preferências musicais de alunos de uma determinada escola.
Como no círculo a medida pode ser em graus e o total de graus é de 360º
estabelecemos a seguinte relação:

O total de 360º (graus do círculo) está para 100% (total de alunos) assim como a porcentagem
que queremos determinar a quantidade de graus da está para “x”.

O que mobilizamos nesta situação é a Regra de Três Simples e podemos


elaborar os cálculos da seguinte forma tomando como base a Tabela de frequência
a seguir:
3600 -------100%
TABELA: Preferências Musicais
X --------- 12%
Preferência Frequência Frequência Utilizamos para resolver o conceito
Musical Absoluta Relativa
de razão e proporção:
Clássica (C) 3 12,00% O produto dos meios é igual o produto
Pop (P) 9 36,00% dos extremos.
Rock ( R) 5 20,00% E passamos a ter a seguinte expressão:
Jazz (J) 4 16,00%
x. 100% = 12%. 360º
Outro (O) 3 12,00%
𝟏𝟐% .𝟑𝟔𝟎º
Nenhum (N) 1 4,00% x= ≈ 43º
𝟏𝟎𝟎%
Total 25 100,00%
Fonte: Dados fictícios

O arredondamento neste caso é muito importante, pois devemos marcar um


ângulo no círculo, o instrumento que temos para isso é o “transferidor” como
mostramos a seguir, e localizar 43º é possível com este instrumento:

41
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

43o

Os arredondamentos devem seguir uma convenção já estabelecida pela lei


do arredondamento, primeira casa decimal ser > 5 aumentamos a anterior, ou se <
5 permanece como está a anterior.
No nosso caso teríamos um ângulo de 43, 3º, 3 < 5, logo permanece 43º como
o valor arredondado.
E assim continuamos a determinar quantos graus representam do Círculo os
demais valores da Tabela de Frequência.

360o ------ 100% 360o ------ 100% 360o ------ 100%


x--------9% x--------5% x-------- 4%

360𝑜 . 9%
𝑥= = 32,4 ≅ 32𝑜
100%

360𝑜 . 5%
𝑥= = 18𝑜
100%

360𝑜 . 4%
𝑥= ≈ 14,4𝑜 = 14𝑜
100%

360o ------ 100% 360o ------ 100%

x--------3% x--------1%

360𝑜 . 3% 360𝑜 . 1%
𝑥= = 10,8º ≅ 11𝑜 𝑥= = 36𝑜
100% 100%

42
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Com estes dados conseguimos montar o gráfico apresentado acima e com


uma visão de professor de Ensino Fundamental, podemos aplicar conceitos que
envolvem a elaboração de gráfico com alunos que já dominem porcentagem, regra
de três simples, compreensão de ângulo e, portanto, podemos trabalhar esta variável
qualitativa com alunos a partir do 7º ano do ensino fundamental.
Vocês podem estar pensando, mas como trabalhar o Gráfico de setores com
alunos que estejam em anos anteriores, e neste caso pode recorrer a artifícios para
que aluno consiga dividir o círculo em partes que se aproxime dos ângulos desejados
como:

Os alunos podem usar o recurso de dividir a circunferência em 12 partes iguais, onde cada uma
corresponderá a 30º e a partir daí os alunos marcarão aproximadamente os graus desejados.
.

Atividades propostas
1) Analise a tabela abaixo:

Tabela 1 - Distribuição dos turistas que visitaram determinada Região segundo a


intenção de retorno.
Opção de retorno fi fr (%)
Sim 31 77,5
Não 9 22,5
Total 40 100
Dados fictícios

a) Construa um gráfico de setores para representar os dados acima.


b) Que conhecimento é mobilizado para elaborar este gráfico?

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.
LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.
MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.
Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

43
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 11_Representação dos dados através de gráficos: Gráfico de


Colunas ou Barras

Nessa aula iremos identificar elementos importantes para a construção do


gráfico de barras ou colunas para representar dados de tanto de variáveis
qualitativas, quanto de quantitativas discretas.

Palavras–chave: Gráfico de Barras; Gráfico de Colunas; Relação entre tabela e


gráficos; Variável qualitativa; Variável quantitativa discreta.

GRÁFICO DE BARRAS
O gráfico de barras pode ser horizontal ou vertical. Nesse tipo de gráfico, o
comprimento da barra representa a frequência da variável em estudo. O gráfico de
barras vertical também é conhecido por gráfico de colunas. Observe o gráfico de
barras a seguir, da mesma variável tratada com o gráfico de setores, de uma variável
qualitativa - Preferência Musical. Que diante da tabela a seguir nos fornece os dados
para a construção do gráfico.

TABELA: Preferências Musicais

Preferência Frequência Frequência


Musical Absoluta Relativa
Clássica (C) 3 12,00%
Pop (P) 9 36,00%
Rock (R) 5 20,00%
Jazz (J) 4 16,00%
Outro (O) 3 12,00%
Nenhum (N) 1 4,00%
Total 25 100,00%

Fonte: dados fictícios

44
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Preferências Musicais

40,00% 36,00%

30,00%

20,00%
20,00% 16,00%
12,00% 12,00%
10,00%
4,00%

0,00%
Clássica (C) Pop (P) Rock ( R) Jazz (J) Outro (O) Nenhum (N)

Fonte: elaborado pelo autor

Vocês podem observar que o gráfico foi construído com as preferências


musicais e suas frequências relativas percentuais, mas poderia ter sido também
pelas frequências absolutas.

Observem no eixo que representa as porcentagens, a distância no gráfico entre


0% e o 10% é a mesma entre os 10% e os 20% e assim sucessivamente.

É importante ao ler qualquer gráfico é identificar qual a forma de representar as


frequências, pois podem ser com valores absolutos, e neles incluem outras
unidades de medidas, como por exemplo, metros, toneladas e outras medidas
relevantes.

O gráfico de colunas é um dos gráficos mais utilizados para representar um


conjunto de dados, sendo a representação de uma série de dados através de
retângulos dispostos verticalmente. As alturas destes retângulos são proporcionais
às suas respectivas frequências. Este gráfico pode ser utilizado para representar
qualquer tipo de variável em qualquer nível de mensuração por este fato é um
recurso extremamente utilizado em pesquisas.

45
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

O gráfico de barras é uma representação de uma série de dados através de


retângulos dispostos horizontalmente. Os comprimentos destes retângulos são
proporcionais às suas respectivas frequências. Este gráfico é semelhante ao gráfico
de colunas, contudo, a posição da escala e da frequência é trocada, ou seja, na linha
horizontal temos a frequência de casos observados e na linha vertical temos a
variável de estudo, como no gráfico a seguir que trata da taxa de probabilidade de
um recém-nascido não completar um ano de vida por estados do Brasil, considerada
uma variável quantitativa e cuja fonte dos dados é o IBGE.

Fonte: IBGE Disponível em: https://biblioteca.ibge.gov.br/visualizacao/periodicos/3097/tcmb_2019.pdf

É importante ressaltar que no caso de uma variável quantitativa temos no eixo horizontal do
gráfico, uma escala de valores que devem ser observadas, pois a medida entre o 0 e o 5 devem
ser a mesma entre o 5 e 10 e assim sucessivamente

Atividade Proposta
Realizada uma pesquisa sobre notas de alunos na disciplina Biologia, gerou a
seguinte tabela:

46
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Tabela – Notas dos alunos


Notas Frequência absoluta (fi)
5 5
6 4
7 3
8 6
9 2
10 1
Total 21
Fonte: dados fictícios

a) Construa o gráfico de colunas ou de barras para representar os dados da tabela.


b) Complete a tabela colocando as frequências relativas percentuais.

REFERÊNCIAS
BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,
2015.
LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.
MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.
Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

47
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 12_Representação dos dados através de gráficos: Histograma


e outros tipos de gráficos

Nessa aula iremos identificar elementos importantes para a construção do


gráfico de nome Histograma para representar dados de variáveis quantitativas
contínuas.

Palavras-chave: Histograma; Relação entre tabela e gráficos; Variável quantitativa


contínua, Pictogramas e outros gráficos.

HISTOGRAMA
As classes são representadas por retângulos, um para cada classe dispostos
vertical e continuamente (sem espaço entre eles), cujas bases serão determinadas
pelos limites destas classes (limites inferior e superior) e cujas alturas serão
determinadas pelas frequências de cada classe, como já vimos também nas tabelas
com variáveis contínuas.
Classe - Também conhecida simplesmente como Classe de Frequência, é o
intervalo de variação dos valores que integram uma variável, é simbolicamente
representada pelo “i”, sendo:
i = 1, 2, 3,...k, onde k representa o número total de classes da distribuição.

k Tabela: n° de faltas dos alunos do 2° ano


1 N° de alunos Frequência (fi)
2 02 ├─ 04 03
3 04 ├─ 06 05
4 06 ├─ 08 10
5 08 ├─ 10 06
6 10 ├─ 12 02
total 26
Fonte: Dados Fictícios

Podemos construir o seguinte Histograma abaixo. E as linhas que unem os


pontos médios das classes nos possibilita a visualização de outro gráfico que é o de
“Polígonos”.

48
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

nº de faltas dos alunos do 2º ano

Faltas

Devemos também aqui, tomar o cuidado de deixar um espaço correspondente


a uma classe no valor de zero até dois, para a construção do Histograma, pois não
existem valores entre 0 e 2.
Se observarem o gráfico de linhas, devemos também marcar o valor 1 e o
valor 12, mesmo não sendo contemplados na tabela, tanto para a esquerda como
para a direita, para construir o Gráfico Polígono de Frequência, pois eles são valores
importantes para construir a linha.

Gráfico de Linhas
O gráfico de linha é utilizado para demonstrar uma sequência numérica de
dados referentes a uma variável ao longo do tempo. É indicado para demonstrar
evoluções (ou regressões) que ocorrem em sequência para que o comportamento dos
fenômenos e suas transformações sejam observados.

Disponível em: https://mundoeducacao.uol.com.br/geografia/tipos-graficos.htm

Neste caso temos alguns dados fornecidos pelo IBGE ao longo dos anos,
mostrada em um gráfico de linhas.

49
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Gráfico de áreas

É semelhante ao gráfico em linhas, diferenciando-se apenas por evidenciar


uma noção de proporção sobre o todo. É também usado para apontar a relação dos
diferentes dados entre si.
Para montar o Gráfico inicialmente, colocam-se todos os pontos como se
fosse formar um gráfico de linhas com um dos dados coletados, e depois pinta-se a
área entre a linha e o eixo horizontal, e entre depois se preenche de outra cor a área
entre os primeiros e segundos dados.

Disponível em: https://mundoeducacao.uol.com.br/geografia/tipos-graficos.htm

Gráfico em rede

Esse tipo de gráfico não é tão comum na disciplina geográfica, sendo mais
frequentemente utilizado para medição de termos especificamente estatísticos e até
em jogos de videogames, on-line ou do tipo RPG. Sua utilidade é comparar valores
distintos de uma mesma variável.

50
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Disponível em: https://mundoeducacao.uol.com.br/geografia/tipos-graficos.htm

Pictogramas
São construídos a partir de figuras representativas da intensidade do
fenômeno. Este tipo de gráfico tem a vantagem de despertar a atenção de alunos
das séries iniciais do Ensino Fundamental público, ou para introduzir os conceitos
em gráficos de colunas, pois sua forma é atraente e sugestiva. Os símbolos devem
ser autoexplicativos. A desvantagem dos pictogramas é que apenas mostram uma
visão geral do fenômeno, e não de detalhes minuciosos. Veja os exemplos abaixo:

a) Número de visitantes entre 1990 e 1998 em uma determinada cidade.

Dados fictícios

51
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

b) Vendas de veículos de uma determinada marca em capitais destas regiões


em um dia.

Dados fictícios

Atividade
Em uma região da cidade de São Paulo, existem algumas escolas estaduais
nas quais a evasão escolar ocorre já há cinco anos. As autoridades das escolas
divulgaram os dados de evasão bimestral em números de alunos, conforme dados
abaixo:

16 10 12 17 14 18 25 37 29 14
13 12 17 43 18 10 23 15 10 11
11 17 15 16 10 28 39 33 08 09

Com os dados acima construa um gráfico que melhor poderá representar essa
variável. Justifique suas escolhas.

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6 ed. Bauru: Pearson, 2016.

MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.


Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

52
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 13_Uso de Tecnologia: Histograma

Nessa aula vamos trabalhar a construção do histograma com o uso de


tecnologia.
Palavras-chave: Software Excel; Ensino; Histograma; Variável quantitativa
contínua.

A POSSIBILIDADE DO ENSINO COM USO DE GRÁFICOS E TECNOLOGIA


Muitas vezes observa-se no ambiente escolar certa expectativa por parte dos
professores, de qualquer área que seja, quanto à vontade de utilizar novos recursos
da informática na educação. E essa expectativa às vezes se transforma em
sentimento de insegurança ou de resistência em alterar a prática de ensino, pois o
professor neste novo contexto é desafiado a rever e ampliar seus conhecimentos
para enfrentar as novas situações.

O software Excel

O Microsoft Excel é um editor de planilhas produzido pela Microsoft para


computadores que utilizam o sistema operacional Microsoft Windows, que faz parte
de um pacote, que normalmente tem que ser pago para se ter nas residências, mas
algumas escolas oferecem esse tipo de ferramenta nos seus laboratórios, ou outra
que é free, que desempenha o mesmo papel para a construção de planilhas ou
gráficos que é o LibreOffice que tem como trabalhar planilha, editor de texto, gráficos
e muitas outras possibilidades. Vamos observar a figura a seguir:

53
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Figura 1 – Print de uma tela do Excel – sem os dados.

Fonte: Elaborado pelo autor

Observem que o cursor deixou destacado a célula A, que podemos inserir os


dados, e no outro destaque, sobre gráficos recomendados podemos escolher o
gráfico que melhor representará os nossos dados. Veja a seguir na Figura 2, os
próximos passos para a construção de um Histograma no Excel.

54
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Figura 2 – Etapas par a construção do Histograma no Excel a partir de uma tabela

Fonte: Elaborada pelo autor

Observem a tabela que possui metragem de apartamentos com intervalos de


classe, que começa com o limite inferior da 1ª classe com 100 metros quadrados e
o limite superior da primeira classe com 127.
A tabela é composta de 8 classes, e a última coluna da tabela é dada a
frequência absoluta que é a quantidade de apartamentos com a metragem em um
intervalo, que começa em 100 metros quadrados e termina na 8ª classe com 316 m 2.
Para colocar em um gráfico de excel, vamos utilizar uma tabela auxiliar, que
está na figura 2 logo acima. Como a tabela inicial não tem valores entre o e 100,
vamos colocar na primeira linha o 100 e a quantidade zero.
Em seguida, vamos colocando todos os números na sequência e a frequência
absoluta correspondente, assim como na tabela abaixo:

55
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

100 0
127 27
154 33
181 20
208 5
235 7
262 4
289 1
316 9

Em seguida selecionamos com o cursor essas duas colunas, e depois


escolhemos com o cursor um dos gráficos, que no nosso caso é o histograma, como
está na figura 2.
O gráfico se apresentará conforme a figura, depois ajuste o nome que quer
nos eixos e o título do gráfico.

56
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 14_A História que os Gráficos contam e Atividade de Tabelas


e Gráficos

Nessa aula vamos realizar uma leitura sobre gráficos e tabelas, pois já
sabemos como eles são formados e quais as maneiras de suas construções; e
também atividades que mobilizam desde conceitos com construção de tabelas, como
a representação dos dados na forma de gráficos.

Palavras-chave: Gráficos; Leitura; Escrita; Tabelas; Histograma; Variável.

A HISTÓRIA QUE OS GRÁFICOS CONTAM


Nós já aprendemos construir as tabelas e os gráficos mais importantes, mas
nada adianta ter tanta informação, sem capacidade para analisá-la, representá-la e
processá-la, e, portanto, vamos procurar seguir tudo o que aprendemos e contar as
histórias que estão por trás dos gráficos e tabelas.
Vamos analisar um gráfico e levantar as histórias que eles podem nos ajudar a contar.

Desmatamento da Amazônia dispara de novo em 2020

Dados de satélite revelam um aumento de 34% na taxa de derrubada da floresta nos


últimos 12 meses
Variação mensal de área desmatada
Dados do projeto DETER para o ano de referência (agosto-julho)

Fonte: TerraBrasilis / CC BY SA
Disponível em https://jornal.usp.br/ciencias/desmatamento-da-amazonia-dispara-de-novo-em-2020/ .Acesso em
13/06/2022.

57
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

➢ Esse gráfico faz parte de um artigo que foi publicado pelo jornal da USP,
portanto, o meio de transmissão das informações costuma ser seguro, e como
tem o link, podemos nos certificar que é realmente a origem da reportagem.
➢ A Fonte do gráfico é dado pela TerraBrasilis, que é uma plataforma
desenvolvida pelo INPE (Instituto Nacional de Pesquisas espaciais, que é um
Instituto Federal Brasileiro) para organização, acesso e uso dos dados
geográficos de monitoramento ambiental, portanto os seus dados são
confiáveis e possíveis de serem observados nos documentos do INPE.
➢ As informações que estão representadas nos gráficos são de um período de
5 anos, que vai de 2015 até 2020. Esses dados foram colocados com cores
diferentes para podermos comparar esses períodos.
➢ A variável estudada é área devastada da Amazônia, e, portanto, é uma
variável quantitativa contínua, porém como estamos representamos em outro
eixo os meses, não temos os dois eixos com números, pois os meses estão
no eixo horizontal.
➢ Podemos comparar as áreas devastadas nos referidos meses, como por
exemplo, no mês agosto de 2019/2020 ocorreu o maior devastamento no
referido mês.
➢ Se compararmos o mês de julho, observamos que houve no ano de
2018/2019, houve o maior aumento de todos os últimos cinco anos.
➢ E podemos comparar ainda outros meses, verificar a diferença percentual
entre eles, e até construir uma tabela com esses dados que são apresentados
nesse gráfico.

Ao escrever os itens acima estamos contando a história que os gráficos estão


nos contando e assim também, escrever a sua história assim como previsões futuras
sobre essa situação. Se habituem a olhar para os gráficos dessa maneira, pois
evitaremos cair em gráficos e dados duvidosos, e não acreditar nas fakenews.

ATIVIDADES PROPOSTAS

58
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

ATIVIDADE 1

Os dados seguintes são referentes ao nível de glicose de 60 crianças:

a) Construa uma distribuição de frequência.


b) Determine as frequências simples acumuladas de cada classe.
c) Determine as frequências relativas de cada classe.
d) Determine as frequências relativas acumuladas de cada classe.
e) Construa um Histograma utilizando o Software Excel.

ATIVIDADE 2
Em uma região da cidade de São Paulo, existem algumas escolas estaduais nas
quais, a evasão escolar ocorre já há cinco anos. As autoridades das escolas
divulgaram os dados de evasão bimestral em números de alunos, conforme dados
abaixo:
16 10 12 17 14 18 25 37 29 14
13 12 17 43 18 10 23 15 10 11
11 17 15 16 10 28 39 33 08 09

a) Construa uma distribuição de frequência.


b) Determine as frequências simples acumuladas de cada classe.
c) Determine as frequências relativas de cada classe.
d) Determine as frequências relativas acumuladas de cada classe.
e) Construa um GRÁFICO utilizando o Software Excel.

59
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 15_ Infográficos X Gráficos

Nessa aula aprenderemos a identificar um infográfico e analisar a parte da


estatística presente neles.
Palavras-chave: Infográfico; Gráficos; Leitura de texto.

INFOGRÁFICO

A origem da palavra infográficos remete-se a princípio na etimologia da


palavra infográfica, que advém do termo inglês information graphic, que é composto
de dois termos: info e grafia. A expressão info é de origem latina formatio e significa
representar, criar uma ideia ou noção; e a expressão grafia é de origem grega, que
indica a representação escrita.
Pesquisadores como Valero Sancho (2001), apresenta uma classificação para
os infográficos e indica que os infográficos são compostos por: textos; números;
ícones; fotografias; desenhos figurativos; requadros; linhas e setas; pontos de
condução e planos de fundo.
Os infográficos são utilizados como uma forma de linguagem que têm por
objetivo divulgar informações de forma atraente, por vezes muitas informações em
pouco espaço, para Kanno (2013) “[...] permite uma leitura mais rápida e
compreensão mais imediata por parte dos leitores” (p.11).
De acordo com Dionìzio (2006), trata o infográfico como sendo um gênero
textual especialmente construído “por meio da orquestração de imagens, texto,
verbal, linhas setas, cores e outros recursos semiótico, pode ter como funções expor
dados estatísticos, geográficos, explicar um fato e narrar acontecimentos.” (p.1)
Parte desse texto é composto por gráficos ou tabelas que estão diretamente
ligados aos conceitos que já estudamos aqui em Estatística. As informações contidas
neles podem ser de diversas áreas, das ciências humanas, exatas, da saúde ou de
tecnologia, depende de que estamos querendo transmitir em um pequeno espaço.
Vamos observar o infográfico a seguir retirado do site do IBGE (Instituto
Brasileiro de Geografia e Estatística) sobre a disponibilidade da rede de
abastecimento de água em 2017.

60
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Disponível em: https://censos.ibge.gov.br/2012-agencia-de-noticias/noticias/20979-norte-e-nordeste-convivem-com-


restricoes-no-acesso-a-saneamento-basico.html. Acesso em: 14 de junho de 2022.

Além das informações na forma de porcentagens, comparando as regiões do


Brasil em relação a distribuição de água, temos também de onde são retirados os
abastecimentos, como as gotas de saem da torneira especificando tanto as
porcentagens como a origem da água.
Além dessas informações temos a água que está no cano da torneira que
também indica as possibilidades da vazão da água.
É possível perceber que existem conhecimentos não somente de estatística,
mas de outras áreas do conhecimento, e que embora as informações estejam sendo
apresentadas como um tipo de infográfico, podemos efetuar muito cálculos de
comparação entre o abastecimento de água nos Estados quanto na vazão desta
água. Destacamos também a variável envolvida nesse infográfico que é a
porcentagem de abastecimento de água, uma variável quantitativa.
Alguns infográficos necessitam também de um texto para complementar mais
informações, e para quem quiser se interessar pelo tema, pode ler o artigo completo
no link disponível.

61
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

REFERÊNCIAS

DIONISIO, A. Gêneros multimodais e multiletramento. In: KARWOSKI,Acir Mário;


GAYDECZKA, Beatriz; BRITO, Karim Siebeneicher (Orgs). Gêneros
textuais: reflexões e ensino. Rio de Janeiro: Lucerna, p. 131-144 ,2006.

Kanno, M. Infografe: Como e porque usar infográficos para criar visualizações e


comunicar de forma imediata e eficiente. São Paulo: Edição eletrônica, 2013.

VALERO SANCHO, J. L. La infografia: técnicas análisis y usos periodísticos.


València: Universitat de València; Castello de la Plana: Publicaciones de la
Universitat Jaume I; Barcelona: Universitat Pompeu Fabra; Bellaterra: Universitat
Autônoma de Barcelona, Servei Publicacions, D.L. 2001.

62
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 16_O Objeto de Estudo - As Medidas de Tendência Central

Nessa aula vamos introduzir as medidas de tendência central: moda, média


e mediana; e calcular alguns tipos de média.

Palavras-chave: Média; Moda; Mediana; Média Aritmética; Média Ponderada; Média


em tabelas sem intervalos de classe.

Medidas de Tendência Central


A Estatística trabalha com diversas informações que são apresentadas por
meio de gráficos e tabelas e com diversos números que representam e caracterizam
um determinado conjunto de dados. Dentre todas as informações, podemos retirar
valores que representem de algum modo, todo o conjunto. Esses valores são
denominados “Medidas de Tendência Central ou Medidas de Centralidade”.

As medidas de centralidade são a Média Aritmética, a Moda e a Mediana. Vamos


mostrar a seguir o que vem a ser cada uma delas.

Quando se trabalha com dados numéricos observa-se uma tendência destes


de se agruparem em torno de um valor central. Isto indica que algum valor central é
característica dos dados e que o mesmo pode ser usado para descrevê-los e
representá-los.
Média Aritmética: É uma das medidas de tendência centrais mais utilizadas no
cotidiano.
É determinada pelo resultado da divisão do somatório dos números dados
pela quantidade de números somados.

63
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Por exemplo, vamos determinar a média dos números


3, 12, 23, 15, 23, 12, 23, 15, 2.
Para isso basta somarmos todos os números e dividirmos pela quantidade de
números, ou seja:
Média Aritmética = (3 + 12 + 23 + 15 + 23 + 12 + 23 + 15 + 2) / 5 = 11
O cálculo da Média Aritmética é frequentemente usado nas escolas para
efetuar a média final dos alunos, em campeonatos de futebol para se obter a média
de gols de uma determinada rodada ou mesmo do campeonato; é também utilizado
em diversas pesquisas estatísticas, pois determina o direcionamento das ideias
expressas em determinados estudos.
Média Aritmética Ponderada
É uma Média Aritmética na qual, alguns dos números envolvidos possuem
“pesos”.
Por exemplo, digamos que a média de uma etapa é dada pela média
ponderada das notas das três primeiras provas, tomando peso dois para a primeira
prova (P1), peso três para a segunda prova (P2) e peso cinco para a terceira prova
(P3).

Neste caso, a Média Aritmética Ponderada é:

𝟐.𝐏𝟏 + 𝟑.𝐏𝟐 + 𝟓.𝐏𝟑


𝑴é𝒅𝒊𝒂 =
𝟏𝟎

Em outras palavras, a Média Aritmética Ponderada é uma Média Aritmética


na qual você repete os números tantas vezes quantos são seus pesos.

Média com Dados em Tabelas sem Intervalos de Classe


Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando
para variável o número de filhos do sexo masculino. Calcularemos a quantidade
média de meninos por família.

64
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Tabela - Número de filhos do sexo masculino


Número de
Frequência absoluta (fi) xi.fi
meninos
0 2 0.2 = 0
1 6 1. 6 = 6
2 10 2.10 = 20
3 12 2.12 = 24
4 4 4.4 = 16
total 34 78
Fonte: dados fictícios

Para encontrarmos a média teremos que dividir 78 pela quantidade de


número de filhos, isto é:
78
média é igual a = 2,3 meninos por família.
34

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.

MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.


Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

65
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 17_O Cálculo da Média em tabelas com intervalos de classe

Nessa aula vamos tratar o cálculo da média quando os dados se apresentam


em tabelas com intervalos de classe.

Palavras–chave: Média; Tabelas com intervalos de Classe; Média em tabelas sem


intervalos de classe.

MÉDIA COM INTERVALOS DE CLASSE


Neste caso, convencionamos que todos os valores incluídos em um
determinado intervalo de classe coincidem com o seu ponto médio, e determinamos
a média aritmética ponderada por meio da fórmula:

x=
 (f * x )
i i

f i

∑ fi é importante lembrar que este símbolo significa a soma de todas as parcelas da coluna do fi.

xi é o ponto médio da classe.

Tabela 1: Notas de candidatos concorrentes a uma bolsa de estudos


Classes Frequência (fi) Frequência acumulada (Fi) Média de
intervalo (xi)
0 l----- 10 9 9 5
10 l----- 20 12 21 15
20 l----- 30 12 33 25
30 l----- 40 16 49 35
40 l----- 50 16 65 45
50 l----- 60 13 78 55
60 l----- 70 12 90 65
70 l----- 80 05 95 75
80 l----- 90 04 99 85
90 l-----100 01 100 95
Total 100
Dados fictícios

66
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Para calcular o ponto médio de cada classe (xi) temos que dividir cada um dos
estremos dela por 2, isto é encontrar a média aritmética de cada classe,
considerando os limites superiores e inferiores de cada classe:

Cálculo do ponto
Classes
Médio da classe (xi)
0 l----- 10 (0 + 10) /2 = 5
10 l----- 20 (10 + 20) /2 = 15
20 l----- 30 (20 + 30) /2 = 25
30 l----- 40 (30 + 40) /2 = 35
40 l----- 50 (40 + 50) /2 = 45
50 l----- 60 (50 + 60) /2 = 55
60 l----- 70 (60 + 70) /2 = 65
70 l----- 80 (70 + 80) /2 = 75
80 l----- 90 (80 + 90) /2 = 85
90l-----100 (90 + 100) /2 = 95

Temos que somar multiplicar por cada uma das frequências absolutas de cada
classe e, portanto, teremos o seguinte:

Cálculo do ponto Médio da


Classes Frequência (fi) fi . xi
classe (xi)
0 l----- 10 9 (0 + 10) /2 = 5 9.5
10 l----- 20 12 (10 + 20) /2 = 15 12.15
20 l----- 30 12 (20 + 30) /2 = 25 12.25
30 l----- 40 16 (30 + 40) /2 = 35 16.35
40 l----- 50 16 (40 + 50) /2 = 45 16.45
50 l----- 60 13 (50 + 60) /2 = 55 13.55
60 l----- 70 12 (60 + 70) /2 = 65 12.65
70 l----- 80 05 (70 + 80) /2 = 75 5.75
80 l----- 90 04 (80 + 90) /2 = 85 4.85
90l-----100 01 (90 + 100) /2 = 95 1.95

67
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Logo, para calcular a média final somaremos esses produtos colocados na


coluna do fi . xi, e obteremos a média procurada.

Média = (9.5 + 12.15 + 12.25 + 16.35 + 16.45 + 13.55 + 12.65 + 5.75 + 04.85 + 1.95)
/100= 41,10
Média das notas de candidatos a concorrentes a uma bolsa de estudos é:
41,10.

68
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 18_Exercícios de construção de tabelas e o conceito de média

Nessa aula, vamos colocar em prática alguns conhecimentos sobre


construção de tabelas e o cálculo da média.

Palavras-chave: Exercícios, Média; Tabelas com intervalos de Classe; Média em


tabelas sem e com intervalos de classe.

ATIVIDADE 1
Os dados brutos que seguem são respostas de 36 pessoas quanto à região
de procedência, quanto à idade em anos completos e número de irmãos.

Região de procedência Idade Nº de irmãos


1 Interior 26 0
2 Capital 32 3
3 Capital 36 6
4 Outra 20 5
5 Outra 40 1
6 Interior 28 2
7 Interior 43 3
8 Capital 41 0
9 Capital 34 3
10 Outra 23 6
11 Interior 33 5
12 Capital 27 1
13 Outra 37 2
14 Outra 44 3
15 Interior 30 0
16 Capital 31 7
17 Outra 39 2
18 Outra 38 6
19 Interior 25 4
20 Interior 37 3
21 Outra 30 3
22 Capital 34 5
23 Outra 41 2
24 Outra 26 0
25 Interior 32 3
26 Outra 35 5
27 Outra 46 4
28 Interior 29 5
29 Interior 40 1
30 Capital 35 2
31 Outra 31 3

69
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

32 Interior 36 0
33 Capital 43 4
34 Capital 33 2
35 Capital 48 3
36 Interior 42 8

O que devemos fazer:

1) Identifique as variáveis: região de procedência, idade e nº de irmãos.


2) Construa uma tabela que melhor registre cada uma dessas variáveis.
3) A tabela de da idade dessas pessoas construa com intervalos de classe
respeitando as regras para encontrar os intervalos da classe.
4) Na tabela das variáveis quantitativas calcule as médias.

Atividade 2

Durante uma manhã, um feirante vendeu determinado produto a preços


variados: 12 unidades foram vendidas a 2 reais; 10 unidades foram vendidas a 3
reais e 8 unidades foram vendidas a 6 reais.

a) Qual foi o preço médio de venda desse produto naquela manhã?


b) Construa uma tabela de frequência para registrar os dados da atividade.

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.

MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.


Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

70
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 19_A Mediana como medida de tendência central

Nessa aula vamos tratar da medida de tendência central mediana e sua


diferença em relação à média
Palavras-chave: Medida de Tendência Central; Mediana; Diferença entre média e
mediana.

A MEDIANA
A mediana é uma estatística de ordem, o que significa que sua determinação
está vinculada à sua posição dentro do conjunto de dados ordenados. Ela é o valor
que divide o conjunto de dados ordenados em dois conjuntos com exatamente o
mesmo número de elementos. Vejamos um exemplo:
Considere as idades (em anos completos) de um grupo de 11 profissionais
especializados em Inteligência Artificial:

27 31 31 33 34 38 39 40 40 45 50
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º

Os valores já estão ordenados para simplificar nossa análise, então observe


que aquele que ocupa a 6ª posição é o que divide o conjunto em dois grupos de
exatamente cinco elementos em cada um (excetuando esse 6º elemento).
Logo, a mediana das idades é igual a 38 anos (Md = 38 anos).
Observe que Mediana e Média são medidas distintas: enquanto a mediana
divide o conjunto em dois com exatamente o mesmo número de elementos, a média
é o valor ao redor do qual os demais se distribuem. Nesse exemplo, a média é igual
a 37,09 anos.
Observe a localização no gráfico 1, no qual a reta azul indica a localização da
média e a reta marrom fornece a localização da mediana.

71
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Gráfico 1 – Idade dos profissionais especializados em Inteligência Artificial

Fonte: Elaborada pela autor

Vale também dizer que a mediana não é influenciada pelos valores extremos
do conjunto, mas apenas pela sua localização.
O gráfico 2 traz também 11 valores, mas modificamos alguns para ilustrar
essa afirmação.
Gráfico 2 – Alterando alguns valores da Idade dos profissionais especializados em Inteligência Artificial

Fonte: Elaborada pela autor

Observe que nesse segundo caso, a existência de valores mais altos “atrai” a
média para o lado direito do gráfico, mas não altera a posição da mediana, que
continua sendo o valor posicionado no 6º lugar do rank.
Passos para o cálculo da mediana.

72
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Para calcular a mediana, é necessário primeiro ordenar os valores


(comumente) do mais baixo ao mais alto.
Em seguida, conta-se até a metade dos valores para achar a mediana.
n+1
Em geral, a mediana ocupa a posição , no qual “n” representa a quantidade
2

de valores do conjunto.
O processo para determinara a mediana é o seguinte:
1 – Ordenar os valores
2 – Se o número de dados é ímpar, a mediana é o valor que está no centro da série.
3 – Se o número de dados é par, a mediana é a média dos dois valores que estão no centro
da série.
Exemplo com dados brutos (n número ímpar): A mediana dos dados: 3,9,5,7,9,1,9.
Para obter a mediana, ordene os dados:
1,3,5,7,9,9,9.
O número de informações n = 7, e, portanto, é ímpar.
A posição mediana é o número que ocupar a 4ª posição, logo esse número
mediano é o 7.
Exemplo com dados brutos (n número par) - Os dados brutos que seguem são
respostas de 36 pessoas quanto à região de procedência, quanto à idade.

Idade
26 37
32 30
36 34
20 41
40 26
28 32
43 35
41 46
34 29
23 40
33 35
27 31
37 36
44 43
30 33
31 48
39 42
38 25
Temos que ordenar:

1º 26 19º 35
2º 20 20º 35

73
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

3º 23 21º 36
4º 25 22º 36
5º 26 23º 37
6º 27 24º 37
7º 28 25º 38
8º 29 26º 39
9º 30 27º 40
10º 30 28º 40
11º 31 29º 41
12º 31 30º 41
13º 32 31º 42
14º 32 32º 43

15º 33 33º 43
16º 33 34º 44
17º 34 35º 46
18º 34 36º 48

Para identificar o termo do meio, precisamos de algumas estratégias:

𝑛+1 36+1
Se temos n par temos que e temos que = 18,5, logo a mediana está entre a posição
2 2

18ª e 19ª, teremos então com mediana:

A idade correspondente a 18ª posição é 34 anos e a idade correspondente a 19ª posição é 35,
logo a mediana será a soma dessas idades dividido por 2.

34 + 35 69
= = 34,5
2 2
Portanto a mediana das idades vai ser 34,5 anos

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.

MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.


Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

74
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 20_O cálculo da Mediana em tabelas com intervalos de classe

Nessa aula vamos aprender a calcular a mediana diante de dados que se


apresentam em uma tabela com intervalos de classe.

Palavras-chave: Medida de Tendência Central; Mediana diante de dados com


intervalos de classe; fórmulas de cálculo de mediana.

A MEDIANA DIANTE DE DADOS EM TABELAS COM INTERVALOS DE CLASSE


Nem sempre os dados para os cálculos das medidas de tendência central se
apresentam na forma de rol ou de tabelas de frequência sem intervalos de classe, e
para efetuar tal cálculo precisamos de alguns procedimentos a mais que recaem em
fórmulas, que a princípio podem ser complicadas, mas é só prestar atenção nos
passos que tudo fica mais descomplicado.
Vamos analisar o exemplo abaixo:
Considere a distribuição relativa a 40 pessoas, tomando para variável estatura
de cada uma. Vocês já estudaram anteriormente, se trata de uma variável
quantitativa contínua.
Tabela 1 – Estatura de um grupo de pessoas

Fonte: dados fictícios

Vamos calcular a mediana desses dados:


A posição da mediana é dada por:
Primeiro passo:
É necessário construir a frequência acumulada para encontrar o elemento
mediano através da sua ordem, como temos na última coluna da Tabela 1 acima.
Segundo Passo:
Calcula-se a ordem do elemento central (n/2).

75
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Como temos o total de n = 40, é número par, quando dividimos 40 por temos
obteremos 20, portanto o a mediana irá estar entre o 20º e o 21º.
Terceiro Passo:
Pela frequência acumulada identifica-se a classe que contém a mediana.
No nosso exemplo está na terceira classe tanto o 20º e o 21º.
Quarto Passo:
Utiliza-se a fórmula:
𝑛
( 2 − 𝐹𝑎𝑛𝑡)
𝑀𝑒 = 𝐿𝑖𝑚𝑒 + . ℎ𝑚𝑒
𝑓𝑖𝑚𝑒

Lime ⟹ é o limite inferior da classe mediana;


n⟹ é o tamanho da amostra;
Fant ⟹ é a soma das frequências anteriores à classe mediana;
hme ⟹ é a amplitude da classe mediana;
fime ⟹ é a frequência da classe mediana.

Portanto, teremos:
Lime = 158; Fant = 13 ; hme = 4 e fime = 11

40
( −13)
2
𝑀𝑒 = 158 + .4 ⟹
11
( 20−13) ( 7)
𝑀𝑒 = 158 + . 4 = 158 + . 4 = 158 + 2,545454 …
11 11

Logo a mediana será: 160,545454...~ 160,55

Atividade
Uma determinada cantina de uma escola quer analisar os seus lucros.
Sabemos que lucro na venda de um produto é variável, mas que, ao longo de seis
meses, foram registrados os valores apresentados na tabela abaixo. Calcule a
mediana na margem de lucro nesse período dessa cantina, baseada na quantidade
do produto vendido que estão na tabela abaixo.

76
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Tabela 1 – Produtos vendidos

Fonte: Dados fictícios

Atividade

1) Uma amostra do tempo de vida útil da bateria de uma marca de celular forneceu
a seguinte distribuição:
Tabela 1 – Tempo de vida útil da bateria

Número de meses
Nº de peças
(vida útil)
0 l------06 3
06 l------12 42
12 l------18 86
18 l------24 127
24 l------30 64
30 l------36 8
total 330
Fonte – dados fictícios

a) Determine a média de vida útil das baterias.


b) Determine a mediana da vida útil dessas baterias.

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.

MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.


Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

77
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 21_A Moda como medida de tendência central

Nessa aula vamos tratar da medida de tendência central moda e sua diferença
em relação às demais medidas de tendência central

Palavras-chave: Medida de Tendência Central; Moda; Diferença medidas de


tendência central.

MODA
É a medida de tendência central que consiste no valor observado com mais
frequência em um conjunto de dados.
Análise da Moda em um conjunto de dados brutos
Por exemplo, digamos “que o time de futebol ‘Santos” em determinado torneio
de fez, em dez partidas, a seguinte quantidade de gols:
55, 44, 22, 13, 33, 77, 13, 13, 22 e 13.
Para essa sequência de gols marcados, a moda é de 13 gols, pois é o número
que aparece mais vezes.
Outra situação comum seria se dentre 8 pessoas tomássemos suas idades, a
saber:
10 anos, 15 anos, 20 anos, 32 anos, 13 anos, 55 anos, 43 anos e 90 anos.
Nesse caso, não há moda, pois nenhuma idade se repetiu mais vezes que a
outra.
Quando um conjunto de dados não apresenta moda, dizemos que esse
conjunto é Amodal. Caso exista uma moda, denominamos o conjunto de Unimodal.
Existindo duas modas, denominamos o conjunto de Bimodal e assim
sucessivamente.
A moda funciona como medida descritiva quando se trata de contar dados.

Essa medida não se presta a manipulações matemáticas. De um ponto de


vista puramente descritivo, a moda indica o valor “típico” em termos de maior
ocorrência.
Além disso, se as frequências são razoavelmente uniformes, a moda perde
muito de sua importância como medida descritiva.

78
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Por outro lado, a utilidade da moda se acentua quando um ou dois valores, ou


um grupo de valores, ocorre com muito mais frequência que os outros. Na maior
parte das vezes, a média aritmética e a mediana fornecem melhor descrição da
tendência central dos dados.
Em geral é bastante simples identificar a moda de dados que estão agrupados
em uma tabela de frequências.
Análise da Moda (Mo) agrupados em uma tabela de frequências.
Vamos trazer um exemplo para analisar a moda em uma tabela de frequências
relativas ao percentual de vezes que 50 alunos formulam questões durante uma
palestra.
Tabela 1 – Nº de questões formuladas pelos alunos

Número de Frequência relativa


vezes percentual
1 5
2 3
3 17
4 35
5 18
6 15
7 7
total 100
Fonte: dados fictícios

A moda neste caso é 4 pois a maior parte dos alunos (35%) formularam 4
perguntas para o palestrante.
Quando há perda de informação, a moda se refere a uma “classe modal”, e
não a um valor único.
Ela mostra a tendência central dos dados identificando a área em que os
dados estão mais concentrados.

Análise da Moda (Mo) agrupados em uma tabela de frequências com intervalos


de classe.
Vamos observar o que ocorre com a moda quando analisamos uma tabela de
frequência com intervalos de classe.
Uma determinada empresa quer analisar que margem de lucro na venda de
um produto é variável, mas que, ao longo de seis meses, foram registrados os

79
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

valores apresentados na tabela abaixo. Vamos identificar a classe modal da margem


de lucro nesse período.
Tabela 1 – Valores percentuais do lucro da empresa
Classe Frequência relativa percentual
15 ├ 25 30
25 ├ 35 45
35 ├ 45 150
45 ├ 55 45
55 ├ 65 30
Total 300
Fonte: dados fictícios

A classe modal é 35 ├ 45, porque é a classe com maior frequência, uma vez
que 150 produtos foram vendidos com margem de lucro entre 35% e 45%.

Atividade
1) Considerando as séries de dados a seguir, indique a Média Aritmética, a Moda, e
a Mediana:
a) 04, 09, 01, 09, 03, 08, 06, 07
b) 01, 02, 03, 04, 09, 04, 11
c) 12, 90, 86, 64, 23, 12
d) 10, 11, 13, 14, 45, 69, 83

2) Considerando as tabelas a seguir, apure a Fi e indique a Média Aritmética, a Moda,


e a Mediana:
Notas fi Fi
1 3
2 6
3 4
4 10
5 12
total

80
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

3) Considerando a distribuição a seguir, apure a Fi e indique a Média Aritmética, a


classe Modal, e a Mediana:
Notas fi Fi
0l----02 07
02l----04 08
04l----06 03
06l----08 02
total

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.

MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.


Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

81
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 22_Medidas Separatrizes e a relação entre a Mediana e Quartis


de uma distribuição

Nessa aula trataremos das medidas de posição em uma distribuição. No


nosso caso, trataremos de Mediana e Quartis.
Palavras-chave: Separatrizes; Quartis; Decis; Percentis; Mediana.

SEPARATRIZES
Separatrizes são valores da distribuição que a dividem em partes quaisquer.
A mediana, apesar de ser uma medida de tendência central, é também uma
separatriz de ordem 1/2, ou seja, divide a distribuição em duas partes iguais.

Existem outras separatrizes. As mais comumente usadas são:


• Quartis – dividem a distribuição em quatro partes iguais, de ordem 1/4.
• Decis – dividem a distribuição em 10 partes iguais, de ordem 1/10.
• Centis – dividem a distribuição em 100 partes iguais, de ordem 1/100

OS QUARTIS
Os quartis são as medidas que dividem um conjunto de dados em quatro
outros conjuntos com exatamente o mesmo número de elementos. Observe no
nosso exemplo:
Considere as idades (em anos completos) de um grupo de 11 profissionais
especializados em Inteligência Artificial:
27 31 31 33 34 38 39 40 40 45 50
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º

A coluna em cor “tijolo” representa a mediana e sua posição (6ª posição na


lista de dados, fornecendo mediana igual a 38 anos).
Tal coluna divide o conjunto inicial em dois outros conjuntos de cinco
elementos cada um deles.
Logo, na terceira posição de cada um deles está o correspondente quartil:
o primeiro quartil no 3º elemento (Q1 = 31anos) e o terceiro quartil no 9º
elemento (Q3 = 40 anos).

82
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

A mediana também é um quartil: ela é o segundo quartil (Q2), veja no gráfico


3.
Gráfico 3 – Idade dos profissionais especializados em Inteligência Artificial

Fonte: elaborado pelo autor

Mediana e quartis: são medidas que se posicionam no conjunto de dados a


partir da ordenação deles, dividindo o conjunto em outros com o exatamente o
mesmo número de elementos:
• Mediana: é um ponto que divide em dois conjuntos com o mesmo número de
elementos (50% dos elementos em cada conjunto)
• Quartis: são 3 pontos que dividem em quatro conjuntos com o mesmo número
de elementos (25% dos elementos em cada conjunto). A mediana é o segundo
quartil.
• Decis são os nove pontos que dividem a distribuição em 10 partes iguais.
• Centil são os 99 valores que dividem a distribuição em 100 partes iguais,
abrangendo, cada um, 1% do número total da distribuição.

Atividade

1) Uma microempresa tem nove funcionários, cujos salários são: R$ 1100,00;


R$1100,00; R$ 1100,00; R$ 1150,00; R$ 1220,00; R$ 1650,00; R$ 1650,00;
R$ 7500,00 e R$ 8000,00.
a) Calcule a média, a moda e a mediana e a amplitude total dos salários destes
funcionários;
b) O valor encontrado para a média é um bom representante para o conjunto de
todos os salários? Justifique, relacionando com o valor da amplitude total.

83
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

2) A Tabela seguinte apresenta o resultado de 45 observações relativas ao


índice pluviométrico em determinado período, onde se deseja saber se ela
pode se tornar um polo turístico.
Tabela 1 – Distribuição dos dias observados em função da quantidade de chuva no período
Quantidade de chuva (mm) Número de dias
135 15
144 09
148 07
157 08
162 04
175 02
total 45
Fonte: dados fictícios

a) Calcule o índice pluviométrico médio, mediano, e a moda dessa região no


período considerado.
b) Representante a distribuição dos dias em função da quantidade de chuva
observada em um gráfico, localizando os valores das medidas de posição
encontradas no item a).
c) O valor encontrado para a média é um bom representante para o conjunto de
dados observados? Justifique, relacionando com o valor das outras medidas
encontradas.

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.

MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.


Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

84
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 23_ Medidas de Dispersão: Para que servem e como se calcula

Nessa aula iremos calcular o desvio padrão em dados que aparecem como
rol, destaque para o desvio padrão amostral, do desvio padrão da população, com
fórmulas e o com uso de Excel.

Palavras-chave: Variância; Desvio Padrão; Medidas de Dispersão.

MEDIDAS DE DISPERSÃO

São utilizadas para analisar a variabilidade de uma amostra. São utilizadas


nas situações em que grupos com médias de valores iguais, possuem características
diferentes. Quanto mais homogênea for uma amostra, menos dispersão ela vai
apresentar.

São elas: Amplitude Total, Desvio Médio, Desvio Padrão e Variância.

▪ Amplitude Total (AT): é a diferença entre o maior e o menor valor encontrados na


distribuição. É dependente de poucos resultados da amostra e pode sofrer muita
alteração com valores discrepantes.
▪ Desvio Médio (DM): é o valor da somatória de todos os valores da distribuição
subtraídos da média e divididos pelo número de valores.
Fórmula:
∑ |x|
DM = ̅) e N é o total de dados
, onde x = (x − X
N

Exemplo: Amostra = {5, 1, 6, 2, 3, 4, 7} Média = ̅


X=4

∑ |x| |5 − 4| + |1 − 4| + |6 − 4| + |2 − 4| + |3 − 4| + |4 − 4| + |7 − 4|
DM = =
N 7

|1| + | − 3| + |2| + | − 2| + | − 1| + |0| + |3| 12


DM = = = 1,7142
7 7

2
▪ Variância S : criada para minimizar as discrepâncias que o desvio médio pode
causar por utilizar valores em módulo.
▪ Ela estabelece os desvios em relação à média aritmética.

85
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

▪ É uma medida de “VARIABILIDADE ABSOLUTA”, sendo de difícil


interpretação.
Fórmula da Variância

̅)2
∑(x − X
2
S =
n −1

Vamos a seguir tratar o desvio padrão e em seguida um exemplo do seu


cálculo juntamente com a variância.

DESVIO PADRÃO
O desvio-padrão é uma medida estatística de dispersão que deve ser usada
conjuntamente com a média. O desvio-padrão dá-nos a informação sobre até que
ponto os dados de uma determinada amostra se afastam da média.
Como exemplo para compreender a sua importância vamos observar a
situação abaixo:

Suponha que está prestes a contratar os serviços de uma empresa de entregas rápidas. Ambas
apresentam uma média de tempo de entrega de mercadorias de 20 horas. Assumindo que tudo o
resto é igual, uma das empresas apresenta um desvio-padrão de 2 horas e 54 minutos e a outra
um desvio-padrão de 4 horas e 30 minutos. Qual das duas empresas escolheria?

Conhecendo o significado do desvio-padrão, a resposta seria óbvia: a primeira


empresa é melhor porque o tempo de entregas é menos disperso em relação à
média.
Cálculo do Desvio Padrão em dados simples
Vamos calcular o desvio padrão em um determinado contexto, diferente do
exemplo acima.
Para preencher uma vaga de Inspetor de Alunos, o departamento de pessoal
de uma escola realizou testes com vários candidatos. Andrea e Pedro foram os
candidatos que obtiveram as melhores notas. A tabela a seguir mostra o
desempenho dos dois candidatos nas provas a que se submeteram:

86
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância
Tabela 1 – Notas de Andrea e Pedro
Resultados dos candidatos
Temas das provas
Andrea Pedro
Uso de Tecnologia 8,5 9,5
Língua Portuguesa 9,5 9,0
Inglês 8,0 8,5
Matemática 7,0 8,0
Conhecimentos específico 7,0 5,0
Média 8,0 8,0
Fonte: Elaborado pelo autor

No caso de Andrea e Pedro, a amostra de notas menos dispersa em relação


à média aritmética corresponderá ao melhor desempenho e, portanto, ao merecedor
da vaga.
Portanto, vamos calcular a variância e o desvio padrão como critério de
desempate.
1º passo: calcule a diferença entre cada nota e a média aritmética de todas as notas.
Faça isso para cada candidato, separadamente. Vamos observar esse cálculo no
quadro abaixo.
Cálculo de Andrea Cálculo do Pedro
8,5 – 8,0 = 0,5 9,5 – 8,0 = 1,5
9,5 – 8,0 = 1,5 9,0 – 8,0 = 1,0
8,0 – 8,0 = 0,0 8,5 – 8,0 = 0,5
7,0 – 8,0 = -1,0 8,0 – 8,0 = 0,0
7,0 – 8,0 = -1,0 5,0 – 8,0 = -3,0

2º passo: calcule o quadrado de cada valor encontrado no passo anterior. Vamos


observar esse cálculo no quadro abaixo.
Cálculo de Andrea Cálculo do Pedro
(0,5)2 = 0,25 (1,5)2 = 2,25
(1,5)2 = 2,25 (1,0)2 = 1,0
(0,0)2 = 0,0 (0,5)2 = 0,25
(-1,0)2 = 1,0 (0,0)2 = 0,0
(-1,0)2 = 1,0 (-3,0)2 = 9,0

87
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

3º passo: calcule a média aritmética dos valores encontrados no passo anterior.


Vamos observar o passo 3 no quadro abaixo.
0,25+2,25+0,0+1,0+1,0
Média dos quadrados (Andrea) = = 0,9
5

2,25+1,0+0,25+0,0+9,0
Média dos quadrados (Pedro) = = 2,5
5

Esses dois valores encontrados são chamados de Variância


Para calcularmos o desvio padrão, basta extrair a raiz quadrada da variância.

Desvio Padrão das notas de Vera ⟹ DP = √𝟎, 𝟗 = 0,95

Desvio Padrão das notas de Pedro ⟹ DP = √𝟐, 𝟓= 1,58

Portanto, Andrea deve ser a contratada para o cargo de inspetor de aluno


dessa escola.
Atividade

1) Uma amostra com peso de 46 peças já embaladas de um processo de produção


está na tabela seguinte:
Peso (KG) 45 47 48 50 51 52
Nº de
2 3 8 15 6 12
peças
a) Calcule o peso médio das peças.
b) Calcule a moda e a mediana.
c) Calcule o desvio padrão.

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.
LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.
MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.
Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

88
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 24_Desvio Padrão com tabelas de frequência

Nessa aula vamos calcular o desvio padrão a partir de uma tabela de


frequência com e sem intervalos de classe, variáveis quantitativas discretas e
contínuas.
Palavras-chave: Desvio padrão; tabelas de frequência, Intervalos de classe;
variáveis discretas; variáveis contínuas.

Desvio Padrão com Tabelas sem Intervalos de Classe, Variável Quantitativa


discreta.

▪ A tabela a seguir mostra dados do número de irmãos de uma classe do 9º ano de


uma escola.

X – Número de Frequência absoluta 2 2


f(X)=f*X f(X )=X *f
irmãos (fi)

0 4 0 0
1 5 5 5
2 7 14 28
3 3 9 27
5 1 5 25
2
20 𝝨f(X)=33 𝝨f(X )=85

Como no cálculo de desvio padrão de dados simples, temos que calcular o


produto do número de irmãos com as suas respectivas frequências absolutas, e
esse cálculo se encontra na terceira coluna da tabela. Este cálculo precisa de uma
somatória, pois estamos calculando a média.

∑ 𝐟𝐗
̅=
𝑴é𝒅𝒊𝒂 = 𝐗
𝐍
∑ 𝐟𝐗 𝟑𝟑
̅=
𝐗 = = 𝟏, 𝟔𝟓 ̅ 𝟐 = 𝟐, 𝟕𝟐𝟐𝟓
𝑿
𝐍 𝟐𝟎

Para o cálculo do desvio padrão construímos a 4ª coluna da tabela e efetuamos.

∑ 𝐟(𝐗 𝟐 ) 𝟖𝟓
𝐒𝟐 = ̅𝟐 =
−𝐗 − 𝟐, 𝟕𝟐𝟐𝟓 = 𝟏, 𝟓𝟐𝟕𝟓
𝐍 𝟐𝟎

89
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

As fórmulas utilizadas para o cálculo da média e do desvio-padrão são de


duas naturezas: dados apresentados em lista (no banco de dados) ou dados
agrupados (em tabelas de distribuição de frequências).
Dados em lista Dados agrupados
Média ∑𝑥 ∑ 𝑥 .𝑓
𝑋̅ = 𝑛 𝑖 onde n é o número de 𝑋̅ = 𝑛𝑖 𝑖 onde fi é a frequência

elementos considerados de cada valor xi


Desvio-Padrão
(𝑥𝑖 − 𝑋̅)2 𝑓𝑖 . (𝑥𝑖 − 𝑥̅ )2
amostral 𝑠= √ 𝑠=√
𝑛−1 𝑛−1

Desvio-Padrão
(𝑥𝑖 − 𝑋̅)2 𝑓𝑖 . (𝑥𝑖 − 𝑥̅ )2
populacional 𝑠= √ 𝑠=√
𝑛 𝑛

Observem as duas fórmulas quando se calcula o Desvio Padrão com a


amostra e com toda a população.
Essa diferença no cálculo é somente um cuidado tomado pelos estatísticos,
que é subtrair 1 de n quando estamos fazendo este cálculo com a amostra.

Atividade

1) Uma amostra do tempo de vida útil da bateria de uma marca de celular forneceu
a seguinte distribuição:

Tabela 1 – Tempo de vida útil da bateria


Número de meses
Nº de peças
(vida útil)
0 l------06 3
06 l------12 42
12 l------18 86
18 l------24 127
24 l------30 64
30 l------36 8
total 330
Fonte – dados fictícios

a) Determine a média de vida útil das baterias dessa marca de celular.


b) Determine o desvio padrão desses valores.

90
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

c) O que pode concluir sobre esses dados em relação à média e o desvio


padrão?

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.

MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.


Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

91
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 25_A Tecnologia e o Cálculo de medidas com o uso do Excel

Nessa aula vamos aprender uma possibilidade do cálculo de algumas


medidas da estatística, utilizando um recurso tecnológico que pode ser tanto o
software Excel como o Libre Office.
Palavras-chave: Tecnologia; Software; Média; Desvio Padrão.

O USO DO EXCEL

Em nosso trabalho utilizaremos as ferramentas disponíveis nas planilhas


eletrônicas, particularmente o Excel.
Para o cálculo da Média: = Média (A1:A18), como podemos observar na figura
1 a seguir:

Figura 1 – Cálculo da média de dados no Excel.

Fonte: Elaborado pelo autor

Para o cálculo do Desvio-Padrão amostral, ou seja, admitindo que esse


conjunto de dados é um subconjunto da população total considerada:

92
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância
Figura 2 – Cálculo do Desvio-Padrão Amostral no Excel.

Fonte: Elaborado pelo autor

Se considerarmos o conjunto dado como sendo a população considerada, o


desvio-padrão populacional será dado por:

Figura 2 – Cálculo do Desvio-Padrão Populacional no Excel.

Fonte: Elaborado pelo autor

Uma observação importante: a média e o desvio-padrão só podem ser calculados


para variáveis quantitativas discretas ou contínuas. Para as variáveis
qualitativas esse cálculo não tem significado.

93
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 26_Média e Desvio-Padrão de uma distribuição

Nessa aula trataremos de medidas de tendência central e de dispersão de


uma distribuição, sempre no contexto dos dados, nesse caso com o cálculo do desvio
padrão.
Palavras-chave: Média; Desvio Padrão; Variabilidade.

A ESTATÍSTICA E A PERCEPÇÃO DA VARIABILIDADE – ESTUDO DA MÉDIA


A espinha dorsal da análise de um conjunto de dados é a percepção da
variabilidade. Para isso, a representação desses dados em gráficos e tabelas é um
primeiro passo importantíssimo. No entanto, não podemos nos passar de medidas
que resumem esses dados de forma específica.
Uma primeira medida é a média, que é o valor ao redor do qual os demais
valores do conjunto de dados se distribuem, que já vimos nas aulas anteriores.
Considerando tal definição, precisamos conhecer como é feita essa
distribuição em torno da média é feita:
Esses dados estão muito concentrados em torno da média ou estão
dispersos?

Neste sentido, percebemos que não faz sentido falarmos de uma medida sem
abordarmos a outra.
Tomemos um exemplo de um grupo de famílias que participam de um estudo
sobre orçamentos domésticos, das quais consideramos o número de pessoas
residentes da mesma moradia.

Moradia A B C D E F G H I J K L M N O P Q R
Nº pessoas 1 2 2 2 4 3 4 2 2 2 3 3 2 2 1 1 3 3

Observe o gráfico 1 de pontos que ilustra essa distribuição.

94
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância
Gráfico 1 – Nº de Pessoas das residências investigadas

º
Fonte: Elaborada pela autor

Cada ponto representa uma moradia. Pense em uma balança na qual cada
ponto é um peso. Onde ficaria o fiel dessa balança?
Vejamos: a reta que inserimos no gráfico 2 passa pelo valor x = 2,67, o que
significa que o número de pessoas por moradia se concentra em torno de 2,67, ou
seja, se distribui em torno da reta x = 2,67, que é a média.
Gráfico 2 – Nº de Pessoas das residências investigadas

Fonte: Elaborada pela autor

A Estatística e a percepção da variabilidade – estudo do desvio-padrão


Observe que ser “fiel da balança” não significa dividir ao meio, mas sim ser
um ponto de equilíbrio desse conjunto de dados. Mas esse ponto de equilíbrio
necessita de uma referência, que será a dispersão ao redor desse valor. Vejamos no
gráfico 3:

95
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância
Gráfico 3 – Nº de Pessoas das residências investigadas

Fonte: Elaborada pela autor

Chamamos de Desvio Padrão (que designaremos por s) à medida de


dispersão que consideraremos nessa análise e as retas a e b foram determinadas
da seguinte forma: a = Média – Desvio Padrão e b = Média + Desvio Padrão.
De forma mais específica, sendo s = 1,33, a = 2,67-1,33 = 1,34 e b = 2,67 +
1,33 = 4. As retas a e b determinam um intervalo, uma região, que congrega uma
grande proporção dos dados considerados, garantindo uma análise robusta.
Existe um teorema na estatística que garante tal resultado. Esse intervalo
assim determinado fornece um primeiro significado para o desvio padrão.
O que significa, dentro do contexto do número de pessoas por moradia,
a informação sobre a dispersão dos dados?

Podemos afirmar que os valores se concentram em torno de 𝑥̅ = 2,67 pessoas por moradia, sendo
que 72,22% dos dados (13 valores entre os 18 observados) estão entre 1,33 e 4, o que fornece um
intervalo bem delimitado para os valores analisados.

Atividade

1) Medindo-se o diâmetro externo de um lote de engrenagens, foram obtidos valores,


em mm, de acordo com a distribuição abaixo:

96
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância
Tabela 1 – Diâmetro externo de um lote de engrenagens

Classe Li Ls fi
1 1001 - 1010 3
2 1011 - 1020 12
3 1021 - 1030 28
4 1031 - 1040 82
5 1041 - 1050 74
6 1051 - 1060 30
7 1061 - 1070 17
8 1071 - 1080 4
Fonte: dados fictícios

Pede-se:
a) Calcular a média, a mediana e o desvio padrão desse lote de peças.
b) Determinar Desvio médio, o Coeficiente de Pearson dessa distribuição.
c) Construir o histograma dos dados obtidos.
d) Considerando que a faixa e tolerância para o diâmetro externo das engrenagens
é de 15% abaixo e acima da média, o que poderia se dizer sobre o processo de
produção dessas engrenagens?

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.

MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.


Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

97
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 27_Noções básicas de Probabilidade

Nessa aula aprenderemos sobre a importância do ensino de probabilidade


nas diversas profissões, assim como para o cidadão e conceitos elementares para a
sua compreensão.
Palavras-chave: Probabilidade; Espaço Amostral; Eventos; Tipos de Eventos.

A IMPORTÂNCIA DO ENSINO DE PROBABILIDADE

No Brasil, a importância de incluir conteúdos relativos à probabilidade está


expressa em documentos oficiais como os Parâmetros Curriculares de Matemática
do Ensino Fundamental – PCN (1998) e a Base Nacional Comum Curricular - BNCC
(2017).
Em ambos consta que uma das finalidades do estudo da probabilidade é que
o aluno compreenda que muitos dos acontecimentos do cotidiano são de natureza
aleatória e que se possam identificar possíveis resultados deles.
Os contextos que se pode apresentar a probabilidade podem ser na área das
exatas, humanas ou biológicas, pois assim como na estatística, a probabilidade
estuda o contexto que os dados estão inseridos.
As probabilidades devem sempre estar relacionadas a algum “evento”, estes podem ser os
mais variados possíveis: chuva; lucro; nascer menina; ocorrer uma carta de ouro; sair ponto 6
no dado; sair bola vermelha de uma urna; a área devastada da Amazônia etc.

A Probabilidade é a medida de incerteza de ocorrência destes possíveis eventos.

A probabilidade de um evento A, é representada por P(A) será sempre um


número entre 0 e 1 e indica a chance de ocorrência do evento A. Quanto mais
próxima de 1 é a P(A) , maior será a chance de ocorrência do evento A, e quanto
mais próxima de zero, menor a chance de ocorrência do evento A.
A um evento impossível temos que P(A) = 0 (a probabilidade de se obter ponto
7 ao se jogar um dado)

98
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

A um evento certo temos que P(A) = 1 (a probabilidade de sair cara ou coroa


quando se joga uma moeda)

Portanto, temos que:


As probabilidades podem ser expressas em decimais, porcentagens ou frações:
1 1
0,10 = 10% = ; 0,25 = 25% = 1 = 100%
10 4

ESPAÇO AMOSTRAL E EVENTOS


Uma experiência aleatória deve ser subentendida sempre que for possível:
- Repetir a experiência indefinidamente, fixadas algumas condições;
- Mesmo mantendo as condições iniciais, sempre será impossível influenciar no
resultado.
Um espaço amostral é o conjunto de todos os resultados possíveis de uma
experiência, resultados estes que podem ser de natureza quantitativa ou qualitativa.
Eventos é qualquer subconjunto do espaço amostral, isto é, qualquer
resultado ou conjunto de resultados do espaço amostral. Portanto os resultados de
um experimento chamam-se eventos.

Conjunto é uma coleção bem definida de objetos e itens

Podemos descrever os elementos de um conjunto de duas maneiras:

➢ Relacionando todos eles, ou relacionando apenas um número suficiente deles,


de modo a deixar claro quais são os elementos do conjunto.
➢ Enunciando uma regra, ou a definição das características comuns aos
elementos do conjunto.
Ex: B = {todos os inteiros menores do que 9}

Para podermos falar de probabilidades, temos de ter sempre um espaço


amostral, que é o conjunto de todos os resultados possíveis de um experimento.
O termo experimento sugere a incerteza do resultado.

99
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Métodos do Cálculo da Estimativa: Clássico; Frequência relativa e subjetivo

O cálculo da estimativa da ocorrência de um evento será igual a razão entre


o número de casos favoráveis e o número de casos possíveis de ocorrer, sendo
todos igualmente prováveis.
n( A)
P( A) = onde
n(U )
P(A) = probabilidade de ocorrer o evento A
n(A) = número de elementos do evento A
n(U ) = número total de resultados possíveis
Os eventos podem relacionar-se entre si de maneira complementar,
mutuamente excludente ou ainda coletivamente exaustivo.

Dado um evento A, o evento B é seu


complementar se tiver (conter) todos os outros
Eventos Complementares
resultados possíveis do espaço amostral.
São os eventos que não tem elemento comum, ou
Eventos Excludentes se não podem ocorrer simultaneamente,
Os eventos serão coletivamente exaustivos se
nenhum outro resultado é possível para o
Eventos Coletivamente exaustivos
experimento em questão.

Atividade
1) Uma urna contém 10 bolas verdes, 8 vermelhas, 4 amarelas, 4 pretas e cinco
brancas, todas de mesmo raio. Uma bola é retirada ao acaso. Qual q probabilidade
de a bola escolhida ser:
a) não verde.
b) não branca ou vermelha.
c) vermelha ou preta.
d) verde, vermelha ou amarela.

2) Uma urna contém 15 cartões enumerados de 1 a 15. Um cartão é retirado


aleatoriamente. Qual a probabilidade de o número no cartão ser múltiplo de 3.

100
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

3) Uma carta é retirada de um baralho comum de 52 cartas.


a) Qual a probabilidade de sair uma carta vermelha.
b) Sair uma carta de copas.
c) Sair um rei ou uma carta de copas.

4) Joga-se um dado branco e um dado preto. Calcule a probabilidade de:


a) ocorrer soma 6.
b) ocorrer soma 11.
c) não ocorrer nem soma 2 e nem soma 8.

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.

MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.


Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

101
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 28_Os Enfoques de Probabilidade e algumas propriedades

Nessa aula aprenderemos algumas das concepções de probabilidade, assim


como o cálculo da interseção e união de eventos.
Palavras-chave: Enfoques de Probabilidade; Probabilidade Interseção; União de
Eventos; Interseção de Eventos.

ALGUNS ENFOQUES DE PROBABILIDADE

1) Enfoque Clássico – Quando o espaço amostral tem resultados igualmente


provável.
- Em uma caixa temos 10 fusíveis “bons” e 3 “defeituosos”. Retira-se um fusível ao
n( A) 3
acaso, a probabilidade de ele ser defeituoso é de: P( A) = = = 23,08%
n(U ) 13
2) Enfoque Empírico ou frequentista – Tem como base a frequência relativa
de ocorrência de um evento num grande número de repetições.
Para esse tipo de cálculo não há fórmulas específicas, mas a necessidade de
muitas repetições dessa para se confirmar a probabilidade.
Como por exemplo, pelo método clássico sabemos que a probabilidade de
sair o número 6 é de 1/6.
Pelo método frequentista teríamos que jogar muitas vezes, às vezes até 1000,
e anotar todos os resultados e com certeza estaríamos muito perto do resultado do
cálculo da probabilidade clássica.
3) Enfoque Subjetivo – Utiliza estimativas pessoais de probabilidade, tendo
como base um certo grau de crença, ou seja, a probabilidade neste caso é uma
avaliação pessoal do grau de viabilidade de um evento.
- Um corretor de seguros estima em 30% a probabilidade de vender hoje uma
apólice de seguros a um jovem casal.
- A probabilidade de um time de futebol ganhar uma partida do campeonato,
dado que ele venceu 80% das partidas anteriores.
São probabilidades que se leva em conta informações técnicas anteriores.

102
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Evento União: Ocorrer o evento A ou o evento B. A probabilidade de ocorrer um evento A ou um


evento B (ou ambos) numa prova é igual à soma das probabilidades de os eventos ocorrerem
separadamente, menos a probabilidades de ocorrerem simultaneamente.
P( A  B) = P( A ou B) = P( A) + P( B) − P( A  B)

se A  B =  então P( A  B) = P( A) + P( B)

Exemplos:
1) Qual a probabilidade de sair 5 ou 6 quando se joga um dado.

    1 1
A = sair 5; B = sair 6 P( A) = P( B) =
    6 6
1 1 2 1
A  B =   P( A  B) = + = = = 33,33%
6 6 6 3
2) Qual a probabilidade de sair um número par ou um número menor que 3
quando se joga um dado.
 
A = número par  = 2,4,6 n( A) = 3  P( A) = =
3 1
  6 2
 
B = número menor que 3 = 1,2 n( B) = 2  P( B) = =
2 1
  6 3

A  B = 2 n( A  B) = 1  P( A  B) =
1
6
1 1 1 3 + 2 −1 4 2
P( A  B) = + − = = = = 66,67%
2 3 6 6 6 3

Evento Intersecção: Ocorrer o evento A e o evento B. A probabilidade de dois


eventos A e B ocorrerem simultaneamente numa prova é igual à probabilidade de um,
multiplicada pela probabilidade condicional do outro em relação ao primeiro.

P( A  B) = P( A) • P( B / A) ou P( A  B) = P( B) • P( A / B) .

Quando os eventos A e B forem independentes “Quando a ocorrência de um não


influencia a ocorrência do outro”, então:

P( A  B) = P( A) • P( B)

103
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Atividades
1) Numa certa cidade 40% da população gosta de futebol, 25 % gostam de
telenovela e 15 % de ambos. Uma pessoa da cidade é selecionada aleatoriamente.

a) Se ela gosta de futebol, qual a probabilidade de também gostar de telenovela.


b) Se ela gosta de futebol, qual a probabilidade de não gostar de telenovela.
c) Qual a probabilidade de não gostar de futebol e nem de telenovela.

2) Em certo colégio, 25% dos meninos e 10% das meninas estão estudando
informática. As meninas constituem 40% do corpo de estudantes. Se um
estudante é selecionado aleatoriamente e está estudando informática. Qual a
probabilidade de ele ser um menino.

3) São dadas as urnas:


A urna A contém 5 bolas vermelhas, 3 brancas e 8 azuis.
A urna B contém 3 bolas vermelhas e 5 brancas.
Uma urna é escolhida ao acaso e depois retirada uma bola. Encontra a
probabilidade de:

a) Uma bola vermelha é escolhida.


b) Uma bola branca é escolhida.
c) Uma bola azul é escolhida.

REFERÊNCIAS
BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,
2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.


MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.
Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

104
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 29_Algumas Técnicas para o Cálculo de Probabilidade

Nessa aula aprenderemos a registrar cálculo de probabilidade, identificando


algumas técnicas.
Palavras-chave: Probabilidade; Técnicas de Contagem; Diagrama de Árvore.

Técnicas de Contagem

Ao utilizarmos o método Clássico para determinarmos a probabilidade de um


determinado evento, é preciso conhecer o número total de resultados possíveis de
um experimento, para isto empregamos técnicas de contagem.

Listar os resultados possíveis.

✓ Responder questões do tipo Verdadeiro ou Falso.

✓ Se houver apenas uma questão, as possibilidades serão:


V ou F → 2 possibilidades.

✓ Se tivermos 2 questões, as possibilidades serão:


VV; VF; FV ou FF → 4 possibilidades.

✓ Quando tivermos 3 questões, as possibilidades serão:


VVV; VVF; VFV; VFF; FVV; FVF; FFV; FFF → 8 possibilidades.

Podemos aprimorar esta técnica de contagem no emprego das árvores de


decisão:
Podemos expandir o diagrama em árvore, para quantas questões forem
necessárias, mas não é prático, se tivéssemos três alternativas complicaria ainda
mais, mesmo porque não necessitamos de todos os resultados, e sim, sabermos
quantos resultados é possível, para isso utilizamos o princípio da multiplicação.

105
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Fig. 1 – A utilização de um diagrama em árvore


Questão n° 1 n° 2 n° 3 resultados
V VVV

V
F VVF
V V VFV
F
F VFF
V FVV

V
F FVF
F
V FFV
F

F FFF

O princípio da multiplicação afirma que, se o primeiro experimento admite a


resultados possíveis, o segundo tem b resultados possíveis, podendo ocorrer
qualquer combinação desses resultados, então o número de resultados possíveis
deste experimento será a x b
• Jogando-se uma moeda e um dado, a moeda pode apresentar dois
resultados e o dado pode apresentar seis resultados, logo o número total de
resultados é 2. 6 = 12
• Na jogada de 3 dados, cada um pode apresentar 6 resultados diferentes,
o número de resultados possíveis é 6. 6. 6 = 36
• Tenho 5 camisas e 3 gravatas diferentes, o número de resultados
possíveis de camisas e gravatas será: 5. 3 =15
• A probabilidade de um aluno que responde aleatoriamente 10 testes do
tipo “verdadeiro ou falso” acertar todas as 10 questões será:
Número de resultados possíveis → 2. 2. 2. 2. 2. 2. 2. 2. 2. 2 = 210 =
1024
Destes 1024 resultados possíveis apenas um tem a combinação dos 10
resultados corretos, logo → P (10 resultados corretos) =
1
= 0,00097656  0,0976%
1024

106
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Atividade Proposta

1) Numa comunidade de 1000 habitantes, 400 são sócios de um clube A, 300 de um


clube B e 200 de ambos. Escolhendo-se uma pessoa ao acaso, qual a probabilidade
dessa pessoa ser sócia de A ou de B?

2) Uma urna contém 50 bolinhas numeradas de 1 a 50. Sorteando-se uma bolinha,


qual a probabilidade de que o número observado seja múltiplo de 8?

3) Uma urna contém 3 bolas brancas e 4 bolas pretas. Tira-se, sucessivamente, 2


bolas. Qual a probabilidade de as bolas serem da mesma cor? (Monte uma árvore
de Probabilidade)

4) Numa certa cidade 40% da população gosta de futebol, 25 % gostam de telenovela


e 15 % de ambos. Uma pessoa da cidade é selecionada aleatoriamente.

a) Se ela gosta de futebol, qual a probabilidade de também gostar de telenovela.


b) Se ela gosta de futebol, qual a probabilidade de não gostar de telenovela.
c) Qual a probabilidade de não gostar de futebol e nem de telenovela.

5) Em certo colégio, 25% dos meninos e 10% das meninas estão estudando
informática. As meninas constituem 40% do corpo de estudantes. Se um estudante
é selecionado aleatoriamente e está estudando informática. Qual a probabilidade
de ele ser um menino.

6) São dadas as urnas:


A urna A contém 5 bolas vermelhas, 3 brancas e 8 azuis.
A urna B contém 3 bolas vermelhas e 5 brancas.
Uma urna é escolhida ao acaso e depois retirada uma bola. Encontra a
probabilidade de:

a) Uma bola vermelha é escolhida.


b) Uma bola branca é escolhida.
c) Uma bola azul é escolhida.

107
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.

MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.


Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

108
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 30_Correlação entre variáveis e o Coeficiente de Pearson

Nessa aula estabelecermos uma correlação entre duas variáveis por meio do
diagrama de dispersão e pelo coeficiente de correção de Pierson.
Palavras-chave: Correlação; Diagrama de Dispersão; Coeficiente de Pearson.

CORRELAÇÃO
Existem pesquisas que frequentemente procuram verificar se existe relação
entre duas ou mais variáveis, isto é, saber se as alterações sofridas por uma das
variáveis são acompanhadas por alterações nas outras.

Por exemplo:
Peso X Idade; Consumo X Renda; Altura X Peso de um indivíduo.
O termo correlação significa relação em dois sentidos (co + relação), e é usado
em estatística para designar a força que mantém unidos dois conjuntos de valores.
A verificação da existência e do grau de relação entre as variáveis é o objeto de
estudo da correlação.
Vamos analisar como exemplo as variáveis, nota da prova e tempo de estudo .

Tempo (X) Nota (Y)


3,0 4,5
7,0 6,5
2,0 3,7
1,5 4,0
12,0 9,3

Vamos colocar em um gráfico que se chama diagrama de dispersão os dados


referentes ao tempo de estudo e a nota dos alunos.

109
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Diagrama de dispersão
10
nota

0
0 2 4 6 8 10 12 14
tempo

O diagrama de dispersão é um gráfico onde pontos no espaço cartesiano XY


são usados para representar simultaneamente os valores de duas variáveis
quantitativas medidas em cada elemento do conjunto de dados.
O diagrama de dispersão é usado principalmente para visualizar a
relação/associação entre duas variáveis, mas também é muito útil para:
Comparar o efeito de dois tratamentos no mesmo indivíduo.
Verificar o efeito tipo antes/depois de uma avaliação.

Propriedade: -1  r  1

Casos particulares:
r = 1  correlação linear positiva e perfeita
r = -1  correlação linear negativa e perfeita
r = 0  inexistência de correlação linear
• Quanto mais próximo o valor de “r” estiver do valor “1”, mais forte a correlação
linear.
• Quanto mais próximo o valor de “r” estiver do “0”, mais fraca a correlação
linear.

110
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Como calcular o coeficiente de correlação:


Com os dados anteriores de tempo e nota estabeleceremos o grau de
correlação entre elas.
Tempo (X) Nota (Y)
3,0 4,5
7,0 6,5
2,0 3,7
1,5 4,0
12,0 9,3

O instrumento empregado para a medida da correlação linear é o coeficiente


de correlação. Esse coeficiente deve indicar o grau de intensidade da correlação
entre duas variáveis e, ainda, o sentido dessa correlação (positivo ou negativo).
Chamado de coeficiente de Person.

Não se assustem com a fórmula, pois é possível realizar cada uma das suas partes com
ajuda de tabelas.

Precisamos calcular:
➢ A somatória de todos os Xi;
➢ A somatória de todos os YI;
➢ A somatória do produto Xi.Yi;
➢ A somatória do Xi²;
➢ A somatória do Yi².

111
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Montamos a tabela com todas essas informações

Tempo (xi) Nota (yi) xi.yi xi² yi²

3,0 4,5 13,50 9,0 20,25


7,0 6,5 45,5 49,0 42,25
2,0 3,7 7,4 4,0 13,69
1,5 4,0 6,0 2,25 16,00

12,0 9,3 111,6 144,0 86,49

total 25,5 28,00 184 208,25 178,68

5.184 - 25,5.28
r =
(5.208,25 - 25,52 ).(5.178,68 - 282 )
920 − 714
r =
(1041,25 − 650,25).(8 93,40 − 784
206 206 206
r = = = = 0,9960
391.109,4 42775,4 206,822145 8

Sendo r = 0,9960, podemos afirmar que há uma correlação linear positiva


consideravelmente significante entre as duas variáveis.

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6. ed. Bauru: Pearson, 2016.

MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.


Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

112
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 31_Regressão Linear


Nessa aula iremos aprender a expressar os dados de uma correlação entre
duas variáveis, por meio de uma equação do 1º grau.
Palavras-chave: Regressão Linear; equação do 1ºgrau; Diagrama de Dispersão;
Relação entre duas variáveis.

REGRESSÃO

Regressão linear é o processo de traçar uma reta através dos dados em um


diagrama de dispersão. A reta resume esses dados, o que é útil quando fazemos
previsões.
Quando duas variáveis possuem certo grau de relacionamento (verificado
pela correlação), podemos aplicar a análise de regressão que vai nos permitir
descrever através de um modelo matemático, a relação entre duas variáveis,
partindo de n observações das mesmas.

A regressão é usada basicamente com duas finalidades: de previsão (prever o valor de y a partir
do valor de x) e estimar o quanto x influência ou modifica y.

• Para executarmos a regressão, as variáveis serão divididas em variável


dependente e variável independente.
• Para o eixo x, indicamos a variável independente e para o eixo y, a
dependente.
• Dessa forma temos: é o coeficiente linear, que dá a altura em que a reta corta
o eixo das ordenadas.

Vamos analisar os conceitos acima diante de um exemplo.


EXEMPLO 1: Quantidade de procaína (anestésico local usado por dentistas)
hidrolisada, em 10 moles/litro, no plasma humano, em função do tempo decorrido
após sua administração.

113
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Tempo
2 3 5 8 10 12 14 15
(minutos
Quantidade
3,5 5,7 9,9 16,3 19,3 25,7 28,2 32,6
hidrolisada

Gráfico de Dispersão das variáveis Tempo e Quantidade de Procaína

Fonte: elaborado pelo autor

Temos que chegar em um modelo matemática que represente estes dados,


que de acordo com o gráfico de correlação, existe uma correlação linear entre
essas duas variáveis.
Esse Modelo Matemática é dado por uma equação de primeiro grau:

Sabemos que x está representado pela variável tempo e que y pela variável
quantidade de procaína. Precisamos encontrar então os valores de “a” e “b”.

Para isso faremos um quadro como apoio para esses cálculos, que
mostramos a seguir:
2
X Y XY X
2 3,5 7,0 4

3 5,7 17,1 9

114
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

5 9,9 49,5 25

8 16,3 130,4 64

10 19,3 193,0 100

12 25,7 308,4 144

14 28,2 394,8 196

15 32,6 489,0 225


TOTAL (∑) 69 141,2 1589,2 767

Para calcular “a” na equação:

n= 8 ∑ xi = 69 (∑ xi)2 = 767

∑ xi. yi = 1589,2 ∑ yi = 141,2

a= [8. 1589,2-(69.141,2) / [8.767- (69)2] =


(12.713,6 - 9.742,8) / (6.136 - 4.761) =
= 2.970,8 / 1.375 = 2,16
a = 2,16

Para calcular b:
Na equação y = b + ax
Substituímos alguns valores para encontrar b.
a = 2,16
Podemos pegar qualquer valor da tabela da média da ∑ xi e y como a mé dia da
somatória de ∑ yi, isto é 69/8 =8,625 e 141,2/ 8 = 18,63 e colocamos na
equação.
b = (141,2/8) – 2,16. (69/8) = - 0,98

115
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Logo temos que b = - 0,98


E a equação de regressão é:

y = - 0,98 + 2,16x

Atividade 1
Consideremos as notas de 12 alunos de um curso de Licenciatura. Queremos
observar se existe correlação entre as notas de Estatística e da Língua
portuguesa.
Nota de Língua
Nota de Estatística
Portuguesa
4 5
6 7
7 8
6 5
9 9
8 8
8 5
2 4
2 5
5 4
4 6
9 8

a) Construa um gráfico de dispersão das variáveis nota de estatística e nota de


Língua portuguesa.
b) Calcule o coeficente de correlação de Pearson entre as variáveis.
c) O que pode afirmar em relação ao resultado obtido na letra b?
d) Calcule a equação que descreve a relação entre estas variáveis, isto é, a
equação que descreve esta regressão.

Atividade 2
Uma pesquisa pretende verificar se há correlação significativa entre o peso total do
lixo descartado, por dia, em 10 escolas com o peso do papel contido nesse lixo.

116
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

A seguir uma tabela com o peso do papel e os demais tipos de lixo descartado por
elas.
Escola A B C D E F G H I j
Peso 10,47 19,85 21,25 24,3 27,38 58.09 33,61 35,75 38,33 49.14
total
Peso de 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43
Papel

Determine a regra de Regressão dessas variáveis.

REFERÊNCIAS

BONAFINI, F. C. Probabilidade e Estatística. São Paulo: Pearson Education,


2015.

LARSON, R; FARBER, B. Estatística Aplicada. 6.ed. Bauru: Pearson, 2016.


MORETTIN, Luiz Gonzaga. Estatística Básica/Pedro A. Morettin, Wilton O.
Bussab. – 6. ed. p.11. – São Paulo: Saraiva, 2010.

117
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Aula 32_Alguns Erros na Mídia e o Tratamento da Informação:


FAKENEWS?

Nessa aula vamos estudar alguns gráficos colocados na mídia que


apresentam erros na sua elaboração, e que isso pode levar a interpretarmos os fatos
de maneira errônea, isto é, pode parecer fakenews.
Palavras- chave: Gráficos; erros na mídia; fakenews.

ANÁLISE DE GRÁFICOS DA MÍDIA

Atualmente, os meios de comunicação recorrem à Estatística para avaliar e


traduzir o assunto abordado, pois ela proporciona uma linguagem que agiliza a leitura
tornando sua visualização mais fácil e agradável. Porém nem sempre as informações
podem estar corretas tanto na veracidade do que está escrito como na sua forma de
escrita.
Apresentaremos a seguir alguns equívocos ou maneiras de intensificar uma
opinião com os objetivos de manipular pessoas que a mídia apresentou em relação
ao tratamento da informação.

Situação 1
Ipea (Instituto de Pesquisa Econômica Aplicada) 27/03/2014

Figura1 1

Três dias depois desta publicação o IPEA divulga oficialmente o que de fato ocorreu
na pesquisa, que estão a seguir o correto e as explicações dadas por eles sobre o
erro.

118
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Em nota1 para esclarecer o que haviam publicado não correto, o Ipea veio a público
e puclicou o seguinte:
Vimos a público pedir desculpas e corrigir dois erros nos resultados
de nossa pesquisa Tolerância social à violência contra as mulheres,
divulgada em 27/03/2014. O erro relevante foi causado pela troca
dos gráficos relativos aos percentuais das respostas às frases
Mulher que é agredida e continua com o parceiro gosta de apanhar
e Mulheres que usam roupas que mostram o corpo merecem ser
atacadas. Entre os 3.810 entrevistados, os percentuais corretos
destas duas questões são os seguintes:”1

O que não foi explicado:


 66% dos entrevistados na pesquisa eram mulheres, enquanto elas
representam 51% da população brasileira.
 “As conclusões gerais da pesquisa continuam válidas, ensejando o
aprofundamento das reflexões e debates da sociedade sobre seus
preconceitos”, defende o IPEA.

Situação 2
A seguir um gráfico mostrado na Globonews que trata da Inflação do Brasil
de 2009 a 2013.

1
Errata da pesquisa “Tolerância social à violência contra as mulheres”. Disponível em:
http://www.ipea.gov.br/portal/index.php?option=com_content&view=article&id=21971. Último acesso em
03/04/2022.

119
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Figura 2

Prestem atenção na distância desproporcional do 5,81% do centro da meta


de 4,5%. Os 4,5% são três vezes menores do que os 1,31%. Isso não é o mais grave.
O 5,91% de 2013 é maior do que 6,50% e 5,82%, índices de 2010 e 2011.
Destacamos na figura 3 abaixo.

Figura 3

O fato é que a inflação não superou o teto da meta que é de 6,5% em nenhum
ano. No limite ficou no teto em 2010. E ficar em 5, 91% no ano passado não é nada
grave. É parte do jogo. Com este tipo de abordagem a Globo ultrapassa até a linha
do que se pode chamar de desinformação.
Depois, O Conta Corrente, programa da Globonews que o veiculou, publicou uma
nota de correção e se comprometeu a retificar também no ar a informação.

120
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Situação 3
Ainda na Globonews, temos o seguinte gráfico apresentado:

Figura 4

Foi apresentada primeira a inflação de julho e depois a de junho para


provavelmente dar a sensação de que houve aumento da taxa, não se sabe se foi
proposital ou simplesmente um descuido na elaboração do gráfico e na realidade
cronologicamente deveriam ter mencionado junho e depois julho.

Situação 4

No Gráfico abaixo temos a informação da taxa de desemprego em alguns Países.

Figura 5

121
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

O Gráfico da Globonews parece ter algo errado em sua proporção, se


compararmos o Brasil com o Chile, por exemplo, observamos que 6,7 é maior do
que os 4,7% do Brasil, mas as alturas dos retângulos estão praticamente do mesmo
tamanho.
Situação 5
A mídia impressa lança mão de vários recursos para ilustrar seus argumentos
jornalísticos. Assim, além das fotos e ilustrações, diversas reportagens são
frequentemente ilustradas por tabelas e gráficos.

A figura 5 apresenta um exemplo de gráfico costumeiramente usado pela


mídia impressa para tratar de assuntos econômicos. Este gráfico foi reproduzido de
uma revista de circulação nacional que ilustra o desempenho comparativo entre duas
taxas de juros2.
Verifica-se que os eixos deste gráfico não são representados
convencionalmente, uma vez que os valores numéricos correspondentes ao eixo
vertical foram posicionados nos pontos de ligação dos segmentos de reta, e a origem
(de valor zero) não é apresentada de forma explícita. Uma fotografia do lançamento
de uma nave espacial foi associada ao gráfico, sendo aquela uma referência ao título
deste: “taxas estratosféricas”. Portanto, há a vinculação de um elemento extra
matemático, que no contexto deste gráfico adquire um caráter simbólico relacionado
a variação das taxas de juros. Ou seja, utilizou-se deste recurso pictórico para
enfatizar a elevação das referidas taxas naquele período.

2 Na taxa real desconta-se o índice de inflação do período a que se refere, o não acontece com a
taxa nominal.

122
UNIVERSIDADE METROPOLITANA DE SANTOS
Núcleo de Ensino a Distância

Num exame mais atento da variação de cada uma das taxas, nota-se que no
período descrito pelo gráfico há um aumento maior da taxa de juros reais, que chega
quase a duplicar seu valor em setembro de 1995 (passando de 1.57 em jun./95 para
2.98 em Set/95).
Enquanto a taxa nominal teve uma variação menor, passando de 4.04
(jun./95) para 4,51 (Set/95). Mesmo assim, a trajetória da nave espacial está
especificamente vinculada a variação da taxa de juros nominal. Tal organização dos
dados poderia influenciar o leitor a interpretar inadequadamente o gráfico e as
informações subjacentes ao mesmo. O exemplo dado ilustra o uso de um gráfico
pela mídia impressa. Essa utilização é norteada pelas intenções jornalísticas de
quem estrutura a matéria, podendo enfatizar, mascarar ou omitir determinados
aspectos da notícia.
Os gráficos apresentados nesta aula texto, alguns de dados da imprensa
escrita, possuem fonte de informação, porém as que foram retiradas de fotos de
noticiários de TV, foram oportunidades de alguns expectadores indignados com tal
tipo de informação, assim como muitos blogueiros. Nosso objetivo não foi difamar
nenhuma instituição, mas sim que seja um alerta para tomarmos cuidado com todas
as informações que nos chegam através de gráficos e tabelas. Lembrando que
somos também mediadores entre este conhecimento e grande parte da população
que são nossos alunos, torna-se fundamental explorar as capacidades críticas diante
destas informações, para não sermos manipulados por tendências de quem nos
informa.

123

Você também pode gostar