Você está na página 1de 26

Aula de 22.02.

2021 – Lousa Virtual

Capítulo 1 - A Natureza da Estatística

A ciência em geral, tem suas abordagens diretamente relacionadas a história humana.

O Homem e suas relações complexas do ponto de vista biológico e cerebral constitui um


importante ponte para o desenvolvimento da ciência como um todo. Logo entendemos que a
estatística é oriunda de uma base científica, associada diretamente aos conceitos
matemáticos.

A estatística tem seu desenvolvimento sempre em estado de avanço, com início em processos
baseado em processos matemáticos simplificados que aos poucos puderam e podem
proporcionar aos usuários dessa ciência, um passo a passo seguro para se tomar certas
decisões.

O avanço da estatística nos oferece a possibilidade da coleta, checagem, análise, formatação e


divulgação de dados estatísticos cada vez mais assertivos, utilizando tabelas, gráficos, e
inúmeras formas de registro e divulgação de dados que acabam por facilitar o processo de
quem necessita de uma informação consistente para se tomar decisão.

Além desse viés a estatística oferece recursos como a análise de probabilidade, cálculos de
índices matemáticos relacionados a média, mediana, desvio padrão e assim por diante, dando
ainda mais vazão a construção de dados matemáticos para quem precisa tomar decisões mais
assertivas.

Método estatístico:

Definição de método : Podemos definir método como uma maneira de se fazer algo, um
processo com um objetivo claro, um começo meio e fim de certa atividade que nos levará a
certo destino. Exemplo de método – Professor que utiliza maneiras interativas para ensinar
como por exemplo, juntar grupos de trabalho e oferecer uma situação problema onde o grupo
deverá apresentar uma solução.

Método experimental - Nesse método todas as causas possíveis são deixadas de lado e se
estimula resultados diferentes através da potencialização de uma nova causa. Exemplo: Teste
da vacina contra a Covid 19 levando em consideração a nova cepa do vírus que está circulando
no mundo. O presente método não descarta mais deixa de lado todos os estudos já realizados
e através de novos experimentos, concentra-se em descobrir novas soluções com base em
causas diferentes e específicas. Física, Química, Biologia.

Definição geral – O método experimental consiste em manter constantes todas as causas


(fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus
efeitos, caso existam.

Método estatístico – Tem como principal característica a impossibilidade de se manter


inalteradas outras causas ou situações relativas.

Exemplo: Aumento do preço do combustível – Vamos imaginar que certo método de avaliação
estatística queira determinar o impacto do último aumento de combustíveis no bolso do
Brasileiro. No método estatístico não é possível eliminar as outras variáveis envolvidas como
por exemplo capacidade de renda, região em que se vive e assim por diante sem que haja
interferência nos resultados do estudo.

Definição geral: O método estatístico, diante da impossibilidade de manter as demais causas


envolvidas na análise, constantes, admite todas essas causas presentes, incluindo todas as
possibilidades na fonte do estudo.

Visão geral do método estatístico:

Crítica dos
dados
Coleta de
dados

Apuração
dos dados
e
divulgação

ANÁLISE DE RESULTADOS E TOMADA DE DECISÃO

Definições de cada etapa

Coleta – Buscar todos os dados necessários em relação ao objeto da pesquisa.

Contínua – Quando os dados são analisados continuamente (Nascimentos, óbitos, frequência


dos alunos)

Periódica – Quando existe intervalo de tempo na pesquisa (Censo de 10 em 10 anos)

Ocasional – Por exemplo no caso da Covid 19 (Pesquisa relativa ao índice de mortes em idosos)

Crítica dos dados – Avaliar se os dados coletados foram absorvidos de forma correta e se as
respostas minimamente podem ser consideradas confiáveis.

Apuração dos dados – Soma e processamento dos dados obtidos criando inclusive a ordem
específica dos mesmos. Exemplo: Pesquisa com o intuito de avaliar o percentual de crianças e
jovens com idade entre 10 e 20 anos que frequentam o ensino.

10 anos – 60%,11 anos – 60%,12 anos – 60%,13 anos – 60%,14 anos – 60%,15 anos – 60%,16
anos – 60%,17 anos – 60%,18 anos – 60%,19 anos – 60%,20 anos – 60%.

Exposição dos dados – Utilizar a maneira mais adequada para se interpretar a informação
fruto da pesquisa. Podem ser utilizados gráficos, tabelas sendo apresentados através de
softwares, excel, power point e assim por diante.

Análise de resultados – Tirar conclusões e tomar decisões.

Duas definições adicionais e importantes:


Coleta, organização e descrição de dados – Estatística descritiva

Análise e interpretação de dados – Estatística indutiva ou inferencial

A estatística nas empresas:

Próxima aula dia – 01.03 (Iniciaremos com esse tema).

Cenário
Empresa
econômico

Tomada de
decisão

Análise de dados
Fornecedores Mercado
estatísticos

Concorrentes

Onde de fato a estatística pode ajudar uma empresa ou negócio?

Exemplo: Determinada empresa tem um projeto de lançar um produto novo no mercado.

Para que esse produto seja lançado será necessária uma pesquisa estratégica relacionada a
aceitação por parte do cliente.

Onde os estudos estatísticos entram nesse aspecto ?

Os estudos estatísticos poderão demonstrar o grau de aceitação dos clientes em potencial com
relação ao produto em questão da seguinte forma:

Produto alimentício – Iogurte novo e com uma composição que promete ajustar fatores
intestinais (Regular Flora intestinal) como nunca realizado por outro produto.

Produto vai estar em fase de teste:

Análise do teste tem que validar o grau de satisfação do cliente e naturalmente considerar se o
produto está atendendo de fato o que promete na prática e segundo a visão do cliente.

Feedback do cliente baseado em pesquisa de satisfação que vai demonstrar se o produto


realmente está atendendo ao requisito.

Bases da pesquisa:

A-) Pesquisa teve como base um universo de 10.000 clientes

B-) Desses 10.000 clientes, 2.000 estão na faixa etária entre 20 e 30 anos, 2.000 na faixa etária
entre 30 e 50 anos e 6.000 na faixa etária acima de 50 anos.

C-) Dessa análise se obteve os seguintes dados:

C1-) 2.000 avaliados entre 20 e 30 anos – Percentual de satisfação foi de 40%

C2-) 2.000 avaliados entre 30 e 50 anos – Percentual de satisfação foi de 60%


C3-) 4.000 avaliados acima de 50 anos – Percentual de satisfação foi de 85%

Quais a análise primordial extraída dessa pesquisa ? ---- A análise primordial demostra que
esse produto tem a tendência de ser mais eficiente e atrativo ao público acima de 50 anos,
sendo recomendado reforço publicitário através de campanhas específicas para atender esse
público.

Análise primordial vai exigir uma série de outras análises e decisões como por exemplo:

1-) Qual investimento necessário para focar o produto no público acima de 50 anos ?

2-) Qual o custo de produção do produto visando esse público ?

3-) Qual o público geral de mercado nessa faixa etária ? Financeiro

4-) Qual a capacidade instalada da indústria para essa produção ?

5-) Qual o faturamento possível ?

Exemplificando:

Empresa

Dados estatísticos

Tomada de decisão

Requer estudos
aprofundados (Financeiro)

Aula de 01.03.2021 – Lousa Virtual

População e amostra com base na estatística

Antes de analisarmos o conceito de população e amostra vamos definir o termo “Variáveis”

Variáveis – É um conjunto de resultados possíveis de um fenômeno.

 Fenômeno “sexo” existem 2 resultados possíveis, masculino ou feminino


 Fenômeno “número de filhos” existe um número de resultados possíveis representado
através dos números naturais (0,1,2,3,4....)
 Fenômeno “altura” temos uma situação um pouco diferente, pois podemos ter um
número infinito de valores numéricos dentro de um intervalo (1.70,1.66,1.72,1.00......)

Em resumo:

Variável
Fenômeno Resultado
(Dados
(Base) estatístico
concretos)
Variáveis podem ser:

Qualitativas – Variáveis são expressas por atributo (sexo, cor da pele e assim por diante)

Quantitativas - Variáveis são expressas em números (salário operadores, idade alunos e assim
por diante)

Quantitativa contínua – Variável que pode assumir qualquer valor entre dois limites (Peso dos
alunos – 72, 72.5,73.3 e assim por diante)

Quantitativa discreta – Variável que pode assumir qualquer um dos valores do conjunto, mas
nunca valores como 72, 72.5,73.3. Essa variável quantitativa discreta irá identificar por
exemplo o número de alunos (10, 20, 30....e assim por diante)

Resumindo: De modo geral, as medições dão origem a variáveis contínuas (Peso, Altura) e as
contagens (Número de alunos, Número de funcionários afastados), variáveis discretas.

População e amostra:

Definições:

População: Um conjunto de entes portadores de pelo menos uma característica comum


(População estatística ou Universo Estatístico).

A análise estatística com base em uma população deve levar em consideração por exemplo a
faixa etária, região onde vivem, poder aquisitivo e assim por diante.

Exemplo:

A-) Estudo do grau de analfabetismo por região do Brasil (Norte, Nordeste, Centro Oeste,Sul)

B-) Quebrar as regiões em sub regiões (Por conta das disparidades sociais)

C-) Levar em consideração uma amostra que ofereça um resultado estatístico satisfatório

Na prática população e amostra:

Am
ost
ra

População
População
População Norte
Sul
Centro Oeste

Uma amostra portanto é um subconjunto finito de uma população.


Técnicas de amostragem

A-) Amostragem casual ou aleatória simples-Através da numeração da população de 1 a n,


realiza-se um sorteio aleatório da população, onde mediante ao mecanismo aleatório poderá
se consolidar os elementos de uma amostra.

Exemplo:

Fenômeno – “Pessoas com comorbidades dentro da empresa”

População – “1.200 funcionários”

Variáveis – “Análise de 20% da população” ou o correspondente a 240 funcionários.

Amostra – “240 funcionários”

Amostragem – “Sorteio aleatório de 240 funcionários, numerados de 1 a 1.200”.

Elementos da Amostra – “1,20,32,44,1.000 ...... até 240 colaboradores”

 Resultado da pesquisa baseado na amostragem:

Idade entre 20 e 30 anos – 20 colaboradores sendo que 50% (10) tem alguma comorbidade.

Idade entre 30 e 40 anos – 60 colaboradores sendo que 80% (48) tem alguma comorbidade.

Idade entre 40 e 50 anos – 100 colaboradores sendo que 90% (90) tem alguma comorbidade.

Idade entre 50 e 60 anos – 60 colaboradores sendo que 10% (6) tem alguma comorbidade.

Com base nesses resultados várias perguntas podem ser feitas:

A-) Onde atuar com relação a políticas internas da empresa associadas a saúde:

Merecem ações:

 Idade entre 40 e 50 anos – 100 colaboradores sendo que 90% (90) tem alguma
comorbidade. Causa (Tabagismo)
 Idade entre 30 e 40 anos – 60 colaboradores sendo que 80% (48) tem alguma
comorbidade. (Sedentarismo)
 Idade entre 20 e 30 anos – 20 colaboradores sendo que 50% (10) tem alguma
comorbidade. (Stress)

A partir desse ponto a empresa pode tomar ações com maior clareza.

B-) Amostragem mediante uma tabela de números aleatórios (Normalmente utilizada


quando a realização de sorteio se torna inviável, devido ao grande Universo Populacional):

Fenômeno - “Pesquisa de frequência com base no número de alunos de um determinado


curso”

População – “90 alunos”

Variáveis – “Análise de 10% da população” ou o correspondente a 9 alunos.


Amostra – “9 alunos”

Amostragem – “Mediante a tabela de números aleatórios 9 alunos, numerados de 1 a 90”.


Para utilizar a tabela pode se utilizar qualquer critério pois através da coleta de dados dessa
tabela haverá uma escolha de alunos sem qualquer predisposição desse ou daquele.
Lembrando que os alunos são de um curso específico e serão pesquisados somente os
matriculados.

Regra estabelecida para essa pesquisa mediante o uso da tabela de números aleatórios:

Considerar a 18 linha, mediante a coleta de números com 2 algarismos (Regra)

Construção dos elementos da amostra:

Linha 18 Tabela de números aleatórios - 61,02,01,81,73,92,60,66,73,58,53,34

Elementos da Amostra – “ 61,02,01,81,73,60,66,58,53.... até 9 colaboradores de um Universo


de 90 colaboradores”

Resultado estatístico

Amostra total – corresponde a 60% do total de faltas da sala

Alunos que mais faltaram pela ordem com relação ao total de faltas da sala:

61 – 10%

02 – 20%

01 – 20%

81 – 10%

73 – 10%

60 – 10%

66 – 10%

58 – 5%

53 – 5%

100% (Considerei hipoteticamente que esses alunos compõe todas as faltas da turma e os
demais não faltaram)

Análise final: Alunos devem melhorar a frequência.

Amostragem estratificada: Dividida em grupos

Sexo M 54 10% 5,4 = Amostra arredondada de 5 Homens (61,02,01,81,73)

Sexo F 36 10% 3,6 = Amostra arredondada de 4 Mulheres (60,66,58,53)

Total 90 - Estratificar significa dividir a amostra em padrão (Homem x Mulher)


Aula de 08.03.2021 – Lousa Virtual - Séries estatísticas

Séries estatísticas “Tabelas”

Tabelas – Basicamente estaremos trabalhando em Excel.

Não é necessariamente a “Tabela” o mais importante e sim os dados constantes na mesma.

Uma tabela existe para de uma forma simples sintetizar os valores que uma ou mais variáveis
podem assumir em um conjunto de dados.

Além das tabelas a estatística também pode ser estruturada através de gráfico aos quais
trabalharemos um pouco mais adiante.

Tabelas servem para construir base matemática associada a estatística com o intuito de
oferecer ao analista dos dados a possibilidade da melhor interpretação possível dentro do
universo de dados disponíveis de forma a tomar decisões mais assertivas.

**** Definição geral de tabela “Tabela é um quadro que resume um conjunto de observações”

Composição de uma tabela:

A-) Corpo: “Conjunto de linhas e colunas (Excel) que contém informações sobre a variável em
estudo”

B-) Cabeçalho: “A parte superior da tabela que específica o conteúdo das colunas”

C-) Coluna indicadora: “Da parte da tabela que específica o conteúdo das linhas”

D-) Linhas: “Retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se
inscrevem e se relacionam diretamente com as colunas”

E-) Casa ou Célula: “Espaço destinado a um determinado número ou mais diretamente a um só


número”

F-) Título: “Sempre localizado no topo da tabela, oferecendo um conjunto de informações que
respondam de maneira clara os seguintes pontos: O que ?, Quando ?, Onde ?

G- Notas e chamadas: “Uma nota se refere a uma fonte de pesquisa utilizada”, assim como
uma chamada, “Exemplifica determinadas análises da tabela que precisam estar em
evidência”.
TÍTULO

MÉDIA DE ANOS DE ESTUDO DAS PESSOAS DE 10 ANOS OU MAIS DE IDADE


CABEÇALHO
BRASIL – 2003 - 2007

ANOS MÉDIA DE ANOS DE ESTUDO


2003 7,2
2004 7,3
LINHA 2005 7,4
2006 7,7
2007 7,8
FONTE: IBGE

OBSERVAÇÕES FINAIS RELATIVAS A CONSTRUÇÃO DE UMA TABELA: CORPO


Quando houver:
COLUNA
A-) Resultado zero em relação a natureza das coisas ou os valores numéricos das coisas,
preencher a célula com um traço horizontal “-------"

B-) Quando não temos dados concretos, preencher as células com três pontos “...”

C-) Quando se existe dúvida quanto ao dado, preencher as células com uma interrogação“?”

D-) Quando o valor for muito pequeno dentro do horizonte de informações , pode acrescentar
a célula um número correspondente de zeros “0,0;0,00;0,000....”

Aula de 15.03.2021 Séries estatísticas

Em definição, série estatística é toda tabela que apresenta a distribuição de um conjunto de


dados estatísticos em função de certa época, local ou espécie.

Em conformidade com a definição acima, fica claro entender que três elementos são
fundamentais:

Tempo, Espaço e a Espécie.

Histórico, Geográfico e Específico.

Exemplos:

A-) Tabela de série histórica ou cronológica:

FRANGO – PREÇOS MÉDIOS

EM SÃO PAULO – 2003-2008

ANOS PREÇO MÉDIO EM R$


2003 2,56
2004 2,64
2005 2,67
2006 2,53
2007 3,20
2008 3,64
FONTE: ASSOCIAÇÃO PAULISTA DE AVICULTUTA

Uma tabela de série histórica nesse caso pode servir para uma análise a título de exemplo:

O ano de 2.008 foi o que teve o melhor preço do frango. Essa análise suscita uma pergunta.
Por que foi o ano de melhor preço ao longo dos últimos 6 anos ? Podem haver várias
respostas.

A-) Os custos subiram, foi necessário subir o preço, não houve reflexo nos lucros.
B-) Houve uma procura maior pela carne de frango em razão do alto preço da carne bovina
sendo dessa forma possível aumentar o preço em razão do aumento da demanda.

B-) Tabela de série geográfica ou de localização:

PRODUÇÃO POR PAÍS DO PRODUTO “X”

ANO 2.019

PAÍS UNIDADES PRODUZIDAS


6 - BRASIL 10.000.000
3 - ITÁLIA 13.500.000
2 - ALEMANHA 17.700.000
4 - INGLATERRA 11.860.000
5 - SUÉCIA 10.100.000
1 - JAPÃO 19.900.000
FONTE: RELATÓRIO PRODUTIVO POR UNIDADE

Qual pergunta poderia ser feita nesse caso ? Qual a explicação para diferenças tão grandes de
produção se as fábricas contam com as mesmas tecnologias ?

C-) Tabela de série específica:

REBANHOS BRASILEIROS - EFETIVO

NOS ESTABELECIMENTOS AGROPECUÁRIOS

2006

ESPÉCIES QUANTIDADE
BOVINOS 205.886.244
BUBALINOS 1.156.870
AVES 821.541.630
SUÍNOS 35.173.824
OVINOS 16.019.170
CAPRINOS 10.401.449
FONTE: IBGE

Qual pergunta poderia ser feita por um investidor interessado em investir no ramo
agropecuário ?

A-) Qual é o tipo de rebanho com maior faturamento ?

B-) Do tipo de produto com maior faturamento, qual a região do país conta com o maior
número de cabeças, levando em consideração o maior faturamento?

C-) Tabela de séries conjugadas ou de dupla entrada:


RESIDÊNCIAS COM INTERNET

2000-2002

CIDADE 2000 2001 2002


AMPARO 15.000 16.000 16.500
ITAPIRA 14.200 14.380 15.000
SERRA NEGRA 9.900 10.300 10.450
ÁGUAS DE LINDÓIA 6.500 6.580 6.700
MONTE ALEGRE DO SUL 1.400 1.480 1.510
FONTE: IBGE

Quais perguntas poderiam ser feitas com base nos dados da tabela acima ?

A-) Qual a renda média de quem tinha internet em casa nesse período por cidade ?

B-) Qual a razão da cidade de Amparo, aumentar consideravelmente o acesso a Internet em


três anos, mais que as outras cidades ?

Dados absolutos e dados relativos:

****Dados absolutos: São dados oriundos de contagem ou medida direto de uma fonte
específica. Ex: “Número de alunos presentes na Live do Unifia”

****Dados relativos: São resultado de comparação por quociente (razões, proporção),


devidamente calculados através do conjunto dos dados absolutos. Ex: “Número de alunos
presentes na Live do Unifia.

 90% dos alunos participaram na primeira live


 95% dos alunos participaram na segunda live
 93% dos alunos participaram da terceira live e assim por diante

Dessa maneira vamos trabalhar com dados absolutos e relativos traduzindo dados por meio de
três aspectos diferentes:

Percentagens, índices, coeficientes e taxas.

AS PERCENTAGENS:

MATRÍCULA NO CURSO DE GPI DO UNIFIA

TURMA 20211

IDADE NÚMERO DE ALUNOS PERCENTAGEM


22 10 43,47%
19 8 34,78%
28 5 21,75%
TOTAL 23 100,00%
Divide-se o número de alunos por idade pelo total de alunos e multiplica-se por 100.

22 anos – (10/23).100 = 43,47% - 19 anos – (8/23).100 = 34,78% - 28 anos-(5/23).100 = 21,73%

Esse tipo de informação poderia facilitar a seleção de alunos para indicação em empresas que
podem solicitar idades específicas.
CIDADE X CIDADE Y

CATEGORIAS N. ALUNOS % N. ALUNOS %


ENSINO FUNDAMENTAL 19.286 90,97% 38.660 91,00%
ENSINO MÉDIO 1.681 7,93% 3.399 8%
ENSINO SUPERIOR 234 1,10% 424 1%
TOTAL 21.201 100% 42.483 100%

ANÁLISE IMPORTANTE: Evitar conclusões comparativas analisando apenas e de forma


superficial os dados absolutos.

Tais análises se tornam mais coerentes na medida em que se constrói a análise com
percentagens.

CIDADE X

ENSINO FUNDAMENTAL – (19.286/21.201).100 = 90,97%

ENSINO MÉDIO – (1.681/21.201).100 = 7,93%

ENSINO SUPERIOR – (234/21.201).100 = 1,10%

CIDADE Y

ENSINO FUNDAMENTAL – (38.660/42.483).100 = 91,00%

ENSINO MÉDIO – (3.399/42.483).100 = 8%

ENSINO SUPERIOR – (424/42.483).100 = 1%

EXEMPLO COMPARATIVO 2, COM OS MESMOS DADOS NUMÉRICOS:

UNIDADE PRODUTIVA X UNIDADE PRODUTIVA Y

CATEGORIAS DESPERDÍCIO % DESPERDÍCIO %


PRODUTO “A” 19.286 L 90,97% 38.660 L 91,00%
PRODUTO “B” 1.681 L 7,93% 3.399 L 8%
PRODUTO “C” 234 L 1,10% 424 L 1%
TOTAL 21.201 100% 42.483 100%

ÍNDICES

Definição: São razões entre duas grandezas.

Exemplo 1:

Renda per capita = renda (Salário) ----- R$ 80.000.000 R$ 1.142,86


População 70.000

Exemplo 2:

Faturamento Líquido Médio por Unidade a = Faturamento Total ----- R$ 180.000.000


R$ 36.000.000,00

Unidades Ind. 5

UNIDADE FATURAMENTO %

A R$ 10.000.000 5,56%
B R$ 20.000.000 11,11%
C R$ 50.000.000 27,78%
D R$ 60.000.000 33,33%
E R$ 40.000.000 22,22%
TOTAL R$ 180.000.000 100,00 %
Forma de cálculo “A” – (10.000.000/180.000.000).100 = 5,56% e assim sucessivamente.

COEFICIENTES

Definição: São razões entre o número de ocorrências e o número total.

Exemplo

Coeficiente de natalidade (Período) = número de nascimentos últimos 5 anos 500 =


0,10

população total atual 5.000

Coeficiente de mortalidade (Período) = número de óbitos 3.000 =


0,60

população total atual 5.000

ANÁLISE VARIAÇÃO NATALIDADE / MORTALIDADE ÚLTIMOS 5 ANOS COM BASE NA


POPULAÇÃO ATUAL

Nascimentos Óbitos

0,10 0,60

Análise

Morreram 5 vezes mais o número de nascidos

Causa – Covid

Impactos – Temos muito menos pessoas proporcionalmente produtivas, gerando impactos


econômicos e sociais sendo, menos gente consumindo, menos condição de estímulo para a
indústria além de outros aspectos de gastos com saúde pública associados aos problemas
psicológicos ligados a pandemia.
TAXAS

Definição: São os coeficientes multiplicados por uma potência.

Exemplo

Taxa de evasão escolar = evadidos .100 180 . 100 = 0,2903


(Coeficiente).100 ---- 29,03% (Taxa)

Total matriculados 620

Aula de 22.03.2021 Distribuição de frequência

O que é frequência no estudo estatístico ?

Resposta: Relata o número de vezes em que uma informação aparece dentro de um


determinado universo populacional.

Dentro de uma determinada série de valores, relacionadas a um universo populacional,


podemos ter valores que se repetem ou não. Independente da repetição a frequência
determina o número de vezes em que certa variável aparece em uma série de valores
estatísticos.

Exemplo:

Estatura de (40 alunos -População) do colégio A “Sem ordenação”

166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
A tabela não ordenada damos o nome de “Tabela primitiva”.

Temos que levar em consideração nesse caso acima a idade dos alunos. A idade terá relação
direta com a estatura média da sala.

Observação importante: A tabela acima está construída conforme a pesquisa foi realizada.
Dessa forma a tabela não está ordenada o que dificulta um entendimento mais assertivo dos
dados.

Primordial então organizar os dados dessa tabela.

Estatura de (40 alunos -População) do colégio A “Ordenada”

150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
A tabela ordenada damos o nome de “ROL”.

A partir da tabela ordenada já podemos extrair algumas informações:

Perguntas:

A-) Qual a menor estatura na população da tabela ? R.150

B-) Qual a maior estatura na população da tabela ? R.173

C-) Quantos alunos tem a mesma altura? R.155 (4 alunos); R.156 (3 alunos); R.158 (2 alunos);
R.160 (5 alunos); R.161 (4 alunos); R.162 (2 alunos); R.163 (2 alunos); R.164 (3 alunos); R.168 (2
alunos); Resposta concreta – De um total de 40 alunos, 27 alunos têm estatura repetida.

OBSERVAÇÃO IMPORTANTE: QUEM FAZ NÃO DEVE E NÃO PODE CONFERIR. A CONFERÊNCIA
DEVE ESTAR SEMPRE ASSOCIADA A QUEM NÃO FAZ A OPERAÇÃO.

Outra pergunta?

Qual a taxa de alunos da população referida que tem estatura repetida dentro da série de
dados colhidos ? População é de 40 alunos, sendo que 27 deles tem estatura repetida ?

(Número de estaturas repetidas/População Total).100 --- (27/40).100 = 67,50 % dos alunos


tem estatura repetida e 32,5% não tem repetição de estatura.

Na abordagem acima, realizamos até certo ponto uma análise baseada na distribuição de
frequência. Vamos abaixo construir esse raciocínio de maneira mais organizada.

TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIA:

Estatura de (40 alunos -População) do colégio A “Ordenada”

150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
ESTATURA FREQUÊNCIA ESTATURA (CM) FREQUÊNCIA ESTATURA (CM) FREQUÊNCIA
(CM)
150 1 158 2 167 1
151 1 160 5 168 2
152 1 161 4 169 1
153 1 162 2 170 1
154 1 163 2 172 1
155 4 164 3 173 1
156 3 165 1 TOTAL 40
157 1 166 1

VAMOS TRANSFORMAR A TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIA EM UMA TABELA DE


DISTRIBUIÇÃO POR INTERVALOS DE CLASSE:

Estatura de (40 alunos -População) do colégio A “Ordenada”

150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
ESTATURA FREQUÊNCIA ESTATURA (CM) FREQUÊNCIA ESTATURA (CM) FREQUÊNCIA
(CM)
150 1 158 2 167 1
151 1 160 5 168 2
152 1 161 4 169 1
153 1 162 2 170 1
154 1 163 2 172 1
155 4 164 3 173 1
156 3 165 1 TOTAL 40
157 1 166 1

TABELA DE DISTRIBUIÇÃO POR INTERVALOS DE CLASSE:

Estatura de (40 alunos -População) do colégio A - “Utilizar um intervalo de 4 cm”

ESTATURA (CM) FREQUÊNCIA


150 I-154 4
154 I-158 9
158 I-162 11
162 I-166 8
166 I-170 5
170I-174 3
TOTAL 40

I- “Significa Intervalo de classes”

TABELA DE DISTRIBUIÇÃO POR INTERVALOS DE CLASSE “TAXA”:

Estatura de (40 alunos -População) do colégio A - “Utilizar um intervalo de 4 cm”

ESTATURA (CM) FREQUÊNCIA TAXA


150 I-154 4 10%
154 I-158 9 22,5%
158 I-162 11 27,5%
162 I-166 8 20,0%
166 I-170 5 12,5%
170I-174 3 7,5%
TOTAL 40

Fórmula--(Frequência/Total da Frequência).100

150 I-154 -- (4/40).100 = 10%

154 I-158 -- (9/40).100 = 22,5%

158 I-162 -- (11/40).100 = 27,5%

162 I-166 -- (8/40).100 = 20%

166 I-170 -- (5/40).100 = 12,5%

170 I-177 -- (3/40).100 = 7,5% (10%+22,5%+27,5%+20%+12,5%+7,5% = 100%)

A partir desse estudo e em um caráter mais aprofundado, poderíamos estabelecer em uma


outra tabela quem são os alunos que estão dentro de cada intervalo de frequência.

Imaginemos por exemplo que hipoteticamente estivéssemos buscando nesse estudo alunos
com déficit de crescimento. A partir dessa premissa seria necessário determinar quem seriam
esses alunos. Vamos partir do pressuposto de que o intervalo entre “150 I-154” para a faixa
etária estudada indicaria um déficit de crescimento. A partir desse ponto, identificar esse
público e tomar ações é fundamental.

TABELA DE DISTRIBUIÇÃO POR INTERVALOS DE CLASSE “TAXA”:

Estatura de (40 alunos -População) do colégio A - “Utilizar um intervalo de 4 cm”

ESTATURA (CM) FREQUÊNCIA TAXA


150 I-154 4 10%
154 I-158 9 22,5%
158 I-162 11 27,5%
162 I-166 8 20,0%
166 I-170 5 12,5%
170I-174 3 7,5%
TOTAL 40

TABELA DE DISTRIBUIÇÃO POR INTERVALOS DE CLASSE “TAXA”:

Estatura de (4 alunos – População “Com Déficit de crescimento) do colégio A

Ano de 2021 “Idade Entre 13 e 14 Anos”

ESTATURA (CM) FREQUÊNCIA TAXA


150 I-154 4 10%

Nome Idade Número de membros da Família Faixa de renda Família


José Paulo Fonseca 13 6 R$ 1.500,00
Júlio Fonseca 14 6 R$ 1.500,00
João Pedro da Silva 14 4 R$ 1.000,00
Tiago da Luz 13 8 R$ 2.000,00
Ação – Criar um plano para melhoria das condições de renda e alimentação das Famílias.

Os dados estatísticos precisam nos levar a uma ação frente as respostas matemáticas obtidas.

Analises adicionais para a consolidação do conceito:

Elementos de uma distribuição de frequência:

Classes deve, ser representadas pela letra “i”

TABELA DE DISTRIBUIÇÃO POR INTERVALOS DE CLASSE “TAXA”:

Estatura de (40 alunos -População) do colégio A - “Utilizar um intervalo de 4 cm”

ESTATURA (CM) FREQUÊNCIA TAXA


150 I-154 4 10%
154 I-158 9 22,5%
158 I-162 11 27,5%
162 I-166 8 20,0%
166 I-170 5 12,5%
170I-174 3 7,5%
TOTAL 40

“i” Classe 1 150 I-154

“i” Classe 2 154 I-158

“i” Classe 3 158 I-162

“i” Classe 4 162 I-166

“i” Classe 5 166 I-170

“i” Classe 6 170 I-174

Temos também a letra “k”, que simboliza o número total de classes ou 6 classes.

Limites de classe – Chamamos também dos extremos de cada classe.

Classe 2 ---- “li” identifica o limite inferior da classe; “Li” identifica o limite superior da classe.

“i” Classe 2 154 I-158 ---- “li” 154; “Li” 158;podemos identificar também como:

“l2” 154; “L2” 158 – Nada mais nada menos que os limites inferior e superior da classe 2.
Amplitude de um intervalo de classe “Que nada mais é que a medida do intervalo que define
a classe .

Essa medida é obtida pela diferença entre os limites superior e inferior da classe e
determinada pela sigla “hi”:

Classe 2 --- hi = Li (-) li hi= 158 (-) 154 hi = 4

Amplitude total da distribuição “Que nada mais é que a medida entre o limite superior
máximo da última classe menos o limite inferior mínimo da primeira classe.

Essa medida é orientada através da sigla “AT”

AT = L(Máximo) – l(mínimo)

AT = 174 - 150 = 24 cm

Aula de 29/03/2021 – Média, Moda e Mediana

Construção inicial de raciocínio ligado ao tema

Em estatística temos o que podemos denominar de medidas de tendência Central.

Essa denominação existe pelo fato dos dados em geral se agruparem em torno de valores
centrais. Dentre as medidas de tendência central podemos destacar:

 Média, Moda, Mediana

Média, moda e mediana são relevantes em termos estatísticos na medida em que oferecem
suporte matemático para a construção e análise de dados estatísticos.

Média aritmética – Trata-se do quociente da divisão da soma dos valores da variável pelo
número de itens relacionados as variáveis.

Dentro dessa análise vamos abordar nessa parte do estudo a Média Aritmética Simples.

Exemplo:

A produção leiteira de determinada vaca, durante o período de 7 dias foi a seguinte:

Dia Litros Desempenho dia

Dia 1 10 10,20%
Dia 2 14 14,29%
Dia 3 13 13,27%
Dia 4 15 15,31%
Dia 5 16 16,33%
Dia 6 18 18,37%
Dia 7 12 12,23%
98 100,00%

Desempenho dia 1 – (10/98).100 = 10,20%

Desempenho dia 2 – (14/98).100 = 14,29%

Desempenho dia 3 – (13/98).100 = 13,27%

Desempenho dia 4 – (15/98).100 = 15,31%

Desempenho dia 5 – (16/98).100 = 16,33%

Desempenho dia 6 – (18/98).100 = 18,37%

Desempenho dia 7 – (12/98).100 = 12,24%

Sobre o aspecto da estatística, podemos guardar números que irão oferecer o desempenho
histórico do animal no quesito produção de leite. Diante do aspecto relacionado a estatística,
podemos além do cálculo de desempenho dia, avaliar se o animal manterá a média de
produção de leite ao longo do tempo.

Vamos agora calcular a média:

Dia Litros Desempenho dia

Dia 1 10 10,20%
Dia 2 14 14,29%
Dia 3 13 13,27%
Dia 4 15 15,31%
Dia 5 16 16,33%
Dia 6 18 18,37%
Dia 7 12 12,23%
98 100,00%

Vejamos novamente a orientação:

Média aritmética – Trata-se do quociente da divisão da soma dos valores da variável pelo
número de itens relacionados as variáveis.

x= xi / n ---- x = 98 / 7, logo a média de produção do animal nesse período é de 14 litros por dia.

Se o animal produz a muito tempo uma média de 14 litros de leite dia, produzir menos que
essa média implica em perda de produtividade do animal.

Ainda sobre o conceito de média, as vezes a média pode ser um número diferente de todos os
números da série de dados que ela representa. Um exemplo dessa condição é o seguinte:

2,4,8,9 – Soma total de 23 para quatro elementos --- Media = 23/4 = 5,75, número não
diretamente representado no conjunto. Em razão desse fator, podemos dizer que a média não
tem para o conjunto de dados uma existência concreta.

Ainda relacionado ao fator da média, temos o que chamamos de Desvio Padrão em relação a
Média.
Em definição o desvio padrão em relação a média é a diferença entre cada elemento de um
conjunto de valores e a média aritmética.

Dia Litros Desempenho dia

Dia 1 10 10,20%
Dia 2 14 14,29%
Dia 3 13 13,27%
Dia 4 15 15,31%
Dia 5 16 16,33%
Dia 6 18 18,37%
Dia 7 12 12,23%
98 100,00%

x= xi / n ---- x = 98 / 7, logo a média de produção do animal nesse período é de 14 litros por dia.

di = xi – x - Diante dessa fórmula vamos encontrar o desvio padrão>

Dia 1 – (10 – 14) -- di = -4

Dia 2 – (14 – 14) -- di = 0

Dia 3 – (13 – 14) -- di = -1

Dia 4 – (15 – 14) -- di = 1

Dia 5 – (16 – 14) -- di = 2

Dia 6 – (18 – 14) -- di = 4

Dia 7 – (12 – 14) -- di = -2

A média possui também algumas propriedades as quais vamos conhecer agora:

1ª Propriedade: A soma algébrica dos desvios tomados em relação a média é nula ou igual a
zero.

Vamos resolver essa questão efetuando inicialmente a soma de todos os desvios padrão e ao
final vamos somar esse resultado pelo número de itens relacionados as variáveis. Utilizemos os
cálculos de desvio padrão feitos anteriormente:

Dia 1 – (10 – 14) -- di = -4

Dia 2 – (14 – 14) -- di = 0

Dia 3 – (13 – 14) -- di = -1


Dia 4 – (15 – 14) -- di = 1

Dia 5 – (16 – 14) -- di = 2

Dia 6 – (18 – 14) -- di = 4

Dia 7 – (12 – 14) -- di = -2

Cálculo

(-4 + 0 + (-1) + 1 + 2 + 4 + (-2)) + Número de itens relacionados as variáveis = 7 dias

-7+7=0

1ª Propriedade: A soma algébrica dos desvios tomados em relação a média é nula ou igual a
zero.

2ª Propriedade: Somando ou diminuindo uma constante © de todos os valores de uma


variável, a média do conjunto fica aumentada ou diminuída dessa mesma constante.

Vamos a um exemplo:

Somar 2 a cada um dos valores da variável do exemplo dado:

Dia Litros Somando 2

Dia 1 10 12
Dia 2 14 16
Dia 3 13 15
Dia 4 15 17
Dia 5 16 18
Dia 6 18 20
Dia 7 12 14
98 112

Vamos então calcular a média com a base na soma constante do valor 2 as variáveis.

Média com base na © -- 112/7 = 16

Média anterior + © 2 = A média calculado com base na © 2.

14 + 2 = 16

3ª Propriedade: Multiplicando ou dividindo todos os valores de uma variável por uma ©, a


média do conjunto fica multiplicada ou dividida por essa constante.

Vamos ao exemplo utilizando como © o número 3 em forma de multiplicação.

Dia Litros Multiplicar 3

Dia 1 10 30
Dia 2 14 42
Dia 3 13 39
Dia 4 15 45
Dia 5 16 48
Dia 6 18 54
Dia 7 12 36
98 294

Para calcular a nova média ---- (294/7) = 42

Média anterior x © 3 = A média calculada com base na © 3.

14 x 3 = 42

Análise final importante dentro do assunto “Média”

Temos que tomar cuidado ao analisar a média através de um fator isolado.

Imaginemos a seguinte resposta aparentemente construída de forma sólida através da média.

1-) Resposta 1 – Minha empresa paga muito bem seus colaboradores.

Colaborador Salário Análise %

José Silva R$ 1.500,00 8,72%


Haroldo Pimentel R$ 2.000,00 11,63%
Luiz Gonzaga R$ 2.000,00 11,63%
Pedro Pontes R$ 1.500,00 8,72%
Manoel Ferreira R$ 10.200,00 59,30%
R$ 17.200,00 100,00%

Manoel Ferreira R$ 10.200,00 59,30%


Está puxando a média para cima logo a resposta dada pelo gestor é incoerente.

Vamos a um cálculo mais lúcido:

José Silva R$ 1.500,00 21,43%


Haroldo Pimentel R$ 2.000,00 28,57%
Luiz Gonzaga R$ 2.000,00 28,57%
Pedro Pontes R$ 1.500,00 21,43%
R$ 7.000,00 100,00%

7.000/4 = Média salarial de R$ 1.750,00 – Essa é a realidade da maioria.

MODA:

Por definição : Diz respeito ao valor que ocorre com maior frequência em uma série de valores.
A moda pode ser considerada natural, amodal ou bimodal.

Moda “natural”: 1 único dado que se repete com maior frequência dentro do conjunto.

Moda “amodal”: Não existem valores que se repetem dentro do conjunto.

Moda “bimodal”: Existe mais de um valor que se repete dentro do conjunto.

Vamos avaliar o seguinte conjunto relativo a idade de um determinado número de alunos de


um curso de Pintura.

Aluno Idade

Aluno A 7
Aluno B 8
Aluno C 10
Aluno D 10
Aluno E 10
Aluno F 11
Aluno G 12
Aluno H 13
Aluno I 15

Moda “natural”: 1 único dado que se repete com maior frequência dentro do conjunto.

Moda = 10 – C,D,E

Aluno Idade

Aluno A 7
Aluno B 8
Aluno C 9
Aluno D 10
Aluno E 11
Aluno F 12
Aluno G 13
Aluno H 14
Aluno I 15

Moda “amodal”: Não existem valores que se repetem dentro do conjunto.


Aluno Idade

Aluno A 7
Aluno B 8
Aluno C 8
Aluno D 8
Aluno E 10
Aluno F 10
Aluno G 10
Aluno H 14
Aluno I 15
Moda “bimodal”: Existe mais de um valor que se repete dentro do conjunto.

Bimodal – Alunos B,C,D 8 anos; E,F,G 10 anos

MEDIANA:

Por definição a mediana é definida como o número que se encontra no centro de uma série de
números.

Quando o conjunto de números for ímpar, conseguimos definir a mediana com maior
tranquilidade.

Exemplo:

Produção em litros de leite tirados de uma vaca em certo período.

9, 13,10,12,14,15,11,16,17

Esse conjunto representa dias diferentes: Na medida que é um conjunto ímpar eu poderia de
antemão calcular a mediana, porém antes disso é necessário ordenar a posição dos dados.

9,10,11,12,13,14,15,16,17

Se o conjunto é ímpar o número central desse conjunto é a mediana: Mediana então é 13.

Quando o conjunto de números for par, conseguimos definir a mediana somando os dois
números centrais e dividindo o mesmo por 2.

Exemplo:

Produção em litros de leite tirados de uma vaca em certo período.

9, 13,10,12,14,15,11,16,17,18

Ordenar:

9,10,11,12,13,14,15,16,17,18

Se o conjunto é par o número central desse conjunto é a mediana: (13+14)/2

Mediana = 13,50

Você também pode gostar