Escolar Documentos
Profissional Documentos
Cultura Documentos
A estatística tem seu desenvolvimento sempre em estado de avanço, com início em processos
baseado em processos matemáticos simplificados que aos poucos puderam e podem
proporcionar aos usuários dessa ciência, um passo a passo seguro para se tomar certas
decisões.
Além desse viés a estatística oferece recursos como a análise de probabilidade, cálculos de
índices matemáticos relacionados a média, mediana, desvio padrão e assim por diante, dando
ainda mais vazão a construção de dados matemáticos para quem precisa tomar decisões mais
assertivas.
Método estatístico:
Definição de método : Podemos definir método como uma maneira de se fazer algo, um
processo com um objetivo claro, um começo meio e fim de certa atividade que nos levará a
certo destino. Exemplo de método – Professor que utiliza maneiras interativas para ensinar
como por exemplo, juntar grupos de trabalho e oferecer uma situação problema onde o grupo
deverá apresentar uma solução.
Método experimental - Nesse método todas as causas possíveis são deixadas de lado e se
estimula resultados diferentes através da potencialização de uma nova causa. Exemplo: Teste
da vacina contra a Covid 19 levando em consideração a nova cepa do vírus que está circulando
no mundo. O presente método não descarta mais deixa de lado todos os estudos já realizados
e através de novos experimentos, concentra-se em descobrir novas soluções com base em
causas diferentes e específicas. Física, Química, Biologia.
Exemplo: Aumento do preço do combustível – Vamos imaginar que certo método de avaliação
estatística queira determinar o impacto do último aumento de combustíveis no bolso do
Brasileiro. No método estatístico não é possível eliminar as outras variáveis envolvidas como
por exemplo capacidade de renda, região em que se vive e assim por diante sem que haja
interferência nos resultados do estudo.
Crítica dos
dados
Coleta de
dados
Apuração
dos dados
e
divulgação
Ocasional – Por exemplo no caso da Covid 19 (Pesquisa relativa ao índice de mortes em idosos)
Crítica dos dados – Avaliar se os dados coletados foram absorvidos de forma correta e se as
respostas minimamente podem ser consideradas confiáveis.
Apuração dos dados – Soma e processamento dos dados obtidos criando inclusive a ordem
específica dos mesmos. Exemplo: Pesquisa com o intuito de avaliar o percentual de crianças e
jovens com idade entre 10 e 20 anos que frequentam o ensino.
10 anos – 60%,11 anos – 60%,12 anos – 60%,13 anos – 60%,14 anos – 60%,15 anos – 60%,16
anos – 60%,17 anos – 60%,18 anos – 60%,19 anos – 60%,20 anos – 60%.
Exposição dos dados – Utilizar a maneira mais adequada para se interpretar a informação
fruto da pesquisa. Podem ser utilizados gráficos, tabelas sendo apresentados através de
softwares, excel, power point e assim por diante.
Cenário
Empresa
econômico
Tomada de
decisão
Análise de dados
Fornecedores Mercado
estatísticos
Concorrentes
Para que esse produto seja lançado será necessária uma pesquisa estratégica relacionada a
aceitação por parte do cliente.
Os estudos estatísticos poderão demonstrar o grau de aceitação dos clientes em potencial com
relação ao produto em questão da seguinte forma:
Produto alimentício – Iogurte novo e com uma composição que promete ajustar fatores
intestinais (Regular Flora intestinal) como nunca realizado por outro produto.
Análise do teste tem que validar o grau de satisfação do cliente e naturalmente considerar se o
produto está atendendo de fato o que promete na prática e segundo a visão do cliente.
Bases da pesquisa:
B-) Desses 10.000 clientes, 2.000 estão na faixa etária entre 20 e 30 anos, 2.000 na faixa etária
entre 30 e 50 anos e 6.000 na faixa etária acima de 50 anos.
Quais a análise primordial extraída dessa pesquisa ? ---- A análise primordial demostra que
esse produto tem a tendência de ser mais eficiente e atrativo ao público acima de 50 anos,
sendo recomendado reforço publicitário através de campanhas específicas para atender esse
público.
Análise primordial vai exigir uma série de outras análises e decisões como por exemplo:
1-) Qual investimento necessário para focar o produto no público acima de 50 anos ?
Exemplificando:
Empresa
Dados estatísticos
Tomada de decisão
Requer estudos
aprofundados (Financeiro)
Em resumo:
Variável
Fenômeno Resultado
(Dados
(Base) estatístico
concretos)
Variáveis podem ser:
Qualitativas – Variáveis são expressas por atributo (sexo, cor da pele e assim por diante)
Quantitativas - Variáveis são expressas em números (salário operadores, idade alunos e assim
por diante)
Quantitativa contínua – Variável que pode assumir qualquer valor entre dois limites (Peso dos
alunos – 72, 72.5,73.3 e assim por diante)
Quantitativa discreta – Variável que pode assumir qualquer um dos valores do conjunto, mas
nunca valores como 72, 72.5,73.3. Essa variável quantitativa discreta irá identificar por
exemplo o número de alunos (10, 20, 30....e assim por diante)
Resumindo: De modo geral, as medições dão origem a variáveis contínuas (Peso, Altura) e as
contagens (Número de alunos, Número de funcionários afastados), variáveis discretas.
População e amostra:
Definições:
A análise estatística com base em uma população deve levar em consideração por exemplo a
faixa etária, região onde vivem, poder aquisitivo e assim por diante.
Exemplo:
A-) Estudo do grau de analfabetismo por região do Brasil (Norte, Nordeste, Centro Oeste,Sul)
B-) Quebrar as regiões em sub regiões (Por conta das disparidades sociais)
C-) Levar em consideração uma amostra que ofereça um resultado estatístico satisfatório
Am
ost
ra
População
População
População Norte
Sul
Centro Oeste
Exemplo:
Idade entre 20 e 30 anos – 20 colaboradores sendo que 50% (10) tem alguma comorbidade.
Idade entre 30 e 40 anos – 60 colaboradores sendo que 80% (48) tem alguma comorbidade.
Idade entre 40 e 50 anos – 100 colaboradores sendo que 90% (90) tem alguma comorbidade.
Idade entre 50 e 60 anos – 60 colaboradores sendo que 10% (6) tem alguma comorbidade.
A-) Onde atuar com relação a políticas internas da empresa associadas a saúde:
Merecem ações:
Idade entre 40 e 50 anos – 100 colaboradores sendo que 90% (90) tem alguma
comorbidade. Causa (Tabagismo)
Idade entre 30 e 40 anos – 60 colaboradores sendo que 80% (48) tem alguma
comorbidade. (Sedentarismo)
Idade entre 20 e 30 anos – 20 colaboradores sendo que 50% (10) tem alguma
comorbidade. (Stress)
A partir desse ponto a empresa pode tomar ações com maior clareza.
Regra estabelecida para essa pesquisa mediante o uso da tabela de números aleatórios:
Resultado estatístico
Alunos que mais faltaram pela ordem com relação ao total de faltas da sala:
61 – 10%
02 – 20%
01 – 20%
81 – 10%
73 – 10%
60 – 10%
66 – 10%
58 – 5%
53 – 5%
100% (Considerei hipoteticamente que esses alunos compõe todas as faltas da turma e os
demais não faltaram)
Uma tabela existe para de uma forma simples sintetizar os valores que uma ou mais variáveis
podem assumir em um conjunto de dados.
Além das tabelas a estatística também pode ser estruturada através de gráfico aos quais
trabalharemos um pouco mais adiante.
Tabelas servem para construir base matemática associada a estatística com o intuito de
oferecer ao analista dos dados a possibilidade da melhor interpretação possível dentro do
universo de dados disponíveis de forma a tomar decisões mais assertivas.
**** Definição geral de tabela “Tabela é um quadro que resume um conjunto de observações”
A-) Corpo: “Conjunto de linhas e colunas (Excel) que contém informações sobre a variável em
estudo”
B-) Cabeçalho: “A parte superior da tabela que específica o conteúdo das colunas”
C-) Coluna indicadora: “Da parte da tabela que específica o conteúdo das linhas”
D-) Linhas: “Retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se
inscrevem e se relacionam diretamente com as colunas”
F-) Título: “Sempre localizado no topo da tabela, oferecendo um conjunto de informações que
respondam de maneira clara os seguintes pontos: O que ?, Quando ?, Onde ?
G- Notas e chamadas: “Uma nota se refere a uma fonte de pesquisa utilizada”, assim como
uma chamada, “Exemplifica determinadas análises da tabela que precisam estar em
evidência”.
TÍTULO
B-) Quando não temos dados concretos, preencher as células com três pontos “...”
C-) Quando se existe dúvida quanto ao dado, preencher as células com uma interrogação“?”
D-) Quando o valor for muito pequeno dentro do horizonte de informações , pode acrescentar
a célula um número correspondente de zeros “0,0;0,00;0,000....”
Em conformidade com a definição acima, fica claro entender que três elementos são
fundamentais:
Exemplos:
Uma tabela de série histórica nesse caso pode servir para uma análise a título de exemplo:
O ano de 2.008 foi o que teve o melhor preço do frango. Essa análise suscita uma pergunta.
Por que foi o ano de melhor preço ao longo dos últimos 6 anos ? Podem haver várias
respostas.
A-) Os custos subiram, foi necessário subir o preço, não houve reflexo nos lucros.
B-) Houve uma procura maior pela carne de frango em razão do alto preço da carne bovina
sendo dessa forma possível aumentar o preço em razão do aumento da demanda.
ANO 2.019
Qual pergunta poderia ser feita nesse caso ? Qual a explicação para diferenças tão grandes de
produção se as fábricas contam com as mesmas tecnologias ?
2006
ESPÉCIES QUANTIDADE
BOVINOS 205.886.244
BUBALINOS 1.156.870
AVES 821.541.630
SUÍNOS 35.173.824
OVINOS 16.019.170
CAPRINOS 10.401.449
FONTE: IBGE
Qual pergunta poderia ser feita por um investidor interessado em investir no ramo
agropecuário ?
B-) Do tipo de produto com maior faturamento, qual a região do país conta com o maior
número de cabeças, levando em consideração o maior faturamento?
2000-2002
Quais perguntas poderiam ser feitas com base nos dados da tabela acima ?
A-) Qual a renda média de quem tinha internet em casa nesse período por cidade ?
****Dados absolutos: São dados oriundos de contagem ou medida direto de uma fonte
específica. Ex: “Número de alunos presentes na Live do Unifia”
Dessa maneira vamos trabalhar com dados absolutos e relativos traduzindo dados por meio de
três aspectos diferentes:
AS PERCENTAGENS:
TURMA 20211
Esse tipo de informação poderia facilitar a seleção de alunos para indicação em empresas que
podem solicitar idades específicas.
CIDADE X CIDADE Y
Tais análises se tornam mais coerentes na medida em que se constrói a análise com
percentagens.
CIDADE X
CIDADE Y
ÍNDICES
Exemplo 1:
Exemplo 2:
Unidades Ind. 5
UNIDADE FATURAMENTO %
A R$ 10.000.000 5,56%
B R$ 20.000.000 11,11%
C R$ 50.000.000 27,78%
D R$ 60.000.000 33,33%
E R$ 40.000.000 22,22%
TOTAL R$ 180.000.000 100,00 %
Forma de cálculo “A” – (10.000.000/180.000.000).100 = 5,56% e assim sucessivamente.
COEFICIENTES
Exemplo
Nascimentos Óbitos
0,10 0,60
Análise
Causa – Covid
Exemplo
Exemplo:
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
A tabela não ordenada damos o nome de “Tabela primitiva”.
Temos que levar em consideração nesse caso acima a idade dos alunos. A idade terá relação
direta com a estatura média da sala.
Observação importante: A tabela acima está construída conforme a pesquisa foi realizada.
Dessa forma a tabela não está ordenada o que dificulta um entendimento mais assertivo dos
dados.
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
A tabela ordenada damos o nome de “ROL”.
Perguntas:
C-) Quantos alunos tem a mesma altura? R.155 (4 alunos); R.156 (3 alunos); R.158 (2 alunos);
R.160 (5 alunos); R.161 (4 alunos); R.162 (2 alunos); R.163 (2 alunos); R.164 (3 alunos); R.168 (2
alunos); Resposta concreta – De um total de 40 alunos, 27 alunos têm estatura repetida.
OBSERVAÇÃO IMPORTANTE: QUEM FAZ NÃO DEVE E NÃO PODE CONFERIR. A CONFERÊNCIA
DEVE ESTAR SEMPRE ASSOCIADA A QUEM NÃO FAZ A OPERAÇÃO.
Outra pergunta?
Qual a taxa de alunos da população referida que tem estatura repetida dentro da série de
dados colhidos ? População é de 40 alunos, sendo que 27 deles tem estatura repetida ?
Na abordagem acima, realizamos até certo ponto uma análise baseada na distribuição de
frequência. Vamos abaixo construir esse raciocínio de maneira mais organizada.
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
ESTATURA FREQUÊNCIA ESTATURA (CM) FREQUÊNCIA ESTATURA (CM) FREQUÊNCIA
(CM)
150 1 158 2 167 1
151 1 160 5 168 2
152 1 161 4 169 1
153 1 162 2 170 1
154 1 163 2 172 1
155 4 164 3 173 1
156 3 165 1 TOTAL 40
157 1 166 1
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
ESTATURA FREQUÊNCIA ESTATURA (CM) FREQUÊNCIA ESTATURA (CM) FREQUÊNCIA
(CM)
150 1 158 2 167 1
151 1 160 5 168 2
152 1 161 4 169 1
153 1 162 2 170 1
154 1 163 2 172 1
155 4 164 3 173 1
156 3 165 1 TOTAL 40
157 1 166 1
Fórmula--(Frequência/Total da Frequência).100
Imaginemos por exemplo que hipoteticamente estivéssemos buscando nesse estudo alunos
com déficit de crescimento. A partir dessa premissa seria necessário determinar quem seriam
esses alunos. Vamos partir do pressuposto de que o intervalo entre “150 I-154” para a faixa
etária estudada indicaria um déficit de crescimento. A partir desse ponto, identificar esse
público e tomar ações é fundamental.
Os dados estatísticos precisam nos levar a uma ação frente as respostas matemáticas obtidas.
Temos também a letra “k”, que simboliza o número total de classes ou 6 classes.
Classe 2 ---- “li” identifica o limite inferior da classe; “Li” identifica o limite superior da classe.
“i” Classe 2 154 I-158 ---- “li” 154; “Li” 158;podemos identificar também como:
“l2” 154; “L2” 158 – Nada mais nada menos que os limites inferior e superior da classe 2.
Amplitude de um intervalo de classe “Que nada mais é que a medida do intervalo que define
a classe .
Essa medida é obtida pela diferença entre os limites superior e inferior da classe e
determinada pela sigla “hi”:
Amplitude total da distribuição “Que nada mais é que a medida entre o limite superior
máximo da última classe menos o limite inferior mínimo da primeira classe.
AT = L(Máximo) – l(mínimo)
AT = 174 - 150 = 24 cm
Essa denominação existe pelo fato dos dados em geral se agruparem em torno de valores
centrais. Dentre as medidas de tendência central podemos destacar:
Média, moda e mediana são relevantes em termos estatísticos na medida em que oferecem
suporte matemático para a construção e análise de dados estatísticos.
Média aritmética – Trata-se do quociente da divisão da soma dos valores da variável pelo
número de itens relacionados as variáveis.
Dentro dessa análise vamos abordar nessa parte do estudo a Média Aritmética Simples.
Exemplo:
Dia 1 10 10,20%
Dia 2 14 14,29%
Dia 3 13 13,27%
Dia 4 15 15,31%
Dia 5 16 16,33%
Dia 6 18 18,37%
Dia 7 12 12,23%
98 100,00%
Sobre o aspecto da estatística, podemos guardar números que irão oferecer o desempenho
histórico do animal no quesito produção de leite. Diante do aspecto relacionado a estatística,
podemos além do cálculo de desempenho dia, avaliar se o animal manterá a média de
produção de leite ao longo do tempo.
Dia 1 10 10,20%
Dia 2 14 14,29%
Dia 3 13 13,27%
Dia 4 15 15,31%
Dia 5 16 16,33%
Dia 6 18 18,37%
Dia 7 12 12,23%
98 100,00%
Média aritmética – Trata-se do quociente da divisão da soma dos valores da variável pelo
número de itens relacionados as variáveis.
x= xi / n ---- x = 98 / 7, logo a média de produção do animal nesse período é de 14 litros por dia.
Se o animal produz a muito tempo uma média de 14 litros de leite dia, produzir menos que
essa média implica em perda de produtividade do animal.
Ainda sobre o conceito de média, as vezes a média pode ser um número diferente de todos os
números da série de dados que ela representa. Um exemplo dessa condição é o seguinte:
2,4,8,9 – Soma total de 23 para quatro elementos --- Media = 23/4 = 5,75, número não
diretamente representado no conjunto. Em razão desse fator, podemos dizer que a média não
tem para o conjunto de dados uma existência concreta.
Ainda relacionado ao fator da média, temos o que chamamos de Desvio Padrão em relação a
Média.
Em definição o desvio padrão em relação a média é a diferença entre cada elemento de um
conjunto de valores e a média aritmética.
Dia 1 10 10,20%
Dia 2 14 14,29%
Dia 3 13 13,27%
Dia 4 15 15,31%
Dia 5 16 16,33%
Dia 6 18 18,37%
Dia 7 12 12,23%
98 100,00%
x= xi / n ---- x = 98 / 7, logo a média de produção do animal nesse período é de 14 litros por dia.
1ª Propriedade: A soma algébrica dos desvios tomados em relação a média é nula ou igual a
zero.
Vamos resolver essa questão efetuando inicialmente a soma de todos os desvios padrão e ao
final vamos somar esse resultado pelo número de itens relacionados as variáveis. Utilizemos os
cálculos de desvio padrão feitos anteriormente:
Cálculo
-7+7=0
1ª Propriedade: A soma algébrica dos desvios tomados em relação a média é nula ou igual a
zero.
Vamos a um exemplo:
Dia 1 10 12
Dia 2 14 16
Dia 3 13 15
Dia 4 15 17
Dia 5 16 18
Dia 6 18 20
Dia 7 12 14
98 112
Vamos então calcular a média com a base na soma constante do valor 2 as variáveis.
14 + 2 = 16
Dia 1 10 30
Dia 2 14 42
Dia 3 13 39
Dia 4 15 45
Dia 5 16 48
Dia 6 18 54
Dia 7 12 36
98 294
14 x 3 = 42
MODA:
Por definição : Diz respeito ao valor que ocorre com maior frequência em uma série de valores.
A moda pode ser considerada natural, amodal ou bimodal.
Moda “natural”: 1 único dado que se repete com maior frequência dentro do conjunto.
Aluno Idade
Aluno A 7
Aluno B 8
Aluno C 10
Aluno D 10
Aluno E 10
Aluno F 11
Aluno G 12
Aluno H 13
Aluno I 15
Moda “natural”: 1 único dado que se repete com maior frequência dentro do conjunto.
Moda = 10 – C,D,E
Aluno Idade
Aluno A 7
Aluno B 8
Aluno C 9
Aluno D 10
Aluno E 11
Aluno F 12
Aluno G 13
Aluno H 14
Aluno I 15
Aluno A 7
Aluno B 8
Aluno C 8
Aluno D 8
Aluno E 10
Aluno F 10
Aluno G 10
Aluno H 14
Aluno I 15
Moda “bimodal”: Existe mais de um valor que se repete dentro do conjunto.
MEDIANA:
Por definição a mediana é definida como o número que se encontra no centro de uma série de
números.
Quando o conjunto de números for ímpar, conseguimos definir a mediana com maior
tranquilidade.
Exemplo:
9, 13,10,12,14,15,11,16,17
Esse conjunto representa dias diferentes: Na medida que é um conjunto ímpar eu poderia de
antemão calcular a mediana, porém antes disso é necessário ordenar a posição dos dados.
9,10,11,12,13,14,15,16,17
Se o conjunto é ímpar o número central desse conjunto é a mediana: Mediana então é 13.
Quando o conjunto de números for par, conseguimos definir a mediana somando os dois
números centrais e dividindo o mesmo por 2.
Exemplo:
9, 13,10,12,14,15,11,16,17,18
Ordenar:
9,10,11,12,13,14,15,16,17,18
Mediana = 13,50