Você está na página 1de 8

1.

A IMPORTÂNCIA DA ANÁLISE DESCRITIVA DE DADOS NAS


ORGANIZAÇÕES

A análise descritiva de dados desempenha um papel fundamental nas


organizações, pois fornece insights valiosos sobre padrões, tendências e
características dos dados coletados.
É uma etapa inicial na interpretação dos dados e pode servir como base para
estratégias empresariais. Sua importância pode ser resumida das seguintes formas:

● Identificação de padrões e tendências: Através da análise descritiva, é possível


identificar padrões e tendências nos dados, o que pode ajudar as organizações
a tomar decisões mais informadas e estratégicas.
● Compreensão das características dos dados: A análise descritiva permite
explorar as características dos dados, como média, mediana, moda, desvio
padrão, entre outros. Isso ajuda a ter uma compreensão mais completa dos
dados e a identificar possíveis outliers ou valores discrepantes.
● Detecção de insights e oportunidades: Ao analisar os dados de forma
descritiva, é possível descobrir insights valiosos que podem levar a
oportunidades de negócio. Esses insights podem ajudar a identificar novos
mercados, otimizar processos internos, melhorar a experiência do cliente, entre
outros benefícios.
● Suporte à tomada de decisões: A análise descritiva fornece informações
confiáveis e objetivas que podem auxiliar na tomada de decisões estratégicas.
Com base nos dados analisados, as organizações podem tomar decisões mais
embasadas e reduzir os riscos envolvidos.
● Avaliação de desempenho: A análise descritiva também é útil para avaliar o
desempenho de uma organização, departamento ou projeto. Ao analisar
métricas e indicadores relevantes, é possível identificar áreas de melhoria e
tomar medidas corretivas.

Além disso, existem diferentes medidas estatísticas que podem ser aplicadas
na análise descritiva, dependendo do que se deseja analisar. Algumas das medidas
mais comuns incluem:
- Média: representa o valor médio de um conjunto de dados.
- Mediana: representa o valor que está no meio de um conjunto de dados
quando eles estão ordenados.
- Moda: representa o valor que ocorre com mais frequência em um conjunto de
dados.
- Desvio padrão: mede a dispersão dos dados em relação à média.
- Variância: mede a variabilidade dos dados em relação à média.
A análise descritiva é apenas uma das abordagens possíveis na análise de dados.
Outras abordagens incluem análise preditiva, análise prescritiva e análise diagnóstica.
A análise preditiva, por exemplo, busca prever eventos futuros com base em padrões
identificados nos dados históricos. Já a análise prescritiva visa identificar as decisões
que devem ser tomadas para alcançar os melhores resultados, simulando diferentes
cursos de ação e considerando variáveis relevantes.
A análise diagnóstica, por sua vez, se concentra em as causas e razões por trás
dos eventos passados, ajudando a identificar áreas de melhoria ou problemas a serem
resolvidos.
Cada uma dessas abordagens desempenha um papel importante na análise de
dados, permitindo que as organizações tomem decisões informadas e alcancem seus
objetivos de forma eficaz.

2. CONCEITOS-CHAVE E FUNÇÕES DA ESTATÍSTICA DESCRITIVA

A estatística descritiva é uma área da estatística que se concentra em resumir e


descrever as características de um conjunto de dados. Ela fornece informações sobre a
distribuição, tendências e padrões presentes nos dados, permitindo uma compreensão
mais profunda do conjunto de dados em questão.
Além disso, ela é amplamente utilizada em diversas áreas, como ciências
sociais, economia, medicina e negócios. Ela permite resumir, organizar e interpretar
os dados, facilitando a compreensão e tomada de decisões com base em informações
concretas
As funções principais da estatística descritiva são:

● Distribuição de frequência: é uma representação tabular ou gráfica que mostra


a frequência com que cada valor ou intervalo de valores ocorre em um
conjunto de dados. Isso permite visualizar a distribuição dos dados e
identificar padrões ou tendências.
● Medidas de tendência central: são utilizadas para determinar o valor central ou
típico de um conjunto de dados. As principais medidas de tendência central
são a média, a mediana e a moda. A média é a soma de todos os valores
dividida pelo número de observações. A mediana é o valor que divide o
conjunto de dados ao meio, com metade dos valores abaixo e metade acima. A
moda é o valor que ocorre com maior frequência no conjunto de dados.
● Medidas de dispersão: indicam o quão espalhados ou agrupados estão os
valores de um conjunto de dados. Elas fornecem informações sobre a
variabilidade dos dados. As principais medidas de dispersão incluem a
variância, o desvio padrão e a amplitude. A variância mede a média dos
quadrados das diferenças entre cada valor e a média. O desvio padrão é a raiz
quadrada da variância e fornece uma medida de dispersão em torno da média.
A amplitude é a diferença entre o maior e o menor valor do conjunto de dados.

3. REGRESSÃO LINEAR

A regressão linear é uma técnica estatística fundamental para modelar a


relação entre uma variável dependente (a variável que queremos prever) e uma ou
mais variáveis independentes (variáveis explicativas). Ela é frequentemente usada em
cenários de negócios para entender e prever relações entre variáveis, o que
pode ser útil para tomar decisões informadas e fazer previsões. Segue abaixo os
conceitos-chave e as funções da regressão linear, juntamente com exemplos concretos
de aplicação em cenários de negócios.

Conceitos-chave da Regressão Linear:

1. Variável Dependente (Y): Esta é a variável que estamos tentando prever ou


explicar. Também é chamada de variável de resposta.
2. Variáveis Independentes (X): São as variáveis que usamos para prever ou
explicar a variável dependente. Também são chamadas de variáveis
explicativas ou preditores.
3. Equação da Regressão Linear: A equação da regressão linear é da forma Y =
aX + b, onde 'a' é o coeficiente angular (ou inclinação) e 'b' é o coeficiente
linear (ou intercepto).
4. Coeficiente Angular (a): Representa a mudança na variável dependente (Y)
para uma mudança unitária nas variáveis independentes (X). É uma medida da
inclinação da linha de regressão.
5. Coeficiente Linear (b): Representa o valor de Y quando X é igual a zero. É o
ponto onde a linha de regressão corta o eixo vertical (Y).

Funções da Regressão Linear:

1. Análise Descritiva: A regressão linear pode ser usada para descrever a relação
entre variáveis. Por exemplo, podemos usar a regressão linear para entender
como o preço de um produto (variável dependente) está relacionado com a
quantidade de publicidade gasta (variável independente).
2. Previsão: Uma das principais funções da regressão linear é a previsão.
Podemos usar um modelo de regressão linear treinado com dados históricos
para fazer previsões futuras. Por exemplo, uma loja de varejo pode usar a
regressão linear para prever as vendas futuras com base em fatores como a
época do ano, o histórico de vendas passadas e a publicidade.
3. Identificação de Relações Causais (em algumas situações): Embora a
regressão linear não prove causalidade por si só, pode ajudar a identificar
relações potenciais entre variáveis. Por exemplo, um estudo de negócios pode
usar regressão linear para investigar se o aumento no treinamento de
funcionários (X) está relacionado ao aumento na produtividade (Y).

Exemplos de Aplicações em Cenários de Negócios:

1. Previsão de Vendas: Uma empresa de varejo pode usar a regressão linear para
prever as vendas futuras com base em variáveis como preço, publicidade,
sazonalidade e outros fatores.
2. Gestão de Recursos Humanos: Uma organização pode aplicar a regressão
linear para entender como fatores como experiência, educação e anos de
serviço afetam o salário de seus funcionários.
3. Precificação de Produtos: Empresas podem usar a regressão linear para
determinar o preço ideal de um produto com base em custos de produção,
demanda do mercado e preços da concorrência.
4. Avaliação de Desempenho de Marketing: Agências de marketing podem
analisar como os gastos em diferentes canais de publicidade (online, TV,
rádio) impactam as vendas de um produto ou serviço.
5. Previsão de Demanda de Estoque: Empresas que gerenciam estoques podem
usar a regressão linear para prever a demanda futura de produtos e, assim,
evitar a falta de estoque ou o excesso de estoque.

Importante ressaltar que a escolha da técnica de regressão linear é apenas o


começo. É importante também avaliar a qualidade do modelo, verificar a adequação
dos dados e considerar a interpretação dos resultados, especialmente em cenários de
negócios complexos. Além disso, a regressão linear tem algumas suposições que
devem ser atendidas para que os resultados sejam confiáveis, como a normalidade dos
resíduos e a independência dos erros.

4. REGRESSÃO LOGÍSTICA

A regressão logística é uma técnica de análise de dados que usa matemática


para encontrar as relações entre dois fatores de dados. Em seguida, essa relação é
usada para prever o valor de um desses fatores com base no outro. A previsão
geralmente tem um número finito de resultados, como sim ou não.
Por exemplo, digamos que você deseje adivinhar se o visitante do seu site
clicará no botão de finalização de compra no carrinho de compras ou não. A análise
de regressão logística analisa o comportamento anterior do visitante, como o tempo
gasto no site e o número de itens no carrinho. Ela determina que, anteriormente, se os
visitantes passassem mais de cinco minutos no site e adicionassem mais de três itens
ao carrinho, eles clicavam no botão de finalização de compra. Usando essas
informações, a função de regressão logística pode prever o comportamento de um
novo visitante do site.
Assim, a regressão logística é uma técnica importante no campo da
inteligência artificial e machine learning (IA/ML). Os modelos de ML são programas
de software que podem ser treinados para executar tarefas complexas de
processamento de dados sem intervenção humana. Os modelos de ML criados usando
regressão logística ajudam as organizações a extrair insights práticos de seus dados
comerciais. Esses insights podem ser usados para análise preditiva a fim de reduzir
custos operacionais, aumentar a eficiência e escalar mais rapidamente. Por exemplo,
as empresas podem descobrir padrões que melhoram a retenção de funcionários ou
geram um design de produto mais lucrativo.
Segue abaixo alguns benefícios do uso da regressão logística em relação a
outras técnicas de ML

1. Simplicidade
Os modelos de regressão logística são matematicamente menos complexos do
que outros métodos de ML. Portanto, você pode implementá-los mesmo que ninguém
na sua equipe tenha conhecimento profundo de ML.

2. Velocidade
Os modelos de regressão logística podem processar grandes volumes de dados
em alta velocidade porque exigem menos capacidade computacional, como memória
e capacidade de processamento. Por isso, são ideais para que as organizações que
estão começando com projetos de ML obtenham alguns progressos rápidos.

3. Flexibilidade
Use a regressão logística para encontrar respostas para perguntas que têm dois
ou mais resultados finitos. Também é possível usá-la para pré-processar dados. Por
exemplo, você pode classificar dados com um grande intervalo de valores, como
transações bancárias, em um intervalo menor e finito de valores usando regressão
logística. Em seguida, processe esse conjunto de dados menor usando outras técnicas
de ML para obter uma análise mais precisa.

4. Visibilidade
A análise de regressão logística oferece aos desenvolvedores maior
visibilidade dos processos internos de software do que outras técnicas de análise de
dados. Também facilita a solução de problemas e a correção de erros, pois os cálculos
são menos complexos.

Quais são as aplicações da regressão logística?

A regressão logística tem várias aplicações no mundo real em muitos setores


diferentes. Por exemplo:

● Manufatura: As empresas de manufatura usam a análise de regressão logística para


estimar a probabilidade de falha de peças em máquinas. Em seguida, planejam
programações de manutenção com base nessa estimativa para minimizar falhas
futuras.
● Saúde: Pesquisadores da área de medicina planejam tratamento e cuidados
preventivos estimando a probabilidade de doença em pacientes. Eles usam modelos de
regressão logística para comparar o impacto do histórico familiar ou dos genes nas
doenças.
● Financeiro: As empresas financeiras precisam analisar as transações financeiras em
busca de fraude e avaliar os pedidos de empréstimo e os pedidos de seguro quanto a
riscos. Esses problemas são adequados para um modelo de regressão logística porque
têm resultados discretos, como alto risco ou baixo risco e fraudulentos ou não
fraudulentos.
● Marketing: As ferramentas de publicidade online usam o modelo de regressão
logística para prever se os usuários clicarão em um anúncio. Como resultado, os
profissionais de marketing podem analisar as respostas dos usuários a diferentes
palavras e imagens e criar anúncios de alta performance que terão interação dos
clientes.
● Aprendizado profundo: usa redes neurais ou componentes de software que simulam o
cérebro humano para analisar informações. Os cálculos de aprendizado profundo são
baseados no conceito matemático de vetores.

Além disso, a regressão linear prevê uma variável dependente contínua usando
determinado conjunto de variáveis independentes. Uma variável contínua pode ter um
intervalo de valores, como preço ou idade. Portanto, a regressão linear pode prever
valores reais da variável dependente. Ela pode responder a perguntas como “Qual será
o preço do arroz daqui a dez anos?”.
Diferentemente da regressão linear, a regressão logística é um algoritmo de
classificação. Ela não é capaz de prever valores reais para dados contínuos. Ela pode
responder a perguntas como “O preço do arroz aumentará 50% em dez anos?”.

Diferenças entre regressão logística e aprendizado profundo

A regressão logística é menos complexa e com menos uso intensivo de


computação do que o aprendizado profundo. Mais importante ainda, por causa de sua
natureza complexa e orientada por máquinas, os cálculos de aprendizado profundo
não podem ser investigados nem modificados pelos desenvolvedores. Por sua vez, os
cálculos de regressão logística são transparentes e mais fáceis de solucionar.
Como executar a análise de regressão logística na AWS?
É possível executar a regressão logística na AWS usando o Amazon
SageMaker. O SageMaker é um serviço de machine learning (ML) totalmente
gerenciado com algoritmos integrados para regressão linear e regressão logística,
entre vários outros pacotes de software estatístico.
Todo cientista de dados pode usar o SageMaker para preparar, criar, treinar e
implantar modelos de regressão logística rapidamente.
O SageMaker remove o trabalho pesado de cada etapa do processo de
regressão logística para facilitar o desenvolvimento de modelos de alta qualidade.
O SageMaker fornece todos os componentes necessários para a regressão
logística em um único conjunto de ferramentas. Assim, você pode colocar os modelos
em produção de forma mais rápida, fácil e a um custo menor.
5. EXEMPLO PRÁTICO DE UMA ANÁLISE DESCRITIVA DE DADOS:
DESEMPENHO DE VENDAS DE UM E-COMMERCE

Contexto: Uma empresa de e-commerce deseja entender melhor o desempenho de suas


vendas ao longo dos últimos 12 meses. A empresa vende uma variedade de produtos online e
deseja tomar decisões informadas para melhorar seu desempenho e lucratividade.

Passo 1: Coleta de dados

Os dados foram coletados e consistem em informações diárias de vendas dos últimos


12 meses, incluindo o valor das vendas, o número de pedidos e o canal de venda (website,
aplicativo móvel, redes sociais).

Passo 2: Análise descritiva utilizando técnicas de estatísticas descritivas:

A análise descritiva é realizada para entender os principais indicadores de


desempenho:
Média de vendas mensais: a média mensal de vendas é calculada para cada um dos 12
meses.
Taxa de crescimento mensal: calcula-se a taxa de crescimento mês a mês para avaliar
se as vendas estão aumentando ou diminuindo.
Canais de venda: analisa-se qual canal de venda (website, aplicativo móvel, redes
sociais) contribuiu mais para as vendas totais.
Produtos mais vendidos: identifica-se quais produtos são os mais vendidos e se houve
mudanças nas preferências dos clientes ao longo do tempo.
Frequência de compras dos clientes: analisa-se a frequência com que os clientes
fazem compras, o que pode ajudar a identificar oportunidades de fidelização.

Passo 3: Impacto nas decisões dos gestores

Com base na análise descritiva dos dados, os gestores podem tomar diversas decisões
estratégica:
Alocação de recursos: se a análise mostrar que o canal de vendas do aplicativo móvel
está crescendo rapidamente, os gestores podem optar por alocar mais recursos nesse canal,
como investir em publicidade ou melhorias na experiência do usuário.
Promoções e ofertas: se certos produtos têm vendas consistentemente baixas, os
gestores podem decidir lançar promoções ou ofertas especiais para impulsionar as vendas
desses produtos.
Expansão de linha de produtos: se a análise revelar que um novo tipo de produto se
tornou popular, os gestores podem considerar expandir sua linha de produtos nessa categoria.
Melhorias na experiência do cliente: se a análise mostrar que a frequência de compra
dos clientes é baixa, a empresa pode focar em melhorar a experiência do cliente para
incentivá-los a comprar com mais frequência.
Definição de metas de vendas: compreender as taxas de crescimento mensal permite
que os gestores estabeleçam metas realistas para o futuro, considerando os padrões históricos.
Dependendo dos objetivos da empresa e da disponibilidade dos dados, podemos
aplicar uma combinação dessas análises para obter uma visão abrangente do desempenho de
vendas desse e-commerce. Essas análises fornecerão informações valiosas sobre o
desempenho de vendas sem a necessidade de modelagem estatística.
Em resumo, uma análise descritiva de dados fornece informações valiosas para os
gestores, permitindo-lhes tomar decisões informadas para melhorar o desempenho da
empresa, alocar recursos de forma eficaz e atender às necessidades dos clientes. Ela é uma
ferramenta crucial para a tomada de decisões estratégicas bem fundamentadas.

6. LINK PARA O VÍDEO NO YOUTUBE


https://www.youtube.com/@alinematospmu/about

7. REDES SOCIAIS DOS ALUNOS ONDE O VÍDEO FOI DIVULGADO


@nickimaia
@dinsantos13
@carminhhas
@joaoafonso
@alinedamicro
@thiagooliveira.tg

REFERÊNCIAS:

Análise de dados: o que é e qual a sua importância - Blog Conquer. Disponível em:
<https://blog.escolaconquer.com.br/analise-de-dados-o-que-e-e-qual-a-sua-importancia/>.
BELFIORE, P. et al. Análise de Dados: Modelagem Multivariada para Tomada de
Decisões. [S. l.]: Campus, 2015.
SIRIUS EDUCAÇÃO. Análise descritiva: o que é, como usar e por que ela é
importante. Disponível em: <https://blog.sirius.education/analise-descritiva/>

Você também pode gostar