Você está na página 1de 92

Business Analytics

Robson Gonçalves, M.Sc.


robson.goncalves@fgv.br
Business Analytics Robson Gonçalves
É paulista, nascido em Mogi das Cruzes em 1970
Mestre em Economia pela Unicamp e bacharel
em Economia pela USP
Foi economista do Banco Central do Brasil,
pesquisador do Instituto de Pesquisa Econômica
Aplicada e professor do Ibmec e do Insper
Leciona nos cursos de MBA da FGV desde 1997,
atuando nas disciplinas de Economia dos
Negócios, Economia Comportamental e Business
Analytics
Atualmente, também atua como consultor na
FGV onde coordena os cursos de Neurobusiness
É coautor de livros como Triuno: Neurobusiness
e Qualidade de Vida e Seja Inesquecível.
Apresentação do curso
Programa da disciplina

▪ Visão sistêmica do processo de tomada de decisão

▪ Análise dos ambientes interno e externo

▪ Localização das bases de dados internas e externas

▪ Processo decisório na perspectiva do BA


Uma área emergente em Gestão
Ponto de atenção: Analytics tem
muitos sentidos

Então, o que é e o que


não é Business
Analytics?

Fonte: https://www.mitsloanreview.com.br/post/quatro-tendencias-surgidas-a-partir-do-uso-de-analytics?utm_source=googleadwords&gclid=Cj0KCQjw8O-VBhCpARIsACMvVLMOleVwWiX-
ePV_xoaVLoJydvGNSvr5Gmh0yt0FXUr_o6QkmwwyqEEaAusvEALw_wcB
Dados, dados, dados...

Fonte: Neoway (2022) GUIA DATA DRIVEN: Como usar os dados para aperfeiçoar os processos
da sua empresa. Disponível em https://cloud.conteudo.neoway.com.br, consultado em 4/jul/2022
Dados, dados, dados...

Foram gerados em 2020 mais de 40 trilhões de gigabytes


(Gartner).

Pesquisa com mais de mil organizações em todo o mundo


mostrou que 53% das que foram identificas como “de alta
performance” se classificaram como usuárias efetivas de análise
de dados (McKinsey).
Dados, dados, dados...
Visão sistêmica do processo de tomada
de decisão: transformar dados em
insights

Dados Dados Modelagem Informação Tomada de


brutos estruturados de dados e insight decisão

Conceitos relacionados:

• Big Data
• Data Mining
• Machine Learning
• Deep Learning
Definindo os conceitos

• Big Data: é um fenômeno atual, a geração de dados marcada pelos 3 Vs


– volume, variedade e velocidade, em geral a partir do uso da
tecnologia (telefonia celular, internet, streaming etc.)
• Data Mining: o processo de explorar dados à procura de padrões
consistentes e visando permitir insights
• Machine Learning: ramo da inteligência artificial (IA) que se concentra
no uso de algoritmos para imitar de forma relativamente automática a
maneira como os humanos aprendem, permitindo decisões autônomas
• Deep Learning: evolução dos mecanismos de Machine Learning no
qual os algoritmos não só aprendem, como também identificam
problemas relacionados a reconhecimento de voz, compreensão de
caligrafias diferentes, diagnósticos por imagem etc.
Definindo os conceitos

• Dado(s): - registro de um atributo ou


comportamento de um ente, objeto ou Valor
fenômeno

• Informação: conjunto de dados ou


conhecimentos organizados, que reduzem a
incerteza com vistas a um objetivo
Decisão Baseada
• Conhecimento (know-how): capacidade de em Dados
saber como utilizar a informação de modo
prático com vistas a seu uso no contexto
corporativo e no contexto da estratégia da
organização

• Decisão: fazer uma escolha dentre algumas


Dados
alternativas com vistas ao atingimento de
objetivo(s) ou meta(s) previamente definidos
Mas, decisão para quê?

Decisão
Valor
• O produto final da Business Analytics Decisão
é a decisão e o objetivo fundamental
é a geração de valor

• Dados são gerados o tempo todo em Conhecimento


larga escala, mas muitos se perdem
ou ficam sem ser coletados

• A capacidade de coletar, processar e Informação


analisar dados para orientar a tomada
de decisão é um ativo estratégico de
grande importância
Dados
Dados
• Mas... não se pode falar em Business Volume
Analytics sem uma vinculação
adequada à estratégia empresarial
Tendências (ou desafios) em
Analytics

1. Governança e processos

2. Cultura Data Driven

3. Dados: primários, secundários ou terciários

4. Integridade e segurança de dados

5. Metadados (metadata)

6. Produtos de dados (data products)


Dimensões relevantes do Analytics
1. Governança de dados

• Ao nível corporativo refere-se ao conjunto de regras definidas com o objetivo de


assegurar o melhor gerenciamento dos dados.
• Visa permitir a qualidade de dados durante todo seu ciclo de vida, seu tratamento e
acesso seletivos com vistas a dar suporte adequado à tomada de decisão.
• As principais áreas de foco da governança de dados incluem a definição de critérios
de disponibilidade, usabilidade, consistência, integridade e segurança dos dados em
linha com os processos da empresa e definindo claramente responsabilidades e
competências relacionadas a cada setor e/ou colaborador de modo a permitir que,
a partir desses critérios, os dados possam ser amplamente utilizados por toda a
organização.
• A governança de dados abrange as pessoas, os processos e a tecnologia da
informação necessários para criar um tratamento consistente e adequado dos dados
de uma organização em toda a empresa. Engloba todas as práticas de
gerenciamento de dados com a base necessárias para garantir que os dados sejam
gerenciados como um ativo e transformados em valor para a empresa.
• Um dos aspectos mais relevantes da governança de dados é garantir que os
mesmos são gerados ou obtidos de acordo com as normas legais (LGPD no caso
brasileiro). As mesmas normas exigem integridade, isto é, a manutenção e a
garantia da precisão e consistência de dados durante todo o ciclo de vida da
informação.
Dimensões relevantes do Analytics
2. Cultura Data Driven
• Refere-se ao uso difundido e engajado de dados gerados por uma companhia ou obtidos no
ambiente onde ela atua para embasar suas tomadas de decisão.
• Essa cultura não exige, necessariamente, que se esteja no campo do Big Data, sendo
igualmente importante no âmbito do Small Data.
• Seu objetivo é usar de modo consistente ferramentas tecnológicas e processos típicos do
Analytics para coletar, analisar, filtrar e armazenar dados, transformando-os em informações
que gerem importantes insights para o crescimento da empresa.
• A cultura Data Driven pode e deve se estender desde os níveis mais operacionais, onde boa
parte dos dados (registros) é gerado até a esfera decisória. Ela se define a partir do
envolvimento com o processo que visa transformar dados em valor por meio de decisões
orientadas por dados.
• A geração, tratamento, modelagem e transformação de dados em informação não
caracterizam uma cultura Data Driven, pois a cultura não está nos processo e sim nas
pessoas cujo engajamento é fundamental.
• A cultura Data Driven também requer a utilização continuada de dados como insumos para a
geração de valor. Atividades de Analytics esporádicas, descontínuas ou isoladas em setores
da empresa não caracterizam a adoção da cultura Data Driven.
• Para gerar uma cultura Data Driven é preciso combinar regras (tarefas, atribuições,
responsabilidades) associadas à relação com os dados. Mas também é preciso demonstrar a
todos na organização que cada uma das ações relacionadas com dados é importante para
transformá-lo em valor, o que tende a gerar engajamento.
Dimensões relevantes do Analytics
3. Dados: primários, secundários ou terciários

• Existem hoje 3 tipos ou níveis de dados com os quais se pode operar em Analytics. Eles que são
conhecidos como first, second e third-party data ou dados primários, secundários e terciários
em português.
• Os dados primários (first-party data) são aqueles gerados ou obtidos diretamente pela empresa
que está fazendo atividades de Analytics. Sua fontes são a interação imediata com clientes,
colaboradores ou fornecedores.
• Dados primários são gerados normalmente pelo ERP, pelos sistemas de emissão de notas fiscais,
pelos controles de estoques ou mesmo por observação direta do comportamento dos clientes
em ambientes físicos ou virtuais. Os SACs e sistemas de apoio a usuários também são
importantes fontes de dados primários. Idem para as análises feitas nas redes sociais.
• Os dados secundários e terciários são menos específicos.
• Os dados secundários (second-party data) em geral são gerados por parceiros que ocupam
outros elos nas cadeias de valor. Um bom exemplo são os varejistas em relação aos industriais,
os concessionários em relação ao fabricantes de automóveis e os vendedores comissionados,
franqueados ou corretores. Sua interface com o cliente é mais direta e, por isso, os dados
registrados por eles são valiosos.
• Já os dados terciários (third-party data) são mais ligados ao ambiente de negócios ou ao setor
de atuação das empresas de modo geral. Dados de associações, sindicatos ou mesmo de órgãos
públicos como o IBGE refletem uma dinâmica mais ampla do mercado no qual a empresa atual
(são ambientais).
• Um bom Analytics faz uso de todas as combinações possíveis de todos esses dados.
Dimensões relevantes do Analytics
4. Integridade e segurança de dados
• Integridade refere-se à manutenção e à garantia da precisão e consistência dos dados durante
todo o seu ciclo de vida e é um aspecto crítico para a arquitetura de Analytics, isto é,
implementação e uso de qualquer sistema que armazene, processe ou recupere dados.
• O termo às vezes é usado como sinônimo para qualidade de dados, sendo que, nesse contexto,
a validação de dados se torna um pré-requisito para sua integridade. Ao mesmo tempo,
integridade de dados é o oposto da corrupção/adulteração de dados.
• A intenção geral de qualquer técnica de integridade de dados é a mesma: garantir que os dados
sejam registrados exatamente como pretendido, rejeitando-se inconsistências, por exemplo
(uma pessoa não pode estar viva e morta ao mesmo tempo ou, se estiver morta, não pode ser
funcionário de uma dada empresa ou estar fazendo compras em dado estabelecimento). Além
disso, a integridade visa garantir que um dado não seja alterado pelo simples fato de ter sido
acessado ou consultado.
• A integridade pode ser física (geralmente associada às condições de armazenamento) ou lógica
(quando se refere ao conteúdo). Dados corrompidos em geral sofreram em sua integridade
física. Dados alterados de forma não intencional ou fraudulenta sofreram em sua integridade
lógica.
• Em suma: a integridade dos dados visa evitar alterações não intencionais ou fraudulentas nas
informações. Integridade de dados não deve ser confundida com segurança de dados. Dados
podem ser “roubados” sem que sua integridade seja afetada.
• Ao mesmo tempo, uma ameaça à integridade é a fraude, que envolve tanto aspectos de
segurança (acesso indevido e com intenção criminosa) quanto de integridade (uma alteração
intencional fraudulenta).
Dimensões relevantes do Analytics
5. Metadados (metadata)
• O termo metadados (metadata em inglês) refere-se a dados (registros) sobre dados. Eles
permitem obter informações sobre um ou mais aspectos sobre os próprios dados.
• Um exemplo simples é dizer: a cada dia são geradas tantas mil curtidas em um dado vídeo do
Youtube. Ou ainda, metade das pessoas que curtiram dada publicação têm menos de 30 anos.
• Outro exemplo são dados relativos a uma imagem (que, em si, também já é um dado ou
registro), como dimensão, data em que foi gerado, se possui ou não direitos autorais etc.
• Uma divisão comum refere-se à distinção entre metadados estruturais e metadados-guia.
• Os metadados estruturais descrevem a estrutura dos objetos do banco de dados: como quantas
colunas e linhas tem uma tabela, quantas páginas tem um livro, quantas observações foram
coletadas em uma pesquisa de campo, quanto tempo se levará lendo um texto na internet,
quantas vezes um dada palavra aparece em um texto. Outro exemplo de interesse são dados
relativos a origens e destinos de chamadas telefônicas, que vão além do próprio conteúdo
• Os metadados-guia nos ajudam a encontrar itens específicos numa pesquisa: busca por
palavras-chave, rash tags, frequência com que um dado artigo é citado, quantas pessoas com
um mesmo nome (homônimas) existem em uma dada população.
• Um terceiro tipo de metadado de interesse óbvio no mundo virtual são os dados de
acessibilidade, que passaram a ser considerados uma categoria própria nas últimas décadas.
• Metadados também são armazenados em bancos ou repositórios de metadados e também
podem ser objeto de estruturação (tratamento e organização) e análises (Data Mining). Projetar
como deverá evoluir o número de inscritos ou seguidores em dado perfil das redes sociais é um
exemplo de análise de preditiva com metadados.
Dimensões relevantes do Analytics
6. Produtos de dados (data products)
• A definição mais aceita de produtos de dados foi feita por Benjamin Bengfort no artigo “The
Age of Data Products”: São “mecanismos econômicos autoadaptados e de ampla aplicação que
derivam seu valor dos dados, além de gerarem mais dados capazes de influenciar o
comportamento humano ou fazendo inferências e previsões”.
• Em outras palavras, em primeiro lugar, produtos de dados usam dados como matéria-prima.
Mas, assim como certos ingredientes culinários, os produtos de dados utilizam dados de
maneiras que se adaptam em razão do tipo de dado e da necessidade do usuário do produto.
• Um exemplo: o número de clientes que frequentam um restaurante a cada dia pode servir para
medir a sazonalidade (dias da semana com maior ou menor frequência) ou projetar o
faturamento mensal. Cruzando esses dados com o tipo de refeição que tem maior ou menor
demanda, pode-se organizar melhor as compras.
• Nesse exemplo, os mesmos dados, com ou sem cruzamento (modelagem) com outros revelou
diferentes mecanismos que, ao serem interpretados e apoiarem a tomada de decisão, se
caracterizam como produtos de dados.
• Assim, um produto de dados se caracteriza por utilizar dados como matéria-prima (como já foi
dito) e transformá-los em informações úteis para a geração de valor. Podem ser relatórios,
dashboards, gráficos, infomapas, projeções, correlações, alertas.
• Um bom produto de dados transmite uma mensagem clara ao tomador de decisão e, às vezes,
também sugere a adoção de uma ou mais decisões com vistas a favorecer o atingimento de um
dado objetivo ou meta estratégicos.
• Um bom produto de dados também se direciona a uma necessidade ou “dor” da organização,
contribuindo para a tomada de decisão baseada em dados (data driven decision process).
Desafio rápido

Redija um único parágrafo, voltado para seu uso empresarial,


contendo pelo menos três dos conceitos listados abaixo,
acrescentando ainda os termos “tomada de decisão” e/ou “valor”:

• Dados
• Data Mining
• Governança de dados
• Produtos de dados
E o Design Thinking?

Enquanto o Design Thinking está


voltada para a criação e a recriação
Pensamento Pensamento de processos, produtos e serviços, o
criativo analítico Business Analytics se dedica à
• Empatia • Compreensão
compreensão dos mecanismos que
• Colaboração • Segregação já estão em plena operação.
• Experimentação • Estruturação
• Reframe • Modelagem O Design Thinking visa criar um
• Inovação • Tomada de novo mundo, enquanto o Business
decisão
• Atingimento de
Analytics visa compreender e prever
metas como o mundo está funcionando e
orientar a tomada de decisão com
base em objetivos estratégicos e
táticos bem definidos.
Arquitetura e Eco Sistema
de Business Analytics e sua
relação com Business
Intelligence
BI versus BA
O que é Business Intelligence?
Referência para como mensurar variáveis e KPIs.
Se estende da coletada de dados à elaboração de relatórios, análises
preliminares e dashboards.
Transforma dados em informações.

O que é Business Analytics?


Busca de repostas e insights a partir da interpretação das informações.
É mais do que saber o que e quando; você também fica sabendo o porquê
e o como.

Fonte da imagem: https://www.scriptcaseblog.net/project-management/business-


intelligence-vs-business-analytics/attachment/bi-vs-ba-photo/
BI versus BA

BI BA
Relatórios
Análises preliminares Projeções estatísticas
Abordagens e
Gráficos Modelos econométricos
métodos Indicadores e KPIs Cenários

Por que aconteceu?


O que aconteceu? Como?
Quando? Vai se repetir?
Questões relevantes Onde? Quando?
Com quem? Com que probabilidade?
O que mais pode
acontecer?

Fonte da imagem: https://www.scriptcaseblog.net/project-management/business-


intelligence-vs-business-analytics/attachment/bi-vs-ba-photo/
BI versus BA

BI Coleta, análise e
visualização de dados
Identificação de “dores”
Análise
descritiva
Geração de relatórios
BA
Análises:
De diagnóstico
Preditiva
Prescritiva

Fonte da imagem: https://www.scriptcaseblog.net/project-management/business-


intelligence-vs-business-analytics/attachment/bi-vs-ba-photo/
BI versus BA

1. O que é business intelligence?

2. O que é business analytics?

3. Diferenciando

4. Diferenciando mais um pouco

5. Complementaridade

6. Inteligência competitiva
BI versus BA
1. O que é business intelligence?
Vamos entender cada ideia separadamente. O business intelligence, ou BI, pode ser
traduzido para “inteligência de negócios” ou mesmo “inteligência de mercado”. Seu papel é,
essencialmente, dar suporte aos empreendedores na criação e execução de um
planejamento estratégico. Isso é feito por meio de um conjunto de métodos, processos e
teorias que permitem às empresas mensurarem suas variáveis e KPIs.

Ou seja, o BI define de que maneira os dados serão coletados e observados para,


posteriormente, serem utilizados nas estratégias internas. É uma ciência necessária para
começar qualquer mensuração, já que são muitas as técnicas e metodologias possíveis com
essa finalidade.

2. O que é business analytics?


O business analytics, ou só BA, também tem a ver com a coleta e mensuração de
informações. Sua tradução seria algo como “análise de negócios”. Só que, neste caso,
estamos falando mais de ação do que de teoria: é aqui que surgem respostas sobre como
os dados serão lidos e interpretados e quais ferramentas serão usadas.

O BA preza por velocidade, otimização e entrega de resultados práticos. É dele que surgem
relatórios, noções qualitativas e quantitativas e tantos outros elementos que trazem uma
exploração mais aprofundada do tema em questão. É mais do que saber como e quando;
você também fica sabendo o porquê.

Fonte: https://www.mitsloanreview.com.br/post/quatro-tendencias-surgidas-a-partir-do-uso-de-analytics?utm_source=googleadwords&gclid=Cj0KCQjw8O-
VBhCpARIsACMvVLMOleVwWiX-ePV_xoaVLoJydvGNSvr5Gmh0yt0FXUr_o6QkmwwyqEEaAusvEALw_wcB
BI versus BA

3. Diferenciando...
Os dois conceitos são realmente parecidos O modo mais fácil de lembrar a diferença entre
eles é vendo um como evolução do outro. O business analytics surgiu do business
intelligence, desenvolvendo-se das técnicas de métricas mais antigas.

Não que o BI seja ultrapassado ou desnecessário atualmente. São apenas metodologias


distintas. O business intelligence é muito útil para ajudar os gestores na elaboração de
estratégias, em particular no início do planejamento, quando ainda não há muito no que se
basear. O business analytics, por outro lado, é mais abrangente e costuma oferecer mais
recursos de estatísticas.

O diagnóstico permitido pelo BI é importante para a construção e aprimoramento das táticas


aplicadas pela empresa — desde as que se dirigem aos clientes até a organização dos
processos internos. As métricas que ele oferece, porém, podem ser confusas e complicadas de
entender. Daí a importância do BA, que se encontra como um facilitador da compreensão de
todos esses materiais.

Então, resumindo, o business intelligence é um tipo de sistema de métricas e análise de


dados, enquanto o business analytics é outro tipo mais aprofundado e simplificado, feito com
o intuito de ajudar no entendimento dos gestores. Ambos se baseiam na informação como
ferramenta essencial, só com abordagens diferentes.

Fonte: https://www.mitsloanreview.com.br/post/quatro-tendencias-surgidas-a-partir-do-uso-de-analytics?utm_source=googleadwords&gclid=Cj0KCQjw8O-
VBhCpARIsACMvVLMOleVwWiX-ePV_xoaVLoJydvGNSvr5Gmh0yt0FXUr_o6QkmwwyqEEaAusvEALw_wcB
BI versus BA

4. Diferenciando mais um pouco...

Enquanto são superficialmente similares, a diferença entre Business Intelligence e Business


Analytics é clara:

• BI utiliza-se de dados atuais e históricos para otimizar o desempenho no presente.

• BA também se utiliza de informações acerca do histórico da companhia e do mercado,


bem como do presente, no entanto a finalidade é preparar a empresa para o futuro.

Tradicionalmente, as grandes empresas têm focado na manipulação de seus dados


estratégicos ao redor de Business Intelligence.

Contudo, com o crescimento de plataformas analytics mais preditivas, em partes, graças


ao avanço de tecnologias como Machine Learning e Inteligência Artificial, esse cenário
tem sofrido algumas mudanças. Até mesmo Business Intelligence está evoluindo por si só,
agregando algumas capacidades previamente exclusivas de plataformas analytics.

Fonte: https://www.mitsloanreview.com.br/post/quatro-tendencias-surgidas-a-partir-do-uso-de-analytics?utm_source=googleadwords&gclid=Cj0KCQjw8O-
VBhCpARIsACMvVLMOleVwWiX-ePV_xoaVLoJydvGNSvr5Gmh0yt0FXUr_o6QkmwwyqEEaAusvEALw_wcB
BI versus BA
5. Complementaridade

Esses sistemas não são inimigos ou donos de territórios exclusivos. Eles podem e devem
coexistir! Se o BA nada mais é do que um expoente do BI, não há razão para se livrar do
“original”. Na verdade, o business intelligence fornece o básico para que o analytics consiga se
firmar.

O que o BI faz é coletar informações, mensurá-las e montar relatórios que expliquem o que está
acontecendo com a empresa em diversos sentidos: entre os concorrentes, entre os consumidores,
na própria equipe, etc. Como não é tão simples criar projeções futuras apenas com tais relatórios,
o BA se torna um próximo passo fundamental. Daí para frente, o business analytics se baseia no
que já foi feito para um estudo minucioso e acessível dos dados, além de fornecer também
elementos complementares e possíveis soluções a serem empregadas. É uma continuação
inevitável do trabalho anterior, não acha?

Portanto, tanto o BI quanto o BA devem ser incorporados no dia a dia do planejamento


estratégico da sua empresa. A mensuração e a análise de dados são o início de qualquer tomada
de decisão, especialmente no que diz respeito às grandes mudanças — nas vendas, nas compras,
no marketing ou em outros processos internos.
A diferença entre business intelligence e business analytics não significa que um exclui o outro,
mas que ambos fazem parte de um sistema maior.

Fonte: https://www.mitsloanreview.com.br/post/quatro-tendencias-surgidas-a-partir-do-uso-de-analytics?utm_source=googleadwords&gclid=Cj0KCQjw8O-
VBhCpARIsACMvVLMOleVwWiX-ePV_xoaVLoJydvGNSvr5Gmh0yt0FXUr_o6QkmwwyqEEaAusvEALw_wcB
6. E a inteligência competitiva?
Enquanto a inteligência competitiva trata do processo de coletar e analisar dados do mercado para
transformá-los em informação, com foco na concorrência e na competitividade da empresa, a
inteligência de negócios remete ao uso de dados nos vários setores da organização, com profissionais
de diferentes áreas usando os dados para embasar suas decisões.

Na inteligência competitiva, a empresa de um modo geral é fonte de dados, mas quem utiliza as
informações são as pessoas do nível estratégico, ou seja, a alta gerência da organização. Isso porque as
decisões estratégicas são fruto de planejamento de longo prazo, definição de objetivos organizacionais
e as estratégias para alcançá-los.

Já o BI visa oferecer informações ao maior número possível de responsáveis por tomadas de decisão,
em seus mais diversos níveis. Este fato está relacionado ao conceito de Gerenciamento de Desempenho
Corporativo, que propõe a provisão de valor estratégico completo.

De modo resumido, pode-se dizer que as principais diferenças entre os dois conceitos está no tipo e
origem dos dados e para quem as informações são destinadas.

Enquanto na inteligência de negócios as informações são provenientes de sistemas e bancos de dados,


na inteligência competitiva as informações são também externas, envolvendo não apenas a empresa,
mas o mercado, o que inclui fornecedores, clientes e concorrentes. Isso significa que em BI os dados
são estruturados e quantitativos, e em IC os dados são também qualitativos.

Fonte: https://www.mitsloanreview.com.br/post/quatro-tendencias-surgidas-a-partir-do-uso-de-analytics?utm_source=googleadwords&gclid=Cj0KCQjw8O-
VBhCpARIsACMvVLMOleVwWiX-ePV_xoaVLoJydvGNSvr5Gmh0yt0FXUr_o6QkmwwyqEEaAusvEALw_wcB
Atividade:
iniciando a construção de case ficcional

Em uma empresa hipotética minimamente caracterizada, defina uma


“dor” ou necessidade ligada a analytics. Em seguida, aponte até 3
tarefas para a área de BI e até 3 tarefas para a área de BA com vistas
a sanar essa “dor”.

Escolha um dos seguintes segmentos de mercado (ou sugira outro):

• Hipermercados
• Administradoras de cartão de crédito
• Empresas de seguro de vida e saúde
• Indústria farmacêutica
Elementos básicos da arquitetura
de BI/BA: eco sistemas
Um ecossistema de dados é o ambiente de
interação entre redes/sistemas e atores
codependentes que contribuem para a
coleta, transferência e uso de dados.

O mapeamento do eco sistema específico


de cada empresa é fundamental como
ponto de partida para a implantação de
projetos/soluções de BA/BI.

Elementos insuficientes ou desarticulados


nesses eco sistemas podem impedir a
adoção e/ou a eficácia do BA/BI, mesmo
que a arquitetura pareça bem desenhada.

O ecossistema mapeia relações entre


pessoas e tecnologias ao longo do processo
que vai dos dados à tomada de decisão .

Fonte:https://tatianecosvieira.wordpress.com/tag/business-intelligence/
Elementos básicos da arquitetura de
BI/BA: DATA WAREHOUSING

Arquitetura

Inputs para BA

Fonte da figura:https://tatianecosvieira.wordpress.com/tag/business-intelligence/
Elementos básicos da arquitetura de
BI/BA: DATA LAKING
Na arquitetura com
data lake os dados são
armazenados de
forma não
estruturada.

A etapa ETL é
realizada na medida
da demanda dos
usuários de produtos
de dados, podendo
ser armazenadas em
mini data warehouses
ou data marts

Fonte da figura adaptado de :https://tatianecosvieira.wordpress.com/tag/business-intelligence/


Proposta conceitual: BI&A
ou Decision Intelligence
Proposta conceitual: BI&A
ou Decision Intelligence

Dados
Tomada
ETL BI BA de
Data
decisão
Warehouse

BI Interface BA
Proposta conceitual: BI&A
ou Decision Intelligence

Estratégia Empresarial

BI BA Decisão
• Relatórios • Insights • Preço
• Análises • Diagnóstico • Investimento
• Dashboards • Descrição • Marketing
• OLAP • Previsão • Gestão de Pessoas
• Data Mining • Prescrição • Gestão Financeira
• Métricas,
indicadores e metas
Atividade:
seguindo na construção de case ficcional

Na mesma empresa hipotética enumere elementos do ecossistema


de BI/BA relacionados com aquela mesma “dor” ou necessidade
apontada na atividade anterior.

Especifique as relações entre esses elementos e uma possível


solução de BI/BA que seja preciso adotar, relacionando com
objetivos estratégicos (genéricos) da empresa hipotética.
Premissas para o sucesso
das práticas BI&A

Apoio da alta gestão

Há três elementos críticos para o sucesso


Eco sistema adequado das práticas BI&A:

• Pessoas
Processo organizacional
e fluxos de informação • Processos
alinhados • Tecnologia

Cultura data driven


Plataformas e ferramentas
Cultura Data Driven
Por que uma cultura data driven?
Por que uma cultura data driven?
Como construir uma cultura data driven
• O primeiro ponto sobre a questão acima é que o grande desafio não consiste em
tomar decisões orientadas por números, indicadores-chave ou padrões.
• Para a maioria das empresas, o obstáculo é justamente fazer com que esses
insumos sejam utilizados, das equipes até a alta gestão.
• Existem companhias em diversos estágios de maturidade no uso de dados. Deste
modo, a dimensão do desafio também depende de como e se as organizações
estão gerindo sua própria base de informações.
• Inclusive, é importante dizer que há uma diferença entre empresas que têm
indicadores-chave definidos e concentram seus dados em planilhas de outras que
nem mesmo coletam dados e geram informações.
• Além disso, é importante ainda que a companhia disponha de uma base de dados
limpa, confiável e frequentemente atualizada. Pois dados e informações incorretos
ou de fontes suspeitas podem induzir a previsões falhas e até mesmo gerar
prejuízos para o negócio.

Fonte: https://www.sbkbs.com.br/insights/transformacao-digital-nas-empresas-impactos/
Maturidade Digital

O que é maturidade digital?


• Inicialmente, é relevante que os gestores compreendam o que significa esse
conceito. Uma empresa com elevado índice de maturidade digital possui duas
características principais:

✓ Conseguiu implementar as tecnologias adequadas para digitalizar e


automatizar processos; e
✓ Alcançou uma performance superior por meio das estratégias desenvolvidas.

• Elevada maturidade digital não significa apenas a adesão às novas tecnologias. Mas
também o preparo da companhia para fazer uso dos recursos a fim de melhorar os
resultados da operação. Isso, principalmente, no que diz respeito ao relacionamento
com clientes, colaboradores e fornecedores.

• O índice mostra o quanto a empresa está preparada para esses desafios. Com isso,
utiliza as tecnologias de forma inteligente e estratégica para alcançar diferenciais de
mercado.

Fonte: https://www.sbkbs.com.br/insights/transformacao-digital-nas-empresas-impactos/
Analytics Maturity Model (AMM)

O modelo Analytics Maturity Model (AMM), foi desenvolvido pelo Data Warehouse
Institute (TDWI) como uma atualização do Business Intelligence Maturity Model, para
adaptar-se a questões como a tecnologia que se desenvolve rapidamente e a crescente
importância da gestão de dados. O modelo destaca ainda a importância da
disseminação organizacional, o apoio político e a definição de padrões institucionais
para o BI&A.
Maturidade Digital no Brasil
Com o objetivo de entender o efeito do processo de digitalização no Brasil, a McKinsey realizou um
estudo com 124 empresas de grande e médio porte em diversos setores para mensurar a maturidade
digital das empresas que atuam no país.

Para tanto, utilizou-se a ferramenta proprietária Analytics & Digital Quotient (A&DQ), que avalia 22
práticas de gestão críticas para o sucesso da transformação digital e captura de resultado financeiro,
distribuídas entre as quatro dimensões mencionadas. A ferramenta A&DQ atribui uma pontuação única
que permite conduzir um benchmarking entre empresas pares e líderes em âmbito global.

Fonte: https://www.mckinsey.com/br/our-insights/transformacoes-digitais-no-brasil
3 referências em BI&A

1.Grupo Pão de Açúcar


2. Nike
3. Amazon
3 referências em BI&A
1.Grupo Pão de Açúcar
No grupo Pão de Açúcar, a inovação veio por meio de uma estratégia de fidelização chamada
Clube Extra. Trata-se de um sistema em que os clientes podem acumular pontos em compras
na loja física e online para obter descontos.

Com a análise de dados, o Pão de Açúcar foi capaz de identificar questões relevantes do
relacionamento com o cliente. Por exemplo: os produtos de maior afinidade, as marcas
preferidas e os itens mais consumidos.

A partir dessas informações, a empresa passou a conhecer melhor os hábitos de consumo dos
clientes e gerar informações próprias. Dessa maneira, utilizou a análise preditiva para aumentar
a relevância da própria marca diante do público.

Além disso, a estratégia de Big Data permitiu uma


otimização do estoque. Uma vez que a empresa realizou
compras mais alinhadas com o consumo do público e
reduziu os custos para manter itens que não tinham
tanta saída.

Fonte: https://www.sbkbs.com.br/insights/analise-de-dados/ Fonte: https://br.pinterest.com/pin/851954454497616050/


3 referências em BI&A
2. Nike
Presente em mais de 180 países, a Nike usa a inteligência de dados para otimizar
processos, aumentar o conhecimento sobre o próprio público e desenvolver novas
linhas e produtos.

Uma das estratégias desenvolvidas pela marca foi um software criado para atletas. A
plataforma gerava informações como batimentos cardíacos, velocidade, quantidade de
passos dados, distância percorrida, entre outros. Nesses casos, o consumidor tinha
acesso a informações do seu interesse sobre a sua prática esportiva e a empresa
também.

Um ponto de destaque da ação foi o incentivo ao compartilhamento das informações


nas redes sociais. O que mobilizou mais pessoas interessadas e criou um sentimento de
competição entre os usuários.

Tal efeito resultou em um crescimento exponencial dos dados gerados diariamente.


Assim, a partir deste conjunto de informações, a Nike recebeu mais subsídios para
basear a tomada de decisões.

Entender o estilo de vida do público é um aspecto


fundamental para a empresa oferecer diferenciais
aos clientes. Com isso, ela se mantém na liderança
no quesito de fornecedora de calçados e roupas
esportivas.

Fonte: https://www.sbkbs.com.br/insights/analise-de-dados/ Fonte: https://br.pinterest.com/pin/851954454497616050/


3 referências em BI&A
3. Amazon
Referência mundial no uso de informações, a Amazon se beneficia da análise de dados para
otimizar processos e melhorar a experiência do consumidor. Ela é uma das companhias que
mais investem em coleta, armazenamento, processamento e análise de informações sobre
clientes e usuários.

Atualmente, a inteligência da empresa chegou a outro nível. Já que a Amazon utiliza o


cruzamento de dados dos consumidores para identificar potenciais compras que serão
realizadas e deixá-las prontas nas distribuidoras. O que diminui o tempo de entrega.

Outro diferencial está nos preços dos produtos. Com a análise de dados da concorrência, a
demanda dos consumidores e a disponibilidade de mercadorias, os preços podem mudar a
cada 10 minutos. Tudo para deixar os valores mais competitivos e alinhados com o mercado.

Fonte: https://www.sbkbs.com.br/insights/analise-de-dados/
Fonte: https://br.pinterest.com/pin/851954454497616050/
Atividade:
seguindo com a construção de case ficcional

Considere a empresa hipotética da atividade anterior


Vamos elaborar um diagnóstico sobre a geração de dados nessa
empresa

Descreva (sempre de forma ficcional) como ocorrem as


seguintes atividades:
▪ Geração/coleta e tratamento inicial de dados (extração)

▪ Estruturação e estocagem desses dados, com vistas à


consulta posterior

▪ Em que fase da maturidade digital essa empresa


está (com base nas respostas anteriores)
A influência dos
Métodos Ágeis
Então, para que fazer BA?

“A Business Analytics facilita a realização de objetivos de


negócios por meio de relatórios de dados para analisar
tendências, criando modelos preditivos para previsão e
otimizando processos de negócios para melhorar o
desempenho”.
(Robinson, Levis e Bennett, 2010)

Três níveis: análise descritiva, preditiva e prescritiva.


Relação entre Product Owner e
Analista de Negócios
Segundo o BABOK (Business Analysis Body of Knowledge):

Um analista de negócios é qualquer pessoa que executa as tarefas


de análise de negócios descritas no Guia BABOK, independente do
cargo, título ou papel.
Analistas de negócios são responsáveis por descobrir, sintetizar e
analisar informação de várias fontes dentro da empresa, incluindo
ferramentas, processos, documentação e partes interessadas.
O analista de negócios é responsável por elicitar [deixar claras] as
necessidades reais das partes interessadas [stakeholders] – o que
muitas vezes envolve investigar e esclarecer seus desejos expressos –
para determinar os problemas e as causas principais.
Relação entre Product Owner e
Analista de Negócios
Segundo a definição do Guia Oficial do Scrum:

O Product Owner, ou dono do produto, é responsável por maximizar


o valor do produto e do trabalho da equipe de desenvolvimento.
A forma como isso é concretizado pode variar bastante entre
organizações, equipes scrum e indivíduos.
O Product Owner é responsável pela backlog [caracterização dos
requisitos e definição de prioridades] do produto.
Relação entre Product Owner e
Analista de Negócios
Nível Decisório

• Foco no produto
Product
• Definição do backlog do
Owner
produto
• Interação mais próxima
com o cliente
• Tomada de decisão

Analista de
Negócios Nível Analítico

• Diagnóstico de problemas
• Identificação de possíveis
soluções
• Previsão e propostas de
melhoria
• Recomendação de ações

https://www.youtube.com/watch?v=0U11iGCNmDU
BACCM – Business
Analysis Core Concept
Model
As 6 dimensões (conceitos) do BACCM

Todos são igualmente


importantes e necessários.

Cada dimensão ou conceito é


definido e depende dos demais
e só fará sentido em sua relação
com os outros.

Um dos objetivos é desenvolver


uma linguagem comum e
apropriada ao analista de
negócios.

É de grande importância
dominar esses termos e seu
significado!
As 6 dimensões (conceitos) do BACCM

Necessidade (need): “Um problema,


oportunidade ou restrição com valor
potencial para os stakeholders.”

Uma necessidade é o que dá início ao


processo de BA.
Ela se relaciona com o estágio atual da
empresa e é o centro das atividades de
diagnóstico típicas do BI.
A solução a ser proposta visa satisfazer a
necessidade elicitada (identificada,
explicitada).
As 6 dimensões (conceitos) do BACCM

Solução (solution): “Uma maneira


específica de satisfazer uma ou mais
necessidades em um contexto.”

Pode haver mais de uma solução possível


a ser apontada, com suas vantagens e
desvantagens.
Empresas diferentes em geral adotam
soluções diferentes, melhor adaptadas a
seu contexto.
As 6 dimensões (conceitos) do BACCM

Mudança (change): “O ato de


transformação em resposta a uma
necessidade.”

Alterações organizacionais decorrentes da


implantação da solução.
Soluções que não implicam em mudanças
são, em geral, paliativos ou meras
“emendas”.
A resistência à mudança é um grande
desafio.
As 6 dimensões (conceitos) do BACCM

Contexto (context): “Refere-se ao


ambiente no qual a solução precisa ser
implementada, incluindo o histórico da
organização, sua estrutura, rotinas,
valores, governança etc.”

O contexto influi na escolha de soluções,


no rumo e no ritmo das mudanças e nos
próprios resultados.
As 6 dimensões (conceitos) do BACCM

Valor (value): “Importância ou utilidade


de algo para uma parte interessada
dentro de um contexto.”

Uma necessidade requer a busca de uma


solução e isso requer investimento. Este,
por sua vez, só deve ser levado adiante se
o resultado gerar valor, que pode ser
tangível (tipicamente, lucro) ou intangível.
As 6 dimensões (conceitos) do BACCM

stakeholders (partes interessadas): “Um


grupo ou indivíduo relacionado de forma
relevante à mudança, à necessidade ou à
solução.”

stakeholder(s) é um indivíduo ou grupo


que pode influenciar as ações de BA ou
ser influenciado por elas.
As partes interessadas podem estar na
própria empresa, ser seus clientes, ser os
provedores da solução ou membros de
uma organização externa.
Atividade:
seguindo com a construção de case ficcional

Considere a empresa hipotética das atividades anteriores

Formule um descritivo do case utilizando todos os 6


conceitos do BACCM

Não é necessário ser exaustivo, citando, por exemplo,


todos os stakeholders ou todas as soluções possíveis

Destaque claramente uma necessidade como


ponto de partida
Fases da Business
Analytics
Três níveis da BI&A

Análises descritivas e preditivas são as ferramentas básicas do


BA no contexto do BI&A. Algumas de suas ferramentas são
relativamente simples, mas possibilitam grandes melhorias no
dia a dia da empresa.

Por sua vez a prescritiva, diretamente voltada para a tomada de


decisão, exige um conhecimento mais aprofundado do
mercado e da própria empresa e, muitas vezes, exige mais
trabalho em equipe e reflexões sob vários pontos de vista.
Três níveis da BI&A

De forma simples, pode-se dizer que:

• A análise descritiva é um retrato do momento e do passado


recente que visa mostrar como estão os dados agora, tanto
portas a fora quanto portas a dentro da empresa
• A preditiva se volta para o futuro e deve traçar configurações
possíveis para o mercado e para variáveis críticas que afetam
o desempenho da empresa, tudo com base nos dados
coletados no passado
• E a prescritiva deve apontar quais as melhores decisões que
podem ser tomadas de acordo com cada cenário traçado na
análise preditiva, sempre visando a máxima geração de valor
Três níveis/fases da BI&A

Descritiva Preditiva Prescritiva

O que aconteceu? O que irá acontecer? O que deve ser feito?


Questões O que está Por que irá acontecer? Por que deve ser feito?
acontecendo?
Relatórios de mercado Data mining Apoio final ao processo
Dashborads Texto mining decisório
Ferramentas/métodos Scorecards Web/media mining Simulações
Armazenamento e Machine learning Análise de sensibilidade
estruturação de dados
Definição clara de Projeções estatísticas e Identificação das melhores
problemas e econométricas decisões e ações de
oportunidades de Cenários negócio possíveis
Resultados
negócio
Alinhamento
estratégico

BI – pode incluir atividades de


diagnóstico

Adaptado de : https://doi.org/10.1080/2573234X.2018.1507324
Valor e complexidade
Valor estratégico

Simulações

Data mining
Machine learing

Data warehousing Sofisticação e


relevância analíticas
Três níveis da BI&A: Análise Descritiva

A análise descritiva, também chamada de exploratória, utiliza técnicas estatísticas para expor os dados
como estão no momento. Essa análise pode ser

• Univariada: investiga uma única variável ou uma coluna no banco de dados;


• Bivariada: investiga a relação entre duas variáveis;
• Multivariada: investiga a relação entre diversas variáveis ou colunas do banco.

Apesar de ser um processo mais básico e relativamente simples de ser feito, uma boa análise descritiva
consegue responder muitas perguntas de negócio de maneira imediata. Por exemplo, qual artigo teve
maior número de acessos no blog? Essa pergunta pode ser respondida apenas com a organização do
banco de dados ou com a construção de um gráfico. Essa análise não exige um modelo estatístico
nem cálculos muito complexos, apenas uma apresentação inteligível dos dados.

Esse tipo de análise é a mais presente em relatórios estatísticos simples, gerados automaticamente. É
importante para ver quais foram os resultados de diferentes áreas da empresa e ajudar nos insights
sobre o que funcionou ou não. Nesse processo são apresentadas estatísticas descritivas, que
descrevem os dados como média, mediana, moda, máximo, mínimo, percentis entre outros.

Mas a estatística não serve apenas para olhar para o passado e entender o que houve, ela também
ajuda a se preparar para o futuro. Uma das formas de fazer é prever o que irá acontecer e isso só é
possível com uma análise preditiva.

Adaptado de : https://doi.org/10.1080/2573234X.2018.1507324

Descritiva Preditiva Prescritiva


Três níveis da BA: Análise Preditiva
A análise preditiva é feita por meio de um modelo preditivo, uma fórmula, para estimar um parâmetro
desconhecido. Essa fórmula pode ser tanto uma expressão matemática quanto uma declaração lógica, ou
a junção dos dois. Mas o que seria esse modelo preditivo? Um modelo, no geral, é uma forma de
representação simplificada da realidade com um objetivo definido. E essa simplificação é feita de acordo
com o objetivo do modelo ou com as possibilidades oferecidas pela base de dados.

O modelo preditivo é julgado pelo seu desempenho preciso. Ele precisa ser inteligível e oferecer
resultados confiáveis já que é com base neles que são tomadas as decisões dentro de uma empresa.

Por exemplo, lojas com um enorme histórico de vendas como o Walmart conseguem prever quais os
produtos mais procurados e que vendem mais depois de uma tempestade ou durante os diferentes ciclos
de vida de uma pessoa. Sabendo quais produtos vendem mais em determinado momento é possível se
preparar para o que irá acontecer.

Uma análise preditiva também é capaz de encontrar qual o perfil de cliente que tende a não renovar
contrato com uma empresa ou aqueles que têm grande chance de pedir um cancelamento do serviço.

Quando conseguimos identificar esses pontos de interesse e prever como eles irão se comportar
podemos passar para a próxima etapa que é: o que fazer com essa informação? Após saber que as
pessoas compram mais água depois de uma tempestade como se preparar para esse acontecimento?
Depois de identificar quais clientes têm mais chance de deixar a empresa, o que fazer com eles? Qual
ação vai trazer mais resultados positivos para a empresa? É aí que entramos na análise prescritiva.
Adaptado de : https://doi.org/10.1080/2573234X.2018.1507324

Descritiva Preditiva Prescritiva


Três níveis da BA: Análise Prescritiva
Também conhecida como análise de recomendação, é quando unimos as análises descritiva e preditiva com
o conhecimento de negócios.

Essas três frentes unidas são capazes de recomendar ações tomadas de maneira automática, otimizar os
processos e escalar a tomada de pequenas decisões. Assim é possível economizar tempo e alcançar
melhores resultados.

A ideia aqui é fornecer recomendações inteligentes para ajudar a alterar o futuro. Enquanto as análises
preditivas preveem futuros possíveis, as análises prescritivas criam suas recomendações específicas para lidar
com esse futuro.

O aplicativo Waze é um exemplo claro de aplicação cotidiana dessa análise. Nele é possível colocar um lugar
de partida e um destino para que o app calcule as rotas possível, quanto tempo cada rota demora para ser
feita e indica qual a melhor para aquele dia e horário.

As análises prescritivas na maioria das vezes dependem de um esforço em equipe para funcionarem. É
preciso criar recomendações alinhadas com o contexto da empresa e com as condições de cada equipe que
irá realizar essas ações.

Ainda, a prescrição pode ser resultado de uma ferramenta de simulação de cenários, criada a partir de
análises preditivas, onde a simulação envolve também a parametrização realizada pelos tomadores de
decisão. Assim, podem visualizar diferentes resultados possíveis a partir de parâmetros pré-estabelecidos.

Descritiva Preditiva Prescritiva


Case da Target
A Target que foi capaz de saber que uma moça estava grávida antes mesmo da família. E
realizou isso baseando-se apenas nos seus hábitos de compra. A ação da loja era a seguinte:
eles conduziram uma pesquisa junto às clientes grávidas para saber quando era a possível data
de nascimento dos bebês. Monitoraram os hábitos de compra dessas mulheres mês a mês para
entender o que mudava. Isso incluía perfumes e cremes com cheiros mais suaves ou sem
cheiro, diferentes suplementos de vitaminas, entre outros produtos.
Com o grande fluxo de informação das clientes, a loja se adiantou e ofereceu descontos em
produtos que elas precisariam. Itens como fraldas, lenços e berços eram as compras mais
comuns das futuras mães. Para engajar esse público a empresa começou a gerar cupons
automáticos para esses produtos.

Foi assim que uma das clientes começou a receber cupons de


desconto para produtos relacionados à maternidade. A família não
entendeu o motivo e seu pai ficou incomodado achando que a
empresa estava estimulando sua filha a engravidar. Semanas depois
a jovem anunciou a gravidez.
A estratégia da loja por trás dessa ação era atingir o público antes
dos concorrentes. E fidelizar as clientes por meio dos cupons de
desconto nas lojas, antes mesmo das crianças nascerem. As outras
empresas, no geral, só começam essa campanha depois das
gestantes se tornarem mães. Por isso acabam perdendo esse
público para a Target que já estava trabalhando com estratégias de
marketing orientado a dados há mais tempo. Fonte: https://operdata.com.br/blog/qual-a-
diferenca-entre-analise-descritiva-preditiva-e-
prescritiva/
Atividade – benchmarking:
analisando o caso Target

▪ Que lições o caso Target oferece para a


empresa fictícia com a qual seu grupo vem
trabalhando?

▪ Pontue e comente elementos relativos a


cada uma das três fases das atividades de
BI&A analisadas anteriormente.

Fonte: https://operdata.com.br/blog/qual-a-
diferenca-entre-analise-descritiva-preditiva-e-
prescritiva/
Análise exploratória
de dados – Data
Analytics
John Tukey e a Análise Exploratória
de Dados

https://www.pensador.com/frase/MjcyMjYzOQ/

(1915 – 2000)
https://en.wikipedia.org/wiki/John_Tukey
Dos dados à sabedoria (conhecimento
decisório): a pirâmide DIKW (data,
information, knoledge, wisdom)

Tomada de decisão
Futuro

Sabedoria data driven

Interpretação,
Conhecimento significado para o
negócio

Organização e
Informação processamento: dados
estruturados
Passado

Dados Obtenção: medições,


observações, bases
acessíveis ou geradas
Geração de Dados Estruturados

• O pré-processamento pode consumir até 80% do tempo e esforço total


de um projeto de análise de dados
• O pré-processamento é um conjunto de atividades que envolvem
preparação, organização e estruturação dos dados. Trata-se de uma
etapa fundamental que precede a realização de análises e predições
• A geração de dados estruturados é o
primeiro grande desafio da BA em seu nível
preditivo
• Sua matéria-prima são os dados não
estruturados gerados em larga escala:
textos, ações de usuários da internet e
aplicativos, imagens, ações em IoT
• O primeiro passo na estruturação de dados
é classifica-los em tipos básicos

https://www.gratispng.com/png-pcw2vg/
Geração de Dados Estruturados
• Contínuos: qualquer valor em um intervalo, como velocidade, tempo,
temperatura
• Discretos: assumem apenas valores inteiros, como unidades de um
dado bem, número de acessos a uma área de um site ou número de
conexões em uma rede social
• Categóricos: assumem apenas um conjunto
específico de valores que representam
categorias, como CEP, profissão,
escolaridade
• Binários: caso especial de categorias tipo 0
ou 1, sim ou não
• Ordinais: permitem classificação apenas
ordinal, como a sequência em que pedidos
foram colocados ou que clientes foram
atendidos

https://www.gratispng.com/png-pcw2vg/
Data mining
A mineração de dados não é uma nova tecnologia e pode ser encontrada
nas antigas civilizações do Oriente Médio que viviam próximas aos rios do
Crescente Fértil.
Desde o século passado, as pessoas analisam dados em computadores
desde que os computadores foram inventados.

No contexto do BI&A, a mineração de está associada à análise preditiva e


a tarefas como:

• Descrição (ex.: Estatística Descritiva);


• Exploração e Visualização de Dados (ex.: Online Analytical
Processing – OLAP, Construção de Mapas);
• Clustering;
• Preparação de métodos e ferramentas de
Otimização e Simulação (ex.: Séries Econométricas
Temporais Programação Linear, Inteira e em Redes,
Simulação de Monte Carlo).
Clustering
• O clustering ou análise de agrupamento de dados é o conjunto de técnicas de
prospecção de dados (data mining) que visa fazer agrupamentos automáticos de dados
segundo o seu grau de semelhança. O critério de semelhança faz parte da definição do
problema e, dependendo, do algoritmo. A cada conjunto de dados resultante do
processo dá-se o nome de grupo, aglomerado ou agrupamento (cluster).

• O procedimento de agrupamento (clustering) também pode ser aplicado a bases de


texto utilizando algoritmos de prospeção de texto (text mining), onde o algoritmo
procura agrupar textos que falem sobre o mesmo assunto e separar textos de conteúdo
diferentes.

• Normalmente o usuário do sistema deve


escolher a priori o número de grupos a
serem detectados. Alguns algoritmos mais
sofisticados pedem apenas o número
mínimo, outros tem a capacidade de
subdividir um grupo em dois.

• Os tipos de algoritmos de agrupamento


de dados mais comuns são: os particionais
e os hierárquicos.

Adaptado de: https://pt.wikipedia.org/wiki/Clustering


Modelos de descoberta ou aquisição de
conhecimento (mais do que só data mining)

• SEMMA: do inglês sample, explore, modify, model, and assess. Definido em


1996. Lista de etapas sequenciais desenvolvida pelo SAS Institute para
orientar aplicativos de mineração de dados. Abordagem criticada por dar
pouca importância à compreensão de aspectos do negócio.
• KDD: do inglês knowledge-discovery in databases. Criado em 1989,
confundia-se com data mining (apenas uma etapa). Conhecimento =
descoberta baseada em dados. Destaca iteração e interação. Voltado para
a descoberta de padrões não triviais e úteis para o negócio nas bases de
dados.
• CRISP-DM: do inglês cross industry standard process for data mining.
Definido em 2000, aprimorado em 2006. Descreve abordagens
comumente usadas por especialistas em mineração de dados para
abordar problemas.

Adaptado de:https://www.linkedin.com/pulse/semma-kdd-ou-crisp-dm-
existe-bala-de-prata-para-frameworks-silva/?originalSubdomain=pt
KDD
Embora KDD e data mining sejam frequentemente entendidos como
sinônimos, é importante frisar que, enquanto o KDD compreende todas as
etapas para a descoberta do conhecimento a partir da existência de dados,
a Mineração de Dados é apenas e tão somente uma das etapas do
processo. O processo é interativo e iterativo. Interativo, pois o usuário pode
interferir e controlar o curso das atividades. Iterativo, por ser uma sequência
limitada de operações onde o resultado de cada uma é dependente dos
resultados das antecedentes.

O data mining é a etapa mais


crítica, pois visa a identificação
de padrões que possam dar
suporte a decisões data driven
(Decision Intelligence)
Fonte: Adaptado de Fayyad, Piatetsky-Shapiro e Smyth (1996), disponível em
https://www.aaai.org/Papers/KDD/1996/KDD96-014.pdf, acessado em 12/jul/2022.
CRISP-DM
A mineração de dados pode ser estruturada nas seis fases, ou etapas, que
compõem o CRISP-DM

▪ Entendimento de negócio;
▪ Entendimento dos dados;
▪ Preparação dos dados;
▪ Modelagem dos dados;
▪ Avaliação dos resultados;
▪ Deployment (implantação).

https://www.linkedin.com/pulse/semma-kdd-ou-crisp-dm-existe-
bala-de-prata-para-frameworks-silva/?originalSubdomain=pt
DALC – Data Analytics Life Cycle

1.
• O DALC se insere nas fases Descoberta:
6. Avaliação
Descritiva e Preditiva do BI&A do modelo –
definição do
• É um dos momentos de maior problema/
objetivo
interação entre o analista de
negócios e os cientistas de
dados 5. 2. Coleta/
• São de grande importância Comunicação extração de
conceitos como SQL, Data dos resultados dados
Warehouse e ETL
• Na pirâmide DIKW, situa-se
entre as fases de informação e 3.
4.
conhecimento Modelagem/
Estruturação:
organização e
transformação
carregamento

Fonte: Adaptado de https://medium.com/@kvmoura/ciclo-de-vida-dos-dados-4-4a6a6cd552b5


Atividade:
Data Analytics Life Cycle na empresa ficcional

Considere novamente a empresa hipotética das atividades anteriores

Considere como referência o roteiro dos slides a seguir

A partir deles, descreva do modo mais realista (sempre de forma ficcional)


atividades ligadas a cada uma das 6 etapas listadas

Aponte também eventuais riscos ou obstáculos para a implantação das rotinas de


Data Analytics referentes às fases descritiva e prescritiva

Associe essas mesmas fases aos elementos da pirâmide


DIKW

Faça menção explícita aos métodos SEMMA, KDD e


CRISP-DM, no que couber

Fonte: https://medium.com/@kvmoura/ciclo-de-vida-dos-dados-4-4a6a6cd552b5
Atividade: Trabalho em Grupo
Data Analytics Life Cycle

1. Descoberta (Discovery): esta etapa consiste em aprender sobre o domínio do


negócio, analisando o histórico da organização em análise de dados. Deve-se também
avaliar os recursos disponíveis pela organização: pessoas, tecnologia, tempo e dados.
É nesta fase também que se formulam as hipóteses sobre os problemas de negócio
que deverão ser desenvolvidas nas próximas etapas.
2. Preparação dos dados (Data Preparation): esta etapa consiste em extrair os dados
de um sistema-fonte, converter em um formato que possa ser analisado e armazenar
em um armazém ou outro sistema. Nesta etapa aplicam-se metodologias geralmente
utilizadas quando os dados são provindos de fontes diferentes: o ETL, um tipo de data
integration em três etapas (extract, transform e load) que combina dados de diversas
fontes e o ELT (extract, load, transform), uma abordagem alternativa utilizada para
aprimorar a performance. Quando as duas técnicas são utilizadas o processo também
é conhecimento como ETLT (SAS). Esta é uma fase de familiarização com os dados
onde é possível tomar medidas para condicionar os dados.
3. Planejamento do modelo (Model Planning): esta etapa consiste em determinar os
modelos e técnicas a serem aplicadas. É uma fase de exploração dos dados,
compreensão das relações entre as variáveis e seleção das que melhor atendem o
modelo.

Fonte: https://medium.com/@kvmoura/ciclo-de-vida-dos-dados-4-4a6a6cd552b5
Atividade: Trabalho em Grupo
Data Analytics Life Cycle

4. Construção do modelo (Model Building): esta etapa consiste em executar o


planejamento da fase anterior em cima de uma base de dados menor e selecionada
para a realização de testes e treinamento dos modelos. Nesta etapa também são
analisadas as ferramentas existentes para processamento dos modelos a fim de
verificar se atendem os requisitos necessários, tais como: processamento paralelo.
5. Comunicar os resultados (Communicate Results): esta etapa consiste em identificar
os principais resultados, aferindo com o os objetivos de negócio levantados na etapa
1. Esta fase pode ser identificada como um sucesso ou um fracasso de acordo com os
resultados obtidos. Os resultados devem ser resumidos e apresentados para as partes
interessadas do projeto.
6. Operacionalizar (Operationalize): esta etapa consiste nas entregas finais do projeto
que podem ser relatórios, algoritmos, instruções e documentos técnicos. Também
pode ser executado um projeto piloto para implementar os modelos em um ambiente
de produção.

Fonte: https://medium.com/@kvmoura/ciclo-de-vida-dos-dados-4-4a6a6cd552b5

Você também pode gostar