Você está na página 1de 119

APLICAÇÕES

DE DATA
ANALYTICS –
BUSINESS
ANALYTICS
ALDO ROVANI
Sumário
AULA 1
INTRODUÇÃO AO CONCEITO DE CIÊNCIA DE
DADOS..................................................................... 7
INTRODUÇÃO......................................................... 8
CIÊNCIA DE DADOS.............................................. 11
CRESCIMENTO DOS DADOS................................ 12
DADO – INFORMAÇÃO – CONHECIMENTO ...... 15
BIG DATA............................................................... 16

AULA 2
CONCEITOS FUNDAMENTAIS DE BUSINESS
ANALYTICS............................................................ 20
INTRODUÇÃO....................................................... 21
BUSINESS INTELIGENCE OU BUSINESS
ANALYTICS?........................................................... 23
DW – DATAWAREHOUSE..................................... 25
DM – DATA MART................................................. 25
DATA LAKE – LAGO DE DADOS E
DATA DISCOVERY – DESCOBERTA DE DADOS.... 26
BIG DATA – IOT E INTELIGÊNCIA ARTIFICIAL .... 27
AULA 3
CICLO DE VIDA DE PROJETOS DE CIÊNCIA DE
DADOS................................................................... 31
INTRODUÇÃO....................................................... 32

AULA 4
BLOCKCHAIN E TECNOLOGIAS DISRUPTIVAS.... 39
INTRODUÇÃO....................................................... 40
BLOCKCHAIN......................................................... 40
SEGURANÇA CIBERNÉTICA................................. 42
REALIDADE VIRTUAL............................................ 43
REALIDADE AUMENTADA:.................................. 44
DRONES................................................................. 45
CHATBOTS............................................................. 46
TECNOLOGIA DE SAÚDE INTELIGENTE.............. 47

AULA 5
ESTRUTURA DE DADOS PARA A TOMADA DE
DECISÃO................................................................ 48
INTRODUÇÃO....................................................... 49
TIPOS DE DADOS.................................................. 50
TIPOS DE BANCO DE DADOS............................... 52
AULA 6
ROI E ATIVOS INFORMACIONAIS..........................56
INTRODUÇÃO....................................................... 57
CONCEITO............................................................. 58
CLASSIFICAÇÃO DE ATIVOS
INFORMACIONAIS............................................... 60
ROI – RETORNO SOBRE O INVESTIMENTO........ 61

AULA 7
FERRAMENTAS DE DATA ANALYTICS E BUSINESS
INTELLIGENCE....................................................... 63
INTRODUÇÃO....................................................... 64
MAGIC QUADRANT FOR ANALYTICS AND
BUSINESS INTELLIGENCE PLATFORMS, 2019.... 67

AULA 08
VISUALIZAÇÃO DE DADOS.................................. 71
INTRODUÇÃO....................................................... 72
CONCEITO............................................................. 73
TIPOS DE VISUALIZAÇÃO DE DADOS................. 73
GRÁFICOS E TABELAS.......................................... 74
EXEMPLOS DE INFOGRÁFICOS........................... 74
AULA 9
CASOS DE SUCESSO DE BIG DATA E
ANALYTICS............................................................ 77
INTRODUÇÃO....................................................... 78
ALGUNS DETALHES DOS CASOS DE SUCESSO... 79

AULA 10
GOVERNANÇA DE TI NAS ORGANIZAÇÕES.........87
CONTEÚDO DO PLANO DIRETOR DE
INFORMÁTICA...................................................... 90
O CICLO DE VIDA DA GOVERNANÇA DE TI........ 94
GERENCIAMENTO DE RISCOS............................. 95
SEIS PASSOS PARA O GERENCIAMENTO DE
RISCOS................................................................... 96
A IMPORTÂNCIA E O PAPEL DA TECNOLOGIA DA
INFORMAÇÃO....................................................... 97

AULA 11
SEGURANÇA DE DADOS, AMEAÇA E PROTEÇÃO
DA INFORMAÇÃO................................................. 98
INTRODUÇÃO....................................................... 99
CONCEITO........................................................... 101
TIPOS DE ATAQUES............................................ 102
ATORES ENVOLVIDOS........................................ 103
MECANISMOS DE DEFESA................................. 104

AULA 12
ÉTICA NO USO DOS DADOS E LEGISLAÇÃO
APLICÁVEL A DADOS PÚBLICOS E PRIVADOS.. 109
INTRODUÇÃO..................................................... 110
LEI Nº13709 DE AGOSTO DE 2018.................... 111
AULA 1

INTRODUÇÃO
AO CONCEITO
DE CIÊNCIA DE
DADOS
INTRODUÇÃO

Muito se fala atualmente sobre a tecnologia


a serviço da informação, sobre os avanços
que tivemos no campo computacional, no
que diz respeito ao “hardware” (que são os
equipamentos como processadores, memórias,
dispositivos de armazenamento e demais
8
periféricos) e “software” (que são os programas
e ou aplicações) utilizadas por nós seja nas
empresas, nas instituições de ensino ou até
mesmo em nossas atividades de entretenimento.

Toda evolução, parte-se do princípio, existe


para satisfazer alguma necessidade de
mercado e ou ditar uma nova maneira de se
fazer determinadas rotinas e ou atividades,
muitos enxergam isso como fator positivo,
de crescimento e de melhoria nos processos
de trabalho, outros demoram a perceber
que as evoluções nos levam a caminhos
complexos e que, se não estivermos
antenados, seremos engolidos e ou
ficaremos ultrapassados. Para as empresas,
muitas vezes ficar na vanguarda, pode
significar a perda de posições no mercado
frente aos seus concorrentes. O fato é que
devemos aproveitar, estrategicamente,
as oportunidades que temos diante das
tecnologias existentes.

Vale ressaltar que para fazermos uso das


informações a nosso favor, precisamos entender
alguns conceitos e principalmente entendermos
que as análises de dados passam a ter papel

9
preponderante para nos apoiar no processo
decisório, diariamente. Portanto termos como:
Ciência de Dados, Big Data, Data Analytics,
Business Analytics, Business intelligence, Data
Lake, Data Mart, Data Warehouse, passam a ser
mais comumente encontrados no nosso dia-a-dia.

Antes de falarmos sobre os conceitos básicos


de ciência de dados, devemos voltar um pouco
na história e citarmos que tivemos em outras
décadas tecnologias muito utilizadas e que
atendiam as demandas que auxiliavam os
diretores e a alta administração da empresa no
processo de tomada de decisão, como Sistemas
de Apoio à Decisão, Sistemas de Informações
Gerenciais, Sistemas de Informações Executivas
e o que temos hoje é de fato uma evolução de
soluções como estas.

Em resumo podemos dizer que não devemos


analisar e tentar entender possíveis ocorrências
futuras, tendências, probabilidade de ocorrências,
se não tivermos um histórico de informações que
servirão de base e parâmetros para as nossas
análises.

Seja bem vindo ao universo dos dados, o mais


valioso ativo das empresas nos dias atuais.

Passemos agora aos conceitos que nortearão os


nossos estudos:
10
CIÊNCIA DE DADOS
Ciência de dados é o termo utilizado no
mercado para definir a EXTRAÇÃO, COLETA e
DESCOBERTA DE INFORMAÇÕES a partir de
diversas fontes de dados. Não podemos deixar
de citar diante dos dados que serão coletados,
muitas vezes para descobrirmos informações
ou obtermos insights, deveremos ainda nos
apoiar no uso de algumas técnicas como:
Inteligência Artificial e ou algoritmos - modelos
estatísticos, que nos ajudarão a responder aos
questionamentos de um determinado problema
de negócio solicitado pelas empresas. Cabe
salientar que em determinadas situações as
empresas já conhecem os problemas e querem
respostas preditivas que podem impedir que
os problemas voltem a ocorrer e em alguns
casos fazer uso das análises preditivas a favor
de alguma oportunidade que até então era
desconhecida.

Como o volume de dados, objeto das análises e


correlações entre eles, é muito grande, a Ciência
de Dados, através das tecnologias existentes, nos
ajudará na interpretação dos mesmos e assim
torná-los úteis aos executivos das empresas.

11
CRESCIMENTO DOS DADOS
CRESCIMENTO DOS DADOS
É notório que a cada segundo geramos milhões
É notório
de que ae ou
transações cada segundo no
interações geramos
Brasil milhões
e no de
transações
mundo, sejae em
ou ambiente
interações,corporativo
no Brasil e eno
oumundo.
mídias
Seja emEambiente
sociais. corporativo
as interações e ou
presentes nomídias
universosociais,
os dados estão
tecnológico cadahoje,
estão, vez mais
sendopresentes no universo
observadas de
tecnológico
perto e observados
pelas empresas, de perto
conforme pelas empresas
demonstra a
nestas diferentes plataformas, conforme nos mostra
imagem:
a imagem:
2017
ThIS IS WhAT hAPPENS
IN AN INTErNET MINUTE

16 Million
900,000 Text
Logins Messages
3.5 Million 4.1 Million
Search Videos
Queries Viewed
70,017 342,000
Hours Watched Apps Downloaded

$751,522 46,200
Spent Online Posts
Uploaded
1.8 Million 452,000
Snaps Created Tweets Sent

15,000
GIFs Sent via 990,000
Messenger Swipes
120
News 156 Million
Accounts 50 Emails Sent
Created Voice-First 40,000
Devices Hours
Shipped Listened

2018 12
Shipped

2018
ThIS IS WhAT hAPPENS
IN AN INTErNET MINUTE

18 Million
973,000 Text
Logins Messages
3.7 Million 4.3 Million
Search Videos
Queries Viewed
266,000 375,000
Hours Watched Apps Downloaded

$862,823 174,000
Spent Online Scrolling
Instagram
2.4 Million 481,000
Snaps Created Tweets Sent

25,000
GIFs Sent via 1.1 Million
Messenger Swipes

38 Million 187 Million


Messages 67 Emails Sent
Voice-First 936,073
Devices Views
Shipped

Comparativo: Internet em um minuto


https://epocanegocios.globo.com/Tecnologia/noticia/2017/09/o-
que-acontece-em-um-minuto-na-internet.html
Comparativo: Internet em um minuto
https://epocanegocios.globo.com/Tecnologia/noticia/2017/09/o-
que-acontece-em-um-minuto-na-internet.html 
O volume de dados vem crescendo de forma expo-
O volume
nencial de dados
e desde 2013vem
até crescendo de forma
ao ano de 2017. Os dados
exponencial e desde
não estruturados 2013 até
(externos aosao ano de 2017,
ambientes os
corpora-
dados não estruturados
tivos, como (externos
dados veiculados aos ambientes
na internet através de
corporativos, como dados
sites e redes sociais) veiculadosquase
já representam na internet
80% do
através
volume de sites e redes
armazenado nossociais)
grandesjádatacenters,
representavamcon-
forme mostra a imagem da Oracle.
13
não estruturados (externos aos ambientes corpora-
tivos, como dados veiculados na internet através de
sites e 80%
quase redes(oitenta
sociais)por
já representam quase 80% do
cento) do volume
volume armazenado
armazenado nos grandes
nos grandes datacenters,
data centers, con-
conforme
forme mostra
mostra a imagem
a imagem da Oracle.
da Oracle.

CRESCIMENTO ExpONENCIAL
DO USO DE DADOS

Data Growth 125


Driven by Unstructured Data Exabytes
Storage
Options

79.2%

Application
r

Unstructured Digital
ea
pe ing
rY

Data Archive
% w
.5 ro
42 G

37.4
Exabytes ing 22.4%
Grow r Year 20.8%
Database

pe Structured Backup
Data

2013 2017

Fonte Oracle (2017)


Fonte: Oracle (2017)

DADO – INFORMAÇÃO
Falaremos – mais sobre os
mais adiante um pouco
CONHECIMENTO
tipos de dados e as suas aplicações no ambiente
corportativo.
Importante destacar que o dado é a matéria-pri-
ma para a geração da informação. Embora nos dias
atuais possamos fazer análises e estudos com os da-
dos brutos, com quatro perguntas básicas, podemos
contextualizar o dado e assim obter entendimento,
ou seja, temos uma informação:

O QUE?
14
QUANDO?
DADO – INFORMAÇÃO –
CONHECIMENTO
Importante que saibamos que o dado é a
matéria prima para a geração da informação.
Para fazer análises e estudos com os dados
brutos, utilizamos quatro perguntas básicas para
contextualizar o dado e obter entendimento. Esse
é o processo da formação rudimentar de toda
informação:

O QUE?
QUANDO?
ONDE?
QUEM?

De posse das informações, se aplicarmos alguma


reflexão, avaliações e assim permitir que novas
experiências sejam incorporadas ao processo,
aprendermos e gerarmos novas informações. E
esse é o processo da geração do conhecimento.
Trabalhar com Dados, informações e obter
conhecimento que apoie no processo de tomada
de decisão, é um dos maiores desafio que as
empresas estão enfrentando, hoje.

15
BIG DATA
O termo Big Data, assim como ciência de dados,
não nos soa mais estranho aos ouvidos, já é
realidade em diversas empresas de diversos
segmentos, que precisam obter respostas rápidas
com o intuito de conhecer melhor seus clientes,
e ou agir pro-ativamente frente à problemas e
oportunidades.

Falar em Big Data é ter clareza de que estamos


falando de grandes volumes de Dados, coletados
em formatos variados de fontes distintas (como
redes sociais) gerados para serem processados
em grande velocidade, tendo como requisito
básico a confiabilidade que eles representam.
Tudo isso só é possível devido às evoluções no
hardware e software. Mas, efetivamente, não
podemos fazer uso dessa tecnologia com recursos
computacionais tradicionais.

Não podemos esquecer que algumas habilidades


são elementares quando falamos de ciência de
dados:
• Matemática
• Estatística
• Programação
• Computação
16
• Conhecimento de segmentos (verticais) e seus
processos de negócio.
• Análise e Modelagem preditiva
• Engenharia e Mineração de dados
• Visualização de dados

Muitas pessoas estão se perguntando sobre os


impactos da revolução tecnológica, no mercado
de trabalho e na econômica propriamente
4.0. Muitas funções hoje desempenhadas por
algumas pessoas, certamente deixarão de
existir (principalmente as atividades que têm
processos repetitivos).Provavelmente, elas serão
automatizadas por robôs ou chatbots.

Em contrapartida, surgirão outras novas funções


que também necessitarão de capacitação para
exercê-las.

Precisamos ter em mente que muitas


automatizações futuras poderão não apenas
substituir postos de trabalhos, mas aumentar
a capacidade produtiva ou de atendimento de
demandas em determinados segmentos.

O uso da inteligência artificial na área médica e


também na área jurídica, por exemplo, permitirá
a médicos, juízes, promotores, advogados
obterem informações precisas e com uma
17
agilidade superior a dos humanos, nos processos
tradicionais de consulta de informações.

Quando falamos de profissionais que lidam


especificamente com a coleta, tratamento, carga
e análise de dados, temos segundo Gartner,
o surgimento de alguns perfis que vem sendo
demandados com considerável aumento desde
2014, como nos mostra a imagem a seguir:

GET READY FOR NEW SKILLS AND ROLES

Data Scientist Job Description Wordcloud


2014 Gartner. Inc. and/or its affiliates. All rights reserved.

18
Emerging Roles for the 21st Century Infocentric
Organization:
—— Chief Data Officer
—— Chief Digital Officer
—— Chief Analytics Officer
—— Data Scientist
—— Information Strategist
—— Information Architect
—— Information Product Manager
—— Information Asset Manager
—— Data Steward
—— Data Custodian

Vale ressaltar que novas funções e ou papéis


exercidos surgiram, em virtude da aprovação da
LGPD (Lei Geral de Proteção de Dados) brasileira,
sancionada pelo então Presidente da República
Michel Temer e que passará a vigorar em 2019,
porém trataremos um pouco sobre esses perfis
mais adiante em outro capítulo.

19
AULA 2

CONCEITOS
FUNDAMENTAIS
DE BUSINESS
ANALYTICS
INTRODUÇÃO

No mercado muitas vezes observa-se iniciativas


de projetos diversos, relacionados à análises
de dados que desperdiçam tempo, dinheiro e
energia.

E por isso precisamos falar sobre Analytics.


Para permitir que se esclareça que temos neste
conceito de forma muito abrangente uma solução
“guarda-chuvas” que tem diversas soluções
abaixo de si, como BI (Business Intelligence), BA
(Business Analytics), Data Discovery, Data Lake,
Big Data, BI Insights, entre outras.

Fazer uso da solução correta e adequada, permite


às empresas investimentos mais assertivos e
resultados mais rápidos no que diz respeito à
geração de respostas aos questionamentos que
objetos de um possível problema de negócio a
ser resolvido, como dissemos anteriormente.
Entendemos, inclusive, que muitas dessas
soluções são complementares e não substitutivas.

21
TECNOLOGIAS QUE
TRABALHAM EM CONJUNTO

BigData
Business
AnaLytcs

Dada
Discovery

BI Self
Business Service
Inteligence

BI
Insights

Assim podemos dizer que ANALYTICS é uma


disciplina que nos ajudará a tomar as melhores
decisões, se utilizarmos a solução adequada.

O próprio Gartner, define que é um processo


cíclico conforme nos mostra a figura:

22
BUSINESS INTELIGENCE OU
BUSINESS ANALYTICS?
Por não conhecerem os níveis de maturidade das
informações, que nos ajudam a identificar quais
os tipos mais adequados de soluções para apoiar
o processo de decisão, muitas pessoas iniciam
projetos ou compram ferramentas que não são
aderentes às suas necessidades.

A figura (SAS Institute) nos mostra os níveis de


maturidade da informação e nos permite melhor
entendimento sobre o tema.

23
ANALYTICS
CAPACIDADES E QUESTÕES

Note que o BI, nos dará informações com base


em dados históricos e atuais, o fatos ocorridos.
Já as soluções de business analytics através
do uso de análises com modelos estatísticos,
nos permite uma antecipação à determinadas
situações, que ainda poderão ocorrer. Em
resumo, podemos afirmar que o BI no responde
“O QUE ACONTECEU”, o BA pode nos responder:
“PORQUÊ ACONTECEU” e “O QUE PODERÁ
ACONTECER”.

Veja não se trata aqui de dizer qual é o melhor, e


sim qual é o mais adequado à necessidade que a
empresa apresenta no momento.

24
DW – DATAWAREHOUSE
O DW ou DATA WAREHOUSE é um banco
de dados centralizado, com capacidade de
armazenar e organizar um grande volume de
dados atuais e históricos que podem ajudar
uma empresa obter insights e auxílio na tomada
de decisões importantes. É uma solução muito
difundida e utilizada no Brasil desde o final da
década de 1990. E ainda existem empresas
que fazem uso desse grande repositório de
informações corporativas como principal fonte
de informações para a geração de relatórios e ou
dashboards.

DM – DATA MART
Um DATA MART é uma subdivisão ou subconjunto
de um dw. Os Data Marts são como pequenas
fatias que armazenam subconjuntos de dados,
normalmente organizados para um departamento
ou um processo de negócio, que passam a ser os
“donos” das informações.

A figura nos mostra que tanto o DW quanto o DM,


tem como origens as informações em bases de
dados dos sistemas transacionais das empresas,
sendo assim os dados estão todos estruturados

25
e em alguns casos, podem também ser uma das
origens para as soluções de BIG DATA que terão
além destes, os dados não estruturados, como
citamos anteriormente:

DATAWAREHOUSE – DATAMART

DM

Mainframe Cubos DM
DataMart
ERP
DataWarehouse
ETL

Legados

ODS

Stage Area
Relatórios
Data Mining
Query
Aplicações Analíticas
Planejamento Financeiro

DATA LAKE – LAGO DE DADOS E


DATA DISCOVERY – DESCOBERTA
DE DADOS
Os DATA LAKES, armazenam os dados em seu
formato bruto, sem qualquer processamento
e sem governança. Aliás, apesar das soluções

26
comerciais, data lake é um conceito e não
uma tecnologia. Podem ser necessárias várias
tecnologias para criar um data lake.

O data lake em essência, é uma estratégia de


armazenamento de dados. Muitos problemas de
negócio podem ser resolvidos a partir de dados
brutos, são de grande utilidade também para
descoberta de informações (DATA DISCOVERY)
que podem ser os insumos para a criação de
métricas, indicadores e ou KPI’s.

É necessário cuidado para a geração do data lake,


para evitar que se produza um pântano em que
os dados não tenham nenhum tipo de controle e
sejam pouco confiáveis.

BIG DATA – IOT E INTELIGÊNCIA


ARTIFICIAL
Antes soava estranho ouvir estes termos, no
entanto agora que já soam muito mais familiares
aos nossos ouvidos, podemos dizer que juntas,
essas técnicas ou tecnologias sustentam
a realidade atual em termos da inovação
tecnológica.

As soluções de BIG DATA, para se tornarem


efetivas fazem uso massivo de dados que muitas
27
vezes podem ser transmitidos e ou coletados
através dos diversos dispositivos eletrônicos com
os seus sensores inteligentes que propagam as
informações, como: smartphones, sensores de
carros, de aviões, sensores em redes de energia e
em plataformas de petróleo - que são exemplos
comuns de aplicações de INTERNET DAS COISAS
“IOT”.

Grandes volumes de Dados de IOT ou de Dados


não estruturados obtidos através de sites,
redes sociais, podem agora ser submetidos
ao uso da INTELIGÊNCIA ARTIFICIAL. A AI
é objeto de pesquisa científica há mais de
cinquenta anos, para que permitir máquinas que
tenham ou adquiram inteligência de humanos
principalmente através de redes neurais artificiais
(RNA), e construam uma analogia aos neurônios
humanos interligados entre-si.

Permitir que uma máquina seja treinada com


a utilização de dados, por meio de instruções
a aprender a executar tarefas rotineiras não é
exatamente uma novidade. Vale lembrar que a
cada etapa ou ciclo de avaliação dos modelos
de Machine Learning utilizados, ajustes podem
ser feitos e ou novos modelos (existem dezenas
deles), podem ser elegíveis para a melhor
resposta ao problema de negócio e ou tarefa a

28
que foram submetidos.

Um novo campo da IA, conhecido como Deep


Learning, se propõe a fazer o aprendizado
de máquina MACHINE LEARNING em várias
camadas, ou seja, de forma mais profunda.
Análises fundamentadas em imagens
através das evoluções conseguidas com os
processadores gráficos GPUs, são fortes aliados
dessa tecnologia, que permite inclusive fazer
reconhecimento facial e diagnósticos médicos.
Muitos recursos de Machine Learning e Deep
Learning, são verdadeiros aliados da área médica,
ajudando a identificar possíveis acidentes e agir
preventivamente e ou a melhorar a eficácia
de diagnósticos de exames de imagem que
possibilitam aos médicos mais eficiência e ações
para o adequado tratamento dos seus pacientes.
Isso poderá ser comprovado com as alguns
cases em capítulos mais adiante, bem como com
materiais complementares disponibilizados no
“SAIBA MAIS”.

Aqui podemos comprovar que a utilização da


ciência de dados, não veio para eliminar postos
de trabalhos, mas otimizar processos e permitir
maior qualidade na realização do trabalho dos
médicos e demais profissionais envolvidos.

Uma dica importante a todos: Quando falamos


29
de inteligência artificial, devemos ter claro o
problema que uso dos algoritmos ou de modelos
matemáticos, estatísticos, visam solucionar. Se
houver mais de um problema, devemos utilizar
algoritmos específicos para a solução de cada um
deles. É comum quando se usa esses recursos que
um algoritmo escolhido inicialmente, venha a ser
substituído por outro que se mostre mais efetivo
à solução do problema em questão.

30
AULA 3

CICLO DE VIDA
DE PROJETOS
DE CIÊNCIA DE
DADOS
INTRODUÇÃO

Assim como em qualquer projeto de Business


Analytics ou Ciência de Dados, precisamos nos
atentar inicialmente a fatores importantes que
podem impactar diretamente o desenvolvimento
dos projetos. Cito aqui, pelo menos, quatro
pontos a serem observados:
• Qual o problema e ou questões estratégicas a
serem resolvidos?
• Qual o objetivo motivador do projeto?
• Quem são os stakeholders e quem é o
patrocinador do projeto.
• Metodologia para Gestão de Projetos. Como
por exemplo PMI, SCRUM entre outras que sejam
consolidadas como boas práticas de mercado.

Para caracterizarmos o nosso trabalho com


projetos de ciência de dados, vamos partir do
princípio que estejamos diante de um problema
de negócio que requer análise de um grande
e complexo volume de dados e que muito
32
provavelmente será necessário a utilização de
com o uso de técnicas, como modelos preditivos,
Inteligência artificial (Machine Learning e Deep
Learning), por exemplo.

O ciclo de vida de projetos de ciência de dados,


está pautado em seis fases e costumamos dizer
que algumas o emprego de todas elas, dependerá
exclusivamente de um fatores - recursos
disponíveis. Nem sempre as empresas possuem
orçamento e porte para o desenvolvimento do
projeto completo. Nesse caso, muitas vezes,
busca-se a solução em uma das etapas que fazem
as demais perder o sentido. De toda forma,
trabalharemos com o cenário ideias com as seis
principais etapas do ciclo de vida de projetos de
ciência de dados:

33
A etapa ENTENDIMENTO DO PROBLEMA, visa
a dedicação da equipe do projeto no sentido de
identificar quais os problemas de negócio a serem
resolvidos. Atenção deve ser dada e exercitada da
seguinte maneira:
• Qual o problema a ser resolvido e qual a sua
importância para a empresa?
• Temos conhecimento de fatos históricos a
respeito?
• Preciso atuar pro-ativamente aos possíveis
acontecimentos e ou cenários futuros?
• Preciso analisar correlações e ou

34
comportamentos de clientes, fornecedores e ou
setores ligados direta ou indiretamente ao meu
segmento de negócio?

Muitos projetos naufragam ou tomam rumos


incorretos por subestimar o entendimento do
problema. Portanto, essas etapas são úteis
também para defendermos se estamos, ou
não, diante de um problema a ser solucionado
utilizando um projeto de ciência de dados.

Após sabermos o(s) problema(s) objeto do


projeto a ser contratado e ou desenvolvido, é
hora de fazermos o mapeamento das origens das
informações (COLETA DE DADOS). Nessa fase
analisamos se os dados possuem origens internas
da empresa, se são dados de domínio público,
se teremos ou não redes sociais como uma das
fontes de dados, se os dados estão estruturados,
semi-estruturados ou não estruturados, se
tratam-se de dados confiáveis.

A etapa COLETA DE DADOS, caracteriza-se pela


identificação da origem das informações, fontes
e características das informações necessárias
à resolução do problema de negócio a ser
resolvido com o projeto em questão, uma análise
exploratória dos dados, para saber o nível de
qualidade e confiabilidade dos dados.

35
Nem sempre precisaremos de todas as
informações disponíveis para resolvermos o
problema em questão. Importante observarmos
que poderemos utilizar dados estruturados e não
estruturados, abordaremos isso nas próximas
aulas.

Sob o ponto de vista da etapa 2 devemos nos


atentar aos seguintes pontos:
• Quais as origens de dados (Sistemas internos
da empresa)
• Faremos utilização de dados de domínio
público como IBGE por exemplo
• Qual o formato dos dados: Estruturado ou Não
Estruturados
• Tratam-se de fontes confiáveis

De posse das etapas anteriores concluídas,


partimos para a etapa de PROCESSAMENTO
E TRATAMENTO DE DADOS que tem como
princípio:
• Pré processamento
• Extração do dado nas origens.
• Preparação (Tratamento, Limpeza,
Padronização)
• Transformação dos dados

36
• Enriquecimento dos dados quando necessário
• Remoção de duplicidade de registos.

A quarta etapa conhecida como EXPLORAÇÃO


DOS DADOS, prevê um estudo com os dados já
processados para saber se temos a solução do
problema em questão, ou se precisaremos de
mais dados para compor o nosso universo de
análise. Nessa etapa temos:
• Geração de relatórios e gráficos
(ainda não exaustivos, apenas para
mostrar os resultados obtidos)
• Cruzamento dados de fontes distintas.
• Simulações diversas

A etapa de ANÁLISE PROFUNDA DOS DADOS,


como já dissemos, é facultativa. Se o problema de
negócio já foi resolvido na etapa de exploração
de dados, ela se faz desnecessária, porém se
o problema se mostra mais complexo, neste
momento poderemos nessa etapa fazer uso de:
• Modelos preditivos
• Machine Learning
• Deep Learning

O Cientista de dados é quem definirá qual


tecnologia mais aderente ao problema.
37
Quando utilizada essa etapa, o trabalho entra
num processo cíclico e podem ser ajustados os
parâmetros e ou variáveis envolvidas para que
tenhamos maior acurácia nos resultados

As etapas de COMUNICAÇÃO DE RESULTADOS


e FEEDBACK, é um dos principais marcos do
projeto, e tem como característica divulgar
os resultados e os seus impactos, seja com o
objetivo de um retorno financeiro e ou melhoria
em processos de negócio, obtidos com o projeto
de ciência de dados é a tarefa demandada nessa
fase.

Dessa forma os resultados devem ser


transmitidos com clareza, objetividade, de forma
direta e ágil. Isso certamente facilitará a vida dos
executivos nos processo decisório empresarial.

Por fim todo projeto precisa ser apresentado,


através de e a etapa de FEEDBACK existe com
essa finalidade, comunicando aos stakeholders os
resultados obtidos.

38
AULA 4

BLOCKCHAIN E
TECNOLOGIAS
DISRUPTIVAS
INTRODUÇÃO

Tecnologia disruptiva (ou inovação disruptiva) é


um termo que descreve a inovação tecnológica,
produto, ou serviço, que provoca uma ruptura
com os padrões estabelecidos ou praticados no
mercado.

A Tecnologia disruptiva vem ganhando destaque


desde 2018 no cenário nacional e internacional e
dá sinais claros de que mudará a nossa forma de
agir, pensar e gerir os negócios.

Vamos conhecê-las?

BLOCKCHAIN
O blockchain surgiu para atender a uma demanda
do sistema financeiro, mas suas aplicações são
muito mais amplas. Ganhou destaque como a
plataforma das criptomoedas, em específico
“Bitcoin”. Mas, Governo, cadeia de suprimentos,
setor de saúde, e tantas outras áreas podem

40
usar e desenvolver a tecnologia com uma ampla
gama de finalidades. Artigos internacionais e
especialistas colocam o blockchain entre as
tecnologias mais disruptivas dos últimos tempos.

De maneira simplista, podemos dizer que o


Blockchain é um banco de dados distribuído
(compartilhado com diversos computadores do
mundo inteiro), onde cada uma das transações
precisam ser validadas em diversos pontos.
Pontos relevantes de sua estrutura:
• Confiabilidade nas operações realizadas
• Transparência e rastreabilidade
• Diversos pontos de validação das operações o
que aumenta o nível de segurança

Fonte: https://portal.tcu.gov.br/imprensa/noticias/tcu-discute-o-
uso-blockchain-em-prestacoes-de-contas-da-ancine.htm

41
SEGURANÇA CIBERNÉTICA
A Segurança Cibernética é uma tecnologia criada
para atuar no combate a crimes digitais, ataques
cibernéticos ou possíveis fraudes em ambientes
digitais em que circulam dados monetários online.

Um dos casos recentes que evidenciam a


importância da segurança cibernética ficou
conhecido como Wannacry. Um código malicioso
conhecido como Wannacry provocou um caos em
diferentes partes do mundo, incluindo o Brasil,
quando sequestrou arquivos em milhares de
computadores e os criptografou. Para recuperar
o acesso aos arquivos em seu estado original, os
hackers pediam um resgate financeiro.

42
Fonte: http://g1.globo.com/tecnologia/blog/seguranca-digital/
post/sequestro-digital-do-wannacry-nao-rouba-dados-entenda-o-
ransomware.html

REALIDADE VIRTUAL
É possível através da Realidade Virtual, recriar
ambientes completos, dando ao usuário a
interatividade necessária como se estivesse
naquele ambiente físico. Muitas indústrias fazem
uso dessa tecnologia, para acelerar treinamentos
com a máxima segurança, reduzindo neste caso
risco de possíveis acidentes.

43
Fonte: https://epocanegocios.globo.com/Caminhos-para-o-futuro/
Energia/noticia/2018/10/realidade-virtual-reduz-risco-e-aumenta-
eficacia-de-treinamentos.html

REALIDADE AUMENTADA:
Através da Realidade aumentada, podemos
através das câmeras de tablets ou smartphones,
e claro os aplicativos disponíveis com essa
tecnologia, visualizar em formato 3D o
equipamento, peças, móveis, no espaço
disponível, com assertividade do ambiente real,
neste caso, dando a segurança nos estudos e ou
operações de compra e venda.

44
Fonte: https://noticias.portaldaindustria.com.br/noticias/educacao/
realidade-aumentada-transforma-ensino-do-senai/

Em nossos materiais auxiliares, podemos ver


exemplos práticos da convergência de tecnologias
como realidade virtual, e aumentada, juntamente
com IOT e Segurança Cibernética que otimizam
situações cirúrgicas no campo da medicina e nos
trabalhos de manutenção de caminhões e carros
(case da VOLVO).

DRONES
O céu não é mais exclusividade de aviões e
helicópteros, os drones ocupam espaço e com
eles podemos atuar precisamente nos locais
físicos (pontos) em que realmente são necessárias
ações. Atualmente forte aliado do agronegócio no
mapeamento do terreno, acompanhamento da
cultura em produção e ou controle de aplicação
de pesticidas.

45
CHATBOTS
Atualmente já falamos ou somos atendidos em
diversos sites de empresas e ou instituições, por
esse tipo de tecnologia. Tem se consolidado a
cada dia e automatiza uma série de atividades
antes desempenhadas por humanos.

Fonte: https://cio.com.br/6-segredos-de-estrategias-para-uso-
chatbots-bem-sucedidas/

46
TECNOLOGIA DE SAÚDE
INTELIGENTE
Tecnologia que permite o monitoramento remoto
de pacientes principalmente com o uso de
“wearables”, que são dispositivos inteligentes,
conhecidos como dispositivos vestíveis. Podem se
enquadrar nessa categoria os relógios e pulseiras
inteligentes, que monitoram frequência cardíaca,
distâncias percorridas, peso, entre outras
informações.

Fonte: https://www.tecmundo.com.br/wearables/117937-samsung-
wearables-dispositivos-vestiveis-realidade-virtual-camera-360.htm

47
AULA 5

ESTRUTURA DE
DADOS PARA
A TOMADA DE
DECISÃO
INTRODUÇÃO

Lidar com dados, é ter em mente que temos


um amplo desafio no sentido de identificar
os tipos e formatos, se os mesmos estão com
qualidade adequada, se faremos ou não uso
de modelos preditivos, se faremos ou não
investimentos em determinada tecnologia ou
banco de dados. Sabemos que o nosso desafio,
independentemente da solução adotada é de
fato gerar informação e conhecimento e levar ao
corpo diretivo das organizações as informações
corretas, no momento correto, para que as
decisões tenham embasamento.

Precisamos no momento de evolução tecnológica


que vivemos, observar que temos tipos
distintos de dados, sendo que cada um com a
sua característica, podem nos ajudar de forma
diferente.

49
TIPOS DE DADOS
Os dados respeitam os propósitos a que se
destinam, para que sejam organizados e
armazenados de forma adequada, precisam ser
classificados:
• ESTRUTURADOS:
Usados para armazenamento de dados de
sistemas corporativos

50
• SEMI ESTRUTURADOS:
Formato xml, exemplo layout de nota fiscal
eletrônica

• NÃO ESTRUTURADOS:
Comentários em redes sociais, no instagram,
twitter e outras mídias sociais (youtube),
laudos ou diagnósticos médicos para exames
de imagem.

Fonte: logotipos extraídos dos sites dos fabricantes dos produtos


relacionados.
51
TIPOS DE BANCO DE DADOS
Assim como os dados têm a sua tipificação,
existem bancos de dados específicos para
armazená-los, segundo o seu formato. Temos
alguns tipos de banco de dados conhecidos
no mercado como: Relacionais, Hierárquicos
e os Não Relacionais. Para esse material,
abordaremos:
• Bancos de dados Relacionais
• Bancos de Dados NoSQL ou não relacionais.
• Surgem as grandes questões:
• Qual banco de dados devo utilizar para o meu
projeto?
• Qual banco de dados é melhor?

Para responder a essas questões devemos antes


saber que tipo de solução é mais adequada
à solução do problema de negócio, que foi o
motivador do projeto. Muitas vezes dentro do
contexto da análise de dados, e as suas soluções
analíticas poderemos concluir que muitas
vezes um projeto de Business Intelligence será
suficiente, em outros casos precisaremos de mais
recursos como Machine Learning, IOT, Big Data.
Neste caso podemos fazer uso de dados não
estruturados e com isso os Bancos de dados Não

52
SQL, têm papel fundamental.

O que devemos saber neste momento é:


• BANCO DE DADOS RELACIONAIS:
Podem ser usados em sistemas transacionais
e ou soluções analíticas que usam dados
estruturados.

• BANCO DE DADOS NÃO RELACIONAIS


(CONHECIDOS COMO NOSQL): são
normalmente utilizados para coleta e ou
processamento de dados no contexto de dados
não estruturados, dessa forma utilizados em
projetos de Big Data.

Fonte: logotipos extraídos dos sites dos fabricantes dos produtos


relacionados.

53
Sabemos que o crescimento dos dados vem
numa exponencial crescente, como vimos
nos capítulos anteriores, e que as empresas,
estão se adaptando aos novos modelos de
armazenamento e de consumo de recursos
de hardware e software, portanto é comum
você ouvir de pessoas da área de tecnologia
da empresas “Estamos trabalhando em cloud
“nuvem”, que significa, estamos contando
com o nosso sistema ocupando espaço em
servidores compartilhados nas nuvens de algum
dos fornecedores: Amazon, Microsoft(Azure),
Google, Oracle). Isso permite às organizações
pagar pelo uso de recursos necessários em
determinados momentos, ou seja, se eu terei
maior processamento em uma determinada
data, pede-se ao fornecedor um escalonamento
de equipamento com características melhores
(memória, processamento e disco), e ao final do
ciclo, volta-se à configuração inicial definida.

Podemos dizer que muito ainda se tem a


crescer nessa área, visto que esbarramos em
termos de nossa legislação que nos impede de
armazenarmos dados em nuvem, pelo risco
da exposição dos dados, no entanto, podemos
dizer que isso é uma quebra de ruptura para
muitas empresas que estão ainda no formato
tradicional, servidores físicos dentro do seu

54
próprio data center.

Seja um banco de dados relacional (SQL), ou não


relacional (NoSql), as empresas possuem em seus
data centers, estruturas para armazenamento
dos dados estruturados ou não, bases de dados
transacionais e ou Informacionais (Bi, BA, Big
Data), para prover informações à empresa.

Não se trata aqui de falarmos qual banco


é melhor: relacional x não relacional, e sim
utilizarmos o banco adequado às nossas
necessidades de negócio, como vimos em nossas
aulas.

55
AULA 6

ROI E ATIVOS
INFORMACIONAIS
INTRODUÇÃO

Conhecemos por ativos, tudo aquilo que


representa algum valor financeiro para as
empresas. O conceito continua válido e assim
fazemos para montarmos os nossos inventários
57
e ou gerarmos a contabilidade da empresa.
Existem no entanto ativos que são tangíveis e
facilmente conseguimos mensurar o seu valor e
ou sua depreciação, outros como por exemplo a
propriedade intelectual, se tornam mais difíceis
de mensurar, nessa categoria estão os ATIVOS
INFORMACIONAIS, que estão nas organizações
e estão diretamente ligados ao que vivemos
atualmente, no que diz respeito à sua utilização e
aos impactos a que estão expostos, em função do
processo de inovação tecnológica.

CONCEITO
Para alguns entende-se por ativos informacionais:
os dados, os softwares e ou aplicativos, bem
como a infraestrutura de TI por onde trafegam
dados. Para outros, entende-se por ativos
informacionais, os dados as informações
que estão nas bases de dados das empresas,
relacionados aos seus clientes, produtos,
fornecedores, bases de conhecimento, entre
outros, excluindo-se os softwares (caracterizados
como ferramentas de acesso, manuseio e
ou armazenamento dos dados), que estão
à disposição das empresas, seja para suas
atividades diárias e rotineiras ou para o seu
processo decisório.

58
Outra definição que podemos também
considerar é que ativo informacional é
uma configuração de pessoas, coisas,
energia, informação, e outras entradas
que tem a capacidade de criar, adquirir,
fornecer, processar, armazenar e disseminar
informação”.
um dos principais benefícios apontados
pelos autores sob essa abordagem foi o
despertar ou incremento da influência
positiva nas percepções de gestão no
tocante à informação, e como resultado
essa passou a ser vista pelos gestores como
geradora de valor ao invés de custo.

OPPENHEIM - STENSON WILSON, 2003a

Não entraremos nesse contexto, já que citamos


em nossa vídeo aula um pouco a respeito e
também citamos a norma ISO 27002, que trata
desse assunto.

Mas os ativos mais importantes das empresas são


os seus dados, as suas informações. Imaginem-
se perdendo a base de dados de Faturas emitidas
aos seus clientes, como a empresa faria sem os
seus recebíveis?

59
CLASSIFICAÇÃO DE ATIVOS
INFORMACIONAIS
De alguma maneira, seria interessante
classificarmos os nossos ativos informacionais
para melhor entendimento de sua utilização e
valor que nos representam:

INFORMAÇÃO DO CLIENTE

INFORMAÇÃO DA CONCORRÊNCIA

INFORMAÇÃO DO PRODUTO

INFORMAÇÃO SOBRE PROCESSOS DO NEGÓCIO

INFORMAÇÃO PARA GESTÃO

GESTÃO DE PESSOAS

INFORMAÇÃO DO FORNECEDOR

LEGAL E REGULAMENTAR

INFORMAÇÃO ORGANIZACIONAL

60
Para nossa reflexão, devemos lembrar que para
manter todos esses tipos de ativos armazenados
em bases de dados, e criarmos uma estrutura
que atenda o dia a dia das empresas em suas
rotinas e ainda permitir que façamos uso
desses dados internos e externos à empresa e
os correlacionarmos, identificarmos padrões, e
fazermos uso disso visando obter vantagens e ou
diferenciais competitivos no segmento em que
atuamos. Sabemos que tudo isso teve um custo
que em algumas etapas aqui citadas. Portanto
o cálculo do ROI sobre os ativos, deve ser feito
diante dos resultados obtidos com os projetos de
natureza analítica ou não.

ROI – RETORNO SOBRE O


INVESTIMENTO
Devemos sempre exercitar algumas perguntas no
momento de calcular o ROI:
• Houve otimização nos processos de negócio?
• Houve redução de custos e ou economia após
a implantação do projeto?
• Aumentamos as nossas receitas ou lucro com o
projeto?

61
• Após isso podemos calcular a relação entre
o dinheiro ganho ou perdido através de um
investimento, e o montante de dinheiro investido,
no projeto em questão através da fórmula:

RECEITA – CUSTO
x 100
CUSTO

62
AULA 7

FERRAMENTAS
DE DATA
ANALYTICS
E BUSINESS
INTELLIGENCE
INTRODUÇÃO

Também conhecidas no mercado pelos


profissionais de TI como ferramentas de
FRONT END. Estamos falando especificamente
de ferramentas que tem como concepção
64
original de desenvolvimento, a apresentação
de informações através de relatórios gráficos,
tabelas, mapas, diagramas entre outros diversos
tipos existentes, seja a partir de uma base de
dados de BI, uma Base exploratória, um Data
Lake e outras estruturas de dados destinadas
à análise com o objetivo de obter insights e ou
tomada de decisão. Muitas vezes esses relatórios
podem ainda estar sem um formato definitivo,
pois passarão pelo crivo de clientes internos
da empresa que devem em primeiro momento
validar se os dados apresentados, fazem sentido,
se estão coerentes ou não. Por fim essas
mesmas ferramentas serão as responsáveis por
apresentar nos painéis executivos, conhecidos
como “dashboards” um conjunto de análises que
servirão de insumos para a alta administração
da empresa ter mais tranquilidade para tomar
decisões e ou ações de curto prazo para a
solução de um determinado foco de problema
e ou potencializar alguma oportunidade que
tenha sido descoberta e ou apresentada nesse
momento.

A partir de agora alguns termos, embora não


queira aqui trazer para o lado muito técnico
do assunto, serão ouvidos por vocês com mais
frequência, e podem não soar mais tão estranhos:

65
FATOS

DIMENSÕES

MÉTRICAS

INDICADORES

KPI’S

São alguns exemplos desses termos.

Devemos relembrar:

Que os aspectos mais importantes nesse


momento de projeto é:
• Ter dados e ou informações confiáveis
• Ter análises com uso de gráficos adequados
• Ter uma política de segurança para o acesso
aos dashboards
• Ter rotinas de atualizações das informações
• A melhor ferramenta é aquela que reproduz as
suas necessidades (requisitos, financeira)

Sempre devemos buscar informações sobre as


melhores ferramentas para ter um forma de
compará-las sobre alguns aspectos como:

66
• Funcionalidades
• Tipos de apresentações que ela traz de forma
nativa
• Estudar alguns tutoriais*
• Realizar provas de conceito (POC) e ou projetos
piloto
• Fazer análise de aderência
• Acompanhar o que dizem os Institutos como
Gartner

MAGIC QUADRANT FOR


ANALYTICS AND BUSINESS
INTELLIGENCE PLATFORMS, 2019

67
Fonte: Gartner “Magic Quadrant for Analytics and Business
Intelligence Platforms.”, 11 de fevereiro de 2019 (G00354763)

* Acesse os sites dos fabricantes que apresentamos. Certamente


tem demos e ou tutoriais gratuitos para estudos lá.

Após a escolha da ferramenta, de posse de


informações confiáveis, podemos iniciar os
trabalhos de desenvolvimento da análises como
as apresentadas na vídeo aula. A Seguir alguns
exemplos de painéis gerados a partir de algumas
ferramentas do quadrante de líderes o Gartner:

68
https://www.tableau.com/solutions/customer/transforming-
healthcare-data-insight-tableau-visual-analytics

https://docs.microsoft.com/pt-br/power-bi/service-get-started

69
https://www.qlik.com/pt-br/solutions/functions/finance

https://www.thoughtspot.com

Considerações para apoiar na escolha das


ferramentas:
• Não olhe somente os líderes no quadrante
• Não olhe somente preços
• Faça análise de aderência
• Faça provas de conceito
70
AULA 08

VISUALIZAÇÃO
DE DADOS
INTRODUÇÃO

Agora que já conhecemos um pouco do poder


das ferramentas de Front End, que nos são úteis
para os projetos de DATA ANALYTICS, precisamos
entender que não podemos selecionar qualquer
tipo de gráfico para apresentarmos as informações
e ao mesmo tempo termos a certeza que o tipo
de visualização escolhida possa transmitir a
informação, sem a necessidade de uma análise e
ou relatório secundário. Em outras palavras, de
nada adianta, criar um gráfico e ou um dashboard
lindo, se ao olhar o gráfico, surge aquela pergunta:
“... e a tabela para eu visualizar os números...” se
isso ocorrer, certamente não fizemos a escolha
correta para apresentar os dados. Um outro
exemplo seria escolher um gráfico de pizza ou
torta (como preferirem), para apresentar um
comparativo de evolução de faturamento de uma
empresa de 24 meses, o ideal nesse caso seria
utilizar gráficos de colunas, barras, linhas e em
alguns casos a combinação de mais de um tipo de
gráfico, no mesmo objeto final.

72
CONCEITO
Podemos dizer que a visualização de dados
é uma representação gráfica de informações
quantitativas, de forma que facilitem a análise e
interpretação das mesmas.

Para o nosso cérebro o processamento das


informações através de imagens, gráficos ou
tabelas é muito mais amigável que relatórios ou
extensas planilhas de dados.

TIPOS DE VISUALIZAÇÃO DE
DADOS
Os tipos mais comuns de visualização de dados,
estão assim classificados:

GRÁFICOS E TABELAS

INFOGRÁFICOS

MAPAS

DIAGRAMAS

73
GRÁFICOS E TABELAS
Existem diversos tipos de visualizações nesta
categoria, muitas vezes desconhecidas pelas
pessoas cito aqui alguns existentes em diversas
ferramentas de visualização:
• Nuvem de palavras
• Gráfico de dispersão (2d ou 3d)
• Mapa de distribuição de pontos
• Treemap ou mapa de árvore
• Gráfico de fluxo
• Gráfico de segmentos
• Gauges ou cockpits

EXEMPLOS DE INFOGRÁFICOS
Através dos infográficos, podemos observar
em uma organização das informações que nos
permite vincular as informações escritas com
as imagens (através dos números em que são
apresentados nas figuras), facilitando o nosso
entendimento.

74
Fonte: https://www.estadao.com.br/infograficos/ciencia,o-que-e-o-
h1n1,563504

O termo Storytelling, passará ser ouvido e


percebido por vocês com maior atenção a partir
de agora, pois a disciplina de visualização de
dados, tem como característica principal, a
preocupação em transmitir um fato, através de
uma narrativa simples que se utiliza de recursos
gráficos e muitas vezes audiovisuais, contando
uma série de acontecimentos em uma linha do
tempo, permitindo que o interlocutor tenha
facilidade de entendimento.

VANTAGENS DO DATA VISUALIZATION:

75
• Geração de análises ad hoc
• Diminui a dependência de ti
• Facilita a interpretação e análise dos dados
• Minimiza versões distintas da mesma
informação
• Centraliza e compartilha informações a
diversos usuários
• Melhora o processo de decisão da empresa

ALGUMAS RECOMENDAÇÕES IMPORTANTES


QUANDO FALAMOS DE VISUALIZAÇÃO DE DADOS:
• Ter habilidades e técnicas de apresentação
• Noções de design
• Ter senso crítico de organização e comunicação
visual
• Criar análises utilizando tipos adequados de
visualização de dados
• Produzir dashboards e gráficos objetivos.
• Preservar a identidade visual da empresa
(cores, logomarcas).

Vale ressaltar que existem diversos livros que


tratam do assunto de data visualization ou
visualização de dados que à medida em que
houver o interesse em se aprofundar no assunto,
vale uma leitura mais detalhada a respeito. Em
nosso material “SAIBA MAIS” tem um livro como
referência.
76
AULA 9

CASOS DE
SUCESSO DE
BIG DATA E
ANALYTICS
INTRODUÇÃO

O Objetivo principal, na apresentação dos casos


de sucesso com o uso de tecnologias analíticas
apresentadas em nossa vídeo aula, foi apenas
para se ter uma idéia de como as tecnologias
78
disruptivas ou não que fazem parte do grande
conceito de ciência de dados, vem se tornando
cada vez mais comuns em nosso dia, seja no
cenário nacional ou internacional. Que possamos
tomar isso como base e fazermos novas consultas
sobre outros casos de sucesso que nos ajudem
a entender um pouco mais sobre o estudo e ou
utilização dos dados para nos auxiliar em nossos
processos decisórios.

Vale ressaltar que alguns casos de sucesso, como


vistos na vídeo-aula, podem se utilizar de mais
de um tipo de ferramenta e ou solução analítica,
porém novamente temos de enfatizar que isso é
perfeitamente normal, pois o objetivo da ciência
de dados é resolver o(s) problema(s) de negócio,
identificados no início do projeto.

ALGUNS DETALHES DOS CASOS DE


SUCESSO

Novo sistema de relacionamento do clube extra.


Voltada para clientes, mas também ligada a
79
fornecedores, utiliza-se do Big Data para :
• criar ofertas
• tentar gerar fidelização à marca.
A informação acima foi pode ser encontrada em https://exame.
abril.com.br/tecnologia/sistema-do-grupo-pao-de-acucar-usa-big-
data-para-fidelizar-clientes/

AGRICULTURA (BIG DATA E


INTELIGÊNCIA ARTIFICIAL)

O objetivo do projeto é ter informações e


recomendações aos produtores sobre:
• qual a melhor data para plantar,
• qual a semente a usar,
• qual a adubação a ser feita,
• elevar a produtividade otimizar a utilização
por metro quadrado plantado
• monitorar a qualidade do plantio,
• antecipação à situações climáticas que podem
causar problema na safra

80
Trago aqui um link, embora já antigo, mas que
nos mostra Rodrigo Santos (em entrevista) da
Monsanto falando sobre o uso das tecnologias
abordadas por nós, e como a empresa na ocasião
pretendia fazer uso das tecnologias em favor do
segmento agrícola.

Acho importante assistirem pelo menos os dez


primeiros minutos da entrevista.
https://descubra.monsanto.com.br/posts/lider-da-monsanto-para-
a-america-do-sul-participa-de-um-programa-no-canal-rural/

LOGÍSTICA (IA, MACHINE LEARNING, IOT


E BIG DATA)

Quando abordamos sobre a UPS, no exemplo


relacionado à logística, notem que a empresa
é de fato pioneira no emprego de tecnologias
disruptivas e investe pesado anualmente nos
desenvolvimentos e ou aquisições de tecnologia
para potencializar os seus negócios globalmente.

81
Além das ferramentas citadas na aula, seguem
mais alguns exemplos do uso das tecnologias pela
empresa:

UPS Bot: CHATBOT - Essa ferramenta habilitada


para Inteligência Artificial imita a conversa
humana e pode responder a perguntas de clientes
como “Onde é o local mais próximo da Trevisan?”
Pode ainda rastrear pacotes e fornecer taxas de
remessa.

UPS My Choice: O sistema gratuito que permite


que clientes residenciais decidam “como, onde e
quando as entregas em domicílio ocorrem”

Autonomous deliveries and drones: A empresa


realizou testes com entregas de suprimentos
essenciais em Ruanda e a demonstração de como
o medicamento pode ser entregue nas ilhas.
Além de utilização para entrega nas zonas rurais
e movimentações de produtos nos seus próprios
armazéns.
https://www.forbes.com/sites/bernardmarr/2018/06/15/the-
brilliant-ways-ups-uses-artificial-intelligence-machine-learning-and-
big-data/#3351ac6d5e6d

82
ENERGIA - DATA MINING

Objetivo do projeto é a detecção e prevenção à


fraudes, projeto trouxe economia de 1,5 milhão
por mês para a companhia.
https://www.forbes.com/sites/bernardmarr/2018/06/15/the-
brilliant-ways-ups-uses-artificial-intelligence-machine-learning-and-
big-data/#3351ac6d5e6d

BIG DATA E IA
A seguir, exemplos do projeto do Ministério de Justiça e Segurança
Pública. São onze produtos a serem entregues ao longo de quatro
anos. Em 2019 foram entregues quatro deles, restando sete para os
próximos anos.

São eles:
• SINESP BIG DATA - já entregue

83
• SINESP GEO INTELIGÊNCIA - já entregue
• SINESP TEMPO REAL - já entregue
• SINESP BUSCA - já entregue
• SINESP CIDADÃO
• SINESP ALERTA
• SINESP AGENTE DE CAMPO
• SINESP CORRUPÇÃO
• SINESP VÍNCULOS
• ALERTA BRASIL 3.0
• SEMINÁRIOS DE TRANSFERÊNCIA.

Sinesp Big Data: Base dos sistemas da Sinesp,


com tecnologias e soluções para execução em
larga escala.

Big Data - Geo inteligência: Possibilidade de


visualizar rotas de policiamento e mapas de calor
com os locais e horários em que mais acontecem
crimes.

Big Data - Tempo real: Monitoramento inteligente


para rápida intervenção, acompanhamento de
ocorrências criminais, detecção por sensores,
câmeras de segurança, viaturas e agentes e
pessoas com restrição de liberdade que fazem
uso de tornozeleiras eletrônicas;

84
Big Data - Busca: Permitirá a busca de
informações em boletins de ocorrência de outros
estados e municípios, além de pesquisas a dados
de pessoas, objetos e documentos.

Abaixo o link para consulta dos demais produtos


constantes no projeto:
https://www.justica.gov.br/news/collective-nitf-
content-1566331890.72

Conhecendo melhor sobre os seus dados, a


empresa pode, a partir de tecnologias, otimizar
processos, aumentar eficiência produtiva,
eliminar focos de fraudes, potencializar
relacionamento, fidelizar clientes ou gerar
economia.

PLATAFORMA DE BLOCKCHAIN

PIER - PLATAFORMA DE INTEGRAÇÃO DE


INFORMAÇÕES DAS ENTIDADES REGULADORAS

O sistema permite que documentos trocados

85
entre bc, susep (superintendência de seguros
privados) e cvm (comissão de valores mobiliários)
possam ser validados de modo muito mais ágil,
segura e confiável.

O projeto do Píer é baseado no Quorum, uma


versão corporativa do Ethereum desenvolvida por
j.p. Morgan
https://computerworld.com.br/2018/06/14/banco-central-usa-
blockchain-como-servico-da-microsoft-para-nova-solucao/

Consulte também o “SAIBA MAIS”


para conhecer cases de de projetos
que contam com a convergência de
mais de uma tecnologia, aplicados à
área da saúde, cadeia de suprimentos,
setor automotivo e um link da principal
fabricante de processadores do mundo
a INTEL, com diversos outros cases de
vários segmentos do mercado. Vale à
pena conferir.

86
AULA 10

GOVERNANÇA
DE TI NAS
ORGANIZAÇÕES
• GOVERNANÇA CORPORATIVA:
é um processo que determina a maneira como
a empresa é administrada, levando em com
consideração os aspectos culturais, políticas e
regulamento interno.

A governança corporativa tem como objetivo


88
principal, passar ao mercado:
—— Confiabilidade,
—— Credibilidade
—— Transparência
—— Ética de seus executivos e alinhamento
estratégico junto aos acionistas, evitando
potenciais fraudes.
• GOVERNANÇA DE TI:
Podemos dizer que a governança de TI é uma
parte da governança corporativa que cuida
especificamente da tecnologia da informação,
no que diz respeito à controle de acesso aos
ativos informacionais e aos resultados obtidos
com as iniciativas, trabalhos e ou projetos sob
a responsabilidade da TI. Cabe dizer que toda e
qualquer iniciativa da TI, deve estar totalmente
alinhada ao planejamento estratégico da
empresa.

Lembrando que, temos de nos atentar a três


pilares importantes:
—— MODELO DE GOVERNANÇA – o modelo
de governança depende do plano
estratégico da empresa.
—— PLANO ESTRATÉGICO – o plano
estratégico é a base para a elaboração do

89
Plano Diretor.
—— PLANO DIRETOR DE TI (PDTI) – o PDTI é
crucial para o modelo de governança de TI

CONTEÚDO DO PLANO DIRETOR


DE INFORMÁTICA
O PDTI deve conter o portfólio de ti da empresa.
Desse modo, o PDTI deve guiar todos os
envolvidos com relação ao que a ti faz – na forma
de projetos ou operações continuadas – bem
como ao que a ti não faz. Em outras palavras, o
PDTI deve indicar os serviços que a ti fornece e
os serviços que ela não fornece. Nesse contexto,
podemos esperar algumas dificuldades típicas no
processo de elaboração do plano.

O PDTI é a documentação final de todo o


processo de governança estudado até aqui.
• METODOLOGIAS: foram criadas para nos dar
apoio para a implantação da Governança de
TI nas empresas. As duas metodologias mais
utilizadas pelo mercado são:

90
Possui um estrutura de relacionamento entre
processos que direcionam e controlam a
organização através de itens como: qualidade de
software e os níveis de segurança da informação.

Os seus quatro processos básicos são:


• Planejamento e Organização: definição de
estratégias, arquitetura, investimentos e riscos
• Aquisição e implementação: definição
e aquisição de soluções, procedimentos,
manutenção e gerência de mudanças
• Entrega e Suporte: níveis de SLA, garantia de
desempenho, custos de serviços, gerência de
dados, problemas e incidentes
• Monitoração: análise de dados para auditoria,
eficiência e acompanhamento de KPIs para
melhoria contínua

91
É baseado na gestão e operação dos recursos de
infra-estrutura e em fornecimento de serviços
no apoio nas necessidades e atividades dos
clientes, medindo a qualidade dos serviços
prestados versus os custos deste serviço e
consequentemente a eficiência do negócio.

Os seus três processos básicos são:


• Gerenciamento de Aplicações: Projeto e
planejamento, implantação, operação, suporte de
software e suporte a usuários.
• Gerenciamento de Serviços: entrega de
serviços e suporte de serviços.
• Gerência de Infra Estrutura de TCI: projeto e
planejamento, implantação, operação e suporte
técnico.

92
• NORMAS INTERNACIONAIS: A Organização
Internacional de Normalização (ISO) e a Comissão
Eletrotécnica Internacional (IEC) publicaram
a norma internacional para a governança
corporativa de tecnologia da informação ISO/
IEC 38500, que tem como objetivo, orientar os
dirigentes de áreas de tecnologia da informação,
os auditores de TI, bem como os profissionais
responsáveis por estruturar, avaliar, gerenciar ou
monitorar o uso da tecnologia das informações
em suas organizações.

A norma NBR ISO/IEC 38500:2009 está


fundamentada em seis princípios aplicáveis a
organizações de qualquer porte.

93
1 RESPONSABILIDADE

2 A ESTRATÉGIA DE NEGÓCIO

3 AS AQUISIÇÕES DE TI

4 DESEMPENHO

5 CONTINUIDADE

6 COMPORTAMENTO HUMANO

O CICLO DE VIDA DA
GOVERNANÇA DE TI
O ciclo deve garantir que a governança de ti
atenda os objetivos esperados pela organização
em quatro áreas-macro, cada uma com seus
respectivos componentes e processos.

94
Alinhamento
estratégico e
compliance

Estrutura, processos, Decisão, compromisso,


operação e gestão priorização e alocação
de recursos

Medição de
desempenho

GERENCIAMENTO DE RISCOS
É a ação de identificá-los e decidir o que
fazer com eles. Os negócios dependem das
informações geradas pelos serviços de TI e
tomada de decisões, ficando mais expostas
aos problemas relacionados a tais serviços. Por
consequência, observamos um aumento na
quantidade e na gravidade dos riscos. Risco não
é certeza de acontecer, não podemos prever
falhas, se bem que hoje dispomos de Inteligência
artificial que pode atuar também nesta área.

95
SEIS PASSOS PARA O
GERENCIAMENTO DE RISCOS

1 IDENTIFICAR – Analisar os processos


identificando possibilidades de falha.

2 PRIORIZAR – Gerar estimativas para que


possam ser priorizados e recursos sejam
alocados na mitigação.

3 PLANEJAR– Desenvolver planos, ações,


e estratégias para o risco analisado,
incorporando-os na rotina da área.

4 RASTREAR E COMUNICAR - Monitorar


o status do risco, comunicar os planos
de ação desenvolvidos, garantindo que o
“staff” esteja ciente do status do risco e
dos planos de ação.

5 CONTROLE - Controlar as alterações


no status do risco que possam afetar
a disponibilidade de um serviço ou
o Service Level Agreement (SLA).

6 APRENDER – Documentar o
conhecimento obtido, elaborando listas
de riscos e categorização.

96
A IMPORTÂNCIA E O PAPEL DA
TECNOLOGIA DA INFORMAÇÃO
• Permeia todos os processos gerenciais e
operacionais das organizações.
• Maior produção e custos menores.
• Tomada de decisões fundamentadas em
informações precisas.
• Melhora o rendimento das empresas em
atendimento ao mercado e ao público-alvo
• Provoca o aumento da prosperidade e da
continuidade da empresa, gerando riquezas para
a sociedade de forma direta ou indireta

97
AULA 11

SEGURANÇA
DE DADOS,
AMEAÇA E
PROTEÇÃO DA
INFORMAÇÃO
INTRODUÇÃO

Embora já tenhamos dito em aulas anteriores que


o principal ativo das empresas são os dados, as
informações e o conhecimento, muitas vezes nos
questionamos se de fato isso é verdade, uma vez
que muitas empresas tem como “core business”,
99
atividades produtivas, comercialização e ou
prestação de serviços.

Imagine uma empresa que trabalha com pesquisa


e desenvolvimento, por exemplo. Já nos demos
conta do volume de informações que ela gera?
E se perdêssemos esses dados, informações
ou conhecimentos envolvidos, certamente
poderíamos jogar fora além de todo o esforço
humano, altos valores investidos sem que a
conclusão do projeto tenha sido alcançada.

Para facilitar o entendimento, relaciona isso ao


desenvolvimento de um novo medicamento.
Quantos anos de pesquisa, testes e investimentos
são destinados à projetos desta natureza?

Diante deste cenário hipotético, devemos


nos preparar para possíveis brechas ou
vulnerabilidades que podem colocar em
risco todos os resultados obtidos durante o
desenvolvimento do projeto. Se levarmos para
o campo financeiro, imaginem um banco com o
mínimo ou nenhuma segurança cibernética... um
verdadeiro estrago poderia ser causado... vocês
já devem imaginar o caos que seria? Para nos
protegermos de situações como essas, vamos
entender como está fundamentada e estruturada
a Segurança da Informação.

100
CONCEITO
SEGURANÇA DA INFORMAÇÃO: tem como
objetivo preservar os dados das empresas de
possíveis ataques, utilizando-se de técnicas e
ferramentas que nos permitem realizar essa
proteção que irá minimizar os riscos de possíveis
ataques, sejam eles internos ou externos.

Os pilares que norteiam a segurança da


informação são:
• CONFIDENCIALIDADE: o conteúdo só pode
ser visto, consultado, impresso, por pessoas
autorizadas.
• INTEGRIDADE: a informação deve ser íntegra,
sem alterações indevidas, desde a sua geração até
o local de acesso.
• DISPONIBILIDADE: garantir que a informação
esteja disponível para acesso quando necessário.

Algumas considerações que precisamos fazer em


relação aos pilares, quando da sua implantação,
diz respeito à:
• VULNERABILIDADE: existe algum ponto fraco
ou falho que coloque em risco algum dos pilares?
• Diante da vulnerabilidade identificada,
quais as potenciais AMEAÇAS QUE ESTAMOS

101
EXPOSTOS?
• Quais as PROVÁVEIS CHANCES de uma
vulnerabilidade ser aproveitada por indivíduos em
ATAQUES CIBERNÉTICOS?
• Que AÇÕES PREVENTIVAS estamos fazendo
para MINIMIZAR OS RISCOS E OU IMPACTOS
desses prováveis ataques?

TIPOS DE ATAQUES
A todo momento devemos nos preocupar se
temos alguma vulnerabilidade que possa expor
os dados das empresas a possíveis ataques e de
posse das informações, agirmos preventivamente.

LINK MALICIOSO: Links para sites criados com


propósito malicioso, como enganar o usuário
ou roubar informações. Contemplam golpes de
phishing, publicidade suspeita, notícias falsas,
sites com malware etc.

MALWARE: Todos os softwares que contêm um


código malicioso, como vírus, trojan ou worm.

PHISHING: Armadilhas criadas para induzir o


usuário a compartilhar seus dados pessoais ou
financeiros, como senhas, número de celular e
dados do cartão de crédito.

102
NOTÍCIAS FALSAS: Armadilhas criadas para
induzir o usuário a compartilhar seus dados
pessoais ou financeiros, como senhas, número de
celular e dados do cartão de crédito.

RAMSOMWARE: é um tipo de MALWARE que


sequestra virtualmente o computador e exige
um pagamento de resgate para ter novamente o
controle do mesmo e das informações.

ATORES ENVOLVIDOS
Como falamos em nossa aula, os atores
envolvidos nos ataques são:

HACKER: Aquele que acessa um dispositivo,


software ou rede de computadores de forma
ilegal ou sem autorização.

SCAMMER: Alguém que finge ser um usuário


legítimo de uma plataforma para convencer
outras pessoas a enviar dinheiro, informações
pessoais ou financeiras e a instalar arquivos
maliciosos.

SPAMMER: Aquele que é responsável por


desenvolver um software ou por enviar um
enorme número de e-mails com propósito
malicioso, como golpes de phishing ou malware.

103
MECANISMOS DE DEFESA
Aqui devemos agrupar as ações, uso de técnicas
e ou ferramentas que visam preservar as
informações das empresas dos possíveis ataques
internos e ou externos, em controle físico ou
lógico.

CONTROLE FÍSICO: que está relacionado à


equipamentos e infra-estrutura como um todo

CONTROLE LÓGICO: uso de softwares capazes


criptografar dados, softwares de detecção à
intrusão, firewall, filtros antispam, antivírus.

104
DADOS DO RELATÓRIO
DA SEGURANÇA DIGITAL
NO BRASIL - 2018

TERCEIRO TRIMESTRE TEM


QUEDA DE CIBERATAQUES E
CRESCIMENTO DE FAKE NEWS

TOP 3 CATEGORIAS
DETECTADAS NO 3º TRIMESTRE

105
LINKS MALICIOSOS
POR REGIÃO

1 em cada 4 pessoas
do Sudeste foi
potencialmente
vítima de
ciberataques*

Norte: 6,3%
Norte: 6,3%
2.471.173

Nordeste: 25,7%
Nordeste: 25,7%
10.145.818

Centro-Oeste: 6,9%
Centro-Oeste: 6,9%
2.713.495

Sudeste: 50%
Sudeste: 50%
19.753.656

Sul:
Sul:11,2%
11,2%
4.435.747
4.435.747

*Cálculo realizado com base no número de detec-


ções do dfndr lab no período e o total de habitan-
tes da região divulgado pelo Instituto Brasileiro de
Geografia e Estatística (IBGE).
106
NOTÍCIAS FALSAS

107
PRINCIPAIS CATEGORIAS
DE LINKS MALICIOSOS

*Golpe do SMS pago; Phishing de perfil falso; Genérico; Phishing


de redes sociais;

Relatório da Segurança Digital no Brasil


Terceiro trimestre – 2018 – DFNRLAB
https://www.psafe.com/dfndr-lab/wp-content/uploads/2018/11/
dfndr-lab-Relat%C3%B3rio-da-Seguran%C3%A7a-Digital-no-Bra-
sil-3%C2%BA-trimestre-de-2018-1.pdf

108
AULA 12

ÉTICA NO USO
DOS DADOS E
LEGISLAÇÃO
APLICÁVEL
A DADOS
PÚBLICOS E
PRIVADOS
INTRODUÇÃO

Alguns de vocês devem estar se perguntando o


que a LGPD (Lei Geral de Proteção de Dados) tem
a ver com o que estamos estudando na disciplina
de Analytics. Bom como o objeto do nosso estudo
110
tem como insumo principal os dados, estamos
diretamente impactados pela legislação em
nosso país e se estivermos atuando em empresas
multinacionais, certamente teremos também de
nos adequar às leis de mesma natureza e que
estejam vigentes nos países em que se encontram
as suas matrizes e ou filiais.

Agora que já temos conhecimento sobre o que


são: Governança Corporativa e Governança de
TI, surge uma terceira e não menos importante
Governança que deve nos orientar para que
estejamos em conformidade com as regras e
normas internas da organização e também da
LGPD. Estamos falando da Governança de Dados.

LEI Nº13709 DE AGOSTO DE 2018


Art. 1º Esta Lei dispõe sobre o tratamento de
dados pessoais, inclusive nos meios digitais,
por pessoa natural ou por pessoa jurídica de
direito público ou privado, com o objetivo de
proteger os direitos fundamentais de liberdade
e de privacidade e o livre desenvolvimento da
personalidade da pessoa natural.

A lei se aplica a todos os segmentos da sociedade,


independentemente do porte das empresas, que
devem se adequar para evitar as penalizações
111
que podem chegar a até 2% (dois por cento
do faturamento, limitados ao valor de R$ 50
milhões), que serão fiscalizados de perto pela
ANPD (Agência Nacional de Proteção de Dados).

OS PRINCÍPIOS DA LEI :

Respeito à privacidade

Liberdade

Livre iniciativa e defesa


do consumidor

Inviolabilidade da intimidade,
da honra e da imagem

112
PORQUE SOMOS IMPACTADOS:

Na lei existem regras que vão desde a coleta e


tratamento de informações de pessoas, empresas
e instituições públicas, até os direitos de titulares
de dados, as responsabilidades de quem processa
esses registros e as estruturas e formas de
fiscalização, e o armazenamento ou apropriação
dos dados sem a devida autorização dos seus
verdadeiros donos.

CLASSIFICAÇÃO DOS DADOS SEGUNDO


A LEI:
• DADO PESSOAL: dado relacionado a pessoa
natural (pessoa física) e identificável
• DADO PESSOAL SENSÍVEL: qualquer dado
vinculado a pessoa natural e que esteja
relacionado a:
—— Etnia,
—— Saúde ou vida sexual,
—— Convicção religião,
—— Opinião política,
—— Genético ou biométrico
• DADO ANONIMIZADO: relativo ao titular que
não possa ser identificado.
113
Notem que as empresas de alguma maneira,
deverão se adequar à forma como coletam
informações, pois, por exemplo, nenhuma das
perguntas feitas ao cliente podem o levar a
entender que está sendo direta ou indiretamente
discriminado.

Se falarmos especificamente do último tipo de


dado: ANONIMIZADO, ainda em se tratando de
Ciência de Dados, este deverá ser o nosso grande
compromisso, quando deveremos descaracterizar
ou desvincular o dado em questão, da pessoa
que é a dona do mesmo. Isso garantirá que
estaremos preservando os dados originais da
pessoa em questão. Assim poderemos fazer uso
de diversas tecnologias para o nosso estudo
de análise exploratória, descoberta de dados,
inteligência artificial, sem que estejamos expostos
às penalizações previstas na LGPD.

Porém ele somente será considerado


anonimizado se, pelas etapas pelas quais passar,
não permitir a quem estiver o utilizando a
reconstrução de uma trilha que o leve ao dado
original da pessoa.

Para a LGPD, se conseguirmos chegar ao


dado original, o dado não é anônimo, e sim
simplesmente um dado, portanto estará sujeito às
penalizações pela ANPD.
114
Devemos citar que temos também diversos perfis
envolvidos no manuseio da informação, citamos
aqui alguns deles:

TITULAR: pessoa natural a quem se referem os


dados pessoais que são objeto de tratamento

CONTROLADOR: pessoa natural ou jurídica, de


direito público ou privado, a quem competem
as decisões referentes ao tratamento de dados
pessoais;

OPERADOR: pessoa natural ou jurídica, de direito


público ou privado, que realiza o tratamento de
dados pessoais em nome do controlador;

ENCARREGADO: pessoa indicada pelo


controlador e operador para atuar como canal de
comunicação entre o controlador, os titulares dos
dados e a Autoridade Nacional de Proteção de
Dados (ANPD).

AGENTE DE TRATAMENTO: o controlador e o


operador.

Como você pode observar, temos seja nas


empresas privadas e ou instituições públicas,
sempre um volume de dados que deverão ter o
consentimento dos seus verdadeiros donos, os
titulares (uma atenção aos dados de crianças e

115
adolescentes que deverão ter o consentimento
dos pais para a coleta dos dados), para que
possamos fazer o devido uso, sem ferir a sua
integridade e sem violar os princípios básicos
da lei que entrará em vigor em 2020. Assim
como a ANPD, as organizações e as instituições
públicas devem, caso ainda não tenham, criar
uma equipe que fará a gestão e governança dos
dados, assegurando assim que os dados tenham
qualidade, sejam rastreáveis, tenham controles de
acessos e compartilhamento, em determinadas
situações passem pelo processo que os tornem
anonimizados.

A equipe de Governança de dados poderá


assumir a responsabilidade também de DPO(Data
Protection Officer, que pode ser um Comitê que
analisará os procedimentos internos no que
diz respeito à Segurança da Informação e um
dos profissionais deverá atuar para que a LGPD
esteja sendo atendida. Muitas empresas já estão
contratando assessoria externa (escritórios
advocatícios) para realizar o trabalho de forma
conjunta.

Importante ressaltar que se a sua empresa utiliza


dados pessoais apenas para fins acadêmicos,
artísticos e ou jornalísticos sem fins econômicos,
ela NÃO ESTARÁ SUJEITA à LGPD.

116
UM BOM INÍCIO PARA SABER SE
ESTAMOS NO CAMINHO PARA CUMPRIR
AS REGRAS DA LEI:
• Procure saber qual a trilha dos dados dentro
da empresa, desde a sua coleta até a real
finalidade de utilização dos mesmos, sejam dados
de funcionários, clientes ou fornecedores.
• Verifique se os princípios de segurança da
informação foram implantados, nos meios em
que os dados estão armazenados.
• Faça um mapa das pessoas que lidam com os
dados e dê treinamento sobre a LGPD, para que
saibam os riscos de vazamentos e uso indevidos
das informações.
• Observar os princípios da boa-fé e da
finalidade específica – o tratamento deve ter
propósitos legítimos, adequação e necessidade,
sendo via de regra necessário o consentimento
expresso do titular.
• Contar com um profissional ou consultoria
externa que oriente às possíveis mudanças e
adequações da lei.

Muitas empresas como por exemplo as empresas


de telefonia, possuem dados sensíveis, de pessoa
natural de milhões de clientes e certamente são
assediadas a passar informações para outros
117
segmentos que desejam fazer campanhas de
marketing para ofertar seus produtos.

De posse dessas informações e por advento da


LGPD, é permitido a monetização dos dados,
desde que os mesmos sejam anonimizados, ou
seja, não possam através de um processo de
rastreabilidade dos mesmos, conseguir identificar
uma pessoa natural.

As empresas de telefonia, poderiam questionar


qual o perfil de cliente as empresas estão
buscando e através de uma análise em suas bases
de dados as empresas de telefonia, venderem
as seguintes informações: Esse perfil de cliente,
tem maior e menor concentrado nas regiões X
e Y, possuem os hábitos de compra..., porém o
maior poder aquisitivo está concentrado neste
perfil da região Z, e de posse das informações,
os interessados (empresas que comprarem
as pesquisas), decidirão como conduzir suas
campanhas e estratégias de marketing.

118

Você também pode gostar