Você está na página 1de 61

Aula 3 - Inteligência Artificial e Novas Tecnologias Exponenciais - Dados

Prof. Patricia Sodre


O que é a computação na nuvem?
A computação em nuvem pode ser definida como um sistema tecnológico que permite o uso de
serviços e programas sem a necessidade exata de estar instalado no computador. O ponto de
partida é ter uma conexão de internet para ter tudo disponível através de algum serviço de
nuvem.

Com o serviço de computação em nuvem é possível utilizar ferramentas e salvar todo e


qualquer tipo de arquivo, desde que esteja conectado à internet. O principal exemplo de
ferramenta para cloud computing do Google Docs, lá é possível editar, adicionar, remover e
inserir arquivos, do leve ao mais pesado, apenas com uma conexão.
Benefícios
Reduçao de custos
Por mais desafiador que possa parecer, existem muitas operações que já estão na relação do
departamento de TI há algum tempo.
Trata-se do uso de tecnologias, equipamentos e até de parceiros especializados para otimizar os
processos e consequentemente possibilitar a redução de custos de TI.

Quando se fala em custos de TI, é impossível não lembrar imediatamente da infraestrutura necessária
para manter um data center e todos os serviços que a empresa necessita.
Com cloud computing, os custos com essa infraestrutura são do provedor, que foca nesse tipo de
serviço e oferece escalabilidade, segurança e solidez para os serviços prestados.
Conceito
Dados
O que são dados?

Dados são observações documentadas ou resultados da medição. A


disponibilidade dos dados oferece oportunidades para a obtenção de
informações.

Os dados podem ser obtidos pela percepção através dos sentidos (por


exemplo observação) ou pela execução de um processo de medição
O que é
informação
Informação é a reunião ou o
conjunto de dados e conhecimentos
organizados, que possam constituir
referências sobre um determinado
acontecimento, fato ou
fenômeno. ...

Ela também permite resolver


problemas e tomar decisões, com
base no uso racional deste
conhecimento adquirido através
dela.
KPI´s X Métricas
KPI - Indicador que tem importância estratégica para acompanhamento de um negócio ou objetivo

•Taxa de rotatividade (taxa de rotatividade)


•NPS
•Duração da sessão
•Custo de aquisição do cliente (CAC)
•Valor vitalício do cliente

Métrica - Algo que pode ser medido, mas não precisa ser estratégico. Métricas são medidas quantificáveis usadas
para analisar o resultado de um processo, ação ou estratégia específica. 

•Ticket médio
•Lifetime Value
•Taxa de conversão
•Taxa de vendas
•Tráfego no site
OKR
OKR significa Objective and Key Results (Objetivos e Resultados Chave, em uma tradução livre).
Essencialmente, o sistema OKR estabelece um direcionamento claro, para gerar alinhamento na empresa
inteira e fornece um meio de medir os  resultados, para ver se estamos caminhando na direção correta.

O: Os usuários amam nosso Produto! 


KR1: Aumentar o NPS em 10 pontos percentuais até o final do trimestre
KR2: Aumentar a nota do aplicativo Android de 4 para 4.5 no Google Play 
KR3: Conseguir ao menos 20 depoimentos em vídeo
Os dados pela história
Um pouco de História
- Guerras

O papel da inteligência na definição dos


conflitos tem aumentado ao longo do
tempo, tanto em seu aspecto estratégico,
quanto em seu aspecto investigativo. Isso
pode ser identificado a partir de uma análise
da evolução da inteligência nos conflitos
ocorridos na segunda metade do século XX e
na primeira década do século XXI. Durante a
Segunda Guerra Mundial, o aspecto
estratégico preponderou sobre o
investigativo
Um pouco de História –
Os maias

Enquanto estiveram no auge, entre os anos 200 d.C. e 900 d.C, os


maias foram uma das civilizações mais avançadas do planeta. Sua
astronomia e sua matemática, em alguns aspectos.

No ano 325, eles já dominavam o conceito de zero, coisa que os


europeus só descobriram e começaram a usar cerca de 700 anos
depois. Em várias cidades maias, como Palenque, Sayil e Chichén
Itzá...

Os maias registraram que o Sol completa seu ciclo em 365,2420


dias, enquanto que na atualidade esse número está definido em
365,2422.
Alfabetização de dados ou literacia de dados é a
capacidade de ler, gerenciar, analisar e
Data Literacy, argumentar por meio de dados. Assim como a
o que é? alfabetização como um conceito geral, a
alfabetização em dados concentra-se nas
competências envolvidas no trabalho com dados. 
Cultura Data-
Driven
Cultura Data-Driven
O conceito da tomada de decisão baseada em dados:
É um processo que envolve a coleta de informações com base em
indicadores mensuráveis, analisando padrões e fatos desses insights e
utilizando-os para desenvolver estratégias e ações operacionais que
beneficiam os negócios em várias áreas.

O data driven business é uma forma de analisar e agir


nos negócios com base em dados, principalmente no que
diz respeito à inteligência corporativa. A metodologia
prega o cruzamento de informações para que se faça
uma análise preditiva mais eficaz.
Dados de Mercado – (Inteligência)
https://www.kaggle.com/tags/brazil

https://dados.gov.br/

https://www.ibge.gov.br/estatisticas/downloads-estatisticas.html

http://www.ipeadata.gov.br/

http://dados.cvm.gov.br/

https://brightdata.com/

https://datasetsearch.research.google.com/

https://earthdata.nasa.gov/

https://ourworldindata.org/
Dados <> Análises

https://www.thinkwithgoogle.com/
Projeto de Dados Projeto de Dados
Ciclo de Vida

Papéis:

Gerente de Projetos/PO

Analista de Negócio
Engenheiro de Dados
Desenvolvedor Front-End

Ciência de Dados
Data Analytics
História do BI
Ralph Kimball

Ralph Kimball (nascido em 1944) é um autor no assunto


de armazenamento de dados e inteligência de
negócios . Ele é um dos arquitetos originais do data
warehouse e é conhecido por suas convicções de longo
prazo de que os data warehouses devem ser projetados
para serem compreensíveis e rápidos.

https://www.kimballgroup.com/
Como
Podemos pensar na normalização como um estado (ou situação) do
banco de dados: se todas as tabelas desse banco estão normalizadas,
então o banco está normalizado. Nesse sentido, o estado inverso à
funciona? normalização é chamado de desnormalização, no qual uma ou mais
tabelas do modelo lógico do banco de dados.
Quais são os tipos de modelos?
Como funciona?
Denormalizar as tabelas de um banco de dados relacional
tem como objetivo prevenir o aparecimento de certas
dependências (dependências funcionais não-triviais,
parciais, transitivas, multivaloradas ou de junção) 

O modelo normalizado
diagrama abaixo apresenta um modelo normalizado, com três tabelas que possuem relações entre si:

                      
O modelo normalizado
diagrama abaixo apresenta um modelo normalizado, com três tabelas que possuem relações entre si:

                      
Trabalhando com a redundância controlada
A figura 3 apresenta o mesmo modelo da figura 1, no entanto, com a adição de atributos redundantes nas entidades “cidade” e “cliente”.

                  
Modelagem Multidimensional
Modelagem Multidimensional

O Data Warehouse (DW) é uma tecnologia que pode ser implementada em sistemas de banco de
dados tradicionais e é atualmente o grande alicerce da solução de Business Intelligence (BI). Mas,
para a adequada estruturação e desempenho, o DW deverá ser modelado seguindo os preceitos
da modelagem multidimensional.

A modelagem multidimensional, ou dimensional como às vezes é chamada, é a técnica de


modelagem de banco de dados para o auxílio às consultas do Data Warehouse nas mais
diferentes perspectivas. A visão multidimensional permite o uso mais intuitivo para o
processamento analítico pelas ferramentas OLAP (On-line Analytical Processing).
Modelagem Multidimensional
As Dimensões são os descritores As Fatos contém as métricas. Possui o caráter
dos dados oriundos da Fato. quantitativo das informações descritivas
Possui o caráter qualitativo da armazenadas nas Dimensões. É onde estão
informação e relacionamento de armazenadas as ocorrências do negócio e possui
“um para muitos” com a tabela relacionamento de “muitos para um” com as tabelas
Fato. É a Dimensão que permite periféricas (Dimensão).
a visualização das informações
por diversos aspectos e A modelagem dimensional possui dois modelos: o
perspectivas. modelo estrela (star schema) e o modelo floco de
neve (snow flake). Cada um com aplicabilidade
diferente a depender da especificidade do
problema. As Dimensões do modelo estrela são
desnormalizados, ao contrário do snow flake, que
parcialmente possui normalização.
Modelagem Multidimensional
Modelagem Multidimensional
Big Data
O que é Big Data?
Big data é um conjunto de dados maior e mais complexo,
especialmente de novas fontes de dados. Esses
conjuntos de dados são tão volumosos que o software
tradicional de processamento de dados simplesmente não
consegue gerenciá-los.

O Big Data consegue gerar dados com grandes


variedades, uma vez que tem acesso a diversas fontes.
Essas fontes de dados são os locais em que as
informações são armazenadas, logo, Google, Analytics,
Facebook, Instagram e WhatsApp fazem parte dessa
definição.
Data Lake
O data lake é um tipo de repositório que armazena conjuntos grandes e variados de
dados brutos em formato nativo. ... Quando dizemos que os dados são brutos, é
porque eles ainda não foram processados para uma finalidade específica. Os dados
em um data lake são definidos só depois de serem consultados.
Refined Zone
Os dados na zona refinada
são agrupados em Subject Area
Marts (SAMs, geralmente chamados
de data marts). Um gerente de
departamento procurando por
números de fim de mês consultaria
um SAM em vez do EDW. ... Dados
refinados são usados ​por um amplo
grupo de pessoas, mas ainda não
são abençoados por todos na
organização
Ciência de Dados
Data Science ou Ciência de
Dados é um estudo muito
disciplinado com relação
aos dados e demais
informações inerentes à
empresa e as visões que
cercam um determinado
assunto. Em resumo é
uma ciência que visa estudar
as informações, seu processo
de captura, transformação,
geração e, posteriormente,
análise de dados.
DataViz
Dataviz
Data visualization, ou visualização de dados, é algo que
existe há séculos, desde os tempos em que os humanos
usavam desenhos em cavernas como uma forma de
comunicação até os dias de hoje, quando os profissionais de
marketing os usam para a tomada de decisões.
Visualizar imagens e formas e chegar a conclusões é como
operamos ao olharmos para alguma coisa. Assim, o processo
de data visualization é muito natural.
Como surgiu a visualização de dados?

Da forma como a conhecemos, a visualização de dados existe há muito tempo. No século 18, um estatístico,
chamado William Playfair, havia inventado as formas que estamos usando com tanta frequência hoje em
dia. Ele é o criador do gráfico de linhas, do gráfico de barras, do já mencionado gráfico de pizza e do
gráfico de círculos.

Durante o século 19, um dos melhores exemplos que aparecem é o gráfico de John Snow, que foi quem
mapeou o surto de cólera em 1854. Antes disso, em 1812, Charles Joseph Minard mapeou a Marcha de
Napoleão para a Rússia, representando sua jornada em um gráfico com características diferentes, como
temperatura e número de soldados restantes em cada local.

Tudo começou a mudar quando aconteceu a Revolução Industrial, e as pessoas também começaram a usar
estatísticas por razões comerciais.

Mais tarde, os computadores entraram em cena. A partir disso, os estatísticos poderiam finalmente acessar
grandes volumes de informação rapidamente. Além disso, eles descobriram o poder de processar grandes
conjuntos de dados e criar estatísticas baseadas nisso.
Ferramentas de
DataViz
Proteção de Dados

Você também pode gostar