Você está na página 1de 241

Formação Cientista de Dados

Módulo 1

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos

Seja Bem-Vindo

Data Science Academy


www.datascienceacademy.com.br

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos

O que é a Formação Cientista de Dados?

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos

Cursos 100% Online


24 horas por dia / 7 dias por semana

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos

A Formação é composta de 6 cursos

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos
Formação composta de 6 cursos

• Big Data Analytics com R e Microsoft Azure Machine Learning


• Big Data Real-Time Analytics com Python e Spark
• Engenharia de Dados com Hadoop
• Machine Learning
• Business Analytics
• Visualização de Dados e Construção de Dashboards

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos

Big Data Analytics com R e Microsoft Azure Machine Learning

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos
Big Data Analytics com R e Microsoft Azure Machine Learning

Azure
Linguagem Machine
Estatística Machine
R Learning
Capítulo Learning
Capítulos Capítulo
6 Capítulos
2, 3 , 4, e 5 7
8, 9, 10 e 11

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos

Big Data Real-Time Analytics com Python e Spark

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos
Big Data Real-Time Analytics com Python e Spark

Análise de
Machine Apache
Dados com Estatística
Learning Spark
Python Capítulo
Capítulo Capítulos
Capítulos 4
5 6, 7, 8 e 9
2e3

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos

Engenharia de Dados com Hadoop

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos
Engenharia de Dados com Hadoop

Armazena
Cluster Machine Hadoop e
mento de
Hadoop Learning Spark
Dados
Capítulos Capítulo Capítulo
Capítulos
2, 3 e 4 8 9
5, 6 e 7

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos

Machine Learning

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos

Estatística e

Machine Learning
Matemática

Árvores de
Decisão

Nearest
Regressão e
Neighbours
Classificação
- KNN

Redes
K-Means
Neurais

Support
Deep
Vector Naive Bayes
Learning
Machines

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos

Business Analytics

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos
Business Analytics

Marketing Financial
RH Analytics
Analytics Analytics

Social Network
Fraud Analytics Text Analytics
Analytics

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos

Visualização de Dados e Construção de Dashboards

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos
Visualização de Dados e Construção de Dashboards

SAS Visual Métodos de


Analytics Visualização

Organização
Tableau
Visual

Design de
R e Python
Dashboards

D3.js

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos
Em todos os cursos

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos
Em todos os cursos

• Módulo Introdução (Capítulo 1)


• Projetos (25)
• Projeto Final (1)
• Quizzes e Exercícios
• Avaliação Final (50 questões)
• Fórum Exclusivo

www.datascienceacademy.com.br
Projetos
R Fundamentos

Projetos

www.datascienceacademy.com.br
Projeto Final
R Fundamentos

Projeto Final

www.datascienceacademy.com.br
Projeto Final
R Fundamentos

Projeto Final

www.datascienceacademy.com.br
Certificado
R Fundamentos

Certificado

www.datascienceacademy.com.br
Projeto Startup
R Fundamentos

Projeto Startup

www.datascienceacademy.com.br
Carreira
R Fundamentos

Preparação para a
Carreira de
Cientista de Dados

www.datascienceacademy.com.br
Recomendação
R Fundamentos
Pré-requisitos (Recomendação)

• Introdução à Ciência de Dados


• Big Data Fundamentos
• Python Fundamentos para Análise de Dados

www.datascienceacademy.com.br
Formação Cientista de Dados
R Fundamentos

Muito Obrigado!

www.datascienceacademy.com.br
R Fundamentos

Big Data Analytics com R e Microsoft Azure


Machine Learning

www.datascienceacademy.com.br
R Fundamentos
Como este curso está dividido?

www.datascienceacademy.com.br
R Fundamentos
Como este curso está dividido?

Parte 1 Parte 2
Linguagem R Estatística
Capítulos 2, 3, 4, 5 Capítulo 6

Parte 3 Parte 4
Machine Learning Azure ML
Capítulo 7 Capítulos 8, 9, 10

www.datascienceacademy.com.br
R Fundamentos

O que esperar deste curso?

www.datascienceacademy.com.br
R Fundamentos
O que esperar deste curso?

• Praticidade

www.datascienceacademy.com.br
R Fundamentos
O que esperar deste curso?

• Praticidade
• Dinamismo

www.datascienceacademy.com.br
R Fundamentos
O que esperar deste curso?

• Praticidade
• Dinamismo
• Muito Conteúdo

www.datascienceacademy.com.br
R Fundamentos
O que esperar deste curso?

• Praticidade
• Dinamismo
• Muito Conteúdo
• Alguns Conceitos Avançados

www.datascienceacademy.com.br
R Fundamentos
O que esperar deste curso?

• Praticidade
• Dinamismo
• Muito Conteúdo
• Alguns Conceitos Avançados
• Objetividade

www.datascienceacademy.com.br
R Fundamentos

O que NÃO esperar deste curso?

www.datascienceacademy.com.br
R Fundamentos
O que NÃO esperar deste curso?

• Este não é um curso só de Estatística


• Comprovar Modelos com Fórmulas Matemáticas
• Não teremos aqui conteúdo de Inteligência Artificial

www.datascienceacademy.com.br
R Fundamentos

Quizzes e Exercícios

www.datascienceacademy.com.br
R Fundamentos

Scripts

www.datascienceacademy.com.br
R Fundamentos
Projetos

Projeto 1 - Análise de Redes Sociais


Projeto 2 - Prevendo a Ocorrência de Câncer
Projeto 3 - Prevendo Despesas Hospitalares
Projeto 4 - Prevendo o Faturamento de uma Rede de Restaurantes
Projeto 5 - Análise de Risco de Crédito

www.datascienceacademy.com.br
R Fundamentos

A orientação sobre cada projeto será publicada


em uma semana e a solução apresentada na
semana seguinte

www.datascienceacademy.com.br
R Fundamentos

Avaliação Final

50 questões – 2 tentativas – 70% - 12 meses

www.datascienceacademy.com.br
R Fundamentos

Bonus

Oracle R Enterprise
Microsoft R

www.datascienceacademy.com.br
R Fundamentos

E como deve ser sua abordagem neste curso

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos
E como deve ser sua abordagem neste curso

Comunique-se
Crie os scripts
8 horas de
dedicação por
semana

www.datascienceacademy.com.br
R Fundamentos

Como se conectar com a


comunidade Data Science?

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

• Users of R Statistical Package


• R Brasil – Programadores
• Big Data Brasil
• Windows Azure – Comunidade Azure
• Estatística Brasil

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

A Carreira de Cientista de Dados

www.datascienceacademy.com.br
R Fundamentos

O avanço e o maior acesso à tecnologia geram um volume


imenso de dados que podem indicar oportunidades de negócio
para as empresas dispostas a analisá-los

www.datascienceacademy.com.br
R Fundamentos

A função cabe ao Cientista de Dados, carreira listada pelo Fórum


Econômico Mundial como uma das mais relevantes para o
mercado até 2025

www.datascienceacademy.com.br
R Fundamentos

Carreira recente, a demanda por Cientista de Dados cresce à


sombra do cenário americano, onde esta já é a profissão mais bem
remunerada pelo segundo ano consecutivo

www.datascienceacademy.com.br
R Fundamentos

“O mercado brasileiro já demanda um bom volume de profissionais,


maior até do que a quantidade de pessoas capacitadas para trabalhar
na área”, diz Celso Poderoso, coordenador dos cursos de MBA em “Big
Data” da Fiap (Faculdade de Informática e Administração Paulista).

www.datascienceacademy.com.br
R Fundamentos

O que levou à ascensão da profissão de Cientista de Dados?

www.datascienceacademy.com.br
R Fundamentos

A Carreira

Você já pensou nas vantagens de


trabalhar com a análise de dados
e ser um dos especialistas mais
procurados pelo mercado?

www.datascienceacademy.com.br
R Fundamentos

Big Data Analytics é fundamental


para a tomada de decisão nas
empresas

www.datascienceacademy.com.br
R Fundamentos

Uma carreira dedicada à área de Big Data Analytics, pode ser uma das
melhores decisões para qualquer profissional com capacidades analíticas

www.datascienceacademy.com.br
R Fundamentos

A ascensão da análise de
dados estruturados e não
estruturados

www.datascienceacademy.com.br
R Fundamentos

As predições de Big Data


estão superando as
previsões de mercado

www.datascienceacademy.com.br
R Fundamentos

Entre 2015-2020, o Big Data


Analytics terá um crescimento
de 14,4% ao ano

www.datascienceacademy.com.br
R Fundamentos

Big Data Analytics é usado em


todo tipo de negócio

www.datascienceacademy.com.br
R Fundamentos

Já está convencido da
importância da profissão de
Cientista de Dados?

www.datascienceacademy.com.br
R Fundamentos

Ainda não?

www.datascienceacademy.com.br
R Fundamentos

Então tenho mais


argumentos!!

www.datascienceacademy.com.br
R Fundamentos

Existem inúmeras opções de


cargos para os profissionais
de Big Data

www.datascienceacademy.com.br
R Fundamentos

Big Data Analytics é uma Estratégia


de Negócio

www.datascienceacademy.com.br
R Fundamentos

E o Cientista de Dados é parte desta


Estratégia

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

E onde estão os Cientistas de Dados?

www.datascienceacademy.com.br
R Fundamentos
O número de Cientistas As principais
de Dados em todo habilidades são R,
mundo dobrou nos Python, Data Mining e
últimos 4 anos Machine Learning

As áreas de TI e A maioria tem formação


Serviços são as que em Ciência da
mais contratam esses Computação,
profissionais Estatística, Matemática
e Física

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

E quais as principais características do


Cientista de Dados?

www.datascienceacademy.com.br
R Fundamentos
E quais as principais características do Cientista de Dados?

1- Ferramentas Básicas
2- Estatística
3- Machine Learning
4- Cálculo Multivariado e Álgebra Linear
5- Data Munging
6- Visualização de Dados e Comunicação
7- Pense como um Cientista de Dados

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

Por que Cientistas de Dados usam R?

www.datascienceacademy.com.br
R Fundamentos

Breve História
do R

www.datascienceacademy.com.br
R Fundamentos
Projeto de pesquisa em Auckland, na Nova
1993
Zelândia
1995 R liberado como projeto open-course

1997 Formado o grupo R-Core


Breve História
2000 Liberada a versão 1.0.0 do R do R
2003 Criação da R Foundation
Primeira conferência internacional de usuários
2004
em Vienna
Formado o R Consortium (com participação da
2015
IBM e Microsoft)
www.datascienceacademy.com.br
R Fundamentos
R possui diversas funções para:

• Extração de Dados
• Limpeza de Dados
• Carregamento e Transformação de Dados
• Análise Estatística
• Modelagem Preditiva
• Machine Learning
• Visualização de Dados

www.datascienceacademy.com.br
R Fundamentos

Pesquisa
realizada no site
KD

www.datascienceacademy.com.br
R Fundamentos

Número de
pacotes R
publicados por
ano no CRAN

Fonte: http://blog.revolutionanalytics.com/2016/03/16-years-of-r-history.html

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

Espera-se que o
Cientista de Dados
domine pelo menos
uma destas 3
linguagens

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

Sintaxe

”A” != ”a”

www.datascienceacademy.com.br
R Fundamentos

Dificuldade

www.datascienceacademy.com.br
R Fundamentos

Vantagens e
Desvantagens

www.datascienceacademy.com.br
R Fundamentos
Vantagens

• Grande variedade de pacotes disponíveis


• Flexibilidade e Rapidez
• Machine Learning

www.datascienceacademy.com.br
R Fundamentos
Desvantagens

• Não há interface gráfica. Tudo é feito por


linha de comando
• Limitações no uso de memória,
principalmente com datasets muito
grandes

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

https://www.r-consortium.org

www.datascienceacademy.com.br
R Fundamentos

https://www.r-consortium.org

www.datascienceacademy.com.br
R Fundamentos

Oracle e Microsoft estão investindo pesado na


linguagem R para suas soluções analíticas

www.datascienceacademy.com.br
R Fundamentos

Versatilidade

www.datascienceacademy.com.br
R Fundamentos
• sqldf – pacote que permite realizar queries SQL em
dataframes no R
• forecast – modelar séries temporais
• plyr – dividir uma estrutura de dados em grupos e aplicar
funções a cada grupo
• stringr – manipulação de strings
• Database drivers – RMongo, RODBC, RMySQL
• ggplot2 – visualização de dados
• qcc – controle de qualidade estatístico
• randomForest – pacote para Machine Learning

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

Por que R e Microsoft Azure Machine Learning?

www.datascienceacademy.com.br
R Fundamentos

O que é o Azure Machine Learning?

www.datascienceacademy.com.br
R Fundamentos

O que é o Azure
Machine Learning?

www.datascienceacademy.com.br
R Fundamentos

Tudo na Nuvem

www.datascienceacademy.com.br
R Fundamentos

Machine Learning
Studio

www.datascienceacademy.com.br
R Fundamentos

Machine Learning
Studio

KNIME

www.datascienceacademy.com.br
R Fundamentos

Módulos prontos
para análises com
R, Python e SQL

www.datascienceacademy.com.br
R Fundamentos

Diversos Módulos
de ML

Azure ML Toolkit

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

Azure HDInsight

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

A Microsoft possui um histórico de evolução


em soluções de análise preditiva

www.datascienceacademy.com.br
R Fundamentos

Ano Produto
1999 Filtros de e-mail e Spam no Microsoft Outlook
2004 Começou a incorporar Machine Learning em seus mecanismos de busca
2005 SQL Server 2005 trouxe opções de data mining
2008 O serviço de busca Bing incorporou Machine Learning para previsão de tráfego
2010 Kinect incorporou o reconhecimento de gestos e filtro de ruídos
2014 Primeira versão do Azure Machine Learning
Microsoft lança a plataforma Cortana Intelligence Suite, totalmente baseada em
2014
Machine Learning

www.datascienceacademy.com.br
R Fundamentos

O Azure Machine Learning tem como


principais competidores:

www.datascienceacademy.com.br
R Fundamentos

O Azure Machine Learning tem como


principais competidores:

Amazon Machine Learning (Amazon)


IBM Watson Analytics (IBM)

www.datascienceacademy.com.br
R Fundamentos

Machine Learning traz um novo paradigma

www.datascienceacademy.com.br
R Fundamentos

Dados Programação
Computador Output
Programas Tradicional

Dados Machine
Programa
Output Computador Learning

www.datascienceacademy.com.br
R Fundamentos

Dados Machine
Programa
Output Computador Learning

A grande vantagem deste novo programa gerado, é que ele pode agora fazer
previsões em novos conjuntos de dados, pois ele já aprendeu como fazer

www.datascienceacademy.com.br
R Fundamentos

Por que não pensaram nisso antes?

www.datascienceacademy.com.br
R Fundamentos

Tempestade Perfeita

• Crescimento exponencial do volume de


dados
• Preço baixo do armazenamento de dados
• Alta capacidade de processamento dos
computadores
• E o surgimento do Big Data Analytics

www.datascienceacademy.com.br
R Fundamentos

Análise Preditiva
(Predictive Analytics)

www.datascienceacademy.com.br
R Fundamentos

Dados são combustível


para a Análise Preditiva

www.datascienceacademy.com.br
R Fundamentos
E podemos ver a Análise Preditiva em ação todos os dias

• Filtros de Spam dos e-mails


• Programas de concessão de financiamento para casa própria
• Padrões de reconhecimento (voz, imagem)
• Seguro de Vida
• Detecção de Fraudes em Cartões de Crédito
• Controle de Voos
• Engines de Busca na Internet

www.datascienceacademy.com.br
R Fundamentos

E por que R e Azure Machine Learning?

www.datascienceacademy.com.br
R Fundamentos
E por que R e Azure Machine Learning?

• Azure Machine Learning é visual, enquanto R é linha de comando (se


complementam)
• O R permite estender as funcionalidades do Azure ML
• Esta combinação permite escalabilidade e mais opções de manipulação
de dados e criação de modelos
• O Machine Learning Studio traz diversos módulos em R, prontos para uso

www.datascienceacademy.com.br
Machine Learning Workflow

www.datascienceacademy.com.br
Machine Learning Workflow

www.datascienceacademy.com.br
Azure Machine Learning Workflow
Dados

Dados Limpos Aplicar


Pré Verificar o Escolher o
Dados e Algoritmos de
Processamento melhor Modelo Modelo
Organizados ML

Dados Liberar seu


Produto ou
Serviço

www.datascienceacademy.com.br
Azure Machine Learning Workflow

www.datascienceacademy.com.br
Azure Machine Learning Workflow
Dados

Dados Limpos Aplicar


Pré Verificar o Escolher o
Dados e Algoritmos de
Processamento melhor Modelo Modelo
Organizados ML

Dados Liberar seu


Produto ou
Serviço

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

Qual a importância do Big Data Analytics?

www.datascienceacademy.com.br
R Fundamentos

Dados x Informação x Conhecimento x Inteligência

www.datascienceacademy.com.br
R Fundamentos
Dados x Informação x Conhecimento x Inteligência

Funcionário Idade Salário Cargo


Aristóteles 32 R$ 7.500,00 Analista Financeiro
Sócrates 41 R$ 9.300,00 Gerente Financeiro

Informação

www.datascienceacademy.com.br
R Fundamentos
Dados x Informação x Conhecimento x Inteligência

As pessoas trabalham com informações mas a


tecnologia armazena dados

www.datascienceacademy.com.br
R Fundamentos
Dados x Informação x Conhecimento x Inteligência

Funcionário Idade Salário Cargo


Aristóteles 32 R$ 7.500,00 Analista Financeiro
Sócrates 41 R$ 9.300,00 Gerente Financeiro

Conhecimento

www.datascienceacademy.com.br
R Fundamentos
Dados x Informação x Conhecimento x Inteligência

www.datascienceacademy.com.br
R Fundamentos
Dados x Informação x Conhecimento x Inteligência

Funcionário Idade Salário Cargo


Aristóteles 32 R$ 7.500,00 Analista Financeiro
Sócrates 41 R$ 9.300,00 Gerente Financeiro

Inteligência – capacidade de resolver problemas, usando o


conhecimento, através das informações disponíveis

Por exemplo: por que os funcionários do setor financeiro tem queda


de performance após 1 ano trabalhando na empresa
www.datascienceacademy.com.br
R Fundamentos
Dados x Informação x Conhecimento x Inteligência

Big Data Analytics

Extrair conhecimento a partir dos


dados

www.datascienceacademy.com.br
R Fundamentos
Dados x Informação x Conhecimento x Inteligência

Machine Learning

Ensinar algoritmos a usar


inteligência, ou seja, usar o
conhecimento para resolver
problemas

www.datascienceacademy.com.br
R Fundamentos
Evolução dos Sistemas Analíticos

www.datascienceacademy.com.br
R Fundamentos
Evolução dos Sistemas Analíticos

www.datascienceacademy.com.br
R Fundamentos
Evolução dos Sistemas Analíticos

O conhecimento nos faz mais inteligentes;


pessoas e empresas que aprendem

www.datascienceacademy.com.br
R Fundamentos
Evolução dos Sistemas Analíticos

O conhecimento nos faz mais inteligentes;


pessoas e empresas que aprendem (e agora, máquinas)

www.datascienceacademy.com.br
R Fundamentos

Estamos vivendo a era da explosão dos dados

bit byte kylobyte megabyte gigabyte terabyte petabyte exabyte zettabyte yottabyte

www.datascienceacademy.com.br
R Fundamentos

Estamos vivendo a era da explosão dos dados

bit byte kylobyte megabyte gigabyte terabyte petabyte exabyte zettabyte yottabyte

Big Data

www.datascienceacademy.com.br
R Fundamentos

Estamos vivendo a era da explosão dos dados

bit byte kylobyte megabyte gigabyte terabyte petabyte exabyte zettabyte yottabyte

Em 2014 a humanidade acumulou em dados Big Data


o equivalente a 1.8 Zettabyte
www.datascienceacademy.com.br
R Fundamentos

O que é Big Data Analytics?

O objetivo é simples: melhorar seus processos de trabalho e adquirir insights


valiosos acerca das tendências de mercado, comportamento dos
consumidores e suas expectativas

www.datascienceacademy.com.br
R Fundamentos

O que é Big Data Analytics?

Big Data Analytics é o trabalho analítico e inteligente em grandes volumes de


dados, estruturados ou não-estruturados, que são coletados, armazenados e
interpretados por softwares de altíssimo desempenho

www.datascienceacademy.com.br
R Fundamentos
Dados de
Ferramentas
de BI

Conteúdo de
Pesquisas
Redes Sociais

Matéria-prima
Arquivos de
Indicadores Log e
Sensores

E-mails Relatórios

www.datascienceacademy.com.br
R Fundamentos

• Direcionamento das Vendas


Vantagens e • Aperfeiçoamento do Processo de Logística
• Atendimento mais eficiente
Benefícios • Melhoria na Gestão de Recursos Humanos
• Identificação de Padrões
• Análise da Concorrência

www.datascienceacademy.com.br
R Fundamentos

5 Perguntas que Precisam ser respondidas antes


de pensar em Big Data Analytics

www.datascienceacademy.com.br
R Fundamentos
5 Perguntas que Precisam ser respondidas antes de pensar em
Big Data Analytics

1- Qual seu objetivo?


2- Qual a origem dos dados?
3- Que solução escolher?
4- Este será um trabalho em equipe?
5- Qual o impacto que o Big Data Analytics terá no negócio?

www.datascienceacademy.com.br
R Fundamentos

Big Data Analytics em


Áreas de Negócio

www.datascienceacademy.com.br
R Fundamentos
Saúde

• Combate a doenças e epidemias


• Dispositivos móveis de monitoramento
• Atendimento médico individualizado
• Wearables e apps

www.datascienceacademy.com.br
R Fundamentos

A Accenture Healthcare IT Vision


2015, uma pesquisa anual sobre
tendências de tecnologia, traz
dados interessantes sobre o uso
de Big Data na saúde.

www.datascienceacademy.com.br
R Fundamentos

45% dos executivos da área


consultados afirmaram que fazem
análise preditiva

www.datascienceacademy.com.br
R Fundamentos

59% disseram que já usam


algoritmos com o objetivo de
fazer softwares operarem com
mais inteligência

www.datascienceacademy.com.br
R Fundamentos

73% de todos os executivos de


saúde relataram ter obtido um
ROI positivo depois de investir em
tecnologias como dispositivos
móveis do tipo wearables

www.datascienceacademy.com.br
R Fundamentos

Construção

www.datascienceacademy.com.br
R Fundamentos

Logística

www.datascienceacademy.com.br
R Fundamentos

Logística

Estatística + Matemática + Mídias Sociais + Macroeconomia + Tecnologia + Dados

Big Data Analytics

www.datascienceacademy.com.br
R Fundamentos
Marketing

• Análise de mercado mais específica


• Interpretação de Dados mais eficaz
• Mais fontes de dados
• Automação do Marketing
• Experiências mais significativas no PV

www.datascienceacademy.com.br
R Fundamentos

Indústria

• Eficiência no Planejamento
• Gestão de Suprimentos
• Redução de Custos
• Qualidade

www.datascienceacademy.com.br
R Fundamentos

E-commerce

www.datascienceacademy.com.br
R Fundamentos

Energia

www.datascienceacademy.com.br
R Fundamentos

A Empresa como um todo

• Mudança de Cultura
• Visão Empresarial
• Esforço Top-Down

www.datascienceacademy.com.br
R Fundamentos

• Big Data já não é mais um tema distante


• Big Data fará toda a diferença para seu negócio
• Qualquer empresa pode se beneficiar do Big Data
• Big Data é um trabalho em equipe

www.datascienceacademy.com.br
R Fundamentos

Mas por onde eu começo?

www.datascienceacademy.com.br
R Fundamentos

Como o Big Data pode me ajudar a aumentar o Market Share da empresa?

www.datascienceacademy.com.br
R Fundamentos
Coletar Dados

Faturamento
Marketing
Clientes
Custos
Efetividade das Campanhas de Marketing
Concorrentes
Redes Sociais

www.datascienceacademy.com.br
R Fundamentos
Trabalhar Sobre os Dados

Carga

Limpeza

Transformação

Compreensão

www.datascienceacademy.com.br
R Fundamentos

Técnicas de Análise

Aplicar modelos estatísticos e compreender o relacionamento entre os dados

Definir variáveis de observação e explanatórias

Buscar correlação e causalidade

www.datascienceacademy.com.br
R Fundamentos

Machine Learning

Juntar tudo e criar um modelo de machine learning, prevendo como estas


variáveis afetam umas às outras quando alteradas

Automatizar o processo

www.datascienceacademy.com.br
R Fundamentos

Apresentar seus Resultados

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

Usando o Github

www.datascienceacademy.com.br
R Fundamentos

O que é um sistema de controle de versão?

www.datascienceacademy.com.br
R Fundamentos

Várias pessoas
trabalhando nos
mesmos arquivos

www.datascienceacademy.com.br
R Fundamentos

Histórico e Conceitos

www.datascienceacademy.com.br
R Fundamentos

• Concurrent Versions System (CVS)


• Subversion (SVN)
Sistemas de Controle • Visual SourceSafe (VSS)
de Versão • Rational ClearCase
• Git

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

• Não depender de um servidor central


• Dar ênfase à velocidade
• Integridade dos dados
• Potencializar o trabalho paralelo

www.datascienceacademy.com.br
R Fundamentos

https://github.com

www.datascienceacademy.com.br
R Fundamentos

https://github.com/dsacademybr
www.datascienceacademy.com.br
R Fundamentos

Muitos Cientistas de Dados


estão no Github

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

No Github você pode encontrar ainda uma infinidade de


material sobre Data Science e projetos completos

www.datascienceacademy.com.br
R Fundamentos

Principais Conceitos do Git

www.datascienceacademy.com.br
R Fundamentos

Branch

Ramificação do projeto,
Principais cada branch representa uma versão do
conceitos do Git seu projeto e podemos seguir uma linha de
desenvolvimento a partir de cada branch

www.datascienceacademy.com.br
R Fundamentos

Clone

Cópia local de todos os arquivos de um


Principais repositorio git
conceitos do Git

www.datascienceacademy.com.br
R Fundamentos

Commit

Coleção de alterações realizadas, é uma


Principais espécie de checkpoint, sempre que
conceitos do Git necessário você pode retroceder até
algum commit existente

www.datascienceacademy.com.br
R Fundamentos

Fork

Uma bifurcação do projeto, uma cópia do


Principais projeto existente para seguir uma nova
conceitos do Git direção

www.datascienceacademy.com.br
R Fundamentos

Master
Principais
conceitos do Git Branch padrão de um repositório Git

www.datascienceacademy.com.br
R Fundamentos

Merge

É a capacidade de incorporar alterações


Principais do git, quando acontece uma junção de
conceitos do Git diferentes branches

www.datascienceacademy.com.br
R Fundamentos

Pull
Principais
conceitos do Git Puxa as alterações do repositório remoto

www.datascienceacademy.com.br
R Fundamentos

Push
Principais Empurra as suas alterações para o
conceitos do Git repositório remoto

www.datascienceacademy.com.br
R Fundamentos

Repositório
Principais Local onde ficam todos os arquivos do
conceitos do Git projeto, inclusive o histórico e versões

www.datascienceacademy.com.br
R Fundamentos

Como utilizar o Github?

https://github.com

www.datascienceacademy.com.br
R Fundamentos

https://github.com
www.datascienceacademy.com.br
R Fundamentos

Github Desktop

https://desktop.github.com

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
R Fundamentos

Preparação de Documentos com R e LaTeX

www.datascienceacademy.com.br
R Fundamentos

O que é LaTeX?

www.datascienceacademy.com.br
R Fundamentos

A ideia central do LaTeX é distanciar o autor o máximo


possível da apresentação visual da informação, pois a
constante preocupação com a formatação desvia o
pensamento do conteúdo escrito

www.datascienceacademy.com.br
R Fundamentos

Tempo e Esforço

Por que empregar tempo e esforço


em documentos mais simples?

Tamanho e Complexidade do Documento

www.datascienceacademy.com.br
R Fundamentos

R e LaTeX

Arquivos com extensão .Rnw

www.datascienceacademy.com.br
R Fundamentos
R e LaTeX

Arquivos com extensão .Rnw

www.datascienceacademy.com.br
R Fundamentos

R e LaTeX

Sweave()
knit()

www.datascienceacademy.com.br
R Fundamentos

R e LaTeX

Sweave()
knit()

Reproducible Research

www.datascienceacademy.com.br
R Fundamentos
knitr()

www.datascienceacademy.com.br
R Fundamentos
Sweave()

www.datascienceacademy.com.br
R Fundamentos

www.datascienceacademy.com.br
Curta Nossas Páginas nas Redes Sociais
E fique sabendo das novidades em Data Science, Big Data, Internet das Coisas e
muito mais…

www.facebook.com/dsacademybr

twitter.com/dsacademybr

www.linkedin.com/company/data-science-
academy
www.datascienceacademy.com.br

Você também pode gostar