Você está na página 1de 28

Data Science

Escola de Dados

© FREEPIK
1
CIÊNCIA DE DADOS

3
§ O que é?
§ Por que aprender?
§ Principais áreas e aplicações

2
CURSO DATA SCIENCE
§ O que você poderá fazer
depois do curso?
§ Conteúdo programático
PREDITIVA ANALYTICS
§ Informações gerais
§ Quem somos
§ Professores
§ Diferenciais
§ Metodologia
§ Depoimentos

© FREEPIK
Ciência de dados
§ O que é?
§ Por que aprender?
§ Principais áreas e aplicações
Ciência de Dados
A área de Ciência de Dados engloba Matemática e Estatística
uma infinidade de assuntos e
conhecimentos. No entanto, é possível
resumi-lá como “a junção das técnicas Cálculo, Álgebra, Otimização, Estatística
de matemática, estatística e Descritiva, Probabilidades e Inferência.
computação com o conhecimento do
negócio” de forma a otimizar o
processo decisório das empresas ou
mesmo resolver problemas de qualquer Computação
espécie com o apoio dos dados.
Linguagens de programação, conceitos de
banco de dados relacionais e não relacionais,
ferramentas de Visualização de Dados.

Conhecimento do Negócio

Sem o conhecimento das particularidades do


negócio, a prática de Ciência de Dados fica sem
sentido e não agrega o valor necessário.
O Big Data
tomou conta do mundo

A quantidade de informação gerada pelo mundo cresce de forma


exponencial. Segundo o IDC, “ ...a soma de todos esses dados,
sendo esses dados criados, capturados ou replicados, está
crescendo de forma espantosa. A previsão é que o crescimento
saltará de 33 Zettabytes (ZB) em 2018 para 175 ZB até 2025. “

1 Zetabyte = 1 MM de Petabytes
1 Petabyte = 1 MM de Gigabytes
© FREEPIK

* Fonte: https://www.seagate.com/files/www-content/our-story/trends/files/idc-seagate-dataage-whitepaper.pdf
O futuro é
da Automação e
Inteligência Artificial
“Entramos na era da Quarta
Revolução Industrial. O Fórum
Econômico Mundial sugere que
a automação irá eliminar 75
milhões de postos de
trabalhos, enquanto 133
milhões de novos empregos
com mais interação entre
homem e máquina serão
criados.”

* Fonte: http://www3.weforum.org/docs/WEF_Future_of_Jobs_2018.pdf
Empregabilidade
alta e duradoura
A profissão de Cientista de Dados foi
classificada como a PROFISSÃO MAIS
DESEJADA EM 2018*. Além disso, qualquer
profissional com habilidades em Dados
terá um futuro muito promissor.

Busca da palavra
“dados” no Linkedin
retornou 30 mil
oportunidades
abertas.
Atualização: Abr/21

* Fonte: https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century
A quantidade de aplicações de
Ciência de Dados é praticamente
infinita, confira algumas:

1 Data Analytics

2 Machine Learning

Processamento de
3
Linguagem Natural

4 Visão Computacional
1 Data Analytics

A principal ferramenta para transformar


dados em informação relevante que
resolva problemas de negócio.

§ Resumo e análise de uma grande


quantidade de dados

§ Cálculo de probabilidades de
ocorrência de algum evento. Ex:
Clientes mais propensos a comprar.

§ Estudo de uma amostra de dados


para tirar conclusões sobre a
população

§ Contar histórias através dos dados


(Data Storytelling)

§ Visualização dos dados através de


Dashboards e Infográficos
2 Machine Learning

Criação de modelos que explicam uma


infinidade de perguntas, como por exemplo:

§ Detecção de SPAM
§ Carros autônomos
Tecnologia § Drones
§ Internet das Coisas
§ Compressão de arquivos

§ Probabilidade de “calote” de clientes


Finanças § Trading algorítmico
§ Precificação de seguros

§ Robôs de autoatendimento
Atendimento § Maximização de NPS
§ Monitoria da Qualidade automática

Marketing § Qual o cliente mais propenso a


e CRM comprar?
§ Recomendação de produtos
§ Previsão de Churn
2 Machine Learning

§ Previsão de morte de pacientes


Saúde § Resposta para um remédio
§ Riscos diversos

§ Previsão da gravidez com base em


Cotidiano comportamento das compras
§ Onde uma pessoa estará amanhã?

§ Previsão de turnover de
colaboradores
RH
§ Qual o melhor candidato para uma
vaga?

§ Probabilidade de ganhar uma ação


Jurídico § Qual o melhor argumento de
defesa?
© FREEPIK
Processamento de
3
Linguagem Natural

Machine Learning aplicado ao


entendimento de Textos e Áudios.
Exemplos:

§ Speech Recognition: Google Tradutor,


Assistentes Virtuais (Siri, Cortana, Alexa, etc)

§ Análise de Sentimentos de textos de


usuários em um site. Ex: Twitter, IMDB etc.

§ Recurso de “Auto Completar” em celulares

§ Extração automática de assuntos e tópicos


de grandes textos

§ Chatbots para realizar o auto-atendimento


em sites
4 Visão Computacional

Machine Learning aplicado à


classificação de imagens e vídeos

§ Detecção de rostos para pagamento


financeiro usando Biometria Facial

§ Image Recognition: Aplicativos


“reconhecem” você automaticamente
nas fotos

§ Geração automática de imagens

§ Desenvolvimento de carros
autônomos

§ Check in automático em
estabelecimentos usando
reconhecimento facial

§ Câmeras inteligentes
Qual a única escola
100% focada no ensino de
Ciência de Dados e Analytics?
Nosso propósito é democratizar o uso de Ciência de
Dados para os mais diversos públicos, contribuindo
assim para a preparação dos profissionais para a
Somos a única escola 100% focada no ensino Economia 4.0 - nova revolução causada pela
de Ciência de Dados e Analytics Transformação Digital e Inteligência Artificial
Nossos professores titulares

Bacharel em Estatística pelo IME-USP, com Especialização em


Inteligência Artificial, Machine Learning, Redes Neurais e
Algoritmos Genéticos pela POLI-USP. Trabalhou com
modelagem de riscos por 10 anos, desenvolvendo
principalmente modelos para quantificação de Risco
Operacional.
Fernando Itano Atualmente é Gerente de Ciência de Dados, atuando em
projetos relacionados a Fraudes, Jurídico e CRM.

Bacharel em Matemática Aplicada pelo IME-USP, possui mais


de 16 anos de experiência no mercado financeiro e no de
serviços de Atendimento ao Cliente. Criou soluções em
Analytics nas mais diversas áreas, entre elas: Qualidade,
Auditoria Interna, Compliance, Risco de Crédito e Cobrança.

Atualmente é Head de Ciência de Dados, atuando em Crédito,


Vinícius Souza Marketing Digital, CRM, Produtos e Atendimento.
Nossos diferenciais

Entrega de valor a Metodologia de Ensino 3.0


Foco em Analytics
cada aula

A Preditiva é a única escola brasileira Conteúdo cuidadosamente Acreditamos em um mix de


focada 100% no ensino de análise de desenvolvido para a cada aula você ferramentas de aprendizado. Aqui as
dados. Contamos com professores conseguir aprender a resolver aulas ao vivo e gravadas se misturam
experientes e especialistas no problemas de Analytics. É sair da aula para você aproveitar ao máximo.
assunto. e aplicar os conceitos.

Analytics que Estudos de caso Customer


vale a pena! reais de mercado Success

Nem tudo é necessário dominar. Aqui na Preditiva o aluno aprende Após o curso, todo aluno recebe
Nossos conteúdos se concentram nas fazendo! Temos cases de várias áreas acompanhamento para colocar em
técnicas e conceitos que realmente de negócios prontos para desafiar os prática o que aprendeu. Nossa meta é
agregam valor à sua formação. alunos na busca da melhor solução. ajudar os alunos a desenvolver a carreira!
Customer
Success

Programa de Mentoria
Além do aluno poder tirar dúvidas e fazer consultas
com os professores da Preditiva através das aulas e
do Portal do Aluno, após o término do curso durante
6 meses o aluno também poderá agendar
encontros mensais de 1h30 com os professores.

Nestes encontros, o aluno poderá trazer um


problema de negócio para o professor e juntos
poderão desenvolver um plano de ação que resolva
o problema utilizando as técnicas e ferramentas
desenvolvidas ao longo do curso.

Para os alunos que ainda não estão inseridos na


área, os encontros de mentoria poderão ser
utilizados para desenvolver uma plano de ação
para inserção na nova área.
Metodologia de ensino

Aulas ao vivo e online Estudos de caso


Aqui os conceitos fundamentais são ensinados Ciência de Dados só faz sentido para nós
ao vivo e somente o homework e aulas quando é usada para resolver problemas de
opcionais são oferecidas por aulas gravadas negócio. Aqui você vai resolver problemas
em nosso Portal do Aluno. reais de vários ramos de atuação.

Exercícios de fixação Leituras complementares


Não adianta uma boa aula e um ótimo Além de todo o vasto material didático que
material didático se não exercitarmos as combina teoria, estudos de caso e exercícios,
técnicas constantemente. Fizemos uma você terá uma seleção de texto opcionais que
seleção de exercícios interessantes para aumentarão ainda mais seu entendimento.
que você entenda de vez quando utilizar as
técnicas de Analytics. © FR
EEPI
K

Quizzes
Para complementar o ensino e deixar as aulas mais
dinâmicas, realizamos competições muito divertidas usando
ferramentas online. Você vai adorar a experiência!
Profissionais
destas empresas
confiam na
Preditiva

“Foi muito proveitoso participar do


“Foi uma experiência muito rica. curso. A larga experiência dos “Professores muito bons, ótimo
O curso me proporcionou novos professores juntamente com a conhecimento. Tiveram a
conhecimentos dos quais utilizei no didática, ajudaram a termos uma preocupação de utilizar
meu trabalho e obtive um resultado visão diferenciada sobre cada case informações reais e aplicar em
super positivo. Os professores estudado nas aulas. Após o curso já exercícios próximos da nossa
estimulam muito a nossa estou aplicando algumas das realidade de uso. Recomendo
capacidade de análise. Super técnicas de Analytics na empresa o curso.”
Recomendo!” aonde trabalho e espero participar do
próximo módulo.” Rodrigo Fatigatte
Mariana Santos Analista de Risco e MIS
Especialista em RH Wallace Nascimento
Desenvolvedor de Sistemas

© FREEPIK
Inicie a trilha de conhecimento com o
Desenvolva modelos preditivos utilizando
Curso Data Science dados estruturados e não estruturados através
de técnicas de Processamento de Linguagem
Aprenda as técnicas e metodologias que estão
revolucionando os negócios
Natural (NLP) e Visão Computacional
O que você será capaz de fazer depois deste curso?

Entender as técnicas Matemáticas Utilizar Python com desenvoltura


e Estatísticas fundamentais
Utilizar os principais pacotes de Ciência de
Um Cientista de Dados deve conhecer o Dados da linguagem de programação
ferramental matemático e estatístico de Python. Ex: Numpy, Pandas, Matplotlib,
todos os modelos Seaborn, Scikit-learn, Tensorflow.

Desenvolver modelos clássicos e de Avaliar a qualidade dos modelos


Machine Learning

Resolver problemas de clusterização, Realizar o devido diagnóstico dos modelos,


regressão e classificação utilizando as avaliando assim a sua qualidade e
principais técnicas disponíveis no mercado capacidade preditiva

Aplicar Metodologia Ágil em Trabalhar com NLP e Visão


Data Science Computacional
Entender a importância de cada etapa no Criação de modelos usando dados não
desenvolvimento de modelos e garantir que estruturados de NLP (Textos) e Visão
seu resultado agregue valor para o negócio Computacional (Imagens e Vídeos)
Conteúdo Programático – Data Science

Módulo 1 Módulo 2 Módulo 3


Nivelamento Matemático Nivelamento Estatístico Nivelamento de Programação
para Data Science para Data Science para Data Science
Exposição: Aulas gravadas Exposição: Aulas gravadas Exposição: Aulas gravadas

a) Álgebra Linear: Vetores, Matrizes e a) Estatística descritiva: Tabelas, Medidas a) Python para Ciência de Dados: Estruturas de dados:
suas principais operações. Strings, Listas, Tuplas, Set’s, Arrays e Dicionários;
resumo de posição e dispersão. Estruturas de controle: IF’s e Loops.; Definição de funções
b) Cálculo: Funções, Limites e Derivadas. b) Probabilidades e suas Distribuições: e classes. b) Overview das principais bibliotecas para
c) Técnicas de Otimização: Busca de Modelos discretos e contínuos. Data Science: Numpy, Pandas, Scikit-learn e Matplotlib,
mínimos e máximos de uma função c) Inferência estatística: Amostra, População, H20.ai entre outras. c) Outras ferramentas e linguagens
Linear e Não Linear. estimadores, Viés, Estimação, Testes de utilizadas. Ex: R, SQL, Knime, etc. d) Versionamento de
Hipóteses, Valor P. códigos: Overview sobre o Git e Github.
Conteúdo Programático - Data Science

Módulo 4 Módulo 5
Introdução à Data Science Aprendizado Supervisionado e
Exposição: Aulas ao vivo Semi Supervisionado
Exposição: Aulas ao vivo
a) O que é Data Science e quais suas principais aplicações?
b) Os tipos de profissionais de Dados: Analistas, Engenheiros e
Cientistas de Dados. a) Regressão Linear Simples e Múltipla
c) O que são modelos e para que servem? b) Séries Temporais e Forecasting
d) Diferenças entre modelos descritivos e preditivos c) Árvores de Decisão
e) O Processo de Aprendizado de Máquina: o método Gradient Descent d) Regressão Logística
f) Os tipos de modelagem: Métodos Supervisionados, Semi e) SVM (Support Vector Machines)
Supervisionados e Não Supervisionados. f) Naive Bayes; g) Redes Neurais Artificiais
g) Abordagem Clássica de Modelos (Inferencial) vs Abordagem h) Ensemble de modelos: Blending, Bagging (Random Forests),
Moderna de Modelos (Machine Learning) Boosting e Stacking
Conteúdo Programático - Data Science

Módulo 6 Módulo 7 Módulo 8


Diagnóstico de Modelos Aprendizado Não Introdução a análise de dados
Supervisionados Supervisionado não estruturados (Deep Learning)
Exposição: Aulas ao vivo Exposição: Aulas ao vivo Exposição: Aulas ao vivo

a) Métricas de performance: R Quadrado e Análise a) Feature Engineering: Extraindo características dos


a) Clusterização: k-Means, DBSCAN, Hierarchical
de Resíduos. Matriz de Confusão, Acurácia, dados; b) Overview sobre dados não estruturados em NLP.
Clustering, Gaussian Mixtured Models (GMM), Self-
Sensibilidade e Especificidade, F1 Score, KS, Curva Representação de textos: One Hot, TF-IDF, Word
Organizing Maps (SOM).
ROC e Gini. b) Validação Cruzada; c) Problemas em Embeddings (Word2Vec e GloVe); Modelos de
b) Redução de dimensionalidade: Análise de
modelos: Overfitting e Underfitting; d) Técnicas Classificação usando Textos (Ex: Análise de Sentimentos).
Componentes Principais (PCA), Autoencoder.
de Regularização: L1, L2 e Dropout. e) Trade Off em c) Overview sobre dados não estruturados em Computer
c) Detecção de Anomalias: Métodos Gaussianos,
Ciência de Dados; f) Desafios em amostras Vision (Visão Computacional):
Autoencoders e Isolation Forest. d) Sistemas de
altamente desbalanceadas (eventos raros) – Redes Neurais Convolucionais (CNN)
Recomendação: Market Basket Analysis (Clientes que
g) Tuning de Hiperparâmetros: Grid Search e – Detecção de objetos
compram X também compram Y).
Algoritmos Genéticos. – Reconhecimento Facial
Conteúdo Programático - Data Science

Módulo 9
Módulo 10
Framework de Desenvolvimento
Projeto final (Capstone)
de Modelos Exposição: Aulas presenciais
Exposição: Aulas online
Desenvolvimento de um Data Product para as seguintes áreas:
a) Entendimento das necessidades de negócio
b) Planejamento Amostral e Noções de Planejamento de Experimentos – Mercado Financeiro: Modelos de Crédito, Seguros e Trading.
c) Governança de Dados ; d) Metodologia Ágil para Data Science: MV – Marketing e CRM: Segmentação de clientes, Recomendação de
(MPD) – Minimum Viable Model, Plataform e Data Product. Produtos, Cliente propenso à Compra.
e) Deploy de modelos: Deploy em Batch, Near Real Time, Real Time; – People Analytics e RH: Previsão de turnover de colaboradores e
Machine Learning at Scale: AWS, Google Cloud Plataform e Azure; melhor candidato para a vaga.
Construindo Pipelines de Modelos e suas API’s; f) Técnicas – Jurídico: Probabilidade de ganho de ações jurídicas.
de Acompanhamento de Modelos; g) Mensurando o valor que Data – Atendimento: Desenvolvimento de um Chatbot.
Science entrega para o negócio: Como vender seu modelo para a área – Tecnologia: Reconhecimento Facial.
cliente? Calculando os resultados financeiros das decisões usando
Data Science; h) Outras metodologias utilizadas. Ex: CRISP-DM.
Curso Data Science
Aprenda as técnicas e metodologias que estão revolucionando os negócios

Carga Horária Aulas


240hs - 140h Presenciais e 100h on-line
(Nivelamentos, Framework e Exercícios) Semanais: Terças e Quintas das 19h30 às 22:30h
Duração do curso: 5 meses

Local
Aulas ao vivo via Zoom
(o conteúdo fica gravado e disponível de forma
vitalícia no Portal do Aluno)

Inscrições Abertas!
© FREEPIK
www.preditiva.ai
contato@preditiva.ai

Siga-nos nas redes sociais

Você também pode gostar