Você está na página 1de 46

DATA

SCIENCE
O guia completo para
começar na área

SOMOSTERA.COM A
SUMÁRIO

02 INTRODUÇÃO

04 ENTENDENDO A ÁREA
DE DATA SCIENCE

14 O PAPEL DE CIENTISTAS
DE DADOS

18 PASSO A PASSO DE
CONHECIMENTOS
DO ZERO À VAGA

33 [BÔNUS] DICAS PARA


PROCESSOS SELETIVOS COM
O EXPERT ALLAN DIEGUEZ

41 CONCLUSÃO
INTRODUÇÃO

Para quem está em transição de carreira para uma área


tão vasta e recente no mercado como é a Ciência de
Dados, o caminho para sair do zero e evoluir até uma
vaga de emprego nem sempre está claro.

Existe um benefício claro com o acesso às informações


pela internet: são conteúdos em blogs, cursos gratui-
tos, fóruns e grupos de discussão que favorecem uma
imersão no universo dos dados.

Mas é fácil se perder nesse processo de estudos ou


acabar colocando muita energia em materiais que
nem sempre fazem diferença para entrevistas e pro-
cessos seletivos.

É por isso que, eventualmente, preferimos e precisamos


de um caminho bem traçado que nos “leve pela mão”
e mostre conteúdos realmente relevantes para o
desenvolvimento na carreira.

SOMOSTERA.COM 02
Essa é a proposta deste e-book. Após ler este material,
esperamos que você:

»» se sinta confiante ao dominar os


principais conceitos da área;

»» tenha pontos de partida seguros para


estudar temas mais desafiadores;

»» entenda a dinâmica das vagas e


processos seletivos do mercado;

»» saiba como se preparar para conquistar


sua primeira vaga como cientista de dados.

Boa leitura e bom aprendizado.

SOMOSTERA.COM 03
ENTENDENDO A
ÁREA DE DATA SCIENCE
_
ENTENDENDO A ÁREA DE DATA SCIENCE

Chamamos de Data Science a área que estuda


a coleta, o processamento, o tratamento, a aná-
lise, a modelagem e a visualização de dados.
Geralmente, os dados passam por esses proces-
sos para serem convertidos em insights e em
informação para gerar conhecimento e viabilizar
a tomada de decisões nas empresas.

É uma área que envolve muitos campos inter-


conectados: negócios, matemática, estatís-
tica, programação e outros. Está associada
a estratégias de construção de arquitetura de
armazenamento de dados, criação de modelos e
algoritmos para análise e geração de formas de
visualizar e comunicar os dados de uma forma
mais compreensível.

Os insumos principais para a Data Science são


os dados massivos gerados em todo lugar atual-
mente. A ideia de Big Data é fundamental para
entender isso. São dados em diversos formatos e
tamanhos, gerados em bases massivas, estrutu-
rados ou não estruturados, com erros e/ou ruídos.

SOMOSTERA.COM 05
_
ENTENDENDO A ÁREA DE DATA SCIENCE

Big data faz referência ao grande volume,


variedade e velocidade de dados que
demandam formas inovadoras e rentáveis
de processamento da informação, para
melhor percepção e tomada de decisão.

Big Data, segundo a Gartner

Nesses dados, a pessoa responsável, chamada de


data scientist, terá que tratar as bases, buscar
padrões e tendências e, eventualmente, automa-
tizar a análise, caso precise. Para isso, existe uma
série de ferramentas, padrões e linguagens que
mencionaremos ao longo deste guia.

A área de Ciência de Dados é extremamente


ampla e continua em constante crescimento.
Nela, você pode se especializar em engenharia de
dados, em visualização, em modelos de machine
learning, em testes e otimização de algoritmos,
entre outras funções.

SOMOSTERA.COM 06
_
ENTENDENDO A ÁREA DE DATA SCIENCE

IMPORTÂNCIA
NO NEGÓCIO

A carreira de cientista de dados aparece em


primeiro lugar na lista de profissões em alta
demanda para os próximos anos, de acordo com
o relatório Future of Jobs, do Fórum Econômico
Mundial. O motivo é sua relevância para os ne-
gócios e seu consequente impacto em toda a
sociedade moderna.

Não se trata somente de analisar os dados. A área


envolve uma análise que se volta a problemas
reais e a responder questionamentos que estão
sendo feitos. Desse modo, a pessoa cientista de
dados precisa ter uma boa visão do negócio para
saber o que priorizar e o que descartar em suas
análises.

A Ciência de Dados pode ser uma das profissões


mais interessantes do momento. Mas, para que
realmente faça a diferença dentro de uma em-
presa, profissionais de dados precisam ir além da
tecnologia, entendendo a fundo o negócio a ser
amparado pela análise.

SOMOSTERA.COM 07
_
ENTENDENDO A ÁREA DE DATA SCIENCE

Alguns pontos fundamentais para diminuir o


abismo entre Data Science e negócios:

ENTENDER PARA ATENDER

O time de Ciência de Dados precisa entender, na


íntegra, de forma empática, as decisões-chave
que líderes da organização estão tentando tomar.
Só então cientistas poderão apresentar resul-
tados analíticos que vão contribuir para essas
decisões.

CRIAR LAÇO COM OS


OBJETIVOS-CHAVE

Para garantir que os resultados analíticos sejam


relevantes para a empresa, é também indispen-
sável estabelecer um laço entre esses resultados
e os principais objetivos de negócio: eficiência,
custo, receita.

SOMOSTERA.COM 08
_
ENTENDENDO A ÁREA DE DATA SCIENCE

VIVER E RESPIRAR O BUSINESS

Em qualquer empresa, sempre há pessoas expe-


rientes em termos de relação com clientes, de
desenvolvimento de produto, de mercado etc.
Data scientists devem ter proximidade com elas.
Devem trocar constantemente e de forma ágil
para dar transparência à evolução dos projetos
e experimentos. E os feedbacks dessas pessoas
vão indicar se estão no caminho certo ou não.

MEDIR OS RESULTADOS

Um time de Data Science só deve começar um


projeto se souber o porquê de ele existir, e como
ele ficará se for bem-sucedido. Não tem segredo:
se você não utilizar um placar, só estará treinando,
e não jogando.

SOMOSTERA.COM 09
_
ENTENDENDO A ÁREA DE DATA SCIENCE

“ Para ser cientista de


dados de verdade, você
tem que entender que seu
trabalho não é apenas
sobre a pesquisa. Você
precisa quantificar e
qualificar o que faz de
forma que faça sentido
para toda a companhia.”

GORDON RIOS,
primeiro Data Scientist da Pandora,
rádio online norte-americana e responsável
pelo ambicioso Music Genome Project.

SOMOSTERA.COM 10
_
ENTENDENDO A ÁREA DE DATA SCIENCE

DIFERENTES
PAPÉIS NO CICLO
DOS DADOS

É importante entender que a Ciência de Dados é


considerada uma grande área, unindo conheci-
mentos que serão responsáveis por todo ciclo de
dados em uma empresa.

Esse ciclo abrange desde a limpeza e modela-


gem de dados até a fase em que os dados podem
ser visualizados e interpretados para tomada de
decisões. Nele, entram profissionais de Engenharia
de Dados, Data Science, Engenharia de Machine
Learning, Análise de Dados, entre outros.

SOMOSTERA.COM 11
_
ENTENDENDO A ÁREA DE DATA SCIENCE

Compreensão
Abordagem
do problema
analítica
de negócio

Dados
requisitados
Feedback

Coleta
Deployment de dados

Avaliação Compreensão
dos dados

Preparação
Modelagem
dos dados

JOHN ROLLINS
Data Scientist, IBM Analytics, IBM

SOMOSTERA.COM 12
_
ENTENDENDO A ÁREA DE DATA SCIENCE

ANALISTAS
E CIENTISTAS
DE DADOS

Um ponto que costuma ser motivo de dúvida para


quem está entrando no mercado de Data Science
e até mesmo para quem já vivencia a rotina na
empresa é sobre a fronteira entre Análise e
Ciência de Dados.

A falta de clareza acontece por esse ser um


campo de conhecimento relativamente novo e
em constante evolução. Assim, empresas podem
lidar de formas diferentes com as nomenclaturas
e responsabilidades de analistas e cientistas.

A principal diferença entre analista de dados e


cientista de dados é que analistas terão maior
foco em análises para respostas rápidas, geração
de insights para decisões e até união dos dados
com a experiência e intuição para a resolução de
problemas.

Enquanto isso, cientistas de dados assumem


projetos de longo prazo, desenvolvendo modelos
para uma finalidade específica ou mesmo fazendo
a limpeza dos dados desde os primeiros estágios.

SOMOSTERA.COM 13
O PAPEL DE
CIENTISTAS DE DADOS
_
O PAPEL DE CIENTISTAS DE DADOS

Com esse pano de fundo, podemos nos apro-


fundar melhor no papel de cientistas de dados.
Profissionais dessa área vão mergulhar nos dados
para, através deles, encontrar padrões e infor-
mações que sejam importantes para resolver um
problema.

Para atuar como cientista de dados, é necessário


desenvolver uma bagagem ampla, que reúna
conhecimentos de tecnologia, programação, es-
tatística, matemática e — muito importante — do
modelo de negócio em que você está trabalhando.

Isso porque cientistas de dados têm um papel


fundamental em alimentar com inteligência e
informações as mais diversas áreas da empre-
sa. Muito mais do que uma área técnica, essa é
uma carreira estratégica e de alto impacto nas
organizações.

SOMOSTERA.COM 15
_
O PAPEL DE CIENTISTAS DE DADOS

Mais algumas informações que podem te


interessar sobre o papel de data scientists:

O dia a dia da profissão envolve trabalhar


em problemas específicos por períodos
significativos; a ciência exige método,
paciência, experimentos e resiliência
quando iniciativas não derem certo;

Suas funções vão depender do contexto da


empresa em que você vai atuar e da maturidade
de dados dela; enquanto alguns negócios já
têm dados estruturados, outros precisam de
profissionais para conduzir esse processo
desde os estágios iniciais;

Você não precisa ter domínio avançado dos


três pilares da Ciência de Dados — tecnologia,
estatística e negócios —, mas é essencial
ter domínio de todas essas áreas e mais
profundidade em pelo menos uma delas;

Para entender melhor o que o mercado está


pedindo, o ideal é observar as vagas para
cientistas de dados de empresas com perfis
que você considera interessantes.

SOMOSTERA.COM 16
A Tera levantou dados interessantes sobre perfil, habi-
lidades e responsabilidades de cientistas de dados nas
empresas brasileiras. Confira a seguir e entenda como
se preparar para a rotina dessa carreira.

HABILIDADES COMO SE RESPONSABILIDADES


TÉCNICAS DESENVOLVE Engajamento com
interpretação do YouTube, Cursos e outros stakeholders,
problema, modelagem treinamentos, livros coleta de dados,
de dados, captação análise de dados,
de dados e ETL modelagem de dados

SOFT SKILLS
Mentalidade orientada
FERRAMENTAS a dados, resolução de
Python, SQL, Git problemas complexos,
resiliência, criatividade

jcomp - Freepik.com

SOMOSTERA.COM 17
O PASSO A PASSO
DE CONHECIMENTOS
DO ZERO A VAGA DE
EMPREGO
_
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA

Depois de conhecer mais sobre a área de Ciência


de Dados e as diferentes possibilidades de atu-
ação nesse mercado tão aquecido, é essencial
compreender como de fato se desenvolver com
confiança.

Nas próximas páginas, você vai navegar por


habilidades técnicas e comportamentais, teorias
e ferramentas que consideramos chaves para
destravar esse mercado e seu currículo como
cientista de dados.

SOMOSTERA.COM 19
_
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA

LINGUAGENS DE
PROGRAMAÇÃO

Para entender como começar em ciência de dados,


é preciso compreender as linguagens de progra-
mação. Na área, temos a proeminência de Python,
por ser uma linguagem orientada a objetos,
versátil, extremamente limpa e apresentar uma
série de bibliotecas já implementadas.

Além disso, outra vantagem de Python é dispor de


um conjunto de elementos já configurados, como
ambientes de desenvolvimento. Eles ajudam
muito a lidar com as instalações de bibliotecas
necessárias e a preparar a máquina para geren-
ciar os dados nas tarefas do cotidiano. Desse
modo, você só precisa importar de forma simples
quando precisar de alguma função.

Como opções que você deve conhecer, citamos


o Anaconda e as ferramentas de notebook,
que preparam toda a estrutura para o desen-
volvimento na nuvem. É fundamental também
dominar o github e seus controles de versiona-
mento para organizar a codificação e ter uma boa
visão na programação em grupo.

SOMOSTERA.COM 20
_
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA

MODELAGEM DE
BANCO DE DADOS

Na ciência dos dados, a modelagem de banco


de dados, evidentemente, cumpre um papel
muito importante. Nesse sentido, a pessoa cien-
tista deve entender muito bem o padrão SQL e
dominar as ferramentas que implementam seus
conceitos em Python, como os bancos de dados
SQlite e PostGreSQL. É importante ter a capaci-
dade de desenvolver modelos para estruturar
a relação entre os dados e implementá-los com
uma linguagem.

Da mesma forma, é necessário aprender a ma-


nipular os dados em estruturas relacionais, de
modo a efetuar consultas, filtragens e alterações
nas bases. Também é interessante conhecer fer-
ramentas para dados não estruturados, como as
tecnologias e o NoSQL.

SOMOSTERA.COM 21
_
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA

RESOLUÇÃO
DE PROBLEMAS
COMPLEXOS

A pessoa cientista de dados deverá se deparar


com problemas complexos e reais que afetam as
pessoas. Por isso, é importante ser analítico e sa-
ber dividir os problemas para chegar à solução de
maneira ágil. Nesse ponto, os conhecimentos do
negócio são úteis também.

ESTATÍSTICA
DESCRITIVA

Outro importante campo é a estatística descriti-


va. É fundamental compreender os métodos de
análise para descrever os dados e buscar infor-
mações imediatas acerca deles, como médias,
medianas, tabelas de frequências e gráficos.
Isso é fundamental, por exemplo, para comparar
dados em bases diferentes e estabelecer uma
visão de como cada uma delas está caracterizada.

SOMOSTERA.COM 22
_
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA

Além disso, a probabilidade e as distribuições aju-


dam a compreender e embasar outros conceitos
relevantes, principalmente na modelagem estatís-
tica. São conceitos que devem estar solidificados
na mente da pessoa que trabalha com dados.

ANÁLISE
EXPLORATÓRIA
DE DADOS

É mandatório também conhecer os métodos para


uma boa análise exploratória em uma base de
dados. Nesse sentido, a pessoa profissional pre-
cisa saber como encontrar padrões e tendências
nos dados, a partir de manipulações de funções
e recursos já existentes em bibliotecas como o
Pandas e Matplotlib.

Inclusive, essa parte ajuda na criação de hipóte-


ses que podem ser confirmadas ou negadas pos-
teriormente. É uma forma de estudar as bases
com a ajuda de elementos visuais como os grá-
ficos e outros métodos de visualização de dados.

SOMOSTERA.COM 23
_
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA

MODELAGEM
ESTATÍSTICA

A modelagem estatística é outra parte integral do


currículo de quem lida com dados. É necessário
entender como coletá-los e transformá-los para
atender a um modelo, com técnicas de inteligên-
cia artificial e aprendizado de máquina.

Um modelo estatístico é uma representação


da realidade na qual definimos a relação entre
variáveis para entender e prever o comportamen-
to de um fenômeno. Estabelecemos quais serão
as variáveis independentes e qual será a variável
dependente; a partir dos elementos independen-
tes, tentamos prever um valor para o elemento
dependente.

Com isso, os modelos ajudam as pessoas cien-


tistas de dados a preverem um resultado para o
problema em análise. Uma pessoa cientista de
dados precisa considerar esses fatores, pois terá
que lidar com cenários complexos em que os
modelos têm que estar preparados para novos
dados e mudanças nas características analisadas.

SOMOSTERA.COM 24
_
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA

MODELOS DE
APRENDIZADO
SUPERVISIONADO

Outro assunto que faz parte do currículo é o


aprendizado de máquina supervisionado. O dia a
dia da pessoa cientista de dados envolverá pro-
blemas dessa natureza, em que é preciso buscar
a melhor maneira de dividir as bases de dados
entre treinamento e teste, bem como selecionar
o melhor algoritmo. Existem várias opções nesse
campo, como as famosas árvores de decisão, o
naive-bayes, o SVM e as redes neurais.

Toda a área do Deep Learning supervisionado


entra nessa categoria, aliás. É necessário domi-
nar a noção de extração de características que as
redes neurais ajudam a automatizar, bem como
entender como usar camadas emprestadas de
modelos já treinados para o caso de problemas
muito complexos, como análise e reconheci-
mento de imagens.

SOMOSTERA.COM 25
_
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA

MODELOS DE
APRENDIZADO NÃO
SUPERVISIONADO

Em complemento aos modelos supervisionados,


temos os modelos não supervisionados. São
exemplos: algoritmos como as regras de associa-
ção, as técnicas de agrupamento e as técnicas
utilizadas para sistemas de recomendação, como
filtragem colaborativa e outros.

Nesse sentido, é preciso compreender bem a


diferença entre os dois tipos de aprendizado
para saber quais problemas se encaixam me-
lhor em cada um. Uma visão analítica também
ajuda na hora de filtrar as conclusões que o algo-
ritmo fornece, de modo a eliminar alguns ruídos
e informações não relevantes e gerar uma visão
mais precisa para aquele negócio.

SOMOSTERA.COM 26
_
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA

TÉCNICAS DE
MACHINE LEARNING
COM EFEITO
TEMPORAL

Outro importante fator a considerar na carreira é


o aprendizado de técnicas de machine learning
(ML) para analisar um efeito temporal. Ou seja, é
preciso analisar os dados com a compreensão de
como eles mudam ao longo do tempo, bem como
buscar a identificação de possíveis padrões nes-
sas variações.

Um exemplo disso são as séries temporais, um


importante conceito da estatística. Elas ajudam
a entender eventos que ocorrem ao longo de um
período, de forma sequencial, como o número de
vendas em uma loja em um ano. Assim, é possível
estudar o comportamento dos dados nesse mo-
mento histórico.

SOMOSTERA.COM 27
_
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA

COMPREENSÃO
DE ÉTICA

Além de conhecer e dominar as dimensões mate-


máticas, estatísticas e computacionais, a pessoa
cientista de dados também precisa de uma com-
preensão ética acerca de sua profissão e das
implicações dela para a sociedade.

Afinal, os sistemas criados por esses profissio-


nais não existem sozinhos, eles existem em um
contexto, em uma organização/uma sociedade e
geram impacto na vida de pessoas em todos os
âmbitos.

Nesse sentido, o ideal é aprofundar a considera-


ção da tecnologia em serviço da sociedade, para o
bem de todos, e não somente como um mero pro-
duto para um fim. É importante entender a rela-
ção entre os sistemas e as pessoas e saber como
lidar com as particularidades do ser humano.

Um exemplo prático disso é a discussão acerca


de dados e privacidade no mundo contemporâ-
neo. As pessoas geram muitos dados que são
úteis para empresas e cientistas de dados em
suas aplicações.

SOMOSTERA.COM 28
_
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA

Contudo, muitos desses dados carregam aspec-


tos da dignidade e dos direitos básicos dos seres
humanos. Nesse sentido, o tratamento dos dados
deve respeitar essa questão e estar alinhado a
esses princípios morais e éticos.

EVOLUÇÃO DAS
SOLUÇÕES DE DADOS
COM MLOPS

No processo de Data Science, existe a parte que


cuida do deploy de algoritmos de ML para uti-
lização em outras aplicações, a engenharia de
machine learning. Nesse sentido, o MLOps é
uma tecnologia importante, pois automatiza não
somente o fluxo de deploy e testes, como tam-
bém o treinamento e a preparação dos dados que
ocorre depois.

A pessoa que decide trabalhar com ciência de


dados entende no seu dia a dia que os modelos
perdem qualidade assim que terminam de ser de-
senvolvidos. Novas características surgem e
influenciam o que chamamos de degradação
do modelo. Para melhorar continuamente e ga-
rantir os melhores resultados com os testes e o
treinamento, é preciso usar as técnicas de MLOps.

SOMOSTERA.COM 29
_
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA

DATA
STORYTELLING

A comunicação é outro aspecto-chave do tra-


balho da pessoa que gerencia dados. Afinal, não
é só tratamento de dados e modelagens: o dia a
dia envolve comunicar os insights encontrados
de modo que eles gerem influência e cooperem
com as decisões tomadas. Ou seja, é necessário
traduzir uma linguagem de dados técnicos e
variáveis estatísticas de desempenho para
uma linguagem de negócios.

Para isso, temos o Data Storytelling. São técnicas


e boas práticas que ajudam a transformar estatís-
ticas, gráficos e relatórios complexos em histórias
interessantes de entender e de acompanhar. O
objetivo é ser o mais democrático possível ao es-
palhar o conhecimento para que todos consigam
compreender, de maneira clara e precisa.

SOMOSTERA.COM 30
_
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA

CONSTRUÇÃO
DE INTERFACES

Aliás, outro momento essencial para a finalização


do processo de Data Science é a construção de
interfaces e aplicações que contêm os modelos.
Em algumas organizações, esse processo é feito
por desenvolvedores front-end, mas em outros
casos, a pessoa cientista de dados mesmo ficará
encarregada disso. Ou seja: é bom ter essa habili-
dade também para se destacar no mercado.

Estamos falando do uso de ferramentas, como o


streamlit do Python, que ajudam a construir de
forma prática uma aplicação web para abrigar um
modelo e facilitar o uso por pessoas não técnicas.
Também envolve a conexão com dashboards para
comunicação dos resultados de forma automáti-
ca para decisores, por exemplo.

SOMOSTERA.COM 31
_
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA

CRIAÇÃO DE
PORTFÓLIO E
PREPARAÇÃO PARA
ENTREVISTAS

A pessoa na carreira de ciência de dados preci-


sa saber se portar como profissional. Isso inclui a
criação e organização de um portfólio com pro-
jetos pessoais e feitos incríveis que possam ser
mostrados em uma entrevista. Envolve também a
própria postura na entrevista, como uma boa ca-
pacidade de comunicação e de entendimento
dos aspectos que vão além do conhecimento
técnico.

Ou seja, se a pessoa já sabe traduzir números em


negócio na entrevista, esse é um bom indício de
que conseguirá transmitir bem os resultados e
realmente ajudar a empresa a crescer. Os entre-
vistadores vão gostar muito disso.

SOMOSTERA.COM 32
ALLAN DIEGUEZ

Head do Chapter
de Data Science
LuizaLabs

Expert do curso de
Data Science e Machine
Learning da Tera

[BÔNUS]
DICAS PARA PROCESSOS
SELETIVOS COM O
EXPERT ALLAN DIEGUEZ
DO LUIZALABS
_
[BÔNUS] DICAS PARA PROCESSOS SELETIVOS COM O EXPERT ALLAN DIEGUEZ

Para ganhar mais confiança durante uma tran-


sição de carreira, nada melhor do que receber
dicas estratégicas de especialistas na área. Por
isso, trouxemos algumas dicas do expert Allan
Dieguez, Head do Chapter de Data Science do
Luizalabs. Elas vão ajudar você a compreender as
fases da seleção de cientistas de dados e como
você pode se destacar.

SOMOSTERA.COM 34
_
[BÔNUS] DICAS PARA PROCESSOS SELETIVOS COM O EXPERT ALLAN DIEGUEZ

PREPARE SEU
CURRÍCULO PARA
A TRIAGEM

O primeiro passo da candidatura para uma vaga


de data scientist é o envio do currículo para ava-
liação. O expert Allan Dieguez explica que, nesse
momento, recrutadores olham se a pessoa real-
mente tem as habilidades de cientista de dados e
quais são os objetivos declarados no seu resumo
profissional. Se a pessoa nunca trabalhou na área,
não pode ser contratada para nível pleno, por
exemplo.

Seu currículo precisa deixar claro que você tem as


skills necessárias para atuar em Ciência de Dados.
Habilidades em Python, Machine Learning, SQL,
Análise de Dados e Estatística são fundamen-
tais, assim como projetos relevantes em Data
Science.

Estude sua Entenda seus Entenda mais sobre


candidatura. pontos fortes a empresa: qual
e fracos e sua o core business e
senioridade em nível de maturidade
relação à vaga. data driven em que
SOMOSTERA.COM ela se encontra. 35
_
[BÔNUS] DICAS PARA PROCESSOS SELETIVOS COM O EXPERT ALLAN DIEGUEZ

MOSTRE
ALINHAMENTO NA
ENTREVISTA DE FIT
CULTURAL

Para ter um bom desempenho nessa fase, Allan


Dieguez aponta que é necessário mostrar inte-
resse no modelo de negócio da empresa, aplicar
seus conhecimentos técnicos ao contexto da
empresa e se comunicar com habilidade.

“É importante mostrar que você


consegue conversar com diferentes tipos
de pessoas de forma simples e direta.
Eu quero um cientista de dados que
fale em português. Eu preciso que eles
sejam humanos. Você precisa traduzir
algo extremamente complexo e colocar
de forma simples o suficiente para que
qualquer pessoa entenda.”

SOMOSTERA.COM 36
_
[BÔNUS] DICAS PARA PROCESSOS SELETIVOS COM O EXPERT ALLAN DIEGUEZ

»» Escolha um projeto com aprendizados;

»» Explique de forma sucinta, caprichando


no storytelling;

»» Use o método STAR (Situação, Tarefa,


Ação, Resultado) como guia;

»» Atenção às perguntas do time.

SAIBA SE
COMUNICAR NA
ENTREVISTA TÉCNICA

A entrevista técnica também tem como meta ob-


servar como cada pessoa se comunica e explica
seus conhecimentos. É preciso saber se expressar
bem e controlar o nervosismo.

SOMOSTERA.COM 37
_
[BÔNUS] DICAS PARA PROCESSOS SELETIVOS COM O EXPERT ALLAN DIEGUEZ

“Eu quero saber o quanto a pessoa sabe


tecnicamente e o quanto ela se comunica
bem. Em uma entrevista técnica,
não é sobre se você saber fazer tudo
tecnicamente. É eu te colocar em um
ambiente controlado para se comunicar
com estranhos de conhecimento elevado
na área e ver se você não trava sob esse
tipo de pressão.”

»» Tente entender a pergunta antes


de responder;

»» Raciocine em voz alta, deixe seu


raciocínio ser percebido;

»» Escreva, desenhe, rabisque;

»» Mais de uma solução é bom, se pelo


menos uma funciona.

SOMOSTERA.COM 38
_
[BÔNUS] DICAS PARA PROCESSOS SELETIVOS COM O EXPERT ALLAN DIEGUEZ

MOSTRE COMO
TRABALHA NO
DESAFIO TÉCNICO

Se você passar pelas primeiras etapas, já está


muito perto da sua vaga de cientista de dados. A
última fase do processo seletivo é o desafio téc-
nico: um case proposto pela empresa, que precisa
ser resolvido por você ao longo de alguns dias, e
apresentado para o time em seguida.

Allan Dieguez ressalta que, além de avaliar o nível


técnico de quem está pleiteando a vaga de data
scientist, a etapa de case também quer enten-
der melhor como a pessoa se comunica e explica
seus raciocínios por trás do trabalho realizado. É
uma simulação do dia a dia do negócio.

SOMOSTERA.COM 39
_
[BÔNUS] DICAS PARA PROCESSOS SELETIVOS COM O EXPERT ALLAN DIEGUEZ

»» Crie hipóteses iniciais sobre o problema


para validar durante a solução;

»» Versione o projeto em uma estrutura que


facilite a reprodução;

»» Registre seus insights e descobertas


em um relatório;

»» Use ao máximo o storytelling para descrever


a solução e suas descobertas.

O mercado de Data Science está em constante


evolução e cheio de boas oportunidades, por isso,
garanta que você tem os conhecimentos e ferra-
mentas necessários para conquistar seu espaço.

SOMOSTERA.COM 40
CONCLUSÃO

As centenas de vagas para cientistas de dados em


aberto nos sites de recrutamento deixam claro que ain-
da existe uma lacuna a ser preenchida nesse mercado.
Faltam profissionais com a preparação necessária para
pleitear as oportunidades.

Em uma sociedade em que dados estão no centro das


decisões, das tecnologias inovadoras e das transfor-
mações positivas, precisamos que mais pessoas sejam
encorajadas e guiadas para ocupar esses espaços de
forma igualitária e representativa.

Esperamos que este e-book seja uma das ferramentas


para atingir este objetivo e que você consiga usá-lo de
forma estratégica na sua evolução em Ciência de Dados.

SOMOSTERA.COM 41
Seja estudando de forma independente ou fazendo um
curso completo que te ajude a adquirir todas as habili-
dades, agora você tem uma visão mais clara sobre essa
área e sobre o que o mercado está buscando.

Você pode contar com a Tera em sua jornada de de-


senvolvimento. Nosso novo curso de Data Science
e Machine Learning tem a proposta de levar você do
zero até a conquista da sua vaga. Com cerca de 500
horas de conteúdo, interações ao vivo com experts,
mentorias sobre carreira e empregabilidade e projetos
práticos assinados por grandes empresas, você poderá
dar passos confiantes nessa carreira promissora.

CONHEÇA O CURSO DE DATA SCIENCE

SOMOSTERA.COM 42
SOBRE A TERA

Somos mais do que uma escola, somos uma comunida-


de de pessoas apaixonadas por educação e tecnologia.

Acreditamos que um mundo melhor nasce do trabalho


de pessoas conscientes, responsáveis e corajosas que
se apropriam da tecnologia para servir ao coletivo.
EQUIPE EDITORIAL

Redação
Rebeca Nascimento e Gabriel Sacramento

Direção de arte
Tatiane Rocha

Diagramação
Leear Martiniano

Apoio de conteúdo
Ana Paula Lafuente, Victor Morganti e Allan Dieguez
SOMOSTERA.COM
SOMOSTERA.COM 45

Você também pode gostar