Escolar Documentos
Profissional Documentos
Cultura Documentos
IHA Cappralab-M
IHA Cappralab-M
Ricardo Cappra
Fundador do Cappra Institute for Data Science
Aspirantes analíticos 13
INSIGHT #3
CEO Data-Driven 25
A primeira análise feita foi sobre o nível de entrada dos profissionais nas empresas. Das
organizações que especificaram esse nível, identificamos que 11.15% são nível Jr., 44.27%
Pleno e 44.58% Sênior conforme a Fig.1.
Algumas vagas já são divulgadas com opção de trabalho remoto ou híbrido. Fruto
da pandemia, 7.6% das vagas disponibilizam essa flexibilidade com destaque para
10% das vagas de cientista de dados, conforme mostrado na Fig.3. Isso representa a
possibilidade desses profissionais atingirem as organizações independentemente da
localização geográfica. Além disso, pode-se interpretar que o impacto dos profissionais
analíticos é escalável.
A primeira análise feita foi sobre o nível de entrada dos profissionais nas empresas. Das
organizações que especificaram esse nível, identificamos que 11.15% são nível Jr., 44.27%
Pleno e 44.58% Sênior conforme a Fig.1.
Os principais setores que divulgaram as vagas estudadas são mostrados na Fig.4. Para
cada profissão, a porcentagem das vagas está dividida pela área da empresa. O setor de
tecnologia é o que mais procura profissionais data-driven, sendo, em média, 50.75% das
empresas analisadas. Em segundo lugar, em média, 19.10% das empresas são de finanças.
Essa relação entre setores financeiros e de dados têm sido acentuada pela grande
tendência de digitalização do setor. Em 2020, o número de fintechs cresceu 34% [6],
unindo tecnologia e setor bancário para prover soluções para o consumidor. Em paralelo,
a implementação da LGPD acelerou a necessidade de tratamento e gerenciamento de
dados em todas as áreas. Isso acentuou a demanda de profissionais com capacidade de
trabalhar com dados ou empresas especializadas para adequação à nova lei de proteção
de dados.
As principais hard skills que as vagas de emprego estudadas têm como critério de
seleção são mostradas na Fig.5. A hard skill mais requisitada é conhecimento em
SQL. Em 71% das vagas analisadas, a linguagem de consulta de base de dados torna-
se imprescindível para um profissional analítico. A segunda habilidade mais pedida é
também uma linguagem de programação. Python aparece em 58% das vagas e reflete
não apenas a necessidade dos times de dados manipular bases de dados, mas também
criar modelos, explorar hipóteses e automatizar tarefas.
Mas não são apenas as hard skills que fazem um profissional analítico um candidato. Soft
skills são as habilidades comportamentais e competências subjetivas do profissional,
sendo as mais requisitadas nos anúncios de vagas representadas na Fig.6.
Ao sumarizar os resultados que esta pesquisa extraiu dos anúncios das vagas de emprego
para profissionais analíticos, é possível traçar um perfil do candidato ideal. Ao focarmos
nas habilidades técnicas, vemos que a prioridade é o conhecimento em tecnologia e
linguagens de programação. Ao mesmo tempo, as habilidades comportamentais mais
buscadas, são em relação ao pensamento analítico e capacidade de traduzir as análises
para as outras pessoas do time de dados. A dualidade da busca por capacitações mais
técnicas e, ao mesmo tempo, por habilidades comportamentais mais comunicativas
demonstra um nível de exigência elevado dos candidatos e, consequentemente, nas
empresas.
Podemos ver que há uma disparidade entre oferta e demanda de forma generalizada.
As habilidades mais técnicas como SQL, Python e Machine Learning são as que mais se
diferem da expectativa das empresas com a realidade dos profissionais que responderam
a pesquisa. Este desequilíbrio é um reflexo da falta de compreensão por parte das
lideranças do que é um profissional analítico. Este profissional é um membro de um time
de dados, com habilidades e competências que complementam as de seus colegas.
Esperar e exigir uma abrangência excessiva de habilidades de um único profissional não é
realista. Dificilmente algum profissional demonstrará proficiência em todas as principais
habilidades requisitadas, essa pessoa dificilmente existe. Portanto, o profissional não será
capaz de suprir toda a demanda da empresa sozinho.
Atualmente, a realidade com a qual temos que lidar é a seguinte: criamos tecnologias
incríveis e geramos muitos dados sobre nós e nossos trabalhos, temos mais dados sendo
gerados do que informações qualificadas sendo extraídas. Mais do que um desperdício,
isso está se transformando em oportunidades para novos transeuntes no campo da
ciência de dados. Os aspirantes analíticos de hoje têm à sua disposição uma gama de
ferramentas e de conhecimentos teóricos pré-estabelecidos, construídos e registrados
pelos cientistas que já trilharam seus caminhos. Milhares de repositórios de dados,
ferramentas e cursos estão disponíveis, e a inteligência do aspirante funciona de lanterna
guia para sua orientação nesse campo tão aberto. Apesar do trabalho com dados envolver
práticas fechadas e determinísticas, afinal estamos falando de um campo que, em sua
essência, é quantitativo, a abordagem ao redor desses dados parte da visão subjetiva da
pessoa que se aproxima deles. Múltiplas técnicas para transformar dados em informação
existem, as influências científicas e culturais, assim como os desafios prévios enfrentados
ao longo da vida do profissional, irão desenhar seus processos decisórios internos que
levarão a uma trilha de desenvolvimento de habilidades, sejam elas mais voltadas para o
lado analítico científico/matemático, visual, ou linguístico. Os passos iniciais na jornada
de interessados em adentrar ao mundo dos dados nunca são os mesmos, mas
padrões podem ser observados.
Nesse sentido, nossa experiência nos permitiu então desenhar arquétipos de personalidade
generalizados, na intenção de dar um empurrão aos aspirantes que precisam se enxergar
como analíticos de fato. Considerando os principais campos do conhecimento analítico:
Business, Tech & Science, categorizamos algumas personalidades frequentemente
encontradas nesta etapa.
Viajantes
O mundo é a sua casa, e você se sente confortável passando
por múltiplas áreas e entendendo as interações entre elas.
Você realiza a ponte de troca de dados entre departamentos
e garante que informações chave não se percam no caminho.
Showman
Você mostra como se faz. Você é um expoente da cultura
analítica dentro da sua organização, e prova que ser
orientado por dados traz retornos positivos. Você ajuda na
estruturação dos processos e a reduzir o uso do feeling.
Construtor
Uma estrutura mal fundamentada corre riscos e você sabe disso.
Você preenche as lacunas de fraqueza e habilita o time a aplicar
processos orientados por dados com mais segurança.
Alquimista
Você transforma dados em ouro. Você se importa menos com o estilo
e mais com a substância. Seu grande leque de técnicas estatísticas
e conhecimento de ferramentas aumenta sua percepção do que os
dados podem falar, elevando o nível das análises do time.
Nenhum desses arquétipos é uma profissão real e isto é proposital: não estamos falando
de caixas, mas de padrões de personalidades que observamos continuamente em nossas
atividades e, ainda, nenhuma pessoa é a mesma para sempre. Nosso conselho é que você
utilize essa indicação para se identificar e se orientar e, ao mesmo tempo, que conheça as
outras personalidades que encontrará ao longo de sua carreira profissional. Talvez você seja
exatamente um destes, ou mais de um ao mesmo tempo, ou nenhum destes exatamente,
mas você provavelmente enxergará esses padrões nas empresas e departamentos que
passará. Se acostume, depois de trabalhar com dados, enxergar padrões em tudo é inevitável.
Não é de hoje, que lideranças de várias empresas, buscam decifrar quais são os skills
necessários para um profissional que atua na área de Ciência de Dados. Muitos já
foram e ainda são as habilidades necessárias para quem quer entrar nesse mercado
tão competitivo. Quando comecei minha trajetória nessa área, me lembro que a lista
envolvendo habilidades técnicas era enorme - saber programar em, no mínimo, umas
03 linguagens era uma habilidade fundamental. E sim, eu aprendi a programar, mas, ao
longo do tempo, durante minhas interações com outras empresas e profissionais aqui no
Instituto, percebi que essa não era a skill mais importante de se ter. E quais são os skills
necessários, então? É possível atuar na área de ciência de dados e não saber programar?
Nesse sentido, resolvi compartilhar um pouco da minha visão para responder essas e
algumas outras perguntas.
Existe um mito que, para se trabalhar com ciência de dados, é necessário ter um
conjunto técnico de conhecimentos muito grande, sendo que essa lista aumenta ano
após ano, com o lançamento de novas tecnologias e ferramentas. Contudo, de um
tempo para cá, estamos ouvindo falar muito sobre a importância de soft skills na ciência
de dados e termos como no code ou low code estão passando a fazer parte do nosso
cotidiano. Diante desse cenário, o que eu devo aprender? Que tipo de profissional eu devo
contratar? Há um equilíbrio entre as habilidades mais e menos técnicas? Sendo bem
objetiva e dando uma resposta que talvez você não vá gostar de escutar: tudo depende
do problema de negócio a ser resolvido e do objetivo. Mas, o que isso significa? Isso
significa que não existe uma receita de bolo pronta, que cada problema de negócio pode
demandar um conjunto de habilidades diferentes.
-Iniciando pelo segundo quadrante, se eu tenho uma alta curiosidade, mas não analiso
os dados, tenho o cenário de formulação de novas hipóteses, à medida que faço
questionamentos, mas não os exploro/valido.
-Contudo, se eu analiso os dados, mas não exploro minha capacidade de ser curioso,
acabo chegando a conclusões enviesadas e superficiais, à medida que não explorei as
diversas vertentes que um problema possui.
-Por fim, se eu alio minha capacidade de ser curioso, questionar, criticar, à análise de
dados, tenho o cenário de melhores decisões, pois, além de formular hipóteses, eu
analiso os dados para conseguir chegar em uma decisão mais assertiva.
Imagine que minha pergunta de negócio é o input do meu modelo e se eu fizer uma pergunta “ruim”
(muitas vezes vaga ou enviesada demais), meu resultado não será tão bom. Ou seja, a qualidade do meu
produto, meu output, está completamente relacionada à qualidade das minhas perguntas. Pensando
em um algoritmo, por exemplo, ele vai executar exatamente aquilo que estiver escrito no código.
Resumindo e detalhando o gráfico acima: quanto mais curioso você for, mais perguntas de negócio
você fará e, consequentemente, maiores serão as chances de se desenvolver produtos de dados mais
assertivos, que estejam em linha com os objetivos e problemas reais do negócio, resultando, por fim,
em melhores decisões.
Então, sempre que você pensar nas habilidades que um profissional de ciência de dados deve ter, ou até
mesmo nas suas próprias competências, lembre: o coração da ciência de dados é sempre ser curioso
e nunca deixar de fazer perguntas. Quais são as principais decisões que eu tomo no meu dia a dia? Eu
estou chegando na causa raiz desse problema? Seja curioso e sempre questione, pois a decisão de hoje
pode não ser a mesma de amanhã!
É inegável que as pessoas já entenderam a importância de analytics, contudo o que ainda vemos é um
percentual altíssimo de projetos relacionados a dados falhando, seja algo perto dos 85% levantados por
Nick Heudecker em 2017 [4] ou dos 77% que apareceram na pesquisa da New Vantage Partners em 2019
[5]. Pensando nisso, o que a grande maioria das empresas tem feito é buscar profissionais que atuem
nessa área de dados para ajudar nesta tarefa. Todavia, algumas perguntas acabam surgindo diante dessa
baixa taxa de sucesso na realização desses projetos. Por que mesmo tendo times de dados os projetos
continuam falhando? Quais as principais habilidades estão faltando para resolver este problema? Como
um profissional de dados pode ajudar? Quais caminhos uma pessoa que deseja se tornar mais analítico
deve percorrer?
O que vemos hoje é uma enxurrada de vagas de trabalho e cursos que tentam suprir a falta desses
profissionais no mercado e, quando analisamos essas oportunidades ou a grade curricular dos cursos,
como citado por Gabriel Figlarz[2] em seu artigo “Decodificando Profissionais Analíticos”, encontramos um
padrão onde quase todas as habilidades listadas são técnicas, comumente citadas como hard skills, que
passam por conhecimentos em matemática, estatística, softwares, linguagens de programação, técnicas
de manipulação de dados, bancos de dados, entre outras. A dúvida que não quer calar é: será que essas
são as habilidades que deveriam estar nas buscas do profissional analítico do futuro? Nossa experiência
ao longo dos anos, em diversas empresas e projetos, mostra que não, já que os principais problemas
acontecem na comunicação, no relacionamento entre as áreas, curiosidade sobre o assunto, paixão por
aprender e tantas outras habilidades que chamamos de soft skills.
Durante os últimos anos, nos deparamos com diversos projetos de dados, em empresas dos mais
diversos tipos pelo Brasil e pelo mundo que não deram certo ou foram engavetados. Diante desse
cenário, tentamos então, entender quais habilidades poderiam minimizar ou evitar a falha destes projetos.
Os principais pontos a serem desenvolvidos são:
-Pouca curiosidade, porque diferente do que muitos pensam, trabalhar com dados exige curiosidade
e criatividade para buscar soluções, se aprofundar no entendimento dos problemas e muitos outros
pontos levantados pela Anna Cristina Rezende Braga[1] em seu artigo “Curiosidade Data-Driven”.
-Pensamento analítico, talvez o mais importante e difícil de resolver já que envolve uma mudança de
pensamento, da forma como as rotinas são executadas e, num primeiro momento, isso leva tempo e
gera desconforto nas pessoas que têm resistência a mudanças.
-Falta de conhecimento técnico é apenas o último motivo pelo qual vemos os projetos falharem. Em
geral acontece por se estar trabalhando com algo muito complexo ou novo, que envolve pesquisas e se
está na borda do conhecimento, ou mais comumente pela falta de uma hard skill. Nesse cenário temos
um problema menos complexo para ser resolvido, já que é possível contratar um terceiro ou aprender
uma nova hard skill para executar a tarefa.
Pensando nisso deixo aqui algumas sugestões para auxiliar no momento da estruturação de um time de
dados ou da decisão de onde investir o tempo estudando para criar projetos de dados:
1- Antes de contratar ou juntar pessoas em um time, entenda quais problemas a empresa está tentando
resolver. Se isso não estiver claro e com objetivos definidos, a chance de entregas de valor do time,
pessoas descontentes e produtos que não servem para nada é enorme. Dê um passo atrás e defina com
precisão os problemas, mesmo que para isso seja necessário uma consultoria externa.
2- Busque pessoas que tenham as soft skills desejadas para trabalhar com o time e que uma delas
seja a curiosidade e a vontade de aprender, pois é bem mais difícil ensinar uma soft skill do que uma
hard skill. Uma informação útil para se lembrar é que para se tornar um expert em uma nova habilidade
existem estudos dizendo que são necessárias 10.000 horas de dedicação. Porém, como Josh Kaufman
[3] nos conta, é que em apenas 20 horas já é possível aprender uma nova habilidade e isso me leva ao
ponto de entender quando é melhor contratar ou treinar pessoas nas hard skills.
3- Mapeie as tarefas que precisam ser executadas entendendo o que é necessário para executá-las e
depois tente incluir dados em todos os passos possíveis. Isso vai ajudar a medir o processo, seja para
entender sua performance ou para auxiliar na tomada de decisão, então não tenha medo de entrar nos
detalhes de como um processo é executado, pois só assim é possível melhorar a comunicação e inovar.
4- Quebre cada problema que aparecer em partes - problemas muito grandes são difíceis de se
resolver, enquanto problemas pequenos podem ser facilmente resolvidos por um indivíduo ou um time
multidisciplinar.
5- Entendo o processo/problema, junte pessoas que tenham habilidades complementares para resolver
o que precisa. Pode parecer óbvio, mas se não tiver passado pelos dois passos anteriores isso pode
parecer bem mais difícil, desgastante e improdutivo do que realmente é.
6- Se precisasse escolher apenas uma habilidade para o futuro de qualquer profissão, essa seria
“aprender”. Aprender a aprender, deixar seus vieses de lado e se abrir para aprender coisas novas, isso
não apenas te levará a solucionar os problemas de forma mais rápida como auxiliará em todos os
pontos que levantamos como principais para um projeto falhar.
Depois de ter passado por algumas dicas, como mensagem final gostaria de deixar o pensamento que
ser uma empresa data-driven não depende de montar uma área de dados, até porque essa é uma área
que nasce pronta para morrer. Para uma empresa se tornar data-driven, todas as pessoas precisam ser
mais analíticas.
Com a construção destas novas estruturas surge um ponto forte, quem deve liderar
estes times? Estes times não possuem um histórico ou uma determinação clara de
como devem entregar valor ao negócio, seu papel é gerar a mudança e levar dados para
os tomadores de decisão. Desta forma, a liderança precisa conseguir navegar entre estes
dois mundos: o mundo da tecnologia e o mundo dos negócios. Sem essa capacidade a
área vai encontrar muitas dificuldades no momento de entregar valor ao negócio.
Esta é uma definição que não está clara para as organizações no momento. Grande parte
delas não possuem recursos com hard skills (skills em database, data mining e analytics)
e, desta forma, não sabem como procurar tais habilidades pelo mercado. A tendência
acaba sendo alocar este projeto de contratação a uma área de negócio considerada mais
analítica ou a um time técnico como BI e TI, que insistem que esta nova área deve ser
absorvida pela sua estrutura por motivos políticos.
A contratação de pessoas com habilidades extremamente técnicas faz com que estes
líderes montem times fortes em hard skills, mas que não conseguem se conectar aos
negócios. Estas áreas focam em estabelecer processos de dados que, em muitos casos,
deveriam fazer parte de um escopo de TI e constroem soluções que eles entendem que
o negócio deveria utilizar. O negócio, por não possuir um conhecimento técnico, por não
conseguir entender o processo que foi realizado e por não conseguir direcionar o time de
dados acaba não utilizando as soluções levantadas. Este ciclo se repete até que alguém
se envolva e redesenhe os processos para aproximar negócios e dados, começando,
então, a geração de valor.
Então, como podemos evitar esta situação? A resposta disso está no perfil do líder de
times analíticos.
Knowledge of the Business – O líder da área de dados não deve ser um especialista
em todas as áreas de negócio da organização. A liderança precisa se familiarizar com
os processos da empresa e entender o fluxo de trabalho e conexões entre as áreas.
Entender sobre como uma área impacta a outra é muito mais importante do que
entender exatamente todos os detalhes do funcionamento de uma área em específico.
Desta forma, podemos entender que é mais importante que a liderança entenda os
conceitos e o que é necessário para a construção de soluções, do que necessariamente
ser capaz de construir modelos avançados sozinhos. A capacidade operacional é
suportada pelo time, mas o processo de visão e estratégia são desenhados pela liderança
e se esta liderança não consegue se conectar com o negócio, nunca será possível gerar
valor tangível para o mesmo.
O perfil do CEO (Chief Executive Officer) mudou por causa da transformação digital.
Por muitos anos, o principal diferencial das lideranças de negócios se concentrava em
identificar talentos para posições estratégicas, orquestrar um equilíbrio entre resultados
e custos e promover a visão institucional para dentro e fora da empresa, enquanto
o conhecimento sobre tecnologia era responsabilidade da liderança de cada área.
Contudo, a tecnologia deixou de ser uma competência especialista e passou a ser um
pilar fundamental para todo o negócio junto dos pilares de pessoas e processos. Para as
organizações sobreviverem nessa era da informação, além da eficiência necessária nos
processos e da preocupação com a performance das pessoas, a base tecnológica, agora,
também é uma premissa fundamental. Obviamente a tecnologia não é uma novidade,
mas o fato dela ter se tornado imprescindível, em alguns mercados é inclusive o principal
diferencial competitivo, é algo novo e já ocupa grande espaço na agenda dos executivos
que lideram organizações ao redor do mundo todo.
A função de CEO sempre exigiu um olhar data-driven. Uma tomada de decisão orientada
por dados é uma exigência para alguém que costuma lidar com ambientes complexos com
muitas pessoas envolvidas, onde processos são observados de uma certa distância em
razão da escassez de tempo do líder e da necessidade de relacionar-se em um ambiente
extremamente político. Por tudo isso, lidar com dados e informações já são parte da
tomada de decisão do CEO. Contudo, muitas vezes, outros líderes do nível c-level não
possuem essas mesmas características: alguns podem ter um foco especial nas pessoas
e na cultura, enquanto outros podem ter um conhecimento e relacionamento com o
mercado que supera qualquer outra coisa, dentre outras habilidades especiais, mas podem
deixar enfraquecida a relação com dados ao decorrer de suas formações profissionais.
Afinal, exemplificando, 10 anos atrás dizer que uma área de Recursos Humanos usaria um
algoritmo para pré-selecionar os candidatos às vagas da empresa seria um insulto, sendo
que hoje isso já é uma realidade em muitas organizações. Líderes que atuam na posição
de CEO precisaram “delegar” a função do olhar data-driven para esses pares, criando
assim uma nova forma de olhar para o negócio, onde toda a liderança precisa consumir
informação de forma ágil e mensurar os resultados instantaneamente, sempre com o apoio
da tecnologia para ser mais eficiente nesse processo.
1- Anna C. R. Braga, 2021, “Curiosidade Data-Driven”, Cappra Institute for Data Science
(http://cappra.institute/iha)
2- Gabriel Figlarz, 2021, “Decodificando profissionais analíticos”, Cappra Institute for Data
Science (http://cappra.institute/iha)
3- Josh Kaufman, 2013/2019, “Don’t have 10,000 hours to learn something new? That’s
fine — all you need is 20 hours”, TED (https://ideas.ted.com/dont-have-10000-hours-to-
learn-something-new-thats-fine-all-you-need-is-20-hours/)
4- Matt Asay, 2017, “85% of big data projects fail”, TechRepublic, November (https://www.
techrepublic.com/article/85-of-big-data-projects-fail-but-your-developers-can-help-
yours-succeed/).
6- Rui Maciel, 10/2020, “ Setor de Fintechs cresceu 34% no Brasil em 2020”, Canal Tech
https://canaltech.com.br/startup/setor-de-fintechs-cresceu-34-no-
brasil-m-2020-172778/
Alguns dos textos estão usando dados devidamente referenciados. Nos demais casos, os textos
são visões proprietárias dos analistas do Cappra Institute for Data Science.
Equipe Responsável