Você está na página 1de 37

Estudo de caso: novas perspectivas de

dados
Como você aprendeu, é possível encontrar dados em praticamente qualquer lugar.
Sempre que você observa e avalia algo no mundo, está coletando e analisando
dados. Sua análise ajuda a encontrar maneiras mais fáceis de realizar tarefas,
identificar padrões para economizar seu tempo e descobrir novas perspectivas
surpreendentes que podem mudar completamente a maneira como você vivencia
tudo.

Veja aqui um exemplo real de como um grupo de analistas de dados usou as seis
etapas do processo de análise de dados para melhorar o local de trabalho e os
processos de negócios. A história deles envolve algo chamado análise de pessoas,
também conhecida como análise de recursos humanos ou da força de trabalho. A
análise de pessoas é a prática de coletar e analisar dados sobre as pessoas que
compõem a força de trabalho de uma empresa com o objetivo de receber insights
para melhorar a forma como a empresa opera.

Ser um analista de pessoas envolve o uso de análise de dados para receber insights
sobre os funcionários e como eles vivenciam as vidas profissionais. Os insights são
usados para definir e criar um local de trabalho mais produtivo e incentivador. Isso
pode liberar o potencial dos funcionários, motivá-los a ter o melhor desempenho
possível e garantir uma cultura empresarial justa e inclusiva. 

As seis etapas do processo de análise de dados que você aprendeu neste programa
são: perguntar, preparar, processar, analisar, compartilhar e agir. Essas seis
etapas se aplicam a qualquer análise de dados. Continue lendo para aprender como
uma equipe de analistas de pessoas usou essas seis etapas para responder a uma
pergunta de negócios.

Uma organização tinha uma taxa de rotatividade alta entre as contratações novas.
Muitos funcionários deixavam a empresa antes do fim do primeiro ano de trabalho.
Os analistas usaram o processo de análise de dados para responder à seguinte
pergunta: como a organização pode melhorar a taxa de retenção de funcionários
novos? 

Veja aqui um resumo do que essa equipe fez, passo a passo.

PERGUNTAR
Em primeiro lugar, os analistas precisavam definir como seria o projeto e o que seria
um resultado de êxito. Portanto, para determinar isso, eles fizeram perguntas
eficazes e colaboraram com líderes e gerentes interessados no resultado da análise
do pessoal. Estes foram os tipos de pergunta que eles fizeram:

 O que você acha que os funcionários novos precisam aprender para ter
sucesso no primeiro ano de trabalho?
 Você já coletou dados de funcionários novos antes? Em caso afirmativo,
podemos ter acesso aos dados históricos?
 Você acredita que os gerentes com taxas de retenção maiores oferecem algo
extra ou exclusivo aos funcionários novos?
 Qual você acha que é a principal causa de insatisfação entre os funcionários
novos?
 Em que porcentagem você gostaria que a retenção de funcionários
aumentasse no próximo ano fiscal?

PREPARAR

Tudo começou com uma preparação sólida. O grupo criou um cronograma de três
meses e decidiu como queria transmitir o progresso às partes interessadas. Também
durante essa etapa, os analistas identificaram quais dados precisavam para atingir o
resultado bem-sucedido que identificaram na etapa anterior. Nesse caso, os
analistas optaram por coletar os dados de uma pesquisa on-line com funcionários
novos. Eles desenvolveram perguntas específicas sobre a satisfação dos funcionários
com diferentes processos de negócios, como contratação e integração, e a
remuneração geral deles. Foram estabelecidas regras para quem teria acesso aos
dados coletados. Nesse caso, nenhuma pessoa fora do grupo teria acesso aos dados
brutos, mas poderia visualizar os dados resumidos ou agregados. Por exemplo, a
remuneração de um indivíduo não estaria disponível, mas as faixas salariais para
grupos de indivíduos seriam visíveis. Eles finalizaram com quais informações
específicas seriam coletadas e a melhor forma de apresentar os dados visualmente.
Os analistas discutiram ideias sobre possíveis problemas relacionados a projetos e
dados e como evitá-los.
PROCESSAR

O grupo enviou a pesquisa. Grandes analistas sabem respeitar os dados e as pessoas


que os fornecem. Como foram os funcionários que forneceram os dados, era
importante garantir que todos os funcionários tinham concordado em participar. Os
analistas de dados também garantiram que os funcionários entendessem como os
dados deles seriam coletados, armazenados, gerenciados e protegidos. Para manter
a confidencialidade, proteger e armazenar os dados de modo eficaz, o acesso ficou
restrito a um número limitado de analistas. Coletar e usar dados de maneira ética é
uma das responsabilidades de um analista de dados. Em seguida, os dados foram
limpos para garantir que estivessem completos e corretos e que eram relevantes.
Certos dados foram agregados e resumidos sem revelar respostas individuais. Os
dados brutos foram carregados em um armazenamento de dados interno para
garantir uma camada extra de segurança.

ANALISAR

Então, os analistas fizeram o que sabem fazer de melhor: analisar. Pelas pesquisas
concluídas, os analistas de dados descobriram que a experiência de um funcionário
novo com certos processos era um indicador-chave da satisfação geral com o
trabalho. Os analistas descobriram que os funcionários que passavam por um
processo de contratação longo e complicado tinham maior probabilidade de deixar
a empresa. Os funcionários que passavam por um processo de avaliação e feedback
eficiente e transparente tinham maior probabilidade de permanecer na empresa. O
grupo sabia que era importante documentar exatamente o que haviam encontrado
na análise, não importando os resultados. Fazer de outra forma diminuiria a
confiança no processo da pesquisa e reduziria a capacidade de coletar dados
verdadeiros dos funcionários no futuro.

COMPARTILHAR

Assim como se certificaram de que os dados estivessem cuidadosamente protegidos,


os analistas também tiveram cuidado no momento de compartilhar o relatório.
Apenas os gerentes que atingiram ou ultrapassaram o número mínimo de
subordinados diretos com respostas enviadas à pesquisa estavam qualificados para
receber o relatório. Primeiro, o grupo apresentou os resultados aos gerentes
qualificados para ter certeza de que eles tinham a visão completa. Em seguida,
pediram que entregassem os resultados às equipes. Isso deu aos gerentes a
oportunidade de comunicarem os resultados no contexto certo. Assim, eles
poderiam ter conversas produtivas com a equipe sobre as próximas etapas para
melhorar o envolvimento dos funcionários.

AGIR

A última etapa do processo para a equipe de analistas foi trabalhar com os líderes da
empresa e decidir a melhor forma de implementar as mudanças e agir com base nas
descobertas. Os analistas recomendaram padronizar o processo de contratação e
avaliação de todas as contratações novas com base nas práticas mais eficientes e
transparentes. Um ano depois, a mesma pesquisa foi distribuída aos funcionários. Os
analistas anteciparam que uma comparação entre os dois conjuntos de resultados
indicaria que o plano de ação funcionou. Acontece que as mudanças melhoraram o
índice de retenção de funcionários novos e as ações das lideranças foram bem-
sucedidas.

A análise de pessoas é certa para você?


Um dos muitos itens que tornam a análise de dados tão empolgante é que os
problemas são sempre diferentes, as soluções precisam de criatividade e o impacto
sobre os outros pode ser grande, até mesmo para mudar ou salvar vidas. Como
analista de dados, é possível fazer parte desses esforços. Talvez você até sinta
inspiração para aprender mais sobre o campo da análise de pessoas. Se for o seu
caso, considere aprender mais sobre esse campo e incluir essa pesquisa em seu
diário de análise de dados. Nunca se sabe: em breve, você poderá ajudar uma
empresa a criar um ambiente de trabalho incrível para você e seus colegas!

Recurso adicional
Para saber mais sobre algumas aplicações recentes da análise de dados no mundo
dos negócios, consulte o artigo “Quatro exemplos de análise de negócios em ação”
da Harvard Business School.  No artigo, o autor revela como as empresas usam
insights de dados para otimizar o processo de tomada de decisões. O primeiro
exemplo do artigo contém um pequeno erro no segundo parágrafo, mas o exemplo
ainda é válido.
Correção do artigo em negrito abaixo: A equipe do Workplace Analytics da Microsoft
levantou a hipótese de que mudar o grupo de 1.200 pessoas de cinco prédios para
quatro poderia melhorar a colaboração, com o aumento do número de funcionários
por prédio e a redução da distância que a equipe precisava percorrer para
comparecer às reuniões. 

Dados e instinto
Detetives e analistas de dados têm muito em comum. Os dois grupos dependem de
fatos e pistas para tomar decisões. Ambos coletam e examinam as evidências. Os
dois conversam com pessoas que conhecem parte da história. E ambos podem até
seguir algumas pistas para ver aonde elas levam. Seja você um detetive ou um
analista de dados, seu trabalho consiste em seguir etapas para coletar e
compreender fatos.

Os analistas usam a tomada de decisões com base em dados e seguem um processo


passo a passo. Você aprendeu que há seis etapas nesse processo:

1. Fazer perguntas e definir o problema.


2. Preparar os dados, coletando e armazenando as informações.
3. Processar os dados, limpando e verificando as informações.
4. Analisar os dados para encontrar padrões, relações e tendências.
5. Compartilhar dados com seu público.
6. Agir com base nos dados e usar os resultados da análise.
No entanto, há outros fatores que influenciam o processo de tomada de decisões.
Você pode ter lido histórias de mistério em que o detetive usava o instinto e seguia
um palpite que o ajudava a resolver o caso. Instinto é uma compreensão intuitiva de
algo com pouca ou nenhuma explicação. Nem sempre isso é algo consciente. Com
frequência, captamos os sinais sem nem perceber. Você apenas tem uma “sensação”
de que tem razão.
Por que o instinto pode ser um problema
Os dados estão no centro da tomada de decisões com base em dados. Portanto, é
essencial que os analistas de dados se concentrem nos dados para garantir que
tomem decisões informadas. Se você ignorar os dados, preferindo tomar decisões
com base na própria experiência, elas poderão ser tendenciosas. Mas, pior ainda,
decisões com base no instinto e sem nenhum dado para apoiá-las podem causar
erros.

Pense no exemplo de uma licitação de uma incorporadora imobiliária para


reconstruir uma parte do distrito central de uma cidade. Ela era conhecida pela
preservação de edifícios históricos. Com base na reputação que tinha, os
planejadores da agência seguiram o instinto e incluíram a preservação de vários
edifícios para conseguir apoio e aprovação para o projeto. No entanto, as doações
privadas ficaram aquém e nenhuma parceria chegou a tempo para resolver a
situação. Depois de muito atraso e uma cara disputa com a cidade, os edifícios
tiveram de ser demolidos.

Quanto mais você entender os dados relacionados a um projeto, mais fácil será
descobrir o que é necessário. Esses esforços também ajudarão a identificar erros e
lacunas nos dados para conseguir comunicar as descobertas com mais eficácia. Às
vezes, a experiência anterior ajuda você a fazer uma conexão que ninguém mais
notaria. Por exemplo, um detetive pode resolver um caso porque se lembra de outro
antigo igual ao que está resolvendo no momento. Isso não é apenas instinto.

Dados + conhecimento dos negócios = mistério resolvido


Combinar dados com conhecimento de negócios e talvez com um toque de instinto
será uma parte comum do seu processo como analista de dados júnior. A chave é
descobrir a combinação exata para cada projeto específico. Muitas vezes, isso
dependerá das metas de sua análise. É por isso que os analistas costumam
perguntar: “Como posso definir o sucesso desse projeto?”.

Além disso, tente fazer estas perguntas sobre um projeto para ajudar a encontrar o
equilíbrio perfeito:

 Que tipo de resultado é necessário?


 Quem será informado?
 Estou respondendo à pergunta que está sendo feita?
 Com que rapidez uma decisão precisa ser tomada?
Por exemplo, se você estiver trabalhando em um projeto urgente, talvez precise
confiar em seu próprio conhecimento e em sua experiência mais do que o normal.
Não há tempo suficiente para analisar completamente todos os dados disponíveis.
No entanto, se você tiver um projeto que envolva muito tempo e recursos, a melhor
estratégia será se basear mais nos dados. Cabe a você, como analista de dados, fazer
a melhor escolha possível. Provavelmente, você combinará dados e conhecimento
de um milhão de maneiras diferentes ao longo da carreira em análise de dados.
Quanto mais você praticar, melhor encontrará a combinação perfeita. 

Origens do processo de análise de dados


Quando você decidiu aderir a este programa, provou ser uma pessoa curiosa.
Portanto, vamos explorar sua curiosidade e falar das origens da análise de dados.
Não sabemos totalmente quando ou por que a primeira pessoa decidiu registrar
dados sobre pessoas e coisas. Mas sabemos que isso foi útil, porque a ideia existe
ainda hoje.  

Também sabemos que as raízes da análise de dados estão na estatística, que


também têm uma história longa. Os arqueólogos consideram a construção das
pirâmides, no antigo Egito, como o início da estatística. Os egípcios antigos eram
mestres na organização de dados. Eles documentaram os cálculos e as teorias em
papiros (materiais semelhantes a papel), que agora são vistos como os primeiros
exemplos de planilhas e listas de verificação. Os analistas de dados atuais devem
muito a esses escribas brilhantes, que ajudaram a criar um processo mais técnico e
eficiente.

É hora de entrar no ciclo de vida da análise de dados, o processo de ir dos dados à


decisão. Os dados passam por várias fases conforme são criados, consumidos,
testados, processados e reutilizados. Com um modelo de ciclo de vida, todos os
principais membros da equipe podem alcançar o sucesso, planejando o trabalho
tanto no início quanto no fim do processo de análise de dados. O ciclo de vida da
análise de dados é bem conhecido entre os especialistas, mas não existe uma única
estrutura definida dessas fases. Pode não haver uma única arquitetura
uniformemente seguida por todos os especialistas em análise de dados, mas há
alguns fundamentos compartilhados em todos os processos de análise de dados.
Neste texto, fornecemos uma visão geral de vários deles, começando com o
processo que constitui a base do Certificado de Análise de Dados do Google.

O processo apresentado como parte do Certificado de Análise de Dados do Google é


valioso à medida que você avança na carreira:

1. Perguntar: pergunta/objetivo/desafio de negócios


2. Preparar: geração, coleta, armazenamento e gerenciamento de dados
3. Processar: limpeza/integridade de dados
4. Analisar: exploração, visualização e análise de dados
5. Compartilhar: comunicação e interpretação de resultados 
6. Agir:  aplicação dos insights com o objetivo de resolver o problema
Compreender esse processo (e todas as iterações que ajudaram a torná-lo
conhecido) será uma grande parte na orientação de sua própria análise e de seu
trabalho neste programa. Vamos examinar algumas outras variações do ciclo de vida
da análise de dados.

Ciclo de vida da análise de dados da EMC


O ciclo de vida da análise de dados da EMC Corporation é cíclico, com seis etapas:

1. Descoberta
2. Pré-processamento de dados
3. Planejamento de modelo
4. Criação de modelos
5. Comunicação dos resultados
6. Operacionalização
A EMC Corporation agora é Dell EMC. Este modelo, criado por David Dietrich, reflete a
natureza cíclica dos projetos reais. As fases não são marcos estáticos: cada etapa se
conecta e leva à próxima e, no fim das contas, se repete. As perguntas-chave ajudam
os analistas a testar se realizaram o suficiente para seguir em frente e garantir que as
equipes tenham passado tempo suficiente em cada uma das fases e não comecem a
modelar antes de os dados ficarem prontos. É um pouco diferente do ciclo de vida da
análise de dados em que este programa se baseia, mas tem algumas ideias centrais
em comum: a primeira fase está interessada em descobrir e fazer perguntas, os
dados precisam ser preparados antes de serem analisados e usados, e então as
descobertas precisam ser compartilhadas e colocadas em prática.

Para mais informações, consulte A gênese do ciclo de vida da análise de dados da


EMC.

Ciclo de vida iterativo da SAS


Um ciclo de vida iterativo foi criado por uma empresa chamada SAS, uma provedora
de soluções de análise de dados líder no mercado. Ele pode ser usado para produzir
resultados repetíveis, confiáveis e preditivos:

1. Perguntar
2. Preparar
3. Explorar
4. Modelar
5. Implementar
6. Agir
7. Avaliar
O modelo SAS enfatiza a natureza cíclica do modelo, visualizando-o como um
símbolo de infinito. O ciclo de vida dele tem sete etapas, muitas das quais vimos em
outros modelos, como Perguntar, Preparar, Modelar e Agir. Mas esse ciclo de vida
também é um pouco diferente. Ele inclui uma etapa após a fase de ação,
desenvolvida para ajudar os analistas a avaliar as soluções e, potencialmente,
retornar de novo à fase das perguntas. 

Para mais informações, consulte Como gerenciar o ciclo de vida da análise para
decisões em escala.

Ciclo de vida da análise de dados com base em projeto


Um ciclo de vida da análise de dados com base em projeto tem cinco etapas simples:

1. Identificação do problema
2. Desenvolvimento dos requisitos de dados
3. Pré-processamento de dados
4. Execução da análise de dados
5. Visualização dos dados
Esse ciclo de vida do projeto de análise de dados foi desenvolvido por Vignesh
Prajapati. Não inclui a sexta fase, ou o que chamamos fase da ação (Agir). No
entanto, ainda aborda muitas das mesmas etapas dos ciclos de vida que já
descrevemos. Ele começa com a identificação do problema e a preparação e o
processamento dos dados antes da análise e termina com a visualização dos dados.

Para mais informações, consulte Como compreender o ciclo de vida do projeto da


análise de dados.

Ciclo de vida da análise de big data


Os autores Thomas Erl, Wajid Khattak e Paul Buhler propuseram um ciclo de vida da
análise de big data no livro Big Data Fundamentals: Concepts, Drivers &
Techniques. O ciclo de vida deles sugere fases divididas em nove etapas:

1. Avaliação do caso de negócios


2. Identificação dos dados
3. Aquisição e filtragem dos dados
4. Extração dos dados
5. Validação e limpeza dos dados
6. Agregação e representação dos dados
7. Análise dos dados
8. Visualização dos dados
9. Utilização dos resultados da análise
Esse ciclo de vida parece ter três ou quatro etapas a mais do que os modelos de ciclo
de vida anteriores. Mas, na realidade, eles apenas dividiram o que chamamos de
fases “Preparar” e “Processar” em etapas menores. Isso enfatiza as tarefas
individuais necessárias para coletar, preparar e limpar os dados antes da fase de
análise.

Para mais informações, consulte Considerações sobre adoção e planejamento de Big


Data.

Principal conclusão
De nossa jornada até as pirâmides e os dados do antigo Egito até agora, a forma
como analisamos os dados evoluiu (e continua evoluindo). O processo de análise de
dados é como a arquitetura da vida real: há diferentes maneiras de realizar as
tarefas, mas as mesmas ideias centrais ainda aparecem em cada modelo do
processo. Quer você use a estrutura deste Certificado de Análise de Dados do Google,
quer use uma das muitas outras iterações que aprendeu, estamos aqui para ajudar a
continuar em sua jornada de dados.

Variações do ciclo de vida dos dados


Você aprendeu que há seis estágios no ciclo de vida dos dados. Veja aqui uma
recapitulação:

1. Planejamento: decida que tipos de dados são necessários, como serão


gerenciados e quem será o responsável por eles.
2. Captura: colete ou traga dados de várias fontes diferentes.
3. Gerenciamento: cuide e mantenha os dados. Isso inclui determinar como e
onde eles são armazenados e as ferramentas usadas para fazer isso.
4. Análise: Use os dados para resolver problemas, tomar decisões e auxiliar as
metas de negócios.
5. Arquivamento: mantenha os dados relevantes armazenados para referência
futura e de longo prazo.
6. Destruição: remova os dados do armazenamento e exclua todas as cópias
compartilhadas deles.
Aviso: tenha cuidado para não misturar ou confundir os seis estágios do ciclo de
vida dos dados (planejamento, captura, gerenciamento, análise, arquivamento e
destruição) com as seis fases do ciclo de vida da análise de dados (pergunta,
preparação, processamento, análise, compartilhamento e ação). Eles não devem ser
usados ou mencionados de maneira intercambiável.

O ciclo de vida dos dados fornece uma estrutura genérica ou comum de como os
dados são gerenciados. Talvez você lembre que as variações do ciclo de vida da
análise de dados foram descritas em Origens do processo de análise de dados. O
mesmo pode ser feito para o ciclo de vida dos dados. No restante deste texto, você
terá uma ideia de como as instituições governamentais, financeiras e educacionais
podem ver os ciclos de vida dos dados de maneira um pouco diferente.

U.S. Fish and Wildlife Service


O U.S. Fish and Wildlife Service (Serviço de pesca e vida selvagem dos EUA) usa o
seguinte ciclo de vida de dados:

1. Planejamento
2. Aquisição
3. Manutenção
4. Acesso
5. Avaliação
6. Arquivamento
Para mais informações, consulte a página Ciclo de vida de gerenciamento de dados
do U.S. Fish and Wildlife Service.

O U.S. Geological Survey (USGS)


O USGS (Pesquisa geológica dos EUA) usa o ciclo de vida dos dados abaixo:

1. Planejamento
2. Aquisição
3. Processamento
4. Análise
5. Preservação
6. Publicação/compartilhamento
Várias atividades transversais ou abrangentes também são realizadas durante cada
estágio do ciclo de vida:

 Descrição (metadados e documentação)


 Gerenciamento da qualidade
 Backup e proteção
Para mais informações, consulte a página Ciclo de vida de dados do USGS.

Instituições financeiras
As instituições financeiras podem adotar uma abordagem um pouco diferente do
ciclo de vida dos dados, conforme descrito em The Data Life Cycle (O ciclo de vida
dos dados, em inglês), um artigo da revista Strategic Finance:

1. Captura
2. Qualificação
3. Transformação
4. Utilização
5. Relatório
6. Arquivamento
7. Limpeza

Harvard Business School (HBS)


Um ciclo de vida de dados final informado pela pesquisa da Universidade de Harvard
tem oito estágios:

1. Geração
2. Coleta
3. Processamento
4. Armazenamento
5. Gerenciamento
6. Análise
7. Visualização
8. Interpretação
Para mais informações, consulte 8 Steps in the Data Life Cycle (Oito etapas no ciclo
de vida dos dados).

Principal conclusão
Compreender a importância do ciclo de vida dos dados vai preparar você para o
sucesso como analista de dados. Os estágios individuais do ciclo de vida dos dados
variam de empresa para empresa ou por indústria ou setor. Os dados históricos são
importantes para o U.S. Fish and Wildlife Service e o USGS. Portanto, o ciclo de vida
dos dados deles se concentra no arquivamento e no backup de dados. Os interesses
da Universidade de Harvard são pesquisa e ensino. Portanto, o ciclo de vida dos
dados inclui visualização e interpretação, mesmo que associados com mais
frequência a um ciclo de vida de análise de dados. O ciclo de vida dos dados da HBS
também não exige um estágio para limpar ou destruir os dados. Em contraste, o
ciclo de vida dos dados de finanças identifica claramente os estágios de
arquivamento e limpeza. Resumindo, os ciclos de vida dos dados variam, mas um
princípio de gerenciamento de dados é universal. Controle como os dados são
tratados para que sejam precisos, seguros e estejam disponíveis para atender às
necessidades da sua organização.

Principais ferramentas do analista de


dados
Conforme você está aprendendo, os programas e soluções mais comuns usados por
analistas de dados incluem planilhas, linguagens de consulta e ferramentas de
visualização. Neste texto, você aprenderá mais sobre cada um deles. Você verá
quando usá-los e por que eles são tão importantes na análise de dados.

Planilhas
Os analistas de dados contam com planilhas para coletar e organizar os dados. Dois
aplicativos de planilhas conhecidos que você provavelmente usará muito em seu
futuro papel como analista de dados são o Microsoft Excel e o Planilhas Google.

As planilhas estruturam os dados de maneira significativa, possibilitando que você

 Colete, armazene, organize e classifique as informações


 Identifique padrões e reúna os dados de uma maneira que funcione para
cada projeto de dados específico
 Crie excelentes visualizações de dados, como gráficos e tabelas

Bancos de dados e linguagens de consulta


Um banco de dados é uma coleção de dados estruturados armazenados em um
sistema de computador. Alguns programas conhecidos de linguagem de consulta
estruturada (SQL, na sigla em inglês) incluem MySQL, Microsoft SQL Server e
BigQuery.

Linguagens de consulta

 Permita que os analistas isolem informações específicas de um banco de


dados
 Facilite o aprendizado e a compreensão das solicitações feitas aos bancos de
dados
 Permita que os analistas selecionem, criem, adicionem ou façam o download
de dados de um banco de dados para análise

Ferramentas de visualização
Os analistas de dados usam várias ferramentas de visualização, como gráficos,
mapas, tabelas, gráficos e muito mais. Duas ferramentas de visualização conhecidas
são o Tableau e o Looker.

Essas ferramentas

 Transformam números complexos em uma história que as pessoas


conseguem entender
 Ajudam as partes interessadas a chegar a conclusões que levem a decisões
informadas e a estratégias de negócios eficazes
 Têm vários recursos
- O simples recurso de arrastar e soltar do Tableau permite que os usuários criem
gráficos interativos em painéis e

planilhas

- O Looker se comunica diretamente com um banco de dados, permitindo que você


conecte seus dados diretamente à ferramenta

visual que você escolher

Uma carreira como analista de dados também envolve o uso de linguagens de


programação, como R e Python, que são muito usadas para análise estatística,
visualização e outras análises de dados.

Principal conclusão
Você tem muitas ferramentas como analista de dados. Esta é uma apresentação das
possibilidades, e você conhecerá muitas dessas ferramentas profundamente ao
longo deste programa. 

Como escolher a ferramenta certa para o


trabalho
Como analista de dados, geralmente você terá que decidir qual solução ou programa
é o certo para o projeto específico em que está trabalhando. Neste texto, você
aprenderá mais sobre como escolher qual ferramenta e quando.

Dependendo da fase do processo de análise de dados em que você se encontrar, será


preciso usar ferramentas diferentes. Por exemplo, se você estiver se concentrando
na criação de visualizações complexas e atraentes, as ferramentas de visualização
que discutimos anteriormente serão a melhor escolha. Mas, se você estiver se
concentrando na organização, limpeza e análise de dados, provavelmente escolherá
entre planilhas e bancos de dados que usam consultas. Planilhas e bancos de dados
oferecem maneiras de armazenar, gerenciar e usar dados. O conteúdo básico para
ambas as ferramentas são conjuntos de valores. No entanto, também existem
algumas diferenças importantes:

Planilhas Bancos de dados


Armazenamentos de dados: acessados com o uso de
Aplicativos de software
uma linguagem de consulta (por exemplo, SQL)
Estruturar dados em formato
Estruturar dados usando regras e relacionamentos
de linha e coluna
Organizar informações em
Organizar informações em coleções complexas
células
Conceder acesso a uma
Conceder acesso a grandes quantidades de dados
quantidade limitada de dados
Entrada manual de dados Entrada de dados estrita e consistente
Geralmente um usuário por vez Vários usuários
Controlado por um sistema de gerenciamento de banco
Controlado pelo usuário
de dados
Você não precisa escolher entre uma ou outra, pois cada uma serve a um propósito
específico. Geralmente, os analistas de dados trabalham com uma combinação das
duas, pois ambas as ferramentas são muito úteis na análise de dados. Por exemplo, é
possível armazenar dados em um banco de dados e, em seguida, exportá-los para
uma planilha para realizar uma análise. Ou, se você estiver coletando informações
em uma planilha e isso se tornar demais para a plataforma específica, será possível
importá-las para um banco de dados. Posteriormente neste curso você aprenderá
sobre linguagens de programação, como a R, que oferecem um controle ainda maior
dos dados, da análise deles e das visualizações que você cria. 

Conforme continuar aprendendo sobre essas ferramentas importantes, você


ganhará o conhecimento para escolher a ferramenta certa para todos os trabalhos
com dados.

Mais recursos de planilha


Para o aprendizado duradouro, é bom ter recursos aos quais recorrer quando você
quiser saber mais sobre o uso de planilhas. Duas das plataformas de planilhas mais
conhecidas e usadas são o Planilhas Google e o Microsoft Excel. As duas oferecem
recursos de treinamento online gratuitos que podem ser acessados sempre que
preciso. Adicione esses links aos favoritos se quiser acessá-los mais tarde.

Treinamento e ajuda do Planilhas Google

Aprenda ainda mais maneiras de mover, armazenar e analisar dados com a página
de treinamento e ajuda do Planilhas Google, localizada na Central de aprendizagem
do Google Workspace. Ela oferece uma lista expandida de dicas, do nível iniciante ao
avançado, com folhas de referências e modelos, guias e tutoriais. 

Folha de referências do Planilhas Google

Quer saber mais sobre o Planilhas Google? Neste artigo de ajuda online,
apresentamos uma pequena lista com as funções mais importantes que você usará,
incluindo linhas, colunas, células e funções. 

Treinamento do Microsoft Excel para Windows

Conheça um pouco melhor as planilhas do Excel visitando esta central de


treinamento online gratuita. Ela oferece de tudo, desde um guia de início rápido e
introdução a tutoriais e modelos. Você encontrará tudo o que precisa saber em um
só lugar.

Guia SQL: primeiros passos


Assim como os humanos usam linguagens diferentes para se comunicar com outras
pessoas, o mesmo ocorre com os computadores. A linguagem de consulta
estruturada (ou SQL, geralmente pronunciada como “sequel”) permite que os
analistas de dados se comuniquem com os bancos de dados. O SQL é uma das
ferramentas mais úteis para os analistas de dados, especialmente ao trabalhar com
grandes conjuntos de dados em tabelas. Ela pode ajudar a investigar bancos de
dados enormes, rastrear textos (conhecidos como strings) e números e filtrar o tipo
exato de dados de que você precisa de maneira muito mais rápida do que uma
planilha. 

Se você nunca usou SQL antes, neste texto ajudaremos a aprender o básico para
apreciar como ele é útil e como as consultas SQL são particularmente úteis. Você
escreverá consultas SQL em um piscar de olhos.

O que é uma consulta?


Uma consulta é uma solicitação de dados ou informações de um banco de dados. Ao
consultar bancos de dados, você usa o SQL para comunicar sua pergunta ou
solicitação. Você e o banco de dados sempre podem trocar informações, desde que
falem a mesma língua.
Cada linguagem de programação, incluindo SQL, segue um conjunto exclusivo de
diretrizes, conhecido como sintaxe. A sintaxe é a estrutura predeterminada de um
idioma que inclui todas as palavras, pontuações e símbolos necessários, bem como
o posicionamento adequado deles. Assim que você inserir critérios de pesquisa
usando a sintaxe correta, a consulta começará a trabalhar para extrair os dados
solicitados do banco de dados de destino.

A sintaxe de cada consulta SQL é a mesma: 

 Use SELECT para escolher as colunas que deseja retornar.


 Use FROM para escolher as tabelas em que estão localizadas as colunas que
você quer.
 Use WHERE para filtrar por certas informações.
Uma consulta SQL é como preencher um modelo. Você descobrirá que, ao escrever
uma consulta SQL do zero, é útil iniciá-la escrevendo as palavras-chave SELECT,
FROM e WHERE no seguinte formato: 

Em seguida, insira o nome da tabela após FROM; as colunas da tabela que você quer
após o SELECT; e, por fim, as condições que você quer colocar em sua consulta após
WHERE. Não deixe de adicionar uma linha nova e um recuo ao adicionar esses
comandos, conforme mostrado abaixo:

Seguir esse método sempre facilita a escrita de consultas SQL. Isso também pode
ajudar você a cometer menos erros de sintaxe.

Exemplo de uma consulta

Veja como uma consulta simples apareceria no BigQuery, um data warehouse no


Google Cloud Platform.
A consulta acima usa três comandos para localizar clientes com o nome Tony:

1. SELECT (selecione) a coluna chamada first_name


2. FROM (de) uma tabela chamada customer_name (em um conjunto de dados
chamado customer_data). (O nome do conjunto de dados é sempre seguido
por um ponto e depois pelo nome da tabela.)
3. Mas só retorne os dados WHERE (onde) o first_name (nome) for Tony
Os resultados da consulta podem ser semelhantes aos mostrados a seguir:

first_name
Tony
Tony
Tony
Como você pode concluir, essa consulta tinha a sintaxe correta, mas não foi muito
útil depois que os dados foram retornados.

Várias colunas em uma consulta


Na vida real, você precisará trabalhar com mais dados, além de clientes chamados
Tony. Várias colunas escolhidas pelo mesmo comando SELECT podem ser recuadas
e agrupadas.

Se você solicitar vários campos de dados de uma tabela, precisará incluir essas
colunas no comando SELECT. Cada coluna é separada por uma vírgula, conforme
mostrado abaixo:

Veja aqui um exemplo de como isso ficaria no BigQuery:


A consulta acima usa três comandos para localizar clientes com o nome Tony.

1. SELECT (selecione) as colunas denominadas customer_id, first_name e


last_name
2. FROM (de) uma tabela chamada customer_name (em um conjunto de dados
chamado customer_data). (O nome do conjunto de dados é sempre seguido
por um ponto e depois pelo nome da tabela.)
3. Mas só retorne os dados WHERE (onde) o first_name (nome) for Tony
A única diferença entre essa consulta e a anterior é que mais colunas de dados foram
selecionadas. A consulta anterior selecionou apenas first_name, enquanto essa
consulta selecionou também customer_id e last_name além de first_name. Em
geral, selecionar apenas as colunas de que você precisa faz um uso mais eficiente
dos recursos. Por exemplo, faz sentido selecionar mais colunas se você realmente
usar os campos adicionais em sua cláusula WHERE. Se você tiver várias condições
em sua cláusula WHERE, elas poderão ser escritas assim:

Observe que, ao contrário do comando SELECT (que usa uma vírgula para separar
campos/variáveis/parâmetros), o comando WHERE usa a instrução AND para
conectar as condições. À medida que você se tornar um criador de consultas mais
experiente, fará uso de outros conectores/operadores, como OR e NOT. 

Veja aqui um exemplo do BigQuery com vários campos usados em uma cláusula
WHERE:
A consulta acima usa três comandos para localizar clientes com um ID de cliente
válido (maior que 0) com nome Tony e sobrenome Magnolia.

1. SELECT (selecione) as colunas denominadas customer_id, first_name e


last_name
2. FROM (de) uma tabela chamada customer_name (em um conjunto de dados
chamado customer_data). (O nome do conjunto de dados é sempre seguido
por um ponto e depois pelo nome da tabela.)
3. Mas só retorne os dados WHERE (onde) customer_id for maior que 0, o
first_name (nome) for Tony e o last_name (sobrenome) for Magnolia.
Observe que uma das condições é uma condição lógica que verifica se customer_id é
maior que zero.

Se apenas um cliente se chamar Tony Magnolia, os resultados da consulta poderão


ser os mostrados a seguir:

customer_id first_name last_name


1967 Tony Magnolia
Se mais de um cliente tiver o mesmo nome, os resultados da consulta poderão ser os
mostrados a seguir:

customer_id first_name last_name


1967 Tony Magnolia
7689 Tony Magnolia

Principal conclusão
O mais importante a ser lembrado é como usar SELECT, FROM e WHERE em uma
consulta. As consultas com vários campos ficarão mais simples depois que você
praticar a escrita de suas próprias consultas SQL posteriormente no programa.
infinitas possibilidades de SQL
Você aprendeu que uma consulta SQL usa SELECT, FROM e WHERE para
especificar os dados a serem retornados pela consulta. Neste texto, apresentamos
informações mais detalhadas sobre formatação de consultas, uso de condições
WHERE, seleção de todas as colunas em uma tabela, adição de comentários e uso de
aliases. Tudo isso torna mais fácil entender (e escrever) consultas para colocar o SQL
em ação. Na última seção do texto, apresentamos um exemplo do que um analista
de dados faria para extrair dados de funcionários para um projeto. 

Uso de letras maiúsculas e minúsculas, recuo e ponto e


vírgula
É possível escrever consultas SQL em letras minúsculas, e não é preciso se preocupar
com espaços extras entre as palavras. No entanto, usar letras maiúsculas e recuo
pode ajudar a ler as informações com mais facilidade. Mantenha suas dúvidas
organizadas e ficará mais fácil revisá-las ou solucioná-las se você precisar verificá-las
mais tarde.

Observe que a instrução SQL mostrada acima tem um ponto e vírgula no final. O
ponto e vírgula encerra instruções, faz parte da norma SQL-92 do American National
Standards Institute (ANSI) e é uma sintaxe comum recomendada para adoção por
todos os bancos de dados SQL. No entanto, nem todos os bancos de dados SQL
adotaram ou aplicam o ponto e vírgula. Portanto, é possível que você encontre
algumas instruções SQL que não terminam com ponto e vírgula. Se uma instrução
funciona sem ponto e vírgula, não há problema nenhum.

Condições WHERE
Na consulta mostrada acima, a cláusula SELECT identifica a coluna da qual você
quer extrair dados por nome, field1, e a cláusula FROM identifica a tabela em que a
coluna está localizada por nome, table. Por fim, a cláusula WHERE restringe sua
consulta para que o banco de dados retorne apenas os dados com correspondência
de valor exata ou os dados que correspondem a uma determinada condição que
você quer satisfazer. 

Por exemplo, se você estiver procurando um cliente específico com o sobrenome


Chavez, a cláusula WHERE será: 

WHERE field1 = 'Chavez'


No entanto, se você estiver buscando todos os clientes com um sobrenome que
comece com as letras “Ch”, a cláusula WHERE será:

WHERE field1 LIKE 'Ch%'

É possível concluir que a cláusula LIKE é muito eficiente, porque permite que você
diga ao banco de dados para procurar um determinado padrão! O sinal de
porcentagem (%) é usado como curinga para corresponder a um ou mais caracteres.
No exemplo acima, Chávez e Chen seriam retornados. Observe que, em alguns
bancos de dados, o asterisco (*) é usado como curinga em vez do sinal de
porcentagem (%).

SELECT (selecionar) todas as colunas


É possível usar SELECT * ?

No exemplo, se você substituir SELECT field1 por SELECT *, selecionará todas as


colunas da tabela, em vez de somente a coluna field1. Do ponto de vista da sintaxe, é
uma instrução SQL correta, mas você precisa usar o asterisco (*) com moderação e
cuidado. Dependendo de quantas colunas uma tabela tem, é possível selecionar
uma quantidade enorme de dados. Selecionar muitos dados pode fazer com que
uma consulta seja executada lentamente.

Comentários
Algumas tabelas não são projetadas com convenções de nomenclatura descritivas
suficientes. No exemplo, field1 era a coluna do sobrenome de um cliente, mas você
não o reconheceria pelo nome. Um nome melhor seria algo como last_name. Nesses
casos, é possível colocar comentários ao lado do SQL para ajudar a lembrar o que o
nome representa. Comentários são textos colocados entre certos caracteres, /* e */,
ou depois de dois travessões (--), conforme mostrado abaixo. 

Comentários também podem ser incluídos fora ou dentro de uma instrução. É


possível usar essa flexibilidade para fornecer uma descrição geral do que você vai
fazer, observações passo a passo sobre como conseguir isso e por que você definiu
parâmetros/condições diferentes. 
Quanto mais confortável você ficar com o SQL, mais fácil será ler e entender as
consultas rapidamente. Ainda assim, nunca é demais ter comentários em uma
consulta para lembrar o que você está tentando fazer. Isso também facilita a
compreensão de outras pessoas sobre sua consulta, caso ela seja compartilhada. À
medida que suas consultas ficam cada vez mais complexas, essa prática economiza
muito tempo e energia para entender consultas complexas que você escreveu meses
ou anos atrás. 

Exemplo de uma consulta com comentários

Veja aqui um exemplo de como comentários podem ser escritos no BigQuery:

No exemplo acima, um comentário foi adicionado antes da instrução SQL para


explicar o que a consulta faz. Além disso, um comentário foi incluído ao lado de cada
um dos nomes das colunas para descrever a coluna e o uso dela. Geralmente, dois
traços (--) são compatíveis. Portanto, é melhor usar e ser consistente nisso. É
possível usar # no lugar de -- na consulta acima, mas # não é reconhecido em todas
as versões de SQL. Por exemplo, o MySQL não reconhece esse caractere.  Se o banco
de dados que você está usando for compatível, também será possível colocar
comentários entre /* e */. 

À medida que você desenvolve suas habilidades profissionalmente, dependendo do


banco de dados SQL que usa, é possível escolher os símbolos de delimitação de
comentários apropriados de sua preferência e mantê-los como um estilo
consistente. À medida que suas perguntas se tornam cada vez mais complexas, a
prática de adicionar comentários úteis ajudará a economizar muito tempo e energia
para compreender as perguntas que podem ter sido escritas meses ou anos antes.

Aliases
Também é possível atribuir um novo nome, ou alias, aos nomes de colunas ou
tabelas para facilitar o trabalho com elas (e evitar a necessidade de comentários).
Isso é feito com uma cláusula SQL AS. No exemplo abaixo, o alias last_name foi
atribuído a field1, e o alias customers foi atribuído a table. Esses aliases são válidos
apenas pela duração da consulta. Um alias não altera o nome real de uma coluna ou
tabela no banco de dados.

Exemplo de uma consulta com aliases

Como executar o SQL como analista de dados


Imagine que você é um analista de dados de uma pequena empresa e seu gerente
pede alguns dados de funcionários. Você decide escrever uma consulta com SQL
para conseguir o que precisa do banco de dados. 

Você deseja extrair todas as colunas empID, firstName, lastName, jobCode e salary.
Como você sabe que o banco de dados não é tão grande, em vez de inserir cada
nome de coluna na cláusula SELECT, você usa SELECT*.  Isso selecionará todas
as colunas da tabela Employee (Funcionário) na cláusula FROM.

Agora é possível ser mais específico sobre os dados que quer na tabela Employee. Se
você quer todos os dados sobre os funcionários no código de trabalho SFI, pode
usar uma cláusula WHERE para filtrar os dados com base nesse requisito
adicional. 

Aqui, você usa:

Uma parte dos dados resultantes retornados da consulta SQL pode ter a seguinte
aparência:
empID firstName lastName jobCode salary

0002 Homer Simpson SFI 15000

0003 Marge Simpson SFI 30000

0034 Bart Simpson SFI 25000

0067 Lisa Simpson SFI 38000

0088 Ned Flanders SFI 42000

0076 Barney Gumble SFI 32000

Suponha que você observe uma grande faixa salarial para o código de trabalho SFI.
Talvez você queira sinalizar todos os funcionários de todos os departamentos com
salários menores para o seu gerente. Como os estagiários também estão incluídos na
tabela e têm salários inferiores a US$ 30 mil, você quer ter certeza de que os
resultados contêm apenas os funcionários em tempo integral com salários inferiores
a US$ 30 mil. Em outras palavras, você quer excluir estagiários com o código de
trabalho INT que também ganham menos de US$ 30 mil. A cláusula AND permite
que você teste as duas condições. 

Você cria uma consulta SQL semelhante à abaixo, em que <> significa "não é igual":

Os dados resultantes da consulta SQL podem ter a seguinte aparência (estagiários


com o código de trabalho INT não são retornados):

empID firstName lastName jobCode salary


0002 Homer Simpson SFI 15000
0003 Marge Simpson SFI 30000
0034 Bart Simpson SFI 25000
0108 Edna  Krabappel TUL 18000
0099 Moe  Szyslak ANA 28000
Com acesso rápido a esse tipo de dado usando SQL, é possível fornecer ao gerente
toneladas de diferentes insights sobre os dados dos funcionários, incluindo se os
salários são equitativos em toda a empresa. Felizmente, a consulta indica que
apenas dois outros funcionários podem precisar de um ajuste de salário, e você
mostra os resultados ao seu gerente. 

Retirar os dados, analisá-los e implementar uma solução pode, em última análise,


ajudar a melhorar a satisfação e a lealdade dos funcionários. Isso torna o SQL uma
ferramenta muito útil. 

Recursos para saber mais


Quem não assina pode acessar esses recursos gratuitamente, mas, se um site limitar
o número de artigos gratuitos por mês e você já tiver atingido o limite, marque o
recurso como favorito e volte a ele mais tarde.

 Tutorial de SQL da W3Schools: Se você quiser explorar um tutorial detalhado


de SQL, este é o lugar perfeito para começar. Este tutorial inclui exemplos
interativos que você pode editar, testar e recriar. Use-o como referência ou
conclua todo o tutorial para praticar o uso de SQL. Clique no botão verde
Começar a aprender SQL agora ou no botão Próximo para iniciar o tutorial.
 Folha de referências sobre SQL: Se você já está em um nível mais avançado,
leia este artigo para ver a sintaxe SQL padrão usada no PostgreSQL. Quando
terminar, você saberá muito mais sobre o SQL e conseguirá usá-lo para
análise de negócios e outras tarefas.

Como planejar uma visualização de dados


Anteriormente, você aprendeu que a visualização de dados é a representação gráfica
das informações. Como analista de dados, você vai querer criar visualizações que
deixem seus dados fáceis de entender e interessantes de olhar. Devido à importância
da visualização de dados, a maioria das ferramentas de análise de dados (como
planilhas e bancos de dados) tem um componente de visualização incorporado,
enquanto outras (como o Tableau) se especializaram na visualização como principal
valor agregado. Neste texto, você explorará as etapas envolvidas no processo de
visualização de dados e algumas das ferramentas de visualização de dados mais
comuns disponíveis. 
Etapas para planejar uma visualização de dados
Vamos ver um exemplo real em que um analista pode precisar criar uma visualização
de dados para compartilhar com as partes interessadas. Imagine que você é um
analista de dados de uma distribuidora de roupas. A empresa ajuda pequenas lojas
de roupas a administrar o estoque, e as vendas estão crescendo. Um dia, você fica
sabendo que a empresa se prepara para fazer uma grande atualização no site. Para
orientar as decisões para a atualização do site, você precisa analisar os dados do site
atual e os registros de vendas. Vamos ver as etapas que você pode seguir. 

Etapa 1: Explorar os dados em busca de padrões

Primeiro, você pede ao gerente ou ao proprietário dos dados acesso aos registros de
vendas atuais e aos relatórios de análise do site. Isso inclui informações sobre como
os clientes se comportam no site atual da empresa e informações básicas sobre
quem visitou, quem comprou da empresa e quanto foi comprado.

Ao analisar os dados, você percebe um padrão entre aqueles que visitam o site da
empresa com mais frequência: geografia e maiores valores gastos em compras. Com
uma análise mais aprofundada, essas informações podem explicar por que as
vendas estão tão fortes agora na região Nordeste e ajudar sua empresa a encontrar
maneiras de deixá-las ainda mais fortes com o novo site. 

Etapa 2: Planejar os recursos visuais

Em seguida, é hora de refinar os dados e apresentar os resultados de sua análise. No


momento, você tem muitos dados espalhados por várias tabelas diferentes, o que
não é uma maneira ideal de compartilhar os resultados com a gerência e a equipe de
marketing. Convém criar uma visualização de dados que explique as descobertas de
maneira rápida e eficaz para o público-alvo. Como você sabe que o público é voltado
para vendas, já sabe também que a visualização de dados que usa precisa:

 Mostrar números de vendas ao longo do tempo


 Conectar as vendas à localização
 Mostrar a relação entre vendas e uso do site
 Mostrar quais clientes impulsionam o crescimento

Etapa 3: Criar recursos visuais

Agora que você decidiu que tipos de informação e insight quer exibir, é hora de
começar a criar as visualizações reais. Lembre-se de que a criação da visualização
certa para uma apresentação ou para compartilhar com as partes interessadas é um
processo. Isso envolve experimentar diferentes formatos de visualização e fazer
ajustes até conseguir o que procura. Nesse caso, uma combinação de diferentes
recursos visuais comunicará melhor suas descobertas e transformará sua análise na
história mais atraente para as partes interessadas. Portanto, você pode usar os
recursos integrados de gráficos em suas planilhas para organizar os dados e criar os
recursos visuais.

1) line charts can track sales over time 2) maps can connect sales to locations 3) donut
charts can show customer segments 4) bar charts can compare total visitors that make
a purchase

1) gráficos de linhas podem acompanhar vendas ao longo do tempo 2) mapas


podem conectar vendas a locais 3) gráficos de rosca podem mostrar segmentos de
clientes 4) gráficos de barras podem comparar o total de visitantes que fazem uma
compra

Criar o kit de ferramentas de visualização de dados


Há muitas ferramentas diferentes podem ser usadas para a visualização de dados. 

 É possível usar as ferramentas de visualização em sua planilha para criar


visualizações simples, como gráficos de linhas e de barras.
 Você pode usar ferramentas mais avançadas, como o Tableau, que permitem
a integração de dados em visualizações de painel. 
 Se você está trabalhando com linguagem de programação R, pode usar as
ferramentas de visualização do RStudio.
Sua escolha de visualização será orientada por uma variedade de itens, incluindo o
tamanho de seus dados e o processo usado para analisá-los (planilha, bancos de
dados/consultas ou linguagens de programação). Por enquanto, apenas considere o
básico. 

Planilhas (Microsoft Excel ou Planilhas Google)


Em nosso exemplo, as tabelas e os gráficos integrados nas planilhas tornaram o
processo de criação de recursos visuais rápido e fácil. As planilhas são ótimas para
criar visualizações simples, como gráficos de barras e de pizza, e oferecem algumas
visualizações avançadas, como mapas e diagramas em cascata e funil (mostrados
nas figuras a seguir).

Mas, às vezes, você precisa de uma ferramenta mais poderosa para dar vida aos
dados. Tableau e RStudio são dois exemplos de plataformas amplamente usadas
que podem ajudar você a planejar, criar e apresentar visualizações de dados eficazes
e atraentes.

Software de visualização (Tableau)


O Tableau é uma ferramenta de visualização de dados conhecida que permite extrair
dados de quase qualquer sistema e transformá-los em recursos visuais atraentes ou
insights úteis. A plataforma oferece práticas recomendadas visuais integradas, o que
torna a análise e o compartilhamento de dados rápidos, fáceis e (o mais importante)
úteis. O Tableau funciona bem com uma ampla variedade de dados e inclui um
painel interativo que permite que você e as partes interessadas cliquem para
explorar os dados de maneira interativa. 
Comece a explorar o Tableau com os recursos dovídeo de instruções. O Tableau
Public é gratuito, fácil de usar e cheio de informações úteis. A página Recursos é um
local completo para ver vídeos de instruções, exemplos e conjuntos de dados para
você praticar. Para explorar o que outros analistas de dados estão compartilhando
no Tableau, visite a páginaVisualização do dia para encontrar belos recursos visuais,
que vão desdeBusca por planetas (habitáveis) até Quem está falando em filmes
populares.

Linguagem de programação (R com RStudio) 


Muitos analistas de dados trabalham com uma linguagem de programação chamada
R. A maioria das pessoas que trabalha com R acaba usando também o RStudio, um
ambiente de desenvolvedor integrado (IDE, na sigla em inglês) para as necessidades
de visualização de dados. Assim como no Tableau, é possível criar visualizações de
dados no estilo painel usando o RStudio.

Confira o site oficial para saber mais sobre oRStudio.


Dá para facilmente passar dias explorando todos os recursos oferecidos em
RStudio.com, mas as Folhas de referências do RStudio e o RStudio Visualize Data
Primer são ótimos para começar. Quando você tiver mais tempo, veja os webinars e
vídeos que oferecem conselhos e perspectivas úteis para usuários iniciantes e
avançados.

Principal conclusão
Os melhores analistas de dados usam muitas ferramentas e métodos diferentes para
visualizar e compartilhar os dados. À medida que você continuar aprendendo mais
sobre visualização de dados ao longo do curso, mantenha a curiosidade, pesquise
diferentes opções e teste continuamente novos programas e plataformas para
aproveitar ao máximo os dados.

Registro de aprendizado: Refletir sobre o


processo de análise de dados

Visão geral  

Você já começou a se familiarizar com o processo de análise de dados. Agora, fará


uma anotação em seu registro de aprendizado refletindo sobre sua experiência com
o processo de análise de dados e seu progresso neste curso. Ao concluir esta
atividade, você terá uma compreensão mais sólida de como usar as etapas desse
processo para organizar tarefas de análise de dados e resolver grandes problemas
com dados. Esta estrutura continuará a ajudar a orientar você em seu próprio
trabalho neste curso e como um analista de dados júnior!

O processo de análise de dados até agora

Reserve um momento para apreciar todo o trabalho que você realizou neste curso.
Você identificou uma pergunta a ser respondida e passou sistematicamente pelo
processo de análise de dados para respondê-la, assim como os analistas de dados
profissionais fazem todos os dias! 
Ao revisar o processo de análise de dados até agora, você já realizou muitas dessas
etapas. Veja aqui alguns exemplos para pensar antes de começar a fazer sua
anotação de registro de aprendizado: 

 Você perguntou algo interessante e definiu um problema a ser resolvido por


meio da análise de dados para responder a essa pergunta. 
 Você refletiu profundamente sobre quais dados precisaria e como os
coletaria a fim de se preparar para a análise.
 Você processou os dados organizando-os e estruturando-os em uma tabela e,
em seguida, movendo-os para uma planilha. 
 Você analisou os dados inspecionando-os e examinando-os em busca de
padrões.
 Você compartilhou sua primeira visualização de dados: um gráfico de barras.
 Por fim, depois de concluir todas as outras etapas, você agiu: Você refletiu
sobre seus resultados, tomou decisões e recebeu informações sobre seu
problema, mesmo que o insight fosse de que você não tinha dados
suficientes ou que não havia padrões óbvios nos dados. 
À medida que avança no restante do programa, continuará usando e revisitando
essas etapas para ajudar a guiar você pelas suas próprias tarefas de análise. Você
também aprenderá mais sobre as diferentes ferramentas que podem ajudar ao
longo do caminho! 

Funções de analista de dados e descrições


de cargos
Conforme a tecnologia continua a avançar, ser capaz de coletar e analisar os dados
com essa nova tecnologia tornou-se uma grande vantagem competitiva para muitas
empresas. Tudo, desde sites a feeds de redes sociais, está repleto de dados
fascinantes que, quando analisados e usados corretamente, podem ajudar a
informar as decisões de negócios. A capacidade de uma empresa de prosperar agora
muitas vezes depende da habilidade dela em aproveitar os dados, aplicar análises e
implementar novas tecnologias.

É por isso que analistas de dados qualificados são alguns dos profissionais mais
procurados do mundo. Um estudo realizado pela IBM estima que as empresas nos
Estados Unidos preencherão 2.720.000 empregos nas áreas de ciência de dados e
análises até 2020*. Como a demanda é grande, você poderá encontrar
oportunidades de emprego em praticamente qualquer setor. Faça uma pesquisa
rápida em qualquer site de emprego importante e você notará que todo tipo de
empresa, de zoológicos a clínicas de saúde e bancos, está procurando profissionais
de dados talentosos. Mesmo que o cargo não use o termo exato “analista de dados”,
a descrição do trabalho para a maioria das funções que envolvem análise de dados
provavelmente incluirá muitas das habilidades e qualificações que você ganhará ao
final deste programa. Neste texto, exploraremos algumas das funções relacionadas
aos analistas de dados que podem ser encontradas em diferentes empresas e
setores. 

* “The Quant Crunch: How the Demand for Data Science Skills is Disrupting the Job
Market,” por Will Markow, Soumya Braganza e Bledi Taska, com Steven M. Miller e
Debbie Hughes.https://www.ibm.com/downloads/cas/3RL3VXGA

Decodificação da descrição do trabalho


A função de analista de dados é um dos muitos cargos que contêm a palavra
“analista”. 

Para citar alguns outros que parecem semelhantes, mas podem não ter a mesma
função:

 Analista de negócios: analisa dados para ajudar as empresas a melhorar


processos, produtos ou serviços
 Analista de inteligência de negócios: analisa dados para finanças ou insights
de mercado
 Consultor de análise de dados: analisa os sistemas e modelos de uso de
dados
 Engenheiro de dados: prepara e integra dados de diferentes fontes para uso
analítico
 Cientista de dados: usa habilidades especializadas em tecnologia e ciências
sociais para encontrar tendências por meio da análise de dados
 Especialista em dados: organiza ou converte dados para uso em bancos de
dados ou sistemas de software
 Analista de operações: analisa os dados para avaliar o desempenho das
operações de negócios e dos fluxos de trabalho
Analistas de dados, cientistas de dados e especialistas em dados se parecem muito,
mas se concentram em tarefas diferentes. Ao começar a navegar por listas de vagas
online, é possível notar que as descrições de empregos das empresas parecem
combinar essas funções ou procuram candidatos que podem ter habilidades
sobrepostas. O fato de que as empresas muitas vezes confundem os limites entre
elas significa que você precisa tomar bastante cuidado ao ler as descrições de cargos
e as habilidades necessárias. 

Na tabela abaixo, ilustramos algumas das sobreposições e distinções entre eles:

Decodificação da descrição do trabalho 

Analistas de dados Cientistas de dados Especialistas em d

Solução de Use ferramentas e Invente novas Use conhecimento


Analistas de dados Cientistas de dados Especialistas em d

ferramentas e modelos,
métodos atuais para de bancos de dado
faça perguntas abertas e
problemas resolver problemas com ferramenta para re
colete novos tipos de
tipos de dados atuais problemas e geren
dados
Analise os dados Analise e interprete Organize grandes v
coletados para ajudar as dados complexos para dados para uso em
Análise
partes interessadas a fazer previsões de dados ou operaçõe
tomar decisões melhores negócios negócios
Outras
habilidades
relevantes
Usamos a função de especialista em dados como um exemplo de muitas
especializações em análise de dados, mas você não precisa se tornar um especialista
em dados! As especializações podem ter vários ângulos diferentes. Por exemplo, é
possível se especializar no desenvolvimento de visualizações de dados e, da mesma
forma, se aprofundar nessa área. 

Especializações de trabalho por setor 


Aprendemos que a função de especialista em dados se concentra no conhecimento
aprofundado de bancos de dados. De maneira semelhante, outras funções de
especialista para analistas de dados podem se concentrar no conhecimento
aprofundado de setores específicos. Por exemplo, em um trabalho como analista de
negócios, é possível assumir algumas funções diferentes do que em uma posição
mais geral, como analista de dados. Como analista de negócios, você provavelmente
colaborasse com os gerentes, compartilhasse suas descobertas de dados e talvez
explicasse como uma pequena mudança no sistema de gerenciamento de projetos
da empresa poderia economizar 3% a cada trimestre. Embora você ainda
trabalhasse com dados o tempo todo, precisaria se concentrar em usar os dados
para melhorar as operações de negócios, a eficiência ou os resultados financeiros.

Outras posições de especialista específicas do setor que podem ser encontradas em


sua pesquisa de emprego de analista de dados incluem:

 Analista de marketing: analisa as condições do mercado para avaliar o


potencial de vendas de produtos e serviços 
 Analista de RH/folha de pagamento: analisa os dados das folhas de
pagamento em busca de ineficiências e erros
 Analista financeiro: analisa a situação financeira por meio da coleta, do
monitoramento e da revisão de dados
 Analista de risco: analisa documentos financeiros, condições econômicas e
dados de clientes para ajudar as empresas a determinar o nível de risco
envolvido na tomada de uma decisão comercial específica
 Analista de saúde: analisa dados médicos para melhorar o aspecto comercial
de hospitais e instalações médicas

Principal conclusão
Explore descrições de trabalho de analistas de dados e funções de analistas
específicas do setor. Você começará a ter uma ideia melhor das diferentes funções
de analistas de dados que existem e quais tipos de funções você está mais
interessado em seguir.  

Estratégias de teste
Como você sabe, este programa pede que você complete avaliações com notas ao
final de cada módulo e curso. As avaliações às vezes podem parecer assustadoras,
mas abordá-las com uma estratégia pode torná-las mais gerenciáveis. Aqui está uma
lista de dicas que você pode usar para se preparar para o sucesso. 

Antes de fazer uma avaliação: 


 Revise suas notas, os vídeos, as leituras e o glossário mais recente para se
atualizar sobre o conteúdo. 
 Encontre uma foto de algo ou um objeto que faça você se sentir feliz. Por
exemplo, você pode olhar para uma fotografia de uma bela praia ou de uma
floresta tranquila quando se sentir sobrecarregado. 

Durante a avaliação:
 Revise o teste antes de preencher as respostas. Lembre-se de revisar seu
trabalho antes de clicar em enviar. 
 Leve o tempo que precisar: Não há limite de tempo.
 Responda as perguntas fáceis primeiro; pule as que você não sabe a resposta
imediatamente.
 Para perguntas de múltipla escolha, concentre-se em eliminar as respostas
erradas primeiro. 
 Leia cada questão duas vezes. Muitas vezes há pistas que são fáceis de deixar
passar em uma primeira leitura.
 Lembre-se de tomar cuidado e confiar em seu conhecimento. Você
provavelmente sabe mais do que acredita.
 Respire fundo e dê a si mesmo um feedback positivo. 
 Reserve algum tempo durante a avaliação para descansar por alguns
segundos, se alongar e sacudir as mãos. Isso realmente pode ajudar a
acalmar seus nervos.

Se você começar a se sentir ansioso:


 Soletre seu nome de trás para frente ou faça um problema de matemática
fácil. Isso o leva de volta ao lobo frontal do cérebro, o que o ajuda a lembrar
de informações com mais facilidade. 
 Concentre-se na respiração calma e constante. 
 Visualize o sucesso.

Antes de enviar a avaliação:


 Revise o seu trabalho, mas tenha confiança. Às vezes, as pessoas mudam as
respostas corretas porque se sentem erradas, mas na verdade estão certas.
Seu primeiro instinto geralmente está correto. 

Você também pode gostar