Você está na página 1de 8

Semana 4

Tenha confiança em seus dados


Olá, que bom que você voltou. Até agora, mantivemos nosso foco em preparar
seus dados para o processamento e análise. Nos próximos vídeos, falaremos
sobre outra parte importante do processo, como organizar e proteger seus
dados. Manter seus dados organizados é importante por algumas razões. Fica
mais fácil encontra-los e usá-los, ajuda a evitar que você cometa erros durante
sua análise e também ajuda a protegê-los. A seguir, vamos discutir os
princípios básicos de como organizar os dados para uso pessoal e profissional,
além das convenções de nomenclatura de arquivos. Também analisaremos
alguns recursos de segurança das planilhas. Ao final desses próximos vídeos,
você conseguirá fazer tudo isso e poderá explicar essas etapas às partes
interessadas, para que elas tenham a certeza de que suas práticas de dados
são seguras. Tudo pronto para começar? Passe para o próximo vídeo. Nele,
começaremos explicando como organizar os dados para uso pessoal.

A organização é tudo
Olá mais uma vez! Não importa se você está organizando seus dados pessoais
para uso próprio ou os dados do projeto para trabalho, há certos procedimentos
que deseja seguir para garantir que seus dados sejam fáceis de encontrar e
usar. Neste vídeo, falaremos sobre algumas práticas corporativas
recomendadas e conferiremos algumas formas diferentes de organizar dados
do projeto. Existem várias práticas recomendadas que você pode usar ao
organizar dados, incluindo convenções de nomenclatura, foldering e
arquivamento de arquivos antigos. Já falamos sobre nomenclatura de arquivos
antes, também conhecida como convenções de nomenclatura. São diretrizes
sistemáticas que descrevem o conteúdo, a data ou versão de um arquivo em
seu nome. Basicamente, significa que você quer usar nomes descritivos e
lógicos em seus arquivos, para torná-los fáceis de encontrar e usar. Por falar
em facilidade de encontrar coisas, organizar seus arquivos em pastas ajuda a
agrupar arquivos relacionados ao mesmo projeto, chamamos isso de foldering.
Por exemplo, todos os arquivos relacionados ao seu plano de férias podem ser
direcionados à pasta Férias2025. Você pode segmentar essa pasta ainda mais
ao criar subpastas, como itinerários ou fotos, dependendo do que gostaria de
acessar mais facilmente. Também pode ser útil mover projetos antigos para um
local separado, criando um arquivo morto e reduzindo a desorganização. Fica
muito mais fácil encontrar e usar meus arquivos quando dou a eles nomes com
significado e pesquisáveis, e ao organizá-los em pastas. Assim, meus dados
ficam mais acessíveis e úteis. Além dessas três práticas recomendadas, há
duas outras coisas a levar a serem consideradas ao organizar os dados para
uso no trabalho. Primeiro, os dados do projeto que usará para o trabalho
podem ser acessados e usados por várias pessoas. É importante alinhar suas
práticas de nomenclatura e armazenamento com a sua equipe para evitar
confusão. Sua equipe também pode desenvolver práticas de metadados, como
criar um arquivo que defina convenções de nomenclatura do projeto para
facilitar a consulta. Nós falaremos sobre convenções de nomenclatura para
arquivos de trabalho mais adiante. Em segundo lugar, pense sobre quantas
vezes você faz cópias de dados e as armazena em locais diferentes.
Principalmente, porque se os dados são armazenados em vários bancos de
dados ou planilhas diferentes, eles podem se contradize e levar a erros no
futuro. Além disso, armazenar em vários locais exige vários espaços. Os
bancos de dados relacionais ajudam a evitar a duplicação de dados e
armazenam seus dados com mais eficiência. Use essas práticas para organizar
dados de diferentes formas, de acordo com o projeto. Vamos ver alguns
exemplos de organização de dados. Tenho algumas pastas de projeto modelo,
cada uma organizada de uma forma um pouco diferente. Vamos olhar cada
uma mais detalhadamente. Vamos começar com a pasta de alto nível de
Finanças. Essa pasta foi organizada de forma categórica. Nela, há subpastas,
como orçamento, notas ficais e folha de pagamento, que representam
diferentes categorias. Vamos clicar em "Notas fiscais" e ver o que há nela.
Nessa pasta, você pode ver que há outro conjunto de subpastas rotuladas por
ano, 2014, 2015... Parece que seguem uma ordem cronológica. Às vezes, a
forma como os arquivos foram organizados nos diz como os dados nesses
arquivos são organizados. Vamos abrir um arquivo e ver se é isso mesmo. Na
subpasta 2014, há um arquivo com notas fiscais de junho.
Se abrirmos, podemos ver que foram organizados por data, assim como as
pastas. Há diferentes formas de se organizar dados, dependendo do que você
precisa fazer com eles. A organização categórica de subpastas e finanças
facilita ir direto para as notas fiscais, no entanto, a organização cronológica da
subpasta de notas fiscais pode nos ajudar a encontrar dados financeiros pela
data exata que estamos procurando. Há também outras formas de organizar
dados: em ordem de importância ou mesmo por local. Uma empresa, por
exemplo, pode usar a organização hierárquica para que os dados do
funcionário reflitam a estrutura da organização de funcionários. Ou uma
empresa que trabalha com dados geográficos pode optar por organizar por
local. É uma boa ideia pensar logo no início do projeto quais os melhores
métodos de organização para você e sua equipe seguirem. Veja outra maneira
de pensar nisso. Os dados desorganizados são como uma sala bagunçada. É
insuportável, fica difícil de encontrar alguma coisa e, quanto mais evita limpá-la,
pior fica. Porém, ao ter certeza logo no início, de onde colocar seus arquivos,
você mantém os dados de trabalho organizados, fáceis de usar e livres de
erros. Agora que você sabe da importância de manter os dados organizados,
seja para uso pessoal ou no trabalho, falaremos um pouco mais nas
convenções de nomenclatura de arquivos e como elas se estendem aos seus
bancos de dados. Vejo você no próximo vídeo.

Diretrizes de organização
Nesse texto, você encontra um resumo das práticas recomendadas de
nomenclatura, organização e armazenamento de arquivos.
Práticas recomendadas de convenções de nomenclatura de arquivos

Consulte as seguintes recomendações de nomenclatura de arquivos:

 Defina e chegue a um acordo com relação às convenções de


nomenclatura de arquivos no início do projeto, evitando que os arquivos
sempre recebam uma nova nomenclatura.
 Alinhe a nomenclatura dos arquivos com as convenções de
nomenclatura de arquivos já implementadas em sua empresa/equipe.
 Certifique-se de que as nomenclaturas são pertinentes. Inclua
informações como nome do projeto e tudo o que possa ajudar a
identificar (e usar) rapidamente o arquivo dentro da finalidade adequada.
 Inclua a data e o número de versão nos nomes do arquivo (formatos
frequentes incluem AAAAMMDD para datas e v## para versões ou
revisões).
 Crie um arquivo de texto como um arquivo modelo, cujo conteúdo
descreva (discrimine) a convenção de nomenclatura de arquivos, além
de um nome de arquivo aplicável.
 Evite incluir espaços e caracteres especiais nos nomes dos arquivos, em
vez disso, use travessões, sublinhados ou letras maiúsculas. Os
espaços e caracteres especiais podem levar a erros em certos
aplicativos.

Práticas recomendadas para manter os arquivos


organizados
Lembre-se destas dicas sobre como manter a organização ao trabalhar com os
arquivos:

 Crie pastas e subpastas em uma hierarquia lógica para que os arquivos


correlacionados sejam armazenados juntos.
 Separe os trabalhos concluídos dos em andamento. Assim, fica mais
fácil encontrar os arquivos de projetos atuais. Armazene arquivos
antigos em uma pasta separada ou em um local de armazenamento
externo.
 Não é feito o backup automático dos arquivos? Faça isso manualmente
com frequência, para evitar que trabalhos importantes sejam perdidos.

Tudo o que precisa saber sobre nomenclatura de


arquivos
Olá, novamente. Bem, você viu que eu mencionei a ideia de usar nomes de
arquivo significativos e lógicos para ajudar a organizar seus dados. Porém,
usar nomes de arquivos consistentes também pode simplificar ou mesmo
automatizar seu processo de análise, economizando tempo e energia a longo
prazo. Ao usar diretrizes sistemáticas que descrevem o conteúdo, a data ou a
versão de um arquivo e o seu nome, você está usando convenções de
nomenclatura de arquivos. Como já sabemos, essas convenções nos ajudam a
organizar, acessar, processar e analisar nossos dados. Confira algumas dicas
gerais sobre como criar convenções de nomenclatura de arquivos que sejam
lógicas e funcionais. Saiba algumas coisas importantes a se fazer. Planeje
suas convenções com antecedência para evitar ter que perder tempo
refazendo isso depois. Alinhe a nomenclatura de arquivos com sua equipe e
certifique-se de que os nomes dos arquivos são pertinentes e façam referência
ao nome do projeto, data de criação, versão de revisão ou qualquer outra
informação útil, necessária para entender o conteúdo do arquivo. Existem
algumas outras coisas simples que você pode fazer para garantir que as
convenções estejam corretas. Primeiro, mantenha o nome do arquivo curto e
simples. Eles devem servir como breves pontos de referência que indicam o
que está no arquivo. Os vídeos anteriores nos mostraram que devemos incluir
datas e números de revisão nos nomes dos arquivos. Eu recomendo formatar
por ano, mês e dia, seguindo os padrões internacionais de data. Cada país
segue uma convenção de data diferente, lembre-se disso. Ao incluir os
números de revisão em um nome de arquivo, preceda-o com um zero. Assim,
se houver dígitos de revisões duplicados, isso já estará incorporado às suas
convenções. Outra ótima regra é o uso de hifens, sublinhados ou letras
maiúsculas em vez de espaços. Seu software pode não reconhecer espaços e
caracteres especiais. Além disso, não há dúvidas de que evitar espaços facilita
o trabalho no SQL. Meu último conselho: crie um arquivo de texto que
apresente todas as suas convenções de nomenclatura em um projeto. Isso é
muito útil se uma pessoa nova integrar a equipe ou se você só precisa de um
breve lembrete enquanto trabalha em algo. Já falamos disso antes quando
abordamos os metadados, que são dados sobre dados. Eles ajudam a explicar
quais dados existem e como estão organizados. Ao usar convenções de
nomenclatura de arquivos sistemáticas e pertinentes em seu projeto, seus
dados serão fáceis de encontrar e usar, e você também pode economizar
tempo. A seguir, continuaremos a analisar as planilhas e falaremos sobre
recursos de segurança e como você pode usá-los para proteger seus dados,
agora já organizados. Vejo você lá.

Registro de aprendizado: consulte as convenções de


nomenclatura e estrutura de arquivos

Visão geral

Na sessão anterior, você aprendeu os princípios básicos das convenções de


nomenclatura e estrutura de arquivos. Agora você concluirá um item em seu
registro de aprendizado ao revisar esses conceitos e refletir sobre o motivo da
sua importância. Assim, você entenderá melhor como e por que os analistas de
dados usam as convenções de nomenclatura e estrutura de arquivos em suas
funções, o que o ajudará a refletir de forma criteriosa sobre a nomenclatura e a
estrutura de arquivos em seus próprios projetos daqui pra frente, mantendo
seus trabalhos mais organizados.

Revise as práticas recomendadas

Antes de adentrar na questão de que tipo de convenções de nomenclatura e


padrões você usaria em seus projetos, pare um momento para revisar as
práticas recomendadas de convenções de nomenclatura e estrutura de
arquivos. 

Ao criar um padrão de convenção de nomenclatura e estrutura de arquivos


para determinado projeto, sempre:

 Trabalhe com suas convenções com antecedência em seu projeto.


Quanto antes começar, mais organizado será. 
 Alinhe as convenções de nomenclatura com sua equipe. As convenções
se tornam mais úteis quando todos aderem a elas.
 Certifique-se de que os nomes dos arquivos têm significância. Mantenha
um padrão consistente, o qual abranja as informações necessárias mais
úteis.
 Mantenha os nomes dos arquivos curtos e diretos.
Isto inclui entender a estrutura esperada de pastas e arquivos em um projeto.
Onde ficam os dados? E suas planilhas? E quanto às visualizações de dados?
Ser capaz de acessar suas pastas com facilidade contribui para um projeto
bem estruturado. 

Lembre-se de que você precisa fazer algumas escolhas estilísticas quando se


trata das convenções de nomenclatura de arquivos, embora ainda haja práticas
recomendadas a serem seguidas também:

Convenção de formatação Exemplo


As datas devem seguir o formato "aaaammdd" SalesReport20201125
Preceda os números de revisão com 0 SalesReport20201125v02
Use hifens, sublinhados ou letras maiúsculas SalesReport_2020_11_25_v02

Recursos de segurança em planilhas


Você voltou! Bem, agora que nossos dados estão organizados e fáceis de
achar, é hora de começar a pensar sobre como protegê-los. A boa notícia é
que as planilhas dispõem recursos de segurança integrados. Neste vídeo,
veremos diferentes programas de planilhas e de que maneira os recursos de
segurança, como proteções de planilhas e controle de acesso, são parecidos.
Quando digo "recursos de segurança", você pode estar pensando em formas
de proteger os dados de outras pessoas. Mas esse é só um tipo de segurança.
Os recursos de segurança podem ser desenvolvidos para impedir que usuários
não autorizados visualizem certos arquivos, ou apenas bloquear suas planilhas,
para que você não corrompa suas fórmulas sem querer. Isso é conhecido como
segurança de dados. Segurança de dados trata de proteger os dados contra o
acesso não autorizado ou a corrupção por meio da adoção de medidas de
segurança. Independentemente do programa de planilhas que você use, ele
apresentará medidas de segurança semelhantes integradas. Como analista de
dados, você trabalhará bastante com o Planilhas Google e o Excel. Vamos falar
sobre o que eles têm em comum. Primeiro, ambos os programas têm recursos
que permitem proteger suas planilhas ou partes de suas planilhas de serem
editadas, desde a planilha inteira até células únicas em uma tabela. Se estiver
em colaboração com outros usuários, é fácil bloquear suas fórmulas para que
não sejam corrompidas por acidente. Por falar em colaboração, o Excel e o
Planilhas Google têm recursos de controle de acesso, como proteção por
senha e permissões de usuário. Com isso, você tem mais controle sobre quem
pode fazer o que em sua planilha. Como os programas ficam instalados em
diferentes locais, os recursos apresentam pequenas diferenças. Nas planilhas
do Excel, você pode criptografar os arquivos e planilhas com senhas antes de
enviá-las por e-mail a outros usuários. Quanto ao Planilhas Google, as
configurações ficam logo no menu de compartilhamento, permitindo que você
controle quem pode ver ou editar a planilha online. Além disso, podem ser
copiadas para que os usuários trabalhem com os dados sem alterar os
originais. Em ambos os programas, as aguias podem ficar ocultas ou não.
Assim, você pode alterar quais dados são exibidos. Lembre-se, porém, de que
outra pessoa pode cancelar a ocultação das guias, então tenha certeza de que
não há problema em deixá-las acessíveis. Como analista de dados, a
segurança dos dados será uma prioridade. Independentemente do programa
que você use para criar planilhas, você pode contar com recursos de
segurança para proteger o seu trabalho. Existem algumas práticas
recomendadas básicas para manter seus dados mais protegidos no geral. Nós
falaremos disso mais adiante. Você chegou ao final do módulo. Parabéns!
Durante os vídeos, falamos sobre estratégias para a organização dos dados
para uso pessoal e profissional, como criar convenções de nomenclatura de
arquivos funcionais, além de algumas medidas de segurança úteis ao usar as
planilhas. Antes de prosseguir no ciclo da vida da análise de dados, é
importante assegurar que seus dados estejam preparados, o que inclui
organizá-los e protegê-los. Como de costume, após o vídeo, você passará pelo
seu desafio semanal. Eu sei que você conseguirá resolvê-lo! Após o desafio
semanal, existem alguns materiais opcionais sobre como se conectar à
comunidade de dados online. Enquanto dá seus primeiros passos na carreira
em Data Analytics, será muito útil conectar-se a outras pessoas, aprender
novas tendências da área e compartilhar seu trabalho. Acredito que você
aproveitará bastante esses vídeos. Eles o ajudarão você a desenvolver sua
presença profissional online e encontrar formas de se comunicar com pessoas
da área, o que é fundamental, já que o networking se torna cada vez mais
online e as oportunidade de trabalho remoto, o padrão. Se você se sente
confiante quanto à sua presença online, prossiga para o desafio do curso. Boa
sorte em seu desafio semanal e nos vemos em breve!

A luta entre a segurança e o Data Analytics


Entende-se por Segurança de dados proteger os dados contra o acesso não
autorizado ou a corrupção com a implementação de medidas de segurança.
Em geral, tem como propósito impedir que usuários não autorizados tenham
acesso ou visualizem dados confidenciais. Cabe aos analistas de dados
encontrar uma forma de equilibrar a segurança de dados com suas próprias
necessidades de Analytics, o que pode ser complicado. Nós queremos manter
nossos dados seguros, mas, ao mesmo tempo, usá-los o mais rápido possível,
para que possamos fazer observações adequadas e no tempo certo. 

Para tanto, as empresas precisam encontrar formas de equilibrar as medidas


de segurança de dados com suas necessidades de acesso aos dados.

Segurança de dados Acesso aos dados


Felizmente, há algumas medidas de segurança que podem ajudar as empresas
a fazerem isso. Nós falaremos sobre duas delas: criptografia e tokenização. 

A criptografia usa um algoritmo único para alterar dados e torná-los


inutilizáveis por usuários e aplicativos que desconheçam o algoritmo, que é
salvo como uma “chave” que pode ser usada para revogar a criptografia. Dessa
forma, se você tem a chave, você ainda pode usar os dados em seu formato
original.  

A tokenização, por sua vez, substitui os elementos dos dados que você quer
proteger com dados gerados de forma aleatória, conhecidos como “token”. Os
dados originais são armazenados em um local separado e atribuídos aos
tokens. Para ter acesso aos dados originais completos, o usuário ou o
aplicativo precisa ter permissão para usar o dado tokenizado e o mapeamento
do token, ou seja, mesmo que o dado tokenizado seja hackeado, o dado
original continua seguro em um local separado. 

A criptografia e a tokenização são apenas algumas das opções de segurança


de dados disponíveis. Existem muitas outras alternativas, como o uso de
dispositivos de autenticação para tecnologia de IA.

Provavelmente, você, analista de dados júnior, não será responsável por


desenvolver esses sistemas. Muitas organizações contam com equipes
dedicadas exclusivamente à segurança de dados, ou contratam empresas
terceirizadas especializadas em segurança de dados, para criar esses
sistemas. É importante saber, no entanto, que todas as empresas são
responsáveis por manter a segurança dos dados, além de entender alguns dos
possíveis sistemas que seu futuro empregador poderá usar.

Você também pode gostar