Você está na página 1de 17

Padronização, limpeza e

transformação dos dados


Dados abertos

Gostaria de iniciar este tópico fazendo algumas perguntas:

• Você saberia dizer exatamente quanto dos seus impostos pagos atualmente
foi investido para pavimentar uma determinada rua de sua cidade, ou qual
percentual foi aplicado em incentivo a pesquisas na área da saúde ou em
incentivo ao esporte?

• Ao comprar um determinado alimento, você saberia informar a procedência,


quem são os trabalhadores envolvidos em todo o processo de produção até
a comida chegar no seu prato?

• Qual o número exato de áreas desmatadas e qual foi o prejuízo ambiental no


último semestre?
Analisando essas perguntas de forma direta,
pode parecer um pouco difícil de respondê-
las, mas, com o passar do tempo, novas
tecnologias foram surgindo e tornaram
possível responder essas e outras questões
mais complexas.

Entretanto, há uma grande dificuldade em


localizar e acessar esses dados de forma
simples e objetiva, e um dos principais
pontos é que a maioria desses dados são
gerados por órgãos públicos, que até o
momento não possuem processos efetivos
para disponibilizar esses dados de forma
padronizada e totalmente documentada.
Agora, imagine o potencial de melhoria na vida dos cidadãos e também na
gestão pública que poderíamos alcançar com todos esses dados mapeados e
organizados.

Foi a partir dessa ideia que surgiu o conceito de open data, ou dados abertos,
que faz parte de uma tendência global de fornecer informações que possam
ser utilizadas de forma livre, reutilizadas e redistribuídas por qualquer pessoa,
sujeitas, no máximo, à exigência de atribuição à fonte original e ao
compartilhamento pelas mesmas licenças em que as informações foram
apresentadas.
Segundo o Guia Open Data a definição da Open Definition pode ser
resumida da seguinte forma:

Disponibilidade e acesso

Os dados devem estar


disponíveis na íntegra e a um
custo de reprodução não
superior ao razoável,
preferencialmente por
download na internet. Os dados
também devem estar
disponíveis em um formato
conveniente e modificável.
Reutilização e redistribuição

Os dados devem ser fornecidos


em termos que permitam a
reutilização e redistribuição,
incluindo a junção com outros
conjuntos de dados.
Participação universal

Todos devem ser capazes de


usar, reutilizar e redistribuir —
não deve haver discriminação
contra campos de atuação ou
contra pessoas ou grupos — ou
seja, restrições “não comerciais”
que impediriam o uso “comercial”
ou restrições de uso para
determinados fins (por exemplo,
apenas na educação), não são
permitidas.
Como parte das iniciativas de open data, surgiu o conceito de governo aberto
(open government), que se refere a projetos e ações que visam à promoção da
transparência, à luta contra a corrupção, ao incremento da participação social e
ao desenvolvimento de novas tecnologias, o que pode tornar os governos mais
abertos, efetivos e responsáveis.

Os governos de todo o mundo começaram a liberar dados livres para consulta


e utilização, isso porque o governo coleta e concentra a maior parte dos dados
gerados, e, de acordo com a legislação, esses dados devem ser abertos e
podem ser consultados por qualquer cidadão. No Brasil, a Lei de Acesso à
Informação entrou em vigor em maio de 2012. É possível acessar as bases de
dados disponibilizadas pelo governo em dados.gov.br, onde é possível
encontrar informações públicas relativas a diferentes temas da administração
pública do Brasil.
A cada segundo, trilhões de bytes são
gerados por empresas e pessoas ao
redor do planeta, e instituições que
conseguem planejar, executar e
gerenciar esses dados conseguem
oferecer diferenciais competitivos e
soluções inovadoras, alinhadas à
transformação digital, para a
população.
O uso de dados abertos permite diversos benefícios, tais como:

✓ transparência e controle da democracia;

✓ inovação;

✓ controle e eficiência de serviços públicos;

✓ acompanhamento do impacto de políticas públicas;

✓ gerar receita e criar novos empregos;

✓ atenção por parte dos cidadãos, das mídias e de outros órgãos de


fiscalização.
O conteúdo a seguir está disponível no Podcast “Análise de dados”
Compliance digital e a LGPD

Quando falamos de uma nova economia que é liderada principalmente pela transformação
digital, podemos citar diversos benefícios, como agilidade no processo de decisão, redução de custos
operacionais, descentralização de informações, além da quebra de paradigmas como o open finance,
open insurance e open everything.

No entanto, com toda essa evolução, é preciso reconhecer que as ameaças também evoluíram na
mesma proporção. E a chave principal para estar alinhado ao mercado é estar sempre pronto para
garantir a segurança máxima das informações, mas, a quarta edição da pesquisa de Maturidade do
Compliance no Brasil, realizada pela KPMG (ANO), mostra que, dentre nove indicadores, análise de dados
e tecnologia obteve a menor nota, o que indica que as empresas não possuem o hábito de monitorar
seus indicadores, e muitos afirmam que não conhecem ou não utilizam tecnologia para as iniciativas de
compliance.
Compliance digital

Compliance digital é um conceito que diz respeito ao conjunto de regras e ações internas que
regulam as atividades desenvolvidas pelas empresas para garantir a proteção dos dados particulares e
de informações de seu público na internet a partir de protocolos de segurança e cumprimento de leis
vigentes. Por exemplo, um código de conduta, auditorias e políticas de privacidade que asseguram o
cumprimento de uma lei.
Lei Geral de Proteção de Dados

A Lei Geral de Proteção de Dados Pessoais (LGPD) estabelece diretrizes importantes e


obrigatórias para a coleta, processamento e armazenamento de dados pessoais. A LGPD foi inspirada
na General Data Protection Regulation (GDPR), que entrou em vigor em 2018 na União Europeia,
trazendo grandes impactos para empresas e consumidores. Já a LGPD brasileira foi publicada em 2018
e entrou em vigência somente a partir de setembro de 2020.

De acordo com a referida lei, fica proibido utilizar informações que, de forma isolada ou em conjunto,
possam revelar a identidade de clientes, exceto em casos de consentimento. São considerados dados
pessoais:

✓ nome;
✓ endereço;
✓ número de documentos;
✓ telefone;
✓ e-mail.
Lei Geral de Proteção de Dados

A relação entre o compliance digital e a LGPD é simples e direta: ao lidar com os dados de
pessoas, é necessário utilizar a Lei Geral de Proteção de Dados para criar diretrizes e um código de
conduta corporativo, a fim de obter amparo jurídico e se resguardar de possíveis ameaças.

Infelizmente, não é incomum vermos casos de vazamento de dados, como o megavazamento de dados
de mais de 220 milhões de brasileiros, que incluía informações como CPF, fotos, endereços e benefícios
sociais. Ou mesmo grandes redes sociais, plataformas de streaming e empresas de varejo que sofreram
ataques recentes. E isso aconteceu mesmo após as leis entrarem em vigor.

E quanto mais transparentes forem as políticas de não conformidade e a adoção de medidas


preventivas, mais rápida será a atuação para evitar que o prejuízo tome proporções inesperadas. Por
exemplo, empresas que avisam de forma ativa sobre uma inconsistência e oferecem suporte
conseguem conquistar e manter a confiança dos clientes.
Lei Geral de Proteção de Dados

Pode até soar contraditório, mas um dos grandes desafios das leis de privacidade é manter
um equilíbrio entre a privacidade dos dados e os benefícios de manter os dados abertos.

Para garantir a privacidade, todas as análises e o tratamento dos dados devem ser de forma
anonimizada, ou seja, quem está tratando os dados não sabe de qual cidadão se trata, e também deve
seguir o consentimento, mantendo todas as atividades de acordo com as regras de governança de
dados da organização.

Assim, podemos concluir que é necessário um compliance digital, que cubra todos os pontos previstos
na LGPD para se extrair o máximo de vantagens do uso de dados, garantindo a privacidade e o uso
consentido das informações.

Você também pode gostar