Você está na página 1de 20

Aula 01

Introdução a
Ciência de Dados

Turma: Bacharelado em Sistemas de Informação


Osmary Camila Bortoncello Glober (Mary)
osmary.glober@up.edu.br
Objetivos

➢ Introdução a Ciência de Dados


➢ Introdução a LGPD e a Governança de Dados
➢ Introdução ao ambiente da disciplina
➢ Introdução a Python
Motivacional

➢ “Estamos entrando em um novo mundo em que os dados podem


ser mais importantes que o software” - Tim O’Reilly

➢ “Os dados são uma coisa preciosa e durarão mais do que os


próprios sistemas“ - Tim Berners-Lee
Ciência de Dados - Conceito

➢ “Ciência de Dados é um campo interdisciplinar sobre métodos


científicos, processos, e sistemas para extrair conhecimento e
insights de vários tipos de formatos de dados”

Dhar, V. (2013) “Data science and prediction”


https://www.kdnuggets.com/2016/03/data-science-process.html
Habilidades
Áreas dentro da Ciência de Dados
➢ Visualização de dados: a apresentação de dados em um formato pictórico ou gráfico para
que eles possam ser facilmente analisados;
➢ Machine learning: ou aprendizagem de máquinas, é um ramo da inteligência artificial
baseado em algoritmos matemáticos e automação, que permitam uma máquina a aprender
e/ou aperfeiçoar seu desempenho em alguma tarefa;
➢ Deep learning: ou aprendizagem profunda, uma área da pesquisa de machine learning que
usa dados para modelar abstrações complexas;
➢ Reconhecimento de padrões: a tecnologia que reconhece padrões nos dados (usada muitas
vezes como sinônimo de aprendizagem de máquina;
➢ Preparação de dados: o processo de conversão de dados brutos em um outro formato para
que eles possam ser consumidos mais facilmente;
➢ Text analytics: ou análise de dados textuais, é o processo de examinar dados não
estruturados para reunir os principais insights de negócios.
Importância dos dados - 2020
Aplicações de Ciência de Dados
Aplicações de Ciência de Dados
Aplicações de Ciência de Dados
Aplicações de Ciência de Dados
Aplicações de Ciência de Dados
LGPD
➢ No Brasil, a LGPD (Lei nº 13.709, de 14/8/2018) entrou em vigor em 18 de setembro de 2020
➢ Diante dos atuais casos de uso indevido, comercialização e vazamento de dados, as novas regras
garantem a privacidade dos brasileiros, além de evitar entraves comerciais com outros países.
○ Assegurar o direito à privacidade e à proteção de dados pessoais dos usuários, por meio de práticas
transparentes e seguras, garantindo direitos fundamentais.
○ Estabelecer regras claras sobre o tratamento de dados pessoais.
○ Fortalecer a segurança das relações jurídicas e a confiança do titular no tratamento de dados pessoais,
garantindo a livre iniciativa, a livre concorrência e a defesa das relações comerciais e de consumo.
○ Promover a concorrência e a livre atividade econômica, inclusive com portabilidade de dados.
Direitos

https://www.serpro.gov.br/lgpd/
Governança de dados

➢ Refere-se ao gerenciamento dos dados em todas as suas


etapas dentro das empresas.
➢ Consiste em normas, políticas e regras para tratar os dados e
garantir que eles sejam usados com um melhor
aproveitamento.
Governança de dados

➢ Controle sobre o ciclo de vida dos dados


○ Confidencialidade (controle)
○ Disponibilidade (visibilidade)
○ Integridade (qualidade)
➢ Definição de dados críticos e sensíveis
➢ Categorizar os dados mais importantes e os que requerem ações
mais específicas
Importância
Sugestões
Ambiente

➢ Google Colab
○ https://github.com/marycamila184/positivo-data-science

➢ O Python e o Jupyter Notebook (e diversos outros pacotes relacionados)


podem ser instalados usando a distribuição Anaconda em:
○ https://www.anaconda.com/distribution/

Você também pode gostar