O documento introduz os conceitos de Ciência de Dados, incluindo suas áreas, aplicações e habilidades necessárias. Também aborda a LGPD, Governança de Dados e o ambiente de desenvolvimento da disciplina usando Python no Google Colab.
O documento introduz os conceitos de Ciência de Dados, incluindo suas áreas, aplicações e habilidades necessárias. Também aborda a LGPD, Governança de Dados e o ambiente de desenvolvimento da disciplina usando Python no Google Colab.
O documento introduz os conceitos de Ciência de Dados, incluindo suas áreas, aplicações e habilidades necessárias. Também aborda a LGPD, Governança de Dados e o ambiente de desenvolvimento da disciplina usando Python no Google Colab.
➢ Introdução a LGPD e a Governança de Dados ➢ Introdução ao ambiente da disciplina ➢ Introdução a Python Motivacional
➢ “Estamos entrando em um novo mundo em que os dados podem
ser mais importantes que o software” - Tim O’Reilly
➢ “Os dados são uma coisa preciosa e durarão mais do que os
próprios sistemas“ - Tim Berners-Lee Ciência de Dados - Conceito
➢ “Ciência de Dados é um campo interdisciplinar sobre métodos
científicos, processos, e sistemas para extrair conhecimento e insights de vários tipos de formatos de dados”
Dhar, V. (2013) “Data science and prediction”
https://www.kdnuggets.com/2016/03/data-science-process.html Habilidades Áreas dentro da Ciência de Dados ➢ Visualização de dados: a apresentação de dados em um formato pictórico ou gráfico para que eles possam ser facilmente analisados; ➢ Machine learning: ou aprendizagem de máquinas, é um ramo da inteligência artificial baseado em algoritmos matemáticos e automação, que permitam uma máquina a aprender e/ou aperfeiçoar seu desempenho em alguma tarefa; ➢ Deep learning: ou aprendizagem profunda, uma área da pesquisa de machine learning que usa dados para modelar abstrações complexas; ➢ Reconhecimento de padrões: a tecnologia que reconhece padrões nos dados (usada muitas vezes como sinônimo de aprendizagem de máquina; ➢ Preparação de dados: o processo de conversão de dados brutos em um outro formato para que eles possam ser consumidos mais facilmente; ➢ Text analytics: ou análise de dados textuais, é o processo de examinar dados não estruturados para reunir os principais insights de negócios. Importância dos dados - 2020 Aplicações de Ciência de Dados Aplicações de Ciência de Dados Aplicações de Ciência de Dados Aplicações de Ciência de Dados Aplicações de Ciência de Dados LGPD ➢ No Brasil, a LGPD (Lei nº 13.709, de 14/8/2018) entrou em vigor em 18 de setembro de 2020 ➢ Diante dos atuais casos de uso indevido, comercialização e vazamento de dados, as novas regras garantem a privacidade dos brasileiros, além de evitar entraves comerciais com outros países. ○ Assegurar o direito à privacidade e à proteção de dados pessoais dos usuários, por meio de práticas transparentes e seguras, garantindo direitos fundamentais. ○ Estabelecer regras claras sobre o tratamento de dados pessoais. ○ Fortalecer a segurança das relações jurídicas e a confiança do titular no tratamento de dados pessoais, garantindo a livre iniciativa, a livre concorrência e a defesa das relações comerciais e de consumo. ○ Promover a concorrência e a livre atividade econômica, inclusive com portabilidade de dados. Direitos
https://www.serpro.gov.br/lgpd/ Governança de dados
➢ Refere-se ao gerenciamento dos dados em todas as suas
etapas dentro das empresas. ➢ Consiste em normas, políticas e regras para tratar os dados e garantir que eles sejam usados com um melhor aproveitamento. Governança de dados
➢ Controle sobre o ciclo de vida dos dados
○ Confidencialidade (controle) ○ Disponibilidade (visibilidade) ○ Integridade (qualidade) ➢ Definição de dados críticos e sensíveis ➢ Categorizar os dados mais importantes e os que requerem ações mais específicas Importância Sugestões Ambiente
➢ Google Colab ○ https://github.com/marycamila184/positivo-data-science
➢ O Python e o Jupyter Notebook (e diversos outros pacotes relacionados)
podem ser instalados usando a distribuição Anaconda em: ○ https://www.anaconda.com/distribution/
Tecnologias Emergentes... Conceitos e Modelagem e Dados para Data Warehouses, Data Mining, Big Data. Modelos de Dados Avançados para Aplicações Avançadas XML PDF