Você está na página 1de 8

Disciplina: Princípios de Ciência de Dados – Atividade 1

Nome: Ludmila Honorio Bueno Pereira

1) Levando em consideração a chamada “Revolução dos Dados”, que surgiu


originando uma nova visão sobre a importância dos dados e a riqueza de
informações que podem ser obtidas com a análise de dados, fale sobre:
i) O que é Big Data?

São conjuntos de dados complexos e difíceis de se analisar tradicionalmente,


eles costumam são gerados de outras fontes grandes. Para lidar com estes
dados requer tecnologia avançada.

ii) Cite e explique quais são os V’s do Big Data.

1) Volume: volumes de dados que podem ser extremamente grandes e


crescer rapidamente, com soluções de armazenamento e gerenciamento
de dados escaláveis
2) Velocidade: é a rapidez que os dados são gerados para serem
disponibilizados para a análise, com os dados sendo gerados em
velocidade cada vez maiores, tornando a análise em tempo hábil um
desafio para os profissionais de Big Data.
3) Variedade: Uma variedade refere-se á diversidade de tipos de dados
gerados em um ambiente de Big Data, a capacidade de processar e
analisar diferentes de dados e fundamental para o sucesso de um
projeto de Big Data.
4) Veracidade: se refere a quantidade e confiabilidade dos dados que estão
sendo gerados e processados em um ambiente de Big Data.
5) Valor: é a capacidade de extrair valor dos dados gerados em um
ambiente de Big Data

iii) O que é Ciência de Dados?

É um campo que combina estatística, matemática, programação, inteligência


artificial e conhecimento de negócios para transformar dados em informações
úteis, é uma área em constante evolução, impulsionada pela disponibilidade de
dados e pelo desenvolvimento de novas tecnologias e algoritmos de

1
Disciplina: Princípios de Ciência de Dados – Atividade 1

aprendizado de máquina muito valorizada em muitos setores, incluindo


finanças, saúde, tecnologia, varejo e muitos mais.

iv) Qual(is) a(s) diferença(s) entre Big Data e Ciência de Dados?

A principal diferença entre Big Data e Ciência de Dados é que o primeiro está
mais relacionado à gestão e processamento de grandes volumes de dados,
enquanto a Ciência de Dados está mais relacionado à análise e geração de
insights a partir desses dados. Enquanto o Big Data se concentra em
armazenar, gerenciar dados.

2) Quais são os três pilares de Ciência de Dados? Dê um exemplo prático de


aplicação no dia a dia.

1- Estatística: A estatística é fundamental na Ciência de Dados para ajudar a


compreender os dados e encontrar padrões e tendências. Ela envolve a análise
de dados, a construção de modelos estatísticos, a inferência e a previsão.

2- Programação: A programação é um pilar importante da Ciência de Dados,


pois ajuda a automatizar processos, processar dados e criar modelos. A
programação também é usada para criar visualizações de dados e relatórios

3-Conhecimento de Negócios: O conhecimento de negócios é importante na


Ciência de Dados porque ajuda a entender os problemas que precisam ser
resolvidos e a traduzir as necessidades dos negócios em questões que podem
ser resolvidas com dados.

um exemplo que usamos no dia a dia é um aplicativo de previsão do tempo.


Esse aplicativo usa dados meteorológicos para prever as condições climáticas
futuras.

3) Quais são as características de uma análise:

i) Do ponto de vista de BI (Business Intelligence) Tradicional?

Orientada a dados: a análise deve ser baseada em dados coletados de


diferentes fontes e sistemas, como sistemas transacionais, data warehouses,
data marts, etc.

1
Disciplina: Princípios de Ciência de Dados – Atividade 1

Consolidada: a análise deve consolidar informações de diferentes fontes em


um único ambiente para fornecer uma visão holística dos dados da empresa.

Histórica: a análise deve permitir a análise de dados históricos, para identificar


tendências e padrões ao longo do tempo.

Padronizada: a análise deve ser padronizada e consistente, seguindo as


mesmas regras de negócios e definições de dados em toda a organização.

Flexível: a análise deve ser flexível o suficiente para permitir diferentes formas
de visualização e análise dos dados, de acordo com as necessidades de
diferentes usuários e áreas da empresa.

Interativa: a análise deve ser interativa, permitindo que os usuários explorem os


dados em diferentes níveis de detalhe e perspectivas, para responder
perguntas e descobrir insights de negócios.

Orientada a ação: a análise deve ser orientada a ação, fornecendo informações


relevantes e acionáveis para apoiar a tomada de decisão estratégica e
operacional na empresa.

ii) Do ponto de vista de um Cientista de Dados?

Explorar dados com métodos estatísticos e aprendizado de máquina para


encontrar insights e padrões ocultos.

O uso de ferramentas de visualização de dados para comunicar informações


de maneira clara e concisa.

A inclusão de dados de várias fontes, incluindo dados seguros e não seguros.

O uso de métodos experimentais para testar hipóteses e validar resultados.

A ênfase na criação de modelos preditivos para prever tendências futuras ou


comportamentos do usuário.

A importância dos dados à privacidade e segurança dos dados em todas as


etapas da análise.

1
Disciplina: Princípios de Ciência de Dados – Atividade 1

4) Sobre Banco de Dados Relacionais e Sistemas Gerenciadores de Banco de


Dados (SGBD’s):

i) Como os dados são organizados em um banco de dados?

Em uma tabela, com linhas e colunas que representam os atributos dos dados.
As tabelas são relacionadas entre si por meio de chaves primárias e
estrangeiras. A chave primária é um campo ou conjunto de campos que
identificam exclusivamente cada linha na tabela e a chave estrangeira é um
campo em uma tabela que faz referência à chave primária em outra tabela.

ii) Quais são algumas das funções de um SGBD?

Tem diversas funções importantes, incluindo a criação, modificação e exclusão


de bancos de dados, definição de regras de acesso e estrutura. Ele também
gerencia usuários e suas permissões de acesso, controla a concorrência para
garantir que as operações de um usuário não afetem as de outro, indexa dados
para acelerar o acesso em grandes conjuntos de dados, otimiza as consultas
para maximizar o desempenho e protege os dados contra acessos não
autorizados por meio de recursos de segurança e privacidade.

iii) Quais são as principais instruções (comandos) utilizados tanto para criar um
banco de dados quanto para armazenar/alterar/excluir e consultar dados em
um banco de dados.

CREATE DATABASE: usado para criar um banco de dados.

CREATE TABLE: usado para criar uma tabela no banco de dados,


especificando os nomes das colunas e seus tipos de dados.

ALTER TABLE: usado para modificar a estrutura de uma tabela, como


adicionar ou remover colunas ou alterar o tipo de dados de uma coluna
existente.

DROP TABLE: usado para excluir uma tabela existente do banco de dados.

INSERT INTO: usado para adicionar novas linhas (registros) a uma tabela.

UPDATE: usado para modificar os valores existentes em uma ou mais linhas


de uma tabela.

1
Disciplina: Princípios de Ciência de Dados – Atividade 1

DELETE FROM: usado para excluir uma ou mais linhas de uma tabela.

SELECT: usado para recuperar dados de uma ou mais tabelas, permite


especificar as vozes que devem ser retornadas, as condições que os dados
devem atender e a ordem em que os resultados devem ser qualificados.

JOIN: usado para combinar dados de duas ou mais mesas em uma única
consulta, é usado para recuperar dados que estão relacionados em diferentes
tabelas.

5) Com relação aos modelos de desenvolvimento de sistemas de


informação (Ciclos de vida), cite e explique ao menos 3 modelos.

1- Modelo em Cascata: O modelo em cascata é um dos modelos de ciclo de


vida mais antigos e bem conhecidos. Ele é caracterizado por uma
sequência linear de fases, começando pela análise de requisitos, passando
pelo design, incentivo, teste e implantação

2-Modelo Iterativo: O modelo iterativo envolve o desenvolvimento


incremental de um sistema. Cada iteração envolve uma análise de
requisitos, design, concentração e teste, mas com um foco em um
subconjunto do sistema maior. Em cada iteração, uma funcionalidade
adicional é adicionada ao sistema

3-Modelo Ágil: O modelo ágil é um conjunto de metodologias de


desenvolvimento que se concentra em fornecer entregas rápidas e
funcionalidades frequentes do sistema. Ele envolve uma abordagem
iterativa e incremental e requer uma forte colaboração entre a equipe de
desenvolvimento e os clientes

6) O banco de dados, muitas vezes, é a parte mais importante do sistema, pois


é onde a informação está armazenada, sendo o projeto de BD essencial para o
desenvolvimento de sistemas de informação. Um projeto de banco de dados é
subdividido em etapas no qual o objetivo é a criação de um banco de dados
otimizado que atenda às expectativas do cliente. E, nesse contexto, os

1
Disciplina: Princípios de Ciência de Dados – Atividade 1

modelos de dados são muito importantes para a transmissão de ideias entre o


cliente e o projetista, bem como para facilitar a manutenção do banco de dados
no futuro. Nesse cenário, observe a figura abaixo:  

Os modelos ALFA, BETA e GAMA são denominados, respectivamente, como:

(D) conceitual, lógico e físico. 

7) Como se denomina a ferramenta para acesso à informação de um Data


Warehouse que armazena dados históricos para tomadas de decisão
empresariais?

(D) OLAP (On-Line Analytical Processing)

8) A melhor definição para OLAP (On-line Analytical Processing) é:

(C) A capacidade para manipular e analisar um grande volume de dados sob


múltiplas perspectivas.

1
Disciplina: Princípios de Ciência de Dados – Atividade 1

9) OLAP é uma ferramenta de Business Inteligence utilizada para apoiar as


empresas na análise de suas informações, visando obter novos conhecimentos
que são empregados para a tomada de decisão. Uma das características que
deve estar presente em ferramentas OLAP é a capacidade de efetuar algumas
operações, como:

I. Ocorre quando o usuário pula um nível intermediário dentro de uma mesma


dimensão, por exemplo, a dimensão tempo é composta por ano, semestre,
trimestre, mês e dia. Essa operação é executada quando o usuário passa de
ano direto para trimestre ou mês.

II. Ocorre quando o usuário aumenta o nível de detalhe da informação,


diminuindo a granularidade, um conceito que determina quais os tipos de
consultas podem ser realizadas no Data Warehouse. Essa operação influencia
diretamente na velocidade do acesso às informações e no volume de dados
armazenados.

III. Ocorre quando o usuário aumenta a granularidade, diminuindo o nível de


detalhamento da informação.

IV. Ocorre quando o usuário passa de uma informação contida em uma


dimensão para uma outra, como por exemplo, inicia na dimensão do tempo e
no próximo passo analisa a informação por região.

As operações definidas em I, II, III e IV são conhecidas, respectivamente,


como:

(D) drill Down, drill Up, drill Throught e drill Across

10) Data Warehouses (DW’s) constituem-se em grandes bancos de dados


analíticos que, dependendo da aplicação, podem ser organizados em apenas
uma estrutura capaz de armazenar todas as informações de uma
empresa/organização. No entanto, um DW pode estar dividido em
subconjuntos que o tornam melhor gerenciável. Qual é a denominação dada a
esses subconjuntos que auxiliam no armazenamento de dados em um DW?
Explique a sua importância.

1
Disciplina: Princípios de Ciência de Dados – Atividade 1

Os Data Marts são subconjuntos menores e mais especializados dentro de um


Data Warehouse, projetados para lidar com informações específicas de um
determinado departamento, área ou processo de negócios da empresa. Eles
fornecem informações relevantes de forma mais rápida e eficiente, podem ser
otimizados para atender às necessidades de áreas específicas, simplificam o
gerenciamento e a manutenção dos dados, e permitem que cada departamento
tome decisões mais precisas e controladas com base em suas necessidades
específicas, descentralizando o processo de tomada de decisão.

Você também pode gostar