Você está na página 1de 5

DICA DO PROFESSOR

É importante verificar que há limites, na forma da Lei, para a coleta,


o armazenamento, a recuperação e o descarte. Empresas ou acadêmicos devem observar que os
dados devem ser utilizados
com responsabilidade.

Nesta Dica do professor, você vai compreender os processos do ciclo de vida de ciência de
dados em comparativo com a Lei Geral de Proteção de Dados (LGPD).

Conteúdo interativo disponível na plataforma de ensino!

EXERCÍCIOS

1) A união de bases de dados similares, para tentar melhorar a análise dos dados, é uma
tarefa comum em ciência de dados.

Dado que uma base de dados A contém dados íntegros, com grande confiabilidade e
com campos similares aos de uma base de dados B, ambas as bases poderiam ser
usadas para analisar um conjunto de dados. No entanto, na base B, verifica-se que
65% de seu total de campos está nulo, e muitos dados contêm erros relacionados ao
formato. Qual seria uma boa estratégia a ser adotada dentro dos processos de ciência
de dados?

A) Devem-se descartar as duas bases, justamente por não ser possível realizar a integração.

B) Mantém-se a segunda base somente, pois, como ela contém erros, de fato, será o objeto de
estudo.

C) A base A será mantida, pois contém dados confiáveis, e a base B será descartada.

D) É possível integrar as duas bases, mesmo com alguns erros na base B.


E) A base B tem colunas correlatas à base A; portanto, deve-se realizar a integração.

2) Em ciência de dados, o contexto do armazenamento dos dados tem seus pormenores


para que tenhamos a devida segurança e fácil recuperação.

Um hospital armazena os dados de seus pacientes a fim de que possa ter mais
segurança e, também, realizar o devido tratamento. Especificamente na área de
dermatologia, há uma pequena amostra de dados armazenados:

Eles foram realizados por um dermatologista de renome; assim, há alta taxa de


confiabilidade e qualidade nos dados. No entanto, ele armazenou os dados dentro de
seu smartphone em bloco de anotação digital, ao qual somente ele tem acesso. A partir
do problema, o que se pode inferir a respeito do armazenamento, da recuperação, da
qualidade e da privacidade?

A) O médico armazenou de forma a dificultar a recuperação dos dados por outros; no entanto,
não há privacidade.

B) Ele armazenou em um formato correto e com alta confiabilidade, de modo que não ocorra
perda dos dados.
C) A coleta tem qualidade e confiabilidade, e, de fato, o armazenamento foi feito de forma
errada, já que dificulta a recuperação, com possibilidades de perda.

D) A privacidade é mantida por ser um acesso único, e a recuperação é fácil. Já a qualidade


dos dados é baixa e com pouca confiabilidade.

E) Ao priorizar a privacidade, o médico afetou a confiabilidade dos dados; portanto, eles


devem ser descartados.

3) A partir da Lei Geral de Proteção de Dados (LGPD), as instituições devem ter o


devido cuidado nos processos de ciência de dados, a fim de garantir a eficiência
necessária com o cumprimento das normas.

Um sistema, alocado na Internet, solicita ao usuário dados pessoais e os armazena em


uma base de dados relacional confiável, à qual somente a própria empresa tem
acesso, utilizando-a para o fim de marketing. De acordo com a Lei Geral da Proteção
de Dados e as fases de coleta e descarte do processo de ciência de dados, pode-se
afirmar que:

A) o usuário pode solicitar a qualquer momento uma cópia dos dados, bem
como compreender para que fim estão sendo utilizados.

B) mesmo que o usuário peça o descarte, a empresa não é obrigada a fazê-lo, já que o usuário
assinou um contrato digital de consentimento.

C) a empresa pode utilizar os dados para o fim necessário, ou seja, mesmo que tenha iniciado
com marketing, poderá, posteriormente, realizar a venda dos dados.

D) para que seja realizada a coleta de dados, a empresa não precisa que o usuário informe o
consentimento, pois pode utilizar-se de outras vias.

E) se o usuário pedir o descarte dos dados, a coleta não mais poderá ser realizada em nenhum
momento, pois o usuário será excluído permanentemente.

4) Em ciência de dados, a preservação dos dados tem, em sua essência, o objetivo de


contribuir para que o dado coletado tenha suas informações originais e fidedignas,
sem perda de informações quando de sua recuperação.

No processo de identificação de pragas, um agrônomo pode colher, em campo,


diversas fotografias em alta qualidade de cada uma delas e catalogá-las em seu
sistema com o intuito de organizar uma base necessária para os seus estudos. No
entanto, ao realizar os processos para a identificação, percebe que o horário e a
qualidade das fotografias têm um papel importante para a catalogação. No que se
refere aos fatores que permeiam as fases da ciência de dados, o que se
pode compreender nesse contexto?

A) A parte dos direitos autoriais foi violada, já que realizou fotografias de diversas pragas
sem a autorização devida.

B) Devido à qualidade baixa dos dados, não é possível prosseguir com os estudos.

C) Estas seriam fotografias que se disseminariam facilmente nas redes sociais, pois todos
compreenderiam seu significado.

D) A preservação das fotografias não é necessária, já que, após os estudos, elas serão
descartadas.

E) • Mostra a importância dos metadados, já que o dia e a hora das fotografias, bem como
a sua qualidade, são dados que poderiam ser obtidos.

5) Na etapa de preparação de dados a serem submetidos ao processo de mineração de


dados, uma importante tarefa consiste no processo de normalização dos dados
numéricos, que está dentro do contexto da análise exploratória e do pré-
processamento dos dados. Com isso, leva-se o conjunto de dados a uma mesma escala,
evitando distorções na execução dos algoritmos de aprendizado de máquina
utilizados na descoberta de conhecimento de dados, afetando a análise dos resultados.

A respeito da análise exploratória e o descarte dos dados, é possível afirmar:

A) Mesmo que a análise exploratória mostre campos nulos, a extração de conhecimento ainda
pode ser feita com esses campos.

B) O descarte é realizado minuciosamente, retirando-se o que não faz sentido ao problema ou


o que não tem condições de ter conhecimento extraído.

C) A mineração de dados é realizada já durante a coleta, a fim de que já se possa obter


insights dos dados.

D) A análise exploratória é um passo que poderia ser ignorado, já que, ao identificar um dado
na coleta, ele deve fazer parte de solução.

E) A normalização dos dados é parte importante anterior à coleta e faz com que a mineração
dos dados seja mais efetiva.

NA PRÁTICA

O ciclo de vida dos dados é importante na realização dos passos necessários para o resultado
final: a extração da informação.
Ele pode ser utilizado em qualquer conjunto de dados.

Neste Na Prática, você verá sua utilização dentro dos dados educacionais e como estes podem
ajudar uma prefeitura a
tomar decisões para a melhoria do serviço à população.

Você também pode gostar