Escolar Documentos
Profissional Documentos
Cultura Documentos
Nesta Dica do professor, você vai compreender os processos do ciclo de vida de ciência de
dados em comparativo com a Lei Geral de Proteção de Dados (LGPD).
EXERCÍCIOS
1) A união de bases de dados similares, para tentar melhorar a análise dos dados, é uma
tarefa comum em ciência de dados.
Dado que uma base de dados A contém dados íntegros, com grande confiabilidade e
com campos similares aos de uma base de dados B, ambas as bases poderiam ser
usadas para analisar um conjunto de dados. No entanto, na base B, verifica-se que
65% de seu total de campos está nulo, e muitos dados contêm erros relacionados ao
formato. Qual seria uma boa estratégia a ser adotada dentro dos processos de ciência
de dados?
A) Devem-se descartar as duas bases, justamente por não ser possível realizar a integração.
B) Mantém-se a segunda base somente, pois, como ela contém erros, de fato, será o objeto de
estudo.
C) A base A será mantida, pois contém dados confiáveis, e a base B será descartada.
Um hospital armazena os dados de seus pacientes a fim de que possa ter mais
segurança e, também, realizar o devido tratamento. Especificamente na área de
dermatologia, há uma pequena amostra de dados armazenados:
A) O médico armazenou de forma a dificultar a recuperação dos dados por outros; no entanto,
não há privacidade.
B) Ele armazenou em um formato correto e com alta confiabilidade, de modo que não ocorra
perda dos dados.
C) A coleta tem qualidade e confiabilidade, e, de fato, o armazenamento foi feito de forma
errada, já que dificulta a recuperação, com possibilidades de perda.
A) o usuário pode solicitar a qualquer momento uma cópia dos dados, bem
como compreender para que fim estão sendo utilizados.
B) mesmo que o usuário peça o descarte, a empresa não é obrigada a fazê-lo, já que o usuário
assinou um contrato digital de consentimento.
C) a empresa pode utilizar os dados para o fim necessário, ou seja, mesmo que tenha iniciado
com marketing, poderá, posteriormente, realizar a venda dos dados.
D) para que seja realizada a coleta de dados, a empresa não precisa que o usuário informe o
consentimento, pois pode utilizar-se de outras vias.
E) se o usuário pedir o descarte dos dados, a coleta não mais poderá ser realizada em nenhum
momento, pois o usuário será excluído permanentemente.
A) A parte dos direitos autoriais foi violada, já que realizou fotografias de diversas pragas
sem a autorização devida.
B) Devido à qualidade baixa dos dados, não é possível prosseguir com os estudos.
C) Estas seriam fotografias que se disseminariam facilmente nas redes sociais, pois todos
compreenderiam seu significado.
D) A preservação das fotografias não é necessária, já que, após os estudos, elas serão
descartadas.
E) • Mostra a importância dos metadados, já que o dia e a hora das fotografias, bem como
a sua qualidade, são dados que poderiam ser obtidos.
A) Mesmo que a análise exploratória mostre campos nulos, a extração de conhecimento ainda
pode ser feita com esses campos.
D) A análise exploratória é um passo que poderia ser ignorado, já que, ao identificar um dado
na coleta, ele deve fazer parte de solução.
E) A normalização dos dados é parte importante anterior à coleta e faz com que a mineração
dos dados seja mais efetiva.
NA PRÁTICA
O ciclo de vida dos dados é importante na realização dos passos necessários para o resultado
final: a extração da informação.
Ele pode ser utilizado em qualquer conjunto de dados.
Neste Na Prática, você verá sua utilização dentro dos dados educacionais e como estes podem
ajudar uma prefeitura a
tomar decisões para a melhoria do serviço à população.