Você está na página 1de 1

Juliana Paixão L.

da Hora | RA: 2022300294


Resolução do Caso - N1 – Disciplina Data Minining
O problema encontrado na Instituição XPTO é muito comum na maioria das instituições
com uma vasta rede de unidades, o volume de dados gerados e diversificação de coordenação
pelas sedes acaba por deturpar o padrão inicialmente estabelecido, influenciando diretamente
a veracidade dos dados, e consequentemente gerando o problema da falta e/ou ruptura de
algumas informações. Em 2006, Boente cita que: o processo de Knowledge Discovery from
Databases, KDD, não se resume apenas a garimpagem de dados, mas este é considerado o
processo elementar para geração do conhecimento gerado a partir de Bases de Dados. O
processo de KDD possui 5 etapas: Seleção, Processamento, Transformação, Mineração de
Dados e Interpretação & Avaliação.

Ao analisar a situação que a XPTO se encontra podemos observar claramente as etapas


do KDD, foi feita a Seleção do curso de Analise e Desenvolvimento de sistemas a qual possui
1794 disciplinas e suas variáveis (nome, carga horária, objetivo e ementa) e tem seus dados
armazenados em planilhas, que serão submetidas ao Processamento e Transformação, etapas
essenciais para assegurar a qualidade na Mineração de Dados, esta é a etapa responsável pela
modelagem das nossas informações e o sucesso dela irá garantir a boa Interpretação e
Avaliação ao final do processo. Como o maior problema dos dados da instituição XPTO é ter uma
padronização dos seus dados se faz necessário aplicar as técnicas de Visualização, para descobrir
padrões ocultos entre os dados, e a de Clusterização, para realizar o tratamento por dados que
possuem semelhança entre si, a ferramenta OpenRefine pode ser uma boa auxiliadora na
modelagem inicial dos dados, porém ao expandir o processo para as demais unidades de
trabalho seria interessante ter uma ferramenta que suporte mais dados, a sugestão é que seja
utilizado o Orange, que tem uma boa interface e possibilita uma ligação com componentes de
machine learning, o que ajudaria em processos futuros.

A adoção de ferramentas de KDD, sobretudo na etapa de Mineração de dados é uma


estratégia inteligente que permite agilizar e facilitar todo esse mecanismo de valorização do
capital intelectual nas empresas, além de possibilitar uma visualizar e interpretação dos dados
de forma mais rápida, agilizando o processo de tomada de decisão e conferindo maior eficácia
e eficiência ao processo de Análise de dados.

Você também pode gostar