Resolução do Caso - N1 – Disciplina Data Minining O problema encontrado na Instituição XPTO é muito comum na maioria das instituições com uma vasta rede de unidades, o volume de dados gerados e diversificação de coordenação pelas sedes acaba por deturpar o padrão inicialmente estabelecido, influenciando diretamente a veracidade dos dados, e consequentemente gerando o problema da falta e/ou ruptura de algumas informações. Em 2006, Boente cita que: o processo de Knowledge Discovery from Databases, KDD, não se resume apenas a garimpagem de dados, mas este é considerado o processo elementar para geração do conhecimento gerado a partir de Bases de Dados. O processo de KDD possui 5 etapas: Seleção, Processamento, Transformação, Mineração de Dados e Interpretação & Avaliação.
Ao analisar a situação que a XPTO se encontra podemos observar claramente as etapas
do KDD, foi feita a Seleção do curso de Analise e Desenvolvimento de sistemas a qual possui 1794 disciplinas e suas variáveis (nome, carga horária, objetivo e ementa) e tem seus dados armazenados em planilhas, que serão submetidas ao Processamento e Transformação, etapas essenciais para assegurar a qualidade na Mineração de Dados, esta é a etapa responsável pela modelagem das nossas informações e o sucesso dela irá garantir a boa Interpretação e Avaliação ao final do processo. Como o maior problema dos dados da instituição XPTO é ter uma padronização dos seus dados se faz necessário aplicar as técnicas de Visualização, para descobrir padrões ocultos entre os dados, e a de Clusterização, para realizar o tratamento por dados que possuem semelhança entre si, a ferramenta OpenRefine pode ser uma boa auxiliadora na modelagem inicial dos dados, porém ao expandir o processo para as demais unidades de trabalho seria interessante ter uma ferramenta que suporte mais dados, a sugestão é que seja utilizado o Orange, que tem uma boa interface e possibilita uma ligação com componentes de machine learning, o que ajudaria em processos futuros.
A adoção de ferramentas de KDD, sobretudo na etapa de Mineração de dados é uma
estratégia inteligente que permite agilizar e facilitar todo esse mecanismo de valorização do capital intelectual nas empresas, além de possibilitar uma visualizar e interpretação dos dados de forma mais rápida, agilizando o processo de tomada de decisão e conferindo maior eficácia e eficiência ao processo de Análise de dados.