Você está na página 1de 11

Universidade do Minho

2023/2024

Mestrado em Engenharia e Gestão de Sistemas de


Informação

Aprendizagem Automática em
Sistemas Empresariais
Projeto 2
TP1 – Grupo 1

Beatriz Morais Guilherme Barbosa Mariana Pedreira Paula Ferreira

PG54038 PG53853 PG54074 PG54126

PG53978 PG54074 PG54074

Docente Manuel Santos


Universidade do Minho
2023/2024

Índice
Índice ....................................................................................................................................................... 2
Índice de Figuras ..................................................................................................................................... 2
Índice de Tabelas ..................................................................................................................................... 2
1. Introdução ....................................................................................................................................... 3
2. Implementação ............................................................................................................................... 4
2.1. Planear Avaliação de Resultados ............................................................................................. 4
2.1.1. Resultados da Avaliação ...................................................................................................... 4
2.1.2. Arquitetura .......................................................................................................................... 4
2.1.3. Modelo Multidimensional ................................................................................................... 4
2.2. Planear Monitorizar e Manutenção ........................................................................................ 5
2.2.1. Plano de Monotorização ..................................................................................................... 5
2.3. Produzir o Relatório Final ........................................................................................................ 5
2.3.1. Relatório Final...................................................................................................................... 5
2.3.2. Apresentação Final .............................................................................................................. 6
2.4. Rever o Projeto........................................................................................................................ 6
2.4.1. Documentação do Estudo ................................................................................................... 6
2.5. Key Performance Indicator (KPI).............................................................................................. 6
3. Bibliografia .................................................................................................................................... 11

Índice de Figuras
Figura 1 - Arquitetura .............................................................................................................................. 4
Figura 2 - Modelo Multidimensional ....................................................................................................... 4
Figura 3 - Dashboard Geral ...................................................................................................................... 9
Figura 4 - Dashboard de Classificação ..................................................................................................... 9
Figura 5 - Dashboard de Regressão ....................................................................................................... 10

Índice de Tabelas
Tabela 1 - Definição das medidas e seleção de KPIs ................................................................................ 7
Tabela 2 - Definição das medidas e seleção de KPIs ................................................................................ 8
Tabela 3 - Definição das medidas e seleção de KPIs ................................................................................ 8
Universidade do Minho
2023/2024

1. Introdução
No contexto da unidade curricular de Aprendizagem Automática de Sistemas Empresariais, foi-
nos proposto o desenvolvimento de um projeto cuja finalidade baseia-se na compreensão, análise e
organização dos dados fornecidos, com o objetivo estimar preços de automóveis consoante
determinadas características.

O grupo terá como base a metodologia CRISP-DM, que fornece um modelo de orientação a
projetos de Data Mining através de uma sequência de eventos idealizados e contém seis fases,
nomeadamente, Business Understanding, Data Understanding, Data Preparation, Modeling, Evalution
Deployment.

Portanto, ao longo da realização deste trabalho, pretende-se aplicar esta metodologia de modo a
obter um modelo de previsão que permita indicar valores futuros para uma variável, target, num
determinado domínio do problema, isto é, um modelo de previsão ideal para o objetivo de negócio.
Universidade do Minho
2023/2024

2. Implementação
Esta última fase consiste num plano de desenvolvimento e implementação da solução e
elaboração de todo o relatório final.

2.1. Planear Avaliação de Resultados

2.1.1. Resultados da Avaliação

Tendo em conta a complexidade da questão de previsão de preços de automóveis e as suas


características, fará todo o sentido implementar nestes sistemas um módulo de Data Mining que
permita gerar informação útil ao negócio, entre outros, assim como o desenvolvimento de Dashboards
Interativas. Este sistema será capaz de diminuir erros nesta previsão.

2.1.2. Arquitetura

Deste modo, a equipa de trabalho


desenvolveu uma arquitetura
associada às diferentes camadas
tecnológicas do fluxo de dados
relativamente a este projeto.
Figura 1 - Arquitetura

2.1.3. Modelo Multidimensional

De forma a desenvolver a fase de Implementação, a equipa utilizou o powerBI onde foi gerado
automaticamente o modelo multidimensional. Para além disso, implementamos um modelo de Data
Mining. Nas Dashboards será possível filtrar e agregar a informação pelos diversos atributos, graças à
versatilidade do PowerBI.

Figura 2 - Modelo Multidimensional


Universidade do Minho
2023/2024

2.2. Planear Monitorizar e Manutenção

2.2.1. Plano de Monotorização

O nosso principal foco é atender às necessidades dos nossos utilizadores, proporcionando-lhes


uma valiosa ferramenta para auxiliar na tomada de decisões sobre o preço dos automóveis. Ao oferecer
estimativas precisas e transparentes, procuramos não só conquistar possíveis compradores de
automóveis, como também vendedores do ramo.

Assim a monitorização e manutenção é algo crucial e o modelo deverá ser ajustável de forma
a suportar modificações que possam surgir, com isto o sistema não permanece estático no tempo e
acompanha as variações no mercado de automóveis, com valores atuais.

Deste modo, existem diversos fatores que devem ser tomados em consideração como verificar
aspetos dinâmicos, e constante avaliação dos resultados de Data Mining.

2.3. Produzir o Relatório Final

2.3.1. Relatório Final

A elaboração deste relatório baseou-se na metodologia CRISP-DM, cujo ciclo de vida é composto
por 6 fases.

Primeiramente, houve uma fase de Business Understanding onde a equipa definiu o objetivo de
negócio, os recursos utilizados, as restrições, as suposições, os riscos, entre outros. Definiu também os
objetivos de negócio e os fatores críticos do sucesso do Data Mining. Elaborou ainda um planeamento
de todo o projeto para que fosse obtido um output de qualidade e dentro dos prazos estipulados pela
equipa docente.

Seguidamente, na segunda e terceira fase da metodologia, nomeadamente o Data


Understanding e Data Preparation, analisámos e descrevemos os dados, selecionando os que se
enquadravam com as necessidades do projeto, verificando a qualidade dos mesmos. Fizemos ainda
uma identificação dos vários cenários possíveis.

Na quarta fase, que é o Modeling, selecionamos técnicas de modelação e construímos


diferentes cenários para testar a qualidade do modelo. Na fase seguinte, Evaluation, analisamos e
interpretamos os resultados de cada modelo, identificando assim o melhor cenário, ou seja, aquele que
melhor cumpria os objetivos de Data Mining e de Business Success definidos previamente pela equipa.

Por fim, na última fase, deployment, foi executado um plano de desenvolvimento e


implementação da solução, assim como realização das dashboards para facilitar a análise dos dados.
Universidade do Minho
2023/2024
2.3.2. Apresentação Final

Na apresentação final serão referidas todas as etapas de realização do projeto, desde todos
os relatórios produzidos, códigos elaborados e dashboards realizadas pela equipa, de modo a facilitar
a visualização dos dados.

2.4. Rever o Projeto

2.4.1. Documentação do Estudo

Tendo por base a metodologia CRISP-DM, conseguimos desenvolver um projeto de Data


Mining com uma estrutura relativamente simples e de fácil compreensão. Este projeto envolve
modelos preditivos o que facilita a tomada de decisão num contexto real, como o sistema de previsão
de preços de automóveis.

A equipa de trabalho executou todas as fases do CRISP-DM com sucesso, e graças ao


acompanhamento do docente e das ferramentas disponíveis, com facilidade. No entanto, sentiu
também que o maior desafio enfrentado foi nas fases Modeling e Evaluation.

Numa primeira abordagem, e tal como estava definido no enunciado, a equipa encarou o
projeto como um problema de Regressão. Contudo, ao aplicar os diferentes modelos de Regressão e
ao analisar as métricas, notamos que estas, apesar de estarem dentro dos valores definidos nos
critérios de sucesso do Data Mining, era enriquecedor para o grupo explorar o problema utilizando a
perspetiva da Classificação. Desta maneira, aplicávamos os conhecimentos lecionados ao longo do
semestre, concedendo-nos uma visão ampla e holística das duas abordagens mais conhecidas.

2.5. Key Performance Indicator (KPI)


Mediante os objetivos de negócio anteriormente definidos, o grupo definiu alguns KPIs (Key
Performance Indicators) usando o método dos 9 passos, que têm como objetivo potenciar o alcance do
objetivo de negócio no qual se encontram inseridos.

• Fase 1 – Início
o Etapa 1 – Criar a Equipa de Projeto
▪ A equipa de projeto será composta pela Maria Beatriz Morais, Guilherme
Barbosa, Mariana Pedreira e Paula Ferreira.

o Etapa 2 – Alinhar os KPIs com as áreas chave e as estratégias de melhoramento


▪ Um critério fundamental para o sucesso de negócio é a precisão das previsões
feitas pelo sistema. Se as previsões forem acertadas, as pessoas vão procurar
a nossa ajuda e isto pode ser medido pela taxa de utilização. Na etapa 6,
encontra-se uma tabela melhor explicada acerca dos nossos KPIs.

o Etapa 3 – Explicar o objetivo da utilização e desenvolvimento dos KPIs


▪ A utilização dos KPIs visa monitorizar o desempenho do negócio e o alcance
dos objetivos definidos na fase Business Understanding.
Universidade do Minho
2023/2024
o Etapa 4 – Definir um protocolo para o desenvolvimento e utilização dos KPIs
▪ Entrada: Vamos utilizar um dataset que consiste numa coleção abrangente de
informações sobre veículos automóveis obtidas a partir do website de
mercado automóvel https://www.cars.com. Nesta etapa utilizamos o
datasetC2.
▪ Cálculo: (Apresentados na coluna KPI da etapa 6)
▪ Saída: Dashboards desenvolvidas (apresentadas abaixo, na etapa 7)
▪ Progresso: De maneira a nos destacar da concorrência o sistema não irá
permanecer estático no tempo e irá acompanhar as variações no mercado de
automóveis, com valores atuais.

• Fase 2 – Desenvolvimento
o Etapa 5 – Identificar os Fatores Críticos de Sucesso (FCS) da Organização
▪ Um critério fundamental para o sucesso de negócio é a precisão das previsões
feitas pelo sistema. Quanto mais preciso o sistema for em prever os preços dos
carros, maior será a probabilidade de sucesso do negócio. Se as previsões
forem acertadas, as pessoas vão procurar a nossa ajuda, e para isso, contamos
com o feedback das mesmas para aprimorar constantemente as estimativas.
O sistema deve ser adotado e usado pelo público-alvo, o que pode ser medido
pela taxa de utilização. Se muitas pessoas ou empresas estão dispostas a
utilizar o nosso sistema para obter previsões de preços de carros, isso é um
indicador positivo.

o Etapa 6 – Definição das medidas e seleção dos KPIs por parte da equipa

▪ Geral
Tabela 1 - Definição das medidas e seleção de KPIs

Objetivo de Fator Crítico Medida KPI Meta


Negócio de Sucesso
Aumentar Diminuir a Número Número de Utilizadores [0;50] – Péssimo;
Número de perda de crescente de ] 50;100] – Muito mau;
utilizadores clientes utilizadores da ]100;250] – Mau;
plataforma ]250; 500] – Bom;
]500; 1000] – Muito Bom;
>1000 – Excelente.
Universidade do Minho
2023/2024
▪ Regressão
Tabela 2 - Definição das medidas e seleção de KPIs

Objetivo de Fator Crítico Medida KPI Meta


Negócio de Sucesso
Aumentar a Diminuir a Diferença Diferença | Previsão [0;500] – Excelente;
precisão do diferença de preço entre a - Preço Real | ]500;1000] – Muito Bom;
modelo da previsão decrescent Previsão e o ]1000;2500] – Bom;
face ao e entre o Preço Real ]2500; 5000] – Mau;
valor real valor da ]5000; 7000] – Muito
previsão e Mau;
o preço >7000 – Péssimo.
real.
Aumentar a Diminuir a Percentage Erro Relativo | Previsão [0;5] % – Excelente;
confiabilidade percentage m de erro (%) - Preço Real | / ]5;10] % – Muito Bom;
do modelo m de erro decrescent Preço Real * ]10;15] % – Bom;
da previsão e na 100 ]15; 20] % – Mau;
previsão ]20; 25] % – Muito Mau;
do preço. >25 % – Péssimo.

▪ Classificação
Tabela 3 - Definição das medidas e seleção de KPIs

Objetivo de Fator Medida KPI Meta


Negócio Crítico de
Sucesso
Aumentar a Aumentar Número % Classificações [100;98] % – Excelente;
precisão do os valores crescente Classificações Corretas / ]98;95] % – Muito Bom;
modelo das de corretas Total de ]95;90] % – Bom;
classificaçõ classificaçõ Classificações ]90; 80] % – Mau;
es corretas. es corretas * 100 ]80; 75] % – Muito Mau;
<75 % – Péssimo.
Aumentar a Aumentar o Número Grau de Confiança do Modelo [100;98] % – Excelente;
confiabilidade grau de crescente ]98;95] % – Muito Bom;
do modelo confiança do grau de ]95;90] % – Bom;
do modelo confiança ]90; 80] % – Mau;
do modelo ]80; 75] % – Muito Mau;
<75 % – Péssimo.

• Fase 3 – Implementação
o Etapa 7 – Desenvolver os meios de visualização
▪ A elaboração de dashboards é uma ferramenta essencial para visualizar e
interpretar dados. Estas apresentam diversas métricas e gráficos interativos
que nos permitem observar diferentes cruzamentos.
Universidade do Minho
2023/2024

Figura 3 - Dashboard Geral

Figura 4 - Dashboard de Classificação


Universidade do Minho
2023/2024

Figura 5 - Dashboard de Regressão

o Etapa 8 – Facilitar a utilização de KPIs para promover a melhoria de desempenho


▪ Não aplicável

• Fase 4 – Revisão
o Etapa 9 – Redefinir e refinar os KPIs por forma a manter a sua relevância
▪ Não aplicável
Universidade do Minho
2023/2024

3. Bibliografia
1- https://machinelearningmastery.com/

Você também pode gostar