Relatorio Conclusao 1

ESCOLA SESI SENAI CATALÃO – GO
AUTOMAÇÃO INDUSTRIAL
KARLLOS ADRIANO SANTANA SILVA
HUGO ROSA DE ALMEIDA
GUILHERME RAMOS
PROJETO DE CONCLUSÃO DE CURSO
MACHINE LEARNING
Catalão
2023
0
ESCOLA SESI SENAI CATALÃO – GO
AUTOMAÇÃO INDUSTRIAL
KARLLOS ADRIANO SANTANA SILVA
HUGO ROSA DE ALMEIDA
GUILHERME RAMOS
PROJETO DE CONCLUSÃO DE CURSO
MACHINE LEARNING
Projeto referente ao projeto de conclusão de curso,

instruído pelo instrutor técnico Cleiton Rezende,
com o tema de Machine Learning.
Catalão
2023
1
Sumário
Introdução 3
História do Machine Learning 5
Algoritmos do Machine Learning 5
Validação Cruzada 8
Aprendizado de máquina em antitruste 8
Validação cruzada na análise de dados econômicos 9
Aplicações de validação cruzada em análise econômica 10
A Divisão de Treinamento Teste (Train/Test Split) 11
Aplicações Práticas do Machine Learning 12
Desafios e Questões Éticas em Machine Learning13
Tendências Futuras em Machine Learning 14
Deep Learning 15
Aprendizado por reforço 17
Aprendizado Automático 18
Qualidades de Dados 19
Expansão sobre Algoritmos Específicos 20
Conclusão 21
Problemática e projeto solução 22
2
INTRODUÇÃO
A era digital tem testemunhado avanços tecnológicos inigualáveis,

impulsionando inovações e transformações significativas em diversas esferas da
sociedade. Entre essas inovações, Machine Learning (Aprendizado de Máquina)
emergiu como um dos campos mais proeminentes e dinâmicos da inteligência
artificial, desencadeando uma revolução no processamento de dados e na tomada
de decisões.
Este Trabalho de Conclusão de Curso (TCC) busca explorar e compreender a

magnitude e o impacto do Machine Learning, destacando suas aplicações, desafios
e o seu papel na moldagem do presente e do futuro. O Machine Learning, que tem
suas raízes em disciplinas como estatística, ciência da computação e inteligência
artificial, representa uma abordagem revolucionária para a análise de dados. Em
contraste com os métodos tradicionais de programação, onde regras explícitas são
definidas, o Machine Learning capacita sistemas a aprender e melhorar com base
em dados. Isso resulta em sistemas que podem identificar padrões complexos, fazer
previsões precisas e automatizar tarefas de forma eficiente, tudo sem intervenção
humana direta. O Machine Learning é uma disciplina multifacetada que engloba
várias técnicas e abordagens para a análise e interpretação de dados. Nesta seção,
exploraremos os fundamentos do Machine Learning, incluindo os três principais
paradigmas e dentre seu esse tema temos alguns fundamentos que ajuda a realizar
uma divisão e um melhor entendimento, são eles: Aprendizado supervisionado,
aprendizado não supervisionado e o aprendizado por reforço. O aprendizado
supervisionado é um dos pilares do Machine Learning, nesse paradigma,
algoritmos são treinados em pares de entrada e saída, ou seja, dados rotulados. No
aprendizado não supervisionado, é uma abordagem de aprendizado de máquina
em que algoritmos são treinados em dados que não possuem rótulos ou classes
atribuídas previamente. Ao contrário do aprendizado supervisionado, no qual um
modelo é treinado para realizar previsões com base em dados rotulados, o
aprendizado não supervisionado visa extrair padrões e estruturas intrínsecas dos
dados sem orientação específica.
3
Existem duas técnicas principais de aprendizado não supervisionado:
agrupamento e redução de dimensionalidade. O agrupamento organiza os dados em
grupos ou clusters com base em suas semelhanças internas, enquanto a redução de
dimensionalidade visa reduzir o número de variáveis em um conjunto de dados,
preservando as informações mais importantes. Algoritmos comuns incluem o K-
Means e Clustering Hierárquico para agrupamento, e PCA (Análise de Componentes
Principais) e t-SNE (t-Distributed Stochastic Neighbor Embedding) para redução de
dimensionalidade. Essas técnicas são aplicadas em diversas situações, como
segmentação de clientes, reconhecimento de padrões e compressão de imagens.
Outra abordagem é o uso de mapas auto-organizáveis (SOM), uma técnica que
mapeia dados multidimensionais em uma rede bidimensional ou tridimensional,
preservando a topologia e a estrutura dos dados. Os SOMs são utilizados para
visualização de características complexas e agrupamento de dados em mapas 2D
ou 3D.
A aprendizagem profunda não supervisionada envolve o uso de redes neurais

profundas para aprender representações hierárquicas e complexas dos dados sem
supervisão. Isso é frequentemente aplicado em modelos pré-treinados para
aprendizado por transferência e extração de recursos em grandes conjuntos de
dados. Esses métodos não supervisionados são fundamentais para explorar
padrões em dados não rotulados, desempenhando um papel crucial em diversas
aplicações, desde a visualização de dados até a preparação de conjuntos de dados
para treinamento de modelos mais avançados. Entender esses fundamentos é
essencial para avançar no estudo do Machine Learning, já que representam os
blocos de construção fundamentais para resolver problemas do mundo real em
diversas áreas, como robótica, jogos e recomendação de produtos.
Temos dois termos que vão ser bastantes ditos durante esse TCC sendo eles
usados bastante nas áreas de inteligência artificial e machine learning:
Explicabilidade: Refere-se à qualidade de ser capaz de explicar ou entender o

funcionamento de um modelo ou sistema. Em contextos de aprendizado de
máquina, é importante que os modelos possam ser compreendidos e explicados de
maneira a fornecer insights sobre como eles tomam decisões.
4
Interpretabilidade: Está relacionada à capacidade de interpretar ou compreender
os resultados ou saídas de um modelo ou sistema. Em contextos de aprendizado de
máquina, busca-se tornar os resultados dos modelos compreensíveis para os
usuários, especialmente em áreas críticas como saúde, finanças e justiça.
História do Machine Learning
Na última metade do século passado Alan turning em sua obra seminal

“Computing Machinery and Intelligence”," formulou o conceito do "Teste de Turing"
para avaliar a inteligência artificial o qual testa a capacidade de um computador de
exibir comportamento inteligente equivalente ao de um ser humano, ou indistinguível
deste, Já na década de 1950 o termo inteligência artificial foi cunhado até então o
machine learning foi considerado parte da inteligência artificial assim levando a
busca por desenvolver um programa de computador capaz de aprender com dados.
Em 1960 as redes neurais começaram a ganhar destaque e houve o surgimento das
primeiras redes neurais simples.
Já em 1980 temos um renascimento do machine learnin com o

desenvolvimento de algoritmos de aprendizado, como maquinas de vetores de
suporte (SVM) e arvores de decisões e graças ao algoritmo de retroprogamação
ampliou se o estudo de redes neurais, o início do século XXI testemunhou um
avanço extraordinário no Machine Learning devido à crescente disponibilidade de
grandes volumes de dados e ao aumento do poder de computação. Isso levou ao
ressurgimento das redes neurais profundas (Deep Learning), que demonstraram um
desempenho excepcional em tarefas como reconhecimento de imagens e
processamento de linguagem natural.
Algoritmos do Machine Learning
“Aprender envolve modificações na máquina de aprendizagem; isto é claro.

Entretanto, a exata natureza destas modificações e a melhor maneira de representá-
las não é nada óbvio. Uma abordagem para isso modela o aprendizado como a
5
aquisição de conhecimento do domínio explicitamente representado.” Inteligência
Artificial - 4ª Ed. 2004 pg.330
Com base nessa fala fica claro que o aprendizado se baseia em algoritmos e
o Machine Learning se baseia na aplicação de uma variedade de algoritmos sendo
os principais são divididos em duas partes os Supervisionado e não supervisionado,
sendo supervisionado tendo tarefas preditivas, como por exemplo uma tarefa de
classificação, sendo contínuo; já as não supervisionadas se divide em grupos de
acordo com sua similaridade.
APRENDIZADO DE MÁQUINA
/ \
/ \
SUPERVISIONADO NÃO SUPERVISIONADO
I I
I I
/\ I
CLASSIFICAÇÃO REGRESSÃO I
/I-------------------\
Preditivo AGRUPAMENTO ASSOCIAÇÃO
SUMARIZAÇÃO e modelos
para aprender a partir dos dados Baseados neles conseguimos trazer a máquina um
entendimento e atribuímos sua função desenvolvendo suas capacidades de
aprender o proposto. Dentre seus outros algoritmos temos as redes neurais
artificiais, inspiradas no funcionamento do cérebro humano, têm desempenhado um
papel fundamental no Machine Learning. Elas consistem em camadas de neurônios
interconectados que processam informações e aprendem representações
complexas. As redes neurais profundas, ou Deep Learning, têm sido notáveis por
seu sucesso em tarefas como visão computacional e processamento de linguagem
natural, já para solucionar problemas de classificação e regressão temos as Árvores
6
de Decisão que são algoritmos de aprendizado supervisionado, elas dividem o
espaço de recursos em subconjuntos menores, representados por um conjunto de
regras de decisão em forma de árvore. Algoritmos como o Random Forest e o
Gradient Boosting Trees aprimoram o desempenho das árvores de decisão. Temos
também métodos que trabalham agrupando dados como os métodos de
clusterização os quais agrupam dados em clusters ou grupos com características
semelhantes. O algoritmo K-Means é um exemplo popular de método de
clusterização, que atribui pontos de dados a grupos com base em sua proximidade.
Os Algoritmos de classificação e regressão são usados para prever rótulos de
classes ou valores numéricos. Além dos algoritmos já mencionados, outros, como
Regressão Logística, Support Vector Machines (SVM) e saindo das abordagens
tradicionais, como os classificadores Naïve Bayes baseados no teorema de Bayes
com suposições de independência, a evolução tecnológica nos trouxe uma
ferramenta poderosa, o aprendizado profundo (Deep Learning). O aprendizado
profundo é uma subárea do Machine Learning que envolve o uso de redes neurais
profundas com múltiplas camadas. Essa abordagem permite a extração de
representações complexas a partir dos dados, tornando-a ideal para tarefas
desafiadoras. Além disso, em tarefas de regressão, uma abordagem amplamente
adotada é a aplicação dos Mínimos Quadrados Comuns, que consiste em ajustar um
modelo linear aos dados, minimizando a soma dos quadrados das diferenças entre
as observações reais e as previsões do modelo. A combinação de técnicas como o
aprendizado profundo e Mínimos Quadrados Comuns oferece uma ampla gama de
ferramentas para resolver problemas do mundo real, como o reconhecimento de
rostos e análise de dados em tempo real.
No campo do aprendizado de máquina, existem diversas técnicas e

algoritmos que desempenham um papel fundamental na análise e processamento
de dados. Dentre elas, destacam-se as máquinas de vetores de suporte (SVM), que
são utilizadas para classificação binária por meio da criação de hiperplanos para
separar os dados em grupos com base na distância máxima entre eles. Por
exemplo, o SVM foi aplicado com sucesso em áreas como detecção de locais de
emenda humana e classificação de imagens em larga escala. Além disso, os
métodos Ensemble, como a média bayesiana e outros algoritmos avançados, têm se
7
destacado no aprendizado de máquina. Esses métodos envolvem a criação de
classificadores que juntos geram previsões ponderadas para novos pontos de
dados. Isto não só reduz o viés do modelo, mas também a variância, tornando as
previsões mais confiáveis. Essas técnicas podem ser usadas em muitos campos,
desde análise de dados em tempo real até reconhecimento de padrões. Portanto,
ao estudar a área de aprendizado de máquina, é importante considerar diferentes
técnicas, desde a combinação de algoritmos até a análise de componentes
principais, para escolher a abordagem mais adequada para problemas específicos e
utilizar de forma otimizada o poder de processamento.
Validação cruzada
A validação cruzada é uma técnica usada para avaliar o desempenho de um

modelo de aprendizado de máquina, dividindo os dados em conjuntos de
treinamento e teste várias vezes para obter uma estimativa mais precisa da
capacidade do modelo de generalizar para novos dados. A validação cruzada
desempenha um papel importante na aplicação do aprendizado de máquina na
defesa competitiva e na análise de dados econômicos garante a robustez e
previsibilidade dos modelos utilizados nestes contextos. A seleção adequada de k e
a interpretação cuidadosa dos resultados são essenciais para garantir a validade
das conclusões obtidas pela validação cruzada esse conceito demonstra como a
validação cruzada pode ser uma ferramenta valiosa na tomada de decisões relativas
à concorrência nas economias modernas.
Aprendizado de máquina em antitruste
A economia digital e a evolução dos mercados competitivos suscitaram

preocupações significativas para as autoridades antitruste em todo o mundo. A
dinâmica única destes mercados, como os efeitos de rede, as economias de escala,
a dependência dos dados dos utilizadores e os custos de mudança, colocam
desafios únicos às operações antitrustes. No entanto, a análise de dados e a
utilização de técnicas de aprendizagem automática fornecem ferramentas poderosas
8
para enfrentar estes desafios (OCDE, 2022). A utilização de modelos e algoritmos
de aprendizagem automática no domínio antitrust requer dois elementos
fundamentais: pessoal formado e a disponibilidade de dados relevantes. A formação
de economistas e advogados em análise de dados e a disponibilidade de conjuntos
de dados apropriados são essenciais para explorar o potencial destas técnicas na
análise antitrust.
Validação cruzada na análise de dados econômicos
Na análise de dados econômicos, a validação cruzada, especialmente a

validação cruzada K-fold, é uma técnica importante para avaliar a previsibilidade. A
validação cruzada é usada para estimar o desempenho do modelo quando aplicado
a dados não utilizados no treinamento. Isto é necessário para garantir que os
modelos sejam generalizáveis e imparciais. A validação cruzada K-fold envolve a
divisão do conjunto de dados em k partes, com k-1 partes usadas para treinamento
e a k-ésima parte usada para teste, o modelo é ajustado várias vezes e o erro
associado a cada execução é calculado ao final do processo, os erros são utilizados
para avaliar o desempenho do modelo e comparar diferentes modelos em termos de
custos associados, como o erro quadrático médio (MSE) (Hastie, Tibshirani, &
Friedman, 2009). A escolha de k é um equilíbrio entre viés e variância valores
menores de k resultam em menos variância, mas em viés maior além disso, a
escolha de k deve levar em consideração limitações computacionais, pois valores
menores de k podem encarecer o processo. Normalmente, os valores k mais
comuns incluem 5, 10 e, em casos especiais, um valor próximo ao tamanho da
amostra (validação cruzada deixar um de fora).
Aplicações de validação cruzada em análise econômica
A validação cruzada tem diversas aplicações em análise econômica uma delas é

a seleção de modelos de aprendizado de máquina, nos quais devem ser escolhidos
diferentes parâmetros de ajuste a validação cruzada é usada para comparar o
desempenho de modelos com diferentes parâmetros de ajuste e selecionar o
9
modelo que produz o menor custo, como o MSE além disso, a validação cruzada
pode ser usada para avaliar a capacidade preditiva de modelos em análises de
casos concorrentes por exemplo, ao considerar o impacto unilateral de uma fusão,
podemos prever a entrada de novos concorrentes ou a probabilidade de tal entrada
dentro de um determinado prazo a validação cruzada permite comparar o
desempenho de diferentes modelos de previsão e escolher o modelo mais
adequado. A validação cruzada desempenha um papel importante na aplicação do
aprendizado de máquina na defesa competitiva e na análise de dados econômicos
garante a robustez e previsibilidade dos modelos utilizados nestes contextos. A
seleção adequada de k e a interpretação cuidadosa dos resultados são essenciais
para garantir a validade das conclusões obtidas pela validação cruzada esse
conceito demonstra como a validação cruzada pode ser uma ferramenta valiosa na
tomada de decisões relativas à concorrência nas economias modernas.
A Divisão de Treinamento Teste (Train/Test Split)
Train/Test Split é uma técnica amplamente utilizada na área de aprendizado de

máquina e análise de dados para avaliar o desempenho de um modelo esta técnica
envolve a divisão do conjunto de dados original em dois subconjuntos: o conjunto de
treinamento e o conjunto de teste. A ideia por trás disso é avaliar até que ponto um
modelo treinado em um conjunto de dados pode generalizar e fazer previsões
precisas sobre novos dados que não foram usados durante o treinamento a partir
disso temos também a;
Divisão de dados: Inicialmente, o conjunto de dados é dividido em duas partes,

geralmente por uma proporção comum, como 70% de dados para treinamento e
30% para teste, no entanto, esta relação pode variar dependendo do tamanho do
conjunto de dados e das necessidades do projeto.
Treinamento do Modelo: O conjunto de treinamento é usado para treinar o modelo

de aprendizado de máquina o modelo aprende com esses dados e ajusta seus
parâmetros para fazer previsões com base nas relações encontradas nos dados de
treinamento Teste do modelo: Após o treinamento, o conjunto de teste é usado para
10
avaliar o desempenho do modelo o modelo faz previsões com base nos dados de
teste e as compara com os valores reais (rótulos verdadeiros) dos dados de teste,
Avaliação do Desempenho: Para avaliar o desempenho do modelo, métricas

apropriadas são calculadas, dependendo do tipo de problema por exemplo, em
problemas de classificação, métricas como precisão, recall e F1-score podem ser
usadas em problemas de regressão, o erro quadrático médio (MSE) ou o erro
absoluto médio (MAE) são comuns. Ajuste de Hiperparâmetros: Além de avaliar o
desempenho, a Divisão de Treinamento/Teste também pode ser usada para ajustar
hiperparâmetros do modelo os hiperparâmetros são configurações que não são
aprendidas pelo modelo, mas que afetam seu desempenho fazendo várias divisões
de treinamento/teste com diferentes configurações de hiperparâmetros, é possível
encontrar a combinação que oferece o melhor desempenho
Limitações: O departamento de Treinamento/Teste pode ser sensível à escolha dos

dados de treinamento e teste a divisão imprecisa pode levar a resultados errôneos
portanto, é importante repetir a divisão e a avaliação do modelo várias.
Aplicações Práticas do Machine Learning
O Machine Learning, longe de ser apenas uma disciplina teórica, é uma tecnologia
com impacto significativo em diversas áreas práticas. Suas aplicações abrangem
uma ampla variedade de setores, impulsionando inovações e transformações em
diferentes domínios da sociedade. Na área da saúde, algoritmos de aprendizado
auxiliam em diagnósticos médicos, prevêem a progressão de doenças e identificam
padrões em grandes conjuntos de dados de pacientes. Sistemas de diagnóstico por
imagem, como detecção de câncer de mama em mamografias, são exemplos
notáveis já no setor financeiro, o Machine Learning é amplamente utilizado para
prever tendências de mercado, detectar fraudes em transações financeiras e
otimizar portfólios de investimento. Algoritmos analisam dados financeiros em tempo
real e históricos para tomar decisões informadas e reduzir riscos. Plataformas de
streaming, comércio eletrônico e redes sociais aplicam o Machine Learning para
personalizar a experiência do usuário. Algoritmos de recomendação analisam
11
históricos de interações do usuário, oferecendo conteúdo, produtos e anúncios sob
medida, impulsionando o engajamento e as vendas também em veículos autônomos
dependem fortemente do Machine Learning para navegação, reconhecimento de
objetos e tomada de decisões em tempo real. Algoritmos de visão computacional e
sensores avançados permitem que carros autônomos identifiquem obstáculos, sinais
de trânsito e outros veículos. O Processamento de Linguagem Natural (NLP) é uma
área em crescimento, com aplicações em tradução automática, chatbots, análise de
sentimentos e resumo de texto.
Algoritmos de Machine Learning capacitam sistemas a compreender e gerar

texto de maneira eficaz. Na indústria e manufatura, o Machine Learning é utilizado
para otimizar processos, prever falhas em equipamentos e melhorar a eficiência da
produção. Algoritmos analisam dados de sensores em tempo real, detectando
anomalias que indicam problemas em potencial. Essas aplicações práticas não
apenas destacam a versatilidade do Machine Learning, mas também evidenciam
seu papel transformador em diversos setores, moldando o presente e indicando
direções inovadoras para o futuro. O Machine Learning é uma tecnologia versátil que
transforma setores como saúde, finanças, streaming, veículos autônomos e
manufatura. Suas aplicações práticas destacam seu papel inovador e moldador do
presente, indicando direções promissoras para o futuro. A evolução constante do
Machine Learning promete avanços significativos, inspirando soluções criativas e
contribuindo para o progresso tecnológico.
Desafios e Questões Éticas em Machine Learning
Embora o Machine Learning tenha proporcionado inúmeros benefícios e revoluções

no mundo contemporâneo, ainda enfrenta desafios significativos, especialmente no
âmbito ético, onde considerações morais e integridade desempenham um papel
crucial como o Viés Algorítmico: Um dos desafios preeminentes é o viés algorítmico,
que surge quando modelos de Machine Learning reproduzem preconceitos
presentes nos dados de treinamento. Essa replicação pode resultar em
discriminação injusta em áreas como contratação, empréstimos e justiça criminal.
Mitigar esse viés é crucial para promover a equidade e a justiça. Privacidade de
12
Dados: A coleta e uso extensivos de dados pessoais levantam questões de
privacidade. A proteção eficaz dos dados do usuário é essencial, especialmente em
setores sensíveis como saúde e finanças. Tópicos como anonimização de dados,
controle de consentimento e regulamentação de privacidade estão no centro das
preocupações. Transparência e Interpretabilidade: Modelos complexos de
Machine Learning, como redes neurais profundas, podem ser desafiadores de
interpretar.
A falta de transparência pode gerar desconfiança, especialmente em

contextos críticos, como diagnóstico médico e segurança de veículos autônomos.
Assegurar a interpretabilidade dos modelos é vital para estabelecer confiança.
Impacto no Emprego e Sociedade: O avanço da automação impulsionada pelo
Machine Learning suscita preocupações sobre o impacto no emprego e na
economia. Embora novas oportunidades surjam, a transição pode ser desafiadora
para muitos trabalhadores. Questões de treinamento e reciclagem profissional são
essenciais para enfrentar esses desafios Tomada de Decisões Autônomas: Em
domínios como veículos autônomos e sistemas de decisão médica, o Machine
Learning capacita máquinas a tomar decisões críticas. Isso levanta questões éticas
sobre responsabilidade e accountability em casos de falha, como acidentes
envolvendo carros autônomos. Legislação e Regulamentação: A rápida evolução
do Machine Learning levanta desafios para a legislação e regulamentação.
Governos globalmente enfrentam o dilema de criar leis que incentivem a inovação,
ao mesmo tempo em que protegem os direitos e a segurança dos cidadãos.
Estabelecer um equilíbrio adequado é fundamental para orientar o desenvolvimento
responsável do Machine Learning.
O impacto da automação impulsionada pelo Machine Learning na sociedade e

no emprego é uma preocupação, exigindo abordagens como treinamento e
reciclagem profissional. A capacidade de tomada de decisões autônomas por
máquinas em setores como veículos autônomos levanta questões éticas sobre
responsabilidade e accountability. Além disso, a rápida evolução do Machine
Learning desafia a legislação global, destacando a necessidade de leis que
promovam a inovação enquanto protegem os direitos e a segurança dos cidadãos.
13
Encontrar um equilíbrio é crucial para orientar o desenvolvimento responsável dessa
tecnologia.
Tendências Futuras em Machine Learning
O campo do Machine Learning está em constante evolução, e diversas tendências

prometem moldar o futuro do setor. Esta seção examina algumas das tendências
emergentes que têm o potencial de impactar significativamente o Machine Learning
nos próximos anos. Aprendizado por Reforço Profundo O Aprendizado por
Reforço Profundo, uma combinação de Aprendizado Profundo com Aprendizado por
Reforço, tem atraído grande atenção. Ele promete avanços em domínios como
robótica, jogos e automação, permitindo que agentes aprendam a partir da interação
com o ambiente a evolução também vira na forma do Aprendizado Federado O
Aprendizado Federado é uma abordagem que permite treinar modelos em
dispositivos locais ou servidores em nuvem, sem a necessidade de compartilhar
dados brutos. Isso promete melhorar a privacidade e a segurança dos dados,
mantendo a capacidade de aprendizado centralizada. Explicabilidade e
Interpretabilidade: A necessidade de modelos mais transparentes e interpretáveis
está crescendo. A explicabilidade é fundamental em áreas como assistência médica,
finanças e justiça, onde as decisões automatizadas devem ser compreensíveis e
justificáveis. Machine Learning na Edge Computing: À medida que dispositivos
IoT (Internet das Coisas) se tornam mais difundidos, o Machine Learning está se
movendo para a borda (edge), onde os dispositivos podem realizar análises de
dados localmente. Isso reduz a latência e a dependência de conexões de rede Ética
em IA: A consideração ética em IA incluindo Machine Learning, continuará sendo
uma tendência importante. A criação de diretrizes e regulamentações para garantir o
uso responsável da tecnologia e a mitigação de viés algorítmico estão no foco da
comunidade global Aprendizado Automatizado: A automatização de processos de
Machine Learning, como seleção de modelos, pré-processamento de dados e ajuste
de hiperparâmetros, está ganhando tração. Isso torna o Machine Learning mais
acessível e eficiente para uma variedade de aplicativos. Aprendizado de Máquina
Quântica: Os avanços na computação quântica têm o potencial de revolucionar o
14
Machine Learning, permitindo a resolução de problemas complexos de forma mais
rápida e eficiente nutrindo assim uma junção de computação quântica e machine
Learning levando a uma velocidade de processamento nível quântico.
Deep Learning
O aprendizado profundo, também conhecido como aprendizado profundo, é

um subcampo avançado do aprendizado de máquina caracterizado pelo uso de
redes neurais artificiais profundas para resolver tarefas complexas de aprendizado e
reconhecimento de padrões. Em contraste com as abordagens tradicionais de
aprendizado de máquina, o aprendizado profundo mostra um desempenho notável
ao lidar com conjuntos de dados grandes e complexos. A arquitetura por trás das
redes neurais profundas é inspirada na forma como o cérebro humano funciona, que
consiste em camadas de neurônios artificiais interconectados. Cada camada
processa e extrai recursos específicos dos dados, e as redes profundas possuem
múltiplas camadas ocultas que lhes permitem aprender representações hierárquicas
e complexas de dados. Uma marca registrada do aprendizado profundo é sua
capacidade de aprender automaticamente recursos importantes dos dados,
eliminando a necessidade de programação manual intensiva. Isso dá ao
aprendizado profundo uma vantagem significativa em aplicações como
reconhecimento de padrões de imagens, processamento de linguagem natural e
tradução automática. No campo da visão computacional, o Deep Learning tem
alcançado resultados notáveis, contribuindo para as áreas de reconhecimento facial,
reconhecimento de objetos em imagens e veículos autônomos. No processamento
de linguagem natural, os modelos de linguagem baseados em redes neurais
profundas melhoraram significativamente a qualidade das traduções automáticas,
dos chatbots e da análise de sentimentos. O impacto do deep learning se estende à
área médica, onde contribui para o diagnóstico por imagem, facilitando a detecção
precoce do câncer em estudos radiológicos.
As indústrias financeiras beneficiam destas técnicas de análise de risco,

previsão de mercado e deteção de fraudes baseadas em modelos de dados
complexos. Apesar do progresso, os desafios permanecem, enfatizando a
15
interpretabilidade dos modelos, especialmente em contextos éticos e legais. Estão a
ser feitos esforços para tornar estes sistemas mais transparentes e compreensíveis,
a fim de aumentar a confiança na sua implementação. À medida que o campo da
aprendizagem profunda evolui, surgem várias tendências promissoras, como a
aprendizagem federada, a aprendizagem profunda e a integração com a
computação quântica. Estas tendências podem promover ainda mais as
capacidades e a aplicabilidade destas tecnologias inovadoras de IA. A
aprendizagem profunda continua a ser um campo dinâmico e estimulante que está a
moldar o futuro das tecnologias emergentes.
Aprendizado por reforço
Baseado no Deep Learning, temos também o aprendizado, também

conhecido como aprendizado profundo, um subcampo avançado do aprendizado de
máquina caracterizado pelo uso de redes neurais artificiais profundas para resolver
tarefas complexas de aprendizado e reconhecimento de padrões. Em contraste com
as abordagens tradicionais de aprendizado de máquina, o aprendizado profundo
mostra um desempenho notável ao lidar com conjuntos de dados grandes e
complexos. A arquitetura por trás das redes neurais profundas é inspirada na forma
como o cérebro humano funciona, consistindo em camadas de neurônios artificiais
interconectados. Cada camada processa e extrai recursos específicos dos dados, e
as redes profundas possuem múltiplas camadas ocultas que lhes permitem aprender
representações hierárquicas e complexas de dados. Uma marca registrada do
aprendizado profundo é sua capacidade de aprender automaticamente recursos
importantes dos dados, eliminando a necessidade de programação manual
intensiva. Isso confere ao aprendizado profundo uma vantagem significativa em
aplicações como reconhecimento de padrões em imagens, processamento de
linguagem natural e tradução automática.
No campo da visão computacional, o Deep Learning tem alcançado resultados

notáveis, contribuindo para áreas como reconhecimento facial, identificação de
objetos em imagens e veículos autônomos. No processamento de linguagem
natural, os modelos de linguagem baseados em redes neurais profundas
16
melhoraram significativamente a qualidade das traduções automáticas, chatbots e
análise de sentimentos. O impacto do deep learning estende-se à área médica,
contribuindo para o diagnóstico por imagem e facilitando a detecção precoce do
câncer em estudos radiológicos. As indústrias financeiras beneficiam-se dessas
técnicas para análise de risco, previsão de mercado e detecção de fraudes
baseadas em modelos de dados complexos. Apesar do progresso, desafios
persistem, enfatizando a interpretabilidade dos modelos, especialmente em
contextos éticos e legais. Esforços estão sendo feitos para tornar esses sistemas
mais transparentes e compreensíveis, visando aumentar a confiança em sua
implementação. À medida que o campo da aprendizagem profunda evolui, surgem
várias tendências promissoras, como a aprendizagem federada, a aprendizagem por
reforço profundo e a integração com a computação quântica. Essas tendências têm
o potencial de impulsionar ainda mais as capacidades e a aplicabilidade dessas
tecnologias inovadoras de IA mantendo a aprendizagem profunda como um campo
dinâmico e estimulante que molda o futuro das tecnologias emergentes.
Aprendizado Automático
O aprendizado de máquina automático, conhecido como AutoML, representa um

desenvolvimento significativo no campo da inteligência artificial, que envolve a
automatização do processo de criação e treinamento de modelos de aprendizado de
máquina. Ao contrário das abordagens tradicionais, onde os cientistas de dados
desempenham um papel fundamental na construção manual de modelos, o AutoML
visa simplificar e acelerar este processo através da automação. A ideia por trás do
AutoML é capacitar os sistemas para que eles próprios executem tarefas
importantes, como seleção de modelos, pré-processamento de dados e ajuste de
hiperparâmetros. Isto é especialmente valioso em cenários onde a procura por
soluções de aprendizagem automática excede a disponibilidade de especialistas em
dados.
O AutoML visa democratizar a adoção de modelos preditivos, permitindo que

profissionais de diversas áreas aproveitem os benefícios do aprendizado de
máquina sem um conhecimento profundo dos detalhes técnicos. Esta abordagem
17
automatizada não só acelera o desenvolvimento de modelos, mas também pode
levar a soluções mais eficientes e eficazes. Os algoritmos do AutoML exploram
automaticamente diferentes arquiteturas e configurações para encontrar a melhor
combinação para um determinado problema. Isto não só economiza tempo, mas
também ajuda a otimizar o desempenho do modelo. O AutoML está se tornando
cada vez mais popular à medida que as organizações percebem a importância do
aprendizado de máquina em diversas aplicações. A sua capacidade de automatizar
tarefas complexas torna a implementação de soluções de machine learning mais
acessível, acelera o ciclo de desenvolvimento e permite uma adaptação mais rápida
às exigências do mercado. À medida que o AutoML evolui, espera-se que ele
desempenhe um papel crítico na integração eficaz de técnicas de aprendizado de
máquina em vários setores e cenários.
Qualidades de Dados
A qualidade dos dados desempenha um papel fundamental no sucesso e no

desempenho dos modelos de aprendizado de máquina. O ditado “entra lixo, sai lixo”
é particularmente importante neste contexto e sublinha que a precisão e fiabilidade
dos resultados obtidos pelos modelos está essencialmente relacionada com a
qualidade dos dados utilizados para treino. Portanto, uma compreensão profunda
dos dados e métodos eficazes de pré-processamento são cruciais para obter
modelos confiáveis e precisos. Na fase inicial do aprendizado de máquina é
necessário fazer uma análise minuciosa dos dados disponíveis. Isto inclui identificar
e lidar com valores ausentes, identificar valores discrepantes e compreender a
distribuição geral dos dados. Esta investigação inicial é importante para
compreender as características internas dos dados e para orientar decisões
subsequentes de pré-processamento. Os métodos de pré-processamento de dados
envolvem diversas etapas, incluindo normalização e padronização, que visam
garantir a consistência dos dados. Isto é especialmente importante quando os
recursos são significativamente diferentes, evitando ponderação desproporcional de
alguns recursos no treinamento do modelo. Além disso, a codificação de variáveis
categóricas, a redução da dimensionalidade e o design de recursos são práticas
18
comuns para melhorar o desempenho do modelo. O tratamento de dados
desequilibrados também é uma consideração crítica. Em muitos casos, as classes
alvo podem ter representações diferentes no conjunto de dados, o que pode
introduzir distorções no treinamento do modelo. Técnicas como sobre amostragem,
sub amostragem e geração de dados sintéticos são usadas para resolver problemas
de desequilíbrio e garantir que o modelo possa aprender com precisão todas as
classes. Além disso, a seleção de recursos relevantes é uma parte importante do
pré-processamento. A remoção de recursos sem importância ou altamente
correlacionados pode simplificar o modelo, reduzir o risco de ajuste excessivo e
melhorar a interpretação. Concluindo, uma compreensão profunda dos dados
combinada com métodos eficazes de pré-processamento é uma parte essencial da
construção de modelos de aprendizado de máquina. Esta abordagem cuidadosa
visa garantir que os modelos sejam treinados com dados de alta qualidade,
resultando em sistemas mais confiáveis, mais generalizáveis e capazes de fornecer
informações valiosas para uma ampla gama de aplicações.
Expansão sobre Algoritmos Específicos
Máquinas de vetores de suporte (SVM): Support Vector Machines (SVM) são

algoritmos de aprendizado supervisionado usados para classificação e regressão. A
ideia básica do SVM é encontrar o hiperplano que melhor separa as classes no
espaço de recursos. Equot;melhorequot; O hiperplano é aquele que maximiza a
margem entre as classes, e a margem é a distância perpendicular entre o hiperplano
e os pontos de dados mais próximos em cada classe, chamados de vetores de
suporte. SVMs são eficientes em espaços de alta dimensão e podem lidar com
conjuntos de dados complexos, o que é particularmente útil para tarefas de
classificação onde a separação de classes não é linear. Floresta Aleatória:
Random Forest é um algoritmo de aprendizado de máquina baseado em conjunto
que pertence à categoria de métodos de árvore de decisão.
Em uma floresta aleatória, diversas árvores de decisão são treinadas durante

o processo de aprendizagem. Cada árvore é treinada em uma subamostra aleatória
do conjunto de dados e as previsões são combinadas por classificação ou média de
19
regressão. Esta unidade ajuda a reduzir o sobreajuste e melhora a generalização do
modelo. Além disso, a aleatoriedade introduzida durante o treinamento da árvore
aumenta a robustez do modelo. Métodos de grupo: Os métodos de conjunto
combinam previsões de vários modelos para melhorar o desempenho geral do
sistema. Além do Random Forest, outros métodos comuns são Gradient Boosting,
AdaBoost e Bagging. O Gradient Boosting cria modelos sucessivamente mais
fracos, dando mais peso aos dados anteriormente classificados incorretamente.
AdaBoost atribui pesos diferentes aos pontos de dados, concentrando-se nos dados
classificados incorretamente pelos modelos anteriores. Bagging ou Bootstrap
Aggregation treina modelos em subconjuntos aleatórios do conjunto de dados e
combina suas previsões. Esses métodos combinatórios são amplamente utilizados
devido à sua capacidade de melhorar a precisão e robustez dos modelos, tornando-
os importantes em muitas aplicações de aprendizado de máquina.
Conclusão
No cenário atual em que a integração tecnológica é contínua, o campo do

aprendizado de máquina surge como uma ferramenta fundamental para enfrentar
desafios complexos e dinâmicos. Ao longo deste trabalho, exploramos os
fundamentos do aprendizado de máquina, desde seus fundamentos teóricos até
aplicações práticas em diversos campos. Acompanhamos a evolução das técnicas
desde modelos tradicionais até abordagens mais avançadas como o deep learning,
que se destacam pela capacidade de lidar com conjuntos de dados grandes e
complexos. Uma abordagem supervisionada, onde os modelos são treinados em
dados rotulados, permite previsões e classificações precisas. No entanto, ao
considerar desafios éticos e questões de privacidade, o preconceito algorítmico e a
interpretabilidade do modelo surgem como questões cruciais. Em contrapartida, a
aprendizagem não supervisionada oferece soluções inovadoras para explorar os
padrões e estruturas internas de informação, destacando-se em tarefas como
agrupamento e redução de dimensionalidade. A introdução do conceito AutoML é
um marco importante porque automatiza a criação e o treinamento do modelo,
tornando o aprendizado de máquina mais fácil e eficiente. Uma proposta para um
20
sistema de semáforos inteligente que combina sensores e aprendizado de máquina
para otimizar o fluxo de tráfego ilustra como essa tecnologia pode ser aplicada de
maneiras inovadoras para resolver problemas do mundo real. No entanto,
considerando o futuro da aprendizagem automática, devem ser abordados desafios
éticos, como o enviesamento algorítmico e a proteção de dados. A transparência e a
interpretabilidade dos modelos devem ser uma prioridade para garantir a confiança
na utilização destas tecnologias. Além disso, tendências promissoras como a
aprendizagem combinada, a ética da IA e a integração com a computação quântica
prometem moldar o cenário da aprendizagem automática nos próximos anos. Em
suma, a aprendizagem automática não é apenas uma ferramenta poderosa para
resolver problemas complexos, mas também uma disciplina em constante evolução
que está a moldar o futuro das tecnologias emergentes. Ao aplicar estes avanços de
forma ética e responsável, podemos ajudar a criar um mundo mais eficiente, mais
seguro e adaptado aos desafios atuais.
Problemática e projeto solução
O constante desenvolvimento do mundo moderno em direção à tecnologia e a busca

por novas soluções traz uma série de desafios, entre os quais aparece o problema
recorrente de atrasos devido a engarrafamentos e trânsito intenso. Nesse sentido,
existe uma proposta para o desenvolvimento de um sistema de semáforos
inteligente que utiliza aprendizado de máquina em combinação com sensores. A
ideia básica é treinar o sistema por meio de vídeos e imagens que registrem a
movimentação dos veículos, detectando engarrafamentos e movimentação na rua.
Com base nesse aprendizado, o semáforo pôde ajustar dinamicamente sua
programação.
Se o trânsito estiver congestionado numa determinada rua, um semáforo pode

favorecer essa rua, aumentando a frequência dos semáforos verdes e ajustando os
tempos de espera. Por outro lado, se uma rua tiver pouco trânsito e outra muito
trânsito, o semáforo pode durar mais na rua com menos trânsito e reduzir o tempo
de espera na rua com mais trânsito. Esta abordagem visa promover uma melhor
gestão do tráfego, reduzir o congestionamento e otimizar os tempos de viagem dos
21
veículos. A combinação de sensores para recolha de dados em tempo real e
algoritmos de aprendizagem automática permite uma resposta mais adaptativa e
eficaz às condições reais de tráfego. Além disso, esta iniciativa pode ser parte
integrante de esforços mais amplos para criar um ambiente urbano mais seguro e
eficiente. Ao estudar estas soluções inovadoras, é possível contribuir para a
construção de um mundo melhor que responda melhor às exigências da sociedade
moderna.
22

Relatorio Conclusao 1

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Relatorio Conclusao 1

Enviado por

Direitos autorais:

Formatos disponíveis

ESCOLA SESI SENAI CATALÃO – GO

KARLLOS ADRIANO SANTANA SILVA

HUGO ROSA DE ALMEIDA

PROJETO DE CONCLUSÃO DE CURSO

KARLLOS ADRIANO SANTANA SILVA

HUGO ROSA DE ALMEIDA

PROJETO DE CONCLUSÃO DE CURSO

Projeto referente ao projeto de conclusão de curso,

História do Machine Learning 5

Algoritmos do Machine Learning 5

Aprendizado de máquina em antitruste 8

Validação cruzada na análise de dados econômicos 9

Aplicações de validação cruzada em análise econômica 10

A Divisão de Treinamento Teste (Train/Test Split) 11

Aplicações Práticas do Machine Learning 12

Desafios e Questões Éticas em Machine Learning13

Tendências Futuras em Machine Learning 14

Aprendizado por reforço 17

Expansão sobre Algoritmos Específicos 20

Problemática e projeto solução 22

A era digital tem testemunhado avanços tecnológicos inigualáveis,

Este Trabalho de Conclusão de Curso (TCC) busca explorar e compreender a

A aprendizagem profunda não supervisionada envolve o uso de redes neurais

Explicabilidade: Refere-se à qualidade de ser capaz de explicar ou entender o

História do Machine Learning

Na última metade do século passado Alan turning em sua obra seminal

Já em 1980 temos um renascimento do machine learnin com o

Algoritmos do Machine Learning

“Aprender envolve modificações na máquina de aprendizagem; isto é claro.

No campo do aprendizado de máquina, existem diversas técnicas e

A validação cruzada é uma técnica usada para avaliar o desempenho de um

Aprendizado de máquina em antitruste

A economia digital e a evolução dos mercados competitivos suscitaram

Validação cruzada na análise de dados econômicos

Na análise de dados econômicos, a validação cruzada, especialmente a

Aplicações de validação cruzada em análise econômica

A validação cruzada tem diversas aplicações em análise econômica uma delas é

A Divisão de Treinamento Teste (Train/Test Split)

Train/Test Split é uma técnica amplamente utilizada na área de aprendizado de

Divisão de dados: Inicialmente, o conjunto de dados é dividido em duas partes,

Treinamento do Modelo: O conjunto de treinamento é usado para treinar o modelo

Avaliação do Desempenho: Para avaliar o desempenho do modelo, métricas

Limitações: O departamento de Treinamento/Teste pode ser sensível à escolha dos

Aplicações Práticas do Machine Learning

Algoritmos de Machine Learning capacitam sistemas a compreender e gerar

Desafios e Questões Éticas em Machine Learning

Embora o Machine Learning tenha proporcionado inúmeros benefícios e revoluções

A falta de transparência pode gerar desconfiança, especialmente em

O impacto da automação impulsionada pelo Machine Learning na sociedade e

Tendências Futuras em Machine Learning

O campo do Machine Learning está em constante evolução, e diversas tendências

O aprendizado profundo, também conhecido como aprendizado profundo, é

As indústrias financeiras beneficiam destas técnicas de análise de risco,

Aprendizado por reforço

Baseado no Deep Learning, temos também o aprendizado, também

No campo da visão computacional, o Deep Learning tem alcançado resultados

O aprendizado de máquina automático, conhecido como AutoML, representa um

O AutoML visa democratizar a adoção de modelos preditivos, permitindo que

A qualidade dos dados desempenha um papel fundamental no sucesso e no

Expansão sobre Algoritmos Específicos

Máquinas de vetores de suporte (SVM): Support Vector Machines (SVM) são

Em uma floresta aleatória, diversas árvores de decisão são treinadas durante

No cenário atual em que a integração tecnológica é contínua, o campo do