Você está na página 1de 2

Nome completo: Rodrigo Santos da Silva

Curso: MBA em Big Data e Inteligencia Competitiva


Área: Tecnologia da Informação
Nº do estudo de caso: 095

A importância do Machine Learning para uma melhor experiência

O avanço tecnológico transformou a maneira como interagimos com plataformas


de entretenimento, como a Netflix, destacando-se não só pela extensa biblioteca de
conteúdo, mas também pelo refinado sistema de recomendações personalizadas. Essa
conquista é impulsionada pelo Machine Learning, ramo da inteligência artificial que
permite à plataforma analisar dados dos usuários e do conteúdo, fornecendo sugestões
precisas e relevantes. A compreensão das técnicas de aprendizado é essencial para
compreender a complexidade e a eficácia desse processo.
O processo começa com a coleta extensiva de dados. A Netflix reúne
informações diversas, desde históricos de visualização até tempo de reprodução,
interações no aplicativo e até mesmo preferências de idioma. Esses dados alimentam
algoritmos complexos de Machine Learning, que utilizam técnicas para compreender
padrões e preferências dos usuários.
Além disso, a empresa deve se esforçar para minimizar qualquer viés presente
nos conjuntos de dados utilizados para treinar os modelos de Machine Learning,
visando aprimorar a precisão e a imparcialidade das recomendações. Se houver
indícios de um viés, a empresa precisa agir para corrigir o problema, seja ajustando o
algoritmo, refinando os conjuntos de dados ou implementando medidas para oferecer
recomendações mais diversificadas, visando este processo, podemos utilizar três
modelos de aprendizados:
Aprendizado Supervisionado: Nesse tipo de aprendizado, o algoritmo é treinado
com um conjunto de dados rotulados, ou seja, dados onde as saídas desejadas já
estão definidas. O objetivo é que o algoritmo aprenda a mapear as entradas para as
saídas corretas, fazendo previsões ou classificações com base nesse aprendizado,
existem duas categorias, são elas: Classificação e Regressão:
Classificação: Envolve prever a qual categoria ou classe uma observação
pertence. Por exemplo, na detecção de spam de e-mails, o algoritmo classifica se um
e-mail é spam ou não, por exemplo: Na saúde, a classificação pode ser usada para
diagnosticar doenças com base em sintomas.
Regressão: Prevê um valor contínuo com base em variáveis independentes. Por
exemplo, prever o preço de uma casa com base em suas características, um exemplo
e na indústria, a regressão pode prever a demanda por um produto, o consumo de
chocolate na páscoa por exemplo.
Aprendizado Não Supervisionado: Aqui, o algoritmo é treinado em um conjunto
de dados sem saídas rotuladas. O algoritmo explora a estrutura dos dados para
encontrar padrões, agrupamentos ou relações intrínsecas entre os elementos, sem
orientação externa, as categorias de Clusterização e Redução de Dimensionalidade
são utilizadas neste método.
Clusterização: Agrupa dados semelhantes em clusters ou grupos, onde
elementos dentro do mesmo grupo são mais semelhantes entre si do que com aqueles
em outros grupos. Por exemplo, agrupar perfis de clientes com base em seus
comportamentos de compra, um exemplo, na área financeira, a clusterização pode ser
usada para detectar fraudes em transações.
Redução de Dimensionalidade: Reduz a quantidade de variáveis em um
conjunto de dados, preservando o máximo possível de informações importantes. Isso
pode ser útil para visualização ou para simplificar modelos, um exemplo claro, na
biologia, a redução de dimensionalidade pode ser usada para analisar expressões
genéticas.
Aprendizado por Reforço: Neste tipo, um agente aprende a tomar decisões em
um ambiente para maximizar uma recompensa ao longo do tempo. O agente interage
com o ambiente, aprendendo quais ações resultam em recompensas positivas ou
negativas.
Podemos utilizar também o para classificação em aprendizado supervisionado o KNN
(K-Nearest Neighbors) e o SVM (Support Vector Machine).
KNN (K-Nearest Neighbors): Este algoritmo classifica pontos de dados com base
na proximidade com os vizinhos mais próximos. Benefícios incluem simplicidade e
eficácia em conjuntos de dados menores. No entanto, pode ser computacionalmente
caro em grandes conjuntos de dados e sensível à escolha do valor de 'k'.
Uma das vantagens é não requer treinamento explícito, pode ser eficaz em problemas
com fronteiras de decisão complexas ou não lineares, funciona bem com conjuntos de
dados pequenos e moderados, suas desvantagens Sensibilidade aos outliers.
SVM (Support Vector Machine): Encontra um hiperplano que melhor separa as
classes. Vantagens incluem eficiência em espaços de alta dimensão e a capacidade de
lidar com conjuntos de dados complexos. Já suas desvantagens do SVM: Dificuldade
de interpretação, o resultado pode ser complexo em espaços de alta dimensão,
dificultando a interpretação do modelo. No entanto, pode ser sensível à escolha do
kernel e ao ajuste dos parâmetros.
Benefícios do SVM: Eficiência em espaços de alta dimensão, bom desempenho
mesmo em conjuntos de dados com muitas características, pode lidar com conjuntos
de dados complexos.
Em resumo, o campo do Machine Learning engloba diversas técnicas e
abordagens, cada uma com suas vantagens e aplicações específicas em setores
variados, além de ser vital compreender os diferentes tipos de aprendizado e
algoritmos para aplicá-los de maneira eficaz em contextos específicos para garantir
uma experiência positiva aos usuários. Isso envolve não apenas a entrega de
recomendações precisas e relevantes.

Você também pode gostar