Bolsa

Bolsa
Apresentação: 16/02/2023
Tema: Pré-Processamento de Dados e Aprendizado de Máquina
Subtópicos:
● O que é Pré-Processamento de Dados e Aprendizado de Máquina ?
- Pré-processamento de Dados: é um conjunto de atividades que envolvem
preparação, organização e estruturação dos dados. Trata-se de uma etapa
fundamental que precede a realização de análises e previsões.Ex: A
organização de uma casa como, por exemplo, como todos os utensílios que
são precisos na preparação dos alimentos estão na cozinha, ou como a
maioria dos produtos usados na limpeza do corpo estão no banheiro, etc..
- Aprendizado de Máquina: O aprendizado de máquina (em inglês, machine
learning) é um método de análise de dados que automatiza a construção de
modelos analíticos. É um ramo da inteligência artificial baseado na ideia de
que sistemas podem aprender com dados, identificar padrões e tomar
decisões com o mínimo de intervenção humana. Ex: filtros da internet
● Contexto histórico de aprendizado de máquina e do pré-processamento de dados?
● Qual é a relação do pré-processamento de dados com o aprendizado de máquina ?
- Uma vez que a maioria dos algoritmos de aprendizado induz conhecimento
estritamente a partir de dados, a qualidade do conhecimento extraído é
amplamente determinada pela qualidade dos dados de entrada. Diversos
aspectos podem influenciar no desempenho de um sistema de aprendizado
devido à qualidade dos dados.
● Etapas do pré processamento de dados ?
- Tarefas fortemente dependentes de conhecimento de domínio: Essas
tarefas somente podem ser efetivamente realizadas com o uso de
conhecimento específico de domínio. Um método automático pode
eventualmente ser empregado para realizar uma tarefa fortemente
dependente de conhecimento de domínio, entretanto, esse método depende
de que um conhecimento específico seja fornecido.
- Tarefas fracamente dependentes de conhecimento de domínio: Essas
tarefas podem ser realizadas por métodos que extraem dos próprios dados
as informações necessárias para tratar o problema de pré-processamento de
dados. Se por um lado essas tarefas ainda dependem de conhecimento de
domínio, pois é necessário, por exemplo, selecionar o método mais
adequado para tratar o problema de pré-processamento de dados, por outro
lado, essas tarefas podem ser realizadas por métodos com um grau de
automação maior do que aquelas que dependem fortemente de
conhecimento de domínio
● Tipos de aprendizado de máquina ?
- Aprendizado de máquina supervisionado: O aprendizado supervisionado
em machine learning é aquele no qual há interferência humana.
Basicamente, uma pessoa fornece um banco de dados e ensina a máquina a
encontrar a resposta desejada de acordo com a necessidade.Dessa forma, a
máquina aprende a tomar decisões com base em informações
pré-estabelecidas por alguém. Por isso, podemos dizer que o aprendizado
supervisionado é capaz de rotular dados de acordo com os exemplos
estabelecidos em seu sistema.
- Aprendizado de máquina não supervisionado: A aprendizagem não
supervisionada é aquela na qual não acontece interferência humana, ou seja,
a máquina cria suas próprias regras de funcionamento com base na
identificação de padrões, que também é feita pelo software. A análise dos
dados acontece, portanto, automaticamente. Dessa forma, o aprendizado
não supervisionado dá mais independência à máquina, mas não trabalha
com feedbacks e com exemplos. Como exemplo, podemos citar as
indicações de conexão do LinkedIn e sistemas de recomendação de músicas
e de filmes.
- Aprendizado de máquina por reforço: Por fim, existe o aprendizado
reforçado, no qual a máquina opera pautada em experiência. Nesse
processo, ela lida com o erro e, depois, procura a abordagem correta para
corrigi-lo e não o cometer novamente. O processo de aprendizado por
reforço não acontece apenas uma vez. Na verdade, a máquina pode tentar
diferentes soluções até encontrar a mais adequada para o problema que está
lidando.
● Quais são as técnicas de pré-processamento de dados ?
- Limpeza de dados: Os dados originais do seu dataset podem conter muitas
partes irrelevantes ou ausentes. Para lidar com esta situação, a limpeza de
dados é essencial. Ela envolve o manuseio e/ou preenchimento de dados
ausentes, redução de ruídos, identificação e remoção de valores aberrantes
e a resolução de inconsistências.
- Transformação de Dados: Essa etapa é executada para transformar os
dados originais em formatos mais apropriados e adequados para o processo
de mineração.
- Redução de dados: A mineração de dados é usada, principalmente, para
lidar com grande volume de dados. Por isso, o processamento computacional
se torna cada vez mais complexo. Para aumentar a eficiência e reduzir os
custos usamos o processo de redução de dados.
● Conclusão
Referências Bibliográficas:
- https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06102003-160219/publico/T
eseDoutorado.pdf
-
Pré-processamento de Dados
- https://www.datageeks.com.br/pre-processamento-de-dados/
Machine Learning
- https://www.sas.com/pt_br/insights/analytics/machine-learning.html
- https://predize.com/blog/tipos-de-aprendizado-de-maquina/
-

Bolsa

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Bolsa

Enviado por

Direitos autorais:

Formatos disponíveis

Bolsa

Você também pode gostar