Escolar Documentos
Profissional Documentos
Cultura Documentos
INSTA - @fazquestao.diretoaoponto
#FAZQUESTÃO
1
YOUTUBE - @fazquestao
INSTA - @fazquestao.diretoaoponto
ALGORITMO
Um algoritmo é um conjunto finito e ordenado de instruções que define um processo
passo-a-passo para realizar uma tarefa ou resolver um problema. Então de maneira mais
abrangente, uma receita culinária, manual de instruções para montar móveis, funções
matemáticas e programas de computador são algoritmos.
É claro que o contexto aqui é voltado para os computadores, seus programas e conjunto
de instruções para resolução de tarefas e programas e para isso ele deve possuir algumas
características essenciais:
#FAZQUESTÃO
2
YOUTUBE - @fazquestao
INSTA - @fazquestao.diretoaoponto
CHATGPT
O ChatGPT, que significa Chat Generative Pre-trained Transformer, é um chatbot de
inteligência artificial (IA) desenvolvido pela OpenAI e lançado em novembro de 2022. Ele se
baseia em um modelo de linguagem grande pré-treinado, o GPT-3, e é capaz de realizar
diversas tarefas, como:
Responder perguntas de forma abrangente e informativa, mesmo que sejam abertas,
desafiadoras ou estranhas.
Gerar textos criativos, como poemas, código, scripts, peças musicais, e-mails, cartas,
etc.
Traduzir idiomas de forma precisa e fluente.
Escrever diferentes tipos de conteúdo de marketing, como slogans, anúncios e
descrições de produtos.
Realizar conversas engajadoras e realistas com os usuários.
#FAZQUESTÃO
3
YOUTUBE - @fazquestao
INSTA - @fazquestao.diretoaoponto
MACHINE LEARNING
Machine Learning, ou Aprendizado de Máquina em português, é um campo da
inteligência artificial que permite que os computadores aprendam e se adaptem sem
serem explicitamente programados para isso. Isso significa que, em vez de fornecer
instruções detalhadas para cada tarefa, os algoritmos de machine learning são treinados com
dados para que possam aprender a realizar a tarefa por conta própria.
#FAZQUESTÃO
4
YOUTUBE - @fazquestao
INSTA - @fazquestao.diretoaoponto
DATA SCIENCE
A Ciência de Dados, ou Data Science em inglês, é um campo interdisciplinar que
combina matemática, estatística, ciência da computação e conhecimento de domínio para
extrair insights valiosos de grandes conjuntos de dados.
CRISP-DM
O CRISP-DM, sigla para Cross Industry Standard Process for Data Mining (Processo
Padrão Inter-Indústrias para Mineração de Dados), é uma metodologia amplamente utilizada
para guiar projetos de mineração de dados. Ele fornece um roteiro estruturado com seis fases
distintas que garantem um processo abrangente e eficiente.
#FAZQUESTÃO
5
YOUTUBE - @fazquestao
INSTA - @fazquestao.diretoaoponto
TIPOS DE TAREFAS
A extração de conhecimento em banco de dados pode ser realizada por meio de duas
categorias principais de tarefas:
TAREFAS PREDITIVAS
O objetivo dessas tarefas é prever o valor de um determinado atributo com base nos
valores de outros atributos. O atributo a ser predito é comumente conhecido como variável
alvo ou dependente, enquanto os atributos usados para fazer a predição são conhecidos
como variáveis explicativas ou independentes.
A modelagem preditiva refere-se à tarefa de construir um modelo para a variável alvo
em função das variáveis explicativas. Existem dois tipos de tarefas de modelagem preditiva:
classificação, que é usada para variáveis alvo discretas, e regressão, que é usada para
variáveis alvo contínuas.
Por exemplo, prever se um usuário da web fará uma compra em uma livraria online é
uma tarefa de classificação porque, neste caso, a variável alvo tem valor binário ou discreto
(sim ou não; 1 ou 0). Por outro lado, prever o preço futuro de uma ação é uma tarefa de
regressão porque o preço é um atributo de valor contínuo. O objetivo de ambas as tarefas é
aprender um modelo que minimize o erro entre os valores previstos e verdadeiros da
variável alvo. A modelagem preditiva pode ser usada para identificar clientes que
responderão a uma campanha de marketing, prever distúrbios nos ecossistemas da Terra ou
julgar se um paciente tem uma doença específica com base nos resultados de testes médicos.
TAREFAS DESCRITIVAS
Aqui, o objetivo é derivar padrões (correlações, tendências, clusters, trajetórias e
anomalias) que descrevem os relacionamentos ocultos nos dados. Tarefas descritivas de
mineração de dados são frequentemente de natureza exploratória e frequentemente
requerem técnicas de pós-processamento para validar e explicar os resultados.
A análise de associação é usada para descobrir padrões que descrevem recursos
fortemente associados nos dados. Os padrões descobertos são normalmente representados
na forma de regras de implicação ou subconjuntos de recursos. Por causa do tamanho
exponencial de seu espaço de busca, o objetivo da análise de associação é extrair os padrões
mais interessantes de uma maneira eficiente. Aplicações úteis de análise de associação
incluem encontrar grupos de genes que têm funcionalidades relacionadas, identificar
páginas da web que são acessadas juntas ou compreender as relações entre os diferentes
elementos do sistema climático da Terra e ainda quais produtos de uma loja costumam ser
comprados juntos, como {fralda}{leite}, o qual sugere que consumidores que compram
fralda frequentemente compram leite, sendo que o inverso não é necessariamente
verdadeiro.
A análise de agrupamento ou clusterização procura encontrar grupos de
observações intimamente relacionadas, de modo que as observações que pertencem ao
mesmo agrupamento sejam mais semelhantes entre si do que as observações que pertencem
a outros agrupamentos. A clusterização tem sido usado para agrupar conjuntos de clientes
relacionados, encontrar áreas do oceano que têm um impacto significativo no clima da Terra
e compactar dados.
#FAZQUESTÃO
6
YOUTUBE - @fazquestao
INSTA - @fazquestao.diretoaoponto
A detecção de anomalias é a tarefa de identificar observações cujas características são
significativamente diferentes do resto dos dados. Essas observações são conhecidas como
anomalias ou outliers. O objetivo é descobrir as anomalias reais e evitar rotular falsamente
objetos normais como anômalos. Em outras palavras, um bom detector de anomalias deve
ter uma alta taxa de detecção e uma baixa taxa de falsos alarmes. As aplicações de detecção
de anomalias incluem a detecção de fraudes, intrusões de rede, padrões incomuns de
doenças e distúrbios do ecossistema, como secas, inundações, incêndios, furacões, etc.
#FAZQUESTÃO
7