Você está na página 1de 39

UNIDADE I

Estudos Disciplinares
Inteligência Artificial

Prof. Dr. Kauê Rosalem


Definição de Inteligência Artificial

 IA é um ramo da Ciência da computação cujo objetivo é desenvolver sistemas


computacionais que exibam características que nós associamos com inteligência no
comportamento humano.
 IA é o estudo de ideias as quais permitem ao computador fazer coisas que façam as pessoas
parecerem inteligentes.
 IA é uma subdivisão da Ciência da Computação preocupada em criar software e hardware
com o objetivo de produzir resultados como os produzidos pelas pessoas.
 IA é o estudo para fazer com que computadores façam coisas que até o momento as
pessoas fazem melhor.

Fonte:
https://www.cidademarketing.com
.br/marketing/2019/08/09/intelige
ncia-artificial-vs-inteligencia-
humana-porque-together-is-
better/
IA x IN

IA – Inteligência Artificial: IN – Inteligência Natural


 Mais permanente.  Criativa enquanto IA não tem nenhuma
 Fácil de duplicar e disseminar. inspiração.
 Pode ser menos cara.  Possibilita às pessoas se beneficiarem e
usarem experiências sensórias.
 Mais consistente.
 Raciocínio humano faz uso da experiência
 Pode ser documentada.
de um amplo contexto.

Humano racional
Sistemas que pensam Sistemas que pensam
Pensamento
como seres humanos racionalmente
Sistemas que agem Sistemas que agem
Comportamento
como seres humanos racionalmente
Áreas relacionadas com IA

 Machine Learning e Deep Learning são métodos para treinar modelos, ou seja, mostrar às
máquinas como elas devem aprender a classificar dados.
 A Inteligência artificial, por sua vez, engloba os dois, e pode ser definida como qualquer
técnica que capacite uma máquina a imitar a inteligência humana.

ARTIFICIAL MACHINE
INTELLIGENCE LEARNING DEEP LEARNING
Qualquer técnica Métodos estatísticos Redes Neurais com múltiplas
que capacite uma que possibilitam que as camadas que assimilam
máquina a imitar a máquinas aprendam a tarefas e reconhecem símbolos
inteligência partir dos dados sem a partir dos dados
humana programação

Fonte: https://opencadd.com.br/machine-learning-ou-deep-learning/
Teste de Turing

 Turing, em 1950, propôs o famoso Teste de Turing no artigo “Computing machinery and
intelligence”.
 O teste foi proposto para fornecer uma definição operacional de inteligência.
 O computador passará no teste se um interrogador humano, depois de propor algumas
perguntas por escrito, não for capaz de distingui-lo de um humano.
Teste de Turing

Para passar no teste, o computador precisaria ter como capacidades:


 Processamento de linguagem natural.
 Representação de conhecimento.
 Raciocínio automatizado.
 Aprendizado de máquina.
 O teste evita a interação física direta para focar na inteligência.

 O chamado “Teste de Turing Total” inclui um sinal de vídeo


para testar habilidades de percepção e também permite
manipulação de objetos (robótica).
 A crítica principal em relação ao teste é que ele não é uma
definição a partir de princípios básicos e sim de imitação.
O argumento da sala chinesa

 A ideia de que inteligência significa a mesma coisa que comportamento inteligente foi desafiada
por alguns estudiosos. O contra-argumento mais conhecido é o experimento da Sala Chinesa, de
John Searle.
 Searle descreve uma experiência em que uma pessoa que não conhece chinês está trancada em
uma sala. Do lado de fora da sala existe uma pessoa que pode enviar notas escritas em chinês
para dentro da sala através de um espaço para correspondência.
 A pessoa dentro da sala recebe um grande manual, no qual ela pode encontrar instruções
detalhadas para responder às anotações que ela recebe do lado de fora.
 Searle argumentou que mesmo que a pessoa de fora da sala tenha a impressão de que ela esteja
conversando com outra pessoa que fala chinês, a pessoa dentro da sala não entende chinês.

Fonte:
https://opencadd.com.br/machine
-learning-ou-deep-learning/
Interatividade

É um subcampo do aprendizado de máquina, que em si é um subcampo da IA, que em si é um


subcampo da ciência da computação. Essa é a definição de:

a) IA (Inteligência Artificial).
b) Deep Learning (Aprendizado Profundo).
c) Data Science (Ciência de Dados).
d) Visão Computacional.
e) Machine Learning (Aprendizado de Máquina).
Resposta

É um subcampo do aprendizado de máquina, que em si é um subcampo da IA, que em si é um


subcampo da ciência da computação. Essa é a definição de:

a) IA (Inteligência Artificial).
b) Deep Learning (Aprendizado Profundo).
c) Data Science (Ciência de Dados).
d) Visão Computacional.
e) Machine Learning (Aprendizado de Máquina).

 No deep learning, as grandes redes neurais artificiais são


alimentadas com algoritmos de aprendizado e quantidades cada
vez maiores de dados, ampliando continuamente sua capacidade
de "pensar" e "aprender”. "Deep" se refere às muitas camadas
que a rede neural acumula com o tempo, e o desempenho
melhora quanto mais profunda a rede for. Hoje, grande parte do
deep learning acontece sob a supervisão humana, mas o objetivo
é criar redes neurais que consigam treinar a si mesmas e
"aprender" de modo independente.
Probabilidade e Incerteza

 Talvez estejamos mais familiarizados com aplicações de probabilidade em jogos.

 No entanto, muito mais importante, a probabilidade também pode ser usada para
quantificar e comparar riscos na vida cotidiana: quais são as chances de bater seu carro
se você exceder o limite de velocidade ou dirigir falando ao celular? Quais são as
chances de que as taxas de juros sobre sua hipoteca subam? Ou quais são as chances
de que a IA automatize tarefas específicas, como detectar ossos fraturados em imagens
de raios-x ou identificar comportamentos suspeitos em pessoas por reconhecimento
facial?
 O fato de que a incerteza pode ser quantificada é de suma
importância, por exemplo, na decisão referente à vacinação
ou outras políticas públicas.
 Os riscos nunca são conhecidos nos mínimos detalhes,
mas sua magnitude é geralmente conhecida em grau
suficiente para que se possa argumentar se os benefícios
superam os riscos.
Classificação Naive Bayes

 O algoritmo Naive Bayes recebe este nome por ser baseado no Teorema de Bayes.
 O classificador Bayes é uma técnica de aprendizado de máquina que pode ser usada para
classificar objetos como documentos de texto em duas ou mais classes.
 O classificador é treinado analisando um conjunto de dados de treinamento, para os quais as
classes corretas são fornecidas.
 O algoritmo tem como objetivo calcular a probabilidade que uma amostra desconhecida pertença
a cada uma das classes possíveis, ou seja, predizer a classe mais provável.
 Este tipo de predição é chamada de classificação estatística, pois é completamente baseada em
probabilidades.
 Esta classificação também é chamada ingênua (a palavra Naive em inglês significa ingênuo), pois
ela considera que o efeito do valor de um atribuído sobre uma determinada classe é independente
dos valores dos outros atributos, o que simplifica os
cálculos envolvidos.

Thomas Bayes
(1702-1761)

Fonte:
https://br.pinterest.com/pin/
464926361529915932/
Aprendizagem de Máquina

Dentre as diversas formas em se definir o conceito de aprendizagem de máquina, temos:


 Aprendizado é a capacidade de se adaptar, modificar e melhorar seu comportamento e suas
respostas, sendo portanto uma das propriedades mais importantes dos seres ditos
inteligentes, sejam eles humanos ou não.
 Ou seja, estamos tentando reproduzir nas máquinas o mesmo processo de aprendizagem
dos seres humanos e fazemos isso através de algoritmos de Machine Learning, que em
última instância nada mais são do que Matemática e Estatística.
 Existem muitos algoritmos que permitem fazer isso, cabendo a um Cientista de Dados
escolher o algoritmo que melhor se encaixa em cada tipo de problema a resolver.
Aprendizagem de Máquina – Aplicabilidades

Reconhecimento Elicitação de
de imagens atributos

Retenção Visualização
de clientes de atributos
Aprendizagem Aprendizagem
supervisionada não
supervisionada Sistema de
Diagnósticos Aprendizagem recomendação
de máquina

Previsões de Segmentação
mercado de clientes

Tarefas de constante
Decisões em aprendizagem
tempo real Aprendizagem
por reforço
Fonte:
Aquisição de https://isitics.com/2018/05/
Navegação conhecimento 10/principais-sub-divisoes-
de robôs e-aplicabilidade-da-
Aprendizagem de Máquina

 Aprendizagem Supervisionada: o supervisionamento é feito através do treinamento com


dados rotulados, ou seja, etiquetados com algum tipo de classe. Por exemplo, produtos
podem ser classificados em duas classes: com defeito e sem defeito.
 Aprendizagem Não Supervisionada: ao contrário da supervisionada, aqui não se faz
necessário o uso de etiquetas. Aqui são encontrados algoritmos de recomendação,
agrupamento e segmentação.
 Aprendizagem por Reforço: a aprendizagem por reforço é muito utilizada em sistemas de
decisão em tempo real. Neste caso, não existe um grande conjunto de dados históricos para
que seja gerado um conjunto de treinamento e consequentemente seja possível criar um
modelo de aprendizado.
Exemplo

Podemos definir como uma aplicação real de IA o seguinte exemplo:

a) Um Filtro de SPAM.
b) Um Classificador de Documentos.
c) Um Identificador de Faces.
d) Um Gerador automático de Códigos.
e) Todas as alternativas estão corretas.
Resposta

Podemos definir como uma aplicação real de IA o seguinte exemplo:

a) Um Filtro de SPAM.
b) Um Classificador de Documentos.
c) Um Identificador de Faces.
d) Um Gerador automático de Códigos.
e) Todas as alternativas estão corretas.
Medicina Diagnóstica e IA

 Em seu estado atual, a IA encontra apenas algumas aplicações especializadas, como


ferramentas de apoio à decisão para radiologistas.
 No futuro próximo, teremos a triagem automática rápida de imagens normais versus
imagens anormais (cerca de 80% dos exames são geralmente normais, 15% são anormais,
mas fáceis de interpretar, e 5% são difíceis de interpretar).
 Muitos especialistas acreditam que a radiologia baseada em IA irá superar com grande
margem as capacidades de radiologistas bem treinados, e uma das razões é a maneira
como o Big Data será usado. O diagnóstico por imagem é uma tarefa essencialmente
visual, ou seja, quanto mais imagens o radiologista vê ao longo de sua profissão, melhor
ele será no diagnóstico.

Fonte:
https://forumsaudedigital.com.br
/fidi-e-aidoc-firmam-parceria-
para-aplicar-inteligencia-
artificial-a-radiologia/
Detecção de fraudes e IA

 A velocidade com que as perdas financeiras podem ocorrer por conta de fraude de cartão de
crédito torna as técnicas inteligentes de detecção de fraudes cada vez mais importantes.
 Devido à disponibilidade de grandes volumes de dados de clientes e de dados transacionais, a
Inteligência Artificial pode ser usada para identificar com eficiência padrões de comportamento
de cartões de crédito irregulares para clientes específicos.
 As empresas de segurança cibernética podem se concentrar na implementação de
aprendizado profundo para criar impressões digitais de usuários e transações, usando modelos
matemáticos através da criação de clusters que podem então ser monitorados.
 Conseguir isso reduzirá os custos gerais dos bancos e melhorará sua reputação com os
clientes, que provavelmente serão mais leais a uma instituição que proteja melhor seu dinheiro.

Fonte:
https://computerworld.com.br/segu
ranca/maioria-das-financeiras-
sofreu-tentativa-de-fraude-nos-
ultimos-anos/
Interatividade

A melhor abordagem para o raciocínio sob incerteza e quase todas as aplicações atuais de IA pode
ser definida por:

a) Probabilidades.
b) Incertezas.
c) Certezas.
d) Dúvidas.
e) Pesquisa e Desenvolvimento.
Resposta

A melhor abordagem para o raciocínio sob incerteza e quase todas as aplicações atuais de IA pode
ser definida por:

a) Probabilidades.
b) Incertezas.
c) Certezas.
d) Dúvidas.
e) Pesquisa e Desenvolvimento.
 O campo de pesquisa em computação probabilística não é novo, mas os avanços em
processamento de alto desempenho e algoritmos de aprendizagem profunda podem levá-lo a
uma nova era.
 Nos próximos anos, devemos acompanhar o desenvolvimento
significativo dos sistemas de Inteligência Artificial em termos de
confiabilidade, segurança, facilidade de manutenção e
desempenho, incluindo o surgimento de hardware projetado
especificamente para computação probabilística. Esses avanços
são essenciais para o uso dessas aplicações no mundo real – de
casas até cidades inteligentes.
Dados, Características e Algoritmos

Fonte:
https://www.datageek
s.com.br/machine-
learning/
Algoritmos de Machine Learning

K-Means
Clustering Mean Shift
K-Medoids

Unsupervised
Learning Principal Component Analysis (PCA)
Dimensionality Feature Selection
Reduction
Linear Discriminant Analysis (LDA)

Machine
Learning
Decision Tree
Regression Linear Regression
Logistic Regression
Reinforcement Supervised
Learning Learning

Navie Bayes
Classification SVM
K-Nearest Neighbor
Fonte: https://www.geeksforgeeks.org/
MNIST

 O M significa Modificado, e NIST significa Instituto Nacional de Padrões e Tecnologia.


 O MNIST é um dataset de dígitos escritos à mão amplamente usado por quem está
estudando sobre Machine Learning.
 Esses dígitos manuscritos foram então digitalizados e etiquetados.
 No total são 60.000 imagens de treinamento e 10.000 imagens de teste.
 O MNIST é gratuito e pode ser usado para você treinar seus algoritmos de Machine Learning
antes de usar datasets maiores e mais complexos.

 Este é o site oficial do MNIST: http://yann.lecun.com/exdb/mnist/

 O que gostaríamos de alcançar é um método de IA que possa


receber uma imagem e automaticamente citar o rótulo correto
(um número entre 0 e 9).
Classificador do vizinho mais próximo (K nearest neighboors – KNN)

 O classificador de vizinho mais próximo está entre os classificadores mais simples possíveis.
 Quando recebe um item para classificar, ele encontra o item de dados de treinamento mais
semelhante ao novo item e exibe seu rótulo.
 Distância geométrica padrão/distância euclidiana.
 A ideia é usar um princípio muito simples de que os usuários com comportamentos passados
e semelhantes tendem a ter um comportamento futuro também semelhante.
 Exemplos: sistema de recomendação de músicas e filmes que coleta dados sobre o
comportamento dos usuários e realiza novas sugestões.
Rótulo A

Rótulo B k=7

Distância

Fonte:
http://computacaointelige
nte.com.br/algoritmos/k-
vizinhos-mais-proximos/
Regressão linear

 A regressão linear é uma metodologia desenvolvida a partir da estatística e da econometria.


 Este método serve para avaliar os efeitos que outras variáveis causam sobre uma variável
analisada.
 A ideia básica na regressão linear é somar os efeitos de cada uma das variáveis de recurso para
produzir o valor previsto.
 O termo técnico para o processo de soma é a combinação linear.
 A palavra linear significa que o aumento na saída quando uma característica de entrada é
aumentada por alguma quantidade fixa é sempre a mesma.
10

 Regressão linear simples (2 variáveis) 9  Dados observados


Regressão linear
8
 Regressão linear múltipla (3 ou mais variáveis)
7
6
 Exemplo: analisar a venda de 5
um produto relacionada ao 4
crescimento populacional de 3
um país. 2
Fonte: 1
https://www.dicionariofinanceiro. 0
com/regressao-linear/ 0 1 2 3 4
Regressão logística

 Um dos casos particulares dos modelos lineares generalizados são os modelos em que a variável
resposta apresenta apenas duas categorias, assumindo valores 0 ou 1, sendo o modelo de
regressão logística o mais popular desses modelos.
 A regressão logística é usada para problemas de classificação, em que trabalhamos com
variáveis categóricas.
 O modelo de regressão logística é semelhante ao modelo de regressão linear.
 Uma variável binária assume dois valores, como por exemplo, Y = 0 e Y = 1 denominados
“fracasso” e “sucesso”.
 A regressão logística é amplamente usada em ciências médicas e sociais, e tem outras
denominações, como modelo logístico. 1

0’s
0,8
1’s

Probability (1/10)
0,6

0,4

0,2
Fonte:
https://aimlsite.wordpress.com/
0
2017/08/13/regressao-logistica- -20 -10 0 10 20
gradiente-descendente/ Model Output
Interatividade

Sobre os itens abaixo, é correto afirmar:

I. No caso de reconhecimento de dígitos MNIST, uma maneira comum de medir a


similaridade de imagem é contar as correspondências pixel a pixel.
II. Um exemplo típico de uma aplicação do método do vizinho mais próximo é prever o
comportamento do usuário em aplicativos de IA, como sistemas de recomendação.
III. Os sistemas de recomendação atuais usam filtragem colaborativa em vez dos metadados
inseridos manualmente.

a) Somente I é correto.
b) Somente I e III são corretos.
c) Somente II é correto.
d) Somente II e III são corretos
e) I, II e III são corretos.
Resposta

Sobre os itens abaixo, é correto afirmar:

I. No caso de reconhecimento de dígitos MNIST, uma maneira comum de medir a


similaridade de imagem é contar as correspondências pixel a pixel.
II. Um exemplo típico de uma aplicação do método do vizinho mais próximo é prever o
comportamento do usuário em aplicativos de IA, como sistemas de recomendação.
III. Os sistemas de recomendação atuais usam filtragem colaborativa em vez dos metadados
inseridos manualmente.

a) Somente I é correto.
b) Somente I e III são corretos.
c) Somente II é correto.
d) Somente II e III são corretos
e) I, II e III são corretos.
Definição de Redes Neurais

 Uma rede neural pode significar uma rede neural biológica “real”, como a do cérebro, ou uma
rede neural artificial simulada em um computador.
 Uma rede neural, biológica e artificial, consiste de um grande número de unidades simples,
neurônios, que recebem e transmitem sinais uns aos outros.
 Redes neurais artificiais formam um conjunto de algoritmos de Machine Learning, que tentam
simular o funcionamento do cérebro humano para realizar atividades complexas.
 Uma das razões para o interesse é a esperança de entender nossa própria mente, que
emerge do processamento neural em nosso cérebro.
Dendritos (terminal de recepção)
Terminal do Axônio
(terminal de transmissão)

Sentido de propagação

Corpo
Fonte: Axônio Nodo de Ranvier
https://deeplearningbr
asil.wordpress.com/ Bainha de Mielina
Redes Neurais Artificiais

 Seu primeiro conceito foi introduzido em 1943, mas ganhou popularidade algumas décadas
depois com a introdução de algoritmos de treinamento como retropropagação (backpropagation),
que permite a realização de um treinamento posterior para aperfeiçoar os resultados do modelo.
Atualmente, há diversas topologias das RNA’s que
buscam resolver diferentes tipos de problemas, tais como:
 Processamento de linguagem natural.
 Reconhecimento de fala e imagens.
 Previsão de valores.
A operação de uma unidade de processamento, proposta por Fonte:
McCullock e Pitts em 1943, pode ser resumida da seguinte maneira: http://deeplearningbook.com.br/o-
perceptron-parte-1/
 Sinais são apresentados à entrada.
 Cada sinal é multiplicado por um número, ou peso, que indica a
sua influência na saída da unidade.
 É feita a soma ponderada dos sinais que produz um nível de
atividade.
 Se este nível de atividade exceder um certo limite (threshold), a
unidade produz uma determinada resposta de saída.
Algoritmo Perceptron

 Um dos primeiros modelos formais de computação neural e por causa de seu papel
fundamental na história das redes neurais: “mãe de todas as redes neurais artificiais”.
 Pode ser usado como um classificador simples em tarefas de classificação binária.
 Um método para aprender os pesos do perceptron a partir dos dados, chamado de algoritmo
Perceptron, foi introduzido pelo psicólogo Frank Rosenblatt, em 1957.
 O princípio básico é alimentar os dados de treinamento da rede, um exemplo de cada vez.
Cada erro de classificação leva a uma atualização no peso.

Fonte:
http://deeplearningbook.co
m.br/o-perceptron-parte-1/
Algoritmo Perceptron

 O Perceptron é uma rede neural de camada única.

 Um Perceptron de várias camadas é chamado de Rede Neural Artificial.

 O Perceptron é um classificador linear (binário).

Fonte:
http://deeplearningbook.co
m.br/o-perceptron-parte-1/
Redes Neurais Convolucionais (CNNs)

 Utilizada para o reconhecimento de um objeto em qualquer lugar de uma imagem, não


importando onde ela tenha sido observada nas imagens de treinamento.
 Os neurônios convolucionais são normalmente colocados nas camadas inferiores da rede, que
processa os pixels brutos de entrada. Neurônios básicos (como o neurônio do perceptron
discutido anteriormente) são colocados nas camadas mais altas, que processam a saída das
camadas inferiores.
 As camadas inferiores geralmente podem ser treinadas usando aprendizado não supervisionado,
assim com fotos de animais, características típicas serão orelhas e focinhos.
 Isso significa que camadas convolucionais pré-treinadas podem ser reutilizadas em muitas tarefas
de processamento de imagem diferentes.
 As camadas superiores são sempre treinadas por técnicas hidden hidden hidden
Input layer 1 layer 2 layer 3
supervisionadas de layer
aprendizado de máquina, Ouput
layer
como retropropagação
(backpropagation).
Fonte:
http://deeplearningbook.com
.br/introducao-as-redes-
neurais-convolucionais/
Redes Adversárias Generativas (GANs)

 Uma das redes é treinada para gerar imagens como as dos dados de treinamento.
 A tarefa da outra rede é separar as imagens geradas pela primeira rede das imagens reais dos
dados de treinamento, ela é chamada de rede adversária, e todo o sistema é chamado de Rede
Adversária Generativa ou GAN (Generative Adversarial Network).
 O sistema treina os dois modelos lado a lado.
 No início do treinamento, o modelo contraditório tem uma tarefa fácil de diferenciar as imagens
reais dos dados de treinamento e as tentativas desajeitadas do modelo generativo.
 À medida que a rede generativa lentamente se torna melhor, o modelo adversário também
precisa melhorar, e o ciclo continua até que, finalmente, as imagens geradas são quase
indistinguíveis das imagens reais.

Training set
Discriminator
Real
Fonte: Random
http://deeplearningboo Fake
noise
k.com.br/introducao-
as-redes-adversarias-
generativas-gans-
generative-
Generator Fake image
adversarial-networks/
Exemplo

 Para construir um classificador de rede neural, precisamos formalizar o problema de uma


maneira que possamos resolvê-lo usando os métodos que aprendemos. A GAN é um tipo de
rede neural que gera as imagens reais a partir de pontos de dados. Portanto, devemos
utilizá-la para nos auxiliar a solucionar nossos problemas. Verdadeiro ou Falso?

 Redes incluindo camadas convolucionais são chamadas de redes neurais convolucionais


(CNNs). Sua principal propriedade é que elas podem detectar recursos da imagem, como
pontos claros ou escuros (ou cores específicas), bordas em várias orientações e padrões.
Verdadeiro ou Falso?
Exemplo – Resposta

 Para construir um classificador de rede neural, precisamos formalizar o problema de uma


maneira que possamos resolvê-lo usando os métodos que aprendemos. A GAN é um tipo de
rede neural que gera as imagens reais a partir de pontos de dados. Portanto, devemos
utilizá-la para nos auxiliar a solucionar nossos problemas. Verdadeiro ou Falso? Falso!

 Redes incluindo camadas convolucionais são chamadas de redes neurais convolucionais


(CNNs). Sua principal propriedade é que elas podem detectar recursos da imagem, como
pontos claros ou escuros (ou cores específicas), bordas em várias orientações e padrões.
Verdadeiro ou Falso? Verdadeiro!
Interatividade

O Perceptron pode ser usado para:

a) Tarefas de classificação binária.


b) Criar hipérboles de IA.
c) Trabalhar como o principal algoritmo durante o inverno da IA.
d) Reconhecimento de imagens.
e) Todas as opções estão erradas.
Resposta

O Perceptron pode ser usado para:

a) Tarefas de classificação binária.


b) Criar hipérboles de IA.
c) Trabalhar como o principal algoritmo durante o inverno da IA.
d) Reconhecimento de imagens.
e) Todas as opções estão erradas.
ATÉ A PRÓXIMA!

Você também pode gostar