Você está na página 1de 5

1.

O machine learning pode ser usado como uma tecnologia para identificar transações que
podem ser fraudulentas. Uma instituição que faz operações de crédito precisa analisar se
um novo cliente tem potencial de tornar-se inadimplente; assim, utiliza-se de uma base
que contém dados de transações bancárias de 5 mil clientes dos últimos cinco anos, em
que há a informação completa de financiamentos, cartões de crédito e compras realizadas
e, ainda, se houve dívidas não pagas.

Nesse contexto, pode-se afirmar:

A. Utilizar algoritmos com a aprendizagem não supervisionada será uma boa estratégia
para o problema; assim, podem-se agrupar os clientes.

B. O problema tem uma base catalogada, e, assim, pode-se utilizar o aprendizado


supervisionado e, ainda, o algoritmo Naive Bayes ou SVM na classificação.

C. Poderia ser desenvolvido um software em que haveria a recuperação dos dados por meio
do SQL e a emissão de um relatório para a tomada de decisão.

D. A base não está catalogada, já que não está definido se o cliente tem bom ou mau
potencial; então, haverá o descarte parcial dos dados.

E. O problema é de regressão, e pode-se utilizar tanto o aprendizado supervisionado como o


não supervisionado.

Resposta: Letra “B” - O problema tem uma base catalogada, pois, se as dívidas foram
pagas, então o cliente é um bom pagador; caso contrário, não é. Assim, o problema se
refere ao contexto do aprendizado supervisionado, e podem-se utilizar os algoritmos
Naive Bayes ou SVM para a classificação.

Em um relatório com a recuperação por meio do SQL, tem-se a visualização dos dados,
mas não a aprendizagem de máquina para que realize as predições necessárias ao
problema.
2. No contexto da robótica, uma mão perfuradora pode realizar trabalhos específicos na
indústria petroleira a fim de encontrar combustível. O contexto se refere a tentativa e erro
por pessoas, em que o padrão não é gravado, pois é somente manipulado por uma pessoa.

Ao falar do contexto da aprendizagem de máquina, o que pode ser aplicado?

A. Dado que os dados oriundos desse processo são abundantes, mas não rotulados, pode-
se utilizar o aprendizado não supervisionado e, assim, garantir a eficácia do procedimento.

B. Os algoritmos de regressão linear e regressão logística poderiam ser utilizados nesse


contexto. No entanto, os dados deveriam ser devidamente mapeados.

C. Pode-se aplicar o aprendizado por reforço, pois, a cada ação da mão perfuradora,
recompensa-se ou pune-se a fim de que tenha um padrão para o encontro de combustível.

D. Não cabe o contexto do aprendizado de máquina, já que o sentido seria o de desenvolver


um sistema comum com um banco de dados relacional, armazenar os dados atuais e
realizar a geração de dashboards.

E. O aprendizado de máquina supervisionado e a utilização de um algoritmo de


classificação comporiam a metodologia nesse segmento. No entanto, o treinamento seria
longo.

Resposta: Letra “C” - O contexto do aprendizado por reforço deve ser utilizado. Não há
uma base de dados de aprendizagem, e sim uma chance de estados possíveis; assim, a
mão pode realizar uma ação e ser ou não recompensada, a fim de reforçar aquela ação e
realizarmos o aprendizado de máquina.

Somente alocar os dados em um banco de dados e gerar algumas informações não será
eficaz, pois não há uma inteligência que conseguirá mostrar as inúmeras possibilidades
de perfuração e qual é o melhor caminho. Assim, não se tem o contexto do aprendizado
supervisionado ou não supervisionado.
3. No contexto do jornalismo, são produzidas diversas notícias sobre diferentes assuntos.
Ao analisar a ciência de dados e o contexto da classificação, verifica-se que nas notícias
não são, comumente, informadas a sua temática. Caso se quisesse saber quantas notícias
tivessem sido publicadas sobre o governo, economia, indústria, pessoas ou quaisquer
outras, tal informação não seria acessível.

A partir desse contexto e da ciência de dados, poderia ser aplicado o aprendizado de


máquina, a fim de organizar uma estatística de temáticas que os meios de comunicação
produzem. Indique a alternativa que apresenta uma solução para esse contexto:

A. Pode utilizar o algoritmo Random Forest dentro do aprendizado supervisionado, a fim de


concebermos as temáticas.

B. Como não há a rotulação das notícias, pode-se aplicar o algoritmo K-means e, então,
primeiramente organizar as notícias em grupos.

C. O aprendizado não supervisionado não cabe ao contexto, pois os dados não estão
rotulados.

D. Não se pode avançar nesse contexto, pois não há informações pertinentes para que se
possa realizar o aprendizado de máquina.

E. Como é um problema de regressão, devem-se organizar os dados de forma a conduzir o


modelo para uma função contínua.

Resposta: Letra “B” - Os dados não estão rotulados, e há um problema de classificação.


Têm-se as informações pertinentes ao problema, e, dentro do aprendizado de máquina
não supervisionado. há o algoritmo K-means, que realiza o agrupamento dos dados de
acordo com características próximas.

Assim, podem-se, inicialmente, agrupar as notícias para posterior verificação temática.


O Random Forest não é cabível ao contexto do aprendizado supervisionado.
4. Dentro da deep learning, há inúmeras camadas de neurônios interconectados. Eles são
utilizados para realizar a aprendizagem dos dados de entrada. Dentro desse contexto, têm-
se as redes convolucionais, que extraem características de imagens e, posteriormente,
realizam o processo de classificação por alguns neurônios.

Dado que uma base A contém fotos de gatos e uma base B contém fotos de cachorros, o
que pode ser afirmado se fotos de hipopótamo forem apresentadas a essa rede já em
produção?

A. Ela afirmará que há uma porcentagem alta próxima dos cachorros, por terem
características semelhantes, como a orelha e pelos.

B. Não reconhecerá, sequer parcialmente, por não ter sido usada a técnica de aprendizado
supervisionado.

C. Para a devida acurácia, seria necessário retreinar a rede com as imagens de


hipopótamos.

D. Não é possível extrair características de diferentes animais, já que há limitação de


camadas de neurônios.

E. Faz-se necessário criar uma rede exclusiva para a identificação de somente um animal.

Resposta: Letra “C” - Em geral, as redes neurais profundas, em sua saída, fazem
distribuição de probabilidade e dão uma porcentagem de acerto em relação ao objeto
identificado. No entanto, orelhas e pelos de cachorros não são próximos de um
hipopótamo. Foi utilizado o treinamento supervisionado, pois são imagens específicas já
de cada animal.

De fato, seria necessário que houvesse retreino da rede com as imagens novas para que
a rede, aprendendo as novas características, pudesse, então, identificar o animal, e uma
rede neural pode identificar múltiplos objetos.
5. O treinamento de uma rede neural profunda é parte importante no processo de
aprendizagem. Assim, há a utilização de diversos hiperparâmetros. Um passo em relação
aos dados consiste na divisão deles em amostras de treino, teste e validação.

Dado que uma base A contém 5 milhões de dados sobre câncer de pele, classificados
como benigno e maligno, e que 20% desse conjunto de dados não está rotulado, em
relação à divisão referida, o que se pode afirmar?

A. Os 20% não rotulados poderiam ser utilizados para a aprendizagem não supervisionada.

B. Os dados não rotulados poderiam ser usados para validação e teste, e os rotulados, para
o treinamento.

C. Pode-se afirmar que não há quantidade suficiente de dados para realizar o treinamento
inicial.

D. Os dados não rotulados têm a prioridade de serem encontrados primeiro, a fim de,
posteriormente, realizarem o treinamento.

E. Para o treinamento inicial, basta obter 0,1% dos dados não rotulados, e, assim, será
realizada a primeira parte.

Resposta: Letra “B” - Há 80% de dados rotulados entre 5 milhões do total. Assim, há uma
quantidade expressiva para iniciar o treinamento. Não é necessário descobrir o rótulo
dos outros 20%, pois eles podem ser utilizados para teste e validação.

Você também pode gostar