Você está na página 1de 16

1.

A taxa de erro é:
a. A soma dos falsos positivos com os falsos negativos, a dividir pelo número
total de dados
b. O número de verdadeiros negativos a dividir pela soma dos verdadeiros
negativos com os falsos negativos
c. O número de verdadeiros negativos a dividir pelo total de dados
d. A soma dos verdadeiros positivos com os verdadeiros negativos a dividir pelo
número total de dados

2. Se quisermos estimar a taxa de falhas que um dado classificador terá quando for usado
em novas situações, devemos usar a taxa de erro que foi calculada para:
a) O conjunto de treino
b) O conjunto de validação
c) O conjunto de teste
d) Não é possível estimar esse valor

3. Uma grande superfície comercial pretende fechar as suas grandes lojas (que têm que
estar fechadas ao Domingo), e abrir lojas mais pequenas. Isso implica que cada uma
das novas lojas possa ter apenas um subconjunto dos produtos disponíveis. Também
é desejável que cada uma dessas novas lojas possa ser dirigida a um tipo específico
de cliente. De entre as técnicas estudadas nesta cadeira, quais são as mais apropriadas
para auxiliar a decisão de que produtos devem ficar em cada loja?
a) As redes neuronais MLP, ou outro método de previsão.
b) Os algoritmos genéticos, ou outro método de otimização.
c) As redes neuronais SOM, ou outro método de agrupamento.
d) As árvores de decisão induzidas a partir de bases de dados.
4. Embora na nossa Marinha a taxa de sucesso no treino de pilotos seja muito alta, é
normal que haja muitos candidatos que não consigam cumprir todos os requisitos. No
início do processo de candidatura são feitos alguns testes, que se espera possam servir
de indicadores para quem tem ou não capacidade para ser piloto naval. No entanto,
há candidatos que, tendo cumprido os mínimos nos diversos testes, acabam por se
revelar inaptos para a tarefa. Pretende-se usar toda a informação relativa aos testes
dos candidatos aceites e ao resultado final (se conseguiram ou não ser pilotos), para
fazer uma seleção mais apurada. Este problema é melhor descrito como um problema
de:
a) Aprendizagem supervisionada
b) Aprendizagem não supervisionada
c) Visualização
d) Otimização
5. Um camarada seu está neste momento a estudar a perceção que o pessoal de Marinha
tem dos Fuzileiros, usando um questionário com múltiplas questões, a fim de
desenvolver campanhas de informação que possam melhorar essa imagem. Parece
natural que haja grupos de pessoas com perceções muito distintas, o que levará a
campanhas diferenciadas. A identificação desses grupos é melhor descrito como um
problema de:
a) Aprendizagem supervisionada
b) Aprendizagem não supervisionada
c) Visualização
d) Otimização

6. As principais vantagens em usar árvores de decisão em vez de redes neuronais é que


geralmente:
a) São mais fáceis de interpretar
b) Têm taxas de erro menor
c) Ambas as respostas a) e b) estão corretas
d) Nem a) nem b) estão corretas.

7. Será que se pode usar uma árvore de decisão, um sistema de vizinho mais próximo,
ou uma rede neuronal para multiplicar dois números reais?
a. Sim, desde que sejam fornecidos um conjunto de vetores com pares de
números reais e o resultado da sua multiplicação, mas isso não faz sentido pois
haverá sempre algum erro na previsão e existe um algoritmo simples que dá o
resultado exato.
b. Sim, desde que seja fornecida uma tábua dos números de 0 a 9, e nesse caso
qualquer dos métodos consegue facilmente calcular o resultado de qualquer
multiplicação sem qualquer erro.
c. Não, pois os métodos de datamining preditivo não conseguem prever o
resultado deste tipo de operações.
d. Não, pois os métodos de datamining preditivo precisam de dados para serem
treinados, e não é possível arranjar dados para treinar um problema deste.

8. Para fazer previsões pode usar:


a. Uma rede neuronal
b. A técnica do “vizinho mais próximo”
c. Qualquer das duas técnicas
d. Nenhuma das técnicas

9. Explique o que é o fenómeno de “overfitting”.


Procurar um modelo que se ajuste aos dados de treino
10. Ao usar as técnicas de PCA (análise de componentes principais), estamos de facto a
fazer uma mudança de coordenadas para um novo sistema de eixos, de forma que a
maior parte da informação relevante esteja contida nas primeiras componentes e que
possamos ignorar as últimas. Os novos eixos…
a) não são necessariamente perpendiculares entre si.
b) correspondem aos vectores próprios da matriz de co-variância dos dados.
c) correspondem à transformada de Fourier dos dados.
d) São sempre em maior número que as coordenadas originais.

11. Uma base de dados é constituída pelas variáveis, 𝑋1, 𝑋2, 𝑋3 e 𝐶, todas categóricas.
Respeitante à variável 𝐶 os registos são classificados com uma classe do conjunto {𝐶1
, 𝐶2}. Perante a classificação de um novo registo através de um classificador de
máxima verosimilhança e considerando os valores desse registo em relação às
variáveis 𝑋1, 𝑋2 e 𝑋3 como 𝑥 = (𝑥1, 𝑥2, 𝑥3), atribuiríamos a classe mediante o valor
máximo entre:
a) 𝑃(𝐶1|𝑥) e 𝑃(𝐶2|𝑥);
b) 𝑃(𝐶1|𝑥) × 𝑃(𝐶1) e 𝑃(𝐶2|𝑥) × 𝑃(𝐶2);
c) 𝑃(𝑥|𝐶1) e 𝑃(𝑥|𝐶2);
d) 𝑃(𝑥|𝐶1) × 𝑃(𝐶1) e 𝑃(𝑥|𝐶2) × 𝑃(𝐶2);

12. Qual a diferença entre grupo de dados de validação e grupo de dados de teste?
Dados de treino: Dados que servem para elaborar/construir o modelo ou modelos.
Dados de validação: Um primeiro teste aos modelos para permitir o seu ajuste e para se
escolher o que apresentará erro menor de previsão. Este conjunto irá controlar o processo
de aprendizagem, ou seja, é usado para controlar a aprendizagem (opcional) e quanto
maior, melhor a estimação do treino ótimo.
Dados de teste: Depois de ajustados os modelos ou de selecionado o que nos permite
obter melhores resultados de validação, podemos reintroduzir os dados de validação nos
dados de treino e testar com os dados de teste para que se obtenha o erro mais realista,
prevendo a capacidade de generalização para qualquer dado apresentado à posteriori, ou
seja, é usado para estimar o desempenho e quanto maior, melhor a estimação do
desempenho do classificador.

13. Tendo em conta a seguinte árvore de decisão descreva a sua classificação final em
cada uma das 2 classes seguintes através regras lógicas (com disjunções e
conjunções):
a) 4 dias de proibição de saída:
Quer sair da escola durante a semana ∩ Dá o salto
b) Vai o próximo fim de semana a casa:
[(Quer sair da escola durante a semana ∩ Não envolve dar o salto) U (Não quer sair da
escola)]
14. Aquando da previsão da classe e da regressão de um atributo de um novo registo
através de um classificador de kvizinhos (k=3), obteve-se a seguinte tabela contendo
as 3 menores distâncias calculadas entre os registos dos dados históricos e do novo
registo.

a) Como classificava o novo dado quanto a 𝑌1? Justifique. O método usado foi
o k-vizinhos básico ou neste caso foi melhor usar uma variante?
Vermelho = 1/1
Azul = ½
Verde = 1/3
K-vizinhos ponderados, por causa de não haver dados iguais, não há uma moda, ou seja,
fica vermelho pela moda ponderada
b) Que valor escolheria para 𝑌2 usando a versão de k-vizinhos mencionada na
sua resposta anterior? Justifique.
Usando a média ponderada [(1*1+0,5*2+(1/3) *2)/(1+0,5+(1/3)] = 1,45
c) Para classificar o novo dado quanto a Y1, foi utilizado o classificador de k-
vizinhos (k=3) ponderado cujos pesos foram definidos como:
W1=0,6 para o 1º vizinho mais próximo
W2 =0,3 para o 2º vizinho mais próximo
W3=0,1 para o 3º vizinho mais próximo
Como seria classificado o novo dado quanto a Y1? Justifique
0,6*1 + 0,3 *(1/2)+0,1*(1/3) / 0,6+0,3+0,1= 1,5
d) Qual a diferença entre o resultado obtido na alínea anterior e o resultado que
se obteria através do método k-vizinhos usual, ou seja, não ponderado?

e) Que valor escolheria para Y2 usando a versão de k-vizinhos ponderada para a


regressão usada na primeira alínea? Justifique
1+0,5*2+(1/3)*2 / 1+0,5+(1/3) =1,45

15. Qual das afirmações é falsa?


a) Não é possível saber exatamente qual será a taxa de erra de um classificador
quando forem apresentados os dados usados no treino
b) Se estimarmos o erro do classificador o erro do classificador usando os dados
que foram usados para o treinar, a nossa estimativa será sempre otimista
c) Para estimarmos quão bom (ou mau) é um classificador, devemos sempre reter
alguns dados (ou seja, não os usar no processo de treino do classificador), de
modo a podemos usá-los no fim para ver se o classificador os classifica
corretamente ou não
d) Não é possível saber exatamente qual será a taxa de erro de um classificador
quando forem apresentados dados novos (não usados no treino)

16. A utilização de um sonar passivo é muito importante na deteção de submarinos


submersos. Há um dado efeito hidrofónico, a que chamaremos “A” que é muito difícil
de ocultar, mas que ocorre raramente. A probabilidade de um submarino nosso emitir
esse efeito é de 0.01. De que se sabe de observar submarinos de um dado adversário,
a probabilidade de estes gerarem esses mesmos efeitos é de 0.04. No entanto, é raro
esses submarinos passarem na nossa costa, e é 5 vezes mais provável que um
submarino na nossa costa seja nosso do que adversário. Se durante um exercício na
nossa costa um operador detetar o “efeito A”, e assumindo que usa um classificador
MAP deve considerar que:
a) Encontrou um submarino adversário
b) Encontrou um submarino nosso
c) Nenhum dos anteriores
d) Com os dados disponíveis é impossível decidir

17. Usando a tabela ao lado, se tiver que substituir o valor em falta para a nota de Álgebra
do João, usando o método dos k-vizinhos (usando distancias de Manhattan), com k=2,
escolhe o valor:
a) 13 SAD Mat. Algebra
b) 14 Manel 18 17 16
João 13 14 ?
c) 15
Maria 14 16 16
d) 16
Pedro 10 10 11
Roberto 15 16 16
José 14 13 15
Hildefonso 13 14 13
18. Se normalizar as notas de SAD pelo método MAX/MIN (para o intervalo [0,1], o
Pedro fica com uma nota de:
a) 10
b) 0
c) 1
d) 0.5

19. Considere os dados relativos a células biológicas dados nas aulas e replicados na
tabela ao lado. Usando como citério a “Pureza da partição” dado nas aulas
(percentagem de dados da classe maioritária), calcule qual é o poder descriminante de
cada atributo
a) F(#Núcleos)= (4+3)/12
b) F(#Caudas)= (5+3)/12
c) F(Cor)= (3+2)/12
d) F(Membrana)= (3+2)/12
20. Imagine que era necessário empenhar uma fragata num cenário operacional onde
havia uma séria ameaça aérea, mas onde havia também muitas aeronaves amigas. A
distribuição entre os dois é por isso fundamental. Durante exercícios navais foi
possível observar em ação as aeronaves amigas e, graças a um esforço de
“shadowing” das forças inimigas, foi possível observar, ainda que muito poucas
vezes, aeronaves amigas em ação. A experiência observada durante os exercícios foi
a seguinte :

Caracteristica/nr 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
da obs.
A- Voava 1 1 0 0 1 0 0 1 0 1 1 0 0 1 0 1 0 0 0 0 0 1 0 1
abaixo dos
200m
B- Voava 1 1 1 1 1 0 1 1 0 1 1 1 1 1 0 1 1 1 0 0 1 1 0 1
abaixo dos
800m
C- Emitia na 0 0 0 1 1 1 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0 1 0 1
banda k
D- Voava acima 0 0 0 1 0 0 0 1 0 0 0 0 1 0 0 0 0 1 1 1 1 0 0 0
de mach 1
E- Tinha o 1 1 1 1 0 0 0 0 0 1 1 1 1 0 0 1 1 1 1 1 1 0 1 0
RADAR em
busca cónica
T- Era inimigo 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

a) Se durante a operação aparecer um contacto aéreo abaixo dos 200m que não
emite na banda K, será ou não adversário ? Utilize uma estimativa MAP para
responder a esta questão.
P(A|x)=P(C|I)*P(I) = 2/4 x 4/24 = 1/12
P(I|C)=P(C|I)*P(I) = 2/4 x 4/24 = 1/12
b) Se durante a operação aparecer um contacto aéreo abaixo dos 500m mas acima
dos 200m, que não emite na banda K, mas tem o radar em busca cónica, será
ou não adversário? Utilize uma estimativa MAP para responder a esta questão.
P(Amigo|C)= P(C|A)*P(A) =5/20 * 20/24 = 5/24
P(I|C)= P(C|I)*P(I) =1/4 * 4/24 = 5/24
c) Para o mesmo problema da alínea anterior, utilize uma estimativa naive de
Bayes
d) Se observar uma aeronave a voar abaixo dos 200m, e usar um classificador de
máxima verosimilhança, tomará a decisão de assumir que o aeronave:
a. Não é possível decidir com os dados disponíveis
b. Tem a mesma probabilidade de ser amiga e inimiga
c. É inimiga
d. É amiga
e) Tendo em conta os dados obtidos no exercício naval da questão 14, imagine
que está em missão no mar Adriático, com ameaças de aviação Sérvia, e avista
um contacto a voar abaixo dos 800m e a emitir em banda K. Usando um
classificador de máxima verosimilhança (ou seja assumindo que à partida há
tantas aeronaves amigas como inimigas), deve assumir que:

a. É amigo
b. É inimigo
c. Tem a mesma probabilidade de ser amiga e inimiga
d. Não é possível decidir com os dados disponíveis

f) Tendo em conta os dados obtidos no exercício naval da questão 14, imagine


que está em missão no Golfo Pérsico onde é duas vezes mais provável ter um
encontro com uma aeronave inimiga do que amiga, e avista um contacto a voar
acima de mach 1. Usando um classificador MAP, deverá assumir que:

a. É amigo
b. É inimigo
c. Tem a mesma probabilidade de ser amiga e inimiga
d. Não é possível decidir com os dados disponíveis

g) Se tiver que substituir valores em falta para uma variável por um valor
concreto:

a. Deve usar o valor 0, ou 1 caso o valor 0 não fizer sentido;


b. Pode usar o método do vizinho mais próximo para estimar o valor em
falta, calculando as distâncias usando as variáveis para as quais
conhece todos os valores.
c. Pode usar um valor qualquer, pois este não afeta a computação das
distâncias entre vetores;
d. O método de Minkowski permite obter as melhores estimativas para
esse valor.

h) Se tiver que substituir o valor em falta para a nota de Álgebra do João, usando
o método dos k-vizinhos, com k=2, escolhe o valor:
a. 16
b. 15 SAD Mat. Algebra
c. 14 Manel 18 17 16
d. 13 João 13 14 ?
Maria 14 16 16
Pedro 10 10 11
Roberto 15 16 16
José 14 13 15
Hildefonso 13 14 13
i) Se normalizar as notas de SAD pelo método MAX/MIN (para o intervalo
[0,1], o Pedro fica com uma nota de:

a. 0
b. 0.5
c. 1
d. 10

21. Durante o exercício REX com veículos autónomos, é necessário saber se há um


intruso a bordo do veículo ou não, existindo para isso um sistema de alarme
incorporado no veículo. A tabela seguinte revela alguns dados que fizerem disparar o
alarme ou não:

Situação Tempestade Havia um intruso a Gaivota pousou em cima do Alarme


bordo veículo soou
1 Falso Falso Falso Falso
2 Falso Falso Falso Falso
3 Falso Falso Falso Falso
4 Falso Falso Falso Falso
5 Falso Falso Falso Verdadeiro
6 Falso Falso Verdadeiro Falso
7 Falso Verdadeiro Falso Falso
8 Falso Verdadeiro Falso Verdadeiro
9 Falso Verdadeiro Verdadeiro Verdadeiro
10 Verdadeiro Falso Verdadeiro Verdadeiro
11 Verdadeiro Falso Verdadeiro Falso
12 Verdadeiro Falso Verdadeiro Falso
13 Verdadeiro Verdadeiro Falso Verdadeiro

a) Usando um classificador Naive-Bayes qual a Probabilidade associada à


situação x de termos um intruso no navio em dia de tempestade, sem que
alguma gaivota pouse no navio.
12
a. P(x|”soar alarme”)=125
10
b. P(x|”não soar alarme”)= 125
10
c. P(x|”soar alarme”)= 83
12
d. P(x|”não soar alarme”)= 83
b) Usando um classificador MAP qual o score associado à situação x de termos
uma gaivota pousada no navio em dia de tempestade, mesmo sem intruso.

1 5
a. P(”soar alarme”|x) ∝ 5 𝑥 13
1 5
b. P(”não soar alarme”|x) ∝ 5 𝑥 13
2 8
c. P(”soar alarme”|x) ∝ 8 𝑥 13
1 8
d. P(”soar alarme”|x) ∝ 8 𝑥 13

22. Imagine que, usando um método de indução de árvores de decisão que desconhece,
alguém obtém a árvore de decisão, apresentada ao lado. Obtenha, usando todos os
dados da questão 14, a matriz de confusão desta árvore, e indique explicitamente qual
a taxa de falsos negativos, de falsos positivos, e de erro. (Considere “positivo “o avião
ser inimigo).
Está em busca
a) Taxa de Erro= cónica?
b) Taxa de Falsos Positivos= Não Sim
c) Taxa de Falsos Negativos=
Amigo Está acima dos
800m?
Amigo Inimigo
Sim
É amigo 2 1 3 Não
É inimigo 2 3 5
Amigo Inimigo

23. Vai ser usado o algoritmo de k-médias juntamente com a distância euclidiana para
agrupar os seguintes 4 exemplos A1=(2,10), A2=(2,5), A3(8,4) e A4=(5,8) em 2
clusters. A matriz das distâncias baseadas na distância euclidianaé a seguinte:
A1 A2 A3 A4
A1 0 √25 √36 √13
A2 0 √37 √18
A3 0 √25
A4 0
Considerou-se as sementes iniciais (os centros de cada cluster) o A1 e o A4.
a) Como são constituídos os dois clusters iniciais?
Clusters A1: A1
Clusters A4: A4, A2, A3
b) No fim da primeira época, quais os novos centros de dois clusters referidos
atrás?
Cluster A1: M1 = (2,10)
2+8+5 5+4+8
Cluster A4: M4 = ( , ) = (5, 5.67)
3 3

24. A técnica de Independant Component Analysis(ICA) pode ser usada para fazer o pré-
processamento de dados. Nesse caso, o que se espera conseguir é:
a) A eliminação de “outliers”
b) A eliminação “missing values”
c) A obtenção de menos variáveis para caracterizar os dados, de modo a manter
o máximo de variância nos mesmos
d) A obtenção de menos variáveis para caracterizar os dados, de modo a
conseguir a mínima informação mútua entre essas variáveis

25. Uma grande superfície comercial pretende fechar as suas grandes lojas (que têm que
estar fechadas ao domingo) e abrir lojas mais pequenas. Isso imploca que cada uma
das novas lojas possa ter apenas um sub-conjunto dos produtos disponíveis. Também
é desejável que cada uma dessas novas lojas possa ser dirigida a um tipo específico
de cliente. De entre as técnicas estudadas nesta cadeira, quais são as mais apropriadas
para auxiliar a decisão de que produtos devem ficar na loja?
a) As redes neuronais MLP, ou outro método de previsão
b) Os algoritmos genéticos ou outro método de optimização
c) As redes neuronais SOM ou outro método de agrupamento
d) As árvores de decisão induzidas a partir de bases de dados
26. A identificação da origem de um efeito hidrofónico (som captado por um sonar em
modo passivo) é, na nossa marinha, feito principalmente por praças muito bem
treinados, e com bastante experiência. Na ETNA (mais concretamente na antiga
Escola de Armas Submarinas) há uma série de gravações de submarinos, torpedos, e
navios de superfície, que são usados para fazer esse treino. Ouvindo essas gravações,
e comparando os sons com as suas causas, alguém fez a seguinte tabela:
(A)Ruído (B) Batimento (C)Batimento (D)Efeito de Cadedral Tipo de contacto
intenso acima periódico periódico entre 2 e
de 7kHz abaixo de 1Hz 5 Hz
S N N N Lancha rápida
S N S N Lancha rápida
N S N S Petroleiro
N S N N Submarino
N N S N Submarino
N N N S Petroleiro
S S N N Petroleiro

a) Se ouvir um som que não tem ruído intenso acima de 7kHz (variável A),
usando a tabela dada e um estimador de máxima verosimilhança, como
classificaria a origem desse som?
Usando o ML, P(x|A) = P(A|x). Desta forma, a inexistência de ruído intenso acima de
7kHz indica que existe uma probabilidade de 50% de ser submarino e 50% de ser
Petroleiro.
b) Se ouvir um som que tem ruído intenso acima de 7kHz, batimentos a 0.4 e
3hz, e efeito de catedral (i.e A=B=C=D=1), consegue classificá-lo de forma
razoável usando algum classificador bayesiano ? Se sim, explique como e faça
essa classificação.
Não pois não existe nenhum caso em que aconteçam esses três acontecimentos.
c) Imagine que é incumbido de desenhar um “detetor de petroleiros”, i.e., um
sistema que dá um alarme sempre que há um petroleiro na área (serve por
exemplo para detetar intrusos num exercício naval onde só é suposto haver
apenas submarinos e lanchas rápidas). Apresente o esquema (identificado
todas as variáveis e componentes do sistema) de um perceptrão simples que
poderia ser usado para fazer essa deteção.
(Efeito Cadedal) U (N Efeito Cadedal ∩ Ruido acima de 7 hz ∩ Batimento periódico
abaixo 1hz)
d) Se as únicas características disponíveis forem a A e D, é possível que um
percetrão simples separe (sem nunca errar) os petroleiros dos outros
contactos?
Não
e) Obtenha, usando o algoritmo DDT uma árvore de decisão para separar os
petroleiros dos demais contactos
(Efeito Cadedal) U (N Efeito Cadedal ∩ Ruido acima de 7 hz ∩ Batimento periódico
abaixo 1hz)
f) Usando o algoritmo DDT de indução de árvores usado nas aulas, obtenha uma
árvore de decisão que permita a um operador pouco treinado prever o tipo de
navio dadas as 4 características apresentadas
g) Usando a árvore obtida na aliena anterior, apresente as regras que esse
operador pode usar para distinguir esses efeitos

27. O patrulha N.R.P. SAD vai para uma missão durante uma semana, e a máquina de
osmose inversa (que produz água doce) acaba de avariar. O imediato, que tem neste
momentoos tanques de aguada cheios, precisa de saber se tem que navegar com água
fechada, ou se pode deixar a guarnição consumir o que precisar. O consumo semanal
varia bastante, de modo que se a guarnição consumir o mesmo que nas semanas de
menor consumo, não haverá qualquer problema. Já se o consumo for igual ao das
semanas mais “complicadas”, a água só irá durar até meio da semana. O imediato
suspeita que as variações de consumo se devem à temperatura ambiente, à temperatura
no interior do navio (que tem ar condicionado e aquecimento), ao estado do mar, e ao
tipo de comida que é servido (categorizada em 5 tipos diferentes). Sendo um jovem
Guarda-Marinha que acaba de sair da Escola Naval tendo frequentado a cadeira de
Sistemas de Apoio à Decisão, o imediato encarrega-o de estimar o consumo para a
semana que se avizinha. A primeira coisa que faz é:

a) Recolher os dados relativos ao consumo de água, temperatura ambiente,


temperatura no interior do navio, estado do mar, e tipo de comida que é servida
(categorizada em 5 tipos diferentes), durante todas as missões de uma semana
que o navio tenha realizado. Isto requer muito trabalho, mas fica com dados
suficientes para contruir grandes conjuntos de dados para treino, teste, a
validação do modelo, logo ficará com melhores previsões.
b) Recolher os dados relativos ao consumo de água, temperatura ambiente,
temperatura no interior do navio, e estado do mar, durante todas as missões de
uma semana que o navio tenha realizado. Não vale a pena recolher dados
relativo são tipo de comida que é servida pois não sendo uma variável
numérica, não pode ser usada para previsões.
c) Recolher dados relativos ao consumo de água, temperatura ambiente,
temperatura no interior do navio, estado do mar, e tipo de comida que é servida
(categorizada em 5 tipos diferentes), durante quatro missões de uma semana
(tantas quando o número de variáveis independentes) que o navio tenha
realizado. Não vale a pena ter mais dados, pois se o número de dados for
superior ao de variáveis independentes esses dados estarão correlacionados,
logo não melhorarão as previsões.
d) Recolher os dados relativos à temperatura ambiental, temperatura no interior
do navio, estado do mar, e tipo e comida que é servida (categorizada em 5
tipos diferentes), durante todas as missões de uma semana que o navio tenha
realizado. Não é necessário recolher dados relativos ao consumo, já que é a
variável que queremos prever.

28. Num processo de classificação, o software WEKA, produziu os seguintes valores:

a) Na matriz de confusão abaixo, referente ao mesmo problema, indique os


valores de a, b e c na matriz de confusão, sabendo que o algoritmo classificou
o conjunto de teste 64 indivíduos como não democratas.
Classificou como Classificou como
democrata não democrata
É democrata 83 a
Não é democrata b C

A+C=64
144+4=83+b =
b) O que significa o valor a na tabela e como se denomina?
A – falso negativo

29. O que significa assumir que duas classes C1 e C2 são linearmente separáveis.
Consegue-se separar as suas classes
30. Por causa de uma prova desportica, um aluno identificado como “U” faltou a uma
prova. Por falta de tempo o profeddort decide usar o metoo dos k-vizinhos para decidir
e deve atribuir ao aluno U a classificação aprovado ou nºao. Para isso ele verifica os
dadosque tem deste ano e do ano passado (tabela 1), referente a vários alunos, onde o
valor 1 idica “sim” e o valor 0 indica “não”.

a) Usando a distância euclidianos para comparara os alunos calcule a distância


do aluno U aos restantes.
b) Dados que o professor usou k=1 para o método dos k-vizinhos indique se o
aluno foi aprovado ou não.
c) Dado que o professor usou k=3 para o método dos k-vizinhos indique se o
aluno foi aprovado ou não.

31. Qual a diferença entre problemas de classificação e regressão em aprendizagem


automática?
Nos problemas de classificação, procura-se de alguma forma conseguir dividir os dados
na nuvem de classes que pretendemos identificar. Já nos problemas de requisição, dada a
informação que

32. Pretende-se um sistema automático separar turistas suecos de espanhóis. Para tal, usa-
se uma câmara de vídeo e software de reconhecimento de imagem que detecta se a
pessoa tem ou não cabelo louro, pele escura, e se é alto (tem mais de 1.8m) ou não.
Um fabricante de equipamentos propõe usar a árvore de decisão apresentada ao lado.
Por outro lado, observou 6 turistas (que constituem o conjunto de treino), e as suas
características são as dadas na tabela.
a) Qual a taxa de erro no conjunto de treino da árvore de decisão apresentada?
A taxa de erro é 1/6
b) Quais as regras, obtidas a partir da árvore de decisão, que caracterizam os
turistas suecos?
Loiro, não tem pele escura e tem mais de 1,8m
c) A árvore de decisão apresentada é a que se iria obter com o algoritmo DDT
dado nas aulas com os dados de treino disponíveis? Se não, qual seria essa
árvore?
Louro Escuro Alt Nac.
o
S N S Sueco
N N S Sueco
N S S Espanhol
N N N Espanhol
S S N Espanhol
S S S Sueco

Você também pode gostar