Você está na página 1de 2

#Bibliotecas utilizadas:

library(MASS)
library (class)
#Conhecendo o Dataset biopsy
help(biopsy)
View(biopsy)
#Pergunta 1:
table(biopsy$class)
#Pergunta 2:
summary(biopsy)
#Pergunta 3:
View(biopsy)
#retirando os N/A
biopsy_teste = na.omit(biopsy[,-c(1)])
#calculando a maior média
max(colMeans(biopsy_teste[,1:9]))
#Pergunta 4:
summary(biopsy)
#Pergunta 5:
#Deve ser desconsiderado para aplicação do modelo pois é um atributo
identificador conforme realizado na questão 3
View(biopsy)
#Pergunta 6:
#Utilizando o novo dataset biopsy_teste mencionado anteriormente onde retirei as
linhas "NA"
nrow(biopsy_teste)
#Pergunta 7:
#Aplicando o KNN
help(knn)
acuracidade = c(1:100)*0
View(resposta)
for (i in 1:100) {
L <- sample(1:nrow(biopsy_teste),round(nrow(biopsy_teste)/3))
Dados_treinamento = biopsy_teste[-L, 1:9]
Dados_Teste = biopsy_teste[L,1:9]
cl_busca = factor(biopsy_teste[-L, 10])
resposta = knn(Dados_treinamento, Dados_Teste, cl = cl_busca, k = 5)
matriz_M = table(resposta[1:length(L)], factor(biopsy_teste[L,10]))
acuracidade[i] = sum(diag(matriz_M))/sum(matriz_M)*100
}
mean(acuracidade)
#Pergunta 8:
acuracidade = c(1:100)*0
Remover_coluna_NA <- subset(biopsy_teste, select = -c(V6))
View(Remover_coluna_NA)
for (i in 1:100) {
L <- sample(1:nrow(Remover_coluna_NA),round(nrow(Remover_coluna_NA)/3))
Dados_treinamento = Remover_coluna_NA[-L, 1:8]
Dados_Teste = Remover_coluna_NA[L,1:8]
cl_busca = factor(Remover_coluna_NA[-L, 9])
resposta = knn(Dados_treinamento, Dados_Teste, cl = cl_busca, k = 5)
matriz_M = table(resposta[1:length(L)], factor(Remover_coluna_NA[L,9]))
acuracidade[i] = sum(diag(matriz_M))/sum(matriz_M)*100
}
mean(acuracidade)
#Pergunta 9:
#Aplicando o KNN
help(knn)
acuracidade = c(1:100)*0
View(resposta)
for (i in 1:100) {
L <- sample(1:nrow(biopsy_teste),round(nrow(biopsy_teste)/3))
Dados_treinamento = biopsy_teste[-L, 1:9]
Dados_Teste = biopsy_teste[L,1:9]
cl_busca = factor(biopsy_teste[-L, 10])
resposta = knn(Dados_treinamento, Dados_Teste, cl = cl_busca, k = 5)
matriz_M = table(resposta[1:length(L)], factor(biopsy_teste[L,10]))
acuracidade[i] = sum(diag(matriz_M))/sum(matriz_M)*100
}
mean(acuracidade)
#k=2 [1] 96.0307
#k=5 [1] 97.23684
#k=12[1] 96.62719

Você também pode gostar