Escolar Documentos
Profissional Documentos
Cultura Documentos
Mineração de Dados
1. Introdução
2. Potência Instalada
Para mover um navio imerso na água é necessário sobrepor a resistência ao movimento, que é a
força que atua contra sua propulsão, chamada de resistência ao avanço. O cálculo dessa
resistência tem um papel fundamental na escolha correta do propulsor e posteriormente do
motor principal.
Onde:
Rw = Resistência de onda
Re = Resistência de vórtices
Rf = Resistência friccional
3. Base de Dados Utilizada
4. Redes Neurais
5. Metodologia
6. Execução do Software
Retirando os dados que eram considerados outliers, a qualidade das predições caiam.
Logo estas embarcações foram mantidas dentro do banco de dados utilizado para treino e teste
da rede neural.
Foram utilizados filtros para retirar as entradas que não possuiam dados completos, ou
seja, entradas que tinham falta de pelo menos uma variável. Com isto os dados utilizados caíram
de 9543 para 4296 entradas. Um número ainda relevante para treino de redes neurais.
O método conta com quatro partes principais: importação do banco de dados, limpeza
dos dados, tratamento dos dados e treino/teste da rede neural. Na importação dos dados foi
utilizado o bloco XLS Reader, que é utilizado para importar dados de uma tabela oriunda do
Excel.
A segunda parte é a limpeza dos dados, que como mencionado anteriormente, realiza a
retirada das entradas que não possuíam dados completos. Foram utilizados blocos Column Filter
e Row Filter para retirar as colunas que não serviriam para as redes neurais e retirar entradas
incompletas, respectivamente.
Na fase de tratamento dos dados foram realizados dois procedimentos, sendo o primeiro
a aplicação da escala logarítmica aos dados de potência instalada. Isto faz com o que as
predições sejam mais eficientes. E posteriormente estes dados foram normalizados, o que
também aumenta a eficiência das redes neurais.
Na quarta e última parte foram realizados o treino e teste das redes neurais. Após alguns
testes foi observado que o coeficiente de determinação (𝑅𝑅 2) variava bastante dependendo dos
dados de entrada para o treino e para os testes. Isto pode acontecer com bancos de dados
pequenos, mas neste caso eram utilizados pouco mais de 4200 entradas.
Como o tempo de treino não era muito grande foi utilizado o Cross Validation para
verificar a real capacidade da rede neural. Neste processo são utilizados, de modo iterativo,
diferentes dados de entrada para o treino e teste da rede neural. Foram utilizadas 10 iterações e
com isso estabilizou-se o coeficiente de determinação das redes neurais.
Ainda estão presentes nesta quarta parte a análise dos resultados obtidos, dados pelo
coeficiente de determinação e pela distribuição das predições quando comparadas aos valores
reais de cada embarcação. O esquema do modelo implementado no software Knime é dado na
figura a seguir:
6.3. Parâmetros
7. Resultados
Foi encontrado para este modelo um coeficiente de determinação (𝑅𝑅 2) igual a 0,907 e
com a seguinte distribuição de predição por valores reais:
0,9
0,8
Predição da Potência Instalada
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0 0,2 0,4 0,6 0,8 1
Potência Instalada
8. Conclusão
9. Referências Bibliográficas