Você está na página 1de 5

Trabalho

Mineração de Dados

1. Introdução

2. Potência Instalada

Para mover um navio imerso na água é necessário sobrepor a resistência ao movimento, que é a
força que atua contra sua propulsão, chamada de resistência ao avanço. O cálculo dessa
resistência tem um papel fundamental na escolha correta do propulsor e posteriormente do
motor principal.

A resistência ao avanço é influenciada particularmente pela velocidade da embarcação, seu


deslocamento e forma do casco. Além disso, é possível dividir a resistência total em algumas
componentes, a saber:

• Resistência friccional – Depende da área molhada do casco, sendo influenciada pela


rugosidade do casco, que aumenta com incrustações.
• Resistência Residual – Tem duas componentes, a resistência de onda, que é resultado
da perda de energia através das ondas geradas pelo casco em movimento na água, e a
resistência de vórtices, que se refere a perda de energia causada pela separação do
fluido no casco.
• Resistência do ar – Influenciada pela parte do navio que se encontra acima da linha
d´água.

A figura a seguir mostra esquematicamente as componentes da resistência total ao avanço.

Onde:

Rw = Resistência de onda

Re = Resistência de vórtices

Rf = Resistência friccional
3. Base de Dados Utilizada

4. Redes Neurais

5. Metodologia

6. Execução do Software

6.1. Limpeza de Dados

O banco de dados utilizado possuia uma distribuição não uniforme de embarcações


quando considerado o porte, seja por deadweight ou deslocamento. Quanto maior o tamanho da
embarcação, menor a quantidade de representantes presentes no banco de dados. Isto fazia com
que estas embarcações fossem dadas como outliers quando os dados eram analisados pelo bloco
PCA do Knime.

Retirando os dados que eram considerados outliers, a qualidade das predições caiam.
Logo estas embarcações foram mantidas dentro do banco de dados utilizado para treino e teste
da rede neural.
Foram utilizados filtros para retirar as entradas que não possuiam dados completos, ou
seja, entradas que tinham falta de pelo menos uma variável. Com isto os dados utilizados caíram
de 9543 para 4296 entradas. Um número ainda relevante para treino de redes neurais.

6.2. Método Utilizado

O método conta com quatro partes principais: importação do banco de dados, limpeza
dos dados, tratamento dos dados e treino/teste da rede neural. Na importação dos dados foi
utilizado o bloco XLS Reader, que é utilizado para importar dados de uma tabela oriunda do
Excel.

A segunda parte é a limpeza dos dados, que como mencionado anteriormente, realiza a
retirada das entradas que não possuíam dados completos. Foram utilizados blocos Column Filter
e Row Filter para retirar as colunas que não serviriam para as redes neurais e retirar entradas
incompletas, respectivamente.

Na fase de tratamento dos dados foram realizados dois procedimentos, sendo o primeiro
a aplicação da escala logarítmica aos dados de potência instalada. Isto faz com o que as
predições sejam mais eficientes. E posteriormente estes dados foram normalizados, o que
também aumenta a eficiência das redes neurais.

Na quarta e última parte foram realizados o treino e teste das redes neurais. Após alguns
testes foi observado que o coeficiente de determinação (𝑅𝑅 2) variava bastante dependendo dos
dados de entrada para o treino e para os testes. Isto pode acontecer com bancos de dados
pequenos, mas neste caso eram utilizados pouco mais de 4200 entradas.

Como o tempo de treino não era muito grande foi utilizado o Cross Validation para
verificar a real capacidade da rede neural. Neste processo são utilizados, de modo iterativo,
diferentes dados de entrada para o treino e teste da rede neural. Foram utilizadas 10 iterações e
com isso estabilizou-se o coeficiente de determinação das redes neurais.

Ainda estão presentes nesta quarta parte a análise dos resultados obtidos, dados pelo
coeficiente de determinação e pela distribuição das predições quando comparadas aos valores
reais de cada embarcação. O esquema do modelo implementado no software Knime é dado na
figura a seguir:
6.3. Parâmetros

7. Resultados

Foi encontrado para este modelo um coeficiente de determinação (𝑅𝑅 2) igual a 0,907 e
com a seguinte distribuição de predição por valores reais:

0,9

0,8
Predição da Potência Instalada

0,7

0,6

0,5

0,4

0,3

0,2

0,1

0
0 0,2 0,4 0,6 0,8 1
Potência Instalada

8. Conclusão
9. Referências Bibliográficas

Você também pode gostar