Você está na página 1de 61

ESCOLA

POLITCNICA DE
PERNAMBUCO

Trabalho de Concluso de Curso

Engenharia de Computao

SELEO DE FATORES DE RISCO


DE LESES EM ATLETAS, ATRAVS
DA EXTRAO DE CONHECIMENTO
DOS PESOS DE UMA REDE NEURAL

Autor: Havana Diogo Alves

Orientador: Muser Jorge Valena

Co-Orientador: Wellington Pinheiro dos Santos

i
ESCOLA
POLITCNICA DE
PERNAMBUCO

HAVANA DIOGO ALVES

SELEO DE FATORES DE RISCO


DE LESES EM ATLETAS, ATRAVS
DA EXTRAO DE CONHECIMENTO
DOS PESOS DE UMA REDE NEURAL

Monografia apresentada como requisito parcial


para obteno do diploma de Bacharel em
Engenharia da Computao pela Escola
Politcnica de Pernambuco Universidade de
Pernambuco.

Recife, junho de 2010.

ii
ESCOLA
POLITCNICA DE
PERNAMBUCO

A todos que acreditam na beleza de seus sonhos!.

iii
ESCOLA
POLITCNICA DE
PERNAMBUCO

Agradecimentos

Aos meus pais, Cleonice Diogo Alves e Marcos Diogo Ramos, pelo
incentivo irrestrito, por serem meu porto seguro, por toda a educao e por todo o
amor. Aos meus irmos Tamires Diogo Alves e Marcos Antnio Diogo Alves.

A toda a minha famlia, em especial minha av Geni Ramos Barbosa e


minha tia Marta Diogo de Lima, pelos bons momentos e pelos bons sentimentos
compartilhados.

A meu namorado Edson Bruno Andrade da Silva, por ser paciente e me


confortar e me fazer sorrir nos momentos de maior estresse e cansao.

A todos os meus amigos, pelo apoio e pelo companheirismo.

Aos Professores Muser Jorge Valena e Wellington Pinheiro dos Santos,


pela grande atuao e importncia na minha vida acadmica.

A minha amiga e companheira de projetos, Liliane Alves do Nascimento,


que compartilhou comigo as noites mal dormidas para finalizao dos trabalhos
da graduao.

Por fim, agradeo a todos os meus professores pela boa formao que
recebi.

Obrigado a todos, por compartilharem meus momentos com alegria!

iv
ESCOLA
POLITCNICA DE
PERNAMBUCO

Resumo
O atletismo brasileiro vem crescendo de forma significativa nos ltimos
anos, conquistando, assim, posies no ranking mundial. O aumento na
intensidade do treinamento dos atletas foi fator relevante para esse feito. Como
conseqncia do aumento da demanda de exerccios cada vez mais modernos e
competitivos, houve um crescimento no risco do aparecimento de leses, o que
motivo de apreenso para atletas e treinadores, pois interrompem o processo
evolutivo do treinamento. Muitos so os fatores que podem contribuir para o
surgimento de tais leses, e saber qual a relevncia de cada um deles de
grande importncia para os profissionais ligados ao esporte, pois sabendo os
mecanismos principais do lesionamento possvel tomar medidas preventivas.
Na rea de sade, mtodos estatsticos tradicionais so comumente usados no
estudo dos mais diversos casos, porm vale ressaltar que tais mtodos detectam
apenas caractersticas lineares dos dados. Como o mundo real repleto de
fenmenos no-lineares, torna-se necessria a utilizao de tcnicas que
capturem esta no-linearidade. Para estes casos, as Redes Neurais Artificiais
tm mostrado resultados bastante satisfatrios. Este trabalho tem como objetivo
utilizar algoritmos de seleo de variveis que extraem conhecimento dos pesos
e sensibilidades de uma rede neural para obter a contribuio de cada fator no
surgimento de leses em atletas. Com isso, espera-se encontrar uma alternativa
mais precisa para se entender os mecanismos favorecedores de leses, podendo
dessa forma, ajudar na determinao de medidas preventivas.

v
ESCOLA
POLITCNICA DE
PERNAMBUCO

Abstract
The Brazilian athletics has grown significantly in recent years, by gaining
thus positions in the world ranking. The increased intensity of training of the
athletes was a relevant factor in this achievement. As a result of increased
demand of exercise increasingly modern and competitive, there was a growth of
risk of developing injuries, which worries athletes and coaches, for interrupting the
evolutionary process of training. There are many factors that can contribute to the
appearance of such injuries, and knowing the relevance of each one is very
important to the professionals linked to the sports, because knowing the main
mechanisms of the injury, they can take preventive steps. In the field of Health,
traditional statistical methods are usually used for studing various cases, but it is
noteworthy that such methods only detect linear features of the data. As the real
world is full of non-linear phenomena, it becomes necessary to use techniques
that capture this nonlinearity. For these cases neural networks have shown good
results. This study aims to use variable selection algorithms that extract
knowledge from weights and sensibilities to obtain the contribution of each factor
in the development of injuries in athletes. We expect to find more accurate
alternative to understand the mechanisms that favor injuries and may thus help in
determining preventive steps.

vi
ESCOLA
POLITCNICA DE
PERNAMBUCO

Sumrio

NDICE DE FIGURAS IX

NDICE DE TABELAS XI

TABELA DE SMBOLOS E SIGLAS XII

1 INTRODUO 13

1.1 Motivao e Problema 13

1.2 Objetivos 14
1.2.1 Objetivo Geral 14
1.2.2 Objetivos Especficos 14

1.3 Estrutura da Monografia 14

2 REVISO BIBLIOGRFICA 16

2.1 Leses na Prtica de Exerccios 16


2.1.1 Definio de Leso e seus Tipos 17
2.1.2 Leses no Atletismo e Fatores que contribuem para o seu surgimento 19

2.2 Redes Neurais Artificiais 21


2.2.1 O Neurnio Biolgico 21
2.2.2 O Neurnio Artificial 22
2.2.3 A Rede MultiLayer Perceptron (MLP) 25

2.3 Critrio de Parada: validao cruzada 28

2.4 Verificao 29

2.5 Seleo de Variveis 29


2.5.1 Algoritmo de Garson e o de Garson Modificado 30
2.5.2 Anlise de Sensibilidades 32

3 METODOLOGIA 34

vii
ESCOLA
POLITCNICA DE
PERNAMBUCO

3.1 Previso e Classificao com Rede Neural MLP 34


3.1.1 Implementao e Configurao da Rede 34
3.1.2 Pr-processamento dos dados 36
3.1.3 Validao do algoritmo da RNA MLP e base utilizada 37

3.2 Seleo de Variveis 38


3.2.1 Experimentos com os algoritmos de Seleo 38

3.3 Estudo da contribuio dos fatores no surgimento de leses em atletas 40

4 RESULTADOS 44

4.1 Resultados da RNA MLP. 44

4.2 Resultados dos algoritmos de seleo de variveis 45


4.2.1 Resultados obtidos com as equaes 45
4.2.2 Resultados com as bases de dados 49

4.3 Resultado da contribuio dos fatores no surgimento de leses em atletas 53

5 CONCLUSO E TRABALHOS FUTUROS 56

REFERNCIAS 59

viii
ESCOLA
POLITCNICA DE
PERNAMBUCO

ndice de Figuras
Figura 1. Ruptura total do ligamento, caracterizando uma entorse de 3 grau. .. 18

Figura 2. Exemplo de leso muscular. ................................................................ 19

Figura 3. Representao de uma clula nervosa e a direo do impulso


nervoso.. 22

Figura 4. Neurnio artificial proposto por McCulloch e Pitts................................ 22

Figura 5. Neurnio artificial com bias.. ................................................................ 24

Figura 6. Rede Perceptron. ................................................................................. 25

Figura 7. Rede MLP com uma camada de entrada, duas intermedirias e uma
de sada .............................................................................................................. 26

Figura 8. Validao cruzada: ponto de parada. .................................................. 28

Figura 9. Grfico da distribuio das classes de vinhos. .................................... 40

Figura 10. Grfico da distribuio dos Atletas nas cinco categorias


pesquisadas. ....................................................................................................... 41

Figura 11. Distribuio dos atletas por faixa etria. Oberva-se maior
quantidade de atletas na faixa dos 16 a 18, e no lado a quantidade de atletas
com mais de 25 anos diminui bastante. .............................................................. 42

Figura 12. Grfico da Quantidade de Atletas X Horas de Treino Dirio. ............... 43

Figura 13. Tempo de prtica de modalidade em anos. ......................................... 43

Figura 14. Grfico da convergncia do treinamento com a base das espcies-


ris. O eixo vertical indica o valor do Erro Mdio Quadrtico (EMQ) para o ciclo
correspondente no eixo horizontal. ..................................................................... 45

ix
ESCOLA
POLITCNICA DE
PERNAMBUCO

Figura 15. Grficos da seleo de variveis para o polinmio multivariado. (a)


Grfico da importncia para cada varivel obtido com os algoritmos de
Garson original e modificado. (b) Grfico dos valores de importncia obtidos
com a anlise de sensibilidades. ......................................................................... 46

Figura 16. Grficos da seleo de variveis para o polinmio de Kolmogorov-


Gabor. (a) Grfico da importncia para cada varivel obtido com os algoritmos
de Garson original e modificado. (b) Grfico dos valores de importncia
obtidos com a anlise de sensibilidades. ............................................................ 48

Figura 17. Grficos da seleo de variveis para a funo com interao


complexa. (a) Grfico da importncia para cada varivel obtido com os
algoritmos de Garson original e modificado. (b) Grfico dos valores de
importncia obtidos com a anlise de sensibilidades. ......................................... 49

Figura 18. Grfico de seleo de variveis para a base de espcies-ris


resultante do algoritmo de Garson. ..................................................................... 50

Figura 19. Grfico de seleo de variveis para a base de espcies-ris


resultante da anlise de sensibilidades. .............................................................. 51

Figura 20. Grfico de seleo de variveis para a base de classes de vinhos


resultante do algoritmo de Garson modificado. ................................................... 52

Figura 21. Grfico de seleo de variveis para a base de classes de vinhos


resultante da anlise de sensibilidades. .............................................................. 53

Figura 22. Grfico da contribio dos fatores no favorecimento de leses em


atletas. 55

x
ESCOLA
POLITCNICA DE
PERNAMBUCO

ndice de Tabelas
Tabela 1. Exemplo de valores para os pesos das conexes de uma rede com
3 entradas, trs neurnios intermedirios e uma sada. ...................................... 30

Tabela 2. Parmetros configurveis para a Execuo da Rede .......................... 34

Tabela 3. Pequena amostra de dados da base das Espcies-ris. Esta base


deve ser normalizada e passar por um processo de binarizao........................ 37

Tabela 4. Atributos da Base de Dados da Elite do Atletismo Brasileiro ............... 41

Tabela 5. Configurao dos parmetros para a obteno do melhor resultado


de classificao das espcies-ris. ...................................................................... 44

Tabela 6. Resultados encontrados pelos algoritmos de seleo de variveis


para a o polinmio multivariado. As linhas com fundo colorido contm as
variveis que fazem parte da equao. ............................................................... 46

Tabela 7. Resultados encontrados pelos algoritmos de seleo de variveis


para o polinmio de Kolmogorov - Gabor. As linhas com fundo colorido
contm as variveis que fazem parte da equao. ............................................. 47

Tabela 8. Resultados encontrados pelos algoritmos de Garson modificado e


de anlise de sensibilidades para a base de espcies-ris. ................................. 50

Tabela 9. Resultados encontrados pelos algoritmos de Garson modificado e


de anlise de sensibilidades para a base de classes de vinhos.......................... 52

Tabela 10. Importncia dos fatores para o surgimento de leses. ........................ 54

Tabela 11. Distribuio da quantidade de atletas lesionados por modalidade. ..... 57

xi
ESCOLA
POLITCNICA DE
PERNAMBUCO

Tabela de Smbolos e Siglas


NAIRS - National Athletic Injury/Illness Reporting System

RNA Rede Neural Artificial

MLP MultiLayer Perceptron

CI Computao Inteligente

LD Leses Desportivas

SAG Sndrome da Adaptao Geral

IC Inteligncia Computacional

ADALINE ADAptative LINear Element

EMQ Erro Mdio Quadrtico

EMA Erro Mdio Absoluto

EPMA Erro Percentual Mdio Absoluto

IMC ndice de Massa Corporal

OMS Organizao Mundial de Sade

xii
ESCOLA
POLITCNICA DE
PERNAMBUCO

1 Introduo

Esse captulo se inicia descrevendo o problema e a motivao do desenvolvimento


deste trabalho. Posteriormente so expostos seus principais objetivos. Por fim, ele
encerrado mostrando o contedo abordado nos captulos seguintes.

1.1 Motivao e Problema


O Sistema de Registro Nacional de Leses Atlticas dos Estados Unidos (NAIRS) define
leso como: acontecimento que limita a participao do atleta por no mnimo um dia
aps sua ocorrncia. Estudos recentes afirmam que as leses trazem como
conseqncia o afastamento de treinos e jogos por um determinado tempo, ocorrendo
assim prejuzos tanto ao atleta como s equipes [1].

A freqncia de leses pode variar de acordo com o tempo de prtica esportiva e


o nmero de horas de treino por semana, sendo consideradas fator principal de
afastamento dos atletas, influenciando seu desempenho e possivelmente seu
psicolgico pela demora ao retorno das prticas esportivas, afetando a equipe como um
todo [2]

De acordo com Pastre et al. [3], h um aumento de leses simultaneamente com


a crescente demanda da prtica de exerccios, tanto recreacionais como competitivos,
gerando preocupaes aos treinadores e atletas, pois interrompem o processo evolutivo
de adaptaes sistemticas impostas pelo treinamento. O mesmo autor ainda cita que
as leses esportivas so resultantes de uma interao de fatores de risco, sendo eles
intrnsecos ou extrnsecos. Os fatores intrnsecos esto relacionados idade, sexo,
condio fsica, desenvolvimento motor, alimentao e fatores psicolgicos. Fatores
extrnsecos se associam especificidade tcnica de cada modalidade, tipo de
equipamento usado, organizao e cargas de treino e competio, condies climticas
ou a combinao destes.

Leite [4] classifica as leses em duas categorias bsicas, sendo elas traumticas
ou por excesso de uso. O mesmo autor ainda descreve trs categorias de mecanismo

13
ESCOLA
POLITCNICA DE
PERNAMBUCO

de leso relacionada com esportes: uso excessivo tambm denominado overtraining,


contato direto e insuficincia de partes moles. Estes mecanismos de leso juntamente
com a causa situacional e fatores de risco devem ser compreendidos por mdicos,
fisioterapeutas e educadores fsicos para preveno, diagnstico e tratamento dos
atletas.

1.2 Objetivos

1.2.1 Objetivo Geral

Obter a contribuio de cada fator no favorecimento de leses em atletas.

1.2.2 Objetivos Especficos

Implementar uma RNA MLP com algoritmo Backpropagation;

Testar o desempenho da rede implementada.

Implementar algoritmos de seleo de variveis que utilizam os pesos e


sensibilidades resultantes do treinamento da rede.

Comparar as tcnicas de seleo.

Escolher a tcnica de seleo que rendeu resultados mais satisfatrios,


para obter a importncia dos atributos da base de dados dos atletas.

1.3 Estrutura da Monografia


O Captulo 2 rene o contedo terico necessrio para se compreender o
trabalho proposto, a saber: leses na prtica de exerccios, RNAs, Critrio de Parada,
Verificao e Seleo de Variveis. Em seguida, o Captulo 3 mostra todas as
abordagens desenvolvidas para atingir o objetivo geral do projeto, tais como o uso de
RNA e de algoritmos de seleo de variveis. Logo depois, o Captulo 4 mostra todos os
resultados obtidos a partir das aplicaes e simulaes das tcnicas desenvolvidas. Por

14
ESCOLA
POLITCNICA DE
PERNAMBUCO

fim, o Captulo 5 resume o trabalho final, rene dificuldades encontradas, discusses


geradas e as concluses obtidas, alm de melhorias e trabalhos futuros.

15
ESCOLA
POLITCNICA DE
PERNAMBUCO

2 Reviso Bibliogrfica

Este captulo descreve todo contedo terico que foi utilizado na tentativa de
resolver o problema descrito no captulo 1. A seo 2.1 aborda alguns conceitos
sobre leses e suas causas. Em seguida, a seo 2.2 discorre sobre RNAs, uma
tcnica de CI que vem mostrando ser uma alternativa mais precisa na predio e
classificao em problemas do mundo real (problemas no lineares). J a seo 2.3
fala sobre validao cruzada, que uma tcnica usada como critrio de parada da
rede. Na seo 2.4 so apresentadas algumas mtricas para avaliar o desempenho
do treinamento da rede. E, por fim, a seo 2.5 traz trs tcnicas de seleo de
variveis, as quais sero o foco deste trabalho.

2.1 Leses na Prtica de Exerccios


Nos ltimos anos, o nmero de praticantes de atividade fsica cresceu vertiginosamente.
Segundo Kettunen et al. [5], o aumento da demanda de exerccios modernos e
competitivos provocou o aumento simultneo no risco de leses, causando
preocupaes tanto para os atletas, quanto para os profissionais responsveis pelo
condicionamento fsico desses, pois interrompem o processo evolutivo de adaptaes
sistemticas impostas pelo treinamento.

As ocorrncias das leses desportivas (LD), possivelmente, so resultado de


exerccios realizados de maneira extenuante e, ainda, inadvertida ou
inapropriadamente, sendo subestimadas a prevalncia e incidncia destes episdios
devido ausncia de notificao em todo o universo esportivo, seja na iniciao das
modalidades ou em altos nveis de performance.

Embora no se conhea com clareza os mecanismos que podem proporcionar as


leses musculares, possivelmente esto relacionadas com as concentraes dos ons
clcio e com a prpria mecnica do movimento. De qualquer forma as leses
musculares esquelticas(alteraes morfofuncionais) so uma constante na vida dos
indivduos que realizam alguma atividade fsica e podem ser mais freqentes naquelas
atividades, onde h um grande nmero de aes excntricas [6].

16
ESCOLA
POLITCNICA DE
PERNAMBUCO

O conhecimento da causa situacional, mecanismo de leso, fatores de risco,


entre outros aspectos, podem auxiliar os profissionais da rea de educao fsica ou
fisioterapia no processo de preveno, diagnstico e tratamento desses agravos,
particularmente no atletismo, caracterizando, portanto, importante contribuio para as
cincias da sade e do esporte.

2.1.1 Definio de Leso e seus Tipos

Uma leso caracterizada pela alterao ou deformidade tecidual, que pode atingir
vrios tipos e nveis de tecidos.

No caso da populao atltica, as leses envolvem mais comumente o sistema


muscoesqueltico e, mais raramente o sistema nervoso. As leses primrias so quase
sempre descritas na medicina esportiva como sendo de natureza crnica ou aguda,
resultantes de foras macrotraumticas ou microtraumticas. As leses microtraumtias
ocorrem em decorrncia do trauma agudo e produzem dor e incapacidade imediatas. As
leses macrotraumticas incluem fraturas, luxaes, subluxaes, entorses, distenses
e contuses. As leses microtraumticas so geralmente denominadas leses por
excesso de uso, ou overuse, e so resultantes da sobrecarga repetitiva ou de uma
mecnica gestual motora incorreta, relacionada ao treinamento contnuo ou
competio. As leses microtraumticas incluem tendinite, tenossinovite, bursite, etc [7].

Os tipos de leses so classificados de acordo com o tecido a qual elas atingem,


podendo, portanto, ser ligamentares, sseas, musculares ou articulares.

As leses ligamentares so comumente relacionadas entorse ligamentar. Uma


entorse envolve dano a um ligamento que fornece suporte a uma articulao. O
ligamento uma faixa de tecido rgido, relativamente inelstico, que liga um osso a
outro.

Se estresses forem aplicados a uma articulao que forcem o movimento alm de


seus limites ou planos de movimento normais, provvel que ocorra leso ao
ligamento. A gravidade do dano ao ligamento classificada de diferentes maneiras;
entretanto, o sistema mais comumente usado envolve trs classes (graus) de entorse
ligamentares:

17
ESCOLA
POLITCNICA DE
PERNAMBUCO

Entorse de 1 Grau: Existe algum estiramento ou talvez ruptura das fibras


ligamentares, com pouca ou nenhuma instabilidade articular. Dor branda, pouco
edema e rigidez articular podem ser observados.

Entorse de 2 Grau: Existe certa ruptura e separao das fibras ligamentares e


instabilidade moderada da articulao. Dor de moderada a aguda; edema e rigidez
articular devem ser esperados.

Entorse de 3 Grau: Existe ruptura total do ligamento, manifestada primariamente


por grande instabilidade articular. A figura 1 ilustra um caso de entorse de 3 grau.

Figura 1. Ruptura total do ligamento, caracterizando uma entorse de 3 grau.

As leses sseas so caracterizadas geralmente por fraturas, que so


leses extremamente comuns entre a populao atltica. Podem ser classificadas, de
modo geral, como abertas ou fechadas. A fratura fechada envolve pouco ou nenhum
deslocamento dos ossos e, portanto, pouca ou nenhuma ruptura do tecido mole. A
fratura aberta, por outro lado, envolve deslocamento suficiente das extremidades
fraturadas para que o osso rompa de fato as camadas cutneas e abra caminho para a
pele.

As leses articulares so muito relacionadas a danos cartilagem. A


osteoartrose um distrbio degenerativo do osso e da cartilagem na articulao e em
torno dela.
18
ESCOLA
POLITCNICA DE
PERNAMBUCO

Outros tipos de leses que envolvem as articulaes so a luxao e a


subluxao, que so, respectivamente, o afastamento de duas superfcies articulares,
mantendo-se afastadas no primeiro caso, e voltando a posio inicial no segundo.

Em atletas e praticantes de atividades fsicas regulares, algumas articulaes


podem ser mais suscetveis a uma resposta parecida com a osteoartrose. A proporo
do peso corporal em repouso sobre a articulao, a distenso da unidade
musculotendinosa e qualquer fora externa importante aplicada sobre a articulao so
fatores de predisposio. Uma mecnica articular alterada, causada por frouxido ou
por traumas anteriores, so tambm fatores a serem considerados.

De todos os tipos de leses, as musculares, so as mais freqentes entre


atletas. Na figura 2 temos ilustrado um caso de leso muscular.

Figura 2. Exemplo de leso muscular.

2.1.2 Leses no Atletismo e Fatores que contribuem para o seu surgimento

Dentre as prticas esportivas, o atletismo se destaca pela diversidade de modalidades,


cada qual caracterizada pela presena de condies especficas de treinamento e
presena de elementos bsicos, como correr, saltar, lanar ou arremessar, que so
observados nos demais esportes com suas respectivas adaptaes [8].

Um dos princpios que norteiam o treinamento esportivo a Sndrome da


Adaptao Geral (SAG). A SAG prev que o corpo humano deve apresentar trs formas
de reao ao estresse. A primeira conhecida como fase de alarme e caracteriza-se

19
ESCOLA
POLITCNICA DE
PERNAMBUCO

por uma reao de choque e contrachoque; a segunda, e que interessa para fins de
performance humana, conhecida como fase de resistncia, quando o organismo reage
de tal modo a produzir adaptaes para que possa resistir a novas demandas impostas
pelo estmulo; e a terceira conhecida como fase de exausto, quando h saturao da
capacidade de reagir a determinado estmulo [9].

O problema est na busca de alcanar ou at ultrapassar limites que treinadores


e atletas tanto necessitam, e que por vezes, ultrapassam a fase de adaptao,
resultando em exausto. Embora existam parmetros para controlar os estmulos
aplicados, h grande dificuldade em articular as diferentes formas de manifestao do
estresse de treinamento, as quais podem ser divididas em: bioqumica ou metablica;
fsica ou estrutural e mental ou psicolgica, segundo Sharkey [10].

No caso das leses musculares as causas mais comuns so: excesso de


treinamento; falta de controle nas tenses de exerccios e alongamentos; gestual motor
(tcnica) indevido nos exerccios e alongamentos; carncia de exerccios de
alongamento compensatrios aps os exerccios fsicos; excesso de fora e
insuficincia de flexibilidade, ou fraqueza com muita flexibilidade; excesso de exerccios,
tanto de fora quanto de alongamento, em msculos fracos, particularmente naqueles
que suportam estruturas de apoio; excesso de exerccios de fora isoladamente em
grupos musculares com encurtamento; dispensa de aquecimento antes do treinamento
e retorno ao treinamento antes da cura total de uma leso.

Para a instalao de agravos, entre amplas possibilidades de fatores causais, os


mtodos de treinamento adotados contribuem significativamente para a ocorrncia
desses eventos. Adicionalmente, para se isolar o efeito dos fatores causais referidos,
tambm so identificados entre outros, os quais se dividem em intrnsecos como idade,
sexo ou bitipo, e extrnsecos como clima, piso de prtica esportiva ou evento praticado
[11 - 13].

20
ESCOLA
POLITCNICA DE
PERNAMBUCO

2.2 Redes Neurais Artificiais


uma tcnica utilizada em resoluo de problemas caractersticos da Inteligncia
Computacional (IC), tais como, previso, classificao, reconhecimento de padres e
clusterizao inspirada no funcionamento do crebro humano. As RNAs foram criadas
no para imitar o funcionamento do crebro, mas para ser um modelo de resoluo de
problemas no algortmicos. Assim, devemos entender a unidade funcional bsica
cerebral, o neurnio.

2.2.1 O Neurnio Biolgico

O neurnio constitudo de um corpo celular, dendrito e um axnio. O dendrito uma


estrutura do tipo ramo, com sinapses para a recepo de mensagens eletroqumicas. O
axnio uma projeo longa que leva impulsos a partir do corpo celular [14].

Um impulso nervoso a transmisso de uma alterao eltrica ao longo da


membrana do neurnio a partir do ponto em que ele foi estimulado. A direo normal do
impulso no organismo do corpo celular para o axnio.

Esse impulso nervoso, ou potencial de ao, uma alterao brusca e rpida da


diferena de potencial transmembrana. Normalmente a membrana do neurnio
polarizada em repouso, sendo que o potencial negativo ( -70 mV). O potencial de ao
consiste de uma reduo rpida da negatividade da membrana at 0mV e inverso
deste potencial at valores de cerca de +30mV, seguido de um retorno tambm rpido
at valores um pouco mais negativos que o potencial de repouso de -70mV.

O nvel crtico de despolarizao que deve ser atravessado a fim de desencadear


um potencial de ao chamado limiar. Os potenciais de ao so causados pela
despolarizao da membrana alm do limiar (Lei do Tudo ou Nada).

21
ESCOLA
POLITCNICA DE
PERNAMBUCO

Figura 3. Representao de uma clula nervosa com a indicao da direo do impulso


nervoso.

2.2.2 O Neurnio Artificial

O neurnio artificial um modelo de representao matemtica de um neurnio


biolgico. A primeira proposta de um neurnio artificial foi feita por McCulloch e Pitts em
1943 (Figura 4) [15].

Figura 4. Neurnio artificial proposto por McCulloch e Pitts.

O modelo proposto uma forma bastante simples de representao do neurnio


biolgico, no qual utiliza uma regra de propagao e uma funo de ativao. Neste
modelo a funo de ativao a funo degrau (Equao 2.1), assim a emisso de
sinal tem por base um limiar, analogamente lei do Tudo ou Nada.

22
ESCOLA
POLITCNICA DE
PERNAMBUCO

V
1,net 0
y= (2.1)
0,net < 0

Na Figura 4, x1,x2,...,xn so os valores de entrada do neurnio e w1, w2,...,wn so


os pesos atribudos a cada entrada. Durante a propagao do sinal os valores de cada
entrada so multiplicados pelos respectivos pesos e o somatrio dos produtos obtidos
menos o limiar resulta na entrada lquida (net) (Equao 2.2) utilizado como

parmetro para a funo de ativao f(net), que o valor de sada do neurnio.

n
n
net i = X wij x j @ (2.2)
j=0

, onde n igual quantidade neurnios na camada de entrada e o limiar.

Para os algoritmos de aprendizado mais adequado que a considerao do


limiar seja implcito. Para isso, como alternativa de representao do neurnio, duas
modificaes so feitas:

adiciona-se uma nova entrada de valor fixo x0 = +1;

acrescenta-se um novo peso sinptico w10 = -.

Essas modificaes resultam em uma nova forma de clculo da entrada lquida,


representada pela equao 2.3. A nova entrada com valor fixo igual a 1 chamada bias.
A arquitetura do neurnio tambm muda como mostra a figura 5.

n
net i = X wij x j (2.3)
j=0

O objetivo do neurnio o de que os pesos sejam escolhidos de forma que ao se


entrar com valores, o valor da sada seja o mais prximo possvel do valor desejado.

A juno de vrios neurnios artificiais forma uma Rede Neural.

Em 1958, Frank Rosenblatt props o que o modelo de Redes Neurais mais


simples, onde vrias unidades de processamento esto ligados a uma nica sada,
como (Figura 6). Esta rede, chamada de rede Perceptron, mesmo simples possui

23
ESCOLA
POLITCNICA DE
PERNAMBUCO

capacidade de aprendizado. A rede perceptron tambm utiliza a funo degrau como


funo de ativao.

Figura 5. Neurnio artificial com bias.

Apesar de possuir capacidade de aprendizado, a rede perceptron possui


limitaes:

Por possuir sadas com valores discretos, tem dificuldade em trabalhar com
valores que possuam rudos;

No possui capacidade de classificar dados no-linearmente separveis.

Widrow e Hoff apresentaram um novo modelo de RNA chamada de ADALINE


(ADAptative LINear Element), no qual possibilitou a utilizao de uma funo contnua
na sada da rede.

O processamento do sinal na rede ADALINE ocorre da mesma forma que na rede


Perceptron, porm a diferena est no clculo da sada, pois possvel utilizar vrias
funes de ativao, das quais as mais utilizadas so Linear (equao 2.4), Sigmoidal
Logstica (equao 2.5) e Tangente Hiperblica (equao 2.6).

Tanto a rede perceptron quanto a ADALINE precisam ser treinadas para que os
pesos de seus neurnios sejam ajustados.

24
ESCOLA
POLITCNICA DE
PERNAMBUCO
` a
y = f net = net (2.4)

` a f
ff
f
ff
f1ffffffffffff
f
y = f net = (2.5)
1 + e@ net
net @ net
` eff
f
af
fff@
f
ff
f
feff
f
f ff
f
fff
ffff
y = f net = net @ net (2.6)
e +e

A utilizao de RNAs com apenas duas camadas, uma de entrada e outra de


sada, no era suficiente para resolver alguns tipos de problemas mais complexos. A
introduo de mais uma camada foi necessria, dando origem rede MLP, ou
MultiLayer Perceptron.

Figura 6. Rede Perceptron.

2.2.3 A Rede MultiLayer Perceptron (MLP)

Para se caracterizar como uma rede MLP, esta deve possuir no mnimo trs camadas,
uma de entrada, uma ou mais camadas intermedirias e uma camada de sada (Figura
7).

25
ESCOLA
POLITCNICA DE
PERNAMBUCO

Figura 7. Rede MLP com uma camada de entrada, duas intermedirias e uma de sada.

O treinamento de uma rede MLP bem mais complexo que o de redes sem
camada intermediria. O algoritmo tradicionalmente utilizado para esse fim conhecido
como backpropagation, que tem esse nome pelo fato de que durante o treinamento h a
propagao e retropropagao do sinal. Sendo assim o backpropagation realizado em
duas fases: a fase Forward (propagao do sinal) e a fase Backward (retropropagao
do sinal).

Os valores de entrada lquida dos neurnios da camada intermediria so


utilizados como parmetros pela funo de ativao escolhida para o treinamento
(Equao 2.6).
b c
1
y = f 1 net 1
1 (2.6)

O resultado da funo de ativao para cada neurnio intermedirio ser ento


utilizado para o clculo da entrada lquida dos neurnio da camada de sada, e da
mesma forma que a camada intermediria a funo de ativao calculada para cada
um (Equaes 2.7 e 2.8). Para cada neurnio de sada calcula-se o erro de sada o qual
a diferena entre o valor desejado e o valor calculado, como mostra a equao 2.9.

n
net = X wij x j
2
i (2.7)
j=0

26
ESCOLA
POLITCNICA DE
PERNAMBUCO
b c
y 2 = f 1 net12 (2.8)

b c
ei = d i @ yi (2.9)

A fase Backward aquela em que os pesos so ajustados. O ajuste feito


utilizando-se o valor da sensibilidade dos neurnios. Para os neurnios da camada de
sada a sensibilidade calculada pelo produto entre o erro de sada e a derivada da
funo de ativao (Equao 2.10) e para os neurnios da camada escondida, o clculo
realizado utilizando-se a equao 2.11, onde no lugar do erro de sada utiliza-se o
somatrio do produto entre a sensibilidade dos neurnios de sada e seus respectivos
pesos.
b c b c
j = d j @ yi f. net j (2.10)

b c
j = f. net j X jwij (2.11)

A frmula geral que atribui um novo valor a um determinado peso pode ser vista
na Equao 2.12, onde: wij(novo) o novo valor atribudo ao i-simo peso do neurnio

j,wij(antigo) o valor corrente do i-simo peso do neurnio j , a taxa de aprendizado,

xi o sinal de entrada do i- simo neurnio, a taxa de momentum.

` a b c b c
wij novo = wij antigo + d o @ yo x j yi y. i (2.12)

A taxa de aprendizado () uma constante de proporcionalidade. Quanto maior


for essa constante, maior ser a mudana nos pesos, aumentando a velocidade do
aprendizado, o que pode levar a uma oscilao do modelo na superfcie de erro. Seus
valores devem estar no intervalo [0,1].

O momentum () a constante que determina o efeito das mudanas passadas


dos pesos na direo atual do movimento no espao de pesos. Este valor foi adicionado

27
ESCOLA
POLITCNICA DE
PERNAMBUCO

de forma emprica e tem por objetivo ajudar o algoritmo backpropagation a escapar de


mnimos locais sem ter que se aumentar a taxa de aprendizagem.

2.3 Critrio de Parada: validao cruzada


Para que a rede no seja treinada de forma exaustiva, necessria a aplicao de
algum critrio de parada. Na grande maioria dos casos a tcnica de validao cruzada
resulta em treinamentos satisfatrios.

Durante a fase de validao, a qual ocorre a cada final de ciclo de treinamento,


parte da base que foi dividida (25%) na fase de pr-processamento utilizada para o
teste de parada. Como o conjunto de validao cruzada nunca utilizado para corrigir
os pesos, eles so sempre inditos para a rede. Dessa maneira, enquanto o erro de
validao cruzada estiver diminuindo, a rede continua generalizando.

A partir do momento que o erro de validao cruzada comea a aumentar


seguidamente, mesmo que simultaneamente o erro de treinamento diminua, a rede
pode ter deixado de aprender e passou a decorar os padres de treinamento. Neste
momento o treinamento deve ser parado (Figura 8). Posteriormente, a rede submetida
ao conjunto de teste ou verificao que ser abordado na seo 2.4.

Figura 8. Validao cruzada: ponto de parada.

28
ESCOLA
POLITCNICA DE
PERNAMBUCO

2.4 Verificao
A fase de verificao tem a funo de indicar se o treinamento da rede foi satisfatrio,
ou seja, para avaliar o desempenho do modelo ajustado.

Diversas mtricas podem ser utilizadas para avaliao do desempenho de uma


rede. A escolha de cada uma delas depende do problema que est sendo abordado.

Para problemas de classificao mais comumente usada a taxa de acerto, que


a quantidade de acertos obtidos dividido pelo total de registros que esto sendo
usados na verificao.

Em problemas de previso, vrias outras mtricas podem ser utilizadas como o


Erro Mdio Quadrtico (EMQ), o Erro Mdio Absoluto, o Erro Percentual Mdio Absoluto
(EPMA), entre outros. O clculos do EMQ, EMA e EPMA so apresentados,
respectivamente, pelas equaes 2.13, 2.14 e 2.15, onde : Zp o valor previsto; Zo o
valor obtido pela rede; e N a quantidade de registros do conjunto de verificao.

N
1fffff
f
b c2
EMQ = X Z p@ Zo (2.13)
N p=1

H I
1fffff N L
f
M
EMA = J XL M
LZ p @ Z oMK (2.14)
N p=1

H I
L N M
L XL M
LZ p @ Z oMM
L M
1ffff
f f pf
L f
f
=f
f1f
f
ff
ff
ff
f
ff
ff
f
ff
ff
ff
f
ff
ff
ff
M
EPMA = J K (2.15)
N Zo

2.5 Seleo de Variveis


Em um problema de classificao ou predio, a resoluo desse pode ser dificultada
pela forma de apresentao dos dados. Em alguns casos a quantidade de dados, bem
como a quantidade de atributos existentes pode aumentar significativamente o tempo de

29
ESCOLA
POLITCNICA DE
PERNAMBUCO

treinamento da rede ou at torn-lo invivel. Saber quais atributos so importantes para


o bom treinamento e quais deles so irrelevantes bastante importante para evitar
situaes de alta dimensionalidade.

Para medir a importncia de um dado atributo em um conjunto de dados


podemos calcular a sua contribuio relativa e/ou o perfil de contribuio. Diversos
mtodos j foram propostos e vm sendo utilizados com esse fim como o algoritmo de
Garson [16] em 1991, que posteriormente foi modificado por Goh [17] em 1995 e o
algoritmo de Lek et al. [18] em 1996. Em 2007 Valena e Ludemir [19] propuseram o
mtodo de Anlise das Sensibilidades.

Neste trabalho sero abordados os algoritmos de Garson e o de Goh, alm da


metodologia da Anlise de Sensibilidades.

2.5.1 Algoritmo de Garson e o de Garson Modificado

O algoritmo original proposto por Garson envolve essencialmente o particionamento dos


pesos das conexes entre a camada escondida e a de sada de cada neurnio
intermedirio em componentes associados com cada neurnio de entrada.

Considere uma rede neural com trs neurnios de entrada, trs neurnios
intermedirios e um neurnio de sada. A tabela 1 mostra os pesos correspondentes a
cada conexo da rede.

Tabela 1. Exemplo de valores para os pesos das conexes de uma rede com 3
entradas, trs neurnios intermedirios e uma sada.

Neurnios / Pesos Entrada 1 Entrada 2 Entrada 3 Sada

Escondido 1 -1.67624 3.29022 1.32466 4.57857

Escondido 2 -0.51874 -0.22921 -0.25526 -0.48815

Escondido 3 -1.75691 -1.44702 0.58286 -2.65221

30
ESCOLA
POLITCNICA DE
PERNAMBUCO

O processo de obteno dos valores de importncia de cada atributo ocorre como


segue:

(1) Para cada neurnio intermedirio i, o valor absoluto do peso da conexo entre
este neurnio e um de sada multiplicado pelo valor absoluto do peso da conexo
entre o mesmo neurnio escondido e um neurnio de entrada. Este clculo deve ser
feito para todos os j simos neurnios da camada de entrada. Assim para o dado
exemplo os produtos Pij a seguir so obtidos:

P11 = 1.67624 x 4.57857; P12 = 3.29022 x 4.57857; P13 = 1.32466 x 4.57857

P21 = 0.51874 x 0.48815; P22 = 0.22921 x 0.48815; P23 = 0.25526 x 0.48815

P31 = 1.75691 x 2.65221; P32 = 1.44702 x 2.65221; P33 = 0.58286 x 2.65221

(2) Para cada neurnio escondido, divide-se Pij pela soma de todos os Pij para
cada neurnio de entrada, obtendo Qij. Por exemplo, para o neurnio escondido 1, Q11 =
P11/(P11 + P12 + P13). Assim:

Q11 = 0.26645; Q12 = 0.522994; Q13 = 0.210560

Q21 = 0.517081; Q22 = 0.228478; Q23 = 0.254441

Q31 = 0.645489; Q32 = 0.341388; Q33 = 0.013123

(3) Para cada neurnio de entrada, os valores de Qij so somados obtendo-se Sj.
Como exemplo, S1 = Q11 + Q21 + Q31 + Q41

(4) Dividindo-se cada valor de Sj pela soma de todos os valores de Sj, obtemos a
importncia relativa R para cada varivel. Assim, expressando em porcentagem: R(%)
= (S1x100) /(S1 + S2 + S3 + S4)

O algoritmo de Garson modificado por Goh difere do original por no passar pelo
processo (1) mostrado acima. O clculo dos Qij feito sem os produtos dos pesos. Essa
alterao tem dado resultados muito semelhantes aos do algoritmo original, com a
vantagem de eliminar um passo, tornando a execuo mais simples e rpida.

31
ESCOLA
POLITCNICA DE
PERNAMBUCO

2.5.2 Anlise de Sensibilidades

Por utilizar os valores absolutos dos pesos das conexes, tanto o algoritmo original de
Garson quanto o de Goh no permitem uma anlise da direo das modificaes
ocorridas na varivel de sada quando ocorre alterao nas variveis de entrada.

O mtodo de Anlise de Sensibilidades permite eliminar algumas variveis de


entrada consideradas desnecessrias, alm de se determinar a importncia de cada
uma dessas variveis em relao sada.

Toma-se por base as derivadas parciais da varivel de sada em relao aos


pesos das conexes. Estas derivadas so na verdade as sensibilidades dos neurnios
de sada que foram calculadas no treinamento da rede.

A equao (2.16) representa o clculo da sensibilidade para cada varivel de


entrada, onde: SenjL a sensibilidade para cada varivel j (j = 1,...,Ninp) de entrada
com relao sada para um dado exemplo L, que varia de 1 a N, sendo N o nmero
total de exemplos de treinamento; Nhid a quantidade de neurnios da camada

escondida e Nout o nmero de neurnios da camada de sada; ei o erro para o i-

simo neurnio da camada de sada; wik. so os pesos das conexes entre a camada

de a sada e a camada escondida; wkj so os pesos das conexes entra a camada

escondida e a camada de entrada; f(neti) a derivada da funo de ativao dos

neurnios da camada de sada e f(netk) a derivada da funo de ativao dos


neurnios da camada escondida.

N hid b c N out b c
Sen jL = X wkj f. net k A X wik f. net i A ei (2.16)
k=1 i=1

b c
Na equao 2.17 podemos observar que f. net i A ei a frmula para o clculo

b c N out b c
da sensibilidade i para um neurnio de sada, e que f. net k A X wik f. net i A ei
i=1

resulta na sensibilidade k de um neurnio intermedirio. Assim podemos escrever a


equao 2.17.

32
ESCOLA
POLITCNICA DE
PERNAMBUCO

N hid

Sen jL = X wkj A k (2.17)


k=1

A equao 2.18 utilizada para se calcular a contribuio ou importncia contj(%)


de cada varivel de entrada com relao varivel de sada.

N
X Sen 2jL
` a ff
ffLf
ff
=f
ff
1f
ff
f
ff
ff
ff
f
ff
ff
f
ff
ff
ff
cont j % = N inp N
(2.18)
X X Sen jL
j=1 L=1

Atravs dos resultados obtidos podemos observar duas caractersticas: a primeira


o perfil das variaes da sada para pequenas mudanas em cada varivel de entrada
e a segunda a classificao da contribuio relativa de cada varivel para a sada da
rede.

33
ESCOLA
POLITCNICA DE
PERNAMBUCO

3 Metodologia
Este captulo descreve o processo de desenvolvimento e aplicao das teorias
apresentadas no Captulo 2, em cima do problema que o projeto corrente se props a
resolver. Inicialmente, na Seo 3.1, a implementao e configurao necessria para a
simulao de uma Rede Neural so descritas na sub-seo 3.1.1, enquanto na sub-
seo 3.1.2 abordado o pr-processamento dos dados. A seo 3.2 discorre sobre as
tcnicas de Seleo de Variveis explanadas na seo 2.4. Na seo 3.3 relata as
fases de testes de validao dos algoritmos da RNA MLP e das tcnicas de seleo de
variveis.

A seo 3.4, enfim, mostra a utilizao das tcnicas implementadas e validadas


at ento, no problema de leses em atletas.

3.1 Previso e Classificao com Rede Neural


MLP

3.1.1 Implementao e Configurao da Rede

Para realizar as tarefas de classificao ou previso, as quais foram utilizadas neste


trabalho, foi implementado o algoritmo de uma Rede Neural MLP com Backpropagation
(Seo 2.2.3), sendo a linguagem Java escolhida para tal propsito.

Para a efetiva execuo do treinamento alguns parmetros devem ser


configurados, seja automaticamente, ou manualmente. Abaixo a Tabela 1 informa os
parmetros configurveis do programa, indicando quais so automticos ou manuais.

Tabela 2. Parmetros configurveis para a Execuo da Rede

Inicializados Manualmente Inicializados Automaticamente

Base de Dados. Momentum.

Taxa de Aprendizado. Funo de Ativao.

34
ESCOLA
POLITCNICA DE
PERNAMBUCO

Nmero mnimo e nmero mximo de Nmero de neurnios na camada de


ciclos. entrada e na camada de sada.

Objetivo do uso da rede: classificao ou Pesos dos neurnios.


para predio.

Nmero de Neurnios na camada Nmero de Neurnios na camada


escondida. (apenas uma camada). escondida. (apenas uma camada).

Ao se escolher a base de dados que ser utilizada no treinamento, a quantidade


de neurnios na camada de entrada e de sada so calculados de acordo com a
quantidade de atributos e a quantidade de sadas inseridas no arquivo. Atravs dessas
quantidades, o nmero de neurnios na camada escondida calculado pela equao
3.1.

Nffffout
ff
ff
f +ffffN
f
f f
ff
ff
ff
ff
f
inpff
N hid = (3.1)
2

, onde Nhid o nmero de neurnios da camada escondida; Nout o nmero de


neurnios da camada de entrada e Ninp representa a quantidade de neurnios da
camada de entrada. Caso o nmero de neurnios da camada intermediria seja
considerado insuficiente, a quantidade pode ser configurada manualmente.

Na maioria dos casos uma taxa de aprendizado igual a 0,05 rendia bons
resultados no treinamento.

Os nmeros mnimo e mximo de ciclos servem apenas para controlar o tempo


de treinamento. A determinao desses valores puramente emprica, podendo variar
para cada caso.

A funo de ativao escolhida foi a sigmoidal logstica (Equao 2.4), pois esta
vem se mostrando ser eficiente para a maioria dos casos de classificao e previso
com Redes MLP.

35
ESCOLA
POLITCNICA DE
PERNAMBUCO

Indicar qual o objetivo do uso da rede, podendo ser para classificao ou


previso, serve para indicar qual tipo de teste de verificao ser realizado. Assim, caso
o problema seja de classificao a verificao ser feita pela quantidade de acertos
obtidos nesta fase. Se for um problema de previso ser calculado o erro mdio
quadrtico (EMQ).

Os pesos das conexes so inicializados por uma funo que gera valores
aleatrios.

3.1.2 Pr-processamento dos dados

Ao se escolher o arquivo de dados este tem seus registros divididos de forma aleatria
para serem utilizados nas fases de execuo da rede, seguindo a distribuio de 50%
para a fase de treinamento, 25% para a fase de validao cruzada e os outros 25%
restantes para a fase de verificao.

Em geral os dados de entrada esto em intervalos de variao bastante distintos


de variao de modo que a modelagem da rede ficar prejudicada, pois esta pode
interpretar valores mais altos como de maior importncia [20]. Nesses casos torna-se
necessria a normalizao dos dados para evitar distores. Das diversas tcnicas de
normalizao, a mais usada e que geralmente suficiente, a transformao linear,
cuja frmula est representada na equao (3.2).

` xfff
a f
f @
if
f
ff
ff
f
fxfff
ff
f
ff
minff
f
ff
y = b@a +a (3.2)
x max @ x min

, onde y o valor normalizado; xi o valor original; xmin e xmax so, respectivamente, o


valor mnimo e o valor mximo do conjunto de dados para determinado atributo; a o
limite inferior e b o limite superior.

Esta normalizao faz com que todos os atributos fiquem com valores no
intervalo da funo de ativao.

Para os experimentos deste trabalho foram utilizados como limite inferior e


superior, respectivamente, 0.1 e 0.9. Estes valores so estabelecidos de forma a se
evitar saturao da rede (valores muito prximo a zero ou um).

36
ESCOLA
POLITCNICA DE
PERNAMBUCO

Alm do problema da variabilidade dos dados, os diferentes tipos de dados


devem ser tratados. No caso de existirem dados nominais, a tcnica mais comumente
utilizada a da binarizao, que consiste em atribuir nmeros binrios aos valores
nominais.

A tabela 3 mostra um exemplo para o conjunto de dados da base das espcies-


ris. Como se v h atributos com diferentes intervalos de variao, alm de um dos
atributos ser nominal.

Tabela 3. Pequena amostra de dados da base das Espcies-ris. Esta base deve ser
normalizada e passar por um processo de binarizao.

Sepal Length Sepal Width Petal Length Petal Width Classe


5.1 3.5 1.4 0.2 Iris-setosa
4.9 3.0 1.4 0.2 Iris-setosa
4.6 3.4 1.4 0.3 Iris-setosa
5.0 3.4 1.5 0.2 Iris-setosa
5.6 2.7 4.2 1.3 Iris-versicolor
5.7 3.0 4.2 1.2 Iris-versicolor
5.7 2.9 4.2 1.3 Iris-versicolor
6.2 2.9 4.3 1.3 Iris-versicolor
6.3 3.3 6.0 2.5 Iris-virginica
5.8 2.7 5.1 1.9 Iris-virginica
7.1 3.0 5.9 2.1 Iris-virginica
6.3 2.9 5.6 1.8 Iris-virginica
4.9 2.5 4.5 1.7 Iris-virginica

Ao trmino da execuo, os pesos e as sensibilidades obtidos na fase


treinamento so gravados em dois arquivos distintos, os quais sero utilizados pelo
mdulo de seleo de variveis.

3.1.3 Validao do algoritmo da RNA MLP e base utilizada

Para testar o algoritmo de Rede MLP com Backpropagation foi utilizada a base de
dados das espcies ris, obtida no repositrio da UCI Machine Learning [21], a qual foi
escolhida por j se ter um conhecimento prvio das caractersticas dessa base.

A base de Espcies-ris composta por 150 registros. Cada registro tem 4


atributos: sepal length, sepal width, petal length e petal width e uma classe que pode ser
ris-setosa, ris-virgnica ou ris-versicolor. A distribuio de 50 registros pertencentes a
37
ESCOLA
POLITCNICA DE
PERNAMBUCO

cada classe. Para que o algoritmo seja considerado com funcionamento adequado
espera-se que a taxa de acerto aps o treinamento seja de no mnimo 97%, sendo esse
o valor obtido pelo algoritmo de Redes Neurais do software Weka [22].

3.2 Seleo de Variveis


Aps a execuo satisfatria do treinamento da rede, podemos dar incio fase de
seleo das variveis.

Os algoritmos aqui abordados foram o de Garson original, o de Garson


Modificado (Goh) e o da Anlise de Sensibilidades.

O algoritmo de Garson original e o de Garson Modificado utilizam os pesos que


foram gravados na fase de treinamento da rede. J o algoritmo de Anlise de
Sensibilidades utiliza tanto os pesos, como tambm as sensibilidades.

Para proceder com a seleo de variveis seguindo um dos trs mtodos


abordados na seo 2.5, o algoritmo captura os valores dos pesos e/ou das
sensibilidades resultantes da fase de treinamento e que foram gravados em arquivos
separados. Os devidos clculos so feitos e os valores das contribuies/importncias
para cada atributo exibido.

3.2.1 Experimentos com os algoritmos de Seleo

Cada algoritmo de seleo foi submetido a testes. Nesta fase espera-se encontrar o
algoritmo que possa dar melhores resultados de seleo. Os experimentos foram
realizados utilizando-se, primeiramente, equaes e, logo aps, duas bases de dados
obtidas no site da UCI Machine Learning.

Utilizando Equaes.

Para testar os algoritmos de seleo foram utilizados o polinmio multivariado, o


polinmio de Kolmogorov Gabor (equao 3.4) e a funo com interao complexa
(equao 3.5).
` a
f x1 ,x 2 ,x 3 ,x 4 ,x 5 = 2 + 3x1 x 2 + 4x 3 x 4 x 5 (3.3)

38
ESCOLA
POLITCNICA DE
PERNAMBUCO

4 2 4 4
x @ 16 x + 5 x
f
f
1fff
ff
ff
ff
ff
ff
ff
ff
f1fff
ff
ff
fx @ 16 + 5 x
f
ff
ff
f1f
ff f
f2f
ff
ff
ff
ff
ff
ff
f2f
f f
ff
ff
ff
ff
ff
ff
2f
ff (3.4)
` a
f x1 , x 2 = +
2 2
h i
f b c2 g b c
(3.5)
` a
f x 1 , x 2 = 1,9 j 1,35 + e x 1 sen o 13 x 1 @ 0,6 e @ x 2 sen o 7 x 4 k

A validao consiste em gerar para cada funo as variveis que fazem parte
desta e variveis que no tm qualquer influncia sobre o resultado da funo. Ou seja,
para o polinmio de Kolmogorov-Gabor, por exemplo, foram gerados 500 valores
aleatrios para as duas variveis pertencentes ao polinmio, calculamos o valor da
funo para cada conjunto de valores e depois geramos outras cinco variveis que no
possuem qualquer influncia sobre o polinmio.

Para as funes em 3.3 e 3.5 foram gerados tambm 500 valores aleatrios para
as duas variveis pertencentes a cada uma destas funes. Procedeu-se o clculo do
valor de cada uma delas para cada conjunto de valores e depois outras variveis no
influentes foram geradas.

Para estar correto, espera-se que o algoritmo de seleo atribua maior


importncia s variveis que determinam o valor da funo e a mnima importncia
possvel para as outras variveis.

Base de Dados das Espcies-ris e de Vinhos

A mesma base utilizada na sub-seo anterior serviu para a validao dos


algoritmos de seleo, e alm dela foi utilizada a base de classificao de vinhos
tambm obtida no repositrio da UCI Machine Learning.

A base de classificao de vinhos contm dados da anlise qumica de alguns


tipos da bebida os quais so classificados em trs classes. Os atributos so de um total
de 13: Malic_acid, Flavonoids, Nonflavonoid_phenols, Ash, Proline, Alcalinity_of_ash,
Magnesium, Alcohol, Total_phenols, OD, Proanthocyanins, Proanthocyanins e Hue. A
figura 9 contm o grfico da distribuio dos registros de vinhos nas trs classes.

39
ESCOLA
POLITCNICA DE
PERNAMBUCO

Distribuio das Classes de Vinhos

80 71
59
60
Quantidade 48
Classe 1
40 Classe 2
Classe 3
20

0
Classe

Figura 9. Grfico da distribuio das classes de vinhos.

Para cada uma das duas bases foi realizado o treinamento da RNA. Aps essa
fase, cada um dos algoritmos de seleo foi executado. De acordo com os resultados
obtidos, novos treinamentos foram realizados, sendo retirados do conjunto de dados
aqueles atributos que foram considerados menos relevantes pelo algoritmo.

O que se espera do algoritmo de seleo que aps um novo treinamento, com


a nova configurao dos atributos, durante a verificao se obtenha uma taxa de
acertos, no mnimo, prxima ao que se conseguiu utilizando todas as entradas dos
dados.

3.3 Estudo da contribuio dos fatores no


surgimento de leses em atletas
A base de dados que ser utilizada foi resultado da pesquisa de campo realizada por
Pastre. Consiste em 215 registros de atletas da elite brasileira, sendo estes distribudos
em cinco diferentes categorias: velocistas, fundistas, nadador categoria borboleta,
nadador categoria peito e nadador categoria costas. A distribuio entre essas
modalidades exibida na figura 10. Cada registro possui 9 atributos. A tabela 5 exibe os
atributos de cada registro.

40
ESCOLA
POLITCNICA DE
PERNAMBUCO

Nmero de Atletas X Categorias

60
50
Nmero de Atletas 50 44 43 Velocistas
38 40
40 Fundistas
30 Nad. Borb.
20 Nad. Costas

10 Nad. Peito

0
Categoria

Figura 10. Grfico da distribuio dos Atletas nas cinco categorias pesquisadas.

Tabela 4. Atributos da Base de Dados da Elite do Atletismo Brasileiro

Nome do Atributo Descrio

Idade Na base os valores para esse atributo vo de 16 a


34.

Sexo Feminino 1; Masculino - 2

ndice de Massa Corporal - o quociente do peso sobre a altura ao quadrado.


IMC

Peso Peso do atleta em quilos.

Estatura Altura do atleta em metros.

Tempo de prtica Tempo em que o atleta pratica a modalidade, em


anos.

Categoria Modalidade esportiva praticada pelo atleta

Freqncia de Ocorrncia Freqncia da Ocorrncia de Leses durante o


treinamento

Horas Horas de treino por dia

Leso Refere-se existncia de leso. (1 ou 0)

41
ESCOLA
POLITCNICA DE
PERNAMBUCO

Dos 215 atletas podemos observar algumas caractersticas:

 80 so do sexo feminino e 135 do sexo masculino;

 tm idades esto entre 16 e 34 anos;

 a mdia de tempo de prtica da modalidade em anos de 13 anos.

 a mdia de horas de prtica por dia de 2,77 horas;

 16 atletas tm IMC > 25, o que de acordo com a Organizao Mundial de


Sade (OMS) indica sobrepeso [24].

As figuras 11, 12 e 13 ilustram, respectivamente a distribuio de atletas por


faixas etrias, por tempo de treino dirio em horas, e por tempo de prtica do esporte
em anos.

Figura 11. Distribuio dos atletas por faixa etria. Observa-se maior quantidade de atletas na
faixa dos 16 a 18, enquanto que a quantidade de atletas com mais de 25 anos diminui
bastante.

42
ESCOLA
POLITCNICA DE
PERNAMBUCO

Figura 12. Grfico da Quantidade de Atletas X Horas de Treino Dirio.

Figura 13. Tempo de prtica de modalidade em anos.

Tendo esses dados em mos, utilizaremos o algoritmo de seleo testado na


seo 3.3 que mostrou o melhores resultados. Aps esta ao, espera-se encontrar os
fatores que so mais relevantes no surgimento de leses em atletas.

43
ESCOLA
POLITCNICA DE
PERNAMBUCO

4 Resultados
Este captulo mostra os resultados obtidos a partir da aplicao da metodologia
explicada no Captulo 3.

4.1 Resultados da RNA MLP.


A avaliao do algoritmo da Rede Neural utilizou duas mtricas, Erro Mdio Quadrtico
para previso e taxa de acertos para classificao (seo 2.4).

Como explanado na seo 3.1, a base utilizada para este teste foi a base das
espcies-ris.

Durante os testes os valores da taxa de aprendizado e as quantidades mnima e


mxima de ciclos foram alterados. Aps diversas tentativas a rede convergiu de forma a
encontrar como o melhor resultado 98,5% de acerto durante a verificao. A
configurao dos parmetros que resultou nesta taxa a que est na tabela 5. A figura
14 mostra o grfico de convergncia do treinamento. O fim do treinamento aconteceu no
ciclo 209.

Tabela 5. Configurao dos parmetros para a obteno do melhor resultado de classificao


das espcies-ris.

Taxa de Aprendizado 0.05

N Mnimo de ciclos 200

N Mximo de ciclos 900

Quantidade de Neurnios na camada escondida 3 (ajustado manualmente)

Objetivo de uso da Rede Classificao

44
ESCOLA
POLITCNICA DE
PERNAMBUCO

Figura 14. Grfico da convergncia do treinamento com a base das espcies-ris. O


eixo vertical indica o valor do Erro Mdio Quadrtico (EMQ) para o ciclo correspondente no eixo
horizontal.

Com o resultado obtido, o algoritmo da RNA MLP foi considerado satisfatrio.


Assim, foi possvel prosseguir com os experimentos utilizando a rede implementada.

4.2 Resultados dos algoritmos de seleo de


variveis
Nesta fase so mostrados os resultados encontrados utilizando os algoritmos de
seleo de variveis explanados no captulo 3.

4.2.1 Resultados obtidos com as equaes

O Polinmio Multivariado

Para este caso o melhor resultado de treinamento foi encontrado com uma taxa
de aprendizagem de 0.05, mnimo de 300 e mximo de 900 ciclos. Foram utilizados 5

45
ESCOLA
POLITCNICA DE
PERNAMBUCO

neurnios na camada escondida, quantidade obtida atravs da equao 3.1. O EMQ


resultante foi de 0.00426.

Os valores de importncia relativa atribudos por cada algoritmo s entradas da


rede so exibidos na tabela 6. possvel observar que o resultado para os algoritmos
de Garson original e modificado so idnticos. Assim, o grfico da figura 15a representa
os dados para esses dois algoritmos de Garson, enquanto que o grfico na figura 15b
formado partir dos valores encontrados pela anlise de sensibilidades.

Tabela 6. Resultados encontrados pelos algoritmos de seleo de variveis para a o polinmio


multivariado. As linhas com fundo cinza contm as variveis que fazem parte da equao.

Importncia Relativa(%)
Garson Garson Anlise de
Varivel Original Modificado Sensibilidades
x1 16,71 16,71 35,69
x2 16,51 16,51 30,65
x3 12,83 12,83 12,14
x4 11,21 11,21 9,96
x5 11,48 11,48 10,93
x6 6,68 6,68 0,0041
x7 6,91 6,91 0
x8 7,38 7,38 0,545
x9 6,64 6,64 0,03
x10 3,61 3,61 0,04

(a) (b)

20
40
Importncia
Relativa(%)

15
R e la t iv a ( % )
Im p o rt n c ia

30
10
20
5 10
0 0
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
Variveis
Variveis

Figura 15. Grficos da seleo de variveis para o polinmio multivariado. (a) Grfico
da importncia para cada varivel obtido com os algoritmos de Garson original e modificado. (b)
Grfico dos valores de importncia obtidos com a anlise de sensibilidades.

46
ESCOLA
POLITCNICA DE
PERNAMBUCO

Os dados mostram que todos os algoritmos atriburam maior importncia aos


atributos que realmente fazem parte da equao, sendo que a anlise de sensibilidades
conseguiu melhor distino entre as variveis contidas na equao e as no contidas.

Polinmio de Kolmogorov Gabor

O treinamento envolvendo o polinmio de Kolmogorov Gabor teve como melhor


resultado EMQ igual a 0.00498, conseguido com a seguinte configurao: taxa de
aprendizado igual a 0.05; mnimo de 350 ciclos e mximo de 900 ciclos; 5 neurnios na
camada escondida, configurados manualmente.

A tabela 7 mostra os valores de importncia obtidos por cada algoritmo de


seleo. Novamente observa-se que os valores obtidos pelo algoritmo original de
Garson so idnticos aos encontrados pelo algoritmo modificado, valores os quais so
ilustrados pelo grfico da figura 16a. Na figura 16b temos o grfico dos valores obtidos
pela anlise de sensibilidades.

Tabela 7. Resultados encontrados pelos algoritmos de seleo de variveis para o polinmio


de Kolmogorov - Gabor. As linhas com fundo cinza contm as variveis que fazem parte da
equao.

Importncia Relativa(%)
Garson Garson Anlise de
Variveis Original Modificado Sensibilidades
x1 48,04 48,04 84,86
x2 44,31 44,31 16,00
x3 5,51 5,51 0,00005
x4 2,15 2,15 0,135

47
ESCOLA
POLITCNICA DE
PERNAMBUCO

(a) (b)

60 90
Importncia Relativa(%)

Importncia Relativa(%)
80
50
70
40 60
50
30
40
20 30
20
10
10
0 0
1 2 3 4 1 2 3 4
Varivel Varivel

Figura 16. Grficos da seleo de variveis para o polinmio de Kolmogorov-Gabor.


(a) Grfico da importncia para cada varivel obtido com os algoritmos de Garson original e
modificado. (b) Grfico dos valores de importncia obtidos com a anlise de sensibilidades.

Os trs algoritmos atriburam maior importncia s variveis que faziam parte do


polinmio. Enquanto a anlise de sensibilidades atribuiu valores prximos de zero s
variveis que no estavam na equao e atribuiu varivel x1 importncia muito maior
que varivel x2, ambos os algoritmos de Garson encontraram um certo equilbrio entre
x1 e x2.

Funo com interao complexa

Em relao a esta funo, o melhor resultado de treinamento foi um EMQ de 0,


0175, para taxa de aprendizagem igual a 0,06 , mnimo de 450 ciclos e mximo de 900.
Foram utilizados 4 neurnios na camada escondida, quantidade configurada
manualmente. O treinamento foi interrompido na 472 ciclo.

As figuras 17a e 17b ilustram, respectivamente os valores de importncia


atribudos a cada varivel pelos algoritmos de Garson e pela anlise de sensibilidades.

48
ESCOLA
POLITCNICA DE
PERNAMBUCO

(a) (b)

50,00 100,00
40,00 80,00

Im p o r t n c ia
Im p o r t n c ia

R e la tiv a (% )
R e la tiv a (% )

30,00 60,00
20,00 40,00
10,00 20,00
0,00 0,00
1 2 3 4 5 1 2 3 4 5

Varivel Varivel

Figura 17. Grficos da seleo de variveis para a funo com interao complexa.
(a) Grfico da importncia para cada varivel obtido com os algoritmos de Garson original e
modificado. (b) Grfico dos valores de importncia obtidos com a anlise de sensibilidades.

Tambm neste caso, a anlise de sensibilidades distinguiu melhor as variveis


contidas na equao.

4.2.2 Resultados com as bases de dados

Nesta seo so apresentados os resultados conseguidos com as bases de dados das


espcies-ris e das classes de vinhos.

Como os resultados obtidos pelo algoritmo de Garson original e o modificado


foram idnticos para as equaes da subseo 4.2.1, os experimentos seguintes foram
realizados apenas com o algoritmo de Garson modificado e com o algoritmo de anlise
de sensibilidades.

Base das Espcies-ris

Na seo 4.1 foi visto que o melhor resultado de treinamento para esta base foi
de 98,5%.

Os resultados obtidos com o algoritmo de Garson modificado e com a anlise de


sensibilidades esto inseridos na tabela 8.

49
ESCOLA
POLITCNICA DE
PERNAMBUCO

Ambos os algoritmos encontraram um certo equilbrio na importncia relativa dos


atributos sepalwidth e petallength. Podemos destacar a diferena na importncia
relativa atribuda por cada algoritmo aos atributos sepallength e petalwidth. Enquanto a
anlise de sensibilidades atribuiu importncia 0 ao atributo petalwidth o algoritmo de
Garson atribuiu 36,44%, sendo assim o atributo de maior importncia.

Tabela 8. Resultados encontrados pelos algoritmos de Garson modificado e de anlise de


sensibilidades para a base de espcies-ris.

Importncia Relativa (%)


Anlise de
Atributo Garson modificado sensibilidades
sepallength 7,85 4,35
sepalwidth 29,29 42,05
petallength 26,41 53,59
petalwidth 36,44 0

As figuras 18 e 19 ilustram, respectivamente, os grficos gerados com os


valores de importncia relativa obtidos com o algoritmo de Garson modificado e com
a anlise de sensibilidades.

40
35
Importncia Relativa(%)

30
sepallength
25
sepalwidth
20
petallength
15
petalwidth
10
5
0
Atributos

Figura 18. Grfico de seleo de variveis para a base de espcies-ris resultante do


algoritmo de Garson.

50
ESCOLA
POLITCNICA DE
PERNAMBUCO

60

Importncia Relativa(%)
50

40 sepallength
sepalwidth
30
petallength
20 petalwidth

10

0
Atributos

Figura 19. Grfico de seleo de variveis para a base de espcies-ris resultante da


anlise de sensibilidades.

Para comparar os resultados com os dois mtodos de seleo, procedeu-se ao


treinamento da rede excluindo os atributos de menor valor de importncia para cada
caso. Assim, a RNA MLP foi executada para a base sem o atributo sepallength, sendo
este o atributo com menor valor de importncia obtido pelo algoritmo de Garson. e para
a base sem o petalwidth que o atributo com menor valor de importncia para a anlise
de sensibilidades.

Retirando o atributo petalwidth da base de dados, o melhor resultado obtido foi de


95% de taxa de acerto. A rede foi configurada com taxa de aprendizagem de 0.05; 4
neurnios na camada escondida, ajustados manualmente; mnimo de 350 e mximo de
900 ciclos. O treinamento foi parado no ciclo 364.

O melhor resultado obtido para a base sem o atributo sepallength tambm foi
igual a 95%. A taxa de aprendizagem utilizada foi de 0.05; mnimo de 350 e mximo de
900 ciclos; 4 neurnios na camada escondida. O treinamento foi interrompido no 367
ciclo.

Base das Classes de Vinhos

O melhor resultado de treinamento foi de 89% de taxa de acerto, para uma taxa
de aprendizado de 0.06, mnimo de 400 ciclos e mximo de 900. Foram utilizados 7
neurnios na camada escondida, quantidade resultante a equao 3.1.

51
ESCOLA
POLITCNICA DE
PERNAMBUCO

As tabelas 9 e 10, respectivamente, mostram os valores de importncia


atribudos a cada varivel pelo algoritmo modificado de Garson e pela anlise de
sensibilidades. As figuras 20 e 21 exibem os grficos para estes dados.

Tabela 9. Resultados encontrados pelos algoritmos de Garson modificado e de anlise de


sensibilidades para a base de classes de vinhos.

Importncia Relativa(%)
Garson Anlise de
Atributos Modificado Sensibilidades
Malic_acid 6,97 1,88
Flavonoids 7,90 0,30
Nonflavonoid_phenols 2,93 6,00
Ash 7,19 14,22
Proline 10,72 38,28
Alcalinity_of_ash 6,48 2,41
Magnesium 3,94 0,13
Alcohol 10,39 25,01
Total_phenols 6,37 0,24
OD 10,82 0,37
Proanthocyanins 5,63 3,13
Color_Intensity 11,29 7,99
Hue 9,37 0

Malic_acid
12,00
Flavanoids
10,00 Nonflavanoid_phenols
Importncia Relativa(%)

Ash
8,00 Proline
Alcalinity_of_ash
6,00
Magnesium
4,00 Alcohol
Total_phenols
2,00
OD

0,00 Proanthocyanins
Color_intensity
Atibutos
Hue

Figura 20. Grfico de seleo de variveis para a base de classes de vinhos


resultante do algoritmo de Garson modificado.

52
ESCOLA
POLITCNICA DE
PERNAMBUCO

Malic_acid
45
Flavanoids
40
Nonflavanoid_phenols
Importncia Relativa(%) 35 Ash
30 Proline
25 Alcalinity_of_ash
20 Magnesium
15 Alcohol
10 Total_phenols
5 OD

0 Proanthocyanins
Color_intensity
Atributos
Hue

Figura 21. Grfico de seleo de variveis para a base de classes de vinhos


resultante da anlise de sensibilidades.

possvel notar que o algoritmo de Garson no descartou qualquer atributo,


tendo apenas dois deles importncia menor que 6%. J na anlise de sensibilidades 4
atributos tiveram importncias prximas de zero.

4.3 Resultado da contribuio dos fatores no


surgimento de leses em atletas
Depois de uma anlise sobre os resultados obtidos com os algoritmos de seleo aqui
apresentados, ficou decidida a utilizao do mtodo de anlise de sensibilidades, por
dois motivos:

1. possvel fazer uma anlise na direo das modificaes ocorridas na varivel


de sada em relao s alteraes nas entradas, pois no so utilizados os
valores absolutos dos pesos das conexes, como fazem os algoritmos de
Garson.

2. Nos testes com as equaes, este algoritmo mostrou ser melhor em destacar as
variveis realmente importantes para cada equao.

Assim, para determinar o valor da contribuio de cada fator apresentado no


favorecimento de leses em atletas, procedeu-se o treinamento com a base de dados
53
ESCOLA
POLITCNICA DE
PERNAMBUCO

referida na seo 3.3 e posteriormente aplicou-se o algoritmo de anlise de


sensibilidades ao resultado do treinamento.

Por ser um problema de certa complexidade, uma base de dados com uma
significativa quantidade de registros seria o ideal para se obter uma taxa de acerto
satisfatria. Porm, para este caso h uma grande dificuldade em se conseguir dados
em boa quantidade e que estejam disponveis para experimentos. Segundo Pastre, as
investigaes sobre leses nos esportes encontram grandes dificuldades devido a
aspectos como critrios de catalogao do conceito de leso, a descrio de sua
incidncia, incluso e descrio dos agravos nos protocolos de estudo, bem como a
diversidade dos grupos de desportistas em cada modalidade. Alm disso, no parece
ser considerada importante a percepo do prprio atleta sobre sua leso, o que de fato
poderia auxiliar em futuros processos de preveno.

Dessa forma, foi necessrio realizar diversos treinamentos, testando vrios


valores para os parmetros. Aps alguns testes, o melhor resultado obtido foi uma taxa
de acerto de 61%. A configurao da rede foi a seguinte: taxa de aprendizagem igual a
0.07; mnimo de 400 ciclos e mximo de 1000 ciclos; quantidade de neurnios da
camada escondida igual a 8, calculado pela equao 3.1.

Os valores de importncia atribudos aos fatores so mostrados na tabela 10. A


figura 21 mostra o grfico formado por estes valores.

Tabela 10. Importncia dos fatores para o surgimento de leses.

Fator Importncia Relativa(%)


Idade 14,42
Sexo 13,3
Peso 4,86
Estatura 10,86
IMC 1,52
T. Prtica 36,34
Modalidade 0,39
Horas 18,33
Freqncia de Ocorr. 0

54
ESCOLA
POLITCNICA DE
PERNAMBUCO

40
35 Idade

Importncia relativa(%)
30 Sexo
Peso
25
Estatura
20
IMC
15
T. Prtica
10
Modalidade
5
Horas
0 Frequncia de Ocorr.
Fatores

Figura 22. Grfico da contribuio dos fatores no favorecimento de leses em atletas.

55
ESCOLA
POLITCNICA DE
PERNAMBUCO

5 Concluso e Trabalhos Futuros


O principal objetivo desta monografia foi utilizar a tcnica de rede neural, associada a
mtodos de seleo de variveis para identificar a contribuio de determinados fatores
no surgimento de leses em atletas. O uso de algoritmos de seleo baseados nos
pesos e sensibilidades resultantes do treinamento de uma rede neural mostra ser uma
alternativa aos mtodos estatsticos tradicionais, comumente utilizados pelos
profissionais da rea de sade, e que apenas capturam caractersticas lineares.

Para tanto, uma RNA MLP treinada com o algoritmo Backpropagation foi
implementada e testada utilizando a base de dados das espcies-ris. Logo aps, trs
algoritmos de seleo foram implementados e testados a fim de se encontrar o que
melhor se adequasse ao problema. Estes foram o algoritmo de Garson, o algoritmo de
Garson Modificado e o algoritmo de anlise de sensibilidades.

Todos os algoritmos de seleo aqui apresentados foram experimentados atravs


da aplicao em equaes e em duas bases de dados. As equaes foram: o polinmio
multivariado, o polinmio de Kolmogorov Gabor e a funo com interao complexa.
As bases de dados foram: a base das espcies-ris e a base de classes de vinhos,
ambas obtidas atravs do site da UCI Machine Learning. Para cada uma das equaes
foram gerados valores aleatrios para as variveis que faziam parte de cada equao e
variveis que no tinham qualquer influncia sobre a mesma. Desse modo para o
algoritmo ser considerado satisfatrio este deve atribuir valores de importncia relativa
maiores para as variveis que fazem parte da equao. Foi observado que os
algoritmos original e modificado de Garson obtinham resultados idnticos, e que a
anlise de sensibilidades fazia uma melhor distino entre as variveis contidas na
equao e as no contidas. Com as bases de dados a anlise de sensibilidades
apresentou melhor poda nos atributos.

Como a anlise de sensibilidades apresentou melhores resultados de seleo,


este algoritmo foi escolhido para se determinar a contribuio de cada fator no
favorecimento de leses em atletas.

56
ESCOLA
POLITCNICA DE
PERNAMBUCO

Dada a complexidade do problema, o ideal seria ter uma base de dados de


tamanho considervel. Porm h uma grande dificuldade em se encontrar dados sobre
leses em atletas que tenham grande quantidade de registros e que estejam disponveis
para estudo. Assim, com a base disponibilizada para este trabalho, o melhor resultado
encontrado foi de 61% de taxa de acerto.

Aplicada a anlise de sensibilidades sobre o resultado do treinamento, alguns


resultados podem ser discutidos. Com os resultados obtidos podemos fazer algumas
observaes:

 Ao fator Freqncia Ocorrida no foi atribudo qualquer valor de


importncia, e o fator Modalidade tambm foi considerado ter pouca
contribuio no surgimento de leses, este fato pode ser explicado atravs
dados da tabela 11, em que a quantidade de atletas lesionados em cada
modalidade so exibidos.

Tabela 11. Distribuio da quantidade de atletas lesionados por modalidade.

Atletas na Atletas lesionados na Percentual de leses por


Modalidade modalidade modalidade modalidade
Velocistas 50 30 60%
Fundistas 37 17 46,4%
Nado Borboleta 43 23 53,48%
Nado Costas 39 24 61,54%
Nado Peito 52 27 51,9%

Observa-se que a quantidade de atletas lesionados est bem distribuda


entre as modalidades, o que nos leva a concluir que para os dados
apresentados as diferentes modalidades no possuem uma grande influncia
sobre lesionamento do atleta.

 O atributo de maior importncia foi o tempo em que o atleta vem


praticando o esporte, seguido do tempo em horas de treino dirio. Tais
resultados fazem sentido, pois segundo Hootman [25] e Hino et al. [26]
medida que se aumenta o tempo de treino, o risco de leses tende a
crescer.

57
ESCOLA
POLITCNICA DE
PERNAMBUCO

 Os fatores Idade e Sexo foram considerados de maior importncia que os


fatores Peso e IMC. Este fato pode ser explicado pelo fato de que por
serem atletas de alta performance, menos de 8% deles apresentou
sobrepeso, tornando estes atributos irrelevantes.

 O atributo Estatura teve maior importncia que Peso e IMC, porm menor
importncia que Sexo e Idade.

Diante do observado, os resultados de seleo dos fatores sobre o lesionamento


de atletas foi considerado satisfatrio.Isto mostra que a seleo de variveis utilizando o
algoritmo de anlise de sensibilidades uma boa alternativa para problemas deste tipo.

A maior dificuldade encontrada para dar incio realizao deste trabalho foi a
obteno dos dados dos atletas. E aps a obteno dos dados, durante os
experimentos, a atividade que mais demandou tempo foi a de implementao, devido a
correes que foram necessrias. Porm com todas as dificuldades, o aprendizado foi
bastante proveitoso.

Durante os testes realizados, vrios parmetros da RNA MLP, como taxa de


aprendizagem, nmero de ciclos e quantidade de neurnios escondidos tiveram de ser
ajustados a fim de se encontrar o melhor resultado. A nvel de pesquisa isto algo
aceitvel, porm no caso de se construir uma ferramenta para usurio final, sendo este
da rea de sade, por exemplo, a tarefa de ajustar tais parmetros torna-se um
problema. Portanto, como trabalho futuro, seria interessante a busca da automao da
arquitetura da rede, de forma que seus parmetros no precisem sofrer interferncia
humana. H tambm a possibilidade de se comparar as tcnicas de seleo aqui
apresentadas com outras tcnicas tradicionais da literatura, as quais no trabalham com
extrao de conhecimento dos pesos da rede.

58
ESCOLA
POLITCNICA DE
PERNAMBUCO

Referncias
[1] SOARES, S. T. M. Relao entre tcnicas e leses em praticantes de jud.
Rev Bras. Med. Esporte, v.12,n.1, Niteri jan./fev. 2006.

[2] Rose, G.; Tadiello F. F.; Rose Jr, D. Leses esportivas: um estudo com
atletas do basquetebol brasileiro. Efdeports. Ano 10, n.94, Buenos Aires, mar.
2006.

[3] Pastre CM, Filho GC, Monteiro HL, Jnior JN, Padovani CR. Leses
desportivas na elite do atletismo brasileiro: estudo a partir de morbidade
referida. Rev Bras Med Esporte. 2005;11:43-7.

[4] Leite, C. B. S.; Neto, F. F. C. Incidncia de leses traumato-ortopdicas no


futebol de campo feminino e sua relao com alteraes posturais. Efdeports.
Ano 9, n.61, Buenos Aires, jun. 2003.

[5] Kettunen J.A., Kujala U.M., Kaprio J., Koskenvuo M., Sarna S. Lower-limb
function among former elite male athletes. Am J Sports Med 2001;29:2-8.

[6] Flegel MJ, Sport first aid. Updated ed. Champaign: Human Kinetics, 1997.

[7] http://www.saudenarede.com.br/?p=av&id=ENTENDENDO_AS_LESOES

[8] Weineck J. Biologia do esporte. 3a ed. So Paulo: Manole, 1991.

[9] Hernandes Jr, BDO. Treinamento desportivo. Rio de Janeiro: Sprint, 2002

[10] Sharkey BJ. Condicionamento fsico e sade. Porto Alegre: Artmed, 1998.

[11] Horta L. Preveno de leses no desporto. Lisboa: Caminho, 1995.

[12] Hollmann W, Hettinger T. Medicina do esporte. So Paulo: Manole, 1992.

[13] Watson AWS. Sports injuries, incidence, causes, prevention. Rev Fisiot USP
1997;4:16-7.

59
ESCOLA
POLITCNICA DE
PERNAMBUCO

[14] Brunner e Sudarth. Tratado de Enfermagem Mdico-Cirrgica, volume 3. Rio


de Janeiro: Guanabara Koogan, 2009

[15] Mcculloch,W. S.; Pitts,W. A logical calulus of the ideas immanent in nervous
activity. Bulletin os Mathematical Biophisics, p. 115 - 133, 1943.

[16] Garson, G.D., 1991. Interpreting neural network connection weights. Artificial
Intelligence Expert 6, 47- 51.

[17] GOH, A.T.C. (1995). Back-propagation neural networks for modeling


complex systems. Artif. Intell. Eng. 9, 143151.

[18] MASTRORILLO, S.; LEK, S.; DAUBA, F.; BELAND, A.(1997). The use
of artificial neural networks to predict the presence of small-bodied fish in a
river. Fresh. Biol. 38, 237246.

[19] M.J.S. Valena, T. B. Ludemir. Explicando a relao entre as variveis de


uma rede neural Iluminando a Caixa Preta. XVII Simpsio Brasileiro de
Recursos Hdricos, So Paulo, Novembro, 2007.

[20] VALENA, Muser. Fundamentos das Redes Neurais: exemplos em Java. 2.


ed. ver. ampl. Olinda: Livro Rpido, 2009. 384 p.

[21] http://archive.ics.uci.edu/ml/datasets/

[22] http://www.cs.waikato.ac.nz/ml/weka/

[23] Pastre et al. Leses desportivas na elite do atletismo brasileiro: estudo a partir
de morbidade referida. Ver Brs Med Esporte 2005;11: 43-47.

[24] http://www.who.int/topics/obesity/es/

[25] Hootman JM, Macera CA, Ainsworth BE, Martin M, Addy CL, Blair SN.
Association among physical activity level, cardiorespiratory fitness, and risk of
musculoskeletal injury. Am J Epidemiol. 2001;154(3):251-8

60
ESCOLA
POLITCNICA DE
PERNAMBUCO

[26] Hino AAF, Reis RS, Rodriguez-Aez CR,R, Fermino RC. Prevalncia de
Leses em corredores de rua e Fatores Associados. Rev Bras Med Esporte
Vol. 15, No 1 Jan/Fev, 2009.

61

Você também pode gostar