Você está na página 1de 12

AnlisedaevasonoensinosuperiornocursodeCincia

daComputaodaUFPB
CarlosAndrSoaresCorreia,EduardoVictor,JairoGustavoG.deO.Arajo,Mateus
Santos,RodrigodeM.Dantas
CentrodeInformticaUniversidadeFederaldaParaba(UFPB)
CEP58051900JooPessoaPBBrasil
{andre.jp.br,eduardovictor.barros,jairogustavo007,
rodrigomdantas4}@gmail.com,{matesantos}@hotmail.com
Abstract. The high rates of student dropout in Computer Science from Universities around the
country and specifically at the Universidade Federal da Paraba, especially in the early stages, is a
fact. This paper aims to conduct a study in order to find the main reason or find a correlation
between its causing factors. For this, knowledge in the area of artificial intelligence applied to a
database were used in this case, the grades transcript of a population selected according to
certain characteristics. In order to run machine learning algorithms, Weka was used, a free open
sourcesoftwarethatcanbeusedfordataminingandtransformingitintousefulinformation.
KeyWords:ArtificialIntelligence,ComputerScience,StudentDropout,MachineLearning,
UFPB,Weka.
Resumo. A grande evaso estudantil no curso de Cincia da Computao das Universidades de
todo o pas e especificamente da Universidade Federal da Paraba, principalmente nos estgios
iniciais, um fato. o presente artigo visa realizar um estudo a fim de encontrar o principal motivo
das evases ou encontrar uma correlao entre os fatores que o acarretam. Para isso, foram
utilizados conhecimentos na rea de inteligncia artificial aplicada a um banco de dados neste
caso, o histrico de notas de uma populao selecionada de acordo com determinadas
caractersticas. Para a execuo de algoritmos de aprendizagem de mquina foi utilizado o Weka,
um software gratuito e de cdigo aberto que pode ser usado para minerar dados e transformlos
eminformaesteis.
PalavrasChave: Inteligncia Artificial, Cincia da Computao, evaso de estudantes,
Aprendizagemdemquina,UFPB,Weka.

1.INTRODUO
Incidindo nas mltiplas espcies de instituies de ensino e afetando o sistema educacional em
sua totalidade, a evaso estudantil se configura enquanto um intricado elemento da educao.
Este fenmeno compreendido como sendo a perda de alunos nos mltiplos nveis de ensino.
Ele acarreta diversas implicaes tanto na esfera social, como na acadmica e igualmente na
econmica. O que fomenta danos ao desenvolvimento humano de todas as naes. Isso o
que afirmam Marlia Costa Morosini, Alam de Oliveira Casartelli, Ana Cristina Benso da Silva,
BettinaSterendosSantos,RafaelEduardoSchmitt,RosanaMariaGessinger[1].
1
Inmeros conceitos de evaso podem ser encontradas em artigos que abordam o tema
na Educao Superior no Brasil, privilegiados em revistas classificadas pela Qualis, Polydoro
(2000) chama a ateno para a distino entre dois conceitos: a evaso do curso que
consiste no abandono do curso sem a sua concluso alm da evaso do sistema que reflete
o abandono do aluno do sistema universitrio. Cardoso (2008) referese aos conceitos acima a
partir de diferentes nomenclaturas: a evaso aparente enquanto a mobilidade do aluno de um
curso para o outro e a evaso real que se refere desistncia pelo aluno do ensino
superior[2].
A grande evaso de estudantes do curso de Cincia da Computao das Universidades
de todo o pas e consequentemente da Universidade Federal da Paraba, principalmente nos
estgios iniciais, um fato. De acordo com dados coletados no site do Instituto Nacional de
Estudos e Pesquisas Educacionais Ansio Teixeira (INEP), um estudo de concluso de curso
1
[1]MOROSINI,M.C.CASARTELLI,A.O.SILVA,A.C.B.SANTOS,B.S.SCHMITT,R.E.GESSINGER,R.M.
AevasonaEducaoSuperiornoBrasil:umaanlisedaproduodeconhecimentonosperidicosQualisentre
20002011.In:JessArriagaGarcadeAndoanyotros.(Org.).ICLABES.PrimeraConferenciaLatinoamericanasobre
elAbandonoenlaEducacinSuperior.1ed.MadriES,2012,v.1,p.1.
[1]MOROSINI,M.C.CASARTELLI,A.O.SILVA,A.C.B.SANTOS,B.S.SCHMITT,R.
E.GESSINGER,R.M.AevasonaEducaoSuperiornoBrasil:umaanlisedaproduode
conhecimentonosperidicosQualisentre20002011.In:JessArriagaGarcadeAndoany
otros.(Org.).ICLABES.PrimeraConferenciaLatinoamericanasobreelAbandonoenlaEducacin
Superior.1ed.MadriES,2012,v.1,p.3.

realizado por um aluno da Universidade Federal do Rio Grande do Sul mostra que entre os anos
de 2002 e 2010, os nmeros da evaso do curso de Cincia da Computao no pas se
mantiveram acima de 50%, chegando marca de 71% no ano de 2009. Dessa forma, se faz
necessrio entender o que provoca a desistncia desses alunos e assim concentrar esforos
nointuitodereverteressequadro.
Partindo desse contexto, o presente artigo visa realizar um estudo a fim de encontrar o
principal motivo das evases ou encontrar uma correlao entre os fatores que o acarretam.
Para isso, foram utilizados conhecimentos na rea de inteligncia artificial aplicada a um banco
de dados neste caso, o histrico de notas de uma populao selecionada de acordo com
determinadas caractersticas. Para a execuo de algoritmos de aprendizagem de mquina foi
utilizado o Weka, um software gratuito e de cdigo aberto que pode ser usado para minerar
dadosetransformloseminformaesteis.

2.DESENVOLVIMENTO
2.1FundamentaoTerica
KDDoprocessonotrivialdeidentificao,apartirdedados,depadresquesejam
vlidos,novos,potencialmenteteisecompreensveis(Fayyad,1996b).

O volume atual de dados gerados por cada ser humano desperta tanto uma demanda
para a transformao destes em informao til quanto para a gerao de ferramentas
computacionais que sejam capazes de lidar com essa quantidade crescente de dados. O ramo
ao qual estas tcnicas de extrao de conhecimento em bancos de dados esto relacionadas
o chamado KDD (Knowledge Discovery in Database) juntamente com a minerao de dados
(DataMining).
O termo KDD referese ao processo global de descobrir conhecimento til de dados. A
minerao de dados, uma das etapas do KDD, pode ser vista como a manipulao e
transformao de grandes quantidades de dados em padres e regras significativos. Seu
objetivo criar um modelo que possa ser capaz de auxiliar a forma como se interpreta aquele
conjunto de dados, sendo este modelo criado a partir do uso da tcnica correta de minerao
de dados. Este componente da KDD depende fortemente de tcnicas conhecidas de
aprendizagem de mquina, reconhecimento de padres, e estatsticas para o descobrimento de
padresnosdados.
Descoberta de conhecimento de dados um processo interativo e iterativo, que
consistenasseguintesetapas:
A primeira desenvolver um entendimento do domnio da aplicao, identificando o
objetivodoprocessodedescobertadeconhecimentodopontodevistadocliente.
Em seguida, criar um conjunto de dados alvo, seja ele a partir da seleo de um
subconjuntodevariveisouamostrasdedados.
A terceira a limpeza e prprocessamento dos dados, que consiste em remover
rudos,decidirqualdecisotomarparaparmetroscomvaloresausentes.
Na quarta etapa se faz a reduo dos dados para descartar atributos invariantes e a
seleodequaisatributossomaisrelevantesparaarepresentaodosdados.
A quinta consiste fazer a correspondncia dos objetivos do processo de KDD com um
mtodo especfico de minerao de dados. Por exemplo, sumarizao, classificao,
regresso,etc.
O prximo passo a escolha do algoritmo de minerao de dados e seleo de um ou
maismtodosparaserusadonadescobertadepadres.
A stima a minerao de dados: descoberta de padres de interesse em uma forma
particularderepresentao.
A oitava etapa consiste em interpretar os padres descobertos, podendo voltar ao incio
doprocessopararealizarmaisumaiterao.
Por fim, na nona etapa devese atuar no conhecimento descoberto, usandoo
diretamente ou fazendo a explanao para as partes interessadas. Nesta etapa tambm se
incluiachecagemesoluodepotenciaisconflitoscomresultadospreviamentealcanados.
Data Mining um passo particular neste processo formado por algoritmos especficos
para extrair padres (modelos) de dados. Os passos adicionais no processo KDD, como
preparao de dados, seleo de dados, limpeza de dados, incorporao de conhecimento
anterior apropriado, e interpretao formal dos resultados de minerao asseguram a
viabilidade da extrao de conhecimento til que derivado dos dados. Uma aplicao
imprudente de mtodos de data mining pode ser uma atividade perigosa que conduza a
descobertadepadresincorretosousemsentido(AGRAWAL,1996).

2.2Metodologia
Os dados para este trabalho foram obtidos atravs da Superintendncia de Tecnologia da
Informao (STI) da Universidade Federal da Paraba (UFPB) em formato de arquivo do tipo
texto, conhecido como txt. De posse desse arquivo, estes dados foram importados para o
banco de dados PostgreSQL a fim de possibilitar a realizao de consultas atravs de
comandos da linguagem Structered Query Language (SQL) que os bancos de dados
relacionais utilizam. Atravs da linguagem SQL, foram excludos dados de alunos que tinham o
Coeficiente de Rendimento Escolar (CRE) igual a zero e todas as disciplinas do primeiro
perodotambmiguaisazero.
O motivo de se fazer esta limpeza se deve ao fato de o sistema de cadastros de alunos
da UFPB operar de um modo muito peculiar: o aluno ao ser aprovado para esta Universidade
automaticamente recebe um nmero de matrcula e automaticamente j est matriculado em
todas as disciplinas do primeiro perodo para o curso que ingressou. Mas acontece que muitos
desses alunos nem sempre realizam a matrcula institucional, diversas vezes por terem sido
aprovados em outra instituio de ensino na qual optam cursar a graduao. Desse modo, no
tendo o discente efetuado a matrcula institucional, fica reprovado em todas as disciplinas do
primeiroperodoeoCREficacomovalorzero.
Os dados solicitados STI comtemplavam os alunos da UFPB que cursaram ou
cursam o bacharelado em Cincia da Computao entre os anos de 2006 e 2013. Todos estes
alunos fazem parte do mesmo currculo do referido curso. Para concluir o curso, eles precisam
estar aprovados nas disciplinas de Banco de Dados, Redes de Computadores e Engenharia de
Software para poderem realizar o estgio curricular obrigatrio alm disso, precisam tambm
realizar um Trabalho de Concluso de Curso (TCC) atravs de uma disciplina homnima e
assim encerrar as suas atividades acadmicas na graduao. Os alunos formados tinham as
disciplinas do primeiro perodo com notas maior ou iguais a cinco, que a nota mnima para ser
aprovado em uma disciplina na UFPB. Tinham ainda as disciplinas que eram prrequisito para
oestgioeadisciplinadoTCCaprovadascomomesmocritriodenotas.
Para os alunos que ainda esto cursando foi observado em que ano e perodo eles
ingressaram, a fim de avaliar at que ponto da grade curricular do curso eles tinham avanado.
Tambm foi observado se estes alunos estavam com a matrcula ativa ou se eram desistentes
com o intuito de melhor avaliar se o aluno conseguiria concluir o curso ou no. De posse
desses critrios de avaliao, o arquivo AttributeRelation File Format (ARFF), que um arquivo
texto, foi montado manualmente. Como os mtodos de aprendizagem de mquina utilizados
seriam supervisionados, criamos o resultado 0 (zero) para os alunos que no terminariam o
cursoeoresultado1(um)paraaquelesqueconcluiriam.
Desse modo, montouse o arquivo ARFF a ser utilizado pelo WEKA com as disciplinas
Introduo Programao, Clculo Diferencial e Integral I, Clculo Vetorial e Geometria
Analtica, Fsica Aplicada a Computao I, Banco de Dados, Redes de Computadores,
Engenharia de Software e Trabalho de Concluso de Curso, o CRE do aluno e o resultado zero
ouumemcadaregistrodoalunoporsetratardeummtodosupervisionado.
O objetivo inicial era classificar os alunos a partir das notas apenas das disciplinas que
so informalmente consideradas como principais do primeiro perodo do curso de Cincia da
Computao: Introduo Programao, Clculo Vetorial e Geometria Analtica, Clculo
Diferencial e Integral I e Fsica Aplicada a Computao I. Aps uma anlise dos resultados
obtidos aps esse estudo inicial, chegouse concluso que seria importante estudar a
correlao de outros atributos de entrada, sendo escolhidas as notas de disciplinas de
diferentes reas da tecnologia da informao, de modo que foi adicionadas as notas das
disciplinasdeBancodeDados,EngenhariadeSoftwareeRedesdeComputadores.
ForamutilizadososseguintesclassificadoresdoWEKA:
Random Forest: (ou florestas aleatrias) um mtodo de aprendizagem de mquina
para classificao (e regresso) que atuam atravs da construo de um grande
nmero de rvores de deciso em tempo de treinamento e produzem a classe que o
mododasadaporrvoresindividuais.
Naive Bayes: Categoriza textos, com o intuito de resolver o problema de julgar dados
como pertencente a uma ou outra categoria. Com o prprocessamento adequado,
competitiva neste domnio com os mtodos mais avanados, incluindo mquinas de
vetordesuporte.
SMO: (ou mquina de vetor de suporte) so capazes de resolver problemas de
classificao e regresso, tendo como base o aprendizado adquirido na etapa de
treinamento. um classificador que funciona corretamente com dados desconhecidos,
ou seja, exemplos que no foram aplicados na fase de treinamento, tornando o modelo
capazdepredizersadasfuturas.
Multilayer Perceptron: (ou Rede Neural) um modelo que mapeia grupos de dados de
entrada para um conjunto de sadas apropriadas. composto por vrias camadas de
ns em um grafo direcionado, com cada camada totalmente ligada prxima. Exceto
para os ns de entrada. Cada n representa um neurnio, ou elemento de
processamento, com uma funo de ativao nolinear. A Rede Neural utiliza uma
tcnica de aprendizagem supervisionada chamada retropropagao que serve para
treinararede.
KNN: (ou Algoritmo do Vizinho Mais Prximo) utiliza a ocorrncia mais prxima, para
classificar uma instncia, onde podese escolher um ou mais indivduos a fim de
melhorar o resultado final, sendo que essa quantidade de indivduos, deve ser mpar
paraquenohajaconflitosnoinstantequeainstnciaestiversendoclassificada.

3.ResultadoseDiscusses
Ao analisar os dados apenas das disciplinas de primeiro perodo, levando em considerao
apenas as aprovaes (notas maiores ou iguais a 5), foi possvel observar que a classificao
no tem uma taxa de acertos satisfatria (ver tabela 1). Isso se deve ao fato que mesmo entre
os alunos que foram aprovados com a nota mnima, em cada disciplina, no mnimo 65%
terminaram o curso. Para os alunos que registraram notas melhores (acima de 7) nessas
disciplinas iniciais, 78% concluram o curso ou foram classificados como alunos que concluiro
ocurso.
Esses nmeros ilustram que as justificativas e motivaes para a evaso dos alunos
podem ser as mais variadas, no se limitando apenas a notas ruins ou falta de capacidade dos
alunos, j que o nmero de alunos que abandona o curso apesar de conseguir boas notas
nessas disciplinas ainda considervel. Inclusive, na disciplina de Introduo Programao,
onde 20% dos alunos ficaram com mdia 10 na disciplina que introduz os conceitos abordados
mais frequentemente ao longo da carreira do estudante, comparada s outras disciplinas do
primeiroperodo,optampornocontinuarnocurso.

Classificador TaxadeAcerto
KNN(K=5) 66,66%
NaiveBayes 65,76%
SMO 68,91%
MultilayerPerceptron 75,22%
RandomForest 47,29%
Tabela1:Taxadeacertosdaclassificaousando
comoentradanotasdasdisciplinasdoprimeiro
perodo.

Em contrapartida, ao analisarmos os dados junto a disciplinas mais prximas ao final


do curso, verificamos que a classificao tem um resultado muito bom, haja vista que de
acordo com testes, 90,5% das pessoas que cursaram estas disciplinas, conseguiram concluir
o curso (ver tabela 2). Esse fato constatado, porque so contedos finais do curso, onde a
grandemaioria,jtemumamaturidademaiornoquedizrespeitocarreiraprofissional.

Classificador TaxadeAcerto
KNN 68,91%
NaiveBayes 87,38%
SMO 91,44%
MultilayerPerceptron 91,44%
RandomForest 89,63%
Tabela2:Resultadodaclassificaocomentrada
asnotasdasdisciplinasdoprimeiroperodoe
prrequisitosdotrabalhodeconclusodecurso.

Sendo assim, conseguimos visualizar que a grande evaso no curso de cincia da


computao da UFPB, se d em sua maioria no incio do curso, e, atentando aos resultados,
possvel levantar questes sobre os motivos que levam essa fuga, uma hiptese bastante
vivel, so as notas baixas que muitas vezes no passam de mera consequncia do momento
complicado que esses alunos vivem nos primeiros perodos da vida universitria. O que nos
leva importncia da interveno da Universidade enquanto agente responsvel pela educao
e formao de profissionais e cidados, aes essas que configuram a funo social da
instituio.
Em alguns casos, o baixo desempenho no incio da carreira acadmica pode ser reflexo
de uma m formao no ensino mdio, principalmente de alunos vindos de escola pblicas, que
no tm um bom nvel de ensino em especial as disciplinas da rea de exatas, que so a base
para o curso de Computao as notas baixas nos primeiros perodos so o reflexo da formao
acadmicaqueoalunoobtevenoensinomdio.
Por outro lado, a cobrana dos pais para ingresso dos filhos no ensino superior e
tambm durante o mesmo, acaba pressionando o aluno, que muitas vezes no tem certeza
sobre o seu futuro e acaba escolhendo cursos fceis de ingressar ou se formar, o que
tambm pode ser considerado causa dessa evaso. Temos ainda, aqueles estudantes que so
forados a sarem de suas casas muito cedo, a fim de uma formao superior e acabam
sentindo o peso de morar sozinhos, tendo que ser responsveis por si prprios, mesmo com
pouca idade, essas e outras mudanas bruscas no modo como eles vivem, acabam gerando
consequnciasnegativasnavidadoestudante,sendoumadelasnodesempenho.

4.CONCLUSO
Com os resultados apresentados acima, possvel notar dentre os vrios alunos que obtiveram
baixo rendimento nos primeiros perodos da faculdade, acabaram por renunciar a vaga no
ensino superior, contribuindo com as estatsticas negativas a respeito da desistncia,
principalmente precoce de alunos, muitas vezes com potencial, mas que so desestimulados
poralgumasdasdisciplinasbsicas.
Na segunda anlise, vemos que a minoria que consegue passar das dificuldades
iniciais, consegue encerrar o curso, seja com notas boas ou razoveis, e uma pequena parte
desses alunos que conseguem concluir, consegue isso com louvor, embora ainda haja
professoresquedificultemoprocessodeaprendizagemeosprejudiquememavaliaes.
Deixando em aberto hipteses sobre possveis fatores que influenciam no desnimo do
aluno com o curso, a ponto de desistir de um possvel futuro promissor, e a antes to sonhada
vaganoensinosuperioreumaformaoacadmicaadequada.
Entre essas possibilidades destacase o fato de os alunos que ingressam no curso sem
saber ao certo seu objeto de estudo, e em consequncia, acabam encontrando disciplinas de
clculo e introduo terica computao, logo no incio e que na maioria das vezes os
desestimulam.
Um outro fator que contribui so as aprovaes de alguns alunos em outras instituies
de ensino. Na maioria das vezes instituies mais prximas dos domiclios desses alunos, o
quetornamaisvivelapermanncianocurso.
Dessa maneira, notase que a ateno da Universidade para com alunos principalmente
dos perodos iniciais deve ser muito bem pensada e convertida em aes efetivas, posto que a
permannciadestesnainstituiotratasedeumaquestosocial,noapenasacadmica.
Pensar em alguns momentos iniciais como semanas acadmicas essencial para que
o aluno saiba o que est por vir e consiga se preparar para tal, talvez uma maior preparao
nos primeiros dias, evitem surpresas futuras e provveis desistncia, portanto, importantssima.
Estes momentos servem para esclarecer aos alunos questes que no esto muito bem
definidas em suas mentes alm disso, muitas vezes serve at mesmo para mostrarlhes
questes que eles nem mesmo sabiam da existncia, evitando assim toda essa problemtica
envolvidanaevasodoensinosuperior.

5.REFERNCIAS
AGRAWAL, R. Fast Discovery of Association Rules. In: Advances in Knowledge Discovery
andDataMining,MentoPark,AAAIPress,1996.

FAYYAD, U. PIATETSKYSHAPIRO, G. SMYTH, P. From data mining to knowledge


discovery: An overview. In: Advances in Knowledge Discovery and Data Mining, AAAI Press /
TheMITPress,MIT,Cambridge,Massachusetts,andLondon,England,1996,p.134.

GAIOSO, N. P. L. O fenmeno da evaso escolar na educao superior no Brasil.


Dissertao(MestradoemEducao),UniversidadeCatlicadeBraslia,75p.2005.

MOROSINI, M. C. CASARTELLI, A. O. SILVA, A. C. B. SANTOS, B. S. SCHMITT, R. E.


GESSINGER, R. M. A evaso na Educao Superior no Brasil: uma anlise da produo
de conhecimento nos peridicos Qualis entre 20002011. In: Jess Arriaga Garca de
Andoan y otros. (Org.). ICLABES. Primera Conferencia Latinoamericana sobre el Abandono en
laEducacinSuperior.1ed.MadriES,2012,v.1,p.13.

POLYDORO, S. A. (2000). O trancamento de matrcula na trajetria acadmica no


universitrio: condies de sada e de retorno instituio. Tese (Doutorado em
Educao),UniversidadeEstadualdeCampinas,145p.

RODRIGUES, F. S. Estudo sobre a evaso no curso de cincia da computao da


UFRGS. 87 f. Trabalho de concluso de curso (Bacharelado em Cincia da Computao).
Universidade Federal do Rio Grande do Sul, Porto Alegre, 2013. [Orientador: Prof. Dr. Dante
AugustoCoutoBarone].2013.

[1] MOROSINI, M. C. CASARTELLI, A. O. SILVA, A. C. B. SANTOS, B. S. SCHMITT, R. E.


GESSINGER, R. M. A evaso na Educao Superior no Brasil: uma anlise da produo de conhecimento
nos peridicos Qualis entre 20002011. In: Jess Arriaga Garca de Andoan y otros. (Org.). ICLABES.
Primera Conferencia Latinoamericana sobre el Abandono en la Educacin Superior. 1 ed. Madri ES, 2012,
v.1,p.1.
[2] MOROSINI, M. C. CASARTELLI, A. O. SILVA, A. C. B. SANTOS, B. S. SCHMITT, R.
E. GESSINGER, R. M. A evaso na Educao Superior no Brasil: uma anlise da
produo de conhecimento nos peridicos Qualis entre 20002011. In: Jess
Arriaga Garca de Andoan y otros. (Org.). ICLABES. Primera Conferencia
Latinoamericana sobre el Abandono en la Educacin Superior. 1 ed. Madri ES, 2012, v.
1,p.3.

Você também pode gostar