Você está na página 1de 19

Percepções e Práticas Educativas no Desempenho Acadêmico: Uma abordagem Machine

Learning

Área 12 - Economia Social e Demografia Econômica

Carlos Enrique Carrasco-Gutierrez1


Fernanda Silva dos Santos 2
Thiago Christiano Silva3
Resumo
A literatura tem discutido novas estratégias de práticas educativas visando aprimorar os
processos de ensino. No entanto, as Instituições de Ensino Superior (IES) enfrentam o desafio
de adaptar-se a essas mudanças e incorporar essas práticas em seus programas, a fim de
influenciar positivamente o processo de ensino-aprendizagem. Este estudo tem como objetivo
analisar a percepção dos estudantes sobre a aplicação de práticas educativas não convencionais
e o impacto dessas práticas no desempenho acadêmico no Ensino Superior. Para isso,
analisamos os microdados do Exame Nacional de Desempenho dos Estudantes (ENADE)
referentes ao último triênio anterior à pandemia de COVID-19, abrangendo todos os cursos
oferecidos pelas IES. Utilizamos técnicas de Machine Learning para identificar os atributos
mais relevantes, além de modelos econométricos para estimar os parâmetros. Os resultados
identificam quatro variáveis que contribuem positivamente para o desempenho dos estudantes.
Essas variáveis estão relacionadas à utilização de tecnologias de informação e comunicação
como estratégia de ensino, ao desenvolvimento das habilidades de trabalho em equipe, à
disponibilidade dos professores para atender os alunos fora do horário das aulas e às condições
do curso que permitem aos estudantes participar de eventos internos e externos à instituição.
Palavra-chave: desempenho, estudante, práticas educativas, ENADE.
JEL: A21, C13, I23
Abstract
The literature has discussed new strategies for educational practices aiming to improve teaching
processes. However, Higher Education Institutions (HEIs) face the challenge of adapting to
these changes and incorporating these practices into their programs in order to positively
influence the teaching and learning process. This study aims to analyze students' perception of
the application of unconventional educational practices and their impact on academic
performance in Higher Education. To achieve this, we analyzed microdata from the National
Student Performance Examination (ENADE) for the last three years prior to the COVID-19
pandemic, encompassing all courses offered by HEIs. We employed Machine Learning
techniques to identify the most relevant attributes, as well as econometric models to estimate
the parameters. The results identify four variables that positively contribute to students'
performance. These variables are related to the use of information and communication
technologies as a teaching strategy, the development of teamwork skills, the availability of
professors to assist students outside of class hours, and the conditions of the course that allow
students to participate in internal and external events of the institution.
Keywords: performance, student, educational practices, ENADE.
JEL: A21, C13, I23

1
Programa de Pós-Graduação em Economia e Política Públicas. Universidade Católica de Brasília, QS 07 - Lote 01,
EPCT, Taguatinga, Brasília - DF 71966-700, Brasil. E-mail: carlosenrique@p.ucb.br
2
Programa de Pós-Graduação em Economia e Política Públicas, Brasil. E-mail: fernanda4.silva4@gmail.com
3
Programa de Pós-Graduação em Economia. Universidade Católica de Brasília. E-mail: thiago.csilva@p.ucb.br
1. INTRODUÇÃO

As Instituições de Ensino Superior (EIS) têm sido motivadas a refletir sobre as mudanças no
processo educacional, reconhecer seu papel social e enfrentar desafios, incluindo a proposição
de alternativas às estruturas ortodoxas e aos modelos tradicionais de ensino-aprendizagem. As
IES vêm reestruturado seus métodos de ensino-aprendizagem, introduzindo inovações e
abordagens que enfatizam a participação ativa dos estudantes e seu envolvimento durante o
curso. Isso contrasta com um sistema em que o professor transmite conhecimentos e o aluno se
limita a recebê-los prontos, sem fazer um esforço maior para elaborar o pensamento.
A utilização de metodologias ativas tornou-se uma estratégia extremamente interessante,
pois busca tornar o processo de ensino-aprendizagem mais atrativo. O conceito de metodologia
ativa é amplo e pode englobar diferentes práticas em sala de aula. Todas têm em comum o
objetivo de tornar o aluno protagonista do processo, deslocando o foco do docente para o aluno,
que assume a responsabilidade por seu próprio aprendizado e participa ativamente de sua
jornada educativa. Nesse sentido, as novas propostas educacionais privilegiam as metodologias
ativas, participativas e problematizadoras de aprendizagem, além de promover o aprendizado
integrado em diferentes cenários, combinando-as com métodos tradicionais.
Este trabalho tem como objetivo investigar os impactos de estratégias não convencionais de
ensino-aprendizagem no desempenho educacional, conforme relatado pelos alunos das
Instituições de Ensino Superior e identificado nos dados do Exame Nacional de Desempenho
dos Estudantes (ENADE) no Brasil. Buscamos compreender como as novas estratégias
pedagógicas de ensino influenciam os resultados educacionais e impulsionam o sucesso
acadêmico e profissional dos estudantes.
Para explorar esse tema, levantamos perguntas relacionadas às práticas de metodologias
ativas de ensino-aprendizagem, que foram respondidas pelos alunos com base nos dados do
ENADE. As questões abordadas neste estudo são as seguintes:
1. O curso proporcionou experiências de aprendizagem inovadoras?
2. O curso favoreceu a articulação do conhecimento teórico com atividades práticas?
3. Os professores apresentaram disponibilidade para atender os estudantes fora do horário
das aulas?
4. O curso ofereceu condições para os estudantes participarem de eventos internos e/ou
externos à instituição?
5. Foram oferecidas oportunidades para os estudantes participarem de projetos de iniciação
científica e atividades que estimularam a investigação acadêmica?
6. Foram oferecidas oportunidades para os estudantes participarem de programas, projetos
ou atividades de extensão universitária?
7. A instituição promoveu atividades de cultura, lazer e interação social?
8. O curso disponibilizou monitores ou tutores para auxiliar os estudantes?
9. Os professores utilizaram tecnologias da informação e comunicação (TICs) como
estratégia de ensino (projetor multimídia, laboratório de informática, ambiente virtual de
aprendizagem)?
10. No curso, você teve a oportunidade de aprender a trabalhar em equipe?

Este estudo adota uma abordagem temática indutiva, baseada no relato dos alunos sobre suas
percepções e preocupações individuais, com o objetivo de investigar a prática educativa nas

2
Instituições de Ensino Superior. Para realizar essa pesquisa, utilizamos técnicas de Aprendizado
de Máquina (Machine Learning) para identificar os atributos mais relevantes, além de modelos
econométricos que incorporam essas variáveis na estimação dos parâmetros. Os dados
utilizados foram obtidos a partir do Exame Nacional de Desempenho dos Estudantes, referentes
aos três anos anteriores à pandemia do COVID-19, e englobam todos os cursos das instituições
de ensino superior do Brasil.
A contribuição deste trabalho é múltipla. Primeiramente, buscamos fornecer conhecimento
empírico que demonstre os efeitos dessas dez práticas pedagógicas no desempenho dos
estudantes. Em segundo lugar, exploramos a vasta quantidade de informações disponíveis nos
microdados do ENADE, a fim de obter novos insights sobre os principais determinantes do
desempenho educacional nas instituições de ensino superior. Em terceiro lugar, nossa
abordagem vai além de uma simples análise econométrica, pois engloba a intersecção de duas
áreas: Aprendizado de Máquina em Ciência da Computação e Econometria em Economia. Por
meio do uso de Aprendizado de Máquina, realizamos a seleção automática de atributos que
podem afetar a variável de interesse, reduzindo a subjetividade do analista na escolha das
variáveis mais relevantes para o estudo. O Aprendizado de Máquina não substitui o analista,
mas complementa sua análise, identificando variáveis que poderiam passar despercebidas,
evitando escolhas arbitrárias. O uso de Aprendizado de Máquina é uma característica distintiva
do procedimento metodológico empregado neste estudo em relação a outros estudos
semelhantes, pois considera um conjunto mais amplo de informações na análise, gerando
resultados mais robustos e contribuindo de maneira significativa para a literatura.
Os resultados encontrados revelaram quatro variáveis que demonstraram ter um impacto
positivo no desempenho acadêmico dos estudantes. A primeira variável é a utilização de
tecnologias da informação e comunicação (TICs), como projetores multimídia, laboratórios de
informática e ambientes virtuais de aprendizagem. A segunda variável é o desenvolvimento dos
alunos em habilidades de trabalho em equipe. A terceira variável é a disponibilidade dos
professores para atender os alunos fora do horário das aulas. Por fim, a quarta variável é a
existência de condições do curso que permitem a participação dos estudantes em eventos
internos e/ou externos à instituição. Essas descobertas sugerem fortemente a adoção dessas
estratégias de ensino-aprendizagem nas IES do Brasil. Além disso, por meio da exploração da
vasta quantidade de informações contidas nos microdados do ENADE, foram obtidos novos
insights sobre os principais determinantes do desempenho educacional nas IES.
A literatura relacionada ao tema apresenta diversas práticas pedagógicas no uso de
metodologias ativas, tais como a aprendizagem baseada em estratégias (SRL), a aprendizagem
baseada em problemas (PBL), o uso de estilos de aprendizagem (learning style), a sala de aula
invertida (flipped classroom), a gamificação (gamification), entre outras. Por exemplo, o Self-
Regulated Learning (SRL), apresentado por Zimmerman e Martinez-Pons (1986), segue a
abordagem construtivista, em que a sala de aula tem como principal função estimular o
aprendizado dos estudantes e incentivar sua participação ativa. Nessa perspectiva, o aluno
autorregulado é consciente e controla seu próprio processo de aprendizagem. Evidências
empíricas demonstram que indivíduos autorregulados são persistentes, determinados,
estratégicos e capazes de avaliar seu progresso, ao contrário daqueles que dependem
cognitivamente ou têm baixa autorregulação (Arias, Lozano, Cabanach & Pérez, 1999;
Zimmerman & Schunk, 2001; Xu, Benson, Mudrey-Camino & Steiner, 2010; Garcia et al.,
2018).
Por outro lado, a aprendizagem baseada em problemas (PBL) envolve um processo de
aprendizagem experimental que permite aos alunos aprender por si mesmos (Torp e Sage, 2002;
Bell, 2010; Blumenfeld et al., 1991). Segundo Herreid et al. (2011), o PBL promove o
desenvolvimento de habilidades analíticas e coloca a responsabilidade dos alunos em seu
próprio trabalho, enquanto os professores acompanham os alunos ao longo do processo de
3
aprendizagem (Ngeow & Kong, 2001; Karabulut, 2002). Algumas vantagens documentadas
desse método incluem a capacidade dos alunos expostos ao PBL de transferir conhecimento e
habilidades para situações da vida real (Hoffman e Ritchie, 1997) e contribuir para a
compreensão de conceitos científicos aplicáveis ao contexto da vida cotidiana (Duggan & Gott,
2002; Ketpichainarong et al., 2010). Uma estrutura inerente ao PBL envolve alunos trabalhando
em grupos menores para discutir um desafio ou problema, com o objetivo de encontrar uma
solução. Isso permite a discussão crítica do problema, busca de informações, acesso a materiais
de aprendizagem e comunicação do conhecimento adquirido a outros alunos e professores
(Rosing, 1997; Rideout, 2001; Rideout & Carpio, 2001). Além disso, o trabalho em grupo
melhora significativamente a percepção dos alunos em relação à aprendizagem e pode aumentar
o desempenho em avaliações.
No que diz respeito aos estilos de aprendizagem (learning style), os alunos utilizam
diferentes abordagens de aprendizagem devido às suas características pessoais. Cada pessoa
tem uma maneira única de processar informações e assimilar novos conhecimentos, baseada
em suas competências e habilidades. Diferentes teorias sobre formas e classificações de estilos
de aprendizagem foram propostas, sendo uma das mais destacadas o método proposto por Kolb
(1976) que sugere um ciclo de aprendizagem experiencial baseado nas atitudes e sentimentos
da pessoa no momento em que está aprendendo. No ambiente escolar, os professores podem
incorporar tecnologias diversas em sua prática pedagógica com base nas preferências ou estilos
de aprendizagem dos alunos, visando identificar suas potencialidades e promover a integração
entre eles. O reconhecimento dos estilos de aprendizagem e a adaptação da educação permitem
que os professores utilizem métodos adequados de ensino e atentem para as diferenças
individuais, garantindo que as necessidades educacionais dos alunos sejam atendidas de forma
eficaz (Engels e Gara, 2010; Samarakoon et al., 2013; Nuzhat et al., 2013; Boström e Hallin,
2013; Boström, 2011; Smith, 2010).
Entre outras práticas pedagógicas de metodologias ativas, temos a sala de aula invertida
(flipped classroom4), que foi popularizada pela primeira vez no ensino secundário nos Estados
Unidos (Lage & Platt, 2000; Bergmann & Sams, 2009), e o processo de gamificação. A
gamificação consiste em utilizar técnicas de jogos, como desafios e recompensas, com o
objetivo principal de aumentar o engajamento e despertar o interesse dos usuários. A
gamificação na educação está se tornando um instrumento fundamental para tornar as aulas e
disciplinas mais atrativas e produtivas tanto para os alunos quanto para os professores, com o
intuito de obter bons resultados no processo de ensino-aprendizagem.
Por fim, é importante mencionar as “boas práticas educativas dos cursos do Ensino Superior”
apresentadas por Chickering e Gamson (1987, 1991) e Hutchins (2003). Esses autores, com
base em décadas de pesquisa sobre a experiência educacional no Ensino Superior, observaram
o declínio do desempenho dos alunos, a passividade dos alunos e os métodos de ensino
deficientes, entre outros fatores. Eles apresentaram sete princípios de boas práticas para os
cursos do Ensino Superior, que incluem: (a) incentivar o contato entre professores e alunos, (b)
promover a reciprocidade e a cooperação entre os alunos, (c) estimular a aprendizagem ativa,
(d) fornecer feedback imediato, (e) enfatizar o tempo dedicado à tarefa, (f) estabelecer altas
expectativas e (g) respeitar a diversidade de talentos e formas de aprendizagem. Diversos
estudos foram desenvolvidos com base nesses fundamentos, como aqueles que avaliam e
definem o ensino eficaz em ambientes tradicionais de sala de aula (Chickering & Gamson,
1987; Chickering & Ehrmann, 1996; McFaden, 2006; McCabe & Meuter, 2011; Gaižiūnienė,
2018).
No Brasil, podemos encontrar alguns estudos empíricos relacionados ao tema. Cornachione
et al. (2010) realizaram uma pesquisa observando atributos comuns na literatura e no

4 Ou aula invertida (inverted classroom).


4
desempenho acadêmico de alunos da graduação em Ciências Contábeis em quatro
universidades brasileiras. Malerva e Escorza (2018) realizaram um estudo identificando os
efeitos das estratégias de aprendizagem no desempenho acadêmico de estudantes de Medicina.
Entre outros trabalhos, podemos mencionar Alencar e Fleith (2004), Santana e Araújo (2010),
Oliveira et al. (2016), Signori, Gláuber Guilherme, et al. (2018), Lima et al. (2016), Signori et
al. (2018), Heringer et al. (2019), Biffi et al. (2020), Corrêa et al. (2020), Cualheta et al. (2021)
e Riccomini et al. (2021).
Este trabalho segue a seguinte estrutura, além desta introdução. Na seção 2, apresentamos a
metodologia utilizada no estudo, bem como a descrição da base de dados e dos modelos de
machine learning. Na seção 3, discutimos os resultados obtidos e, por fim, na seção 4,
apresentamos as conclusões.

2. METODOLOGIA
2.1 Modelos de Regressão Regularizados
Para esta pesquisa utilizamos o modelo de regressão regularizado (ou modelos de
penalização) também conhecidos como regressão Rede Elástica (Elastic Net) no Machine
Learning. A regularização consiste em adicionar uma penalidade aos coeficientes do modelo
de regressão, de forma a evitar o sobreajuste (overfitting5) e melhorar a capacidade de
generalização do modelo. A Rede Elástica combina de forma ideal duas técnicas de
regularização: 𝐿1 -norm (Lasso) e 𝐿2 -norm (Ridge). A 𝐿1 -norm (Lasso) tem a propriedade de
realizar uma seleção de recursos ao reduzir os coeficientes de regressão menos importantes a
zero. Isso significa que, durante o processo de otimização, a Lasso tende a eliminar os atributos
menos relevantes, mantendo apenas os mais importantes para a previsão do alvo. Por outro
lado, a 𝐿2 -norm (Ridge) não realiza uma seleção rígida de recursos, mas penaliza os coeficientes
maiores, fazendo com que eles sejam reduzidos. Isso ajuda a evitar a sensibilidade excessiva a
outliers e a reduzir a multicolinearidade, que ocorre quando os atributos estão altamente
correlacionados.
Para selecionar os atributos mais importantes a partir de um conjunto de dados, utilizamos
os resíduos da seguinte regressão:
𝑦𝑖 = 𝛽0 + ∑𝑝𝑗=1 𝑥𝑖𝑗 𝛽𝑗 + 𝑒𝑟𝑟𝑜𝑟𝑖 (1)
no qual 𝑥𝑖𝑡 é um vetor composto por características dos estudantes (e.g., sexo, renda, bolsa
auxilio, tempo de estudo etc.). De acordo com o procedimento da rede elástica, selecionamos
𝛽 que minimiza a seguinte função de perda 𝐿(𝛽):
2
𝑗 2 ||𝛽|| 2 2
𝐿 (𝛽 ) = ∑ 𝑁 𝑃
𝑖=1(𝑦𝑖 − 𝛽0 − ∑𝑗=1 𝛽𝑗 𝑥𝑖𝑡 ) + 𝜆 [(1 − 𝛼 ) + 𝛼||𝛽|| 1 ] (2)
2

Em que 𝑖 𝜖 {1, … , 𝑁} indexam os estudantes e o termo 𝑥𝑖𝑡𝑗 indexa o 𝑗th regressor da variável 𝑦
em 𝑖 no tempo 𝑡. Os operadores ||. ||1 e ||. ||2 indicam 𝐿1 - e 𝐿2 - normas tomadas sobre a entrada
vetorial. A primeira expressão em (2) representa o erro tradicional de ajuste de dados (resíduos),
enquanto a segunda expressão representa o termo de regularização. O parâmetro 𝜆 regula a
importância relativa do termo tradicional e do termo de regularização. O termo 𝛼 controla a
combinação convexa de 𝐿1 e 𝐿2 para a regularização. Quando 𝛼 é igual a zero, a Rede Elástica
se torna equivalente à regressão de Ridge, utilizando apenas a penalidade L2-norm. Quando 𝛼
é igual a um, a Rede Elástica se torna equivalente à regressão de Lasso, utilizando apenas a

5 Quando um modelo estatístico se ajusta muito bem ao conjunto de dados anteriormente observado, mas se mostra ineficaz para prever novos resultados.

5
penalidade L1-norm. Valores intermediários de alfa permitem uma combinação dos dois tipos
de penalidade, proporcionando um ajuste mais flexível.
A regularização atua penalizando os coeficientes 𝛽 mais elevados, resultando em uma redução
nos coeficientes estimados e uma função de ajuste mais suave em relação à distribuição dos
dados. Por meio desse procedimento, podemos selecionar as variáveis mais relevantes contidas
no vetor 𝑥 para a variável dependente 𝑦. Esse processo é conhecido como seleção de
características (feature selection) usando a abordagem de Elastic Net. O procedimento de
feature selection no contexto de Machine Learning refere-se à técnica de selecionar um
subconjunto relevante de variáveis (características) a partir do conjunto original de dados. O
objetivo é identificar as variáveis mais informativas ou importantes para o modelo preditivo,
eliminando aquelas que possam ser redundantes, irrelevantes ou até mesmo prejudiciais para a
precisão do modelo.
Em resumo, a seleção adequada de características é essencial para diversos motivos. Em
primeiro lugar, pode ajudar a melhorar a eficiência computacional, reduzindo a
dimensionalidade do conjunto de dados. Além disso, ao remover características irrelevantes ou
redundantes, é possível evitar overfitting, que ocorre quando o modelo se ajusta excessivamente
aos dados de treinamento e não generaliza bem para novos dados.

2.2 Dados

Utilizamos os microdados do ENADE no período pré-pandemia do COVID-19, referentes


ao último triênio (2016, 2017 e 2018), abrangendo todos os cursos das Instituições de Ensino
Superior. O ENADE é utilizado para avaliar o desempenho dos alunos no último ano dos cursos
de graduação em relação aos conteúdos programáticos previstos nas diretrizes curriculares, ao
desenvolvimento de competências e habilidades necessárias para a formação geral e
profissional, e ao nível de atualização dos estudantes em relação à realidade brasileira e
mundial. Os resultados do ENADE, juntamente com as respostas do Questionário do Estudante,
são utilizados para calcular os Indicadores de Qualidade da Educação Superior, que medem o
conceito ENADE nas instituições de ensino superior. As notas atribuídas variam de 1 a 5, sendo
5 a pontuação máxima. Neste estudo, consideramos apenas os cursos presenciais.
As variáveis consideradas abrangem um conjunto de características que visam refletir o
perfil educacional das IES em relação ao desenvolvimento do aluno. A Tabela 1 apresenta a
descrição da variável dependente e das variáveis explicativas de interesse relacionadas às
práticas não tradicionais investigadas neste estudo. A variável dependente corresponde à nota
bruta do aluno, que varia de 0 a 100. Por outro lado, as variáveis explicativas são do tipo discreto
nominal, variando de 1 a 6. Ou seja, estão em uma escala em que 1 representa “discordo
totalmente” e 6 representa “concordo totalmente”.

2.3 Modelo econométrico

Utilizamos a seguinte especificação empírica para analisar o impacto das práticas de ensino não
tradicionais no desempenho educacional:
𝑗
log (𝑦𝑖,𝑡 ) = 𝛼𝑖 + 𝛼𝑞(𝑖),𝑡 + log (𝑋𝑖,𝑡 )𝛽′ + 𝑍𝛾 ′ + 𝜀𝑖,𝑡 (3)
Nesta equação, o 𝑖 representa o aluno, q(i) é algum grupo ao qual o aluno pertence (como
escola, estado, etc.) e 𝑡 é a dimensão temporal. O termo 𝛼𝑖 captura características individuais
que não mudam ao longo do tempo, conhecido como efeito fixo do indivíduo. Já 𝛼𝑔(𝑖),𝑡 captura
os efeitos fixos que permitem comparar grupos similares em diferentes aspectos, representados

6
por 𝑔(𝑖 ). A variável 𝑋𝑖𝑡𝑗 considera as dimensões de interesse relacionadas à prática educativa j
que desejamos estudar. A variável 𝑍 é um vetor de variáveis usualmente utilizadas em estudos
empíricos para explicar o desempenho educacional, como idade, horas de estudo, sexo, etc.
Os efeitos fixos 𝛼𝑖 e 𝛼𝑞(𝑖),𝑡 no modelo estimado serão selecionados pelo algoritmo de Machine
Learning para capturar a heterogeneidade dos alunos e em diferentes aspectos representados
por q(i). Nosso objetivo é verificar se os coeficientes 𝛽𝑗 contidos no vetor 𝛽′ são positivos e
estatisticamente diferentes de zero (𝛽𝑗 > 0). A variável dependente 𝑦𝑖𝑡 em (3) representa a nota
do aluno i no ano t, e 𝜀𝑖,𝑡 é o termo de erro. O coeficiente de interesse, 𝛽𝑗 , pode ser interpretado
como a elasticidade do efeito das práticas educativas na nota.

Tabela 1: Descrição das variáveis relacionadas às práticas educativas


Tipo de
Variáveis Descrição
variável
Dependente
Nota bruta na formação geral - Média ponderada da parte objetiva (60%) e
nota_geral Inteiro
discursiva (40%) na formação geral. (valor de 0 a 100)
Variáveis explicativas relacionadas ao ensino não tradicional
Nominal No curso você teve oportunidade de aprender a trabalhar em equipe (discordo
curso_equipe (6 segmentos) totalmente = 1, ... , concordo totalmente = 6)
Foram oferecidas oportunidades para os estudantes participarem de programas,
Nominal
prog_extensao (6 segmentos)
projetos ou atividades de extensão universitária (discordo totalmente = 1, ... ,
concordo totalmente = 6)
Foram oferecidas oportunidades para os estudantes participarem de projetos de
Nominal
proj_ini_cientif (6 segmentos)
iniciação científica e de atividades que estimularam a investigação acadêmica
(discordo totalmente = 1, ... , concordo totalmente = 6)
Nominal O curso ofereceu condições para os estudantes participarem de eventos internos
curso_eventos (6 segmentos) e/ou externos à instituição (discordo totalmente = 1, ... , concordo totalmente = 6)
Nominal O curso favoreceu a articulação do conhecimento teórico com atividades práticas
curso_teorico (6 segmentos) (discordo totalmente = 1, ... , concordo totalmente = 6)
Nominal Os professores apresentaram disponibilidade para atender os estudantes fora do
disp_prof (6 segmentos) horário das aulas (discordo totalmente = 1, ... , concordo totalmente = 6)
Nominal Os professores utilizaram tecnologias da informação e comunicação (TICs) como
prof_estra (6 segmentos) estratégia de ensino (discordo totalmente = 1, ... , concordo totalmente = 6)
Nominal O curso disponibilizou monitores ou tutores para auxiliar os estudantes (discordo
curso_moni (6 segmentos) totalmente = 1, ... , concordo totalmente = 6)
Nominal A instituição promoveu atividades de cultura, de lazer e de interação social
inst_social (6 segmentos) (discordo totalmente = 1, ... , concordo totalmente = 6)
Nominal O curso propiciou experiências de aprendizagem inovadoras (discordo totalmente
curso_experi (6 segmentos) = 1, ... , concordo totalmente = 6)

Fonte: Elaboração própria.

3. RESULTADOS

Neste estudo, consideramos um amplo conjunto de variáveis disponíveis no ENADE e, após


o pré-processamento das informações, chegamos a um total de 50 variáveis para a análise do
processo de seleção de características utilizando a abordagem Elastic Net. A descrição completa
dessas variáveis pode ser encontrada nas Tabelas 1 e Tabela 2.
Para selecionar os atributos com poder preditivo na explicação das notas dos alunos,
dividimos a base de dados em dois conjuntos: o conjunto de treinamento, contendo 50% das
observações, e o conjunto de teste, contendo o restante. Esses conjuntos foram classificados de

7
forma aleatória seguindo o procedimento “Bernoulli sampling”6. A escolha do modelo (Eq. 2)
foi feita através da seleção dos parâmetros 𝛼 e 𝜆 usando um procedimento de validação cruzada
(cross validation), alinhado com 𝑘 = 5 dobras7 (folds) e 100 repetições independentes para
garantir robustez estatística. Nesse procedimento, utilizamos 𝑘 − 1 = 4 dobras para
treinamento e a dobra restante para os testes. Esta metodologia permite-nos afinar os
parâmetros de regularização, evitando ao mesmo tempo o sobreajuste (overfitting) do modelo.
Nós otimizamos um espaço de busca para o 𝛼 sobre a grade {0, 0.05, 0.10, . . . , 1} e 𝜆 sobre
{0, 0.1, 0.2, . . . , 5}. Como prática padrão, pré-processamos todas as regressões aplicando uma
padronização Z-score em todos os pontos de dados, usando apenas os valores predefinidos
extraídos dos dados de treinamento, a fim de evitar vazamento de dados do conjunto de teste.
Os resultados da regularização Elastic Net são apresentados na Figura 1, exibindo a ordem de
importância das variáveis na nota geral.

Figura 1: Resultados da seleção de características utilizando um procedimento de rede


elástica com regularização L2 e L1.

Fonte: elaboração própria.


Nota: Resultados do feature selection usando um procedimento de Elastic Net com e regularização. Os coeficientes são
normalizados em termos do atributo mais importante “grupo”. Classificação média dos atributos mais importantes. Quanto
menor a classificação, mais importante é o atributo.

Podemos observar que as quatro variáveis mais relevantes na nota, em ordem, são “grupo”,
“bolsa_finan”, “renda_fam” e “esc_med_con”. Essas variáveis correspondem,
respectivamente, aos cursos de graduação (categoria administrativa da IES, ver Tabela 4 em
anexo), ao tipo de bolsa de estudos recebida para custear total ou parcialmente as mensalidades,
e ao tipo de escola onde o ensino médio foi cursado. A Tabela 2 apresenta o ranking das
variáveis ordenadas pela ordem de importância identificada pela variável “Ordem”. Além disso,
é interessante notar que variáveis tradicionais, como “sexo” e “cor_raca”, frequentemente
utilizadas em estudos de regressão, não apresentaram maior relevância na determinação da

6
Ele se baseia no conceito de uma distribuição de Bernoulli, que é uma distribuição de probabilidade discreta com dois resultados
possíveis: sucesso (geralmente representado por 1) e fracasso (geralmente representado por 0).
7
Escolhemos o valor de k=5 devido ao tamanho da amostra.
8
variável dependente (nota geral). Isso fortalece ainda mais a análise prévia da metodologia de
Aprendizado de Máquina em nosso estudo.

Tabela 2: Descrição das variáveis utilizadas na seleção de variáveis pelo Machine Learning
Ordem
(escolhida Tipo de
pelo Variáveis Descrição/Perguntas
Machine variável
Learning)

Nominal (94 Código da área de enquadramento do curso no Enade (todos os cursos


1 grupo
segmentos) - triênio 2016, 2107 e 2018). Ver Tabela 4.
Que tipo de bolsa de estudos ou financiamento do curso você recebeu
para custear todas ou a maior parte das mensalidades? (A = Nenhum,
pois meu curso é gratuito, B = Nenhum, embora meu curso não seja
gratuito, C = ProUni integral, D = ProUni parcial, apenas, E = FIES,
Caracter (11
2 bolsa_finan apenas, F = ProUni Parcial e FIES, G = Bolsa oferecida por governo
segmentos)
estadual, distrital ou municipal, H = Bolsa oferecida pela própria
instituição, I = Bolsa oferecida por outra entidade (empresa, ONG, outra),
J = Financiamento oferecido pela própria instituição, K = Financiamento
bancário)
3 renda_fam* Inteiro Qual a renda total de sua família, incluindo seus rendimentos?
Em que tipo de escola você cursou o ensino médio? (A = Todo em
Caracter (6 escola pública, B = Todo em escola privada (particular), C = Todo no
4 esc_med_con
segmentos) exterior, D = A maior parte em escola pública, E = A maior parte em
escola privada (particular), F = Parte no Brasil e parte no exterior)
Ao longo da sua trajetória acadêmica, você recebeu algum tipo de
Caracter (6
bolsa acadêmica? No caso de haver mais de uma opção, marcar apenas a
5 bolsa_acad bolsa de maior duração. (A = Nenhum, B = Bolsa de iniciação científica, C
segmentos)
= Bolsa de extensão, D = Bolsa de monitoria/tutoria, E = Bolsa PET, F =
Outro tipo de bolsa acadêmica)
Até que etapa de escolarização sua mãe concluiu? (A = Nenhuma, B =
Caracter (6
6 educ_mae Ensino fundamental: 1º ao 5º ano, C = Ensino fundamental: 6º ao 9º ano, D
segmentos)
= Ensino médio, E = Ensino Superior - Graduação, F = Pós-graduação)
Código da organização acadêmica da IES. (A= Centro Federal de
Caracter (5
7 orgacad segmentos)
Educação Tecnológica, B = Centro Universitário, C = Faculdade, D =
Instituto Federal de Educação, Ciência e Tecnologia, E = Universidade)
Até que etapa de escolarização seu pai concluiu? (A = Nenhuma, B =
Caracter (6
8 educ_pai Ensino fundamental: 1º ao 5º ano, C = Ensino fundamental: 6º ao 9º ano, D
segmentos)
= Ensino médio, E = Ensino Superior - Graduação, F = Pós-graduação)
9 idade Numérica Idade do inscrito em 26/11/2017
Quantas horas por semana, aproximadamente, você dedicou aos
10 horas_estud* Numérica
estudos, excetuando as horas de aula?
Durante o curso de graduação você participou de programas e/ou
atividades curriculares no exterior? (A = Não participei, B = Sim,
Programa Ciência sem Fronteiras, C = Sim, programa de intercâmbio
Caracter (6
11 ativ_curricu segmentos)
financiado pelo Governo Federal (Marca; Brafitec; PLI; outro), D = Sim,
programa de intercâmbio financiado pelo Governo Estadual, E = Sim,
programa de intercâmbio da minha instituição, F = Sim, outro intercâmbio
não institucional)
12 ano_ini_grad Numérica Ano de início da graduação
Caracter (27 Código da UF de funcionamento do curso (11 = Rondônia, ... , 53 =
13 uf_curso
segmentos) Distrito federal)
Binaria (2 Alguém em sua família concluiu um curso superior? (A = Sim, B =
14 fam_con_ens_super
segmentos) Não)
Caracter (6 Qual é a sua cor ou raça? (A = Branca, B = Preta, C = Amarela, D =
15 cor_raca segmentos) Parda, E = Indígena, F = Não quero declarar)
Nominal (6 Em que unidade da Federação UF você concluiu o ensino médio? (11
16 con_ensimedio segmentos) = Rondônia, ... , 53 = Distrito federal)

9
Nominal (5 Qual o seu estado civil? (A = Solteiro(a), B = Casado(a), C =
17 est_civil segmentos) Separado(a) judicialmente/divorciado(a), D = Viúvo(a), E = Outro)
Qual modalidade de ensino médio você concluiu? (A = Ensino médio
tradicional, B = Profissionalizante técnico (eletrônica, contabilidade,
Caracter (5
18 mod_ens_med_con agrícola, outro), C = Profissionalizante magistério (Curso Normal), D =
segmentos)
Educação de Jovens e Adultos (EJA) e/ou Supletivo, E = Outra
modalidade)
Seu ingresso no curso de graduação se deu por meio de políticas de
ação afirmativa ou inclusão social? (A = Não, B = Sim, por critério
Caracter (6 étnico-racial, C = Sim, por critério de renda, D = Sim, por ter estudado em
19 politicas_social segmentos) escola pública ou particular com bolsa de estudos, E = Sim, por sistema
que combina dois ou mais critérios anteriores, F = Sim, por sistema
diferente dos anteriores)
Qual alternativa a seguir melhor descreve sua situação financeira
(incluindo bolsas)? (A = Não tenho renda e meus gastos são financiados
por programas governamentais, B = Não tenho renda e meus gastos são
Caracter (6 financiados pela minha família ou por outras pessoas, C = Tenho renda,
20 sit_finan
segmentos) mas recebo ajuda da família ou de outras pessoas para financiar meus
gastos, D = Tenho renda e não preciso de ajuda para financiar meus gastos,
E = Tenho renda e contribuo com o sustento da família, F = Sou o
principal responsável pelo sustento da família)
Qual alternativa a seguir melhor descreve sua situação de trabalho
Caracter (5 (exceto estágio ou bolsas)? (A = Não estou trabalhando, B = Trabalho
21 sit_trab segmentos) eventualmente, C = Trabalho até 20 horas semanais, D = Trabalho de 21 a
39 horas semanais, E = Trabalho 40 horas semanais ou mais)
Você teve oportunidade de aprendizado de idioma estrangeiro na
Instituição? (A = Sim, somente na modalidade presencial, B = Sim,
Caracter (5 somente na modalidade semipresencial, C = Sim, parte na modalidade
22 estud_idioma
segmentos) presencial e parte na modalidade semipresencial, D = Sim, na modalidade
a distância.
E = Não)
Os equipamentos e materiais disponíveis para as aulas práticas foram
Nominal (6
23 equip_mat adequados para a quantidade de estudantes. (Discordo totalmente = 1,
segmentos)
... , Concordo totalmente = 6)
Foram oferecidas oportunidades para os estudantes realizarem
Nominal (6
24 intercam_estagio intercâmbios e/ou estágios no país. (Discordo totalmente = 1, ... ,
segmentos)
Concordo totalmente = 6)
Nominal (6 Os professores demonstraram domínio dos conteúdos abordados nas
25 prof_dom
segmentos) disciplinas. (Discordo totalmente = 1, ... , Concordo totalmente = 6)
Caracter (2
26 sexo Tipo de sexo (M = Masculino, F = Feminino).
segmentos)
Os ambientes e equipamentos destinados às aulas práticas foram
Nominal (6
27 amb_equp adequados ao curso. (Discordo totalmente = 1, ... , Concordo totalmente
segmentos)
= 6)
Quantas pessoas da sua família moram com você? Considere seus
28 qt_pessoas* Inteiro pais, irmãos, cônjuge, filhos e outros parentes que moram na mesma
casa com você.
A instituição dispôs de refeitório, cantina e banheiros em condições
Nominal (6
29 inst_ref_ban segmentos)
adequadas que atenderam as necessidades dos seus usuários.
(Discordo totalmente = 1, ... , Concordo totalmente = 6)
Algum dos grupos abaixo foi determinante para você enfrentar
dificuldades durante seu curso superior e concluí-lo? (A = Não tive
dificuldade, B = Não recebi apoio para enfrentar dificuldades, C = Pais, D
Caracter (11
30 grup_determ = Avós, E = Irmãos, primos ou tios, F = Líder ou representante religioso,
segmentos)
G = Colegas de curso ou amigos, H = Professores do curso, I =
Profissionais do serviço de apoio ao estudante da IES, J = Colegas de
trabalho, K = Outro grupo)
Nominal (6 As condições de infraestrutura das salas de aula foram adequadas.
31 cond_infra segmentos) (Discordo totalmente = 1, ... , Concordo totalmente = 6)
Qual o principal motivo para você ter escolhido este curso? (A =
Inserção no mercado de trabalho, B = Influência familiar, C = Valorização
Caracter (9
32 escol_curso segmentos)
profissional, D = Prestígio Social, E = Vocação, F = Oferecido na
modalidade a distância, G = Baixa concorrência para ingresso, H = Outro
motivo)
10
Nominal (5 Código da região de funcionamento do curso (1 = Norte, 2 = Nordeste,
33 regiao_curso segmentos) 3 = Sudeste, 4 = Sul, 5 = Centro-Oeste)
Nominal (6 A biblioteca dispôs das referências bibliográficas que os estudantes
34 biblio
segmentos) necessitaram. (Discordo totalmente = 1, ... , Concordo totalmente = 6)
Ao longo da sua trajetória acadêmica, você recebeu algum tipo de
Caracter (6
auxílio permanência? No caso de haver mais de uma opção, marcar
35 tipo_auxilio apenas a bolsa de maior duração. (A = Nenhum, B = Auxílio moradia, C =
segmentos)
Auxílio alimentação, D = Auxílio moradia e alimentação, E = Auxílio
permanência, F = Outro tipo de auxílio)
A instituição dispôs de quantidade suficiente de funcionários para o
Nominal (6
36 inst_func apoio administrativo e acadêmico. (Discordo totalmente = 1, ... ,
segmentos)
Concordo totalmente = 6)
Excetuando-se os livros indicados na bibliografia do seu curso,
37 quant_livro_leu* Inteiro
quantos livros você leu neste ano?
Nominal (6 O curso exigiu de você organização e dedicação frequente aos
38 org_ded_estud
segmentos) estudos. (Discordo totalmente = 1, ... , Concordo totalmente = 6)
Caracter (3 Qual a sua nacionalidade? (A = Brasileira, B = Brasileira naturalizada, C
39 nascio
segmentos) = Estrangeira)
Fonte: elaboração própria. Baseado nos questionários da ENADE, correspondente ao anos 2016, 2017 e 2018.
Nota: As variáveis com (*) foram transformadas em variáveis do tipo quantitativo. A variável renda_fam foi transformado em
variável numérica considerando os valores médios por faixa de renda. Para cada faixa de renda do questionário da ENADE foi
calculado a média amostral. A coluna correspondente a variável “ordem” indica a ordem classificada pelo feature selection
segundo a abordagem Elastic Net.

Determinado o conjunto de variáveis na análise previa pelo Machine Learning, a especificação


empírica a ser estimada tem a seguinte configuração:
𝑗
𝑙𝑜𝑔(𝑛𝑜𝑡𝑎𝑖,𝑡 ) = 𝛼𝑖 + 𝛼𝑔(𝑖),𝑡 + log (𝑋𝑖,𝑡 )𝛽′ + 𝛾1 𝑟𝑒𝑛𝑑𝑎_𝑓𝑎𝑚𝑖 + 𝛾2 𝑖𝑑𝑎𝑑𝑒𝑖 + 𝛾3 ℎ𝑟_𝑒𝑠𝑡𝑢𝑑𝑖 +
𝛾4 𝑞𝑡_𝑝𝑒𝑠𝑠𝑖 + 𝜀𝑖,𝑡 (3)
Em que:
𝑛𝑜𝑡𝑎𝑖𝑡 : nota geral na prova do Enade do aluno i do ano t.
𝛼𝑖 : efeitos fixos do indivíduo escolhidas pelo Machine Learning;
𝛼𝑔(𝑖),𝑡 : efeitos fixos que assegura comparar grupos similares em diferentes aspectos denotados
por 𝑔(𝑖) e escolhidas pelo Machine Learning.
𝑗
𝑋𝑖𝑡 : considera as dimensões de interesse relacionadas as práticas educativas j que desejamos
estudar e que pertencem ao conjunto {curso_experi, curso_teorico, disp_prof, curso_eventos,
proj_ini_cientif, prog_extensao, inst_social, curso_moni, prof_estra, curso_equipe}.
𝛽: vetor contendo os parâmetros de interesse 𝛽 = [𝛽1 , 𝛽2 , … , 𝛽10 ]′;
𝑟𝑒𝑛𝑑𝑎_𝑓𝑎𝑚𝑖 : é a renda total de sua família pelo indivíduo 𝑖;
𝑖𝑑𝑎𝑑𝑒𝑖 : idade do aluno;
ℎ𝑟_𝑒𝑠𝑡𝑢𝑑𝑖 : horas que o aluno i dedica ao estudo;
𝑞𝑡_𝑙𝑖𝑣𝑟𝑜𝑠𝑖 : quantidade de livros lido pelo aluno;
𝑞𝑡_𝑝𝑒𝑠𝑠𝑖 : quantidade de pessoas que moram com o aluno;

As variáveis 𝑟𝑒𝑛𝑑𝑎_𝑓𝑎𝑚𝑖 , 𝑖𝑑𝑎𝑑𝑒𝑖 , ℎ𝑟_𝑒𝑠𝑡𝑢𝑑𝑖 , 𝑞𝑡_𝑙𝑖𝑣𝑟𝑜𝑠𝑖 e 𝑞𝑡_𝑝𝑒𝑠𝑠𝑖 são de natureza continua


e, por esse motivo, foram incorporadas na equação (3). As variáveis renda total da família e
horas de estudo estão entre as 10 primeiras variáveis selecionadas pelo Elastic Net. Para compor
o top 10, foram incluídas as variáveis até a ordem 12.
A Tabela 3 apresenta os resultados das estimativas do modelo descrito na equação (3).
Incorporamos nas estimativas as dez primeiras variáveis (top 10) selecionadas pela
regularização Elastic Net, e que correspondem às variáveis “grupo”, “bolsa_finan”,
“esc_med_con”, “bolsa_acad”, “educ_mae”, “orgacad”, “educ_pai”, “ativ_curricu”,
“ano_ini_grad” e “uf_curso” (ver descrição completa na Tabela 2).

11
Tabela 3 - Resultados econométricos
Variável dependente log(nota_geral)
Modelo (1) (2) (3)
Variáveis independentes
log(curso_experi) -0,052*** -0,052*** -0,052***
(0,006) (-0,007) (0,005)
log(curso_teorico) 0,001 0,001 0,001
(0,006) (0,006) (0,004)
log(disp_prof) 0,028*** 0,028*** 0,028***
(0,005) (0,007) (0,003)
log(curso_eventos) 0,057*** 0,057*** 0,057***
(0,006) (0,007) (0,007)
log(proj_ini_cientif) -0,044*** -0,044*** -0,044***
(0,005) (0,004) (0,005)
log(prog_extensão) -0,0001 -0,0001 -0,0001
(0,006) (0,003) (0,009)
log(curso_moni) -0,035*** -0,035*** -0,035***
(0,004) (0,005) (0,005)
log(prof_estra) 0,061*** 0,061*** 0,061***
(0,006) (0,017) (0,006)
log(curso_equipe) 0,041*** 0,041*** 0,041***
(0,007) (0,009) (0,005)
log(inst_social) 0,005 0,005 0,005
(0,004) (0,005) (0,004)
log(renda_fam) 0,050*** 0,050*** 0,050***
(0,001) (0,004) (0,003)
log(idade) -0,131*** -0,131*** -0,131***
(0,006) (0,02) (0,014)
log(horas_estud) 0,037*** 0,037*** 0,037***
(0,002) (0,003) (0,001)
sexoM 0,040*** 0,040*** 0,040***
(0,002) (0,01) (0,003)
qt_pessoas -0,009*** -0,009*** -0,009***
(0,001) (0,001) (0,001)
ano_ini_grad 0,015*** 0,015*** 0,015***
(0,001) (0,001) (0,001)
Efeitos fixos
(Machine Learning)
Top 10 variáveis Yes Yes Yes
Fit statistics
Observações 765.909 765.909 765.909
R2 0,598 0,598 0,598
R2-adjusted 0,161 0,161 0,161
Erro Robusto (clustering) aluno grupo uf_curso

Fonte: elaboração própria.


Nota: Níveis de significância utilizados: ***1%; **5%; *10%. Os 10 atributos selecionados pelo algoritmo de Machine
Learning, utilizando o procedimento de seleção de características (feature selection), e usados como efeitos fixos são: grupo,
bolsa_finan, esc_med_con, bolsa_acad, educ_mae, orgacad, educ_pai, ativ_curricu, ano_ini_grad e uf_curso. Uma descrição
detalhada dessas variáveis pode ser encontrada na Tabela 2.

12
Utilizamos o método de mínimos quadrados ordinários (MQO) robustos para lidar com
problemas de heteroscedasticidade por clusters (aluno, grupo, UF), conforme apresentado nas
colunas 1, 2 e 3. Observamos nas três especificações estimadas que a renda familiar, as horas
dedicadas ao estudo e o ano em que o aluno iniciou a graduação têm um impacto positivo
significativo na nota, com um nível de significância de 5%. Isso significa que, quanto melhores
forem as condições financeiras da família do estudante, melhor será sua nota. Além disso,
quanto mais horas o aluno dedicar aos estudos, maior será sua nota. E, por fim, quanto mais
tempo tem o aluno estiver na Instituição de Ensino Superior maior será a sua nota.
Também constatamos que a idade afeta negativamente a nota. Isso significa que, os alunos
com mais idade tender a ter uma nota menor. Por outro lado, a variável binária “sexo” (1 =
homem; 0 = mulher) tem um impacto positivo na nota dos alunos, indicando que os homens
têm notas mais altas do que as mulheres. Por fim, a variável “qt_pessoas”, que representa o
número de pessoas que moram com o aluno, tem um efeito negativo na nota. Isso pode ser
explicado pela falta de espaço físico ou por um ambiente inadequado que possa prejudicar o
desempenho acadêmico do aluno.
Em relação às variáveis de interesse desta pesquisa, observamos o seguinte: as variáveis
relacionadas à utilização de tecnologias da informação e comunicação como estratégia de
ensino (prof_extra), o desenvolvimento do aluno em trabalhar em equipe (curso_equipe), a
disponibilidade dos professores para atender os alunos fora do horário das aulas (disp_prof) e
as condições do curso para a participação dos estudantes em eventos internos e/ou externos à
instituição (curso_eventos) possuem um efeito positivo estatisticamente significativo na nota,
com um nível de significância de 5%.
Não encontramos evidências dos efeitos das variáveis “curso_teorico”, “prog_extensão” e
“inst_social” na nota. Por fim, também constatamos que as variáveis “curso_experi”,
“proj_ini_cientif” e “curso_moni” afetaram negativamente a nota do aluno. Ou seja, à medida
que as práticas relacionadas a essas variáveis são implementadas, a nota dos alunos diminui.
Isso evidencia que nem todas as práticas não tradicionais podem trazer benefícios para o
desempenho educacional. Uma explicação plausível pode ser que a forma como essas práticas
estão sendo implementadas não está proporcionando os efeitos esperados e, em vez de trazer
benefícios, acaba sendo ineficaz.
Para mostrar a robustez dos resultados encontrados, estimamos novamente os modelos
considerando adicionalmente mais dois conjuntos de variáveis identificados pelo Machine
Learning (ML). As primeiras três colunas da Tabela 3 apresenta os resultados das estimações
considerando as 5 primeiras variáveis selecionadas pelo ML e as três últimas colunas
correspondem aos resultados considerando as 15 primeiras variáveis selecionadas pelo ML.
Podemos observar que em geral os resultados se mantem robustos aos resultados apresentados
na Tabela 2. Em particular podemos notar que a variável “prog_extensão” pasa a ser
estatisticamente significante ao nível de 5% para quando usados as primeiras 5 variáveis e a
estimação foi robusta por cluster para aluno e grupo (coluna 1 e 2). Para os outros casos esta
variável permanece estatisticamente igual a zero.

13
Tabela 3 - Análise de robustez

Variável dependente log(nota_geral)


Modelo (1) (2) (3) (1) (2) (3)
Var. Independentes
log(curso_experi) -0,047*** -0,047*** -0,047*** -0,048*** -0,048*** -0,048***
(0,003) (0,006) (0,004) (0,013) (0,008) (0,008)
log(curso_teorico) 0,001 0,001 0,001 -0,002 -0,002 -0,002
(0,003) (0,006) (0,003) (0,013) (0,008) (0,005)
log(disp_prof) 0,023*** 0,023*** 0,023*** 0,033*** 0,033*** 0,033***
(0,003) (0,005) (0,004) (0,012) (0,008) (0,005)
log(curso_eventos) 0,053*** 0,053*** 0,053*** 0,053*** 0,053*** 0,053***
(0,003) (0,006) (0,007) (0,014) (0,008) (0,011)
log(proj_ini_cientif) -0,045*** -0,045*** -0,045*** -0,042*** -0,042*** -0,042***
(0,003) (0,004) (0,006) (0,013) (0,007) (0,007)
log(prog_extensão) 0,009*** 0,009*** 0,009 0,003 0,003 0,003
(0,003) (0,003) (0,008) (0,014) (0,004) (0,012)
log(curso_moni) -0,031*** -0,031*** -0,031*** -0,035*** -0,035*** -0,035***
(0,002) (0,004) (0,005) (0,01) (0,006) (0,004)
log(prof_estra) 0,068*** 0,068*** 0,068*** 0,052*** 0,052** 0,052***
(0,004) (0,015) (0,004) (0,014) (0,021) (0,006)
log(curso_equipe) 0,046*** 0,046*** 0,046*** 0,042*** 0,042*** 0,042***
(0,004) (0,01) (0,004) (0,016) (0,009) (0,01)
log(inst_social) 0,001 0,001 0,001 0,011 0,011* 0,011
(0,002) (0,004) (0,004) (0,011) (0,006) (0,008)
log(renda_fam) 0,054*** 0,054*** 0,054*** 0,045*** 0,045*** 0,045***
(0,001) (0,003) (0,002) (0,003) (0,004) (0,003)
log(idade) -0,146*** -0,146*** -0,146*** -0,146*** -0,146*** -0,146***
(0,003) (0,017) (0,012) (0,018) (0,022) (0,012)
log(horas_estud) 0,039*** 0,039*** 0,039*** 0,037*** 0,037*** 0,037***
(0,001) (0,002) (0,001) (0,004) (0,003) (0,002)
sexoM 0,031*** 0,031*** 0,031*** 0,039*** 0,039*** 0,039***
(0,001) (0,009) (0,003) (0,005) (0,009) (0,003)
qt_pessoas -0,011*** -0,011*** -0,011*** -0,009*** -0,009*** -0,009***
(0,0003) (0,001) (0,001) (0,002) (0,001) (0,001)
ano_ini_grad 0,012*** 0,012*** 0,012*** 0,015*** 0,015*** 0,015***
(0,0004) (0,001) (0,002) (0,002) (0,001) (0,001)
Efeitos fixos
(Machine Learning)
Top 5 variáveis Yes Yes Yes - - -
Top 15 variáveis - - - Yes Yes Yes
Fit statistics
Observações 765.909 765.909 765.909 765.909 765.909 765.909
R2 0,182 0,182 0,182 0,851 0,851 0,851
R2-adjusted 0,142 0,142 0,142 0,211 0,211 0,211
Erro Robusto (clustering) aluno grupo uf_curso aluno grupo uf_curso

Fonte: elaboração própria.


Nota: Níveis de significância utilizados: ***1%; **5%; *10%. O algoritmo de Machine Learning, por meio do procedimento
de seleção de características (feature selection), identificou 5 atributos relevantes: grupo, bolsa_finan, esc_med_con,
bolsa_acad e educ_mae. Considerando agora os 15 principais atributos selecionados por meio do feature selection, temos:
grupo, bolsa_finan, esc_med_con, bolsa_acad, educ_mae, orgacad, educ_pai, ativ_curricu, ano_ini_grad, uf_curso,
fam_con_ens_super, cor_raca, con_ensimedio, est_civil e mod_ens_med_con. Para obter uma descrição detalhada dessas
variáveis, consulte a Tabela 2.

14
5. CONCLUSÕES

Este estudo tem como objetivo investigar a percepção dos estudantes em relação aos efeitos
de dez práticas educativas não convencionais de ensino-aprendizagem nas Instituições de
Ensino Superior no Brasil, buscando identificar as variáveis que influenciam positivamente o
desempenho acadêmico. Por meio da aplicação de técnicas de aprendizado de máquina e
econometria, foram analisados os microdados do Exame Nacional de Desempenho dos
Estudantes referentes ao último triênio pré-pandemia do COVID-19, englobando todos os
cursos das IES.
As análises empíricas revelaram quatro variáveis que demonstraram ter um impacto positivo
no desempenho acadêmico dos estudantes, sendo elas:
1. Utilização de tecnologias da informação e comunicação (TICs) como estratégia de ensino.
2. Desenvolvimento dos alunos em habilidades de trabalho em equipe.
3. Disponibilidade dos professores para atender os alunos fora do horário das aulas.
4. Condições do curso que permitem a participação dos estudantes em eventos internos e/ou
externos à instituição.
Essas descobertas sugerem fortemente a adoção dessas estratégias de ensino-aprendizagem
nas IES do Brasil. Além disso, por meio da exploração da vasta quantidade de informações
contidas nos microdados do ENADE, foram obtidos novos insights sobre os principais
determinantes do desempenho educacional nas IES.
Outro aspecto relevante deste estudo é a evidência do valor do uso de métodos de
Inteligência Artificial na análise econômica. Essa abordagem permitiu automatizar o processo
subjetivo de seleção dos atributos que melhor qualificam as IES, incorporando esses resultados
na análise econométrica e fornecendo evidências mais robustas dos resultados alcançados.
Em suma, este estudo destaca a importância de implementar estratégias educativas baseadas
em TICs, estimular o desenvolvimento de habilidades de trabalho em equipe, aprimorar a
disponibilidade dos professores e criar condições favoráveis para a participação dos estudantes
em eventos acadêmicos. Além disso, demonstra de maneira convincente como a utilização de
métodos avançados, como a Inteligência Artificial, pode contribuir para uma análise mais
precisa e automatizada dos fatores determinantes do desempenho educacional nas IES.

REFERÊNCIAS BIBLIOGRÁFICAS

Aithal, P. S. and Kumar, P. M., How Innovations and Best Practices Can Transform Higher Education
Institutions: A Case Study of SIMS (February 17, 2015). International Journal of Management (IJM),
Volume 6, Issue 2, February (2015), pp. 83-98.
Alencar, E. M. L. S.; Fleith, D. S. Inventário de Práticas Docentes que Favorecem a Criatividade no Ensino
Superior. Psicologia: Reflexão e Crítica, 2004, 17(1), pp.105-110.
Arias, A. V., Lozano, A.B., Cabanach, R.G., Pérez, J.C.N. (1999). Las estratégias de aprendizaje: revisión
teorica y conceptual. Revista Latinoamericana de Psicologia, 31 (3), pp. 425-461.
Barbel, N. A. N. As metodologias ativas e a promoção da autonomia de estudantes. Semina: Ciências Sociais
e Humanas, Londrina, v. 32, n. 1, p. 25-40, jan./jun. 2011.
Batts, D., Colaric, S. M., & McFadden, C. (2006). Online courses demonstrate use of seven principles.
International Journal of Instructional Technology & Distance Learning, 3(12), 15-26.
Bell, S. (2010). Project-based learning for the 21st century: Skills for the future. Clearing House, 83(2), 39-
43.doi.org/10.1080/00098650903505415.

15
Bergmann, J., & Sams, A. (2009). Remixing chemistry class: Two Colorado teachers make vodcasts of their
lectures to free up class time for hands-on activities. Learning & Leading with Technology, 36(4), 22–27.
Biffi, Maríndia, et al. "Active learning methodologies: challenges for professors of two medical schools in
Rio Grande do Sul, Brazil." Revista Brasileira de Educação Médica 44 (2020).
Blumenfeld, P. C., Soloway, E., Marx, R. W., Krajcik, J. S., Guzdial, M., & Palincsar, A. (1991). Motivating
project-based learning: Sustaining the doing, supporting the learning. Educational Psychologist, 26(3/4),
369. doi.org/10.1080/00461520.1991.9653139.
Bonwell, C. C. & Eison, J. A. (1991). Active learning: creating excitement in the classroom. ASHE-ERIC
higher education reports. ERIC Clearinghouse on Higher Education, The George Washington University,
Washington, DC.
Chickering, A. W., & Gamson, Z. F. (1987). Seven principles for good practice in undergraduate education.
American Association for Higher Education Bulletin, 39(7), 3-7.
Chickering, A. W., & Gamson, Z. F. (1991). Applying the seven principles for good practice in higher
education. San Francisco, CA: Jossey-Bass.
Chickering, A. W., & Ehrmann, S. C. (1996). Implementing the seven principles: Technology as a lever.
American Association for Higher Education Bulletin, 49(2), 3-6.
Cornachione Junior, E. B.; Cunha, J. V. A.; de Luca, M. M. M.; Ott, E. O bom é meu, o ruim é seu:
perspectivas da teoria da atribuição sobre o desempenho acadêmico de alunos da graduação em Ciências
Contábeis. Rev. contab. finanç. 2010.
Corrêa, Matheus, et al. "An analysis of the insertion of sustainability elements in undergraduate design
courses offered by Brazilian higher education institutions: An exploratory study." Journal of Cleaner
Production 272 (2020): 122733.
Cualheta, Luciana Padovez, and Gardenia da Silva Abbad. "What does entrepreneurship education look like
in Brazil? An analysis of undergraduate teaching plans." Education+ Training 63.7/8 (2021): 1043-1057.
Cyrino, L. G.; Pereira, M. L. T. Trabalhando com estratégias de ensino-aprendizado por descoberta na área
da saúde: a problematização e a aprendizagem baseada em problemas. Cad. Saúde Pública, Rio de Janeiro,
20(3):780-788. 2004.
de Oliveira Neto, José Dutra, and Gilvania de Sousa Gomes. "Technology Enhanced Learning for Higher
Education in Brazil." eLearn 2016.8 (2016).
Dean, T.; Lee-Post, A.; Hapke, H. Universal Design for Learning in Teaching Large Lecture Classes. Journal
of Marketing Education. 2016.
Duggan, S., & Gott, R. (2002). What sort of science education do we really need? International Journal of
Science Education, 24(7), 661-679. doi.org/10.1080/09500690110110133
Estévez-Ayres, Iria; Alario-Hoyos, Carlos; Pérez-Sanagustín, Mar; Pardo, Abelardo; Crespo-García, Raquel
M.; Leony, Derick; Parada G., Hugo A.; Delgado-Kloos, Carlos. A methodology for improving active
learning engineering courses with a large number of students and teachers through feedback gathering and
iterative refinement. ERIC - International Journal of Technology and Design Education. 2015.
Gaižiūnienė, Lina. Innovative Study Methods Adaptation: The Power of An Effective Teacher. The European
Journal of Social and Behavioural Sciences EJSBS Volume XXIV. 2018.
Garcia, R; Falkner, K; Vivian, R. Systematic literature review: Self-Regulated Learning strategies using e-
learning tools for Computer Science, Computers & Education, Volume 123, 2018, Pages 150-163, ISSN
0360-1315. https://doi.org/10.1016/j.compedu.2018.05.006.
Guerra, C. J. O., & Teixeira, A. J. C. Os impactos da adoção de metodologias ativas no desempenho dos
discentes do curso de ciências contábeis de instituição de ensino superior mineira. Revista De Educação E
Pesquisa Em Contabilidade (REPeC), 10(4). 2016.
Heringer, Markoni Ramires, et al. "Innovation in brazilian private higher education: A proposal for the
application of active methodologies based on the flipped classroom." International Journal of Innovation 7.2
(2019): 221-340.
Herreid, C. F., N. A. Schiller, K. F. Herreid, and C. Wright. 2011. In case you are interested: results of a
survey of case study teachers. J. Col. Sci. Teach. 40(4):76–80.
16
Hoffman, B., & Ritchie, D. (1997). Using multimedia to overcome the problems with problem-based
learning. Instructional Science, 25, 97–115. http://link.springer.com/journal/11251
Huffman, W. H.; Huffman, A. H. Beyond basic study skills: The use of technology for success in college.
Elsevier. 2011.
Hutchins, H. M. (2003). Instructional immediacy and the seven principles: Strategies for facilitating online
courses. Online Journal of Distance Learning Administration, 6(3), 1-10.
Karabulut, U.S. (2002). Curricular Elements of Problem-Based Learning at Cause Developments of
SelfDirected Learning Behaviors Among Students and Its Implications on Elementary Education. Master's
thesis, University of Tennessee, Retrieved from http://trace.tennessee.edu/utk_gradthes/2078
Ketpichainarong, W., Panijpan, B., & Ruenwongsa, P. (2010). Enhanced learning of biotechnology students
by an inquiry-based cellulose laboratory. International Journal of Environmental and Science Education,
5(2), 169-187. Retrieved from http://www.ijese.net
Kolb, D. A. (1981). Learning styles and disciplinary differences. In A. Chickering (Ed.), The modern
American college (pp. 232-255). San Francisco, CA: Jossey-Bass.
Lage, M., & Platt, G. (2000). The internet and the inverted classroom. Journal of Economic Education, 31,
11.
Lima, Rui M., Diana Mesquita, and Luciana Coelho. "Five Years of Project-Based Learning Training
Experiences in Higher Education Institutions in Brazil. 2016".
Limberger, J. B. Metodologias ativas de ensino-aprendizagem para educação farmacêutica: um relato de
experiência. Interface. 2013.
Malerva, I. S.; Escorza, Y. H. Estrategias de aprendizaje y desempeño académico en estudiantes de Medicina.
Educación Médica. 2018.
McCabe, D. B.; Meuter, M. L. A Student View of Technology in the Classroom: Does It Enhance the Seven
Principles of Good Practice in Undergraduate Education? Journal of Marketing Education, 2011.
Mello, M. B. J. B.; Leme, M. I. S. Motivação de alunos dos cursos superiores de tecnologia. Psicol. Esc.
Educ. 2016.
Ngeow, K., & Kong, Y. S. (2001). Learning To Learn: Preparing Teachers and Students for Problem-Based
Learning. ERIC Digest. Retrieved from http://www.ericdigests.org/2002-2/problem.htm
Riccomini, Fernanda Edileuza, et al. "Educational innovation: Trends for higher education in
Brazil." International Journal of Educational Management 35.3 (2021): 564-578.
Santana, A. L. A.; Araújo, A. M. P. Aspectos do perfil do professor de Ciências Contábeis e seu reflexo no
Exame Nacional de Desempenho dos estudantes (ENADE) – um estudo nas universidades federais do Brasil.
Universidade Federal de Minas Gerais, Belo Horizonte, 2011.
Signori, Gláuber Guilherme, et al. "Gamification as an innovative method in the processes of learning in
higher education institutions." International Journal of Innovation and Learning 24.2 (2018): 115-137.
Silva, T. C.; Tabak, B. M.; Ferreira, I. M. Modeling Investor Behavior Using Machine Learning: Mean-
Reversion and Momentum Trading Strategies. Hindawi. 2019.
Souza, C. S.; Iglesias, A.G; Pazin Filho, A. Estratégias inovadoras para métodos de ensino tradicionais –
aspectos gerais. Revista FMRP USP. 2014. https://www.revistas.usp.br/rmrp/article/view/86617/89547.
KOLB, D. A. Learning Style Inventary Technical Manual. Boston: Hay Mcber, 1976.
KOLB, D. A. Experimental learning: Experience as the source of learning and development. New Jersey:
Prentice-Hall, Englewood Cliffs, 1984.
Rideout, E. (2001). Transforming nursing education through problem-based learning. Sudbury, MA: Jones
and Bartlett Publishers
Sungur, S., & Tekkaya, C. (2006). Effects of problem-based learning and traditional instruction on self-
regulated learning. The journal of educational research, 99(5), 307-320. doi.org/10.3200/JOER.99.5.307-
320
Torp, L., & Sage, S. (2002). Problems as possibilities: Problem-based learning for K-12 education. ASCD.

17
Xu, M., Benson, S. N. K., Mudrey-Camino, R., & Steiner, R. P. (2010). The relationship between parental
involvement, self-regulated learning, and reading achievement of fifth graders: A path analysis using the
ECLS-K database. Social Psychology of Education, 13(2), pp. 237-269. doi: 10.1007/ s11218-009-9104-4
Zimmerman, B. J., & Martinez-Pons, M. (1986). Development of a Structured Interview for Assessing
Student Use of Self-Regulated Learning Strategies. American Educational Research Journal, 23, 614-628.
https://doi.org/10.3102/00028312023004614
Zimmerman, B. J., & Schunk, D. H. (Eds.). (2001). Self-regulated learning and academic achievement:
Theoretical perspectives. Routledge.

ANEXO

Tabela 4 - Composição dos cursos do IES contidos na variável “grupo”


Grupo área Descrição
702 = Matemática (Licenciatura)
904 = Letras-Português (Licenciatura)
905 = Letras-Português e Inglês (Licenciatura)
906 = Letras-Português e Espanhol (Licenciatura)
1402 = Física (Licenciatura)
Educação 1502 = Química (Licenciatura)
1602 = Ciências Biológicas (Licenciatura)
2001 = Pedagogia (Licenciatura)
2402 = História (Licenciatura)
3002 = Geografia (Licenciatura)
3502 = Educação Física (Licenciatura)
26=Design
83=Tecnologia Em Design De Moda
103=Tecnologia Em Design De Interiores
Humanidades e Artes 104=Tecnologia Em Design Gráfico
903 = Letras-Português (Bacharelado)
2401 = História (Bacharelado)
2501 = Artes Visuais (Licenciatura)
5401 = Ciências Sociais (Bacharelado)
102 = Tecnologia Em Comércio Exterior
100 = Administração Pública
94 = Tecnologia Em Logística
93 = Tecnologia Em Gestão Comercial
87 = Tecnologia Em Gestão Financeira
Ciências Sociais, Negócios e 86 = Tecnologia Em Gestão De Recursos Humanos
Direito 1 = Administração
2 = Direito
13 = Ciências Econômicas
18 = Psicologia
22 = Ciências Contábeis
81= Relações Internacionais
84 = Tecnologia Em Marketing
18
85 = Tecnologia Em Processos Gerenciais
106 = Tecnologia Em Gestão Pública
803 = Comunicação Social - Jornalismo
804 = Comunicação Social - Publicidade E Propaganda
91 = Tecnologia Em Gestão Hospitalar
5402 = Ciências Sociais (Licenciatura)
72 = Tecnologia em Análise e Desenvolvimento de
Sistemas
79 = Tecnologia em Redes de Computadores
701 = Matemática (Bacharelado)
Ciências, Matemática e 1601 = Ciências Biológicas (Bacharelado)
Computação 3001 = Geografia (Bacharelado)
55 = Biomedicina
4006 = Sistemas De Informação
6409 = Tecnologia em Gestão da Tecnologia da
Informação
21 = Arquitetura e Urbanismo
4003 = Engenharia Da Computação
5710 = Engenharia Civil
5806 = Engenharia Elétrica
5814 = Engenharia de Controle e Automação
Engenharia, Produção e 5902 = Engenharia Mecânica
Construção 6002 = Engenharia de Alimentos
6008 = Engenharia Química
6208 = Engenharia de Produção
6306 = Engenharia
6307 = Engenharia Ambiental
6405 = Engenharia Florestal
5 = Medicina Veterinária
Agricultura e Veterinária
90 = Tecnologia Em Agronegócios
6 = Odontologia
12 = Medicina
19 = Farmácia
23 = Enfermagem
27 = Fonoaudiologia
Saúde e Bem Estar Social
28 = Nutrição
36 = Fisioterapia
38 = Serviço Social
69 = Tecnologia Em Radiologia
3501 = Educação Física (Bacharelado)
29 = Turismo
88 = Tecnologia Em Gastronomia
Serviços
92 = Tecnologia Em Gestão Ambiental
95 = Tecnologia Em Estética E Cosmética
Fonte: elaboração própria.
Baseado nos questionários da ENADE, correspondente aos anos 2016, 2017 e 2018.

19

Você também pode gostar