Você está na página 1de 127

LEARNING

ANALYTICS:
ANÁLISE E
DESEMPENHO DO
ENSINO E
APRENDIZAGEM

Andrea Filatro

1
Editora Senac São Paulo – São Paulo – 2019

2
Sumário

Capítulo 1

Educação 3.0 – ajudando o estudante a assumir o prota-


gonismo do processo, por meio do learning analytics
1 As novas TAs e a geração de dados

2 Feedback e o protagonismo do aluno

3 Educação adaptativa

Considerações finais

Referências

Capítulo 2

Big Data e Data Mining: transformando dados em co-


nhecimentos para a área de educação
1 Processos de avaliação

2 Métricas de desempenho

3 Big data e educação

Considerações finais

Referências

Capítulo 3

Dados – informações – conhecimento – inteligência. Um


processo essencial para a educação para o século XXI
1 Transformando dados em conhecimento para a melhora do processo en-
sino-aprendizagem

2 Tipos de informações: desempenho, engajamento, presença, gestão, etc.

3
3 Enem/Enade – Como as avaliações externas geram informações sobre o
desempenho dos alunos e cursos

Considerações finais

Referências

Capítulo 4

LMSs e plataformas educacionais – como avaliar se um


ambiente é adequado para a nova educação?
1 Tipos de LMSs e quais dados eles podem extrair da participação e de-
sempenho dos alunos em cursos presenciais, híbridos e 100% on-line

2 Quais informações são importantes para a tomada de decisões?

3 Quais processos devem ser avaliados?

Considerações finais

Referências

Capítulo 5

Mobile Education – gerando dados de forma ubíqua e


pervasiva
1 Dados e informações em todos os lugares e a todo tempo

2 Analítica da aprendizagem móvel

3 Analítica da aprendizagem ubíqua

4 Trabalhando com processos avaliativos para mobile

Considerações finais

Referências

Capítulo 6

Estatística educacional e learning analytics

4
1 Estatística básica

2 Análise de clusters

3 Análise fatorial e regressão

Considerações finais

Referências

Sobre a autora

5
Capítulo 1

Educação 3.0 –
ajudando o estudante a
assumir o protagonismo
do processo, por meio
do learning analytics

Nosso objetivo neste capítulo é identificar as oportunidades e desa-


fios que esse novo cenário da Educação 3.0 oferece.

Para isso, vamos caracterizar essa nova geração educacional, em


contraponto às gerações da Educação 1.0 e Educação 2.0, destacando
tanto o protagonismo do aluno no processo de ensino-aprendizagem
como a evolução das tecnologias rumo à análise de dados educacionais.

Neste capítulo, começamos a discutir também o campo de learning


analytics e sua contribuição para a aprendizagem adaptativa.

Esse é só o começo da nossa jornada rumo à educação apoiada por


tecnologias inteligentes.

6
Você está convidado a fazer essa exploração conosco!

1 As novas TAs e a geração de dados


“Educação 3.0” é uma expressão utilizada por vários autores (KE-
ATS; SCHMIDT, 2007; LENGEL, 2012; GERSTEIN, 2014) para desig-
nar uma nova geração educacional, mais adequada à era digital. O termo
é importante em nossa discussão inicial sobre o tema deste livro, porque
fornece o pano de fundo para o surgimento e a consolidação do campo
denominado learning analytics.

Diversos autores enfatizam aspectos diferentes desse pano de fundo.


Moravec (2011), por exemplo, descreve a evolução da Socie-dade 1.0 do
século XIX (agrária e artesanal) para a Sociedade 2.0 do século XX (in-
dustrial e massificada), até chegar à Sociedade 3.0 do século XXI (tecno-
lógica, globalizada e inovadora).

Lengel (2012), por sua vez, caracteriza a evolução do Ambiente de


Trabalho 1.0 (no qual as ferramentas eram produzidas manualmente, e o
trabalho era realizado ao ar livre, por grupos de pessoas de diferentes
idades) para o Ambiente de Trabalho 2.0 (no qual as pessoas organizadas
em grupos que exerciam as mesmas atividades ao longo do dia passaram
a trabalhar em fábricas, basicamente em linhas de montagem para a pro-
dução em larga escala), até chegar ao Ambiente de Trabalho 3.0 (no qual
o trabalho voltou a ser realizado em grupos menores, formados por espe-
cialistas de diferentes áreas reunidos para resolver problemas complexos,
com o apoio de ferramentas digitais de informação e comunicação).

No campo educacional, os autores traçam um paralelo entre esses


cenários e três gerações educacionais com as quais convivemos nos últi-
mos séculos. De acordo com Keats e Schmidt (2007), a chamada Educa-

7
ção 1.0, vigente no século XIX, preparava as pessoas para o modo de
produção agrícola, com os alunos aprendendo em grupos heterogêneos e
de maneira bastante artesanal.

Já a Educação 2.0, que predominou no século XX e perdura até hoje


em muitas escolas e universidades, preparava as pessoas para o mundo
industrial, com os alunos divididos por idade e realizando também tare-
fas repetitivas e solitárias.

Por consequência, pelo menos em tese, a Educação 3.0 deveria


acompanhar as transformações na sociedade, no trabalho e da tecnologia,
a fim de preparar as pessoas para uma realidade pós-industrial, com alu-
nos e professores produzindo colaborativamente apoiados por ferramen-
tas digitais para resolver problemas reais.

Quadro 1 – Comparação da evolução da web, da educação e do


trabalho
FASE WEB EDUCAÇÃO TRABALHO
Sistema artesanal:
estudo se dá ao ar Campo: trabalho ao
Caracterizada por sites estáticos e livre, com ferra- ar livre, no campo,
com pouquíssima interação, cujo mentas simples e com ferramentas sim-
1.0
foco era o consumo das em pequenos gru- ples e manuais; gru-
informações. pos, formados por pos incluíam pessoas
pessoas de idades de diferentes idades.
diferentes.

Sistema padroniza-
Baseada na colaboração on-line,
do: estudo se dá em Indústria: trabalho se
na partilha de saberes, na difusão
grandes grupos, dá em fábricas, com
de informação e na interatividade
com pessoas de ferramentas mecâni-
2.0 homem-máquina, por meio de re-
mesma idade; local cas, em grandes gru-
des sociais, fóruns e chats apresen-
passa a ser fechado pos e a partir de tare-
tados como softwares livres, de
e atividades são fas repetitivas.
programação aberta e coletiva.
repetitivas.

Fonte: elaborado pela autora, com base em Sant’Ana, Suanno e Sabota (2017, p. 166) e Porvir
(s.d.).

8
FASE WEB EDUCAÇÃO TRABALHO

Multitarefa: trabalho
Transição: estudo
Agrega às funcionalidades das se dá em pequenos
ainda se organiza
versões anteriores a interpretação grupos interdiscipli-
em grandes grupos,
semântica dos dados do usuário nares, que resolvem
3.0 que fazem a mesma
durante sua navegação, a fim de problemas comple-
atividade ao mesmo
proporcionar uma experiência per- xos. Usam ferramen-
tempo; é preciso
sonalizada de uso da rede. tas digitais durante
nova configuração.
todo o dia.

Fonte: elaborado pela autora, com base em Sant’Ana, Suanno e Sabota (2017, p. 166) e Porvir
(s.d.).

O argumento geral em defesa da Educação 3.0 é que os alunos que


ocupam hoje os bancos escolares são os primeiros que cresceram num
mundo digital e, nesse novo cenário, a aprendizagem ocorre em qualquer
lugar e em qualquer tempo, mediada por tecnologias de informação e co-
municação que apoiam situações didáticas presenciais, híbridas e total-
mente a distância.

PARA SABER MAIS

Para compreender melhor a respeito de produção de conteúdos,


estratégias e práticas em esquema colaborativo e aberto como
característica da Educação 3.0, recomenda-se o artigo de Ale-
xandra Okada e Daniela Melaré Vieira Barros (2013) intitulado
“Os estilos de coaprendizagem para as novas características da
educação (3.0)”.

Vale destacar que a inserção das tecnologias na educação tem sido


gradual, como se fossem ondas de adoção cada vez mais complexas, em
um certo paralelo com o desenvolvimento da Web 1.0, 2.0 e 3.0. Por
consequência, a adoção das tecnologias da informação e comunicação
(TIC) do início da Educação 3.0 é bem diferente da educação colaborati-

9
va, ubíqua e pervasiva que se impõe nos últimos anos, abrindo caminho e
impulsionando novas metodologias como o learning analytics.

Além disso, devido à valorização do paradigma colaborativo e da


filosofia de abertura, o processo de aprendizagem é enriquecido através
de ampla participação. Alunos e professores são instigados a cocriar, rea-
daptar e reutilizar conteúdos e estratégias para aprender, de um modo
muito mais aberto do que nas gerações anteriores.

Adicionalmente, a coaprendizagem pode ocorrer em espaços múlti-


plos, incluindo os ambientes formais de ensino – como as escolas e as
universidades – tanto quanto as redes informais abertas, os espaços inte-
ligentes e ambientes personalizados da Web 3.0.

O quadro a seguir apresenta de modo esquemático as características


das três gerações educacionais, resumindo a perspectiva de vários auto-
res citados.

Quadro 2 – Características das gerações educacionais


EDUCAÇÃO EDUCAÇÃO
CARACTERÍSTICAS EDUCAÇÃO 2.0
1.0 3.0

Recursos educa-
cionais gratuitos /
abertos criados e
Direitos autorais e recur-
reutilizados por
Materiais tra- sos educacionais livres /
estudantes em vá-
dicionais de abertos para estudantes
Tipos de conteúdo rias instituições,
direitos dentro de um mesmo cur-
disciplinas, na-
autorais so ou disciplina, às vezes
ções, e comple-
entre instituições
mentados por ma-
teriais originais
criados para eles

Fonte: adaptado de Keats e Schmidt (2007) e Gerstein (2014).

10
EDUCAÇÃO EDUCAÇÃO
CARACTERÍSTICAS EDUCAÇÃO 2.0
1.0 3.0
Orquestrador da
Fonte de Guia e fonte de criação de conhe-
Papel do professor
conhecimento conhecimento cimento
colaborativo

Ativo, forte senso


de propriedade da
De passivo para sentido
própria educação,
Comportamento dos Absorvente ativo, com senso emergen-
cocriação de re-
alunos passivo te de propriedade da pró-
cursos e oportuni-
pria educação
dades, escolha
ativa
Atividades de
aprendizagem
Do tipo tradi- abertas e flexíveis
As atividades tradicionais
cional, como que se concen-
são realizadas por meio de
ensaios, traba- tram na promo-
tecnologias mais abertas
Atividades de lhos, testes e ção da criativida-
que permitem colaboração
aprendizagem algum traba- de dos estudan-
crescente, mas ainda con-
lho em grupo tes; redes sociais
finadas aos limites institu-
dentro da sala fora dos limites
cionais e de sala de aula
de aula tradicionais de
disciplina, curso,
instituição, nação
Receber, res-
Principais atividades Comunicar, contribuir e Conectar, criar e
ponder,
dos alunos colaborar construir
regurgitar
Tecnologias de participa- Tecnologias de
ção: mecanismos mais análise e interpre-
avançados de busca e sele- tação: aplicativos
Tecnologias ção, espaços de colabora- móveis, redes so-
de acesso: na- ção como blogs e wikis, ciais mundiais,
vegadores, distribuição de conteúdo mídias com con-
Tecnologias utilizadas
sistemas de através de RSS, podcas- teúdo rico, nu-
busca e con- ting, videocasting e scre- vens, agentes se-
sulta, e-mail encasting, bookmarking mânticos, ciência
social, compartilhamento dos dados,
de fotos, vídeos e outros interoperabilida-
artefatos de

Fonte: adaptado de Keats e Schmidt (2007) e Gerstein (2014).

11
Das várias características apontadas para a Educação 3.0, uma que
se aplica particularmente ao tema deste capítulo e ao livro como um todo
são as tecnologias de análise e interpretação, especialmente a ciência dos
dados, que, como veremos ao longo desta discussão, tem uma contribui-
ção importante para o processo de ensino-aprendizagem nos dias atuais.

2 Feedback e o protagonismo do
aluno
A evolução das gerações educacionais mostra como, ao longo do
tempo, os alunos passaram a ocupar um papel cada vez mais ativo, parti-
cipativo e construtivo na educação. Keats e Schmidt (2007) resumem os
pontos essenciais da Educação 3.0, que para eles evidenciam o protago-
nismo estudantil na Educação 3.0:

Quadro 3 – Pontos essenciais da Educação 3.0

Fonte: elaborado pelo autor, com base em Keats e Schmidt (2007).

12
1. O papel dos alunos se amplia para fazer escolhas de um modo diferente do que es-
tava disponível na Educação 1.0 e na Educação 2.0.
2. Mais do que receptores passivos de conhecimento, os estudantes se tornam produ-
tores de conteúdo de aprendizagem, e esse conteúdo pode ser reutilizado e até
mesmo liberado sob licenças abertas como Creative Commons, que permitem o
compartilhamento gratuito e a criação de obras derivadas.[1]
3. Os arranjos institucionais permitem a certificação da aprendizagem alcançada pe-
los alunos em diferentes contextos de aprendizagem, e não apenas dos cursos regu-
lamentados e ministrados por instituições reconhecidas.

Fonte: elaborado pelo autor, com base em Keats e Schmidt (2007).

Avançando um pouco mais, Gerstein (2014) afirma que, na Educa-


ção 3.0, os alunos tomam nas mãos o seu destino educacional e passam a
ser autores, condutores e avaliadores de suas próprias experiências de
aprendizagem. Nesse novo paradigma, são os alunos que determinam o
que querem aprender, e são eles que decidem quais são as estratégias de
estudo e as tecnologias preferenciais de como irão aprender. Além disso,
os alunos formam suas próprias comunidades de aprendizagem usando
as redes sociais e utilizam conhecimentos de outros aprendizes, educado-
res, especialistas e atores que estejam dispostos a compartilhar na busca
por conhecimento e solução de problemas.

IMPORTANTE

Diante das transformações socioeconômicas, político-sociais e


tecnológicas que caracterizam a Sociedade 3.0, o ambiente edu-
cacional está se aproximando hoje de um ponto de inflexão. Faz-
se necessário que as instituições de ensino deem um passo radi-
cal em direção à Educação 3.0, como caracterizamos aqui, para
que possam permanecer relevantes no cenário social e consigam
fincar sua posição de liderança no que diz respeito às ações edu-
cacionais do futuro.

13
É importante acrescentar que, no âmbito da Educação 3.0, todo esse
protagonismo dos alunos se torna mais acessível, mais visível e mais
passível de monitoramento e retroalimentação com o apoio de tecnologi-
as de aprendizagem baseadas em participação e análise/interpretação de
dados. Estamos falando aqui mais especificamente da chamada analítica
da aprendizagem, tradução para o termo learning analytics que dá título a
esta obra.

A analítica da aprendizagem é uma área de pesquisa e prática emer-


gente. A primeira conferência sobre o tema (LAK – learning analytics
and knowledge) só ocorreu em 2011, em Alberta, Austrália. Um ano de-
pois, surgiu a Society for Learning Analytics Research (SoLAR), sob a
presidência de um dos maiores representantes do conectivismo, George
Siemens.

Embora recente, a força da analítica da aprendizagem se revela no


paralelo feito com o emprego da análise de dados em outros setores da
sociedade. Assim, da mesma forma que Amazon, Netflix e Google têm
cada vez mais coletado, armazenado, tratado e interpretado dados dos
usuários para adaptar as recomendações e propagandas a seus consumi-
dores e potenciais clientes, os educadores, os pesquisadores e os próprios
alunos também podem se basear em dados para adaptar a proposta origi-
nal de um curso às necessidades e aos interesses individuais.

Da mesma forma que os analistas de negócios utilizam os dados re-


lacionados ao consumidor para atingir clientes potenciais e assim perso-
nalizar suas estratégias de marketing, a análise de aprendizagem utiliza
dados relacionados ao estudante para construir melhores soluções educa-
cionais, alcançar grupos de estudantes em situação de risco e avaliar se

14
os programas destinados a melhorar a retenção têm sido efetivos e de-
vem ser mantidos.

PARA PENSAR

Em alguns mercados como o do entretenimento e do comércio, o


consumidor assumiu nos últimos anos um novo papel muito mais
ativo. O presidente do Veduca, plataforma de ensino on-line,
Carlos Souza, explica:

Na indústria da música, há 15 anos atrás, o po-


der estava nas mãos das gravadoras. A tecnolo-
gia entrou e hoje o poder está com o consumidor
final, que escuta música, de modo que dá para
comprar on-line uma música só, sem ter que ir a
uma loja e comprar o CD todo. Isso acontece
também na indústria do entretenimento, basta
olhar para o grande exemplo da Netflix. E está
acontecendo na educação. (PORVIR, s.d.)

Vemos assim um paralelo entre o novo consumidor e o aluno


protagonista, ambos alinhados ao novo paradigma proposto pela
era digital.

De acordo com o Horizon Report 2015 – que investiga as tendênci-


as tecnológicas e metodológicas para as universidades brasileiras num
horizonte de cinco anos – a educação está embarcando em uma busca se-
melhante à da ciência dos dados aplicada em outras áreas, como negóci-
os, comércio e entretenimento. Só que, no campo educacional, o objetivo
é traçar o perfil dos alunos e coletar o maior número possível de informa-
ções sobre suas interações em atividades de aprendizagem on-line e mó-
vel, a fim de prover um feedback robusto sobre as ações realizadas e os
resultados alcançados (JOHNSON, 2015).

15
O propósito do learning analytics é, portanto, compreender o pro-
gresso dos alunos ao longo de um programa, curso ou disciplina, e quali-
ficar sua interação com conteúdos, ferramentas e pessoas. A partir dessa
compreensão embasada em dados, é possível construir melhores propos-
tas pedagógicas, capacitar os alunos a terem um papel proativo em sua
aprendizagem, identificar os alunos em situação de risco e avaliar fatores
que afetam a conclusão e o sucesso dos estudos.

Assim, como parte ciência dos dados educacionais, o learning


analytics é concebido como uma forma efetiva de avaliar as respostas
dos alunos, de fornecer feedback imediato e prever ajustes visando à
apresentação de conteúdos e à proposição de atividades de forma
personalizada.

3 Educação adaptativa
À medida que as instituições de ensino passam a adotar metodologi-
as híbridas, com ações presenciais complementadas por ações remotas, a
educação se realiza cada vez mais em ambientes e plataformas on-line.

Esses sistemas integrados de apoio à aprendizagem dispõem de so-


fisticadas ferramentas que podem rastrear o comportamento dos estudan-
tes e de recursos para coleta de dados objetivos, como o número de cli-
ques e o tempo gasto em uma página específica, tanto quanto são capazes
de capturar e lidar com informações cada vez mais sutis, como a resiliên-
cia e a assimilação de conceitos.

Um dos benefícios mais promissores desses mecanismos de análise


de dados é o seu potencial para informar o design instrucional proposto
e, por meio de ambientes de aprendizagem adaptativa, responder às
ações do aluno em tempo real.

16
Para educadores e pesquisadores, a análise de dados educacionais
propicia insights sobre a interação do aluno com textos on-line, materiais
didáticos e colegas. Os alunos também podem se beneficiar dessa análi-
se, por meio de softwares móveis e plataformas on-line que usam dados
específicos dos estudantes para produzir sistemas de apoio que atendam
às suas necessidades de aprendizagem.

PARA SABER MAIS

A Geekie[2] é uma plataforma on-line de ensino adaptativo que


mapeia os pontos fracos dos estudantes aplicando questões do
mesmo padrão do Exame Nacional do Ensino Médio (Enem).
Usando recursos adaptativos semelhantes aos encontrados no
Google e na Amazon, a plataforma analisa as necessidades do
aluno e sugere planos de estudo, indicando conteúdos disponí-
veis em acervo de mais de 600 videoaulas. Adicionalmente, a
plataforma permite que professores e gestores possam adotar ini-
ciativas pedagógicas para melhorar o desempenho de alunos ou
classes nos conteúdos em que se identificam mais dificuldades.

Num espectro mais amplo de análise, a ciência dos dados educacio-


nais possibilita a tomada de decisão informada em todos os níveis do sis-
tema educacional. Conclusões baseadas na análise de vários conjuntos de
dados podem ter implicações significativas nos órgãos administrativos e
governamentais, no sentido de indicarem as áreas para melhoria que per-
mitam alocar para questões específicas e, por fim, avaliar a efetividade
dos programas implementados.

Considerações finais

17
Por mais delineada que esteja a Educação 3.0 por diversos autores –
e ainda que a expressão Educação 4.0 também seja utilizada em algumas
publicações nacionais e internacionais, praticamente com os mesmos
princípios (CARVALHO NETO, 2017; HARKINS, 2008) –, Lengel
(2012) argumenta que a escola e a universidade atual não evoluíram para
acompanhar as demandas da contemporaneidade. Pelo contrário, conti-
nuam seguindo um modelo fabril, com aulas padronizadas e atividades
repetitivas, pouco adequadas ao momento que vivemos.

De fato, não é difícil perceber que existe um gap entre o que a soci-
edade exige e o que as instituições formais oferecem. No entanto, viven-
ciamos a expansão da educação a distância e dos modelos híbridos, que
representam uma brisa de inovação em relação às ações educacionais
convencionais.

Quanto à incorporação de tecnologias inteligentes como a analítica


de dados, iniciativas e projetos pontuais indicam o impacto potencial
desse campo de pesquisa e prática, especialmente na concepção de ambi-
entes de aprendizagem personalizados e on-line.

Nosso desafio nos capítulos seguintes é desvendar os meandros des-


sa área tão promissora e relacioná-la a outros movimentos emergentes
em educação apoiada por tecnologias.

Referências
BARROS, Daniela; OKADA, Alexandra. Os estilos de coaprendizagem
para as novas características da Educação 3.0. In: GOMES, Maria João;
OSÓRIO, Antonio José; RAMOS, Altina; SILVA, Bento Duarte da; VA-
LENTE, Luís (Org.). Atas da VIII Conferência Internacional de TIC

18
na Educação Challenges 2013: Aprender a qualquer hora e em qualquer
lugar. Braga, Portugal, 2013, pp. 1208-1222.

CARVALHO NETO, Cassiano Zeferino. Educação 4.0: princípios e prá-


ticas de inovação em gestão e docência. Laborciência, 2017.

GERSTEIN, Jackie. Moving from Education 1.0 through Education 2.0


towards Education 3.0. Experiences in self-determined learning. Boi-
se: Boise State University, 2014, p. 83-98.

HARKINS, Arthur M. Leapfrog Principles and Practices: Core Com-


ponents of Education 3.0 and 4.0. Futures Research Quarterly Draft VIII,
2008: 1-15.

JOHNSON, L. et al. NMC Horizon Report: 2015 Higher Education


Edition. Austin, Texas: The New Media Consortium, 2015.

KEATS, Derek W.; SCHMIDT, Philipp J. The genesis and emergence of


education 3.0 in higher education and its potential for Africa. First Mon-
day, v. 12, n. 3, march, 2007.

LENGEL, James. Education 3.0: seven steps to better schools. Teachers


College, Columbia University, NY, 2012.

MORAVEC, John W. Desde la sociedad 1.0 a la sociedad 3.0. In: COBO


ROMANÍ, Cristóbal; MORAVEC, John W. (Org.). Aprendizaje invisi-
ble. Hacia una nueva ecología de la educación. Barcelona: Publicaci-
ons i Edicions de la Universitat de Barcelona, 2011. p. 47-74.

PORVIR. Personalização: educação sob medida. [s.d.]. Disponível em:


<http://porvir.org/especiais/personalizacao/>. Acesso em: 5 jan. 2018.

SANT’ANA, Jonathas Vilas Boas de; SUANNO, João Henrique; SABO-


TA, Barbra. Educação 3.0, complexidade e transdisciplinaridade: um es-

19
tudo teórico para além das tecnologias. Revista Educação e
Linguagens, Campo Mourão, v. 6, n. 10, jan./jun. 2017.

20
[1] Há que se observar, contudo, que liberar ou não uma obra para com-
partilhamento livre e gratuito é uma decisão do(s) autor(es), não do pú-
blico que usufrui da obra. E, nesse sentido, é importante considerar tam-
bém que esse conceito ainda é questionado por alguns especialistas em
direitos autorais, que não veem amparo legal para esse tipo de licença.
De todo modo, o que se destaca aqui é a democratização na produção e
na distribuição do conhecimento, uma característica incontestável da
Educação 3.0.

[2] Disponível em: <http://www.geekie.com.br/>. Acesso em: 5 jan.


2018.

21
Capítulo 2

Big Data e Data Mining:


transformando dados
em conhecimentos para
a área de educação

Nosso objetivo neste capítulo é compreender a importância da pro-


dução e análise de dados durante o processo de ensino-aprendizagem.
Para isso, vamos explorar os conceitos de data mining, educational data
mining e big data, termos em inglês que têm aparecido com cada vez
mais frequência nas discussões sobre educação. Vamos abordar também
qual é a relação desses conceitos com a avaliação e o desempenho dos
alunos.

Para iniciar, vamos partir da conceituação sobre o que é data mining


(DM ou, em português, “mineração de dados”, como vamos adotar a par-
tir de aqui). Trata-se de um campo emergente de pesquisa e prática inter-
disciplinar, que combina análise estatística de dados, aprendizagem de
máquina (machine learning),[1] reconhecimento de padrões e visualiza-

22
ção de dados. É também conhecido como educational data mining (EDM
ou, em português, “mineração de dados educacionais”).

A Sociedade Internacional de Mineração de Dados Educacionais


define a área como

uma disciplina emergente, ocupada com o desenvolvimento de mé-


todos para explorar tipos exclusivos de dados provenientes de ambi-
entes educacionais e usar esses métodos para entender melhor os
alunos e os ambientes em que eles aprendem. (SIEMENS; BAKER,
2012, livre tradução)

Isso se dá pelo desenvolvimento ou adaptação de métodos e algorit-


mos de mineração existentes, para que se prestem a compreender melhor
os dados produzidos principalmente por alunos e professores.

De fato, muitas instituições educacionais fazem uso de ambientes


virtuais de aprendizagem (AVAs) ou outras tecnologias de apoio ao pro-
cesso de ensino-aprendizagem e, por consequência, produzem grande vo-
lume de dados de várias fontes, em diferentes formatos e em diferentes
níveis de granularidade.

Diante desse cenário, as questões que intrigam a área de mineração


de dados educacionais abrangem: O que fazer com esses dados educacio-
nais? Como reverter estas informações extraídas em benefícios para as
instituições, para alunos e professores envolvidos em um curso ou outra
situação didática? Como professores e alunos podem identificar e utilizar
as informações ocultas nos dados coletados?

De acordo com Costa et al. (2012), a mineração de dados pode ser


vista como a etapa principal de um processo mais amplo conhecido
como “descoberta de conhecimento em bases de dados” (do inglês kno-
wledge discovery in databases, ou KDD). As etapas que a antecedem e a

23
sucedem são o pré-processamento de dados (ou seja, a preparação de da-
dos, abrangendo mecanismos para captação, organização e tratamento
dos dados) e o pós-processamento dos resultados obtidos na etapa de
mineração.

Agora, como os dados podem ser transformados em conhecimento?


Através da identificação de padrões nos muitos dados coletados e tam-
bém da identificação de desvios aos padrões esperados, para compor in-
formações que tragam algum benefício novo e posam ser compreendidas
rapidamente pelos usuários para uma possível tomada de decisão.

Estamos falando, na verdade, de fazer as tecnologias trabalharem de


modo mais intenso nos processos de avaliação da aprendizagem, tema da
nossa próxima seção.

1 Processos de avaliação
Para compreender o potencial da mineração de dados educacionais
nos processos avaliativos, vamos considerar primeiro as três categorias
básicas de avaliação empregadas na aprendizagem:

1. Avaliação diagnóstica – verifica o rendimento global do aluno NO


INÍCIO de uma unidade de estudo, curso ou programa, para fins de
avanço em um curso ou para certificação.

2. Avaliação formativa – ocorre DURANTE a situação didática e re-


troalimenta o processo de ensino-aprendizagem.

3. Avaliação somativa – verifica o rendimento global do aluno AO


FINAL de uma unidade de estudo, curso ou programa, para fins de
avanço em um curso ou para certificação.

24
Sabemos que as tecnologias têm sido usadas há tempos na avaliação
diagnóstica (na aplicação de pré-testes, por exemplo); e o mesmo pode
ser dito com respeito à avaliação somativa (nos exames de larga escala,
como a Prova Brasil, o Saeb, o Enem, o Enade, por exemplo). Podemos
dizer, contudo, que sua utilização na avaliação formativa, comparativa-
mente, é (ou era) menos frequente, devido à dificuldade de aplicar várias
avaliações estruturadas ao longo do processo.

Mas essa realidade muda com a mineração de dados educacionais,


cujo objetivo não é apenas transformar os dados em conhecimento, mas
filtrar o conhecimento minerado para a tomada de decisões sobre como
melhorar a aprendizagem dos alunos.

Podemos falar, portanto, também no uso da mineração de dados


como um tipo de avaliação formativa, aquela que ocorre enquanto um
curso ou programa ainda está no ar, o que permite melhorá-lo continua-
mente por meio de retroalimentação (feedback) ao sistema.

Traduzindo: analisar como os alunos exploram o ambiente de apren-


dizagem permite avaliar a proposta de um curso de maneira formativa, a
partir dos resultados de sua implementação. Isso ajuda professores, de-
signers educacionais a projetar ou a modificar a abordagem adotada.

Além disso, o conhecimento descoberto pode ser usado não apenas


por designers educacionais e professores, mas também pelos usuários fi-
nais, os estudantes. Assim, a aplicação da mineração de dados em siste-
mas educacionais pode ser orientada para apoiar as necessidades especí-
ficas de cada uma dessas categorias de partes interessadas.

Isso é especialmente útil no contexto da educação a distância


(EAD), em função da distância física e temporal entre alunos, professo-
res e a instituição. Na EAD, o êxito dos cursos depende de sistemas efi-

25
cazes de acompanhamento e avaliação para que dificuldades específicas
dos alunos possam ser identificadas e, a partir daí, endereçadas pelos
professores ou pelo sistema. Como já afirmavam Moore e Kearsley
(2007, p. 30):

Uma das poucas generalizações que se pode fazer a respeito de


qualquer programa de educação a distância – seja qual for a tecnolo-
gia de comunicação usada e o nível de conteúdo – é que um bom
sistema de monitoramento e avaliação pode conduzir a um progra-
ma bem-sucedido, ao passo que um sistema ruim quase certamente
levará ao fracasso.

Como podemos ver na figura 1, um sistema de monitoramento e


avaliação envolve um fluxo de ações que, apoiadas por técnicas de mine-
ração de dados, podem ser empreendidas de maneira mais informada
para apoiar o design e a implementação de sistemas e ambientes
educacionais.

Figura 1 – Aplicando a mineração de dados ao


design de sistemas e ambientes educacionais

Fonte: adaptado de Romero et al. (2011, p. 3).

26
Assim, educadores e designers instrucionais que atuam em escolas,
universidades e outras instituições de ensino realizam ações como proje-
tar, planejar, construir e manter sistemas educacionais. Os alunos usam
esses sistemas para aprender.

Com base na informação disponível sobre cursos, alunos, uso do


ambiente e interação, as técnicas de mineração de dados podem ser apli-
cadas para descobrir conhecimentos úteis que ajudem a melhorar os pro-
jetos e sistemas educacionais.

O conhecimento minerado entra no ciclo de design para orientar,


facilitar e melhorar a aprendizagem como um todo.

2 Métricas de desempenho
Há muitos exemplos de aplicação da mineração de dados em ambi-
entes educacionais. Entre eles, a predição do desempenho dos alunos é
uma das mais antigas e mais populares.

De fato, as pesquisas em mineração de dados educacionais vêm ofe-


recendo contribuições teóricas e práticas significativas para a melhoria
nos modelos de conhecimento do estudante em diferentes áreas de co-
nhecimento, como ensino de língua estrangeira, geometria, química, físi-
ca e outros. Observa-se uma redução considerável do tempo gasto pelos
alunos para desenvolver suas habilidades acadêmicas, principalmente em
áreas como a matemática.

Alguns modelos automatizados são baseados em algoritmos capazes


de identificar, em tempo real, até mesmo quando alunos que estão estu-
dando em ambientes virtuais de aprendizagem tentam conseguir melho-
res notas sem ter de fato aprendido o conteúdo adequadamente. Essa fun-

27
cionalidade permite que sistemas educacionais apresentem comporta-
mentos “inteligentes”, ofereçam suportes e feedbacks apropriados.

Baker et al. (2006) descrevem um exemplo deste tipo de sistema in-


teligente, no qual um personagem (um cachorrinho de nome Scooter) re-
age de acordo com o comportamento apresentado pelo aluno. Quando o
aluno interage com o sistema computacional de forma adequada, o per-
sonagem faz sinal de positivo. Quando o aluno tenta pedir ajuda ao siste-
ma diversas vezes para obter a resposta final de um exercício sem ao me-
nos tentar resolvê-lo, o personagem muda seu comportamento.

E, como o sistema não possui dados suficientes para determinar se o


aluno realmente aprendeu ou não o conteúdo desejado, então a persona-
gem Scooter tenta diagnosticar o conhecimento do aluno através de uma
sequência perguntas adicionais a fim de verificar se o aluno aprendeu o
conteúdo corretamente, orientando-o a revisar o conteúdo caso isso não
tenha ocorrido.

PARA SABER MAIS

O exemplo do sistema inteligente que utiliza a personagem Sco-


oter para interagir com os alunos é descrito no artigo “Mineração
de dados educacionais: oportunidades para o Brasil”, de Ryan
Shaun Joazeiro de Baker e colegas, publicado na Revista Brasi-
leira de Informática na Educação, v. 19, n. 2, 2011 (disponível
na Web, em português). Nesse artigo, você encontra outros
exemplos de aplicação da mineração de dados educacionais no
Brasil.

Baker et al. (2011) destacam o fato de que, no Brasil, analisar e


compreender o desempenho dos alunos é um desafio considerável devido
à diversidade da população. Nesse sentido, por reconhecer uma correla-

28
ção entre dados socioculturais dos alunos e suas ações, atitudes e com-
portamentos durante a aprendizagem, a mineração de dados educacionais
pode oferecer apoio ao aluno de acordo com sua personalidade, religião,
raça, cultura, idade, sexo, etc., proporcionando a cada indivíduo uma ex-
periência única.

Uma pesquisa brasileira que merece destaque nessa área é apresen-


tada por Kampff (2009), que identifica comportamentos e características
de alunos com alto risco de evasão ou reprovação em ambientes vir­tuais
de aprendizagem. O sistema alerta o professor para tomar as devidas
providências.

Outra pesquisa interessante é apresentada por Pimentel e Omar


(2006), que utilizam técnicas da EDM para identificar as relações entre
medidas de conhecimento (cognitivas) e medidas metacognitivas. As
medidas cognitivas retratam o real desempenho do aluno na resolução de
cada problema, enquanto as medidas cognitivas indicam o grau de cons-
ciência (awareness) do aluno em relação ao seu próprio conhecimento.

3 Big data e educação


A expressão big data é autoexplicativa, e uma definição mais preci-
sa abrange “as tecnologias que gerenciam e analisam informações em
variedade, volume e velocidade enormes” (GABRIEL, 2013, p. 31).

A ideia de big data na educação pode parecer nova, mas ela está
presente desde 1995, quando Agrawal e Srikant apresentaram o primeiro
trabalho relacionado à mineração de dados educacionais.

Uma década depois, em 2005, foi realizado o primeiro evento ofici-


al utilizando o termo no título “Workshop on Educational Data Mining”,

29
realizado em Pittsburgh, Estados Unidos (FILATRO; CAVALCANTI,
2018; BAKER; INVENTADO, 2014).

A partir de então, a mineração de dados educacionais só tem evoluí-


do e se especializado para lidar com as massivas quantidades de dados,
geradas principalmente em contextos de educação a distância e educação
presencial apoiada por mídias e tecnologias.

Mas quais seriam esses grandes dados gerados no contexto educaci-


onal? Filatro e Cavalcanti (2018) listam os principais:

dados de conclusão, permanência e evasão;

dados de aprovação e reprovação;

dados de acesso a recursos didáticos como textos, imagens, vídeos,


áudios, animações, infográficos;

dados de participação em atividades de aprendizagem como questi-


onários fechados, atividades abertas, fóruns de discussão;

dados de desempenho em atividades de aprendizagem e de


avaliação;

dados de interação social (relacionamento com colegas de estudo e


professores, por exemplo);

dados de avaliação de reação;

dados de pesquisa de satisfação.

Na EAD e em ações presenciais que utilizam ambientes virtuais de


aprendizagem e outros sistemas computacionais com capacidade de re-
gistrar os dados de alunos e da equipe docente, é mais simples reconhe-
cer como e onde a maioria desses dados é coletada e armazenada. Em

30
geral, os diferentes sistemas computacionais utilizados para apoiar a
aprendizagem costumam centralizar, em um único local, registros das
ações de ensino-aprendizagem executadas por estudantes e educadores.

Na educação convencional, que é predominantemente presencial,


esses registros costumam estar mais dispersos em tabelas ou planilhas
eletrônicas segundo as prioridades e interesses de professores e gestores.
A exceção são os dados de avaliação final e certificação, armazenados
por obrigatoriedade legal, quando muito, em sistemas de gestão
escolar/acadêmica.

No entanto, além da vasta quantidade de dados, o que caracteriza o


big data é também sua velocidade e variedade, aspectos que precisam ser
igualmente considerados. Esse é o campo de atuação da mineração de
dados educacionais.

O fato é que na mineração de dados educacionais a descoberta da


informação é automática, realizada por meio de técnicas especializadas
como as descritas brevemente no quadro a seguir.

Quadro 1 – Principais técnicas de mineração de dados


TÉCNICA DESCRIÇÃO
Predição Prevê o desempenho do aluno e detecta seus comportamentos

Agrupa conjuntos de dados de cursos ou dados de alunos com base em


Clusterização
sua aprendizagem e padrões de interação

Mineração de
Identifica relações nos padrões de comportamento dos alunos e diagnosti-
relaciona-
ca dificuldades de aprendizagem
mentos

Destilação de
dados para Representa os dados de forma mais compreensível usando técnicas de
julgamento visualização de informação
humano

Fonte: adaptado de Faria (2014, p. 27-29).

31
TÉCNICA DESCRIÇÃO

Identifica dados significativamente diferentes dos demais, incluindo alu-


Detecção de nos com dificuldades de aprendizagem, desvios nas ações ou comporta-
diferenças mentos de professores ou alunos e irregularidades nos processos de
aprendizagem
Analisa as relações sociais em termos de nós e conexões/ligações, em es-
Análise de
pecial aquelas que acontecem através de ferramentas de comunicação
redes sociais
como fóruns e chats
Mineração de Extrai conhecimento relacionado à evolução e ao desempenho dos alunos
processos durante o percurso escolar ou acadêmico
Mineração de Analisa o conteúdo de fóruns, chats, páginas web e documentos a fim de
texto gerar informações qualidade

Rastreio de
Usa modelos cognitivos para comparar competências identificadas e as
conhecimen-
respostas dos alunos ao longo de um período de tempo
to

Fonte: adaptado de Faria (2014, p. 27-29).

Como podemos perceber, a mineração de dados educacionais é um


campo de grandes possibilidades a ser conhecido e explorado. O imenso
poder computacional de coletar, tratar e transformar dados relativos à
aprendizagem humana pode subsidiar de fato a tomada de decisão por
professores, especialistas, designers instrucionais e gestores, propiciando
processos de avaliação contínua e efetiva capazes de alterar o rumo da
prática e da pesquisa em educação.

Considerações finais
A geração e o armazenamento de dados sobre o ensino-aprendiza-
gem em grandes quantidades são possibilitados hoje por sistemas com-
putacionais de apoio à aprendizagem. Seja no contexto da educação a
distância ou da educação presencial mediada por tecnologias, pratica-

32
mente tudo o que os alunos e os professores fazem nos am­bientes virtu-
ais de aprendizagem é rastreado e monitorado.

Essa riqueza de dados precisa ser transformada em conhecimento


que subsidie a melhoria dos processos, de preferência a tempo de corrigir
rotas e prover caminhos alternativos a alunos, educadores, modelos pe-
dagógicos e instituições de ensino.

A mineração de dados educacionais fornece a fundamentação teóri-


co-prática para essa verdadeira revolução na forma de entender como se
dá a aprendizagem e de oferecer ensino compatível às necessidades dos
alunos.

Nos capítulos seguintes, aprofundaremos a discussão sobre essas


potencialidades e sobre as técnicas que possibilitam usar com inteligên-
cia os vastos dados educacionais disponíveis.

Referências
AGRAWAL, Rakesh; SRIKANT, Ramakrishnan. Mining sequential pat-
terns. In: Eleventh international conference on data engineering. Tai-
pei, Taiwan: IEEE Computer Society Press, 1995, pp. 3-14.

BAKER, Ryan S. J.; INVENTADO, Paul S. Educational Data Mining


and Learning Analytics. In: LARUSSON, J. A.; WHITE, B. [Eds.].
Learning Analytics: From Research to Practice. Springer New York,
2014, pp. 61-75.

BAKER, Ryan Shaun Joazeiro de et al. Adapting to When Students


Game an Intelligent Tutoring System. In: Proceedings of the Internati-
onal Conference on Intelligent Tutoring Systems, 2006, pp. 392-401.

33
BAKER, Ryan Shaun Joazeiro de; ISOTANI, Seiji; CARVALHO, Adria-
na Maria Joazeiro Baker de. Mineração de Dados Educacionais: Oportu-
nidades para o Brasil. Revista Brasileira de Informática na Educação,
v. 19, n. 2, 2011.

COSTA, Evandro et al. Mineração de Dados Educacionais: Conceitos,


Técnicas, Ferramentas e Aplicações. Anais da Jornada de Atualização
em Informática na Educação – JAIE 2012.

FARIA, Susana Maria Sousa Martins Leite de. Educational Data Mi-
ning e Learning Analytics na melhoria do ensino on-line. 2014. 138 f.
Dissertação (Mestrado em Estatística, Matemática e Computação) – Uni-
versidade Aberta de Portugal, 2014.

FILATRO, Andrea; CAVALCANTI, Carolina. Metodologias inov-ati-


vas em educa­ção presencial, a distância e corporativa. São Paulo: Sa-
raiva Somos, 2018.

GABRIEL, Martha. Educ@R: A (r)evolução digital na educação. São


Paulo: Saraiva, 2013.

KAMPFF, Adriana J. C. Mineração de dados educacionais para gera-


ção de alertas em ambientes virtuais de aprendizagem como apoio à
prática docente. 2009. 186 f. Tese (Doutorado em Informática na Edu-
cação) – Universidade Federal do Rio Grande do Sul, 2009.

MOORE, Michael G.; KEARSLEY, Greg. Educação a distância: uma


visão integrada. São Paulo: Thomson Learning, 2007.

PIMENTEL, Edson P., OMAR, Nizam. Descobrindo Conhecimentos em


Dados de Avaliação da Aprendizagem com Técnicas de Mineração de
Dados. Workshop sobre Informática na Escola. Anais do Congresso da
Sociedade Brasileira de Computação, pp. 147-155, 2006.

34
ROMERO, Cristóbal et al. Handbook of Educational Data Mining.
Boca Raton, FL: CRC Press, 2011.

ROMERO, Cristóbal; VENTURA, Sebastian. Data mining in education.


WIREs Data Mining Knowl Discov, 2013.

SIEMENS, George; BAKER, Ryan S. J. Learning Analytics and Educa-


tional Data Mining: Towards Communication and Collaboration. In:
Proceedings of the 2nd International Conference on Learning Analy-
tics and Knowledge. ACM Press, 2012.

35
[1] Machine learning (aprendizado de máquina) – habilidade dos siste-
mas computadorizados de melhorar seu entendimento e desempenho por
meio de modelos matemáticos e descoberta de padrões de dados, que são
usados para fazer predição sem que tenham sido previamente configura-
dos para isso (FILATRO; CAVALCANTI, 2018).

36
Capítulo 3

Dados – informações –
conhecimento –
inteligência. Um
processo essencial para
a educação para o
século XXI

Nosso objetivo neste capítulo é identificar as melhores práticas para


a manipulação de dados que gerem informações importantes, de forma a
produzir conhecimento que seja transformado em inteligência para o pro-
cesso educacional.

Para isso, vamos iniciar explorando conceitos centrais da área de


computação – dado(s), informação, conhecimento e inteligência, para, a
partir daí, identificar quais são os principais tipos de dados e informações
de interesse no campo da educação.

37
A fim de complementar e ilustrar essa discussão, vamos analisar
ainda aspectos relacionados a dados e informações sobre o desempenho
de alunos e de cursos através dos grandes sistemas de avaliações nacio-
nais como o Enem e o Enade.

1 Transformando dados em
conhecimento para a melhora do
processo ensino-aprendizagem
Segundo definições de dicionários reconhecidos como o brasileiro
Houaiss e o inglês Oxford, podemos dizer que, na área da ciência da
computação, dado é uma informação (ou um pedaço de informação) ca-
paz de ser processada(o) por um computador.

De forma mais específica, Semidão (2014, pp. 96, 98, 99), a partir
de um exaustivo estudo sobre a tríade dados-informações-conhecimen-
tos, apresenta definições variadas que nos ajudam a entender melhor o
conceito de dado(s):

“O que é dado”, frequentemente usado como um substantivo singu-


lar coletivo. Fatos, figuras, ou instruções apresentadas em forma
passível de ser compreendida, interpretada e comunicada por um ser
humano ou processada por um computador. (Online Dictionary for
Library and Information Science, verbete “data”, s.p.)

Termo geral usado para expressar informação quantitativa ou nume-


ricamente codificada; termo particularmente utilizado para descrever
informações armazenadas numa base de dados. (International Ency-
clopedia of Information and Library Science, p. 120)

Representações (digitais) binárias de fatos atômicos, especialmente


de transações financeiras. […] Combinação de fatos e significados
que são processados para resultar em informação […] Dados são
portadores de conhecimento e de informação. Eles consistem essen-

38
cialmente de sinais e são a matéria-prima a ser processada. Os dados
representam observações ou fatos fora de contexto, e não são direta-
mente significativos. Tanto a informação quanto o conhecimento são
comunicados por meio de dados. (Dictionary of Information Science
and Technology, p. 152)

Tendo em vista essas definições, informação é, por decorrência, o


resultado, o produto, do processamento de dados. A informação pode ser
apresentada de diversas formas, como textos, gráficos, tabelas, sons e
animações, entre outros, conforme a necessidade de quem a utiliza.

Definições mais específicas para o conceito de informação são sele-


cionadas por Semidão (2014, pp. 110, 111, 114):

Conjunto de dados que foi processado até ganhar uma forma signifi-
cativa. Vista dessa forma, informação é um conjunto de dados reuni-
dos em uma forma compreensível; forma capaz de comunicação e
de utilização; a essência do que é um significado foi anexado aos
fatos brutos. (International Encyclopedia of Information and Library
Science, p. 244)

Reunião de dados expressa em uma forma compreensiva e capaz de


ser comunicada. (Harrod’s Librarians’ Glossary, p. 111)

Conhecimento que é comunicado. (The Epistemological Lifeboat,


verbete “information”, s.p.).

Conhecimento registrado ou comunicado (British Standards, verbete


“information”, s.p.).

Quanto ao conceito de conhecimento, este pode ser entendido como


sinônimo do termo entendimento e está muito mais ligado à pessoa (ou
organização) que o possui do que a algo externo e objetivado. Mais uma
vez, recorremos ao estudo de Semidão (2014, pp. 124, 125, 133-134)
para elencar diversas definições do conceito de conhecimento:

39
Informação compreendida sob a luz da experiência e incorporada no
entendimento intelectual dos que conhecem algo sobre algum obje-
to. (Online Dictionary for Library and Information Science, verbete
“knowledge”, s.p.).

Informação avaliada e organizada na mente humana, de modo a po-


der ser utilizada propositadamente (International Encyclopedia of
Information and Library Science, p. 342).

Conjunto formado por informação, regras, interpretações e cone-


xões, localizadas dentro de um contexto e uma experiência, adquiri-
do por uma organização, bem de uma forma individual ou institucio-
nal. O conhecimento só reside em um conhecedor, uma pessoa espe-
cífica que o interioriza racional ou irracionalmente. (Hernández Ló-
pez, verbete “knowledge”, s.p.).

Toda a alteração provocada no estado cognitivo do indivíduo, isto é,


no seu estoque mental de saber acumulado, proveniente de uma in-
teração positiva com uma estrutura de informação (Aldo de Albu-
querque Barreto, verbete ”conhecimento”, s.p).

Na verdade, podemos considerar dois tipos de conhecimento: o co-


nhecimento tácito, subjetivo e impalpável, que está na mente das pessoas
e é relativamente dinâmico. Este se refere a um sistema de ideias resul-
tante de experiências, contextos, interpretação e reflexão, que é difícil de
ser formalizado, transferido ou explicado a outra pessoa. O conhecimen-
to explícito, por sua vez, é relativamente estável e pode ser expresso,
verbalizado e formalizado em textos, gráficos, tabelas, figuras, desenhos,
esquemas, diagramas, etc. (TAKEUCHI; NONAKA, 2008). Como pode-
mos imaginar, a “transição” entre conhecimento tácito e explícito é uma
meta importante na gestão do conhecimento dentro de qualquer organi-
zação, em especial, as que lidam com a educação. E, nesse sentido, como
temos visto até aqui, as áreas de mineração de dados educacionais e lear-
ning analytics oferecem métodos e ferramentas capazes de capturar e tra-
tar grandes quantidades de dados de tal modo que eles possam ser trans-

40
formados em conhecimento explícito, muitas vezes confirmando e outras
vezes colocando em xeque conhecimentos tácitos cultivados por educa-
dores e gestores.

Retomando o vocabulário discutido, de acordo com Pinheiro


(2005), podemos identificar uma cadeia conceitual que vai desde o dado
até a informação e o conhecimento. Essa cadeia envolve uma crescente
complexidade, que começa na forma bruta e primitiva do dado até sua
elaboração como informação, chegando à sua absorção pela estrutura
cognitiva humana, quando se transforma em conhecimento.

O quadro a seguir resume esses três conceitos essenciais:

Quadro 1 – Conceitos essenciais da ciência computacional


Elemento primário; isento de significação; número; símbolo; pri-
DADO(S) meira percepção; elemento material; externo à mente; indício; in-
sumo para informação; ligado à tecnologia computacional.

Reunião de dados; dados processados; agregação de semântica


aos dados; conhecimento registrado; insumo para o conhecimen-
INFORMAÇÃO
to; sinal comunicado; mensagem; nota; notícia; novidade; pré-
cognição.
Informação aplicada em um contexto; informação para tomada de
CONHECIMENTO decisão; culminância do processo cognitivo; memória; cabedal de
informações na mente; tácito; individual; social; organizacional.

Fonte: Semidão (2014, pp. 184-185).

Já virou um clássico das redes sociais a ilustração de David Somer-


ville (2014), para ilustrar o post intitulado Information is not power [In-
formação não é poder] e representar graficamente essa tríade, agregando
ainda os conceitos de insight e sabedoria.

41
Figura 1 – A cadeia conceitual para dados,
informação, conhecimento, insight e sabedoria

Fonte: Somerville (2014).

Como mostra a figura, o insight está relacionado à capacidade de


enxergar conexões entre pontos de dados que outras pessoas ainda não
enxergaram, criando novos dados, informações e conhecimentos. Aqui a
mineração e a analítica de dados educacionais são de grande ajuda, na
medida em que a capacidade computacional no tratamento de grandes
quantidades de dados pode despertar insights que um ser humano ou
mesmo um grupo de seres humanos levaria muito tempo para identificar.

Já a sabedoria pode ser considerada a capacidade de uma pessoa co-


locar em prática o conhecimento que possui, na vida pessoal ou profissi-
onal. Aqui podemos dizer que temos o campo de atuação exclusivamente
humano, em que as pessoas dão sentido aos dados, às informações, aos
conhecimentos e aos insights produzidos ou provocados pelas tecnologi-
as e os utilizam para a tomada de decisão em situações reais.

42
PARA PENSAR

Nos últimos anos até a exclusividade humana de demonstrar sa-


bedoria vem sendo questionada pelos desenvolvimentos recentes
da inteligência artificial. A partir dessas funcionalidades, robôs
de última geração se mostram capazes de tomar inúmeras deci-
sões relativas à vida prática. Por exemplo, aparelhos eletrodo-
mésticos inteligentes decidem quando acionar determinados pro-
gramas para limpar um recinto conforme o nível de sujeira iden-
tificado, ou carros sem motoristas decidem quais percursos reali-
zar a partir da análise de inúmeras variáveis capturadas por
sensores.

De acordo com García-Marco (2011), a distinção entre conhecimen-


to e sabedoria se acentua durante a industrialização e se aprofunda com a
explosão das informações na Sociedade do Conhecimento. Nessa pers-
pectiva, informação e conhecimento estão muito mais ligados ao desen-
volvimento dos meios de comunicação coletivos, como a im-prensa e o
cinema, inicialmente, e logo depois o rádio e a televisão, até chegarmos
hoje à internet.

Assim, o avanço do conhecimento técnico e científico, bem como as


profundas mudanças sociais decorrentes da digitalização, gerou uma de-
marcação importante no próprio conceito de conhecimento: durante sé-
culos o conhecimento esteve mais ligado ao saber teórico e ao saber vi-
ver e agora evoluiu desse patamar mais abstrato para outro mais aplica-
do, pragmático e contextual.

Num paralelo, como vimos anteriormente, a mineração de dados


(data mining) se caracteriza como uma etapa do processo mais amplo de
descoberta de conhecimento em bases de dados informatizadas. Assim,
na área denominada knowledge discovery in databases (KDD), ocorre

43
um processo geral de descoberta de conhecimento por meio da identifica-
ção de padrões, a partir de dados, que sejam válidos, novos, potencial-
mente úteis e compreensíveis. Ou seja, nesse processo os dados deverão
resultar em algum benefício novo que possa ser compreendido pelas pes-
soas para apoiar uma possível tomada de decisão, agora baseada em co-
nhecimentos explícitos resultantes.

2 Tipos de informações: desempenho,


engajamento, presença, gestão, etc.
Como vimos anteriormente, a mineração de dados se dedica à busca
e extração de dados a partir de um repositório. No âmbito da computa-
ção, o repositório é um “banco de dados digitais”. Este termo, usado lar-
gamente na área computacional, significa uma coleção organizada de
dados.

Na área educacional, os dados possuem nuanças mais diversas do


que as observadas em dados de outras áreas do conhecimento (como co-
mércio, bancos, indústria, por exemplo), demandado adaptações e técni-
cas diferenciadas.

De acordo com Filatro e Cavalcanti (2018), no contexto da educa-


ção apoiada por mídias e tecnologias – como é o caso da EAD –, é mais
simples reconhecer como e onde os dados são coletados e armazenados,
porque os ambientes virtuais centralizam em um único sistema as ações
de ensino-aprendizagem executadas por estudantes e educadores. Na
educação convencional, que é predominantemente presencial, os regis-
tros de dados costumam estar mais dispersos. No âmbito da educação
continuada e da educação corporativa, podemos pensar em dois cenários:
no caso do e-learning, é gerada grande quantidade de dados sobre ações

44
de capacitação e atualização; além disso, dados como o número de pes-
soas treinadas anualmente, as horas de treinamento ofertadas e a percep-
ção dos treinandos sobre aspectos variados das ações são registrados jun-
tamente com os dados das ofertas presenciais.

Com esse pano de fundo em mente, podemos considerar o fra-


mework conceitual que Bakharia et al. (2016) propõem para abordar cin-
co dimensões significativas da análise de dados no contexto dos ambien-
tes educacionais:

1. Análise temporal – capacidade de visualizar estatísticas de acesso


a cursos, conteúdos, atividades e ferramentas durante um curso den-
tro de um LMS. Em geral, a unidade de medida utilizada é a sema-
na, mas também é importante checar o acesso antes e depois de
eventos instrucionais chave. Nesse sentido, os eventos temporais se
agrupam em três diferentes categorias:

a. eventos recorrentes – repetem-se em intervalos periódicos,


por exemplo, tutoriais e palestras;

b. eventos de submissão – incluem datas de entrega de ativida-


des ou prazos-limite para responder a questionários ou partici-
par de fóruns;

c. eventos únicos – ocorre uma única vez no curso, por exemplo,


a palestra de um convidado ou uma visita técnica.

Alguns exemplos de análise temporal incluem informações sobre:


acesso diários e total de acessos por período (semana, quinzena,
mês…), acesso por item da estrutura do curso, visualizações de
páginas.

45
2. Análise comparativa – capacidade de observar padrões e relações
entre dois ou mais aspectos de um curso. Pode trazer insights sobre
como a sequência de atividades de aprendizagem propostas impacta
a participação dos estudantes ao longo do tempo, porém não se res-
tringe ao domínio temporal, aplicando-se também à análise de rede
social, de conteúdo e de discurso. Uma aplicação é acompanhar o
fluxo de discussão on-line de um pequeno grupo de alunos e verifi-
car como o envolvimento dos membros do grupo muda e evolui ao
longo do tempo em relação a outros componentes do curso.

Alguns exemplos incluem: comparação de acesso a conteúdos a fer-


ramentas; comparação de acesso de itens de acesso por estudantes
semana a semana, análise comparativa com outras edições do mes-
mo curso.

3. Dinâmica de coortes[1] – capacidade de ver quais alunos aces­sa-


ram ou não itens específicos do curso, como número de tentativas
de responder a um questionário ou quiz, acesso a gravações de aulas
e postagens feitas por um único aluno no fórum. Também inclui a
capacidade de identificar percursos de alunos e grupos de alunos e o
impacto desses padrões de atividades sobre os resultados de
aprendizagem.

Exemplos incluem: descobrir alunos que acessaram conteúdos e fer-


ramentas e aqueles que não o fizeram; visualizar alunos com atribu-
tos específicos (como nota em questionário menor que X ou entrega
de X% de atividades propostas).

4. Analítica específica de ferramentas – capacidade de obter dados


mais detalhados de ferramentas como quiz e fórum, por exemplo,
para atrelar questões a conceitos, identificar tópicos mais explora-

46
dos em uma discussão, as redes que se formam em atividades cola-
borativas (por meio de sociogramas), atividades que ocorrem fora
do LMS (como em redes sociais e microblogs), se determinadas mí-
dias foram assistidas via streaming ou por meio de download, ou
que porções de um vídeo foram assistidas.

Exemplos incluem: notas em atividades, números de tentativas de


resposta, análise de itens, número de postagens em fóruns, entre
outros.

5. Ferramentas de apoio à intervenção e contingência – capacidade


de identificar e intervir quando alunos individuais ou grupos de alu-
nos estão potencialmente “em risco”, porque não estão acessando
conteúdo crucial para a aprendizagem ou não estão atingindo notas
mínimas nas atividades propostas. Na maioria dos casos, uma notifi-
cação automática alerta os alunos a respeito e provê aconselhamen-
to nas áreas em que eles deveriam se concentrar.

Exemplos abrangem a inclusão de métricas semanais ou semestrais


e métricas de ferramentas específicas como recursos para algoritmos
de descoberta de padrões, além da capacidade dos professores ou do
sistema proverem feedback aos estudantes e recomendarem ativida-
des alternativas.

A figura a seguir representa graficamente esse framework, com des-


taque especial para o papel central que o professor desempenha na medi-
da em que é ele quem lança mão dos diferentes tipos de análise para em-
preender a tomada de decisão relacionada à intervenção e contingência.

47
Figura 2 – Framework conceitual para as
dimensões de análise dados educacionais

Fonte: adaptado de Bakharia et al. (2016).

Como podemos notar, é a extensão dos dados que podem ser coleta-
dos, processados e utilizados para possibilitar o acesso a informações so-
bre desempenho, engajamento, presença e gestão, entre outros. Na seção
a seguir, veremos como isso se aplica ao nível macro dos sistemas educa-
cionais, por meio dos dados gerados em avaliações de larga escala como
o Enem e o Enade.

3 Enem/Enade – Como as avaliações


externas geram informações sobre o
desempenho dos alunos e cursos
De acordo com Dourado et al. (2017), as primeiras iniciativas de
avaliação dos sistemas de ensino no Brasil tiveram início nos anos 1960.
No entanto, somente no final da década de 1980, o Ministério da Educa-
ção institucionalizou um sistema de avaliação do rendimento escolar na
educação básica, especialmente devido às altas taxas de repetência e eva-
são nas escolas públicas.

48
Desse esforço, resultaram nos anos seguintes várias avaliações de
larga escala para os diversos níveis do ensino no Brasil. O Sistema de
Avaliação da Educação Básica (Saeb), instituído em 1990, foi o primeiro
deles, seguido pelo Enem – Exame Nacional do Ensino Médio, instituído
em 1998 e adotado como critério de seleção para o ensino superior em
2009, e pelo Enade – Exame Nacional de Desempenho dos Estudantes,
cuja primeira aplicação ocorreu em 2004.

Nas seções a seguir, focaremos nos dois últimos exames, tendo em


vista as possiblidades de geração de dados e informações sobre o desem-
penho de alunos e cursos.

3.1 Enem – Exame Nacional do Ensino Médio


O Enem é um exame optativo realizado pelos estudantes sobre os
conteúdos do ensino médio. Tem por objetivo colaborar para a criação de
referências para o aperfeiçoamento dos currículos e, hoje em dia, tam-
bém tem sido usado como método de seleção de estudantes para o ensino
superior ou bônus em vestibulares tradicionais.

Esse exame consiste em uma prova de autoavaliação que o estudan-


te realiza sobre os conteúdos do ensino médio e que colabora com a cria-
ção de referências para o aperfeiçoamento dos currículos de ensino. Hoje
tem sido usado também como método de seleção de estudantes para o
ensino superior ou bônus em vestibulares tradicionais.

49
PARA SABER MAIS

O Enem[2] tem sido objeto de grande atenção por atingir um nú-


mero considerável de estudantes. Em 2017, os inscritos alcança-
ram cerca de 4,7 milhões de estudantes. Por essa razão, há vários
recursos e aplicativos disponíveis para consulta gratuita. Um de-
les é a plataforma Hora do Enem, que reúne notícias, simulados
e videoaulas em uma parceria entre o Ministério da Educação,
Serviço Social da Indústria (Sesi) e a TV Escola.

3.2 Enade – Exame Nacional de Desempenho dos


Estudantes
O Enade avalia o rendimento dos alunos dos cursos de graduação,
ingressantes e concluintes, em relação aos conteúdos dos cursos em que
estão matriculados. A participação no Enade é obrigatória e avalia o de-
senvolvimento das competências e habilidades necessárias ao aprofunda-
mento da formação geral e profissional.

O exame é obrigatório para os alunos selecionados e é condição in-


dispensável para a emissão do histórico escolar e do diploma de
graduação.

A cada três anos os cursos são avaliados, alternando as áreas do co-


nhecimento humanas, exatas, agrárias e saúde. Os resultados são consi-
derados na composição de índices de qualidade de cursos e instituições,
como o Conceito Preliminar de Curso (CPC) e o Índice Geral de Cursos
(IGC).

3.3 Estudos

50
Sabemos que a avaliação é um elemento muito importante no pro-
cesso de ensino-aprendizagem. Ela reflete o nível de desempenho de alu-
nos por meio da atribuição de notas ou conceitos. Porém, mais do que
isso, pode ser usada como uma ferramenta para determinar o grau de as-
similação de conceitos, técnicas, procedimentos, normas e valores; ajuda
o professor a aperfeiçoar seus métodos de trabalho; e ainda auxilia os
alunos no desenvolvimento de autoconfiança.

Avaliações externas como o Enem e o Enade geralmente são reali-


zadas em larga escala, ou seja, aplicadas de forma padronizada a um
grande número de pessoas, particularmente os estudantes. Tanto o Enem
quanto o Enade são conduzidos pelo Instituto Nacional de Estudos e Pes-
quisas Educacionais “Anísio Teixeira” (Inep), vinculado ao Ministério da
Educação.

De acordo com Fonseca e Namen (2016), a aplicação de testes e


questionários em avaliações de larga escala gera um grande volume de
dados, que constituem um importante acervo de informações para subsi-
diar a formulação de ações governamentais e o mapeamento da situação
do sistema educacional.

PARA SABER MAIS

Os resultados das avaliações externas nacionais como o Enem, o


Enade, a Prova Brasil e também os dados dos Censos Escolar, da
Educação Superior, dos Profissionais do Magistério, entre outras
bases podem ser acessados na forma de microdados no site do
Inep.[3]

Além dessa aplicação básica mais voltada ao planejamento macro


do sistema educacional brasileiro, essas bases de dados permitem extrair

51
informações e conhecimento que estão embutidos nos microdados – tais
como as relações entre diferentes indicadores, utilizando-se para isso o
processo KDD e a abordagem de learning analytics. Por exemplo, a par-
tir das técnicas de mineração e analítica dos dados, é possível identificar
relações entre fatores socioeconômicos e culturais como faixa etária, gê-
nero, renda familiar, origem escolar, área geográfica, etc. e desempenho
dos alunos nas avaliações.

Considerações finais
Exemplos da análise de dados educacionais visando à melhoria do
processo de ensino-aprendizagem ainda são raros no Brasil, o que de cer-
ta forma se justifica pela recentidade do tema. Ao mesmo tempo, quando
consideramos as dimensões possíveis de análise, fica patente o potencial
e a importância de adotar de forma mais intensiva métodos de mineração
e analítica de dados, com o intuito de conhecer a situação dos diversos
níveis e modalidades de ensino, os fatores relacionados e, por con-
sequência, nortear a implantação de melhorias no sistema educacional
brasileiro.

No [capítulo seguinte], vamos nos aprofundar na análise de dados


em nível micro, aqueles gerados, por exemplo, por sistemas de gerencia-
mento da aprendizagem (LMSs – learning management systems).

Referências
BAKHARIA, Aneesha et al. A conceptual framework linking learning
design with learning analytics. Proceedings of the Sixth International
Conference on Learning Analytics & Knowledge 2016. ACM: New
York, 2016, pp. 329-338.

52
DOURADO, Raphael et al. Novas possibilidades de avaliação em larga
escala na educação básica através do uso de EDM e Learning Analytics.
XXXVII Congresso da Sociedade Brasileira de Computação, 2017.

FILATRO, Andrea; CAVALCANTI, Carolina. Metodologias inov-ati-


vas em educação presencial, a distância e corporativa. São Paulo: Sa-
raiva Somos, 2018.

FONSECA, Stella Oggioni da; NAMEN, Anderson Amendoeira. Mine-


ração em bases de dados do Inep: uma análise exploratória para nortear
melhorias no sistema educacional brasileiro. Educ. rev., Belo Horizonte,
v. 32, n. 1, jan./mar. 2016.

GARCÍA-MARCO, Francisco J. La pirámide de la información revisita-


da: enriqueciendo el modelo desde la ciencia cognitiva. El profesional
de la información, v. 20, n. 1, 2011.

PINHEIRO, Lêna V. R. Processo evolutivo e tendências contemporâneas


da Ciência da Informação. Informação & Sociedade: Estudos. João
Pessoa, v. 15, n.1, pp.13-48, 2005.

SEMIDÃO, Rafael Aparecido Moron. Dados, informação e conheci-


mento enquanto elementos de compreensão do universo conceitual
da ciência da informação: contribuições teóricas. 2014. 199 f. Disserta-
ção (Mestrado em Ciência da Informação) – Universidade Estadual Pau-
lista, Faculdade de Filo-sofia e Ciências, Marília, 2014.

SOMERVILLE, David. Information Isn’t Power. Random Blather,


2014. Disponível em: <https://random-blather.com/2014/04/28/informa-
tion-isnt-power/>. Acesso em: 19 fev. 2018.

TAKEUCHI, Hirotaka; NONAKA, Ikujiro. Gestão do conhecimento.


Porto Alegre: Bookman, 2008.

53
[1] Em estatística, coorte é um grupo de indivíduos que têm em comum
um conjunto de características (idade, localização geográfica, condição
física, etc.) e estão expostos aos mesmos eventos (por exemplo, desas-
tres, fatos históricos, uso de medicação e, no caso educacional, situação
didática ou metodologia de ensino, entre outros).

[2] Disponível em: <http://www.horadoenem.org/>. Acesso em: 19 fev.


2018.

[3] Disponível em: <http://portal.inep.gov.br/microdados>. Acesso em:


19 fev. 2018.

54
Capítulo 4

LMSs e plataformas
educacionais – como
avaliar se um ambiente
é adequado para a nova
educação?

As oportunidades para aproveitar novas fontes de dados, fazer no-


vas perguntas e perseguir novos insights cresceram à medida que o ecos-
sistema de tecnologia de aprendizagem se expandiu e a definição do que
constitui aprendizagem evoluiu além da experiência formal da sala de
aula para incluir modos informais, sociais e experienciais de adquirir co-
nhecimento e habilidades.

Por essa razão, trabalhamos neste capítulo com diferentes tipos de


ambientes computacionais dedicados à gestão do processo de ensino-
aprendizagem, identificando os dados que eles podem gerar a respeito da
participação e do desempenho dos alunos. Analisamos particu­larmente

55
soluções desenvolvidas para os LMSs mais utilizados mundialmente
(Moodle, Blackboard e Canvas).

Por fim, focamos nossa atenção em cinco dimensões significativas


para a análise de dados no contexto dos ambientes educacionais – que
incluem a análise temporal, a análise comparativa de padrões e relações,
a dinâmica de coortes (alunos e grupos), a análise de ferramentas e, mais
propriamente, as ferramentas de apoio à intervenção e a implementação
de planos de contingência para alunos “em risco”.

1 Tipos de LMSs e quais dados eles


podem extrair da participação e
desempenho dos alunos em cursos
presenciais, híbridos e 100% on-line
De acordo com Romero e Ventura (2013), existe uma grande varie-
dade de ambientes educacionais e sistemas de informação que são usados
tanto na educação presencial tradicional quanto na educação totalmente a
distância. Cada um desses ambientes fornece dados de diferentes nature-
zas que precisam ser pré-processados de maneiras diferentes, dependen-
do dos problemas e tarefas a serem resolvidos.

Na educação tradicional, baseada principalmente no contato presen-


cial entre professores e alunos em palestras, discussão em aula e peque-
nos grupos, os sistemas coletam principalmente informações sobre
frequência (presença) e desempenho (notas). Além disso, as instituições
educacionais armazenam dados administrativos, como perfil do aluno,
informações sobre o professor, dados sobre formação de turmas, calendá-
rio letivo, grade de disciplinas, agendas de utilização de classes e labora-

56
tórios, informações de classe e agendamento, etc., assim como informa-
ções on-line do tipo páginas Web e páginas de conteúdo do curso. Nas
salas de aula convencionais, os professores em geral buscam melhorar o
ensino monitorando a aprendizagem e o desempenho dos alunos através
da observação direta e da análise de material escrito.

Já a educação apoiada por mídias e tecnologias, incluindo a modali-


dade a distância, utiliza sistemas computacionais para apresentar infor-
mações, prover orientações e gerenciar as atividades dos alunos. Inicial-
mente, os sistemas funcionavam de forma autônoma em um computador
local. Com a disseminação da Internet, sugiram novos sistemas educaci-
onais baseados na Web e mais recentemente, com a crescente adoção de
técnicas de inteligência artificial, surgiram novos sistemas educacionais
inteligentes e adaptativos. A figura 1 resume os principais sistemas edu-
cacionais utilizados atualmente.

Figura 1 – Sistemas de apoio à educação


presencial, blended ou totalmente a distância

Fonte: adaptado de Romero e Ventura (2013).

57
De forma mais detalhada, os sistemas para educação apoiada por
mídias e tecnologias abrangem:

LMSs (learning management systems, ou sistema de gerencia-


mento da aprendizagem) – suítes de software que fornecem fun-
ções de entrega e realização de cursos: administração, documenta-
ção, rastreamento e relatórios de programas de treinamento, eventos
em sala de aula on-line, programas de e-learning, apresentação de
conteúdo e realização de atividades. Também oferecem espaços
para facilitar compartilhamento de informações e comunicação en-
tre os participantes. Todas as atividades realizadas pelos alunos,
como ler, escrever, fazer testes, desenvolver tarefas em tempo real e
comentar eventos com colegas, são gravadas em geral com o regis-
tro de usuário, data e horário e ferramentas utilizadas.

IMPORTANTE

Costuma-se utilizar de modo intercambiável os termos AVA (am-


biente virtual de aprendizagem) e LMS para descrever sistemas
computacionais que viabilizam a aprendizagem on-line. No en-
tanto, a designação LMS exprime uma preocupação mais nítida
com os requisitos de sistema e a arquitetura computacional, en-
quanto o termo AVA reflete mais propriamente o conceito de
“sala de aula on-line”, podendo abranger páginas Web, grupos
em redes sociais, sessões de webconferência e outros espaços
virtuais utilizados livremente para a realização de atividades de
ensino-aprendizagem, sem um foco específico no registro centra-
lizado de dados dos usuários (FILATRO, 2008).

ITSs (intelligent tutoring systems, ou sistemas de tutoria inteli-


gente) – fornecem orientações ou comentários personalizados dire-
tos aos alunos, modelando seu comportamento no sistema e alteran-

58
do o modo de interação de cada aluno com base em seu modelo
individual.

AIH (adaptive and inteligent hypermedia systems, ou sistemas


de hipermídia adaptativa e inteligente) – buscam ser mais adaptá-
veis ao construir um modelo de objetivos, preferências e conheci-
mentos de cada aluno e usar este modelo ao longo da interação com
pessoas, ferramentas e conteúdo para se adaptar às necessidades e
características desse aluno.

Sistemas de teste e quiz – têm por objetivo principal avaliar o nível


de conhecimento dos alunos em relação a um ou mais conceitos ou
assuntos, usando uma série de perguntas/itens e outras instruções
para fins de recolher informações sobre os usuários. Armazenam
grande quantidade de dados sobre as respostas dos alunos, pontua-
ções e estatísticas.

Outros sistemas – repositórios de objetos de aprendizagem e CMS


(content management systems), softwares para mapeamento concei-
tual, redes sociais, wikis, fóruns, jogos educacionais, realidade vir-
tual/3D, computação ubíqua, entre outros, que monitoram a partici-
pação e o desempenho dos usuários e podem gerar dados importan-
tes para o processo de ensino-aprendizagem.

59
IMPORTANTE

Os CMSs, também conhecidos como LCMSs, são orientados a


funcionalidades de criação de novos conteúdos, captura de co-
nhecimentos (especialmente em contextos empresariais), compo-
sição de conteúdos já existentes e armazenamento e recuperação
de conteúdos de aprendizagem. Diferem dos repositórios de ob-
jetos de aprendizagem porque na maioria dos casos incluem fer-
ramentas de autoria, curadoria e edição de conteúdos (FILATRO,
2008).

Observe-se que, na figura, esses sistemas estão interligados, mos-


trando as diversas possíveis relações. Por exemplo, um sistema de testes
ou quiz pode fazer parte de um LMS, ou um sistema de tutoria inteligen-
te pode ter características de LMS.

Como podemos perceber, a maioria dos sistemas educacionais re-


gistra grande quantidade de dados sobre o perfil e o desempenho dos
usuários no processo de ensino-aprendizagem. O maior desafio, portanto,
é, a partir desses registros, tornar a mineração e a analítica de dados
acessíveis para aqueles que estão na linha de frente e têm condições efe-
tivas de colocar em prática o conhecimento extraído os dados.

Para atender a essa demanda, empresas fornecedoras de sistemas


para educação, particularmente de sistemas para gerenciamento da
aprendizagem (LMS), vêm lançando soluções para tratamento e análise
de dados, como, por exemplo: Analytics for Learn (A4L) para Blackbo-
ard, SmartKlass™ Learning Analytics para Moodle e Analytics para
Canvas.

1.1 Analytics for Learn (A4L) para Blackboard

60
Oferece o suporte de rubricas (para identificar e apoiar alunos em
dificuldades) e dados mais detalhados de ferramentas (para identificar e
entender padrões de engajamento de alunos e professores com conteúdo,
recursos e avaliações), elevando os relatórios do LMS a um patamar
superior.

Figura 2 – Exemplo de resultados exibidos pelo Analytics for Learn


(A4L) para o LMS Blackboard

1.2 SmartKlass™ Learning Analytics para


Moodle
Plug-in gratuito do Moodle que funciona como uma dashboard
(central de operações) para instituições, alunos e estudantes; baseado na
especificação xAPI 1.0 (ver mais a seguir), exibe informações diárias so-
bre atividades individuais e colaborativas e resultados em cursos.

61
Figura 3 – Exemplo de resultados exibidos pelo
SmartKlass™ Learning Analytics para o LMS
Moodle

1.3 Analytics para Canvas


Com base na especificação Caliper Analytics v1.1, coleta dados
como log-in, taxas de participação e notas em atividades específicas,
quantidade de tempo gasto interagindo com recursos on-line ou com ou-
tros alunos, e analisa padrões de uso do LMS pelos alunos, permitindo
que professores examinem as relações entre o envolvimento dos alunos e
os resultados da aprendizagem em comparação com dados de outros alu-
nos, estudantes de outras edições ou turmas e/ou rubricas de
desempenho.

62
Figura 4 – Exemplo de resultados exibidos pelo
recurso Analytics para o LMS Canvas

Você deve ter notado anteriormente a menção de duas especifica-


ções técnicas: a xAPI 1.0 e Caliper Analytics v1.1. Elas aparecem aí por-
que os desenvolvedores de software já perceberam a necessidade de ade-
rir a padrões internacionais de programação e registro de dados em vez
de criar sua própria solução para resolver a questão da analítica da apren-
dizagem. Vejamos um pouco mais sobre essas especificações.

A especificação xAPI 1.0 ou API da experiência (conhecida inicial-


mente como API Tin Can) foi lançada em abril de 2013 pela ADL, como
um aperfeiçoamento do padrão Scorm (sharable content object reference
model – modelo de referência para objetos de conteúdo compartilhado),
amplamente adotado para desenvolver conteúdos educacionais on-line. A
especificação visa coletar dados sobre várias atividades que um aprendiz
ou educador realiza, mesmo fora dos tradicionais ambientes on-line.

63
PARA SABER MAIS

API é sigla para o termo em inglês application programming in-


terface (ou interface de programação de aplicativos). Refere-se a
um conjunto de padrões estabelecidos por um desenvolvedor de
software para que outros criadores desenvolvam produtos associ-
ados ao seu. Exemplo é o Google Maps, cujo código original é
utilizado por diversos outros sites e aplicativos (FILATRO,
2016). Já o Scorm define padrões de comunicação entre os con-
teúdos de aprendizagem e um ambiente de execução (em geral,
um ambiente virtual de aprendizagem igualmente compatível).

Segundo Filatro (2016), por meio dessa especificação, é possível


reunir em uma base central de dados denominada LRS (learning record
store, ou armazém de registros de aprendizagem) informações acessadas
ou produzidas em diferentes interfaces, sistemas, redes e equipamentos.
O sistema organiza essas experiências em registros constituídos basica-
mente de <ator> (o aluno), <verbo> (o que aconteceu entre e o ator e o
objeto) e <objeto> (um objetivo de aprendizagem, competência ou tópi-
co de conteúdo), com um <resultado> (por exemplo, uma pontuação em
um teste ou jogo) alcançado em um <contexto> (uma situação de apren-
dizagem formal ou informal). Ainda de acordo com a autora, incluem-se
no rol de experiências registráveis aquelas vivenciadas em redes sociais e
via dispositivos móveis, tais como celulares, smartphones, notebooks e
tablets).

A especificação Caliper Analytics v1.1 foi lançada em janeiro de


2018 pelo IMS Global Learning Consortium. Esta versão se seguiu à es-
pecificação original criada em 2015, com o objetivo de promover um
ecossistema aberto para dados e análises educacionais. A especificação
permite coletar dados sobre a aprendizagem e o uso de ferramentas, além

64
de mapear fluxos de alto volume de dados, em tempo real, com vistas a
auxiliar o planejamento acadêmico, o design de programas e cursos e as
medidas de intervenção com relação aos alunos.

A base do Caliper é uma linguagem comum usada para descrever,


colecionar e trocar dados de aprendizagem em tecnologias de aprendiza-
gem e promover melhor interoperabilidade de dados através de um voca-
bulário compartilhado. O Caliper tem sido adotado por empresas forne-
cedoras de softwares educacionais, como Blackboard, D2L, Instructure,
Elsevier, Kaltura e McGraw-Hill Education para efetuar análises prediti-
vas e fornecer informações sobre atividades de aprendizagem, eficácia de
recursos de instrução e engajamento de estudantes.

O que está por trás dessas especificações é o fato de que a qualida-


de, a eficácia e o desempenho derivados da mineração e da analítica de
dados podem ser alcançados mais efetivamente quando equipados com
padrões (do inglês, standards) baseados em fundamentos comuns. Sem
esses padrões, é difícil comparar, contrastar e correlacionar efetivamente
atividades de aprendizagem, determinar a eficácia de currículos e avaliar
a interação dos alunos. Ou seja, não se trata apenas de um procedimento
tecnológico, em termo do formato dos dados, mas também de uma forma
padronizada de lidar com as informações educacionais, desde a seleção
de dados, sua hierarquização e a tomada de decisão estratégica visando à
melhoria do processo de ensino-aprendizagem.

É interessante notar que, em 2015, a Educause publicou um relató-


rio a partir de pesquisa feita com mais de 70 formadores de opinião, que
apontaram a necessidade de avanços nos LMSs tradicionais em cinco
áreas-chave (BROWN; DEHONEY; MILLICHAP, 2015):

1. interoperabilidade e integração;

65
2. personalização;

3. analytics, orientação e avaliação de aprendizagem;

4. colaboração; e

5. acessibilidade e design universal.

Uma vez que sistemas individuais provavelmente não são capazes


de atender a todas essas necessidades, o relatório recomenda para os cha-
mados NGDLEs (next generation digital learning environments, ou am-
bientes digitais de aprendizagem de próxima geração) uma abordagem
do tipo “Lego”, em que componentes de diferentes sistemas sejam com-
binados com base em padrões de integração e interoperabilidade.

Essa visão é apoiada pelo Horizon Report 2017, que também traz a
visão de alguns líderes em relação aos LMSs tradicionais, como limi­ta-
dos em capacidade, concentrados demais na administração da aprendiza-
gem e não na aprendizagem em si. Essa crítica emerge especialmente a
partir da disseminação dos MOOCs em 2011, com a adoção de platafor-
mas abertas como o OpenEdX, e a utilização paralela por alunos e do-
centes de ferramentas como Google Apps, WordPress, Slack e iTunes U
(externas aos LMSs). Diante desse cenário, o relatório indica os NG-
DLEs como espaços mais flexíveis que podem oferecer suporte, persona-
lizar, cumprir os padrões de design universal e desempenhar um papel
maior na avaliação de aprendizagem formativa. Nessa visão, em vez de
existirem como sistemas únicos e isolados, esses ambientes se tornam
uma confederação de sistemas e componentes computacionais que ade-
rem a padrões comuns (ADAMS BECKER et al., 2017).

66
2 Quais informações são importantes
para a tomada de decisões?
Diante das possibilidades de trabalhar com dados internos e exter-
nos a LMSs e considerando o conceito mais amplo de ambientes digitais
de aprendizagem de nova geração, quais informações provenien­tes de
tantas fontes diferentes são realmente importantes para a tomada de deci-
são em educação apoiada por mídias e tecnologias?

Em linhas gerais, podemos pensar em informações resultantes da


mineração e analítica de dados de entrada, dados internos à proposta de
design instrucional e ao processo de ensino-aprendizagem (incluindo da-
dos de interação, dados temporais e de detecção de dispositivos) e tam-
bém dados de saída (incluindo dados de desempenho final e de percep-
ção do aluno), como elencado no quadro a seguir.

Quadro 1 – Dados importantes para a tomada de decisão em educa-


ção apoiada por mídias e tecnologias
TIPOS DE DADOS INDICADORES

Notas em processos seletivos internos


Notas em avaliações externas (Enem, Enade…)
Dados demográficos dos alunos (idade, sexo, região,
1. Dados de entrada (anterio- renda, origem escolar, experiência profissional…)
res à situação didática)
Pesquisa diagnóstica (sobre conhecimentos anteriores,
crenças sobre a área de conhecimento ou prática a ser
estudada, expectativas em relação ao curso ou disciplina,
etc.)

2. Dados relativos à aprendi- Áreas mais acessadas da página inicial do(s) ambiente(s)
zagem proposta de design ins-
Número de acessos a conteúdos (textos, vídeos, multimí-
trucional e à aprendizagem
dia, materiais complementares, links externos…)
propriamente dita
Fonte: elaborado pela autora, com base em IMS GLOBAL (2017); Bakharia et al. (2016); Filatro e
Cavalcanti (2018).

67
TIPOS DE DADOS INDICADORES
Número de acessos a atividades (questionários, fóruns,
desafios, jogos, simuladores…)

Número de acessos aos materiais complementares e


links externos
Número de entregas de atividades (questionários, fóruns,
desafios, jogos, simuladores…)
Número de tentativas de resposta em questionários

Questionários menos e mais respondidos


Questionários com maior e menor pontuação
Desafios/atividades menos e mais entregues

Desafios/atividades com maior e menor pontuação


Número de acesso ao boletim/livro/registro de notas

Número de acessos aos feedbacks de atividades (questio-


nários, fóruns, desafios, jogos, simuladores…)
Unidades de estudo com menor e maior acesso
Unidades de estudo com menor e maior nota

3. Dados de interação social Número de mensagens enviadas ao tutor


Número de mensagens recebidas do tutor
Número de mensagens enviadas a colegas

Número de mensagens recebidas de colegas


Número de postagens nos fóruns

Número de mensagens lidas nos fóruns


Número de postagens respondidas nos fóruns
Número de anexos publicados nos fóruns

Número de postagens nos fóruns (por tipo de mídia –


texto, imagem, áudio, vídeo…)
Número de postagens em blogs e redes sociais

Fonte: elaborado pela autora, com base em IMS GLOBAL (2017); Bakharia et al. (2016); Filatro e
Cavalcanti (2018).

68
TIPOS DE DADOS INDICADORES
Número de postagens em blogs e redes sociais (por tipo
de mídia – texto, imagem, áudio, vídeo…)
Número de comentários em postagens de blogs e redes
sociais
Números de curtidas ou aprovações em postagens de
blogs e redes sociais

Número de comentários lidos em blogs e redes sociais


Número de comentários comentados em blogs e redes
sociais

Número de participações em chats ou


vídeo/webconferências
Número de acessos aos canais de atendimento (mural de
notícias, fórum de dúvidas, atendimento telefônico,
FAQ, serviço de mensagens instantâneas…)

4. Dados temporais Número de dias transcorridos entre o início do curso e o


1º acesso dos alunos ao(s) ambiente(s)
Intervalo de tempo entre os acessos ao(s) ambiente(s)
Tempo total conectado ao(s) ambiente(s)

Tempo total gasto nos conteúdos disponibilizados (tex-


tos, vídeos, multimídia, materiais complementares, links
externos…)
Tempo total gasto nas atividades propostas (questionári-
os, fóruns, desafios…)

Histórico de acessos ao longo do curso ou disciplina


Tempo médio durante o qual os alunos acessam o(s)
ambiente(s)

Dias da semana/mês/ano de maior acesso ao(s)


ambiente(s)
Dias da semana/mês/ano de maior acesso aos conteúdos
(textos, vídeos, multimídia, materiais complementares,
links externos)

Fonte: elaborado pela autora, com base em IMS GLOBAL (2017); Bakharia et al. (2016); Filatro e
Cavalcanti (2018).

69
TIPOS DE DADOS INDICADORES

Dias da semana/mês/ano de maior acesso às atividades


(questionários, fóruns, desafios, jogos, simuladores…)
Dias e horários de entrega mais comuns para as
atividades

Dias e horários de entrega mais comuns para a consulta


aos canais de atendimento (mural de notícias, fórum de
dúvidas, atendimento telefônico, FAQ, serviço de men-
sagens instantâneas…)
Acesso por PC
5. Detecção de dispositivos de
Acesso por celular
acesso
Outros
Índice de conclusão de curso ou disciplina

Índice de abandono/evasão
Nota final em atividades on-line (questionários, fóruns,
6. Dados de desempenho final desafios, jogos, simuladores…)
Nota em provas presenciais
Nota em projeto final
Nota final no curso ou disciplina

Resultados de pesquisas de satisfação intermediária


7. Percepção dos alunos
Resultados de pesquisa de satisfação final

Fonte: elaborado pela autora, com base em IMS GLOBAL (2017); Bakharia et al. (2016); Filatro e
Cavalcanti (2018).

Vale lembrar que a coleta desses dados varia em termos de abran-


gência. Dados individuais podem gerar informações relativas ao desem-
penho de cada aluno; quando consolidados em grupos, turmas ou coleti-
vos aprendendo simultaneamente, possibilitam insights sobre a proposta
de design instrucional; quando distribuídos ao longo de um período, per-
mitem acumular séries históricas e fazer inferências mais amplas sobre
os resultados.

70
Figura 5 – Abrangência dos dados coletados e sua contribuição para
a tomada de decisão educacional
DADOS CONSOLIDADOS DADOS DISTRI-
DADOS INDIVIDUAIS DE GRUPOS, TURMAS BUÍDOS DE UM
OU COLETIVOS PERÍODO

Informações relativas ao desem- Insights sobre a efetividade Séries históricas e


penho e à participação de cada da proposta de design inferências sobre
aluno individualmente instrucional os resultados

Além disso, a tomada de decisão envolve a indicação de periodici-


dade na coleta dos dados. Alguns deles são registrados de forma pontual
(por exemplo, dados de entrada e de saída), enquanto os dados relativos
ao processo de ensino-aprendizagem requerem acompanhamento diário,
semanal, quinzenal, mensal, bimestral, refletindo uma sistemática de ava-
liação mais formativa, conforme os objetivos e a capacidade de interven-
ção para ajuste durante o processo.

É importante levar em conta ainda que alguns indicadores podem


ser subdivididos conforme as especificidades de um curso ou disciplina.
Pode-se, por exemplo, identificar que tipos de mídias são mais acessadas,
caso a proposta de design instrucional ofereça uma variedade de supor-
tes; ou pode-se estender dados de avaliação caso se empreguem rubricas
ou avaliações entre pares. No caso de jogos e simuladores, pode ser ne-

71
cessário coletar outros dados referentes a tentativas, superações de fases
ou progresso em níveis.

3 Quais processos devem ser


avaliados?
Como vimos no [capítulo 3], há pelo menos cinco dimensões de
análise de dados no contexto dos ambientes digitais de aprendizagem:

Figura 6 – Cinco dimensões significativas da


análise de dados no contexto dos ambientes
educacionais

Fonte: elaborado pela autora, com base em Bakharia et


al. (2016).

Podemos observar essas cinco dimensões distribuídas nos vários


tipos de dados abordados no [quadro 1], mostrado anteriormente. Basica-

72
mente, os dados ali listados fornecem indicadores para avaliar processos
de:

seleção e acompanhamento dos alunos;

planejamento e design instrucional;

apoio tutorial e administrativo (via canais de atendimento);

avaliação da aprendizagem;

satisfação dos alunos em relação aos cursos.

Constatamos, assim, que a tomada de decisão informada (ou seja,


apoiada por informações derivadas da mineração e do tratamento de da-
dos) abrange tanto a avaliação diagnóstica (que antecede a situação didá-
tica), quanto a avaliação formativa (que ocorre durante a situação didáti-
ca propriamente dita e gera insights para intervenção e mudança de rota)
e a avaliação somativa, que subsidia a prestação de contas em relação
aos recursos e esforços empreendidos para levar a cabo as ações de ensi-
no-aprendizagem.

Considerações finais
Para deixar mais claro o potencial da avaliação dos processos com o
apoio da mineração e da analítica de dados da aprendizagem, encerramos
o capítulo com as questões organizadas por Davenport et al. (2010 apud
NUNES; CHAVES, 2015) com relação ao modo de usar as informações
de modo mais efetivo e gerar insights a partir das informações obtidas.

Os autores dispõem seus questionamentos ao longo do tempo – pas-


sado, presente e futuro –, atrelando-os aos formatos de resposta viabiliza-
dos pela área de learning analytics. Assim, relatórios e gráficos estatísti-

73
cos podem responder à pergunta: “O que aconteceu?”. Alertas podem
responder à pergunta: “O que está acontecendo?”. E extrapolações po-
dem responder à pergunta: “O que acontecerá?”. A essas constatações
podem se seguir insights do tipo “Como e por que aconteceu?”, pergunta
à qual a modelagem estatística pode responder, ou “Qual é a melhor ação
a seguir?”, pergunta à qual sistemas de recomendação podem responder,
ou “O que de melhor ou pior pode acontecer”, per­gunta à qual medidas
de predição, otimização e simulação podem ajudar a responder.

Dessa forma, podemos verificar todo o potencial do learning analy-


tics para a compreensão do processo de ensino-aprendizagem como um
todo, possibilitando intervenções para aperfeiçoamento a tempo de bene-
ficiar os alunos, inclusive durante a situação didática.

Referências
ADAMS BECKER, Samantha et al. NMC Horizon Report: 2017.
Higher Education Edition. Austin, Texas: The New Media Consortium,
2017.

BACKARIA, Aneesha et al. A conceptual framework linking learning


design with learning analytics. In: Proceedings of the Sixth Internatio-
nal Conference on Learning Analytics & Knowledge 2016, pp. 329–
338. ACM, New York, 2016.

BROWN, Malcol; DEHONEY, Joanne; MILLICHAP, Nancy. The Next


Generation Digital Learning Environment: A Report on Research.
EDUCAUSE Learning Initiative (ELI) white paper (April 2015).

DAVENPORT, Thomas H.; HARRIS, Jeanne G.; MORISON, Robert.


Analytics at work: smarter decisions better results. Boston: Harvard Bu-

74
siness Press, 2010.

FILATRO, Andrea. Design instrucional na prática. São Paulo: Pear-


son/Prentice Hall, 2008.

______. Produção de conteúdos educacionais. São Paulo: Saraiva So-


mos, 2016.

FILATRO, Andrea; CAVALCANTI, Carolina Costa. Metodologias


inov-ativas em educação presencial, a distância e corporativa. São
Paulo: Saraiva Somos, 2018.

IMS GLOBAL. Learning measurement for analytics whitepaper.


IMS Global Consortium, 2013.

NUNES, João Batista Carvalho; CHAVES, João Bosco. Tecnologias di-


gitais na educação superior: a analítica da aprendizagem e a didática. In:
CAVALCANTE, Maria Marina Dias et al. (Org.). Didática e prática de
ensino: diálogos sobre a escola, a formação de professores e a sociedade.
EdUECE, Fortaleza, v. 4, pp. 347-358, 2015.

ROMERO, Cristóbal; VENTURA, Sebastian. Data mining in education.


WIREs Data Mining Knowl Discov. John Wiley & Sons, v. 3, pp. 12-
27, 2013.

75
Capítulo 5

Mobile Education –
gerando dados de forma
ubíqua e pervasiva

Neste capítulo, avançamos em nossa reflexão sobre a mineração e a


analítica de dados para além dos tradicionais ambientes virtuais de
aprendizagem, abrangendo os dados provenientes de interações realiza-
das com base em dispositivos móveis.

Com o objetivo de compreender as oportunidades que esses disposi-


tivos oferecem para a educação, especialmente na obtenção de dados, va-
mos analisar os conceitos de mobilidade, m-learning (aprendizagem mó-
vel) e u-learning (aprendizagem ubíqua), para então nos debruçarmos so-
bre a analítica de aprendizagem móvel e ubíqua.

1 Dados e informações em todos os


lugares e a todo tempo
De acordo com Martha Gabriel (2018), a mobilidade é uma parte
intrínseca da natureza humana desde os nossos ancestrais; isso ocorre

76
porque a nossa configuração corporal favorece, desde que nascemos, o
movimento.

Ao longo da evolução humana, temos desenvolvido tecnologias que


ampliam a nossa capacidade de movimento: os meios de transporte e as
tecnologias de comunicação estão aí para comprovar quão longe pode-
mos chegar – seja fisicamente, seja por meio da disseminação de nossas
ideias.

Nas últimas décadas, as tecnologias digitais, em especial os disposi-


tivos móveis conectados à internet, potencializaram ainda mais a mobili-
dade humana.

Podemos ter uma ideia desse potencial analisando os resultados da


Pesquisa Nacional por Amostra de Domicílios Contínua – PNAD Contí-
nua, realizada pelo IBGE (Instituto Brasileiro de Geografia e Estatística)
no quarto trimestre de 2016, sob o tema suplementar Tecnologia da In-
formação e Comunicação – TIC1, com foco específico no acesso à inter-
net e à televisão e na posse de telefone móvel celular para uso pessoal.

A pesquisa observou a existência de telefone móvel celular em


94,6% dos domicílios brasileiros e indicou esse dispositivo móvel como
a principal forma de acesso à internet, num universo de mais de 116 mi-
lhões de pessoas entrevistadas (veja a tabela 1 a seguir).

Tabela 1 – Formas de acesso à internet no Brasil (por pessoas acima


de 10 anos)
EQUIPAMENTOS UTILIZADOS PESSOAS QUE UTILIZARAM A INTER-
PARA ACESSAR A INTERNET NET (%)
Brasil Grandes regiões

Fonte: adaptado de Brasil (2016, p. 11).

77
Centro-
Norte Nordeste Sudeste Sul
Oeste

TELEFONE MÓVEL CELULAR 94,6 95,7 94,8 94,5 93,1 96,5

MICROCOMPUTADOR 63,7 46,4 52,5 69,1 71,0 63,6

TABLET 16,4 10,4 13,8 18,3 16,9 16,9

TELEVISÃO 11,3 5,3 7,9 12,7 14,4 11,5

Fonte: adaptado de Brasil (2016, p. 11).

Vale a pena considerar que, em 77,3% dos domicílios pesquisados,


o acesso à Internet se dava por meio do uso da banda larga móvel (3G ou
4G), superando o da banda larga fixa (71,4%).

Embora tamanha expansão ainda tenha reflexos expressivos em ter-


mos educacionais, é cada vez maior o interesse e a prática da aprendiza-
gem com mobilidade.

De fato, os dispositivos móveis são provavelmente os únicos artefa-


tos que acompanham o aprendiz em diferentes momentos e situações de
aprendizagem. E isso ocorre independentemente do material que está
sendo utilizado (anotações em papel, em tablets, no computador), da lo-
calização do aprendiz (em casa, no ambiente de trabalho, nos tempos de
espera) ou da duração de uma ação educacional específica (variando de 1
a n minutos).

Na esfera da aprendizagem com mobilidade, dois conceitos preci-


sam ser estudados antes de nos aprofundarmos na aplicação da minera-
ção e da analítica aos dados educacionais móveis – m-learning e u-
learning.

1.1 M-learning

78
Em termos conceituais, o processo de ensino-aprendizagem inter-
mediado por dispositivos móveis, como telefones celulares, smartphones
e tablets, é conhecido como m-learning (do inglês mobile learning, ou
aprendizagem móvel, ou aprendizagem com mobilidade).

Relatório da Unesco de 2014 aponta uma definição mais estreita


para o m-learning como o uso de tecnologias móveis sozinhas ou em
combinação com outras tecnologias digitais de informação e comunica-
ção que possibilitam a aprendizagem em todos os lugares e a qualquer
tempo.

PARA SABER MAIS

A organização não governamental One Laptop per Child


(OLPC), fundada por Nicholas Negroponte, professor do Massa-
chussets Institute of Technology (MIT), desenvolveu um modelo
de laptop XO voltado a crianças, para distribuição em escolas
básicas como o “laptop de 100 dólares”. No Brasil, o programa
foi instituído pela Lei nº 12.249, de 11 de junho de 2010, e al-
cançou o valor final entre 300 e 350 dólares por unidade no Bra-
sil. Veja mais informações em Rosa e Azenha (2015).

Mas o foco da aprendizagem móvel vai muito além do uso de tecno-


logias, pois várias são as dimensões da mobilidade envolvidas. Além da
mobilidade física (aprender em diferentes locais), é preciso considerar
também a mobilidade temporal (aprender em diferentes momentos) e a
mobilidade contextual (aprender em diferentes contextos sociais). Deve-
mos observar ainda que o contexto que cerca o aprendiz móvel é definido
dinamicamente, emergindo das atividades que o ator realiza e envolven-
do motivos, ações planejadas e não planejadas (SACCOL et al., 2007).

79
Segundo Saccol, Schlemmer e Barbosa (2011), o m-learning pode
ser caracterizado por:

maior controle e autonomia do aprendiz sobre a própria


aprendizagem;

aprendizagem em contexto, no local, horário e condições que o


aprendiz julgar mais adequados;

continuidade e conectividade entre contextos nos quais o aprendiz


se mover;

aproveitamento de tempos, espaços e quaisquer oportunidades para


aprender de forma espontânea, de acordo com seus interesses e
necessidades.

É interessante ressaltar que aprender em movimento é a base da


aprendizagem móvel: uma vez que os alunos não são obrigados a perma-
necer em um local específico, as atividades de aprendizagem podem
ocorrer sem as restrições físicas normais e é possível uma maior flexibili-
dade de aprendizagem.

PARA PENSAR

Com a expansão as tecnologias móveis e os benefícios decorren-


tes, parece que os laboratórios de informática montados em esco-
las e universidades correm sério risco de obsolescência. Ainda
mais se considerarmos o fenômeno do BYOD (bring your own
device ou, em português, “traga seu próprio dispositivo”).

Mais especificamente, na aprendizagem móvel, os chamados “tem-


pos mortos” podem se tornar oportunidades para aprender. De igual for-
ma, o acesso a materiais e a interação com outros atores podem ocorrer

80
na medida em que dúvidas surgirem em campo e que situações inespera-
das se apresentarem. Dessa forma, os espaços de ensino-aprendizagem
acabam por se ampliar para além da sala de aula tradicional ou das situa-
ções formais formação/capacitação, favorecendo a educação continuada
por toda a vida.

1.2 U-learning
Como podemos ver, um dos aspectos mais positivos dos dispositi-
vos móveis é que eles permitem a aprendizagem em diferentes contextos.
À medida que o contexto muda, é necessário adequar a forma de apren-
der a esse novo contexto. Nesse sentido, Saccol et al. (2011) consideram
o u-learning (do inglês ubiquitous learning, ou aprendizagem ubíqua)
ainda mais abrangente que o m-learning.

Vamos entender melhor essa distinção. Na aprendizagem ubíqua, a


sensibilidade ao contexto do aprendiz é central. Isso se traduz na capaci-
dade de os softwares se adaptarem à situação em que o aprendiz se en-
contra – isso inclui (FILATRO; CAVALCANTI, 2018):

o contexto computacional, ou seja, a rede, o tipo de conectivi­dade, a


largura de banda;

o contexto do usuário, envolvendo seu perfil, localização, ve­locida-


de de movimento, estado de espírito, além dos usuários próximos;

seu contexto físico, incluindo luminosidade, temperatura e umidade;


e

seu contexto temporal, abrangendo hora, data ou época do ano


específica.

81
No u-learning, tudo o que ocorre ao redor do aprendiz é percebido e
capturado na forma de dados contextuais, podendo gerar a entrega perso-
nalizada de conteúdos, adaptação de atividades de aprendizagem e a re-
comendação de interações com pessoas ou locais próximos.

A detecção dos dados contextuais pode ajudar a melhorar a intera-


ção entre os alunos, os dispositivos móveis e os ambientes de aprendiza-
gem. Por exemplo, um aplicativo de aprendizagem ubíqua recupera de-
terminados dados do contexto do aprendiz; então, os materiais didáticos
são fornecidos ao aluno justamente com base na informação contextual
coletada.

Como isso é feito? Por meio de tecnologias de detecção como Wi-Fi


(conexão sem fio), GPS (do inglês global positioning system, ou sistema
de posicionamento global) e RDFI (do inglês radio-frequency identifica-
tion, ou identificação por radiofrequência). Todas essas tecnologias pos-
sibilitam a captura de dados contextuais, como horários e locais em que
as interações ocorrem.

Este é, portanto, o aspecto mais distintivo entre o ambiente de


aprendizagem ubíqua e o ambiente de aprendizagem móvel. Ou seja,
pode haver aprendizagem móvel (por exemplo, quando o aprendiz acessa
um ambiente virtual de aprendizagem tradicional em movimento, ou
seja, por meio de smartphones e tablets) mesmo que não haja a detecção
de dados contextuais por meio de sensores e tecnologias de detecção,
como ocorre de forma característica na aprendizagem ubíqua.

Aqui percebemos mais uma distinção entre o m-learning, que se


concentra em tecnologias e dispositivos móveis (por exemplo, smartpho-
nes) para apoiar a aprendizagem, e o u-learning, que pode ocorrer sem o
uso dos dispositivos móveis convencionais.

82
PARA SABER MAIS

Um exemplo de u-learning sem os dispositivos móveis tradicio-


nais pode ser visto nos Sifteo Cubes – pequenos cubos interati-
vos e comunicáveis que, conectados a um computador através de
um dispositivo sem fio, proporcionam uma maneira de inovadora
de jogar. Para entender como o vídeo funciona, sugiro que acesse
seu canal (SIFTEO, 2010).

Vemos assim que a captura e o tratamento de dados contextuais dos


alunos são inerentes à aprendizagem ubíqua. Isso nos remete ao campo
do learning analítico, que é nosso principal interesse neste livro. Mas ve-
jamos primeiro como a analítica de dados se aplica também à aprendiza-
gem móvel.

2 Analítica da aprendizagem móvel


A analítica de aprendizagem móvel (mobile learning analytics,
MLA) se concentra principalmente em coletar, analisar e apresentar rela-
tórios dos dados móveis dos aprendizes. Muitas vezes a MLA é apoiada
por dados pré-registrados sobre os alunos em diferentes sistemas educa-
cionais (sistemas de gestão escolar ou acadêmica, learning management
systems, etc.)

Os dados móveis podem ser coletados a partir das diferentes intera-


ções realizadas de forma explícita pelos alunos:

Interação explícita aluno-aluno: uma vez que os alunos não são


obrigados a permanecer em um local específico, as atividades de
aprendizagem podem ocorrer sem as restrições físicas normais e
com maior flexibilidade de aprendizagem. Por exemplo, as intera-

83
ções podem ocorrer enquanto os alunos carregam seus dispositivos
móveis. Analisar esses dados pode gerar informações úteis e levar a
uma compreensão do padrão de interação entre os alunos.

Interação explícita com materiais didáticos: uma análise do tem-


po gasto pelos alunos em atividades específicas, seus estilos de
aprendizagem preferidos, seus tempos de aprendizado preferenciais
e a frequência de acesso pode permitir a apresentação de materiais
mais personalizados, para estudo de tópicos específicos. Além dis-
so, é possível verificar se a interação entre o aluno e os materiais
didáticos está apoiando o alcance dos objetivos de aprendizagem
definidos. Nesse contexto, tanto educadores quanto estudantes po-
dem ampliar a consciência sobre o progresso da aprendizagem.

No entanto, da mesma forma que podemos diferenciar a aprendiza-


gem móvel da aprendizagem ubíqua, Aljohani e Davis (2012) diferenci-
am a MLA da analítica da aprendizagem ubíqua, como podemos ver na
seção seguinte.

3 Analítica da aprendizagem ubíqua


A analítica da aprendizagem ubíqua (ubiquitous learning analytics,
ULA) está voltada não apenas para recuperação, análise e relatório dos
dados móveis dos aprendizes, mas também para as informações contex-
tuais que caracterizam a aprendizagem ubíqua, que podem ser suplemen-
tadas pelos dados registrados em outros sistemas educacionais.

Os dados móveis e contextuais podem ser recuperados a partir de


interações explícitas, mas também de interações implícitas. Vejamos.

84
Interações explícitas: envolvem alto nível de intervenção humana,
de modo que os dispositivos móveis são controlados externamente
pelos aprendizes e influenciados por suas entradas e atividades. Os
estudantes se comunicam de forma explícita com os dispositivos de
diferentes maneiras – por meio de linha de comando, interface gráfi-
ca, entrada de fala e gestos etc., e transmitem ao sistema móvel suas
expectativas e necessidades.

Interações implícitas: os dados contextuais sobre os estudantes,


por exemplo, sua localização e o momento temporal em que ocor-
rem as interações, são coletadas automaticamente pelos dispositivos
móveis usando diferentes tecnologias de detecção, como Wi-fi, GPS
e RFID. Nesse caso, a coleta dos dados contextuais não exige ne-
nhuma intervenção direta dos alunos; mesmo assim, o uso de tais
dados pode contribuir para tornar a aprendizagem mais eficaz.

PARA SABER MAIS

Um exemplo de analítica de aprendizagem ubíqua é o sistema


Scroll (system for capturing and reminding of learning log, ou
sistema de captura e lembrete do registro de aprendizagem). O
sistema utiliza dados contextuais coletados anteriormente e os
exibe quando os alunos retornam ao local onde os dados foram
gravados, ajudando-os a lembrar o que aprenderam na ocasião.

4 Trabalhando com processos


avaliativos para mobile
Vários aspectos relacionados ao papel do learning analytics em ge-
ral para a avaliação se aplicam também ao mobile e ao ubiquitous analy-

85
tics (ver [capítulo 2]). Isso se aplica especialmente à avaliação formativa,
aquela que ocorre durante a situação didática e retroalimenta o processo
de ensino-aprendizagem por meio de feedbacks.

É certo que, depois de realizarem uma atividade proposta, pode ser


bastante útil para os alunos receberem informações sobre como eles se
saíram na tarefa. Comentários negativos podem ajudá-los a se conscienti-
zarem de seus erros e a buscarem novos caminhos. Por outro lado, o fe-
edback também pode destacar atributos positivos e, assim, proporcionar
incentivo e motivação aos alunos. Dessa forma, feedbacks balanceados
podem fornecer orientação e estímulo em prol da manutenção ou modifi-
cação de ações relevantes para a conclusão de atividades.

De um lado, feedbacks formativos (positivos ou negativos) auxiliam


os alunos a assumirem o papel de protagonistas ativos e conscientes de
seu próprio progresso em um curso ou unidade de estudo. De outro lado,
os feedbacks proveem informação aos professores sobre a eficácia do en-
sino e sobre até que ponto os alunos dominaram os conteúdos fornecidos.

De acordo com Gibbs e Simpson (2004), existem algumas condi-


ções específicas sob as quais a avaliação pode favorecer a aprendizagem,
ou seja, ser realmente formativa. No âmbito do learning analytics, desta-
camos as seguintes condições:

a. o feedback deve ser constituído por comentários suficientes, com


frequência suficiente e em detalhes suficientes;

b. o feedback deve se concentrar no desempenho dos alunos, na apren-


dizagem e nas ações sob o controle dos alunos, em vez de nos pró-
prios alunos e em suas características individuais;

86
c. o feedback é oportuno na medida em que é recebido por estudantes
enquanto ainda importa para eles e a tempo de eles prestarem aten-
ção para aprenderem mais ou receberem mais apoio.

Vemos assim que o feedback imediato é uma característica comum


à avaliação formativa e ao learning analytics, com grande potencial para
promover a chamada aprendizagem autorregulada.

Nesse sentido, como apontam Tabuenca et al. (2015), notificações


simples via SMS (do inglês short message service, ou serviço de mensa-
gens curtas) são úteis para prover a autorregulação e a prática reflexiva.
Dashboards (painéis de controle) podem apoiar a conscientização e a re-
flexão do desempenho individual e dos pares, por meio de visualizações
e estatísticas mais ricas, podendo ainda sugerir conteúdos ou atividades
de aprendizagem adicionais.

Considerações finais
Vimos neste capítulo como é amplo o potencial de utilização dos
dispositivos móveis para a aprendizagem, especialmente quando consi-
deramos a captura e o tratamento dos dados móveis e contextuais dos
aprendizes.

Nesse sentido, as áreas de analítica da aprendizagem móvel e ubí-


qua impulsionam um tipo de aprendizagem muito mais próxima da reali-
dade, in loco e personalizável às características e ao contexto de quem
aprende.

No próximo e último capítulo deste volume, vamos abordar conhe-


cimentos básicos de estatística educacional que nos permitirão com­pre-

87
ender melhor como se dá a análise de dados no learning analytics em ge-
ral e em suas versões móvel e ubíqua.

Referências
ALJOHANI, Naif R.; DAVIS, Hugh C. Learning analytics in mobile and
ubiquitous learning environments. 11th World Conference on Mobile
and Contextual Learning: mLearn 2012, Finland. 16-18 Oct 2012.

BRASIL. Instituto Brasileiro de Geografia e Estatísticas. Pesquisa Naci-


onal por Amostra de Domicílios Contínua 2016. Brasília, 2016.

FILATRO, Andrea; CAVALCANTI, Carolina C. Metodologias inov-


ativas em Educação presencial, a distância e corporativa. São Paulo:
Saraiva Somos, 2018.

GABRIEL, Martha. Você, eu e os robôs: pequeno manual do mundo


digital. São Paulo: Atlas, 2018.

GIBBS, Graham; SIMPSON, Claire. Conditions under which Assess-


ment supports Student Learning. Learning and teaching in higher edu-
cation, 2004, 1, 3-31.

ROSA, Fernanda R.; AZENHA, Gustavo S. Aprendizagem móvel no


Brasil: gestão e implementação das políticas atuais e perspectivas futu-
ras. São Paulo: Zinnerama, 2015.

SACCOL, Amarolina Z. et al. m-learning ou aprendizagem com mobili-


dade: um estudo exploratório sobre sua utilização no Brasil. XXXI En-
contro da ANPAD. Rio de Janeiro, 22 a 26 de setembro de 2007.

SACCOL, Amarolina Z.; SCHLEMMER, Eliane; BARBOSA, Jorge. m-


learning e u-learning: novas perspectivas da aprendizagem móvel e

88
ubíqua. São Paulo: Pearson, 2011.

SIFTEO. Youtube, setembro, 2010. Disponível em: <https://www.youtu-


be.com/user/sifteo/about>. Acesso em 3 abr. 2018.

TABUENCA, Bernardo et al. Time will tell: The role of mobile learning
analytics in self-regulated learning. Computers & Education 89, 2015,
pp. 53-74.

UNESCO. O futuro da aprendizagem móvel: implicações para plane-


jadores e gestores de políticas. Brasília, DF: Unesco, 2014.

89
Capítulo 6

Estatística educacional e
learning analytics

Nosso último capítulo tem por objetivo explorar os conhecimentos


básicos de estatística educacional para a análise de dados.

É fato que educação, como ciência social, trabalha com fenômenos


que não podem ser diretamente observados, por exemplo, a aprendiza-
gem, a propensão a abandonar os estudos, a criatividade. Daí a predomi-
nância de pesquisas de natureza qualitativa, que adotam métodos como
estudo de caso, pesquisa-ação e pesquisa etnográfica, entre outras.

Com a explosão dos dados e o desenvolvimento da ciência de da-


dos, o uso de métodos quantitativos e da estatística para análises multiva-
riadas, ou seja, de fenômenos complexos, que envolvem múltiplas variá-
veis, tem sido intensificado nas últimas décadas.

Por essa razão, iniciamos este capítulo com uma breve revisão dos
fundamentos da estatística e a seguir concentramos nossa atenção nas
técnicas de análise de clusters (ou clusterização), de análise fatorial e de
regressão.

90
1 Estatística básica
A estatística é uma ciência que faz parte da matemática e que em-
prega métodos para a coleta, organização, descrição, análise e interpreta-
ção de dados, visando a tomada de decisão em ambientes de incertezas e
variações.

Ou seja, a estatística está intimamente relacionada ao que vimos até


aqui a respeito de mineração e analítica de dados. Essa é razão pela qual
precisamos considerar os fundamentos da estatística quando tratamos de
um tema como o learning analytics.

Basicamente, a estatística pode ser dividida em três grandes áreas:

1. Estatística descritiva: inclui conceitos e métodos para coletar, or-


ganizar, apresentar, analisar e interpretar dados obtidos em uma co-
leção de dados (de uma população ou de uma amostra). Entre os
métodos da estatística descritiva, podemos citar: média, moda, me-
diana, frequência, intervalo de confiança, histograma, desvio pa-
drão, etc.

2. Estatística inferencial ou indutiva: refere-se ao processo de ex-


trair inferências sobre o processo ou a população em estudo, a partir
de resultados observados em uma amostra. Realiza a análise e inter-
pretação dos dados tendo em vista a tomada de decisões relaciona-
das a uma determinada população de interesse. Entre os métodos da
estatística inferencial, podemos citar: correlação (a medida da rela-
ção entre duas ou mais variáveis), regressão (que requer um conjun-
to de dados numéricos e desenvolve uma fórmula matemática que
transforma as variáveis de entrada em predição de valor real para a

91
variável dependente), teste de hipóteses (resposta à pergunta
sim/não), séries temporais, etc.

3. Estatística e probabilidade: estuda os eventos aleatórios e a incer-


teza, superando a compreensão intuitiva dos graus de probabilidade
que leva as pessoas a afirmarem que algo é provável ou improvável,
por meio de métodos de quantificação das chances associadas a di-
versos resultados.

A abordagem estatística utilizada na educação e na pesquisa em ci-


ências sociais baseia-se geralmente na estatística inferencial. Esta permi-
te que os pesquisadores coletem e analisem amostras de indivíduos e fa-
çam inferências ou generalizações sobre toda a população. Por exemplo,
se uma característica (ou seja, uma variável), como a pontuação do estu-
dante em um teste de seleção, estiver associada ao resultado de avaliação
em uma amostra, pode-se inferir que essa variável é relevante para o re-
sultado da aprendizagem na população como um todo.

PARA SABER MAIS

O Ministério da Educação publicou em 2009 um material de


apoio aos profissionais de educação no qual você pode encontrar
fundamentos da estatística que auxiliam na tomada de decisão no
campo educacional. Esse material está disponível na Web sob o
título Estatística aplicada à educação (MEDEIROS, 2009).

De acordo com Miller et al. (2015), um passo fundamental na esta-


tística inferencial é o desenvolvimento de uma hipótese a priori, uma
conjectura sobre os efeitos que existem na população. Nos dados, a rela-
ção hipotética é testada usando uma estatística específica, como correla-
ção ou regressão, e uma probabilidade (valor p) é retornada. Se o valor p

92
cair abaixo de um ponto de corte pré-especificado, a pesquisa determina
que há um efeito significativo na amostra e, portanto, na população.

Na educação a distância e em ações educacionais apoiadas por tec-


nologias, as estatísticas de uso do ambiente virtual de aprendizagem e de
outras ferramentas tecnológicas utilizadas pelos alunos são muitas vezes
o ponto de partida para a abordagem estatística, incluindo número de vi-
sitas e visitas por página.

Outras estatísticas mostram a distribuição do aluno conectado ao


longo do tempo e os cursos ou unidades de estudo dentro de um curso
com acesso mais frequente, assim como as atividades semanais e men-
sais dos usuários. Algumas estatísticas também podem mostrar o número
médio de violações a um sistema de restrições.

Métodos inferenciais mais avançados, como a análise de correlação


entre variáveis, podem ser usados para fazer inferências sobre atitudes do
aluno que afetam a aprendizagem. A análise de regressão pode ser usada
para prever se um aluno responderá a uma pergunta corretamente e qual
será sua pontuação na avaliação final.

O método estatístico consiste em algumas fases:

1. Definir qual é o problema a ser analisado ou resolvido, exercendo as


seguintes ações:

a. compreender o contexto em análise, examinando outras pes-


quisas ou outros levantamentos feitos sobre o tema, a fim de
delimitar exatamente o que se quer investigar;

b. identificar os principais parâmetros de interesse que guiarão a


coleta de dados;

93
c. formular corretamente o problema a ser analisado, a partir da
compreensão do contexto e da identificação dos parâmetros de
interesse a serem investigados.

2. Planejar a pesquisa, respondendo às seguintes perguntas:

a. Quais dados obter?

b. Como obter esses dados?

c. Que tipo de levantamento será realizado – censitário (toda a


população) ou amostral (parte da população)?

d. Qual será o cronograma de atividades?

e. Quais serão os custos de realização da pesquisa?

3. Coletar os dados, que podem ser:

a. dados primários – coletados diretamente na fonte de origem,


através de observação ou levantamento via entrevista, tele­fone
ou questionário;

b. dados secundários – coletados por outra organização, já publi-


cados anteriormente, por exemplo, o Anuário Estatístico do
IBGE.

4. Apurar os dados, por meio de:

a. tabulação – dispor em uma tabela as respostas obtidas em


questionários;

b. contagem – tamanho da amostra ou população a ser analisada


para obter os indicadores relacionados (número de respostas
válidas);

c. agrupamento – utilização de classes para agrupar informações.

94
5. Apresentar os dados, facilitando a análise, interpretação e tomada
de decisão através de:

a. tabelas;

b. gráficos;

6. Analisar e interpretar os dados, por meio das seguintes ações:

a. realizar cálculos de medidas;

b. interpretar resultados;

c. tirar conclusões.

Resumindo, as fases consistem em definir o problema (respondendo


à pergunta “O que pesquisar?”), planejar a pesquisa, coletar os dados,
apurar (ou processar) os dados e por fim apresentá-los para subsidiar a
elaboração de conclusões e a tomada de decisão. A demanda por resolver
problemas dos mais variados tipos, inclusive no campo educacional, só
aumenta. E a velocidade e variedade dos dados disponíveis para análise,
assim como o poder computacional para processá-los, só fazem crescer a
importância da estatística como método científico.

95
PARA PENSAR

É de interesse para o campo da mineração e analítica de dados a


distinção entre dados estruturados e não estruturados. Os dados
estruturados são organizados em uma estrutura numérica que os
torna identificáveis. Um exemplo são as respostas de diferentes
pacientes, de idade, sexo e condições de saúde identificadas, a
um medicamento aplicado a partir de 10 medições. Os dados não
estruturados, por sua vez, não têm uma estrutura identificável.
Um exemplo seriam as anotações do médico registradas manual-
mente ou um áudio no qual ele grava suas impressões sobre os
pacientes. A estes dados precisam ser aplicadas técnicas de apu-
ração e tratamento muito mais sofisticadas.

Conhecidos os fundamentos da estatística e o método estatístico,


cabe perguntar: no que a estatística se diferencia da ciência de dados, na
qual se situam a mineração e analítica de dados que temos estudado até
aqui?

De acordo com Amaral (2016), a estatística, seja a descritiva, seja a


inferencial, está associada à etapa de análise de dados. Ela permite dis-
tinguir entre causalidade e correlação e, assim, identificar intervenções
que causarão mudanças nos resultados. Também possibilita estabelecer
métodos de previsão e estimativa, quantificar seu grau de certeza e fazer
isso usando algoritmos que exibem um comportamento previsível e re-
produzível. Desta forma, os métodos estatísticos visam concentrar a
atenção nas descobertas que podem ser reproduzidas por outros
pesquisadores.

A ciência de dados, por sua vez, é mais abrangente, por envolver


todo o ciclo de vida dos dados, da sua produção ao seu descarte.

96
Além disso, a própria Associação Americana de Estatística reconhe-
ce que, por sua natureza interdisciplinar, a ciência de dados é composta
por várias outras ciências, como as ciências da computação, por exem-
plo, com diferentes modelos, tecnologias, processos e procedimentos re-
lacionados aos dados. Entre eles, podemos citar: a) a área de gerencia-
mento de banco de dados, que permite a transformação, a conglomeração
e a organização de dados; b) o aprendizado de máquina, que converte da-
dos em conhecimento; e c) os sistemas distribuídos e paralelos, que for-
necem a infraestrutura computacional para realizar a análise dos dados.

PARA SABER MAIS

Aprendizado de máquina (ou machine learning) é um subconjun-


to da inteligência artificial que proporciona aos computadores a
capacidade de manipular um conjunto de dados e daí extrair res-
postas a perguntas específicas, da mesma forma que um ser hu-
mano faria. Baseia-se na ideia de que existem algoritmos genéri-
cos que podem ser alimentados com dados e construir sua pró-
pria lógica com base nesses dados (FILATRO; CAVALCANTI,
2018).

2 Análise de clusters
Podemos dizer que agrupar e rotular aspectos da realidade são duas
das ocupações mais padronizadas do cérebro humano. Ao dividir a rea-­
lidade existente em diferentes categorias, estamos realizando tarefas de
agrupamento e classificação que podem ser melhoradas ao longo do tem-
po à medida que aprendemos mais sobre a realidade (VELLIDO, et al.,
2011).

97
A análise de clusters, também conhecida como clusterização (do in-
glês clustering, agrupamento) é uma técnica estatística cujo objetivo é
encontrar dados semelhantes entre si. Essa técnica distribui variados da-
dos analisados (heterogêneos) em conglomerados com características si-
milares (mais homogêneas) denominados clusters.

PARA PENSAR

No mundo dos negócios, cluster é uma concentração de empre-


sas que possuem características semelhantes, coabitam e colabo-
ram entre si, tornando-se assim mais eficientes. Um exemplo
bem conhecido de cluster é o Vale do Silício, na Califórnia (Es-
tados Unidos), onde se concentra grande número de empresas.
No Brasil, podemos citar o Porto Digital, no Recife, que é consi-
derado um dos principais parques tecnológicos do Brasil.

Uma das aplicações na área educacional é, por exemplo, agrupar


alunos para fins de atividades colaborativas, considerando características
dos estudantes, nível de conhecimento, entre outros dados.

Assim, a análise de clusters difere da classificação de dados pura e


simples porque busca associar um item de dados com um ou vários agru-
pamentos utilizando medidas de similaridades e não rótulos de classifica-
ção predefinidos. Quanto maior for a homogeneidade dentro de um gru-
po e quanto maior for a diferença entre grupos, melhor será o
agrupamento.

Existem várias formas distintas de representar os clusters criados


pelos algoritmos de agrupamento. As mais comuns são apresentadas na
figura a seguir.

Figura 1 – Exemplos de formas de representação de clusters

98
(a) Partição

(b) Diagrama de Venn

(c) Tabela ou matriz de valores

Fonte: adaptado de Linden (2009) e Regazzi (2001 apud VICINI; SOUZA, 2005, p. 19).

99
(d) Dendograma

Fonte: adaptado de Linden (2009) e Regazzi (2001 apud VICINI; SOUZA, 2005, p. 19).

Assim, cada tipo de cluster tem uma forma distinta de representar os


dados. O tipo partição (a), permite visualizar grupos de dados que estão
mais próximos entre si e mais distantes dos padrões de outros agrupa-
mentos. Já o Diagrama de Venn (b), em uma proposta parecida, agrupa
os dados em figuras geométricas.

A tabela ou, como também é chamada, matriz de vetores, apresenta


em forma matricial, representado por X, o coeficiente de correlação entre

100
os dados que foram coletados, dispostos no eixo da coluna, e as variá-
veis, dispostas no eixo da linha. Por fim, o último exemplo que apresento
é o dendograma (d), que é um diagrama em forma de árvore, que exibe o
agrupamento de acordo com a ordenação hierárquica entre os dados.

Segundo Reis (2001 apud FARIA, 2014), a análise de clusters com-


preende cinco etapas:

1. A seleção de indivíduos (ou objetos) ou de uma amostra de indi­ví-


duos (ou objetos) a serem agrupados.

2. A definição de um conjunto de variáveis a partir das quais será obti-


da a informação necessária ao agrupamento dos indivíduos
(objetos).

3. A definição de uma medida de semelhança ou distância entre cada


dois indivíduos (objetos).

4. A escolha de um critério de agregação ou desagregação dos indiví-


duos (objetos), isto é, a definição de um algoritmo de
partição/classificação.

5. Por último, a validação dos resultados.

3 Análise fatorial e regressão


A análise fatorial é uma técnica para filtrar uma massa de dados
brutos e reduzi-los a um conjunto de dados menor, selecionando e con-
servando apenas as informações mais importantes. Essa é uma maneira
de encontrar padrões ocultos, mostrar como esses padrões se sobrepõem
e indicar quais características estão presentes em vários padrões.

101
A análise fatorial é especialmente útil para conjuntos complexos de
dados, aplicando-se, por exemplo, a estudos psicológicos, pesquisas no
âmbito da política, verificação de status socioeconômico e resultados de
dietas alimentares. Por essa razão, é de grande interesse na área
educacional.

Segundo Figueiredo Filho e Silva Júnior (2010), a principal função


da análise fatorial é reduzir uma grande quantidade de variáveis observa-
das em um número menor de fatores. A ideia-chave é que múltiplas va-
riáveis observadas têm padrões similares de respostas, porque estão todas
associadas a uma variável latente (ou seja, não diretamente mensurada).
Por exemplo, as pessoas podem responder de forma semelhante a per-
guntas sobre renda, educação e ocupação, todas associadas à variável la-
tente, a situação socioeconômica.

Uma análise fatorial é basicamente um modelo da medição de uma


variável latente. Por exemplo, podemos não ser capazes de medir direta-
mente a propensão de um aluno a abandonar os estudos. Mas podemos
medir se a propensão é alta ou baixa em um conjunto de variáveis como:
“Detesto estudar” e “Não costumo concluir nada a que me proponho”.
Pessoas com alta propensão a abandonar darão respostas altas semelhan-
tes a essas variáveis, da mesma forma que pessoas com baixa propensão
a abandonar os estudos darão respostas baixas semelhantes a essas variá-
veis. Há dois tipos de análises fatoriais:

Análise fatorial exploratória: aplicada quando não se conhece a


estrutura dos dados ou quantas dimensões estão presentes em um
conjunto de variáveis. Geralmente é adotada nos estágios iniciais de
uma pesquisa, visando explorar a relação entre um conjunto de va-
riáveis e identificar padrões de correção. Também pode ser utilizada

102
para criar variáveis independentes ou dependentes que serão usadas
posteriormente em modelos de regressão (como veremos a seguir).

Análise fatorial confirmatória: empregada para testar uma hipóte-


se sobre qual é a estrutura dos dados ou quantas dimensões estão
presentes em um conjunto de variáveis. É o caso em que o investi-
gador se guia por alguma teoria e verifica em que medida determi-
nadas variáveis são representativas de um conceito ou dimensão.

PARA SABER MAIS

O artigo “Visão além do alcance” de Figueiredo Filho e Silva Jú-


nior (2010), já citado, traz um exemplo de pesquisa sobre as va-
riáveis que determina se um regime é menos ou mais democráti-
co, com base no emprego da análise fatorial.

Como mencionado anteriormente, a regressão é outro recurso esta-


tístico de interesse para a compreensão de fenômenos complexos. De
acordo com Miller et al. (2015), trata-se de uma técnica comum de mo-
delagem estatística inferencial que avalia as relações, ou correlações, en-
tre uma ou mais variáveis independentes (também chamadas de explica-
tivas ou preditoras) e um resultado, ou variável dependente (também
chamada de variável de resposta). O quadro a seguir mostra alguns
exemplos de variáveis.

Quadro 2 – Exemplos de variáveis independentes de dependentes


VARIÁVEL INDE-
VARIÁVEL DEPENDENTE (Y)
PENDENTE (X)
Temperatura do forno Resistência mecânica da cerâmica
Octanagem (propriedade da gasolina de resistir à compressão
Quantidade de aditivo
sem entrar em autoignição) da gasolina

103
VARIÁVEL INDE-
VARIÁVEL DEPENDENTE (Y)
PENDENTE (X)

Estresse Frequência cardíaca

Renda Consumo
Memória RAM Tempo de resposta do sistema
Grau de escolaridade Renda anual

Modelos com uma variável independente ou explicativa são chama-


dos de regressão simples. Modelos com mais de uma variável indepen-
dente ou explicativa são conhecidos como regressão linear múltipla.

O objetivo da regressão é, portanto, entender as relações de depen-


dência entre variáveis de modo a construir modelos que permitam prever
o comportamento de uma variável conhecendo-se os valores de outra ou
de outras variáveis.

A partir desse conceito, a análise de regressão visa:

encontrar as variáveis mais relevantes que se relacionam com a va-


riável dependente;

encontrar a função matemática que descreve como uma ou mais va-


riáveis se relacionam a essa variável dependente e estimar os parâ-
metros que definem esta função (equação ajustada); e

usar a equação ajustada para prever valores da variável dependente.

A regressão pode ser expressa em uma função matemática ou em


um gráfico (diagrama) de dispersão. Os valores de uma variável apare-
cem no eixo horizontal, e os da outra, no eixo vertical. Veja na figura a
seguir um exemplo de diagrama de dispersão que mostra a relação entre
as variáveis peso e altura.

104
Figura 2 – Exemplo de diagrama de dispersão

PESO (KG) ALTURA (M)


80 1,80

85 1,83
50 1,65
70 1,90

55 1,60
77 1,80
85 1,78

93 1,86
65 1,70
60 1,65

Fonte: adatpado de Portnoi (2006).

Quanto maior a correlação entre as variáveis, mais próxima de uma


reta será a distribuição.

105
No entanto, a análise gráfica da relação entre variáveis é importante,
mas os olhos nem sempre são um bom juiz da intensidade de uma rela-
ção. É preciso, então, utilizar medidas numéricas que acompanhem o
gráfico.

Por exemplo, o Coeficiente de Correlação de Pearson mede a inten-


sidade e a direção da relação linear entre duas variáveis quantitativas.

O resultado da equação (r) será sempre um valor entre -1 e 1, do


que se deduz que:

Quanto mais próximo r for de -1, maior será a correlação negativa


entre as variáveis.

Quanto mais próximo r for de 1, maior será a correlação positiva


entre as variáveis.

Quanto mais próximo r for de 0, menor a correlação entre as


variáveis.

Essa é apenas uma introdução à análise de regressão que, juntamen-


te com as outras técnicas aqui estudadas, demonstram o potencial da es-
tatística para apoiar a análise dos dados educacionais.

106
Considerações finais
Neste capítulo, exploramos fundamentos e técnicas da estatística
como conclusão do nosso estudo sobre learning analytics.

Mesmo apresentando de forma sucinta apenas alguns conceitos e


procedimentos dessa área, podemos observar quão importante é para os
educadores desenvolver uma “mentalidade estatística” a fim de compre-
ender melhor e questionar os números e gráficos com os quais nos depa-
raremos cada vez mais na era do big data.

Em linhas gerais, a mentalidade estatística envolve saber coletar,


descrever, analisar e sintetizar dados, exigindo uma forma de pensar di-
ferente do raciocínio matemático, pois a estatística lida com incertezas.

Adotar o pensamento estatístico envolve o ato de pensar e fazer pre-


dições sobre o processo investigativo, questionando os dados e fazendo
inferências, desde a definição da amostra até a representação visual dos
resultados a terceiros.

Referências
AMARAL, Fernando. Introdução à ciência de dados: mineração de da-
dos e big data. Rio de Janeiro: Alta Books, 2016.

FARIA, Susana M. S. M. L. Educational Data Mining e Learning


Analytics na melhoria do ensino on-line. 2014. 138 f. Dissertação
(Mestrado em Estatística, Matemática e Computação) – Universidade
Aberta de Portugal, 2014.

FIGUEIREDO FILHO, Dalson Brito; SILVA JÚNIOR, José Alexandre


da. Visão além do alcance: uma introdução à análise fatorial. Opin. Pu-

107
blica, Campinas, v. 16, n. 1, jun. 2010.

FILATRO, Andrea; CAVALCANTI, Carolina. Metodologias inov-ati-


vas em educação presencial, a distância e corporativa. São Paulo: Sa-
raiva Somos, 2018.

LINDEN, Ricardo. Técnicas de agrupamento. Revista de Sistemas de


Informação da FSMA, n. 4, 2009.

MEDEIROS, Carlos Augusto de. Estatística aplicada à educação. Bra-


sília: Universidade de Brasília, 2009.

MILLER, L. Dee et al. A Comparison of Educational Statistics and Data


Mining Approaches to Identify Characteristics that Impact Online Lear-
ning. Journal of Educational Data Mining, v. 7, n. 3, 2015.

PORTNOI, Marcos. Probabilidade e estatística: correlação e regressão


linear. Material de apoio às aulas, 2006.

VELLIDO, Alfredo; CASTRO, Félix; NEBOT; Angela. Clustering Edu-


cational Data. In: ROMERO, Cristóbal et al. Handbook of Educational
Data Mining. Boca Raton, FL: CRC Press Taylor & Francis Group,
2011.

VICINI, Lorena; SOUZA; Adriano Mendonça. Análise multivariada:


da teoria à prática. Santa Maria: UFSM, CCNE, 2005.

108
Sobre a autora

Andrea Cristina Filatro, graduada em Pedagogia, é mestra e dou-


tora em Educação pela Faculdade de Educação da USP, com formação
em gestão de projetos pela FIA – Fundação Instituto de Administração. É
consultora da FIA – Faculdade de Administração e Negócios, ENAP,
IRB e CEDDET. Professora convidada da Universidade Anhembi Mo-
rumbi no curso de pós-graduação Inovação em Tecnologias Educacio-
nais, tem experiência na área de educação a distância, ensino superior,
ensino profissionalizante e tecnologia educacional. Autora dos livros
Design instrucional contextualizado (2004), Design instrucional na prá-
tica (2008), Produção de conteúdos educacionais (2015), Design thin-
king na educação presencial, a distância e corporativa (2017), Práticas
inovadoras de educação mediadas pelas tecnologias da informação e da
comunicação (2017), Como preparar conteúdos para EAD (2018) e
Metodologias inov-ativas na educação presencial a distância e corpora-
tiva (2018).

109
Administração Regional do Senac no Estado de São Paulo
Presidente do Conselho Regional
Abram Szajman

Diretor do Departamento Regional


Luiz Francisco de A. Salgado

Superintendente Universitário e de Desenvolvimento


Luiz Carlos Dourado

Editora Senac São Paulo


Conselho Editorial
Luiz Francisco de A. Salgado
Luiz Carlos Dourado
Darcio Sayad Maia
Lucila Mara Sbrana Sciotti
Jeane Passos de Souza

Gerente/Publisher
Jeane Passos de Souza

Coordenação Editorial/Prospecção
Luís Américo Tousi Botelho
Márcia Cavalheiro Rodrigues de Almeida

Administrativo
João Almeida Santos

Comercial
Marcos Telmo da Costa

Acompanhamento Pedagógico
Ana Claudia Neif Sanches Yasuraoka

110
Designer Educacional
Francisco Shoiti Tanaka

Revisão Técnica
Whaner Endo

Coordenação de Preparação e Revisão de Texto


Luiza Elena Luchini

Preparação de Texto
Patrícia Café

Revisão de Texto
AZ Design Arte e Cultura

Projeto Gráfico Original


Alexandre Lemes da Silva
Emília Correa Abreu

Capa
Antonio Carlos De Angelis

Editoração Eletrônica
Michel Iuiti Navarro Moreno

Ilustrações
Michel Iuiti Navarro Moreno

Imagens
iStock Photos

Produção do ePub
Daniele Lippert
Juliana Ramos
Lucas Camargo
Rhodner Paiva
Ricardo Diana

Proibida a reprodução sem autorização expressa.

111
Todos os direitos desta edição reservados à
Editora Senac São Paulo
Rua 24 de Maio, 208 – 3º andar
Centro – CEP 01041-000 – São Paulo – SP
Caixa Postal 1120 – CEP 01032-970 – São Paulo – SP
Tel. (11) 2187-4450 – Fax (11) 2187-4486
E-mail: editora@sp.senac.br
Home page: http://www.editorasenacsp.com.br

© Editora Senac São Paulo, 2019

112
Dados Internacionais de Catalogação na Publicação
(CIP)

(Jeane Passos de Souza - CRB 8ª/6189)

Filatro, Andrea
Learning analytics: análise e desempenho do ensino e
aprendizagem / Andrea Filatro. – São Paulo: Editora Senac
São Paulo, 2019. (Série Universitária)
Bibliografia.
e-ISBN 978-85-396-2576-5 (ePub/2019)
1. Educação 2. Educação 3.0 3. Educação e Tecnolo-
gia 4. Análise de aprendizado 5. Pesquisa em educação:
Métodos estatísticos 6. Estatísticas educacionais: Processa-
mento de dados I. Título. II. Série.

18-859s CDD-370.72
371.33
BISAC EDU027000
EDU037000
EDU029030

Índice para catálogo sistemático


1. Educação : Análise de aprendizado : Pesquisa em
educação 370.72
2. Educação e Tecnologia 371.33

113
Siga a Editora Senac nas redes sociais.

Gostou? Confira nosso catálogo completo em


www.editorasenacsp.com.br

114
Avaliação de impacto ambiental
Souza, Barbara
9788539625994
294 páginas

Compre agora e leia

A Série Universitária foi desenvolvida pelo Senac São Paulo com o


intuito de preparar profissionais para o mercado de trabalho. Os títulos
abrangem diversas áreas, abordando desde conhecimentos teóricos e
práticos adequados às exigências profissionais até a formação ética e
sólida. Avaliação de impacto ambiental apresenta o embasamento teórico
e discute as práticas da análise de viabilidade dentro do contexto de

115
licenciamento ambiental brasileiro. Explora cada etapa do processo e os
princípios fundamentais da Avaliação de Impacto Ambiental, com ênfase
nas melhores práticas. São abordados os desafios na concepção e
implementação de propostas de desenvolvimento desde projetos até
planos e políticas. Os principais tópicos incluem o licenciamento
ambiental, o desenvolvimento sustentável, consideração de alternativas,
a hierarquia de mitigação, determinação de significância e engajamento
de partes interessadas. O livro é destinado a profissionais da área
ambiental, incluindo proponentes, consultores e reguladores, bem como
pesquisadores e estudantes.

Compre agora e leia

116
Design instrucional contextualizado
Filatro, Andrea
9788539604715
216 páginas

Compre agora e leia

A educação convencional pode ser reforçada por outra em ambientes


digitais de aprendizagem. Esse trabalho não apenas propõe opções
criativas de aplicação do design instrucional no âmbito do que já se tem,
mas, com base em conceitos fundamentais para a compreensão de sua
perspectiva sobre educação a distância on-line, design e instrução,

117
engloba a dimensão andragógica, relacionada com as condições inerentes
à aprendizagem de adultos.

Compre agora e leia

118
A formação do professor e outros escritos
Azanha, José Mário Pires
9788539603237
235 páginas

Compre agora e leia

Essa obra póstuma, referência para professores, estudantes e


profissionais da área educacional, é uma coletânea de artigos escritos
pelo professor José Mário Pires Azanha, nome expressivo da área de
filosofia da educação no Brasil. O autor enfatiza particularidades da
realidade brasileira, discorrendo sobre uma série de temas relevantes,
polêmicos e atuais, como a formação do professor, o Exame Nacional do

119
Ensino Médio (Enem), a autonomia da escola, o ensino público e os
Parâmetros Curriculares Nacionais (PCNs).

Compre agora e leia

120
Comida de bebê
Lobo, Rita
9788539614493
168 páginas

Compre agora e leia

Como é esperto esse seu bebê: nem fez um ano e já vai melhorar a
alimentação da casa toda. Não acredita? Está tudo aqui, nas páginas de
Comida de Bebê: uma introdução à comida de verdade. Com apoio de
médicos e nutricionistas, Rita Lobo traz as respostas para as dúvidas
mais comuns da fase de introdução alimentar e, de quebra, ainda ensina a
família a comer com mais saúde, mais sabor e muito mais prazer. Venha

121
descobrir como o pê-efe, o prato feito, essa grande instituição brasileira,
vai virar o pê-efinho do bebê.

Compre agora e leia

122
O que tem na geladeira?
Lobo, Rita
9788539626205
352 páginas

Compre agora e leia

Como é que eu transformo a compra da feira em refeições variadas e


saborosas todo santo dia? Este livro tem a resposta. Rita Lobo ensina sua
fórmula de criar receitas e apresenta mais de 200 opções para variar o
cardápio. Em O que tem na geladeira?, que é baseado na série de mesmo
nome do canal Panelinha no YouTube, você vai descobrir que preparar
comida saudável de verdade é mais simples do que parece. O livro é
dividido em 30 capítulos, cada um dedicado a um alimento da abóbora
ao tomate, passando pela cebola, escarola, milho, repolho, entre outros. E

123
você vai aprender os melhores cortes, técnicas de cozimento e
combinações de sabor para esses alimentos. Além das preparações com
hortaliças, raízes e legumes, o livro apresenta também opções de receitas
com carnes para compor o cardápio. Tem filé de pescada frita, tagine de
peixe, coxa de frango assada, peito de frango grelhado, bisteca grelhada,
lombo de porco, costelinha, kafta de carne, bife de contrafilé e muito
mais. Nas mais de 200 receitas, bem variadas, você encontra opções de
entradas, pratos principais, muitos acompanhamentos e até alguns bolos,
como o de cenoura, de mandioca, de pamonha, e sobremesas, como o
doce de abóbora, o curau e um incrível sorvete de cenoura indiano, o
kulfi. Para Rita Lobo, cozinhar é como ler e escrever: todo mundo
deveria saber. Mas ninguém nasce sabendo! Este livro vai dar uma
mãozinha nesse processo de aprendizagem.

Compre agora e leia

124
Table of Contents
Capítulo 1 Educação 3.0 – ajudando o estudante a
assumir o protagonismo do processo, por meio do 6
learning analytics
1 As novas TAs e a geração de dados 7
2 Feedback e o protagonismo do aluno 12
3 Educação adaptativa 16
Considerações finais 17
Referências 18
Capítulo 2 Big Data e Data Mining: transformando
22
dados em conhecimentos para a área de educação
1 Processos de avaliação 24
2 Métricas de desempenho 27
3 Big data e educação 29
Considerações finais 32
Referências 33
Capítulo 3 Dados – informações – conhecimento –
inteligência. Um processo essencial para a educação 37
para o século XXI
1 Transformando dados em conhecimento para a melhora do
38
processo ensino-aprendizagem
2 Tipos de informações: desempenho, engajamento, presença,
44
gestão, etc.
3 Enem/Enade – Como as avaliações externas geram
48
informações sobre o desempenho dos alunos e cursos
Considerações finais 52
Referências 52
Capítulo 4 LMSs e plataformas educacionais – como
avaliar se um ambiente é adequado para a nova 55
educação?
1 Tipos de LMSs e quais dados eles podem extrair da 56

125
participação e desempenho dos alunos em cursos presenciais,
híbridos e 100% on-line
2 Quais informações são importantes para a tomada de decisões? 67
3 Quais processos devem ser avaliados? 72
Considerações finais 73
Referências 74
Capítulo 5 Mobile Education – gerando dados de forma
76
ubíqua e pervasiva
1 Dados e informações em todos os lugares e a todo tempo 76
2 Analítica da aprendizagem móvel 83
3 Analítica da aprendizagem ubíqua 84
4 Trabalhando com processos avaliativos para mobile 85
Considerações finais 87
Referências 88
Capítulo 6 Estatística educacional e learning analytics 90
1 Estatística básica 91
2 Análise de clusters 97
3 Análise fatorial e regressão 101
Considerações finais 107
Referências 107
Sobre a autora 109

126

Você também pode gostar