Escolar Documentos
Profissional Documentos
Cultura Documentos
1
Pesquisas nacionais como de Palermo, Silva e Novellino (2014), afirmam que
“Os fatores que influenciam a proficiência são múltiplos e complexos”. As
informações coletadas atualmente sobre a qualidade de ensino brasileiro, são
obtidas através de dados do Censo Escolar, Exame Nacional do Ensino Médio -
ENEM ou Prova Brasil, que integram entre vários sistemas de avaliação estatística
do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira - INEP.
Inicialmente, o que iria ser chamado de Instituto Nacional de Pedagogia, o
INEP foi criado em janeiro de 1937 e homologado pelo Decreto-Lei nº 580, de 30 de
julho de 1938, com o nome de Instituto Nacional de Estudos Pedagógicos. Já em
agosto de 2001, o Inep passou a se chamar Instituto Nacional de Estudos e
Pesquisas Educacionais Anísio Teixeira, como homenagem ao educador Anísio
Teixeira que contribuiu imensamente no desenvolvimento da instituição ao longo de
duas décadas (SAVIANI, 2012). Saviani (2012), ao citar a Lei nº 378 de janeiro de
1937, afirmar que as conforme o art. 2º do decreto que o instituiu, as atribuições
iniciais do INEP foram:
a) organizar documentação relativa à história e ao
estudo atual das doutrinas e das técnicas
pedagógicas, bem como das diferentes espécies
de instituições educativas;
b) manter intercâmbio, em matéria de pedagogia,
com as instituições educacionais do País e do
estrangeiro;
c) promover inquéritos e pesquisas sobre todos
os problemas atinentes à organização do ensino,
bem como sobre os vários métodos e
processos pedagógicos;
d) promover investigações no terreno da
psicologia aplicada à educação, bem como
relativamente ao problema da orientação e seleção
profissional;
e) prestar assistência técnica aos serviços
estaduais, municipais e particulares de educação,
ministrando-lhes, mediante consulta ou
independentemente desta, esclarecimentos e
soluções sobre os problemas pedagógicos;
2
f) divulgar, pelos diferentes processos de difusão,
os conhecimentos relativos à teoria e à prática
3
aluno na escola. Desta forma é possível alcançar uma colaboração entre as três
esferas governamentais, perpassando assim uma boa qualidade na educação.
Voltado para o avanço da tecnologia, a Ciência dos Dados (Data Science) é
um campo interdisciplinar de estudo que tem por objetivo a geração de
conhecimento, a partir do armazenamento e análise de enormes quantidades de
dados, geralmente complexos, de relações intrincadas, heterogêneos e sujeitos a
ruídos, como costumam ser os dados coletados do mundo real. Engloba, portanto:
captura, armazenamento e gerenciamento de dados; infraestrutura computacional
centrada em dados, normalmente acompanhada por processamento intensivo e
massivamente paralelo; técnicas avançadas de mineração de dados e inteligência
artificial (IA) para detecção de padrões subjacentes aos dados, aprendizagem e
análises preditivas (GRUSON, D. et al, 2019).
A mineração de dados, como o próprio termo sugere, é um processo de
extração e filtragem de informações com maior valor agregado aos interesses
humanos, criando ou descobrindo relações não triviais que poderiam estar ou não
ocultas tão evidentes nos dados brutos per si (FIGUEIREDO, E. et al., 2019). Para
alguns autores, a mineração de dados é uma etapa importante nos processos mais
sofisticados de análise preditiva ofertados pela Inteligência Artificial (IA) (NGUYEN,
G. et al., 2019).
A aprendizagem de máquina é um campo da IA que trata de desenvolver
programas de computador capazes de aprender e melhorar o seu desempenho em
tarefas específicas, através da aquisição de experiência embutida nos dados que
recebe. Visa absorver representações estatísticas e matemáticas através da
estrutura dos dados de modo a utilizá-las para fazer previsões (NGUYEN, G. et al.,
2019).
Observado o esforço do Brasil e de outros países em parametrizar a
educação, e visto o avanço tecnológico dos dias atuais, se faz necessário utilizar
das técnicas mais avançadas da Tecnologia da Informação e Comunicação - TIC
que possam apresentar fatores que influenciam na educação. Existem comunidades
em todo o mundo que estudam sobre as TIC’s na educação. As mais conhecidas
são as comunidades de – Educational Data Mining (EDM) ou Mineração de dados
Educacionais – que é uma prática que surgiu em 2000 através de workshops e teve
sua primeira conferência internacional em 2008 (EDM’08, 2008). Romero e Ventura
(2013) alegaram que a EDM combinou três áreas de conhecimento: Educação,
4
Computação e Estatística. A integração desses conhecimentos gerou três novas
áreas, Learning Analytics, Data Mining e Machine Learning e o E-learning. A figura
abaixo apresenta esses relacionamentos:
5
os pesquisadores a identificar ou melhor compreender a origem desses construtos
latentes em relação às variáveis de seu interesse.
A escolha de FA se deu ao fato de o estudo buscar agrupar diversas
variáveis correlacionadas, visto que a base de dados do microdados do INEP possui
mais de 100 variáveis sobre a infraestrutura das escolas. O FA também separa as
variâncias compartilhadas entre atributos (communalities) das variâncias intrínsecas
(uniqueness). Assim, é possível dar destaques às variáveis que têm correlações
mais importantes daqueles que se correlacionam pouco.
1.2 Justificativa:
Acredita-se que descobrir como melhorar a qualidade da educação deve ser
a vontade de todo profissional da área. As primeiras pesquisas oficiais se tornaram
mundialmente conhecidas a partir da década de 60 (COLEMAN, 1966). Encontrar
ferramentas ou métodos que identifiquem critérios relevantes sobre a educação
sempre será bem vinda a comunidade e a sociedade. Essa pesquisa pode ajudar as
escolas a se desenvolverem, e assim: melhorar a reputação da escola, melhorar na
motivação e dedicação dos alunos e dos professores; e contribuir para gerar um
ambiente mais propício à aprendizagem.
Mas não basta detectar quais são os critérios de uma educação de
qualidade. Somente o termo qualidade já é complexo suficiente. É preciso muito
mais que um aspecto para melhorar a educação como todo. Para a Unesco,
A qualidade se transformou em um conceito
dinâmico que deve se adaptar permanentemente a
um mundo que experimenta profundas
transformações sociais e econômicas. É cada vez
mais importante estimular a capacidade de previsão
e de antecipação. Os antigos critérios de qualidade
já não são suficientes. Apesar das diferenças de
contexto, existem muitos elementos comuns na
busca de uma educação de qualidade que deveria
capacitar a todos, mulheres e homens, para
participarem plenamente da vida comunitária e para
serem também cidadãos do mundo. (UNESCO,
2001:1 apud GADOTTI, p.2)
6
Visto que o governo brasileiro entrega seus dados sobre a educação de forma
gratuita, percebe-se que essa pesquisa se torna muito viável, pois seu custo se
limita apenas ao limite dos computadores que utilizaremos para esse trabalho.
1.3 Objetivos
1.3.1 Objetivo Geral:
Analisar com o uso de técnicas da inteligência artificial quais fatores das
infraestruturas escolares públicas correlacionam tanto positivamente quanto
negativamente o crescimento do IDEB no Brasil e como diferenciá-las?
7
● A conclusão no Capítulo 5, apresenta o que o trabalho pode contribuir para o
meio acadêmico e as dificuldades e limitações encontradas, finalizando com
as propostas de trabalhos futuros.
● Após os capítulos são apresentados os apêndices e anexos que descrevem
…
8
BIBLIOGRAFIA:
9
● EDM’08. The First International Conference on Educational Data Mining.
Montreal, Quebéc, Canada: Université du Québec à Montréal (UQÀM), jun.
2008.
10
● Romero, C., & Ventura, S. (2013). Data mining in education. Wiley
Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 3(1), 12-27.
11
Tecnicamente, essas descrições excluem a análise de componentes, que é
um método para reduzir a dimensionalidade de um conjunto de variáveis
observadas através da criação de um número ótimo de compósitos ponderados.
Uma grande diferença entre a análise fatorial e a de componentes é que na última
toda a variância é analisada, enquanto na análise fatorial, apenas a variância
compartilhada (comum) é analisada. Por esse motivo, a análise fatorial às vezes é
chamada de análise fatorial comum. De muitas maneiras, no entanto, a análise de
componentes é muito semelhante à análise fatorial comum, e muitos dos
desideratos para a análise fatorial exploratória apresentados aqui se aplicam
igualmente à análise de componentes. Dado que o objetivo da análise de
componentes é explicar o máximo possível de variância observada por meio dos
compostos ponderados e não, como na análise fatorial comum, modelar as relações
entre variáveis como funções de variáveis latentes subjacentes, aqueles desideratos
relacionados à importância da teoria pois a análise fatorial não se aplica
necessariamente à análise de componentes (ver Widaman, 2007, para uma
explicação detalhada da distinção conceitual e matemática entre análise fatorial
exploratória e análise de componentes principais). Isso porque, embora os
componentes possam representar construtos, a análise de componentes ainda pode
ter utilidade como método de redução de dados, mesmo que os próprios
componentes não sejam interpretados. Nesses casos, os componentes não
fornecem uma explicação para a variância compartilhada das variáveis, mas são
usados para representar essa variância compartilhada da maneira mais
parcimoniosa possível.
A Análise de Componentes Principais, em inglês “Principal Component
Analysis” (PCA), é um método de estatística multivariada que foi desenvolvida antes
da Segunda Guerra Mundial. Porém, sua aplicação se tornou mais ampla somente
na década de 1960. Esse lapso temporal se deu pelo fato da enorme dificuldade dos
cálculos envolvendo esse método. Somente após o desenvolvimento dos
computadores o uso do PCA se tornou mais aplicável. Ao mesmo tempo, surgiram
requisitos de cálculo de autovalores e autovetores, porque a aplicação de
componentes principais em problemas técnicos exigia muita precisão (Maćkiewicz,
Ratajczak, 1993). O PCA analisa consecutivamente, matrizes de variância-
covariância e correlações, e executa as diversas funções, como: teste dos
componentes principais e/ou mais relevantes de um matriz; construção de dendritos
12
para padronização dos componentes principais selecionados; definição de valores e
vetores próprios das matrizes analisadas; testes e cálculos de coeficientes entre os
componentes selecionados; determinação da variação de todas as variáveis de
entrada para cada componente; criação de um dendrito inicial das variáveis de
entrada; separação de objetos analisados em um sistema de coordenadas; outros.
Para esse trabalho, busca-se utilizar as técnicas de IA Principal Component
Analysis - PCA e outras, tanto na base de dados do IDEB e do microdados
ofertados pelo INEP. O objetivo é identificar quais são os fatores ou características
“determinantes (promotores), influenciadores e/ou condicionantes que podem
comprometer a qualidade do ensino”. Ressalta-se que o critério de um bom
desempenho escolar neste trabalho, está ligado ao bom desempenho das escolas
em relação a nota do IDEB da instituição. Apesar de alguns autores como Soares e
Xavier (2013) criticarem a possível manipulação de dados do IDEB para uma
avaliação de desempenho escolar, ainda assim, usaremos o mesmo como métrica
de referência de qualidade de ensino.
13