Você está na página 1de 64

INSTITUTO DE DESENVOLVIMENTO EDUCACIONAL DO ALTO URUGUAI

FACULDADE IDEAU
CURSO DE ENGENHARIA DE PRODUÇÃO

APLICAÇÃO DE REDES NEURAIS ARTIFICIAIS NA


PROGNOSE DA CAPTAÇÃO ACADÊMICA DE UMA
INSTITUIÇÃO DE ENSINO SUPERIOR

TRABALHO DE CONCLUSÃO DE CURSO

CARLOS ALBANO DE OLIVEIRA JÚNIOR

Getúlio Vargas – RS
2018
CARLOS ALBANO DE OLIVEIRA JÚNIOR

APLICAÇÃO DE REDES NEURAIS ARTIFICIAIS NA


PROGNOSE DE CAPTAÇÃO ACADÊMICA DE UMA
INSTITUIÇÃO DE ENSINO SUPERIOR

Trabalho de Conclusão de Curso apresentado


ao curso de Engenharia de Produção, do
Instituto de Desenvolvimento Educacional do
Alto Uruguai, como parte dos requisitos para
obtenção do grau de Bacharel em Engenharia
de Produção.
Orientadora: Ms. Elisandra Mottin Freschi

Getúlio Vargas – RS
2018
INSTITUTO DE DESENVOLVIMENTO EDUCACIONAL DO ALTO URUGUAI
FACULDADE IDEAU
CURSO DE ENGENHARIA DE PRODUÇÃO

A comissão examinadora, abaixo assinada, aprova o Trabalho de


Conclusão de Curso

APLICAÇÃO DE REDES NEURAIS ARTIFICIAIS NA


PROGNOSE DA CAPTAÇÃO ACADÊMICA DE UMA
INSTITUIÇÃO DE ENSINO SUPERIOR

ELABORADO POR:
CARLOS ALBANO DE OLIVEIRA JÚNIOR

Como requisito parcial para obtenção do grau de


Bacharel em Engenharia de Produção

COMISSÃO EXAMINADORA:

Prof. Ms. Elisandra Mottin Freschi, IDEAU (Orientadora)

Prof. Ms. Suzana França de Oliveira da Silva, IDEAU

Prof. Esp. Murilo Nuernberg, IDEAU

Getúlio Vargas – RS
2018
Dedico este trabalho a todos os mentores que
fomentaram o conhecimento que até então
erigi.
AGRADECIMENTOS

Agradeço, primeiramente, a minha família por ser o arcabouço para o


desenvolvimento e conclusão deste trabalho.
As “pedras no caminho” que tornaram o percurso mais estimulante.
Àqueles que me criticaram construtivamente.
Àqueles que me instigaram almejar sempre mais conhecimento.
A quem me acompanhou esta extensa marcha.
A todos vocês,
MEU SINCERO RECONHECIMENTO.
“Se você não sabe o que irá enfrentar,
planeje para o pior caso e otimize.”
Simon Haykin

“Quando se age com base na piedade e

não na justiça, termina-se punido.”


Ayn Rand
RESUMO

O trabalho desenvolvido alude a um estudo, no qual se aplicou Redes Neurais


Artificias (RNA), no processo de previsão da capacidade para obtenção de novos
acadêmicos de uma entidade privada de ensino. Almejando, arquitetar uma rede
conexionista adequada a aproximar a função capacitada para previsão de demanda
anual acadêmica de uma instituição de ensino superior. Empregou-se, o método
qualitativo, concomitante, a pesquisa bibliográfica e exploratória; utilizando o
programa Neuroph para a construção da rede Perceptron de Múltiplas Camadas
(PMC). Além da inferência estatística envolvida na interpretação das variáveis, essas
de origens geográfica, mercadológica e econômica. Culminando, após o estudo,
nestes resultados principais, como: a identificação da convergência muito relevante
dos indicadores de renda e produção regional, destacando-se a produção primária
que constitui a variável que melhor segue a variação das matrículas da faculdade; a
percepção de que quanto mais enxuta for a rede neural, melhor será seu desempenho
dentro dos limites pré-estabelecidos como escopo; e, obviamente, o sucesso no
desenvolvimento do pretendido sistema de previsão de demanda embasado em
inteligência artificial à Faculdade IDEAU.

Palavras-chave: Redes Neurais Artificiais, Perpectron de Múltiplas Camadas,


Previsão Acadêmica.
ABSTRACT

The work developed refers to a study in which Artificial Neural Networks (ANN) was
applied in the process of predicting the capacity to obtain new academics from a private
teaching entity. In aiming, to architect a suitable connectionist network to approximate
the function enabled to forecast the annual academic demand of a higher education
institution. The qualitative method, concomitant, was used the bibliographic and
exploratory research; using the Neuroph program for the construction of the multilayer
Perceptron (MLP). In addition to the statistical inference involved in the interpretation
of the variables, those of geographic, market and economic origin. The following
results to top in the study, in most studies, in the top of study results, in the top of
research, and important regional studies, in the top of the matrices of college; the
perception that there is more sulfur to a neural network, the better its performance
within the pre-established limits as a scope; and, obviously, the success in the
development of the intended demand prediction system based on artificial intelligence
to the College IDEAU.

Keywords: Artificial Neural Network, Multilayer Perceptron, Academic Demand.


LISTA DE FIGURAS

Figura 1: Estrutura Biológica do Neurônio Humano. ................................................. 25


Figura 2: Estrutura do Neurônio Artificial. .................................................................. 26
Figura 3: Feedforward de Camada Simples .............................................................. 27
Figura 4: Feedforward de Camadas Múltiplas ........................................................... 28
Figura 5: Recorrentes ou Realimentada .................................................................... 28
Figura 6: Estrutura Reticulada ................................................................................... 29
Figura 7: Topografia PMC TCC-7.............................................................................. 54
LISTA DE TABELAS

Tabela 1: Classificação de Correlação ...................................................................... 37


Tabela 2: Fluxo do Método Empregado no Estudo. .................................................. 40
Tabela 3: Egressos Totais Anuais ............................................................................. 46
Tabela 4: Vagas Oferecidas Anualmente .................................................................. 47
Tabela 5: PIB Per Capita ........................................................................................... 48
Tabela 6: Produção Setorial ...................................................................................... 49
Tabela 7: Taxa de Inflação IPCA e Desemprego RMPA Anuais ............................... 50
Tabela 8: Matrículas Anuais ...................................................................................... 51
Tabela 9: Correlação e Desvio Padrão ..................................................................... 51
Tabela 10: Normalização dos Dados ........................................................................ 52
Tabela 11: Descrição PMC TCC-7 ............................................................................ 53
Tabela 12: Relatório Treinamento ............................................................................. 56
Tabela 13: Relatório Teste ........................................................................................ 57
LISTA DE GRÁFICOS

Gráfico 1: Erro Total .................................................................................................. 54


Gráfico 2: Histograma das Ponderações TCC-7 ....................................................... 55
Gráfico 3: Resultado Treinamento TCC-7 ................................................................. 56
Gráfico 4: Resultado Teste TCC-7 ............................................................................ 57
LISTA DE ABREVIATURAS

CRE – Coordenadoria Regional de Educação


EaD – Ensino a Distância
EJA – Educação de Jovens e Adultos
EM – Ensino Médio
FEE – Fundação de Economia e Estatística
IA – Inteligência Artificial
IBGE – INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA
IDE – Ambiente de Desenvolvimento Integrado
IDEAU – Instituto de Desenvolvimento Educacional do Alto Uruguai
IES – Instituição de Ensino Superior
INEP – Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira
IPCA – Índice Nacional de Preços ao Consumidor Amplo
IPEA – Instituto de Pesquisa Econômica Aplicada
MEC – Ministério da Educação
PIB – Produto Interno Bruto
PMC – Perceptron de Múltiplas Camadas
RMPA – Região Metropolitana de Porto Alegre
RNA – Redes Neurais Artificiais
STP – Sistema Toyota de Produção
TCC – Trabalho de Conclusão de Curso
SUMÁRIO
1 INTRODUÇÃO ....................................................................................................... 15
1.1 Identificação do Problema ................................................................................ 16
1.2 Objetivos ............................................................................................................ 17
1.2.1 Objetivo Geral .................................................................................................. 17
1.2.2 Objetivos Específicos ....................................................................................... 18
1.3 Justificativa........................................................................................................ 18
1.4 Estrutura do Trabalho ....................................................................................... 20
2 REFERENCIAL TEÓRICO..................................................................................... 22
2.1 Redes Neurais Artificiais .................................................................................. 22
2.1.1 Histórico ........................................................................................................... 23
2.1.2 Neurônio Biológico ........................................................................................... 24
2.1.3 Neurônio Artificial ............................................................................................. 25
2.1.4 Principais Arquiteturas...................................................................................... 27
2.1.5 Aprendizagem .................................................................................................. 29
2.1.6 Configurações de RNA’s .................................................................................. 29
2.1.7 Perceptron de Múltiplas Camadas (PMC) ........................................................ 30
2.1.8 Algoritmo Backpropagation .............................................................................. 30
2.1.9 Aplicações ........................................................................................................ 32
2.1.10 Neuroph Studio .............................................................................................. 33
2.1.11 Normalização dos Dados ............................................................................... 33
2.2 Previsão Demanda ............................................................................................ 34
2.3 Estatística Descritiva Bivariada ....................................................................... 35
2.3.1 Medidas de Associação.................................................................................... 35
2.3.2 Medidas de Correlação .................................................................................... 36
3 METODOLOGIA .................................................................................................... 38
3.1 Delineamento da Pesquisa ............................................................................... 38
3.2 Método de Trabalho .......................................................................................... 39
3.3 Coleta dos Dados .............................................................................................. 41
3.4 Análise dos Dados ............................................................................................ 41
3.5 Delimitações Do Trabalho ................................................................................ 42
4 APRESENTAÇÃO E ANÁLISE DOS RESULTADOS ........................................... 44
4.1 Apresentação da Empresa Estudada .............................................................. 44
4.2 Período Estudado .............................................................................................. 44
4.3 Região Analisada .............................................................................................. 45
4.4 Análise dos Resultados .................................................................................... 46
4.4.1 Egressos do Ensino Médio Regular e EJA ....................................................... 46
4.4.2 Total de Vagas Oferecidas ............................................................................... 47
4.4.3 PIB Per Capita .................................................................................................. 47
4.4.4 Produção Setorial ............................................................................................. 48
4.4.5 Taxa de Inflação do Real e Taxa de Desemprego ........................................... 49
4.4.6 Matrículas Anuais ............................................................................................. 50
4.4.7 Correlação e Desvio Padrão ............................................................................ 51
4.4.8 Normalização dos Dados ................................................................................. 52
4.4.9 Construção das RNA’s ..................................................................................... 52
5 DISCUSSÃO DOS RESULTADOS ........................................................................ 58
CONCLUSÃO ........................................................................................................... 61
REFERÊNCIAS ......................................................................................................... 63
15

1 INTRODUÇÃO

No preâmbulo da era industrial, em razão da enorme demanda do mercado


consumidor por produtos industrializados as indústrias permaneciam em uma situação
favorável. Decorrente desse cenário, qual fosse a espécie, quantidade ou qualidade
dos produtos e serviços produzidos pelas organizações, esses provavelmente seriam
comercializados com sucesso. Assim, evidencia-se que o processo de gestão
produtivo nesse período não exigia uma sistemática meticulosa para o êxito do
empreendimento.
Progressivamente, a capacidade de o mercado absorver a oferta maciça de
produtos processados foi se restringindo. Uma vez que, com o aumento da
capacidade produtiva, da concorrência de livre mercado e das circunstâncias
inevitáveis dos ciclos econômicos, ocorreu a elevação exponencial da seletividade dos
clientes em relação a escolha dos produtos e serviços que lhes interessassem. Dessa
forma, pondo em julgamento a capacidade administrativa até então vigente nas
indústrias.
Advindo de tal panorama, a necessidade de uma metodologia de gestão
embasada em fatos e estatísticas constitui-se como a diferença entre a evolução ou a
extinção das empresas. Em função disso, surgiram a Administração Científica de
Taylor, o Fordismo, o Sistema Toyota da Produção (STP), a filosofia Lean, a
Engenharia de Produção e a aplicação da Inteligência Artificial (IA) para referenciar e
possibilitar o controle e o planejamento administrativo efetivo. Proporcionando,
maximizar os lucros, minimizar os custos e as despesas, analisar os riscos e a
viabilidade dos seus investimentos durante a alocação de seus bens escassos.
Destarte, superando vários paradigmas no processo de melhoria continua na
disciplina gerencial.
Contemplando as considerações expostas acima, o presente trabalho almeja a
criação de uma ferramenta para o auxílio administrativo de uma instituição de ensino
superior. Visando, melhorar o processo decisório e de planejamento na destinação de
seus recursos privados, o estudo se propõem a efetuar a prognose da captação
acadêmica anual através do uso de Redes Neurais Artificias (RNA), especificamente,
o Perceptron de Múltiplas Camadas (PMC), com processo de Machine Learning
Backpropagation, baseando-se em índices econômicos, oferta de vagas da instituição
16

e a demanda primária em sua região de influência. Assim, empregando Inteligência


Artificial para prever a demanda da organização objeto de estudo.
O presente trabalho encontra-se estruturado em capítulos. No primeiro capítulo
é apresentado o problema, os objetivos e a justificativa da pesquisa. O segundo
capítulo aborda o referencial teórico utilizado no estudo que destaca assuntos sobre
história, definições, importância, inferência estatística, normalização de dados e
aplicação das RNA’s no processo de previsão. O terceiro capítulo refere-se à
metodologia aplicada. As apresentações dos dados, análises de resultados,
sugestões e propostas compõem o conteúdo do capítulo quatro e no cinco encontra-
se as discussões dos resultados. As considerações finais antecedem as referências
bibliográficas, sendo assuntos do sexto e do sétimo capítulos, respectivamente,
finalizando desta forma o trabalho.

1.1 Identificação do Problema

Para a elaboração do trabalho identificou-se problemas intrínsecos, os quais


caracterizam-se como obstáculos a serem superados para o desenvolvimento do
estudo proposto.
Primeiramente, questiona-se em relação às Redes Neurais Artificiais (RNA’s)
se realmente são ferramentas computacionais indicadas para a previsão da demanda
de captação para cursos superiores. Ao passo que, as características mais atrativas
das redes neurais artificiais consistem de suas elevadas habilidades em mapear
sistemas não-lineares, aprendendo os comportamentos analisados a partir de dados
e informações, fazendo destas ferramentas poderosas para aplicação em problemas
dinâmicos. E consequentemente, com aplicação viável em sistemas de previsão.
Dando continuidade ao estudo, a seleção das variáveis independentes, a serem
apuradas como entradas competentes a inserção nas redes conexionistas,
apresentam-se como um problema para produção dos indicadores de previsão de
demanda total da instituição de ensino. Nesse caso, mesmo não sendo do escopo do
trabalho a demonstração dos aspectos que interferem na busca pela instrução de nível
superior, serão utilizados, indicadores socioeconômicos, concomitantemente, a
análise do perfil da instituição em sua região de influência, justificando, a natureza das
variáveis e qualificando-as através de métodos de inferência estatística. Dessa forma,
17

sendo capaz de demonstrar as relativas relações entre os termos entrada escolhidos


e os aspectos a serem previstos.
Ainda nessa perspectiva, há que se ressaltar que os dados a serem utilizados
como parâmetros de treinamento para o sistema de prognose não possuem um
contingente significativo para gerar maior confiabilidade a dinâmica de aprendizado
sináptico da rede neural. Não só, há de se salientar a importância do tipo de RNA a
ser utilizada, aditivo a topologia arquitetural a construir para a criação do método de
previsão, além da escolha, para a execução da rede, entre a utilização através de
programação por linguagem computacional ou servir-se de programa especializado
em processadores paralelamente distribuídos.
É válido também apontar, que o estudo em questão lidará com questões
praxiológicas, pois tange a ação humana, tanto em relação às escolhas individuais da
população analisada, como cenários políticos e econômicos, adido as considerações
geográficas e mercadológicas. Ao passo que, buscar-se-á minimizar o ruído que
envolva esses feitios da pesquisa.
Considerando as premissas acima detalhadas define-se como questão de
pesquisa a respectiva inquisição: “Qual a rede neural artificial capaz de produzir um
sistema de previsão da captação acadêmica anual de uma instituição de ensino
superior?”

1.2 Objetivos

Neste tópico serão apresentados os objetivos deste trabalho. Primeiramente,


apresentar-se-á o objetivo geral e posteriormente os objetivos específicos.

1.2.1 Objetivo Geral

Construir uma rede neural artificial adequada a aproximar a função capacitada


para previsão de demanda acadêmica de uma instituição de ensino superior.
18

1.2.2 Objetivos Específicos

• Calcular o grau de correlação das variáveis no desempenho do problema


estudado;
• Demonstrar a viabilidade da utilização das RNA’s para a prognose de demanda
acadêmica;
• Evidenciar através de inferência estatística os parâmetros com maior influência
aos resultados almejados;
• Produzir indicadores numéricos que quantifiquem proporcionalmente a demanda
total acadêmica à instituição.

1.3 Justificativa

Confere-se como justificativa relevante a área de estudo, no qual está sendo


desenvolvido, o presente trabalho. Uma vez que, essencialmente, o estudo a ser
elaborado trata-se de uma sistemática para previsão de demanda dos serviços
oferecidos por uma entidade privada. E que a partir disso, como a Engenharia de
Produção, notoriamente, acentua-se como uma área do conhecimento que reúne em
sua alçada a gestão de recursos escassos, visando maximizar sua utilização, é
imperativo à efetiva administração, desenvolvimento e utilização de indicadores
competentes para previsão da demanda.
Emerge como argumento a realização do exposto trabalho a entidade onde
será efetuado, no caso específico da instituição de ensino superior, a criação de
fatores estatísticos para tomada de decisão em situações de incerteza. Tendo
conhecimento que no Brasil a oferta de cursos, e de suas respectivas vagas, é
regulada e regulamentada pelo Ministério da Educação (MEC), há de se esperar que
no cenário ideal todas as inscrições ofertadas pela instituição fossem preenchidas,
não obstante, tal cenário revela-se antifactual à instituição em estudo. Nesse
panorama, uma avaliação apurada da expectativa da demanda para o mix dos cursos
oferecidos demonstra-se como referência a ponderação de atividades como: análise
mercadológica necessária, os recursos que serão demandados, e além, da avaliação
de viabilidade de oferecer os cursos ao público.
Finalmente, ainda é possível citar a legítima contribuição acadêmica e científica
à área da Inteligência Artificial (IA). À medida que, através da demonstração de uma
19

nova aplicação prática em aproximação de funções em previsões com redes


conexionistas, atesta-se o potencial de versatilidade das Redes Neurais Artificiais para
a solução de problemas de natureza variada.
Pertinente salientar que, efetuada a revisão sistemática da literatura existente,
não foram encontrados artigos, trabalhos e pesquisas que tratassem do mesmo tema
proposto no presente trabalho. Isso posto, manifesta-se o caráter inédito do presente
estudo a ser executado. Para a corroboração dessas alegações, segue a tabela
ilustrando os termos e fontes utilizados na revisão sistemática da literatura (Quadro
1):

Quadro 1 – Termos e Fontes Pesquisadas na Revisão Sistemática da Literatura.


Termo de Fonte
Termo de busca Termo complementar
ligação pesquisada
Redes Neurais
e Previsão de Demanda Google Scholar
Artificiais
Redes Neurais
e Previsão de Demanda Crossref
Artificiais
Redes Neurais
e Previsão de Demanda Portal Capes
Artificiais
Redes Neurais
e Previsão de Vendas Google Scholar
Artificiais
Redes Neurais
e Previsão Acadêmica Google Scholar
Artificiais
Fonte: Autor, 2018.

No processo da busca bibliográfica foi consultado como instrumento de


pesquisa três portais distintos (Google Scholar, Crossref e Portal Capes), sendo o
primeiro, utilizado como meio de busca principal. Findadas as inquirições, não fora
encontrado nessas fontes nenhum artigo em língua portuguesa que dissertasse sobre
o uso de RNA’s para a prognose da captação acadêmica. Em contrapartida, localizou-
se vários artigos os quais aludem o emprego de redes conexionistas no processo de
previsão de demanda, consumo ou venda de bens e serviços utilizados em diversos
cenários distintos.
20

Advertindo que na presente data das execuções das pesquisas nesses portais,
com a inserção dos termos acima descritos, foram quantitativamente encontrados,
respectivamente:
1- O volume de 980 artigos em língua portuguesa e nenhum correspondente ao
tema do trabalho.
2- A grandeza de 200 artigos em língua portuguesa e nenhum correspondente ao
tema do trabalho.
3- O montante de 200 artigos em língua portuguesa e nenhum correspondente ao
tema do trabalho.
4- A porção de 980 artigos em língua portuguesa e nenhum correspondente ao
tema do trabalho.
5- A dimensão de 980 artigos em língua portuguesa e nenhum correspondente ao
tema do trabalho.

1.4 Estrutura do trabalho

No primeiro capítulo foram introduzidos os assuntos e as relações com a


engenharia de produção, apresentado o problema de pesquisa, os objetivos do
trabalho, geral e específicos, e as justificativas de realizar o referido estudo bem como
a revisão sistemática da literatura. No capítulo dois, será apresentado o histórico das
redes conexionistas, a estrutura do neurônio artificial, concomitante a sua analogia
biológica, em que se inspira, os tipos de redes neurais, os processos de aprendizado
e generalização, as ferramentas aproveitadas, o processo de normalização dos dados
a serem coletados, além de embasar os processos de inferência estatística para
delinear a relação das entradas para calcular a previsão de demanda acadêmica. No
terceiro capítulo, declara-se a metodologia utilizada, a coleta de dados documental, a
utilização de processos estatísticos para embasar a escolha das variáveis de entrada,
além de como serão interpretados e empregados os resultados das RNA’s
construídas.
No capítulo quatro, encontra-se os resultados da pesquisa, a comprovação da
relação causal das entradas com a variação da captação acadêmica, a construção de
uma rede PMC para o sistema de previsão, os resultados dos processos de
treinamento e a capacidade de generalização da rede na análise do problema. No
quinto capítulo, será demonstrado a relação entre os eventos observados na prática
21

e a teoria pesquisada, as tendências evidenciadas, os possíveis rumos do trabalho,


as contribuições para as teorias acerca do assunto e as contribuições para a empresa
objeto de estudo. No capítulo seis se enunciará se os objetivos foram atingidos, se os
resultados obtidos foram satisfatórios, destacar-se-á se os mesmos terão sua
relevância confirmada, apontando as melhorias à instituição, as limitações e
sugestões para próximas pesquisas. No último capítulo, o sétimo, será elencado as
referências usufruídas durante o estudo.
22

2 REFERENCIAL TEÓRICO

2.1 Redes Neurais Artificiais

A genealogia da teoria das Redes Neurais emerge da conversão em modelos


matemáticos e modelos de engenharia, dos neurônios biológicos humanos (KOVÁCS,
2006). São processadores paralelamente distribuídos compostos de simples unidades
de processamento, armazenando conhecimento experimental e o disponibilizando ao
uso. Assemelhando-se ao cérebro em duas particularidades; primeira, o
conhecimento é obtido pela rede com base no seu ambiente através de um processo
de aprendizagem; segundamente, forças de conexão entre neurônios, denominadas
como pesos sinápticos, armazenam o conhecimento contraído (HAYKIN, 2001).
Analogamente definem, Silva et al. (2016), as RNA’s como modelos
computacionais motivados pelos estudos dos processos pertencentes ao sistema
nervoso de seres vivos. Possuindo a aptidão de aquisição e conservação de
conhecimento (baseado em informações). Sendo, um conjunto de unidades de
processamento, constituídos por neurônios artificiais, que são interligados por muitas
interconexões, estando representadas matematicamente por vetores/matrizes de
pesos sinápticos.
Uma rede neural é um sistema computacional fundamentada no
processamento interligado paralelamente para desempenhar uma determinada tarefa.
Os modelos de redes conexionistas constituem proeminente técnica estatística não-
linear capacitada para deliberar uma sucessão de problemas de enorme
complexidade. Por isso, são úteis em situações que não há a possibilidade de mesurar
explicitamente um conjunto de regras. Ordinariamente, isso ocorre quando o meio
gerador dos dados se transforma constantemente. Os principais campos de ação são
para previsão e classificação de padrões (VELLASCO, 2007).
Acrescentando que as Redes Neurais Artificiais (RNA) se tornam um dos
artifícios da área de inteligência artificial (IA) que gradativamente é mais explorado
para resolução de problemas relativos à classificação e agrupamento de padrões
(dados), principalmente no exame de imagens, em que alguns algoritmos
convencionais não têm competência perante à complexidade das estruturas. Contudo,
a produção destas ferramentas computacionais não é banal e, frequentemente, o
próprio disciplina de RNA no meio acadêmico é negligenciada (SUPTITZ et al. 2015).
23

2.1.1 Histórico

Em 1943, insuflado pelos avanços na deliberação experimental das


propriedades eletrofisiológicas dos neurônios, e pelos então recentes resultados de
Alan Turing e Jonh von Neumann que determinaram a essencial natureza booleana
da inteligência, sendo possivelmente o resultado da atividade neuronal, Warren
McCulloch – médico, filósofo, matemático e poeta – juntamente com o estatístico
Walter Pitts publicaram o artigo que hoje é referência primeira referência para a teoria
das redes neurais artificiais(KOVÁCS, 2006).
Fora apresentado por Donald Hebb, em 1949, o primeiro trabalho comprovando
ligação direta com o aprendizado das RNA’s. Mostrou como a plasticidade da
aprendizagem de redes conexionistas é alcançada nos neurônios através da variação
dos pesos de entrada. Propondo uma teoria explicando o aprendizado em neurônios
biológicos abalizado no reforço das ligações sinápticas entre neurônios excitados.
Conhecida como regra de Hebb na comunidade de RNA’s (BRAGA et al., 2012).
No desfecho da década de 1950 na Universidade de Cornell, Rosenblatt
desenvolveu às ideias de McCulloch. Criando a rede de Perceptron, uma autêntica
rede de múltiplos neurônios do tipo discriminadores lineares (KOVÁCS, 2006). Widrow
e Hoff em 1960 desenvolveram a rede Adaline (Adaptive Linear Element).
Consecutivamente, propuseram a Adaline múltipla, denominado de Madaline. (SILVA
et al., 2016). Mais tarde, sugeriram uma regra de aprendizado, conhecida como regra
delta, também conhecida como algoritmo de aprendizagem LMS (least mean square).
Esta, por sua vez, é fundamentada no método do gradiente descendente para
minimização do erro na saída de um neurônio com resposta linear (BRAGA et al.,
2012)
Todavia, em 1969, a neurocomputação padeceu um contratempo com a
publicação dos estudos de Minsky & Papert. Os autores evidenciaram de forma
efusiva as restrições das RNA’s, compostas com somente uma única camada, ao
aprender a confluência entre as entradas e saídas de funções de lógica simples como
Xor (ou-exclusivo). Essencialmente, na publicação demonstraram a impossibilidade da
ferramenta neurocomputacional realizar a apropriada classificação de padrões para
classes não linearmente separáveis (SILVA et al., 2016).
John Hopfield publicou, no início da década de 1980, um artigo que destacou
as propriedades associativas das RNA’s. A partir dessa publicação ocorreu a
24

retomada das pesquisas na área. O grande feito de Hopfield foi, sem sombra de
dúvida, salientar a relação entre sistemas físicos e redes recorrentes auto-
associativas, proporcionando o espaço para a aplicação de teorias correntes da Física
para estudar tais modelos neurais. O relato do algoritmo de treinamento
Backpropagation poucos anos depois revelou que a perspectiva de Minsky & Papert
sobre o perceptron era extremamente pessimista. As RNA’s de múltiplas camadas
são, inquestionavelmente, aptas ao deliberar problemas complexos. A partir dessa
década, principiou-se o novo estopim do entusiasmo pelas RNA’s na comunidade
cientifica mundial. Além disso, uma dupla de fatores se responsabilizam pelo retorno
de interesse na área: em primeiramente, o avanço da tecnologia, sobretudo no setor
de microeletrônica, que viabilizou a execução de modelos de neuronais e sua
interconexão de uma maneira antes impensável; em segundo, o lapso simbólico do
restante do ambiente de IA, mesmo com o seu sucesso na solução de determinados
tipos de problemas, não tenha conquistado avanços expressivos na resolução de
alguns problemas simples para seres humanos (BRAGA et al., 2012).

2.1.2 Neurônio Biológico

A computação de informações no cérebro humano é administrada por elemento


processadores biológicos que atuam em paralelo, tendo como propósito a produção
de ações adequadas para cada uma de suas aplicações, por exemplo, como refletir e
memorizar. O neurônio, sendo a célula elementar do sistema nervoso aptas para
conduzir impulsos elétricos provenientes de reações físico-químicas. Tal elemento
cerebral é desmembrado em três partes principalmente, isto é, nos dendritos, no copo
celular (soma) e no axônio, como verificado na Figura 1. (SILVA et al., 2016).
25

Figura 1: Estrutura Biológica do Neurônio Humano.


Fonte: Silva et al., 2016.

Os dendritos possuem a tarefa de incorporar as informações, ou impulsos


eletromagnéticos, originários de outros neurônios e dirigi-los até a soma. Então,
processando a informação, e novos impulsos são produzidos. Esses estímulos são
comunicados a outros neurônios, conduzido pelo axônio até os dendritos dos
próximos neurônios. Dessa forma, a sinapse, define-se como o contato entre a
terminação axônica de um neurônio e o dendrito de outro. Através das sinapses que
os neurônios se unem funcionalmente, erigindo as redes neurais biológicas. As
sinapses funcionam como condicionadores capazes de gerir a transmissão de do fluxo
da informação entre neurônios na rede neural (BRAGA et al., 2012).

2.1.3 Neurônio Artificial

O neurônio artificial é a analogia digital do neurônio biológico, enquadrando-se


como uma unidade de processamento informacional preponderante para a operação
de uma RNA. O neurônio, subdivide-se em: sinais de entrada, pesos sinápticos, limiar
de ativação, combinador linear, potencial de integração, função de ativação e sinais
de saídas (HAYKIN, 2001). Essa unidade computacional está ilustrada na figura a
seguir (Figura 2):
26

Figura 2: Estrutura do Neurônio Artificial.


Fonte: Haykin, 2001.

Por consequente, definem Silva et al. (2016), os elementos básicos do neurônio


artificial como:

a) Sinais de entrada {x1, x2, ..., xm): medidas do ambiente que são usualmente
normalizadas buscando incrementar a eficiência computacional dos algoritmos
de aprendizagem.
b) Pesos sinápticos {wk1, wk2, ..., wkm}: são os valores que ponderarão cada
entrada da rede, possibilitando quantificar as relações de funcionamento de
neurônio.
c) Combinar linear {}: é a reunião o produto de todas as entradas ponderadas
produzindo um valor de potencial de ativação.
d) Limiar de ativação ou bias {bk}: é a variável que indica qual o patamar adequado
para que o resultado gerado pelo combinador linear consiga precisar um valor
de disparo em direção à saída do neurônio.
27

e) Potencial de ativação {k}: é a diferença entre  e bk ordenando se o potencial


será excitatório (k ≥ bk) ou inibitório (k < bk).
f) Função de ativação {(.)}: seu intuito é moderar a saída do neurônio dentro de
um razoável intervalo de valores a serem admitidos pela própria imagem
funcional. Podendo as funções ser: degrau, função sinal, rampa simétrica,
logística, tangente hiperbólica, gaussiana e linear.
g) Sinal de saída {yk}: é o resultado do processamento feito pelo neurônio.

2.1.4 Principais Arquiteturas

Indiferente da função de ativação empregada, neurônios individuais têm


aptidão computacional insuficiente. Porém, um grupo de neurônios artificiais
entrelaçados em uma rede neural são capazes de resolver dificílimos problemas
(BRAGA et al., 2012). O estilo pela qual os neurônios de uma rede neural estão
organizados está profundamente relacionado com o algoritmo de aprendizagem
usado para o treinamento da rede (HAYKIN, 2001). As arquiteturas podem ser
classificadas como:

a) Feedforward de Camada Simples – rede formada com somente uma camada


de neurônios com o fluxo de informação sempre seguindo uma única direção,
ou seja, camada de entrada para a camada de saída (Figura 3) (SILVA et al.,
2016).

Figura 3: Feedforward de Camada Simples


Fonte: Silva et al., 2016.
28

b) Feedforward de Camadas Múltiplas – rede unidirecional com um ou mais


camadas neuronais ocultas, com a funcionalidade de intervir utilmente entre as
entradas e as saídas da rede (Figura 4) (HAYKIN, 2001).

Figura 4: Feedforward de Camadas Múltiplas


Fonte: Haykin, 2001.

c) Recorrentes ou Realimentada – rede empregada para a resolução de


problemas que envolvam processamento temporal (Figura 5) (BRAGA et al.,
2012).

Figura 5: Recorrentes ou Realimentada


Fonte: Haykin, 2001.

d) Estrutura Reticulada – rede que considera a disposição espacial das unidades


de processamento almejando a extração de características (Figura 6) (SILVA
et al., 2016).
29

Figura 6: Estrutura Reticulada


Fonte: Silva et al., 2016.

2.1.5 Aprendizagem

É o procedimento pelo qual os parâmetros livres de uma RNA são ponderados


pelo estimulo ambiental no qual a rede está estabelecida. A determinação do tipo de
aprendizagem ocorre pela maneira como a alteração do parâmetro acontece. A
reunião de regras precisas à solução de um problema de treinamento é designada
como algoritmo de aprendizagem (HAYKIN, 2001). Segundo Braga et al. (2012), os
processos de aprendizagem são divididos em:
a) Supervisionado – Treinamento com supervisão, ou professor externo, o qual é
responsável por inserir os padrões de entrada na rede e verificar a saída
resultante, comparando-a com a saída desejada.
b) Não-supervisionado – Não há um supervisor externo ou professor responsável
pelo acompanhamento do procedimento. No decorrer do processo de
aprendizagem as entradas alimentam continuamente à rede, e a ocorrência de
regularidade e redundância nos dados possibilitam o aprendizado da RNA.

2.1.6 Configurações de RNA’s

EXPLANAM SILVA ET AL. (2016), EXEMPLOS DE VÁRIAS CONFIGURAÇÕES DE


REDES CONEXIONISTAS DESENVOLVIDAS, TAIS COMO:
a) Perceptron – Combinar Linear de Rosenblat
b) Adaline – Adaptive Linear Element
c) Madaline – Múltipla Adaline
d) PMC – Perceptron de Múltiplas Camadas
e) RBF – Funções de Base Radial
30

f) Hopfield – Recorrentes de Hopfield


g) SOM – Mapas Auto-organizáveis
h) LVQ – Quantização Vetorial por Aprendizagem
i) Conter-Propagation – Redes de Contra Propagação
j) ART – Teoria da Ressonância Adaptativa

2.1.7 Perceptron de Múltiplas Camadas (PMC)

As redes PMC, dissertam Silva et al. (2016), são caraterizadas pela presença
de no mínimo uma camada escondida de neurônios, localizada entre a os
processadores de entrada e a respectiva camada de saída da RNA. Em decorrência
disso, as redes PMC usufruem de pelo menos duas camadas de neurônios, os quais
estarão distribuídos entre as camadas intermediárias e camada de saída.
Notoriamente, os perpectrons de múltiplas camadas têm sucesso na resolução
de diversos problemas complexos, caracterizam-se por efetuarem seu treinamento
supervisionada pelo, popularmente conhecido, algoritmo de retropropagação de erro
(HAYKIN, 2001).

2.1.8 Algoritmo Backpropagation

O algoritmo de treinamento de redes PMC é o backpropagation que, por ser


supervisionados ou com professor, usa pares de entrada e saída (x, yd) para, pela
convergência de erros, ajustar as ponderações da rede. O treinamento ocorre em
duas etapas, em que cada etapa perfaz a rede em um sentido. As fases do
backpropagation são chamadas de fase forward e fase backward. A fase forward
serve para delimitar a saída da rede para um dado padrão de entrada. A fase
backward aproveita a saída desejada e a saída fornecida para atualizar os pesos de
suas sinapses. O ajuste de pesos da rede baseia-se na regra delta generalizada
(BRAGA et al, 2012).
Detalhamento, o processo de treinamento da rede PMC utilizando o
backpropagation é empregado através dos passos a seguir (NOVAIS et al apud
WERBOS, 2016):
1. Principiar os pesos sinápticos com valores não nulos e aleatórios;
2. Exprimir um padrão de entrada e propagá-lo até a saída da rede;
31

3. Calcular os erros momentâneos na saída da rede (E), em que (1) demonstra o


cálculo do erro de cada neurônio no instante n, e (2) refere-se ao cálculo do
erro total no instante n;
𝑒𝑗 (𝑛) = 𝑑𝑗 (𝑛) − 𝑦𝑗 (𝑛)
(1)
𝑚
1
𝐸(𝑛) = ∑ 𝑒𝑗2 (𝑛)
2
𝑗−1

(2)
4. Com a equação (4), calcular os gradientes locais (δ) dos neurônios da camada
de saída. O gradiente (δ) do neurônio artificial j é o produto entre o erro desse
neurônio (ej) com a derivada da função de ativação (Q’) aplicada ao campo
local induzido vj calculado em (3), onde wij representa o peso de entrada
associado a cada neurônio j;
𝑚

𝑣𝑗 (𝑛) = ∑ 𝑤𝑖𝑗 (𝑛) − 𝑦𝑗 (𝑛)


𝑖=0

(3)

𝛿𝑗 (𝑛) = 𝑒𝑗 (𝑛)𝑄 ′ (𝑣𝑗 (𝑛))

(4)
5. Ajustar os pesos da camada de saída utilizando as equações em (5):
∆𝑤𝑗𝑖 (𝑛) = 𝜂𝛿(𝑛)𝑦𝑖 (𝑛)
𝑤𝑖𝑗 (𝑛 + 1) = 𝑤𝑖𝑗 + ∆𝑤𝑗𝑖 (𝑛)
(5)
6. Mensurar os gradientes locais dos neurônios da camada escondida adotando
(6), em que p alude à quantidade de neurônios à direita integrados a j:
𝑝

𝛿𝑗 (𝑛) = 𝑄 (𝑣𝑗 (𝑛)) ∑ 𝛿𝑘 (𝑛)𝑤𝑘𝑗 (𝑛)
𝑘=1

(6)
7. Ajustar os pesos da camada oculta aplicando as equações em (7);
∆𝑤𝑗𝑖 (𝑛) = 𝜂𝛿(𝑛)𝑦𝑖 (𝑛)
𝑤𝑖𝑗 (𝑛 + 1) = 𝑤𝑖𝑗 + ∆𝑤𝑗𝑖 (𝑛)
(7)
8. Para todos os padrões de treinamento (1 época) repetir os passos de 2 a 7;
32

9. Calcular a cada época o erro médio quadrado (EMQ) para o treinamento


empregando a equação (8), onde N constitui o número de padrões utilizados
no treinamento;
𝑁
1
𝐸𝑀𝑄 = ∑ 𝐸(𝑗)
𝑁
𝑗=1

(8)
10. Se o EMQ>VD (valor desejado) ou se as épocas iteradas forem menos que o
número máximo de épocas (NMEp), repetir o passo 8. Senão pare;

2.1.9 Aplicações

Segundo Braga et al. (2012), as RNA’s se aplicam essencialmente a problemas


nos quais hajam dados, experimentais ou suscitados através de modelos, pelos quais
a rede adaptará os seus pesos visando o cumprimento de alguma tarefa. Em razão
disso, as ocupações capitais nas quais as RNA’s se aplicam são: classificação (atribuir
padrão desconhecido a várias classes conhecidas), categorização (descobrir classes
bem definidas nos dados de entrada), aproximação (mapear funções continuas das
variáveis de entrada), previsão (estimar situações futuras com base nos estados
atuais e anteriores do sistema modelado) e otimização (minimizar ou maximizar uma
função de custo). A Quadro 2 esboça algumas aplicações das RNA’s:

Quadro 2: Algumas aplicações das RNA’s.


TAREFAS ALGUMAS APLICAÇÕES

Reconhecimento de caracteres.
Reconhecimento de imagens.
Diagnostico (médico, equipamento, etc.)
Classificação Análise de crédito.
Detecção de fraudes.
Detecção de falhas em sistemas
industriais.
33

Agrupamento de sequências de DNA.


Categorização Mineração de dados.
Análise de expressão gênica.
Agrupamento de clientes.

Previsão do tempo.
Previsão Previsão financeira (câmbio, bolsa, etc.)
Modelagem de sistemas dinâmicos.
Previsão de sequências de DNA.

Fonte: adaptação de Braga et al. (2012).

2.1.10 Neuroph Studio

O Neuroph (Java Neural Network Framework) é um ambiente de


desenvolvimento integrado (IDE) exclusivo para modelagem de RNA’s convencionais.
Disponibilizando simultaneamente com uma biblioteca de código aberto, escrita na
linguagem Java. Dispõem ainda de uma ferramenta gráfica que proporciona a criação e
o armazenamento dos modelos de RNA. Oferece boa documentação on-line (SUPTITZ,
et al., 2015).
Contudo, apontam Suptitz et al., (2015), não há uma maneira simplificada de
inserir a entrada dos dados e validar o modelo arquitetado: os dados precisam ser
manualmente digitados ou então importados e já processados para análise da RNA.
Além disso, não é possível visualizar os estágios de execução do modelo de rede
neural, como possibilidade de observar a ponderação dos pesos sinápticos,
acompanhar as integrações e as transferências intraneural.

2.1.11 Normalização dos Dados

De forma que as entradas de uma rede neural apresentam caráteres distintos


é imperativo que os seus valores sejam normalizados para evitar que as unidades de
processamento da camada escondida com funções de ativação sigmoides não
operem na região de saturação e que as importâncias das grandezas díspares não
sugestione de maneira variada as ponderações dos pesos e vieses da rede
conexionista no decorrer do treinamento. As saídas almejadas também necessitam
34

ser normalizadas para que seja admissível o correto mapeamento entre os domínios
normalizadas e as imagens adequadas. Para esses desígnios os dados para os intups
amostral de treinamento da rede e as saídas pretendidas apropriadas são ajustados
para se situarem dentro intervalo [0,1] ou [-1, +1] (GAMBOGI, 2013). Obedecendo, o
cálculo da seguinte fórmula:
(𝑥𝑁𝑚𝑎𝑥 − 𝑥𝑁𝑚𝑖𝑛 )(𝑥 − 𝑥𝑚𝑖𝑛 )
𝑥𝑁 = + 𝑥𝑁𝑚𝑖𝑛
𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
Em que:
xN = valor normalizado.
x = valor a normalizar.
xNmax = limite superior para normalização.
xNmin = limite inferior para normalização.
xmax = limite superior da variável a normalizar.
xmin = limite inferior da variável a normalizar.

2.2 Previsão Demanda

Desenvolver previsões de demanda é proeminente para auxiliar na estipulação


dos recursos imperativos ao empreendimento. Fundamental em tempos de abertura
de mercados. Além, dos mercados que podem ser atingidos pela empresa, assim
como a concorrência que enfrentará, transformam-se continuamente, exigindo novas
previsões de demanda em períodos gradativamente mais curtos (MAKRIDAKIS et
al.,1998). As previsões de demanda procuram executar a prognose das situações que
podem suceder em um período para que seja possível suavizar os impactos
motivados por falhas em um projeto mal executado. Auxiliando na tomada de decisão
influenciando diretamente no desempenho da organização (GASPARINI, 2017).
Na perspectiva da demanda, a concepção de conhecimento que é
preponderante a informação sobre a demanda futura de serviços e de produtos das
organizações. As intenções dos clientes podem ser obtidas de várias fontes, bem
como dados e informações sobre a concorrência são conseguidas por meio de
atividades de monitoramento de mercado que auxiliam a formação coerente do
potencial de demanda (DAY, 1994). Em algumas ocorrências, esse conhecimento é
produzido formalmente, através de metodologias disciplinadas de previsão,
35

empregando técnicas de modelagem estatística sofisticadas, para categorizar


padrões históricos de demanda e projetá-los para o futuro (MOON, 2006).

2.3 Estatística Descritiva Bivariada

A estatística descritiva pode ser conceituada como um grupo de técnicas


analíticas empregado para explorar os dados coletados numa dada pesquisa, que são
categorizados por números, tabelas e gráficos. Visando proporcionar relatórios que
demonstrem informações sobre a relação, tendência e dispersão dos dados
(MORAIS, 2005). Específica Fávero e Belfiore (2017), a estatística descritiva
bivariada objetiva analisar e estudar as relações (associação para variáveis
qualitativas e correlação para variáveis quantitativas) entre uma dupla de variáveis.

2.3.1 Medidas de Associação

De acordo com Fávero e Belfiore (2017), medidas de associação são o conjunto


de parâmetros estatísticos que almejam verificar a existência de associação entre dois
grupos qualitativos de estudo e de seu grau de associação. Essas medidas são:
a) Qui-quadrada (X2) – mensura a discrepância entre a tabela de contingente
observado e o esperado. Na medida em que um valor baixo indica
independência entre as variáveis. Calculado por:
𝐼 𝐽 2
2
(𝑂𝑖𝑗 − 𝐸𝑖𝑗 )
𝑋 = ∑∑
𝐸𝑖𝑗
𝑖=1 𝑗=1

em que:
Oij = quantidade de observações na i-ésima categoria da variável X e na j-
ésima da variável Y;
Eij = frequência esperada de observações na i-ésima categoria da variável X e
na j-ésima da variável Y;
I = quantidade de categorias (linhas) da variável X;
J = quantidade de categorias (colunas) da variável Y.
b) Coeficiente Phi – medida de associação para variáveis nominais fundamentada
no X². Com resultado entre 0 (independente) e 1 (associação perfeita).
Calculado por:
36

𝑋2
𝑃ℎ𝑖 = √
𝑛

c) Coeficiente de Contingência (C) – medida de associação para variáveis


nominais fundamentada no X². Com limite inferior sendo 0 (independente) e
limite superior em função da quantidade de categorias. Calculado por:

𝑋2
𝐶=√
𝑛 + 𝑋2

d) Coeficiente V de Cramer – medida de associação para variáveis nominais


fundamentada no X². Com resultado entre 0 (independente) e 1 (associação
perfeita). Calculado por:

𝑋2
𝑉=√ 𝑒𝑚 𝑞𝑢𝑒 𝑞 = 𝑚í𝑛(𝐼, 𝐽)
𝑛. (𝑞 − 1)

e) Coeficiente de Spearman (rsp) – medida de associação para variáveis ordinais.


Com resultado 0 indicando independente total. Calculado por:
6 ∑𝑛𝑘=1 𝑑𝑘2
𝑟𝑠𝑝 = 1 −
𝑛. (𝑛2 − 1)
em que:
n = número de observações;
dk = diferença entre os postos de ordem k.

2.3.2 Medidas de Correlação

Conforme Fávero e Belfiore (2017), medidas de correlação são o conjunto de


coeficientes estatísticos que visam averiguar a existência de correlação entre duas
variáveis quantitativos estudadas e de seu grau de correlação. Essas medidas são:
a) Covariância (cov (X, Y)) – mesura a variação conjunta entre duas variáveis
quantitativos. Calculado por:
∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅). (𝑌𝑖 − 𝑌̅)
𝑐𝑜𝑣(𝑋, 𝑌) =
𝑛−1
em que:
Xi = i-ésimo valor de X;
Yi = i-ésimo valor de Y;
𝑋̅ = média dos valores de X;
37

𝑌̅ = média dos valores de Y;


n = tamanho da amostra.
b) Coeficiente de Correlação de Pearson (𝜌) – é uma medida que varia de -1 a 1.
Na forma que, se 1 (diretamente proporcional), se -1 (inversamente
proporcional) ou se 0 (independentes). Calculado por:
∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅). (𝑌𝑖 − 𝑌̅)
𝜌=
√∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅) √∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)

Ainda acrescenta Dantas apud Pereira (2005), pode classificar os resultados


como (Tabela 1):

Coeficiente Correlação
|𝜌| = 0 Nula
0 < |𝜌| ≤ 0,30 Fraca
0,30 < |𝜌| ≤ 0,70 Media
0,70 < |𝜌| ≤ 0,90 Forte
0,90 < |𝜌| ≤ 0,99 Fortíssima
|𝜌| = 1 Perfeita

Tabela 1: Classificação de Correlação


Fonte: adaptação Dantas, 2005.
38

3 METODOLOGIA

Subsequentemente, serão exprimidos os sistemas e os processos utilizados


durante a execução da presente pesquisa. Contando sinteticamente, o delineamento
de pesquisa, o método empregado, como se coletou os dados, e como esses foram
analisados no decorrer do trabalho e, por fim, enumerar as delimitações consideradas.
Logo, demonstrando a sistemática aplicada pelos quais se regeu a presente
investigação científica.

3.1 Delineamento da Pesquisa

A princípio, o atual estudo tipifica-se como uma pesquisa bibliográfica, na qual


têm materiais já publicados como base de formação. Convencionalmente,
empregando materiais impressos, como livros, revistas, jornais, teses, dissertações e
anais de eventos científicos como fontes nessa modalidade de pesquisa. Entretanto,
pelo mérito da propagação de novos formatos de informação, estas pesquisas incluem
também outras espécies de fontes, como discos, fitas magnéticas, CD’s, tal como
material encontrado na internet (GIL, 2010). Acrescenta, Marion et al (2010), que esse
método visa despontar a evolução do conhecimento sobre um determinado assunto
específico, assinalando os acertos e as falhas dos múltiplos trabalhos na área,
criticando e elogiando, definindo o que é, verdadeiramente, significativo. A locução
“pesquisa bibliográfica” é habitualmente utilizada para indicar um passo da revisão da
literatura. De tal modo, é concomitantemente qualificada como um tipo de pesquisa e
uma parte do processo de realização de um trabalho acadêmico ou científico.
Incluso a pesquisa bibliográfica, o estudo classifica-se como uma pesquisa
exploratória que caracteriza normalmente quando existe escasso conhecimento sobre
o assunto a ser abordado. Por tal artifício, procura-se entender profundamente a
temática, o tornando mais claro ou construindo indagações relevantes ao
direcionamento da pesquisa (RAUPP & BEUREN, 2006). Com determinados
desígnios primordiais, como: oportunizar maiores informações sobre o assunto que
será investigado; promover a delimitação do tema de pesquisa; orientar os objetivos
e o levantamento das hipóteses; ou encontrar um novo tipo de aspecto sobre o tema.
(ANDRADE, 2002)
39

Caracterizando-se também pelo método quantitativo, no qual consiste numa


maneira de experimentar teorias objetivas, examinado a relação entre as variáveis.
Tais variáveis podem ser mensuradas tradicionalmente por instrumentos, para que os
dados numéricos se capacitem à análise estatística. O documento final do estudo tem
uma estrutura fixa, a qual constitui-se em introdução, bibliografia e teoria, métodos,
resultados, discussão e conclusão (CRESWELL, 2008). Ressaltando que são aqueles
trabalhos acadêmicos ou científicos os quais o pesquisador colige, cataloga e avalia
dados numéricos. Começando com o estudo amostral, quantificando fatores,
buscando as correlações estatísticas e probabilísticas, e ao final, as generalizações
(MARION et al, 2010).

3.2 Método de Trabalho

Inicialmente, efetuou-se o projeto de pesquisa, constando a identificação do


problema que foi investigado, o escopo que pretendesse alcançar com o estudo sobre
a temática em questão, justificar a importância e necessidade da realização da
utilização de uma rede PMC na prognose da captação acadêmica, junto com a
referência teórica necessária que embasou a execução da pesquisa. Em seguida, fez-
se a seleção e coleta dos dados para possíveis entradas que se utilizou na RNA. Com
esses dados, testou-se a hipótese da relação causal entre os problemas e as variáveis
elencadas, calculando as suas correlações, identificando os valores de convergência
entre as mesmas.
Em posse desses dados, iniciou-se o processo de normalização e pré-
processamento das entradas e saída, em seguida a geração de uma rede PMC,
treinando-a pelo processo supervisionado, com os dados coletados junto a instituição
como amostra de controle. Feito isso, realizou-se o processo de ajuste da rede, como:
adequação da taxa de aprendizagem, a eficiência da topologia neural, o número de
iterações necessário ao treinamento, e se houve a obtenção da precisão pretendida,
elegeu-se a PMC mais competente. Empreendidas tais tarefas, encetou-se o processo
de generalização da rede para validá-la como efetivo sistema de previsão da captação
acadêmica. Finalmente, relatou-se no documento os dados utilizados, analisando-os,
e postulando sugestões e propostas, outrossim, discutiu-se o escopo da investigação
científica, exprimindo as considerações finais depreendidas com o trabalho.
40

Em seguida esboça-se na tabela de fluxo o método empregado no estudo


(Tabela 2):

• Identificação do Problema.
• Objetivos.
• Justificativa.
Projeto • Referencial Teórico.

• Coleta de dados para possíveis variáveis de entrada.


• Hipóteses de relação causal entre o problema e as variáveis.
• Cálculo de correlação
Seleção de • Processo de normalização e pré-processamento da base de
Inputs dados.

• Coleta de dados dos outputs e sua normalização.


Geração da • Construção de uma rede PMC
RNA. • Treinamento supevisionado.

• Ajuste da taxa de aprendizagem.


• Determinar o grafo arquitetural eficiente.
Ajustes da • Regular o número necessário de neurônios e épocas.
Rede. • Alcaçar a precisão pré-definida.

• Generalização das amostras de teste.


Validação da • Efetivação do sistema de previsão da captação acadêmica.
Rede PMC.

• Expocição dos dados.


• Análises, sugestões e propostas.
Relato dos • Discussões sobre o escopo.
Resultados. • Conclusões.

Tabela 2: Fluxo do Método Empregado no Estudo.


Fonte: Autor, 2018.
41

3.3 Coleta dos Dados

Compreendendo a natureza do referido trabalho científico, foi utilizado o


método documental para o processo de coleta dos dados necessários a realização do
estudo. A quem desejar empreender uma pesquisa documental deverá objetivar
compor uma coletânea satisfatória, consumir todas as fontes de informações
interessantes (CELLARD, 2008). Refere-se como um critério de coleta de dados que
suprime, parcialmente, a eventualidade de qualquer interferência do pesquisador nas
interações, acontecimentos ou comportamentos pesquisados (GAUTHIER, 1984). Os
documentos são fontes de informações, recomendações e elucidações que trazem
seu conteúdo para resolver certas questões e auxiliar na validação para outras,
respeitando os interesses do cientista (FIGUEIREDO, 2007). Tais documentações
foram coletadas na instituição objeto de estudo, Instituição de Desenvolvimento
Educacional do Alto Uruguai (IDEAU), nos portais do Ministério da Educação (MEC),
no Instituto Brasileiro de Geografia e Estatística (IBGE), no Instituto Nacional de
Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), no Instituto de Pesquisa
Econômica Aplicada (IPEA), na Fundação de Economia e Estatística (FEE), nas 7ª,
15ª e 39ª CRE’s (Coordenadoria Regional de Educação) do estado do Rio Grande do
Sul e nas instituições públicas e privadas de ensino médio e básico abrangido por
essas coordenadorias.

3.4 Análise dos Dados

Praticar a seleção da coleção de variáveis que, na perspectiva do pesquisador,


hipoteticamente, talvez tenham relação com a demanda acadêmica da instituição
estudada e representem o cenário econômico regional. As variáveis escolhidas
tiveram origens diversas, especificamente, foram consideradas questões geográficas,
mercadológicas e econômicas como possíveis entradas as redes conexionistas.
Acatada a primeira etapa, com o emprego de inferência estatística, particularmente, o
cálculo de correlação (r de Pearson), para quantificar a convergência das variáveis
selecionadas para o processo de previsão de captação da instituição. Posteriormente,
foram organizados os diferentes domínios e sua imagem em períodos, e a partir disso,
realizou-se a normalização dos dados num intervalo necessário as funções de
42

ativação da futura RNA que foi arquitetada. Nessas atividades, elaborando gráficos
que ilustrem a sua relação tendenciosa.
Já com a propriedade das entradas relevantes ao problema, inicia-se o projeto
da rede PMC. Exclusivamente, foi aproveitado o programa gratuito Neuroph – Java
Neural Network Framework – para a geração das redes neurais processadas durante
a pesquisa. Nessa ferramenta, foi construído a rede PMC que avaliou os dados
inseridos buscando aproximar a função capaz de prever o problema considerado na
pesquisa, através da ponderação de seus pesos sinápticos pelo treinamento
supervisionado com o algoritmo Backpropagation.
Sendo ainda, efetuado todas as medidas necessárias de ajuste da RNA (taxa
de aprendizagem, arquitetura neural, o número de épocas de treinamento e precisão
pretendida) nessa plataforma. Todos esses procedimentos de refinamento foram
ilustrados graficamente no trabalho. Obtida a precisão almejada e a rede neural já
calibrada, enfim, realizou-se o processo de generalização, como método de
contraprova para validação do sistema, corroborando sua capacidade de previsão
com amostras fora do conjunto de treinamento. Dessa forma, efetivando a promoção
de uma sistemática apta a prognose da captação acadêmica da instituição de ensino
superior estudada.

3.5 Delimitações do Trabalho

A pesquisa delimita-se a realizar a produção de um sistema capaz de prever a


demanda anual de uma instituição de ensino superior privada, localizada no interior,
na região do Alto Uruguai do estado do Rio Grande do Sul. Considerando, somente
fatores quantitativos para a execução da pesquisa, englobando apenas o conjunto de
municípios onde a instituição tem influência, não ponderando fatores psicológicos,
emocionais ou culturais da população estudada. Logo, a pesquisa versa somente
sobre as idiossincrasias específicas que, factualmente, afetam o desempenho
mercadológico da empresa pesquisada perante um cenário econômico.
A investigação não teve como escopo criar uma metodologia universal para
previsão de demanda acadêmica. Muito menos, revela-se como um estudo capacitado
para determinar os fatores que afetam de forma peremptória as escolhas de uma
população específica por instrução de nível superior. Conscientizando-se que a
variedade de instituições de ensino superior é imensa, à medida que, por exemplo,
43

existem entidades públicas, privadas e até de ensino a distância (EaD) que atendem
uma infinidade de públicos com expectativas diversas.
Sendo assim, a sistemática que aqui se desenvolveu foi, iminentemente,
incompetente em casos tão genéricos. Definitivamente, apenas com uma anterior
análise rigorosa, dos fatores singulares de influência da instituição de ensino e
acréscimos metodológicos de estudo correlatos, é que o método pesquisado no
referido trabalho pode ser desenvolvido com outros planos de fundo.
44

4 APRESENTAÇÃO E ANÁLISE DOS RESULTADOS

Neste capítulo apresentam-se os resultados da pesquisa, bem como as


análises referentes a estes resultados.

4.1 Apresentação da Empresa Estudada

Em setembro de 2004 é fundada em Getúlio Vargas a entidade particular de


ensino superior IDEAU (Instituto de Desenvolvimento Educacional do Alto Uruguai),
tendo por objetivo a formação de pessoas, por meio do ensino de qualidade.
A instituição oferece em seu portfólio cursos em diversas áreas do
conhecimento no nível da graduação, como: Administração, Agronomia, Análise e
Desenvolvimento de Sistemas, Arquitetura e Urbanismo, Ciências Contábeis, Design
de Moda, Direito, Educação Física (Licenciatura e Bacharelado), Engenharia de
Produção, Estética e Cosmética, Farmácia, Fisioterapia, Medicina Veterinária,
Odontologia, Pedagogia, Psicologia e Turismo. Almejando, o processo de integração
da teoria com prática para desenvolver profissionais qualificados ao mercado de
trabalho. Além de promover cursos de especialização, mestrado, cursos técnicos e de
atualidade, educação básica e possuir revista cinética própria. Atendendo, um público
abrangendo num nicho geográfico que inclui 50 municípios do noroeste gaúcho.

4.2 Período Estudado

O intervalo empregado no presente estudo, foi delimitado, indiretamente pela


Instituição de Ensino Superior, em uma série temporal que gerasse dados
consideráveis à produção dos indicadores resposta, imperativos as redes
conexionistas desenvolvidas. O interim que foi utilizado compreende o lapso entre os
anos de 2007 a 2018, sendo para o conjunto das entradas o período de 2007 a 2017,
enquanto às grandezas objetivo o período de 2008 a 2018.
45

4.3 Região Analisada

A região considerada para a coleta de dados abrange todos os municípios onde


a instituição tem influência. Atributo definido pelo processo mercadológico de visita in
loco que a organização emprega em cada instituição de ensino médio nessa região.
Ambicionando, a divulgação por meio de propaganda, além de, ministrar palestras
expositivas sobre a convergência das áreas de conhecimento e as graduações
oferecidas pela faculdade. A região compreende 50 municípios da mesorregião
noroeste do Rio Grande do Sul. Especificamente, no Quadro 3:

Quadro 3: Municipalidades de Abrangência do Estudo

Floriano São João da


Água Santa Centenário Mariano Moro
Peixoto Urtiga
Maximiliano São José do
Aratiba Charruá Gaurama
de Almeida Ouro
Áurea Coxilha Getúlio Vargas Nonoai São Valentim
Barão de Gramado dos
Cruzaltense Paim Filho Sertão
Cotegipe Loureiros
Barra do Rio Entre Rios do Severiano de
Ibiaçá Paulo Bento
Azul Sul Almeida
Ipiranga do
Barracão Erebango Ponte Preta Tapejara
Sul
Benjamin
Constant do Erechim Itatiba do Sul Quatro Irmãos Três Arroios
Sul
Trindade do
Cacique Doble Erval Grande Jacutinga Rio dos Índios
Sul
Campinas do Tupanci do
Estação Machadinho Sananduva
Sul Sul
Santo
Marcelino
Carlos Gomes Faxinalzinho Expedito do Viadutos
Ramos
Sul
Fonte: Autor, 2018.
46

4.4 Análise dos Resultados

Nesta seção relata-se a natureza das entradas e saídas da rede. Expondo as


suas justificativas e a coleção das base de dados coletas, correlacionadas e
normalizadas. Além é claro, das rna’s arquitetas com seus respectivos desempenhos
e resultados.

4.4.1 Egressos do Ensino Médio Regular e EJA

Classe de dados que representa o contingente de concluintes do ensino médio


regular e EJA (Educação de Jovens e Adultos) na referida região analisada no estudo.
Essa importância, representa a demanda primária da instituição, ou seja, os indivíduos
recém egressos do ensino médio que estão aptos a iniciar uma graduação de nível
superior. Esses dados foram coletados juntamente com a 7ª, 15ª e 39ª CRE’s do
estado do Rio Grande do Sul, adido, aos dados coletados nas escolas públicas e
privadas de ensino médio e básico. Na tabela a seguir consta o total de egressos
distribuídos no período elencado (Tabela 3):

Ano Egressos
2007 4629
2008 4610
2009 4004
2010 3792
2011 4012
2012 3760
2013 3799
2014 3900
2015 3637
2016 3692
2017 3134

Tabela 3: Egressos Totais Anuais


Fonte: Autor, 2018.
47

4.4.2 Total de Vagas Oferecidas

Essa variável quantifica o total de vagas disponibilizadas ao público anualmente


nos processos seletivos, vestibulares da faculdade, sendo o resultante da adição da
quantidade de vagas de todos os cursos de graduação ofertados no período. As
informações referentes a dimensão de vagas ofertadas nos anos contidos no período
ponderado, foi encontrado no portal interativo e-MEC e está disposta em seguida na
Tabela 4:

Ano Vagas
2008 700
2009 980
2010 980
2011 1005
2012 1030
2013 1130
2014 1230
2015 1080
2016 1130
2017 1580
2018 1730

Tabela 4: Vagas Oferecidas Anualmente


Fonte: Autor, 2018.

4.4.3 PIB Per Capita

O indicador objetiva demonstrar a parcela média da renda anual da população


estudada perante o PIB (Produto Interno Bruto) na região considerada. Ou seja, é a
razão entre a soma da produção bruta anual dos municípios supracitados (Quadro 3)
pelo contingente populacional dessas localidades. A conjectura persiste na
perspectiva hipotética de que quanto maior for a renda de uma população maior será
a disposição desta procurar instrução de nível superior, da mesma medida, que a
situação inversa seja um empecilho ao consumo desse serviço. Durante a execução
48

da pesquisa coletou-se os dados necessários para a mensuração dessa variável no


portal do IBGE atingindo os seguintes valores que estão contidos na Tabela 5,
ressaltando que os valores são nominais, não levando em consideração o
comparativo de poder de compra e correções monetárias que equalizassem os
valores.

Ano PIB População PIB Per Capita


2007 R$ 4.77.708.090,00 341.117 R$ 14.006.07
2008 R$ 5.424.934.840,00 342.293 R$ 15.848,80
2009 R$ 6.040.012.980,00 340.669 R$ 22.553,71
2010 R$ 7.676.536.920,00 340.226 R$ 22.563,05
2011 R$ 8.751.402.150,00 340.133 R$ 25.726,23
2012 R$ 8.944.647.600,00 351.954 R$ 26.297,50
2013 R$ 11.270.064.820,00 352.400 R$ 32.021,41
2014 R$ 11.239.441.230,00 352.824 R$ 31.893,99
2015 R$ 12.128.330.760,00 353.992 R$ 34.375,02
2016 R$ 11.752.352.500,00 355.164 R$ 33.419,64
2017 R$ 11.869.876.030,00 356.339 R$ 33.865,56

Tabela 5: PIB Per Capita


Fonte: Autor, 2018.

4.4.4 Produção Setorial

Colige-se nessa seção a quantificação das produções brutas dos setores


primário, secundário e terciário da região estimada, nos mesmos padrões da entrada
anterior, é o resultado da soma de toda a produção bruta por setor anual das
municipalidades consideradas no estudo como parâmetro de atuação da Instituição
de Ensino Superior. Considerando-os como entradas distintas às RNA’s. No decurso
da pesquisa reuniu-se as informações imperiosos ao cálculo dessas variáveis,
também, no portal do IBGE atingindo os valores a seguir (Tabela 6):
49

Ano Primário Secundário Terciário


2007 R$ 996.352.812,00 R$ 1.061.438.448,00 R$ 1.714.205.664,00
2008 R$ 1.161.175.729,00 R$ 1.140.391.074,00 R$ 1.944.852.131,00
2009 R$ 1.047.230.014,00 R$ 1.697.429.133,00 R$ 2.063.915.627,00
2010 R$ 1.293.034.050,00 R$ 2.457.095.054,00 R$ 2.388.286.682,00
2011 R$ 1.462.423.583,00 R$ 2.810.009.982,00 R$ 2.766.523.580,00
2012 R$ 1.296.736.909,00 R$ 2.684.641.234,00 R$ 3.070.641.574,00
2013 R$ 2.171.837.271,00 R$ 3.010.518.845,00 R$ 3.839.088.918,00
2014 R$ 2.220.392.316,00 R$ 2.628.487.232,00 R$ 3.988.419.435,00
2015 R$ 2.233.976.607,00 R$ 3.034.865.043,00 R$ 3.034.865.043,00
2016 R$ 2.133.447.659,00 R$ 2.916.505.306,00 R$ 2.916.505.306,00
2017 R$ 1.952.104.608,00 R$ 2.925.254.822,00 R$ 2.925.254.822,00

Tabela 6: Produção Setorial


Fonte: Autor, 2018.

4.4.5 Taxa de Inflação do Real e Taxa de Desemprego

A Taxa de Inflação, alude como o índice que exprime o aumento generalizado


e ininterrupto dos preços em uma economia. Especulando, que a inflação afetaria na
busca por graduação da população analisada, na medida em que, considerando: a
renda dessa população, seu poder de compra e a capacidade de poupança; a inflação
impactaria na maneira como esses indivíduos escolhem e conseguem alocar sua
renda mensal. Ou seja, se a renda não aumenta acima ou proporcionalmente a taxa
inflação, a capacidade dessa população optar por instrução é menor. Para a apuração
das taxas dos períodos essenciais utilizou-se os dados do IPCA mensal encontrado
no portal do IPEA, conforme tabela a baixo (Tabela 7). Salientando que, os dados
apresentados correspondem, dessa forma, a uma informação de abrangência
nacional, visto a impossibilidade de se estimar a desvalorização da moeda somente
na região e períodos elencados nesse trabalho. Além disso, de não se poder
discriminar a influência das relações comerciais externar a região estudada no
processo de variação do poder de troca do Real.
A Taxa de Desemprego, reporta a proporção de indivíduos de uma população
capazes de exercer uma atividade profissional e que estão buscando
50

um emprego remunerado, entretanto que, por diversas razões, não estão introduzidos
no mercado de trabalho. O contingente de desempregados é um fator avaliativo para
a economia, sendo assim, quanto maior for a população dos sem renda, menor será
o público interessa na aquisição de um curso superior. Através das informações
disponibilizadas no portal da FEE, servindo-se do índice mensal da RMPA, pesquisa
mais próxima da realidade da região objeto de estudo. Os dados podem ser
observados a seguir (Tabela 7):

Ano Inflação Anual Desemprego RMPA


2007 4,46% 11,3%
2008 5,90% 9,8%
2009 4,31% 9,4%
2010 5,91% 7,2%
2011 6,50% 6,4%
2012 5,84% 6,5%
2013 5,91% 6,1%
2014 6,41% 6,1%
2015 10,67% 9,6%
2016 6,29% 10,7%
2017 2,95% 12,8%

Tabela 7: Taxa de Inflação IPCA e Desemprego RMPA Anuais


Fonte: Autor, 2018.

4.4.6 Matrículas Anuais

A quantidade de matrículas anuais registrada pela instituição, nos períodos


avaliados, representa a resposta necessária para subsidiar o processo supervisionado
de treinamento das redes conexionistas. Há de se relatar que não foi considerado o
valor absoluto das matriculas, porém, o percentual de preenchimento em relação as
vagas oferecidas nos processos seletivos dos anos correlatos. Justifica-se essa
decisão, dado que, durante o período analisado, vários cursos foram inaugurados e
integrados ao portfólio de graduações da faculdade. Por outro lado, adido a algumas
áreas do conhecimento, que a instituição acabou optando por não abrir mais seleção,
51

motivada pela baixa procura por tais cursos específicos. Os dados foram coletados na
faculdade IDEAU e estão catalogados na Tabela 8 seguinte:

Ano Matrículas % Preenchimento


2008 421 60%
2009 386 39%
2010 363 37%
2011 385 38%
2012 484 47%
2013 515 46%
2014 569 46%
2015 622 58%
2016 522 46%
2017 611 39%
2018 517 30%

Tabela 8: Matrículas Anuais


Fonte: Autor, 2018.

4.4.7 Correlação e Desvio Padrão

Na Tabela 9 abaixo, encontra-se os resultados dos cálculos de correlação de r


de Pearson das variáveis de entrada selecionadas com o número de matrículas
anuais, com seu índice de convergência, além, do desvio padrão do percentual de
preenchimento relativo a quantidade de matrículas:

Entradas Coeficiente Correlação


Egressos EM -0,50 Média
Vagas Oferecidas 0,57 Média
PIB Per Capita (PPC) 0,80 Forte
Produto Primário (PP) 0,87 Forte
Produto Secundário (PS) 0,72 Forte
Produto Terciário (PT) 0,85 Forte
Taxa de Inflação 0,28 Fraca
Taxa de Desemprego -0,20 Fraca
DESVIO PADRÃO 0,09

Tabela 9: Correlação e Desvio Padrão


Fonte: Autor, 2018.
52

4.4.8 Normalização dos Dados

O procedimento de pré-processamento do banco de dados reunido foi


executado pelo método descrito no referencial teórico, apontando que como as
variáveis não possuem limites definidos e para não restringir o treinamento a novas
bases de dados, adotou-se uma range grande para não limitar a capacidade das
RNA’s. Os dados tratados estão dispostos na Tabela 10:

Variáveis Entradas Saídas


Períodos Egressos Vagas PPC PP PS PT Inflação Desemprego Matrículas
2008 0,93 0,34 0,28 0,10 0,11 0,17 0,04 0,11 0,60
2009 0,92 0,48 0,32 0,12 0,11 0,19 0,06 0,10 0,39
2010 0,80 0,48 0,45 0,10 0,17 0,21 0,04 0,09 0,37
2011 0,76 0,50 0,45 0,13 0,25 0,24 0,06 0,07 0,38
2012 0,80 0,51 0,51 0,15 0,28 0,28 0,07 0,06 0,47
2013 0,75 0,56 0,53 0,13 0,27 0,31 0,06 0,07 0,46
2014 0,76 0,61 0,64 0,22 0,30 0,38 0,06 0,06 0,46
2015 0,78 0,53 0,64 0,22 0,26 0,40 0,06 0,06 0,58
2016 0,73 0,56 0,69 0,22 0,30 0,43 0,11 0,10 0,46
2017 0,74 0,78 0,67 0,21 0,29 0,42 0,06 0,11 0,39
2018 0,63 0,85 0,68 0,20 0,29 0,44 0,03 0,13 0,30

Tabela 10: Normalização dos Dados


Fonte: Autor, 2018.

4.4.9 Construção das RNA’s

Norteando-se pelos objetivos da pesquisa, foram construídas diversas redes


conexionistas na busca do escopo do trabalho. Nessa perspectiva, foram
desenvolvidas várias redes, com diferente quantidade de camadas, quantidade de
neurônios, erro médio esperado e iterações no processo de treinamento. Também se
considerou a possibilidade de verificar a diferença de desempenho no caso da
inserção de somente as entradas de correlação forte no aprendizado de rede.
Posto isso, foi arquitetado 15 (quinze) PMC’s, as quais dez com todas as
variáveis e cinco com aquelas de convergência forte. Essas últimas, demonstraram-
se incapazes de resolver o problema proposto. Já, as dez primeiras foram mais
53

competentes no processo de aprendizagem e de testes, contudo se privilegiou a rede


mais efetiva, definida pelo menor número de erro de aprendizagem e controle, de
iterações no processo de treinamento, e por fim, quantidade enxuta de camadas e
neurônios.
Na Tabela 11, encontra-se todos os aspectos que tipificam a topologia da rede
mais apta, somado, a amostragem utiliza no treinamento e o grupo de períodos de
controle para o teste de assertividade da TCC-7, erro máximo aceitado de
aprendizagem e o número de iterações do processo.

PMC TCC-7
Inputs 8
Outputs 1
Nº de camadas 3
Nº Neurônios na Camada de Entrada 8
Nº Neurônios na Camada Escondida 11
Nº Neurônios na Camada de Saída 1
Amostragem de Treinamento (2008, 2009, 2010, 2012, 2014 e 2018)
Amostragem de Teste (2013, 2015, 2016 e 2017)
Erro Máximo Treinamento Esperado 0,0001
Nº Iterações Aproximadamente 23750.

Tabela 11: Descrição PMC TCC-7


Fonte: Autor, 2018.

A Figura 7 produzida pelo IDE Neuroph, ilustra a arquitetura da PMC de melhor


desempenho, onde cada círculo corresponde a um neurônio artificial – exceto os
verdes escuros que são os bias das camadas –, os retângulos delimitam as camadas
de processamento e as setas demonstrar o fluxo de informação na rede TCC-7. De
modo que, cada neurônio da primeira camada receba os inputs e alimentem,
simultaneamente, todos os neurônios subsequentes e esses abasteçam o neurônio
da camada de saída para o cálculo definitivo da saída estimada. Caso a resposta não
respeite o erro considerado com viável, o processo é repetido, através da machine
learning Backpropagation.
54

Figura 7: Topografia PMC TCC-7


Fonte: Autor, 2018.

No Gráfico 1, ilustra-se o decaimento do erro quadrático médio da rede, até


atingir o valor pré-definido no início do treinamento, o que da rede nº 7 ocorreu
aproximadamente na casa das 23750 iterações, sugerindo no tocante as redes
construídas aquela que precisou de menos processamento para tanger o erro
esperado.

Gráfico 1: Erro Total


Fonte: Autor, 2018.
55

O histograma das ponderações (Gráfico 2), pode-se visualizar as distribuições


de frequência do valor dos pesos sinápticos na conclusão do processo de
aprendizagem da rede conexionista TCC-7, demonstrando uma tendência central
simétrica, o que conferiu a rede menor número de épocas, ao passo que a maioria
dos valores se centraram perto de zero.

Gráfico 2: Histograma das Ponderações TCC-7


Fonte: Autor, 2018.

No relatório a seguir (Tabela 12), encontram-se as concatenações das


amostras empregadas no treinamento da rede, com as respostas obtidas no processo
e a variação absoluta em relação ao esperado. Encerrando, pelo cálculo de erro
quadrático médio que estabelecido no valor de 0,000187 cessou o estágio de
aprendizagem.
56

RELATÓRIO TREINAMENTO
Período Inputs Outputs Obtido Erro
2008 0,93; 0,34; 0,28; 0,1; 0,11; 0,17; 0,04; 0,11 0,6 0,5843 -0,0157
2009 0,92; 0,48; 0,32; 0,12; 0,11; 0,19; 0,06; 0,1 0,39 0,4092 0,0192
2010 0,8; 0,48; 0,45; 0,1; 0,17; 0,21; 0,04; 0,09 0,37 0,3749 0,0049
2011 0,76; 0,5; 0,45; 0,13; 0,25; 0,24; 0,06; 0,07 0,38 0,3926 0,0126
2012 0,8; 0,51; 0,51; 0,15; 0,28; 0,28; 0,07; 0,06 0,47 0,4575 -0,0125
2014 0,76; 0,61; 0,64; 0,22; 0,3; 0,38; 0,06; 0,06 0,46 0,4745 0,0145
2018 0,63; 0,85; 0,68; 0,2; 0,29; 0,44; 0,03; 0,13 0,30 0,2879 -0,0121
Erro Quadrado Médio Total: 0,000187

Tabela 12: Relatório Treinamento


Fonte: Autor, 2018.

Já no Gráfico 3, exibe-se comportamento exercido pela PMC. Assim, a


progressão dos resultados obtidos (representado no traço laranja) desenvolvidos pela
rede TCC-7 e as respostas que supervisionam o processo de treinamento (simulados
pelo traço azul).

Treinamento
0,70

0,60

0,50

0,40

0,30

0,20

0,10

0,00
2006 2008 2010 2012 2014 2016 2018 2020

Esperado Obtido

Gráfico 3: Resultado Treinamento TCC-7


Fonte: Autor, 2018.
57

O relatório exposto na Tabela 13, colige os períodos reservados para os testes


de controle da PMC nº7. Rememorando, o aspecto que o conjunto imagem objetivo
do estudo possui um desvio padrão de 0,09, os resultados obtidos variaram no caso
de 2016 ao limite dos mesmos 0,09 enquanto os demais resultados permaneçam
abaixo desse patamar.

RELATÓRIO TESTE
Período Inputs Outputs Obtido Erro
2013 0,75; 0,56; 0,53; 0,13; 0,27; 0,31; 0,06; 0,07 0,46 0,40 0,06
2015 0,78; 0,53; 0,64; 0,22; 0,26; 0,40; 0,06; 0,06 0,58 0,57 0,01
2016 0,73; 0,56; 0,69; 0,22; 0,30; 0,43; 0,11; 0,10 0,46 0,55 0,09
2017 0,74; 0,78; 0,67; 0,21; 0,29; 0,42; 0,06; 0,11 0,39 0,34 -0,05
Erro Quadrado Médio Total: 0,011275

Tabela 13: Relatório Teste


Fonte: Autor, 2018.

Ilustrando o teste, (Gráfico 4), expõem-se a pequena diferença dos resultados


obtidos (representado no traço laranja) e os que era esperado no controle (simulados
pelo traço azul).

Teste
0,70

0,60

0,50

0,40

0,30

0,20

0,10

0,00
2012,5 2013 2013,5 2014 2014,5 2015 2015,5 2016 2016,5 2017 2017,5

Esperado Obtido

Gráfico 4: Resultado Teste TCC-7


Fonte: Autor, 2018.
58

5 DISCUSSÃO DOS RESULTADOS

Constatou-se após a realização da pesquisa a capacidade da produção de um


sistema de previsão utilizando Inteligência Artificial, especificamente, com
processadores paralelamente distribuídos configurados em uma rede Perceptron de
Múltiplas Camadas, porque perante os resultados almejados, através das
ponderações computacionais, foi possível prever com precisão, dentro do desvio
padrão esperado, a demanda acadêmica da empresa objeto de estudo. Mesmo
embasando-se em entradas genéricas que representam alguns aspectos econômicos
da região selecionada, não inferindo esforços pela busca de indicadores realmente
incisivos, que possibilitem e justifiquem, satisfatoriamente, a intensidade de demanda
por cursos de graduação em uma instituição de ensino superior. Além disso, ainda
com uma distribuição pequena de cenários, a RNA conseguiu ser competente na
previsão da captação acadêmica anual da faculdade, dentro da amostragem de
controle, pois, ao posso que, o que torna o processo de aprendizado da rede mais
competente é o universo de exemplos que se alimenta o sistema, o pequeno número
de períodos poderia viciar a rede em uma tendência de média de resultados não
conferindo em exatidão na análise de dados específicos.
Tangendo, a prática da coleta de dados e o desenvolvimento do sistema,
contemplou-se, algumas caraterísticas, no tocante as entradas em relação a demanda
da Faculdade IDEAU e ao processo de criação da rede.
Primeiramente, a relação das variáveis elencadas demostrou algumas
considerações:
• o aumento de oferta de vagas não precipita um aumento equivalente de
matrículas para a empresa, visto que gradativamente, são oferecidas mais
vagas em cursos diversos, não se traduzindo no aumento de clientes;
• o contingente de concluintes do Ensino Médio (EM) não representam
indicador forte para auxiliar a justificativa da variação de demanda da empresa,
levantando o questionamento de qual seria o perfil majoritário dos clientes que
buscam a instituição;
• entretanto, ao adentrar-se nos indicadores de renda e produção regional,
a convergência é muito acentuada, ressaltando que a produção primaria é o
indicador que melhor acompanha a variação de matrículas do empreendimento;
59

• por fim, as taxas de inflação e desemprego evidenciam sua quase


independência em relação a variante estudada, pois as duas entradas possuem
correlações fracas.
Suplementarmente, apreciando às experiências absorvidas no decorrer da
criação de várias redes neurais PMC se viabilizou algumas observações:
• quanto mais enxuta for a rede neural, melhor será seu desempenho
dentro dos limites pré-estabelecidos como objetivo, a proporção que, a inclusão
de neurônios e, subsequentemente, camadas neurais não impingem melhor
performance à resolução do pretendido, pois na análise das ponderações dos
neurônios evidencia-se que muitos se tornam ou excludentes ou indiferentes
no processamento;
• um treinamento competente na busca pelo menor erro, não
necessariamente produz um sistema de boa generalização, pois mesmo com
um aprendizado eficiente a rede tende ao viés de confirmação daquilo que ela
já conhece e se especializou, tornando-se inapta para responder os problemas
os quais demandaram sua construção. Logo, produzindo saídas tendenciosas
a média, ou pior, anti-factuais,
• a insistência em um número imenso de iterações não possibilita a
diminuição progressiva do erro, e muito menos, alcançar o erro quadrático
máximo. Considerando, que em certo contingente de iterações o erro para de
diminuir e progressivamente aumenta;
• a adoção de poucas entradas, mesmo que essas tenham uma
correlação forte, não servem de arcabouço para a criação de um sistema de
previsão apto, visto que, no estudo mesmo com vários ajustes as redes não
conseguiram chegar a um resultado satisfatório.
Ao presente trabalho, disserta-se como possíveis rumos àquilo que já foi
erigido, a avaliação dos perfis dos clientes da IES – Instituição de Ensino Superior –
para viabilizar a construção de um banco de dados razoável para a seleção de
entradas mais convergentes. Indo além, com o emprego de Inteligência Artificial (IA),
o uso de RNA’s não supervisionadas para categorizar aspectos a serem analisados
como indicadores de variação de demanda. Com a tendência da criação de sistemas
aptos a previsão de demanda semestral e por cursos da faculdade. Também,
presando pelos resultados adquiridos o estudo das relações que justifiquem a
60

correlação da renda e produção regional ao desempenho comercial da empresa


estudada. Com um foco transgredindo o escopo estabelecido, oportunizar o emprego
das redes conexionistas em instituições de natureza distinta e de empresas de ramos
diversos.
Há de se apontar, que por meio do uso prático dos processadores
paralelamente distribuídos, tornou-se possível corroborar muitos aspectos apontados
na literatura especializada, que delineiam limites teórico e de manejo para esse ramo
da IA. Já a organização que foi objeto de estudo desse trabalho, seus benefícios foram
variados:
• a aquisição de um sistema de previsão de demanda embasado em
inteligência artificial;
• um indicador para o processo de tomada de decisão;
• a avaliação de desempenho da demanda a luz dos cenários econômicos;
• e a ponderação de aspectos mercadológicos e de alocação de recursos,
mediando análise de resultados alcançados no trabalho.
61

CONCLUSÃO

Ao término do trabalho, conseguiu-se cumprir os objetivos estabelecidos no


projeto, como a construção de uma rede neural artificial adequada a aproximar a
função capacitada para previsão de demanda acadêmica de uma instituição de ensino
superior, calculando o grau de correlação das variáveis no desempenho do problema
estudado. Demonstrando, a viabilidade da utilização das RNA’s para a prognose de
demanda acadêmica, evidenciando, através de inferência estatística os parâmetros
com maior influência aos resultados almejados. Dessa forma, produzindo indicadores
numéricos que quantifiquem proporcionalmente a demanda total acadêmica à
instituição.
Apesar de ser um sistema baseado em entradas gerais que representam
determinados aspectos econômicos dos municípios avaliados, não induzindo esforços
pela busca de indicadores realmente contundentes, que justifiquem, suficientemente,
a magnitude de demanda por cursos de graduação em uma IES. Além disso,
delineando as várias limitações da pesquisa, como a limitada quantidade de períodos
para análise e construção de banco de dados, a falta de registro nos portais do MEC
e IBGE, afora, principalmente, os empecilhos de conseguir os dados de concluintes
de Ensino Médio nas instituições da região estudada, que transitam entre a dificuldade
imensa de comunicação, colaboração e de total indiferença as requisições de
informação, a RNA conseguiu ser competente na previsão da captação acadêmica
anual da faculdade, com uma variação igual ou inferior ao desvio padrão da
amostragem de controle.
Entre os principais resultados, a convergência muito relevante dos indicadores
de renda e produção regional, observando que a produção primária constitui o
indicador que melhor acompanho a variação de matrículas da faculdade. A percepção
de que quanto mais enxuta for a rede neural, melhor será seu desempenho dentro
dos limites pré-estabelecidos como escopo. E obviamente, a aquisição de um sistema
de previsão de demanda embasado em inteligência artificial para a IDEAU.
Finalmente, as sugestões às futuras pesquisas, a avaliação dos perfis dos
clientes da IES, seja pela análise psicológica, pedagógica e cultural da população,
para viabilizar a construção de um banco de dados aceitável para a seleção de
entradas mais convergentes justificadas em estudos empíricos. Ademais, com o
emprego de RNA’s não supervisionadas, como a configuração dos Mapas Auto-
62

organizáveis de Kohonen (SOM), para categorizar aspectos ignorados como


indicadores de variação de demanda acadêmica. Além, do aprofundamento do escopo
da pesquisa atual na criação de sistemas aptos a previsão de demanda semestral e
por cursos da faculdade. Debandando, das limitações estabelecidas, oportunizar o
emprego dos processadores paralelamente distribuídos em instituições de natureza
distinta e de empresas de ramos diversos.
63

REFERÊNCIAS

ANDRADE, Maria Margarida de. Como preparar trabalhos para curso de pós-
graduação: noções básicas. 5ª ed. São Paulo: Atlas, 2002.

BRAGA, A. P.; CARVALHO, A. C. P. L. F.; LUDEMIR, T. B. Redes Neurais Artificiais:


teoria e aplicações. 2ª ed. Rio de Janeiro: LTC, 2012.

CRESWELL, J. W. Educational research: Planning, conducting, and evaluating


quantitative and qualitative research. 3ª ed. Upper Saddler River, NJ: Merrill, 2008.

CELLARD, A. A análise documental. In: POUPART, J. et al. A pesquisa qualitativa:


enfoques epistemológicos e metodológicos. Petrópolis, Vozes, 2008.

DANTAS, Rubens Alves. Engenharia de Avaliações: uma introdução à


metodologia cientifica. 2ª ed. Ver. De acordo com a NBR-14.653-2:2004. São Paulo:
Pini, 2005.

DAY, G. S. The capabilities of market driven organizations, Journal of Marketing,


v. 58, n. 4, p. 37-52, 1994

FÁVERO, Luiz Paulo; BELFIORE, Patrícia. Manual de Análise de Dados. 1ª ed. Rio
de Janeiro: Elsevier, 2017.

FIGUEIREDO, N.M.A. Método e metodologia na pesquisa científica. 2ª ed. São


Caetano, do Sul, São Paulo, Yendis Editora, 2007.

FUNDAÇÃO DE ECONOMIA E ESTATÍSTICA (FEE). PED – Série Histórica Mensal.


Brasil, 28 de março de 2018, < https://www.fee.rs.gov.br/publicacoes/ped-rmpa/serie-
historica-mensal/>. Acesso em: 17 de outubro de 2018.

GAMBOGI, Jarbas Aquiles. Aplicação de Redes Neurais na Tomada de Decisão


no Mercado de Ações. Universidade de São Paulo, Escola Politécnica Departamento
de Engenharia de Telecomunicações e Controle. São Paulo, 2013.

GASPARINI, Robson. Análise dos Modelos de Previsão de Demanda Frente às


Necessidades de Manutenção de Estoques de uma Indústria de Produção de
Cerveja Artesanal. UNESC, Criciúma, 2017.

GAUTHIER, B. (ORG). Recherche Sociale: De la problématique à la collecte des


données. Québec. Presses de l’Univesité du Québec: 1984.

GIL, Antonio Carlos. Como Elaborar Projetos de Pesquisa. 5ª ed. São Paulo: Atlas,
2010.

HAYKIN, Simon. Redes Neurais: princípios e prática. 2ª ed. Porto Alegre: Bookman,
2001.
64

INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA (IBGE). Produto


Interno Bruto dos Municípios. Brasil, [s.d.], <https://www.ibge.gov.br/estatisticas-
novoportal/economicas/contas-nacionais/9088-produto-interno-bruto-dos-municipios.
html?=&t=notas-tecnicas>. Acesso em: 20 de setembro de 2018.

INSTITUTO DE PESQUISA ECONÔMICA APLICADA (IPEA). Índice de Preços ao


Consumidor Ampliado (IPCA). Brasil, [s.d.], < http://www.ipeadata.gov.br/Exibe
Serie.aspx?serid=38391>. Acesso em: 5 de outubro de 2018

KOVÁCS, Zsolt László. Redes Neurais Artifíciais: fundamentos e aplicações: um


texto básico. 4ª ed. Ver. – São Paulo: Editora Livraria de Física, 2006.

MAKRIDAKIS, S.; WHEELWRIGHT, S.; HYNDMAN, R. J. Forecasting methods and


applications. 3. ed. New York: John Wiley & Sons, 1998.

MARION, José Carlos; et al. Monografia para os Cursos de Administração,


Contabilidade e Economia. 2ª ed. São Paulo: Atlas, 2010.

MINISTÉRIO DA EDUCAÇÃO(MEC). Sistema e-MEC. Brasil, c.2018,


<http://emec.mec.gov.br/>. Acesso em: 15 de setembro de 2018.

MOON, M. A.; et al. Breaking down barriers to forecast process improvement.


Foresight: The International Journal of Applied Forecasting, v. 4, p. 26-30, 2006.

MORAIS, Carlos Mesquita. Escalas de Medida, Estatística Descritiva e Inferência


Estatística. Escola Superior de Educação Instituto Politécnico de Bragança.
Bragança, 2005.

NOVAES, Ronaldo Cordeiro; el al. Redes Neurais Artificiais Aplicadas na Previsão do


Preço no Mercado Ibérico de Eletricidade. Revista Engenharia em Ação UniToledo,
Araçatuba, SP, v. 01, n. 01, p. 153-168, out./dez. 2016.

RAUPP, F.M.; BEUREN, I.M. Como elaborar trabalhos monográficos em


contabilidade: teoria e prática. 3.ed. São Paulo: Atlas, 2006.b

SILVA, I. N.; SPATTI, D. H.; FLAUZINO, R. A. Redes Neurais Artifíciais: para


engenharia e ciência aplicada. – São Paulo: Artiliber, 2016.

SUPTITZ, Ivan Luis; FROZZA, Rejane; MOLZ, Rolf Fredi. Análise Comparativa de
Ferramentas de Redes Neurais Artificiais. XXXV Encontro Nacional de Engenharia
de Produção. Perspectivas Globais para a Engenharia de Produção Fortaleza, CE,
Brasil, 13 a 16 de outubro de 2015.

VELLASCO, M. M. B. R. Redes Neurais Artificiais. Rio de Janeiro, Laboratório


Inteligência Computacional Aplicada: PUC-RJ, 2007.

Você também pode gostar