Você está na página 1de 15

Utilização de Algoritmo Genético na Parametrização de Redes Neurais Artificiais Para

Aplicação na Elaboração de Orçamento de Vendas

Autoria: Paulo Henrique da Silva Almeida, Luis Paulo Guimarães dos Santos, Luiz Alberto
Luz de Almeida, Joséilton Silveira da Rocha, Sheizi Calheira de Freitas

Resumo: Para obter previsões mais acuradas, é necessário utilizar ferramentas estatísticas
capazes de descrever as relações não-lineares entre as séries históricas e as variáveis
ambientais. Nesta investigação, foi estudado o uso de redes neurais artificiais utilizadas no
desenvolvimento de funções estatísticas de previsão, com aplicação no orçamento de vendas.
Para tanto, foi definida a forma como as séries históricas e variáveis ambientais foram
incorporadas na topologia da rede, sem padronização, em conseqüência da aplicação
específica, o que exigiu métodos mais robustos de treinamento dos parâmetros da rede, como
a aplicação de algoritmos genéticos. O objetivo deste trabalho foi demonstrar a eficiência do
uso de redes neurais artificiais na previsão de vendas.

1. Introdução
Prever informações futuras com razoável precisão, principalmente séries que variam de
forma não-linear ao longo do tempo, é o grande desafio dos gestores de qualquer empresa,
principalmente nos dias atuais onde a competitividade acirrada dos mercados exige um
planejamento mais consistente das ações das empresas.
As companhias necessitam de reações cada vez mais rápidas às incertezas e às
constantes mudanças nas variáveis ambientais que influencia o seu desempenho, para tanto
necessitam de ferramentas mais robustas.
O orçamento, como mecanismo de controle gerencial, sempre esteve presente no dia-a-
dia das empresas modernas e, devido à complexidade das operações atuais, necessita
apresentar resultados mais confiáveis, principalmente a respeito da previsão da demanda dos
produtos da empresa.
A previsão de demanda reflete diretamente na elaboração da previsão das vendas e do
orçamento de vendas, como parte integrante do orçamento geral da empresa. Este orçamento é
elaborado tendo em vista a expectativa da empresa em relação à demanda pelos seus produtos.
Há muitas dificuldades de ordem técnica e prática no planejamento das quantidades e
receitas de vendas, mas apesar dessas dificuldades, algumas empresas conseguem alcançar um
grau relativo de precisão no seu planejamento de vendas, principalmente pela atenção dada,
pela alta administração da empresa, ao plano de vendas, assegurando recursos suficientes para
seu apoio técnico além de encarar o planejamento de vendas como objetivos a serem
atingidos, formulando estratégias necessárias para seu cumprimento. (WELSCH,1998)
A empresa, na figura do comitê orçamentário, deve reunir condições de estabelecer o
mais precisamente possível esta demanda para um intervalo futuro, em geral um ano. A
capacidade de avaliar e prever demanda com precisão é preponderante para o sucesso do
processo orçamentário como um todo e a consistência de todo o orçamento de uma empresa é
reflexo direto da maneira como a previsão da demanda é estabelecida, tendo em vista que
todos os outros orçamentos que compõe o orçamento-mestre, derivam diretamente daquele.
Existem diversos métodos de previsão de vendas, com vantagens e desvantagens, e que
podem ser utilizados paralelamente. Os métodos geralmente buscam informações no próprio
mercado consumidor e fornecedor, além de órgãos públicos, instituições de classes, e na
própria empresa, além da utilização das vendas passadas da empresa analisadas por meio de
técnicas matemáticas e estatísticas. (SANVICENTE & SANTOS,1997)

1
Dentre os meios utilizados para a previsão de vendas, é destacado neste trabalho a
utilização de técnicas de tratamento e análise de dados utilizando-se ferramentas específicas
baseadas em inteligência artificial.
Até então, a previsão de vendas era estruturada com base em metodologias estatísticas
como regressão linear, análise de séries temporais, regressão logística dentre outras, e por
muito tempo teve sua eficácia questionada, principalmente pelo fato das séries de vendas da
empresa não se comportarem de forma uniforme ao logo do tempo.
A necessidade de previsões mais consistentes fez surgir estudos de utilização de
ferramentas de inteligência artificial como as redes neurais artificiais no desenvolvimento de
aplicações capazes de efetuar previsões com margens de erros consideradas satisfatórias.
As pesquisas do uso de redes neurais na previsão de séries temporais foram se
aprimorando, até a constatação que a parametrização da rede é um passo fundamental para o
sucesso do modelo a ser desenvolvido.
A parametrização da rede neural não é tarefa das mais simples tendo em vista que os
pacotes computacionais disponíveis oferecem uma infinidade de combinações possíveis dos
parâmetros da rede, principalmente pela própria característica da aplicação neural. A
definição inicial de cada parâmetro geralmente é estabelecida de acordo com a experiência ou
sensibilidade de cada operador, deixando aberto um flanco para imperfeições ou o não
atingimento dos resultados esperados.
Devido a pouca eficiência das metodologias tradicionais na previsão de séries temporais
de vendas, e ainda as dificuldades encontradas pela maioria dos pesquisadores na
parametrização da rede neural, este trabalho se dispõe a responder a seguinte questão: O uso
de algoritmo genético na parametrização da rede neural pode elevar o grau de eficiência da
mesma na previsão de séries temporais de vendas?
A principal hipótese levantada é que o uso de algoritmo genético na parametrização da
rede neural artificial concorre para o significativo aumento da eficiência do modelo neural de
previsão de séries temporais.
O objetivo deste trabalho é demonstrar a eficiência da rede neural artificial
parametrizada com o uso de algoritmo genético em prever as vendas série temporal de vendas.
O trabalho tomará como base os dados relativos às indústrias de eletroeletrônico da
Zona franca de Manaus, através da criação de um modelo neuro-preditor, utilizando uma série
histórica das vendas e de variáveis ambientais, de janeiro de 1998 até janeiro de 2003, e a
confrontação dos resultados obtidos na rede com os resultados efetivamente ocorridos entre
janeiro e junho de 2003. A eficiência do modelo será constatada com a comparação do MSE
(Mean Square Error) de modelos neuronais já propostos anteriormente.
O cumprimento do objetivo proposto viabilizará a utilização do referido modelo na
elaboração do orçamento de vendas das empresas em detrimento de técnicas menos eficientes.
Este trabalho se justifica pela dificuldade de prever esses dados com a precisão desejada
utilizando as ferramentas tradicionais, tendo em vista a limitação da estatística em tratar dados
não-lineares como a evolução de uma série de vendas de uma empresa.
Para séries de dados que se comportam de forma irregular ao longo do tempo, é
imprescindível o uso de ferramentas computacionais avançadas, como redes neurais artificiais,
que permitem, a partir de uma série histórica de dados, e uma arquitetura computacional,
prognosticar valores que extrapole o intervalo de tempo presente (MARTIN,2000).
O uso de redes neurais artificiais na previsão de séries temporais ditas ruidosas,
mostrou-se uma alternativa prática e viável, contudo devido à dificuldade de definição dos
parâmetros adequados para a rede, corria-se o risco da sub-utilização do recurso, bem como a
impossibilidade de atingir um resultado satisfatório. Desta maneira, a busca de soluções que
atendam a necessidade dos usuários dos sistemas neurais em relação à otimização de seus
parâmetros é uma realidade.

2
2. Fundamentação Teórica
2.1 Orçamento de Vendas
O processo orçamentário é influenciado fortemente pela previsão da demanda. Uma
previsão precisa das vendas é o grande segredo para o sucesso do orçamento geral das
empresas.
Todas as demais partes do orçamento geral dependem, de algum modo, do orçamento
de vendas, deste modo, se o orçamento das vendas for feito de forma descuidada, todo o resto
do processo orçamentário será um grande desperdício de tempo (GARRISON e
NOREEN,2001), ou como segundo Martin (2000) prognosticar, incorretamente demandas
pode conduzir a um acréscimo nos custos finais dos produtos, afetando a participação no
mercado, gerando situações indesejáveis de demanda reprimida e/ou estoques elevados.
Para ANTHONY e GOVINDARAJAN (2002) um orçamento de receita consiste em
uma projeção de quantidades estimadas de vendas, quantidades essas que são multiplicadas
pelos preços esperados de venda. Ainda segundo os autores, de todos os componentes de um
orçamento de lucro, o orçamento da receita é o mais crítico, e é aquele mais sujeito a maiores
incertezas.
As vendas representam as principais fontes de entrada de recursos monetários nas
companhias, portanto, os investimentos em ativo imobilizado, o volume de despesas a ser
planejado, a necessidade de mão-de-obra, o nível de produção e vários outros aspectos
operacionais dependem do orçamento de vendas (WELSCH,1998).
O orçamento de vendas é influenciado fortemente por fatores que muitas vezes fogem
ao controle dos executivos. A conjuntura econômica, por exemplo, é um fator que não pode
ser previsto com precisão através de métodos tradicionais.
De acordo com ATKINSON et al. (2000) as empresas desenvolvem a previsão da
demanda de muitas formas. Algumas utilizam pesquisas de mercado sofisticadas,
administradas por peritos externos, ou pelo seu departamento de vendas, já outras empresas
usam modelos estatísticos, que geram previsão de demanda, baseado em tendências e
previsões das atividades econômicas na economia, e a relação com os padrões de vendas
passados. Outras empresas assumem que a demanda vai cair ou subir em razão de taxas
previamente estimadas.
Ainda segundo o autor supra citado, a empresa deve elaborar um plano de vendas para cada
linha de produto, pois desta maneira forneceria base para a elaboração de orçamento de produção
de cada produto, tendo em vista que o plano de produção é sensível ao plano de vendas.
Na elaboração do orçamento de vendas, segundo SANVICENTE e SANTOS (1997),
são consideradas variáveis de mercado consumidor, variáveis de produção, variáveis de
mercado fornecedor e de trabalho e variáveis de recursos financeiros. A consideração dessas
variáveis requer uma análise cuidadosa e uma ponderada fixação de objetivos e definição de
políticas. A principal dificuldade decorrente dessa análise, segundo o autor, é a carência de
informações necessárias e a impossibilidade de quantificação de algumas dessas variáveis.
KOTLER apud SANVICENTE e SANTOS (1997), escreve sobre seis métodos de
previsão de procura, agrupados em três bases de informações: o que se diz, o que se faz e o
que se fez.
Os métodos baseados no que se diz, são três: a) levantamento de intenções dos
compradores, que nada mais é que perguntar aos compradores potenciais o quanto eles
tencionam encomendar de cada produto, em certo período, e em que condições. Esse método
é aplicado para produtos com poucos compradores potenciais. b) levantamento de opiniões de
vendedores, através do fornecimento de informações sobre quantidades vendidas a cada
cliente nos últimos meses e também as políticas de marketing fixadas para o período futuro.
De posse dessas informações os vendedores realizam estimativas sobre as vendas neste
período. A principal deficiência deste método reside no fato de que os vendedores tem seus

3
rendimentos associados ao preenchimento de quotas de vendas podendo, nesta análise, reduzir
o valor das estimativas de vendas para facilitar o atingimento de metas. c) levantamento de
opiniões de especialistas, que é a sondagem de consultores externos, especialistas internos da
organização, órgãos públicos, associações de classes, para obter um nível mais amplo de
espectativas referente ao mercado do produto.
Os métodos baseados no que se faz, é aplicado, principalmente, quando do lançamento
de um produto novo e sem similares no mercado, onde não se tem o conhecimento do
comportamento prévio de suas vendas. Nestes métodos, realiza-se o lançamento do produto
em pequena escala, em determinada região escolhida com representativa do mercado total e as
reações dos consumidores neste mercado-teste fornecem subsídios para as previsões no
mercado total. A restrição a esse método é a dificuldade em encontrar um mercado-teste
adequado, além de seu custo bastante elevado.
Os métodos baseados no que se fez, são os métodos que utilizam instrumental
matemático e estatístico na explicação do comportamento das vendas passadas e são aplicados
na projeção de vendas futuras. Dentre os métodos mais comuns estão a regressão linear e a
análise de séries temporais.
A regressão linear é uma técnica estatística que permite calcular o valor de uma
grandeza em relação a uma outra, ou combinações de outras (regressão linear múltipla). É
empregada principalmente quando os dados relativos às outras grandezas são estimados mais
facilmente, ou porque precedem os da primeira no tempo.
Para a aplicação deste método é de fundamental importância o conhecimento das séries
históricas das vendas e de outras variáveis, que se julgam guardarem relações casuais com as
vendas. Em seguida, através de processos estatísticos, determina-se uma equação linear que
relacione a variável dependente (vendas) com as variáveis independentes ou explicativas.
Como a regressão é linear, a limitação do método diz respeito à relação linear entre as
variáveis dependentes e independentes, não admitindo, neste modelo, relações não-lineares
entre ambas.
A análise de regressão utiliza o método dos mínimos quadrados ordinários, onde a
determinação da reta r é feita de tal forma a minimizar a soma dos quadrados das distâncias
entre os pontos e a reta estimada.
Na prática, como visto anteriormente, as vendas estão associadas a um conjunto de
variáveis cuja influência é desconhecida. A seleção dessas variáveis deve obedecer a
significância de cada grandeza para a variável dependente (vendas). As variáveis pouco
significativas são descartadas, até que se tenha um conjunto com apenas variáveis que
expliquem de forma satisfatória o fenômeno.
Após a determinação da função linear, determina-se os valores das variáveis
dependentes para o futuro, através da variável independente.
A análise das séries temporais compreende o estudo de quatro forças atuantes:
• Tendência (T)
• Ciclo (C)
• Sazonalidade (S)
• Fator aleatório (B)
• Representadas algebricamente de duas maneiras:
• Forma multiplicativa: Y= T x C x S x B
• Forma aditiva: Y = log T + log C + log S + log B
A tendência representa um comportamento geral das vendas durante um longo período
de tempo, e pode apresentar-se crescente, estável ou declinante.
O ciclo é representado por um comportamento cíclico das vendas, e geralmente só pode
ser observado através de uma longa série de tempo.

4
A sazonalidade e a representação da variação das vendas em determinados períodos do
ano, motivada por peculiaridades de cada época.
O fator aleatório agrega as demais forças atuantes não identificadas nas categorias
anteriores.
A análise das vendas baseada nas séries temporais deve ser contemplar o cuidado em
relação aos dados estudados expurgando-se da análise valores claramente discrepantes,
influenciados por situações extraordinárias.
O passo seguinte à seleção e depuração da série histórica é o tratamento estatístico ou
matemático, como alisamento exponencial, normalização ou médias móveis.
O orçamento de vendas pode ser encarado como uma série de elementos inter-
relacionados que estabelecem as bases por meio da formulação dos (1) Objetivos da Empresa,
que são as metas gerais da organização; (2) Estratégia da Empresa que é a maneira de se
atingir as metas e (3) Previsão de Vendas que é a projeção técnica das vendas através de séries
temporais, correlação, modelos matemáticos, ajustamento exponencial e pesquisa operacional.
Um dos fatores mais importantes na previsão de vendas é a análise de vendas passadas da
empresa, pois o desempenho passado geralmente é o melhor indicador do que pode ser
conseguido no futuro (WELSH, 1998). De acordo com o autor, a previsão de vendas, ao
contrário de um orçamento de vendas, é uma projeção técnica de procura em potencial para
um período específico e de acordo com determinadas hipóteses. Uma previsão de vendas será
transformada num plano de vendas quando a administração tiver acrescentado o seu
julgamento, as suas estratégias, as aplicações de recursos e a sua dedicação no sentido de
tomar medidas agressivas para alcançar os objetivos de vendas.
Dentre as diversas classificações dos métodos de projeção de vendas existentes, segue,
conforme WELSH (1998):
1. Método de julgamento (não-estatístico): Combinação das opiniões da equipe de vendas,
combinação das opiniões dos supervisores da divisão de vendas e combinação das opiniões
dos executivos
2. Métodos Estatísticos: Método do ritmo econômico (análise de tendências), método de
seqüências cíclicas (análise de correlação), analogia históricas especiais e método de
transposição
3. Métodos de finalidades específicas: Análise da industria, análises de linha de produtos e
análise de usos finais de produtos
4. Combinação de métodos
O surgimento de computadores com grande capacidade de processamento favoreceu a
disseminação do uso de orçamentos pelas empresas, principalmente pela condição que
ofereceu aos elaboradores, de simular situações prováveis e avaliar seu impacto no plano
orçamentário, além de facilitar o uso de ferramentas estatísticas e matemáticas, no processo de
elaboração do orçamento.
Como o objeto deste trabalho é a comprovação da eficiência de um modelo matemático
na previsão das vendas da empresa em questão, baseado em uma série histórica de dados,
acaba por concorrer diretamente com a metodologia convencional de utilização de modelos
estatísticos para a projeção de vendas, propondo a criação de um modelo “neuro-genético”.
2.2 Redes Neurais Artificiais (RNA)
A técnica das Redes Neuronais Artificiais, consiste na simulação de sistemas nervosos
biológicos em programas ou circuitos digitais. Tais redes são capazes de estabelecer relações
complexas entre dados, de forma relativamente precisa, sem que seja necessário informar a
elas qual a função que os relaciona.
O estudo das RNA fundamenta-se na tentativa de emular a forma inteligente de
processar informações do cérebro humano, ou seja, de criar um modelo não-paramétrico que
represente a forma de pensar dos seres humanos.

5
PORTUGAL e FERNANDES (1997), define as RNA, também chamados de modelos
conexionistas de computação ou ainda sistemas de processamento paralelo distribuído (PDP),
como “estrutura de processamento de informação distribuída e paralela”, formada por
unidades de processamento, (neurônios, nós ou células), interconectados por arcos
unidirecionais, também chamados de ligações, conexões ou sinapses. Os neurônios possuem
memória local e realizam operações de processamento de informações localizada. Cada célula
possui uma saída que (axônio) a qual pode se ramificar em muitas ligações colaterais.
Ressalta-se a condição de que cada processamento deve ser realizado localmente, dependendo
apenas dos valores correntes dos sinais que chegam até cada célula. Esses valores atuam sobre
os valores armazenados na memória local do nó.
2.2.1 Aplicações de Redes Neurais
GORZALCZANY (1998) propôs uma modelagem de dados e previsão com uso de
redes neurais com lógica fuzzy (nebulosa), chamada fuzzy neural network (Rede Neural
Nebulosa) aplicada à área de negócios, argumentando que tanto informações quantitativas
quanto qualitativas contribuem para a descrição de comportamento de muitos sistemas
empresariais e que modelos neurais poderiam ser construídos para utilizar ambos os tipos de
conhecimento para previsões de níveis de vendas. O modelo proposto utiliza uma RNA
multilayer perceptron (MLP) e algoritmo de aprendizado backpropagation, com alguns
elementos da teoria de conjuntos nebulosos. Os resultados obtidos foram comparados com o
modelo clássico de Box-Jekins, sendo considerados satisfatórios.
A aplicação de RNA na área de jogos de empresas foi descrito por VALDAMERI
(1999). Segundo o autor, o principal problema encontrado nas aplicações de jogos
empresariais virtuais é a previsão de vendas, com base na política de mercado e na política
interna de cada empresa participante do jogo. O modelo proposto pelo autor, como solução
deste problema, utiliza uma RNA feedforward com aprendizado backpropagation
supervisionado, tendo como variáveis de entrada da rede o preço, desconto, prazo, juros,
propaganda e sazonalidade, e como saída os valores de vendas à vista e a prazo. O erro médio
encontrado pelo modelo ficou em torno de 7,96%.
FALAS et al. (1994), também utilizou uma Rede MLP para a predição de lucro como
suporte a tomada de decisão sobre investimento. Neste modelo foram definidas variáveis
significativas para a explicação da variação do lucro, tais como: margem bruta, dividendos
por ação, despesa com depreciação, retorno sobre ativo total e outras. Os dados foram obtidos
na base de dados “compusat”, referente a todas empresas de manufatura disponível de um
período de 10 anos (1982-1991). Foram testadas diversas arquiteturas de RNA com uma ou
duas camadas ocultas, sendo que o melhor desempenho foi obtido com uma RNA, com 9
neurônios de entrada, uma camada oculta com 3 neurônios e 1 neurônio de saída, utilizado um
algoritmo de treinamento desenvolvido por CHARALAMBOUS (1992) , (conjugate gradient
training algorithm). Os resultados obtidos constataram uma melhora de 1% em relação ao
modelo logit, alcançando 65,9% de acerto no treinamento e 65,3% no teste.
ABELÉM (1994), propõe um modelo de previsão da cotação do ouro no mercado
internacional, através das cotações diárias com os valores mínimos, máximos e de fechamento do
ouro no período de janeiro/88 a junho/93. Os dados foram divididos em duas partes, treinamento e
teste. A arquitetura da rede foi determinada através do uso do método windowing. Durante o
estudo foram feitos vários testes utilizando variáveis explicativas como a taxa de câmbio de
moedas estrangeiras, variando os parâmetros da rede, até que se alcançasse resultados cada vez
melhores. A melhor arquitetura da RNA apresentou MSE de 7,18 no treinamento e na previsão de
10 dias à frente alcançou MSE de 5,02. Os resultados obtidos foram comparados com os obtidos
pelo modelo Box-Jekins, que atingiu MSE na previsão de 13,91.
Em seu experimento, MARTIN (2000) também propõe um modelo baseado em RNA
para prognóstico com base em séries temporais utilizando o sistema computacional MatLab.

6
Na fase treinamento foram utilizadas diversas arquiteturas de rede, sempre com 100 ciclos do
algoritmo de aprendizado backpropagation. O melhor desempenho alcançado na fase de
treinamento teve MSE igual a 3,98E-6. Já na fase de validação, chamada pelo autor de
“diagnóstico, o melhor desempenho teve MSE igual a 4,7E-6. O autor constatou em seu
trabalho, que a RNA possui satisfatória capacidade de generalização a partir de valores
conhecidos do passado.
2.3 Os Algoritmos Genéticos (AG)
Os algoritmos genéticos são métodos generalizados de busca e otimização que simulam
os processos naturais de evolução, aplicando a idéia darwiniana de seleção, proposta no
século XIX. Segundo esta teoria, “as espécies naturais vão evoluindo para adaptar-se ao meio
que vivem, com o critério de que aqueles indivíduos que melhor se adaptarem terão maior
probabilidade de sobreviver até a idade adulta e procriar, fazendo com que seus gêneses
passem de geração para geração”.
Na sua elaboração são consideradas populações digitais que se otimizam de acordo com
suas funções, seguindo padrões genéticos e de seleção natural. Cada aplicação tem a
necessidade de ter uma função apropriada.
Possíveis soluções de um problema são combinadas e alteradas, normalmente através de
mecanismos inspirados na seleção natural, na recombinação e na mutação genética, tendo
como principais características a obtenção de um conjunto de soluções ao invés de uma única.
As soluções são consideradas populações.
Um algoritmo genético vai especializando uma população para adaptar-se a um
determinado contexto e esta adaptação vai ser definida precisamente pela função a ser otimizada.
Algoritmos Genéticos são muito eficientes para busca de soluções ótimas, ou
aproximadamente ótimas, em uma grande variedade de problemas, pois não impõem muitas
das limitações encontradas nos métodos de busca tradicionais.
2.3.1 Componentes e Implementação de um Algoritmo Genético
No AG, as variáveis são representadas como genes de um cromossomos ou indivíduo.
Cada coordenada de um ponto no espaço é considerado um gene, onde seu conjunto acaba por
formar o indivíduo. A seleção dos melhores resultados é dada com o uso de operadores
genéticos como a mutação ou cruzamento, onde o AG combina dois genes de dois
cromossomos pais para formar dois novos cromossomos.
Na prática, a implementação do AG compreende uma codificação binária, com uso de
string de bits e as operações genéticas são realizadas pela simples manipulação desses bits.
Os softwares especializados proporcionam ambiente com linguagem especifica para a
parametrização do AG. No MatLab, a implementação do AG é dada pela escolha dos
parâmetros genéticos, como tamanho da população, número de gerações, taxa de cruzamento,
tipo de cruzamento, taxa de extrapolação e de mutação.
2.3.2 - Parametrização de um Algoritmo Genético
Os principais parâmetros genéticos são: a) Tamanho da população: é o número de
cromossomos na população. Este parâmetro define o desempenho do AG. Quanto maior a
população maior o desempenho, porém mais necessidade de recursos computacionais. b) Taxa
de cruzamento: Determina a velocidade de aparecimento de novos indivíduos na população.
Quanto maior esta taxa, mais rápido são introduzidos novos indivíduos na população, contudo
uma taxa muito elevada concorre para uma descaracterização da população original pela sua
completa substituição. c) Tipo de cruzamento: Determina a forma como os cromossomos vão
trocar seus genes, gerando novos indivíduos. Existem diversos tipos de cruzamento. d) Taxa
de mutação: Determina a probabilidade de ocorrência de mutação. Mutação determina a
entrada de indivíduos “diferentes”, ou seja, trazendo novas informações à população. Uma
alta taxa de mutação dificulta a busca pois a população acaba por adquirir informações novas
em demasia, já uma taxa muito baixa, restringe as respostas a um ambiente bem limitado.

7
2.3.3 – Operadores Genéticos
Os principais operadores genéticos são: Seleção, Cruzamento e Mutação. Esses
operadores são responsáveis pelas alterações sofridas na população ao longo do tempo,
sempre na busca de um resulto satisfatório. A seleção filtra os melhores indivíduos da
população para o processo de reprodução, limitando cada vez mais o surgimento de
indivíduos mais fracos. O cruzamento é a propagação propriamente dita dos indivíduos mais
aptos da população, por meio de troca de informação entre eles. A mutação é a alteração
arbitrária e externa da diversidade genética da população, introduzindo novas informações e
fornecendo mais elementos para a estruturação do resultado.
3. Metodologia da Pesquisa
3.1 Materiais e Métodos
Na elaboração deste trabalho foi utilizado o software MatLab 6.1 da Mathworks, além
do software Excel e Word da Microsoft.
Os dados coletados junto as bases de dados citadas a frente foram organizados em
matrizes no MS-Excel, posteriormente tratados estatisticamente e exportados para o Matlab,
onde as ferramentas de algoritmo genético e redes neurais foram carregadas. Os scripts da
rede neural foram escritos, definindo-se todos os parâmetros necessários à execução do
programa. Após definição da RNA, foi dado início à simulação com os dados carregados
previamente, obedecendo às fases de aprendizado e validação.
Os resultados foram dispostos em forma de gráficos para melhor visualização.
3.2 Procedimentos
A solução do problema consistiu no teste de um modelo neuro-preditor desenvolvido a
partir do software MatLab 6.1, com o objetivo de comprovar sua eficiência perante os
modelos existentes para o prognóstico de séries temporais através da comparação da função
erro MSE (Mean Square Error).
As séries históricas objetos deste modelo são consideradas como séries temporais por se
enquadrarem no conceito de MENDENHALL apud ABELEM (1994), que as define como
sendo qualquer conjunto de observações ordenadas no tempo.
O modelo proposto neste trabalho é próprio, elaborado através de uma RNA MultiLayer
Perceptron, com duas camadas intermediárias, mais a camada de entrada e de saída. A função
de ativação é a tangente sigmóide e utiliza algoritmo de aprendizado não-padronizado,
elaborado especificamente para esta aplicação, baseado em Algoritmo Genético.
A opção pela RNA MultiLayer Perceptron se deu por ser a mais utilizada na realização
de prognóstico de valores futuros de séries temporais.
O modelo segue o esquema conceitual abaixo:

+
e i
vi
Função -
v% i
Pi Rede
Neural
Ye

Web

Algoritmo m
Genético ∑e
i =1
2
i

Figura 1 – Esquema conceitual da RNA proposta

8
Onde:
Pi representa a camada de entrada da rede (variáveis explicativas)

vi representa as vendas reais, ou alvo do modelo


v%i representa o valor das vendas obtido pela rede neural, ou seja, a saída de dados
ei
representa o erro de predição:
ei
=(
vi - v%i ) (4)
Yerepresenta a função do erro. Neste estudo optou-se por trabalhar com a função MSE
(Mean Square Error) conforme o seguinte esquema:
2
1 m
MSE= m ∑ i =1
( y − yˆ )

Onde:
y representa as vendas reais, ou alvo do modelo
ŷ representa o valor das vendas obtido pela rede neural, ou seja, a saída de dados

Como observado no esquema, a rede neural proposta teve seu erro modelado através de
algoritmo genético, otimizando a seleção dos parâmetros da rede na sua retro-alimentação.
No modelo, os parâmetros do algoritmo genético foram definidos em uma população de
100 indivíduos e 1000 gerações de evolução.
A série temporal objeto deste estudo foram as vendas mensais consolidadas das
indústrias do segmento de eletro-eletrônica sediadas na Zona Franca de Manaus, no período
de janeiro de 1998 a junho de 2003, obtida através da SUFRAMA (Superintendência da Zona
Franca de Manaus), disponível no endereço eletrônico: www.suframa.gov.br, no tópico
estatísticas.

Na montagem da rede neural, foram consideradas variáveis explicativas ( P i ), que se


constituem a entrada de dados da rede e tentam explicar as variações ocorridas na série de
dados. Essas variáveis são (a) CDI (Certificado de Depósito Interbancário ou Interfinanceiro),
(b) IGP-M (Índice Geral de Preços do Mercado), (c) Dólar Comercial, (d) Taxa de
Desemprego e (e) A própria variação trimestral das vendas.
A escolha das variáveis explicativas foi baseada na representatividade do mercado
consumidor, que se supõe ser sensível às variações de cada uma delas. A variação das vendas
é diretamente proporcional à variação da demanda e inversamente proporcional a variação do
custo de produção.
Os CDI são títulos de emissão das instituições financeiras para lastrear as operações de
tomada de recursos ou de empréstimos entre elas mesmas. São títulos de operação restrita às
instituições bancárias, criadas fora do âmbito do Banco Central do Brasil em meados da
década de 80. O CDI representa um padrão de taxa média, utilizado como custo básico da
taxa de juros no mercado, utilizado como referência nas operações de crédito a curto prazo, e
sua variação afeta de forma inversamente proporcional o consumo e diretamente proporcional
o custo dos produtos.
O IGP-M é um índice apurado pela Fundação Getúlio Vargas, criado em maio de 1989
para que fosse de absoluta credibilidade e longe das intervenções do governo. Este índice é
9
média ponderada de outros três índices IPA (Índice de Preços no Atacado), IPC (Índice de
Preços ao Consumidor) e INCC (Índice Nacional de Custos da Construção), também apurados
pela Fundação Getúlio Vargas, e reflete a alteração de preços desde matérias-primas agrícolas
e industriais até bens e serviços finais. Este índice foi utilizado no modelo para mapear o
efeito da inflação nas vendas das empresas em questão.
O dólar comercial explica eventuais efeitos da variação cambial no custo da matéria-
prima dos produtos ou na variação do consumo dos bens vendidos no mercado externo.
A taxa de desemprego aberto, apurada mensalmente pelo Instituto Brasileiro de
Geografia e Estatística (IBGE), através da Pesquisa Mensal de Emprego (PME), indica a
relação entre o número de pessoas desocupadas (procurando trabalho) e o número de pessoas
economicamente ativas em um determinado período de referência.
A PME foi implantada em 1980 e é realizada em 6 regiões metropolitanas (Recife,
Salvador, Belo Horizonte, Rio de Janeiro, São Paulo e Porto Alegre), com o objetivo de
avaliar a conjuntura do trabalho junto à população em idade ativa.
As grandes alterações ocorridas no mercado de trabalho impuseram uma revisão
completa na metodologia da pesquisa em 2001, atualizando sua cobertura temática e
atendendo às recomendações internacionais, principalmente no que diz respeito a abrangência
geográfica, população em idade ativa, conceitos segundo as recomendações da OIT -
Organização Internacional do trabalho, instrumentos de coleta e expansão da amostra.
A taxa de desemprego aberto totalizada (média de todas as regiões metropolitanas) foi
introduzida no modelo no intuito de explicar eventual expansão ou retração da demanda e
conseqüentemente das vendas, em função do aumento ou diminuição da população ocupada,
supondo ser a demanda inversamente proporcional à taxa de desemprego apurada pelo IBGE.
Os dados foram separados em dois conjuntos: (1) dados de treinamento (de janeiro de
1998 a dezembro de 2002) e (2) dados de teste ou de validação (janeiro a junho de 2003). Os
dados de treinamento foram carregados no MatLab através de uma matriz com 57 linhas,
representando os meses da série temporal e de 16 colunas representando a variação trimestral
de todas as variáveis explicativas e da série de venda.
Todos os dados foram normalizados, ou seja, enquadrados no intervalo [-1 +1]. A
normalização é um tratamento estatístico que remove de todos os pontos da série temporal a
média da mesma. A normalização é necessária, pois em muitos casos a informação
significante de uma série está contida em pequenas variações que se encontram adicionadas a
um grande valor de compensação, e este valor de compensação pode ser retirado se é sabido
que ele é irrelevante para o sistema e está inibindo o treinamento. A normalização também
permite a adequada manipulação das não-linearidades da série temporal.

V V V V CDI CDI CDI IGP- IGP- IGP- US$ US$ US$ Tx D Tx D Tx D


(t-1) (t-2) (t-3) (t-1) (t-2) (t-3) M (t- M (t- M (t- (t-1) (t-2) (t-3) (t-1) (t-2) (t-3)
Período 1) 2) 3)
Abr/98
Mai/98 Target Input
...
Dez/02
jan/03
... Teste
jun/03
Figura 2 – Matriz de entrada dos dados na RNA

A rede neural multilayer perceptron foi montada com 15 neurônios de entrada,


representando a variação trimestral de todas as variáveis, duas camadas intermediárias, sendo

10
uma com quatro neurônios e a outra com dois neurônios e uma camada de saída, conforme
esquema a seguir:
variável ambiental 1 variável ambiental 5

x1 (t − 1) x1 (t − 2) x1 (t − 3) x5 (t − 1) x5 (t − 2) x5 (t − 3)
−1 −1 −1 −1
z z z z

primeira camada f1 f2 f3 f4

segunda camada f5 f6

f7 neurônio de saída

y (t )
Figura 3 – RNA proposta

Sendo:
Para a primeira camada:
f n = tan sig ( f n *Wn + bn )
Para a segunda camada:
f5 = tan sig ( f1 *W12 + f 2 *W22 + f3 *W32 + b5 )
f 6 = tan sig ( f1 * W12 + f 2 * W 22 + f 3 * W 32 + b5 )

A elaboração do modelo foi estruturada em seis fases:


1. Coleta dos dados: A série histórica das vendas mensais foram coletados através
da SUFRAMA (Superintendência da Zona Franca de Manaus). A série das
variáveis explicativas foram coletadas junto ao IPEA (Instituto de Pesquisa
Econômica Aplicada), através do endereço eletrônico www.ipeadata.gov.br, no
tópico “séries históricas” e IBGE (Instituto Brasileiro de Geografia e Estatísitica)
através do endereço eletrônico www.ibge.gov.br no tópico “indicadores de
trabalho e rendimento”.
2. Tratamento dos dados coletados: O valor das vendas foi corrigido pelo IGP DI
(Índice Geral de Preços Disponibilidade Interna), posteriormente todos os dados
foram normalizados e organizados em matrizes, que foram carregadas no
software MatLab 6.1,
3. Separação dos dados em dois conjuntos, um de treinamento e um de teste ou
validação
4. Definição e configuração da rede: A configuração da rede foi estabelecida com
base na seleção do paradigma neural apropriado à aplicação, posteriormente foi
determinada a topologia da rede a ser utilizada - o número de camadas, o número
de unidades em cada camada, foi determinado os parâmetros do algoritmo de
treinamento, através de algoritmo genético e funções de ativação.
11
5. Treinamento da Rede: O treinamento foi desenvolvido através da utilização de
algoritmo genético, que otimizou o ajustamento dos pesos das conexões, e foi
interrompido quando a rede apresentou uma boa capacidade de generalização e
quando a taxa de erro apresentou-se suficientemente pequena, ou seja menor que
um erro admissível.
6. O teste da rede: O conjunto de teste foi utilizado para determinar a performance
da rede com dados que não foram previamente utilizados.
Os resultados obtidos foram analisados sobre a ótica da função de erro MSE, por ser a
função mais utilizada, o que facilita a comparação de resultados obtidos com outros
experimentos realizados.
O erro foi determinado nas duas fases da elaboração do modelo: no treinamento da rede
e em sua validação, considerando a previsão para um período à frente, e os resultados foram
comparados graficamente.
Para o MSE do treinamento, o modelo atingiu – 2.055624, após 1000 gerações e
população de 100 indivíduos, correspondendo a um erro médio individual de 3,61%,
considerando as 57 observações. Já no MSE de validação, o erro atingido para um período a
frente foi de -0.040817 que representou 4,08% de erro individual, para o universo de 6
observações. O resultado de um período era acrescentado à rede para compor a validação do
período seguinte.

Figura 4 - Comparação Gráfica do Resultado – Dados de Treinamento


Na tabela 01, segue a comparação dos resultados obtidos na fase de validação da RNA,
para um período à frente:
PERÍODO REAL PREVISTO ERRO
1 -0,36685 -0,36685 -0,0012
2 -0,17684 -0,17684 -0,0014
3 -0,09824 -0,10376 -0,0743
4 0,11808 0,11794 -0,0121
5 -0,31720 -0,04586 -0,1189
6 -0,13850 -0,13987 -0,0370
ERRO MÉDIO -0,0408
Tabela 1 – Resultados obtidos na validação da RNA

12
Graficamente:
Real X Previsto - Dados de Validação

0,2

Real
Valores Normalizados

Previsto

-0,2

-0,4
1 2 3 Período 4 5 6

Figura 5 - Comparação Gráfica do Resultado – Dados de Validação

Em termos práticos, o resultado obtido em cada período pode ser considerado como as
vendas da empresa naquele período, assim como os resultados dos períodos subseqüentes. A
série de resultados seria então incorporada à planilha de elaboração do orçamento de vendas
da companhia, dando início efetivo ao processo orçamentário.
4. Conclusão
O trabalho evidenciou o sucesso da RNA na solução do problema proposto,
principalmente por se tratar de um conjunto de dados por demais ruidosos e sem
periodicidade aparente, em contrapartida à limitada capacidade dos modelos lineares. Mesmo
comparado aos resultados alcançados por outros modelos neuro-preditores, a exemplo dos
desenvolvidos por MARTIN (2000) e ABELÉM (1994), a RNA desenvolvida neste trabalho
atingiu resultados ainda superiores, principalmente pelo uso de modelagem genética, que
otimizou a escolha dos parâmetros adequados à solução do problema.
Algumas dificuldades inerentes à modelagem da RNA, como a complexidade de sua
parametrização, considerada por ABELÉM (1994) altamente dependente da experiência do
projetista e da experimentação manual, foram amainadas com a utilização de algoritmo
genético, alcançando resultado muito satisfatório
A utilização do software MatLab proporcionou ambiente adequado a simulação do
modelo, oferecendo condições de estabilidade e consistência nas aplicações.
De fato, além de demonstrar a eficiência da RNA na previsão de séries temporais, este
trabalho traz contribuição ao desenvolvimento de modelos híbridos, com a utilização de
algoritmo genético, tendo em vista sua comprovada capacidade de otimizar os resultados
obtidos pela RNA
O modelo proposto mostrou-se adequado ao uso corrente na elaboração de orçamento
empresarial, bem como em outras aplicações gerenciais que necessitem de ferramentas
preditivas, mediante a confecção de software específico para tal fim.
Em trabalhos futuros serão apresentadas novas aplicações gerenciais do modelo
proposto bem como a incorporação de novas ferramentas como wavelets e fuzzy logic.

13
Bibliografia
AMAT J. M.; GOMES J.S. Controle de Gestão – uma perspectiva global. 2000. 25p.
Artigo.Universidade Pompeu Fabra, Departamento de Economia de la Empresa, Barcelona,
Espanha.
ABELÉM A. J. G. Redes neurais artificiais na previsão de séries temporais. 1994. 97p.
Dissertação de Mestrado. DEE, PUC-RJ.
ANTHONY, Robert N., GOVINDARAJAN, Vijay. Management Control Systems. 9th
ed.[s.l.]: Irwin/Mcgraw-Hill, 2002.
ATKINSON, Anthony A.; BANKER, Rajiv D.; KAPLAN, Robert S.; YOUNG, S. Mark.
Contabilidade gerencial. São Paulo: Atlas, 2000.
BARR, A., FEIGENBAUM, E.A., ed. The handbook of artificial intelligence. vol.1.
Stanford, CA, Heuristech Press, 1981.
CURRY, B.; MORGAN, P.; BEYNON, M. Neural networks and forecasting: ‘orthodox’
methods and new research. 1999. 7p. Cardiff Business School, University of Wales Cardiff,
United Kingdom.
DE ALMEIDA F. C.; SIQUEIRA J. DE O. Comparação entre regressão logística e redes
neurais na previsão de falências de bancos brasileiros. In: Congresso brasileiro de redes
neurais, 3. 1997, Florianópolis.
DE ALMEIDA F. C.; ZANETI L. A. JR. Exploração do uso de redes neurais artificiais na
previsão do comportamento de ativos financeiros. In: SEMEAD, 3. 1998, São Paulo.
Faculdade de Economia Administração e Contabilidade-USP.
FALAS T.; CHARITOU A.;CHARALAMBOUS C. The application of artificial neural
networks in the prediction of earnings. 1994. 5p. Departament of public and business
administration school of economics and management, University of Cyprus.
FIALHO, MÁRIO: Construtividade e Algoritmos Genéticos, 1995. <http://www.ctai.rct-
sc.br/labiutil/fialho1.html>. Acessado em 21 nov. 2003.
FUNDAÇÃO GETÚLIO VARGAS. Divisão de gestão de dados. Disponível em:
<http://www.fgv.br/dgd. Acessado em 17 ago.2003.
GARRISON, Ray H.; NOREEN, Eric W. Contabilidade gerencial. Rio de Janeiro: LTC,
2001.
GOLDBERG, D.E., Deb, K. & Clark, J.H.: Genetic algorithms, noise, and the sizing of
populations. pp 333-362,1992. ftp://ftp- illigal.ge.uiuc.edu/pub/papers/IlliGALs/91010.ps.Z
Acessado em 21 nov. 2003.
HAYKIN, S. Neural Networks: A comprehensive fundation. 2.ed. New Jersey: Prentice hall,
1999. 795p.
HOLLAND, John H.:Adaptation in natural and artificial systens. University of Michigan Press
Ann Arbor, 1975.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. Indicadores de trabalho e
rendimento. Disponível em: <http://www.ibge.gov.br>. Acessado em 17 ago. 2003.
INSTITUTO DE PESQUISA ECONOMICA APLICADA. Séries Históricas. Disponível em:
<http://www.ipea.gov.br>. Acessado em 25 ago. 2003.
LUBISCO N. M. L.; VIEIRA S.C. Manual de estilo acadêmico:Monografias, dissertações e
teses. 2ª ed. Salvador: EDUFBA, 2003. 144p.
MARTIN C. Aplicação de redes neurais para prognóstico com base em séries temporais.
2000. 74p. Dissertação de Mestrado. PPGEP, UFSC.
PORTUGAL, M. S.; FERNANDES, L.G. Redes neurais artificiais e previsão de séries
econômicas: uma introdução. 1995. 22p. Artigo. UFRGS.
PORTUGAL, M. S.; FERNANDES, L.G; NAVAUX P.O.A. Previsão de séries de tempo:
redes neurais artificiais e modelos estruturais.1995. 19p. Artigo. UFRGS.

14
SANVICENTE, A. Z.; SANTOS, C. da C. Orçamento na administração de empresas:
planejamento e controle. 2.ed. São Paulo: Atlas, 1998. 57p.
SUPERINTENDÊNCIA DA ZONA FRANCA DE MANAUS. Estatísticas. Disponível
em:<http://www.suframa.gov.br> . Acessado em 11 ago. 2003.
VALDAMERI, A. R.; LOPES, M. C.; WILHELM, P. P. H. Aplicação de redes neurais
artificiais para previsão de vendas do sistema de informação do jogo de empresas
virtual.[199_]. 6p. Artigo. UFSC.
VERGARA, S. C. Projeto e relatórios de pesquisa em administração. 4. ed. São Paulo:
Atlas, 2003. 96p.
WELCH, G. A. Orçamento empresarial. 4.ed. São Paulo:Atlas, 1998. 126p.

15

Você também pode gostar