Você está na página 1de 29

SisReN Sistema de Redes Neurais e Regresso Linear

1. PREPARANDO A AMOSTRA PARA DIGITAO Ao iniciar o trabalho de Avaliao de um imvel, pelo processo comparativo, procure identificar as caractersticas que, normalmente, mostram-se mais significativas na formao do seu valor no mercado. Depois de vistoriado o imvel a ser avaliado, preencha a planilha de amostragem, que est localizada na pasta Ficha de Dados, no diretrio do SisReN, onde os dados da amostra, a ser colhida no mercado, sero identificados, e suas caractersticas intrnsecas e extrnsecas , transformadas em variveis numricas. (veja exemplo de planilha de amostragem de terrenos urbanos, abaixo).
PLANILHA DE AMOSTRAGEM - Terrenos Urbanos em Belo Horizonte / MG Dad o Endereo Fonte (fone) rea (m2) Frente (m) Ms (jan2001=1) Oferta= 2 Venda= 1 ... .. Valor (R$) Obs.

1 2 ...
Organize e numere os diversos dados da amostra, antes de iniciar o uso do SISREN, isto facilitar seu trabalho. Depois de coletados os dados e preenchida sua planilha, acione o programa, e proceda da seguinte forma: 2. CRIANDO ARQUIVO DE DADOS Ao acionar o SISREN, a primeira tela mostrada informa a Dica do Dia. Feche esta janela e, se voc no deseja que esta tela seja exibida cada vez que o programa for ativado, desabilite a mesma na caixa de dilogo. Fechada a janela de Dica, estar disponibilizada a janela de opes para Abrir Modelo de Dados, Criar novo Modelo ou Abrir Ultimo Modelo. Como nosso objetivo neste momento criar um novo arquivo de dados, esta deve ser a opo selecionada. Para navegar entre os campos da janela de identificao do modelo, abaixo descritos, utilize a tecla < TAB >. A tecla < ENTER >, finaliza a digitao da janela.

Autor: Informe seu nome, para personalizao do modelo a ser criado; Data : Informe a data da criao do modelo, para identificao futura; Outras informaes : Caractersticas gerais do modelo, exemplo: Terrenos em Belo Horizonte - JAN/2004 - completo; Estas informaes podem ser alteradas posteriormente, atravs da opo Modelo... Propriedades, do menu principal. Terminada a identificao do modelo, tecle < ENTER > ou clique em Avanar, para ativar a janela de identificao das variveis que sero usadas no teste de influncia nos valores de mercado.

INFORMANDO NOMES DAS VARIVEIS


Na janela de dilogo correspondente identificao dos Nomes de Variveis, escreva no espao Nome da Varivel, o nome de todas as variveis que faro parte de seu modelo, inclusive a varivel dependente, acionando o boto Adicionar, aps a digitao de cada uma delas. Este procedimento gera uma Lista de Variveis, informando os nomes escolhidos no lado direito da janela. Para facilitar a montagem de seu modelo, esto disponveis alguns nomes de variveis comumente testadas. Se voc deseja utilizar qualquer destes nomes, clique duas vezes sobre o mesmo, na lista de Variveis mais comuns (lado direito da janela). O nome escolhido dever aparecer no lado esquerdo da janela, incorporando a Lista de Variveis, que est sendo montada. Terminada a digitao dos Nomes das Variveis acione o boto Avanar >>. RESUMO - Nome das Variveis: 1) Digite o nome da 1a varivel de seu modelo no campo Nome da Varivel; 2) Acione o boto Adicionar; 3) Digite o nome da 2a varivel de seu modelo no campo Nome da Varivel; 4) Acione o boto Adicionar; 5) Repita os procedimentos acima at finalizar a identificao de todas as variveis do modelo, inclusive a varivel dependente; 6) Acione o boto Avanar >>; Selecionada as variveis a serem utilizadas, o prximo passo ser definir o tipo destas variveis, bem como definir a varivel dependente e assinalar se a mesma Unitrio ou Total e qual a varivel rea utilizada. Aps o procedimento acima, o sistema ir perguntar se voc deseja salvar o arquivo com nome padro SisReN1. Responda Sim, com o mouse, que o sistema continuar o dilogo. Na janela de Salvar, escolha o nome e destino do arquivo que est sendo montado (drive, diretrio, subdiretrio, etc.), e acione o boto Salvar.

DIGITANDO OS DADOS
A janela de Edio de Dados, possibilita o cadastramento das informaes sobre endereo, fonte e valores das variveis , de cada dado da amostra colhida para testes de hipteses. Os procedimentos necessrios ao correto cadastramento, so os seguintes: 1) No item Contedo, digite a informao solicitada para o campo assinalado com contorno escurecido da tabela (ao lado direito superior da janela, indicado o nmero do dado e o campo a ser digitado no momento); Voc pode tambm digitar a informao diretamente na clula, bastante teclar F2. 2) Depois de digitada a informao solicitada para cada campo, tecle <ENTER>. Utilize a tecla <TAB> somente para navegar entre os botes da parte inferior da janela, a tecla <ENTER> posiciona no prximo campo do dado que est sendo digitado. 3) Terminada a digitao de todos os campos do dado, acione a tecla <<enter>> ou escolha o boto + referente a adicionar dado. Este procedimento adiciona outro dado para digitao; 4) Depois de digitado o ltimo dado, acione o boto Salvar. este procedimento ir gravar o arquivo de dados, no local indicado no item anterior.

Obs.: para corrigir qualquer campo, basta selecion-lo, com o mouse, digitar a informao correta e teclar <ENTER> (campos alfanumricos sero limpos com barra de espao).

3. ESCOLHA DO MTODO DE CLCULO Regresso Linear O uso de Estatstica Inferencial para estudo de comportamento do mercado imobilirio, pressupe que, a variao em torno do valor mdio encontrado nas amostras colhidas neste mercado, apresenta-se significativamente influenciada pelas diferenas fsicas e qualitativas, normalmente presentes entre os dados destas amostras. O SISREN permite que este estudo seja atravs de duas metodologias: processo dos Mnimos Quadrados, que calcula o percentual da variao em torno da mdia que se deve s diferenas mais importantes entre os dados, no enfoque do avaliador, para o mercado pesquisado, ou pelo uso de Redes Neurais Artificiais, que est descrito na segunda parte deste tutorial. O processo dos Mnimos Quadrados, consiste na busca de uma equao linear (Equao de Regresso), que se mostre o mais aderente possvel disperso dos dados da amostra, num grfico cartesiano, ou seja, a equao representativa da mdia, que passa mais ao centro dos pontos do grfico. Exemplificando, para duas variveis, o grfico abaixo representa a disperso no plano cartesiano, de amostra do mercado imobilirio, onde os dados colhidos apresentam diferenas significativas nas reas dos imveis.

Valor (y)
(Varivel Dependente)

Dados da amostra

Equao de Regresso y = A+ Bx

di ei

Valor mdio da amostra (

yi
n

rea (x)
(Varivel independente)

Define-se por Variao total em torno do valor mdio da amostra, o 2 somatrio dos quadrados dos di di , ou seja, o somatrio do quadrado da

distncia dos dados mdia aritmtica da amostra Da mesma forma, define-se por Variao residual, o somatrio dos quadrados dos ei ei2 , isto , o somatrio do quadrado da distncia dos dados

equao de regresso.
Relacionar o Valor com a rea dos imveis, significa na verdade, formular a hiptese de que, na populao, a Variao dos valores em torno da sua mdia aritmtica, sofre influncia da Variao da rea dos mesmos, ou seja, quanto maior a rea, maior o valor do imvel, numa relao linear equivalente a y = A + Bx, sendo o valor representado por y e a rea, por x. Os parmetros A e B so calculados pelo Mtodo dos Mnimos Quadrados.

( e )
2 i

A amostra comprova esta hiptese, medida em que a Variao residual 2 se mostrar significativamente inferior Variao total di . Desta

maneira, a expectativa de que a disperso em torno da equao de regresso, representada pela Variao Residual ei2 seja menor que a disperso em torno

da mdia aritmtica, representada pela Variao Total


4

(d ) . A diferena entre o
2 i

montante representativo das duas variaes (

(d ) - (e ) ), indica a parcela da
2 i
2 i

variao dos valores em torno da mdia aritmtica que se deve s diferenas de suas reas. Numericamente, a influncia das reas nos Valores dos imveis, quantificada atravs do percentual da Variao em torno da mdia que tem origem nas diferenas de reas. Este percentual definido como Coeficiente de Determinao, calculado da seguinte forma:

Coeficiente de determinao C d =

d - e d
2 i 2 i

2 i

Isto significa que, quanto mais prximo de 1,00 este coeficiente de determinao, maior a influncia das diferenas entre as reas dos imveis da amostra (varivel independente) na variao do valor dos imveis (Varivel dependente) em torno de sua mdia aritmtica.

TRANSFORMAO DE VARIVEL
Este processo de clculo, busca reduzir a disperso em torno do valor mdio, atravs do uso de um Valor Mdio varivel, ou seja, o valor mdio de um imvel, vai depender de suas caractersticas, conforme a funo linear representada pela equao de regresso. Por outro lado, para que o modelo de regresso mostre-se consistente, enquanto representativo dos valores mdios praticados para imveis com caractersticas diferentes, torna-se necessrio que a disperso dos pontos em torno da equao de regresso apresente-se o mais homognea possvel. Significando assim, que a amostra colhida aleatria, no apresentando distores tendenciosas. O clculo atravs dos Mnimos Quadrados, identifica somente funes lineares, no entanto, em alguns casos, a relao entre as variveis mostra disperso de forma no linear. Neste caso, podemos utilizar, como artifcio, algumas transformaes matemticas nas variveis, as quais podero linearizar esta relao. Exemplificando, suponha a seguinte disperso entre os dados: Valor

Valor mdio da amostra (

yi
n

rea Equao de Regresso y = A+ Bx

Observa-se claramente que, mesmo que o Coeficiente de Determinao do modelo apresente valores prximos de 1,00, indicando boa aderncia dos dados equao de regresso e reduzindo a variao total em torno do valor mdio da amostra, a disperso destes dados em torno da equao de regresso mostra-se heterognea, indicando trechos em que o valor mdio representativo est acima de todos os imveis da amostra, e vice-versa. Para contornar o problema, utiliza-se, como artifcio, transformao matemtica nas variveis, no intuito de linearizar a disperso. Neste caso, uma nova varivel, com dependncia matemtica da varivel transformada, trazida ao processo de anlise. Neste exemplo, a tentativa de linearizao ser atravs da inverso da varivel x, na forma: z = 1 , a qual deve resultar na seguinte disperso de y por z
x

Valor

Equao de Regresso y = A+ Bz

Valor mdio da amostra (

yi
n

obtm-se agora, uma disperso homognea dos valores da amostra, em torno da equao representativa da mdia (y = A+Bz), sinalizando uma amostragem aleatria, sem tendenciosidade. Por outro lado, como z =
1 , em x

relao varivel x, que representa a rea dos imveis, a equao pode ser escrita da seguinte forma: y = A+
B , isto quer dizer que o valor mdio dos x

imveis (y) apresenta uma relao no linear com a rea dos mesmos (x).

Calculando-se o Coeficiente de Determinao do modelo de regresso nesta nova formatao, pode-se compar-lo com o mesmo coeficiente, calculado originalmente. A equao que apresenta maior Coeficiente de Determinao, mostra-se mais aderente aos dados, na forma matemtica em que os mesmos esto considerados. Este raciocnio, amplia significativamente as alternativas de clculo de uma equao representativa da mdia, pois, atravs da combinao de transformaes nas variveis, calcula-se o Coeficiente de Determinao para cada situao diferente. Dentre todos, aquele que apresenta-se mais prximo de 1,00, o mais aderente disperso de pontos que representa.

ESCOLHA DE TRANSFORMAES PARA TESTE


Ao adotar-se transformaes Inversa e Logartmica para cada varivel, teremos, no caso de 2 (duas) variveis, 9 (nove) situaes diferentes, cada uma apresentando Coeficiente de Determinao prprio, conforme tabela abaixo:

FORMA DE x

FORMA DE y

1 2 3 4 5 6 7 8 9

x x x 1/x 1/x 1/x ln x ln x ln y

y 1/y ln y y 1/y ln y y 1/y ln y

Pelo exposto, calculando-se o Coeficiente de Determinao para cada uma das nove situaes acima, obtm-se um elenco de equaes de regresso que, hierarquizadas em seus coeficientes, devem ser analisadas isoladamente, buscando-se como mais representativa, aquela que apresenta disperso homognea dos pontos em torno da mdia (equao), com a maior aderncia possvel aos dados da amostra (maior coeficiente).

No exemplo, duas variveis e duas transformaes, originaram 9 (nove) equaes distintas. Trazendo mais uma varivel ao processo de anlise (3 variveis), e mantendo as 2 (duas) transformaes, o nmero de equaes a serem testadas aumenta para 27 (vinte e sete), ou seja, os 9 (nove) testes acima, para a nova varivel em cada uma das formas (direta, inversa e logaritmo). Desta maneira, cada varivel ou transformao acrescida ao processo de anlise, incrementa o nmero de equaes de anlise da seguinte forma:

N Equaes = n ,

k = n de variveis onde n = n de transformaes

Ao testarmos, por exemplo, 3 (trs) transformaes: direta, inversa e logaritmo, em amostra que contempla o total de 10 (dez) variveis (nove independentes e uma dependente), o sistema calcula 59.049 equaes ( 310 ). Do mesmo modo, a incluso de mais testes de transformaes, tais como raiz quadrada, inverso da raiz, potncia de 2 e inverso da potncia de 2, tambm disponibilizadas pelo SISREN, incrementa significativamente o nmero de equaes calculadas, aumentando consequentemente, o tempo de resposta do sistema, de acordo com o potencial do computador utilizado e a quantidade de dados da amostra. Esto disponveis na caixa de dilogo da opo de clculo do sistema, trs Mtodos diferentes de procura do modelo matemtico de melhor aderncia aos dados amostrais: geral; dirigido e simplificado, os quais possibilitam maximizar a relao quantidade de equaes calculadas e tempo de resposta do sistema.

No Mtodo denominado geral, cada varivel ter testes de transformaes


, x , conforme escolha do , Ln x, x 2, 1 2 , 1 x x x usurio, disponveis na caixa de dilogo do mdulo de clculo (as trs primeiras so default do sistema), sendo calculadas equaes para todas as combinaes possveis entre as variveis transformadas, gerando um nmero de equaes igual a n k , conforme descrito. Estas equaes sero hierarquizadas pelo Coeficiente de Correlao (linearizao do Coeficiente de Determinao, C c = C d ), sendo disponibilizados, em ordem decrescente, os 50 modelos que apresentam Coeficiente de Correlao mais elevado.

para as formas:

x, 1

O Mtodo geral, calcula quantidade significativa de equaes para modelos acima de 8 (oito) variveis, exigindo do computador boa capacidade de processamento, para um tempo de resposta aceitvel (at 2 minutos). No Mtodo denominado simplificado, o SISREN tambm efetua as transformaes escolhidas pelo usurio em todas as variveis, no entanto, so calculadas apenas as combinaes que relacionam a varivel dependente com cada uma das variveis independentes. Este Mtodo busca de forma mais rpida, modelos com coeficientes de determinao elevados, no entanto, embora a maior parte das vezes encontre a combinao de transformaes que apresenta o maior coeficiente de todos, isto no ocorre sempre. bastante til nos casos em que o computador utilizado limitado e/ou, a amostra contempla variveis em grande quantidade (acima de 8), exigindo do Mtodo geral um tempo de resposta mais elevado. A quantidade de equaes calculadas equivalente a:
n = transforma es 2 Equaes = n (k - 1), onde k = total de variveis

No Mtodo denominado Dirigido, o usurio define qual a transformao que deseja adotar, para cada varivel, dentre as formas disponveis no dilogo disponibilizado aps a escolha deste mtodo (lado direito superior da janela do mdulo de clculo). Para escolha da transformao a ser efetuada em cada varivel para teste, selecione a mesma na lista disponibilizada direita da janela e escolha a forma matemtica, entre aquelas disponveis no canto direito superior da janela (a opo Auto testa todas as transformaes disponveis). Os botes com as alternativas de transformaes, disponveis no canto direito inferior da janela, facilitam a escolha de uma transformao nica para todas as variveis de forma simultnea.

10

O mdulo Calcular, disponibiliza ainda, em sua janela de dilogo, algumas opes para agilizar aes na massa de dados antes de iniciar os clculos. No canto inferior esquerdo da janela, a opo Analisar Variveis, verifica possveis inconsistncias nos valores atribudos para as variveis, nos diversos dados da amostra (em desenvolvimento); a opo Reconsiderar todos os dados, habilita todos os dados marcados como desabilitados para clculo, e a opo Durbin Watson identifica a varivel que servir de base para classificao da massa de dados no clculo da estatstica de Durbin Watson. Depois de definidas as alternativas de clculo, acione o boto Calcular, e aguarde a resposta do sistema. 4. ESCOLHA DO MODELO DE REGRESSO Efetuados os clculos definidos pelo usurio, no caso dos mtodos geral e simplificado, o sistema disponibiliza uma relao com as 50 (cinqenta) equaes que mostraram mais aderncia aos dados da amostra, equaes estas, resultantes das transformaes matemticas escolhidas para as diversas variveis. Estes modelos de regresso, hierarquizados pelo Coeficiente de Correlao, so ordenados de forma decrescente. Na janela de dilogo Opes Equaes de regresso, esto disponveis alguns resultados importantes na tomada de deciso, a respeito do modelo estatstico mais consistente para estimao do valor representativo da mdia populacional, com base nos dados da amostra. Os resultados visualizados, correspondem equao de regresso, cujo Coeficiente de Correlao est selecionado (em azul), na parte inferior da janela. Ao acionar o pequeno boto, com seta, disponvel direita deste campo selecionado, o sistema mostra a lista de equaes, com as 50 mais aderentes aos dados, hierarquizadas pelo coeficiente de correlao, em ordem decrescente. Atravs do mouse ou da tecla (seta para baixo), do teclado, o usurio poder observar estes resultados iniciais para cada uma destas 50 equaes calculadas, escolhendo a equao que parece mais adequada, para verificao dos demais resultados. Feita a escolha, acione o boto aplicar para os testes de consistncia. 5. ANLISE DE CONSISTNCIA Ao analisar os resultados estatsticos apresentados pela equao de regresso escolhida, importante cuidados especiais com alguns tpicos fundamentais na sua utilizao para estimativa de valores mdios populacionais. Principalmente no que diz respeito aos seguintes aspectos:

11

TESTE DE HIPTESES
Cada varivel utilizada para explicar e reduzir a variao dos valores dos imveis em torno da sua mdia, representa na verdade, uma hiptese. Isto significa que, ao afirmarmos que a variao das reas dos imveis causam variao nos seus valores, formulamos a hiptese de que, quanto maior a rea, maior o valor do imvel, se conservadas as demais variveis inalteradas. A equao de regresso dever mostrar esta relao. Da mesma forma, ao utilizarmos a idade dos imveis como varivel explicativa da variao dos valores em torno de sua mdia, nossa expectativa que a equao de regresso demonstre que, quanto maior a idade do imvel, menor seu valor, conservadas as demais condies. A amostra colhida, dever demonstrar a veracidade de cada hiptese, com probabilidade de erro reduzida. A Norma Brasileira para Avaliao de Imveis NB-502, recomenda que no ultrapasse a 10%, o nvel de erro mximo aceitvel, ao rejeitar o fato de que cada uma destas variveis no interfere na variao dos valores (significncia).

TESTE DA EQUAO
Pelo exposto, o modelo de regresso dever mostrar, antes de mais nada, que o crescimento do valor mdio dos imveis est coerente com as expectativas na formulao de cada hiptese. Desta maneira, o primeiro e mais importante teste de consistncia a ser efetuado no modelo de regresso, refere-se exatamente verificao de sua coerncia com cada uma das hipteses formuladas. Neste teste deve-se observar qual efeito provocado nas estimativas oferecidas pela equao, quando h um incremento relativo em cada varivel, permanecendo as demais inalteradas. No SISREN, ao acionar o cone (cone Equao) o sistema mostra a equao de regresso inferida, tanto na forma linear como transformada (marca no canto inferior esquerdo da janela), alm disso, este mdulo mostra um ensaio numrico e grfico, sobre a variao observada nos resultados oferecidos por esta equao, ao se adotar incrementos relativos em cada varivel explicativa (hiptese). Os resultados numricos esto descritos no tpico Analisando a Equao de Regresso, do mdulo Ajuda do Sistema. Os diversos grficos, mostrando a evoluo do valor dos imveis para cada varivel, acessados pelos pequenos botes com setas laterais acima dos mesmos, podem ser visualizados em 3D, ou transferidos para outros aplicativos Windows (Word, Exel, etc.), acionando-se o boto direito do Mouse, sobre o grfico.

12

ANLISE DE HIPTESE INCOERENTE


Uma incoerncia entre o resultado obtido na equao e a expectativa em relao hiptese formulada, constitui-se defeito que inviabiliza o uso da equao para estimao de valores mdios. Esta incoerncia ocorre em trs situaes: Um dos dados contidos na amostra, apresenta uma relao completamente contrria hiptese que se busca comprovar; exemplo:um imvel colhido para fazer parte da amostra, apresenta idade bastante avanada e valor de comercializao bem superior aos demais, enquanto que, pela hiptese formulada, esta relao deveria estar invertida. Grande parte da amostra apresenta-se incompatvel com a hiptese formulada; exemplo:na amostra, os terrenos com grandes frentes apresentam valores mais reduzidos que os terrenos com pequenas frentes, enquanto que a hiptese busca provar que quanto maior a frente, maior o valor dos terrenos. Duas ou mais variveis explicativas (hipteses) apresentam-se fortemente relacionadas entre si (colinearidade); exemplo:na amostra, os terrenos com grandes frentes apresentam valores mais elevados que os terrenos com pequenas frentes, nesta hiptese a equao mostra-se coerente. Concomitantemente, outra hiptese busca provar que quanto mais distante de um plo atrativo, menor o valor do imvel e, embora os dados coletados demostrem este fato, a equao mostra o contrrio. Muitas vezes, isto se deve uma forte relao entre frente e distncia, onde os imveis com grandes frentes, esto mais distantes do plo atrativo, fazendo com que a frente modifique a influncia da distncia, no modelo

Uma forma simples de verificar a presena de qualquer destas ocorrncias , sem dvida, a anlise criteriosa da amostra, principalmente no que respeito comparao numrica e grfica entre o comportamento do valor dos imveis e a varivel inconsistente. O SISREN possibilita este estudo, atravs da opo Exibir Dados (cone), seguida da opo Classificar (cone), recomendando-se que, a classificao dos dados, seja efetuada pela varivel dependente (valor dos imveis). Com os dados listados na tela, ordenados pelo valor dos imveis, procure identificar se a inconsistncia est baseada em um nico dado ou em toda a amostra. A presena de colinearidade entre variveis independentes (hipteses), melhor observada atravs de mdulo especfico do Sistema, o qual est explicitado no item Correlaes, mais adiante.

13

DESABILITANDO DADOS INCONSISTENTES


Ao identificar, um ou mais dados inconsistentes com uma das hipteses formuladas, observe que os mesmos podem apresentar justificativa nas demais hipteses, sendo recomendvel portanto, uma anlise completa da informao (dado), antes de adotar qualquer atitude em relao a mesma. Ao concluir que um dado apresenta-se inconsistente com as demais informaes da amostra, procure efetuar outro ensaio desconsiderando a presena do mesmo. Para tanto, proceda da seguinte forma: 1) Acione o mdulo Editar Dados (cone); 2) Selecione o dado a ser desabilitado, clicando sobre qualquer campo do mesmo; 3) Desabilite o dado, clicando sobre a marca que aparece ao lado do contedo do campo selecionado; 4) Acione o boto Salvar seguido do boto Fechar, ambos no rodap da janela; Obs.: - O sistema informa os dados desabilitados para clculo, colocando um asterisco (*) na primeira coluna da linha dos mesmos; - Para habilitar o dado novamente, proceda da mesma forma indicada acima, marcando novamente o dado no passo 3); Este procedimento aciona novamente o mdulo de Clculo do sistema, disponibilizando a janela correspondente. Reveja os procedimentos descritos a partir do item 3 e recomece a anlise.

DESABILITANDO HIPTESE INCONSISTENTE


Ao constatar que, a hiptese formulada apresenta-se inconsistente com a realidade mostrada nos dados da amostra, procure efetuar novo ensaio desconsiderando a presena da mesma. Para tanto, proceda da seguinte forma: 1) Feche todas as janelas abertas, colocando o sistema na janela inicial do arquivo (janela inicial na abertura do arquivo); 2) Desabilite a hiptese, clicando sobre a marca que aparece ao lado esquerdo do nome da varivel que a representa (canto superior esquerdo da janela); 3) Ao acionar o mdulo Calcular novamente, o sistema solicita confirmao do procedimento de regravao do arquivo com a alterao efetuada. Responda Sim; Obs.: - Para habilitar a hiptese novamente, proceda da mesma forma indicada acima, marcando novamente a varivel no passo 2); Acionado o mdulo de Clculo do sistema, proceda a anlise da nova formatao, conforme descri a partir do descrito a partir do item 3 e recomece a anlise.

14

ANLISE DE RESDUOS
O uso da Estatstica Inferencial no tratamento de amostras do mercado imobilirio, tem como objetivo a homogeneizao dos dados coletados, atravs da eliminao da parcela da variao dos valores em torno de sua mdia, originada nas diferenas existentes entre os dados. Isto significa que, a Variao Residual, ou seja, a parcela da variao que permanece aps a retirada do efeito provocado pelas diferenas entre os dados, deve mostrar-se o mais aleatria possvel. Assim, as diferenas entre os valores amostrados e os valores mdios estimados pela equao de regresso (resduos aleatrios), no devem apresentar qualquer tipo de tendncia, ou comportamento padronizado, indicando que, algum fenmeno no contemplado nas hipteses formuladas ainda est interferindo nesta variao. Pode-se enumerar uma srie de ocorrncias que originam amostras ditas tendenciosas, dentre as quais podemos citar: - mercado monopolizado ou oligopolizado; - toda amostra colhida em uma nica fonte; - repetio exaustiva de dados iguais (ex.: vrios apartamentos iguais, no mesmo prdio e com o mesmo valor); - mistura de dados pertencentes populaes diferentes e, como conseqncia, com variao causada por hipteses diferentes (ex.: mistura de dados com caractersticas de glebas em amostra de lotes, ou vice-versa, mistura de salas comerciais e lojas); presena de colinearidade entre variveis independentes, em nveis elevados (variveis independentes -hipteses- fortemente correlacionadas entre si); expectativas especficas de uma nica negociao (ex. imvel de herana, com liquidez forada; imvel necessrio expanso de agncia bancria; etc.); impreciso na informao das caractersticas do dado (algumas vezes o corretor no possui informaes precisas sobre as caractersticas do imvel venda, tais como: rea, frente, data, etc., fazendo aproximao grosseira, tal fato acaba inviabilizando o uso da informao)

A anlise criteriosa dos resduos do modelo (diferena entre os valores praticados nos imveis da amostra e a mdia estimada para os mesmos pela equao de regresso), permite identificar ocorrncias deste tipo. Os dados atpicos em relao amostra colhida, ou deformaes de origens diversas, so facilmente detectados pela observao dos desvios relativos dos dados em relao sua mdia estimada, e visualizao do desenho da disperso.

15

ANLISE NUMRICA DA DISPERSO


O SISREN, atravs do mdulo Resduos (cone), possibilita a visualizao da disperso dos dados em torno da mdia estimada, tanto de forma grfica como numrica. Ao acionar o cone correspondente a este mdulo, o usurio acessa a tabela de informaes sobre o comportamento dos resduos do modelo para a varivel dependente (valor). O contedo de cada coluna desta tabela, est descrito no mdulo de ajuda do sistema. A pequena janela de dilogo, colocada direita da tabela, no canto superior, possibilita acesso s tabelas de informaes sobre o comportamento de cada hiptese (varivel explicativa). Para tanto, basta clicar no boto com seta direita do campo com o nome da varivel, escolhendo em seguida, a varivel a ser estudada. Esto disponibilizadas informaes referentes s seguintes caractersticas da varivel (ttulo indicativo acima da tabela): - Resduo da varivel: o sistema transforma a hiptese escolhida em varivel dependente, e a varivel dependente (valor) em hiptese, a seguir calcula os parmetros da equao de regresso em que as demais variveis, inclusive o valor, justificam a variao da varivel em anlise, informando a disperso neste caso. - Resduo do modelo: esta tabela, acessada com um clique do mouse no campo correspondente, abaixo do nome da varivel, na pequena janela de dilogo, informa na coluna Valor Calculado, o valor que a varivel (hiptese) deveria apresentar, para que o resduo da varivel dependente (valor) fosse nulo. importante frisar que, no caso de amostras do mercado imobilirios, toda a anlise deve se concentrar no estudo da disperso apresentada pela varivel dependente (valor), sendo os demais estudos apenas subsidirios a este objetivo. Estas amostras, via de regra, apresentam alguns indicadores de ajuste, na tabela de resduos da varivel dependente (valor): - Na coluna correspondente ao Valor Calculado, no dever haver nenhuma estimativa com sinal negativo. Tal fato tem origem nas transformaes matemticas adotadas, alm de colinearidades entre hipteses. - Na coluna Desvio Relativo, observa-se que modelos consistentes apresentam desvio mximo de 30% entre o dado e a sua estimativa linearizada, sendo aceitveis desvios de at 60%. Em amostras mais abundantes (acima de 50 dados), desvios de at 80% so tolerveis. Nos demais casos convm a verificao da consistncia do dado.

ANLISE GRFICA DA DISPERSO


O objetivo da pesquisa cientfica a formulao de uma equao de regresso dita estocstica (cada valor do domnio apresenta uma distribuio de valores na imagem), cuja distribuio dos dados em torno da mdia estimada (equao) seja a mais homognea possvel. Tal fato proporciona estimativas confiveis para a mdia populacional, no domnio da amostra. Visualmente, a
16

disperso abaixo apresenta bom indcio do atendimento a esta condio, restando ainda o exame dos indicadores numricos de anlise. Valor

Equao de Regresso y = A+ Bx

Hiptese

Esta representao grfica torna-se factvel quando a equao apresenta uma nica hiptese (reta), ou at duas hipteses explicativas da variao (plano). Para um nmero maior de hipteses, usual em amostras do mercado imobilirio, esta representao conjunta de variveis torna-se invivel. No SISREN, forma grfica da disperso, acessada atravs de um clique no campo Grficos, disponvel na parte inferior da janela de dilogo, os valores mdios estimados pela equao esto dispostos ao longo de uma linha horizontal e, a diferena entre o valor de cada dado da amostra e sua mdia estimada, est representada na distncia vertical entre o ponto que representa o dado e esta linha. O grfico acima estar representado da seguinte forma: Limites recomendados para estudo de disperso : ( y 2 ) (dados fora destes limites: Outliers)

Resduo : y ( yi - i )

Equao de Regresso : y = A + B1x1 + B2x2 +


17

O mercado imobilirio raramente disponibiliza amostras com disperso comportadas como esta, no entanto, modelos, baseados em dados coletados aleatoriamente e com preciso nas informaes de suas caractersticas, apresentam boa aproximao. As tendncias, indicativas de comportamento padronizado nos resduos, bem como dados dispersos ou extremos, so caractersticas que podem ser facilmente visualizadas neste grfico, conforme os seguintes exemplos: DADOS DISPERSOS E EXREMOS

dado disperso : li

dado extremo : muitas vezes no pertence mesma populao do restante da amostra.

18

DISTRIBUIO HETEROGNEA A disperso dos dados em torno da mdia estimada, aumenta medida em que o valor estimado aumenta, ou vice-versa (heterocedasticidade).

DISTRIBUIO PADRONIZADA OU REPETIDA A disperso dos dados em torno da mdia estimada, obedece um padro repetitivo para intervalo de valores (auto-regresso).

IDENTIFICANDO EFEITOS COLINEARES


As diversas hipteses formuladas, com objetivo explicar a variao dos valores em torno de sua mdia, so formadas de conjuntos numricos que podem ser tratados isoladamente. Estes conjuntos numricos, foram definidos ou escolhidos, a partir da observao do seu relacionamento com o valor praticado para os imveis.

19

Assim, a observao do comportamento do valores praticados no mercado, induz o avaliador formulao das hipteses, e a amostra retirada da populao tem por objetivo comprovar que estas hipteses so verdadeiras. Isto significa que, quanto maior a relao de causa e efeito entre cada hiptese e o valor, ou de outra forma, quanto mais forte a relao entre cada conjunto numrico representativo de cada hiptese e o conjunto numrico representativo dos valores dos imveis da amostra, mais facilmente a hiptese ser comprovada. Por outro lado, como as hipteses so representadas por conjuntos numricos, certamente apresentam algum relacionamento entre si, mesmo que casual, embora no tenha sido este o objetivo do ensaio. Na verdade, quando os conjuntos numricos representativos de duas hipteses, por exemplo, mostram forte relao entre si, significa que ambas explicam a mesma parcela da variao dos valores, no sendo possvel identificar o efeito de cada uma destas hipteses na formao dos valores, de forma isolada. Dito de outra forma, como se a relao entre as hipteses estivesse explicando a variao dos valores, no sendo possvel a utilizao do modelo de regresso nas situaes em que esta relao no est respeitada. Exemplificando: rea e testada so hipteses comumente utilizadas para explicar a variao dos valores dos terrenos urbanos no mercado. No entanto, a formao dos centros urbanos, tem origem no fracionamento de grandes propriedades em lotes de dimenses padronizas, onde a rea total dos lotes uma funo de sua testada (frente para via pblica). Este fato resulta em amostras com forte relao entre estas duas hipteses, onde quanto maior a testada, maior a rea dos imveis.

Uma forma simples de identificar o grau de relacionamento entre os conjuntos numricos que representam as hipteses, est justamente na medida do coeficiente de correlao apresentado entre as mesmas. No SISREN, o acionamento do cone correspondente (correlaes), permite a visualizao dos coeficientes de correlao de cada hiptese com todas as demais. A janela visualizada apresenta a primeira hiptese da lista sendo comparada com as demais, com um clique do mouse ou atravs do teclado, o usurio poder analisar todos os relacionamentos entre variveis, tanto isoladamente com em seu conjunto (veja no mdulo ajuda do sistema estes conceitos). A utilizao da equao de regresso para estimao de valores mdios praticados no mercado imobilirio, est restrita aos imveis inseridos nas caractersticas dos dados amostrados, sendo desaconselhvel a extrapolao de qualquer hiptese, sem a perfeita identificao da tendncia da equao aps o limite da hiptese.

20

Amostras com hiptese colineares, apresentam como agravante a este fato, restries de uso para o conjunto das hipteses. Isto quer dizer que, mesmo que o imvel a ser avaliado contenha caractersticas numricas que se inserem no intervalo numrico das hipteses, ele deve apresentar ainda um relacionamento entre as hipteses compatvel com aquele apresentado na amostra. No exemplo formulado, quando a amostra contm uma relao entre rea e testada, onde as grandes reas apresentam grandes testadas e as pequenas reas contam com pequenas testadas, a utilizao da equao de regresso resultante apresentar uma extrapolao desta relao quando o imvel a ser avaliado apresentar uma rea grande e frente pequena, e vice-versa.

ESTIMAO DE VALORES
A anlise cientfica do mercado imobilirio a partir da observao do comportamento apresentado pelas amostras colhidas do mesmo, tem por objetivo a inferncia de valores mdios provveis para qualquer imvel pertencente populao estudada na amostra. No SISREN, a inferncia ou estimao, de valores para imveis pertencentes populao amostrada, est disponvel atravs do mdulo projetar (cone). Neste mdulo, a janela de dilogo solicita a digitao das caractersticas numricas do imvel a ser avaliado, representadas nas hipteses formuladas. Para cada hiptese, o sistema informa os limites numricos na amostra, avisando as extrapolaes a estes limites. Depois de digitados os valores de todas as hipteses, o sistema informa, atravs do boto Projetar, o valor mdio estimado para o imvel na populao, de acordo com a amostra, bem como, o intervalo de confiana para a verdadeira mdia populacional. Este intervalo de confiana calculado com base na estatstica t de Student, com probabilidade de acerto controlada pelo usurio (tabela de opes no lado direito inferior da janela). Juntamente com a informao dos valores mnimo e mximo do intervalo de confiana, esto indicados os desvios relativos destes valores em relao mdia estimada. Desvios elevados indicam estimativas pouco confiveis, muitas vezes decorrentes de extrapolaes de caractersticas individuais ou coletivas nas hipteses. Atravs do boto Grfico, possvel visualizar o comportamento da funo estimativa da mdia e seu intervalo de confiana, em relao cada hiptese individual, bem como verificar a presena de pontos de inflexo da curva resultante do uso da funo, quando for o caso (pontos de mximo e mnimo).

21

6. RELATRIOS E OUTROS RECURSOS Os diversos relatrios disponibilizados, descritos no mdulo de ajuda do sistema, podem ser visualizados sempre que o cone (cone da lupa) estiver habilitado. Outros recursos, tais como a importao e exportao de dados e relatrios para os pacotes Word e Exel, da Microsoft, alm de operaes matemticas entre as diversas variveis ou dados, esto descritos no mdulo de ajuda do sisteam.

7. Anlise de modelo no SisReN - Sistema de Redes Neurais Artificiais

A topologia da rede multicamadas considerada neste software corresponde a uma rede de duas camadas de neurnios, com a seguinte configurao: at 39 entradas (variveis independentes ou explicativas) na camada entrada; (2 N + 1) neurnios na camada escondida (N nmero de entradas) e 1 neurnio na camada de sada (variveis dependente ou explicada). 60.000 dados

tambm considerado que os neurnios possuem entradas de polarizao cada um. As funes de ativao (transferncia do axnio) adotadas so: Linear Sigmide Tangente Hiperblico

A topologia utilizada tem a seguinte configurao:

22

X p0 = 1
h W10

I p0 = 1 net h1 p

o W10

X p1 X pN

W1h N
o WM 0 o WM 1

W1h N
WLh0

h WLN

Dendritos e Axnio Soma e Funo de Ativao do Neurnio- Camada Escondida Soma e Funo de Ativao do Neurnio- Camada de Sada

Fig. I.1 Topologia da rede neural multicamadas

WLh1

net h pL

f Lh ( net h ) pL

I pL

o WML

N : Nmero de Entradas M : Nmero de Sadas e de Neurnios na Camada de sada L : Nmero de Neurnios na Camada Escondida

23

net o pM

h W11

f 1h ( net h1 ) p

I p1

o W11

net o1 p

f 1h (net h1 ) p

Y p1

h f M ( net h ) pM

Y pM

Seja o conjunto de treinamento (dados de entrada e as variveis independentes e dependentes) conforme mostrado abaixo:

Dado

Endereo

Setor Urbano

rea Coef. Aprov. Tipo de Unitrio Via

1 Av. Antnio Carlos,3083 2 Francisco Sales, 149 3 Av. Contorno,1676 4 Av. Pedro II, 690 5 Av. Augusto de Lima,1826 6 Rua Platina,1074 7 Rua Caraa,777 8 Av. Bias Fortes,413 9 Rua do Ouro,637 10 Rua Grafito 11 Rua Oligisto 12 Rua Urbelndia

650

720

1 1,7 1,7 1,7 3 1,7 1,5 3 1,5 1,7 1,7 1,7

3 3 3 3 3 3 2 3 2 1 1 1

200 363 510 394 648 366 300 987 450 237 205 250

700 385 850 431,5 750 355 850 540 750 650 1.000 850 650 580 600 950 350 557 600 530 512 360

Geralmente o maior esforo para o treinamento de uma rede neural encontrase na coleta de dados e no pr-processamento deles. O pr-processamento consiste na normalizao dos dados da entrada e da sada. Para o tipo de rede considerada o nico requisito que os valores das entradas e das sadas se encontrem no intervalo de 0 a 1 por compatibilidade com a funo sigmide, caso a mesma venha a ser utilizada. Os seguintes procedimentos foram adotados para normalizar os dados das entradas associados s suas respectivas sadas, antes de us-los no treinamento da rede neural: Como os valores de 0 e 1 so valores infinitos para a funo sigmide, recomendvel diminuir este intervalo para valores de 0,2 e 0,8 respectivamente, com o objetivo de facilitar a convergncia durante o treinamento da rede. Os dados de entrada e os valores de sada so ento normalizados, sendo definido o domnio dentre os valores colocados acima (0,2 e 0,8).

No SisReN, no mdulo exibir variveis, pode ser verificada a transformao obtida, escolhendo a tela apropriada, conforme indicado na figura a seguir:

24

Pode-se verificar que a normalizao no altera a escala de valores, apenas o domnio onde os dados estaro sendo representados. Uma das condies para obter uma representao neural satisfatria que os dados sejam consistentes e reflitam o fenmeno a ser representado, em nosso caso o mercado imobilirio. A incorporao de subjetividades, fora dos padres de avaliao, pode levar a uma rede neural com polarizao da sua representatividade e falhar na estimativa do valor de venda do imvel. Portanto, para o incio do processo de treinamento, imprescindvel a anlise atravs de todos os recursos grficos e de tabelas (incluindo a anlise de regresso linear e inferncia estatstica paramtrica) que o software dispe, para eliminar variveis inconsistentes e/ou dados inconsistentes. Outra condio a ser considerada em relao quantidade de conjuntos e ao nmero de dados de cada um a serem coletados. A quantidade dos conjuntos no mais importante que a qualidade dos mesmos. A nica condio que o nmero de conjuntos e os dados de cada um contenham os dados representativos do problema. Uma condio para estabelecer a qualidade dos conjuntos que estes no sejam extremamente dispersos. Se for considerado um conjunto muito distante dos outros conjuntos a rede neural, pode-se refletir num maior tempo computacional gasto para que a rede aprenda a associar os conjuntos.

25

Caso exista uma falha na qualidade dos conjuntos de treinamento, tambm haver uma dificuldade para representar aqueles valores mal condicionados. De forma geral, a quantidade necessria de dados e variveis para o processamento de RNA pode ser fixada em funo da mesma quantidade a ser utilizada pela Regresso Linear, no caso do mercado imobilirio. importante ressaltar que quando os dados apresentarem uma distribuio uniforme e no-linear, uma aproximao linear para esses conjuntos pode trazer resduos significantes o que pode levar a estimativas falsas do valor do imvel sendo avaliado. O objetivo deste software a representao dessa distribuio atravs de redes neurais artificiais. Aps anlise da regresso linear, dispensando dados e variveis inconsistentes, pode ter incio o processo de treinamento da rede neural. As opes de treinamento so as disponibilizadas na seguinte caixa de dilogo:

Se os dados apresentarem no pr processamento um comportamento linear, ento a funo de ativao mais apropriada a linear. Caso contrrio, existem as outras funes que permitem descrever o comportamento de mercado atravs de modelo no linear. A seguinte tabela pode ser utilizada como ponto de partida: Funo Taxa de Aprendizagem 0,05 0,5 0,05 Tolerncia Mxima 0,01 0,001 0,001 Neurnios na camada escondida 2N+1 2N+1 2N+1

Linear Sigmide Tangente Hiperblico

26

O grfico que ser apresentado a seguir ir ajudar no monitoramento do processo de treinamento, devendo este ser interrompido quando no houver mais alterao no erro quadrtico calculado. A figura a seguir ilustra este comportamento:

Aps o treinamento, deve ser verificada o poder de predio do modelo, bem como o comportamento de cada varivel independente (entrada) com a varivel independente (de sada), para verificar o ajuste dos dados ao modelo escolhido. importante ressaltar que as redes neurais devem ter o seu treinamento interrompido quando ainda possuiu uma boa capacidade de generalizao, e no somente quando a aderncia obtida for a mxima, pois a rede, nesta situao, est apenas decorando o comportamento da amostra colhida e perde o poder de predio. Nos grficos abaixo, obtidos atravs do SisReN, podemos verificar a aderncia e o comportamento das variveis (mdulo de aderncia e testa da equao):

Valores Calculados e Observados 1.000 900 800 700 600 500 400 300 200 1 2 3 4 5 6 7 8 9 10 11 12

27

Projeo p/rea
430 600 420 410 400 390 380 370 400 500 600 700 800 900 600 550 500 450 400 350 300

Projeo p/Setor

700

800

900

1.000

Projeo p/Aproveitamento
425 420 415 410 405 400 395 390 385 1 2 3 1

Projeo p/Via

600 550 500 450 400 350 300 250

Por ltima, deve ser verificada a estimativa de valores para imveis que tenham sido separados da amostra inicial. No mdulo de projeo de valores temos os resultados obtidos, conforme abaixo ilustrado:

28

Concluses e perspectivas futuras: Para que a RNA possa ser definitivamente utilizada na Engenharia de Avaliaes, no estgio atual de estudos, fundamental que os pressupostos bsicos relacionadas no anexo A do projeto de Norma 14653-2 sejam atendidos. Porm, alguns destes pressupostos somente podem ser alcanados ainda se utilizados os modelos de regresso linear. Cabe ressaltar que a modelagem atravs de redes neurais tem apresentado muitos avanos, principalmente quanto validao estatstica de seus resultados, o que nos leva a acreditar que em um futuro prximo este estudo estar completo. A proposta final deste software enfatiza a necessidade da utilizao paralela de um sistema computacional onde seja possvel estimarmos o valor de mercado atravs da RNA e da Regresso Linear Mltipla, a fim de estabelecermos intervalos de confiana para os resultados obtidos pelo mtodo dos mnimos quadrados. Se for verificado que os valores estimados pela RNA esto dentro deste intervalo, porm mais aderentes aos dados, ento a concluso pelo valor deve ser a favor da RNA, e justificado no laudo descritivo.

29

Você também pode gostar