Você está na página 1de 127

VALDIR ALVES

AVALIAO DE IMVEIS URBANOS BASEADA EM MTODOS ESTATSTICOS MULTIVARIADOS

CAMPO MOURO 2005

VALDIR ALVES

AVALIAO DE IMVEIS URBANOS BASEADA EM MTODOS ESTATSTICOS MULTIVARIADOS

Dissertao apresentada como requisito parcial obteno do grau de Mestre em Cincias, Curso de Ps-Graduao em Mtodos Numricos em Engenharia, rea de Concentrao em Programao Matemtica, Setor de Cincias Exatas e Setor de Tecnologia, Universidade Federal do Paran. Orientao: Prof. Dr. Anselmo Chaves Neto.

CAMPO MOURO 2005

DEDICATRIA

Senhor, que as pessoas se amem se respeitem e que busquem a paz.

ii

AGRADECIMENTOS

minha famlia, pelo apoio e compreenso, em especial minha esposa Ldia e aos meus filhos Ana Carolina e Andr Felipe. A todos os alunos do curso pelo apoio e amizade e em especial aos colegas Amauri, Douglas, Flvia e Silvia pela ajuda. Aos professores do curso e em especial professora Neida pelas primeiras orientaes. Ao meu orientador, prof. Anselmo, que apoiou o desenvolvimento do trabalho e ofereceu todas as contribuies necessrias para sua realizao. A todos que direta ou indiretamente contriburam para a realizao deste trabalho.

iii

SUMRIO

LISTA DE FIGURAS ........................................................................................................... vii LISTA DE QUADROS ........................................................................................................ viii LISTA DE TABELAS ........................................................................................................... ix RESUMO ................................................................................................................................. x ABSTRACT ........................................................................................................................... xi 1 INTRODUO ..................................................................................................................01 1.1 TEMA DO ESTUDO ........................................................................................................01 1.2 OBJETIVOS ......................................................................................................................03 1.2.1 Objetivo Geral ..............................................................................................................03 1.2.2 Objetivos Especficos ....................................................................................................04 1.3 IMPORTNCIA DO TRABALHO ..................................................................................04 1.4 ESTRUTURA DO TRABALHO ......................................................................................05 2 REVISO DE LITERATURA ..........................................................................................06 2.1 INTRODUO .................................................................................................................06 2.2 ENGENHARIA DE AVALIAO ..................................................................................06 2.2.1 Introduo .....................................................................................................................06 2.2.2 Normas Tcnicas ...........................................................................................................07 2.2.3 Avaliao de Imveis Urbanos ....................................................................................07 2.2.3.1 Avaliao ....................................................................................................................08 2.2.3.2 Valor ...........................................................................................................................08 2.2.4 Classificao dos Imveis Urbanos .............................................................................10 2.2.5 O Mercado .....................................................................................................................11 2.2.5.1 Mercado Imobilirio .................................................................................................11 2.2.6 Caractersticas dos Imveis .........................................................................................14 2.2.7 Mtodos de Avaliao ...................................................................................................14 2.2.8 Nvel de Preciso da Avaliao ....................................................................................17 2.3 ANLISE MULTIVARIADA ..........................................................................................18 2.3.1 Introduo .....................................................................................................................18 2.3.2 Estatsticas Descritivas Multivariadas ........................................................................21 2.3.3 Mtodos Multivariados ................................................................................................23 2.3.3.1 Anlise de Componentes Principais .........................................................................24
iv

2.3.3.2 Anlise de Agrupamento (Clusters Analysis) ..........................................................28 2.3.3.3 Discriminao, Classificao e Reconhecimento de Padres ................................31 2.3.3.4 Avaliao de Funes de Reconhecimento e Classificao ....................................38 2.4 ANLISE DE REGRESSO LINEAR ............................................................................40 2.4.1 Introduo .....................................................................................................................40 2.4.2 Modelo Linear Geral de Regresso .............................................................................41 2.4.3 Anlise da Varincia da Regresso .............................................................................42 2.4.4 Verificao dos Pressupostos do Modelo ....................................................................43 2.4.5 Poder de Explicao do Modelo ..................................................................................46 2.4.6 Relao entre Variveis ...............................................................................................46 2.4.7 Seleo de Variveis Regressoras ................................................................................48 3 MATERIAL E MTODO .................................................................................................51 3.1 MATERIAL ......................................................................................................................51 3.1.1 rea de Estudo ..............................................................................................................51 3.1.2 Limitao da Pesquisa ..................................................................................................53 3.1.3 Levantamento dos Dados .............................................................................................54 3.1.3.1 As Variveis Utilizadas .............................................................................................54 3.1.3.2 Amostra ......................................................................................................................57 3.2 METODOLOGIA DE DESENVOLVIMENTO DA PESQUISA ....................................57 3.2.1 Consideraes para a Construo do Modelo ............................................................58 3.2.1.1 Identificao das Variveis Independentes .............................................................58 3.2.1.2 Transformaes de Variveis ...................................................................................59 3.2.1.3 Anlise Exploratria .................................................................................................60 3.2.1.4 Anlise dos Resduos .................................................................................................60 3.2.1.5 Verificao da Adequao do Modelo .....................................................................60 3.3 ESTUDO DE CASO .........................................................................................................61 4 APLICATIVO AMI DESENVOLVIDO ..........................................................................62 4.1 ALGORITMO DO PROGRAMA AMI ............................................................................62 4.2 AVALIAO DO AMI ....................................................................................................66 4.3 DESCRIO DO PROGRAMA AMI .............................................................................67 4.4 COMPARAO DOS RESULTADOS ENTRE O PROGRAMA STATGRAPHICS E O AMI .........................................................................................................................................75 4.4.1 Resumo dos Resultados para Apartamentos .............................................................77
v

4.4.2 Resumo dos Resultados para Casas ............................................................................78 4.4.3 Resumo dos Resultados para Terrenos ......................................................................80 5 CONSIDERAES FINAIS .............................................................................................82 5.1 CONCLUSES .................................................................................................................82 5.2 SUGESTES PARA FUTURAS PESQUISAS ...............................................................84 REFERNCIAS BIBLIOGRFICAS ................................................................................85 APNDICES ..........................................................................................................................87

vi

LISTA DE FIGURAS

Figura 2.1: Representao da estrutura de componentes principais ............................................24 Figura 2.2: Matriz de confuso ............................................................................................. 39 Figura 3.1: Mapa com a localizao de Campo Mouro ....................................................... 52 Figura 3.2: Mapa dos municpios vizinhos Campo Mouro .............................................. 53 Figura 4.1: Diagrama de fluxo do programa AMI ................................................................ 65 Figura 4.2: Entrada de dados usando um arquivo do Excel .................................................. 67 Figura 4.3: Mostrando os tipos de opes de clculo para a regresso ................................. 67 Figura 4.4: Com a opo 1 mostrando os tipos de distncia e ligaes ................................ 68 Figura 4.5: Dendrograma apresentado para a escolha de nmero de grupos ........................ 68 Figura 4.6: Grupos formados ................................................................................................ 69 Figura 4.7: Processo 2: anlise de Componentes Principais para o grupo 1 ......................... 69 Figura 4.8: Perguntando o nmero de componentes e o processo de regresso ................... 70 Figura 4.9: Calculando o valor da observao do 45 apartamento ...................................... 71 Figura 4.10: Estimando o valor da ltima observao .......................................................... 71 Figura 4.11: Analisando os apartamentos por Anlise Fatorial ............................................ 72 Figura 4.12: AMI perguntando o nmero de fatores ............................................................. 72 Figura 4.13: Regresso com Anlise Fatorial ....................................................................... 73 Figura 4.14: Regresso considerando todas as variveis ...................................................... 74 Figura 4.15: Resultados da regresso .................................................................................... 74

vii

LISTA DE QUADROS

Quadro 2.1: Anlise de Varincia (ANOVA) ....................................................................... 43 Quadro 3.1: Variveis independentes para apartamento ....................................................... 55 Quadro 3.2: Variveis independentes para casas residenciais .............................................. 56 Quadro 3.3: Variveis independentes para terrenos .............................................................. 57

viii

10

LISTA DE TABELAS

Tabela 4.1: Comparao dos valores estimados pelas 3 opes ............................................75 Tabela 4.2: Comparao dos valores estimados pelas 3 opes ............................................80 Tabela 4.3: Comparao dos valores estimados pelas 3 opes ............................................81

ix

11

RESUMO

Neste trabalho so mostrados conceitos de Estatstica Multivariada e tambm apresenta um programa computacional denominado AMI (Anlise Multivariada de Imveis), em MATLAB. Tal programa tem por finalidade avaliar imveis urbanos considerando cada imvel como um vetor de caractersticas aleatrias e construo de um modelo estatstico que estima o valor de um novo imvel de maneira automtica, evitando subjetividades de avaliadores. O programa oferece ao usurio trs opes de regresso: 1) Anlise de Agrupamento (Clusters Analysis) e Componentes Principais aplicadas s caractersticas dos imveis para obteno de classes homogneas, tambm oferece 5 (cinco) tipos de distncias e 4 (quatro) tipos de ligaes (oferecendo a melhor opo de ligao conforme o ndice cofentico) e essas variveis foram reduzidas e transformadas de modo a evitar problemas de multicolinearidade, comuns a esse tipo de dados. Assim, as novas variveis foram utilizadas para a determinao dos modelos de Regresso Linear Mltipla de cada classe ou grupo homogneo de itens e para cada tipo de imveis (apartamento, casa e terreno). 2) Anlise Fatorial que explica as correlaes entre as variveis originais em termos de um conjunto de poucas variveis no observveis, faz a rotao dos fatores (Varimax) para evitar a multicolinearidade. 3) Regresso mltipla simples trabalha com todas as variveis, sem nenhum tratamento. Essa opo no confivel, pois os dados no sofreram nenhum tratamento para evitar problemas de multicolinearidade. As trs opes apresentam a funo de regresso, os parmetros estatsticos (R2, F e p) e o valor estimado para um novo imvel. O programa computacional desenvolvido, bem como sua proposta de avaliao, foi aplicado a um conjunto de dados oriundos da pesquisa realizada por Silvia Neide Brulio (2004), referentes a 44 apartamentos, 51 casas e 24 terrenos da cidade de Campo Mouro PR, podendo ser aplicado em outras localidades e tambm a outros produtos que necessitem de avaliao. O modelo de cada classe dos trs tipos de imveis avaliados apresentou um bom ajuste aos dados e uma boa capacidade preditiva, atendendo todas as suposies tericas de regresso linear mltipla.

Palavras-chave: avaliao de imveis, regresso linear mltipla, anlise de agrupamento, anlise fatorial.

12

ABSTRACT

In this work concepts of Multivariate Statistics are shown and it also presents a computational program denominated MAI (Multivariate Analyses of Immobiles), in MATLAB .That program has the purpose to evaluate immobile urban considering each immobile one as a vector of aleatory characteristics and construction of a statistical model that esteems the value of a new property in an automatic way, avoiding appraisers' subjectivities. The program offers to the user three regression options: 1) Clusters Analysis and Main Components applied to the characteristics of the properties for obtaining of homogeneous classes, it also offers 5 (five) types of distances and 4 (four) types of connections (offering the best connection option according to the cophenet index) and those variables were reduced and transformed in way to avoid multicolinearity problems, common to that type of data. Like this, the new variables were used for the determination of the models of Multiple Linear Regression of each class or homogeneous group of items and for each type of properties (apartment marries and land). 2) Factorial Analysis that explains the correlations among the original variables in terms of a group of little you varied you didn't observe, it makes the rotation of the factors (Varimax) to avoid the multicolinearity. 3) Simple Multiple Regression uses all the variables, without any treatment. That option is not reliable, because the data didn't suffer any treatment to avoid multicolinearity problems. The three options present the regression function, the statistical parameters (R 2 , F and p) and the esteem value for a new one immobile. The program developed for computer, as well as your evaluation proposal, the was applied a group of data originating from of the research accomplished by Silvia Neide Brulio (2004), referring to 44 apartments, 51 houses and 24 lands of Campo Mouro's city - PR, it could be applied at other places and also the other products that need evaluation. The model of each class of the three types of appraised properties presented a good adjustment to the data and a good capacity predictable, assisting all the theoretical suppositions of multiple linear regression.

Word-key: evaluation of properties, multiple linear regression, clusters analysis, factorial analysis.

xi

1 INTRODUO

1.1 TEMA DO ESTUDO

A avaliao de imveis, urbanos e rurais, utilizada na grande maioria dos negcios, discusses e pendncias interpessoais e sociais em toda e qualquer comunidade. Ocorre em geral na compra ou na venda de casas, lojas comerciais, instalaes industriais, aluguis, na reavaliao de ativos de empresas, em atendimento legislao vigente, na partilha oriunda de heranas, meaes ou divrcios, no lanamento de impostos, nas hipotecas imobilirias, nas divergncias que originam aes demarcatrias, possessrias, nas indenizaes, nas desapropriaes e servides, enfim, em um nmero expressivo de aes oriundas de problemas inerentes aos relacionamentos humanos, onde o valor de um bem assume importncia fundamental. Toda vez que uma empresa necessita de um emprstimo para investimento na construo de instalaes ou capital de giro recorre a bancos de desenvolvimento. E esses bancos atendem a essas solicitaes desde que o solicitante apresente garantias reais. Entendese por garantias reais imveis ou mquinas e equipamentos. Sendo assim, toda vez que se faz um investimento com apoio em bancos de desenvolvimento h necessidade de emisso de um laudo de avaliao do imvel, mquina ou equipamento. Neste trabalho ser estudado o caso de avaliao de imveis urbanos. Apesar do conceito de valor ser de difcil definio, sujeito e suscetvel s mudanas filosficas, tornam-se importante no relacionamento humano e social adotar critrios para que se exera um carter de justia em sua aplicao prtica. Assim, um trabalho de avaliao imobiliria constitui-se de uma seqncia de operaes que resultam no que poderia ser chamado de uma formao de juzo sobre o valor de um imvel ou um direito sobre ele. A norma brasileira NBR5676 (ABNT, 1989) trabalha com o conceito de que o valor aquele fornecido para um dado instante, nico, no importando qual a finalidade da avaliao. Esse valor corresponde ao preo que se definiria, para um determinado imvel, em um mercado de concorrncia perfeito, sujeito s seguintes premissas:

a) Homogeneidade dos bens levados a mercado; b) Nmeros elevados de compradores e vendedores (o mercado no pode por eles ser alterado); c) Sem influncia externa; d) Conhecimento pleno e absoluto sobre o mercado, sobre os bens e das tendncias de avaliao por parte dos compradores e vendedores; e) Vendedores e compradores oferecendo liquidez com liberdade plena de entrada e sada do mercado. A partir destas consideraes, pode-se afirmar que a avaliao passa a ser uma determinao tcnica do valor ou de um direito sobre o imvel. Dentre outros fatores deve-se levar em conta que o valor de um bem est diretamente ligado sua capacidade de produzir renda, sua utilizao potencial, o atendimento de uma necessidade ou a sua raridade. Os imveis urbanos podem ser definidos como bens que no so mveis, localizados nas cidades, geralmente classificados como glebas urbanizveis, reas ou lotes e terrenos com benfeitorias (casas, prdios residenciais, prdios comerciais, galpes e outros). A NBR 5676-ABNT (1989) define como sendo uma gleba urbanizvel, uma grande extenso de terreno passvel de receber obras e infraestruturas urbanas, por sua localizao, seus aspectos fsicos, sua destinao legal e pela existncia de um mercado comprador. Entretanto, em grande parte dos mercados imobilirios, a base de clculos que estima os valores dos imveis, seja para a venda ou para clculo de impostos, feita de forma subjetiva, ou seja, sem nenhum procedimento cientfico. Assim, neste trabalho desenvolveu-se um programa computacional que, a partir das caractersticas particulares dos imveis, estima o seu valor de forma objetiva e dentro da realidade de mercado. Nesse sentido, as caractersticas e os atributos dos imveis constituem os dados pesquisados e que exercem influncia na formao do valor. Estes dados devem ser tratados por inferncia estatstica, respeitados os nveis de rigor definidos por norma tcnica, e transformados em informao de mercado. O nvel de rigor corresponde preciso do trabalho e ser tanto maior quanto menor for a subjetividade contida na avaliao. O rigor de uma avaliao est condicionado

pesquisa efetivada, confiabilidade dos dados coletados e qualidade do modelo aplicado no processo de avaliao. A norma NBR 5676 classifica o trabalho nos seguintes nveis: expedito, normal, rigoroso ou rigoroso especial. As variveis utilizadas na inferncia estatstica merecem destaque e, para cada tipo de problema devem ser classificadas, estudadas e aceitas atravs de trabalho estatstico. Assim, por exemplo, para se avaliar um lote urbano devem-se levar em conta algumas variveis tais como: a dimenso de testada, a profundidade, a rea total, a localizao, o uso do solo, as posturas municipais, o zoneamento urbano, as distncias a plos que os valorizem ou os desvalorizem, a taxa de ocupao, a topografia, a suscetibilidade a enchentes ou a danos ambientais, o padro de construes na vizinhana, a infra-estrutura urbana, a paisagem visual a partir do imvel. Estas e outras variveis permitem ao final a determinao do valor unitrio do terreno pesquisado com relao sua rea total. Estas variveis devem ser ponderadas para que conceitos estatsticos possam ser aplicados com vistas determinao do melhor modelo de ajuste. Embora muitas publicaes tratem deste assunto, poucas do um tratamento matemtico rigoroso ao problema, e dificilmente empregam mtodos estatsticos multivariados. importante salientar que no tpico referente deteco dos erros grosseiros, trabalham somente com critrios prticos, no aplicando testes estatsticos. Assim, visando dar um tratamento mais adequado a este tipo de erro est sendo proposta, no presente trabalho, a aplicao dos mtodos estatsticos multivariados juntamente com o programa computacional desenvolvido no Software Matlab 7.0.

1.2 OBJETIVOS

1.2.1 Objetivo Geral Desenvolver um programa computacional que avalie imveis urbanos utilizando estatsticas multivariadas e considerando cada imvel como um vetor de caractersticas aleatrias.

1.2.2 Objetivos Especficos O objetivo geral pode ser atingido desde que se alcancem os seguintes objetivos especficos: 1. Elaborar uma rotina de programa que construa classes homogneas das particularidades de cada tipo de imvel. 2. Elaborar uma rotina para reduzir o nmero de variveis a serem analisadas e que facilite a interpretao, sem grande prejuzo de informaes. 3. 4. Construir modelos de regresso mltipla. Interpretar os resultados obtidos.

1.3 IMPORTNCIA DO TRABALHO

Uma considervel parcela de bens pblicos, de pessoas fsicas ou jurdicas, consiste de bens imveis. A amplitude desse recurso primordial da sociedade cria a necessidade de informes avaliatrios como suporte para tomadas de decises referentes ao uso e disposies desses bens (Abunahman, 1998 citado por Brulio, 2005). Imveis so dados como garantias reais em emprstimos junto s instituies financeiras. A necessidade de estabelecer valor uma das atividades mais freqentes do homem moderno, sendo os imveis um de seus bens mais valorizados. Ento, a avaliao de imveis importante nas operaes de compra e venda locaes, garantias de financiamentos, aplices de seguro, instalaes comerciais e industriais, cobrana de impostos, ou seja, atividades cotidianas inerentes ao relacionamento humano. O valor de um imvel pode ser subjetivo dependendo das circunstncias e modo de avaliao. Por outro lado, o valor de um imvel dado pela soma dos valores da edificao e pelo valor do terreno, que depende da sua localizao. No entanto, o valor de um bem no pode ser confundido com o preo do bem, que representa a quantidade de dinheiro paga pelo mesmo, o que depende da lei da oferta e da procura.

Nesse sentido, houve, portanto, a necessidade de se desenvolver um programa computacional que torne mais precisas as formas de avaliao de um imvel, aproximando ao mximo de seu valor de mercado, haja vista que em Campo Mouro (local do presente estudo), assim como em outras cidades, essas avaliaes so feitas de forma subjetiva e esse trabalho visou facilitar e melhorar a qualidade das avaliaes. Isso pode se dar com o uso adequado do programa no tratamento das caractersticas desses imveis atravs da inferncia estatstica, da regresso mltipla e das tcnicas de Anlise Multivariada.

1.4 ESTRUTURA DO TRABALHO

Com o objetivo de facilitar o entendimento do leitor, de forma clara e objetiva, esta pesquisa est estruturada de tal maneira que no primeiro captulo encontram-se os objetivos e o verdadeiro significado da escolha do tema. No segundo captulo tem-se uma reviso de literatura envolvendo a teoria sobre a avaliao de imveis, sua normatizao e os conceitos matemticos acerca da Anlise Multivariada, que sustenta todo o desenvolvimento do programa computacional. O programa computacional desenvolvido, bem como sua implementao, se encontra no terceiro captulo. O quarto captulo apresenta, de forma detalhada, os resultados da utilizao do programa em relao a dados reais e a anlise de todo o procedimento estatstico utilizado. E finalmente, as concluses com base no estudo realizado e sugestes para trabalhos futuros so encontradas no quinto captulo.

2 REVISO DE LITERATURA

2.1 INTRODUO

O principal objetivo desse captulo apresentar, numa linguagem simples, um texto sobre avaliao de imveis, dando informaes sobre programao e estatstica multivariada, suficientes para o entendimento do modelo estatstico proposto.

2.2 ENGENHARIA DE AVALIAO

2.2.1 Introduo Os primeiros estudos sobre avaliao de imveis no Brasil datam de 1918, e j em 1923 foram introduzidos novos mtodos de avaliao de terrenos, que a partir de 1929 comearam a ser sistematicamente aplicados. A partir da a engenharia de avaliao no Brasil tomou corpo e continua crescendo e evoluindo nas tcnicas de avaliao. Atualmente um grande nmero de profissionais desenvolve estudos nesse campo, visando dar ao tema o suporte cientfico necessrio aos mtodos tcnicos at ento utilizados (Fiker, 1997). Para Dantas (1998), a Engenharia de Avaliaes uma especialidade da engenharia que rene um conjunto amplo de conhecimentos na rea de engenharia e arquitetura, bem como em outras reas das cincias sociais, exatas e da natureza. Ela tem com o objetivo determinar tecnicamente o valor de um bem, de seus direitos, frutos e custos de reproduo. As Avaliaes so de grande interesse para o mercado imobilirio, tais como: bancos de crdito imobilirio, compradores e vendedores de imveis, prefeituras, empresas seguradoras, etc. A Engenharia de Avaliaes pode ser praticada por engenheiros, arquitetos e agrnomos, cada um atuando em sua habilitao profissional, conforme normas e regulamentos do CREA, CONFEA, ABNT, leis municipais, estaduais e federais.

2.2.2 Normas Tcnicas A ABNT - Associao Brasileira de Normas Tcnicas o Frum Nacional de Normalizao. As Normas Brasileiras, cujos contedos so de responsabilidade dos Comits Brasileiros (ABNT/CB) e dos Organismos de Normalizao Setorial (ABNT/ONS) e das Comisses de Estudos Especiais Temporrios (ABNT/CEET), so elaboradas por Comisses de Estudo (CE), formadas por representantes dos setores envolvidos, delas fazendo parte: produtores, consumidores e neutros (universidades, laboratrios e outros) (ABNT NBR 14653-2, 2004). Em meados de 1950 surgiram as primeiras normas de avaliao de imveis organizadas por entidades pblicas e institutos. Devido ocorrncia de grande quantidade de desapropriaes em So Paulo, ocasionado pela expanso da cidade e construo do metr na dcada de 1960, as normas ganharam maior relevncia. Porm, o primeiro anteprojeto de normas da ABNT na Engenharia de Avaliao data de 1957. Em 1977, estudos feitos por comisses de profissionais dedicados s percias e avaliaes judiciais, em essncia, deram origem primeira Norma Brasileira para Avaliao de Imveis Urbanos, a NB-502/77 da ABNT (Dantas, 1998). Depois de passar por uma reviso em 1989, a Norma Brasileira para Avaliao de Imveis Urbanos foi registrada no INMETRO como NBR 5676. Os nveis de preciso foram transformados em nveis de rigor. Segue-se a ela a Norma para Avaliao de Servides. Alguns institutos, com base na NBR 5676, produziram, paralelamente, normas especficas de forma mais detalhada observando as caractersticas de cada regio. Atualmente existe uma proposta levada ABNT para sintetizar o tema de Engenharia de Avaliaes em uma norma nica. Trata-se da Norma para Avaliao de Bens, formada por uma parte principal, contendo os conceitos, mtodos e definies comuns a todos os bens e, nos apndices, a parte especfica para cada tipologia de bem a avaliar. 2.2.3 Avaliao de Imveis Urbanos Alguns conceitos pertinentes tcnica de avaliar so apresentados a seguir.

2.2.3.1 Avaliao A Norma NB-502/89 (NBR-5676) da ABNT, de avaliao de imveis urbanos, define avaliao como a determinao tcnica do valor de um imvel ou de um direito sobre o imvel. A avaliao de imveis a definio tcnica do valor de mercado dos bens ou de direitos sobre eles. Esta definio feita dentro de procedimentos tcnicos para a realizao das anlises de valor. Segundo Moreira (1994), avaliar a arte de estimar valores apropriados e especficos, em que o conhecimento tcnico e o bom-senso so condies fundamentais. Abunahman (1998) define avaliao como sendo uma aferio de vrios fatores econmicos definidos em relao a propriedades descritas com data prevista, tendo como base a anlise de dados relevantes. 2.2.3.2 Valor Desde sua origem, o homem busca estabelecer preos para os bens, tais que satisfaam sua noo de valor numa transao e de maneira que se efetivem trocas, sejam elas diretas como o escambo ou indiretas como a moeda. O conceito de valor de um bem, de modo geral, intuitivo e subjetivo, quer seja vendedor ou comprador deste bem, podendo variar entre os participantes de um mercado. No entanto, o preo uma caracterstica que representa a quantidade de dinheiro paga pelo bem. Segundo Brulio (2005), muitas medidas de valor podem estar relacionadas a um bem, dentre elas o custo de produo, ao qual so agregados outros custos como matriaprima, estocagem e comercializao desde o produtor at o produto final onde ser formado o preo e o valor de mercado, no havendo necessariamente uma relao matemtica entre eles. No entanto, em mercados que se aproximam daquele de concorrncia perfeita, os preos so estabelecidos pela lei da oferta e procura independentemente dos custos de produo. Em vista disso, no mercado considerado, o valor do bem poder no apresentar nenhuma relao com os custos citados (podendo mesmo ser inferior). Quando o mercado permanece estvel por um longo perodo, o preo e a quantidade acabam sendo negociados atravs da oferta e procura. Toda a subjetividade e intuio que leva os participantes do mercado a tentar suprir sua satisfao, tornam-se, portanto em

quantidades vendidas e ofertadas e seus respectivos preos. Logo, o preo estabelecido pelo mercado considerado uma representao justa do valor do bem analisado. Nos mercados onde so efetuadas trocas indiretas, os preos (valores) so expressos em moeda corrente, podendo ser transformados em outras moedas. As avaliaes pelo valor de mercado podem ser consideradas instantneas, ou seja, so vlidas, apenas, por um intervalo curto de tempo. Encontram-se vrias definies e interpretaes e que so suscetveis a mudanas sobre os conceitos de valor, valor de mercado e preo. No entanto, torna-se importante determinar alguns critrios para sua aplicao prtica. Assim, um trabalho de avaliao imobiliria constitui-se de uma srie de operaes e etapas at que se chegue a uma definio de valor. Dentre os diversos conceitos de valor, a Norma NB-502/89 (NBR-5676) da ABNT, de Avaliao de Imveis Urbanos, define valor como sendo aquele fornecido para um bem em um dado instante, nico, no importando qual a finalidade da avaliao. Esse valor corresponde ao valor real que se definiria em um mercado de concorrncia perfeita caracterizado pelos seguintes silogismos: a) Igualdade dos bens levados ao mercado; b) Nmero elevado de compradores e vendedores, no sendo o mercado alterado por eles; c) Sem influncias externas; d) Conhecimento pleno e absoluto entre os participantes sobre o bem, o mercado e as tendncias deste; e) Os participantes oferecendo liquidez com plena liberdade de entrada e sada do mercado. Existem casos onde a necessidade de estimar um valor acontece a nvel particular. Assim, as partes envolvidas vendedor e comprador do bem, chegam ao comum acordo da quantidade necessria (moedas) em um determinado instante (Molina, 1999). Porm, quando ocorre a necessidade da determinao do valor, de uma maneira mais ampla, isto , sem ser a nvel particular, portanto ampliado a outras pessoas alm dos diretamente envolvidos na transao de ordem privada ou pblica, procura-se uma perspectiva tcnica. Surge, ento, a

10

Cincia da Avaliao, ou seja, a Engenharia de Avaliaes, que infere sobre o valor de um bem de forma fundamentada. Segundo Barbosa Filho (1998) o valor de um bem antes de tudo um fenmeno social e pode estar associado a um vetor composto por um conjunto de variveis que abrange todas as suas caractersticas fsicas, do seu entorno, da sua utilidade e dos fatores subjetivos que a prpria coletividade cria no contexto em que est situado a cada instante. Moreira (1994) afirma que valor empregado costumeiramente em diversos sentidos. No entanto, quando aplicado relativamente propriedade, a palavra valor demonstra um sentido de posse, domnio ou troca de propriedade, medida em termos de uma unidade monetria. Fiker (1997) afirma que valor a relao entre a intensidade das necessidades econmicas do homem e a quantidade de bens disponveis para satisfaz-las, sendo determinado dependendo da oferta e da demanda do bem. Atualmente o valor de mercado de um imvel atribudo pelo preo fixado pelo vendedor e comprador. Assim, no so forados e no esto sujeitos a presses anormais tendo pleno conhecimento das condies de compra e venda e de como este imvel deve ser e ser utilizado. Contudo, o mercado imobilirio no , por natureza, de concorrncia perfeita. Dessa forma, estima-se o preo mdio de mercado, atravs de uma amostragem de preos que trazem todas as imperfeies deste mercado. 2.2.4 Classificao dos Imveis Urbanos De acordo com a Norma NB-502/89 (NBR-5676) da ABNT, os imveis so classificados em: a) Quanto ao uso O imvel urbano pode ser: residencial, comercial, industrial, institucional e misto. b) Quanto ao tipo do imvel O imvel urbano pode ser: terreno (lote ou gleba), apartamento, casa, escritrio (sala ou andar corrido), loja, galpo, vaga de garagem, misto, hotis, hospitais, cinemas e teatros, clubes e recreativos.

11

c) Quanto ao agrupamento Os imveis urbanos se agrupam da seguinte forma: loteamento, condomnio de casas, prdio de apartamentos, conjunto habitacional (casas, prdios ou mistos), conjunto de salas comerciais, prdio comercial, conjunto de prdios comerciais, conjunto de unidades comerciais, shopping-centers e complexo industrial. Este trabalho utilizou dados correspondentes apenas aos imveis dos tipos: apartamentos, casas residenciais e terrenos. 2.2.5 O Mercado Entende-se por mercado o local onde so efetuadas as transaes comerciais envolvendo troca de bens, tangveis ou intangveis, ou direitos sobre os mesmos. Neste sentido, o termo mercado refere-se quele de concorrncia perfeita e contendo, em geral, as caractersticas dos bens. Os participantes do mercado o fazem voluntariamente e tm conhecimento pleno das condies em vigor; nenhum participante, sozinho, capaz de alterar as condies estabelecidas; cada transao feita de maneira independente das demais; o nmero de ofertas e/ou transaes suficientemente grande, de maneira que a retirada de uma amostra no afeta o mercado. 2.2.5.1 Mercado Imobilirio Para Moscovitch (1997), o mercado imobilirio a jurisdio de determinao dos preos de imveis urbanos que, como quaisquer outras mercadorias, passam pela medida da oferta e da demanda. De acordo com Dantas (1998), ele formado por trs seces: a) a dos imveis a serem vendidos; b) a das partes que desejam vend-los (vendedores); c) a das partes interessadas em adquiri-los (compradores). O mercado imobilirio pode ser subdivido ainda, em vrias especialidades, tais como a de apartamentos, de casas e de terrenos que foram especificamente analisadas neste trabalho.

12

Cada mercado tem seu prprio comportamento e suas caractersticas especficas. No entanto, existem inmeras divergncias e desigualdades entre os imveis, que faz o mercado imobilirio comportar-se de forma acentuadamente diferente de outros mercados de bens, devido s caractersticas especiais dos imveis. Por sua localizao fixa, qualquer alterao no ambiente provoca modificaes no valor do imvel. Como as influncias no so anlogas, as variaes provocadas so claramente notveis, causando progressivamente as diferenas. Por outro lado, como todo bem econmico, a escassez relativa lei da oferta e procura define o preo dos imveis. Os governos e as economias globais so grandes influenciadores sobre o preo dos imveis. E, por sua importncia e significado social, as leis propiciam tratamentos especiais. Dentro do mercado onde ocorrem as transaes imobilirias, identificam-se alguns fenmenos como o dinamismo da atividade imobiliria e o processo de estruturao interna das reas urbanas. Existem, tambm, influncias externas, que alteram continuamente os valores e usos do solo. O estudo de todos estes fatores constitui o processo de formao de valores, ou seja, como os valores dos imveis so compostos. Esses valores muitas vezes sofrem transformaes como condies de mercado e tambm valores que so praticados, devido falta de ordenao entre empreendedores, intermedirios, poder pblico e tambm a prpria populao. Por se tratar de bens econmicos, todas as mudanas que causam maior ou menor disponibilidade refletem em modificaes, alteraes de valor. Sabe-se que muitas alteraes como a oferta de crdito, a inflao, a conduo da economia, as polticas fiscais, o crescimento demogrfico e a confiana no governo so importantes na flutuao de preos. No entanto, ocorrer em certo momento um fenmeno chamado de equilbrio instantneo resultando num valor de mercado. Todas as variaes ocorridas nas condies do mercado so absorvidas e armazenadas pelos imveis, influenciando seus valores, que oscilam no tempo e no espao e que, em ltima anlise, so resultados da oferta e demanda por este bem. E assim, outras mudanas na oferta ou na demanda causaro novo equilbrio, em outros nveis de preo. Faz-se interessante observar que por existirem inmeros fatores e influncias, uma parte das variaes dos valores imobilirios considerada aleatria, podendo-se pensar no

13

preo final, como baseado em um valor mais provvel que aumenta ou diminui por uma parcela imprevisvel, de acordo com as influncias casuais. Assim, o valor de um imvel segue o modelo estatstico, Y= + Onde: Y o valor negociado; (2.1)

o valor mais provvel, ou seja, E (Y) = ; a perturbao estocstica.


Segundo Brulio (2005), num mercado de concorrncia perfeita a situao ideal aquela onde a oferta e a procura encontra-se equilibrada sendo a relao entre imvel, vendedor e comprador que so os formadores do mercado, especialmente importantes para a construo do preo. No entanto, pode ocorrer o mercado de concorrncia imperfeita, ocasionando casos de monoplio e oligoplio. Nos casos de monoplio o mercado torna-se comandado por um nico vendedor, mas um caso mais raro de ser encontrado. Entretanto mais comum ser encontrado casos de oligoplio, onde a oferta concentrada em um pequeno nmero de vendedores que tambm se preocupam com propagandas e qualidade dos imveis, fazendo com que haja sempre uma alta nos preos dos imveis. Ocorrem ainda os casos de monopsnio, existindo apenas um comprador e tambm oligopsnio com muitos compradores (Dantas, 1998). O mercado imobilirio no pode ser considerado um mercado de concorrncia perfeita diante de muitas anlises tericas, pois este mercado pode ser visto como uma passagem livre, que os bens so idnticos e que todos os participantes tm as informaes perfeitas e que no sofrem nenhuma presso agindo livremente. No mercado imobilirio, ocorrem fatores que o dificultam: a falta de uniformidade dos imveis e a falta de informaes so exemplos disto. No se pode esquecer que os altos custos impossibilitam grande parte da populao a participar deste mercado de compra e venda, deixando-as ligadas a locao e a financiamentos indisponveis. Finalmente, pode-se concluir que o mercado imobilirio um mercado de concorrncia imperfeita.

14

2.2.6 Caractersticas dos Imveis Muitos fatores e fontes de divergncias diferenciam os imveis em si: vida til, localizao, singularidade, custos das unidades e tudo isto faz com que o mercado imobilirio tenha um comportamento diferente de outros mercados de bens. Esta combinao de fatores e divergncias, em um dado momento, permite explicar grande parte das diferenas de valores entre os imveis (Gonzlez e Formoso, 2000). O preo de um imvel conhecido integralmente. Nele esto orados os atributos como localizao, terreno, rea e vida til. Assim, os preos dos imveis podem ser compreendidos como a soma dos produtos das quantidades de cada um desses servios pelos seus preos implcitos (localizao, rea, terreno e vida til). Ao final, importante verificar que, por existirem inmeras influncias, uma parte das variaes dos valores imobilirios pode ser considerada aleatria, ou seja, pode-se pensar no preo final como baseado em um valor mais provvel que sujeito a variaes, de acordo com as influncias pontuais do caso e conforme o modelo (2.1). 2.2.7 Mtodos de Avaliao A escolha da metodologia mais apropriada para uma dada avaliao depende das condies atuais do mercado, do tipo de servio a que se presta e da preciso que se deseja. No entanto, independentemente da metodologia utilizada, essa dever apoiar-se em pesquisa de mercado e considerar os preos comercializados e/ou ofertados, bem como outros elementos e atributos que influenciam o valor (NBR-5676/90). De acordo com Montenegro Duarte (1999), a avaliao como cincia usada para encontrar um valor, no exata, mas pode ser altamente precisa. Deve ser objetiva e esclarecedora, identificando o bem a ser avaliado e o mtodo a ser utilizado e quando realizada de forma cientfica, ou seja, baseada em teorias e mtodos adequados, utiliza instrumental tecnolgico prprio buscando a objetividade. Assim os resultados das estimativas realizadas por diferentes grupos de avaliadores, devero ser prximos uns dos outros. Desta forma, podem-se definir as metodologias de avaliao como formas de se atribuir valor a um imvel. De acordo com a ABNT (NBR-5676/90), os mtodos de avaliao

15

so divididos em dois grandes grupos: mtodos diretos e mtodos indiretos. A seguir so apresentados detalhamentos desses mtodos. a) Mtodos Diretos Quando o valor do resultado da avaliao independe de outros, o mtodo chamado de direto (Dantas, 1998). Os mtodos diretos se subdividem: - Mtodo comparativo de dados um mtodo que define o valor de comparao com dados de mercado que so semelhantes quanto a caractersticas peculiares ou no. o mtodo mais indicado para trabalhos de avaliao, porm para a sua aplicao, existe uma condio fundamental que a existncia de um conjunto de dados que possa ser utilizada, estatisticamente, como amostra de mercado imobilirio. As caractersticas e os atributos dos dados pesquisados que exercem influncia na formao dos preos, devem ser ponderados por homogeneizao ou por deduo estatstica, respeitados os nveis de rigor definidos nessa norma. - Mtodo comparativo de custo de reproduo de benfeitorias o mtodo que apropria o valor das benfeitorias, atravs da reproduo dos custos de seus componentes. Estes custos so compostos com base em oramento detalhado em funo da avaliao realizada. Devem ser justificados e quantificados os efeitos do desgaste fsico e do obsoletismo funcional das benfeitorias. A utilizao dos mtodos diretos tem preferncia e sempre que existirem dados suficientes para utilizao do mtodo comparativo ele deve ser escolhido (Dantas, 1998). b) Mtodos Indiretos O mtodo considerado indireto quando necessita de resultados provenientes de outro procedimento. Os mtodos indiretos so: - O mtodo da renda Avalia o valor do imvel ou de suas partes componentes em funo de um rendimento j existente ou previsto pelo bem no mercado, ou seja, o valor econmico do bem. - Mtodo involutivo

16

O valor do terreno estimado por estudos da viabilidade tcnica-econmica do seu aproveitamento, considerando como aproveitamento eficiente realizao de um empreendimento imobilirio hipottico compatvel com as caractersticas do imvel e com as condies do mercado (Moreira Filho, Frainer e Moreira 1993). - Mtodo residual Obtm-se o valor do terreno a partir da diferena entre o valor total do imvel e o valor das benfeitorias, levando-se em conta o fator de comercializao (Fiker, 1997). Analisando os vrios mtodos de avaliao, mostrados anteriormente, pode-se observar que de uma forma, ou de outra, todos so comparativos. Sendo assim, Dantas, 1998, explica que no mtodo comparativo comparam-se bens semelhantes; no mtodo de custo, comparam-se os prprios custos no mercado; nos mtodos da renda e involutivo compara-se possibilidade de renda do bem; e no mtodo residual, compara-se o nvel de comercializao do mercado. O mtodo comparativo, quando utilizado, permite que se tenha uma estimativa mesmo com as diferentes tendncias de mercado. Ele estima o valor baseado na comparao com outros semelhantes, iniciando de um grupo de dados e somando-se com outras informaes resultando numa amostragem estatstica de dados do mercado imobilirio. Portanto, o mtodo comparativo de dados de mercado o mtodo mais utilizado e indicado para avaliaes de mercado. Na prtica, geralmente ocorre a falta de algum componente que influencie no valor final do imvel e isto faz com que a semelhana entre o imvel avaliado e os componentes da amostra seja imperfeita e incompleta. Assim, os atributos dos dados pesquisados que influenciam o valor devem ser ponderados por homogeneizao ou inferncia estatstica, respeitando os nveis de rigor definidos na NBR-5676/89. Com o uso de tcnicas estatsticas obtm-se uma avaliao isenta de subjetividade e de grande confiabilidade (Moreira Filho, Frainer e Moreira 1993; Gonzlez e Formoso, 2000). Tabelas e tambm modelos de preos hednicos, tais como a regresso linear mltipla, so utilizados para estimar valores. No entanto, ambos sofrem contestaes sobre sua eficcia. As tabelas que eram tradicionalmente utilizadas so criticadas por serem imprecisas e de pouca confiabilidade. A regresso linear mltipla tem demonstrado srios

17

problemas de multicolinearidade nas variveis explicativas e tambm de incluso de outlier na amostra. Alm disso, a colinearidade dentro dos dados pode tornar a regresso linear mltipla um modelo inadequado para um mercado que requer respostas rpidas e de alta preciso, sendo aceitvel apenas quando realizada por um profissional capacitado (Worzala, Lenk e Silva, 1995). Neste trabalho procura-se evitar o problema da multicolinearidade trabalhando-se com componentes principais. 2.2.8 Nvel de Preciso da Avaliao Os nveis de preciso que caracterizam uma determinada avaliao so normatizados pela NBR-5676/90. De acordo com NBR-5676, em seu item 7, o nvel de rigor almejado numa dada avaliao est diretamente relacionado com as informaes extradas do mercado. Sendo assim, a preciso do mercado ser determinada por esse nvel que ser maior ou menor, dependendo da avaliao. Este rigor relaciona-se diretamente com a abrangncia da pesquisa, confiabilidade e adequao dos dados coletados, qualidade do processo avaliatrio e ao grau de subjetividade do avaliador. Desta forma, os trabalhos avaliatrios podem, de acordo com a norma, ser classificados como de nvel de rigor expedito, normal, rigoroso e rigoroso especial. Rigor expedito: o valor obtido sem a utilizao de qualquer instrumento matemtico, apenas com o nvel de conhecimento de mercado do avaliador. muito freqente, porm no este o objetivo deste trabalho. A ausncia de mtodo cientfico determina que o valor seja atribudo atravs de escolha arbitrria, no caracterizando o aspecto tcnico da avaliao. Rigor normal: para esta avaliao utilizam-se mtodos estatsticos e existem exigncias com relao coleta e tratamento dos dados. Rigorosa: nestas avaliaes os dados devem se basear em processos estatsticos que permitam calcular estimativas no tendenciosas do valor, tendo a total iseno de subjetividade. O resultado final da avaliao, atravs do tratamento estatstico adotado, deve estar contido em um intervalo de confiana fechado e com um nvel de confiana mximo de 80%, desde que as hipteses nulas sejam testadas ao nvel de significncia mximo de 5%.

18

Rigorosa especial: caracteriza-se pelo encontro de um modelo estatstico o mais abrangente possvel, ou seja, que incorpore o maior nmero de caractersticas que contribuem para a formao do valor. A funo estimada da formao de valor deve ser eficiente e no tendenciosa. Portanto, a hiptese nula da equao de regresso deve ser rejeitada ao nvel de significncia mximo de 1% (ANOVA). J as hipteses nulas sobre os parmetros do modelo de regresso ao nvel de significncia mximo de 10% para o teste unicaudal (teste t) ou 5% em cada ramo do teste bicaudal. Devem ser analisadas as seguintes condies bsicas referentes aos resduos do modelo ajustado aos dados: Gaussianidade, homogeneidade da varincia e independncia. Desta forma os resduos devem ser Gaussianos, independentes e identicamente distribudos, ou seja, i ~ N (0, 2). Logo, deve-se testar a Gaussianidade por um mtodo adequado. Os mais usados so: o teste de Shapiro-Wilks e o de Kolmogorov-Smirnov. A homogeneidade da varincia das variveis pode ser verificada graficamente por meio do grfico dos resduos contra os valores ajustados, ou seja, i x y i i = 1, 2, ..., n. E, a premissa da independncia dos resduos pode ser identificada por meio do grfico dos resduos contra a ordem, ou seja, i xi .
^ ^ ^

2.3 ANLISE MULTIVARIADA

2.3.1 Introduo Ao se tomar uma deciso, muitos fatores costumam estar envolvidos nela; certamente nem todos tm a mesma importncia. Quando a intuio utilizada nessa tomada de deciso, nem todos os fatores costumam ser identificados, ou seja, no sero definidas as variveis que afetam a deciso. Assim tambm, nota-se que um grande nmero de variveis envolve os acontecimentos sejam eles culturais ou naturais. Muitas cincias buscam conhecer a realidade e, assim, interpretar os acontecimentos e fenmenos baseados no conhecimento das variveis intervenientes consideradas importantes nestes eventos. A finalidade da cincia estabelecer relaes e encontrar ou propor leis

19

explicativas. Para isso necessrio absorver todas as informaes que so consideradas mais relevantes para obter o entendimento do fenmeno analisado. So diversas as dificuldades encontradas na transformao das informaes (dados) obtidas em conhecimento. Porm, a maior delas de natureza epistemolgica: a cincia que tenta representar a realidade atravs de modelos e teorias dos diversos ramos do conhecimento. Outra dificuldade a aspirao de universalidade das explicaes cientficas, resultando desta forma, ao condicionamento da pesquisa a uma padronizao metodolgica, tendo um aspecto essencial que a avaliao estatstica das informaes. A cada dia amplia-se cientificamente a facilidade de obteno de informaes sobre acontecimentos e fenmenos que esto sendo analisados, sendo que estas informaes so parcelas de dados que devem ser trabalhados e processados e ento transformados em conhecimentos. Assim, cada vez mais surge a necessidade da utilizao de ferramentas estatsticas que apresentem uma viso por inteiro sobre o fenmeno analisado e que melhore as informaes obtidas com uma abordagem univariada. A designao Anlise Multivariada corresponde a um conjunto de tcnicas que utiliza simultaneamente todas as variveis que caracterizam um item na anlise estatstica. Assim, ao invs de trabalhar com uma varivel explicativa X ela considera o vetor X cujas componentes so variveis aleatrias explicativas. A metodologia da Anlise Multivariada detm um grande potencial de aplicao, pois facilita o entendimento do relacionamento entre as diversas variveis aleatrias. As tcnicas multivariadas, so tcnicas que no tratam apenas uma dimenso de anlise de dados, mas tambm uma escala de cruzamento entre vrias dependentes ou no e tambm um cruzamento de dados que envolvem informaes dependentes, oferecendo assim ao pesquisador, uma nova dimenso, mais abundante que normalmente em abordagem univariada. A estatstica univariada clssica fixou-se no estudo de uma nica caracterstica (ou varivel) medida para um conjunto pequeno de indivduos, desenvolvendo as noes de estimativa e de testes fundamentados em hipteses muito restritivas. Entretanto, na prtica, os indivduos observados so freqentemente caracterizados por um grande nmero de caractersticas (ou variveis).

20

Os mtodos de anlise de dados permitem um estudo global dessas variveis, pondo em evidncia ligaes, semelhanas ou diferenas. Por isso, mergulham-se indivduos e variveis em espaos geomtricos, fazendo-se a mxima economia de hipteses, e transformam-se os dados para visualiz-los num plano ou classific-los em grupos homogneos, perdendo o mnimo de informaes. A Anlise Multivariada a parte da estatstica que estuda, interpreta e elaboram o material estatstico sobre um conjunto de n > 1 variveis (quantitativa e/ou qualitativa). Os dados onde cabe uma Anlise Multivariada so, portanto, de carter multidimensional (Cuadras, 1981). Pode ser usada para a reduo ou simplificao de dados, distribuio e agrupamentos, investigao da dependncia entre variveis, predio, teste de hiptese, e muitas outras. Pla (1986) aponta alguns dos objetivos mais importantes dos mtodos multivariados: a) Encontrar a adequao de representar o universo em estudo, simplificando a estrutura dos dados. Pode-se obter atravs da transformao (combinao linear ou no linear) de um conjunto de variveis interdependentes em outro conjunto independente e/ou num conjunto de menor dimenso. b) Classificao; esta anlise permite estabelecer as observaes dentro de grupos ou, ento, concluir que os indivduos esto aleatrios no multiespao, sendo tambm possvel, alocar novos itens em grupos identificados. c) Anlise da interdependncia; tem como objetivo examinar a interdependncia entre as variveis, a qual abrange desde a independncia total at a colinearidade quando uma delas combinao linear de outras ou, em termos mais gerais, uma funo f (x) qualquer das outras. De acordo com Johnson e Wichern (1998), em problemas que envolvem p variveis (p > 1), tomando-se n observaes de cada vetor aleatrio X de dimenso p tem-se que as medidas observadas xij, com i = 1, 2,... , n e j = 1, 2,... , p, podem ser arranjadas em uma matriz de dados genrica de ordem n x p, nXp, conforme 2.2.

21

X 11 X Xp = 21 n M X n1

X 12 L X 22 L M O X n2 L

X1p X2p M X np

(2.2)

A representao da matriz de dados correspondente a n observaes do vetor X = [X1, X2,..., Xp] de dimenso p, composto por p varveis aleatrias, pode ser nXp = (Xij). No entanto, essa matriz corresponde a uma amostra aleatria de tamanho n do vetor pdimensional X, ou seja, [x1, x2, x3,..., xn]. Na grande maioria das vezes, quando se estuda reas de pesquisas e aplicao de tcnicas estatsticas, vrias caractersticas (variveis) so observadas. Essas variveis devem ser analisadas em conjunto por no serem independentes e a Anlise Multivariada a rea que trata desse tipo de anlise e visa trabalhar, conjuntamente, com mais do que uma varivel. As tcnicas multivariadas mais utilizadas so aquelas relacionadas ao estudo da estrutura de covarincia do vetor observado, ao estudo do agrupamento de itens e ao estudo do reconhecimento de padres e classificao. Especificamente pode-se citar: Anlise de Componentes Principais, Anlise Fatorial, Anlise de Correlao Cannica, Anlise de Agrupamento (Cluster Analysis) e Reconhecimento e Classificao de Padres. Vrias so as tcnicas que podem ser aplicadas aos dados. Sua utilizao depende do tipo de dados que se deseja analisar e dos objetivos do estudo. Nesta pesquisa trabalhou-se com as seguintes tcnicas multivariadas: - Anlise de Agrupamentos; - Anlise de Componentes Principais; - Reconhecimento de Padres e Classificao. 2.3.2 Estatsticas Descritivas Multivariadas A Cincia Estatstica trabalha com amostras. As informaes amostrais podem ser resumidas em nmeros sumrios conhecidos como estatsticas e que podem constar nas observaes multivariadas [x1, x2, x3, ..., xn]. As estatsticas so usadas na inferncia sobre os parmetros, ou seja, na estimao do vetor mdio , da matriz de covarincia ou da matriz

22

de correlao , entre outros. De maneira que o vetor mdio populacional deve ser estimado pelo vetor mdio amostral, X , definido pela expresso,

X=

x
i =1

(2.3)

onde xi com i = 1, 2, ..., n corresponde s observaes amostrais do vetor X e n o tamanho da amostra observada. Outros parmetros de uma populao multivariada f(x) podem ser avaliados, tais como a matriz de covarincia , definida por:

12 12 2 2 = 21 M M p1 p 2

L 1p L 2p O M L 2 p

(2.4)

onde se tem na diagonal principal as varincias das variveis aleatrias e, fora da diagonal principal, as covarincias entre elas. E, a matriz de correlao , definida por:
1 21 = M p1

12 L 1 p 1 L 2 p p2 L
M O M 1

(2.5)

com as correlaes entre as variveis fora da diagonal principal. Ento estes parmetros, e

, so estimados, respectivamente, pela matriz de covarincia amostral S e pela matriz de


correlao amostral R ou , cujas expresses so:

s12 ( xi x )( xi x ) ' s21 S = i =1 = M n 1 s p1


n

s12 2 s2 M sp2

L s1 p L s2 p O M L s2 p

(2.6)

sendo s 2j a varincia amostral da varivel aleatria Xj,

23

s 2j =

( X
n i =1

ij X j

n 1

(2.7)

e sjk a covarincia amostral entre as variveis aleatrias Xj e Xk, ou seja,

sjk =

( X
n i =1

ij

Xj

)( X

i1

X 1j

)
(2.8)

n 1

e
1 r = 21 R= M rp1 r12
1

M rp 2

L r1 p L r2 p O M L 1

(2.9)

com as correlaes amostrais fora da diagonal principal e dadas pelo quociente entre a covarincia amostral e o produto dos desvios padres amostrais, ou seja:

rjk =

s jk s j sk

para j k.

(2.10)

Esses estimadores so os melhores para se determinar os parmetros. Os primeiros so EUMV (Estimador Uniformemente de Mnima Varincia) e o ltimo EMV (Estimador de Mxima Verossimilhana). 2.3.3 Mtodos Multivariados Mtodos Multivariados so tcnicas estatsticas importantes cujo uso est particularmente disseminado nas cincias fsicas, sociais e mdicas. tambm complexa porque difcil de identificar tcnicas que so projetadas para estudar relaes dependentes e interdependentes. Existem vrios mtodos de Anlise Multivariada, com diversas finalidades. Portanto, necessrio saber que tipo de conhecimento se pretende gerar. Os mtodos estatsticos so escolhidos de acordo com os objetivos da pesquisa. Aplicou-se neste trabalho alguns destes mtodos sendo detalhados nas prximas sees.

24

2.3.3.1 Anlise de Componentes Principais O mtodo das Componentes Principais procura explicar a estrutura da varincia e covarincia de um vetor aleatrio atravs de poucas combinaes lineares das variveis originais. Seu objetivo geral baseia-se tanto em reduzir os dados como em facilitar a interpretao, pois consiste numa transformao, de eixos, tornando as novas variveis (combinaes lineares) no correlacionadas. De forma que uma matriz de dados X de ordem n x p pode ser substituda por outra de ordem n x m sendo m << p . De acordo com Johnson e Wichern (1998), embora as p componentes sejam necessrias para reproduzir toda a variabilidade presente na estrutura de covarincia do vetor

X de dimenso p, freqentemente, uma grande parte desta variabilidade poder ser explicada
por um nmero m < p de Componentes Principais. Neste caso existe praticamente a mesma quantidade de informaes nas m Componentes Principais do que nas p variveis originais. A Anlise das Componentes Principais freqentemente revela relaes que no eram previamente consideradas e assim permitem interpretaes que no iriam, de outro modo, aparecer. a) Componentes Principais Populacionais Algebricamente, as componentes principais so combinaes lineares das p variveis originais X1, X2,..., Xp que compem o vetor aleatrio X. Geometricamente, as combinaes lineares representam a seleo de um novo sistema de coordenadas, obtido por rotao do sistema original, sendo que os novos eixos representam as direes com variabilidade mxima. Como exemplo, tem-se, na figura 2.1, a representao da estrutura de componentes principais para p = 2: Figura 2.1: Representao da estrutura de componentes principais
Y2 X2 X1 Y1

25

onde:

X1 e X2 so eixos originais. Y1 e Y2 so novos eixos (eixos originais rotacionados: centrado na mdia


amostral). Obtm-se as Componentes Principais a partir da matriz de covarincia ou da matriz de correlao , que resumem a estrutura de relacionamento das p variveis originais que compem o vetor X. Ento, da matriz de covarincia ou da matriz de correlao , obtmse os autovalores 1 > 2 > ..... > p e os respectivos autovetores e1, e2,... , ep. E, com estes entes algbricos se constri as combinaes lineares que definem as componentes principais, ou seja,

Yi = e i' X, i = 1, 2,... , p.

(2.11)

As Componentes Principais so combinaes lineares, Yi i = 1, 2,..., p, no correlacionadas, uma vez que a matriz dos autovetores P, em (2.12), ortogonal (PP = PP = I),
e11 e12 e e22 21 P= ... ... e p1 e p 2
... e1 p ... e2 p . ... ... ... e pp

(2.12)

A varincia da Componente Principal Yi = e i X, i = 1, 2,... , p dada por,

'

V(Yi) = V(e i X) = eV ( X )e i = e i e i i
e a covarincia entre as componentes Yj e Yk nula, ou seja, cov (Yj, Yk) = 0. Portanto define-se: -

'

'

'

'

'

(2.13)

A primeira componente principal como a combinao linear Y1 = e 1 X que


' maximiza a varincia de Y1, sob a restrio e 1 e 1 = 1.

'

26

A segunda componente principal como a combinao linear Y2 = e 2 X que maximiza V e 2 X sujeita a restrio e 2 e 2 = 1 e cov(Y1 , Y2 ) = 0.
' '

'

A i-sima componente principal como a combinao linear Yi = e i X que maximiza V e i X sujeita a restrio e i e i = 1 e cov(Yi , Yk ) = 0 k i.
' '

'

b) Componentes Principais Amostrais Comumente os parmetros da estrutura de covarincia, ou , so desconhecidos. Ento, a obteno das componentes principais feita a partir de seus estimadores, que so a matriz de covarincia amostral S ou a matriz de correlao amostral R. Estas estatsticas so definidas por:

S=

1 n ( xi x )( xi x ) ' n 1 i =1

(2.15)

R = D-1SD-1

(2.16)

onde D a matriz desvio padro amostral e x o vetor mdio amostral, dados respectivamente por:

s1 0 0 s2 D= ... ... 0 0

... 0 ... 0 ... ... ... s p

(2.17)

x1 x x = 2 M x p

(2.18)

Ento, obtm-se as estimativas dos elementos da estrutura de covarincia do vetor


aleatrio X, ou seja, os autovalores i i = 1, 2,..., p e os correspondentes autovetores ei e

constroem-se as componentes principais amostrais:

27

' Y = ei X, i = 1, 2,..., p.

(2.19)

As propriedades das componentes principais se mantm e so obtidas com base em estimadores. A obteno das componentes principais com base nas informaes da matriz de correlao preferida, devido ao fato de se conseguir eliminar o efeito de escala nos valores das componentes do vetor de variveis originais X. A matriz de correlao uma matriz de covarincia, mas de variveis padronizadas. Assim, consegue-se eliminar a influncia da escala das variveis na magnitude das varincias. Os autovetores definem as direes da mxima variabilidade e os autovalores especificam as varincias. Eles so a essncia do mtodo das componentes principais. Quando os primeiros autovalores so muito maiores que os demais, a maior parte da varincia total pode ser explicada por um nmero menor do que as p dimenses do vetor X. O desenvolvimento da Cincia Estatstica, com o passar do tempo, favoreceu o aparecimento de outro mtodo de extrao dos fatores de uma Anlise Fatorial, que o da mxima verossimilhana. computacionais.
c) Critrios para Definio do Nmero de Componentes Principais Extradas

Os

dois

mtodos

esto

disponveis

nos

modernos

programas

Um critrio para a determinao do nmero de componentes a serem extradas foi sugerido por Kaiser em 1960. Segundo Johnson e Wichern (1988), Kaiser props escolheremse somente as componentes correspondentes aos autovalores (razes latentes) de magnitudes maiores do que um. Outra maneira de se definir o nmero de componentes atravs da percentagem de variao explicada. O pesquisador, neste caso, deve julgar se m componentes explicam suficientemente o relacionamento entre as p variveis originais. Geralmente, um bom grau de explicao superior a 75% para um m pequeno. Um procedimento que visualiza muito bem o Critrio de Kaiser grafar os autovalores contra o nmero de componentes na ordem de extrao (Scree Plot). Fixando-se um nvel de corte fica fcil decidir o nmero de m. Uma propriedade muito importante das Componentes Principais a independncia entre elas. Desta forma, podem substituir as variveis originais e eliminar o problema de multicolinearidade.

28

2.3.3.2 Anlise de Agrupamento (Clusters Analysis)

uma tcnica multivariada que busca a formao de grupos homogneos de objetos ou variveis. Estes grupos so formados calculando-se as distncias entre os itens, representados por vetores compostos pelas suas caractersticas, construindo-se uma matriz de distncias e juntando os itens em grupos de acordo com suas proximidades. Segundo Crivisqui (1993) os chamados Mtodos de Agrupamento, ou Cluster Analysis, ou ainda Mtodos de Classificao Automtica, so mtodos estatsticos destinados a dividir em subconjuntos um conjunto de dados observados. Aplicar estes mtodos significa definir nesse conjunto as classes em que se distribuem os elementos do conjunto. Se n indivduos sobre os quais se observaram p caractersticas esto representados num espao de p dimenses, chamam-se classes aos subconjuntos de indivduos desse espao de representao que so identificveis. No se pode requerer a existncia de classes num conjunto de observaes. S possvel verificar a existncia de nveis de sntese significativos correspondentes organizao em classes e subclasses dos elementos, de modo que os elementos de uma matriz de dados qualquer no so necessariamente classificveis. Por isso, necessrio explorar previamente a estrutura da informao disponvel, antes de orientar-se em direo a um algoritmo de classificao. a) Medidas de similaridade e dissimilaridade Quando so agrupados itens, a proximidade usualmente indicada por uma espcie de distncia. Por outro lado, as variveis so usualmente agrupadas com base nos coeficientes de correlao ou outras medidas de associao. Assim, quanto maior ou menor o valor do ndice de similaridade ou dissimilaridade mais ou menos parecidos so os objetos. Existem vrios ndices de similaridades, sendo que a sua principal medida o coeficiente de correlao. No entanto, os itens podem sem comparados por uma distncia. Existem vrias mtricas que podem ser usadas:
Distncia Euclidiana: , simplesmente, a distncia geomtrica no espao

Multidimensional. A distncia entre os itens x e y definida por:

29

d (x, y ) = ( x
p i =1

yi )

(2.20)

Outras medidas para a distncia entre x e y so definidas por:


Quadrado da distncia Euclidiana:
d x, y = ( x i y i )
2 i =1

( )

(2.21)

Distncia city-block (Manhattan):


d x, y = x i y i
i =1

( )

(2.22)

Distncia de Mahalanobis (distncia estatstica):

d x, y =

( ) (x y ) S (x y ) =
' 1

(x1 y1 )2
S12

+L+

(x

yp )
2 Sp

(2.23)

Distncia de Minkowski:
d x, y = n x1 y1 + x 2 y 2 + L + x p y p

( )

=n

x
i =1

yi

(2.24)

b) Mtodo de agrupamento hierrquico A utilizao deste mtodo segue o seguinte procedimento: iniciam-se com g grupos, sendo que cada um formado por um nico objeto; calcula-se a matriz simtrica de distncias n n, D = (dij), onde dij a distncia ou similaridade entre o objeto i e o objeto j, onde: d11 = d22 = ... = dnn = 0. Na matriz de distncias D, acha-se o par de grupos mais prximo (menor distncia) e juntam-se os grupos. O novo grupo formado , por exemplo, (AB). Nova matriz de distncias construda, simplesmente apagando-se as linhas e colunas correspondentes aos grupos A e B e adicionando-se a linha e a coluna dadas pelas distncias entre (AB) e os grupos remanescentes. Repetem-se estes passos anteriores, num total de (g 1), vezes observando-se as identidades dos grupos que so agrupados.

30

A funo de um item ou grupo a outro grupo feita usando-se um tipo de procedimento chamado ligao. Os tipos de ligaes mais comuns so: Ligao Simples (vizinho mais prximo), Ligao Completa (vizinho mais distante), Mtodo de Ward, Mtodo das Mdias das Distncias e Mtodo do Centride. A seguir sero detalhados os trs primeiros tipos de ligaes.
Ligaes Simples (vizinho mais prximo)

Nesta ligao o agrupamento feito juntando-se dois grupos com menor distncia ou maior similaridade. Quando formado o novo grupo, por exemplo, (AB), na ligao simples, a distncia entre (AB) e algum outro grupo C calculado e os resultados so apresentados graficamente em um diagrama de rvore ou dendrograma. d(AB)C = min {dAC, dBC}
Ligao Completa (vizinho mais longe)

(2.25)

O procedimento muito semelhante ao da ligao simples, com uma nica exceo: o algoritmo aglomerativo comea determinando a menor distncia dik, constri-se a matriz de distncias D = (dik) e os grupos vo se juntando. Se A e B so dois grupos de um nico elemento, tem-se (AB) como novo grupo. A distncia entre (AB) e outro grupo C dada por: d (AB)C = max {dAC, dBC}
Mtodo de Ward

(2.26)

Este mtodo usado, avaliando a perda de informaes utilizando o critrio da soma ao quadrado dos erros, (SQE), entre dois agrupamentos, para todas as amostras. Quando se tem a distncia mnima unem-se os grupos prximos, e volta-se a iterar nos grupos. Ento tem-se:
SQE =

(x
i =1

x )' (xi x )

(2.27)

Sendo:
x a mdia das amostra;

xi uma medida multivariada associada com o i-simo item.

31

Os resultados so fornecidos na forma de dendrograma e o eixo vertical d os valores de SQE. A deciso do nmero de classes ou tipos para anlise tomada a partir do exame do dendrograma ou rvore hierrquica, onde podem ser lidos os ndices de nvel ou ndices de similaridade que so as distncias euclidianas em que ocorrem as junes dos pontos observados para formar grupos. Uma grande distncia indica que a agregao reuniu dois grupos muito dissimilares e, por isso, deve-se definir o nmero de grupos anterior a esta distncia.
2.3.3.3 Discriminao, Classificao e Reconhecimento de Padres

Estatisticamente, a construo e a avaliao de regras de reconhecimento e classificao de padres podem ser baseadas em trs mtodos principais: Funo Discriminante Linear de Fisher, Regresso Logstica e Mtodo das k-mdias. Posteriormente, surgiu a tecnologia de Redes Neurais (tecnologia emergente), mtodos de Programao Matemtica e outros mtodos para formao do conjunto de procedimentos usados no reconhecimento e classificao de objetos e indivduos. Abaixo se detalha o mtodo da Anlise Discriminante.
- Anlise Discriminante

Segundo Johnson e Wichern (1988), uma tcnica multivariada que tem por objetivo tratar dos problemas relacionados com separar conjuntos distintos de objetos (itens ou observaes) e alocar novos objetos em conjuntos previamente definidos. Quando empregada como procedimento de classificao no uma tcnica exploratria, uma vez que ela conduz a regras bem definidas, as quais podem ser utilizadas para classificao de outros objetos. Tem como objetivos imediatos, quando usada para discriminao e classificao, os seguintes: 1. Descrever algbrica ou graficamente as caractersticas diferenciais dos objetos (observaes) de vrias populaes conhecidas a fim de achar discriminantes cujos valores numricos sejam tais que as populaes possam ser separadas tanto quanto possvel. 2. Agrupar os objetos (observaes) dentro de duas ou mais classes determinadas. Tenta-se encontrar uma regra que possa ser usada na alocao tima de um novo objeto (observao) nas classes consideradas.

32

Uma funo que separa pode servir para alocar um objeto e, da mesma forma, uma regra alocadora pode sugerir um procedimento discriminatrio. Na prtica, os objetivos 1 e 2, freqentemente, sobrepem-se e a distino entre separao e alocao torna-se confusa.
- Discriminao e Classificao: Mtodo de Fisher

1. Mtodo de Fisher para Duas Populaes A idia de Fisher foi transformar as observaes multivariadas Xs em observaes univariadas Ys tais que os Ys das populaes 1 e 2 sejam separados tanto quanto possvel. Fisher tomou combinaes lineares de X para criar os Ys, dado que as combinaes lineares so funes de X e por outro lado so de fcil clculo. Assim, sendo 1y a mdia dos Ys obtidos dos Xs pertencentes a 1 (populao 1) e 2y a mdia dos Ys obtidos dos Xs pertencentes a 2 (populao 2), Fisher selecionou a combinao linear que maximiza a distncia quadrtica entre 1y e 2y relativamente variabilidade dos Ys. Assim, seja:

1 = E (X|1) = valor esperado de uma observao multivariada de 1. 2 = E (X|2) = valor esperado de uma observao multivariada de 2.
e supondo a matriz de covarincia = [( i)( i)] i = 1, 2

(2.28). (2.29).

(2.30)

como sendo a mesma para as duas populaes, e ainda considerando a combinao linear,

1x1

Y = c' X
1xp px1

(2.31)

tem-se:

1y = E (Y |1) = E (cX |1) = cE (X |1) = c1, 2y = E (Y|2) = E (cX |2) = cE (X |2) = c2


e
2 V (Y) = y = V (cX) = c V (X) c = cc,

(2.32) (2.33)

(2.34)

33

que a mesma para ambas as populaes. Ento, segundo Fisher, a melhor combinao linear a derivada da razo entre o quadrado da distncia entre as mdias e a varincia de Y.

(1y 2 y )2
2 y

(c1 c2 )2 cc

c(1 2 )(1 2 )c cc

(c )2 cc

(2.35)

onde

= 1 2.
Ento, com = 1 2 e Y = cX,

(2.36)

(c ) 2 maximizada por: c c (2.37)

c = k -1 = k -1 (1 2) para qualquer k 0. Para k = 1 tem-se: c = -1 (1 2) e Y = cX = (1 2)-1X,

(2.38)

que conhecida como Funo Discriminante Linear de Fisher. Ela transforma as populaes multivariadas 1 e 2 em populaes univariadas, tais que as mdias destas populaes so separadas tanto quanto possvel relativamente varincia populacional, considerada comum. Logo, para classificar a observao multivariada X0 usa-se o modelo: Y0 = (1 2)-1X0 (2.39)

Y0 o valor da Funo Discriminante de Fisher para a nova observao X0, e considerando o ponto mdio entre as mdias das duas populaes univariadas, m=
1 ( 1 y + 2 y ), 2 (2.40)

como

m=

1 (c 1 1 + c 2 2 ) 2 1 ( 2 ) 1 1 + ( 1 2 ) 1 2 2 1

m=

34

m=

1 ( 1 2 ) 1 ( 1 + 2 ) 2

(2.41)

e tem-se que:

E (Y0 |1) m 0
e

(2.42)

E (Y0 |2) m < 0,

(2.43)

ou seja, se X0 pertence a 1, se espera que Y0 seja igual ou maior do que o ponto mdio. Por outro lado se X0 pertence a 2, o valor esperado de Y0 ser menor que o ponto mdio. Portanto, a regra de classificao : alocar x0 em 1 se y0 m 0 alocar x0 em 2 se y0 m < 0 Os parmetros 1, 2 e geralmente so desconhecidos. Ento, supondo que se tem

n1 observaes da v.a. multivariada X1 de dimenso p, ou seja, tem-se uma amostra aleatria


da populao 1 e n2 observaes da v.a. multivariada X2 de dimenso p, que corresponde a uma mostra aleatria da populao 2, os resultados amostrais correspondentes so: 1 n1 1 n1 x1 = x i1; S1 = ( xi1 x1 )( xi1 x1 ) n1 i =1 n1 1 i =1 1 2 1 n2 x 2 = xi 2 ; S2 = ( xi 2 x 2 )( xi 2 x 2 ) n2 i =1 n2 1 i =1
n

(2.44)

(2.45)

Assumindo que as populaes sejam assemelhadas, natural considerar a varincia como a mesma da estima-se a matriz de covarincia comum pela matriz de covarincia amostral calculada com a amostra conjunta,
Sp = (n1 1) S1 + (n 2 1) S 2 (n1 + n 2 2)

(2.46)

que um estimador no-viciado daquele parmetro .

35

Conseqentemente, a Funo Discriminante Linear de Fisher Amostral dada por:


Y = c X = ( x 1 x 2 ) S p 1 x

(2.47)

e a estimativa do ponto mdio entre as duas mdias amostrais univariadas,


y 1 = c x1

(2.48)

e
y2 = c x2

(2.49)

dada por:
1 1 ( y 1 + y 2 ) = ( x 1 x 2 ) S p 1 x 1 + ( x 1 x 2 ) S p1 x 2 2 2 1 m = ( x 1 x 2 ) S p1 ( x 1 + x 2 ) 2 m= Finalizando a regra de classificao a seguinte:
y0 m 0

]
(2.50)

x0 alocado em 1 x0 alocado em 2

y0 m < 0

A combinao linear particular Y = c x = ( x 1 x 2 )S p1 x maximiza a razo:

( y 1 y 2 ) 2 (c 1 x 1 c 2 x 2 ) 2 (c d ) 2 = = 2 Sy c Spc c Spc

(2.51)

onde:
d = x1 x 2

(2.52)

36

2 Sy =

( yi1 y 1 ) 2 + ( yi 2 y 2 ) 2
i =1 i =1

n1

n2

n1 n2 2

(2.53)

2. Discriminao entre Diversas Populaes O mtodo anterior vlido para duas populaes pode ser estendido para diversas populaes. O primeiro objetivo de Fisher com o mtodo foi o de separar populaes, podendo ser usado tambm para classificar novos itens em uma das populaes. Esse mtodo no necessita da suposio de que as diversas populaes sejam normais multivariadas, porm, necessrio assumir que as matrizes de covarincias populacionais so iguais, ou seja,
1 = 2 = ... = g = . Assim, seja o vetor mdio dos diversos grupos (populaes),
1 g g i =1 i

(2.54)

e B0 a matriz Soma de produtos cruzados entre grupos populacionais tal que:


B0 =

(
i =1

)( )'
i

(2.55)

A combinao linear Y = cX tem por esperana:


E (Y) = c' E ( x |i) = c' i

(2.56)

para a populao i e varincia: V (Y) =


2 y = c'V(X) c = c' c

(2.57)

para todas as populaes. Desta forma, o valor esperado iy = c i muda quando a populao da qual X selecionado outra. Tem-se ento uma mdia global:

1 g y = iy = c' g i =1

(2.58)

37

e a razo entre a Soma dos quadrados das distncias das populaes para a mdia global e a varincia de Y c' B0 c que uma generalizao multigrupal do caso de duas populaes. c' c

Medindo a variabilidade entre grupos de valores (escores) Y relativamente variabilidade comum dentro dos grupos, da mesma forma do que no caso de duas populaes, pode-se selecionar c que maximiza esta razo. conveniente normalizar c tal que c c = 1.
'

Sejam 1 2 ... s > 0 os s min (g 1 p) autovalores no-nulos de -1B0 e e1, e2,..., es os correspondentes autovetores (escalonados tal que e' e = 1). Ento, fcil provar
que o vetor de coeficientes c que maximiza a razo c' B0 c dado por c1 = e1. A combinao c' c

linear c1X chamada primeiro discriminante e de forma idntica, pode-se generalizar para o k-simo discriminante com ck = ek com k = 1, 2,..., s. Geralmente, e i no so conhecidas, toma-se amostras aleatrias de tamanhos ni das populaes i, i = 1, 2,..., g e denotando o conjunto de dados da populao i, i = 1, 2,..., g, por parmetros i e dados por: 1 ni
niXp

tem-se os estimadores dos

xi =

x
j =1

ni

ij

(2.59)

x=

ni x i
i =1 g

n
i =1

x
i =1 j =1 g

ni

ij

n
i =1

(2.60)
i

A matriz Soma de produtos cruzados entre grupos, B0, estimada por:


B0 = ( x i x )( x i x )'
i =1 g

(2.61)

e um estimador para pode ser obtido com base na matriz W:


W =

i =1

ni

j =1

( x ij x i )( x ij x )' =

i =1

( n i 1) S i

(2.62)

Conseqentemente,

38

(n1 1) S1 + (n2 1) S 2 +....+ (n g 1) S g W = = Sp n1 + n2 +...+ n g g n1 + n2 +....+ n g g

(2.63)

$ $ $ $ $ $ c 'B0 c c 'B0 c tambm maximiza . Logo, Assim, o mesmo c que maximiza a razo $' $ $ $ c 'S p c cWc

$ $ apresentar-se- o otimizante c na forma mais usual, que o autovetor e i da matriz W-1B0,


$$ $ porque se W-1B0 e = e ento Sp-1 B0 e = (n1 + n2 + ... + n g g )e , portanto, concluindo que

sejam 1 2 ... g > 0 os autovalores no nulos de W-1B0 e e1 , e 2 ,....., e s os


$ $ $ correspondentes autovetores, sendo s min (g 1, p) e e i normalizado tal que e i S p e i = 1;

$ $ ento o vetor de coeficientes que maximiza a razo citada acima c 1 = e 1 e a combinao $ linear e 1 x chamada primeiro discriminante amostral. Generalizando, tem-se no passo k o k$ simo discriminante amostral e k ' x , k s.
2.3.3.4 Avaliao de Funes de Reconhecimento e Classificao

1. Critrio TPM (Total Probability of Misclassification) A TPM dada por:


TPM = p1 f1 ( x)d x p2 f 2 ( x)d x
R2 R1

(2.64)

onde: p1 e p2 so as probabilidades de uma observao pertencer a 1 ou a 2, respectivamente. E o menor valor para esta quantidade, obtido pela escolha adequada das regies R1 e R2, chamado de taxa tima de erro (optimum error rate), OER,
OER = p1 f1 ( x)d x p2 f 2 ( x)d x
R2 R1

(2.65)

f1 ( x)

com R1 e R2 determinados por R1 :

f1 ( x)

p2 e R2 em caso contrrio. p1

A taxa aparente de erro (que definida como frao das observaes no treinamento amostral) calculada da matriz de confuso que mostra a situao real das observaes nos

39

grupos versus o reconhecimento. Para n1 observaes de 1 e n2 de 2 , a matriz de confuso tem a forma:


Figura 2.2: Matriz de confuso Predito

1
Classificao atual

2
n1M n2C n1 n2

1 2

n1C n2M = n2 n2C

Onde:
n1C: nmero de itens de 1 corretamente reconhecido como de 1 ; n1M: nmero de itens 1 misturados com de 2 ; n2C: nmero de itens 2 corretamente reconhecido como de 2 ; n2M: nmero de itens 2 misturados com de 1 .

A taxa aparente de erro (APER) dada por:


APER = n1M + n 2 M n1 + n 2

(2.66)

e vista como a proporo de itens ou observaes no conjunto de treinamento que so reconhecidos erroneamente. 2. Abordagem de Lachenbruch uma tcnica para avaliar a eficincia da regra de classificao. Os passos so: 1. Comece com o grupo da populao 1 . Omita uma observao deste grupo e construa uma funo baseada nas n1 1 e n2 observaes.

40

2. 3.

Reconhea (classifique), usando a funo, a observao no incorporada. Repita os passos 1 e 2 at que todas as n1 observaes de 1 sejam classificadas.
H Seja n1(M ) o nmero de observaes reconhecidas erroneamente neste grupo.

4.

( Repita os passos de 1 a 3 para as n2 observaes de 2 . Seja n2H ) o nmero de M

observaes reconhecidas erroneamente neste grupo. Ento,


n(H ) P (2 1) = 1M n1

(2.67)

e
n(H ) P (1 2) = 2 M n2

(2.68)

e a proporo total esperada de erro :


E ( AER) =
H n 1(M ) + n (2 H ) M

n1 + n 2

(2.69)

Assim, obtm-se uma regra de reconhecimento e classificao construda com as n observaes amostrais e testadas com todas referidas observaes.

2.4 ANLISE DE REGRESSO LINEAR

2.4.1 Introduo

A Anlise de Regresso a tcnica estatstica indicada quando se estuda o relacionamento entre as variveis (dependente e independente). Existem numerosas aplicaes desta tcnica que ocorrem em quase todos os campos cientficos. Na Engenharia de Avaliao, considera-se, geralmente, como varivel dependente os preos vista de mercado em oferta e efetivamente transacionados e como variveis

41

independentes as caractersticas do imvel. No modelo linear que pode representar os preos de mercado, a varivel resposta (dependente) expressa por uma combinao linear das variveis independentes, de forma original ou transformada, e respectivas estimativas dos parmetros populacionais, acrescidas de erro aleatrio, oriundo de variaes do comportamento humano. Assim, tem-se o modelo, que representa n observaes,
Yi = 0 + 1 X i1 + 2 X i 2 + L + p 1 X i , p 1 + i , i = 1, 2, L, n
2.4.2 Modelo Linear Geral de Regresso

(2.70)

O modelo (2.70) com n observaes pode ser colocado na forma matricial. Ento se tem:
Y = X +

(2.71)

onde Y o vetor aleatrio de resposta, o vetor de parmetros de dimenso p, X a matriz do modelo de ordem n x p e o vetor aleatrio de erros de dimenso n. E, de forma detalhada,
Y1 Y 2 Y =. nx1 . Yn 1 X 11 1 X 21 . . X = . nxp . . . 1 X n1 . . . . . . . . . . . . X 1, p 1 X 2, p 1 . . . X n , p 1 1 0 2 1 . = . = nx1 . px1 . . p 1 n

A aplicao completa do modelo (2.71) fundamentada nas seguintes suposies:

o vetor de erros = [1, 2,..., n] aleatrio, ou seja, as componentes i, i = 1, 2,..., n so variveis aleatrias;

a esperana de cada componente de zero, ou seja, E() = 0 e E(i) = 0; as componentes do vetor no so correlacionadas, ou melhor, cov (i, j) = 0, i
j e possuem varincia constante, . Assim, a matriz de covarincias de a

matriz diagonal In, onde In a matriz identidade de ordem n, V () = In.

42

O modelo (2.71) com as trs suposies anteriores conhecido como Modelo Linear de Gauss Markov e o Teorema de Gauss-Markov garante que sob as trs suposies e com
XX no singular, os estimadores no viciados uniformemente de mnima varincia (EUMV)

do vetor e da varincia so, respectivamente: = (XX)-1(XY) e


S =

(2.72)

1 n Yi Yi n p i =1

(2.73)

Uma outra suposio que pode ser exigida, alm das j citadas, para o modelo de regresso a seguinte:

a distribuio de i, i =1, 2,..., n a Normal (Gaussiana).

Levando em considerao esta suposio, tem-se o modelo de Gauss-Markov Normal e


p Yi ~ N i xi , 2 . i =1

2.4.3 Anlise da Varincia da Regresso

Esta anlise uma das tcnicas estatsticas cujas bases foram lanadas por Fisher. a tcnica geralmente usada para verificar se o ajuste de regresso existe. importante construir um quadro que resuma as informaes da Anlise da Varincia (ANOVA), para o modelo geral:
Yi = 0 + 1 X i1 + 2 X i 2 + L + p 1 X i , p 1 + i , i = 1, 2, L, n

(2.74)

com p 2 parmetros. Assim, o quadro 2.1 resume as informaes.

43

Quadro 2.1: Anlise de Varincia (ANOVA)

Fonte de variao Regresso Residual Total

Soma de quadrados SQRegr = X ' Y ny 2 SQR = Y ' Y ' X ' Y


'

G.L.
p1 np

Quadrado mdio SQ Re gr p 1 SQR n p

F SQ Re gr SQR / n p p 1

SQT = Y ' Y ny 2

n1

O teste feito com a estatstica F (ltima coluna do quadro 2.1) o da hiptese nula

H0: 1 = 2 = ... = p-1 = 0, ou seja, se existe regresso dos Xs para Y, ou melhor, se existe
relao linear entre a varivel resposta Y e as covariveis Xi, i = 1, 2,... , p 1, este teste fundamental para validade do modelo linear ajustado, Y = X .
2.4.4 Verificao dos Pressupostos do Modelo a) Homocedasticidade
^ ^

A homocedasticidade corresponde varincia constante dos resduos. uma propriedade essencial e que deve ser garantida, sob pena de invalidar toda a anlise estatstica. Deseja-se que os erros sejam aleatrios, ou seja, no devem ser relacionados com as caractersticas dos imveis. Quando a homocedasticidade no ocorre, h heterocedasticidade; significa dizer que as chances de ocorrerem erros grandes (ou pequenos) variam conforme o tipo de imvel. H tendncias nos erros. As conseqncias da heterocedasticidade so que as estimativas dos parmetros da regresso (0, 1, 2,..., p-1) no so tendenciosas, mas so ineficientes e as estimativas das varincias so tendenciosas. Os testes t e F tendem a dar resultados incorretos. Neste caso, os resultados no so confiveis, ou seja, o modelo pode parecer bom, mas ele no adequado aos dados, na verdade. A homocedasticidade pode ser verificada atravs de grficos de resduos (erros). Se os pontos esto distribudos aleatoriamente em uma faixa, sem demonstrar um comportamento definido, h homocedasticidade. No entanto, se existe alguma tendncia (crescimento, decrescimento ou oscilao), ento h heterocedasticidade. Havendo heterocedasticidade, podem ser feitas transformaes nas variveis (geralmente logartmicas) ou outras solues mais complexas. O modelo ento, deve ser modificado.

44

b) Independncia serial dos resduos (no-autocorrelao)

Ocorre autocorrelao quando os erros so correlacionados com os valores anteriores ou posteriores na srie. Este fenmeno chamado de correlao serial. Seu surgimento pode se dar por especificao incorreta do modelo da regresso, por causa de erros na forma do modelo ou ainda, por excluso de variveis independentes importantes para a anlise. Existindo autocorrelao, os estimadores ordinrios de mnimos quadrados no so mais os melhores estimadores lineares no-tendenciosos. Neste caso, existiro outros mtodos que produzem menor varincia amostral nos estimadores. Alm disso, em presena de correlao serial, os testes de significncia (t e F) e de construo de intervalos de confiana dos coeficientes da regresso tambm oferecem concluses incorretas, isto , as regies de aceitao e os intervalos de confiana podem ser mais largos ou mais estreitos do que os calculados, dependendo da tendncia ser positiva ou negativa. A verificao da autocorrelao pode ser realizada pela anlise do grfico dos resduos comparados com os valores preditos, onde este deve apresentar pontos dispersos aleatoriamente, sem nenhum padro definido ou pelo teste de Durbin-Watson.
c) Normalidade dos resduos

A Anlise de Regresso baseia-se na hiptese de que os erros seguem uma distribuio Normal (distribuio de Gauss). Em presena de falta de Gaussianidade, os estimadores so no-tendenciosos, mas os testes no tm validade, principalmente em amostras pequenas. Entretanto, pequenas fugas da Gaussianidade no causam grandes problemas. A heterocedasticidade ou a escolha de um modelo incorreto para a equao pode ser a causa da no-normalidade dos resduos.
A verificao da Gaussianidade pode ser feita pelos testes de aderncia como, por exemplo, o de Kmogorov-Sminorv ou de Shapiro-Wilks.

d) Outliers

Denomina-se outlier um dado que contm grande resduo em relao aos demais que compem a amostra e assim tem comportamento muito diferente dos demais (Dantas, 1998).

45

de grande importncia controlar os outliers, porque de acordo com a estimao da equao, um grande erro modifica significativamente seus somatrios, alterando os coeficientes da equao. Dessa forma, um imvel apenas pode modificar a equao. Geralmente, adota-se o intervalo de 2 desvios padres em torno da mdia dos erros, pois no existe um limite fixo. Como a mdia deve ser zero, os resduos padronizados

i dp

devem estar entre 3 e 3. Os imveis com erros que ultrapassam estes limites devem ser analisados cuidadosamente; a existncia de outliers deve sempre ser interpretada como um sinal de problema na amostra.
e) Colinearidade ou multicolinearidade

Multicolinearidade definida como a existncia de relaes lineares entre as variveis independentes, de tal forma correlacionada umas s outras, tornando-se difcil ou impossvel isolarem suas influncias separadas e obter uma estimativa precisa de seus efeitos relativos. Quando a relao exata tem-se o caso da multicolinearidade perfeita. Raramente encontram-se variveis independentes que so perfeitamente

relacionadas. Esse caso no traz problemas, pois facilmente detectado e pode ser resolvido simplesmente eliminando uma ou mais variveis independentes do modelo. O interesse no que se refere multicolinearide est nos casos em que ela ocorre com alto grau, isto , quando duas variveis independentes esto significativamente correlacionadas ou quando h uma combinao linear entre um conjunto de variveis independentes. Assim, a multicolinearidade mais uma questo de grau do que de natureza (Kmenta, 1978). O fato de muitas funes e regresses diferentes proporcionarem bons ajustes para um mesmo conjunto de dados porque os coeficientes de regresso atendem vrias amostras onde as variveis independentes so altamente correlacionadas. Assim, os coeficientes de regresso estimados variam de uma amostra para outra quando as variveis independentes esto altamente correlacionadas. Isso leva a informaes imprecisas a respeito dos coeficientes verdadeiros (Neter e Wasserman, 1974). Geralmente, a multicolinearidade causada pela prpria natureza dos dados, principalmente nas reas de economia com variveis que representam valores de mercado. Pode tambm ocorrer devido amostragem inadequada.

46

Em Anlise de Regresso Linear Mltipla, existe um freqente interesse com relao natureza e significncia das relaes entre as variveis independentes e a varivel dependente. Em muitas aplicaes de administrao e economia, freqentemente encontramse variveis independentes que esto correlacionadas entre elas mesmas e, tambm, com outras variveis que no esto includas no modelo, mas esto relacionadas varivel dependente (Neter e Wasserman). A existncia de multicolinearidade tendo sido detectada e considerada prejudicial, indicando que o pesquisador deve procurar solues para suavizar seus efeitos nocivos. Vrias medidas corretivas tm sido propostas, desde medidas simples s mais complexas, para suavizar os efeitos provocados pela multicolinearidade (Elian, 1988; Judge et al., 1980). Algumas solues para o problema da multicolinearidade so propostas, tais como: remoo de variveis, ampliao do tamanho da amostra, adoo de tcnicas estatsticas como Anlise de Componentes Principais, entre outras. Neste trabalho aplicou-se a tcnica das Componentes Principais para remover o problema da multicolinearidade entre as caractersticas dos imveis.
2.4.5 Poder de Explicao do Modelo

Para se medir o quanto a variabilidade total dos dados explicada pelo modelo de regresso, compara-se a Soma de Quadrados da Regresso com a Soma de Quadrados Total e, ento, tem-se o coeficiente de determinao ou de correlao mltipla ao quadrado, R2,
(y
n

R2 =

(y
i =1

i =1 n

y) 2

0 < R2 < 1
i

(2.75)

y)

Quando o ajuste bom o modelo explica boa parte da variao total e, consequentemente, o valor de R2 prximo de 1. A estatstica R2 indica a qualidade do ajuste do modelo adotado.
2.4.6 Relao entre Variveis

Na anlise de um modelo de regresso o coeficiente de correlao uma medida estatstica muito importante. O grau de associao entre duas variveis definido

47

numericamente pelo Coeficiente de Correlao, parmetro representado por . Com base em

n observaes do par (X, Y) este parmetro estimado pela estatstica,

=r=
onde,

(X
n i =1

X Yi Y
2
i

)(

)
2

(X

) (Y Y )

S xy SxS y

(2.76)

X a mdia da varivel X;
Y a mdia da varivel Y;

S xy a covarincia amostral entre X e Y;


S x o desvio padro amostral de X;
S y o desvio padro amostral de Y.
O coeficiente de correlao varia entre os limites 1 e 1 podendo ser positivo ou negativo (1 1) e tambm nulo ( = 0). Quando = 0 significa que no existe nenhum relacionamento entre as variveis. Quando o coeficiente de correlao igual unidade, 1 ou + 1, tem-se um relacionamento perfeito entre elas. O grau de relacionamento entre as variveis, definido numericamente pelo valor no caso amostral, pode ser assim interpretado:
Coeficiente Correlao
^

=0
0 < 0,30
^

....................

relao nula

....................

relao fraca

0,30 < 0,70 0,70 < 0,90


^

....................

relao mdia

....................

relao forte

48

0,90 < 0,99

.................... ....................

relao fortssima relao perfeita

=1

Nota-se tambm que nem sempre uma elevada correlao entre duas variveis representa a existncia de relao de causa e efeito entre as mesmas. Esses casos do origem s chamadas de influncia no caso. O estudo do relacionamento entre um conjunto de variveis pode ser realizado aplicando diversas tcnicas, desde os coeficientes de correlao de Pearson, de Spearman, Anlise Fatorial e a Anlise de Componentes Principais. A estatstica (2.76) conhecida como o coeficiente de correlao linear de Pearson e uma medida usada no estudo da relao linear existente entre duas varveis X e Y.
2.4.7 Seleo de Variveis Regressoras

Um dos problemas mais freqentes em Anlise de Regresso a seleo do conjunto de variveis independentes a serem includas no modelo (Neter e Wasserman, 1974). O pesquisador deve especificar o conjunto de variveis independentes a ser empregado para descrever, controlar ou predizer a varivel dependente. Um problema muito difcil de relacionamento que aparece na seleo de variveis quando uma equao de regresso construda com o objetivo de predio e envolve muitas variveis. Talvez, muitas delas contribuam pouco ou nada para a preciso da predio. A escolha apropriada de algumas delas fornece a melhor predio, porm quais e quantas devem ser selecionadas? (Snedecor e Cochram, 1972). Em algumas reas, a teoria pode ajudar na seleo das variveis independentes a serem empregadas e na especificao da forma funcional da relao de regresso. Os experimentos podem ser controlados para fornecer dados sobre a base de que os parmetros de regresso podem ser estimados e a forma terica da regresso testada. Em muitos outros campos, modelos tericos so raros. Assim, os investigadores so freqentemente forados a explorar as variveis independentes para que possam realizar estudos sobre a varivel dependente. Algumas das variveis independentes podem ser removidas seletivamente. Uma varivel independente pode no ser fundamental ao problema;

49

pode estar sujeita a grandes erros de medidas e pode duplicar outra varivel independente da lista. Assim, outras variveis independentes, que no podem ser medidas, podem ento ser excludas ou substitudas por variveis que esto altamente correlacionadas com estas. Normalmente, aps uma seleo inicial, o nmero de variveis independentes ainda grande. Sendo assim, o investigador geralmente desejar reduzir o nmero de variveis independentes a serem usadas no modelo final, existindo razes para isto: uma delas que um modelo de regresso com um nmero grande de variveis independentes caro para se utilizar. O problema torna-se, ento, de como reduzir a lista de variveis independentes de forma a obter a melhor seleo de variveis independentes. Este conjunto precisa ser pequeno para que a manuteno dos custos de atualizao do modelo seja manusevel e a anlise facilitada, e ainda, deve ser grande o suficiente de forma que seja possvel uma descrio, um controle e uma predio adequados. Existem muitos procedimentos de seleo, mas nenhum deles pode,

comprovadamente, produzir o melhor conjunto de variveis independentes. Dentre os procedimentos, pode-se citar como os mais comumente usados: todas as regresses possveis,
backward, forward e stepwise.
Todas as regresses possveis: consiste em ajustar todas as possveis equaes de

regresso. Aps a obteno de todas as regresses, devem-se utilizar os critrios para comparao dos modelos ajustados. Alguns critrios que podem ser usados so o R 2 (coeficiente de explicao), MSE (quadrado mdio dos resduos) e Cp (estatstica de Mallows). Para alguns conjuntos de variveis, os trs critrios podem levar para o mesmo melhor conjunto de variveis independentes. Este no o caso geral, pois diferentes critrios podem sugerir diferentes conjuntos de variveis independentes. Daniel e Wood (1971) recomendam, no caso de um grande nmero de equaes alternativas, o critrio do erro quadrado total para caracterizar a equao. A principal desvantagem do procedimento de procura de todas as regresses possveis a quantidade de esforo computacional necessria, j que cada varivel independente potencial pode ser includa ou excluda, gerando (2 p 1) regresses possveis quando existem p variveis independentes potenciais (Elian, 1998; Draper e Smith, 1981).

50

- Stepwise (passo a passo)

o mtodo mais usado dos mtodos de pesquisa que no requerem a computao de todas as regresses possveis. A rotina de regresso stepwise permite que uma varivel independente, trazida para dentro do modelo em um estgio anterior, seja removida subseqentemente se ela no ajudar na conjuno com variveis adicionadas nos ltimos estgios. Esta rotina empregada conduz a um teste para rastrear alguma varivel independente que seja altamente correlacionada com variveis independentes j includas no modelo. A limitao da procura da regresso stepwise que ela presume a existncia de um nico conjunto timo de variveis independentes e busca identific-lo. Como notado anteriormente, no existe freqentemente um nico conjunto timo. Outra limitao da rotina de regresso
stepwise, que ela algumas vezes surge com um conjunto de variveis independentes

razoavelmente fracos para predies, quando as variveis independentes esto altamente correlacionadas (Draper e Smith, 1981).
- Seleo forward

uma verso simplificada da regresso stepwise, omitindo o teste, se uma varivel uma vez que tenha entrado no modelo deva ser retirada. Este procedimento considera, inicialmente, um modelo simples usando a varivel de maior coeficiente de correlao com a varivel dependente. Uma varivel por vez incorporada at que no haja mais incluso, e as variveis selecionadas definem o modelo.
- Eliminao backward

Este procedimento de procura oposto seleo forward. Ele comea com o modelo contendo todas as variveis independentes potenciais. O procedimento backward requer mais clculos do que o mtodo de seleo forward, j que ele comea com o maior modelo possvel. Entretanto, ele tem uma vantagem de mostrar ao analista as implicaes do modelo com muitas variveis.

51

3 MATERIAL E MTODO

3.1 MATERIAL

3.1.1 rea de Estudo

A rea de estudo foi a cidade de Campo Mouro, situada ao Noroeste do Estado do Paran, distante 87 km de Maring, 323 km de Foz do Iguau, 477 km de Curitiba e 659 km de So Paulo e se constitui no maior entroncamento rodovirio do Sul do Brasil. Sede da Microrregio 12 (diviso administrativa estadual), Campo Mouro agrega 25 municpios com economia baseada inicialmente no setor primrio e hoje realiza investimentos na rea industrial, j em avanado estgio de implementao do setor secundrio e desenvolvimento do tercirio. A fertilidade da terra permite uma grande produtividade no campo. A rea cultivada de Campo Mouro ultrapassa os 50 mil hectares. As principais culturas so: soja, trigo, milho, algodo e aveia. Paralelamente agricultura, destaca-se o parque de revendas e assistncia tcnica de equipamentos e insumos. Campo Mouro sede da maior cooperativa singular da Amrica Latina, a Coamo - Cooperativa Agropecuria Mouroense, hoje Coamo Agroindustrial Cooperativa. As Coordenadas geogrficas do Municpio so 2402'38'' de Latitude Sul e 5222'40'' de Longitude Oeste do Meridiano de Greenwich, a uma altitude mdia de 630 metros sobre o nvel do mar. A seguir, na figura 3.1, tem-se a localizao da cidade no mapa do Estado do Paran.

52

Figura 3.1: Mapa com a localizao de Campo Mouro

Fonte: Prefeitura Municipal de Campo Mouro, 2005.

Campo Mouro limita-se com os seguintes Municpios: - Norte: Peabiru - Nordeste: Barbosa Ferraz - Sul: Luiziana - Leste: Corumbata do Sul - Oeste: Farol e Mambor - Noroeste: Araruna A seguir, na figura 3.2, tem-se o mapa dos municpios vizinhos de Campo Mouro.

53

Figura 3.2: Mapa dos municpios vizinhos Campo Mouro

Fonte: Prefeitura Municipal de Campo Mouro, 2005.

O Municpio de Campo Mouro pertence bacia hidrogrfica do Rio Iva, sendo seu rio mais importante o Rio Mouro, que atravessa o Municpio de sul a norte. Outros rios, importantes por serem condicionantes fsico-naturais expanso urbana de Campo Mouro, so o Rio km 119 e Rio do Campo, este ltimo, onde a SANEPAR coleta 80% da gua que abastece o municpio. A seguir tm-se outras informaes: rea da unidade territorial: 766,44 km; Populao estimada em 2004: 81.259 habitantes; Pessoas Residentes na rea Urbana: 74.754 habitantes;
Domiclios particulares permanentes em 2004: 22.829 domiclios;

Atividades imobilirias (aluguis e servios prestados s empresas): 36 empresas.


3.1.2 Limitaes da Pesquisa

A falta de dados para um melhor aprimoramento do modelo, pois a imobiliria TAPOVIC, mesmo sendo a maior imobiliria da cidade tinha poucos dados a oferecer, j que para uma boa segurana e confiana no tratamento estatstico, recomenda-se pelo menos o triplo do nmero de variveis para o nmero de informaes.

54

Outra limitao do trabalho o espao de tempo. Como qualquer alterao na economia provoca modificaes nos valores dos imveis, estes esto sujeitos s influncias dos governantes e das economias local, regional, nacional e global. Assim, no decorrer do tempo, existe uma flutuao dos valores dos imveis.
3.1.3 Levantamento dos Dados

Os dados foram aproveitados da pesquisa realizada por Silvia Neide Brulio (2004), feita de forma cautelosa, e dos dados depende o sucesso da Anlise Estatstica. Foi realizado um planejamento antes da coleta dos dados. Nesse planejamento contemplou-se o espao fsico, local onde est inserido o total de imveis, populao a estudar e o nmero de imveis a serem pesquisados. No mercado de imveis, freqente a entrada de dados novos, por isso, deve-se fazer um novo levantamento a cada nova avaliao para garantir a representao dos novos dados na amostra (Dantas, 1998). Na determinao da oferta imobiliria existem aspectos de extensa variao e combinao de atributos constituindo a heterogeneidade do produto habitao. Essa disperso deve estar presente na descrio completa do mercado, includa nas faixas de preos, tamanhos dos imveis e, ainda, nas diferentes localizaes. Assim, faz-se necessrio obter o maior nmero de dados e atributos possveis (Brulio, 2005).
3.1.3.1 As Variveis Utilizadas

As variveis explicativas (independentes) so do tipo quantitativo e qualitativo, representando as caractersticas do imvel, e esto a seguir detalhadas. A varivel resposta (dependente) o preo, que representa o valor de venda do imvel em reais. As varveis originais e as independentes esto relacionadas, classificadas e descritas nos Quadros 3.1, 3.2 e 3.3 para os tipos de imveis, apartamentos, casas e terrenos respectivamente.

55

Quadro 3.1: Variveis independentes para apartamento

Variveis Revestimento do prdio

Categorias

Descrio

1a4 1a4 Sem = 0 Com = 1 1a4 Sem = 0 Com = 1 At 1 ano = 6 2-5 anos =5 6-10 anos = 4 11-15 =3 15-20 anos =2 Mais de 20 =1 At 1 ano = 6 2-5 anos =5 6-10 anos = 4 11-15 =3 15-20 anos =2 Mais de 20 = 1 1a3 0 ou 1 1a3 1a3 Unidade Unidade Unidade Unidades Unidades
m2

Identifica o revestimento do prdio. Identifica o andar que o apartamento est localizado. Sabe-se que dependendo do andar que se localiza o apartamento ele mais ou menos valorizado. Identifica a existncia ou no de dependncia de empregados. Identifica o nvel de conservao do imvel. Identifica a presena ou no de sute, atribuindo o valor 1 mesmo quando h presena de mais de uma sute.

Andar Dependncia de empregado Estado de conservao Sute

Idade aparente

Idade aparente: idade aparente do edifcio. Por ser uma varivel contnua, a idade do imvel dividiu-se em perodos.

Idade real

Idade real: idade cronolgica do edifcio reflete o estgio tecnolgico.

Proximidade Lavanderia Posio do apartamento Padro de acabamento Sala Pavimento Garagem Dormitrio Elevador rea privativa Peas Banheiro

Identifica a quanto o imvel se localiza prximo de escolas, supermercados, hospitais e do centro comercial. Identifica a existncia ou no de lavanderia. Identifica a posio do apartamento em relao ao prdio (frente, lateral ou fundo). Identifica os vrios nveis de acabamento. Indica o nmero de salas existentes no apartamento. Indica o nmero de pavimentos do prdio. Quantifica o nmero de vagas para carro disponvel para cada apartamento. Quantifica o nmero de dormitrios. Identifica a quantidade de elevadores no prdio. Corresponde superfcie ou rea do apartamento expressa em metros quadrados, obtida do registro de imveis. Quantifica as peas constituintes do imvel. Identifica o nmero de banheiro social.

Unidades Unidades

Fonte: Imobiliria Tapowik, 2004.

56

Quadro 3.2: Variveis independentes: casas residenciais

Variveis

Categorias

Localizao Dependncia de empregado Nvel de conservao Sute Idade aparente

1a5 Completa = 1 Incompleta = 0,5 Inexistente = 0 1a4 0 ou 1 At 1 ano = 6 2-5 anos =5 6-10 anos = 4 11-15 =3 15-20 anos =2 Mais de 20 anos = 1

Descrio Naturalmente um local melhor ou pior do que um outro em funo de diversas caractersticas, entre as quais sua infra-estrutura urbana.

Identifica a existncia ou no de dependncia de empregado, completa ou incompleta. Identifica o nvel de conservao do imvel. Identifica a presena ou no de sute, atribuindo o valor 1 mesmo quando h presena de mais que uma sute.

Por ser uma varivel continua a idade do imvel dividiu-se em perodos.

Garagem Distncia de supermercados Presena de lavanderia Edcula Padro de acabamento Piscina Cobertura Estrutura Dormitrio rea do terreno rea construda Peas Banheiro

0 ou 1 1a3 0 ou 1 0 ou 1 1a3 0 ou 1 1a4 1a5 Unidades


m2 m2

Identifica a presena de garagem, onde atribudo o valor mesmo quando a mais que uma vaga. Identifica a proximidade do imvel de grandes mercados. Identifica a existncia ou no de lavanderia. Identifica a presena (1) ou no (0) de edcula. Identifica os vrios nveis de acabamento. Identifica a existncia ou no de piscina. Identifica o tipo de cobertura do imvel. Identifica o material de construo do imvel. Quantifica o nmero de dormitrios. Identifica a rea do terreno. Identifica a rea total construda. Quantifica as peas constituintes do imvel. Identifica o nmero de banheiro social.

Unidades Unidades

Fonte: Imobiliria Tapowik, 2005.

57

Quadro 3.3: Variveis independentes: terrenos

Variveis Localizao

Categorias 1a6

Plo de influncia Plano Inclinado Pavimentao Proteo Posio Frente

1 ou 1 0a3 0a3 0 ou 1 0 ou 1 1 ou 2 1a3

Ponto Comercial rea do terreno

0a3
m2

Descrio Varivel que qualifica a localizao do imvel. Indica se o mvel localiza-se prximo a locais que influenciam no seu valor Identifica se o terreno est acima, abaixo ou ao nvel da rua. Indica o nvel de inclinao do terreno. Identifica a presena ou no de pavimentao na rua ou avenida onde est inserido o terreno. Indica se o terreno possui ou no proteo (muro ou cerca). Identifica a posio do terreno na quadra (meio ou esquina). Identifica a largura do terreno. Sabendo que um terreno de frente com maior metragem possui uma melhor valorizao. Sabendo que os terrenos localizados em zona de comrcio ou de moradia, o terreno mais ou menos valorizado. Esta varivel identifica os vrios nveis de localizao. Quantifica a rea do terreno.

Fonte: Imobiliria Tapowik, 2005.

3.1.3.2 Amostra

A amostra foi constituda por 119 imveis. Sendo 44 apartamentos, 51 casas e 24 terrenos localizados na rea urbana da Cidade de Campo Mouro PR, dos quais 80 esto localizados na rea central.

3.2 METODOLOGIA PARA O DESENVOLVIMENTO DA PESQUISA

A metodologia aqui proposta procura determinar classes homogneas de apartamentos, casas e terrenos atravs de uma Anlise de Agrupamento aplicada amostra considerada. Utilizaram-se as tcnicas de inferncia, no nvel de avaliao rigorosa, de acordo com NB-502/89 (avaliao de imveis urbanos), com o desenvolvimento de um programa em MAT LAB, para o processamento dos dados e o Software Excel , por ser um aplicativo de

58

uso quase universal. A Anlise de Agrupamento foi aplicada para juntar imveis semelhantes. Utilizou-se a Distncia Euclidiana e a ligao pelo mtodo de Ward. Ento, a partir dos grupos formados (clusters), aplicou-se o mtodo de Componentes Principais, procurando eliminar o problema da multicolinearidade que pode ocorrer na regresso do preo. Assim, conservaram-se as primeiras componentes e as que constituem um resumo de informao mais importante da estrutura de covarincia. Com a finalidade de alcanar um dos objetivos deste, que a obteno do modelo de preciso, foi desenvolvido um estudo com a tcnica da Regresso Linear Mltipla, para prever dentro de cada agrupamento o valor de um novo imvel. As primeiras ferramentas descritas so para atender o objetivo de estudo das variveis que participam da construo do modelo de Regresso Linear Mltipla.
3.2.1 Consideraes Para a Construo do Modelo

As etapas, ou roteiro, que so necessrias para construir um modelo matemtico atravs de critrios multivariados usando a Regresso Linear Mltipla com a finalidade de estimar valores de imveis urbanos em Campo Mouro so apresentados a seguir.
3.2.1.1 Identificao das Variveis Independentes

Uma das dificuldades existentes na avaliao de imveis a determinao das variveis que influenciam no seu valor. So muitos os fatores que devem ser levados em considerao, mas nem sempre se pode desenvolver um nico modelo representativo da realidade do conjunto do mercado de imveis. Um dos aspectos mais importantes na avaliao de imveis a seleo das variveis independentes que possam ser utilizadas na regresso, que so aquelas que tm influncia na formao do preo, pois so variveis importantes na formao de valor de uma determinada categoria ou subconjuntos de imveis, no necessariamente so as mesmas que para outro subconjunto, inclusive dentro de uma mesma regio. As possveis variveis independentes (ou explicativas) que podem influenciar no preo de um imvel devem ser listadas a priori. A definio das variveis explicativas preliminarmente economiza tempo e diminui o custo de execuo da pesquisa. Em algumas ocasies necessrio desconsiderar alguns dos elementos da amostra coletada pelo fato de serem elementos diferenciados do resto, razo pela qual sua presena afeta fortemente os valores globais da equao de regresso, no permitindo ento a sua considerao no modelo de avaliao. As variveis explicativas para a avaliao de imveis so aquelas referentes a

59

todas as caractersticas fsicas e locacionais do imvel. No entanto, dentre todas as caractersticas fsicas e locacionais relacionadas a um imvel, nem todas so relevantes formao de seu preo. De forma geral e preliminar, podem-se citar como relevantes formao do preo, as seguintes variveis explicativas. Apartamentos: rea total, rea til, nmero de dormitrios, nmero de sute, nmero de carros na garagem, dependncias de empregados, idade do imvel, elevador, estado de conservao, padro de acabamento, regio de valorizao imobiliria, distncia escola, etc. Casas residenciais: Estado de conservao, rea construda, rea do terreno, localizao, nmero de sutes, dependncia de empregados, estrutura, padro de acabamento, entre outras. Terrenos: rea total, comprimento frontal (frente), localizao, rea comercial, etc. Essa lista de variveis explicativas tende a variar de municpio para municpio, dependendo das caractersticas de cada um. Para a cidade de Campo Mouro PR, a varivel explicativa mais relevante a de proximidade do centro comercial.
3.2.1.2 Transformaes de Variveis

As variveis que so definidas para a caracterizao e localizao de um imvel so do tipo quantitativas ou qualitativas. Geralmente, estas variveis precisam sofrer transformaes para que ento possam ser realizadas as anlises. As variveis qualitativas devem ser quantificadas atravs de uma codificao adequada. Em muitas situaes so atribudas para as variveis qualitativas o valor 0 (zero) quando no tem a caracterstica e 1 (um) caso contrrio. Ento, tem-se uma varivel do tipo dummy, pronta para ser utilizada para anlise. E outras variveis que se referem s caractersticas qualitativas dos imveis, como a conservao do imvel (pssimo, regular, bom e timo); classificao do imvel (baixo, normal e alto) e outras, so casos que so resolvidos dando pesos para a caracterstica. Geralmente esses pesos so na ordem crescente, da situao menos favorvel para a mais favorvel. E ainda, quando uma varivel pode vir a gerar um nmero muito grande de modalidades, algumas vezes, ela pode ser definida por uma escala numrica, atribuindo-se tambm pesos s modalidades, (por exemplo, a idade do imvel).

60

As variveis originais apresentadas nos Quadros 3.1, 3.2 e 3.3, foram transformadas utilizando a tcnica multivariada Anlise de Componentes Principais.
3.2.1.3 Anlise Exploratria

Para o estudo de relacionamento entre as variveis pode ser utilizado, entre outros, o coeficiente de correlao de linear de Pearson para as variveis quantitativas e as qualitativas, sendo que, no segundo caso, elas devem ser transformadas em dummy. O coeficiente de correlao indica a existncia ou no de relao linear significativa entre as variveis independentes e a varivel dependente, informao necessria para uso da regresso linear. Esses coeficientes, quando apresentam valores altos entre as variveis independentes, indicam a possvel existncia de multicolinearidade, e ainda, o valor do determinante da matriz (XX), quando prximo de zero, tambm indica a existncia de multicolinearidade. Apesar do coeficiente de correlao linear de Pearson e do determinante da matriz (XX) indicar a existncia da multicolinearidade, eles no a quantificam.
3.2.1.4 Anlise dos Resduos

A investigao da adequao do modelo uma etapa do procedimento necessrio na anlise dos dados, to importante quanto a sua construo. A plotagem dos resduos o instrumento usado para examinar o modelo. A anlise grfica dos resduos necessria para examinar o ajuste do modelo, ou seja, para confirmar se ele tem uma boa aproximao do verdadeiro sistema e para verificar se as suposies da regresso por mnimos quadrados no foram violadas (Montgomery, 1997).
3.2.1.5 Verificao da Adequao do Modelo

Um ltimo passo que deve ser realizado antes de adotar o modelo para avaliao de imveis, verificar sua aplicabilidade. Inicialmente, deve-se fazer a Anlise de Varincia para testar a significncia do modelo ajustado, no entanto, isto por si s no garante a qualidade das predies. A qualidade do ajuste pode ser testada comparando os valores preditos com os valores observados. O ajuste to bom, quanto maior for a quantidade de valores preditos prximos dos valores observados, isto , com pequeno erro de predio. O valor do coeficiente de correlao linear R2 importante para definir a qualidade do modelo adotado.

61

3.3 ESTUDO DE CASO

Neste trabalho, efetuou-se um estudo no mercado imobilirio da Cidade de Campo Mouro PR, restringindo-se ao segmento de imveis urbanos, cujo objetivo ser modelar este mercado atravs da Anlise de Regresso, pautando-se da Anlise Multivariada e estimar ou calcular o valor de venda de apartamentos, casas e terrenos, de forma absolutamente objetiva, sem qualquer opinio originria da subjetividade intrnseca do ser humano. O Software utilizado para a construo da tabela de dados e as devidas transformaes foi o Excel. As matrizes de dados resultantes (apartamentos, casas e terrenos) foram submetidas aos tratamentos estatsticos descritos no segundo captulo. Todos os resultados estatsticos foram obtidos atravs do programa desenvolvido em Matlab, verso 7.0 e comparados com os resultados obtidos no Software Statgraphics. Em primeiro lugar as matrizes de dados foram submetidas Anlise de Agrupamentos (clusters) hierrquicos, utilizando-se a Distncia Euclidiana, sendo que os agrupamentos foram feitos por meio da ligao de Ward para formar as classes homogneas. Aps vrias simulaes, ficou claro que o nmero timo de classes a considerar para o caso de residncias seria quatro e para os apartamentos trs, enquanto para os terrenos apenas duas classes. Aps a formao das classes homogneas realizou-se uma Anlise Discriminante para avaliar a consistncia das classes obtidas. Em seguida realizou-se uma Anlise de Componentes Principais para cada classe formada para os tipos de imveis. Com a obteno dos escores das Componentes Principais para explicar a variao total, substituiu-se as variveis explicativas originais. Por fim foi desenvolvido um modelo de Regresso Linear Mltipla para cada uma das classes de cada tipo de imvel. Considerou-se como varivel resposta o preo de venda vista, que se denominou valor.

62

4 APLICATIVO AMI DESENVOLVIDO

Para resolver os problemas de trabalho manual, necessrio no Software Statgraphics, foi desenvolvido um programa denominado AMI (Anlise Multivariada de Imveis) em
Matlab 7.0. O programa desenvolvido est no Anexo 1.

4.1 ALGORITMO DO PROGRAMA AMI

O algoritmo usado para o desenvolvimento do aplicativo foi o seguinte: 1. Leitura de dados da planilha Excel. Esta base de dados contm as variveis em colunas e as observaes em linhas, estando a varivel dependente na ltima coluna. 2. Aps a leitura, o programa mostra as trs opes de clculo para a regresso com os seguintes tratamentos das observaes: a. b. c. Anlise de Agrupamentos e Anlise de Componentes Principais. Anlise Fatorial. Regresso Mltipla Simples (sem nenhum tratamento).

a1. Formao de grupos (clusters), nesta etapa o usurio seleciona um tipo de distncia dentre as seguintes:
d = 1, EUCLIDEAN (distncia euclidiana). d = 2, SEUCLIDEAN (quadrado da distncia euclidiana). d = 3, CITYBLOCK (distncia Manhattan) d = 4, MAHALANOBIS (distncia estatstica). d = 5, MINKOSWSKI (usando n = 3)

63

assim como tambm os tipos de ligao entre os grupos, tais como:


t = 1, SINGLE (Vizinho mais prximo). t = 2, COMPLETE (Vizinho mais distante) t = 3, AVERAGE (Mdia das distancias). t = 4, WARD (Mtodo de Ward).

O programa apresenta um dendrograma para a avaliao de formao de K grupos, o programa pergunta o nmero de grupos a formar. a2. Com os K grupos formados o programa reagrupa as n observaes em K matrizes para a anlise das componentes principais. a3. Para o grupo i so verificadas as anlises das componentes principais, mostrando uma tabela com a proporo da varincia explicada pelos autovalores da matriz covarincia e o programa pede ao usurio o numero de p componentes principais a serem usados. a4. Para o grupo i, tendo as componentes principais, feita a anlise de regresso mltipla, mostrando a funo de regresso, o parmetro R2 (coeficiente de correlao linear) e os parmetros da avaliao da varincia F e p. a5. No caso de calcular o valor de um imvel, as observaes (variveis independentes) devem ser colocadas na ltima linha com a varivel dependente igual a zero. Neste caso os processos 1, a1 e a2 so iguais e ser analisado unicamente o grupo j, onde a ltima observao pertence. Em continuao so realizados os processos a3 e a4 para o grupo j e calculado o valor da varivel dependente com a funo regresso, mostrando os parmetros das estatsticas. Para o caso da opo 2 (Anlise Fatorial), tem-se a seguinte seqncia do algoritmo: b1. O AMI avalia os autovalores da matriz de correlao das observaes e mostra a proporo da varincia explicada acumulada para o usurio selecionar o nmero
N de fatores a serem analisados.

64

b2. O programa faz a regresso dos escores rotacionados (varimax) de todas as observaes (sem a ltima coluna que o preo) para serem usados na regresso. b3. Para os escores de todas as observaes com n componentes so calculados os coeficientes da equao de regresso mltipla, mostrando a equao de regresso, o parmetro R2 (coeficiente de correlao linear) e os parmetros da avaliao da varincia F e p. b4. Se o preo da ltima observao for zero, ser estimado o valor da varivel dependente (preo) da mencionada observao. Para o caso da opo 3 (Regresso Mltipla Simples), a seqncia do algoritmo a seguinte: c1. Com base nas observaes (com todas as variveis) so calculados os coeficientes da equao de regresso mltipla, mostrando a equao de regresso, o parmetro R2 (coeficiente de correlao linear) e os parmetros da avaliao da varincia F e p. c2. Se o preo da ltima observao for zero, ser estimado o valor da varivel dependente (preo) da mencionada observao. Na figura 4.1 a seguir, apresentado o diagrama de fluxo do programa AMI.

65

Figura 4.1: Diagrama de fluxo do programa AMI


Leitura de dados da planilha Excel XY = Matriz de ordem n x m Mostra as 3 opes de regresso: Op = 1 (Agrupamentos e ACP) Op = 2 (Anlise Fatorial) Op. = 3 (Sem tratamentos) Fim Regresso mltipla Calcula Y se XY (n, m) = 0 sim

Op = 3 no Op = 1 sim Definio dos parmetros: d = tipo de distancia t = tipo de ligao K = nmero de grupos Op = 2 no

sim

Anlise Fatorial com escores rotacionados (Varimax)

Regresso mltipla Calcula Y se XY (n, m) = 0 Formao de grupos (clusters) Fim no XY (n,m) 0 sim J = grupo onde a observao i pertence

sim

Anlise de Componentes Principais para o grupo J

no iK Fim Clculo da varivel dependente Y Anlise de Componentes Principais para o grupo i Fim Regresso mltipla para o grupo i i = i+1 Fonte: O Autor, 2005. Regresso mltipla para o grupo J

sim

66

4.2 AVALIAO DO AMI

Os resultados foram comparados com os resultados do Software Statgraphics Plus


5.0, e a seqncia para realizar o objetivo (regresso mltipla) neste aplicativo a seguinte:

1) Abrir o programa e na planilha prpria colar a base de dados do Excel. Na seqncia faz-se a anlise de agrupamentos com as opes de K grupos, variveis padronizadas. 2) Uma vez formados os grupos, o programa indica simplesmente quais observaes pertencem aos K grupos. No Excel faz-se a redistribuio das observaes em K grupos, que seria em K sub-pastas. Este trabalho feito manualmente demandando tempo e cuidado, pois se fossem centenas ou milhares de observaes, o tempo seria de algumas horas ou dias. 3) Com as observaes enquadradas em cada grupo feitas no Excel, colar na planilha prpria os dados. Para este grupo analisam-se as componentes principais com as opes de nmero das componentes principais (i). Os resultados so as i componentes do grupo, salvar os resultados na planilha prpria do Statgraphics. 4) Na seqncia realiza-se a regresso mltipla tendo como dados as componentes principais e verificam-se os parmetros das estatsticas da regresso. Neste processo, o tempo de execuo total dos itens 1, 2, 3 e 4 de vrias horas, dependendo da prtica com o programa Statgraphics e da segurana de que tudo o que feito manualmente no tenha erros. Usando o programa AMI, o tempo quase nulo, pois tudo realizado pelo programa. Os resultados so idnticos aos resultados do Statgraphics.

67

4.3 DESCRIO DO PROGRAMA AMI

A seqncia das janelas apresentadas pelo AMI :


Figura 4.2: Entrada de dados usando um arquivo do Excel

Figura 4.3: Mostrando os tipos de opes de clculo para a regresso

68

Figura 4.4: Com a opo 1 mostrando os tipos de distncia e ligaes

Este grfico mostra que a melhor ligao entre os grupos average, ou seja, que a mdia das distncias com ndice cofentico igual a 0,74361.
Figura 4.5: Dendrograma apresentado para a escolha de nmero de grupos

69

Neste processo podem ser selecionados 2, 3 ou 5 grupos, mas foram selecionados 2 grupos.
Figura 4.6: Grupos formados

Figura 4.7: Processo 2: anlise de Componentes Principais para o grupo 1

Nesta etapa foi excluda a coluna 3 (varivel 3) por possuir valores iguais, uma caracterstica deste grupo. O programa pergunta o nmero de componentes a serem usadas, neste caso, o programa indica que tem que ser menor a 17 componentes, pois a condio que o nmero de observaes para uma regresso tem que ser maior ao nmero de componentes.

70

Figura 4.8: Perguntando o nmero de componentes e o processo de regresso

O nmero de componentes usado neste caso ser de 10 com uma varincia explicada acumulada de 97,22 %. A figura 4.8 tambm mostra a equao de regresso para o grupo 1:
Y = -231,1999*CP1 + 1 782,8403*CP2 9 175,1104*CP3 3 518,4216*CP4 +

+ 10 126,8349*CP5 + 507,8941*CP6 + 10 383,084*CP7 + 1 744,384*CP8 + + 5 895,8829*CP9 + 11 933,8859*CP10 + 21 461,2404, com R2 = 0,9006 e a anlise da varincia com F = 5,4375 e com valor da significncia de 0,02527, o que significa que se rejeita a hiptese de no haver regresso. Analogamente os resultados so mostrados para o grupo 2:
Y = -12 140,2077*CP1 + 7 491,9091*CP2 7 889,13*CP3 + 2 967,7093*CP4 +

+ 22 871,6474*CP5 7 286,1078*CP6 9 574,2814*CP7 + 10 397,2659*CP8 + + 1 479,4856*CP9 -23 796,0254*CP10 117 191,3768, com R2 = 0,7857, F = 5,8658 e
p = 0,00095.

Ambos os grupos tm R2 > 0,75 indicando boa correlao.

71

No caso de calcular o valor da varivel dependente de uma nova observao, colocase esta observao na ltima linha na planilha do Excel com o preo igual a zero. Veja o exemplo na continuao:
Figura 4.9: Calculando o valor do 45 apartamento

O valor do mercado de R$110 000,00, mas, para testar esta observao, foi colocado um valor de 0.
Figura 4.10: Estimando o valor da ltima observao

A ltima observao pertence ao segundo grupo e o programa simplesmente analisou este grupo e o valor estimado para esta observao de 132 609.81, com um coeficiente de regresso de 0,7827 com 10 componentes. Na seqncia ser analisado por Anlise Fatorial, digitando 2 na opo de anlise:

72

Figura 4.11: Analisando os apartamentos por Anlise Fatorial

Aps mostrar os autovalores e a proporo da varincia acumulada, o programa pergunta o nmero de fatores a serem considerados.
Figura 4.12: AMI perguntando o nmero de fatores

73

Depois de digitado o nmero de componentes para a anlise da regresso com 10 componentes, o programa mostra o seguinte:
Figura 4.13: Regresso com Anlise Fatorial

A equao da regresso com 10 fatores :


Y = 44 065,0343*F1 + 8 908,6589*F2 17 686,0306*F3 + 7 885,606*F4 -

- 5 654,0828*F5 + 11 501,3934*F6 + 6 105,4323*F7 + 15 266,1667*F8 + 16 396,1855*F9 - 14 413.7115*F10 + 125 068,2457. O valor da ltima observao de 116 002,81 com um coeficiente de regresso de 0,7916, o que significa que a anlise da varincia rejeita a hiptese de no haver regresso. Da mesma forma pode-se optar pela terceira opo e fazer uma regresso diretamente com as variveis, sem nenhum tratamento.

74

Figura 4.14: Regresso considerando todas as variveis

Figura 4.15: Resultados da regresso

A equao da regresso de:

75

Y = 11 165,4093*V1 + 1 756,9593*V2 + 26 018,5638*V3 + 112 463,3882*V4 +

+ 418,4552*V5 1 647,8111*V6 + 2 186,2769*V7 13 924,2677*V8 + 14 916,216*V9 + + 43 800,5883*V10 32 571,4002*V11 + 22 319,6361*V12 + 52 736,861*V13 - 1 830,7984*V14 + 3 151,1696*V15 15 814,0065*V16 + 5 499,5626*V17 + + 11 482,7732*V18 -13 218,9298*V19 + 13 260,6722*V20 + 4 652,535*V21 -164 341,852 Como se pode observar, os parmetros so bons e o valor da ltima observao estimada de 98 949,7482. Analisando os trs casos, quem mais se aproxima do valor a opo 2:
Tabela 4.1: Comparao dos valores estimados pelas 3 opes
opes opo 1 opo 2 opo 3 valor 110 000,00 110 000,00 110 000,00 estimado 132 609,81 116 002,81 98 949,75 diferena -22 609,81 -6 002,81 11 050,25 diferena % 20,55 5,457 10,046

Neste caso pode-se falar que o preo de R$110 000,00 um estimativo do valor de mercado, cujas regras de deciso variam.

4.4 COMPARAO DOS RESULTADOS ENTRE O PROGRAMA STATGRAPHICS E O AMI

i)

Na formao de grupos (cluster) ambos com distncia euclidiana e agrupamento de Ward. No Statgraphics os 2 grupos formados so: GRUPO 1 = 1 4 5 6 7 10 13 14 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 35 36 (27) GRUPO 2 = 2 3 8 9 11 12 15 33 34 37 38 39 40 41 42 43 44 (17) No AMI os 2 grupos formados so:

76

GRUPO 1 = 6 8 9 11 12 13 15 16 17 20 33 34 37 38 39 40 41 (17) GRUPO 2 = 1 2 3 4 5 7 10 14 18 19 21 22 23 24 25 26 27 28 29 30 31 32 35 36 42 43 44 (27) Na avaliao dos resultados, as observaes comuns so: Os grupos tm as mesmas quantidades com os nomes dos grupos diferentes: Similaridade entre os Grupos com 27 observaes = 22 de 27 = 81,5% Similaridade entre os Grupos com 17 observaes = 12 de 17 = 70,6% Essa diferena existe quando as distncias so iguais, ficando o programa com a deciso de formao dos grupos. ii) Na anlise de componentes principais, para este caso usam-se os grupos formados pelo programa AMI e rodando no programa Statgraphics. Com os escores das 10 componentes principais (col1, col2,..., col10, col11 = preo) extrados a partir da matriz de correlao das observaes, a regresso obtida no Statgraphics :
Analysis of Variance --------------------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value --------------------------------------------------------------------------------------------Model 7.58821E9 10 7.58821E8 5.44 0.0253 Residual 8.37324E8 6 1.39554E8 -------------------------------------------------------------------------------------------Total (Corr.) 8.42553E9 16 R-squared = 90.0621 percent R-squared (adjusted for d.f.) = 73.4988 percent Standard Error of Est. = 11813.3 Mean absolute error = 5300.13 The equation of the fitted model is Col_11 = 21 461,3 231,192*Col_1 + 1 782,82*Col_2 9 175,1*Col_3 - 3 518,4*Col_4 + 10 126,8*Col_5 + 507,89*Col_6 + 10 383,1*Col_7 + + 1 744,42*Col_8 + 5 895,85*Col_9 + 11 933,9*Col_10 No AMI para o grupo 1: REGRESSO MLTIPLA Y = - 231,1999*CP1 + 1 782,8403*CP2 - 9 175,1104*CP3 - 3 518,4216*CP4 + + 10 126,8349*CP5 + 507,8941*CP6 + 10 383,084*CP7 + 1 744,384*CP8 + + 5 895,8829*CP9 + 11 933,8859*CP10 + 21 461,2404 ESTATSTICA DO MODELO R
2

= 0,90062

F = 5,4375

p = 0,025266

77

Como se pode observar, os resultados da regresso so iguais. Para o grupo 2, os resultados no Statgraphics so:
Analysis of Variance ---------------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value ---------------------------------------------------------------------------------------Model 6.45385E10 10 6.45385E9 5.79 0.0010 Residual 1.78356E10 16 1.11472E9 ---------------------------------------------------------------------------------------Total (Corr.) 8.23741E10 26 R-squared = 78.3481 percent R-squared (adjusted for d.f.) = 64.8156 percent Standard Error of Est. = 33387.5 Mean absolute error = 18693.2 The equation of the fitted model is Col_11 = - 11 3123,0 11 708,1*Col_1 + 7 395,67*Col_2 7 784,78*Col_3 + + 4 194,68*Col_4 + 23 199,4*Col_5 7 958,46*Col_6 7 123,08*Col_7 + + 12 618,3*Col_8 + 2 370,04*Col_9 21 388,6*Col_10 E no AMI tem-se: REGRESSO MLTIPLA Y = -11 708,2947*CP1 + 7 395,6095*CP2 -7 784,6064*CP3 + 4 194,7926*CP4 + + 23 199,3472*CP5 -7 958,6098*CP6 -7 123,0317*CP7 + 12 618,4508*CP8 + + 2 369,774*CP9 -21 389,0761*CP10 -113 121,4588 ESTATSTICA DO MODELO R2 = 0,78348 F = 5,7897 p = 0,0010212.

Analisando os resultados, pode-se afirmar que so aproximadamente iguais. Com valores de R2 >75 %.
4.4.1 Resumo dos Resultados para Apartamentos

Dados com 44 observaes e 22 variveis: GRUPO 1 = 6 8 9 11 12 13 15 16 17 20 33 34 37 38 39 40 41 (17)


Y = -231,1999*CP1 + 1 782,8403*CP2 9 175,1104*CP3 3 518,4216*CP4 +

+ 10 126,8349*CP5 + 507,8941*CP6 + 10 383,084*CP7 + 1 744,384*CP8 + + 5 895,8829*CP9 + 11 933,8859*CP10 + 21 461,2404. Neste grupo foi desconsiderada a varivel 3 (elevador = 1) por possuir todos os valores iguais a 1 e R2 = 0.9006. GRUPO 2 = 1 2 3 4 5 7 10 14 18 19 21 22 23 24 25 26 27 28 29 30 31 32 35 36 42 43 44 (27)

78

Y = -11 708,2947*CP1 + 7 395,6095*CP2 7 784,6064*CP3 + 4 194,7926*CP4 +

+ 23 199,3472*CP5 7 958,6098*CP6 7 123,0317*CP7 + 12 618,4508*CP8 + + 2 369,774*CP9 -21 389,0761*CP10 113 121,4588. Neste grupo foram desconsideradas as variveis 4 (localizao = 1) e 11 (sute = 1) por possuir todos os valores iguais e R2 = 0.7835.
4.4.2 Resumo dos Resultados para Casas

Dados com 51 observaes e 19 variveis:


Opo 1: (Anlise de Agrupamentos e Componentes Principais)

Tipo de distncia euclidiana e tipo de ligao ward, formada em 4 grupos. GRUPO 1 = 8 12 13 14 24 25 26 28 31 34 44 48 (12) Equao da regresso com 10 componentes principais:
Y = 2 352,8701*CP1 + 14 682,8764*CP2 26 680,0908*CP3 2 143,8816*CP4 -

-15 706,917*CP5 16 068,2388*CP6 807,695*CP7 + 2 837,1778*CP8 + + 30 340,9987*CP9 + 7 161,036*CP10 + 335 172,8204. Neste grupo foi desconsiderada a varivel piscina por possuir todos os valores iguais zero (sem piscina) e R2 = 0.9123. GRUPO 2 = 1 3 4 5 6 9 10 15 16 17 19 20 22 29 30 32 36 38 40 43 45 46 47 49 51 (25) Equao da regresso com 10 componentes principais:
Y = 12 220,9925*CP1 + 307,181*CP2 3 553,3992*CP3 + 8 534,9659*CP4 -

- 21 673,6631*CP5 + 1 399,9938*CP6 406,8441*CP7 + 24 863,9387*CP8 + + 3 076,8517*CP9 + 7 133,0792*CP10 135 246,2812. Neste grupo no foi desconsiderada nenhuma varivel, pois possuem valores diferentes e R2 = 0.9123. GRUPO 3 = 2 7 11 21 35 37 39 (7)

79

Equao da regresso com 05 componentes principais:


Y = 3 381,742*CP1 + 25 395,7101*CP2 3 085,5499*CP3 + 2 998,7434*CP4 +

+ 35 063,3867*CP5 + 38 609,3956 Neste grupo foram desconsideradas as variveis 2 (garagem = 1) e 16 (lavanderia = 1), pois possuem valores iguais e R2 = 0. 9509. GRUPO 4 = 18 23 27 33 41 42 50 (7) Equao da regresso com 05 componentes principais:
Y = -8 719,292*CP1 4 037,9719*CP2 4 617,7801*CP3 1 899,7625*CP4 -

- 4 786,5778*CP5 69 709,5748 Neste grupo foram desconsideradas as variveis 11 (estrutura = 3) e 13(piscina = 0), pois possuem valores iguais e R2 = 0.9994.
Opo 2: (Anlise Fatorial)

Equao da regresso com 10 fatores:


Y = 17 160,2815*F1 + 18 097,7924*F2 + 3 788,0114*F3 + 11 702,6414*F4 +

+ 21 321,633*F5 + 5 647,0059*F6 + 11 399,342*F7 + 21 162,3526*F8 + 30 948,3984*F9 + + 5 791,8663*F10 + 96 745,098 e R2 = 0.7847.


Opo 3: (Regresso Mltipla Simples, com todas as variveis).

Y = 9 613,4525*V1 + 22 164,1341*V2 + 671,2289*V3 + 4 524,6907*V4 -

- 930,9592*V5 + 6 691,6853*V6 + 225,8114*V7 + 85,0273*V8 + 12 495,6409*V9 - 10 415,1484*V10 + 21 678,8472*V11 1 476,9568*V12 + 17 263,8745*V13 - 18 058,2558*V14 + 6 853,9381*V15 20 153,3818*V16 + 5 775,6852*V17 - 1 684,3853*V18 -94 861,0962 e R2 = 0. 8366. Colocando zero no preo da ltima observao (preo = 40000).

Tabela 4.2: Comparao dos valores estimados pelas 3 opes

80

opes opo 1 opo 2 opo 3

valor 40 000,00 40 000,00 40 000,00

estimado 42 734,52 47 381,33 58 096,46

diferena -2 734,52 -7 381,33 -18 096,46

diferena % 6,836 18,45 45,24

4.4.3 Resumo dos Resultados para Terrenos

Dados com 24 observaes e 11 variveis:


Opo 1: (Anlise de Agrupamento e Componentes Principais)

Tipo de distncia euclidiana e tipo de ligao ward, formada em 4 grupos. GRUPO 1 = 1 2 3 4 5 8 9 10 11 12 16 18 19 20 21 22 23 24 (18)
Y = 15 508,3498*CP1 + 6 408,5873*CP2 + 19 369,2796*CP3 + 14 705,3493*CP4 -

- 4 078,808*CP5 4 154,5414*CP6 + 3 939,7138*CP7 + 5 781,7527*CP8 + 5 864,1289*CP9 - 16 556,4398*CP10 50 239,7229 e R2 = 0.9799. GRUPO 2 = 6 7 13 14 15 17 (6) As variveis de nmeros 3 (plo = 1), 4 (frente = 3), 8 (inclinado = 0) e 10 (pavimentao = 1) foram eliminadas por possurem valores iguais. Dessa forma, a equao dada por:
Y = 66 082,5699*CP1 2 285,7628*CP2 + 12 034,3121*CP3 + 21 812,3321*CP4 -

- 28 360,0695*CP5 28 291,8593 e R2 = 1.0.


Opo 2: (Anlise Fatorial) com 5 fatores

Y = 21 269,8524*F1 5 876,4286*F2 + 22 094,3272*F3 + 55 872,7757*F4 +

+ 19 952,1654*F5 + 74 458,3333 e R2 = 0. 8491.


Opo 3: (Regresso Mltipla Simples)

Y = 14 982,0119*V1 + 42 917,3384*V2 2 101,3467*V3 + 1 628,9076*V4 +

+ 11,1196*V5 + 4 029,0109*V6 + 5 702,7019*V7 2 524,9226*V8 + 16 158,2245*V9 - 3 402,4047*V10 65 237,4996 e R2 = 0. 8643. Colocando zero na varivel preo na ltima observao: (preo = 30.000,00).

81

Tabela 4.3: Comparao dos valores estimados pelas 3 opes


opes opo 1 opo 2 opo 3 valor 30 000,00 30 000,00 30 000,00 estimado 21 264,52 18 216,87 21 275,44 diferena 8 735,48 11 783,13 8 724,56 % 29,118 39,277 29,082

82

5 CONSIDERAES FINAIS

Em 1918, em nosso pas mostram-se os primeiros estudos de avaliao de imveis e j em 1923 foram introduzidos novos mtodos de avaliao de terrenos, que a partir de 1929 comearam a ser sistematicamente aplicados. Nesse contexto a engenharia de avaliao no Brasil tomou corpo e continua crescendo e evoluindo nas tcnicas de avaliao. Atualmente um grande nmero de profissionais e entidades desenvolve estudos nesse campo, visando dar ao tema o suporte cientfico necessrio aos mtodos tcnicos at ento utilizados (Fiker, 1997). Este trabalho mostra a importncia de usar um programa computacional para a avaliao de imveis em qualquer cidade desde que se tenha uma base de dados atualizados e pode ser usado por engenheiros, arquitetos e agrnomos, cada um atuando em sua habilitao profissional, conforme normas e regulamentos do CREA, CONFEA, ABNT, leis municipais, estaduais e federais.

5.1 CONCLUSES As concluses pertinentes ao trabalho so:


Com o tratamento estatstico dos dados das observaes evitou-se problema de

multicolinearidade e valores das caractersticas iguais podem ser eliminados para evitar divises por zero no clculo da correlao. Ainda, reduziu-se a quantidade de variveis para a regresso, ou seja, a matriz de dados ficou com a ordem mais baixa.
J com a Anlise Fatorial tambm pode se fazer uma boa regresso evitando a

multicolinearidade atravs do rotacionamento dos escores sem perda significativa de informao e obtendo, assim, variveis no correlacionadas.
O programa AMI, no exclusivo para a cidade de Campo Mouro, pode ser

usada em qualquer cidade, basta possuir os dados atualizados obedecendo ao formato de entrada num arquivo de Excel, onde as colunas so as variveis e as

83

observaes so as linhas. Recomenda-se que o nmero de observaes seja maior que o nmero de variveis, e se usar a opo 1 (agrupamentos) o nmero de observaes ainda muito maior (na ordem de 3 vezes maior que o nmero de variveis).
Nos trs casos de avaliao tm-se regresses com R2 maiores que 75 %, o que

garante a consistncia da regresso para estimativa dos preos dos imveis. Isto se deve tambm boa coleta de dados representativos.
De acordo com os apndices 5, 6 e 7 a melhor opo para apartamentos, casas e

terrenos e a opo 1, que usa as tcnicas multivariadas de agrupamentos homogneos e para cada grupo usa a Anlise de Componentes Principais para reduzir as variveis e evitar variveis altamente correlacionadas, desta forma evita-se a multicolinearidade.
De acordo com os apndices 5, 6 e 7, a opo menos recomendada a opo 3,

pois os dados no sofrem tratamento estatstico, dessa forma tm-se problemas de multicolinearidade.
De acordo com o apndice 6 para o grupo 1 (12 observaes) os parmetros das

estatsticas foram R2 = 0.99675

F = 30.7138

p = 0.13959, o valor de

p=13,96%, de maneira que se aceita a hiptese nula, a de no existir regresso, da

mesma forma para o grupo 3 com p = 36,69%, de acordo a estes resultados podese afirmar que para o uso da opo 1, o nmero de observaes deve ser maior que nmero de variveis de cada grupo, dessa forma, se usar os agrupamentos, o nmero de observaes deve ser maior pelo menos o nmero de vezes o dos grupos formados.
A metodologia multivariada aplicada neste trabalho se mostrou vivel, atingiram-

se resultados com alto nvel de preciso e a metodologia pode ser aplicada de modo geral em imveis de outras cidades, ainda melhorando o questionrio ao nvel de quantificao das respostas. Dessa forma, o presente trabalho procurou oferecer uma contribuio na rea de Engenharia de Avaliao.

84

5.2 SUGESTES PARA FUTURAS PESQUISAS

1) Construir um programa em linguagem visual para uso de pessoas leigas e com poucas instrues para o clculo (donos de imobilirias) sem precisar do programa Matlab. 2) Comparar com modelos de redes neurais e algoritmos genticos.

85

REFERNCIAS BIBLIOGRFICAS

ABNT (Associao Brasileira de Normas Tcnicas). Avaliao de imveis urbanos (NBR 5676 e NBR 502). Rio de Janeiro: ABNT, 2004. ABUHNAMAN, S. A. Curso bsico de engenharia legal e de avaliaes. So Paulo: Pini, 1998. BARBOSA FILHO, D. S. Tcnicas avanadas de engenharia de avaliaes. Caixa Econmica Federal, 1998. BOUROCHE, J. M. SAPORTA, G. Anlise de dados. Rio de Janeiro: Zahar, 1982. BRALIO, S. N. Proposta de uma metodologia para a avaliao de imveis urbanos baseado em mtodos estatsticos multivariados. Dissertao de Mestrado. UFPR: Curitiba, 2005. CUADRAS, C. M. Mtodos de anlisis multivariante. Universidade de Barcelona, 1981. CRIVISQUI, E. M. Anlisis factorial de correspondencias, un instrumento de investigacin en ciencias sociales. Laboratoire de Mthodologie du Traitement des Donnes, Universit Libre de Bruxelles. Edicin: Universidad Catlica de Asuncin, Asuncin, Paraguay, 1993. DANIEL, C.; WOOD, T. E. Fitting equations to data. New York: John Wiley & Sons, Inc, 1971. DANTAS, R. A. Engenharia de avaliaes: introduo metodologia cientfica. So Paulo: Pini, 1998. DANTAS, R.A. Engenharia de avaliaes uma introduo metodologia cientfica. [S.l.] So Paulo: Pini, 2000. DRAPER, N. R. & SMITH, H. Applied regression analysis. New York: Jhon Wiley & Sons, Inc, 1981. ELIAN, S. N. Anlise de regresso. So Paulo: IME,1998. FIKER, J. Avaliao de imveis urbanos. 5. ed. So Paulo: Pini, 1997. GONZLEZ, M. A. S.; FORMOSO, C. T. Anlise conceitual das dificuldades na determinao de modelos de formao de preos atravs da anlise de regresso. Engenharia Civil UM, 8: 65-75, 2000. GONZLEZ, M. A. S.. A engenharia de avaliaes na viso inferencial. So Leopoldo: Unisinos,1998. JOHNSON, R. A.; WICHERN, D. W. Applied multivariate statistical analysis. 4. ed. Nova Jersey: Prentice Hall, Inc., 1998.

86

JOHNSTON, J. Mtodos economtricos. So Paulo: Atlas, 1986. JUDGE, G. G.; GRIFFITHS, E. W.; HILL, R. C.; LEE, T. The theory and practice of econometrics. New York: John Wiley & Sons,1980. KMENTA, J. Elementos de econometria. So Paulo: Atlas, 1978. LACHENBRUCH, P. A. Discriminant analysis. New York: Hafner Press, 1975. LEBART, L.; MORINEAU, A.; FNELON, J. Tratamiento estadstico de datos. Barcelona: Marcombo Boixareu, 1995. MOLINA, M. A. El catastro en Espaa. Valncia: UPV, 1999. MONTENEGRO DUARTE, A. Modelo geral de valores isento de subjetividade: caso de apartamentos na cidade de Belm. Dissertao de Mestrado. Porto Alegre e Valncia, 1999. MONTGOMERY, D. C. Design and analysis of experiments. 4. ed. USA: John Wiley, 1997. MOREIRA, A. L. Princpios de engenharia de avaliaes. So Paulo: Pini, 1997. MOREIRA FILHO, I. I.; FRAINER, J. I.; MOREIRA, R. M. I. Avaliao de bens por estatstica inferencial e regresses mltiplas. Porto Alegre: Avalien, 1993. MOSCOVITCH, S. K. Qualidade de vida urbana e valores de imveis: um estudo de caso para Belo Horizonte. Nova Economia, nmero especial: 247-279, 1997. NETER, J.; WASSERMAN, W. Applied linear statistical models. Richard D. Irwin, Inc, Illinois, 1974. PEREIRA, R. S. Estatstica e suas aplicaes. So Paulo: Grafosul, 1970. PLA, L. E. Anlisis multivariado: mtodo de componentes principales. Secretaria general de la organizacin de estados americanos. Washington, 1986. SNEDECOR, G. W.; COCHRAN, W. G. Statistical methods. 6. ed., Iowa: Ames, 1972. WORZALA, E.; LENK M.; SILVA A. An exploration of neural networks and itns application to real estate valuation. The Journal of Real Estate Research, 10 (2): 185-201, 1995.

87

APNDICES

88

APNDICE 1: PROGRAMA AMI (PARA MATLAB 7.0)

function AMI % % % % % % % % % % % % % % % % % % % % % % % % % % **************************************************************** * ANLISE DE AGRUPAMENTO, COMPONENTES PRINCIPAIS E REGRESSO * DE DADOS MULTIVARIADOS * **************************************************************** * Funo programada para a dissertao de mestrado * * Valdir Alves * **************************************************************** l a matriz XY sendo X matriz de dados e Y vetor coluna de preos a primeira coluna e a ordem das observaes e a ltima os preos, XY e uma planilha de Excel NOME. xls na pasta Work do Matlab7. o programa clusteriza em K grupos, calcula os componentes principais por grupo e faz a regresso linear multivariada para cada grupo mostrando a equao de regresso. Para a Anlise de Agrupamento podem ser usadas as distncias: 1)'euclid'; 2)'seuclid'; 3)'cityblock'; 4)'mahal'; 5)'minkowski' e os tipos de ligao: 1)single, 2)complete, 3)average, 4)ward Para saber o preo de um novo imvel coloque os dados do imvel na ltima linha da planilha Excel com o preo = 0. ao final do programa ser mostrado o preo calculado para o novo imvel. para a regresso importante saber que o nmero de observaes tem que ser maior ao nmero de componentes principais Ao final sero gerados os arquivos com as respostas: nome_G1, nome_G2.....se for agrupamentos e ACP. Nome_F se for por Anlise Fatorial Nome_S se for por Regresso Mltipla Simples

clear clc disp(' ---------------------------------------------------------------------') disp(' * ACESSANDO OS DADOS: Selecione o arquivo de dados no Excel *') disp(' ---------------------------------------------------------------------') disp(' ') [ARQUIVO,CAMINHO] = uigetfile('*.xls','Escolha o Arquivo com os dados (Excel).'); nomef=[CAMINHO ARQUIVO]; nf1=[ARQUIVO]; ncar=size(nf1); ncar2=ncar(2); ncar1=ncar2-3; nf1(ncar1:ncar2)=[]; nomeA=nf1;% nome sem a extenso disp(' ') tt=[' arquivo XLS = ' nomef ]; disp(tt) disp(' ') %XY=dados;v6 XY = xlsread(nomef);%v7 [n,m]=size(XY); ncol=m;

89

ncol=ncol-1;%tirando a ordem das observaes tt=[' total de observaes = ' num2str(n)]; disp(tt) tt=[' total de variveis = ' num2str(ncol)]; disp(tt) disp(' ') X_Y=XY; disp(' ---------------------------------------------------------------------') disp(' * OPES DE ANLISE PARA A REGRESSO *') disp(' *********************************************************************') disp(' ---------------------------------------------------------------------') tt=[' * (1) Anlise por Agrupamentos e Componentes Principais *']; disp(tt) disp(' ---------------------------------------------------------------------') tt=[' * (2) Anlise Fatorial *']; disp(tt) disp(' ---------------------------------------------------------------------') tt=[' * (3) Anlise de Regresso Simples *']; disp(tt) disp(' ---------------------------------------------------------------------') disp(' ') OP=input(' ENTRAR COM O TIPO DE OPO = '); disp(' ') if OP==2 fatorim(XY, nomeA) return elseif OP==3 Rsimples(XY, nomeA) return elseif OP>3 return end tt=[' * Anlise por Agrupamentos e Componentes Principais *']; disp(tt) disp(' *********************************************************************') %X_Y matriz X sem o preo e a ordem X_Y(:,m)=[]; X_Y(:,1)=[]; disp(' ') d5={'euclidean';'seuclidean';'cityblock';'mahalanobis';'minkowski'}; t4={'single';'complete';'average';'ward'}; %v6 %d5={'euclid';'seuclid';'cityblock';'mahal';'minkowski'}; %t5={'single';'complete';'average';'centroid';'ward'}; %format long % EXTRAO DOS DADOS disp(' ---------------------------------------------------------------------') disp(' * PROCESSO 1 : AGRUPANDO - CLUSTERING *') disp(' *********************************************************************') disp(' ---------------------------------------------------------------------') disp(' * OPO DE TIPOS DE DISTNCIA *') disp(' ---------------------------------------------------------------------') tt=[' * d = 1, EUCLID (distncia euclidiana) *']; disp(tt) tt=[' * d = 2, SEUCLID (quadrado da distncia euclidiana) *' ]; disp(tt) tt=[' * d = 3, CITYBLOCK (distncia Manhattan) *' ]; disp(tt) tt=[' * d = 4, MAHAL (distncia estatstica) *'];

90

disp(tt) tt=[' * d = 5, MINKOSWSKI (usando n=3) *']; disp(tt) disp(' ---------------------------------------------------------------------') disp(' ') td=input(' ENTRAR COM O TIPO DE DISTNCIA d = '); disp('') %matriz de distncia aa=d5{td}; if td==5 Y=pdist(X_Y,aa,3); else Y=pdist(X_Y,aa); end %verificar o melhor agrupamento cmax=0; imax=0; c=[]; for i=1:4 aa=t4{i}; Z=linkage(Y,aa); c(i)=cophenet(Z,Y); if cmax<c(i) ; cmax=c(i); imax=i; end end aa=t4{imax}; Z=linkage(Y,aa); tt=[' melhor agrupamento = "' num2str(aa) '" sendo o cophenet = ' num2str(cmax)]; disp(tt) disp(' ') disp(' ---------------------------------------------------------------------') disp(' * OPO DE TIPOS DE LIGAO *') disp(' ---------------------------------------------------------------------') tt=[' * t = 1, SINGLE (Vizinho mais prximo) * Cophenet = ' num2str(c(1))]; disp(tt) tt=[' * t = 2, COMPLETE (Vizinho mais distante) * Cophenet = ' num2str(c(2))]; disp(tt) tt=[' * t = 3, AVERAGE (Mdia das distncias) * Cophenet = ' num2str(c(3))]; disp(tt) tt=[' * t = 4, WARD (Mtodo de Ward) * Cophenet = ' num2str(c(4))]; disp(tt) disp(' ---------------------------------------------------------------------') disp(' ') tip=input(' ENTRAR COM O TIPO DE LIGAO t = '); disp('') aa=t4{tip}; Z=linkage(Y,aa);%fazendo as ligaes aa=dendrogram(Z,n);%VISUALIZANDO OS GRUPOS DENDROGRAMA % K grupos K=input(' Digite o nmero de grupos K = '); T=cluster(Z,K); disp(' ') % VETORES DE GRUPOS VG=[];%vetor de ordem K indicando o nmero de elementos por grupo disp(' ---------------------------------------------------------------------') disp(' * FIM DO PROCESSO 1: GRUPOS FORMADOS *') disp(' ---------------------------------------------------------------------') if K>1;

91

for i=1:K; tt=[' GRUPO ' num2str(i) ' = ' ]; ne=0; for j=1:n; if T(j) == i; tt=[tt num2str(j) ' ']; ne=ne+1; end end VG=[VG ne]; tt=[tt '(' num2str(ne) ')']; disp(tt) end elseif K==1; tt=[' GRUPO 1 = 1 .....' num2str(n) ]; disp(tt) T=diag(eye(n)); VG(1)=n; end disp(' ---------------------------------------------------------------------') zz=input(' Tecle ENTER para continuar................................','s'); disp(' ') disp(' ') %guardando os grupos em texto %gera X1, X2...grupos for i=1:K; CC=[];%CC matriz Curinga for j=1:n; if T(j) == i; CC=[CC;XY(j,:)]; end end [n1,m1]=size(CC); nomearq=[nomeA '_G' num2str(i) '.txt' ]; arq=fopen(nomearq,'w'); tt=['ANLISE DO GRUPO ' num2str(i)]; fprintf(arq,tt); tt=['--- observaes ' ]; fprintf(arq,tt); fprintf(arq,'\r\n'); for i=1:n1 for j=1:m1 fprintf(arq,' %d ',CC(i,j)); end fprintf(arq,'\r\n'); end fclose(arq); end %avalia todos se na ltima linha de XY tem preo se no avalia somente o grupo da ltima linha if XY(n,m)==0;% pega somente o grupo da n obs KG=T(n);%grupo da n CC=[];%CC matriz Curinga do grupo K for j=1:n;%formando a matriz do grupo KG if T(j) == KG; CC=[CC;XY(j,:)]; end end %eliminando colunas com valores iguais [n1,m1]=size(CC);

92

CE=[];%vetor de colunas eliminadas NCC=[]; for j=1:m1 V=CC(:,j); if min(V)==max(V); CE=[CE j]; else NCC=[NCC CC(:,j)]; end end [n1,m1]=size(NCC); YY=NCC(:,m1);%vetor de preos NCC(:,m1)=[];%tirando a ltima coluna a=isempty(CE); if a==1;%caso null tt=[' No existem variveis com valores iguais']; else tt=[' As variveis N. ' num2str(CE-1) ' foram eliminadas por possuir valores iguais' ]; end disp(tt) disp(' ') CC=NCC; nomearq=[nomeA '_G' num2str(KG) '.txt' ]; arq=fopen(nomearq,'a'); fprintf(arq,'\r\n'); fprintf(arq,tt); fprintf(arq,'\r\n'); %fim da eliminaao disp(' *********************************************************************') disp(' NA SEQNCIA SER CALCULADA O VALOR (Y) DA LTIMA OBSERVAO') disp(' *********************************************************************') disp(' ') tt=[' A ltima observao ' num2str(n) ' pertence ao grupo = ' num2str(KG)]; disp(tt) disp(' ') disp(' *********************************************************************') tt=[' ANLISE DO GRUPO = ' num2str(KG)]; disp(tt) disp(' *********************************************************************') disp(' ') disp(' ---------------------------------------------------------------------') disp(' * PROCESSO 2: COMPONENTES PRINCIPAIS *') disp(' ---------------------------------------------------------------------') %covarincia S=corrcoef(CC); %S=cov(CC); r1=eig(S); r1=flipud(sort(r1)); m1=length(r1); j1=(1:m1)'; t1=sum(r1); r2=(r1/t1)*100; r3=(cumsum(r1)/t1)*100; r=[j1 r1 r2 r3]; disp('') disp(' * PROPORO DE VARINCIA EXPLICADA PELOS *') disp(' * AUTOVALORES DA MATRIZ CORRELAO *') disp(' ') disp(' ORDEM AUTOVA- VAR. EXPL. VAR. EXPL. ') disp(' LORES (EM %) ACUM. (%) ')

93

disp(' -----------------------------------------') disp(sprintf(' %8.0f %10.4f %8.2f %11.2f\n',r')) disp(' -----------------------------------------') tt=[' Digite o nmero de componentes < ' num2str(VG(1)) ' = ']; nc=input(tt); %salvando as informaes if nc>m1; nc=m1; end %E autovetores, e D Matriz Diagonal de autovalores [E,D]=eig(S); [dd,ind]=sort(diag(D)); %dd=vetor autovalor, ind=vetor de ndices dd=flipud(dd)'; ind=flipud(ind)'; %ordena de acordo a os ndices e ind flipado E=E(:,ind); n2=length(dd); %componentes principais [n1,m1]=size(E); %nomearq=[nomeA '_G' num2str(KG) '.txt' ]; %arq=fopen(nomearq,'a'); fprintf(arq,'\r\n'); tt=['autovalores ' ]; fprintf(arq,tt); fprintf(arq,'\r\n'); for j=1:m1 fprintf(arq,' %d ',dd(j)); end fprintf(arq,'\r\n'); fprintf(arq,' '); fprintf(arq,'\r\n'); tt=['Componentes principais - autovetores ' ]; fprintf(arq,tt); fprintf(arq,'\r\n'); for ii=1:n1 for j=1:m1 fprintf(arq,' %d ',E(ii,j)); end fprintf(arq,'\r\n'); end %fclose(arq); %escores ESCR=CC*E; %controlando o nmero de comp principais CP=[];%MATRIZ DE COMP PRINC tirando as outras colunas for ii=1:nc; CP=[CP ESCR(:,ii)]; end [n1,m1]=size(CP); %nomearq=[nomeA '_G' num2str(KG) '.txt' ]; %arq=fopen(nomearq,'a'); fprintf(arq,'\r\n'); tt=['Escores com ' num2str(nc) ' componentes']; fprintf(arq,tt); fprintf(arq,'\r\n'); for ii=1:n1 for j=1:m1 fprintf(arq,' %d ',CP(ii,j)); end fprintf(arq,'\r\n');

94

end %fclose(arq); disp(' ') disp(' ---------------------------------------------------------------------') disp(' * PROCESSO 3: REGRESSO MLTIPLA *') disp(' ---------------------------------------------------------------------') disp(' ') [n3,m3]=size(CP); CPY=CP(n3,:);%comp prin da ltima linha CP(n3,:)=[];%Tira a ltima linha sem preo YY(n3,:)=[];% Tira a ltima linha no YY n3=n3-1; %acrescer uma coluna de um uno=diag(eye(n3)); CP=[CP uno]; [B,BINT,R,RINT,STATS] = regress(YY,CP,95); %B=coeficientes y=Bx sendo a ltima a constante ttY=[' Y = ' num2str(B(1)) '*CP1 ' ]; for ii=2:nc; if B(ii)>0; ttY=[ttY ' + ' num2str(B(ii)) '*CP' num2str(ii) ]; else ttY=[ttY ' ' num2str(B(ii)) '*CP' num2str(ii) ]; end end ii=nc+1; if B(ii)>0; ttY=[ttY ' + ' num2str(B(ii)) ]; else ttY=[ttY ' ' num2str(B(ii)) ]; end tt1=[' REGRESSO PARA O GRUPO ' num2str(KG) ]; disp(tt1) disp(' ---------------------------------------------------------------------') disp(ttY) disp(' ---------------------------------------------------------------------') disp(' ') tt1=[' ESTATSTICA DO MODELO ' num2str(KG) ]; disp(tt1) disp(' ---------------------------------------------------------------------') disp(' R2 F p ') disp(' -----------------------------------------') STATS1=STATS; STATS1(4)=[]; disp(sprintf(' %8.4f %10.4f %8.5f\n',STATS1')) disp(' -----------------------------------------') disp(' ') tt1=[' Componentes principais da ltima observao (cp1,cp2,...)' ]; disp(tt1) tt1=[' ']; for ii=1:nc; tt1=[tt1 num2str(CPY(ii)) ' ']; end disp(tt1) disp(' ') nc1=nc+1; B0=B(nc1); B(nc1)=[]; Y0=CPY*B+B0; tt2=[' Y(varivel dependente) da ltima observao = ' num2str(Y0) ];

95

disp(tt2) disp(' *********************************************************************') disp(' FIM DO PROGRAMA'); %nomearq=[nomeA '_G' num2str(KG) '.txt' ]; %arq=fopen(nomearq,'a'); fprintf(arq,'\r\n'); tt1=['REGRESSO MLTIPLA ' ]; fprintf(arq,tt1); fprintf(arq,'\r\n'); fprintf(arq,ttY); fprintf(arq,'\r\n'); fprintf(arq,' '); fprintf(arq,'\r\n'); fprintf(arq,tt2); fprintf(arq,'\r\n'); tt1=['ESTATSTICA DO MODELO ']; fprintf(arq,tt1); fprintf(arq,'\r\n'); tt1=['R2 = ' num2str(STATS(1)) ' F = ' num2str(STATS(2)) ' p = ' num2str(STATS(3))]; fprintf(arq,tt1); fprintf(arq,'\r\n'); fclose(arq); return else%pega todos os grupos para avaliao disp(' ') disp(' *********************************************************************') tt=[' NA SEQNCIA SERO ANALIZADOS OS ' num2str(K) ' GRUPOS']; disp(tt) disp(' *********************************************************************') disp(' ') disp(' ---------------------------------------------------------------------') disp(' * PROCESSO 2: COMPONENTES PRINCIPAIS *') disp(' ---------------------------------------------------------------------') disp(' ') for i=1:K tt=[' ANALISANDO O GRUPO ' num2str(i) ]; disp(tt) disp(' *********************************************************************') CC1=[];%CC1 matriz Curinga DO GRUPO for j=1:n; if T(j) == i; CC1=[CC1;XY(j,:)]; end end %eliminando colunas com valores iguais [n1,m1]=size(CC1); CE=[];%vetor de colunas eliminadas NCC=[]; for j=1:m1 V=CC1(:,j); if min(V)==max(V); CE=[CE j]; else NCC=[NCC CC1(:,j)]; end end [n1,m1]=size(NCC); a=isempty(CE); if a==1;%caso null

96

tt=[' No existem variveis com valores iguais']; else [n7,m7]=size(CE); if m7>1 tt=[' As variveis N [' num2str(CE-1) '] foram eliminadas por possuir valores iguais' ]; else tt=[' A varivel N [' num2str(CE-1) '] foi eliminada por possuir valor igual ]; end end disp(tt) disp(' ') nomearq=[nomeA '_G' num2str(i) '.txt' ]; arq=fopen(nomearq,'a'); fprintf(arq,'\r\n'); fprintf(arq,tt); fprintf(arq,'\r\n'); CC1=NCC; %fim da eliminao [n1,m1]=size(NCC); YY=CC1(:,m1);%vetor de preos CC1(:,m1)=[];%tirando a ltima coluna %covarincia %S=cov(CC1); S=corrcoef(CC1); r1=eig(S); r1=flipud(sort(r1)); m1=length(r1); j1=(1:m1)'; t1=sum(r1); r2=(r1/t1)*100; r3=(cumsum(r1)/t1)*100; r=[j1 r1 r2 r3]; disp(' ') disp(' * PROPORO DE VARINCIA EXPLICADA PELOS *') disp(' * AUTOVALORES DA MATRIZ CORRELAO *') disp(' ') disp(' ORDEM AUTOVA- VAR. EXPL. VAR. EXPL. ') disp(' LORES (EM %) ACUM. (%) ') disp(' -----------------------------------------') disp(sprintf(' %8.0f %10.4f %8.2f %11.2f\n',r')) disp(' -----------------------------------------') tt=[' Digite o nmero de componentes < ' num2str(VG(i)) ' = ']; nc=input(tt); if nc>m1; nc=m1; end %E autovetores, e D Matriz Diagonal de autovalores [E,D]=eig(S); [dd,ind]=sort(diag(D)); %dd=vetor autovalor, ind=vetor de ndices dd=flipud(dd)'; ind=flipud(ind)'; %ordena de acordo a os ndices e ind flipado E=E(:,ind); n2=length(dd); [n1,m1]=size(E); %nomearq=[nomeA '_G' num2str(i) '.txt' ]; %arq=fopen(nomearq,'a'); fprintf(arq,' '); fprintf(arq,'\r\n'); tt=['autovalores ' ];

97

fprintf(arq,tt); fprintf(arq,'\r\n'); for j=1:m1 fprintf(arq,' %d ',dd(j)); end fprintf(arq,'\r\n'); fprintf(arq,' '); fprintf(arq,'\r\n'); tt=['Componentes principais - autovetores ' ]; fprintf(arq,tt); fprintf(arq,'\r\n'); for ii=1:n1 for j=1:m1 fprintf(arq,' %d ',E(ii,j)); end fprintf(arq,'\r\n'); end %fclose(arq); %escores ESCR=CC1*E; %controlando o nmero de comp principais CP=[];%MATRIZ DE COMP PRINC for ii=1:nc; CP=[CP ESCR(:,ii)]; end [n2,m2]=size(CP); %nomearq=[nomeA '_G' num2str(i) '.txt' ]; %arq=fopen(nomearq,'a'); %fprintf(arq,' '); fprintf(arq,'\r\n'); tt=['Escores com ' num2str(nc) ' componentes' ]; fprintf(arq,tt); fprintf(arq,'\r\n'); for ii=1:n2 for j=1:m2 fprintf(arq,' %d ',CP(ii,j)); end fprintf(arq,'\r\n'); end %fclose(arq); disp(' ') disp(' ---------------------------------------------------------------------') disp(' * PROCESSO 3: REGRESSO MLTIPLA disp(' ---------------------------------------------------------------------') disp(' ') [n3,m3]=size(CP); %acrescer uma coluna de um uno=diag(eye(n3)); CP=[CP uno]; [B,BINT,R,RINT,STATS] = regress(YY,CP,95); %B=coeficientes y=Bx sendo a ltima a constante ttY=[' Y = ' num2str(B(1)) '*CP1 ' ]; for ii=2:nc; if B(ii)>0; ttY=[ttY ' + ' num2str(B(ii)) '*CP' num2str(ii) ]; else ttY=[ttY ' ' num2str(B(ii)) '*CP' num2str(ii) ]; end end ii=nc+1;

*')

98

if B(ii)>0; ttY=[ttY ' + ' num2str(B(ii)) ]; else ttY=[ttY ' ' num2str(B(ii)) ]; end tt1=[' REGRESSO PARA O GRUPO ' num2str(i) ]; disp(tt1) disp(' ---------------------------------------------------------------------') disp(ttY) disp(' ---------------------------------------------------------------------') disp(' ') tt1=[' ESTATSTICA DO MODELO ' num2str(i) ]; disp(tt1) disp(' ---------------------------------------------------------------------') disp(' R2 F p ') disp(' -----------------------------------------') STATS1=STATS; STATS1(4)=[]; disp(sprintf(' %8.4f %10.4f %8.5f\n',STATS1')) disp(' -----------------------------------------') disp(' *********************************************************************') disp(' ') %nomearq=[nomeA '_G' num2str(i) '.txt' ]; %arq=fopen(nomearq,'a'); %fprintf(arq,' '); fprintf(arq,'\r\n'); tt1=['REGRESSO MLTIPLA ' ]; fprintf(arq,tt1); fprintf(arq,'\r\n'); fprintf(arq,ttY); fprintf(arq,'\r\n'); fprintf(arq,' '); fprintf(arq,'\r\n'); tt1=['ESTATSTICA DO MODELO ']; fprintf(arq,tt1); fprintf(arq,'\r\n'); tt1=['R2 = ' num2str(STATS(1)) ' F = ' num2str(STATS(2)) ' p = ' num2str(STATS(3))]; fprintf(arq,tt1); fprintf(arq,'\r\n'); fprintf(arq,'\r\n'); %avaliando o grupo Naval=CP*B; tt1=['Avaliando o grupo ']; fprintf(arq,tt1); fprintf(arq,'\r\n'); for i=1:n2 fprintf(arq,' %d ',CC1(i,1)); fprintf(arq,' %d ',YY(i)); %tt1=[num2str(Naval(i)) ]; fprintf(arq,' %d ',Naval(i)); fprintf(arq,'\r\n'); end fclose(arq); if i==K disp(' FIM DO PROGRAMA'); else zz=input(' Tecle ENTER para continuar................................','s'); disp(' ') end

99

end end

SUB-PROGRAMA ANLISE FATORIAL

function fatorim(XY, nomeA) %nome A = nome do arquivo sem a extenso %XY = arquivo do Excel [n1,m1]=size(XY); nomearq=[nomeA '_F.txt' ]; arq=fopen(nomearq,'w'); tt=['ANLISE FATORIAL ' ]; fprintf(arq,tt); tt=['--- Observaes ' ]; fprintf(arq,tt); fprintf(arq,'\r\n'); for i=1:n1 for j=1:m1 fprintf(arq,' %d ',XY(i,j)); end fprintf(arq,'\r\n'); end X_Y=XY; [n,m]=size(XY); YY=XY(:,m); %X_Y matriz X sem o preo e a ordem X_Y(:,m)=[]; X_Y(:,1)=[]; disp(' ') X=X_Y; k=1;%matriz de dados R=corrcoef(X); %Autovalores e autovetores de R [E2,D2]=eig(R); [dd2,i2]=sort(diag(D2)); dd2=flipud(dd2)'; i2=flipud(i2)'; E2=E2(:,i2); ddt=(dd2/(sum(dd2)))*100; ddacum=cumsum(ddt); disp(' ---------------------------------------------------------------------') disp(' * PROCESSO 1: Autovalores e varincia explicada acumulada disp(' ---------------------------------------------------------------------') disp(' ') %Matriz de pesos L r1=eig(R); r1=flipud(sort(r1)); m1=length(r1); j1=(1:m1)'; t1=sum(r1); r2=(r1/t1)*100; r3=(cumsum(r1)/t1)*100; r=[j1 r1 r2 r3]; disp(' * PROPORO DE VARINCIA EXPLICADA PELOS *') disp(' * AUTOVALORES DA MATRIZ CORRELAO *') disp(' ')

*')

100

disp(' ORDEM AUTOVA- VAR. EXPL. VAR. EXPL. ') disp(' LORES (EM %) ACUM. (%) ') disp(' -----------------------------------------') disp(sprintf(' %8.0f %10.4f %8.2f %11.2f\n',r')) disp(' -----------------------------------------') disp(' ') tt=[' Digite o nmero de fatores < ' num2str(m1) ' = ']; N=input(tt); nc=N; disp(' ') tt=['nmero de fatores ' num2str(N) ]; fprintf(arq,tt); fprintf(arq,'\r\n'); %disp(f1)%ESCORES FATORIAIS [Lambda,Psi,T,stats,F] = factoran(X,N,'scores','regression'); %[Lambda,Psi,T,stats,F] = factoran(X,N,'rotate','varimax','scores','regression'); disp(' ---------------------------------------------------------------------') disp(' * PROCESSO 2: ESCORES FATORIAIS ROTACIONADOS - VARIMAX disp(' ---------------------------------------------------------------------') disp(' ') disp(F)%ESCORES FATORIAIS CP=F; disp(' ') disp(' ---------------------------------------------------------------------') disp(' * PROCESSO 3: REGRESSO MLTIPLA *') disp(' ---------------------------------------------------------------------') disp(' ') %para calcular Y [n3,m3]=size(CP); if XY(n,m)==0 CPY=CP(n3,:);%comp prin da ltima linha CP(n3,:)=[];%Tira a ltima linha sem preo YY(n3,:)=[];% Tira a ltima linha no YY n3=n3-1; end %acrescer uma coluna de um uno=diag(eye(n3)); CP=[CP uno]; [B,BINT,R,RINT,STATS] = regress(YY,CP,100); %B=coeficientes y=Bx sendo a ltima constante ttY=[' Y = ' num2str(B(1)) '*F1 ' ]; for ii=2:nc; if B(ii)>0; ttY=[ttY ' + ' num2str(B(ii)) '*F' num2str(ii) ]; else ttY=[ttY ' ' num2str(B(ii)) '*F' num2str(ii) ]; end end ii=nc+1; if B(ii)>0; ttY=[ttY ' + ' num2str(B(ii)) ]; else ttY=[ttY ' ' num2str(B(ii)) ]; end tt1=[' REGRESSO' ]; disp(tt1) disp(' ---------------------------------------------------------------------') disp(ttY)

*')

101

disp(' ---------------------------------------------------------------------') disp(' ') tt1=[' ESTATSTICA DO MODELO ' ]; disp(tt1) STATS1=STATS; STATS1(4)=[]; disp(' ---------------------------------------------------------------------') disp(' R2 F p ') disp(' -----------------------------------------') disp(sprintf(' %8.4f %10.4f %8.5f\n',STATS1')) disp(' -----------------------------------------') disp(' *********************************************************************') disp(' ') if XY(n,m)==0 nc1=nc+1; B0=B(nc1); B(nc1)=[]; Y0=CPY*B+B0; tt2=[' Y(varivel dependente) da ltima observao = ' num2str(Y0) ]; disp(tt2) disp(' *********************************************************************') end fprintf(arq,'\r\n'); tt1=['REGRESSO MLTIPLA ' ]; fprintf(arq,tt1); fprintf(arq,'\r\n'); fprintf(arq,ttY); fprintf(arq,'\r\n'); fprintf(arq,' '); fprintf(arq,'\r\n'); tt1=['ESTATSTICA DO MODELO ']; fprintf(arq,tt1); fprintf(arq,'\r\n'); tt1=['R2 = ' num2str(STATS(1)) ' F = ' num2str(STATS(2)) ' p = ' num2str(STATS(3))]; fprintf(arq,tt1); fprintf(arq,'\r\n'); fclose(arq); disp(' *FIM DO PROGRAMA *') return

102

SUB-PROGRAMA REGRESSO SIMPLES function Rsimples(XY, nomeA) [n1,m1]=size(XY); nomearq=[nomeA '_S.txt' ]; arq=fopen(nomearq,'w'); tt=['regresso multivariada ' ]; fprintf(arq,tt); tt=['--- Observaes ' ]; fprintf(arq,tt); fprintf(arq,'\r\n'); for i=1:n1 for j=1:m1 fprintf(arq,' %d ',XY(i,j)); end fprintf(arq,'\r\n'); end X_Y=XY; [n,m]=size(XY); YY=XY(:,m); %X_Y matriz X sem o preo e a ordem X_Y(:,m)=[]; X_Y(:,1)=[]; disp(' ') CP=X_Y; disp(' ') disp(' ---------------------------------------------------------------------') disp(' * PROCESSO 1: REGRESSO MLTIPLA disp(' ---------------------------------------------------------------------') disp(' ') %para calcular Y if XY(n,m)==0 CPY=CP(n,:);%variveis da ltima linha CP(n,:)=[];%Tira a ltima linha sem preo YY(n,:)=[];% Tira a ltima linha no YY n1=n-1; end %acrescer uma coluna de um uno=diag(eye(n1)); CP=[CP uno]; [B,BINT,R,RINT,STATS] = regress(YY,CP,100); %B=coeficientes y=Bx sendo a ltima constante ttY=[' Y = ' num2str(B(1)) '*V1 ' ]; nc=m-2; for ii=2:nc; if B(ii)>0; ttY=[ttY ' + ' num2str(B(ii)) '*V' num2str(ii) ]; else ttY=[ttY ' ' num2str(B(ii)) '*V' num2str(ii) ]; end end ii=nc+1; if B(ii)>0; ttY=[ttY ' + ' num2str(B(ii)) ]; else ttY=[ttY ' ' num2str(B(ii)) ]; end tt1=[' REGRESSO' ];

*')

103

disp(tt1) disp(' ---------------------------------------------------------------------') disp(ttY) disp(' ---------------------------------------------------------------------') disp(' ') tt1=[' ESTATSTICA DO MODELO ' ]; disp(tt1) STATS1=STATS; STATS1(4)=[]; disp(' ---------------------------------------------------------------------') disp(' R2 F p ') disp(' -----------------------------------------') disp(sprintf(' %8.4f %10.4f %8.5f\n',STATS1')) disp(' -----------------------------------------') disp(' *********************************************************************') disp(' ') if XY(n,m)==0 nc1=nc+1; B0=B(nc1); B(nc1)=[]; Y0=CPY*B+B0; tt2=[' Y(varivel dependente) da ltima observao = ' num2str(Y0) ]; disp(tt2) disp(' *********************************************************************') end fprintf(arq,'\r\n'); tt1=['REGRESSO MLTIPLA ' ]; fprintf(arq,tt1); fprintf(arq,'\r\n'); fprintf(arq,ttY); fprintf(arq,'\r\n'); fprintf(arq,' '); fprintf(arq,'\r\n'); tt1=['ESTATSTICA DO MODELO ']; fprintf(arq,tt1); fprintf(arq,'\r\n'); tt1=['R2 = ' num2str(STATS(1)) ' F = ' num2str(STATS(2)) ' p = ' num2str(STATS(3))]; fprintf(arq,tt1); fprintf(arq,'\r\n'); fclose(arq); disp(' *FIM DO PROGRAMA *') return

104

APNDICE II - MATRIZ DE DADOS REFERENTE AOS APARTAMENTOS

apartamento posio do apto elevador garagem localizao rea privativa pavimento 1 3 2 1 1 222 15 2 3 1 1 1 162,44 7 3 3 1 1 1 176 8 4 3 2 2 1 179,2 14 5 3 2 2 1 279,4 20 6 3 1 1 1 120 12 7 2 1 1 1 220 16 8 3 1 1 1 107 8 9 2 0 1 1 50 4 10 3 2 3 1 240 15 11 3 0 1 0 100 3 12 3 0 1 1 147 6 13 3 1 1 1 108 7 14 2 2 2 1 311 16 15 2 1 1 1 132 7 16 3 2 1 1 107 8 17 3 2 1 1 107 8 18 3 2 4 1 330 15 19 3 2 2 1 220 15 20 3 1 1 1 130 6 21 3 2 2 1 164 10 22 3 2 2 1 160 15 23 3 2 1 1 374 15 24 3 1 1 1 220 16 25 2 1 1 1 220 16 26 3 1 2 1 180 13 27 3 1 2 1 320 13 28 3 1 2 1 180 13 29 3 1 2 1 320 13

andar 3 1 2 3 3 3 2 1 2 3 2 1 3 3 2 3 4 3 3 3 3 3 3 4 3 3 3 3 3

pecas 9 9 9 10 8 12 12 9 4 12 7 7 11 10 8 8 8 17 13 11 11 11 14 14 14 13 11 13 11

sala 1 1 1 2 1 2 3 3 1 3 2 1 2 3 2 2 2 3 2 2 2 2 3 3 3 2 1 2 1

dormitrio 2 2 2 2 2 3 3 2 1 2 3 2 2 2 2 2 2 3 3 3 3 3 2 3 3 3 3 3 3

sute 1 1 1 1 1 1 1 1 0 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

banheiro 1 1 1 1 1 2 2 1 1 1 2 1 1 1 1 1 1 3 1 1 1 2 3 2 2 1 1 1 1

dep. de emp. 1 1 1 1 1 1 1 0 0 1 0 0 1 1 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1

105 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 1 2 3 3 1 1 1 3 3 3 3 3 3 1 3 2 2 2 1 1 2 2 0 0 0 1 1 1 1 1 2 2 2 1 1 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 260 260 260 140 130 260 310 100 70 90 38 40 170 170 170 14 14 14 8 7 14 16 4 3 3 8 8 7 7 7 acabamento 3 3 3 3 3 3 3 2 2 3 2 2 2 3 2 2 3 2 1 2 3 1 2 3 2 2 2 3 2 1 3 11 11 11 6 7 11 11 7 5 6 4 5 9 9 9 2 2 2 1 2 2 2 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 2 2 1 2 2 2 2 1 1 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 2 1 2 1 1 1 1 1 1 1 1 0 0 1 1 0 0 0 0 0 0 0 0

apartamento dist. de escola dist. de hospital dist. de supermercado 1 2 2 3 2 3 1 3 3 3 2 3 4 3 2 3 5 3 2 3 6 3 2 3 7 2 2 2 8 2 2 2 9 3 2 3 10 3 3 3 11 3 1 1 12 3 2 3 13 3 3 3 14 1 1 1 15 3 2 1 16 3 3 3

revestimento do prdio conservao idade real idade aparente valor (R$) 4 2 2 2 130000 1 5 4 6 85000 1 5 4 6 80000 4 5 4 6 115000 4 5 2 4 150000 2 5 3 4 110000 4 4 2 2 120000 1 3 3 5 68000 1 4 4 4 40000 4 4 2 3 170000 1 3 2 3 50000 2 5 4 5 60000 4 3 3 3 93000 4 5 4 4 250000 1 4 5 5 65000 4 4 3 3 65000

106 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 3 2 3 3 3 3 1 3 3 3 3 3 3 3 3 3 2 3 3 1 3 3 3 3 3 3 3 3 3 1 3 3 3 3 1 3 3 1 3 1 3 3 3 3 2 3 3 1 3 3 3 3 3 3 3 3 3 2 3 3 3 3 1 3 3 3 3 3 3 3 3 3 3 3 3 1 3 3 3 3 3 3 3 3 2 2 2 2 2 2 2 3 3 3 3 3 3 2 2 2 2 2 2 3 2 2 2 2 2 2 2 2 4 4 4 3,5 3,5 4 4 4 4 4 4 4 4 4 4 4 4 1 4 4 1 1 1 1 1 4 4 4 4 4 4 4 4 4 4 4 4 3 4 3 4 3 3 3 3 3 3 4 3 3 2 3 3 4 4 4 3 3 5 3 3 3 4 3 3 4 5 4 5 2 2 2 5 4 2 4 1 1 1 3 3 4 4 4 3 2 5 4 4 4 4 4 4 4 5 4 5 2 2 2 5 4 2 4 1 1 1 4 4 6 6 6 71000 220000 200000 90000 140000 250000 250000 150000 120000 180000 250000 180000 250000 115000 120000 140000 90000 65000 120000 210000 100000 70000 95000 30000 40000 100000 90000 110000

107

APNDICE III - MATRIZ DE DADOS REFERENTE A CASAS RESIDENCIAIS

casa 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

bairro 5 4 4 2 4 5 5 3 3 3 5 3 3 5 4 4 3 3 5 4 3 3 5 4 2 2 5 5

garagem 1 1 1 1 1 1 1 1 0 1 1 1 1 0 1 1 0 1 1 1 1 1 1 1 0 1 1 1

sute 1 1 1 1 1 1 1 0 0 0 0 0 0 0 1 1 0 1 1 1 1 0 1 0 0 0 1 0

banheiro 2 3 3 2 2 2 2 1 1 1 2 2 1 1 1 1 2 1 3 1 1 2 1 1 1 1 2 1

edcula 1 0 0 0 1 1 1 0 0 0 1 0 0 0 1 1 0 0 1 1 1 0 0 0 0 0 0 0

dist. rea supermercado construda 3 183 2 216 2 155 1 170 1 160 3 160 3 134 3 70 2 198 2 113 3 238 2 158 3 124 3 95 3 187 1 242 1 100 1 180 1 380 1 240 2 184 3 140 3 400 3 110 3 120 3 150 3 400 3 130

rea do terreno 500 977 420 490 480 500 1000 300 350 400 1200 315 300 340 490 490 480 786 480 490 1000 446 600 270 300 300 750 300

acabamento cobertura estrutura conservao piscina 1 4 3 1 0 1 4 3 1 0 2 4 3 1 0 2 4 3 1 0 2 4 3 3 0 2 4 3 3 0 2 4 3 2 0 1 2 1 1 0 1 1 1 3 0 2 2 1 2 0 2 4 3 2 0 2 1 1 2 0 2 4 3 2 0 2 2 1 1 0 3 4 3 2 0 3 4 3 2 0 2 4 3 2 0 3 4 3 3 0 2 3 3 2 0 3 4 3 2 1 2 4 3 3 1 2 1 2 2 0 2 4 3 2 0 2 4 3 3 0 2 4 3 1 0 2 4 3 3 0 2 4 3 3 0 2 2 1 1 0

108 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 4 4 5 5 5 5 5 5 5 4 5 5 3 3 2 3 3 3 5 2 5 2 3 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0 0 0 0 0 1 1 1 1 1 1 0 1 0 0 1 2 1 2 1 1 1 2 1 1 1 1 1 1 2 1 1 2 2 1 3 1 1 0 1 1 1 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 3 1 1 1 3 3 3 3 3 2 3 3 2 2 2 1 1 3 3 2 3 3 2 200 244 113 220 92 123 150 200 100 70 100 80 70 180 70 115 160 325 320 116 180 100 80 400 500 300 500 650 300 1000 400 1000 490 950 475 600 640 480 250 450 225 450 300 500 800 390 2 2 2 4 2 2 1 2 1 1 2 2 1 2 2 2 2 3 3 2 2 2 2 4 4 4 4 4 4 2 4 1 1 2 2 3 4 4 4 4 4 4 3 4 3,5 2 3 3 3 3 3 3 1 4 1 1 1 1 3 3 3 3 3 4 4 3 3 3 3 3 2 2 2 3 2 1 2 1 1 1 1 3 3 3 3 3 3 3 2 3 2 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0

casa 1 2 3 4 5 6 7

dormitrio 2 3 3 2 2 3 4

dep.de empregados 1 1 1 0 0 0 0

lavanderia 1 1 1 1 1 1 1

peas 8 13 12 7 9 8 10

idade aparente 2 2 2 3 3 3 4

valor (R$) 120.000 160.000 110.000 70.000 85.000 100.000 160.000

109 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 3 2 3 4 4 3 2 2 3 3 2 3 2 2 3 5 2 3 3 3 3 3 3 2 3 2 2 2 2 2 2 3 3 0 0 0 0 0 0 0 1 1 0 1 0 1 1 0 1 0 0 0 0 0 0 1 1 1 0 0 0 1 0 0 0 0 0 0 0 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 0 1 1 1 1 1 1 1 1 1 5 5 8 9 12 8 6 12 13 8 10 14 11 13 6 14 5 6 6 11 5 9 13 9 15 7 7 7 7 5 5 7 7 1 3 2 1 1 1 1 4 3 5 3 5 2 3 2 3 4 3 5 3 3 6 6 4 3 5 5 1 2 1 1 1 1 30.000 28.000 35.000 150.000 45.000 30.000 28.000 140.000 130.000 50.000 150.000 150.000 135.000 180.000 40.000 150.000 60.000 15.000 45.000 165.000 95.000 100.000 130.000 90.000 185.000 90.000 15.000 150.000 150.000 140.000 30.000 60.000 45.000

110 41 42 43 44 45 46 47 48 49 50 51 2 2 1 2 2 4 2 3 3 2 3 0 1 0 0 1 1 0 0 0,5 0 0 0 1 1 1 1 1 0 0 1 0 1 5 10 8 8 9 16 13 6 12 5 6 5 6 5 4 1 6 4 3 5 4 2 30.000 90.000 50.000 70.000 130.000 180.000 290.000 50.000 98.000 65.000 40.000

111

APNDICE IV - MATRIZ DE DADOS REFERENTE AOS TERRENOS

terreno 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

localizao 6 2 5 3 5 5 4 4 5 6 2 2 3 4 6 5 6 5 5 5 3 3 4 3

setor comercial 2 0 0 0 0 2 1 0 1 3 0 0 2 1 3 0 3 0 0 0 0 0 0 0

plo 1 0 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 0 1 1 1

frente 2 3 1 2 3 3 3 1 3 1 2 2 3 3 3 1 3 1 3 1 2 2 2 1

rea do terreno 650 640 500 390 262 1000 950 475 470 500 420 420 2000 950 1000 242 940 500 350 500 336 336 300 450

proteo 3 3 3 3 3 3 3 3 3 0 0 0 0 3 3 0 2 2 0 0 0 0 0 3

plano 0 1 1 2 2 2 2 0 3 3 3 3 2 2 2 2 3 1 2 0 3 3 2 3

inclinado 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0

posio 1 2 1 1 2 1 1 1 2 1 2 1 2 1 2 1 2 1 2 1 1 1 1 1

pavimentao valor (R$) 1 100000 1 25000 1 43000 1 33000 1 40000 1 140000 1 90000 1 38000 1 70000 1 145000 0 15000 0 13000 1 100000 1 90000 1 250000 1 38000 1 300000 1 47000 1 60000 1 50000 1 15000 1 30000 1 25000 1 30000

112

APNDICE V QUADRO DE PREOS PREDECIDOS DE APARTAMENTOS


apartamento valor 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 130.000,00 85.000,00 80.000,00 115.000,00 150.000,00 110.000,00 120.000,00 68.000,00 40.000,00 170.000,00 50.000,00 60.000,00 93.000,00 250.000,00 65.000,00 65.000,00 71.000,00 220.000,00 200.000,00 90.000,00 140.000,00 250.000,00 250.000,00 150.000,00 120.000,00 180.000,00 250.000,00 180.000,00 250.000,00 115.000,00 120.000,00 140.000,00 90.000,00 65.000,00 120.000,00 210.000,00 100.000,00 70.000,00 95.000,00 30.000,00 40.000,00 100.000,00 90.000,00 110.000,00 Grupo2: A Fatorial A Simples A_Agrupam 139.620,30 73.230,46 91.097,49 162.978,70 165.618,90 108.145,20 103.441,50 68.270,63 34.495,38 138.725,60 59.842,96 70.007,96 94.332,59 216.105,20 47.884,77 68.497,66 68.903,35 238.017,00 229.705,80 90.232,79 145.853,40 160.269,20 250.538,90 162.987,40 143.434,80 176.995,20 227.360,70 177.764,00 228.129,50 145.532,50 136.580,90 127.629,30 84.140,32 77.515,85 118.181,50 221.732,20 93.798,20 66.740,97 91.840,82 36.676,36 40.674,19 107.639,10 82.785,98 123.044,30
2 2 2 2

Dif.(%) -7,40% 13,85% -13,87% -41,72% -10,41% 1,69% 13,80% -0,40% 13,76% 18,40% -19,69% -16,68% -1,43% 13,56% 26,33% -5,38% 2,95% -8,19% -14,85% -0,26% -4,18% 35,89% -0,22% -8,66% -19,53% 1,67% 9,06% 1,24% 8,75% -26,55% -13,82% 8,84% 6,51% -19,26% 1,52% -5,59% 6,20% 4,66% 3,33% -22,25% -1,69% -7,64% 8,02% -11,86%

Avaliao A_Fatorial 142.334,10 69.097,90 105.933,70 132.372,70 163.176,50 121.467,10 147.293,40 69.892,33 26.403,62 159.508,70 50.407,09 80.267,51 89.401,90 206.583,00 83.912,75 58.406,38 70.054,15 278.144,20 193.097,70 115.127,10 150.750,60 168.790,30 208.643,70 159.246,20 148.260,80 148.774,20 234.573,50 148.774,20 234.573,50 141.209,40 128.899,30 116.589,10 119.424,30 72.862,38 117.913,90 231.330,10 103.761,90 48.566,10 61.654,72 37.858,92 75.418,86 91.639,18 81.316,13 103.287,00

Dif.(%) -9,49% 18,71% -32,42% -15,11% -8,78% -10,42% -22,74% -2,78% 33,99% 6,17% -0,81% -33,78% 3,87% 17,37% -29,10% 10,14% 1,33% -26,43% 3,45% -27,92% -7,68% 32,48% 16,54% -6,16% -23,55% 17,35% 6,17% 17,35% 6,17% -22,79% -7,42% 16,72% -32,69% -12,10% 1,74% -10,16% -3,76% 30,62% 35,10% -26,20% -88,55% 8,36% 9,65% 6,10%

A_Simples Dif.(%) 132.327,90 -1,79% 80.008,87 5,87% 90.129,81 -12,66% 147.583,00 -28,33% 157.204,80 -4,80% 89.394,28 18,73% 156.971,50 -30,81% 57.743,62 15,08% 34.817,09 12,96% 160.250,10 5,74% 50.000,00 0,00% 54.584,42 9,03% 84.663,29 8,96% 225.102,90 9,96% 86.226,03 -32,66% 59.516,79 8,44% 62.539,01 11,92% 256.561,30 -16,62% 183.489,80 8,26% 125.127,60 -39,03% 159.736,60 -14,10% 177.219,10 29,11% 236.247,70 5,50% 155.352,90 -3,57% 141.149,00 -17,62% 163.370,40 9,24% 245.999,50 1,60% 163.370,40 9,24% 245.999,50 1,60% 124.130,10 -7,94% 132.289,60 -10,24% 140.449,10 -0,32% 130.124,10 -44,58% 57.095,17 12,16% 118.085,70 1,60% 195.785,10 6,77% 100.447,40 -0,45% 48.822,15 30,25% 78.847,79 17,00% 39.372,14 -31,24% 72.693,41 -81,73% 99.511,42 0,49% 74.125,76 17,64% 102.533,60 6,79%

Estatsticas: Grupo1

R = 0.90062 F = 5.4375 R = 0.78569 F = 5.8658 R = 0.845 R = 0.89329 F = 8.7702

p = 0.025266 p = 0.00094988 p = 1.8882e-006

F = 10.1761 p = 1.1396e-007

113

APNDICE VI QUADRO DE PREOS PREDECIDOS DE CASAS


casas n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 Valor 120.000,00 160.000,00 110.000,00 70.000,00 85.000,00 100.000,00 160.000,00 30.000,00 28.000,00 35.000,00 150.000,00 45.000,00 30.000,00 28.000,00 140.000,00 130.000,00 50.000,00 150.000,00 150.000,00 135.000,00 180.000,00 40.000,00 150.000,00 60.000,00 15.000,00 45.000,00 165.000,00 95.000,00 100.000,00 130.000,00 90.000,00 185.000,00 90.000,00 15.000,00 150.000,00 150.000,00 140.000,00 30.000,00 60.000,00 45.000,00 30.000,00 90.000,00 50.000,00 70.000,00 130.000,00 180.000,00 290.000,00 50.000,00 Avaliando por opes Agrupam. Dif(%) A Fatorial Dif(%) 110.594,00 7,84% 113.853,70 5,12% 165.112,10 -3,20% 163.207,30 -2,00% 104.565,00 4,94% 104.270,90 5,21% 83.244,11 -18,92% 57.014,11 18,55% 82.956,91 2,40% 106.292,10 -25,05% 100.432,40 -0,43% 104.080,60 -4,08% 153.527,80 4,05% 128.716,00 19,55% 29.620,70 1,26% 30.117,58 -0,39% 24.752,10 11,60% 50.731,80 -81,19% 38.939,61 -11,26% 36.217,29 -3,48% 151.772,10 -1,18% 174.500,10 -16,33% 46.174,35 -2,61% 56.274,48 -25,05% 29.383,03 2,06% 65.388,98 -117,96% 26.780,53 4,36% 55.580,93 -98,50% 132.490,30 5,36% 126.013,80 9,99% 142.401,60 -9,54% 144.192,00 -10,92% 18.330,54 63,34% 56.810,92 -13,62% 150.006,90 0,00% 136.267,60 9,15% 164.577,60 -9,72% 174.180,50 -16,12% 159.128,00 -17,87% 157.660,00 -16,79% 181.586,70 -0,88% 179.143,70 0,48% 44.249,19 -10,62% 48.134,95 -20,34% 151.414,40 -0,94% 185.436,60 -23,62% 62.882,68 -4,80% 52.656,80 12,24% 15.791,10 -5,27% 23.717,74 -58,12% 42.827,20 4,83% 27.195,82 39,56% 164.211,70 0,48% 192.324,10 -16,56% 94.460,51 0,57% 30.719,73 67,66% 127.596,00 -27,60% 91.153,03 8,85% 117.345,10 9,73% 126.399,80 2,77% 90.366,90 -0,41% 100.070,50 -11,19% 166.023,60 10,26% 177.669,10 3,96% 90.626,75 -0,70% 97.081,05 -7,87% 15.620,85 -4,14% 72.547,27 -383,65% 134.092,50 10,61% 110.897,80 26,07% 146.523,20 2,32% 131.727,10 12,18% 149.735,80 -6,95% 92.802,93 33,71% 12.861,83 57,13% 35.934,48 -19,78% 64.173,03 -6,96% 89.826,86 -49,71% 51.735,79 -14,97% 50.189,58 -11,53% 30.220,23 -0,73% 64.558,87 -115,20% 87.620,67 2,64% 107.719,00 -19,69% 50.693,19 -1,39% 55.709,54 -11,42% 67.648,81 3,36% 58.913,22 15,84% 139.631,10 -7,41% 121.947,70 6,19% 178.216,50 0,99% 141.623,20 21,32% 243.132,70 16,16% 194.438,90 32,95% 51.443,33 -2,89% 34.171,09 31,66% Simples 115.887,50 163.868,00 109.453,30 68.990,58 92.775,60 93.639,03 123.567,30 6.944,65 33.394,77 45.126,94 162.663,40 49.576,45 70.011,60 49.383,38 145.050,70 133.488,70 21.983,31 135.228,30 175.935,70 158.492,30 182.183,40 66.740,72 159.611,20 47.960,57 3.734,20 26.349,99 187.348,60 48.847,10 101.837,50 121.766,50 98.746,20 184.820,20 95.427,06 75.075,57 113.211,80 138.145,40 100.785,00 34.341,63 92.107,29 47.203,08 44.906,37 111.957,20 47.597,98 42.390,55 104.504,20 152.411,00 226.028,60 47.394,97 Dif(%) 3,43% -2,42% 0,50% 1,44% -9,15% 6,36% 22,77% 76,85% -19,27% -28,93% -8,44% -10,17% -133,37% -76,37% -3,61% -2,68% 56,03% 9,85% -17,29% -17,40% -1,21% -66,85% -6,41% 20,07% 75,11% 41,44% -13,54% 48,58% -1,84% 6,33% -9,72% 0,10% -6,03% -400,50% 24,53% 7,90% 28,01% -14,47% -53,51% -4,90% -49,69% -24,40% 4,80% 39,44% 19,61% 15,33% 22,06% 5,21%

114

49 50 51

98.000,00 139.043,20 65.000,00 65.899,25 40.000,00 41.536,25 grupo1 grupo 2 grupo 3 grupo 4 A Fatorial
2 2 2 2 2 2

-41,88% 123.253,40 -1,38% 61.383,24 -3,84% 46.411,45

-25,77% 126.771,80 5,56% 98.377,96 -16,03% 49.954,79

-29,36% -51,35% -24,89%

Estatsticas R = 0.99675 F = 30.7138 R = 0.91233 F = 14.5695 R = 0.95092 F = 3.8749 R = 0.78469 F = 14.5778 F = 9.1021 p = 0.13959 p = 9.5501e-006 p = 0.36694 p = 1.9472e-010 p = 5.0106e-008

R = 0.99938 F = 321.2337 p = 0.04233

A Simples R = 0.8366

115

APNDICE VII QUADRO DE PREOS PREDECIDOS DE TERRENOS


terreno n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Estatsticas preo 100.000,00 25.000,00 43.000,00 33.000,00 40.000,00 140.000,00 90.000,00 38.000,00 70.000,00 145.000,00 15.000,00 13.000,00 100.000,00 90.000,00 250.000,00 38.000,00 300.000,00 47.000,00 60.000,00 50.000,00 15.000,00 30.000,00 25.000,00 30.000,00 Grupo 1 Grupo 2 A Fatorial agrupamento Dif.(%) 103.178,10 -3,18% 24.905,15 0,38% 48.369,13 -12,49% 28.632,82 13,23% 37.169,79 7,08% 140.000,00 0,00% 90.000,00 0,00% 34.325,81 9,67% 77.048,69 -10,07% 140.033,70 3,43% 19.406,38 -29,38% 8.133,56 37,43% 100.000,00 0,00% 90.000,00 0,00% 250.000,00 0,00% 41.672,51 -9,66% 300.000,00 0,00% 42.870,81 8,79% 51.262,84 14,56% 51.225,11 -2,45% 15.444,18 -2,96% 34.402,67 -14,68% 31.039,01 -24,16% 27.879,77 7,07% R R R
2 2 2 2

Avaliao por opes A Fatorial Dif.(%) 148.873,60 -48,87% 27.449,32 -9,80% 28.653,89 33,36% 34.573,59 -4,77% 58.727,13 -46,82% 151.669,00 -8,34% 94.309,39 -4,79% 24.052,34 36,70% 109.140,50 -55,92% 192.995,10 -33,10% 11.801,99 21,32% 8.011,58 38,37% 128.921,60 -28,92% 94.309,39 -4,79% 213.707,10 14,52% 30.302,31 20,26% 213.253,30 28,92% 27.946,71 40,54% 55.042,66 8,26% 24.814,66 50,37% 17.205,92 -14,71% 32.598,87 -8,66% 37.378,36 -49,51% 21.261,69 29,13% p = 5.391e-005 p = NaN p = 8.0357e-007 p = 0.00037022

A Simples Dif.(%) 141.191,40 -41,19% 23.433,55 6,27% 45.305,46 -5,36% 21.449,89 35,00% 67.777,74 -69,44% 145.660,40 -4,04% 87.205,11 3,11% 21.817,83 42,58% 118.710,70 -69,59% 188.357,90 -29,90% 22.079,11 -47,19% 5.920,89 54,45% 130.887,20 -30,89% 87.205,11 3,11% 219.718,00 12,11% 36.052,28 5,13% 220.724,50 26,43% 41.276,45 12,18% 56.669,23 5,55% 24.990,80 50,02% 16.566,45 -10,44% 14.465,10 51,78% 23.344,11 6,62% 26.190,86 12,70%

= 0.97995 =1 = 0.84911 = 0.8643

F = 34.208 F = NaN F = 20.2585 F = 8.2799

A Simples R